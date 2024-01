CUDA, MPS et Prérequis

Installation de Ferret

brew install git-lfs git lfs install

git clone https://github.com/jeanjerome/ml-ferret cd ml-ferret git switch silicon

conda create -n ferret python=3.10 -y conda activate ferret

pip install --upgrade pip pip install -e . pip install pycocotools pip install protobuf==3.20.0

mkdir -p ./model git lfs install git clone https://huggingface.co/lmsys/vicuna-13b-v1.3 model/vicuna-13b-v1.3

mkdir -p ./delta curl -o ./delta/ferret-13b-delta.zip https://docs-assets.developer.apple.com/ml-research/models/ferret/ferret-13b/ferret-13b-delta.zip unzip ./delta/ferret-13b-delta.zip -d ./delta

python -m ferret.model.apply_delta \ --base ./model/vicuna-13b-v1.3 \ --target ./model/ferret-13b-v1-3 \ --delta ./delta/ferret-13b-delta

/opt/homebrew/Caskroom/miniconda/base/envs/ferret/lib/python3.10/site-packages/bitsandbytes/cextension.py:34: UserWarning: The installed version of bitsandbytes was compiled without GPU support. 8-bit optimizers, 8-bit multiplication, and GPU quantization are unavailable. warn("The installed version of bitsandbytes was compiled without GPU support. " 'NoneType' object has no attribute 'cadam32bit_grad_fp32' Loading base model Loading checkpoint shards: 100%|██████████████████████████████████████████████████████| 3/3 [00:04<00:00, 1.57s/it] Loading delta Loading checkpoint shards: 100%|██████████████████████████████████████████████████████| 3/3 [00:08<00:00, 2.94s/it] Applying delta Applying delta: 100%|█████████████████████████████████████████████████████████████| 421/421 [00:16<00:00, 26.04it/s] Saving target model

conda activate ferret python -m ferret.serve.controller --host 0.0.0.0 --port 10000

Démarrage du contrôleur

conda activate ferret python -m ferret.serve.gradio_web_server --controller http://localhost:10000 --model-list-mode reload --add_region_feature

Démarrage de l'interface Web

conda activate ferret python -m ferret.serve.model_worker --host 0.0.0.0 --controller http://localhost:10000 --port 40000 --worker http://localhost:40000 --model-path ./model/ferret-13b-v1-3 --add_region_feature

Démarrage du Modèle

Interface du démonstrateur Ferret

Test de la démo

Test du chien et des furets

Test du ponton sur le lac

Test du salon

Conclusion

Développé en collaboration avec l’Université Cornell, Apple a présenté très discrètement sur GitHub, son tout premier modèle de LLM, Ferret. Bien après OpenAI, Meta ou encore Google, Apple se lance donc, à son tour, dans la course aux LLM. L’approche est toutefois différente. Open source et multimodal, ce modèle combine vision par ordinateur et traitement du langage naturel, offrant des capacités uniques en termes de compréhension et d’analyse du texte et des images. Plus puissant que GPT-4 d’OpenAI au dire d’Apple, cette avancée promet d’enrichir les appareils de la firme, notamment en améliorant l’interprétation des données et peut-être même de Siri.Ironie du sort, bien qu’Apple ait arrêté d’utiliser et de supporter les produits de NVidia depuis 2016, son modèle Ferret a été développé en utilisant les cartes graphiques très performantes de NVidia, les A100. Le code source disponible sur GitHub ne fonctionne donc pas sur les produits de la Pomme.Voyons comment y remédier et testons les capacités et la réactivité de cette toute première version de Ferret sur nos machines “Designed by Apple”.La plus grande adhérence du code de Ferret réside dans son utilisation de CUDA, le framework pour GPU de NVidia. Heureusement, la librairie utilisée est PyTorch qui a été portée et optimisée pour les GPU Apple Silicon. Le portage vers l’architecture Metal d’Apple sera d’autant plus simple.L’autre point à noter est la documentation sommaire sur l’installation et l’utilisation de Ferret sur le site de GitHub, preuve s’il en est, qu’Apple réserve son modèle LLM uniquement aux chercheurs comme le précise ses conditions d’utilisation.Alors cherchons ensemble comment faire tourner ce Ferret sur nos Mac. Pour cela, gardons en tête qu’une quantité substantielle de mémoire GPU est nécessaire. Nos tests ont été réalisés sur un MacBook Pro avec 64 Go de mémoire.Commencez par installer Git Large File Storage (LFS) pour gérer les tailles importantes des fichiers dont nous allons avoir besoin :Le code officiel de Ferret est disponible sur https://github.com/apple/ml-ferret . J’ai adapté ce code pour les processeurs Silicon et le framework Metal Performance Shaders (MPS) d’Apple, disponible sur https://github.com/jeanjerome/ml-ferret/tree/silicon • La branchecontient le code d’origine d’Apple.• La branchecontient ma version adaptée.Cette structuration facilite la comparaison entre les deux versions. Pour cloner le code :Ferret utilise Python, donc créons un environnement virtuel avec Conda pour isoler les dépendances :Installez ensuite les dépendances nécessaires :Placez le modèle Vicuna dans le répertoireà la racine du projet :Patientez pendant le téléchargement du modèle.Apple fournit un fichier avec les différences entre les poids de Vicuna et Ferret. Téléchargez-les :Cette étape peut prendre un peu de temps.Pour appliquer les modifications de Ferret sur Vicuna :Suivez les logs pour confirmer le bon déroulement de l’opération :Vous venez d’installer Ferret sur votre Mac.La démo fournie par Apple permet d’apprécier les capacités du nouveau modèle via une interface web.Ce démonstrateur inclut un contrôleur, un serveur web Gradio et un worker de modèle qui charge les poids et effectue l’inférence.Lancez la démo avec ces commandes dans trois terminaux séparés :Démarrez le contrôleur :Attendez le message indiquant que le contrôleur est opérationnel :Lancez le serveur web :Attendez que s’affiche la ligneExécutez le worker de modèle :Surveillez les logs pour vérifier que tout fonctionne correctement :Cliquez sur l’adresse http://localhost:7860/ pour accéder à l’interface web de la démo.Apple a inclus des tests avec images et prompts pré-remplis pour évaluer Ferret.Testons-les !• Sélectionnez la première image (le chien blanc) dans• Dans, choisissez• Dessinez sur le chien et le furet dans• Cliquez enfin sur le boutonen face du promptLes réponses varient, mais restent cohérentes avec l’image et dépendent sans doute des pixels sélectionnés :: The object [497, 303, 791, 658] is a dog, and it’s standing next to another dog [307, 507, 459, 690]. They seem to be enjoying their time together in the snow.: The object [457, 283, 817, 701] is a dog, and the object [318, 498, 464, 707] is a ferret. The dog and the ferret appear to be sitting together in the snow, suggesting a friendly interaction or companionship.• Sélectionnez la deuxième image (le ponton).• Sans dessiner, soumettez le prompt en cliquant sur le boutonen face du prompt: When you’re on the dock [218, 535, 810, 993], you should be mindful of a few things. Firstly, the water [0, 518, 998, 997] is a crucial aspect, and you should be careful not to go too close to the edge [731, 543, 998, 591]. Secondly, the surrounding trees [875, 366, 940, 510] [707, 385, 757, 535] [650, 393, 695, 529] [512, 420, 540, 526] [775, 375, 818, 522] could pose a hazard if you’re not cautious. Lastly, it’s important to be aware of the path [218, 535, 810,] to ensure you stay on the right track to avoid any unintentional falls or injuries.• Choisissez la troisième image (le salon).• Soumettez le prompt sans dessiner en cliquant sur le boutonen face du prompt• Ferret commence à nous répondre…. On sent qu’il se sent à l’étroit dans les 64 Go de RAM.: The image depicts a cozy living room [12, 1, 982, 989] with various pieces of furniture [490, 588, 709, 883] and decorations [244, 27, 394, 110] [247, 28, 274, 109] [378, 43, 411, 108]. In the center, there is a colorful, multicolored rug [90, 689, 746, 994] on the floor. A flat-screen TV [1, 394, 93, 723] is mounted on the left wall, with remotes [5, 679, 60, 734] placed nearby. Two couches [513, 421, 938, 769] [501, 577, 993, 995] are arranged in the room, with one along the right wall and another on the far end of the room. A few chairs are also present, scattered around the room. A dining table [710, 392, 954, 511] [avec un NETWORK ERROR DUE TO HIGH TRAFFIC. PLEASE REGENERATE OR REFRESH THIS PAGE. (error_code: 1): Caught Unknown Error MPS backend out of memory (MPS allocated: 26.50 GB, other allocations: 55.14 GB, max allowed: 81.60 GB). Tried to allocate 10.00 KB on private pool. Use PYTORCH_MPS_HIGH_WATERMARK_RATIO=0.0 to disable upper limit for memory allocations (may cause system failure).Pas de solution donc pour mon MacBook Pro, les 80 Go occupés par Ferret ne suffisent pas…En conclusion, l’intégration de Ferret, le dernier né des modèles LLM d’Apple, sur les machines équipées de processeurs Apple Silicon, représente une avancée notable dans le domaine de l’intelligence artificielle. Malgré quelques défis inhérents à l’adaptation du code initial, qui était conçu pour les GPU NVidia, les efforts de portage vers l’architecture Metal d’Apple ont été très simples.L’installation et le déploiement de Ferret, bien qu’exigeant en termes de mémoire et de ressources, ouvrent des perspectives passionnantes pour les utilisateurs de Mac. Les démonstrations fournies avec le code source illustrent la puissance et la polyvalence de Ferret, capable d’analyser et d’interpréter des données visuelles et textuelles de manière approfondie.Il est important de noter que cette implémentation de Ferret, malgré sa puissance, reste gourmande en ressources, particulièrement en mémoire vive. Nul doute qu’Apple va, à présent, adapter son nouveau modèle à ses machines et notamment aux iPhones. Son potentiel pour améliorer les applications existantes et en créer de nouvelles est immense, et on peut s’attendre à ce que sa prochaine évolution apporte encore plus d’innovations et de fonctionnalités.