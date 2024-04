Microsoft dévoile Phi-3 Mini, une petite IA gratuite qui peut tourner sur votre smartphone ou votre PC sans connexion internet et rivalise avec la version gratuite de ChatGPT. Découvrez tout ce qu'il faut savoir et comment l'utiliser dès maintenant !

Dans l'IA comme dans d'autres domaines, ce n'est pas forcément la taille qui compte ! Même si les géants de la tech investissent des milliards pour créer le plus large modèle de langage possible, la guerre a aussi lieu à l'autre extrémité.

En effet, les GAFAM cherchent à créer des modèles à la fois petits et puissants. Et ce mardi 23 avril 2024, Microsoft vient de prendre la tête dans cette course.

La firme américaine vient d'annonce Phi-3-mini : un modèle de langage IA léger, plus simple, moins cher à exploiter que les LLM traditionnels comme GPT-4 Turbo ou Gemini Ultra.

Sa petite taille est notamment idéale pour le faire tourner localement, et ses performances rivalisent pourtant avec celles de GPT-3.5.

Il pourrait donc permettre de faire tourner un chatbot aussi puissant que la version gratuite de ChatGPT, mais sur un smartphone sans même avoir besoin de connexion internet !

Cerise sur le gâteau : ce modèle est gratuit et open-source, disponible dès aujourd'hui. Que demande le peuple ?!

Les IA toujours plus larges, une quête sans fin

En général, on mesure la taille d'un modèle de langage IA par son nombre de paramètres. Ce terme désigne les valeurs numériques dans le réseau de neurones qui permet au modèle de traiter et de générer du texte.

Les paramètres sont appris pendant l'entraînement sur de larges jeux de données, et encodent en quelque sorte la connaissance du modèle sous une forme quantifiée.

Un plus grand nombre de paramètres offre généralement au modèle des capacités de génération de langage plus complexes et nuancées. C'est pourquoi les LLM IA sont de plus en plus larges, et de plus en plus « intelligents ».

Toutefois, un modèle plus large requiert aussi davantage de puissance de calcul pour son entraînement et son utilisation. Ce qui se traduit par un coût économique et environnemental problématique.

À l'heure actuelle, certaines LLM comme Google PaLM 2 ou GPT-4 ont plusieurs centaines de milliards de paramètres et les prochaines générations comme GPT-5 ou Amazon Olympus en auront encore davantage.

Ils nécessitent de nombreux GPU de Data Center très énergivores pour fonctionner correctement, comme des gouffres sans fond qui pourraient absorber toutes les ressources de la planète sans être rassasiés pour autant.

Phi-3 Mini, l'IA qui peut tourner sur un smartphone sans connexion

Aux antipodes de cette quête de grandeur, Phi-3-mini ne contient que 3,8 milliards de paramètres et a été entraîné sur 3,3 billions de tokens.

Cela permet de le faire tourner sur un simple GPU grand public ou sur du hardware d'accélération IA compatibles avec les smartphones et laptops.

Il succède à Phi-2, lancé en décembre 2023, et Phi-1 datant de juin 2023. Sa fenêtre de contexte atteint 4000 tokens, mais Microsoft a aussi lancé une version à 128 000 tokens dénommée phi-3-mini-128K.

Deux autres versions à 7 milliards et 14 milliards de paramètres seront également lancées ultérieurement, avec des capacités « significativement supérieures ».

Phi-3 Mini vs Mistral 8x7B, Llam-3 8B GPT-3.5 : quelle est la meilleure mini IA ?

Selon le document technique publié par Microsoft, les performances globales de Phi-3 rivalisent avec celles de modèles comme Mixtral 8x7B et GPT-3.5.

Rappelons que Mixtral 8x7B est l'un des modèles de la startup française Mistral, tandis que GPT-3.5 alimente la version gratuite de ChatGPT. Il surpasse même le tout nouveau Llama-3 8B !

Si l'on se fie aux benchmarks, Phi-3 Mini offre des performances impressionnantes pour sa taille. Les premiers retours des testeurs sont également dithyrambiques.

Il existe déjà des modèles pouvant fonctionner sur un appareil local, mais ils nécessitent tout de même un puissant hardware haut de gamme.

De son côté, Phi-3 peut tourner confortablement avec moins de 8GB de RAM et générer du texte à une vitesse correcte sur un CPU basique.

Même un Raspberry Pi à 55 dollars peut le faire tourner, et sa licence open source MIT le rend accessible à tous. Ce petit modèle a tout pour s'imposer parmi les grands !

Une IA entraînée comme un enfant en bas âge

Afin de créer un si petit modèle capable de rivaliser avec GPT-3.5 et ses 175 milliards de paramètres, Microsoft s'est appuyée sur une découverte de ses chercheurs.

Ils se sont aperçus qu'en utilisant des données d'entraînement de haute qualité, triées sur le volet, issues de livres et du web et combinées avec des données synthétiques, ils pouvaient atteindre des performances similaires avec beaucoup moins de paramètres.

Les développeurs se sont aussi inspirés de la façon dont les enfants apprennent à partir des histoires qu'on leur raconte le soir : des livres avec des mots simples, et des structures de phrases spécifiques.

Ils ont donc pris 3000 mots et ont demandé à un autre LLM d'écrire des livres pour enfants afin d'entraîner Phi-3 Mini.

De plus, ce modèle est davantage aligné pour la sécurité, la robustesse et le format conversationnel. Ce n'est pas donc seulement la quantité qui compte, mais aussi la qualité.

Cette nouvelle technique va permettre de continuer d'améliorer les capacités des petites IA, et donc réduire le coût environnemental et économique de cette technologie…

Comment utiliser Phi-3 Mini dès maintenant ?

Phi-3 est disponible dès à présent sur la plateforme cloud Microsoft Azure, ou encore sur des plateformes comme Hugging Face et Ollama qui permet de faire tourner les modèles sur Mac et PC.

Vous pouvez également télécharger le logiciel gratuit open-source LM Studio sur votre appareil en vous rendant sur le site web à cette adresse. Il vous permet de faire tourner n'importe quelle IA open source.

Cherchez Phi-3 sur la page d'accueil, sélectionnez « microsoft/Phi-3-mini-4k-instruct-gguf », et téléchargez la version Q4 dans la liste située sur la droite.

Une fois téléchargé, vous pouvez utiliser Phi-3 en cliquant sur l'onglet de discussion dans le menu de gauche et sur « New Chat » (nouvelle discussion).

Choisissez le modèle Phi-3 dans la barre en haut de l'écran. Vous pouvez commencer à écrire votre premier prompt et l'envoyer à l'IA !

Nul besoin de connexion internet. Vous pourrez donc utiliser cette IA même en cas de panne mondiale d'internet ! Encore mieux qu'une encyclopédie pour les survivalistes !

Avez-vous testé Phi-3 Mini ? Que pensez-vous de ses performances en comparaison avec ChatGPT ? Partagez vos retours en commentaire !

Notre blog est alimenté par les lecteurs. Lorsque vous achetez via des liens sur notre site, nous pouvons percevoir une commission d'affiliation.