La communauté IA est en effervescence depuis quelques jours après avoir découvert en ligne un modèle d’IA aussi performant que ChatGPT-4. Au cœur de cette agitation, un modèle LLM de la licorne française Mistral qui a fuité !
IA de Mistral : de Hugging Face à 4chan, et puis c’est l’explosion
Dans la journée du 28 janvier, un utilisateur de Hugging Face connu sous le pseudo Miqu Dev, publie un ensemble de fichiers sur la plateforme. Fonctionnant un peu comme GitHub, Hugging Face est une plateforme en open source pour trouver et partager des milliers de codes, de modèles d’IA, d’ensembles de données, etc.
L’ensemble de fichiers, un grand modèle de langage (LLM) intitulé « Miqu-1-70b », atterrit sur la plateforme et devient donc open source. Dans la foulée, un abonné du très controversé site 4chan crée et publie un lien vers le fichier « Miqu-1-70b ». À partir de là, la toile s’enflamme
Les membres de la communauté IA commencent à en parler, à l’analyser, à le partager sur X, à le tester et à le comparer à d’autres modèles d’IA. Ils sont saisis par les performances de ce LLM que beaucoup comparent à ChatGPT-4. En analysant le modèle d’IA, certains évoquent une ressemblance avec les travaux de Mistral. D’autres supposent que Miqu signifie MIstral QUantized.
Les rumeurs sont rapidement confirmées par le grand patron de Mistral. Sans entrer dans les détails, Arthur Mensch, cofondateur et PDG de Mistral, a confirmé qu’il s’agit effectivement d’un LLM de l’entreprise. Il explique que le fichier a été publié par inadvertance par un employé d’un de leurs clients bénéficiant d’un early access.
La communauté IA continue de bouillonner
La publication de Mensch sur X n’a pas réfréner l’enthousiasme de la communauté IA qui reste fascinée par les performances exceptionnelles de ce LLM signé Mistral. Les aficionados perçoivent « Miqu-1-70b » comme le concurrent direct de ChatGPT-4, en version open source.
Soumis à EQ-Bench (un benchmark conçu pour évaluer les modèles d’IA), « Miqu-1-70b » obtient un score impressionnant de 83,5. L’aptitude globale du modèle de langage rappelle largement celle de ChatGPT-4 selon la communauté. Cela suggère que les LLM open source comblent l’écart avec les géants propriétaires.
Jusque là, la comparaison entre le LLM de Mistral et GPT-4 reste complexe. Dans la communauté IA, les avis divergent en ce qui concerne leurs performances dans diverses tâches. Des évaluations et comparaisons plus approfondies s’avèrent nécessaires pour déterminer de manière concluante quel modèle est le mieux adapté à des cas d’utilisation spécifiques.

Ceci dit, ce LLM laisse présager un potentiel changement dans la dynamique du marché de l’IA. L’IA open source, illustrée par des modèles comme « Miqu », continue de remettre en question la position dominante des modèles propriétaires. Ces modèles open source pourraient bientôt offrir des alternatives plus compétitives pour un large éventail d’applications.
- Partager l'article :