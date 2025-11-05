La France dévoile son classement des IA… et c’est du gros bullshit

La France voulait évaluer les IA objectivement. Ce classement public des IA place donc un modèle français au sommet, loin devant OpenAI et Google.

Lancé en octobre 2024, le comparateur public compar:IA devait offrir un outil neutre et transparent pour mesurer la qualité des modèles d’IA conversationnelle. Un an plus tard, le gouvernement publie son tout premier classement. Le modèle Mistral-medium-3.1 rafle la première place, devant des géants comme Gemini ou GPT.

C’est quoi exactement ce classement des IA ?

Un an après son lancement discret, le comparateur public compar:IA de France vient de publier son tout premier classement des modèles d’IA testés par le grand public. Créé par la Direction interministérielle du numérique (DINUM) et le ministère de la Culture, ce site permet aux utilisateurs de comparer anonymement deux IA conversationnelles.

Je vous explique comment compar:IA marche. Vous posez une question, deux IA répondent, vous votez pour la meilleure réponse, sans savoir laquelle est laquelle. Ensuite, le système révèle les modèles testés, leur origine, leur impact carbone, et même s’ils sont open source.

Au départ, l’idée de ce classement des IA, c’était d’offrir une évaluation participative et transparente des modèles qui dominent nos écrans. Sauf que les résultats dévoilés début novembre 2025 ont pris tout le monde à contrepied. Sur le podium, le premier est Mistral-medium-3.1, un modèle français intermédiaire, donc ce n’est pas le plus puissant de la gamme. Gemini-2.5-Flash vient en seconde place, suivie de Gemini-2.0-Flash en troisième place.

Ces trois IA sont des versions allégées, optimisées pour la vitesse plutôt que la profondeur. Elles n’ont rien à voir avec les cadors habituels du secteur comme Gemini-2.5-Pro, Claude Opus 4.1 ou GPT-5, qui dominent les benchmarks internationaux. Alors, comment trois modèles lights peuvent-ils battre les monstres d’OpenAI et Anthropic dans ce classement des IA ?

Du côté d’OpenAI, la surprise est totale, car le premier modèle d’IA GPT apparaît à la 7ᵉ place dans le classement, et ce n’est même pas GPT-4.5 ou GPT-5, mais gpt-oss-120b, une version open source sortie en août 2025. Et les autres ? gpt-4.1-mini (22ᵉ) et gpt-5-mini (26ᵉ). Autant dire que les fans de GPT ont avalé de travers.

Le gouvernement français dévoile aujourd'hui son classement des modèles d'IA.



Son top 3 : 🥇Mistral Medium, 🥈Gemini 2.5 Flash et 🥉Gemini 2.0 Flash. Que des modèles « lite ».



Plus étonnant : GPT-5 est 30ème, Claude Sonnet 3.5 est 11ème et Gemini 2.5 Pro n'est pas là.



👇 pic.twitter.com/1FlMQCIk3Q — Nicolas Lellouche (@LelloucheNico) November 4, 2025

Classement vivant, mais déjà controversé

Le ministère de la Culture reste toutefois prudent. Il est impossible de savoir qui vote réellement sur compar:IA. Experts en IA ? Étudiants ? Utilisateurs lambda ? On ne sait pas. Ce flou est volontaire, pour respecter la protection des données personnelles. Mais il rend aussi le classement des IA difficile à interpréter.

Et pour couronner le tout, certains modèles affichent des intervalles de confiance très larges, preuve que les avis divergent fortement. Par exemple, deepseek-chat-V3.1, actuellement 8ᵉ, a un intervalle de confiance allant de -10 à +7. Il pourrait donc grimper comme chuter selon les prochains votes.

A l’inverse, l’IA Mistral-medium-3.1, en tête sur le classement, affiche un intervalle de -0/+0. Autrement dit, une stabilité parfaite. Bizarre ? Peut-être. Mais pour le moment, aucune preuve d’un biais n’a été trouvée.

Le gouvernement précise que ce classement IA sera mis à jour chaque semaine, afin de refléter l’évolution des votes. Pour l’instant, les autorités refusent de parler de biais patriotique. Aucun audit n’a encore été mené sur d’éventuelles influences linguistiques, culturelles ou nationales.

Compar:IA reste présenté comme un outil d’observation vivant et ouvert à la recherche. Mais entre résultats improbables, écarts statistiques énormes et absence de transparence sur le profil des votants, il est difficile de ne pas sentir un léger parfum de bullshit technocratique.

En attendant des explications , Mistral peut se vanter d’avoir battu OpenAI sur son propre terrain au moins dans la version française du match.

