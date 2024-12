Google dévoile Gemini 2.0 Flash Thinking Experimental : une IA capable de raisonner et d’expliquer son cheminement de réflexion pour répondre à un prompt. Concurrent direct de OpenAI o1, peut-il s’imposer comme nouveau champion ?

En septembre 2024, OpenAI dévoilait o1 : la première IA capable de raisonner. Après une version préliminaire, la version complète du modèle a été lancée le 5 décembre 2024.

À présent, c’est au tour de Google de lancer son propre modèle IA « raisonnant ». Dénommé Gemini 2.0 Flash Thinking Experimental, il s’agit du deuxième modèle de la famille Gemini 2.0 après Flash dévoilé le 11 décembre 2024.

Sa carte technique le décrit comme « meilleur pour la compréhension multimodale, le raisonnement et le codage ».

Il a notamment la capacité de « raisonner sur la plupart des problèmes complexes » dans les domaines comme la programmation, les maths et la physique.

À travers une publication sur X, le directeur de produit de AI Studio, Logan Kilpatrick, explique que Gemini 2.0 Thinking Experimental est « la première étape dans le voyage de raisonnement de Google ».

It’s still an early version, but check out how the model handles a challenging puzzle involving both visual and textual clues: (2/3) pic.twitter.com/JltHeK7Fo7

De son côté, le scientifique en chef de Google DeepMind, Jeff Dean, affirme que cette IA est « entraînée pour utiliser les pensées afin de renforcer son raisonnement ».

Basé sur Gemini 2.0 Flash, cette version présente une conception similaire à OpenAI o1 et aux autres modèles raisonnants.

Ils sont capables de vérifier eux-mêmes la véracité des faits qu’ils avancent, réduisant le problème des « hallucinations » qui limite l’utilité de modèles comme GPT-4o ou Gemini 1.5.

Revers de la médaille : ils prennent souvent plus longtemps pour fournir une réponse aux prompts. Ce processus de réflexion peut leur prendre quelques secondes, voire même quelques minutes.

Lorsqu’il reçoit un prompt, Gemini 2.0 Flash Thinking Experimental fait une pause avant de répondre. Il passe en revue un certain nombre de prompts liés, et « explique » son raisonnement.

Après un moment, l’IA résume ce qu’elle considère comme la réponse la plus exacte. Toutefois, comme son nom l’indique, le modèle est encore au stade expérimental.

Selon les premiers testeurs, il présente encore des lacunes. Il a par exemple échoué au test consistant à lui demander combien de « r » il y a dans le mot « strawberry » : il a répondu deux.

Pour tester ce nouveau modèle, rendez-vous sur la plateforme de prototypes Google AI Studio ! Vous pouvez y accéder en suivant ce lien.

Depuis le lancement de o1, de nombreuses entreprises concurrentes de OpenAI ont lancé leurs propres modèles similaires. Par exemple, en novembre 2024, DeepSeek a lancé une preview de son IA DeepSeek-R1.

Dans le même temps, Alibaba Qwen a dévoilé le premier rival « ouvert » de o1. Déjà en octobre 2024, Bloobmerg révélait que Google avait chargé plusieurs équipes de créer des modèles raisonnants.

Puis, en novembre de la même année, The Information a révélé que l’entreprise avait au moins 200 chercheurs focalisés sur cette technologie.

Cet essor est notamment lié à la quête de nouvelles approches pour perfectionner l’IA générative. Les techniques utilisées jusqu’à maintenant pour créer des modèles de plus en plus larges ne fonctionnent plus.

D’autant qu’il n’y a plus suffisamment de données pour entraîner les modèles. Les IA ont en quelque sorte déjà absorbé toutes les informations créées par l’humain…

Toutefois, certains experts pensent que le raisonnement n’est pas la meilleure piste à suivre pour l’évolution de l’intelligence artificielle. Ces modèles sont chers, car ils requièrent beaucoup de puissance de calcul.

Et même si leurs performances sont convaincantes sur les benchmarks, on ignore s’ils peuvent réellement maintenir ce taux de progression sur le long terme…

Want to see Gemini 2.0 Flash Thinking in action? Check out this demo where the model solves a physics problem and explains its reasoning. pic.twitter.com/Nl0hYj7ZFS

— Jeff Dean (@JeffDean) December 19, 2024