Google lance Gemini Deep Think : l’IA qui teste plein d’idées en même temps

Ny Ando A. 4 août 2025 2 minutes de lecture Google, IA générative

Un petit nouveau fait son apparition dans la famille IA de raisonnement de Google. Baptisé Gemini 2.5 Deep Think, il est présenté comme le modèle le plus avancé que le géant ait jamais conçu.

D’après la firme, ce modèle est un système multi-agents. Pour faire simple, il ne fonce jamais tête baissée vers une réponse unique. Non, il convoque tout un bataillon d’agents pour attaquer la question sous tous les angles, en simultané. Il opte ensuite pour la meilleure option.

Gemini Deep Think est accessible via l’abonnement Ultra de Google, au tarif de 250 dollars par mois.

Gemini Deep Think, une machine à idées

Si vous voulez tout savoir, ce n’est pas la première fois qu’on entend parler de Gemini 2.5 Deep Think. La boîte l’a, au fait, présentée officiellement, en mai dernier, à l’occasion de la Google I/O 2025.

Cependant, celui-ci qui vient d’arriver a reçu plusieurs mises à jour depuis. Google affirme avoir mis au point de nouvelles techniques d’apprentissage par renforcement. Cela afin de permettre à l’IA de mieux naviguer dans ses raisonnements complexes

D’ailleurs, ce n’est pas pour rien si Gemini 2.5 Deep Think a décroché la médaille d’or à l’Olympiade internationale de mathématiques (IMO). Du moins, une version spécifique de lui.

Google a même prévu de confier cette version à un groupe restreint de mathématiciens et de chercheurs universitaires. Pour info, elle est beaucoup plus lente que les IA destinées au grand public. Elle nécessite plusieurs heures de calcul pour résoudre certains problèmes complexes.

Toutefois, la société espère qu’il contribuera à des avancées majeures dans le domaine de la recherche académique.

Les résultats benchmark

Sur le redouté Humanity’s Last Exam, Deep Think a décroché un score de 34,8 %. Ce qui est loin devant Grok 4 de xAI (25,4 %) et o3 d’OpenAI (20,3 %).

Les capacités de codage de l’IA ont aussi été évaluées sur le benchmark LiveCodeBench 6. Et elle a explosé les scores avec un impressionnant 87,6 %. Elle a devancé Grok 4 (79 %) et o3 d’OpenAI (72 %).

Il faut aussi savoir que Gemini 2.5 Deep Think intègre des outils d’exécution de code et de recherche Google. Cela lui permet de produire des réponses plus longues et plus détaillées que les IA traditionnelles.

Lors de ses expérimentations, Google a également noté que le modèle générait des projets web plus soignés et plus esthétiques que ceux de la concurrence.