Gemini 2.5 Pro n’a pas non plus brillé lors d’une partie de Pokémon. D’après les résultats, elle s’est montrée bien moins douée qu’un enfant.
Il devient assez courant de voir des passionnés tester les capacités des intelligences artificielles. C’était comme le jour où un ingénieur a fait jouer ChatGPT aux échecs. Et plus récemment, Deep Mind, la filiale de Google spécialisée dans l’IA, s’est aussi lancé. Il a fait jouer Gemini 2.5 Pro au Pokémon. L’idée est de savoir jusqu’où ce puissant modèle de langage va-t-il arriver ? Les résultats ne sont pas à la hauteur de toutes les attentes.
Un comportement étrange de Gemini en jouant au Pokémon
Comme Claude chez Anthropic, DeepMind a aussi voulu mettre à l’essai les capacités de raisonnement de son IA, Gemini 2.5 Pro. Pour ça, il l’a fait participer à Pokémon en direct sur Twitch avec « Gemini Plays Pokémon »
Sans surprise, l’IA a réussi à finir la partie. Pourtant, ce qui intrigue, c’est le comportement étrange qu’elle a adopté en cours de jeu. L’expérience a été un vrai défi pour l’IA que pour n’importe quel enfant qui découvre le jeu.
En effet, l’IA serait passée par des phases de paniques. « Au cours du jeu, Gemini 2.5 Pro se retrouve dans diverses situations qui provoquent une simulation de panique dans le modèle » mentionne le rapport de Google.
Ces moments de panique se traduisent par une « dégradation observable de la capacité de raisonnement du modèle ». C’est-à-dire que Gemini 2.5 Pro perd ses moyens pendant la partie. Cela arrive surtout quand l’un des ses Pokémon est sur le point de se faire mettre K.O.
Dans son rapport, Google explique que, face au stress, le modèle prend ses décisions un peu n’importe comment. Un comportement qui, finalement, ressemble beaucoup à celui d’un humain sous pression.
Des capacités limitées
Pendant sa partie de Pokémon, Gemini 2.5 Pro a vite laissé tomber toute forme de stratégie. À la place, elle a réagi de façon impulsive, souvent de manière inefficace.
« Ce comportement s’est produit dans suffisamment d’instances séparées pour que les membres du chat Twitch remarquent activement quand cela se produit » précise le rapport.
En plus, selon ceux qui ont suivi la partie, Gemini a besoin des centaines d’heures pour pouvoir progresser dans un jeu qu’un enfant peut le faire en quelques dizaines d’heures.
Si Gemini a facilement cédé aux paniques, qu’en est-il de Claude ? Cette autre IA ne s’en est pas mieux sortie non plus. Certes, elle a compris qu’en perdant tous ses Pokémon, le joueur est automatiquement renvoyé au Centre Pokémon.
Ainsi, face à une impasse dans la grotte du Mont Sélénite, elle a élaboré un plan suicidaire. Elle fait volontairement mettre K.O toutes ses créatures pour s’échapper. Une stratégie inattendue de la part d’une IA assez puissante comme Claude.
Une fois de plus, ces tests montrent que les IA, même si on les dit capables de tout, ont bel et bien leurs limites. Elles peuvent être redoutables dans certains domaines, mais échouent dans d’autres.
- Partager l'article :