Depuis plusieurs semaines, Claude 3.7 Sonnet, le modèle IA d’Anthropic, tente de finir Pokémon Rouge, un jeu Game Boy de 1996. Malheureusement, jusqu’ici, elle échoue.
De nos jours, les entreprises d’intelligence artificielle parlent souvent d’énormes progrès. Certaines prédisent même qu’un jour, leurs modèles seront plus intelligents que nous. C’est impressionnant, en théorie. Car pendant ce temps, Claude se bat toujours contre un jeu vieux de 30 ans : Pokémon Rouge.
Ce jeu sorti en 1996, conçu pour les enfants, semble être un vrai cauchemar pour cette IA. Malgré tout, Claude a essayé…
Claude, bloqué depuis 80 heures dans Pokémon Rouge ?
En février 2025, Anthropic a présenté un projet ambitieux : « Claude joue à Pokémon Rouge ». L’idée paraît simple : voir si Claude peut terminer ce jeu comme le ferait un humain. Le modèle utilisé est Claude 3.7 Sonnet, présenté comme un prodige du raisonnement.
Et à ce propos, les débuts étaient plutôt prometteurs ! Claude a obtenu plusieurs badges, ce qui prouve qu’elle comprend les combats. Elle anticipe, elle s’adapte, elle réfléchit. Bref, elle avance. Mais alors, pourquoi n’a-t-elle pas encore terminé le jeu ?
Car en réalité, elle stagne. Elle refait les mêmes actions. Elle retourne dans des villes déjà explorées. Elle parle aux mêmes personnages, encore et encore. Ensuite, elle se bloque dans un coin de la carte et elle y reste des heures.
Par exemple, citons le cas du Mont Lune. Claude y est restée bloquée plus de 80 heures ! Un joueur humain passe cette étape en une vingtaine de minutes. Mais Claude, elle, tournait en rond. Littéralement.
En tout cas, ce n’est pas le raisonnement en combat qui pose problème. Claude sait qu’un type Électrik est inefficace contre un type Roche. Et elle s’en souvient. Ensuite, elle s’en sert pour adapter sa stratégie. Plutôt malin, non ?
Mais en dehors des combats, c’est une autre histoire.
Ce qu’elle voit, elle ne le comprend pas… et ce qu’elle apprend, elle l’oublie
Outre les soucis de stratégie, Claude a du mal à voir ce qu’elle fait. Oui, elle lit les images, elle suit l’état du jeu comme un vrai joueur. Mais elle ne comprend pas ce qu’elle voit.
Et selon Jonathan Hershey, chercheur chez Anthropic, c’est un vrai problème. Claude se cogne contre les murs, elle confond un chemin avec une maison. Elle tente de traverser les bâtiments sans succès, évidemment.
Pourquoi ? Car les graphismes du jeu sont vieux, flous, pixelisés. Et si pour nous, humains, un carré gris signifie mur, pour Claude, c’est un mystère.
Et si le jeu avait des images réalistes ? Alors Claude comprendrait sans doute beaucoup mieux. Mais ce n’est pas le cas ici. Pokémon Rouge est un monde de petits carrés, difficile à décrypter pour une IA.
En parallèle, Claude oublie aussi beaucoup de choses. Sa mémoire est grande, certes, elle peut stocker 200 000 jetons d’informations. Mais lorsque cette limite est atteinte, elle doit résumer. Et là, elle perd des détails essentiels.
Et en ce qui concerne les erreurs, elles sont parfois graves. Par exemple, Claude a cru que la sortie vers la Forêt de Viridian se trouvait à un endroit précis. Elle a alors passé des heures à chercher au mauvais endroit. Le pire c’est qu’elle n’a pas remis son hypothèse en question.
Or, comme l’explique Hershey, Claude fait trop confiance à ce qu’elle a écrit plus tôt. Elle pense que c’est vrai alors qu’en réalité c’est totalement faux. Résultat : elle bloque, encore et longtemps.
Claude révèle ce que l’IA ne sait (toujours) pas faire
Il s’agit pourtant de l’un des modèles les plus récents. Claude 3.7 est censée représenter le futur. Et selon Elon Musk, l’IA dépassera l’humain dès fin 2025. D’autres comme Dario Amodei, PDG d’Anthropic, pensent que ce sera plutôt en 2027. Mais je me demande : comment croire à ces promesses quand une IA peine à finir un jeu rétro ?
Et si Claude comprend les dialogues, c’est parce qu’elle brille dans le traitement du texte. Par exemple, lorsqu’on lui dit d’aller voir le Professeur Chen, elle suit les étapes. Elle parle à sa mère, va au laboratoire, puis cherche une solution. Plutôt cohérent !
Mais dès qu’il faut réfléchir dans l’espace, ça coince. Claude ne comprend pas qu’un mur est infranchissable. Elle ne sait pas toujours quelle stratégie est meilleure qu’une autre. Et surtout, elle répète souvent les mêmes erreurs, sans le savoir.
En revanche, Claude montre parfois des signes encourageants. Elle change de méthode et elle teste aussi d’autres approches. Après, elle note ce qui fonctionne ou pas. Et ça, c’est nouveau.
Sans doute faut-il encore du temps. Plus de mémoire, une meilleure lecture d’image, et une capacité à douter de ses propres idées. Car aujourd’hui, Claude croit trop en ses propres erreurs.
Mais je note que jusqu’ici, Ce jeu n’est pas encore gagné, mais ce n’est pas perdu non plus. En tant qu’expérience, « Claude joue à Pokémon Rouge » reste fascinante. On y voit tous les paradoxes de l’IA. Parfois brillante, parfois perdue. Capable de raisonner… puis d’échouer sur une porte.
Et vous, vous auriez fini Pokémon Rouge plus vite que Claude ? Dites-le en commentaire !
- Partager l'article :