DeepMind Agent57 : une IA meilleure que l’humain à 57 jeux vidéo Atari

Bastien L. 2 avril 2020 2 minutes de lecture Intelligence artificielle

DeepMind Agent57 est une nouvelle intelligence artificielle créée par Google DeepMind. Elle est capable de surpasser l’humain sur 57 jeux vidéo Atari différents. Une prouesse jamais atteinte jusqu’à présent.

Après le jeu de Go et le jeu vidéo de stratégie en temps réel StarCraft II, l’intelligence artificielle de DeepMind est désormais experte en jeux d’arcade rétro. La nouvelle IA de la filiale d’Alphabet, intitulée Agent57, est capable de surpasser le joueur humain moyen sur 57 jeux vidéo Atari différents.

En réalité, ces 57 jeux ont été désignés en 2012 comme un standard pour mesurer les performances d’un agent de Deep Learning. Parmi les jeux d’arcade sélectionnés pour mettre à l’épreuve les IA, on compte de nombreux classiques tels que Pitfall, Solaris et Montezuma’s Revenge. Ces titres ont été choisis parce qu’ils proposent une large variété de niveaux de difficulté et nécessitent d’adopter des stratégies très distinctes pour emporter la victoire.

Il s’agit donc d’un excellent moyen de mesurer les performances d’un agent de Deep Learning, puisque le but de cette technologie est de permettre aux machines de s’adapter à de multiples situations et de faire face aux changements ou à l’inconnu. En d’autres termes, un agent deep learning doit se rapprocher d’une IA générale comparable à l’intelligence humaine…

Jusqu’à présent, d’autres agents IA sont parvenus à maîtriser des jeux simples du set Atari57, mais aucun ne pouvait surpasser l’humain sur des jeux nécessitant des compétences plus avancées comme l’exploration à long terme et la mémoire comme Montezuma’s Revenge. Agent57 est le premier à réussir à exceller dans chacun des 57 jeux.

DeepMind Agent57 se rapproche de l’intelligence d’un joueur humain

Pour relever ce défi, les chercheurs de DeepMind ont créé un agent distribué entre différents ordinateurs s’attaquant à différents aspects du problème. Certains étaient focalisés sur les » récompenses de nouveauté « , c’est-à-dire la découverte de choses qu’ils n’ont pas encore découvertes.

D’autres étaient concentrés sur des tâches plus simples, comme de déterminer quelle pattern permet d’obtenir la plus grande récompense. Tous les résultats ont ensuite été combinés en un seul agent équipé d’un » meta-controller « lui permettant de mesurer les coûts et les bénéfices de chacune des approches en fonction du jeu.

Ainsi, l’Agent57 représente un nouveau cap franchi pour l’intelligence artificielle. Cependant, DeepMind estime qu’il peut encore être amélioré sur différents points. En plus d’être extrêmement cher à exécuter, paradoxalement, cet agent n’excelle pas autant que d’autres agents plus simples sur les jeux les plus minimalistes. Toutefois, DeepMind a plusieurs idées pour corriger ces faiblesses… alors préparez-vous à vous faire ridiculiser par l’IA aux jeux qui ont marqué votre enfance !