DeepMind dévoile de nouveaux détails sur l’IA qui peut résoudre des problèmes complexes du monde réel. L’algorithme, qu’ils appellent MuZero, a appris à jouer à une foule de jeux à des niveaux surhumains.
Après avoir réussi à prédire le phénomène de repliement des protéines en 2020, DeepMind de Google a lancé une nouvelle intelligence artificielle. Loin de ses épreuves sur les problèmes biologiques complexes, MuZero se concentre maintenant à dominer ses adversaires dans les jeux de stratégie en ignorant totalement les règles du jeu.
MuZero IA : l’apogée de l’intelligence artificielle de DeepMind
MuZero est capable de créer des stratégies tout en jouant dans un environnement complètement inconnu. DeepMind réussit à combiner des itérations précédentes d’IA de jeu qui peuvent planifier à l’avance tout en apprenant de leur mouvement précédent.
L’intelligence artificielle fonctionne en utilisant 3 paramètres différents pour créer une stratégie de jeu :
– Quelle est la qualité de la position actuelle ?
– Quelle est la meilleure action à entreprendre ensuite ?
– Quel a été le succès de la dernière action ?
L’IA de DeepMind simplifie l’ensemble du jeu en un élément distinct de questions, qui dictent ensuite la manière de procéder. Elle apprend en permanence tout au long du jeu à prendre ces décisions et les résultats sont extrêmement impressionnants.
« Les systèmes qui utilisent la recherche par anticipation, ont obtenu un succès remarquable dans les jeux classiques mais reposent sur la connaissance de la dynamique de leur environnement, comme les règles du jeu ou un simulateur précis », déclarent les développeurs de DeepMind dans une publication sur leur blog.
Ils ont aussi ajouté : « Il est donc difficile de les appliquer à des problèmes réels et désordonnés, qui sont généralement complexes et difficiles à distiller en règles simples ».
MuZero, maître des jeux sans connaissance humaine
DeepMind a pu faire évoluer son IA en un modèle capable d’atteindre des performances surhumaines dans des problèmes de planification complexes allant des échecs à l’Atari. Dans tous les cas, MuZero a surpassé les algorithmes d’apprentissage de renforcement de pointe.
MuZero joue actuellement au Go, aux échecs, au shogi et aux jeux Atari. De telles avancées en matière d’intelligence artificielle pourraient avoir des implications retentissantes pour les algorithmes qui peuvent s’adapter sans jeu de règles. C’est un défi auquel les humains sont confrontés quotidiennement.
Il a également obtenu des résultats intéressants lorsque le nombre de simulations qu’il était autorisé à effectuer a été augmenté. Comme le nombre de simulations planifiées a été augmenté par coup, MuZero s’est mieux comporté, démontrant qu’une planification accrue lui permettait de jouer et d’apprendre plus efficacement.
- Partager l'article :