Google lance un système basé sur le Machine Learning pour entraîner des IA testeurs de jeux vidéo

AI a récemment annoncé un système basé sur le Machine Learning dédié aux développeurs de jeux qui pourraient l'utiliser pour former des agents de de jeu rapidement et efficacement.

Affecter les humains à des problèmes plus complexes

L'idée est de former rapidement et efficacement des agents de test de jeux. Cela permettrait aux développeurs de se concentrer sur des problèmes plus complexes. Le système ne nécessite aucune expertise en Machine Learning (ML). Celui-ci fonctionne avec une grande variété de jeux populaires et peut former une politique de ML, qui génère des actions à partir de l'état du jeu sur une seule instance  en moins d'une heure. Google AI a également fourni une bibliothèque open source qui montre l'application de ces techniques dans la pratique.

Tester en jouant permet de détecter et corriger les bugs graves comme les plantages ou les chutes hors de l'univers du jeu. Mais trouver les bugs dans un vaste espace d'un jeu moderne reste un des principaux défis des testeurs. Ainsi, Google AI a décidé de se concentrer sur la formation d'un système qui pourrait jouer le jeu à grande échelle, en formant un groupe d'agents de test au lieu d'un seul agent efficace jouant à l'intégralité du jeu de bout en bout. Chaque agent pourrait ainsi effectuer des tâches de quelques minutes, appelées boucles de jeu.

Donner aux développeurs une API efficace et conviviale

La solution proposée donne aux développeurs de jeux une API efficace et conviviale. Le système leur permet de décrire leur jeu en fonction de l'état de base qu'un joueur perçoit et des actions sémantiques qu'il peut entreprendre. Toutes ces informations sont représentées par des concepts avec lesquels les développeurs de jeux sont familiers, comme les entités, les raycasts, les emplacements et les rotations 3D, les boutons et les joysticks.

Facile d'utilisation, cette API sémantique de haut niveau permet au système de s'adapter aux spécificités d'un jeu en cours de développement. La combinaison spécifique de blocs de construction d'API du développeur influence le choix de l'architecture du réseau, car elle informe sur le type de scénario de jeu dans lequel le système est déployé.

Imiter divers schémas de contrôle

Cette API est suffisamment large pour imiter divers schémas de contrôle dans les jeux : tireurs à la première personne, tireurs à la troisième personne, jeux de course, tireurs à double manche, etc. Les réseaux conçus tendent intrinsèquement vers un comportement simple comme la visée, l'approche ou l'évitement, le mouvement et le ciblage 3D étant souvent une partie fondamentale du gameplay. La technologie y parvient en évaluant le schéma de contrôle du jeu et en créant des couches de réseau neuronal qui effectuent un traitement spécialisé des observations et des actions du jeu.

Après avoir généré une architecture de réseau neuronal, le réseau doit être formé pour jouer au jeu en utilisant un choix approprié d'algorithme d'apprentissage.Pour ce cas d'utilisation, l'Imitation Learning (IL) qui enseigne les politiques de ML en regardant les professionnels jouer au jeu, fonctionne efficacement. Contrairement au RL (Reinforcement Learning) où l'agent doit trouver une bonne politique par lui-même, l'IL nécessite de reproduire le comportement d'un expert humain.

Newsletter

Envie de ne louper aucun de nos articles ? Abonnez vous pour recevoir chaque semaine les meilleurs actualités avant tout le monde.

Cliquez pour commenter