Accueil > Analytics > Dota 2 : une IA bat les joueurs semi-pro en s’entraînant 180 ans par jour
dota 2 openAI

Dota 2 : une IA bat les joueurs semi-pro en s’entraînant 180 ans par jour

Dota 2 n’a (presque) plus de secrets pour OpenAI. L’intelligence artificielle est parvenue à battre à plusieurs reprises une équipe de cinq joueurs semi-professionnels grâce au Machine Learning.

L’intelligence artificielle est déjà capable de battre les humains aux échecs ou au jeu de Go. À présent, les scientifiques cherchent à entraîner une IA capable de vaincre les meilleurs joueurs du monde aux jeux vidéo.

En août 2017, le système de Machine Learning développé par le laboratoire américain OpenAI avait déjà réussi à battre un joueur professionnel de Dota 2, Dendi. Cependant, cette victoire avait eu lieu dans des circonstances très particulières où le joueur était seul face au personnage contrôlé par l’IA.

Désormais, OpenAI est en mesure de gagner contre des équipes de joueurs amateurs et semi-professionnelles dans des conditions (presque) réelles. Sur trois matchs, OpenAI est parvenue à gagner deux fois.

L’intelligence artificielle contrôle une équipe de cinq personnages (OpenAI Five) et fait face à une équipe de cinq joueurs. Les deux équipes sont composées des mêmes personnages : Necrophos, Sniper, Viper, Crystal Maiden et Lich.

Le jeu est exécuté avec un taux de rafraîchissement de 30 images par seconde pendant environ 45 minutes. Toutes les quatre images, les robots reçoivent les informations telles que la position et la santé des unités visibles, ce qui leur permet d’avoir accès aux mêmes informations capitales que les joueurs humains. En outre, les bots sont en mesure de calculer la portée de leurs attaques avec précision.

L’IA profite donc d’un avantage conséquent sur les humains : elle a accès à toutes les informations instantanément, alors que les joueurs devront utiliser leur souris pour consulter ces données manuellement.

Chaque événement est perçu par l’IA en moyenne 1,5 image plus tard, et le robot peut réagir dès l’image suivante. Le temps de réaction moyen de OpenAI est donc d’environ 82,5 millisecondes, ce qui est plus rapide qu’un joueur humain.

Les cinq robots OpenAI Five ne communiquent pas vraiment avec eux, mais reposent sur un hyperparamètre intitulé  » team spirit « . Celui-ci peut être défini de 0 à 1, et indique aux bots s’ils doivent se concentrer sur leurs propres récompenses ou sur la récompense moyenne de l’équipe entière.

Dota 2 : OpenAI se confrontera à une équipe de 5 joueurs pro en août 2018

OpenAI n’est donc pas encore en mesure de gagner sans aucun avantage par rapport aux joueurs humains. Cependant, même dans ces circonstances, sa capacité à remporter la partie est impressionnante. La complexité et la quantité de possibilités dans un jeu vidéo comme Dota 2 est incomparable avec des jeux de plateau comme les échecs.

Il s’agit d’un pas de géant pour l’intelligence artificielle, d’autant qu’OpenAI est désormais en mesure d’élaborer sa propre stratégie. Lors du duel remporté contre Dendi en août dernier, les chercheurs avaient dû lui dicter le comportement à adopter.

Pour parvenir à cette prouesse, l’IA s’est entraînée en jouant contre elle même. Il s’agit de la technique du self-play, très utilisée dans le domaine du Machine Learning. Chaque jour, chacun des cinq bots s’entraîne environ pendant 180 années contre lui-même. Au total, l’équipe au complet s’entraîne donc environ 900 ans par jour contre elle-même. Cet entraînement intensif nécessite une telle puissance de calcul que 128 coeurs de CPU et 256 GPU Nvidia P100 hébergés sur Google Cloud sont nécessaires.

La prochaine ambition des chercheurs de OpenAI est de parvenir à entraîner leur IA pour qu’elle parvienne à vaincre une équipe de cinq joueurs professionnels au tournoi The International qui se tiendra en août 2018. Si cet objectif est atteint, la récompense qui se chiffre en millions de dollars sera remportée par les robots.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Send this to a friend