L’IA passe au combat de rue : un tournoi LLM hors-norme

Oliva R. 31 mars 2024 2 minutes de lecture Flash, IA générative

Une équipe d’enthousiastes de l’IA a organisé un tournoi à San Francisco pour déterminer quel grand modèle de langage est le meilleur aux jeux de combat.

Les grands modèles de langage (LLM) sont généralement évalués sur leur capacité à générer du texte cohérent, à répondre à des questions ou à accomplir des tâches de compréhension. Cependant, un groupe d’experts en intelligence artificielle a décidé d’explorer une approche différente et ludique pour comparer les performances de ces modèles. Lors d’un récent hackathon AI à San Francisco, ils ont organisé un tournoi opposant divers LLM dans des combats de Street Fighter III.

Mistral contre OpenAI : la revanche

Les premiers affrontements ont mis aux prises différentes versions du modèle Mistral, développé par les organisateurs de l’événement. Mais la compétition est montée d’un cran avec l’entrée en lice des modèles GPT-3.5 et GPT-4 d’OpenAI. Les LLM se sont affrontés dans des combats sans merci, enchaînant coups de poing, combos dévastateurs et parades magistrales.

Après de nombreuses batailles acharnées, les résultats ont été compilés et un vainqueur s’est imposé : le modèle GPT-3.5 Turbo d’OpenAI. Les places d’honneur ont été chaudement disputées, avec une version réduite de Mistral décrochant l’argent et un preview de GPT-4 terminant sur la troisième marche du podium.

Reproduire l’expérience

Les amateurs peuvent désormais reproduire ce tournoi grâce au code source disponible sur Github. Nul besoin d’un supercalculateur, mais il faudra se procurer un fichier ROM d’un jeu de combat 2D ou 3D avec des mouvements limités dans l’environnement.

Au-delà de l’aspect ludique, cette expérience ouvre des perspectives intéressantes pour l’industrie du jeu vidéo. On peut imaginer, dans un avenir proche, des adversaires contrôlés par des LLM capables de offrir une expérience de jeu extrêmement réaliste et stimulante.

Une application potentielle dans le domaine militaire ?

Bien que l’objectif principal soit le divertissement, certains experts s’interrogent déjà sur les applications possibles de cette technologie dans d’autres domaines, comme le militaire. Les capacités démontrées par GPT-3.5 dans des simulations de guerre soulèvent des questions sur son potentiel pour des tâches stratégiques complexes.