Google vient de dévoiler la deuxième version de son modèle IA Genie. Désormais, cette intelligence artificielle est capable de créer des jeux vidéo en monde ouvert en 3D à partir d’un simple prompt textuel ! Une innovation qui pourrait totalement bouleverser l’industrie vidéoludique…
Il se passe quelque chose dans le monde du jeu vidéo. Quelque chose de très important, qui pourrait bien révolutionner totalement cette industrie déjà titanesque !
En septembre 2024, Tencent dévoilait GameGen-O : la première IA capable de créer des jeux vidéo en monde ouvert. Plus récemment, toujours en Chine, les chercheurs d’Alibaba ont également dévoilé une telle IA, dénommée The Matrix.
On peut également citer l’entreprise World Labs fondée par Fei-Fei Li, qui vient de dévoiler son IA pouvant transformer n’importe quelle image en jeu vidéo. Un autre exemple est la startup israélienne Decart, avec son IA capable de recréer le jeu Minecraft.
A présent, toutefois, c’est au tour de DeepMind, le bras de recherche en intelligence artificielle de Google de dévoiler Genie 2 : un modèle IA pouvant générer une variété infinie de mondes 3D interactifs !
Il s’agit du premier géant de la tech américain à s’attaquer à cette technologie. Désormais, elle est donc dans le collimateur des GAFAM et pourrait se démocratiser très rapidement !
Scènes 3D interactives et simulations physiques
Ce modèle succède à Genie, dévoilé plus tôt en 2024, qui se contente de créer des jeux en 2D. La deuxième version est capable de générer une scène interactive 3D en temps réel à partir d’une image et d’une description textuelle.
Selon DeepMind, Genie 2 peut générer une « vaste diversité de riches mondes en 3D ». Notamment des mondes dans lesquels les utilisateurs peuvent effectuer des actions comme sauter ou nager en utilisant une souris et un clavier.
Entraînée sur des vidéos, cette IA sait simuler les interactions d’objets, les animations, l’éclairage, la physique, les reflets et même le comportement des « PNJ » (personnages non-joueurs).
Elle peut également générer des mondes cohérents dans différentes perspectives, comme la vue isométrique ou la vue à la première personne. La durée maximale est d’une minute, mais la plupart dure entre 10 et 20 secondes.
Sur son blog, la firme explique que « Genie réagit intelligemment aux actions effectuées en pressant les touches d’un clavier, identifiant le personnage et le déplaçant correctement ».
Par exemple, « notre modèle peut comprendre que les touches de flèches déplacent le robot et non les arbres ou les nuages ».
Une IA entraînée à plagier les jeux AAA ?
En observant les simulations de Genie 2, on constate une ressemblance frappante avec les jeux vidéo AAA. Il est donc probable que les données utilisées par son entraînement contiennent des vidéos de ces jeux.
Toutefois, DeepMind, comme la plupart des laboratoires IA, refuse de dévoiler les détails sur ses méthodes de collecte de données. Il peut s’agir d’une façon d’éviter d’être imité par la concurrence, mais aussi d’éviter les poursuite pour violation de propriété intellectuelle…
Rappelons que Google est le propriétaire de YouTube. Or, ses conditions d’utilisation lui donnent la permission d’utiliser les vidéos YouTube pour l’entraînement de ses modèles.
Cependant, on peut considérer que Genie 2 crée des copies non autorisées des jeux vidéo qu’il a regardées. Ce sera donc à la justice de trancher en cas de plainte…
Un nouveau cap pour les IA génératives de jeux vidéo
La plupart des modèles similaires à Genie 2, aussi appelés « world models » ou modèles de mondes, peuvent simuler des jeux et des environnements 3D. Toutefois, ils ont des problèmes d’artefacts, de cohérence et d’hallucinations.
Par exemple, le simulateur Oasis de Decart peut recréer Minecraft, mais avec une basse résolution. Il tend aussi à « oublier » la disposition des niveaux.
Ce n’est pas le cas de Genie 2, qui peut se remémorer les parties d’une scène simulée qui ne sont pas en vue et les représenter avec précision quand elles sont à nouveau visibles. Une faculté qu’il partage uniquement avec les modèles de World Labs.
Pour le moment, toutefois, le gros bémol est que Genie 2 efface votre progression dans les jeux toutes les 60 secondes environ. Il n’est donc à l’évidence pas encore possible de concevoir un jeu complet avec cette IA.
C’est la raison pour laquelle DeepMind le présente davantage comme un outil de recherche et de créativité, permettant le prototypage d’expériences interactives et l’évaluation d’agents IA.
Selon la firme, « grâce aux capacités de généralisation hors-distribution de Genie 2, les croquis et les dessins peuvent être transformés en environnements pleinement interactifs ».
Et en utilisant Genie 2 pour créer des environnements pour les agents IA, « nos chercheurs peuvent générer des tâches d’évaluation que les agents n’ont pas vues pendant leur entraînement ».
From first person real world scenes, to third person driving environments, Genie 2 generates worlds in 720p 📷. Given an image, Genie 2 simulates world dynamics, creating a consistent environment playable with keyboard and mouse inputs ⌨️. https://t.co/OF5uoQoQYk
— Jack Parker-Holder (@jparkerholder) December 4, 2024
A plus long terme, ce type d’IA pourrait bel et bien permettre à n’importe qui de créer de véritables jeux vidéo complets à partir d’un simple prompt textuel ou d’une esquisse. Il s’agirait alors d’une révolution majeure pour l’industrie vidéoludique et pour le divertissement.
D’ailleurs, Google est convaincu qu’il s’agit du prochain grand cas d’usage de l’IA. En octobre 2024, DeepMind a recruté Tim Brooks : l’ancien directeur du développement du générateur de vidéo OpenAI Sora.
Il a été chargé de travailler sur les technologies de génération de vidéo, mais aussi sur les simulateurs de monde. De même, deux ans plus tôt, le laboratoire a recruté Tim Rocktäschel de Meta, qui est notamment connu pour ses expériences ouvertes avec des jeux vidéo comme NetHack.
En tant que fan de jeux vidéo, je pense personnellement que l’IA générative représente bel et bien la prochaine grande évolution dans ce domaine. Très bientôt, nous pourrons tous donner vie à n’importe quelle idée de monde virtuel qui nous passe par la tête et s’y plonger seul ou à plusieurs !
Et vous, qu’en pensez-vous ? Ces IA génératives de jeux vidéo pourront-elles un jour produire des jeux vidéo dignes des plus gros blockbusters de l’industrie à partir d’un simple prompt ? Comptez-vous les utiliser ? Partagez votre avis en commentaire !
- Partager l'article :