Google vient de dévoiler Genie : une intelligence artificielle capable de générer un jeu vidéo à partir d’un prompt ou d’une simple image soumise par l’utilisateur. Découvrez comment ça marche, et comment l’IA s’apprête à transformer totalement le monde du gaming !
Si vous êtes gamer, comme moi, vous avez certainement déjà rêvé de créer votre propre jeu vidéo. Malheureusement, les logiciels comme RPG Maker requièrent énormément d’efforts pour obtenir un résultat décent.
Maîtriser un moteur comme Unity et un langage de programmation n’est pas non plus à la portée du premier venu, et les places dans les écoles spécialisées comme Enjmin sont très limitées.
C’est la raison pour laquelle la plupart des fans de jeux vidéo se contentent de jouer plutôt que de créer. Toutefois, l’intelligence artificielle s’apprête à tout changer !
À la manière dont MidJourney et DALL-E permettent à n’importe qui de créer des images, et comme Sora va transformer tout un chacun en cinéaste, une nouvelle IA va vous laisser créer votre jeu en toute simplicité : Genie, créé par Google DeepMind.
Google Genie, une IA entraînée sur 200 000 heures de jeux vidéo

Dévoilé le 26 février 2024 sur le blog de DeepMind, cet outil peut créer un jeu vidéo à partir d’un simple prompt (une description textuelle) ou même d’une seule image !
C’est le fruit d’une collaboration entre Google et l’University of British Columbia. Son nom est l’abréviation de « Generative Interactive Environments ».
Son fonctionnement repose sur un modèle d’action latente qui infère les actions entre les images, un tokenizer qui convertit les images vidéo en tokens, et un modèle dynamique déterminant la prochaine image.
Un modèle plutôt petit, mais performant
Avec 11 milliards de paramètres, Genie AI est un modèle relativement petit. Il a été entraîné sur plus de 200 000 heures de vidéos de personnes jouant à des jeux, et plus précisément des jeux de plateformes en 2D tels que Super Mario ou Contra.
Il s’agit de vidéos issues d’internet, disponibles publiquement sur des plateformes spécialisées telles que Twitch ou YouTube.
Cet entraînement s’est déroulé sans supervision humaine. Pourtant, Genie a été capable de comprendre les mécaniques et la physique de l’action.
Et ce, sans même que les streams vidéo ne contiennent d’informations sur les boutons pressés par le joueur !
Fort de cet entraînement, le modèle peut transformer une photo, un croquis ou même une image générée par l’IA en jeu vidéo jouable et réactif aux commandes de l’utilisateur. Le processus s’effectue en une seule étape.
II génère les images et autres éléments requis pour transformer le croquis en un monde ouvert pleinement réalisé, puis prédit les prochains pixels en se basant sur les actions du joueur.
La vidéo est compressée par le tokenizer, puis envoyée à au modèle d’action pour encoder les transitions entre deux images comme l’une des huit actions latentes. Un autre modèle est ensuite utilisé pour prédire les futures images.
Au commencement … une qualité à améliorer
Bien évidemment, la qualité des jeux est encore très limitée. L’IA a été entraînée sur des vidéos minuscules en très faible définition 160×90 pixels à seulement 10 images par seconde.
Elle génère donc des jeux dans une définition similaire, qui ne dure que 16 secondes et… à seulement une image par seconde.
On est donc encore loin d’une IA capable de créer Elden Ring ou Baldur’s Gate 3 en un claquement de doigts. Toutefois, Genie est un projet de recherche et non un produit fini.

Il s’agit de la première pierre, la première étape d’une révolution dans le monde du jeu vidéo. Déjà en 2023, les cadres de Microsoft Xbox avaient prédit que d’ici moins d’une décennie, l’IA pourrait créer n’importe quel jeu vidéo à partir d’un prompt de l’utilisateur.
À partir de maintenant, l’intelligence artificielle ne va faire que progresser et se développer à un rythme effréné. Rappelez-vous qu’il y a moins de deux ans, le fait qu’une IA puisse créer de simples images semblait déjà extraordinaire…
De même, en 2021, internet s’enflammait pour une IA qui avait créé une simulation automobile complètement floue et minimaliste en regardant GTA V.
Au fil du temps, Genie va pouvoir s’entraîner à partir de vidéos plus longues, en meilleure définition, avec davantage de puissance de calcul, et pourra donc à son tour produire des jeux d’une qualité nettement supérieure.
Quels sont les obstacles à surmonter ?
Pour le moment, le principal obstacle à cette nouvelle ère du jeu vidéo est le hardware. Le nombre de GPU permettant d’entraîner et d’exécuter les IA est limité, et les fournisseurs comme Nvidia peinent à répondre à la demande.
Cependant, de nouvelles puces spécialement dédiées à l’IA sont en développement et vont permettre à l’industrie d’accélérer.
Il faudra encore d’immenses avancées en matériel, en connectivité et en stockage d’énergie pour faire tourner une telle technologie dans un casque VR suffisamment compact pour être porté.
Et pour permettre au joueur de réellement s’immerger, des progrès devront aussi être effectués dans le domaine des retours haptiques.
Vers des jeux vidéo directement injectés dans nos cerveaux ?
À terme, la meilleure solution pourrait être d’injecter directement ces visions et ces sensations dans nos cerveaux via des câbles, mais est-ce réellement ce que désirent les joueurs ?
Rappelons que la startup Neuralink d’Elon Musk a réalisé son premier implant cérébral sur un humain, et celui-ci est désormais capable de contrôler une souris d’ordinateur par la pensée.
Cette technologie est pour l’instant destinée au domaine médical, mais Musk n’a jamais caché son intention d’utiliser le Neuralink pour connecter le cerveau humain à l’IA .
Ceci permettra un transfert direct d’informations, bien plus rapidement qu’avec un clavier ou même avec le langage. Les données seront transmises aussi vite que les pensées fusent dans votre esprit.
D’autres technologies en développement permettront bientôt aux ordinateurs de réagir en temps réel à vos émotions, afin d’optimiser les jeux vidéo pour l’utilisateur.
Un pas de plus vers l’AGI et les robots humanoïdes
L’intelligence artificielle se développe à une vitesse ahurissante, et change le monde plus rapidement que n’importe quelle autre technologie auparavant dans l’histoire de l’humanité.
Pour en revenir à Google Genie, il ne s’agit donc que d’une brique parmi d’autres dans la grande convergence qui s’apprête à bouleverser la façon dont nous explorons l’imaginaire tel un véritable tsunami.
Au-delà du jeu vidéo, l’IA apprend peu à peu à comprendre notre monde. Selon Tim Tim Rocktäschel, le directeur de l’équipe à l’origine du projet, ce modèle peut aussi transmettre ses connaissances sur les mondes 3D à d’autres agents ou modèles IA.
Comme il l’explique, « nous avons aussi entraîné Genie sur des données robotiques (RT-1) sans action et avons démontré que nous pouvons aussi entraîner un simulateur d’action contrôlable. Nous pensons que c’est un pas prometteur vers les modèles de monde général pour l’AGI ».
Les futurs agents IA pourront être entraînés dans une succession sans fin de nouveaux mondes générés. L’étude prouve aussi que les actions apprises par Genie peuvent être transférées à des environnements réels conçus par l’humain, et les chercheurs affirment qu’il ne s’agit que d’un début.
Chaque progrès réalisé par l’IA est un pas en avant vers son incarnation dans des robots humanoïdes capables d’effectuer n’importe quelle tâche et vers l’émergence d’une IA générale dotée de sa propre conscience…
Genie 2 : l’IA qui révolutionne la création de mondes 3D interactifs
Continuant sa route vers un univers du gaming interactif, Google a récemment dévoilé Genie 2. Il s’agit d’une intelligence artificielle capable de générer des environnements 3D interactifs à partir de simples descriptions textuelles ou d’images. Cette avancée permet de créer des mondes virtuels où les utilisateurs peuvent interagir de manière dynamique. Aussi, il devient possible d’effectuer des actions telles que sauter, nager ou interagir avec des objets.

Genie 2 intègre des éléments complexes tels que la physique, l’éclairage réaliste et le comportement des personnages non-joueurs (PNJ). Tout ceci permet d’offrir une expérience immersive proche des jeux vidéo AAA.
Actuellement, ces environnements restent limités à des sessions d’environ une minute. Néanmoins, l’IA conserve en mémoire les parties du monde déjà explorées afin d’assurer une cohérence lors des déplacements. Cette technologie ouvre par conséquent de nouvelles perspectives pour le prototypage rapide de jeux vidéo et la formation d’agents intelligents.
Revers de la médaille, des questions se posent concernant la propriété intellectuelle, notamment sur l’utilisation potentielle de vidéos de jeux existants pour l’entraînement de l’IA. Malgré ces défis, Genie 2 représente une avancée significative dans la génération automatisée de mondes virtuels. L’outil témoigne d’une avancée progressive vers la possibilité de créer des jeux vidéo complets à partir de simples instructions textuelles.
L’IA pourra bientôt créer d’immenses mondes virtuels
L’intelligence artificielle est en passe de révolutionner la création de mondes virtuels. Des outils comme Google Genie et OpenAI Sora permettent déjà de générer des environnements 3D interactifs et des personnages réalistes capables d’interagir en langage naturel.
Grâce aux avancées en réalité virtuelle et en IA, les joueurs pourront bientôt explorer des univers dynamiques entièrement générés en temps réel. Les personnages non-joueurs (PNJ) ne se limiteront plus à des dialogues préprogrammés, mais pourront discuter librement avec les utilisateurs sur n’importe quel sujet.
OpenAI Sora démontre déjà une capacité à maintenir la cohérence des environnements persistants, tandis qu’ElevenLabs automatise la création d’effets sonores et de voix. En parallèle, des outils comme Suno V3 génèrent de la musique à la demande, ouvrant la porte à des jeux où des bardes IA improvisent des chansons sur les exploits du joueur.
À terme, la convergence de ces technologies permettra de concevoir des jeux vidéo AAA à partir d’un simple croquis ou d’un prompt textuel. Ainsi, les utilisateurs auront un contrôle quasi divin sur leur univers. Cette fusion entre IA et réalité virtuelle marque le début d’une nouvelle ère du divertissement interactif.
- Partager l'article :