Gemini Omni Flash

Gemini Omni Flash : découvrez l’IA de Google qui crée des vidéos sur simple commande 

Pour pimper vos vidéos de vacances, Google vient de lancer Gemini Omni Flash aux côtés de Nano Banana 2 Lite.  Il s’agit d’une IA capable de créer et de monter des vidéos sur simple commande vocale ou textuelle.

Créer une vidéo avec des effets spéciaux demandait autrefois des heures de montage. Aujourd’hui, une simple description suffit parfois à obtenir un résultat convaincant. C’est notamment possible avec Gemini Omni Flash, la toute dernière IA multimodale de Google.

C’était lors de la conférence Google I/O que la firme de Mountain View a dévoilé cette IA. Destiné d’abord aux développeurs via Google AI Studio, ce modèle veut démocratiser les effets spéciaux. Le principe ? Simple. Vous parlez à la machine, elle modifie vos images.  Plus besoin de jongler entre plusieurs logiciels. Du moins, sur le papier.

Ce qui distingue Gemini Omni Flash

La force de Gemini Omni Flash réside dans sa capacité à mélanger les genres. Ce modèle ne se contente pas de générer une vidéo à partir d’un texte. Il comprend également des images et de courtes vidéos comme références afin de produire un résultat cohérent.

L’objectif est de transformer le montage vidéo en conversation. L’utilisateur peut demander d’ajouter un effet ou de modifier un décor. Il est même possible d’intégrer du texte directement dans une scène, sans manipuler une timeline complexe.

Google explique aussi que son modèle s’appuie sur les connaissances multimodales de Gemini. Concrètement, cela lui permet de mieux comprendre le contexte d’une demande, qu’il s’agisse d’histoire, de biologie ou simplement de logique narrative.

L’entreprise montre notamment une démonstration où une personne réalise plusieurs faux tours de magie. Des ballons surgissent d’un smartphone, tandis que de l’eau semble couler de l’écran vers un verre. Derrière ces effets, la vidéo d’origine reste pourtant très classique.

Une IA pensée pour produire des vidéos à toute vitesse

Google positionne Gemini Omni Flash comme une solution rapide et assez abordable pour les développeurs. Le tarif annoncé atteint 0,10 dollar par seconde de vidéo générée, soit le même niveau que Veo 3.1 Fast.

Le modèle prend aussi en charge le montage conversationnel. Il devient ainsi possible de modifier une création plusieurs fois de suite simplement en formulant de nouvelles instructions. Cette approche évite de recommencer un projet depuis le début à chaque changement.

Autre point intéressant, le système synchronise automatiquement du texte ou des éléments graphiques avec les actions visibles dans la vidéo. Une fonction qui pourrait séduire les créateurs de contenus, les studios ou encore les plateformes de commerce en ligne.

Google met d’ailleurs en avant plusieurs démonstrations. L’une transforme une simple photo en animation touristique. Une autre réinvente une pièce avant de produire une visite vidéo du résultat. Une troisième convertit des images de produits en clips promotionnels plus dynamiques.

Un lancement prometteur, mais encore limité

Malgré ses ambitions, Gemini Omni Flash reste une version preview. Certaines fonctions importantes manquent encore à l’appel. Les vidéos générées sont limitées à dix secondes.

Les références audio ne sont pas encore prises en charge. Et les vidéos utilisées comme source ne doivent pas dépasser trois secondes. Plus gênant, la cohérence d’un personnage peut encore varier lors d’un changement de plan ou d’un mouvement de caméra.

infographie montrant les capacités de Gemini Omni Flash

Quoi qu’il en soit, pour prouver que son concept fonctionne, l’entreprise s’associe à un autre modèle nommé Nano Banana 2 Lite. Ensemble, ils alimentent déjà plusieurs applications de démonstration assez bluffantes.

Parmi elles figure Anywhere. Cette application transforme par exemple vos simples selfies en voyages mémorables autour du globe. Il y a aussi Space Lift qui réinvente la décoration de votre salon en projetant un rendu cinématographique en 3D. Enfin, Omni Product Studio cible les commerçants en transformant des photos de produits statiques en publicités dynamiques. 

Bref, Google cherche à occuper le terrain de la vidéo rapide. L’outil Gemini Omni Flash pose des bases solides. Pourtant, elle reste une bêta qui doit encore faire ses preuves sur la durée.

Restez à la pointe de l'information avec LEBIGDATA.FR !

▶ Abonnez-vous à notre chaîne YouTube et Ajoutez-nous à vos favoris sur Google Actualités
Cliquez pour commenter

Newsletter

La newsletter IA du futur

Rejoins nos 100 000 passionnés et experts et reçois en avant-première les dernières tendances de l’intelligence artificielle🔥