Rendus 4K réalistes, avec son et dialogues, les démos de Veo 3 de Google rivalisent avec Sora d’OpenAI.
19 mai 2025, conférence Google I/O – la firme dévoile Veo 3, sa dernière IA de génération vidéo. Les démos, spectaculaires, ont fait monter l’attente. Ses capacités techniques et créatives rivalisent sans peine avec celles de Sora.
La démo de Veo 3 frôle le réalisme
Lors de la démonstration, les vidéos de Veo 3 s’affichent en 4K avec un réalisme sans précédent. Les personnages adoptent des comportements physiques crédibles, enrichis d’effets sonores générés par l’IA.
Mais pas n’importe quels sons : bruitages, dialogues et ambiances, tout est produit automatiquement. Des fonctions permettant de créer des scènes variées, presque authentiques.
En effet, Veo 3 intègre l’audio de manière native, avec possibilité d’ajouter dialogues et bruitages via de simples prompts. Le rendu se rapproche parfois d’un chef-d’œuvre hollywoodien.
Par ailleurs, Google a collaboré avec Primordial Soup, dirigée par le cinéaste Darren Aronofsky, pour explorer les usages cinématographiques. Une alliance qui renforce l’attrait de Veo 3 pour les industries créatives.
L’IA peut générer des dialogues humoristiques, des publicités, des reportages ou même des vidéos ASMR. Une autre démonstration présente la création de scènes de jeux vidéo en temps réel.
En effet, Veo 3 reproduit des univers inspirés de Fortnite ou Minecraft, avec actions et interfaces intégrées. Autre exemple, une séquence CGI montre des animaux discutant dans une forêt, avec un son parfaitement synchronisé.
Un entraînement appuyé sur les vidéos YouTube
Veo 3 s’appuie sur de vastes ensembles de données, incluant des vidéos disponibles sur YouTube. Petite précision, cette plateforme appartient à Google.
Rien d’étonnant donc à ce que l’IA génère une vidéo montrant un streamer remportant une partie de Fortnite… uniquement avec une pioche. Mais cette démo de Veo 3 soulève une question : qu’en est-il des droits d’auteur ? Fortnite reste une œuvre protégée, propriété d’Epic Games.
En théorie, les filtres de Google devraient bloquer ce type de contenu. Or, un expert en IA affirme avoir contourné ces garde-fous. Les systèmes de sécurité, encore imparfaits, laissent des failles possibles.
Autre limite constatée, les vidéos que Veo 3 génère ne dépassent pas dix secondes, contrairement à ce que laisse penser la démo. En revanche, le modèle semble éviter les deepfakes, aucune imitation de personnalité n’a été signalée.
Pour l’instant, Veo 3 reste accessible uniquement aux États-Unis. L’outil est réservé aux abonnés du plan Google AI Ultra, via l’application Gemini et la plateforme Vertex AI pour les entreprises.
- Partager l'article :