La startup Odyssey va vous faire oublier OpenAI Sora ! Elle prépare une IA de création de vidéos capable de rivaliser avec les plus grands studios d’Hollywood, en permettant à l’utilisateur de modifier chaque élément tel que le décor, l’éclairage, le mouvement ou les personnages… découvrez tout ce qu’il faut savoir !
En février 2024, OpenAI surprenait le monde entier en dévoilant Sora : une intelligence artificielle permettant de créer des vidéos à partir d’un simple prompt textuel.
Près de six mois plus tard, le lancement de cet outil se fait toujours attendre, mais plusieurs concurrents proposent déjà leurs alternatives.
C’est le cas des startups chinoises Kling et Vidu, ou encore des Américains Runway Gen-3 et Luma Dream Machine qui sont disponibles en France.
Toutefois, la startup Odyssey, fondée il y a environ un an, veut aller encore plus loin. Elle vient d’annoncer la création d’une IA visuelle « de qualité hollywoodienne ».
Cette dernière sera capable de générer des décors, des personnages et des éclairages cinématiques.
Le générateur de vidéos qui vous donne le contrôle total
Sa différence avec les autres outils text-to-video ? Elle donne à l’utilisateur le contrôle total et granulaire de chaque élément dans la scène.
Comme le souligne le co-fondateur de la startup, Jeff Hawke, personne n’utiliserait ChatGPT s’il produisait du texte que les utilisateurs ne pouvaient pas modifier.
Pourtant, « c’est exactement la façon dont fonctionnent les outils text-to-video à l’heure actuelle, avec des modèles qui produisent un fichier vidéo entièrement préparé que vous ne pouvez pas retoucher ».
Ainsi, il critique le fait que « si un décor, un personnage, un éclairage ou un mouvement ne convient pas, vous devez tout recommencer ».
En effet, avec un outil tel que Luma Dream Machine, l’utilisateur se contente d’entrer son prompt et l’IA se charge de créer une vidéo qui correspondra ou non à ses attentes. Il faut parfois répéter le processus des centaines de fois pour obtenir un résultat satisfaisant.
L’autre co-fondateur et CEO d’Odyssey, Oliver Cameron, déplore que nous soyons entourés de « texte et d’imagerie générés par IA de piètre qualité ».
À ses yeux, pour qu’une IA puisse être exploitée à Hollywood, elle doit être capable de créer des « visuels époustouflants et sans anomalies ».
Quatre modèles IA au lieu d’un seul
Alors comment Odyssey compte surmonter ces limites ? La startup a entraîné quatre modèles génératifs, qui permettent aux utilisateurs de contrôler avec précision les différentes couches de la vidéo.
Ces modèles peuvent générer une géométrie de haute qualité, des images photo-réalistes, un éclairage impressionnant, et un mouvement entièrement contrôlable.
Afin de parvenir à ses fins, Cameron révèle qu’Odyssey a déjà levé plus de 9 millions de dollars auprès des investisseurs.
Il explique que ses modèles sont plus difficiles à créer que les outils text-to-video classiques, mais qu’ils permettront l’émergence d’un meilleur produit fini.
Une startup fondée par des experts en voitures autonomes
L’approche de la startup s’inspire principalement des véhicules autonomes, qui ont dû repousser les limites de l’iA visuelle et ont contribué à améliorer les performances à l’aide de données du monde réel.
De plus, ces voitures sans pilote ont eu besoin de simulations avec une physique précise et réaliste. Auparavant, Cameron a d’ailleurs co-fondé la startup Voyage qui développe des voitures autonomes pour les personnes âgées ne pouvant plus conduire.
De son côté, Hawke était un chercheur dans l’entreprise britannique Wayne qui teste des véhicules autonomes dans différentes villes du Royaume-Uni.
Si l’IA d’Odyssey fonctionne réellement comme annoncé, vous pourrez donc générer très rapidement des vidéos correspondant exactement à ce que vous imaginez.
Elle a donc véritablement le potentiel de révolutionner les films, les séries TV, les clips musicaux ou même les jeux vidéo, en permettant à n’importe qui donner vie à toutes ses idées…
- Partager l'article :