IA vidéo chinoise

Minimax Video-1 : créez des séquences de ouf instantanément !

Imaginez une intelligence artificielle capable de donner vie à vos idées les plus folles en quelques secondes. La fiction dépasse la réalité avec MiniMax Video-1. Cette nouvelle étoile montante des technologies IA génératives fait sensation avec son modèle de conversion de texte en vidéo. Avec ses séquences de cinq secondes créées instantanément avec un prompt simple, cette rivale chinoise de Sora fait beaucoup parler d’elle sur les réseaux comme dans la presse.

YouTube video

MiniMax Video-01 fait plus qu’impressionner le public

Lancée discrètement à la rentrée 2024, MiniMax Video a été conçue par une start-up soutenue par des multinationales telles qu’Alibaba et Tencent. Lors de la conférence de presse tenue à Shanghai, les développeurs de Minimax ont tenu une première conférence. Avec ce modèle IA, une simple description textuelle se transforme en séquences d’environ cinq secondes. La plateforme livre la vidéo avec un rendu époustouflant en 40 à 60 secondes selon la complexité du prompt.

Une énième concurrente de taille pour Sora ?

Depuis l’apparition des extraits du modèle Sora en février, une douzaine de modèles similaires ont vite émergé en Chine. MiniMax Video-01 se démarque du lot grâce à son interface épurée et ultra-intuitive. Le fondateur de la start-up Yan Junjie a expliqué aux journalistes : “Nous avons en effet réalisé des progrès significatifs dans la génération de modèles vidéo et, sur la base des évaluations et des scores internes, nos performances sont meilleures que celles de Runway dans la génération de vidéos.”

Mais malgré ces déclarations optimistes, plusieurs modèles d’IA concurrents restent en tête. Par exemple, Runway Gen-3, Dream Machine et Kling. Ces derniers proposent des vidéos de 10 secondes et un mode pro pour une génération plus longue. Personnellement, je vous recommande de tester Sora et MiniMax Video-1 pour en avoir le cœur net.

Des vidéos instantanées avec un niveau cinématographique

En dépit de son niveau professionnel, MiniMax Video-1 facilite l’expérience utilisateur avec des tutoriels intégrés. L’application offre également un support multilingue natif qui facilite la tâche à ceux qui veulent diffuser leurs audiovisuels au niveau international.

Sur le point technologique, Minimax Vidéo-01 prend en charge des vidéos en résolution 1280×720 à 25 images par seconde. Ce qui donne une impression de clarté incomparable et une fluidité exceptionnelle pour les mouvements. Vous avez même la possibilité d’ajouter divers styles de prise de vue, notamment avec les déplacements de caméra cinématographique (CGI). Des techniques telles que le panoramique, le zoom ou l’effet d’appareil au poing donnent beaucoup de dynamisme à vos séquences.

Voici un exemple de prompt pris mot pour mot :

Dans une séquence d’un réalisme à couper le souffle, le monstre géant Godzilla se déplace dans une jungle dense et fumante avec le réalisme d’un animal sauvage dans son habitat naturel. Des arbres imposants s’effondrent devant son cadre massif alors qu’il fait des pas délibérés et sûrs. Sa fourrure verte écailleuse brille humidement dans la lumière tachetée de la canopée, et le sol tremble à chaque pas tonitruant. Ses yeux sont féroces et alertes, scrutant son environnement.

Une version améliorée de cette IA arrive bientôt

MiniMax travaille aussi sur une version 02 avec des améliorations comme la conversion d’images en vidéos et aussi des clips de 10 secondes, et peut-être même plus. La startup promet donc une mise à jour rapide, dans les semaines à venir. Minimax travaille même sur une API pour les développeurs afin d’intégrer les capacités de génération de vidéos.

L’IA vidéo chinoise a déjà montré qu’elle peut générer des mouvements humains hyperréalistes. Comme les gestes précis des mains, une précision que peu d’outils concurrents peuvent égaler. Cela dit, quelques améliorations seront encore les bienvenues. Comme pour la plupart des plateformes IA, Minimax Video-1 éprouve de la difficulté à afficher les visages humains lorsqu’il faut gérer plusieurs expressions faciales. La longueur des séquences reste également à revoir.

Les longs prompts ne sont pas les meilleurs

Avec ce très long prompt, par exemple, les erreurs sont clairement visibles :

« La vidéo montre une scène se déroulant dans les années 1950, où un robot T-800 se promène dans les rues d’une ville américaine. Le paysage urbain est plein d’ambiances rétro, avec des voitures anciennes garées des deux côtés de la rue et des gens vêtus de vêtements de style médiéval, y compris des hommes portant des chapeaux haut de forme et des femmes portant des robes jupons. Les bâtiments sont décorés avec des enseignes au néon classiques et des publicités de l’époque, créant une atmosphère nostalgique.

Le robot T-800, avec son exosquelette métallique qui brille à la lumière du jour, marche avec détermination sur le trottoir. Les piétons regardent le robot avec stupeur et curiosité, et certains reculent pour éviter sa trajectoire. La caméra capture un plan large de la scène, mettant en évidence le contraste entre le robot futuriste et l’arrière-plan des années 1950. Alors que le robot continue d’avancer, il passe devant un restaurant avec de grandes fenêtres en verre, à travers lesquelles on peut voir les clients réagir à son apparition.« 

Être bref et ne pas trop insister sur les détails

En pratique, il faut une formulation de leurs phrases claire et concise pour obtenir les résultats les plus pertinents. Le minimum de mot ajoute de la précision à la modélisation IA. Les plateformes telles que MiniMax Video-1 utilisent des concepts tels que human modeling simulation qui enrichissent la diversité et la qualité des vidéos. Cet autre exemple de prompt montre que les séquences sont meilleures avec assez peu d’informations à gérer pour l’IA.

La vidéo montre un homme mangeant de la restauration rapide américaine. Un homme aux cheveux courts noirs, vêtu d’un T-shirt blanc, est assis à une petite table ronde blanche dans le restaurant. Devant l’homme se trouve une assiette avec des nuggets de poulet frits et des ailes, et une tasse de boisson avec une paille blanche. L’homme tient un hamburger de bœuf au double fromage dans une main et prend une grosse bouchée du hamburger. Plan moyen, tir fixe. Montre l’homme engloutissant sa nourriture.

Voici une interpretation de l’IA vidéo chinoise de la gloutonnerie humaine

Minimax réduit le prix d’un spot publicitaire à quelques centimes

L’équipe derrière Minimax Video-1 reste discrète sur la question d’agent, mais tient à affirmer l’accessibilité financière de la plateforme. Selon nos sources, le coût pour générer une vidéo avec cet outil avoisine les 30 centimes d’euros par vidéo. Cette tarification compétitive place Minimax Video-1 parmi les options les plus rentables pour ceux souhaitant entrer dans le domaine de la vidéo.

Pour comparer, sachez que la production d’un spot classique de 7 secondes varie entre 1200 € et 4 000 €. Dès la préproduction, le casting, le script et le repérage des lieux demandent entre 600 € et 1000 €. Après, il faudra engager une équipe de tournage et confier le projet à la postproduction.

Outre le montage et l’ajout d’effets, les techniciens doivent encore travailler la musique, l’étalonnage des couleurs et bien d’autres détails. Il faut noter que si ce coût apparaît faible, il augmente selon l’envergure des projets ou le volume de vidéos requis. Comme pour beaucoup de plateformes IA, les grandes entreprises ont droit à leurs propres devis personnalisés.

Quelles sont les alternatives à cette IA vidéo chinoise ?

Sora , Runway Gen-3 et MiniMax Video-1 dans un mouchoir de poche

MiniMax Video-1 souhaite se hisser au même niveau que Sora. Cette IA générative développée par OpenAI est reconnue pour sa capacité à générer des vidéos de haute qualité à partir de descriptions textuelles. Elle a été l’une des pionnières de ce segment du marché des l’intelligence artificielle. La compétition entre MiniMax Video-1 et Sora ne fait que commencer. Disposant de soutien financiers conséquents, ces deux entreprises cherchent à améliorer leurs algorithmes pour offrir des fonctionnalités uniques.

Autre concurrent notable, Runway émerge du lot avec son modèle Gen-3. Cet outil IA se distingue par so habileté à produire des vidéos de dix secondes. Les séquences plus longues que celles offertes par Video-1 répondent mieux aux besoins des professionnels. Outre des spots publicitaires, les clips et les vidéos de formation sont aussi possibles avec cette plateforme. Les performances de Runway sont souvent comparées à celles de MiniMax. Cela dit, les deux entreprises bataillent surtout pour proposer la meilleure qualité. Bien que plus courtes, les séquences générées l’IA vidéo chinoise ont une plus grande précision dans les mouvements humains.

D’autres plateformes pour générer des vidéos IA

Dream Machine est également un acteur important dans ce domaine. Cette IA se concentre sur la création de vidéos hyperréalistes, avec une attention particulière aux détails comme les gestes des mains et les expressions faciales. Dream Machine est citée comme l’une des IA les plus avancées en termes de réalisme des vidéos générées, ce qui en fait un concurrent sérieux pour MiniMax.

En dernier, mais pas des moindres, Kling est une autre IA qui mérite d’être mentionnée. Bien que moins connue que ses concurrents, Kling AI propose des fonctionnalités innovantes et une interface utilisateur conviviale qui facilite la création de vidéos. Cette plateforme se positionne comme une alternative viable pour ceux qui recherchent une solution simple et efficace pour la génération de vidéos à partir de texte.

Restez à la pointe de l’information avec LEBIGDATA.FR !

Abonnez-vous à notre chaîne YouTube et rejoignez-nous sur Google Actualités pour garder une longueur d’avance.

Newsletter

Envie de ne louper aucun de nos articles ? Abonnez vous pour recevoir chaque semaine les meilleurs actualités avant tout le monde.

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *