Photo d'une jeune femme chinoise aux couleurs d'Alibaba

Alibaba lance WAN 2.1 : l’IA de vidéo qui pulvérise OpenAI Sora !

Besoin de transformer du texte ou des images en vidéos époustouflantes en quelques clics ? Sans pour autant vider votre portefeuille, bien entendu ! Alibaba vient de rendre cela possible avec Wan 2.1. 

Wan 2.1 n’est pas uniquement puissant et performant comme modèle. Cet outil de conversion de texte en vidéo est désormais source. Autrement dit, tout le monde a le droit de l’installer et ce, gratuitement.

Les chinois et leur modèle open source

Wan 2.1 permet aux utilisateurs de créer des vidéos à partir de texte, d’images et même d’autres vidéos. 

Ce modèle défait déjà Sora d’ avec ses clips tellement réalistes qu’il est difficile de croire qu’ils proviennent d’une application d’IA. Cela dit, l’entreprise chinoise cherche toujours à le rendre meilleur. 

Il faut savoir que l’une des idées ingénieuses qui ont permis à DeepSeek de devenir viral est la décision de son créateur de le rendre open source. Alors, il me semble qu’Alibaba a retenu la leçon. 

Mercredi, le 5 mars, la firme a annoncé le nouveau statut open source de son IA Wan 2.1. En prime, le modèle, ou plus précisément la version Wan2.1-T2V-14B, s’est hissée en tête du classement VBench en matière de performances.

YouTube video

Selon le site de Wan, ce service d’IA peut restituer des mouvements complexes. Il offre des vidéos réalistes avec des gestes corporels détaillés, des transitions dynamiques et des déplacements de caméra fluides.

En plus, c’est le premier modèle vidéo à prendre en charge du texte en chinois et en anglais. Mieux encore, l’outil peut éventuellement créer des vidéos de qualité cinématographique

Visuels dignes d’un film, textures riches et effets stylisés, tout est garanti. Il peut générer même des effets sonores et de la musique de fond synchronisés avec le contenu visuel.

Et ses fonctionnalités d’édition sont tout aussi impressionnantes. Il permet, par exemple, des modifications précises en utilisant des images et des références vidéo.

Des preuves des performances de Wan 2.1 ?

Le site propose plusieurs exemples bluffants. Des chiens faisant du vélo, des chats en plein match de boxe et même des danseurs exécutant des chorégraphies complexes

J’y ai aussi trouvé d’autres vidéos dont une d’une femme émergeant de l’eau, d’un archer tirant à l’arc et d’un chien coupant des tomates. Il faut donc croire que Wan 2.1 est aussi capable de simuler avec précision la physique du monde réel et des interactions réalistes entre objets.

Le moins que je puisse dire c’est qu’avec de telles performances et un statut open source, il pulvérise complètement Sora ainsi que beaucoup d’autres outils similaires. 

Cela dit, avec de tels systèmes ouverts, les risques d’abus, notamment la diffusion de fausses vidéos réalistes, sont inévitables. 

YouTube video

Ce qui est plutôt inquiétant vu que le site d’Alibaba ne précise pas les mesures de sécurité prévues dans le cas échéant. Pas même la façon dont ces vidéos générées par l’IA seront identifiées comme telles.

Il ne reste plus qu’à espérer que le géant chinois saura gérer les dérives potentielles de son IA open source. Alors, qu’est-ce que vous en dites ?

Personnellement, je m’écarte un peu du sujet mais j’ai remarqué que plus l’IA fait partie de notre quotidien, plus les startups font tout leur possible pour se surpasser l’un de l’autre. 

Et alors que certains se font remarquer pour leur performance, d’autres, comme le modèle Lucie, censée être une alternative à , passent complètement à côté. 

Et vous, quelles sont vos remarques ? Dites-nous tout dans le commentaire ! 

Restez à la pointe de l'information avec LEBIGDATA.FR !

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Newsletter

La newsletter IA du futur

Rejoins nos 100 000 passionnés et experts et reçois en avant-première les dernières tendances de l’intelligence artificielle🔥