Mochi-1 débarque avec une nouvelle fonctionnalité qui s’annonce très intéressante. Vous pouvez désormais affiner ce bijou de Genmo pour refléter vos besoins spécifiques. découvrez dans cet article comment.
Genmo, un laboratoire spécialisé en vidéo IA basé à San Francisco, a présenté une nouvelle fonctionnalité pour son outil Mochi-1.
Ce module complémentaire permet de personnaliser des vidéos générées par l’IA. Et en ajoutant quelques clips supplémentaires, vous obtenez un résultat plus adapté à vos besoins.
Vous connaissez Mochi-1, non ? Il n’est pas pour tout le monde
Dès son lancement, Mochi-1 a marqué les esprits grâce à la qualité exceptionnelle des vidéos qu’il génère. Ce nouvel outil représente un grand pas vers des clips créés par IA avec une qualité proche du cinéma.
J’ai, toutefois, bien peur que Mochi-1 n’est pas conçu pour tout le monde. Il s’agit d’une avancée technologique avant tout destinée à la recherche.
Cette version initiale fonctionne avec une seule carte graphique, mais elle exige une machine très puissante. Un processeur graphique haut de gamme avec au moins 60 gigaoctets de mémoire est indispensable, ce qui le rend inaccessible à la majorité des utilisateurs.
Malgré ces contraintes, la démonstration impressionne. Avec seulement une douzaine de clips, vous pouvez ajuster le modèle pour répondre à vos besoins spécifiques.
La personnalisation repose sur une technologie appelée LoRA, utilisée depuis longtemps pour modifier des modèles d’images. Cet outil peut tout aussi être exploité pour transformer un modèle standard en un modèle taillé sur mesure.
Par exemple, il devient possible d’ajouter votre logo à des vidéos ou de créer des contenus uniques pour vos projets. Quoiqu’avec Mochi-1, cette approche est proposée pour la première fois dans un format open source.
Néanmoins, manipuler Mochi-1 demande des connaissances avancées en programmation et en lignes de commande. Vous pouvez donc en conclure que ce n’est pas un outil pour les débutants ou les amateurs.
L’open source, la nouvelle tendance ?
La technologie open source est de plus en plus populaire, on dirait, à en juger par les nombreuses annonces récentes. Cette semaine, par exemple, le modèle Allegro-T12V a été lancé, une nouvelle IA vidéo qui semble très prometteuse.
Ce modèle permet de créer une vidéo de 6 secondes en 720p simplement à partir d’une commande texte. Ce qui le rend vraiment spécial, c’est qu’il fonctionne avec seulement 9 Go de VRAM, une sorte de mémoire dédiée aux cartes graphiques.
Le géant chinois Alibaba, lui aussi, a dévoilé QwQ-32B-Preview une IA franchit les limites des modèles d’aujourd’hui dans le raisonnement mathématique et la programmation. Et devinez quoi, cet outil est également open source.
Envie de l’essayer ? QwQ-32B-Preview est disponible sur Hugging Face. Et n’oubliez pas de nous partager votre expérience dans les commentaires.
- Partager l'article :