Vlogger

Google dévoile Vlogger : créez votre influenceuse IA pour les réseaux

Grâce à des modèles avancés d'apprentissage automatique, les chercheurs de ont développé un nouveau système d'intelligence artificielle, appelé Vlogger.

Une autre technologie IA débarque ? Oui, et elle peut transformer une photo en vidéos réalistes. En plus, elle permet de créer facilement une influenceuse IA pour les réseaux sociaux. Découvrez maintenant cette technologie prometteuse.

Création d'avatars réalistes

Au cœur de cette révolution, les chercheurs de Google ont travaillé d'arrache-pied pour donner vie à Vlogger. Cette innovation a le pouvoir de métamorphoser une simple photographie en un avatar animé, commandé directement par la voix de son créateur.

Même si Vlogger n'a pas encore été officiellement lancé, les démonstrations qui circulent nous offrent un aperçu stupéfiant de réalisme.

Il est vrai, bien sûr, que d'autres outils permettant des animations semblables étaient déjà présents sur le marché, à l'instar de la synchronisation labiale proposée par Pika Labs ou encore des services de traduction vidéo de Hey Gen et Synthesia.

Toutefois, Vlogger se distingue radicalement grâce à son approche plus intuitive. De plus, sa consommation réduite en termes de ressources signale une véritable révolution.

Comment fonctionne Vlogger ?

Le fonctionnement de Vlogger repose sur une architecture de diffusion avancée. Cette technologie passe par plusieurs étapes pour générer l'avatar.

D'abord, elle analyse l'audio et l'image fournis, les soumet à un processus de création de mouvement en 3D. Ensuite, elle utilise un modèle de diffusion temporelle pour déterminer les mouvements et leur synchronisation.

Enfin, l'avatar est ajusté pour produire le résultat final. Le système s'appuie sur un réseau neuronal qui prédit le mouvement du visage, du corps, et les expressions faciales. Il utilise l'image fixe comme point de départ et l'audio comme guide.

Pour s'entraîner, le modèle a utilisé MENTOR, un vaste ensemble de données contenant des vidéos étiquetées de personnes s'exprimant. Cela a considérablement enrichi sa capacité à générer des avatars réalistes.

Exploration du potentiel et reconnaissance des limites

Malgré son potentiel considérable, il convient de reconnaître que Vlogger n'est pas sans limites. Actuellement à l'état de prototype plutôt que de produit fini, il se peut qu'il ne restitue pas avec une fidélité absolue les mouvements naturels d'un individu.

Les chercheurs eux-mêmes admettent que, face à des gestuelles complexes ou dans le cadre d'environnements hétérogènes, le modèle pourrait se montrer moins performant. Il est, de surcroît, optimisé essentiellement pour la création de séquences vidéo brèves.

Toutefois, le tableau n'est pas uniquement teinté de nuances sombres, les champs d'application potentiels de Vlogger sont, en effet, particulièrement étendus. Ils s'étendent, d'une part, à l'amélioration des traductions vidéo et à la conception d'assistants virtuels animés de manière convaincante. D'autre part, ils incluent le développement de personnages de jeux vidéo au réalisme saisissant.

Un point tout particulièrement captivant réside dans l'opportunité d'exploiter Vlogger. En effet, cela permet d'optimiser les communications vidéo, spécialement dans les contextes à faible bande passante. Cette perspective ouvre la porte à des échanges virtuels nettement plus fluides et accessibles.

Newsletter

Envie de ne louper aucun de nos articles ? Abonnez vous pour recevoir chaque semaine les meilleurs actualités avant tout le monde.

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *