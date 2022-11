Movio propose une plateforme d’intelligence artificielle permettant de créer automatiquement des vidéos de marketing à partir d’un simple texte. Désormais implantée en Californie, la startup chinoise espère séduire les marketeurs du monde entier en les laissant créer des contenus novateurs très facilement…

Au fil de l’année 2022, l’intelligence artificielle générative a connu un essor fulgurant. Grâce aux algorithmes « text-to-image » de groupes comme OpenAI et Stability AI, il est désormais possible de créer des images artistiques en entrant une simple description textuelle.

De nombreuses oeuvres d’art impressionnantes ont ainsi été générées par l’IA, et l’une d’elles a même gagné une compétition dans le Colorado. Les outils tels que MidJourney ou DALL-E 2 sont exploités par des graphistes, des designers, des illustrateurs ou même des architectes.

Une nouvelle vague de startups cherche à présent à développer des applications pour ce nouveau type de modèle de langage permettant aux machines de créer du texte, des images ou des vidéos à partir de données entrées par l’humain.

Movio créer des vidéos d’avatars parlants à partir de simples textes

L’une de ces startups est Movio. Créée il y a deux ans, elle utilise l’IA générative et d’autres frameworks de machine learning comme les GAN (réseaux génératifs antagonistes) pour créer des vidéos comportant des avatars humains parlants.

Sa plateforme s’adresse principalement aux marketeurs, avec une interface glisser-déposer similaire à celle de Canva. Les utilisateurs peuvent choisir entre différents templates, selon le cas d’usage. Il peut s’agir par exemple d’un thème pour un site de shopping ou pour un voyage au Japon.

Il est ensuite possible d’ajouter un avatar hyper-réaliste en guise de « porte-parole ». Son discours est généré par le texte entré par l’utilisateur. Les vêtements, le visage et la voix du personnage peuvent être modifiés en un clic.

À l’heure actuelle, le nombre d’utilisateurs de Movio atteint quelques centaines de milliers. Approximativement un millier d’entre eux sont des clients payants. L’entreprise a levé 9 millions de dollars auprès d’investisseurs tels que IDG, Sequoia Capital China, et plus récemment Baidu Ventures.

Une startup créée par des vétérans de TikTok et Snapchat

Le CEO Josh Xu et le CPO Liang Wang, les deux co-fondateurs de Movio, se sont rencontrés à la Carnegie Mellon University durant leurs études. Auparavant, Liang Xang a travaillé sur le réseau social musical Smule, et pour l’entreprise ByteDance qui détient TikTok. De son côté, Josh Xu a travaillé pendant six ans comme ingénieur chez Snapchat.

Initialement basée à Shenzhen, capitale chinoise du hardware électronique et du e-commerce, Movio s’était précédemment illustrée avec un outil de création de vidéos deepfakes. Sa plateforme était utilisée par les marchands en ligne pour créer des vidéos promotionnelles narrées par des humains synthétiques.

Désormais implantée à Los Angeles, Movio compte attirer les marketeurs américains désirant exploiter l’IA pour leur travail. Selon la startup, les vidéos offrent des possibilités illimitées pour le marketing. Son but est notamment de permettre aux marketeurs d’envoyer des emails contenant des avatars parlants plutôt que du texte.

Pour l’heure, Movio peut synthétiser uniquement des têtes parlantes. La firme travaille toutefois pour que ses algorithmes puissent générer des mouvements du corps entier. Cette évolution la rapprochera de son but de créer une « plateforme de production de vidéo IA tout-en-un ».

Le prix des vidéos générées dépend de leur durée, calculée selon la durée du script fourni par l’utilisateur. Des frais supplémentaires sont ajoutés pour les clients désirant des visages personnalisés. Cette option est particulièrement prisée pour les vidéos de formation d’entreprise.

En parallèle, Movio a aussi ouvert son API aux sites web tiers. Certains utilisent d’ores et déjà son moteur pour créer des avatars de service client.

Après l’essor des outils text-to-image, les plateformes text-to-video s’annoncent comme le prochain phénomène. Outre Movio, plusieurs géants de la tech ont présenté leurs IA génératives de vidéos comme Google Imagen Video ou Meta Make A Video…