OpenAI ne sait même pas si Sora s’entraîne sur du contenu YouTube. Cela n’est pas du goût de la plateforme de vidéos de Google qui hausse le ton.
Mira Murati, directrice technique chez OpenAI, et Neal Mohan, PDG de YouTube, se répondent par interviews interposées. La première avoue ne pas savoir si l’entraînement de Sora utilise ou non des vidéos YouTube. Pour Mohan, c’est inacceptable que le modèle de texte-à-vidéo se forme sur du contenu de sa plateforme.
Sora sera le prochain modèle d’intelligence artificielle phare d’OpenAI. Celui-ci transforme les instructions textuelles en courtes vidéos réalistes et imaginatives.
Ce futur modèle de texte-à-vidéo représente une avancée significative qui repousse les limites de la créativité de l’intelligence artificielle. De plus, il ouvre de nouvelles perspectives prometteuses pour de nombreux secteurs d’activité.
Le problème perpétuel de l’entraînement des modèles d’IA
Les performances d’un modèle d’IA dépendent de la qualité de son entraînement. La formation doit ainsi se faire avec des données qualitatives et quantitatives.
Il faut savoir que ces données qualitatives sont principalement des œuvres humaines. Leur exploitation peut souvent poser des problèmes de propriété intellectuelle.
Les créateurs de contenu ne veulent pas que leurs œuvres soient utilisées pour entraîner des modèles d’IA. Rappelons que de grands noms de l’industrie musicale américaine se sont récemment mobilisés contre Suno AI.
Pour le cas d’OpenAI, il ne faut pas oublier son procès contre le New York Times. Le journal condamnait l’utilisation de ses articles de presse pour entraîner les grands modèles de langage servant de moteur à ChatGPT.
Des vidéos YouTube pour entraîner Sora ? Elle n’est pas certaine
Le 13 mars dernier, le Wall Street Journal a publié une interview de Mira Murati. La directrice technique d’OpenAI y parle longuement de Sora.
Ce modèle d’IA révolutionnaire est attendu pour plus tard cette année. Il va également intégrer le son à long terme, précise la responsable technique.
Sur le sujet des données utilisées pour entraîner le modèle de texte-à-vidéo, Murati s’est montrée évasive. Elle a mentionné des « données accessibles au public ou sous licence ».
La directrice technique a raconté ne pas savoir si Sora a utilisé des vidéos provenant de YouTube et des réseaux sociaux. Néanmoins, elle a confirmé l’exploitation du contenu de Shutterstock, avec lequel OpenAI possède un partenariat.
Une « claire violation » selon le PDG de YouTube
La plateforme de vidéos de Google est très stricte en ce qui concerne l’utilisation de ses vidéos par des tiers. En particulier, pour les usages sans autorisation.
L’entraînement de Sora sur des vidéos YouTube serait « claire violation » des règles de la plateforme selon Neal Mohan. Le PDG était interviewé par Bloomberg jeudi dernier.
Un créateur a certaines attentes, quand il met son travail sur la plateforme, rappelle le dirigeant. Le respect des conditions d’utilisation fait partie de celles-ci.
Pour le patron de YouTube, l’exploitation du contenu de sa plateforme pour entraîner Sora constituerait une violation des droits d’auteur. Néanmoins, il ne confirme pas dans son entretien si OpenAI a réellement exploité des vidéos de YouTube.
- Partager l'article :