Dans une récente controverse autour des pratiques de collecte de données d'OpenAI, il a été révélé que la société aurait transcrit plus d'un million d'heures de vidéos YouTube pour entraîner son modèle d'intelligence artificielle (IA) GPT-4.

L'accusation du New York Times

Le New York Times a apporté de nouveaux éléments à cette affaire en publiant un rapport détaillant comment OpenAI aurait utilisé ces transcriptions illégales pour améliorer son moteur d'IA. Selon ce rapport, Google, qui appartient au même groupe qu'YouTube, Alphabet Inc., était au courant de ces actions mais n'aurait pas agi. La raison en serait que la multinationale utiliserait également des vidéos YouTube pour ses propres modèles d'IA.

Cette pratique pourrait enfreindre les droits d'auteur des créateurs qui ont produit ces vidéos et nuire à leur monétisation à long terme. En utilisant leurs contenus sans permission, OpenAI et Google neglige le travail et l'effort investi par ces créateurs dans la production de leurs œuvres originales.

Google et sa politique de confidentialité

Google aurait, selon les informations disponibles, modifié sa politique de confidentialité afin de couvrir l'utilisation d'autres contenus publics. Bien que cette modification puisse protéger l'entreprise contre d'éventuelles poursuites, elle ne résout pas le problème de l'exploitation des œuvres créatives sans autorisation.

OpenAI et Google ne sont pas les seules entreprises à faire l'objet de critiques pour leurs pratiques de collecte de données. Le géant américain Cox Media Group a également avoué écouter les conversations d'utilisateurs par l'intermédiaire de dispositifs intelligents, comme les smartphones et les téléviseurs connectés, afin d'identifier de nouveaux clients pour un ciblage publicitaire plus précis.

Les réactions de la communauté

Face à ces révélations, de nombreux utilisateurs et défenseurs des droits numériques ont exprimé leur mécontentement et leur préoccupation. Certains appellent à une régulation stricte du secteur des technologies de l'information et de la communication pour garantir le respect des droits des créateurs et éviter ce genre de pratique controversée.

Ces affaires soulignent l'importance de la transparence et de l'éthique dans le domaine de l'intelligence artificielle. Les entreprises doivent être claires sur leurs méthodes de collecte de données et informer les utilisateurs de la manière dont leurs informations sont utilisées. Dans le cas contraire, elles risquent de perdre la confiance du public et de s'exposer à des conséquences juridiques.

