Photo qui illustre le verdict d'un juge

Meta a téléchargé 82TB de livres pour entraîner son IA ! Est-ce du vol ?

a utilisé le torrenting pour télécharger 82 To de livres via des plateformes illégales. De plus, la société a installé des systèmes pour éviter qu’on remonte à elle.

La société mère de est actuellement en plein procès ! Apparemment, elle est accusé d’entraîner illégalement son modèle d’IA Llama sur des livres protégés. Par ailleurs, les documents à l’origine de l’affaire sont justement sur le point d’être rendus publics. C’est justement ce qui a permis de connaître l’ampleur du piratage réalisé par Meta, qui connaissait parfaitement ce qu’elle faisait.

Téléchargement massif d’œuvres protégées par le droit d’auteur !

Un article de vx-underground publié sur X a permis de découvrir que Meta s’est servie de torrents piratés pour entraîner son modèle d’IA. Elle a pu télécharger exactement 81,7 To de données qui viennent de bibliothèques fantômes, dont Anna’s Archive, Z-Library et LibGen.

Les inquiétudes des chercheurs concernant l’utilisation de Meta de matériel piraté ont renforcé les preuves sous forme de communication écrite.

« Je ne pense pas que nous devrions utiliser du matériel piraté. Je dois vraiment tracer une ligne ici, » a témoigné un chercheur senior en IA chez Meta en octobre 2022.

Un autre a déclaré : « L’utilisation de matériel piraté devrait dépasser notre seuil éthique ». « SciHub, ResearchGate, LibGen sont en gros comme PirateBay ou quelque chose comme ça, ils distribuent du contenu protégé par le droit d’auteur et ils le violent, » a-t-il ajouté.

YouTube video

Meta tente de dissimuler son recours aux torrents !

Les reproches adressés à Meta ne s’arrêtent pas là ! En effet, elle a été critiquée pour avoir tenté de couvrir ses traces. Pourtant, je pense que c’est une preuve de son implication ! Pourquoi ? Parce que le groupe était totalement conscient qu’il risquait des ennuis s’il était découvert.

« L’utilisation des adresses IP de Meta pour télécharger du contenu pirate via des torrents », s’inquiétait Nikolay Bashlyko, ingénieur de recherche chez Meta, en avril 2023.

Quelques mois plus tard, il rappelait, lors d’une discussion avec le service juridique de l’entreprise, que le principe même du torrenting reposait sur le partage de ces fichiers piratés avec des tiers. Il a d’ailleurs affirmé que c’est « ce qui pourrait être légalement inacceptable ».

Évidemment, Meta a pris en compte ses inquiétudes, mais a choisi de mettre en place des systèmes visant à dissimuler son activité plutôt que d’y mettre fin.

Frank Zhang, chercheur chez Meta, évoque dans un message interne l’instauration d’un « mode furtif » pour le piratage. C’est ce qui permet d’éviter l’utilisation des serveurs de Facebook lors du téléchargement des ensembles de données, afin de réduire le risque de remonter jusqu’au seeder ou au downloader.

Vous pensez que Méta a volé en téléchargeant ces informations pour entraîner son modèle d’IA ?

Restez à la pointe de l'information avec LEBIGDATA.FR !

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Newsletter

La newsletter IA du futur

Rejoins nos 100 000 passionnés et experts et reçois en avant-première les dernières tendances de l’intelligence artificielle🔥