Le géant des puces se retrouve au cœur d’une tempête judiciaire. Des millions de livres piratés pour entraîner ses IA ? Les auteurs américains ne décolèrent pas, et les marchés observent de près. Nvidia pourrait payer cher cette polémique.
Nvidia n’a pas fini de faire parler de lui. Cette fois, pas pour une bonne cause. En effet, une action collective américaine vient de déposer une plainte amendée. Elle accuse le groupe d’avoir utilisé des millions de livres piratés pour entraîner ses modèles d’IA. Les documents internes cités par les plaignants semblent accablants. Selon eux, Nvidia aurait sollicité directement une « bibliothèque de l’ombre » pour accéder à ces données massives.
Des livres piratés pour entraîner l’IA : comment Nvidia s’est retrouvé dans le viseur ?
Le scandale repose sur Books3, un jeu de données déjà controversé. Mais l’affaire dépasse désormais ce simple corpus. La plainte évoque un accès structuré à plusieurs centaines de téraoctets de contenus, dont des ouvrages protégés par le droit d’auteur. La concurrence féroce autour des grands modèles de langage pourrait avoir poussé Nvidia à franchir la ligne.
Les documents judiciaires révèlent qu’un membre de l’équipe data de Nvidia a contacté Anna’s Archive. C’est l’une des plus grandes bibliothèques pirates en ligne. L’objectif ? Obtenir un accès massif et rapide à des collections entières pour enrichir les données de pré-entraînement.
La plateforme aurait signalé l’illégalité de ses contenus. Pourtant, la direction aurait donné son feu vert pour poursuivre les discussions. L’ampleur du dossier impressionne. Car les auteurs accusent Nvidia d’avoir exploité d’autres sources controversées, telles que LibGen, Sci-Hub ou Z-Library.
Pire, le groupe aurait fourni des outils permettant à des partenaires et clients professionnels d’accéder à ces données piratées. La stratégie risquée pourrait coûter très cher en justice.
Une affaire emblématique des tensions autour de l’IA
Nvidia nie toute faute concernant l’accusation des livres piratés pour entraîner l’IA. La firme avance l’argument du « fair use », estimant que les œuvres serviraient uniquement à établir des corrélations statistiques.
D’autres acteurs du secteur ont déjà utilisé cet argument. Mais ce dernier ne convainc plus autant les tribunaux. Les plaignants, eux, voient un manquement grave aux droits d’auteur et demandent des comptes.
The Guardian a déjà rapporté une affaire similaire, qui concernait Anthropic. Le tribunal américain avait jugé que l’entraînement de ses modèles sur des livres légalement acquis pouvait relever du fair use, mais que le stockage massif de copies piratées dépassait les limites légales.
Dans une autre affaire, Meta a obtenu un jugement partiellement favorable. L’entreprise de Zuckerberg que certains usages de livres pour l’entraînement d’IA ne constituaient pas une violation du droit d’auteur.
Cette polémique met donc en lumière un dilemme crucial pour l’industrie de l’IA. Comment nourrir les modèles sans franchir les limites légales ? Or, la pression pour développer des modèles plus performants pousse certaines entreprises à explorer des voies contestables. Et si la justice américaine donnait raison aux auteurs, les conséquences financières et réglementaires pour Nvidia pourraient être monumentales.
Une situation qui inquiète les experts
Même si le tribunal n’a pas encore rendu de verdict définitif dans l’affaire des livres piratés pour entraîner l’IA, la situation inquiète déjà les spécialistes. En effet, cette controverse ne se limite pas à un simple débat juridique. Elle pourrait rapidement se transformer en facteur de risque majeur pour Nvidia et d’autres acteurs du secteur.
Sur les marchés, les investisseurs n’aiment rien tant que l’incertitude juridique. Si une décision judiciaire venait à condamner Nvidia, les conséquences sur le cours de l’action pourraient être importantes. Quand une entreprise fait face à des procès coûteux ou à des dommages et intérêts colossaux, cela pèse souvent sur son carnet de commandes et sa valorisation boursière.
On a déjà vu des exemples frappants dans l’histoire récente de la technologie. En 2000, MP3.com s’est retrouvée déboutée dans une affaire de copies de musique sans autorisation. Ce qui l’a poussée à devoir verser plus de 150 millions de dollars de dommages et intérêts. Cette affaire a aussi plongé l’entreprise dans de graves difficultés financières avant une fusion de sauvetage.
Plus récemment, comme l’a rapporté The Washington Post, Anthropic a accepté un accord de 1,5 milliard de dollars. Cela simplement pour éviter un procès lié à l’utilisation non autorisée de millions de livres piratés pour l’entraînement de son modèle Claude.
Pour Nvidia, la route s’annonce semée d’embûches. Les prochains mois s’annoncent décisifs. Affaire à suivre !
- Partager l'article :