cerveau IA posé sur des revues et journaux

Meta s’offre les archives du Wall Street Journal pour booster ses modèles d’IA

Meta continue d’alimenter son IA avec du contenu premium. Le groupe de Mark Zuckerberg vient de signer un accord de licence avec News Corp. Ainsi, Meta utilisera les archives et les articles de Wall Street Journal et d’autres médias pour améliorer les réponses de son chatbot Meta AI et entraîner ses futurs modèles. 

Depuis plusieurs mois, les géants de la tech multiplient les accords avec les médias. Ils veulent nourrir leurs modèles avec des sources fiables et structurées. Meta, lui, vient de s’associer avec News Corp, un groupe qui possède notamment le Wall Street Journal.

Selon les informations publiées par le quotidien économique, l’accord pourrait atteindre 50 millions de dollars par an pendant trois ans. Cette somme importante donnera à Meta le droit d’utiliser les contenus éditoriaux du groupe pour améliorer son IA. 

Meta veut nourrir son IA avec des sources fiables comme le Wall Street Journal

L’accord permet donc à Meta d’utiliser le contenu du Wall Street Journal et d’autres médias appartenant à News Corp dans deux cas précis. D’abord pour entraîner ses modèles d’intelligence artificielle. Les systèmes d’IA générative ont besoin d’énormes volumes de texte pour apprendre à comprendre le langage. Et aussi pour analyser des faits et produire des réponses cohérentes.

Ensuite pour alimenter directement les réponses du chatbot Meta AI. Cela signifie que certaines réponses pourront s’appuyer sur des informations issues de ces publications.

Pour Meta, l’enjeu est d’améliorer la qualité et la crédibilité de son assistant conversationnel. Les IA génératives sont souvent critiquées pour leurs approximations ou leurs informations datées. Ainsi, intégrer des sources journalistiques reconnues augmentera la fiabilité des réponses.

Dans une déclaration précédente sur sa stratégie, Meta expliquait vouloir intégrer davantage de sources d’information variées. L’entreprise veut offrir des contenus plus pertinents et plus actuels à ses utilisateurs.

Les détails officiels restent discrets, mais d’après les informations du Wall Street Journal, Meta pourrait payer jusqu’à 50 millions de dollars par an, pour un engagement de trois ans. L’accord couvrirait les contenus de plusieurs marques de News Corp aux États-Unis et au Royaume-Uni.

Je vous rappelle que News Corp a déjà signé un accord de cinq ans avec OpenAI, évalué à environ 250 millions de dollars. Ainsi, les archives journalistiques deviennent de plus en plus une ressource stratégique pour entraîner les intelligences artificielles.

Les groupes de presse disposent d’un avantage avec des millions d’articles structurés, vérifiés et couvrant des décennies d’actualité. Pour les développeurs d’IA, ce type de contenu représente une matière première particulièrement précieuse.

Les médias passent de la confrontation au partenariat

Pendant longtemps, les relations entre entreprises d’IA et médias ont été tendues. Plusieurs rédactions accusent les modèles d’avoir été entraînés sur leurs contenus sans autorisation. Mais, News Corp adopte désormais une approche très claire face à cette situation. Son PDG Robert Thomson parle d’“une stratégie mêlant “persuasion et poursuites”.

Les entreprises technologiques ont donc deux choix. Négocier un accord de licence ou risquer une bataille judiciaire. Les groupes de médias veulent être rémunérés si leurs contenus servent à entraîner des modèles d’IA. Ces derniers pourront ensuite générer des réponses ou des articles.

Et cette position commence à porter ses fruits. Meta a déjà signé des accords similaires avec plusieurs médias, dont CNN, Fox News, USA Today ou encore People. Pour les plateformes, payer pour ces contenus peut aussi réduire les risques juridiques qui entourent encore l’entraînement des modèles d’IA.

Pourquoi la qualité des données compte pour entraîner une IA ?

Les modèles d’IA progressent rapidement, mais leur performance dépend directement des données utilisées pour les entraîner. Les entreprises qui contrôlent les meilleures sources d’information disposent donc d’une longueur d’avance.

Les archives d’un média comme le Wall Street Journal représentent des décennies d’analyses économiques, de reportages et d’enquêtes. Pour un système d’IA, c’est une base d’apprentissage extrêmement riche.

Dans le même temps, les groupes de presse cherchent de nouveaux modèles économiques. Puisque les revenus publicitaires et les abonnements sont sous pression. Les licences accordées aux entreprises d’IA pourraient devenir une nouvelle source de revenus pour le journalisme.

Par ailleurs, je pense que l’accord entre Meta et le propriétaire de Wall Street Journal n’est probablement qu’une étape. Les entreprises d’IA vont continuer à chercher des contenus fiables, récents et vérifiés pour améliorer leurs modèles. Les médias, eux, vont tenter de monétiser ces archives qui prennent soudain une valeur stratégique.

Toutefois, ils devront analyser jusqu’où les plateformes pourront-elles intégrer du contenu journalistique dans leurs assistants ? Et comment s’assurer que les médias restent visibles si les utilisateurs obtiennent directement les réponses via un chatbot ?

Ce qui est sûr c’est que l’IA devient un nouvel intermédiaire de l’information. Et les archives journalistiques deviennent l’un des carburants les plus précieux de l’économie numérique. 

Restez à la pointe de l'information avec LEBIGDATA.FR !

▶ Abonnez-vous à notre chaîne YouTube et Ajoutez-nous à vos favoris sur Google Actualités
Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Newsletter

La newsletter IA du futur

Rejoins nos 100 000 passionnés et experts et reçois en avant-première les dernières tendances de l’intelligence artificielle🔥