machine learning prédire débat houleux web

Le Machine Learning peut prédire les débats houleux sur internet

Bastien L. 25 mai 2018 2 minutes de lecture Analytics, Data Analytics, Intelligence artificielle

Le Machine Learning est désormais capable de prédire si une conversation sur internet va tourner au vinaigre. Grâce aux travaux des chercheurs de la Cornell University, de Google Jigsaw et de Wikimedia, l'intelligence artificielle pourra ainsi bientôt remplacer les modérateurs humains sur le web.

Sur le web, les discussions ont tôt fait de dégénérer. Galvanisés par la distance et l'anonymat, les internautes tendent bien souvent à oublier la politesse et le respect. Le ton monte, les insultes fusent, les menaces surviennent. C'est un véritable problème, mais la technologie pourrait bientôt mettre un terme à ces échanges envenimés.

Le Machine Learning pourrait en effet permettre de prédire le dérapage des conversations en ligne afin d'y couper court avant qu'il ne soit trop tard. Les chercheurs de la Cornell University, de Google Jigsaw et de Wikimedia se sont associés afin de créer un logiciel capable de scanner une discussion à la recherche de certains termes laissant présager d'une tournure houleuse.

Le logiciel en question a été entraîné avec plus de 1200 conversations issues des commentaires Wikipedia. Certains termes ont été étiquetés par les chercheurs comme indicateurs du ton d'un débat. Par exemple, certaines expressions sont l'apanage d'une conversation courtoise. On peut citer la gratitude (« merci pour ton aide »), ou les formules de politesse (« s'il vous plait »). De même, certaines tournures de phrase comme « je pense que » indiquent généralement que l'ambiance est cordiale.

Le Machine Learning peut analyser le ton d'une conversation en ligne

Au contraire, certains termes semblent systématiquement témoigner d'une animosité. C'est le cas des questions directes : « Pourquoi n'y a-t-il pas de mention de ceci ? » ou encore « Pourquoi n'as tu pas regardé cela ? ». C'est aussi le cas des phrases qui commencent par un pronom à la seconde personne comme « Tes sources n'ont aucune importance ». Ce constat est particulièrement vrai lorsque ce type de phrases apparaissent comme la première réponse à un article Wikipedia.

En plus de ces signaux, les chercheurs jaugent la toxicité d'une conversation en utilisant l'API Google Perspective. Cet outil d'intelligence artificielle permet de déterminer si un texte est amical, neutre ou agressif dans sa tonalité. Pour équilibrer les jugements effectués par le logiciel, les chercheurs ont utilisé la méthode statistique de la régression logistique.

Après son entraînement, le logiciel a été évalué sur sa capacité à prédire si une conversation qui commence de façon cordiale va mal tourner. En moyenne, le programme a atteint une précision de 65%, tandis que les humains parviennent à prédire la tournure d'une discussion avec une précision moyenne de 72%.

Ainsi, des progrès doivent encore être réalisés. Cependant, dans un futur proche, il est fort possible que les machines puissent modérer les conversations en ligne. Ainsi, les plateformes comme Facebook et YouTube sur lesquelles les commentaires haineux affluents pourraient être automatiquement « détoxifiés »

Restez à la pointe de l'information avec LEBIGDATA.FR !

Abonnez-vous à notre chaîne YouTube et rejoignez-nous sur Google Actualités pour garder une longueur d'avance.

Partager l'article :