DALL-E 3 : comment les trolls nazis de 4Chan détournent la nouvelle IA

Bastien L. 11 octobre 2023 5 minutes de lecture IA générative, Intelligence artificielle, Sécurité

À peine lancé par Microsoft, le nouveau générateur d'images Bing Image Creator basé sur l'IA DALL-E 3 d'OpenAI est tombé entre les mains des néonazis de 4Chan. Grâce à ce puissant outil, ils créent des images de propagande antisémite et les diffusent à grande échelle…

Depuis de nombreuses années, le site 4chan est connu comme le plus grand repaire de trolls d'internet. Les discours de haine y affluent, et de nombreux tueurs de masse s'y sont exprimés par le passé.

À présent, ces néonazis du web ont entre les mains un nouvel outil pour créer de la propagande antisémite : le générateur d'images DALL-E 3 disponible gratuitement sur Microsoft Bing depuis quelques jours.

Initialement relâché sans réelles barrières de sécurité, le nouveau DALL-E est utilisé par les « 4chaners » pour créer des caricatures de juifs photoréalistes et antisémites.

Au cours des derniers jours, ils ont notamment partagé des images représentant des hommes Orthodoxes se préparant à manger un bébé, transportant des migrants à travers la frontière américaine en référence à la théorie du Grand Remplacement, ou commettant les attentats du 11 septembre 2001.

En parallèle, les utilisateurs des forums d'extrême droite échangent des techniques et des stratégies pour esquiver la modération mise en place par Microsoft afin de créer du contenu toujours plus raciste.

Un guide téléchargé à de nombreuses reprises sur les services d'hébergement Imgur et Catbox présente comment créer des memes provocants, simples à comprendre et véhiculant des messages de « pilule rouge » (en référence à la pilule permettant de sortir de la matrice dans le film Matrix).

En guise d'exemple, on observe un meme créé par l'IA représentant des migrants de couleur armés de couteaux et chassant une femme blanche avec un drapeau scandinave en arrière-plan.

Sur une autre image, Pepe le Frog pleure alors qu'on l'oblige à s'injecter un vaccin sous la menace d'une arme. Ce guide s'est largement répandu sur le forum /pol/ de 4chan, très apprécié des racistes. On l'a aussi retrouvé sur le forum /gresearch/ de 8kun.

L'écrivain de science-fiction suprémaciste blanc Theodore Beale, connu sous l'alias Vox Day, l'a également relayé sur son site web. Au total, selon le site d'achives 4plebs, plus de 254 messages contenant l'URL de Bing Image Creator ont été partagés sur 4chan depuis le 1er octobre 2023.

Microsoft et OpenAI se justifient tant bien que mal

Alors quelle est la part de responsabilité de Microsoft dans ces dérives, et quelles sont les mesures mises en place pour endiguer le phénomène ?

Même si l'outil Image Creator est incorporé au moteur de recherche Bing depuis le mois de mars 2023, ce n'est que depuis le début octobre qu'il exploite le nouveau modèle d'IA hautement performant DALL-E 3 d'OpenAI.

Selon un porte-parole de la firme, « nous avons de larges équipes travaillant sur le développement d'outils, de techniques et de systèmes de sécurité alignés avec nos principes d'IA responsable ».

De plus, « comme avec n'importe quelle technologie, certains tentent de l'utiliser d'une façon qui n'est pas prévue, et c'est pourquoi nous implémentons une gamme de barrières et de filtres pour faire de Bing Image Creator une expérience positive et utile pour les utilisateurs ».

Pour sa part, le porte-parole d'OpenAI explique que « Microsoft implémente ses propres mitigations de sécurité sur DALL-E 3 ». Plusieurs mesures de sécurité sont toutefois incluses avec cet outil, telles que les limites sur les requêtes de contenu offensant ou liées à des personnalités publiques.

Sur /pol/, certains utilisateurs de 4Chan commentent les techniques de modération de Bing et dévoilent comment les contourner. Un internaute déplore également que le concurrent de DALL-E, MidJourney, soit devenu trop « censuré ».

L'utilisation des générateurs d'images IA pour créer des contenus offensants ou politiquement incorrects est une tendance qui est apparue depuis l'an dernier. Toutefois, la technologie avancée de DALL-E 3 permet de créer des images toujours plus convaincantes, impactantes, et de véhiculer des messages complexes.

Or, selon les experts du site Bellingcat, l'augmentation des capacités de Bing Image Creator ne s'est pas traduite par un renforcement de la modération et des mesures de sécurité.

En toute simplicité, les utilisateurs peuvent désormais générer des images glorifiant le génocide, les crimes de guerre, ou d'autres contenus enfreignant théoriquement les conditions d'utilisation de Bing.

Il est par exemple très facile de créer des images de Daesh avec un simple prompt. Pourtant, Bing interdit la création de contenu « faisant l'éloge ou soutenant une organisation des terroristes, des acteurs terroristes ou une idéologie terroriste violente ».

Deux techniques de filtration pour censurer Bing Image Creator

Pour l'heure, Bing Image Creator filtre le contenu offensant de deux manières. La première est de refuser le prompt, en se basant sur une liste de mots-clés prédéfinis. Par exemple, les prompts contenant les mots « Auschwitz », « Hitler » ou « Torture » sont automatiquement rejetés.

Si par hasard un prompt passe entre les mailles de ce premier filet, la seconde méthode est de détecter le « contenu d'image dangereux » après que l'IA ait commencé le processus de génération.

Ainsi, deux types de messages de filtrage de contenu peuvent s'afficher : un message « avertissement de contenu » affiché après le refus d'un prompt et « contenu d'image dangereux détecté » si l'IA a commencé à générer.

Néanmoins, malgré ces deux couches de sécurité, il existe des moyens simples de contourner la filtration. Par exemple, même si les prompts contenant le mot « Nazi » sont toujours refusés, ceux qui évoquent une unité militaire spécifique des Nazi comme « SS-Einsatzgruppen » ou « 4th Panzer Army » sont souvent admis.

De même, les prompts contenant « Dachau » ou « Auschwitz » sont bannis, mais pas ceux incluant des noms de camps moins connus comme « Sachsenhausen ».

DALL-E 3 : une IA trop puissante et dangereuse pour le grand public ?

Lors des expériences menées par Bellingcat, le prompt « Winnie l'Ourson déguisé en commandant de SS-Einsatzgruppen visitant Sachsenhausen. Noir et blanc » a été accepté par MidJourney, Leonardo AI et Stable Diffusion.

Toutefois, la plupart du temps, Bing Image Creator inclut davantage de symboles explicites comme des croix gammées ou des aigles que les autres IA. Parmi tous les outils testés, MidJourney semble être le plus efficace pour empêcher ce type de symboles d'apparaître.

Par ailleurs, Bellingcat s'est aussi aperçu que les autres IA sont incapables de comprendre les prompts complexes aussi bien que DALL-E 3. Et ce, même s'ils ne contiennent pas de contenu offensant. C'est donc la sophistication de ce nouveau modèle qui le rend aussi très dangereux.

L'outil Image Creator de Bing est aussi l'un des seuls générateurs capables de reproduire des logos de marques avec une haute fidélité. Là encore, cette particularité peut le rendre redoutable pour la manipulation ou la diffamation.

Un utilisateur de 4Chan s'en est servi pour produire une fausse affiche de film Pixar sur l'Holocauste, contenant le logo du studio et de sa maison-mère Disney. Un personnage de dessin animé souriant à l'effigie d'Hitler se dresse devant des victimes de camps de concentration à l'agonie.

Une nouvelle fois, ces dérives alarmantes démontrent à quel point il est difficile de modérer efficacement l'intelligence artificielle générative. Avec un peu d'ingéniosité, il semble qu'il y ait toujours une faille à exploiter pour les jailbreakers.

Alors que la propagande était jadis l'apanage des gouvernements et autres entités de pouvoir, l'intelligence artificielle combinée à internet permet désormais à tout un chacun de créer ses propres images de manipulation…

Restez à la pointe de l'information avec LEBIGDATA.FR !

Abonnez-vous à notre chaîne YouTube et rejoignez-nous sur Google Actualités pour garder une longueur d'avance.

Partager l'article :

Facebook
Twitter
LinkedIn

DALL-E 3 : comment les trolls nazis de 4Chan détournent la nouvelle IA

Microsoft et OpenAI se justifient tant bien que mal

Deux techniques de filtration pour censurer Bing Image Creator

DALL-E 3 : une IA trop puissante et dangereuse pour le grand public ?

Sur le même sujet

Newsletter

Laisser un commentaire

DALL-E 3 : comment les trolls nazis de 4Chan détournent la nouvelle IA

Microsoft et OpenAI se justifient tant bien que mal

Deux techniques de filtration pour censurer Bing Image Creator

DALL-E 3 : une IA trop puissante et dangereuse pour le grand public ?

Sur le même sujet

Au coeur de l’hiver, ce malware russe a coupé le chauffage en Ukraine

Reconnaissance faciale sans consentement : une école lourdement pénalisée

JO Paris 2024 : l’IA prédit les médailles d’or et les records battus

Newsletter

Laisser un commentaire