Stable Diffusion : tout savoir sur le champion des générateurs d’images IA Open Source

Bastien L. 11 février 2025 10 minutes de lecture Dossiers, Intelligence artificielle

L’intelligence artificielle text-to-image Stable Diffusion de Stability AI permet de générer des images à partir de textes, à l’instar de MidJourney et DALL-E. Toutefois, cette IA est la seule à permettre de générer du contenu pornographique sans censure. Inutile de préciser que les internautes s’en donnent à coeur joie… découvrez tout ce que vous devez savoir.

Depuis plusieurs mois, DALL-E et MidJourney émerveillent les internautes en créant des oeuvres d’art à partir de leurs idées. Il suffit d’entrer des mots pour que ces IA génèrent de magnifiques dessins.

Vous voulez un média comme celui que vous lisez ?

Passez de lecteur à leader ! Faites de votre entreprise un acteur inévitable avec votre propre média 🔥

Vous voulez un média comme celui que vous lisez ?

Passez de lecteur à leader ! Faites de votre entreprise un acteur inévitable avec votre propre média 🔥

Malheureusement pour les amoureux d’art et de poésie, même l’IA text-to-image n’échappe pas à la règle 34 d’internet : la pornographie existe concernant tous les sujets concevables.

Le modèle de génération text-to-image Stable Diffusion de l’entreprise d’intelligence artificielle Stability AI vient d’être lancé, mais les gens l’utilisent déjà pour créer des images pornographiques.

Qu’est-ce que Stable Diffusion ?

Développé par Stability AI et lancé officiellement lancé le 22 août 2022, Stable Diffusion est un générateur freemium de texte à image qui crée des images étonnantes et détaillées à partir d’invites. Contrairement à DALL-E et Midjourney, il est open-source, ce qui signifie que vous êtes libre d’utiliser, de modifier ou de distribuer son code légalement. En septembre 2023, Stable Diffusion compte plus de 10 millions d’utilisateurs.

Lancée en juillet 2023, Stable Diffusion XL ou SDXL est la dernière version de Stable Diffusion. Comme prévu, elle présente des avancées significatives en termes de génération d’images par l’IA. SDXL ajoute plus de nuances, comprend mieux les messages courts et reproduit mieux l’anatomie humaine.

Comment utiliser Stable Diffusion ?

https://twitter.com/EMostaque/status/1561777122082824192?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1561777122082824192%7Ctwgr%5E9258bf09099b1fb122135bd7a06e94c356f59030%7Ctwcon%5Es1_&ref_url=https%3A%2F%2Fmixed-news.com%2Fen%2Fdall-e-2-open-source-alternative-stable-diffusion-is-now-available%2F

Pour profiter des fonctionnalités de Stable Diffusion, saisissez votre texte dans le champ réservé et cliquez ensuite sur « Générer ». Il est conseillé d’être le plus explicite possible lors de la rédaction du texte, étant donné que le logiciel prend en compte le langage naturel. Par exemple, vous pouvez simplement décrire le sujet et le style de l’image que vous souhaitez créer. En fonction de votre demande, le logiciel peut générer jusqu’à 4 images liées au texte. Pour avoir accès à ces propositions, il suffit de cliquer sur l’une d’entre elles et d’appuyer sur la touche « + ».

Selon Emad Mostaque, PDG de DreamStudio, cette API publique a pour but d’« étendre la créativité des utilisateurs et de leur permettre de vivre de nouvelles expériences ». D’autres fonctionnalités vont être ajoutées à DreamStudio, notamment la possibilité d’utiliser directement votre GPU local ou d’ajouter des animations.

Vous trouverez egalement les instructions pour utiliser Stable Diffusion via DreamStudio à cette adresse. En guise d’alternative à DreamStudio, HuggingFace offre aussi une interface web rudimentaire pour Stable Diffusion.

Gardez en tête que vous ne pouvez pas générer de contenu pornographique si vous utilisez DreamStudio. Pour créer ce type d’images, vous devez exécuter le modèle IA localement sur votre GPU. Le code complet est disponible sur GitHub à cette adresse.

Les systèmes nécessaires pour exécuter Stable Diffusion localement

Pour exécuter Stable Diffusion localement, il faut télécharger le modèle. En outre, il faut disposer d’une carte graphique Nvidia avec plus de 4 Go de RAM.

Quant aux cartes graphiques AMD, elles ne sont pas officiellement supportées, mais peuvent être utilisées avec quelques astuces. Or, bientôt les puces Apple M1 seront prises en charge.

En outre, si vous n’êtes pas très inspiré, vous pouvez utiliser un créateur de textes automatique à cette adresse. Pour rejoindre la communauté officielle de Stable Diffusion sur Discord, rendez-vous à cette adresse.

Stable Diffusion : l’IA text-to-image sans censure

Comme DALL-E Mini (CrAIyon) ou MidJourney, Stable Diffusion est capable de créer des images réalistes à partir de simples textes entrés par les internautes grâce aux réseaux de neurones.

Toutefois, les créateurs de ces MidJourney et DALL-E Mini ont implémenté des limites. Les requêtes contenant des mots violents ou à caractère sexuel sont automatiquement censurées.

De son côté, le modèle Stable Diffusion de Stability AI n’a aucune restriction. Les utilisateurs peuvent télécharger ce modèle et le modifier à leur guise pour générer n’importe quel contenu. Sans surprise, beaucoup s’en servent pour créer du contenu pornographique automatiquement.

Afin de développer son modèle IA, Stability AI a reçu l’aide de plus de 15 000 beta testeurs. En juillet 2022, elle a enfin ouvert l’accès à son outil pour les chercheurs.

Depuis lundi 22 août 2022, Stable Diffusion est ouvert à tous. Toutefois, ce modèle a fuité sur le web et notamment sur 4Chan bien avant sa sortie officielle.

Malgré l’interdiction fixée par l’entreprise de générer du contenu pornographique, et avant le lancement, de nombreux internautes égrillards se sont affairés à créer des images aussi grivoises que possible…

Stability AI interdit la création de porno… en vain

Depuis le début du mois d’août 2022, le forum de Stable Diffusion est inondé par les images pornographiques. Des dessins Hentai, des photos de célébrités nues, des scènes pornographiques imaginaires créées par l’IA affluent sur le site.

Pourtant, Stability AI s’oppose fermement à ce type de contenu. La version bêta de Stable Diffusion et l’application web DreamStudio interdisent le contenu pornographique ou érotique. Sur Twitter, l’entreprise avait demandé aux utilisateurs de « ne rien générer que vous auriez honte de montrer à votre mère ».

La firme précise que des filtres de contenu sont mis en place sur la plateforme. Elle applique donc la même forme de censure que MidJourney ou DALL-E Mini. En fait, la société demandait aux internautes de créer le contenu pour adulte uniquement sur leur propre GPU lorsque le modèle sera relaxé.

Toutefois, n’importe qui peut le copier pour l’exécuter sur son PC et les vils internautes s’empressent de créer des images obscènes. Néanmoins, les utilisateurs de Stable Diffusion doivent respecter les conditions d’utilisation de la licence du modèle. Il s’agit de la licence CreativeML OpenRAIL-M dont les termes sont les mêmes que ceux DALLE-Mini pour la version open-access.

Cette licence interdit notamment l’usage « détourné, malicieux ou malveillant ». Il est également proscrit de « générer des images que les gens risquent de trouver dérangeantes ou offensantes, ou du contenu propageant des stéréotypes historiques ou actuels ».

Reddit, Discord : où voir les images créées par Stable Diffusion ?

La différence entre le modèle Stable Diffusion et les autres IA text-to-image est qu’il est disponible en « open access » (accès libre). Cela signifie que n’importe qui peut télécharger le modèle et l’exécuter sur sa propre machine à la maison ou dans un laboratoire de recherche.

Il n’est pas nécessaire d’exploiter les serveurs de l’entreprise via le cloud. Or, les filtres et les règles de censure s’appliquent uniquement sur ces serveurs. Quatre subreddits dédiés au contenu licencieux ont déjà vu le jour :

r/unstablediffusion,
r/PornDiffusion,
r/HentaiDiffusion
et r/stablediffusionnsfw.

Au total, ces groupes rassemblent environ 2000 membres. Le subreddit principal de Stable Diffusion rassemble quant à lui 8000 fans.

Un serveur Discord a aussi été ouvert par le modérateur des subbredits r/Singularity, r/UnstableDiffusion, r/PornDiffusion et r/HentaiDiffusion : Ashley22.

https://twitter.com/MartinNebelong/status/1562046724209872896?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1562046724209872896%7Ctwgr%5E9258bf09099b1fb122135bd7a06e94c356f59030%7Ctwcon%5Es1_&ref_url=https%3A%2F%2Fmixed-news.com%2Fen%2Fdall-e-2-open-source-alternative-stable-diffusion-is-now-available%2F

LAION : un dataset d’entraînement « truffé d’images porno »

Afin d’obtenir les dessins souhaités, les utilisateurs rédigent de longues descriptions qu’ils partagent et complètent entre eux. Par exemple, un dessin a été créé à partir du texte « peinture à l’huile d’une princesse blanche nue réaliste exposée seins symétriques et cuisses réalistes exposées avec de charmants yeux détaillés, le ciel, page de couleur, tankoban, 4K, cartographie de tons, poupée, akihiko yoshida, james dean, andrei riabovitchev, marc simonetti, yoshitaka amano, longs cheveux, bouclés ».

Ces textes sont ensuite fournis à l’IA pour la laisser créer une image. Stable Diffusion a été entraîné en utilisant 4000 GPU Nvidia A100, sur un ensemble de données nommé « LAION-Aesthetics ». En fait, LAION est l’anagramme de Large-scale Artificial Intelligence Open Network (réseau ouvert d’intelligence artificielle à grande échelle). Il s’agit d’une organisation non lucrative consacrée à l’IA.

Le dataset open source LAION 5B pèse 250 terabytes et contient 5,6 milliards d’images collectées sur internet. Son prédécesseur LAION-400M était connu pour contenir du contenu aberrant. Une étude de 2021 révélait qu’il comportait « de nombreux textes et images troublants et explicites de viols, pornographie, stéréotypes malins, insultes racistes, et autre contenu extrêmement problématique ».

L’équipe Google Research a elle aussi entraîné son modèle texte-to-image Imagen sur LAION-400M. Les chercheurs ont préféré éviter d’ouvrir l’accès à leur modèle au public de peur qu’il produise des représentations blessantes et mette en scène des stéréotypes.

Pour remédier au problème, Stability AI a réduit LAION 5B de deux milliards à 120 millions d’images en entraînant un modèle à prédire la note de 1 à 10 que les gens donneraient à une image. Seules les meilleures ont été retenues pour le dataset LAION-Aesthetics. Le but étant notamment d’éliminer les images pornographiques.

Le danger des DeepFakes

https://twitter.com/Plinz/status/1561796775911911424?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1561796775911911424%7Ctwgr%5E9258bf09099b1fb122135bd7a06e94c356f59030%7Ctwcon%5Es1_&ref_url=https%3A%2F%2Fmixed-news.com%2Fen%2Fdall-e-2-open-source-alternative-stable-diffusion-is-now-available%2F

Si des images de hentaï générées par une IA n’ont rien de bien dangereux, Stable Diffusion peut être détourné pour générer du contenu beaucoup plus problématique : des DeepFakes. Les internautes peuvent utiliser cette IA pour créer de fausses photos nues de célébrités. Il suffit de lui fournir la photo d’une star, et de lui laisser imaginer son corps dénudé.

Les DeepFakes générés grâce à l’IA posent problème aux chercheurs et aux ingénieurs depuis plusieurs années. Mais encore, les nouveaux modèles text-to-images dans la lignée de Stable Diffusion ne vont clairement pas arranger les choses.

Contrairement à DALL-E ou MidJourney, Stable Diffusion peut être utilisé pour créer de fausses photos de célébrités car l’ensemble de données LAION open-source sur lequel il est entraîné contient de nombreuses photos de stars.

De telles photos peuvent nuire à la réputation d’une vedette, même si elles sont fausses. Les images générées par l’IA ne sont pas encore suffisamment réalistes pour être pris pour de vrais clichés, mais pourraient rapidement le devenir…

Un américain arrêté pour générer des images pédopornographiques sur Stable Diffusion

En mai 2024, un habitant du Wisconsin, Steven Anderegg, a été arrêté pour avoir utilisé Stable Diffusion, pour générer plus de 13 000 images pédopornographiques réalistes. Le ministère de la Justice américain a déclaré que c’est une première affaire où l’utilisation d’une IA générateur d’image sans censure a conduit à des poursuites judiciaires. Cette arrestation souligne l’ampleur des défis posés par les technologies d’IA dans la lutte contre la pédopornographie.

Anderegg utilisait Stable Diffusion, un générateur d’images open-source qui permet de créer des images réalistes à partir de descriptions textuelles. Malgré les mesures mises en place pour empêcher la création de contenus explicites, il a réussi à contourner ces restrictions. En plus de générer des images, il a également partagé certaines d’entre elles via Instagram avec un mineur de 15 ans, expliquant comment il avait utilisé l’outil pour produire ces images.

L’arrestation de cet individu met en lumière les risques croissants associés à l’utilisation des IA pour créer du contenu abusif. Europol a également signalé une augmentation significative des cas où des technologies d’IA sont utilisées pour générer ou altérer des images d’abus sexuels sur enfants. Ces images posent des défis majeurs pour l’identification des victimes réelles et compliquent les efforts des autorités pour surveiller et contrôler ce type de matériel en ligne.

Le cas d’Anderegg montre l’importance de renforcer les mesures de sécurité autour des IA générateur d’image sans censure. Plus encore, de maintenir un engagement ferme pour protéger les enfants contre toutes formes d’exploitation, même celles facilitée par les avancées technologiques (KION546) (DW).

Des datasets plus responsables : les efforts de Stability AI pour répondre aux critiques

L’utilisation de datasets de grande échelle comme LAION-5B a permis à Stable Diffusion de devenir une référence en matière de génération d’images text-to-image. Cependant, ces ensembles de données massifs ont également attiré de vives critiques. Effectivement, LAION-5B et ses prédécesseurs, tels que LAION-400M, contenaient une proportion significative de contenus explicites, violents ou biaisés. Ce qui a suscité des préoccupations éthiques et légales.

Consciente de ces défis, Stability AI a pris des mesures pour améliorer la qualité et la responsabilité de ses datasets. Le lancement de LAION-Aesthetics en est une illustration. Ce dataset réduit la quantité d’images problématiques. Pour ce faire, il utilise des modèles de filtrage capables de prédire la qualité esthétique des contenus. Ce processus a permis de passer de 5,6 milliards d’images dans LAION-5B à seulement 120 millions dans LAION-Aesthetics. Ces images ont été sélectionnées pour leur valeur artistique et leur conformité à des normes éthiques élevées.

Malgré ces efforts, des critiques persistent. Certains soulignent que des contenus explicites subsistent, et que le filtrage basé sur des modèles peut introduire de nouveaux biais. Cependant, ces améliorations marquent une étape essentielle vers une IA générative plus sûre et éthique. Plus encore, elles montrent la volonté de Stability AI de répondre aux préoccupations croissantes du public et des régulateurs.

Comment utiliser un générateur d’images IA sans censure en 2025 ?

La première étape consiste à choisir un ia générateur d’image sans censure comme Stable Diffusion sur des plateformes en ligne qui l’hébergent. Vous pouvez créer un compte avec une simple adresse email. En 2025, certaines plateformes proposent même une connexion via Google ou d’autres réseaux sociaux.

Une fois connecté, vous arrivez généralement sur une interface avec un champ de texte principal. C’est ici que vous écrirez votre prompt, c’est-à-dire la description détaillée de l’image que vous souhaitez générer. Plus votre description est précise, meilleur sera le résultat.

Lors de la rédaction du prompt, pensez à inclure des détails sur le style artistique souhaité. Personnalisez votre requête : photo réaliste, peinture à l’huile, aquarelle, ambiance lumineuse, sombre, chaleureuse, etc. N’hésitez pas à utiliser des termes techniques comme « 4K », « haute résolution », ou « hyperréaliste » pour améliorer la qualité.

Les paramètres avancés permettent également d’affiner votre création en 2025. Vous pourrez ajuster la taille de l’image, le nombre d’itérations (combien d’images seront générées), et parfois même le « seed » (un nombre qui permet de reproduire exactement la même image). Ces options sont souvent accessibles via un menu déroulant ou des boutons dédiés.

Après avoir lancé la génération, l’IA mettra quelques secondes à quelques minutes pour créer vos images. Vous pourrez alors les télécharger, les modifier ou les régénérer si le résultat ne vous convient pas. Pour améliorer une image, vous pouvez ajuster votre prompt en fonction du résultat obtenu.