DALL-E 2 enfin disponible pour tous ! Comment créer de l’art avec l’IA Text-to-Image ?

Bastien L. 3 juillet 2024 10 minutes de lecture Dossiers, Intelligence artificielle

DALL-E 2 est l'une des meilleures IA de génération d'image « Text-to-Art », permettant de créer des images artistiques à partir d'un simple texte. Découvrez comment vous inscrire et comment l'utiliser à travers notre guide complet !

Lancé en version beta en avril 2022, DALL-E 2 a rapidement créé le buzz sur le web et les réseaux. Cet outil s'est imposé comme l'un des générateurs d'images IA les plus avancés, en particulier pour la création d'images photoréalistes.

Vous avez probablement déjà vu des exemples de créations DALL-E 2 sur la toile, facilement reconnaissables par les carrés de couleur servant de watermark en bas à droite de l'écran. Les images générées par cet outil sont impressionnantes.

L'accès à DALL-E 2 était réservé à une poignée d'élus. Seuls quelques privilégiés triés sur le volet pouvaient mener des expériences avec l'IA de création d'images d'OpenAI.

D'autres outils similaires comme Stable Diffusion et MidJourney étaient accessibles à tous, mais DALL-E 2 était plus restreint. Les personnes désirant l'utiliser devaient s'inscrire à une liste d'attente.

Ce n'est désormais plus le cas. Depuis le 28 septembre 2022, OpenAI a annoncé l'ouverture complète de DALL-E 2 et la suppression de la liste d'attente. N'importe qui peut désormais laisser libre cours à son imagination en créant des images à l'aide de l'IA.

Qu'est-ce que DALL-E 2 ?

DALL-E 2 est une plateforme de génération d'image par intelligence artificielle. Développé par l'entreprise OpenAI, cet outil permet aux utilisateurs de générer des images, juste en entrant un texte.

L'utilisateur décrit le sujet et le style de l'image qu'il veut créer, et DALL-E 2 se charge de la générer. Pour être capable de comprendre les mots de l'utilisateur et de les illustrer, cette IA a été entraînée sur une base de données de plus de 650 millions d'images et de légendes existantes grâce au Machine Learning.

En parallèle, DALL-E peut aussi être utilisé pour éditer une image existante ou créer des variantes. Une fonctionnalité récemment ajoutée permet également d'étendre une image par-delà son cadre existant.

Le nom DALL-E est un mot-valise entre l'artiste Salvador Dali et le film d'animation WALL-E par Pixar. Cet outil repose sur l'IA GPT-3 d'OpenAI, capable de comprendre et de traiter le langage naturel humain afin de le convertir en images.

À quoi sert DALL-E 2 ?

DALL-E 2 permet de créer une multitude d'images dans des styles très variés. Cette IA peut même reproduire le style d'artistes célèbres. En Allemagne, un institut d'art maintient une exposition d'art évolutive en utilisant DALL-E 2 pour générer des œuvres basées sur les sujets tendance sur Twitter.

Outre la dimension artistique, cet outil peut être utilisé pour le design, l'architecture ou même le marketing. Plusieurs marques, dont Heinz, l'ont utilisé pour créer des publicités expérimentales. En outre, DALL-E 2 pourrait être utile pour accélérer la création d'arrière-plans de jeux vidéo ou de films.

En général, cette intelligence artificielle « Text-to-Art » permet de réaliser des expériences artistiques, de générer et de tester de nouvelles idées.

Selon OpenAI, plus de 1,5 million de personnes l'utilisent pour créer plus de 2 millions d'images par jour. Ces utilisateurs vont « des artistes aux directeurs de la création en passant par les écrivains et les architectes ». La firme ajoute qu'environ 100 000 d'entre eux partagent leurs créations et leurs commentaires sur le serveur Discord officiel.

DALL-E 2 : comment fonctionne t-il ?

Pour comprendre le fonctionnement du générateur d'images d'IA, il faut se familiariser avec les concepts suivants :

CLIP : signifie Contrastive Language-Image Pre-training (pré-entraînement contrastif langage-image). Il s'agit peut-être de l'élément le plus important de l'architecture de DALL-E 2. L'approche repose sur l'idée qu'il est possible d'utiliser le langage naturel pour enseigner aux ordinateurs le rapport entre différentes images.

CLIP se compose de deux réseaux neuronaux :

un codeur de texte
et un codeur d'image.

Tous deux sont entraînés sur des collections vastes et diverses de paires image-texte. Le modèle analyse ces paires d'images et de légendes pour créer des représentations vectorielles appelées « text/image embeddings« . En d'autres termes, CLIP sert de pont entre le texte (entrée) et l'image (sortie).

Modèle antérieur : il prend un encastrement de texte légende/CLIP et s'en inspire pour générer des encastrements d'images CLIP.

Modèle de diffusion du décodeur (unCLIP) : l'inverse du modèle CLIP original génère des images en utilisant les incrustations d'images CLIP.

DALL-E 2 crée un résultat en combinant les modèles antérieurs et unCLIP. L'image ci-dessous décrit grossièrement le processus sous-jacent.

Comment s'inscrire sur DALL-E 2 ?

Depuis septembre 2022, l'accès est désormais ouvert et n'importe qui peut s'inscrire depuis le site officiel. Voici comment s'y prendre/

Créer un compte sur le site web d'OpenAI. Pour ce faire, vous devrez entrer votre adresse email et un code de sécurité, et créer un mot de passe à huit chiffres.
Ensuite, vous recevrez un email contenant un lien, sur lequel vous devez cliquer pour vérifier votre compte. Vous recevrez aussi un code par SMS pour confirmer votre identité. En guise d'alternative, vous pouvez aussi créer un compte en utilisant votre compte Google ou Microsoft.
Cliquez pour finir sur le bouton « Continuer » pour accepter les conditions d'utilisation.

Certains internautes rencontrent toutefois des difficultés. Sur Twitter et Instagram, plusieurs personnes se plaignent que DALL-E 2 est inaccessible dans leur pays ou qu'ils reçoivent une erreur en tentant de s'inscrire. Il n'y a toujours pas d'API pour DALL-E 2, mais OpenAI y travaille.

Comment créer une image avec DALL-E 2 ?

Une fois l'inscription complétée, vous pouvez commencer à écrire votre premier texte descriptif ou « prompt » en anglais. Il suffit de décrire le sujet de l'image et le style désiré, et l'IA se charge de la créer.

Après avoir créé votre compte, vous verrez à l'écran une grande boîte de texte. C'est ici que vous pouvez écrire une description de l'image que vous souhaitez créer, avec un maximum de 400 caractères.

Essayez d'être le plus détaillé possible, et cliquez sur « générer ». Dès lors, DALL-E 2 crée quatre images basées sur votre texte. En cas de message d'erreur, vous pouvez réessayer.

N'hésitez pas à éditer votre « prompt » autant de fois que nécessaire pour améliorer le résultat. Toutefois, gardez en tête que chaque nouvelle génération d'image vous coûtera des crédits.

Si l'une des quatre images générées vous convient, cliquez dessus. Vous pouvez ensuite la télécharger en cliquant sur la flèche située en haut à droite de l'image. Il est également possible d'éditer l'image en cliquant sur le bouton « edit », avec des outils tels qu'une gomme ou l'importation d'images à ajouter. En outre, vous pouvez aussi créer des « variations » alternatives de l'image.

Comment modifier une image existante avec DALL-E 2 ?

Une autre manière d'utiliser DALL-E 2 est de télécharger une image depuis votre ordinateur ou votre smartphone, afin de la modifier. Sous la boîte de texte, vous trouverez un lien permettant de la charger.

L'image sera automatiquement rognée en carré. Après l'avoir téléchargée, vous pouvez laisser DALL-E 2 créer ses propres variations ou éditer l'image à votre guise.

DALL-E 2 Outpainting : étendre l'oeuvre d'art par-delà son cadre

La fonctionnalité Outpainting, récemment ajoutée à DALL-E 2, permet d'étendre une image par-delà ses bordures d'origine. Vous pouvez l'appliquer à une image créée par l'IA, ou sur une image que vous avez téléchargée.

Ce nouvel outil a déjà été utilisé sur des oeuvres d'art célèbres comme La Joconde. L'IA ajoute des éléments, et le résultat est plutôt impressionnant.

Pour utiliser cette fonction, générez ou téléchargez une image puis réduisez sa taille en tirant les angles. Écrivez votre « prompt », et DALL-E 2 se chargera d'ajouter les éléments souhaités en reprenant le style de l'œuvre d'origine.

Améliorez vos images avec un « Prompt Book » pour DALL-E 2

En essayant les générateurs Text-to-Art comme DALL-E 2 pour la première fois, vous vous être probablement rendu compte que le résultat n'était pas forcément à la hauteur de vos attentes et loin des plus belles images réalisées avec ces outils.

Afin d'améliorer vos créations, vous pouvez utiliser le « Prompt Book » de Guy Parsons, publié sur le site DALL-Ery GALL-Ery spécialement dédié à l'art IA. Cette ressource visuelle peut vous aider à mieux formuler vos descriptions textuelles et vous inspirer pour exploiter tout le potentiel de DALL-E 2.

Ce guide composé de 82 pages révèle les meilleures techniques pour perfectionner vos résultats sur DALL-E 2. Il recommande notamment les meilleurs adjectifs à utiliser pour atteindre l'ambiance, l'émotion ou la composition esthétique que vous recherchez.

https://twitter.com/GuyP/status/1547234780001042432

Vous recevrez aussi des astuces pour tous les types d'images, qu'il s'agisse de photographie, de portraits ou de paysages. Les différents styles d'illustrations et d'arts historiques sont abordés, au même titre que l'art en 3D.

Le livre prodigue notamment des conseils pour les angles de vue, l'éclairage, le type d'objectif, ou encore les textures. Il montre aussi comment utiliser les divers styles artistiques.

Combien coûte DALL-E 2 ?

Pour accéder à DALL-E 2, les utilisateurs doivent acheter des crédits utilisés pour générer des images, effectuer des modifications ou créer des variantes. Voici les détails des tarifs pour DALL-E 2 :

Crédits gratuits : Les nouveaux utilisateurs reçoivent 50 crédits gratuits lors de l'inscription et 15 crédits supplémentaires chaque mois. Ces crédits expirent après un mois.
Crédits achetés : Des crédits supplémentaires peuvent être achetés par incréments de 115 crédits pour 15 USD. Ces crédits achetés sont valables pendant 12 mois à compter de la date d'achat.
Utilisation de l'API : Si vous utilisez l'API DALL-E, le prix dépend de la résolution des images générées :
- Résolution 1024×1024 : 0,020 USD par image
- Résolution 512×512 : 0,018 USD par image
- Résolution 256×256 : 0,016 USD par image

Notons que les artistes peuvent demander un tarif réduit à cette adresse. Les utilisateurs conservent la pleine propriété des images qu'ils créent avec DALL-E 2, ce qui signifie qu'ils peuvent réimprimer, vendre et utiliser commercialement les images sans aucune revendication de la part d'OpenAI.

Par ailleurs, il existe des alternatives gratuites à DALL-E 2, telles que l'IA open source Stable Diffusion permettant de créer des images sans aucune censure. Vous pouvez aussi utiliser l'outil DALL-E Mini, désormais renommé CrAIyon suite aux plaintes d'OpenAI, mais cet outil offre des performances bien plus limitées.

Comment supprimer la watermark DALL-E 2 ?

Les images générées avec DALL-E 2 sont faciles à reconnaître. Elles contiennent une signature ressemblant à une ligne de carrés colorés située en bas à droite de l'image.

Toutefois, le règlement de DALL-E 2 autorise à supprimer cette watermark. Cette suppression est en effet indispensable pour la plupart des cas d'usages commerciaux. Vous pouvez retirer cette signature très facilement avec n'importe quelle application d'édition d'image telle que Photoshop.

Il est également possible de télécharger directement l'image sans watermark. Sur PC, effectuez un clic droit sur l'image, choisissez l'option « Inspecter » et cherchez l'URL windows.net. Copiez le lien de l'image et ouvrez-le. Elle devrait apparaître sans le logo. Sur smartphone ou tablette, vous pouvez presser l'image sur la page de génération et cliquer sur « sauvegarder l'image ».

Les limites de DALL-E 2

La qualité du résultat de DALL-E 2 dépend en grande partie du texte fourni par l'utilisateur. Plus vous êtes précis, plus vous avez de chances d'obtenir le résultat souhaité. Toutefois, le système présente certaines limites intrinsèques.

Par exemple, il n'est pas encore très compétent en matière de compositionnalité (bien qu'il semble s'améliorer avec le temps). Cela signifie que DALL-E 2 ne parvient souvent pas à fusionner de manière significative plusieurs objets ou propriétés d'objets tels que la forme, l'orientation et la couleur.

Mais ce n'est pas tout. Le programme risque aussi de ne pas fonctionner correctement, même avec des instructions (relativement) simples. Par exemple, si l'étiquetage des données est incorrect, il peut produire de faux résultats, tout comme quelqu'un qui aurait appris le mauvais mot. Ou, lorsqu'il reçoit du texte qu'il n'a pas appris auparavant, il essaiera de produire des résultats similaires à ceux qu'il a vus pendant la formation, mais les résultats peuvent être trop différents.

Nous pensons qu'il est passionnant de voir le développement de DALL-E avec le temps et de voir comment il peut être appliqué à de nouveaux domaines en utilisant ce qu'il a appris.

Les préoccupations dans les limites de DALL-E 2

OpenAI a programmé DALL-E 2 pour qu'il ne crée pas d'images de personnalités publiques et de célébrités. En fait, il ne génère pas d'images contenant des visages réalistes ou des personnes réelles. Il s'agit là d'un pas dans la bonne direction pour empêcher l'utilisation abusive du programme. Toutefois, compte tenu de la disponibilité croissante de fausses applications profondes, des acteurs malveillants pourraient prendre une image de DALL-E et y intégrer le visage de quelqu'un d'autre.

La violation des droits d'auteur pourrait également devenir un problème majeur à mesure que DALL-E 2 gagne en popularité. OpenAI affirme que les utilisateurs « bénéficient de tous les droits de commercialisation des images qu'ils créent avec DALL-E, y compris le droit de les réimprimer, de les vendre et de les commercialiser ». Cependant, les générateurs d'art par IA dépendent du travail d'artistes humains pour analyser, apprendre et créer de l'art. On ne peut donc pas exclure la possibilité d'une violation des lois sur la propriété intellectuelle, même si elle n'est pas intentionnelle.

Quelles sont les interdictions ?

Avant d'ouvrir l'accès à son outil, OpenAI s'est assuré de mettre en place des règles strictes pour éviter les « biais et la toxicité » des images générées par DALL-E 2. Des changements ont notamment été apportés. Ces derniers permettent de générer des images « reflétant mieux la diversité de la population mondiale » si le genre ou l'ethnie n'est pas précisé dans le texte de « prompt ».

Par ailleurs, DALL-E rejettera automatiquement les images contenant des visages humains réalistes ou ressemblant à des personnalités publiques telles que des stars ou des politiciens.

OpenAI n'autorise pas non plus la création d'images pouvant offenser. Notamment des images montrant des automutilations, des symboles haineux ou des actes illégaux. Des systèmes de surveillance automatisés et des modérateurs humains se chargent de censurer le contenu interdit.

Auparavant, OpenAI interdisait tout usage commercial des images générées par DALL-E 2. Toutefois, la version bêta confère désormais « les pleins droits d'utilisation » pour les images créées avec la plateforme. Ceci inclut notamment le droit de vendre les images, ou de les imprimer pour les utiliser sur de la marchandise.

Un autre problème concerne le fait que la comportement de DALL-E 2 n'est pas fiable en matière de composition. Bien que ceci n'est pas très grave, il peut se révéler néfaste dans d'autres cas.

Faut-il avoir peur de DALL-E ?

L'ouverture de DALL-E 2 semble cohérente avec la ligne de conduite d'OpenAI, dont le nom signifie littéralement « intelligence artificielle ouverte ». Tout un chacun va pouvoir s'essayer à la création artistique assistée par IA.

Toutefois, cette démocratisation soulève aussi des inquiétudes. Rappelons que DALL-E 2 peut produire des images très réalistes, et permet également d'éditer des visages d'humains réels. Par conséquent, des cybercriminels pourraient l'exploiter pour créer des DeepFakes ou usurper des identités.

Contrairement à l'outil open-source Stable Diffusion, autorisant la création de contenu violent et pornographique, DALL-E 2 impose tout de même des limites en termes de contenu.

Comme l'explique OpenAI, ces garde-fous ont été mis en place et dès le départ et ont été améliorés en se basant sur l'usage réel de cette IA. Dans un billet de blog, la firme précise que ces améliorations ont permis l'ouverture de l'accès.

Afin d'empêcher le contenu interdit, OpenAI combine surveillance humaine et automatisée. Les tentatives de créer des images de personnes publiques sont automatiquement bloquées.

De même, le jeu de données utilisé pour entraîner DALL-E 2 a été filtré pour supprimer le contenu violent, haineux ou à caractère sexuel. La firme explique avoir « rendu les filtres plus robustes pour rejeter les tentatives de générer du contenu sexuel, violent ou tout autre contenu enfreignant nos règles ». De nouvelles techniques de détection et de réaction ont également été élaborées pour empêcher l'usage à mauvais escient.

Toutefois, outre les dangers liés à la sécurité, DALL-E 2 pose des soucis de droit d'auteur. Face à cette problématique, Getty a préféré interdire le contenu généré par IA de sa banque d'images. Beaucoup d'artistes et créateurs craignent aussi que leur profession devienne inutile…

Restez à la pointe de l'information avec LEBIGDATA.FR !

Abonnez-vous à notre chaîne YouTube et rejoignez-nous sur Google Actualités pour garder une longueur d'avance.

Partager l'article :

Facebook
Twitter
LinkedIn

DALL-E Google GPT Microsoft Midjourney OpenAI Stable Diffusion Twitter

DALL-E 2 enfin disponible pour tous ! Comment créer de l’art avec l’IA Text-to-Image ?

Qu'est-ce que DALL-E 2 ?

À quoi sert DALL-E 2 ?

DALL-E 2 : comment fonctionne t-il ?

Comment s'inscrire sur DALL-E 2 ?

Comment créer une image avec DALL-E 2 ?

Comment modifier une image existante avec DALL-E 2 ?

DALL-E 2 Outpainting : étendre l'oeuvre d'art par-delà son cadre

Améliorez vos images avec un « Prompt Book » pour DALL-E 2

Combien coûte DALL-E 2 ?

Comment supprimer la watermark DALL-E 2 ?

Les limites de DALL-E 2

Les préoccupations dans les limites de DALL-E 2

Quelles sont les interdictions ?

Faut-il avoir peur de DALL-E ?

Sur le même sujet

Newsletter

1 commentaire

Laisser un commentaire

DALL-E 2 enfin disponible pour tous ! Comment créer de l’art avec l’IA Text-to-Image ?

Qu'est-ce que DALL-E 2 ?

À quoi sert DALL-E 2 ?

DALL-E 2 : comment fonctionne t-il ?

Comment s'inscrire sur DALL-E 2 ?

Comment créer une image avec DALL-E 2 ?

Comment modifier une image existante avec DALL-E 2 ?

DALL-E 2 Outpainting : étendre l'oeuvre d'art par-delà son cadre

Améliorez vos images avec un « Prompt Book » pour DALL-E 2

Combien coûte DALL-E 2 ?

Comment supprimer la watermark DALL-E 2 ?

Les limites de DALL-E 2

Les préoccupations dans les limites de DALL-E 2

Quelles sont les interdictions ?

Faut-il avoir peur de DALL-E ?

Sur le même sujet

JO Paris 2024 : l’IA prédit les médailles d’or et les records battus

L’armée anglaise teste cette IA qui indique aux soldats quand tirer

L’IA est en train de s’auto-détruire, et l’industrie commence à paniquer

Newsletter

1 commentaire

Laisser un commentaire