dall e 2 guide complet

DALL-E 2 enfin disponible pour tous ! Comment créer de l’art avec l’IA Text-to-Image ?

2 est l'une des meilleures IA de génération d'image « Text-to-Art », permettant de créer des images artistiques à partir d'un simple texte. Découvrez comment vous inscrire et comment l'utiliser à travers notre guide complet !

Initialement lancé en version beta en avril 2022, DALL-E 2 a rapidement créé le buzz sur le web et les réseaux. Cet outil s'est imposé comme l'un des générateurs d'images IA les plus avancés, en particulier pour la création d'images photoréalistes.

Vous avez probablement déjà vu des exemples de créations DALL-E 2 sur la toile, facilement reconnaissables par les carrés de couleur servant de watermark en bas à droite de l'écran. Les images générées par cet outil sont impressionnantes.

L'accès à DALL-E 2 était réservé à une poignée d'élus. Seuls quelques privilégiés triés sur le volet pouvaient mener des expériences avec l'IA de création d'images d'OpenAI.

D'autres outils similaires comme et MidJourney étaient accessibles à tous, mais DALL-E 2 était plus restreint. Les personnes désirant l'utiliser devaient s'inscrire à une liste d'attente.

Ce n'est désormais plus le cas. Depuis le 28 septembre 2022, a annoncé l'ouverture complète de DALL-E 2 et la suppression de la liste d'attente. N'importe qui peut désormais laisser libre cours à son imagination en créant des images à l'aide de l'IA.

Qu'est-ce que DALL-E 2 ?

DALL-E 2 est une plateforme de génération d'image par intelligence artificielle. Développé par l'entreprise OpenAI, cet outil permet aux utilisateurs de générer des images, juste en entrant un texte.

L'utilisateur décrit le sujet et le style de l'image qu'il veut créer, et DALL-E 2 se charge de la générer. Pour être capable de comprendre les mots de l'utilisateur et de les illustrer, cette IA a été entraînée sur une base de données de plus de 650 millions d'images et de légendes existantes grâce au Machine Learning.

En parallèle, DALL-E peut aussi être utilisé pour éditer une image existante ou créer des variantes. Une fonctionnalité récemment ajoutée permet également d'étendre une image par-delà son cadre existant.

Le nom DALL-E est un mot-valise entre l'artiste Salvador Dali et le film d'animation WALL-E par Pixar. Cet outil repose sur l'IA GPT-3 d'OpenAI, capable de comprendre et de traiter le langage naturel humain afin de le convertir en images.

À quoi sert DALL-E 2 ?

DALL-E 2 permet de créer une multitude d'images dans des styles très variés. Cette IA peut même reproduire le style d'artistes célèbres. En Allemagne, un institut d'art maintient une exposition d'art évolutive en utilisant DALL-E 2 pour générer des œuvres basées sur les sujets tendance sur .

Outre la dimension artistique, cet outil peut être utilisé pour le design, l'architecture ou même le marketing. Plusieurs marques, dont Heinz, l'ont utilisé pour créer des publicités expérimentales. En outre, DALL-E 2 pourrait être utile pour accélérer la création d'arrière-plans de jeux vidéo ou de films.

En général, cette intelligence artificielle « Text-to-Art » permet de réaliser des expériences artistiques, de générer et de tester de nouvelles idées.

Selon OpenAI, plus de 1,5 million de personnes l'utilisent pour créer plus de 2 millions d'images par jour. Ces utilisateurs vont « des artistes aux directeurs de la création en passant par les écrivains et les architectes ». La firme ajoute qu'environ 100 000 d'entre eux partagent leurs créations et leurs commentaires sur le serveur Discord officiel.

DALL-E 2 : comment fonctionne t-il ?

Pour comprendre le fonctionnement du générateur d'images d'IA, il faut se familiariser avec les concepts suivants :

CLIP : signifie Contrastive Language-Image Pre-training (pré-entraînement contrastif langage-image). Il s'agit peut-être de l'élément le plus important de l'architecture de DALL-E 2. L'approche repose sur l'idée qu'il est possible d'utiliser le langage naturel pour enseigner aux ordinateurs le rapport entre différentes images.

CLIP se compose de deux réseaux neuronaux :

  •  un codeur de texte
  •  et un codeur d'image.

Tous deux sont entraînés sur des collections vastes et diverses de paires image-texte. Le modèle analyse ces paires d'images et de légendes pour créer des représentations vectorielles appelées « text/image embeddings« . En d'autres termes, CLIP sert de pont entre le texte (entrée) et l'image (sortie).

Modèle antérieur : il prend un encastrement de texte légende/CLIP et s'en inspire pour générer des encastrements d'images CLIP.

Modèle de diffusion du décodeur (unCLIP) : l'inverse du modèle CLIP original génère des images en utilisant les incrustations d'images CLIP.

DALL-E 2 crée un résultat en combinant les modèles antérieurs et unCLIP. L'image ci-dessous décrit grossièrement le processus sous-jacent.

Comment s'inscrire sur DALL-E 2 ?

dall e 2 création compte

Initialement lancé en avril 2022, DALL-E 2 était uniquement accessible sur liste d'attente pendant cinq mois. Depuis septembre 2022, l'accès est désormais ouvert et n'importe qui peut s'inscrire depuis le site officiel.

Selon OpenAI, « étendre raisonnablement un système aussi puissant et complexe que DALL-E, tout en apprenant toutes les façons créatives dont il peut être utilisé et détourné, a nécessité une approche de déploiement itérative ». Ces quelques mois ont permis à la firme de mieux cerner les dangers liés à son IA, et de renforcer les barrières de sécurité suffisamment pour l'ouvrir au grand public.

  • Il suffit de créer un compte sur le site web d'OpenAI. Pour ce faire, vous devrez entrer votre adresse email et un code de sécurité, et créer un mot de passe à huit chiffres.
  • Ensuite, vous recevrez un email contenant un lien, sur lequel vous devez cliquer pour vérifier votre compte. Vous recevrez aussi un code par SMS pour confirmer votre identité. En guise d'alternative, vous pouvez aussi créer un compte en utilisant votre compte ou .
  • Cliquez pour finir sur le bouton « Continuer » pour accepter les conditions d'utilisation.

Certains internautes rencontrent toutefois des difficultés. Sur Twitter et Instagram, plusieurs personnes se plaignent que DALL-E 2 est inaccessible dans leur pays ou qu'ils reçoivent une erreur en tentant de s'inscrire. Il n'y a toujours pas d'API pour DALL-E 2, mais OpenAI y travaille.

Comment créer une image avec DALL-E 2 ?

dall e 2 tuto créer image

Une fois l'inscription complétée, vous pouvez commencer à écrire votre premier texte descriptif ou « prompt » en anglais. Il suffit de décrire le sujet de l'image et le style désiré, et l'IA se charge de la créer.

Après avoir créé votre compte, vous verrez à l'écran une grande boîte de texte. C'est ici que vous pouvez écrire une description de l'image que vous souhaitez créer, avec un maximum de 400 caractères.

Essayez d'être le plus détaillé possible, et cliquez sur « générer ». Dès lors, DALL-E 2 crée quatre images basées sur votre texte. En cas de message d'erreur, vous pouvez réessayer.

dall e 2 tuto 2 générer

N'hésitez pas à éditer votre « prompt » autant de fois que nécessaire pour améliorer le résultat. Toutefois, gardez en tête que chaque nouvelle génération d'image vous coûtera des crédits.

Si l'une des quatre images générées vous convient, cliquez dessus. Vous pouvez ensuite la télécharger en cliquant sur la flèche située en haut à droite de l'image. Il est également possible d'éditer l'image en cliquant sur le bouton « edit », avec des outils tels qu'une gomme ou l'importation d'images à ajouter. En outre, vous pouvez aussi créer des « variations » alternatives de l'image.

Comment modifier une image existante avec DALL-E 2 ?

dall e 2 édition image

Une autre manière d'utiliser DALL-E 2 est de télécharger une image depuis votre ordinateur ou votre smartphone, afin de la modifier. Sous la boîte de texte, vous trouverez un lien permettant de la charger.

L'image sera automatiquement rognée en carré. Après l'avoir téléchargée, vous pouvez laisser DALL-E 2 créer ses propres variations ou éditer l'image à votre guise.

dall e 2 variations image

DALL-E 2 Outpainting pour étendre une oeuvre d'art par-delà son cadre

La fonctionnalité Outpainting, récemment ajoutée à DALL-E 2, permet d'étendre une image par-delà ses bordures d'origine. Vous pouvez l'appliquer à une image créée par l'IA, ou sur une image que vous avez téléchargée.

Ce nouvel outil a déjà été utilisé sur des oeuvres d'art célèbres comme La Joconde. L'IA ajoute des éléments, et le résultat est plutôt impressionnant.

Pour utiliser cette fonction, générez ou téléchargez une image puis réduisez sa taille en tirant les angles. Écrivez votre « prompt », et DALL-E 2 se chargera d'ajouter les éléments souhaités en reprenant le style de l'œuvre d'origine.

Améliorez vos images avec un « Prompt Book » pour DALL-E 2

En essayant les générateurs Text-to-Art comme DALL-E 2 pour la première fois, vous vous être probablement rendu compte que le résultat n'était pas forcément à la hauteur de vos attentes et loin des plus belles images réalisées avec ces outils.

Afin d'améliorer vos créations, vous pouvez utiliser le « Prompt Book » de Guy Parsons, publié sur le site DALL-Ery GALL-Ery spécialement dédié à l'art IA. Cette ressource visuelle peut vous aider à mieux formuler vos descriptions textuelles et vous inspirer pour exploiter tout le potentiel de DALL-E 2.

Ce guide composé de 82 pages révèle les meilleures techniques pour perfectionner vos résultats sur DALL-E 2. Il recommande notamment les meilleurs adjectifs à utiliser pour atteindre l'ambiance, l'émotion ou la composition esthétique que vous recherchez.

Vous recevrez aussi des astuces pour tous les types d'images, qu'il s'agisse de photographie, de portraits ou de paysages. Les différents styles d'illustrations et d'arts historiques sont abordés, au même titre que l'art en 3D.

Le livre prodigue notamment des conseils pour les angles de vue, l'éclairage, le type d'objectif, ou encore les textures. Il montre aussi comment utiliser les divers styles artistiques.

Combien coûte DALL-E 2 ?

dall e 2 achat crédits

À l'origine, l'utilisation de DALL-E 2 était gratuite pendant les deux premiers mois. En juillet 2022, OpenAI a toutefois introduit un système de crédits.

Ces crédits sont nécessaires pour générer de l'art sur la plateforme. Lors de leur inscription, les utilisateurs reçoivent 50 crédits gratuits. Par la suite, ils reçoivent 15 crédits par mois.

Il est également possible d'acheter des crédits additionnels pour un prix de 15$ pour 115 crédits. Cette somme permet de générer environ 460 images au format 1024×1024 pixels. Notons que les artistes peuvent demander un tarif réduit à cette adresse.

Il existe des alternatives gratuites à DALL-E 2, telles que l'IA open source Stable Diffusion permettant de créer des images sans aucune censure. Vous pouvez aussi utiliser l'outil DALL-E Mini, désormais renommé CrAIyon suite aux plaintes d'OpenAI, mais cet outil offre des performances bien plus limitées.

Comment supprimer la watermark DALL-E 2 ?

dall e 2 watermark

Les images générées avec DALL-E 2 sont faciles à reconnaître. Elles contiennent une signature ressemblant à une ligne de carrés colorés située en bas à droite de l'image.

Toutefois, le règlement de DALL-E 2 autorise à supprimer cette watermark. Cette suppression est en effet indispensable pour la plupart des cas d'usages commerciaux. Vous pouvez retirer cette signature très facilement avec n'importe quelle application d'édition d'image telle que Photoshop.

Il est également possible de télécharger directement l'image sans watermark. Sur PC, effectuez un clic droit sur l'image, choisissez l'option « Inspecter » et cherchez l'URL windows.net. Copiez le lien de l'image et ouvrez-le. Elle devrait apparaître sans le logo. Sur smartphone ou tablette, vous pouvez presser l'image sur la page de génération et cliquer sur « sauvegarder l'image ».

Les limites de DALL-E 2

La qualité du résultat de DALL-E 2 dépend en grande partie du texte fourni par l'utilisateur. Plus vous êtes précis, plus vous avez de chances d'obtenir le résultat souhaité. Toutefois, le système présente certaines limites intrinsèques.

Par exemple, il n'est pas encore très compétent en matière de compositionnalité (bien qu'il semble s'améliorer avec le temps). Cela signifie que DALL-E 2 ne parvient souvent pas à fusionner de manière significative plusieurs objets ou propriétés d'objets tels que la forme, l'orientation et la couleur.

Mais ce n'est pas tout. Le programme risque aussi de ne pas fonctionner correctement, même avec des instructions (relativement) simples. Par exemple, si l'étiquetage des données est incorrect, il peut produire de faux résultats, tout comme quelqu'un qui aurait appris le mauvais mot. Ou, lorsqu'il reçoit du texte qu'il n'a pas appris auparavant, il essaiera de produire des résultats similaires à ceux qu'il a vus pendant la formation, mais les résultats peuvent être trop différents.

Nous pensons qu'il est passionnant de voir le développement de DALL-E avec le temps et de voir comment il peut être appliqué à de nouveaux domaines en utilisant ce qu'il a appris.

Les préoccupations dans les limites de DALL-E 2

OpenAI a programmé DALL-E 2 pour qu'il ne crée pas d'images de personnalités publiques et de célébrités. En fait, il ne génère pas d'images contenant des visages réalistes ou des personnes réelles. Il s'agit là d'un pas dans la bonne direction pour empêcher l'utilisation abusive du programme. Toutefois, compte tenu de la disponibilité croissante de fausses applications profondes, des acteurs malveillants pourraient prendre une image de DALL-E et y intégrer le visage de quelqu'un d'autre.

La violation des droits d'auteur pourrait également devenir un problème majeur à mesure que DALL-E 2 gagne en popularité. OpenAI affirme que les utilisateurs « bénéficient de tous les droits de commercialisation des images qu'ils créent avec DALL-E, y compris le droit de les réimprimer, de les vendre et de les commercialiser ». Cependant, les générateurs d'art par IA dépendent du travail d'artistes humains pour analyser, apprendre et créer de l'art. On ne peut donc pas exclure la possibilité d'une violation des lois sur la propriété intellectuelle, même si elle n'est pas intentionnelle.

Quelles sont les interdictions ?

Avant d'ouvrir l'accès à son outil, OpenAI s'est assuré de mettre en place des règles strictes pour éviter les « biais et la toxicité » des images générées par DALL-E 2. Des changements ont notamment été apportés. Ces derniers permettent de générer des images « reflétant mieux la diversité de la population mondiale » si le genre ou l'ethnie n'est pas précisé dans le texte de « prompt ».

Par ailleurs, DALL-E rejettera automatiquement les images contenant des visages humains réalistes ou ressemblant à des personnalités publiques telles que des stars ou des politiciens.

OpenAI n'autorise pas non plus la création d'images pouvant offenser. Notamment des images montrant des automutilations, des symboles haineux ou des actes illégaux. Des systèmes de surveillance automatisés et des modérateurs humains se chargent de censurer le contenu interdit.

Auparavant, OpenAI interdisait tout usage commercial des images générées par DALL-E 2. Toutefois, la version bêta confère désormais « les pleins droits d'utilisation » pour les images créées avec la plateforme. Ceci inclut notamment le droit de vendre les images, ou de les imprimer pour les utiliser sur de la marchandise.

Un autre problème concerne le fait que la comportement de DALL-E 2 n'est pas fiable en matière de composition. Bien que ceci n'est pas très grave, il peut se révéler néfaste dans d'autres cas.

Faut-il avoir peur de DALL-E ?

L'ouverture de DALL-E 2 semble cohérente avec la ligne de conduite d'OpenAI, dont le nom signifie littéralement « intelligence artificielle ouverte ». Tout un chacun va pouvoir s'essayer à la création artistique assistée par IA.

Toutefois, cette démocratisation soulève aussi des inquiétudes. Rappelons que DALL-E 2 peut produire des images très réalistes, et permet également d'éditer des visages d'humains réels. Par conséquent, des cybercriminels pourraient l'exploiter pour créer des DeepFakes ou usurper des identités.

Contrairement à l'outil open-source Stable Diffusion, autorisant la création de contenu violent et pornographique, DALL-E 2 impose tout de même des limites en termes de contenu.

Comme l'explique OpenAI, ces garde-fous ont été mis en place et dès le départ et ont été améliorés en se basant sur l'usage réel de cette IA. Dans un billet de blog, la firme précise que ces améliorations ont permis l'ouverture de l'accès.

Afin d'empêcher le contenu interdit, OpenAI combine surveillance humaine et automatisée. Les tentatives de créer des images de personnes publiques sont automatiquement bloquées.

De même, le jeu de données utilisé pour entraîner DALL-E 2 a été filtré pour supprimer le contenu violent, haineux ou à caractère sexuel. La firme explique avoir « rendu les filtres plus robustes pour rejeter les tentatives de générer du contenu sexuel, violent ou tout autre contenu enfreignant nos règles ». De nouvelles techniques de détection et de réaction ont également été élaborées pour empêcher l'usage à mauvais escient.

Toutefois, outre les dangers liés à la sécurité, DALL-E 2 pose des soucis de droit d'auteur. Face à cette problématique, Getty a préféré interdire le contenu généré par IA de sa banque d'images. Beaucoup d'artistes et créateurs craignent aussi que leur profession devienne inutile…

Newsletter

Envie de ne louper aucun de nos articles ? Abonnez vous pour recevoir chaque semaine les meilleurs actualités avant tout le monde.

1 commentaires

1 commentaire

  1. J’ai pas tout compris comment ça marche pour s’inscrire mais bon j’espère que ça va marcher

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *