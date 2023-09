Surprise ! OpenAI annonce DALL-E 3 pour le mois d’octobre 2023. Cette nouvelle version devrait générer des images d’une qualité nettement supérieure, dignes de MidJourney, et sera directement incorporée à ChatGPT ! Découvrez tout ce qu’il faut savoir.

Lancé en janvier 2021, DALL-E est le tout premier générateur d’images IA. Il permet de créer des images à partir d’une description textuelle entrée par l’utilisateur : le prompt.

Depuis lors toutefois, malgré une deuxième version en avril 2022, cet outil s’est fait surpasser par d’autres logiciels comme MidJourney ou Stable Diffusion.

L’un des principaux points faibles de DALL-E 1 et 2 est une tendance à ignorer certains mots dans les prompts. De manière générale, la qualité des images produites est nettement inférieure à MidJourney.

Néanmoins, OpenAI est bien décidé à reprendre sa couronne et vient de lancer par surprise la troisième itération de DALL-E !

Un générateur d’images directement intégré à ChatGPT

Selon les chercheurs, cette nouvelle version comprend mieux le contexte des prompts, et peut donc générer des images beaucoup plus proches du résultat souhaité par l’utilisateur.

Autre nouveauté majeure : DALL-E 3 est directement intégré à ChatGPT. Il suffit donc de demander au chatbot de créer l’image, et celui-ci se charge d’écrire un long prompt détaillé pour le générateur.

Il reste également possible d’écrire vos propres prompts si vous maîtrisez suffisamment cette discipline. C’est d’ailleurs un talent très recherché qui peut vous permettre d’accéder au métier de Prompt Engineer…

Lors d’une démonstration à la presse, le chercheur en chef de l’équipe DALL-E, Aditya Ramesh, a demandé à ChatGPT de l’aider à créer un logo pour un restaurant de ramen dans les montagnes.

Le chatbot a aussitôt écrit un prompt plus long, plus détaillé, et DALL-E a proposé quatre résultats. L’un représentait par exemple une montagne avec des ramens en guise de sommets enneigés et du bouillon coulant comme une cascade.

Comme l’explique OpenAI, la connexion entre DALL-E et ChatGPT va permettre à tout un chacun de créer de l’art IA puisqu’il n’est plus nécessaire de savoir prompter.

Pas d’images violentes ou sexuelles, ni de plagiat d’artistes existants

Les chercheurs ont focalisé leur travail sur DALL-E 3 pour créer de solides mesures de sécurité. Le but ? Empêcher la création d’images haineuses ou érotiques.

Une équipe externe de jailbreakers a été appelée pour OpenAI pour tenter de contourner la sécurité afin de la mettre à l’épreuve. En outre, des classificateurs d’inputs ont été utilisés pour apprendre à l’IA à ignorer certains mots violents ou explicites dans les prompts.

Afin d’éviter les DeepFakes, DALL-E 3 sera également incapable de recréer des images de personnalités publiques même si le prompt inclut des noms.

Contrairement à DALL-E 2 qui pouvait imiter le style d’artistes existants, DALL-E 3 a été entraîné à refuser ce type de demande.

Les artistes pourront également refuser que leurs oeuvres soient utilisées pour entraîner les futures versions de modèles IA text-to-image.

Dall.E 3 images shared by OpenAI



Fun fact: The name DALL-E is a fusion of Salvador Dali, the famous artist, and Pixar's WALL-E movie.#Dalle3 pic.twitter.com/wmwgdCmwv3 — Anu Aakash (@anukaakash) September 21, 2023

Un créateur pourra soumettre une image dont il détient les droits et exiger sa suppression de la base de données via un formulaire sur le site web. Ainsi, les futures versions de DALL-E pourront bloquer les résultats similaires à cette image ou à ce style.

Il s’agit probablement d’une façon pour OpenAI d’éviter les poursuites. Rappelons que des artistes ont porté plainte contre Stability AI et MidJourney en les accusant d’avoir exploité leurs œuvres protégées par droits d’auteur.

Selon Sandhini Agarwal, chercheuse d’OpenAI, malgré ces mesures de sécurité, l’IA s’améliore continuellement et n’est pas encore parfaite.

On peut toutefois se demander si ce « bridage » éthique ne risque pas de limiter l’utilité de DALL-E 3, et sa capacité à rivaliser avec Stable ou MidJourney…

Comment utiliser DALL-E 3 ?

Our new text-to-image model, DALL·E 3, can translate nuanced requests into extremely detailed and accurate images.



Coming soon to ChatGPT Plus & Enterprise, which can help you craft amazing prompts to bring your ideas to life:https://t.co/jDXHGNmarT pic.twitter.com/aRWH5giBPL — OpenAI (@OpenAI) September 20, 2023

Dans un premier temps, DALL-E 3 sera disponible pour les utilisateurs de ChatGPT Plus et ChatGPT Enterprise à partir du mois d’octobre 2023.

Par la suite, les laboratoires de recherche et les utilisateurs de l’API pourront y accéder dans le courant de l’automne. On ignore pour l’instant quand l’outil sera disponible gratuitement pour le grand public, mais c’est bel et bien le projet d’OpenAI !