Quel est le meilleur générateur d’images IA entre DALL-E 3 d’OpenAI et MidJourney 5.2 ? Afin d’en avoir le cœur net, nous vous proposons un grand comparatif sur une large variété de styles artistiques ! Découvrez le grand versus des IA d’art !
Les générateurs d’images IA sont de formidables outils, permettant de créer une image à partir d’un simple prompt textuel. Hormis les chatbots comme ChatGPT, c’est le type d’application d’intelligence artificielle le plus populaire auprès du grand public.
Parmi les meilleurs outils de cette catégorie, les deux références incontestées sont MidJourney et DALL-E. Mais quel est le meilleur ? C’est ce que nous vous proposons de découvrir à travers ce comparatif entre les deux dernières versions en date : MidJourney 5.2 et DALL-E 3 !
Qu’est-ce que DALL-E et MidJourney ?
Développé par OpenAI, le créateur de ChatGPT, DALL-E 3 est le nouveau modèle IA de génération d’image lancé début octobre 2023. Il permet de créer des images à partir de texte entré par l’utilisateur.
C’est le successeur de DALL-E 1 et DALL-E 2, sortis avant ChatGPT. Ses performances sont toutefois nettement supérieures en termes de réalisme et de détail.
Il peut créer des images très difficiles à distinguer de véritables œuvres d’art, ce qui en fait un excellent outil pour les designers, les artistes et quiconque a besoin de créer des images rapidement et efficacement.
Selon OpenAI, DALL-E 3 offre une « génération d’images plus nuancée et contextuelle ». Désormais, plus aucun mot du prompt n’est ignoré.
Les exemples publiés par OpenAI montrent bien que cette troisième mouture est beaucoup plus sophistiquée, notamment pour l’expression créative et la génération de texte.
De son côté, MidJourney est développé par une startup fondée par David Holze, ancien chercheur à la NASA. Là encore, cet outil produit de nouvelles images à partir d’un simple prompt textuel.
Il est possible de choisir entre une large variété de styles, des plus abstraits aux plus réalistes. Grâce à sa capacité à comprendre et à répondre aux requêtes en langage naturel, MidJourney est parfait pour quiconque veut créer de l’art rapidement !
Avant le lancement de DALL-E 3, il s’agissait incontestablement du meilleur générateur d’images pour un artiste. Désormais, il fait face à un concurrent tout à fait sérieux…
Quel est le plus accessible ?
Pour accéder à DALL-E 3, vous pouvez vous rendre directement sur le site de OpenAI, utiliser ChatGPT Plus ou le Image Creator de Microsoft Bing.
De son côté, MidJourney est accessible par le biais de la messagerie en ligne Discord. Après avoir rejoint le serveur officiel, vous pourrez envoyer vos prompts à un robot pour qu’il les transforme en images.
Une application mobile et un site web sont également en développement, mais on ignore pour le moment à quelle date ils seront disponibles.
Une version gratuite est proposée pour chacun de ces deux outils. Avec DALL-E 3, vous pouvez profiter de 50 crédits gratuits lors du premier mois, qui ont ensuite réduits à 15 crédits ou 60 images.
De son côté, MidJourney autorise à créer 25 images gratuitement. Une fois cette limite dépassée, vous devrez payer environ 10 dollars par mois pour continuer à l’utiliser.
Comparaison sur différents prompts
Afin de comparer DALL-E 3 avec MidJourney, nous vous proposons de découvrir ce que produit MidJourney à partir des prompts donnés en guise d’exemple par OpenAI pour DALL-E 3.
Photoréaliste
Commençons par une image réaliste, avec le prompt « un siège chic dont le design rappelle la forme d’une citrouille, avec des coussins orange foncé, dans un loft stylé ».
On constate que les deux outils ont parfaitement capturé l’essence de ce prompt. L’image de DALL-E 3 représente un loft lumineux, photo-réaliste en plein après-midi, tandis que celle de MidJourney dégage une certaine aura de sophistication.
Celle de DALL-E 3 est beaucoup plus détaillée, mais le contraste et la simulation de lumières et d’ombre par MidJourney sont extrêmement réussis.
Stylisé
Comparons maintenant les deux outils sur le prompt : « une silhouette d’un grand piano surplombant une ville au crépuscule vu depuis le dernier étage d’un penthouse, rendu dans le style vif et audacieux d’un poster vintage ».
Cette fois, les deux images apparaissent étonnamment similaires. Les pianos semblent quasiment identiques, et même si le prompt n’a pas évoqué New York City, on retrouve la silhouette du building de Chrysler en arrière-plan dans les deux cas.
Une fois encore, l’image produite par DALL-E 3 semble plus détaillée. C’est tout particulièrement le cas pour l’arrière-plan. Les couleurs plus audacieuses évoquent des sentiments similaires à la musique jazz.
De son côté, MidJourney a choisi une palette et des textures plus douces. Néanmoins, l’image de DALL-E 3 ressemble plus à une œuvre d’art et les nuages sont particulièrement bien stylisés.
Illustration digitale
L’art digital est un courant particulièrement important à notre époque. Afin de mettre nos générateurs IA à l’épreuve, soumettons-leur le prompt : « illustration numérique d’une scène de plage réalisée avec du fil. La plage de sable est représentée avec du fil beige, les vagues sont faites de fil bleu et blanc s’écrasant sur le rivage. Un soleil de fil se couche à l’horizon, projetant une lueur chaleureuse. Les palmiers de fil se balancent doucement et de petits coquillages de fil parsèment le rivage ».
À partir de cette description, les résultats produits par DALL-E 3 et MidJourney sont très différents. De prime abord, celui de MidJourney ressemble davantage à de l’art numérique et le style choisi est plus agréable pour les yeux.
Néanmoins, DALL-E 3 a suivi le prompt avec plus de fidélité. Le soleil devait être constitué lui aussi de fil, et MidJourney n’a pas tenu compte de ce détail.
Pixel Art
Le Pixel Art connaît un succès retentissant, notamment auprès des nostalgiques de vieux jeux vidéo. Voici le résultat produit par DALL-E et MidJourney sur le prompt : « une scène Pixel Art de la Coit Tower debout sur Telegraph Hill, avec une vue panoramique de la ville en contrebas et les oiseaux qui volent autour ».
Ici, DALL-E 3 l’emporte haut la main puisqu’il est le seul à avoir produit du véritable Pixel Art. En zoomant sur l’image de MidJourney, on s’aperçoit de la supercherie. De son côté, l’IA d’OpenAI est restée fidèle au prompt tout en maximisant le nombre de détails. Le résultat ressemble réellement à un jeu 8-bit d’antan.
Art surréaliste
Si DALL-E se nomme ainsi, c’est en hommage au célèbre peintre surréaliste Salvador Dali. Il semble donc logique de tester les générateurs IA sur ce style artistique si particulier…
Le prompt soumis est : « Un vaste paysage entièrement composé de viandes diverses s’étend devant le spectateur. Des collines tendres et succulentes de rosbif, des pilons de poulet, des rivières de bacon et des rochers de jambon créent une scène surréaliste, mais appétissante. Le ciel est orné de soleil pepperoni et de nuages de salami ».
À partir de cette description, DALL-E et MidJourney sont partis dans des directions totalement opposées. L’œuvre de DALL-E est totalement bizarre, et l’IA est parvenue à capturer le caractère onirique qui fait le charme de l’art surréaliste : absurde, subversif, et un peu psychédélique.
De son côté, MidJourney propose un résultat plus terre-à-terre. Même si l’aspect fantaisiste est présent, l’image est finalement trop « mainstream » pour entrer dans le champ du surréalisme. Notons qu’il a oublié le soleil de pepperoni…
Flat Design
Très utilisé pour les interfaces de smartphones ou d’ordinateurs modernes, le Flat Design est omniprésent à l’ère numérique. Le prompt suivant a été soumis aux deux IA : « Illustration flat design d’une famille de monstres très diversifiée. Le groupe inclut un monstre brun à fourrure, un monstre noir élégant avec des antennes, un monstre vert tacheté et un petit monstre à pois, tous interagissant de manière ludique ».
En termes de créativité, les deux IA ont produit un résultat satisfaisant. Néanmoins, seul DALL-E est parvenu à représenter tous les personnages listés dans le prompt. MidJourney s’est contenté des monstres bruns et verts.
Croquis
Que valent nos deux IA sur un style relativement simple comme le croquis ? Voici les résultats obtenus sur le prompt : « illustration de style croquis à l’encre d’un petit hérisson tenant un morceau de pastèque avec ses petites pattes, prenant de petites bouchées les yeux fermés avec plaisir ».
Dans ce cas de figure, le résultat produit est relativement similaire. Néanmoins, là encore, DALL-E semble avoir pris en compte davantage de détails comme les yeux fermés et les bouchées de pastèque.
Illustration botanique
Pour tester les générateurs d’images sur l’illustration botanique, voyons leurs résultats sur le prompt « une illustration botanique antique dessinée avec de fines lignes et une touche de fantaisie aquarelle, représentant un étrange lys croisé avec un piège à mouches Vénus, ses pétales posés comme s’ils étaient prêts à se refermer sur des insectes sans méfiance ».
Dans les deux cas, le rendu est impressionnant. On retrouve le même sentiment que dans les véritables œuvres de ce style. Le mélange entre les deux plantes est très réussi. DALL-E l’emporte sur le contraste, mais MidJourney brille par le nombre de détails subtils.
Peinture à l’huile
Le prompt est le suivant : « Une peinture à l’huile détaillée d’un vieux capitaine, dirigeant son navire à travers une tempête. L’eau salée éclabousse son visage buriné, la détermination dans ses yeux. Des nuages tournoyants malveillants sont visibles au-dessus et des vagues sévères menacent de submerger le navire tandis que les mouettes plongent et tournoient dans le paysage chaotique. Le tonnerre et les lumières s’éloignent, illuminant la scène d’une étrange lueur verte ».
Les images produites ici démontrent à quel point l’IA générative s’est améliorée au fil des dernières années. Celle de MidJourney rappelle l’art baroque, et capture à merveille la lassitude du vieux marin.
On peut presque entendre les vagues s’écrasant sur les rochers. Les détails comme l’eau se fracassant contre la cabine et le soleil à l’horizon sont également époustouflants. De son côté, DALL-E parvient là encore à capturer chaque détail du prompt, des mouettes à l’étrange lueur verte.
Les rendus 3D
Quelle IA utiliser pour les rendus 3D ? Voyons la réponse avec ce prompt : « un rendu 3D d’une tasse à café placée sur un rebord de fenêtre pendant une journée de tempête. La tempête à l’extérieur de la fenêtre se reflète dans le café, avec des éclairs miniatures et des vagues turbulentes visibles à l’intérieur de la tasse. La pièce est faiblement éclairée, ce qui ajoute à l’atmosphère dramatique ».
Sur cette requête, DALL-E s’érige en vainqueur. Son image est plus originale, et MidJourney n’a pas reflété les vagues dans la tasse de café. Le rendu de la tempête par DALL-E est exceptionnel, et les éclairs de l’ampoule sont très bien faits.
Architecture
L’intelligence artificielle est une vraie révolution pour l’architecture, et de nombreux professionnels l’utilisent déjà. Alors quel outil choisir ?
Sur le prompt : « un immeuble d’architecture moderne avec de larges fenêtres en verre, situé sur une falaise surplombant un océan serein au coucher de soleil », les deux résultats sont esthétiquement réussis, mais le building de DALL-E semble beaucoup plus fiable.
L‘arrière-plan est également plus joli côté DALL-E, au même titre que les détails sur les falaises et le reflet des nuages dans la mer.
Diorama
Afin de tester les deux IA sur des dioramas, nous leur proposons le prompt « une mini-carte diorama d’un café orné de plantes d’intérieur. Des poutres en bois s’entrecroisent au-dessus et une station d’infusion froide se distingue par de minuscules bouteilles et verres ».
Le café de DALL-E 3 offre une ambiance plus accueillante, et le panneau « Cold Brew » sur le mur montre sa capacité à générer du texte. Néanmoins, celui de MidJourney est magnifique et très détaillé.
Quel est le meilleur ?
Il est difficile de départager objectivement MidJourney et DALL-E 3, car tous deux sont hautement performants et peuvent être considérés comme les références du domaine. Les images qu’ils produisent sont impressionnantes.
Chacun utilise ses propres algorithmes, et diffère sur des points comme les options de ratio d’aspect ou les modes de synthèse d’image comme l’outpainting. Tous deux exploitent des modèles de diffusion générative, mais les visuels qu’ils produisent sont très distincts.
En réalité, le choix dépend principalement de vos préférences et de votre budget. La possibilité d’accéder à DALL-E 3 gratuitement via Bing Image Creator est un réel avantage sur ce point.
N’hésitez pas à profiter des crédits gratuits pour essayer les deux outils et les comparer sur vos propres prompts pour sélectionner celui qui vous convient le mieux !
Concernant la qualité des images produites, vous avez pu voir à travers notre comparatif que chacune de ces deux IA se débrouille mieux que l’autre sur certains styles.
Toutefois, DALL-E se révèle bien plus avancé pour prendre en compte tous les détails d’un prompt et pour générer du texte incorporé à l’image. C’est un réel avantage, mais nul doute que la prochaine version de MidJourney rattrapera ce retard…
- Partager l'article :