Google dévoile Imagen 2 : encore meilleure que DALL-E 3 et MidJourney ?

Google dévoile Imagen 2 : encore meilleure que DALL-E 3 et MidJourney ?

Google a récemment déployé Imagen 2, la nouvelle version de sa technologie de création d’images. Le géant de Mountain View a introduit de nouvelles fonctionnalités améliorées et intuitives à son outil qu’il juge avancé, en espérant surpasser les performances de DALL-E 3 et de MidJourney. Est-ce vraiment le cas ?

Des images de qualité avec une farandoles de fonctionnalités améliorées

Dans un billet de blog, Google souligne particulièrement la qualité des images générées par Imagen 2. Le géant de la technologie explique aussi avoir exploité la puissance de DeepMind, sa technologie d’IA, pour développer cet outil de conversion texte-image de dernière génération

Parmi les nouveautés annoncées, Google évoque un outil polyglotte. Les utilisateurs ont en effet la possibilité d’utiliser des prompts dans plusieurs langues : chinois, l’hindi, japonais, coréen, portugais, anglais, espagnol… De nombreuses autres langues seront bientôt disponibles.

Autre particularité, la possibilité pour les entreprises et les professionnels d’utiliser Imagen pour générer un logo ou « des images pour leur cas d’utilisation spécifique » pour reprendre les mots de Google. Snap (la société mère de Snapchat) et d’autres entreprises comme Shutterstock et Canva par exemple auraient déjà sauté le pas.

Google a également intégré des fonctionnalités de sécurité et de confidentialité à Imagen 2. L’outil permet par exemple d’apposer un filigrane numérique sur les images générées par l’IA, permettant à l’utilisateur d’en spécifier la source et de les distinguer des images réelles. Ce nouvel outil de dernière génération est actuellement accessible aux clients Vertex AI de Google.

Une concurrente directe de DALL-E 3 et de MidJourney ?

Avec Imagen 2, Google espère surpasser MidJourney, une référence en matière de créativité artistique. Les images qu’il génère sont riches en détails, reflétant de véritables techniques photographiques concernant la lumière et les angles. Cependant, son voyage vers l’image parfaite peut être ardu, nécessitant une élaboration méticuleuse des prompts.

Google présente Imagen 2 comme une technologie avancée qui génère des images de haute qualité et très réalistes. Google dit obtenir cette performance en combinant la puissance des grands modèles de langage qui aident le système à comprendre le texte, avec la puissance des modèles de diffusion, qui lui permettent de générer des images avec beaucoup de détails et de précision. 

DALL-E 3 privilégie la précision à l’interprétation artistique. Il reflète de manière impressionnante l’invite, offrant un résultat plus simple mais moins imaginatif. Malgré cela, l’attrait visuel des productions de DALL-E 3 est indéniable, donnant souvent lieu à des images agréables à regarder.

En plus d’une bonne interprétation des prompts et d’une excellente qualité des images, Imagen 2 permet de modifier et d’affiner l’intégralité ou une partie de l’image générée, de créer des légendes à partir d’images. Il permet aussi d’obtenir des légendes sur une image en utilisant le sous-titrage visuel et VQA dans la console Google Cloud. La technologie Imagen 2 est-elle réellement meilleure que ses concurrents ? La parole aux utilisateurs.

Newsletter

Envie de ne louper aucun de nos articles ? Abonnez vous pour recevoir chaque semaine les meilleurs actualités avant tout le monde.

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *