Google frappe fort avec Imagen 3, son dernier générateur d’images IA. Accessible à tous, mais avec quelques restrictions…
Bonne nouvelle : Google a réactivé la génération d’images par IA avec Imagen 3. Cette IA peut créer des images au format carré avec un réalisme impressionnant. Elles sont même comparables à celles de concurrents comme Midjourney et Flux. Vous n’avez pas hâte de l’essayer ?
À qui est destiné Imagen 3 ?
Google vient de lancer Imagen 3, une mise à jour de l’IA générateurs d’images Imagen 2. Avant, il était réservé aux abonnés Gemini Advanced utilisant uniquement la version Web.
Mais dorénavant, il est accessible à tous les utilisateurs de Google Gemini (Web, application mobile et android). Il faut toutefois noter que sur le mode gratuit, la création d’images de personnes n’est pas possible.
Seuls les abonnés à partir de Gemini Advanced, à 19 $ par mois, peuvent en créer. Mais même avec cet abonnement, l’IA ne génère pas de visages réalistes ni de personnes réelles.
Imagen 3, développé par Google DeepMind, a été présenté lors de l’événement Google I/O le 14 mai 2024. Ce modèle se distingue par sa capacité à adapter ou transformer une image à partir d’une simple invite textuelle.
Il permet aux utilisateurs de modifier facilement des éléments sans repartir de zéro. Pour accéder à cette nouvelle fonctionnalité, il pourrait-être nécessaire de mettre à jour l’application.
Qu’est-ce que cette IA a pour nous séduire ?
Imagen 3 marque une amélioration notable par rapport à son prédécesseur, Imagen 2. Le modèle respecte mieux les consignes fournies par les utilisateurs via l’interface de Google Gemini. Les images générées sont ainsi plus riches et bien détaillées.
Au fait, avant, Google avait temporairement désactivé la fonctionnalité de génération d’images dans Gemini. Pourquoi ? En raison de la prudence excessive du modèle lorsqu’il s’agissait de créer des visages humains.
Cette prudence est toujours présente, surtout pour éviter les abus et les usages malveillants. Cependant, Google a réussi à trouver un équilibre entre sécurité et créativité.
Et puis, Imagen 2 avait aussi souvent pour effet de rendre les images avec un aspect trop artificiel, avec des textures ressemblant à du plastique.
Le nouveau modèle, lui, rapproche les capacités de Google de celles de DALL-E 3 d’OpenAI, bien qu’elles soient limitées. Le modèle ne produit que des images au format carré, contrairement à DALL-E 3 d’OpenAI, qui permet diverses orientations et tailles.
De plus, l’outil refuse encore parfois de générer certaines scènes complexes ou surréalistes. Selon une source qui a pu le tester, Imagen 3 a souvent refusé de générer l’image d’une personne dans un café sur une base lunaire.
Cependant, pour des représentations plus simples, comme des paysages naturels ou des objets du quotidien, Imagen 3 s’en sort extrêmement bien.
- Partager l'article :