Ideogram vient de lancer Ideogram 4.0, un nouveau modèle d’image IA dont les performances attirent déjà l’attention. À en croire la firme canadienne, cette IA pourrait s’imposer comme l’une des nouvelles références de l’écosystème open source.
Créer une image spectaculaire avec une IA est devenu presque banal. En revanche, générer une affiche avec un texte parfaitement lisible reste souvent un parcours semé de lettres tordues et de mots inventés. C’est précisément sur ce terrain qu’Ideogram 4.0 veut faire la différence, avec des performances impressionnantes. Ce modèle mise autant sur la qualité visuelle que sur sa capacité à respecter des mises en page complexes.
Ces performances d’Ideogram 4.0 qui impressionnent les benchmarks
Selon les données communiquées par l’entreprise, le modèle atteint un score Elo de 1285 sur Design Arena. Pour ceux qui l’ignorent encore, ce dernier est une plateforme de comparaison indépendante utilisée pour évaluer les générateurs d’images.
Sur le graphique publié, Ideogram 4.0 se place devant plusieurs modèles ouverts majeurs, dont HunyuanImage de Tencent ou encore Gemini 3 Flash Image Gen.
L’écart n’est pas anodin. Le modèle afficherait plus de 100 points d’avance sur certains concurrents directs. Un avantage qui, sur ce type de classement, traduit généralement une préférence nette des utilisateurs lors des comparaisons à l’aveugle.
Là où Ideogram 4.0 semble réellement se distinguer, c’est dans sa capacité à générer du texte directement à l’intérieur des images.
L’entreprise évoque un taux de réussite de 47,9 % lors d’évaluations réalisées par des designers professionnels. Un chiffre particulièrement élevé dans un domaine où la typographie reste l’un des principaux défis techniques.
Un modèle conçu pour les affiches, les logos et le texte
Ideogram 4.0 repose sur 9,3 milliards de paramètres et a été entraîné à partir de descriptions JSON structurées. Cette approche permet d’aller bien plus loin qu’un simple prompt textuel classique.
Les utilisateurs peuvent notamment définir des palettes de couleurs précises. Il est aussi possible de positionner différents éléments grâce à des coordonnées. Le modèle permet même de contrôler séparément le contenu textuel et son style graphique. Une fonctionnalité qui intéressera particulièrement les designers, les créateurs de contenu et les développeurs.
Au-delà des performances, l’autre annonce majeure concerne la disponibilité d’Ideogram 4.0. Ce modèle est distribué sous forme de poids ouverts. Vous pouvez donc le télécharger librement sous licence non commerciale.
Le modèle bénéficie déjà d’une intégration native dans ComfyUI ainsi que sur plusieurs plateformes spécialisées. Cette ouverture permet aux développeurs de l’adapter à leurs besoins sans dépendre systématiquement d’une API propriétaire.
- Partager l'article :