Après des années de collaboration avec OpenAI, Microsoft semble désormais décidé à voler de ses propres ailes. La firme a développé un nouveau modèle de génération d’images baptisé MAI-Image-1.
Ce modèle est rapide, précis et surtout étonnamment doué pour transformer de simples mots en images plus vraies que natures. Et il débarque officiellement dans Bing Image Creator et Copilot Audio Expressions. Et selon Mustafa Suleyman, le responsable de l’IA chez Microsoft, ce n’est qu’un début. MAI-Image-1 sera bientôt déployé en Europe.
MAI-Image-1 peut-il rivaliser avec DALL-E et GPT-4o ?
MAI-Image-1 est le premier modèle interne de Microsoft capable de produire des images d’une qualité bluffante. Notamment dans les scènes naturelles ou culinaires. D’après Suleyman, il maîtrise l’éclairage avec une finesse que peu de modèles atteignent. Lumière réfléchie, reflets, textures… le rendu est impressionnant.
Sur son blog, Microsoft précise que MAI-Image-1 combine vitesse et réalisme. L’idée est de permettre aux utilisateurs de transformer leurs idées en images en quelques secondes, puis d’ajuster le résultat avec d’autres outils. Et je dois avouer que cette rapidité est séduisante. On peut tester, corriger et recommencer sans attendre des minutes entières comme avec certains modèles plus lents.
Mis à part cela, le modèle sera aussi intégré à Copilot Audio Expressions. Ce dernier peut déjà générer des histoires audio. Mais MAI-Image-1 y ajoutera désormais des illustrations. Une voix raconte, l’image prend forme, et l’ensemble crée une narration visuelle et sonore. Intéressant, vous ne trouvez pas ?
Microsoft avait déjà dévoilé MAI-Voice-1 et MAI-1-preview, deux modèles internes dédiés respectivement à la voix et au texte. Avec MAI-Image-1, la firme poursuit son exploration du tout-en-un maison. Et pendant que Copilot migre vers GPT-5 d’OpenAI, Microsoft semble préparer un futur où ses propres modèles tiendront le premier rôle.
- Partager l'article :
