technique du MIT

Cette technique du MIT rend DALL-E et MidJourney 30 fois plus rapides !

Des scientifiques du MIT ont trouvé une nouvelle technique pour simplifier le processus de création d'images avec et . Ils ont réduit le nombre d'étapes de cent à une, ce qui rend l'affichage 30 fois plus rapide.

Des chercheurs du MIT ont développé une technique baptisée « distillation par correspondance de distribution » (DMD). Elle simplifie drastiquement le processus de création d'images de DALL-E et MidJourney.

Auparavant, générer une image impliquait un laborieux cheminement à travers une centaine d'étapes. Aujourd'hui, grâce à cette innovation, tout ce processus se condense en une unique étape. Cette compression ne diminue pas la qualité des images produites, mais elle accélère leur génération de manière spectaculaire.

« Notre travail est une nouvelle méthode qui accélère de 30 fois les modèles de diffusion actuels tels que Stable Diffusion et DALLE-3 », affirme Tianwei Yin, l'un des co-auteurs principaux de cette étude.

Par ces mots, il souligne l'importance de cette avancée qui réduit considérablement le temps de calcul tout en préservant, voire en améliorant, la qualité visuelle des images générées.

Comment fonctionne cette technique du MIT ?

Initialement, les modèles de diffusion d'images par IA reposaient sur un processus complexe, en plusieurs étapes. D'abord, ils commençaient avec une image aléatoire, à laquelle ils ajoutaient du bruit. Ensuite, ils supprimaient ce bruit progressivement pour clarifier l'image, en fonction de l'invite textuelle donnée.

Or, ce processus pouvait s'étirer sur jusqu'à 100 étapes de diffusion inverse, ce qui était loin d'être optimal.

Cependant, cette technique du MIT (DMD) a révolutionné ce processus en le condensant en une seule étape. Lors d'un révélateur, le temps nécessaire pour générer une image est drastiquement passé de 2,59 secondes à seulement 90 millisecondes.

Cela représente, ni plus ni moins, une accélération presque 29 fois supérieure à ce qui était observé auparavant. Et cela marque aussi un gain de temps considérable.

Nouvelle méthode IA : plus rapide, accessible et réduit les coûts

Cette technique du MIT ne se contente pas de briser les barrières de vitesse, elle élargit également l'accès à la création d'images de haute qualité à une audience plus vaste. Un générateur d'images IA récemment développé, qui utilise cette méthode, s'est révélé être 8 fois plus rapide que le meilleur outil d'OpenAI.

Par ailleurs, il est également compatible avec des ordinateurs bon marché. Cette avancée suggère une démocratisation de la technologie d'IA générative, ce qui permet une créativité sans limite sur des appareils accessibles à tous.

D'autre part, la réduction du processus à une unique étape pour la génération d'images constitue, sans aucun doute, une avancée monumentale. Cela se traduit non seulement en termes de vitesse, mais aussi par une économie significative de ressources.

Fredo Durand, collaborateur et co-auteur de l'étude, n'a pas caché son enthousiasme en affirmant : « La diminution du nombre d'itérations a été le Saint Graal dans les modèles de diffusion depuis leur création ».

Ce progrès, en réalité, signifie une réduction considérable des coûts de calcul. En conséquence, cela ouvre grandement la porte à des applications innovantes dans divers secteurs, allant de l'éducation à l'art, et bien au-delà.

Newsletter

Envie de ne louper aucun de nos articles ? Abonnez vous pour recevoir chaque semaine les meilleurs actualités avant tout le monde.

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *