Koala, ce nouveau générateur d’images IA est 5 fois plus rapide que les autres modèles. Pour l’obtenir, les scientifiques se servaient de la « distillation des connaissances » afin de comprimer Stable Diffusion XL en un modèle de générateur d’image d’IA.
Koala a été récemment révélé par des scientifiques sud-coréens. Il s’agit d’un générateur d’images IA, plus rapide et plus performant que les autres. Par ailleurs, il est possible de l’utiliser sur n’importe quel ordinateur, même ceux à faible spécification. En effet, ce modèle ne requiert qu’un GPU et environ 8 Go de RAM. C’est donc un générateur d’image à la fois efficace et accessible.
En quoi Koala AI se distingue-t-il des autres générateurs d’images plus grands ?
Koala AI diffère des autres IA génératrices d’images grâce au processus de distillation des connaissances. Il s’agit d’une technique qui utilise un modèle de génération d’images open source et compacte ses paramètres à une valeur relativement basse. À titre d’exemple, Koala ne demande que 700 millions de paramètres pour faire fonctionner sa plus petite variante.
Par ailleurs, le processus de distillation des connaissances restreint les exigences de calcul, sans pour autant limiter les performances. De cette manière, l’utilisateur pourra obtenir à tout moment une résolution d’images de haute qualité.
Elle se distingue aussi en termes de vitesse de génération. En effet, ce générateur d’image est meilleur que DALL-E 2 et DALL-E 3 de la célèbre société OpenAI. Sachez que Koala est capable de créer des images en seulement deux secondes, si ces deux versions d’OpenAI demandent plus de 10 secondes pour effectuer cette tâche.
Néanmoins, il est toujours possible d’attendre un peu plus pour obtenir un résultat surprenant.
Un test particulièrement satisfaisant
L’équipe de scientifiques sud-coréens a révélé ses résultats dans un article le 7 décembre 2023 dans la base de données de pré-impression arXiv. Un compte rendu a également été publié à partir du référentiel d’IA open source Hugging Face.
L’Institut de recherche en électronique et télécommunication (ETRI), l’institution à l’origine des nouveaux modèles, a conçu cinq versions, dont trois versions du « KOALA ». Ce dernier génère en effet des images via une saisie de texte. Deux autres versions de « Ko-LLaVA » quant à eux peuvent répondre à des données textuelles avec des vidéos ou des images.
Durant les tests, KOALA a créé une image à partir de l’invite « une photo d’un astronaute lisant un livre sous la lune sur Mars » en seulement 1,6 seconde. Ils ont demandé à DALL-E 2 de générer une image avec la même invite, et l’a effectuée en 12,3 secondes. DALL-E 3 quant à lui a généré l’image en 13,7 secondes d’après un communiqué.
Koala permet aux utilisateurs de générer une image gratuitement et rapidement
Le générateur d’image Koala AI permet notamment de générer des images IA gratuitement. Lors d’un test, le résultat n’était pas aussi parfait. Toutefois, l’utilisation d’un ordinateur bas de gamme pour l’intelligence artificielle pourrait ouvrir la voie à des découvertes frappantes.
Le plus important est de savoir que cet outil permet d’avoir de bons résultats même à de faibles coûts opérationnels. C’est d’ailleurs l’une des raisons pour lesquelles les scientifiques souhaitent l’incorporer dans d’autres domaines, à savoir la production de contenu ou encore l’éducation et autres.
En outre, vu qu’il est capable de fonctionner sur des appareils bas de gamme, ce générateur peut ainsi conduire à la démocratisation de l’IA.
Qu’en pensez-vous de ce nouveau générateur d’image IA ? Est-ce que vous allez essayer Koala ? Vous pouvez donner votre avis dans les commentaires.
- Partager l'article :