Google SignGemma : l’IA qui traduit le langage des signes en discours oral

Cette nouvelle IA de Google, SignGemma, comprend la langue des signes et la transforme en discours oral, sans Wi-Fi, en open source, et avec du DeepMind dedans. Elle combine vision par ordinateur, accessibilité et performance en temps réel. Le tout, dans un format open source

Présenté lors de la conférence Google I/O 2025, SignGemma est le nouveau modèle d’IA signé Google DeepMind. Cette nouveauté va faciliter la communication entre personnes sourdes ou malentendantes et celles qui ne maîtrisent pas la langue des signes. SignGemma est basé sur les technologies maison comme Gemini Nano et pensé pour fonctionner en local, même sans connexion.

SignGemma donne une voix à la langue des signes

Google l’a fait ! Une IA capable de lire vos gestes et de les transformer en paroles, en temps réel. Son nom, c’est SignGemma, et évidemment elle fait partie de la série Gemma, une famille de modèles d’IA open source. Ainsi, tout le monde pourra y accéder, des développeurs en solo aux grandes entreprises.

SignGemma a été entraînée sur différents styles de langues des signes, avec une grande maîtrise de l’ASL (American Sign Language) pour l’instant. En plus, grâce à un transformateur de vision dernier cri, cette technologie capte les formes, mouvements et expressions faciales.

Gus Martins, chef de produit chez DeepMind a donc présenté une démo. Dans celle-ci, il a montré comment SignGemma peut traduire instantanément des signes en texte parlé en anglais.

L’un des gros atouts de SignGemma c’est qu’elle peut tourner hors ligne. Puisque son architecture légère se base sur Gemini Nano. C’est une excellente nouvelle pour celles et ceux qui vivent dans des zones à faible connectivité. Google pourrait bientôt aussi intégrer SignGemma à des outils Google existants comme Gemini Live.

Encore en phase de test, SignGemma n’est pas encore disponible au grand public. Toutefois, Google a déjà ouvert un formulaire pour celles et ceux qui veulent l’essayer et donner leur retour. L’équipe de Google DeepMind affirme même que c’est leur système de « traduction en texte oral de la langue des signes » le plus performant à ce jour.

Personnellement, au milieu de toutes les avancées parfois inquiétantes et des usages malveillants de l’IA, je trouve que SignGemma représente une utilisation vraiment inspirante de la technologie. Une IA qui voit, comprend et parle, mais surtout, un outil qui rapproche les humains, c’est ce genre de projets qui redonne du sens à l’innovation.

Restez à la pointe de l'information avec LEBIGDATA.FR !

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Newsletter

La newsletter IA du futur

Rejoins nos 100 000 passionnés et experts et reçois en avant-première les dernières tendances de l’intelligence artificielle🔥