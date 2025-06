Cette nouvelle IA de Google, SignGemma, comprend la langue des signes et la transforme en discours oral, sans Wi-Fi, en open source, et avec du DeepMind dedans. Elle combine vision par ordinateur, accessibilité et performance en temps réel. Le tout, dans un format open source

Présenté lors de la conférence Google I/O 2025, SignGemma est le nouveau modèle d’IA signé Google DeepMind. Cette nouveauté va faciliter la communication entre personnes sourdes ou malentendantes et celles qui ne maîtrisent pas la langue des signes. SignGemma est basé sur les technologies maison comme Gemini Nano et pensé pour fonctionner en local, même sans connexion.

Google l’a fait ! Une IA capable de lire vos gestes et de les transformer en paroles, en temps réel. Son nom, c’est SignGemma, et évidemment elle fait partie de la série Gemma, une famille de modèles d’IA open source. Ainsi, tout le monde pourra y accéder, des développeurs en solo aux grandes entreprises.

SignGemma a été entraînée sur différents styles de langues des signes, avec une grande maîtrise de l’ASL (American Sign Language) pour l’instant. En plus, grâce à un transformateur de vision dernier cri, cette technologie capte les formes, mouvements et expressions faciales.

Gus Martins, chef de produit chez DeepMind a donc présenté une démo. Dans celle-ci, il a montré comment SignGemma peut traduire instantanément des signes en texte parlé en anglais.

