Gemini 3.5 Translate

Gemini 3.5 Translate va faire tomber la barrière des langues 

Avec Gemini 3.5 Translate, Google veut traduire les conversations en temps réel dans plus de 70 langues, sans transformer tout le monde en GPS fatigué.

Google veut encore grignoter un morceau du futur, et cette fois, il s’attaque à un vieux fantasme de science-fiction. Comprendre quelqu’un presque instantanément, même s’il parle une langue que vous ne maîtrisez pas. Avec Gemini 3.5 Translate, aussi présenté sous le nom Gemini 3.5 Live Translate, l’entreprise promet une traduction orale en temps réel dans plus de 70 langues.

L’idée n’est pas nouvelle. Les traducteurs automatiques existent depuis des années. Mais Google affirme avoir franchi un cap. Son nouveau modèle audio n’attend plus sagement la fin d’une phrase pour produire une traduction. Il écoute, traite et restitue le flux au fur et à mesure, avec quelques secondes de décalage. Un délai qui rappelle davantage un interprète humain qu’un vieux logiciel coincé dans un centre d’appels.

L’outil arrive dans Google Traduction sur Android et iOS, mais aussi dans Google Meet. Les développeurs pourront, eux, y accéder via l’API Gemini Live. Bref, Google ne lance pas seulement une fonction pratique pour les vacances. Il pose aussi une brique dans les réunions internationales, les services clients, les applications de mobilité et tous les endroits où les humains doivent se parler sans partager la même langue.

Gemini 3.5 Translate veut tuer la voix de robot

Le point le plus intéressant de Gemini 3.5 Translate n’est pas seulement le nombre de langues prises en charge. C’est la promesse d’une voix moins mécanique. Google explique que son modèle conserve l’intonation, le rythme et la hauteur de voix du locuteur original. En clair, la traduction doit garder une partie de votre manière de parler.

Youtube video

Une voix synthétique qui ne sonne pas comme un distributeur de tickets SNCF, on ne va pas bouder. Dans les faits, il faudra juger sur la durée. Les démonstrations d’IA sont souvent impeccables quand tout est calme, bien éclairé et parfaitement scénarisé. Mais en réalité, elle, ressemble plus souvent à un restaurant bruyant, un taxi pressé ou une visio avec trois micros ouverts.

Google assure justement avoir entraîné son modèle pour mieux gérer les bruits ambiants. Gemini 3.5 Live Translate détecte automatiquement les langues et évite à l’utilisateur de jouer au DJ linguistique entre deux phrases. Plus besoin de changer manuellement le réglage dès qu’un interlocuteur passe de l’espagnol au japonais. C’est pratique, et surtout moins ridicule en pleine conversation.

L’entreprise ajoute aussi SynthID, son tatouage numérique intégré au signal audio. L’objectif est d’identifier les contenus générés par IA. Une précaution bienvenue, car une technologie capable d’imiter le ton d’un locuteur soulève forcément des questions. Traduire, c’est utile. Faire parler quelqu’un avec une voix trop crédible, c’est déjà un terrain plus glissant.

Google Meet devient un terrain de jeu multilingue

Google Meet fait partie des premiers services servis. Avec Gemini 3.5 Translate, la traduction vocale dans Meet doit passer à plus de 70 langues et plus de 2000 combinaisons linguistiques. Avant, le système restait beaucoup plus limité et dépendait largement de l’anglais comme langue pivot. Là, Google veut permettre des échanges plus directs entre plusieurs langues. 

Pour les entreprises, la promesse est évidente. Une réunion internationale sans sous-titres bricolés, sans interprète externe et sans longues pauses gênantes. C’est un outil pratique pour que tout le monde se comprenne. Dans la pratique, il restera les accents, les blagues ratées, les expressions locales et les phrases corporate que même l’IA aura peut-être envie d’ignorer.

Google Traduction profite aussi de cette mise à jour. Avec des écouteurs, la traduction peut être diffusée directement dans les oreilles. Sur Android, un nouveau mode écoute permettrait même de porter le téléphone à l’oreille comme lors d’un appel classique pour entendre la traduction plus discrètement. Une bonne idée pour éviter de partager toute une conversation avec les voisins de table.

Des partenaires comme Grab testent déjà le modèle pour faciliter les échanges entre chauffeurs et passagers. C’est sans doute là que ce type d’outil peut devenir le plus utile. Pas dans une keynote bien huilée, mais dans les petites situations du quotidien où une incompréhension suffit à créer une vraie galère.

Reste une question centrale. La traduction en temps réel ne se limite pas aux mots. Elle touche au contexte, aux nuances et parfois à la diplomatie la plus élémentaire. Google avance vite, très vite même. Mais pour savoir si Gemini 3.5 Live Translate est vraiment un traducteur fiable ou seulement un excellent démonstrateur technologique, il faudra l’entendre travailler ailleurs que sur scène.

Restez à la pointe de l'information avec LEBIGDATA.FR !

▶ Abonnez-vous à notre chaîne YouTube et Ajoutez-nous à vos favoris sur Google Actualités
Cliquez pour commenter

Newsletter

La newsletter IA du futur

Rejoins nos 100 000 passionnés et experts et reçois en avant-première les dernières tendances de l’intelligence artificielle🔥