Chuuut ! Gemini a des oreilles : l’IA Google peut écouter les fichiers audio

Pendant longtemps, Gemini se présentait comme une star multimodale. Il savait jongler avec du texte, manipuler des images, commenter des vidéos et même générer des sons. 

Mais un détail agaçait encore ses utilisateurs. Il ne pouvait pas avaler les fichiers audio. Heureusement, ce trou dans la raquette vient d’être corrigé. Alors, votre attention, ami lecteur ! Les murs ont peut-être des oreilles. Mais Gemini aussi dorénavant.

Laissez Gemini prendre en charge vos fichiers audio

Désormais, plutôt que de réécouter des heures d’enregistrement, vous pouvez déléguer cette corvée à Gemini. Elle restitue les moments clés, met en avant les points importants et peut même transformer tout cela en une présentation visuelle claire.

Et pourquoi pas lui demander d’en faire un résumé, une analyse, ou même un rapport détaillé. Tout ce que vous voulez. Pour ce faire, il suffit de cliquer sur l’icône « + » puis le petit trombone et déposer vos enregistrements dans la bulle de discussion. 

Cette nouvelle fonctionnalité est disponible que ce soit sur la version web ou dans l’application mobile. Et la bonne nouvelle, c’est qu’elle n’est pas réservée aux clients premium. 

Tous les utilisateurs peuvent la tester gratuitement. A condition de rester raisonnables, bien sûr. Google fixe une limite de dix minutes par fichier audio. Largement suffisant pour un extrait de podcast ou une capsule de cours donc. 

Ceux qui veulent plus de confort, en revanche, devront mettre la main au portefeuille. Avec Gemini Pro ou Ultra, il est possible d’envoyer des fichiers de trois heures. Bien a Assez pour couvrir un séminaire complet ou une saison entière de débats enregistrés.

Mieux encore, ce traitement va au-delà de l’anglais. Vous pouvez soumettre des enregistrements dans d’autres langues et obtenir des retours adaptés.

Et juste pour info, Google ne s’arrête pas à Gemini. Avec NotebookLM, il propose déjà de transformer des documents écrits en podcasts fictifs animés par deux voix. Tout ça pour permettre à chacun de digérer l’information comme il le souhaite. 

La grande question est de savoir ce que nous allons faire de cette nouvelle fonctionnalité.

Restez à la pointe de l'information avec LEBIGDATA.FR !

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Newsletter

La newsletter IA du futur

Rejoins nos 100 000 passionnés et experts et reçois en avant-première les dernières tendances de l’intelligence artificielle🔥