Pendant que le monde débat sur les IA multimodales, Google, lui, tente un nouveau challenge : parler avec les dauphins. Et ce n’est pas une blague, c’est un projet très sérieux.
Les dauphins fascinent les scientifiques depuis longtemps, notamment pour leurs capacités cognitives hors normes. Coopération, apprentissage mutuel, reconnaissance de soi dans un miroir… ces mammifères marins font preuve d’une intelligence remarquable.
Depuis des décennies, les chercheurs font des pieds et des mains pour décoder les étranges mélodies faites de clics et de sifflements que les dauphins utilisent pour discuter entre eux.
Mais, il était impossible de percer ce langage sous-marin. Du moins jusqu’à ce que Google collabore le Wild Dolphin Project (WDP) et crée DolphinGemma.
Cette IA est suffisamment légère pour tourner sur des téléphones Pixel utilisés directement sur le terrain. Bon, avec ses 400 millions de paramètres, il est bien plus compact que la plupart des LLM habituels.
Mission impossible ? Pas pour Google
Depuis 1985, le Wild Dolphin Project étudie une communauté de dauphins tachetés de l’Atlantique, avec une approche non invasive. L’équipe filme le comportement de ces mammifères marins dans leur habitat naturel et enregistre leur voix.
L’un des objectifs majeurs de ce programme est de mieux comprendre les vocalisations des dauphins et leur rôle dans les interactions sociales.
Grâce à des décennies de données, ils ont pu relier certains sons à des actions précises. Par exemple, certains sifflements sont utilisés comme des « noms » leur permettant de s’appeler. Tandis que d’autres cris retentissent lors des confrontations.
Mais malgré ces découvertes, l’essentiel du système de communication des dauphins reste encore à décoder. Encore faudrait-il qu’ils disposent d’un véritable langage structuré.
Denise Herzing, biologiste et fondatrice du WDP, elle-même l’a dit : « Nous ne savons pas encore s’ils utilisent des mots ». Il est alors indispensable de comprendre la structure et les modèles récurrents des vocalisations pour déterminer s’il existe vraiment, chez ces animaux, un langage doté de logique et de syntaxe.
Et c’est précisément pour approfondir cette analyse que le modèle d’IA DolphinGemma de Google a été développé.
Parlez avec les dauphins grâce à l’IA de Google
Google a développé DolphinGemma à partir de ses modèles open source Gemma. Eux-mêmes issus de la même base technologique que les modèles commerciaux Gemini.
L’idée est simple en théorie. Appliquer le fonctionnement des grands modèles de langage (LLM), conçus pour prédire la suite d’un texte, à la communication acoustique des dauphins.
DolphinGemma utilise SoundStream, une technologie audio maison, pour transformer les vocalisations des dauphins en « jetons audio » exploitables par l’IA. Une fois le son analysé, le modèle prédit le jeton suivant. Dans une logique similaire à celle des modèles linguistiques destinés aux humains donc.
L’objectif est d’identifier des schémas récurrents dans les sons produits par les dauphins, afin de construire un début de vocabulaire commun. Des lexiques potentiellement compréhensibles à la fois par l’IA et par les cétacés.
Pour entraîner ce modèle d’IA, Google s’est appuyé sur les vastes archives audio du WDP. Plus l’IA est alimentée de données, plus elle est en mesure de reconnaître des régularités, de les structurer, et potentiellement de poser les bases d’un vocabulaire compréhensible.
Tout comme les autres modèles de la gamme Gemma, DolphinGemma est open source. Google prévoit de rendre le modèle accessible à la communauté scientifique dès l’été prochain.
Même si cette IA de Google ne permet pas encore de directement « parler » aux dauphins, c’est un bon début. D’ailleurs, qui sait ? À terme, elle sera peut-être aussi adaptée à d’autres espèces de cétacés. Ce qui ouvrirait la voie à la communication inter espèces.
Fascinant, vous ne trouvez pas ?
- Partager l'article :