Google recrute l’équipe de Hume AI pour muscler la voix de Gemini

Google continue de renforcer ses équipes en intelligence artificielle. Cette fois, le géant américain s’intéresse à Hume AI, une jeune pousse connue pour ses travaux sur la voix. 

En revanche, détrompez-vous, ce n’est pas un rachat classique. Google DeepMind a choisi une autre voie. Un accord de licence accompagne l’arrivée de plusieurs profils clés au sein de ses équipes.

Hume A, c’est qui déjà ? C’est une entreprise spécialisée dans la voix par IA. Elle se distingue par sa capacité à analyser les émotions à partir de la voix humaine. Son modèle détecte l’humeur, le ton et certaines nuances émotionnelles. Une approche qui dépasse la simple reconnaissance vocale.

Google & Hume AI : quel genre d’accord ?

Selon Wired, premier média à révéler l’information, le PDG de Hume AI, Alan Cowen, rejoint Google DeepMind. Environ sept ingénieurs spécialisés l’accompagnent dans ce mouvement. 

Leur mission consiste à travailler sur les capacités vocales de Gemini. L’objectif est bien simple. Améliorer la compréhension et l’interaction par la voix au sein de l’assistant. 

YouTube video

Hume AI ne disparaît pas pour autant du paysage. Les actifs restants de la startup poursuivent leurs activités. La technologie développée continue d’être proposée à d’autres entreprises du secteur de l’IA. 

La structure change de direction, avec Andrew Ettinger à sa tête. Ce dernier a rejoint l’entreprise récemment, à la fois comme investisseur et dirigeant.

Aucun montant officiel n’a été communiqué concernant l’accord signé avec Google. Andrew Ettinger a toutefois apporté quelques explications. A savoir que Google bénéficie d’un droit non exclusif sur l’ensemble de la propriété intellectuelle de Hume AI. 

Cette technologie sera intégrée aux processus internes du groupe. Hume AI conserve donc une liberté commerciale sur ses solutions. La startup prévoit d’ailleurs de lancer de nouveaux modèles vocaux dans les prochains mois. 

Elle affirme être bien positionnée pour atteindre 100 millions de dollars de chiffre d’affaires cette année. Un signal fort pour une entreprise dont l’équipe fondatrice partiellement migre vers un géant de la tech. Le modèle économique reste donc actif et ambitieux.

Cette stratégie de recrutement : une tendance de plus en plus visible

YouTube video

Cette opération illustre une tendance de plus en plus visible dans l’écosystème de l’IA. Les grandes entreprises préfèrent recruter des équipes entières plutôt que de racheter les sociétés. 

Cette méthode permet d’accélérer le développement interne tout en limitant les contraintes réglementaires. Elle attire aussi l’attention des autorités. L’an dernier déjà, Google avait déjà recruté le PDG de Windsurf

Cette startup spécialisée dans le codage par IA avait connu une forte exposition médiatique. Plusieurs chercheurs de haut niveau avaient également rejoint le groupe. OpenAI adopte une stratégie proche avec l’intégration de plusieurs équipes, dont celles de Convogo et de Roi.

Face à ces pratiques, la Commission fédérale du commerce américaine a annoncé un renforcement de sa surveillance. L’agence souhaite examiner ces accords de plus près. Les régulateurs cherchent à comprendre leur impact sur la concurrence. Le recrutement massif de talents devient un sujet sensible.

La voix, le nouveau terrain de jeu des géants de l’IA

Au-delà de la stratégie de recrutement, cet accord met en lumière l’importance croissante de la voix dans l’IA. Au fait, actuellement, le secteur dans son ensemble investit massivement dans l’audio. 

Google par exemple a publié un nouveau modèle audio natif pour l’API Live le mois dernier. Pour info, Gemini Live permet déjà des échanges vocaux avec le chatbot. Mais cette fois, les notes de version évoquent une meilleure gestion des flux de travail complexes.

A ce qu’il parait, OpenAI préparerait aussi une refonte de ses modèles vocaux. Ce travail accompagnerait le lancement d’un appareil personnel axé sur l’audio, conçu avec io, la société de Jony Ive. Des fuites parlent d’un format proche d’écouteurs intra-auriculaires.

Meta accélère également dans ce domaine. L’entreprise a racheté la startup Play AI l’an dernier. Les lunettes connectées Ray-Ban exploitent de plus en plus la voix pour les appels, les messages ou le contrôle mains libres. La demande suit la même trajectoire.

Selon l’investisseuse Vanessa Larco, la voix représente le mode d’entrée le plus accepté pour les objets connectés. ElevenLabs illustre cette dynamique avec 330 millions de dollars de revenus annuels récurrents. La parole s’impose désormais comme un pilier central des usages en IA.

Restez à la pointe de l'information avec LEBIGDATA.FR !

▶ Abonnez-vous à notre chaîne YouTube et Ajoutez-nous à vos favoris sur Google Actualités
Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Newsletter

La newsletter IA du futur

Rejoins nos 100 000 passionnés et experts et reçois en avant-première les dernières tendances de l’intelligence artificielle🔥