Les assistants vocaux actuels peinent à convaincre. Alexa interrompt trop souvent, Gemini manque de fluidité et ChatGPT vocal reste limité. Pourtant, une nouvelle technologie pourrait changer la donne.
Sesame, la start-up du cofondateur d’Oculus, propose une IA vocale si fluide qu’on a enfin envie d’échanger avec elle. Avec une conversation plus naturelle et une capacité d’improvisation impressionnante, cet assistant vocal intrigue et séduit.
Contrairement aux assistants classiques, Maya, une des voix de Sesame, ne se contente pas de répondre mécaniquement. Elle écoute, comprend et réagit avec fluidité afin de rendre l’échange plus immersif. Lors d’un test, elle a intégré spontanément un personnage dans une aventure inspirée de Donjons & Dragons. « J’ai demandé à Maya d’inclure un ingénieur gnome dans mon histoire, elle l’a fait immédiatement », explique un utilisateur.
Là où d’autres IA montrent des hésitations ou des temps de réponse artificiels, Maya enchaîne naturellement, avec des pauses proches d’une véritable conversation humaine. Ce réalisme vocal change totalement l’expérience et rend l’échange plus agréable.
Un projet soutenu par des grands noms de la tech
Sesame n’est pas une simple expérimentation. La start-up est portée par Brendan Iribe, le cofondateur d’Oculus, et Ankit Kumar, ancien CTO d’Ubiquity6. L’entreprise a reçu le soutien financier de Andreessen Horowitz, Spark Capital et Matrix Partners, tous investisseurs majeurs dans Oculus VR. Ce solide financement laisse entrevoir une ambition bien plus grande qu’un simple assistant vocal.
Selon ses créateurs, Sesame ne se limite pas à la voix. L’entreprise développe également des lunettes d’IA destinées à accompagner l’assistant vocal. Ces lunettes intelligentes, conçues pour un usage quotidien, offriraient un son haute qualité et un accès instantané à l’IA, capable d’observer et d’interpréter le monde en temps réel.
Un modèle d’IA basé sur un million d’heures audio
L’efficacité de Maya repose sur un modèle d’IA entraîné sur un million d’heures d’audio accessible au public. Sesame assure que son IA évoluera pour supporter plus de 20 langues dans les mois à venir. Un pas important vers la démocratisation des assistants vocaux véritablement intelligents et multilingues.
Autre fait marquant : Sesame prévoit d’ouvrir le code source de son modèle. Cette approche open source permettrait aux développeurs et chercheurs du monde entier d’améliorer et d’adapter la technologie. Contrairement aux IA fermées de Google ou OpenAI, cette transparence favoriserait une évolution plus rapide et plus accessible.
Sesame affirme que son assistant vocal a franchi « la vallée mystérieuse de la voix conversationnelle ». L’objectif est clair : offrir une interaction si naturelle que l’utilisateur oublie qu’il parle à une machine. Le premier retour d’expérience semble confirmer cette avancée.
Là où les célèbres Alexa et Google Assistant restent limités, Maya engage une conversation qui donne envie de continuer. Ce n’est plus une simple commande vocale, mais une véritable interaction. Avec le développement de lunettes intelligentes intégrées à l’IA, Sesame pourrait bien redéfinir notre rapport aux assistants vocaux.
- Partager l'article :