Bientôt, ChatGPT pourrait devenir un assistant vocal intelligent grâce à Voice Engine. Siri, Alexa et Google Assistant auraient alors du souci à se faire.
Sam Altman a fait quelques révélations intéressantes lors de son dernier passage dans le podcast de Lex Fridman. Le patron d’OpenAI y a notamment annoncé la future sortie, cette année, d’un « incroyable nouveau modèle ». Il s’agirait de Voice Engine, dont la start-up californienne a récemment fait une demande d’enregistrement de marque.
ChatGPT a bousculé le secteur de la recherche en ligne. Le populaire agent conversationnel génératif s’attaquerait désormais à celui des assistants vocaux intelligents.
OpenAI a déposé une demande pour faire de Voice Engine sa marque. Rappelons que c’est le Bureau américain des brevets et des marques de commerce (USPTO) qui s’occupe de ces requêtes.
La soumission du dossier a eu lieu le lundi 18 mars, au lendemain de l’interview d’Altman avec Fridman. Au cours de cet entretien, le PDG a fait savoir que la start-up californienne avait « beaucoup d’autres choses importantes à sortir » avant GPT-5.
Mais que sait-on de Voice Engine ?
Le document de dépôt de marque détaille évidemment les principaux champs d’action de ce mystérieux moteur vocal. Ce sont les suivants :
- Conception d’assistants vocaux intelligents
- Reconnaissance de la parole et de la voix
- Traitement des commandes vocales et conversion entre la parole et le texte
- Reconnaissance et génération automatiques de la voix et de la parole
- Génération de paroles ou des sons à l’aide de prompts en langage naturel (texte, parole, images et vidéos)
- Génération de signaux vocaux et audio avec des prompts
- Traitement du langage naturel et de la parole grâce à l’apprentissage automatique
- Reconnaissance, traduction et transcription multilingues de la parole
- Utilisation de l’intelligence artificielle pour la conversion automatique texte-voix et texte-audio
- Développement de services vocaux
Tout cela est bien beau, mais il n’est pas certain que l’USPTO valide le dépôt de marque. Rappelons que le mois dernier, OpenAI n’a pas obtenu gain de cause pour faire de GPT sa marque.
D’autre part, la start-up californienne n’offre pas encore d’assistant vocal intelligent à ses utilisateurs. Elle met toutefois à leur disposition une API pour convertir la parole en texte.
Autre rappel, OpenAI possède un modèle de reconnaissance vocale appelé Whisper. Celui-ci est beaucoup moins populaire que les modèles GPT de la start-up.
GPT-5 : Pas pour tout de suite !
Avant Voice Engine, OpenAI a demandé un dépôt de marque pour GPT-6 et GPT-7. Ce sont les futurs grands modèles de langage (LLM) de la start-up.
La simulation de conversations fait partie des grandes nouveautés de GPT-6, tandis que GPT-7 va permettre à ChatGPT de générer de la musique.
Sam Altman a également évoqué le cas de GPT-5. Les utilisateurs qui espèrent tellement le successeur de GPT-4 et de GPT-4 Turbo devront prendre leur mal en patience.
« Nous avons beaucoup d’autres choses importantes à sortir en premier », fait savoir le patron d’OpenAI. Voice Engine ferait partie de ces choses importantes.
- Partager l'article :