OpenAI prépare une IA qui pourrait tuer Siri, Alexa et Google Assistant, mais…

Bientôt, pourrait devenir un assistant vocal intelligent grâce à Voice Engine. Siri, Alexa et Assistant auraient alors du souci à se faire.

a fait quelques révélations intéressantes lors de son dernier passage dans le podcast de Lex Fridman. Le patron d’ y a notamment annoncé la future sortie, cette année, d’un « incroyable nouveau modèle ». Il s’agirait de Voice Engine, dont la start-up californienne a récemment fait une demande d’enregistrement de marque.

YouTube video

ChatGPT a bousculé le secteur de la recherche en ligne. Le populaire agent conversationnel génératif s’attaquerait désormais à celui des assistants vocaux intelligents.

OpenAI a déposé une demande pour faire de Voice Engine sa marque. Rappelons que c’est le Bureau américain des brevets et des marques de commerce (USPTO) qui s’occupe de ces requêtes.

La soumission du dossier a eu lieu le lundi 18 mars, au lendemain de l’interview d’Altman avec Fridman. Au cours de cet entretien, le PDG a fait savoir que la start-up californienne avait « beaucoup d’autres choses importantes à sortir » avant GPT-5.

Mais que sait-on de Voice Engine ?

Le document de dépôt de marque détaille évidemment les principaux champs d’action de ce mystérieux moteur vocal. Ce sont les suivants :

  • Conception d’assistants vocaux intelligents
  • Reconnaissance de la parole et de la voix
  • Traitement des commandes vocales et conversion entre la parole et le texte
  • Reconnaissance et génération automatiques de la voix et de la parole
  • Génération de paroles ou des sons à l’aide de prompts en langage naturel (texte, parole, images et vidéos)
  • Génération de signaux vocaux et audio avec des prompts
  • Traitement du langage naturel et de la parole grâce à l’apprentissage automatique
  • Reconnaissance, traduction et transcription multilingues de la parole
  • Utilisation de l’intelligence artificielle pour la conversion automatique texte-voix et texte-audio
  • Développement de services vocaux
YouTube video

Tout cela est bien beau, mais il n’est pas certain que l’USPTO valide le dépôt de marque. Rappelons que le mois dernier, OpenAI n’a pas obtenu gain de cause pour faire de sa marque.

D’autre part, la start-up californienne n’offre pas encore d’assistant vocal intelligent à ses utilisateurs. Elle met toutefois à leur disposition une API pour convertir la parole en texte.

Autre rappel, OpenAI possède un modèle de reconnaissance vocale appelé Whisper. Celui-ci est beaucoup moins populaire que les modèles GPT de la start-up.

GPT-5 : Pas pour tout de suite !

Avant Voice Engine, OpenAI a demandé un dépôt de marque pour GPT-6 et GPT-7. Ce sont les futurs grands modèles de langage (LLM) de la start-up.

La simulation de conversations fait partie des grandes nouveautés de GPT-6, tandis que GPT-7 va permettre à ChatGPT de générer de la musique.

YouTube video

Sam Altman a également évoqué le cas de GPT-5. Les utilisateurs qui espèrent tellement le successeur de GPT-4 et de GPT-4 Turbo devront prendre leur mal en patience.

« Nous avons beaucoup d’autres choses importantes à sortir en premier », fait savoir le patron d’OpenAI. Voice Engine ferait partie de ces choses importantes.

Restez à la pointe de l'information avec LEBIGDATA.FR !

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Newsletter

La newsletter IA du futur

Rejoins nos 100 000 passionnés et experts et reçois en avant-première les dernières tendances de l’intelligence artificielle🔥