En moins de deux minutes. C’est le temps que promet Voice Agent Builder, la nouvelle plateforme de xAI, pour créer un agent vocal sans écrire une seule ligne de code.
Les agents vocaux ne sont plus réservés aux géants de la tech. Après les chatbots, place aux IA qui décrochent le téléphone, répondent aux clients et exécutent des tâches en temps réel. Avec Voice Agent Builder, xAI entre à son tour dans cette course très disputée. Cette plateforme rend la création d’un agent vocal accessible, sans la moindre ligne de code. De quoi éveiller la curiosité.
Comment Voice Agent Builder simplifie la création d’agents vocaux ?
Avec cette version bêta, Voice Agent Builder s’appuie sur xAI et son modèle Grok Voice pour proposer une plateforme entièrement sans code. L’utilisateur décrit simplement le rôle de son agent. Il ajoute ensuite des documents, définit quelques règles de sécurité et connecte ses outils.
L’idée n’est pas révolutionnaire. Plusieurs acteurs proposent déjà des plateformes similaires. La différence avancée par xAI repose surtout sur son architecture.
Beaucoup de solutions s’appuient sur plusieurs services distincts pour la reconnaissance vocale, le raisonnement de l’IA et la synthèse de la voix. Voice Agent Builder, lui, réunit toutes ces étapes au sein d’une seule plateforme.
Moins d’intermédiaires signifie moins de latence et moins de points de défaillance. L’approche est séduisante. Dans la pratique, les performances dépendront surtout des situations réelles.
La plateforme mise sur des appels réalistes
Les conversations téléphoniques sont rarement parfaites. Bruit de fond, accent marqué, interruptions ou changement d’avis en pleine phrase : les appels sont rarement de tout repos. Le quotidien d’un centre d’appels est bien loin d’une démonstration marketing parfaitement maîtrisée.
xAI affirme avoir entraîné Grok Voice sur ce type de situations complexes. L’entreprise met aussi en avant son benchmark interne, baptisé τ-Voice Bench. Selon ces résultats, son modèle dépasserait plusieurs solutions concurrentes dans différents scénarios.
Comme toujours avec les classements maison, un peu de prudence reste de mise. Car ces benchmarks donnent une indication, mais ils ne remplacent pas des retours d’expérience indépendants. Les entreprises regarderont surtout la qualité des conversations en conditions réelles avant de tirer des conclusions.
Bien plus qu’une voix, l’agent peut aussi exécuter des tâches
Le rôle d’un agent vocal ne consiste plus uniquement à répondre à une question. La plateforme peut accéder à une base documentaire et consulter des fichiers Word, Excel, Markdown ou HTML.
Elle peut aussi effectuer des recherches via des API et planifier un rendez-vous dans Google Agenda ou Outlook. Il est même possible d’envoyer un e-mail ou encore de transférer un appel vers un opérateur humain lorsque la situation l’exige.
Chaque conversation est enregistrée et transcrite. Les administrateurs peuvent consulter les actions réalisées par l’agent et vérifier les outils qu’il a utilisés. Ils peuvent aussi définir des garde-fous pour bloquer certaines opérations sensibles, comme la lecture de données bancaires.
Par ailleurs, les utilisateurs peuvent choisir parmi plus de 80 voix intégrées. Elles ont aussi la possibilité de créer une voix personnalisée à partir de quelques minutes d’enregistrement audio. Un numéro de téléphone est également fourni pour effectuer des tests ou lancer un déploiement.
Et qu’en est-il côté tarification ? xAI annonce une facturation à la minute d’audio, sans frais de plateforme supplémentaires.
- Partager l'article :