Jeudi dernier, OpenAI a officiellement lancé ChatGPT Agent. Ce modèle combine tous les talents de ses prédécesseurs Operator et Deep Research en un seul outil. Il est intégré à l’interface de ChatGPT, avec un fonctionnement guidé par le dialogue.
Dans son annonce officielle, l’entreprise dirigée par Sam Altman présente ce nouvel agent IA comme un assistant intelligent inédit. Apparemment, il est capable d’exécuter des tâches complexes à votre place, grâce à ce que la boite décrit comme un « ordinateur virtuel ».
L’outil peut, entre autres, accéder à votre calendrier pour vous rappeler vos réunions. Faire des courses en ligne ou encore compiler des analyses concurrentielles au format présentation.
Mais tout n’est pas gagné. Je vous explique pourquoi.
ChatGPT Agent : une intervention humaine requise
Au fait, OpenAI, toujours aussi prudent, n’a pas rendu ChatGPT Agent complètement autonome. L’outil n’est à même d’exécuter une action jugée importante que si un humain lui donne l’autorisation.
Impossible, donc, de lui confier une tâche puis de s’éclipser. Ce qui est sur le plan de la sécurité, est tout à fait justifié. Puisque les modèles d’IA sont vulnérables aux erreurs et aux attaques. Cela dit, cette nécessité de validation constante révèle aussi l’immaturité de la technologie.
Tenez, Isa Fulford, en charge de la recherche sur ce projet lui-même, a, par exemple, avoué qu’il lui a fallu près d’une heure pour passer une commande de cupcakes via l’agent. Mais bon, elle a nuancé en disant que bien que lent, l’outil était quand même utile… parce qu’elle n’avait pas envie de le faire elle-même.
Puis, il y aussi la démonstration vidéo publiée par OpenAI. L’agent a été chargé d’organiser un voyage permettant de visiter tous les stades de la MLB (la ligue majeure de baseball américaine).
Résultat, il a généré une carte affichant un arrêt… en plein golfe du Mexique. Ce qui assez est intéressant vu qu’aucun stade ne peut être situé en pleine mer. Cela va de soi.
Ce n’est même pas tout, les horaires des matchs fournis par ChatGPT Agent étaient aussi inexacts. Les conseils, eux, sont largement dépassés par ceux que l’on trouve en quelques secondes sur un moteur de recherche classique.
Et malgré ces approximations, les présentateurs de la vidéo ne relèvent pas les erreurs. Aucun correctif, aucun commentaire critique, seulement un enthousiasme mesuré, illustré par un « très belle carte » prononcé avec le sourire par le chef de produit Yash Kumar.
- Partager l'article :