Des performances bluffantes, c’est tout ce que les experts savent sur gpt2-chatbot. Le mystère reste entier sur ce grand modèle de langage désormais introuvable.
Les experts en intelligence artificielle le surnomment gpt2-chatbot. La mystérieuse apparition de ce grand modèle de langage (LLM) aux performances exceptionnelles, lundi, continue de les intriguer. Celles-ci représentent un bond significatif par rapport aux LLM actuels. Les spéculations vont bon train sur sa provenance et sa nature.
Chatbot Arena se charge de classer les grands modèles de langage selon leurs performances. Rappelons que GPT-4 d’OpenAI ne domine plus le classement après un an de leadership.
Le puissant modèle d’intelligence artificielle a ainsi fait une apparition surprise sur la plateforme. Il a surclassé la concurrence le temps de sa présence.
gpt2-chatbot serait imbattable aux IMO
gpt2-chatbot a débarqué sans grande pompe, mais il n’aura pas échappé à la vigilance des experts en intelligence artificielle. Ethan Mollick fait notamment partie de ces spécialistes.
Pour ce professeur à la Wharton School de l’université de Pennsylvanie, ce mystérieux LLM surpasse GPT-4 dans des tâches de raisonnement complexe. Par exemple, il dessine mieux une licorne avec du code par rapport aux grands modèles de langage d’OpenAI.
D’autre part, Andrew Gao — chercheur de l’université Stanford — lui a soumis un exercice des Olympiades internationales de mathématiques (IMO).
Le niveau de ce championnat de mathématiques est extrêmement élevé. « Seuls les quatre meilleurs élèves en mathématiques des États-Unis peuvent y participer », rappelle Gao. Pourtant, gpt2-chatbot est parvenu à résoudre le problème du premier coup.
Des capacités inattendues, présage d’un énorme potentiel
Le comportement transgressif de gpt2-chatbot a également surpris les spécialistes de l’intelligence artificielle. En effet, le LLM peut choisir d’ignorer les restrictions.
Par ailleurs, il semble plus disposé à enfreindre les règles. GPT-4 — le moteur de l’IA conversationnelle ChatGPT — ne peut pas se comporter de cette manière.
D’autre part, Dimitris Papailiopoulos — professeur à l’université du Wisconsin — a fait une découverte étonnante. Le LLM peut résoudre un casse-tête logique trop complexe pour GPT-4.
gpt2-chatbot surclasse également le grand modèle de langage d’OpenAI en codage. C’est du moins le constat de Chase McCoy, développeur chez Codegen.
Can confirm gpt2-chatbot is definitely better at complex code manipulation tasks than Claude Opus or the latest GPT4
— Chase (@ChaseMc67) April 29, 2024
Did better on all the coding prompts we use to test new models
The vibes are deffs there 👀
Et si gpt2-chatbot était en fait GPT-5 ?
Aucun expert n’est en mesure d’affirmer avec certitude d’où provient gpt2-chatbot. Néanmoins, certains spécialistes — notamment Andrew Gao — soupçonnent OpenAI.
En effet, le chercheur de l’université Stanford pointe des similitudes entre le mystérieux LLM et les précédents grands modèles linguistiques d’OpenAI. Gao évoque entre autres des « faiblesses similaires face à certains jetons spéciaux ».
Certains vont même jusqu’à dire que gpt2-chatbot pourrait être GPT-5. Ce futur LLM aux capacités exceptionnelles est en préparation chez OpenAI.
Si gpt2-chatbot était vraiment un aperçu de GPT-5, qu’il surclasse GPT-4 ou encore Claude 3 Opus d’Anthropic serait tout à fait normal.
Finalement, la provenance du mystérieux modèle d’intelligence artificielle importe peu. Cette apparition soudaine et éphémère ne fait que rappeler aux experts à quel point leur secteur peut rapidement évoluer.
Au vu des avancées majeures que connaît la recherche sur l’intelligence artificielle, un nouveau LLM avec les capacités remarquables de gpt2-chatbot pourrait arriver avant la fin de l’année.
- Partager l'article :