Près d’une semaine après sa brève apparition, gpt2-chatbot continue de faire parler. Les experts ne savent toujours pas d’où est sortie cette IA surpuissante.
Le dernier week-end d’avril, gpt2-chatbot avait fait un passage remarqué sur Chatbot Arena. GPT-4 et Claude 3 Opus ne rivalisaient pas avec les capacités de ce surpuissant grand modèle de langage (LLM). Les experts en intelligence artificielle poursuivent l’enquête sur ses origines. Ils pensent maintenant tenir une très bonne piste.
Un modèle d’intelligence artificielle qui surpasse les LLM les plus performants du moment. Les habitués de Chatbot Arena ne s’attendaient pas à une telle découverte, fin avril.
Ils n’avaient eu que 24 heures pour tester les capacités exceptionnelles de la mystérieuse IA. Cette dernière avait été retirée après ce délai.
Chatbot Arena était saturé à cause de gpt2-chatbot qui générait un trafic trop élevé. L’administrateur de la plateforme n’avait alors d’autres choix que de le retirer.
Ce qui bluffe tant les experts en intelligence artificielle
Le LLM surpuissant a montré une compréhension contextuelle avancée. Il générait des réponses pertinentes et détaillées à une variété de requêtes.
Les experts ont particulièrement remarqué sa capacité à fournir des informations précises et spécifiques. De plus, gpt2-chatbot présentait une polyvalence impressionnante sur différents sujets de conversation. Aucun autre LLM ne possède sa flexibilité.
Pour dessiner une licorne avec du code, l’IA surpuissante se débrouille largement mieux que GPT-4 d’OpenAI. C’est également le cas pour les tâches de raisonnement complexe.
Par ailleurs, le modèle d’IA inconnu excelle en mathématiques. Il peut trouver la solution d’un exercice des Olympiades internationales de mathématiques du premier coup.
gpt2-chatbot, made in OpenAI ? Voici les indices !
Les experts en intelligence artificielle doutent fort que gpt2-chatbot soit l’œuvre d’une petite start-up. Le LLM sort forcément du laboratoire d’un acteur majeur du secteur.
Beaucoup pensent évidemment à OpenAI. C’est d’ailleurs pour cette raison que les chercheurs ont surnommé l’IA inconnue gpt2-chatbot.
D’une certaine manière, le terme “gpt2” renvoie à GPT-2 de la start-up californienne. Celui-ci était son grand modèle de langage le plus performant en 2019.
Par ailleurs, il y a cette étrange publication modifiée sur X du PDG d’OpenAI, Sam Altman. « J’ai un faible pour gpt-2 », avait d’abord partagé le patron de la start-up californienne. « J’ai un faible pour gpt2 », a-t-il ensuite corrigé.
Un coup marketing réussi !
Est-ce que ce gpt2-chatbot est la création d’un nouveau venu qui essaie de se faire une place ? Peut-être. Mais peu nombreux sont les experts à appuyer cette théorie.
Quoi qu’il en soit, son apparition éphémère sur Chatbot Arena sent le coup de marketing. Il pourrait s’agir d’une opération de la compagnie de Sam Altman pour son prochain LLM.
GPT-4 Turbo est une version de GPT-4 avec des capacités renforcées. Malgré des performances très satisfaisantes, il reste évident que la base GPT-4 arrive à bout de souffle.
OpenAI doit proposer une nouvelle génération de modèle d’IA pour franchir un autre cap. Il s’agit de GPT-5 dont la date de lancement reste inconnue.
Pensez-vous que gpt2-chatbot était un aperçu de GPT-5 ?
- Partager l'article :
Buzz