gpt2 chatbot gpt-5 leak

GPT-5 en leak sur le web ?! 5 exploits choquants de gpt2-chatbot

Une mystérieuse IA circule sur le web : gpt2-chatbot. Et vu ses performances, certains se demandent si ce n'est pas -5 relâché sur le web par ! Découvrez 5 cas d'usage bluffants, inenvisageables pour GPT-4 !

Depuis le début du mois de mai 2024, une mystérieuse IA affole internet. Ce chatbot portant le nom de code « gpt2-chatbot » surpasse les performances de GPT-4, 1.5 ou Anthropic Claudeet personne ne sait d'où il vient !

S'agit-il d'une version preview de GPT-5, relâchée incognito sur le web par OpenAI pour le tester dans le monde réel ?

Nul ne peut vraiment le savoir, mais les internautes sont stupéfaits par les prouesses accomplies par cette IA. Voici 5 exemples de tâches qu'elle a réussis avec brio !

Recréer les jeux Flappy Bird et Tetris en un seul prompt

https://twitter.com/minchoi/status/1787836907566531056

L'expert en IA Min Choi est parvenu à créer un clone du jeu mobile Flappy Bird avec gpt2-chatbot, plus précisément avec la version im-also-a-good-gpt2-chatbot via le Battle Mode du site lmsys Arena.

Pour y parvenir, il n'a eu qu'à utiliser un simple prompt : « Code Flappy Bird game in Python ». Il a également fourni à l'IA 3 images PNG pour le guider. Le résultat est bluffant !

De même, un dénommé Joon-Hong Kim est parvenu à recréer Tetris en langage Python avec un seul prompt.

Résoudre des puzzles et raisonner mieux que les autres IA

Étonnamment, la version im-a-good-gpt2-chatbot se révèle aussi capable de résoudre un puzzle que les autres modèles IA sont incapables de comprendre.

Il s'agit d'un de raisonnement : il y a deux équipes de foot, l'équipe A a 8 victoires et l'équipe B en a 5. Sachant qu'il reste 7 matchs avant la fin de la compétition, l'IA doit déterminer le nombre minimum de victoires dont l'équipe B a besoin pour gagner.

Afin de résoudre cette énigme, gpt2-chatbot analyse la situation étape par étape en détaillant son raisonnement. Il passe en revue le nombre de victoires actuelles, le nombre de matchs restants, et le nombre total de victoires possibles pour chaque équipe après avoir joué tous les matchs.

https://twitter.com/itsandrewgao/status/1787762934233567645

Il examine également les conditions de victoire de l'équipe B, la distribution des victoires, et l'équation permettant de trouver la bonne réponse. Cette méthode lui permet de déterminer que l'équipe B a besoin de gagner 6 matchs sur 7 !

La personne qui lui a soumis ce test sur Reddit précise que la version im-also-a-good-gpt2-chatbot a également trouvé la réponse, mais a eu besoin de 2 prompts.

Confrontée à une autre épreuve par un internaute dénommé Pietro Schirano, l'IA s'est là encore révélée plus douée que ses rivaux pour le raisonnement.

Lorsqu'on lui demande quel est le plus lourd entre un kilo de plume et un kilo de plomb, elle parvient à répondre qu'ils pèsent tous deux un kilo et que la différence réside uniquement dans leur volume et leur densité.

Une devinette qui peut sembler simple, mais qui induit souvent les IA (et même les humains) en erreur !

Dessiner et créer de l'art ASCII

Sur X, un dénommé Phil est impressionné par la capacité de gpt2-chatbot à créer de l'art ASCCI : une technique pour créer des images en utilisant uniquement les 95 caractères imprimables du standard American Standard Code for Information Interchange.

Comme il le démontre à travers une comparaison, gpt2-chatbot surpasse totalement les autres modèles comme Meta LLama-3-70b.

Toutefois, un autre internaute lui a ensuite fait remarquer que son dessin de licorne est une copie pure et simple d'une création humaine.

Déçu, Phil en déduit que gpt2-chatbot est simplement meilleur pour se rappeler ses données d'entraînement avec exactitude…

Même pour le dessin classique, gpt2-chatbot se révèle plus habile que d'autres modèles comme GPT-4 Turbo, comme le souligne Dimitris Papailiopoulos sur X.

Résoudre des problèmes mathématiques

Côté mathématiques, gpt2-chatbot n'a pas à rougir non plus. Comme le souligne Andrew Gao, elle est parvenue à résoudre un problème issu de l'Olympiade Internationale de Mathématiques (OIM) du premier coup !

Rappelons que les maths sont traditionnellement une discipline très difficile pour les chatbots IA. Même GPT-4 Turbo peine à résoudre des exercices et des problèmes.

Selon la rumeur, OpenAI a créé une IA portant le nom de code Q* très douée pour les maths et beaucoup d'experts estiment qu'il s'agit de la clé vers la création d'une AGI

Comprendre les lois de la physique

Contrairement aux autres IA, comme GPT-4 Turbo, gpt2-chatbot est même capable de résoudre des problèmes de physique.

La version im-also-a-good-gpt2-chabot est ainsi parvenue à résoudre un problème issu du chapitre 2 du livre University Physics with Modern Physics.

L'énoncé indique que le super-héros Green Lantern tombe du haut d'un immeuble, et traverse la moitié de la distance totale pendant la dernière seconde de sa chute. Le problème à résoudre était de déterminer la hauteur de l'immeuble, et l'IA y est parvenue !

Comment tester gpt2-chatbot ?

Pour essayer cette puissante IA par vous-même, rendez-vous sur chat.lmsys.org et sélectionnez le mode Arène.

Entrez un prompt, et évaluez la réponse. Le chatbot sur lequel vous tombez est sélectionné au hasard à chaque tentative.

Vous devez donc réessayer, jusqu'à tomber sur « im-a-good-gpt2-chatbot » ou « im-also-a-good-gpt2-chatbot ». C'est un peu hasardeux, mais il s'agit de la seule méthode permettant de tester cette mystérieuse IA !

YouTube video

Restez à la pointe de l'information avec LEBIGDATA.FR !

Abonnez-vous à notre chaîne YouTube et rejoignez-nous sur Google Actualités pour garder une longueur d'avance.

Newsletter

Envie de ne louper aucun de nos articles ? Abonnez vous pour recevoir chaque semaine les meilleurs actualités avant tout le monde.

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *