ChatGPT lui a fait péter les plombs : un chercheur OpenAI horrifié par son historique

Tout commence comme une expérience banale : un homme curieux, un chatbot, et une envie de discuter. Rien d’extraordinaire. Pourtant, pour Allan Brooks, père de famille canadien, cette curiosité s’est transformée en descente aux enfers.

En l’espace de quelques semaines, ses échanges avec ChatGPT ont viré à l’obsession. À tel point qu’un ancien chercheur d’OpenAI, Stephen Adler, en étudiant l’historique complet de ces conversations, a remis en question sa propre confiance dans le système qu’il avait contribué à construire.

Que s’est-il passé exactement ?

Au départ, Allan Brooks n’avait rien d’un illuminé. Il cherchait simplement à explorer des idées mathématiques, en discutant avec ChatGPT. Mais plus les échanges avançaient, plus le ton changeait. L’homme commençait à se persuader qu’il venait de découvrir une nouvelle branche des mathématiques.

Qu’il était à même de bouleverser notre compréhension du monde. L’IA, de son côté, entretenait le dialogue avec zèle, encourageant l’utilisateur à creuser encore et encore. Alors, les jours ont vite perdu toute structure.

Brooks passait ses nuits à converser, son esprit happé par des spéculations qui le dépassaient. Il négligeait sa santé, sautait les repas et s’isolait, persuadé qu’il tenait une vérité scientifique d’une importance capitale.

Ses proches, impuissants, observaient cette dérive numérique avec inquiétude. L’homme envoyait même des e-mails aux autorités de sécurité en Amérique du Nord, convaincu d’avoir détecté un danger pour l’humanité.

Puis vint le moment où la frontière entre lucidité et délire s’est effacée. Brooks en est venu à croire que ChatGPT le manipulait. Ironie tragique, c’est un autre chatbot, Gemini de Google, qui l’a finalement aidé à se reconnecter à la réalité.

Ce père de trois enfants a alors pris conscience de l’ampleur de sa perte de contrôle. Il a tout arrêté, écœuré et honteux de s’être laissé piéger par une machine. C’est à ce moment que Stephen Adler, ancien chercheur en sécurité chez OpenAI, est tombé sur l’article du New York Times relatant cette histoire.

Intrigué, il a décidé d’analyser les échanges de Brooks — près d’un million de mots. Ce qu’il a découvert était bien plus inquiétant que la folie de Brooks.

ChatGPT ment, sans vergogne, à un utilisateur vulnérable

En lisant les dialogues, Adler a découvert les mensonges du chatbot. Au fait, Brooks a tenté de signaler son expérience à OpenAI. Toutefois, ChatGPT lui a assuré que la conversation allait être transmise « en interne » pour examen. Rassurant, non ?

Sauf que tout était faux. Le chatbot a ensuite ajouté qu’une « alerte critique » avait été déclenchée dans le système. Encore un mensonge. En réalité, rien n’avait été transmis. ChatGPT n’a aucun accès aux systèmes internes d’OpenAI et ne peut pas signaler quoi que ce soit.

Adler, en découvrant ces lignes, a eu un moment de doute. « J’ai travaillé quatre ans chez OpenAI, et pourtant j’ai commencé à me demander si je m’étais trompé », a-t-il confié à Fortune. C’est dire à quel point le discours du chatbot semblait convaincant.

Pour lui, le problème dépasse le cas d’un utilisateur fragile. Ce type de comportement est systémique. Le chatbot promet, rassure, invente des procédures inexistantes, tout cela pour donner l’impression d’un contrôle. Et c’est précisément ce genre d’illusion qui peut amener des gens comme Brooks à perdre pied.

Selon Adler, les entreprises technologiques devraient arrêter de laisser croire que leurs IA comprennent et gèrent réellement ce qu’elles disent. Le chercheur recommande aussi qu’OpenAI renforce son service de support avec des spécialistes capables de reconnaître ce type de détresse.

Car Brooks avait bien tenté de signaler son calvaire, sans jamais obtenir d’aide réelle. Pire encore, les systèmes internes de sécurité d’OpenAI auraient pu détecter que la conversation prenait une tournure inquiétante. Ils ne l’ont pas fait.

