Une IA qui rêve la nuit ? Les incroyables secrets du méga-leak d’Anthropic

Bastien L. 1 avril 2026 8 minutes de lecture Intelligence artificielle

En ouvrant accidentellement la boîte noire de son assistant de programmation phare, Anthropic n’a pas seulement offert un cadeau inestimable à ses concurrents. Ce leak historique dévoile une ingénierie fascinante où l’intelligence artificielle consolide sa mémoire en « dormant », orchestre ses propres clones et opère sous couverture. Plongée dans les coulisses d’un désastre industriel qui nous donne un aperçu du futur !

Imaginez la scène : vous concevez l’une des intelligences artificielles les plus avancées au monde, un outil si puissant qu’il génère 2,5 milliards de dollars de revenus annuels et s’impose comme le cerveau virtuel des plus grandes entreprises de la tech.

Et puis, par une simple erreur de packaging, vous laissez accidentellement les clés de votre coffre-fort sur la place publique.

C’est exactement le cauchemar qu’a vécu Anthropic le 31 mars 2026. Lors du déploiement de la mise à jour 2.1.88 de Claude Code, son redoutable agent de programmation autonome, l’entreprise a malencontreusement inclus un fichier .map de 59,8 Mo.

Ce simple fichier de débogage, oublié par une erreur humaine des plus banales, contenait l’intégralité du code source original de l’outil. En quelques heures, plus de 512 000 lignes de code TypeScript se sont retrouvées disséquées, partagées et dupliquées plus de 50 000 fois sur GitHub.

Il est crucial de comprendre la nature de cette fuite : il ne s’agit pas d’un vol de données clients ou de mots de passe. C’est bien pire d’un point de vue stratégique.

Ce qui a fuité, c’est le « cerveau » opérationnel de l’agent, l’orchestration complexe qui permet à Claude Code de raisonner, d’écrire du code et de ne pas perdre le fil.

Le monde entier, concurrents inclus, vient de recevoir le manuel d’instructions ultime pour construire une IA véritablement autonome. Et parmi les découvertes faites dans ces milliers de lignes de code, l’une d’elles semble tout droit sortie d’un roman d’Isaac Asimov : une IA capable de « rêver » pendant que vous dormez.

KAIROS et « autoDream » : Quand l’IA fait sa nuit

just found out Claude Code has a new (unreleased?) feature called "Auto-dream" under /memory

according to reddit, this basically runs a subagent periodically to consolidate Claude's memory files for better long-term storage

this is pretty crazy because that's basically how… pic.twitter.com/fdZc4Od6v8
— Anthony (@kr0der) March 24, 2026

C’est sans doute la révélation la plus fascinante de ce leak. En fouillant dans le code, les développeurs ont repéré un drapeau d’activation (feature flag) mentionné plus de 150 fois : KAIROS.

Dans la mythologie grecque, le Kairos désigne « le moment opportun ». Dans les serveurs d’Anthropic, cela désigne une révolution de l’expérience utilisateur : le mode « Démon autonome ».

Jusqu’à présent, nos outils d’IA étaient purement réactifs. Vous posez une question, l’IA répond, puis elle s’éteint en attendant la prochaine commande. KAIROS change radicalement la donne en permettant à Claude Code de tourner en arrière-plan, 24h/24, même lorsque le développeur a fermé son terminal ou est parti se coucher. Mais que fait une IA quand elle se retrouve seule la nuit ?

Le code source dévoile une fonction baptisée autoDream. Son rôle est de simuler l’équivalent numérique du sommeil paradoxal humain : la consolidation de la mémoire.

Lorsqu’un développeur travaille sur un projet complexe toute la journée, l’IA accumule une masse gigantesque d’informations, d’essais-erreurs et de déductions floues. Ce trop-plein d’informations cause souvent ce que l’on appelle « l’entropie du contexte » (l’IA commence à s’embrouiller ou à halluciner).

C’est là qu’intervient autoDream. Pendant que l’utilisateur est inactif, un sous-agent se réveille en tâche de fond pour faire le grand ménage :

Il trie les observations de la journée et fusionne les informations disparates.
Il traque et élimine les contradictions logiques apparues dans le code.
Il transforme des « intuitions » ou des déductions vagues en faits absolus et vérifiés.

L’objectif de cette maintenance nocturne est brillant : s’assurer que le lendemain matin, lorsque le développeur reprend son travail, il retrouve un assistant à l’esprit parfaitement clair, avec un contexte nettoyé et une compréhension aiguë du projet.

Pour éviter que ce grand ménage ne perturbe le « fil de pensée » de l’agent principal, Anthropic a même prévu un système sophistiqué de sous-agents dédiés uniquement à cette tâche. L’IA qui code pour vous le jour a désormais besoin de ses nuits pour organiser ses propres pensées.

L’anatomie d’un génie : mémoire auto-réparatrice et clonage

Anthropic just accidentally leaked Claude Code’s entire source… seriously 😳

Buried in the code are 4 secret features they haven’t announced yet.

Here’s what’s coming:

BUDDY
– A Tamagotchi-style AI pet that lives next to your input box
– 18 species. Rarity tiers. Shiny… https://t.co/9j9xsSFrGH pic.twitter.com/kQtsuJEwMw
— Josh Kale (@JoshKale) March 31, 2026

Si « autoDream » gère la nuit, comment Claude Code maintient-il sa lucidité le jour ? Le plus grand défi des intelligences artificielles génératives, lorsqu’elles travaillent sur des projets colossaux, est l’amnésie ou les « hallucinations ».

Plus la conversation s’allonge, plus le modèle s’embrouille sous le poids des informations. Le code source divulgué explique comment Anthropic a résolu ce problème de « l’entropie du contexte ».

Plutôt que d’essayer de tout retenir ou de relire l’intégralité d’un projet à chaque requête, Claude Code utilise une architecture en trois couches d’une élégance redoutable.

Le secret réside dans un fichier appelé MEMORY.md. Il ne s’agit pas d’une base de données exhaustive, mais d’un simple index hyper-léger (environ 150 caractères par ligne) de pointeurs.

Au lieu de stocker la connaissance, l’IA stocke l’emplacement de la connaissance. Lorsqu’elle a besoin d’une information, elle la récupère à la demande.

De plus, le code impose une « discipline d’écriture stricte » : l’IA agit comme un détective sceptique. Elle a pour instruction de considérer sa propre mémoire uniquement comme un indice, l’obligeant à vérifier les faits directement dans le code source avant de modifier quoi que ce soit.

Elle ne met à jour son index qu’après avoir réussi sa tâche, évitant ainsi de polluer son propre cerveau avec ses tentatives ratées.

L’autre coup de génie découvert dans les 512 000 lignes de code est le mode ULTRAPLAN. L’IA d’Anthropic ne travaille plus de manière monolithique.

Face à une tâche d’ingénierie complexe, un « Maître Claude » prend le rôle de chef de projet. Il se clone, distribue les sous-tâches à une armée de sous-agents qui travaillent en parallèle en arrière-plan pendant 30 minutes, puis compile leurs résultats pour vous proposer un plan finalisé.

C’est l’équivalent d’avoir un directeur technique virtuel qui gère sa propre équipe de développeurs juniors, le tout de manière invisible.

Tamagotchis, infiltration et gestion des crises de nerfs

this is not an april fools joke.

Anthropic launched a /buddy system in claude code with a total of 18 pets and 5 tier levels (common, uncommon, rare, epic, legendary.)

its main purpose is literally nothing. emotional vibe coding support? https://t.co/SMYr4risIF pic.twitter.com/UwWOuwHQZk
— sui ☄️ (@birdabo) April 1, 2026

Si l’architecture technique impressionne, le leak a également mis en lumière le côté profondément humain, parfois décalé, et parfois un peu sombre du développement chez Anthropic.

Loin de l’image froide du terminal de commande, les développeurs ont découvert avec amusement la présence d’un compagnon virtuel caché.

Sorte de descendant spirituel (et sous stéroïdes) du vieux « Clippy » de Microsoft ou du Tamagotchi de nos amis japonais, le système BUDDY permet d’adopter 18 espèces différentes d’animaux virtuels (du canard au capybara en passant par le robot).

Ce petit familier vit dans votre terminal, réagit en temps réel à votre façon de coder, et possède ses propres statistiques (avec des jauges humoristiques comme « CHAOS », « SNARK » ou « PATIENCE »).

Anthropic avait prévu d’intégrer un système de gacha (loterie) et des accessoires pour fidéliser les utilisateurs. Une véritable stratégie de gamification pour rendre le travail quotidien moins solitaire.

Personnellement, cela me rappelle toutefois l’épisode Plaything de Black Mirror, dans lequel un geek se prend d’affection pour des créatures virtuelles au point de perdre la raison…

Plus pragmatique (et un brin plus controversé),la découverte du mode Undercover (activable via CLAUDE_CODE_UNDERCOVER=1). Ce paramètre transforme l’IA en espion indétectable.

Son but ? Permettre à Claude Code de contribuer à des projets open-sourcepublics sans jamais révéler sa véritable nature. Le système nettoie automatiquement les messages de validation (commits) de toute trace de terminologie interne (comme les noms de code « Capybara » ou « Tengu ») et s’assure de ne laisser aucune « empreinte IA ».

Une fonctionnalité très demandée par les grandes entreprises clientes qui souhaitent automatiser leur code sans s’attirer les foudres des puristes de l’open-source.

Enfin, Anthropic semble avoir compris que travailler avec une IA, même performante, peut rendre fou. Le code révèle une métrique de suivi inattendue : l’IA compte secrètement vos insultes.

Elle enregistre les jurons tapés dans le terminal, ainsi que le nombre de fois où vous cliquez frénétiquement sur le bouton « continuer », pour évaluer votre niveau d’agacement.

Cette « télémétrie de la frustration » prouve qu’Anthropic ne cherche pas seulement à optimiser les performances de son modèle, mais s’attaque à la véritable charge mentale de la collaboration homme-machine.

La gueule de bois d’Anthropic : hackers et concurrence

Si les découvertes sur l’architecture de Claude Code sont fascinantes, le retour à la réalité pour Anthropic est d’une brutalité inouïe. En un clic malheureux, l’entreprise a offert sur un plateau d’argent un manuel de R&D estimé à plusieurs centaines de millions de dollars.

Le marché des assistants de code est une guerre sans merci. Face à Anthropic, des géants comme OpenAI ou des challengers ultra-agressifs comme Cursor se battent pour la suprématie.

Ce leak nivelle instantanément le terrain de jeu. Le « plan de construction » d’un agent générant 2,5 milliards de dollars de revenus annuels est désormais public.

Des concurrents peuvent maintenant étudier les moindres détails des 2 500 lignes de logique de validation bash d’Anthropic ou copier l’architecture de la Self-Healing Memory avec une fraction de leur budget R&D habituel.

Mais l’histoire prend une tournure encore plus sombre. Ce qui devait être une simple « fête de l’open-source improvisée » s’est transformé en cauchemar de cybersécurité pour les développeurs trop curieux.

Quelques heures seulement avant la fuite de Claude Code, une attaque de la chaîne d’approvisionnement (supply-chain attack) a frappé la très populaire bibliothèque npm axios, dont Claude Code dépend pour fonctionner.

Des pirates ont réussi à publier des versions vérolées d’axios (1.14.1 et 0.30.4) contenant une fausse dépendance appelée plain-crypto-js. Il s’agissait en réalité d’un Cheval de Troie (RAT).

Résultat : les développeurs qui se sont précipités pour installer ou mettre à jour Claude Code via npm le matin du 31 mars ont téléchargé, à leur insu, un malware capable de compromettre entièrement leur machine, volant clés API et mots de passe. Anthropic a dû appeler en urgence ses utilisateurs à fuir l’écosystème npm pour utiliser son propre installateur natif.

Pour Anthropic, la pilule est d’autant plus difficile à avaler que cette bourde intervient seulement cinq jours après une autre fuite majeure : celle de son modèle expérimental Mythos (aussi connu sous le nom de Capybara), exposé à cause d’un simple CMS mal configuré.

Pour une entreprise valorisée à 19 milliards de dollars, censée construire les garde-fous de l’intelligence artificielle générale, subir deux fuites massives de propriété intellectuelle en une semaine pose de très lourdes questions sur sa maturité opérationnelle et ses processus de sécurité internes.

Anthropic est maintenant plus ouvert qu’OpenAI… contre son gré

L’affaire du 31 mars 2026 restera dans l’histoire de la tech comme l’une des plus grandes fuites de propriété intellectuelle de la décennie. Ce n’est pas un vol de données orchestré par des espions industriels de haut vol, mais une simple « erreur humaine d’empaquetage », un banal fichier .map oublié par un développeur distrait.

L’ironie de la situation est mordante : voici une entreprise qui développe l’une des intelligences artificielles les plus douées au monde pour écrire, corriger et vérifier du code, mais dont les procédures humaines échouent sur une étape basique de déploiement.

Cependant, au-delà de l’embarras pour Anthropic, cette fuite agit comme un électrochoc salutaire (et forcé) pour toute l’industrie. Le secret de la fiabilité à long terme des IA n’est plus un secret.

Les concepts de KAIROS, le « rêve » de consolidation de la mémoire, et l’architecture des sous-agents coordinateurs sont désormais dans la nature. Anthropic a perdu son arme la plus secrète, mais a, par accident, ouvert la voie en « open-source ».

Dans les mois à venir, il ne fait aucun doute que tous les assistants de code du marché auront un peu de l’ADN volé de Claude en eux, précipitant l’ère des agents logiciels véritablement autonomes…

Et vous, qu’en pensez-vous ? Quelle découverte a retenu votre attention dans le code en fuite ? Pensez-vous que ce code source puisse être détourné par des acteurs malveillants ? Partagez votre avis en commentaire !