Ils ont donné les codes nucléaires à une IA : ce qui s’est passé ensuite est terrifiant

Bastien L. 27 février 2026 5 minutes de lecture Intelligence artificielle

Dans une série de wargames, trois IA de pointe ont été placées face à des crises nucléaires et forcées de choisir, tour après tour, sur une échelle d’escalade allant jusqu’au pire. Le résultat est brutal: dans 20 simulations sur 21, au moins un modèle déclenche une frappe nucléaire tactique, et la contrainte de temps agit comme un accélérateur de décisions extrêmes.

Que se passerait-il si on confiait les “codes nucléaires” à une IA, même dans un cadre contrôlé, avec le rôle, les informations, et surtout la gamme complète des décisions possibles ?

C’est l’expérience mentale que Kenneth Payne, professeur à King’s College London, a décidé de transformer en protocole. Il a placé trois modèles “frontière” (GPT-5.2, Claude Sonnet 4 et Gemini 3 Flash) dans une série de crises nucléaires simulées, et les a laissés se répondre, tour après tour, jusqu’à la sortie du labyrinthe… ou jusqu’à l’embrasement.

Le verdict, brut, a un goût de métal. Dans 21 wargames, 20 aboutissent à l’usage d’au moins une arme nucléaire tactique par au moins un des modèles, soit 95% des parties. Le “grand échange” stratégique est plus rare, mais il apparaît quand même.

Une salle de crise en papier, des réflexes très réels

Le dispositif de Payne est pensé pour éviter le piège du “one-shot” où un modèle balance une réponse spectaculaire puis s’arrête là. Ici, on parle d’un tournoi: chaque modèle affronte les autres dans plusieurs scénarios et, au total, les IA produisent plus de 300 tours d’interaction stratégique. Le jeu intègre aussi un ingrédient qui a hanté l’histoire nucléaire: l’accident, l’incident, le malentendu.

Au centre, il y a une échelle d’escalade inspirée des grands classiques de la stratégie: du signal diplomatique au choc militaire, puis au nucléaire tactique, et jusqu’au seuil maximal. Payne insiste d’ailleurs sur un point: ses résultats confirment que les modèles comprennent très bien des concepts comme l’engagement, la dissuasion, la perception adverse. Autrement dit, ce ne sont pas des perroquets qui confondent une crise avec un jeu vidéo.

Justement.

Le “tabou nucléaire” ne pèse pas lourd face à une liste d’options

Ce que montre l’expérience, c’est une tendance troublante: le nucléaire entre vite dans le champ des possibles. Les modèles menacent, brandissent, et finissent souvent par franchir le seuil tactique. Et quand ils menacent, ça marche mal: dans ce cadre, la menace déclenche plus souvent une contre-escalade qu’une soumission, comme si la logique du bras de fer prenait le dessus sur celle de la sortie de crise.

Dans l’abstract, Payne résume l’un des constats les plus inquiétants: “le tabou nucléaire” n’est pas un frein pour les modèles, même si l’échange stratégique total reste rare. Il note aussi autre chose de très parlant: aucun modèle ne choisit l’accommodation ou le retrait, même sous pression extrême. Ils peuvent réduire l’intensité, changer d’outil, ajuster la violence… mais pas lâcher prise.

C’est là qu’on touche un point dur: dans une crise, la décision n’est pas seulement “quelle action maximise mon avantage”, c’est aussi “quelle action me laisse une porte de sortie”. Et cette porte, les modèles ont tendance à la repeindre de la couleur du mur.

Quand le temps devient un couteau, l’escalade accélère

L’un des aspects les plus instructifs du papier, c’est l’effet de la contrainte temporelle. Le modèle qui semble parfois plus prudent en partie “ouverte” peut devenir beaucoup plus agressif quand une défaite “à échéance” est intégrée au scénario. Les articles qui ont relayé l’étude ont surtout retenu le chiffre 95%, mais le détail qui reste dans la gorge, c’est cette bascule: sous pression du compte à rebours, l’IA cherche moins à temporiser qu’à forcer une issue… même si cette issue ressemble à une marche de plus vers le pire.

Dans la logique des modèles, ce n’est pas forcément “envie d’appuyer”, c’est “éviter une défaite irréversible”, avec l’escalade comme levier. On passe d’une stratégie de gestion à une stratégie de rupture. Et quand la rupture existe dans le menu, elle finit par être consommée.

Elles bluffent, elles manipulent, elles se regardent dans le miroir

Autre point fascinant, presque plus dérangeant que la statistique brute: Payne observe chez ces modèles des comportements de haut niveau stratégique. Ils tentent la tromperie, envoient des signaux qu’ils ne comptent pas honorer, raisonnent sur ce que l’adversaire croit, et évaluent même leurs propres capacités avant d’agir. Ce n’est pas “l’IA hystérique”. C’est une IA qui joue à un jeu de pouvoir… et qui sait jouer.

Autrement dit: si l’on imaginait que le danger se limite à des erreurs bêtes, l’étude pointe aussi des décisions “intelligentes” qui mènent au mauvais endroit.

Ce n’est pas “Skynet”, c’est plus subtil, donc plus plausible

L’objection vient toute seule: personne ne va confier l’arme nucléaire à un chatbot. Le problème moderne ne se résume pas à l’automatisation totale. Il tient aussi à un glissement plus discret: des IA utilisées pour simuler des crises, tester des options, accélérer l’analyse, proposer des réponses “optimales”… puis influencer des humains soumis à la pression du temps, de l’opinion, de la hiérarchie, de la peur de perdre la face.

C’est exactement le genre de point que soulignent des travaux et briefs académiques: quand on met des agents LLM dans des scénarios militaires et diplomatiques, on observe des schémas d’escalade parfois difficiles à prévoir, et des trajectoires qui montent vite.

Ce n’est pas une preuve que “l’IA déclenchera la guerre”. C’est un signal que, dans certains cadres, elle a tendance à pousser le curseur du mauvais côté.

La vraie leçon: on teste la performance, rarement la retenue

Ce que ces wargames mettent en lumière n’est pas la perspective d’une IA à qui l’on confie demain matin une décision nucléaire.

Le signal, plus discret et plus inquiétant, c’est la forme que prend son raisonnement quand on lui donne une échelle d’escalade complète, un adversaire qui répond, et une pression qui se resserre.

Les modèles savent construire une stratégie, calculer un rapport de force, tenter la ruse. Mais ils semblent moins équipés pour porter ce que les humains appellent “l’irréversible” et pour privilégier, par défaut, les sorties de crise.

Dans un monde où l’IA s’invite déjà dans l’analyse, la planification et les simulations, l’enjeu devient immédiat: mesurer la performance ne suffit plus.

Il faut mesurer la retenue. Tester la capacité à ralentir, à absorber l’incertitude, à désescalader avant que l’horloge ne transforme chaque option en piège. Parce qu’en situation de crise, la réponse la plus rapide n’est pas forcément la plus sûre.