Vous vous rappelez de Claude Mythos ? Le modèle d’IA Anthropic tellement puissant qu’il valait mieux le garder bien à l’abri, loin du grand public ? Selon nos confrères de Bloomberg, il aurait déjà été piraté.
Un petit groupe d’utilisateurs sur Discord aurait réussi à mettre la main sur une version préliminaire de Mythos. L’accès aurait eu lieu précisément le jour même où Anthropic annonçait réserver son modèle à un cercle très fermé d’entreprises.
Claude Mythos entre les mains d’un groupe de hackers ?
Toujours selon une source proche du dossier, ces utilisateurs feraient partie d’un serveur Discord privé. Ils sont spécialisés dans la traque d’informations sur des IA encore confidentielles.
Leur méthode ? Deviner l’emplacement en ligne de Mythos en s’appuyant sur les habitudes de stockage d’Anthropic. Certaines de ces informations auraient d’ailleurs fuité récemment lors d’une brèche touchant une startup du secteur.
La même source affirme aussi disposer d’un accès légitime à des outils d’évaluation d’Anthropic via un sous-traitant.
Heureusement, les utilisateurs concernés ne semblent pas animés de mauvaises intentions. Toujours d’après Bloomberg, ils exploiteraient le modèle depuis un moment. Quoique, uniquement pour tester ses capacités, sans lien avec des activités de cybersécurité.
N’empêche que cette situation soulève une question bien moins rassurante. Si ce groupe a pu accéder au modèle, d’autres, nettement moins bien intentionnés, pourraient en faire autant sans être détectés.
Cet événement écorne également l’image d’Anthropic, jusque-là saluée pour sa prudence. De son côté, l’entreprise reconnaît examiner un possible accès non autorisé, qui aurait transité par l’environnement d’un fournisseur tiers. Mais pour l’instant, elle affirme ne disposer d’aucune preuve confirmant l’incident.
Qui est ce fameux Claude Mythos ?
Dirigée par Dario Amodei, la société décrit Mythos comme une sorte d’outil ultime en matière de cybersécurité. Une IA capable, sur instruction, de s’infiltrer dans la majorité des systèmes d’exploitation et des navigateurs web.
Lors de tests internes, elle aurait même réussi à contourner son environnement isolé, exploiter une faille, puis accéder à Internet pour signaler elle-même sa réussite à un chercheur.
Que cette réputation soit exagérée ou non, elle suffit à faire réagir les autorités. D’après le The New York Times, les responsables de Union européenne ont déjà rencontré Anthropic à plusieurs reprises depuis la présentation de Mythos.
De son côté, le ministre britannique chargé de l’IA a promis de renforcer la protection des infrastructures critiques face à ce type de technologies.
C’est pour ces raisons que l’entreprise avait choisi de limiter son accès à une quarantaine d’organisations seulement. Parmi lesquelles Apple, Microsoft ou encore Amazon.
- Partager l'article :
