Ne vous laissez pas séduire par les réponses fluides et à l’air sympathique de ChatGPT, car des experts ont trouvé 7 failles. Quatre seraient même encore actives, même dans la toute dernière version. Alors, faut-il vraiment s’inquiéter ?
On l’utilise pour rédiger des mails, résumer des articles ou juste discuter. Mais pendant que le monde entier s’extasie devant les capacités de ChatGPT, des chercheurs en cybersécurité viennent de tirer la sonnette d’alarme.
Tenable, un acteur réputé dans le domaine, a révélé pas moins de sept failles critiques de ChatGPT baptisées HackedGPT. Et le pire ? Certaines transforment l’IA en complice involontaire de cybercriminels, capable d’exfiltrer données personnelles et conversations privées sans que personne ne s’en rende compte.
Quelles sont ces failles de ChatGPT ?
La première faille de ChatGPT recensée est presque risible de simplicité. Parce qu’un commentaire piégé sur un blog public suffit. Vous demandez un résumé de l’article ? L’IA lit aussi les commentaires. Elle obéit aux instructions cachées. Aucune alerte, aucun antivirus ne détecte la manipulation.
Il y a aussi l’attaque 0-click. Vous posez une question banale. SearchGPT part ensuite faire sa recherche sur le web et tombe sur un site compromis. Et là, l’exploitation se déclenche. Les criminels ciblent souvent des sujets tendance pour toucher un maximum d’utilisateurs.
Ensuite, les liens partageables posent aussi problème. Puisque ces URL pré-remplies peuvent être détournées. Vous cliquez sur un lien reçu par mail ou sur les réseaux, et vous activez sans le savoir des commandes malveillantes. Le tout se déroule en coulisses, sans que l’utilisateur se doute de rien.
Et les autres vulnérabilités ?
OpenAI a essayé de sécuriser ChatGPT avec un système « url_safe ». Mais cela pose problème. Car Tenable a découvert que certains liens de suivi Bing passent systématiquement, même dangereux. Ils peuvent donc rediriger vers des sites contrôlés par des pirates.
Vient ensuite la Conversation Injection. SearchGPT introduit des commandes dans la discussion que ChatGPT exécute comme si elles venaient de l’utilisateur. Ce n’est pas la seule technique d’exploitation redoutable découverte par Tenable. Le bug de formatage Markdown est tout aussi dangereux. Il masque en effet le contenu malveillant à l’écran. De ce fait, vous obtenez une attaque parfaitement invisible.
Et la dernière faille de ChatGPT ? C’est la pire. Parce que des instructions malveillantes sont injectées dans la mémoire longue durée. Une fois corrompue, cette mémoire transforme chaque nouvelle conversation en opportunité d’exfiltration. Cela même des jours après l’attaque initiale.
OpenAI est bien sûr informé et certaines failles ont été corrigées. Mais plusieurs restent actives. Comme le rappelle Moshe Bernstein, ingénieur senior chez Tenable : « Les gens et les organisations doivent partir du principe que les outils IA peuvent être manipulés et concevoir des contrôles en conséquence. » Certes, ChatGPT, comme toutes les IA, reste puissant, mais inoffensif. Alors, prudence est mère de sûreté.
- Partager l'article :
