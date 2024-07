Une panne informatique mondiale causée par l'agent de sécurité CrowdStrike a perturbé les systèmes Windows. Cela a affecté divers services critiques et des millions d'utilisateurs. Les experts de Dynatrace et Acronis soulignent l'importance des tests rigoureux, des mises à jour échelonnées et des solutions basées sur l'intelligence artificielle. C'est important pour prévenir et gérer efficacement de telles pannes à l'avenir.

Les conséquences de la panne

La récente panne informatique mondiale causée par un problème avec l'agent de sécurité CrowdStrike a paralysé de nombreux systèmes Windows. Cette interruption a touché divers services critiques. Cela va des vols d'avion cloués au sol à des problèmes de connectivité pour les utilisateurs dans plusieurs régions. Citons entre autres les États-Unis, l'Australie et l'Allemagne. Les erreurs d'écran bleu sont devenues fréquentes, créant des perturbations massives.

Kevin Reed, Chief Information Security Officer chez Acronis, explique : « La récente panne de CrowdStrike semble provenir d'un bug dans son agent EDR qui n'a malheureusement pas été testé de manière approfondie. Cela a entraîné une perturbation généralisée car de nombreuses installations ont été touchées dans le monde entier. La mise à jour défectueuse nécessite une intervention manuelle pour être résolue, en particulier le redémarrage des systèmes en « mode sans échec » et la suppression du fichier pilote défectueux. Ce processus est fastidieux et laisse les systèmes vulnérables dans l'intervalle, invitant potentiellement à des attaques opportunistes. »

L'importance des tests rigoureux pour éviter d'autres pannes informatiques mondiales

Cet incident a mis en lumière la nécessité de tests rigoureux et de mises à jour échelonnées pour les agents de détection et de réponse aux incidents (EDR). Kevin Reed poursuit : « Cet incident souligne l'importance de tests rigoureux et de mises à jour échelonnées pour les agents EDR. Normalement, les tests sont effectués à chaque mise à jour et peuvent prendre des jours, voire des semaines, en fonction de l'importance de la mise à jour ou des changements. La facilité avec laquelle les fichiers de pilotes peuvent être supprimés soulève également des questions sur les mécanismes d'autoprotection du logiciel de CrowdStrike. »

Les entreprises doivent veiller à ce que leurs fournisseurs de solutions de sécurité mettent en œuvre des protocoles de test robustes. Les clients d'Acronis qui disposaient de sauvegardes récentes ont pu restaurer leurs systèmes dans un état stable. Cette option a alors minimisé les temps d'arrêt et l'exposition au risque.

Le rôle crucial de l'IA dans la gestion des pannes

Alois Reitbauer, Chief AI Strategist chez Dynatrace, a souligné l'importance des solutions basées sur l'intelligence artificielle (IA) pour gérer les systèmes informatiques complexes. « Compte tenu de la complexité croissante des logiciels, tous les développeurs de logiciels et toutes les organisations sont susceptibles de subir des pannes. Lorsque des pannes surviennent, les organisations doivent être en mesure d'identifier la cause première et d'y remédier immédiatement. Les approches basées sur l'IA sont devenues essentielles pour les opérations informatiques complexes à déployer. Les processus manuels ne peuvent pas suivre. Une approche de l'IA basée sur la puissance des trois (prédictive, causale et générative) est de plus en plus critique pour aider les organisations à fournir une disponibilité et une performance optimales des logiciels et à minimiser les perturbations de l'expérience de l'utilisateur final. »

Cette approche basée sur l'IA permet de réduire considérablement le temps nécessaire pour diagnostiquer et corriger les pannes. Cette perspective assure ainsi une reprise rapide des opérations et une réduction des impacts sur les utilisateurs finaux.

L'incident de CrowdStrike souligne l'importance de se préparer aux pannes informatiques et de rester résilient. Les entreprises doivent investir dans des solutions de sauvegarde robustes et exiger des protocoles de test stricts. L'adoption de technologies avancées comme l'IA peut jouer un rôle clé dans la gestion proactive. Elle permet aussi de réduire les impacts des pannes.

