Tout savoir sur le SPOF informatique, le single point of Failure ou “point unique de défaillance” en Français. Comprendre ce terme important dans le Big Data qui peut impacter : les données, le data center, le switch, des entreprises comme Cisco ou OVH, etc.

SPOF est un acronyme qui sonne comme une onomatopée. Pourtant ce terme désigne quelque chose de très sérieux : le Single Point of failure.

En Français, l’expression se traduit par point de défaillance unique. Cette notion renvoie à une particularité d’une architecture d’un système informatique. Comme le Big Data repose sur des infrastructures IT classique le SPOF informatique peut avoir une dimension critique à l’ère de l’exploitation des données de masse.

SPOF définition du “point unique de défaillance”

Le point de défaillance unique désigne un élément dans une infrastructure donnée qui peut entraîner la chute du système si celui-ci vient à défaillir. Ce SPOF est un élément dont tout le fonctionnement d’une architecture physique dépend et qui n’est pas sécurisé par un backup, une redondance ou un équipement de secours. Il peut y avoir un ou plusieurs Single Point of Failure. La fibre optique, un routeur, un serveur, un switch un Pare-feu, un serveur de service, l’alimentation électrique, un proxy, un câble, etc. Pratiquement tout élément d’un système peut être considéré comme un SPOF.

Les causes sont nombreuses : dégradations volontaires, tremblement de terre, panne électronique, mécanique (disque dur), incendies, guerre, etc. Ces mêmes causes peuvent être provoquées par un point unique de défaillance. Imaginez un ordinateur central qui contrôle la température du cœur nucléaire d’une centrale. Une défaillance peut entraîner une catastrophe nucléaire. L’exemple le plus parlant pour nous français n’est autre que le nouveau système d’aiguillage numérique de la SNCF situé à la gare Montparnasse. Une panne d’un calculateur avait créé une immobilisation des trains et des voyageurs pendant plusieurs heures.

À l’ère du cloud, du « as a Service » et des systèmes distribués, les points uniques de défaillance dépassent largement le cadre matériel. Ils concernent désormais les microservices, les environnements multi-régions, les fonctions serverless et les services gérés par des fournisseurs cloud.

En 2025, les SPOF se manifestent également dans les services de coordination, les proxys ou encore les interconnexions entre régions cloud. En effet, la complexité de l’infrastructure rend la redondance logicielle aussi cruciale que la redondance matérielle.

Les conséquences sont souvent moins humaines que financières. Si un SPOF peut causer un incident physique, il provoquera généralement une interruption de service ou diminuera la vitesse d’accès à une page Web, une application Cloud.

Résoudre un SPOF

Dans le cadre d’une disponibilité continue, il faut impérativement éliminer les single point of failure. Pour ce faire la solution est “simple” : créer une redondance des différents points de défaillance. Si dans la littérature une redondance peut être mal vue, en informatique cela consiste à installer plusieurs exemplaires d’un même équipement. Cette redondance peut également être logiciel : il faut alors copier le code informatique d’un processus et le sauvegarder en tant que backup (mirroring). Il existe plusieurs formes de redondance afin de protéger l’intégrité des équipements d’un système :

Redondance symétrique : il s’agit de mettre deux exemplaires d’un même équipement ou processus à l’opposé dans l’espace.

Redondance asymétrique : le matériel ou le processus de secours n’est pas le même que le SPOF.

Redondance modulaire : faire dévier le SPOF d’un système à un autre.

Redondance évolutive : consiste à isoler l’élément défaillant et utiliser le reste du système.

Ces différentes formes de redondance peuvent être employées en même temps suivant les équipements, les logiciels ou encore les parties du système à protéger.

Détecter un Single Point Of Failure

Avant même de mettre en place des solutions de redondance, il convient d’identifier les possibles points uniques de défaillance. Ce n’est pas forcément la chose la plus aisée. En effet, un SPOF peut ne pas être visible dans un système fermé (par exemple, un intranet), mais se révéler une fois la connexion à l’extérieur est établie. Pour être sûres de n’en rater aucun, les entreprises établissent une cartographie exhaustive du système afin de détecter l’ensemble des Single Point of Failures et de mettre en place les redondances associées. Les jeunes entreprises peuvent établir cet exercice dès la conception de l’architecture d’un système. Les sociétés installées depuis plusieurs années font généralement appel à des cabinets d’audit spécialisés dans la détection de ces failles aux incidences parfois insoupçonnées.

Cas pratique : un SPOF dans un datacenter

Les systèmes sur lesquels repose le Big Data sont directement impactés par ces points uniques de défaillance. Les datacenters font partie des infrastructures les plus sensibles. Par définition, ils reposent sur une imbrication du matériel informatique et des logiciels afin d’assurer le stockage des données. Souvent partie d’un système haute disponibilité, les datacenters doivent être impactés à minima par des SPOF. Il faut alors le moindre de ces défauts d’architecture en doublant, voire en triplant le nombre de sources d’énergie, de routeurs, de switchs, de structures logicielles et de serveurs nécessaires. Dans le pire des cas, le service ralentira, mais ne s’arrêtera pas. Il faut également migrer les sauvegardes de données au sein d’un autre datacenter afin de se prémunir de leur perte.

Au vu de la taille de ces infrastructures, elles sont souvent victimes d’accident physique. Par exemple, OVH a subi une panne importante d’une durée de 4h30 min en novembre 2017 entraînant une interruption de service pour bon nombre de ses clients. Rappelons qu’OVH héberge 3 millions de sites Web. En cause, deux arrivées électriques EDF défectueuses et les chaînes de groupes électrogènes hors services au sein de son data center de Strasbourg. En même temps, la liaison fibre optique entre le centre de Roubaix et celui de Gravelines a lâché à cause d’un bug logiciel. Un problème que l’entreprise avait pourtant anticipé en commençant des travaux pour doubler le nombre de nœuds optiques.

Différence avec Single Point Of Contact

Le point unique de défaillance est à bien différencier du Single Point of Contact ou SPOC. Contrairement au SPOF, il s’agit du point de contact unique, une infrastructure qui va centraliser l’ensemble des communications (appels, messages, mail, etc.). Il s’agit souvent d’un centre d’appels. Une personne peut également assurer le rôle de Single Point Of Contact. Dans ce cas-là, il est le référent unique sur une thématique donnée au sein d’une entreprise.

