Google contraint de fermer un de ses data centers à Londres pendant la canicule

Une panne liée à un échec de refroidissement a forcé Google à fermer un de ses data centers à Londres lors de la canicule. Les services de la zone europe-west2-a ont été perturbés.

Un système de refroidissement défaillant au moment de la canicule

La hausse des températures n’a pas été sans impact chez Google au niveau des data centers dans la région britannique. La société s’est exprimée au sujet d’une panne qui a interrompu les services de la zone europe-west2-a.

Le rapport de la société explique : « Un de nos data centers sis en la zone europe-west2-a n’a pas pu garder une température idéale à son bon fonctionnement. C’est le résultat d’une défaillance du système de refroidissement combiné à la canicule. »

Du côté technique, la société n’a rapporté aucune explication au sujet de la possible source de défaillance du système de refroidissement. Cependant, juste avant la panne qui a sévi, les températures externes environnaient 39°C. Au niveau des prévisions de montée de température, cette chaleur était anticipée. Cependant, une telle canicule n’est pas dans les habitudes de cette région britannique.

Les techniciens avaient travaillé depuis 7h du matin pour remédier à la panne sans grand succès. La chaleur s’allongeant jusqu’à la fin de la journée, il a fallu éteindre cette zone pour éviter des extensions aux autres systèmes. Une décision poursuivie par une vague de murmures, car cela signifiait que 35 % des machines virtuelles de cette zone ont été hors d’état.

Les ingénieurs de Google ont par ailleurs réorienté le chemin du trafic pour les services internes par mégarde. Ce qui a provoqué quelques désordres au niveau des ressources de travail.

Ce n’est que vers 22h, heures de Londres, que le système de refroidissement s’est stabilisé. En somme, la panne a duré 23 minutes au début. Plus tard, une durée plus prolongée de « 35 heures » et 15 minutes a eu lieu.

Google prend les dispositions nécessaires pour que la situation en datacenters ne se reproduise plus

Toutes ces situations seront analysées par les ingénieurs de la société. A la suite de ces défaillances thermiques, Google promet de travailler sur divers engagements. Entre autres, la société mobilisera les recherches nécessaires pour éviter la surcharge thermique menant à des arrêts complets de zone. Elle travaillera également sur les capacités de récupération automatisée pour atténuer l’attente dans la mesure du possible. Et enfin, Google prévoit de faire un audit de tous ses équipements et des normes des systèmes de refroidissement de ses data centers. Et cela dans tous ceux qui hébergent Google Cloud à travers le monde entier.

Ces décisions sont appropriées vu que des situations similaires se reproduisent régulièrement. Google approfondit sur la recherche à ce sujet car ces pannes de data centers sont très coûteuses. Mis à part ce contexte de chaleur intense, la principale source de panne de ces installations est liée aux problèmes de réseau. D’autre part, les défaillances des systèmes informatiques, les problèmes d’équipements touchent aussi les data centers.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.

Pin It on Pinterest