Un snapshot de stockage (ou instantané de stockage) permet de réaliser une copie de données stockées sur un système de stockage, ou une copie des modifications apportées à ces données. Découvrez quels sont les avantages, le fonctionnement, les différents types de snapshots de stockage et la différence avec un backup.
Snapshot c’est quoi ?
Snapshot : définition de cet instantané de stockage
Comme l’explique la page Snapshot de Wikipedia, un snapshot informatique, ou instantané de stockage, peut être décrit comme une « photo » des données stockées sur un système de stockage de données à un instant précis. Concrètement, la plupart du temps, il se présente comme un ensemble de marqueurs de référence permettant de suivre les modifications apportées aux données depuis le dernier snapshot.
Le principal intérêt du snapshot est de permettre à l’utilisateur de restaurer les données telles qu’elles étaient lors de la capture. Il s’agit donc d’un outil de protection des données à utiliser en cas d’erreur de manipulation humaine, ou de corruption des données. Il est également possible de l’utiliser dans le cadre d’un test d’applications logicielles ou d’une opération de data mining.
Si plusieurs snapshots sont effectués, il est possible de choisir celui que l’on souhaite restaurer. Chacun d’entre eux est stocké sur un disque dur virtuel différent qui se charge stocker les changements effectués sur un autre disque dur virtuel. Le VHD intercepte toutes les opérations d’écriture et laisse les données d’origine inaltérées. Les différents snapshots sont liés par des relations parent-enfant et forment une arborescence. Chaque snapshot crée une nouvelle branche de l’arbre.
Une application snapshot est très utile pour les processus de sauvegarde, car il permet d’obtenir un instantané de volume sans arrêter la production. Cet instantané peut ensuite être répliqué à distance. Il peut aussi servir de base pour une sauvegarde sur disque ou sur bande.
Snapshot de stockage : quels sont les différents types de technologies ?
On compte plusieurs types de technologies de snapshots de stockage. Les deux plus anciennes technologies sont le copy-on-write et le split-mirror. Le copy-on-write est actuellement la technologie la plus utilisée, mais le redirect-on-write, plus récent, commence à gagner en popularité. L’intantané de type copy-on-write consiste à stocker les métadonnées relatives au volume concerné dans un espace réservé. L’opération est pratiquement immédiate.
Chaque fois qu’un bloc du volume d’origine est modifié, la modification est également répercutée au sein de l’espace réservé. De fait, seules les modifications effectuées sont copiées, ce qui permet d’économiser de l’espace disque. Cette procédure permet de récupérer très rapidement les données en cas d’erreur, de corruption ou d’effacement des données.
L’inconvénient est que, si l’on veut revenir à l’état initial du volume de stockage, il est impératif de conserver tous les snapshots intermédiaires. Il est aussi impératif de disposer d’une sauvegarde du volume initial. Les snapshots COW ne protègent pas d’une panne de disque.
Par ailleurs, chaque modification de bloc génère plusieurs écritures, ce qui mène à une dégradation des performances au fil du temps. Pour cause, chaque processus de copy-on-write requiert une lecture et deux écritures pour lire et écrire le snapshot sur un autre espace avant de l’écraser. Cette inconvénient provient du fait qu’il est sauvegardé sur le même espace que le fichier original.
Il existe une variante appelée copy-on-write with background copy. Cette méthode consiste à prendre un snapshot COW et à utiliser un processus en arrière-plan pour copier les données à l’emplacement de l’instantané. Ce processus créer un miroir des données d’origine. Ainsi, cette variante est considérée comme un hybride entre le copy-on-write et la technique du clonage.
L’autre technologie de snapshot de stockage populaire est le split-mirror, aussi appelé clonage. Cette technique consiste à copier l’intégralité des données du volume original en créant une copie miroir, et non uniquement les données modifiées comme dans le cas du snapshot CoW.
Chaque fois que l’utilitaire est lancé, une copie complète est créée. Ceci permet de simplifier le processus de restauration, de duplication ou d’archivage des données. Le clonage permet aussi d’accéder aux données en mode hors-ligne. En revanche, le processus est plus lent, et consomme beaucoup plus de ressources et d’espace de stockage puisque chaque snapshot nécessite autant de d’espace que le volume d’origine.
Depuis peu, une autre technologie de snapshot gagne en popularité. Il s’agit des snapshots Redirect on Write (ROW). Comme les snapshots COW, les ROW permettent de copier les modifications apportées aux données. Cependant, plutôt que de modifier un bloc existant, les nouvelles écritures sont redirigées vers un espace libre. Ainsi, les ROW évitent le problème de la dégradation des performances au fil des écritures multiples. En revanche, cette méthode complique l’accès aux donnes originales et aux différents snapshots, et oblige à copier les données sur le volume original chaque fois qu’un snapshot est effacé.
Parmi les autres techniques de snapshot moins courantes, on compte le snapshot incrémental. Cette technique permet de créer un repère temporel, permettant à l’utilisateur de revenir dans le temps. Il présente l’avantage de pouvoir créer un instantané informatique plus rapidement et plus fréquemment qu’avec les autres techniques. De plus, cette technique ne consomme presque pas d’espace de stockage supplémentaire par rapport aux données originales, ce qui permet de conserver les snapshots plus longtemps.
Enfin, le snapshot VMware consiste à effectuer une copie d’un fichier disque virtuel afin de pouvoir restaurer une machine virtuelle (VM) à un point temporel spécifique en cas d’erreur ou d’incident. Cette technique est uniquement utilisée au sein d’environnements VMware, et les snapshots sont souvent supprimés en moins d’une heure. Les administrateurs peuvent prendre plusieurs snapshots pour créer plusieurs points de restauration. Lorsqu’un snapshot VMware est réalisé, les données sont en lecture seule. Les autres fournisseurs de Cloud comme AWS ou Microsoft Azure proposent des fonctionnalités moins poussées. Il faut souvent passer par un prestataire externe pour bénéficier d’un système de sauvegarde d’instantané de qualité, en prenant le risque qu’il ne soit pas compatible avec la base de données utilisée dans l’entreprise.
Qu’est-ce que la protection de données continue ?
La protection de données continue (Continous Data Protection) est une technique qui consiste à utiliser les snapshots pour réaliser un back up d’un système de façon à permettre aux utilisateurs de restaurer la version la plus récente des données.
Alors que les snapshots de stockage sont généralement effectués à des points prédéterminés, le CDP permet de sauvegarder les données chaque fois qu’un changement est effectué. Ainsi, les utilisateurs peuvent récupérer les données avec les changements les plus récents, alors qu’un snapshot traditionnel ne le permettra pas si le système tombe en panne avant que la capture ne soit effectuée.
Quelle est la différence entre un snapshot et un back-up ?
Les snapshot ne doivent pas être confondu avec un backup, et ne peuvent remplacer un backup traditionnel. Pour cause, ils consomment trop d’espace de stockage et peuvent dégrader les performances s’ils sont utilisés en guise d’outil de backup. De plus, les snapshots ne sont pas une copie complète des données, et restent dépendants des données sources. Si ces données sont perdues, il est perdu aussi.
Il est donc préférable d’utiliser les snapshots en complément d’une stratégie de backup. Dans ce contexte, les snapshots peuvent apporter certains avantages comme la possibilité d’accéder plus rapidement et plus facilement aux données.
- Partager l'article :