Déduplication de données : définition et utilité

La déduplication de données est une technique de compression de données qui implique la suppression des données redondantes dans un système. Elle s'utilise pour sauvegarder des données et pour transmettre des données sur un réseau.

Quelle est son utilité ?

Elle permet de stocker un modèle unique de données dans une base de données ou dans un système d'information plus vaste. La déduplication de données examine puis compare les données entrantes avec les données déjà stockées. Si des données sont déjà présentes, les algorithmes de déduplication suppriment les nouvelles données et les remplacent par un pointeur.

Par exemple, lorsqu'on procède à la sauvegarde d'un ancien fichier, le fichier précédent et les modifications s'ajoutent au segment de données total. Cependant, en l'absence de différence, on crée tout simplement un pointeur tout en ignorant le nouveau fichier.

La déduplication de données est une technologie qu'utilisent les fournisseurs de solutions de stockage. Le but étant de mieux exploiter l'espace de stockage. Ces fonctionnalités se regroupent généralement dans une catégorie plus large, appelée réduction de données. Tous ces systèmes ont un même objectif : améliorer l'efficacité de stockage. Si elles utilisent les techniques de déduplication appropriées, les entreprises peuvent stocker davantage de données que le suggère leur capacité de stockage globale.

Exemple de cas d'une déduplication de données

Les entreprises exécutent souvent un environnement de bureau virtuel, où des centaines de postes de travail identiques sont stockés sur un serveur. Elles exploitent des centaines de fichiers provenant de Windows 8, Office 2013 et d'autres outils dont les utilisateurs peuvent avoir ponctuellement besoin.

Si l'on considère que les images de chaque poste de travail consomment 25 Go d'espace disque, cela représenterait 5 To de capacité pour 200 postes. Avec la déduplication, il est possible de ne stocker qu'une seule copie de ces machines virtuelles. À chaque fois que le système découvre une donnée qui est stockée quelque part dans l'environnement de stockage, il enregistre un petit pointeur à la place de la copie de données, libérant ainsi des blocs qui seraient autrement occupés.

Déduplication matérielle ou logicielle

Les déduplications fonctionnelles réduisent la charge de traitement associée aux produits logiciels. Ces systèmes peuvent aussi ajouter des matériels de protection des données, comme des instruments de sauvegarde, des VTL (Virtual Tape Libraries) ou des serveurs de stockage en réseau.

Bien que la déduplication logicielle puisse éliminer efficacement les redondances à la source, les méthodes matérielles se focalisent sur la réduction des données lors du stockage. Par conséquent, si la déduplication matérielle ne permet pas d'économiser de la bande passante, elle compense ce problème en offrant des vitesses de compression plus élevées.

La déduplication matérielle des données offre des performances élevées, une évolutivité et un déploiement relativement sans interruption. Elle s'adapte particulièrement bien aux déploiements des grandes entreprises, plutôt que par des PME ou des bureaux distants.

Newsletter

Envie de ne louper aucun de nos articles ? Abonnez vous pour recevoir chaque semaine les meilleurs actualités avant tout le monde.

Cliquez pour commenter