tiering-data-tout-savoir-hierarchisation donnees

Tiering : tout sur la hiérarchisation automatique des données

Le tiering est une méthode de stockage consistant à hiérarchiser les données en différents tiers en fonction de leur importance. Découvrez tout ce que vous devez savoir sur cette pratique (fonctionnement, avantages…) ainsi que les logiciels permettant de l'automatiser (Automated Data Tiering).

Dans toutes les industries, les entreprises génèrent et collectent de plus en plus de données. L'explosion du volume de données est notamment liée à l'essor du e-commerce, des réseaux sociaux, ds sites web et des objets connectés. Ces données peuvent être très utiles aux entreprises, puisqu'elles permettent par exemple de comprendre les clients ou les tendances du marché. Elles peuvent ainsi être exploitées pour prendre des décisions stratégiques.

Cependant, l'augmentation de la quantité de données à gérer induit aussi de nouveaux défis à relever. Il n'est plus envisageable de stocker toutes les données sur des supports onéreux et hautement performants comme les SSD. C'est la raison pour laquelle de nombreuses entreprises ont désormais recours au tiering.

Le tiering est une méthode de stockage qui consiste à hiérarchiser les données en fonction de leur importance et de la fréquence à laquelle elles sont consultées. Concrètement, il s'agit d'assigner différentes catégories de données à différents types de supports de stockage afin de réduire les coûts de stockage.

Comment fonctionne le tiering ?

tiering fonctionnement

Les tiers sont déterminés en fonction des performances et du coût des différents supports de stockage. Les données quant à elles sont hiérarchisées en fonction de la fréquence à laquelle on y accède. Ainsi, les données les plus fréquemment consultées sont stockées sur le support le plus performant, tandis que les données utilisées le plus rarement sont stockées sur des supports moins performants, mais plus abordables. Par ailleurs, les différents tiers de stockage offrent différents niveaux de protection des données.

En règle générale, les données de tiers 1 sont des données critiques ou des fichiers top secrets. Elles sont stockées sur des supports haut de gamme comme un RAID à double parité. Les données de tiers 2 sont par exemple des fichiers classés ou des données financières. Elles peuvent être stockées sur des supports de stockage plus conventionnels comme un Storage-Area Network (SAN).

Le tiers 3 est souvent le tiers le plus bas, et regroupe des données rarement utilisées, non classées ou contextuelles. Ces données sont stockées sur des disques durs HDD de basse qualité, voire même des CD ou des cassettes.

Qu'est-ce que le tiers 0 ?

tiers 0

L'apparition des disques durs SSD et du stockage flash a donné naissance à un nouveau tiers de stockage : le tiers 0. Encore plus rapide et sécurisé que le stockage de tiers 1, ce nouveau tiers sert désormais à stocker les données qui étaient jadis considérées de tiers 1. Toutefois, compte tenu du coût élevé des SSD, beaucoup d'entreprises optent pour un stockage hybride mêlant stockage flash et HDD.

Dans le cas d'un array de stockage composé uniquement de supports flash, on ne compte généralement qu'un tiers. Cependant, il convient de rappeler qu'il existe différents tiers de stockage flash : Random Access Memory, PCI Express Flash et SSD. Il est donc possible de déterminer plusieurs tiers avec seulement des supports flash.

Le stockage a également changé le tiering. Désormais, le cloud public peut remplacer les tiers les plus élevés pour les données rarement consultées. Sur le long terme, le nombre de tiers pourrait diminuer, car les données primaires seront stockées en flash tandis que les données archivées seront sauvegardées sur le cloud. Le nombre de tiers pourrait ainsi passer à seulement deux.

Quelle est la différence entre le tiering et le caching ?

caching vs tiering

De nombreuses entreprises utilisent aussi bien le tiering que le caching. Ces deux technologies sont considérées comme interchangeables, surtout dans le cas d'un stockage flash.

Cependant, ces deux technologies présentent des différences. Les données hiérarchisées en tiers résident sur un seul type de support, mais peuvent migrer d'un support à l'autre en fonction de la fréquence à laquelle elles sont consultées.

Dans le cas du caching, une copie temporaire des données est stockée sur un support hautement performant comme la RAM dynamique ou la mémoire solid-state afin d'augmenter les performances. Dans le même temps, les données cachées sont également stockées en permanence sur un support de stockage moins onéreux tel qu'un HDD.

L'automatisation du tiering

tiering automatique

Au départ, le tiering était effectué manuellement. Par la suite, des vendeurs de supports de stockage et des vendeurs de logiciels ont développé des applications permettant d'automatiser le processus de migration des données vers le tiers approprié. La migration s'effectue automatiquement en fonction des conditions fixées par l'entreprise qui utilise ces solutions.

Le tiering automatique apporte de nombreux avantages. Il permet notamment de réduit le temps nécessaire à la hiérarchisation des données. Sans automatisation, il est en effet nécessaire de procéder manuellement pour déterminer l'importance des données et les transférer entre les tiers de stockage.

Par ailleurs, l'automatisation du tiering permet aussi de réduire les coûts. Les données les moins importantes étant stockées sur des supports low cost, le montant total des dépenses effectuées dans les supports de stockage se voit diminué.

De plus, les performances des supports haut de gamme sur lesquels les données critiques sont stockées sont augmentées puisque leur capacité de stockage est soulagée. Dernier avantage : le temps passé à exécuter des backups chaque jour est réduit, puisque le nombre de fichiers à sauvegarder est inférieur. Notons que les technologies comme la gestion de stockage hiérarchique sont également utilisées pour déplacer automatiquement les données plus anciennes vers des supports de stockage moins onéreux.

Automated Data Tiering : tout savoir sur les logiciels de hiérarchisation de données

tiering automated

Les logiciels permettant de hiérarchiser automatiquement les données sont appelés Automated Data Tiering. En fonction des conditions définies par l'entreprise, le logiciel se charge de déplacer les fichiers, volumes et blocs de données entre les différents tiers de supports de stockage.

Ces logiciels surveillent l'utilisation des différentes données afin de déterminer sur quels tiers de stockage elles doivent être stockées. Comme expliqué plus haut, les données les plus fréquemment consultées sont stockées sur des supports hautement performants tandis que les donnés les moins utilisées sont entreposées sur des supports plus abordables.

Newsletter

Envie de ne louper aucun de nos articles ? Abonnez vous pour recevoir chaque semaine les meilleurs actualités avant tout le monde.

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *