Accueil > Analytics > Data Analytics > Qu’est-ce qu’un Datamart ? Définition d’un sous-ensemble du Data Warehouse
datamart definition fonctionnement datawarehouse utilisation marketing commercial

Qu’est-ce qu’un Datamart ? Définition d’un sous-ensemble du Data Warehouse

Découvrez ce qu’est un Datamart et son utilité au sein d’une entreprise. Ce sous-ensemble du Data Warehouse se destine aux métiers. Cet outil est aux prémices du Big Data.

Les entrepôts de données sont inextricablement liés au Big Data. Ce sont dans ces lieux que les entreprises, les fournisseurs stockent les fichiers et leurs métadonnées afin de leur archiver ou de les traiter. Habituellement connu sous le nom de Data Warehouse, il existe des formats spécifiques d’entrepôts de données, des sous-ensembles. Parmi ceux-ci, on trouve le Datamart.

Datamart vs data warehouse

datamart tri

Un Datamart est un donc un sous élément du data Warehouse que l’on peut traduire en français par magasin de données ou comptoir de données. Ici le but n’est pas de rassembler des données avant de les trier (la définition du Data Warehouse), mais de les organiser selon des usages métiers ou des domaines ciblés. Ils vont servir à groupes d’utilisateur dans l’entreprise.

Le Datamart rassemble un ensemble de données organisées, ciblées, agrégées et regroupées dans le but de répondre aux besoins des métiers. Techniquement, il est créé à partir d’une base de données relationnelle exploitée à partir du langage informatique SQL et stockée physiquement sur un disque dur par le biais d’un système de gestion de base de données.

Datamart définition : deux écoles de pensée

Ses principes et son fonctionnement sont théorisés par deux spécialistes des sciences informatiques : Bill Inmon et Ralph Kimball.

datamart bill inmon

Bill Inmon, considéré par beaucoup comme le créateur du Data Warehouse, ce chercheur a écrit plus de 40 livres et plus de 1000 articles sur ce sujet. Il définit le Datamart comme un flux de données en provenance du Data Warehouse. Il regroupe de manière fonctionnelle les données spécialisées, agrégées pour un métier en particulier. Dans cette approche, il n’est pas au cœur de l’entrepôt de données, mais en périphérie de ce dernier.

Ralph Kimball, lui aussi et informaticien et chef d’entreprise ayant écrit de nombreux ouvrages sur le datawarehousing. Selon lui, le Datamart est un sous ensemble du Data Warehouse composé de tables détaillées ou agrégées, reliées entre elles. L’idée est de rendre le rendre accessible, rapide et représentatif d’une activité dans une entreprise. Selon Kimball, ce sont les Datamart qui constituent le Data Warehouse.

datamart Ralph Kimball

Ces deux conceptions du Datamart convergent vers une même appréciation de cet item. Il s’agit d’un extrait de l’ensemble des données d’une entreprise, il ne contient que le nécessaire. Les données inutiles sont retirées et l’historisation est réalisée en fonction de la requête de l’utilisateur. Ainsi les métiers ne sont pas perturbés par des données parasites ou contiguës. Deux modèles d’utilisation du Datamart prévalent : l’interrogation des stocks (ou l’historique de l’activité commerciale), ou l’activité en flux (les commandes en direct).

L’architecture conçue sur une base de données relationnelle et la nécessité de mettre en silo les data facilite la rapidité d’accès, mais verrouille les possibilités. Une requête inhabituelle réalisée à partir d’un logiciel d’interrogation de database, par exemple un outil de reporting, ne donnera pas le résultat escompté à moins d’une modification de l’accès à d’autres parties du Data Warehouse.

Les exemples de Datamart

datamart marketing commercial

Plusieurs utilisations de ce type de base de données sont possibles. Trois métiers sont particulièrement concernés : le marketing, le commerce et les ressources humaines.

Datamart marketing et commercial

Ce type de database relationnelle se concentre sur les besoins des responsables marketing dont le travail est d’identifier les prospects et les clients cibles. Avec un tel outil à leur portée, ils peuvent consulter l’ensemble des contacts enregistrés auprès de l’entreprise. Les noms, prénoms, numéros de téléphone, adresses physiques et mails sont quelques-unes des informations consultables. Avec un outil de reporting associé, il peut rapidement savoir qui il a contacté, s’il a réussi à lui vendre un produit, s’il est satisfait, etc. Le tout peut être associé à l’impact des comportements sur le chiffre d’affaires de l’entreprise.

Datamart Ressource Humaines

Ici on utilise les informations concernant les employés pour enregistrer les arrivées et les départs des salariés, l’âge moyen des collaborateurs, les professions représentées, l’ancienneté dans l’entreprise, la rémunération, etc. Cela permet de fournir des statistiques et des rapports facilitant les décisions d’embauche ou de licenciement.

Datamart financier

Cette fois-ci, il s’agit de fournir de la business intelligence concernant la santé financière et administrative de l’entreprise. Le chiffre d’affaires global, par secteur, ainsi que les coûts y sont analysés. De même, les éléments d’audit comme les factures, leurs origines et les bons de commande. On peut y identifier les impayés, les bénéfices, la charge salariale de l’entreprise suivant les flux de données utilisées.

Datamart VS Cube

Les nouveaux utilisateurs de Business Intelligence confondent souvent Datamart et Cube. On les comprend aisément, ce sont deux éléments relatifs aux applications métiers au sein d’un Data Warehouse. Seulement, le premier est un sous-ensemble de cette infrastructure et rassemble toutes les données concernant une activité. Le Cube, lui, permet d’effectuer des requêtes afin de répondre aux questions particulières des métiers. Quelle est l’âge d’une population de travailleur ? quelle est le taux de turnover ? Voilà à quoi va servir cet outil.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Send this to a friend