Accueil > Analytics > OLAP : définition d’une technologie d’analyse multidimensionnelle
olap online analytical processing définition fonctionnement fonctionnalités solutions prix

OLAP : définition d’une technologie d’analyse multidimensionnelle

OLAP, acronyme de Online Analytical Processing, est une technologie permettant d’effectuer des analyses de données multidimensionnelles au sein de bases de données créées à cet effet. Découvrez la définition de l’OLAP informatique, son fonctionnement, son utilité, ses avantages, les différentes solutions du marché et leur prix.

Le OLAP, ou Online Analytical Processing, est une technologie de traitement informatique (computer processing). Elle permet à un utilisateur de consulter et d’extraire facilement les données pour les comparer de différentes façons. C’est un outil inscrit dans analysis services d’aide à la décision bien pratique pour une entreprise. Les données OLAP sont stockées sur une base multidimensionnelle, aussi appelées Cubes OLAP, pour faciliter ce type d’analyses. Un serveur OLAP est nécessaire.

Les bases de données multidimensionnelles considèrent chaque attribut d’une donnée comme une dimension « séparée ». Le logiciel peut ensuite localiser l’intersection des dimensions et les afficher. Il est ainsi possible d’analyser et de comparer les données de différentes façons. Les attributs peuvent aussi être séparés en plusieurs sous-attributs. Les bases de données multi-dimensionnelles s’opposent aux bases de données relationnelles à deux dimensions.

OLAP ou Online Analytical Processing : concrètement, comment fonctionnent les bases de données multidimensionnelles ?

Les systèmes OLAP permettent donc aux entreprises d’effectuer une analyse rapide de leurs données. Prenons pour exemple d’entreprise un food-truck qui sillonne les villes de France pour vendre ses burgers. Afin d’examiner ses performances, l’entreprise peut par exemple utiliser l’Online Analytical Processing pour afficher le nombre de cheeseburgers qu’elle a vendu à Paris au mois de janvier 2018. Elle peut ensuite comparer ce nombre avec le nombre de burgers vendus au mois de décembre 2017, ou encore avec le nombre de burgers au bacon sur la même période.

La base de données multidimensionnelle considère chaque attribut, tel que le produit, les régions géographiques, ou la période temporelle comme une dimension. L’intersection des dimensions est par exemple la quantité de cheeseburgers vendus à Toulouse au dessus d’un certain prix pendant une période spécifique. En guise d’exemple de sous-attribut, on peut citer les différentes périodes de temps.

olap fonctionnement

OLAP ou Online Analytical Processing : à quoi ça sert ?

L’OLAP peut être utilisé pour le data mining (forage de données) ou encore pour la découverte de relations entre les données. Une base de données OLAP n’a pas besoin d’être aussi large qu’une Data Warehouse, (entrepôts de données en Français) car les analyses de tendances ne requièrent pas toutes les données transactionnelles.

En utilisant ODBC (Open Database Connectivity), il est possible d’importer des données en provenance de bases de données relationnelles existantes afin de créer une base de données multidimensionnelle ou database pour l’OLAP. Ainsi, il permet de comparer des données en provenance de plusieurs bases de données. C’est particulièrement utile pour les professionnels du Business Intelligence.

L’OLAP permet aussi l’analyse de tendances, les calculs complexes, et le data modeling. Il est à la base de nombreuses applications pour le Business Perfomrance Management, la prévision, le budgeting, la planification, le reporting financier, l’analyse, les modèles de simulation, la knowledge discovery et le Data Warehouse Reporting.

OLAP Cube définition : qu’est-ce que c’est ?

olap cube définition

Un cube OLAP est une base de données multimensionnelle optimisée pour les Data Warehouses et les applications OLAP. Il s’agit d’une méthode permettant de stocker les données sous forme multidimensionnelle, notamment pour le reporting. En général, ces cubes sont pré-résumés pour accélérer le temps de requête par rapport aux bases de données relationnelles.

Pour effectuer des requêtes au sein des cubes OLAP, on utilise le langage MDX (multimensional expressions). Ce langage fut développé par Microsoft à la fin des années 1990 avant d’être adopté par les autres vendeurs de bases de données multidimensionnelles.

Les cubes sont conçus pour pouvoir être utilisés par tous les employés de l’entreprise, et non uniquement par les responsables de division informatique. Ils sont capables de rapporter des millions d’enregistrements en une seule fois.

OLAP : quels sont les différents types de systèmes ?

 

On dénombre différents types de systèmes. Les principaux sont MOLAP et ROLAP.

MOLAP : Multidimensional Online Analytical Processing

Les produits MOLAP permettent aux utilisateurs de modéliser les données au sein d’un environnement multidimensionnel, plutôt que de fournir une vue multimensionnelle de données relationnelles comme le font les produits ROLAP.

La structure d’un modèle multimensionnel n’est pas une série de tableaux, comme c’est le cas dans une base de données relationnelle. Ces modèles reposent sur les cubes OLAP, dont chaque cellule représente une intersection de dimensions. Le problème des outils MOLAP est que les données doivent être transférées à partir de systèmes relationnels, et peuvent donc être potentiellement redondantes. Par ailleurs, les MOLAP sont souvent des systèmes propriétaires, nécessitant un apprentissage complet et un déploiement de la part des responsables informatiques. Un bon exemple de MOLAP est le PowerOLAP de Paris Tech.

ROLAP : Relational Online Analytical Processing

Les produits ROLAP – c’est à dire relational OLAP – permettent d’accéder directement aux données stockées dans les bases de données relationnelles. Ainsi, les entreprises peuvent directement exploiter leurs SGBDR déjà en place. On effectue les requêtes avec un produit ROLAP en utilisant le langage SQL.

Le problème des produits ROLAP est qu’ils sont trop dépendants du SQL. Or, ce langage est limité est souvent inflexible grammaticalement. Un autre inconvénient est que les données doivent être extraites et reformatées avant de pouvoir effectuer une requête.

HOLAP : Hybrid Online Analytical Processing

Les produits HOLAP combinent les meilleures fonctionnalités du MOLAP et du ROLAP dans une seule architecture. Ainsi, ces produits corrigent les inconvénients de ces deux types de produits. Ils peuvent être utilisés aussi bien sur une base de données multidimensionnelle que sur une base de données relationnelle.

Les systèmes HOLAP peuvent stocker de plus grandes quantités de données, offrent une meilleure scalabilité, des traitements de données rapides, et une flexibilité pour l’accès aux sources de données. En revanche, leur caractère hybride implique aussi qu’ils partagent les faiblesses du MOLAP et du ROLAP.

HTAP : Hybrid Transaction / Analytical Processing

Le terme HTAP a été inventé en 2014 par Gartner. Ce terme décrit les systèmes in-memory data permettant d’effectuer à la fois des traitements OLAP (online analytical processing) et OLTP (online transaction processing). Le HTAP repose sur un traitement plus puissant, plus récent, généralement distribué.

Il nécessite souvent de nouveaux appareils et toujours une nouvelle plateforme logicielle. Cette technologie est logée dans la base de données relationnelle, et il n’y a plus de réplication de données puisque les informations transactionnelles font désormais partie du modèle analytique.

D’autres distinctions existent, mais sont principalement utilisées par les vendeurs pour se distinguer de la concurrence. C’est le cas de SOLAP, DOLAP, WOLAP et Mobile OLAP.

OLAP (Online Analytical Processing) vs OLTP (Online Transaction Processing) : quelles sont les différences ?

olap vs oltp différences

Les systèmes informatiques sont divisés entre deux catégories principales : OLTP (transactionnel) et OLAP (analytique). Les systèmes OLTP sont généralement des sources de données pour les Data Warehouses, tandis que les systèmes Online Analytical Processing permettent d’analyser les données.

Les OLTP rassemblent des données opérationnelles permettant de contrôler et d’effectuer les tâches fondamentales des entreprises. Il s’agit de la source originelle de données. Ces données révèlent un snapshot des processus en cours. Les requêtes sont standardisées et la vitesse de traitement est généralement très rapide. Si les données historiques sont archivées, très peu d’espace est nécessaire.

De leur côté, les Online Analytical Processing rassemblent des données en provenance de diverses bases de données OLTP. Ces données permettent de planifier, d’aiguiller des décisions ou de résoudre des problèmes. Elles offrent une vue multidimensionnelle des différentes activités de l’entreprise. Les requêtes sont souvent complexes, et impliquent des agrégations de données. La vitesse de traitement dépend de la quantité de données, et peut prendre des heures. L’espace nécessaire est plus important à cause de structures d’agrégation et de données historiques.

OLAP ou Online Analytical Processing : quelles sont les meilleures solutions, quels sont les prix ?

Parmi les différentes solutions disponibles sur le marché, on compte deux solutions principales. Il s’agit d’Hyperion Solution Essbase, et Oracle Express Server, tous deux appartenant à Oracle. 

Les produits OLAP sont généralement conçus pour des environnements regroupant plusieurs utilisateurs. De fait, le coût des logiciels dépend du nombre d’utilisateurs. Il faut également prendre en compte le coût du serveur associé. Par exemple, une entreprise comme SAS propose des offres de serveurs. L’entreprise dispose de facilité de paiement pour les sociétés âgées de minimum deux ans, employant 10 personnes et qui dépensent au moins 5000 dollars.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Send this to a friend