Accueil > Analytics > Data Analytics > Dark Data : des données précieuses et souvent négligées
dark data

Dark Data : des données précieuses et souvent négligées

Selon IDC et EMC, le monde comportera 40 zettabytes de données d’ici 2020. D’après le sondage Veritas Global Databerg Survey 2016, 85% de ces données seront des Dark Data. À travers cet article, découvrez ce que sont les Dark Data, et comment les exploiter pour améliorer l’activité de votre entreprise.  

D’après Gartner, les Dark Data sont les ensembles d’informations que les organisations collectent, traitent et stockent pendant leurs activités régulières, mais qu’elles échouent généralement à réutiliser. Du point de vue d’une organisation, les Dark Data sont les données qui peuvent ou non être stockées dans des SOR (systems of record).

Il peut s’agir de documents papiers, de photos, de vidéos, ou d’informations négligées car elles ne semblent pas essentielles. Selon Mads C. Brink Hansen, directeur de produit chez TARGIT, spécialiste de la business intelligence et fournisseur de solutions analytiques, les entreprises peuvent découvrir de nouvelles insights si elles parviennent à exploiter ces données.

dark-data-2

Par exemple, une entreprise souhaiter améliorer l’efficacité de ses forces de vente sur le terrain. En analysant les rapports de dépenses de trajets envoyés par ses forces de vente, elle est parvenue à déterminer le nombre de réunions auxquelles chaque employé a assisté. Ce nombre a ensuite été comparé à la quantité de réunions escomptée pour chacun d’entre eux. En l’occurrence, les rapports de trajets et de dépenses ont été réutilisés pour obtenir des insights sur la quantité de réunions auxquelles une force de vente est susceptible d’assister, et quels éléments parvenaient à atteindre cet objectif.

Pour Hansen, les entreprises doivent dévouer autant de temps à explorer les profondeurs des Dark Data qu’à analyser leur Big Data. Toutefois, pour les CIO et autres analystes, il est difficile de convaincre les chefs d’entreprise de financer des projets Dark Data. Ces données inactives sont considérées comme inutiles, et pourraient représenter une importante perte de temps et d’argent.

Comment explorer les Dark Data ?

dark-data-2

Selon Hansen, il existe deux façons d’explorer les Dark Data. La première méthode consiste à explorer toutes ces données dans l’espoir de trouver des insights capables de transformer l’activité de l’entreprise. La seconde est de définir des objectifs spécifiques, pour ensuite entamer une exploration de ces données pour vérifier si elles peuvent permettre d’atteindre ce but.

La meilleure approche est celle orientée vers des résultats concrets pour l’activité. Cette approche permet également d’abandonner les recherches si aucun résultat n’est obtenu après un certain temps. Pour explorer ces données, Hansen et son entreprise utilisent une combinaison de requêtes et d’algorithmes de données.

Les outils de requête permettent aux utilisateurs dépourvus de compétences en science des données d’explorer les Dark Data. Ces outils permettent également aux analystes de données de développer des algorithmes avec des langages comme R.

Exemple d’utilisation des Dark Data

dark-data-tableau

Toujours d’après Hansen, la meilleure façon d’approcher les Dark Data est « d’arpenter le sol ». Selon lui, il est plus que probable que les analystes d’une entreprise aient déjà développé leurs propres bases de données pour enregistrer les activités et les trier en bassins de Dark Data, sans même que les départements informatiques ne soient au courant. Si les Dark Data sont correctement appliquées à des points précis de l’activité, il est possible de trouver des insights utiles

Pour y parvenir, tout est question de méthodologie. Par exemple, les gérants de l’entrepôt d’une entreprise remarquent un nombre important de retours sur un produit particulier. Ils enregistrent cette information, mais ne savent pas pourquoi ce produit a été retourné, si ce n’est qu’il ne fonctionnait pas, aux dires des consommateurs.

Les produits sont alors renvoyés à l’usine pour être retravaillés, et l’entreprise se rend compte qu’un contact électrique tombe en panne systématiquement. L’usine remplace ce contact défectueux, et le produit est à nouveau mis en vente. L’usine conserve une base de données des activités de réparation.

Malheureusement, le problème de faux contact n’est jamais communiqué à un ingénieur. Or, le produit pourrait alors être repensé afin de supprimer le problème et éliminer les retours, la déception du consommateur, et la chute des marges de profit. C’est pourquoi il est important d’explorer les Dark Data.

A lire également

data visualization top meilleurs outils

Data Visualization : top des meilleurs outils de visualisation de données

Il est parfois difficile de présente des données de façon compréhensible à des personnes qui ne …

Send this to friend