dataworks data steward studio scott gnau
Scott Gnau, CTO d'HortonWorks présentait Data Steward Studio.

Data Steward Studio : HortonWorks renforce son offre Data Governance

Lors de son salon DataWorks de Berlin, HortonWorks a profité de la journée du 17 avril pour présenter les nouveautés de sa plateforme de Global Data Management, Hortonworks DataPlane Service. Après Data Lifecycle Manager, Data Steward Studio est le second service extensible qui sera disponible sur la plateforme. Il permet d’évaluer le niveau de sécurité et d’assurer la traçabilité des données.

Dans deux mois sera appliqué le règlement général européen sur la protection des données. Les sanctions et les questions posées par la mise en place du GDPR provoquent des réactions plus ou moins rapides au sein des fournisseurs de technologies Big Data. À cela s’ajoutent différentes polémiques qui touchent des entreprises comme Facebook et Cambridge Analytica.

Un contexte de régulation tendu pour les entreprises selon HortonWorks

Afin de rassurer leurs clients, les entreprises ont besoin de mettre en place une politique de gestion globale des données. Et pour cela, elles ont besoin d’outils leur permettant de répondre aux besoins de sécurité et de traçabilité. Cela permet sur le papier de faciliter les décisions stratégiques, puisque les données utilisées dans ces processus sont en principe sécurisées.

Restez en sécurité avec le Leader Mondial du VPN !

Techniquement, cela demande d’avoir une vision globale des données stockées sur site, dans le Cloud et dans les différents clusters, datalakes d’une entreprise. Pour rappel, en cas de faille de sécurité, les entreprises devront prévenir les autorités en moins de 72 heures. HortonWorks propose pour sa part la solution Data Steward Studio.



Connu pour être l’un des premiers distributeurs d’Hadoop, HortonWorks avait déjà lancé l’année dernière sa plateforme de gestion globale des données : DataPlane Service. Cette dernière profitait déjà du service Data LifeCycle Manager qui permet sur le papier de gérer le cycle de vie des données au regard des politiques centrales de gouvernance, d’organiser la récupération et la sauvegarde des données, de gérer la redondance des données, ainsi que de hiérarchiser ces opérations.


Data Steward Studio : un nouvel outil conçu pour la Data Governance

dataworks data steward studio

Avec le deuxième module Data Steward Studio (DSS), la présentation d’HortonWorks au DataWorks se concentrait sur la validation des données stockées au sein de la totalité de l’infrastructure Big Data. Que ce soit on premice ou dans le Cloud, Data Steward Studio permet d’évaluer le niveau de confiance des données, en les cherchant, en les organisant, en les cataloguant suivant leur niveau de criticité (assets économiques ou données personnelles), et en retraçant leurs parcours dès leur création. HortonWorks insiste également sur la sécurisation des données et des métadonnées.

L’outil de la firme basée à Santa Clara repose sur deux sets de services Open Source : Apache Atlas et Apache Ranger. Le premier cité est un framework de Data governance et de gestion de métadonnées pour Hadoop, tandis que le second permet la sécurisation des données au sein de la plateforme Hadoop et de ses différentes versions, comme celle d’HortonWorks.

Une première démo est disponible dès maintenant. Data Steward Studio sera officiellement disponible au deuxième semestre 2018. Certains pourraient penser que l’entreprise intervient tardivement en proposant un outil en direction du GDPR à deux mois de son application, le 25 mai 2018. Mais comme l’a rappelé Abhas Ricky director of strategy of innovation chez HortonWorks, « 65 % des entreprises ne seront pas prêtes pour le GDPR en mai. De plus, 90 % de ces retardataires déclarent qu’ils auront appliqué le règlement un an plus tard ».