Accueil > Analytics > Data Analytics > Open Data : The Linux Foundation veut ouvrir le Big Data
cdla linux open data

Open Data : The Linux Foundation veut ouvrir le Big Data

Afin de faciliter l’assemblage et le partage d’ensembles de données Big Data, The Linux Foundation a créé un Framework Community Data Licence Agreement. L’objectif de ce Framework est d’appliquer le concept de l’open sourcing au Big Data, et de standardiser la législation autour du partage de données ouvertes. 

Dans le domaine des programmes informatiques, l’open source a permis de transformer la façon dont les logiciels sont codés. À présent, The Linux Foundation compte appliquer le même concept aux données avec son nouveau framework Community Data Licence Agreement (CDLA). Cette nouvelle famille de licences Open Data vise à soutenir les communautés collaboratives dans leurs efforts de curation et de partage des données ouvertes.

Plus précisément, ces licences permettent aux individus et aux entreprises de partager des données aussi facilement qu’elles partagent du code open-source. Elles vont permettre de former facilement des communautés pour assembler et maintenir des ensembles de données Big Data. A terme, les entreprises pourront ainsi créer de nouvelles applications basées sur les données.

Grâce à des programmes Open Source comme Hadoop, Spark et MongoDB, il est déjà possible de transformer des données non structurées en informations précieuses. Désormais, le défi consiste à assembler les données de manière à ce que ces outils les analysent. Les licences CDLA vont aider à atteindre cet objectif.

Par exemple, si les fournisseurs, constructeurs automobiles, et les services d’infrastructure civile peuvent partager des données, ils pourraient être en mesure d’améliorer la sécurité, de réduire la consommation d’énergie et d’améliorer la maintenance prédictive. Alors que les voitures autonomes s’apprêtent à transformer l’industrie automobile et à générer des petabytes de données, les données ouvertes pourraient être très utiles.

Open Data : la législation du partage de données enfin standardisée

Par ailleurs, les licences CDLA vont permettre de formaliser la législation autour du partage de données. Jusqu’à présent, chaque accord de partage de données était unique. Les CDLA pourront être très utiles pour les entreprises et les avocats afin de gérer et d’utiliser les licences de données. Pour parvenir à trouver le meilleur terrain d’entente, et conformément à la tradition de la communauté open source, la Linux Foundation a utilisé un processus collaboratif.

On dénombre deux types de licences CDLA. La licence de partage encourage le retour de données en guise de contribution à la communauté. Cette licence devrait permettre d’accélérer le développement de nouvelles technologies informatiques comme le Machine Learning grâce à la collaboration massive. La licence permissive n’oblige aucunement les utilisateurs des données à contribuer à leur tour.

Open Data : le CDLA reste agnostique quant à la confidentialité des données

Les CDLA visent à répondre aux besoins des entreprises, organisations et communautés qui disposent aussi de données précieuses à partager. Dans la pratique, ces licences permettront aux producteurs de données de partager leurs données avec un meilleur contrôle de ce qu’en font les destinataires. Les Data Communities pourront également profiter de ce nouveau standard qui trouve le juste milieu entre les besoins des producteurs et des utilisateurs de données. Enfin, les utilisateurs de données pourront trouver de nouvelles données et profiter de licences stipulant clairement leurs droits et leurs responsabilités à l’égard de ces données.

En ce qui concerne la confidentialité des données, le CDLA est agnostique. Il incombe aux producteurs de données de créer leur propre structure de gouvernance pour déterminer ce qu’ils publient et comment en fonction des différentes lois. Pour cause, le CDLA est pensé pour pouvoir être utilisé partout dans le monde. Il n’est donc pas possible de le conformer à une juridiction particulière. Ce Framework a donc ses limites, mais constitue une avancée majeure pour le Big Data et la technologie de manière générale.

Send this to a friend