Databricks lance Delta Sharing un outil de partage de données open source

Ça y est. Le cinquième projet open source de Databricks est lancé ! Delta Sharing permet aux fournisseurs de partager leurs données avec des serveurs et logiciels cloud. Toutefois, pour pouvoir en bénéficier, ces derniers doivent posséder le connecteur adéquat. Ce lancement de produit n’est qu’un avant-goût du projet Delta Lake de Databricks.

Databricks avance la solution au partage de données

D’après Ali Ghodsi, directeur général de Databricks, les outils propriétaires auraient du mal à résoudre le problème de transfert de données d’un point à un autre. Dans la mesure où les données explosent aujourd’hui, « le principal obstacle à surmonter pour les organisations avec les données est le partage des données, le partage entre différentes vues, le partage entre les organisations – c’est le problème numéro un que rencontrent les organisations ».

Delta Sharing serait pourtant apte à résoudre ce problème. En effet, « il s’agit du tout premier protocole ouvert de l’industrie, une norme ouverte pour partager un ensemble de données en toute sécurité. […] Ils peuvent standardiser sur Databricks ou autre chose. Par exemple, ils peuvent avoir normalisé l’utilisation d’AWS Data Exchange, de Power BI ou de Tableau – et ils peuvent ensuite accéder à ces données en toute sécurité. »

Quels sont les attributs de Delta Sharing de Databricks ?

En premier lieu, il s’agit d’un outil capable de travailler avec de nombreux services SaaS et infrastructures cloud. L’on entrevoit alors l’implication de plusieurs partenaires dans le processus. Parmi ces derniers, l’on retrouve par exemple des fournisseurs de services cloud de type Google, Microsoft ou Amazon. Font également partie des partenaires : Nasdaq, S&P, Foursquare, Collibra, Alation, Qlik et Starburst.

Profitez de 2 To à vie de stockage en ligne avec pCloud

Cette ouverture serait, selon Ghodsi, une des clés qui fera le succès de ce projet. En se confiant par exemple à la fondation Linux, celui-ci s’assure du fonctionnement de Delta Sharing au sein de différents environnements. Quant aux collaborations réalisées avec les entreprises de renom, elles constituent un autre volet essentiel. Cela augmente les chances de succès vis-à-vis de tous les services proposés au consommateur. Malgré l’existence d’une multitude de connecteurs, Databricks espère que les contributeurs en créeront davantage au fil des ans.

Comment fonctionne Databricks ?

Tout comme Snowflake, le même modèle de tarification à la consommation est utilisé chez Databricks. Cela traduit que ses revenus sont étroitement liés aux données que vous décidez de déplacer dans son logiciel. Cependant, l’avantage de Delta Sharing, c’est que vous serez autorisé à partager vos informations avec qui vous voulez et non uniquement un client Databricks. Ghodsi soutient dans son communiqué que malgré la flexibilité offerte aux clients de pouvoir déplacer les données, cela ne déteint pas sur la finance de son entreprise.