Accueil > Dossiers > Cloudera Data Platform : tout savoir sur le Cloud de Données d’Entreprise
cloudera data platform

Cloudera Data Platform : tout savoir sur le Cloud de Données d’Entreprise

Cloudera lance la Cloudera Data Platform : une plateforme Cloud entièrement dédiée aux données. Elle permet notamment le Data Warehousing, la gestion et l’analyse de données, mais aussi l’exploitation des données pour le Machine Learning. Découvrez tout ce que vous devez savoir sur cette plateforme, sur ses différentes fonctionnalités, et sur les principaux points forts qui la distinguent de sa concurrence…

En octobre 2018, Cloudera et Hortonworks annonçaient leur fusion. Quelques mois plus tard, en mars 2019, les deux entreprises dévoilaient le fruit de leur alliance : la Cloudera Data Platform, premier cloud de données d’entreprises (Enterprise Data Cloud). Dans le cadre de l’événement annuel Cloudera Strata qui se déroulait cette semaine à New York, la CDP a enfin été lancée.

Cloudera Data Platform : qu’est-ce que c’est ?

La Cloudera Data Platform est une plateforme permettant aux entreprises l’analyse de données grâce à des outils analytiques en libre-service au sein d’environnements hybrides et multicloud. Elle permet aux entreprises de créer des Data Lakes sur le Cloud en quelques heures, afin de valoriser l’ensemble de leurs données.

De nouveaux services Cloud intégrés à la plateforme offrent par ailleurs un accès en libre service aux données et aux fonctions analytiques pour les analystes, les Data Scientists, les professionnels IT et les développeurs. Trois nouveaux services Cloud-Native permettant d’exploiter les données d’entreprise ont déjà été dévoilés par Cloudera.

Cloudera Data Warehouse

Tout d’abord, le service Cloudera Data Warehouse permet de déployer facilement des entrepôts de donnée accessibles en libre-service pour les analystes. Elle permettra notamment de transférer rapidement les workloads sur site vers le Cloud, grâce à sa capacité à ingérer des données à grande échelle en provenance de sources structurées ou non structurées.

Cette Data Warehouse Cloud est basée sur de puissants moteurs SQL testés en entreprise. Des centaines d’utilisateurs pourront accéder aux données en un seul clic, aussi bien sur site que sur le Cloud. Les ressources pourront être scalées à la demande en fonction des besoins, et la gestion des workloads s’effectue également en libre service grâce à des outils intuitifs.

Cloudera Machine Learning

Le service Cloudera Machine Learning, de son côté, permet de déployer aisément des espaces collaboratifs de Machine Learning pour permettre aux Data Scientists d’exploiter les données d’entreprise. A l’aide de cet outil, les entreprises peuvent rapidement déployer de nouveaux workspaces de Machine Learning en quelques clics pour permettre l’accès en self-service aux outils et aux données nécessaires aux workflows d’apprentissage automatique.

La réplication de données sur site ou sur le Cloud s’effectue très rapidement sans pour autant lésiner sur la sécurité et la gouvernance. En outre, les Data Scientists peuvent choisir leurs propres outils tout en profitant de ressources élastiques adaptables à leurs besoins. L’entrainement de modèles, l’ingénierie des données, le déploiement et la gestion des modèles s’effectuent en toute simplicité via une interface tout-en-un, évitant d’avoir à passer d’une plateforme à l’autre.

Cloudera Data Hub

Enfin, le Cloudera Data Hub est un service Cloud-Native de gestion de données et d’analytique. Il permet au service IT et aux développeurs de l’entreprise de créer plus rapidement des applications métier pour tout type de scénario.

Là encore, l’accès en libre-service aux données de l’entreprise est au centre de ce service. Pour les trois services Cloud-Native de la CDP présentés par Cloudera, le self-service, le multi-cloud et la sécurité sont les maîtres mots qui permettent à la plateforme de se démarquer de sa concurrence…

Quels sont les avantages de Cloudera Data Platform face à la concurrence ?

De par son caractère multi-fonction, la Cloudera Data Platform vient concurrencer de nombreux services. Tout d’abord, elle rivalise avec plusieurs services des principaux fournisseurs de Cloud. On peut citer plusieurs composants du portfolio AWS tels que Sagemaker, Red Shift ou EMR. Il en va de même pour Big Query chez Google Cloud ou Microsoft SQL sur Azure.

De même, la CDP aspire à remplacer plusieurs services de vendeurs tiers comme Databricks, Snowflake, Elasticsearch, MongoDB ou Confluent. Selon Fred Koopmans, VP de la société, même si certains de ces services spécialisés seront plus efficaces dans leur domaine, aucun ne peut se vanter d’offrir la polyvalence de la Cloudera Data Platform. Ainsi, Cloudera propose ici une plateforme tout-en-un pour le Big Data.

La CDP propose de multiples fonctionnalités pour faciliter et accélérer le déploiement des principaux types d’applications. Cinq nouvelles expériences en libre-service sont proposées : flow & streaming, data engineering, data warehouse, operational database et Machine Learning.

Outre ce caractère multi-fonctions, la CDP se démarque par son aspect multi-cloud. Les données peuvent être gérées, analysées et utilisées sur site, en Cloud Hybride ou privé, et dans les environnements des principaux fournisseurs de Cloud public. Pour l’heure, seul le Cloud public Amazon Web Services est pris en charge, mais la compatibilité Microsoft Azure est prévue pour la fin 2019. La compatibilité Google Cloud, quant à elle, est attendue pour le courant de l’année 2020. Cette caractéristique offre une flexibilité accrue pour les entreprises.

L’autre point fort de la Cloudera Data Platform est l’importance accordée à la sécurité et à la gouvernance des données. Ses technologies SDX (Shared Data Experience) permettent d’assurer la sécurité, la confidentialité et la conformité des données sur n’importe quel Cloud. Grâce à cet outil, les entreprises peuvent créer des lacs de données sécurisés en quelques heures seulement. De plus, l’écriture de script est remplacée par une interface de configuration intuitive.

Enfin, le dernier grand avantage de la CDP face à sa concurrence est son approche 100% open source pour le calcul, le stockage et l’intégration. Les utilisateurs et les développeurs tiers pourront donc contribuer à l’amélioration de la plateforme, ce qui garantit une innovation rapide et continue. La plateforme est déjà utilisée par plusieurs grands groupes tels qu’Accenture, IBM, Globe Telecom ou GlaxoSmithKline (GSK) qui se disent très satisfaits.

Prix et disponibilité

La Cloudera Data Platform est disponible dès à présent à l’internationale. Elle est déjà compatible avec Amazon Web Services, et la compatibilité avec Google Cloud et Microsoft sera ajoutée dans les mois à venir.

Le tarif de base pour la plateforme et ses différentes déclinaisons débute à 10 000 dollars. Les nouveaux services Cloud Native seront quant à eux facturés à l’heure, à hauteur de 72 cents de l’heure pour le service Data Warehouse, 68 cents de l’heure pour le Machine Learning, et 24 cents de l’heure pour le Data Hub. Vous pouvez consulter tous les tarifs sur la page officielle de Cloudera à cette adresse.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Send this to a friend