oracle cloud data science platform

Oracle ajoute le Machine Learning et la Data Science à son Cloud

Près de quatre ans après les autres géants du Cloud, Oracle ajoute enfin des fonctionnalités de Data Science et de Machine Learning à sa plateforme Cloud. Malgré son retard, la firme se distingue par plusieurs points forts…

Afin de gagner en compétitivité sur le marché du nuage, Oracle vient d’ajouter des fonctionnalités de Data Science et de Machine Learning à son infrastructure Cloud. Avec la  » Cloud Data Science Platform « , de nouveaux services vont venir enrichir l’offre du géant américain.

Cette plateforme regroupe un Data Catalog, des services de Machine Learning, ou encore des distributions Hadoop et Apache Spark pour l’OCI (Oracle Cloud Infrastructure). Des notebooks Jupyter permettent le développement et le déploiement de modèles de Machine Learning.

Les développeurs et les Data Scientists peuvent créer une session de notebook, à savoir un environnement de développement lancé en surcouche de machines virtuelles et de stockage en bloc. Une session est créée au sein d’un Virtual Cloud Network (VCN), et peut accéder ax données en provenance de l’Autonomous Data Warehouse (ADW).

Les scientifiques des données peuvent utiliser des bibliothèques populaires comme Pandas pour récupérer des données en provenance de l’Autonomous Data Warehouse et effectuer des analyses ou générer des visualisations à partir de ces données. Ainsi, les utilisateurs peuvent effectuer les analyses prédictives au plus près de leur Data Warehouse.

Les algorithmes de Machine Learning, quant à eux, sont intégrés avec l’Oracle Autonomous Database avec la prise en charge nouvelle de Python et d’AutoML. Ainsi, les Data Scientists pourront développer des modèles en utilisant à la fois des algorithmes Open Source et des algorithmes in-database.

Grâce aux capacités AutoML ajoutées à la plateforme, la sélection et le paramétrage des algorithmes peuvent être automatisés à travers l’automatisation des tests d’algorithmes et la configuration des hyperparamètres. La sélection automatisée de fonctions prédictives simplifie l’ingénierie des fonctions en identifiant automatiquement les caractéristiques prédictives sur les ensembles de données les plus larges.

Les utilisateurs peuvent choisir le modèle qui leur convient, à partir d’un procédé d’évaluation utilisant différentes mesures. Oracle met aussi l’accent sur l’explicabilité des modèles, avec une explication automatisée de l’importance des différents facteurs influents sur la génération d’une prédiction.

Oracle se distingue par l’intégration AutoML, l’explicabilité et les fonctionnalités de collaboration

Selon Oracle, cette plateforme est la première à offrir des explications  » model-agnostic « . Un Data Scientist pourra par exemple expliquer quels sont les principaux facteurs de fraude pris en compte par un modèle de détection de fraude, afin que l’entreprise puisse modifier ses processus ou prendre des mesures de sécurité.

La Oracle Cloud Data Science Platform inclut aussi les machines virtuelles dédiées à la Data Science de l’Oracle Cloud Infrastructure, et l’Oracle Big Data Service basé sur une implémentation Cloudera Hadoop complète.

Un Data Catalog permet aux utilisateurs de découvrir, de trouver, d’organiser, d’enrichir et de suivre des assets sur Oracle Cloud. En outre, Cloud SQL permet les requêtes SQL sur les données dans HDFS, Hive, Kafka, NoSQL et Object Storage.

Avec cette plateforme, Oracle ne fait que rattraper un important retard sur les autres géants du Cloud. En effet, AWS, Azure, Google Cloud et IBM proposent des services de Machine Learning depuis 2016. Cependant, Oracle affirme que sa plateforme sort du lot grâce à des fonctionnalités dédiées à la collaboration et une intégration étroite avec les nombreuses sources de données disponibles sur OCI…

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Pin It on Pinterest