La plateforme Project Dataworks de IBM

IBM DataWorks : une plateforme pour tous les types de données !

Le New Yorkais IBM présente sa nouvelle plateforme Project DataWorks, regroupant les fonctionnalités d’Apache Spark et la technologie de Machine Learning Watson. Grâce à ce projet, il sera possible d’analyser et de traiter tous les formats de données depuis une seule et même plateforme. 

Dans le domaine du Big Data, il existe un problème bien connu des analystes. Lorsque deux ensembles de données doivent être fusionnés, il arrive que leurs formats soient complètement différents et incompatibles. La fusion nécessite plus de temps et plus d’argent pour être réalisée correctement.

Le problème serait résolu si tous ces ensembles de données étaient au même format, stockés au sein d’un dossier central. Tous les employés de l’entreprise pourraient accéder à ce dossier pour extraire, filtrer ou analyser les données en provenance des différents départements.

Une plateforme pour traiter tous les formats de données

ibm-bluemix

Avec sa nouvelle plateforme Project DataWorks, IBM compte harmoniser le paysage du Big Data afin de permettre cette facilité d’accès et de manipulation des données. Une initiative qui devrait simplifier la vie des analystes et réduire les charges des entreprises.

Le Project DataWorks fait partie de Bluemix, la fameuse plateforme Cloud d’IBM. Le projet repose sur les capacités de Machine Learning d’Apache Spark, afin d’effectuer de nombreuses tâches automatiquement sur le Cloud. Selon la firme, DataWorks peut traiter des données en provenance de n’importe quel type de source : objets connectés, réseaux sociaux, bases de données…

Plusieurs centaines de Go par seconde

ibm-watson

La technologie de Machine Learning Watson d’IBM aide également DataWorks à traiter les informations plus rapidement. La vitesse pourrait atteindre plusieurs centaines de giga-octets par seconde. Cette rapidité devrait permettre aux entreprises d’obtenir des réponses à leurs requêtes en un temps record.

La vitesse n’est pas le seul atout de DataWorks. Comme évoqué précédemment, son objectif principal est d’offrir au Big Data un format universel. IBM compte supprimer les silos de données, les incompatibilités et les données non gouvernées. La plateforme a été testée par RSG Media, une entreprise d’analyse dédiée aux industries des médias et du divertissement. Selon IBM, RSG a pu permettre à un réseau de clients d’économiser 50 millions de dollars grâce à DataWorks. Ces économies ont été réalisées grâce à une meilleure efficacité dans l’analyse des données relatives aux préférences du public.

DataWorks va permettre de réduire le temps de préparation des données

bob-picciano

Selon Bob Picciano, senior vice-président d’IBM Analytics, le Big Data est arrivé à un point d’inflexion. Les utilisateurs passent 80% de leur temps à préparer les données. Peu importe la tâche, et même lorsqu’ils appliquent l’intelligence artificielle la plus sophistiquée. Pour cause, il n’existe aucune plateforme standard.

Grâce à IBM et sa plateforme DataWorks, ce temps de préparation pourrait être réduit considérablement grâce à la possibilité de traiter tous les types de données. Les analystes et les professionnels pourront ainsi obtenir des résultats bien plus rapidement qu’autrefois.

Dans un monde dirigé par les données, où la quantité de données va continuer à s’accroître, la standardisation de l’industrie Big Data est devenue nécessaire. Les entreprises pourront devenir plus agiles, exploiter les données de façon optimisée, et la plateforme d’IBM n’est probablement qu’une première étape vers cette évolution