La conférence Strata + Hadoop World 2016

Strata + Hadoop World 2016 : la conférence Big Data la plus importante de l’année

La semaine dernière, tous les principaux acteurs de l’industrie du Big Data étaient réunis à New York, dans le cadre de la conférence Strata + Hadoop World. L’occasion pour les entreprises de présenter leurs nouvelles technologies à un public composé de plus de 7000 personnes. 

De nombreuses personnalités influentes de l’analytique ont tenu leur keynote, afin de présenter leur vision du futur du Big Data, du Machine Learning, de l’internet des objets, des véhicules autonomes ou des Smart Cities. Parmi ces personnes, on compte notamment le Data Scientist en chef de la Maison Blanche, DJ Patil.

L’essor de l’Open Data grâce à Barack Obama

dj-patil

Ce dernier s’est exprimé sur sa mission de « libérer de manière responsable le pouvoir des données pour le bénéfice de tous les Américains ». Le Big Data a par exemple fortement aidé à réduire la consommation excessive d’opiacés. Patil est également revenu sur l’importance de l’ouverture des données

Selon lui, lorsque Barack Obama est arrivé au pouvoir, il y avait environ 10 ensembles de données ouvertes disponibles. Aujourd’hui, on en compte plus de 2000. Grâce à l’actuel Président des États-Unis, toutes les entreprises peuvent ainsi utiliser les données pour développer de nouvelles stratégies et des technologies pour les concrétiser

Intel et l’intelligence des données

intel-strata

De son côté, Martin Hall, Data Scientist en chef des solutions Big Data d’Intel, a abordé l’essor du Big Data. Grâce à l’intérêt massif pour cette technologie, il est désormais possible d’ajouter « l’intelligence » aux données, aux outils d’analyse et à la puissance informatique permettant de délivrer plus d’informations.

Avec l’arrivée de la médecin personnalisée, des voitures autonomes, des objets connectés, nous sommes désormais entrés dans l’ère de l’intelligence artificielle. Les objets connectés offrent toujours plus de possibilités d’automatisation, et s’apprêtent à transformer nos vies, notre façon de travailler, et nos interactions et communications avec le reste du monde.

Cette conférence a permis de confirmer que l’analyse de streaming de données en temps réel fait désormais pleinement partie du paysage de la science des données. Le moteur open source Apache Kafka dirige cette transition, et les acteurs majeurs du marché affichent tout leur soutien à cette technologie.

Cloudera Hadoop passe en version 5.9

cloudera-hadoop

L’un des principaux vendeurs de plateformes open source, Cloudera, a annoncé l’arrivée prochaine de la version 5.9 de sa distribution Hadoop. Celle-ci embarquera Spark 2.0 pour la première fois, aux côtés d’Apache Kudu, conçu spécifiquement pour l’analyse en temps réel.

Sa distribution sera également compatible avec l’infrastructure cloud Microsoft Azure, en plus d’AWS et Google Cloud. Un nouveau modèle pay-as-you-go va également être proposé, parallèlement au modèle d’abonnement annuel actuellement en vigueur.

IBM impressionne avec son robot Marvin

ibm-marvin

Le robot Marvin d’IBM a permis de divertir les foules en jouant à pierre, feuille, ciseaux. Son taux de victoire en forte augmentation a démontré la capacité des ordinateurs à prédire notre comportement.

Marvin fonctionne grâce à Apache Spark. Par ailleurs, IBM a annoncé une nouvelle initiative baptisée Project Dataworks, combinant les fonctionnalités d’Apache Spark et Watson.

SAP part à la conquête du Cloud

altiscale

De son côté, SAP est revenu sur sa récente acquisition d’Altiscale, startup californienne du Big Data. Ce rachat permettra d’améliorer le service Cloud de SAP, en offrant par exemple un accès aux services Spark. La firme a également montré son moteur de requête Vora, capable d’utiliser le Machine Learning pour améliorer les opérations Big Data dirigées par l’IA.

Une fois de plus, la conférence Strata + Hadoop World s’est montrée riche en nouveautés pour l’industrie du Big Data. Cette édition 2016 montre que l’événement est l’un des plus importants pour le marché mondial des analyses de données.