Cloudera évoque le futur du Big Data

Cloudera : quel futur pour le Big Data ?

Afin d'explorer et d'anticiper le futur du , le spécialiste Bernard Marr s'est entretenu avec Mike Olson, l'un des fondateurs de . Ensemble, ils tentent de prédire l'avenir de cette nouvelle technologie.

Fondé en 2008, Cloudera fait figure de précurseur dans le domaine du Big Data. À l'époque, ce terme était encore  inconnu de la plupart des entreprises. Seuls les programmeurs en Java œuvrant pour ou Yahoo connaissaient l'existence d'. Aujourd'hui, grâce à sa position de pionnier, Cloudera fournit la technologie Open Source utilisée dans la plupart des projets analytiques de grande envergure. La firme investit également massivement dans le développement de nouveaux outils et applications ouvrant l'accès au plus grand nombre à des technologies comme le Machine Learning, les analyses en temps réel, et à une meilleure utilisation des données non structurées.

C'est après son départ d' que Olson a commencé à travailler au développement d'un logiciel de base de données Open Source avant de s'associer avec d'anciens ingénieurs de Yahoo, et Facebook dotés d'une expérience avec Hadoop. En 2009, Cloudera devient le premier vendeur commercial d'Hadoop. Il participe ainsi à l'explosion de l'usage d'analytiques Big Data dans l'industrie. Grâce à Hadoop, un accès abordable au stockage distribué pour architectures grande échelle est proposé, au même titre que les technologies fondamentales comme MapReduce, indispensables pour un projet Big Data.

Au commencement, Cloudera devait donc s'interroger sur l'utilité du Big Data. L'entreprise devait déterminer pourquoi les données sont importantes, pourquoi elles sont utiles, et surtout pourquoi Hadoop est la meilleure plateforme pour les exploiter.

cloudera

Désormais, tous les analystes savent que le Big Data est l'outil qui va redéfinir le monde de l'entreprise, et toute l'industrie technologique ne parle plus que d'Hadoop. Toutefois, ces technologies existaient déjà sous la forme de deux composants complexes. Le système de fichier HDFS, qui permettait de répartir de larges quantités de données sur des supports de stockages bon marché, et le framework MapReduce permettant de récupérer et de traiter ces données. Cependant, il était nécessaire de développer des outils supplémentaires pour le faire.

La naissance d'un écosystème

Ces dernières années, un riche écosystème s'est formé autour du Big Data, composé d'entreprises comme Cloudera qui vendent Hadoop, mais également de firmes innovant dans les systèmes de stockage, et tentant d'apporter une réelle valeur ajoutée pour leur clientèle.

C'est cet écosystème, et le développement de logiciels Open Source HBase, ou Impala qui a permis l'essor du Big Data et les nombreuses opportunités qu'il offre à présent. Grâce à ces solutions, le Big Data n'est plus uniquement le domaine réservé des experts en statistiques et en sciences informatiques.

Il est également accessible à de nombreux secteurs, tels que l'industrie médicale, dans laquelle il permet de créer de nouveaux traitements. Dans les services financiers, l'analyse de données permet d'empêcher les transactions frauduleuses. Dans l'humanitaire, le Big Data aide à gérer les conséquences des guerres et des catastrophes naturelles.

Les publicitaires l'utilisent pour mieux cibler leurs clients. Les vendeurs aux détails peuvent maintenant proposer de meilleures offres promotionnelles. Par ailleurs, le Big Data permet de résoudre progressivement d'importants problèmes économiques et sociaux. C'est notamment le cas en Colombie où le gouvernement commence à se servir de cette nouvelle technologie.

Des outils pour remplacer le personnel qualifié

Selon Olson, des dizaines de milliers de personnes ont été formées à l'utilisation d'Hadoop. Cependant, il est impossible d'apprendre à toute l'humanité à se servir du Big Data. D'ici peu, de nouveaux outils novateurs permettront de compenser le manque de personnes qualifiées pour l'analyse de données afin de répondre aux besoins des entreprises. Malgré tout, des entreprises comme Cloudera et des Data Scientists qualifiés seront toujours nécessaires pour installer et maintenir une plateforme Big Data répondant aux exigences de qualité de sécurité d'une entreprise.

hadoop

Vers une révolte des particuliers ?

Dans un futur proche, le sort de l'industrie du Big Data pourrait reposer entièrement sur l'opinion des particuliers. Deux options sont envisageables. Les masses peuvent percevoir les avantages à laisser les gouvernements et les entreprises accéder à leurs données, et ouvrir davantage l'accès à leur vie privée en vue d'un meilleur niveau de confort et de sécurité. Au contraire, il est possible que le manque de confiance mène au déploiement d'un effort collectif pour dissimuler le maximum de données personnelles.

La direction empruntée par les particuliers pourrait dépendre d'événements à venir. Par exemple, si Facebook est piraté demain et que toutes les conversations sont publiquement exposées, le Big Data risquerait de devenir la cible de toutes les critiques.

Pour Olson, c'est la raison pour laquelle il est essentiel d'investir massivement dans la sécurité des infrastructures et de construire des mécanismes de protection infaillibles. Toutefois, un dialogue éthique entre les créateurs de données et les organisations qui les collectent est également indispensable. Ce dialogue n'en est encore qu'à ses débuts et doit absolument être pris plus au sérieux.

En résumé, Mike Olson envisage le futur du Big Data comme le développement de nouveaux outils et innovations, et l'ouverture de l'accès à ces solutions analytiques avancées au plus grand nombre. Par ailleurs, il souligne l'importance d'un dialogue éthique entre les développeurs, les industries, les gouvernements et le public au sujet de l'exploitation des données et de la sécurité.

Newsletter

Envie de ne louper aucun de nos articles ? Abonnez vous pour recevoir chaque semaine les meilleurs actualités avant tout le monde.

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *