Accueil > Analytics > Tour de France : il rentre dans l’ère du Machine Learning et du Big Data
tour de france big data une

Tour de France : il rentre dans l’ère du Machine Learning et du Big Data

Depuis deux ans, le Tour de France est rentré dans l’ère du Big Data grâce à la société Dimension Data. Cette année les deux partenaires vont plus loin en passant au machine learning. Explications.

Il est loin le temps des Poulidor, Anquetil, ou Hinault, le Tour de France a bien changé. La compétition préférée des amateurs de cyclisme a suivi les évolutions technologiques de ces vingt dernières années pour finalement devenir le terrain d’essai de nouvelles technologies en passe de s’imposer dans le monde du sport et de l’industrie.

Depuis 2015, le groupe Amaury, l’organisateur du Tour de France et propriétaire du média l”Equipe, fait appel à la société sud-africaine Dimension Data pour fournir des données détaillées sur la tenue de l’événement.

Le Tour de France, gourmand en infrastructure

Pour ce faire, les deux entreprises mêlent Big Data, Cloud Computing et Internet des Objets. Concrètement, les données sont remontées depuis des transpondeurs GPS situés sous les selles et les gyroscopes dans les pédales des coureurs. Pour assurer, une connectivité maximale, les capteurs fonctionnent en réseau maillé : ils sont interconnectés pour que les informations soient relayés à la voiture de course, puis à l’hélicoptère jusqu’au camion technique situé en fin d’étape. Cette logistique, gérée en grande partie par Amaury Sport Organisation et la chaîne TV Eurosport, est importante à détailler pour comprendre le type de traitement de données effectuées lors du Tour de France.

Les quelques 19 Gigaoctets récoltés par jour sont envoyés sur le Cloud de Dimension Data qui s’occupe de la partie analytique afin de mettre à jour les informations de la compétition toutes les secondes. Le tout est retranscrit par le biais d’une data visualisation sur le site officiel du tour de France et sur FrancetvSport.

Il faut ajouter à la géolocalisation des coureurs, leur espacement et leurs vitesses en temps réel, les tracés des étapes, le classement des coureurs, les flux des réseaux sociaux, les photos et les vidéos accessibles pendant et après les étapes.

Suivre la compétition à l’aide du Big Data

tour de france donnee

Bref, Il ne s’agit pas seulement pas d’informer les téléspectateurs du temps et des kilomètres restants, mais de leur fournir à eux, aux organisateurs et aux responsables des 22 équipes des données cruciales sur le déplacement des 198 coureurs engagés lors de cette 104e édition d’une longueur de 3540 kilomètres.

Ce ne sont pas moins de 150 millions de données géospatiales et environnementales qui sont traitées pour obtenir une expérience dite de “Data Driven Story”, c’est-à-dire le fait de raconter une histoire avec les données. Par ailleurs, l’entreprise, partenaire officiel du tour de France, prévoit la création de trois milliards de points de données.

Le Machine Learning entre en scène en 2017

tour de france big data

Cette année, Dimension Data est allé plus loin. L’entreprise, qui dispose de sa propre équipe de cyclistes sur le tour, a intégré dans son offre un outil de machine learning. Grâce aux algorithmes qu’elle a composés à d’autres fins, l’ESN fait converger les informations de la journée en cours avec les étapes précédentes pour prédire les vainqueurs d’étape.

Selon les propos recueillis par Forbes France, sur la première semaine, Dimension Data a été capable de deviner 5 des sept vainqueurs d’étape.
Pour l’instant, ces résultats ne sont pas rendus publics, mais il s’agit là d’une expérience qui pourrait se démocratiser à l’avenir. Ce serait alors une véritable aubaine pour les amateurs de paris sportifs qui pourraient s’essayer aux paris prédictifs. Cela intéresse forcément les organisateurs de ces jeux d’argent comme la PMU ou le site Bwin qui tiennent les paris depuis le début de la compétition.

Les limites du prédictif : l’heureux hasard du Tour de France

dimension data tour de france big data

Il y a tout de même des limites à cette technologie. Dimension Data n’est pas encore capable de prédire les abandons (29 en ce 20 juillet), les chutes, les comportements dangereux ou les arrivés hors délai : ce qui relève du hasard et du mental. De plus, tous les vélos de rechange ne sont pas équipés de balises GPS. En effet, seuls les cycles utilisés au départ d’une étape disposent d’une selle dotée de ce type de capteur.

Tant mieux pour les allergiques à la technologie. Malgré cette armada de données mises au service du Tour de France, il est toujours de difficile de deviner le vainqueur à la fin d’une étape, et à l’arrivée sur les champs Élysée de dire à coup sûr qui sera le maillot jaune. On s’y rapproche tout de même fortement.

Sources & crédits Source : Forbes, Data Dimension - Crédit : Tour de France

A lire également

définition Data Mining

Data Mining : définition et exemples d’utilisation du forage de données

Le Data Mining est une composante essentielle des technologies Big Data et des techniques d’analyse …

Send this to a friend