Face à l’accroissement des volumes de données dans toutes les entreprises, les Analytics on the Edge se présentent comme une alternative de choix. Plutôt que de transférer les données vers une Data Warehouse, cette stratégie consiste à traiter les données directement à la source pour gagner du temps, économiser des ressources voire obtenir plus d’informations exploitables.
Dans le cadre du business, l’Internet des Objets apporte de nombreux bénéfices. Il permet d’accéder à davantage de données, et ainsi d’obtenir de meilleures informations exploitables. Cependant, cette technologie apporte également de nouveaux défis. La taille est la vitesse des donnés collectée par les appareils connectés peut venir à bout des infrastructures réseau les plus solides. Dans des situations où le timing est crucial, les retards causés par la congestion de la bande passante ou les données inefficacement routées peuvent causer d’importants problèmes.
Edge Analytics
Pour résoudre ces problèmes, le concept de « edge analytics » gagne en popularité. Parfois désigné par la notion d’analyses distribuées, ce concept se rapporte aux systèmes au sein desquels les analyses sont effectuées en même temps que les données sont collectées. Bien souvent, c’est à cet endroit que les actions basées sur les informations fournies par les données sont nécessaires. Plutôt que de concevoir des systèmes centralisés au sein desquels les données sont renvoyées vers les Data Warehouses à l’état brut, avec le besoin d’être nettoyées et analysées pour devenir utiles, l’idée est d’effectuer tout le traitement au sommet du système.
En guise d’exemple, on peut prendre un système de sécurité CCTV à grande échelle, avec des dizaines de milliers de caméras couvrant une large zone. Il est fort probable que 99,9% des vidéos enregistrées soient inutiles pour la détection d’intrus. Pour chaque seconde de vidéo utile, on dénombrera des heures et des heures de vidéo inutile. Partant de ce constat, il est inutile de transférer toutes ces données en temps réel vers le réseau, générant des dépenses et consommant de l’espace de stockage.
Il est plus judicieux que les images soient analysées directement au sein des caméras au moment où elles sont capturées. Les vidéos inutiles seront quant à elles effacées ou marquées comme faible priorité. Les ressources centralisées pourront traiter uniquement les données intéressantes.
Cisco se place en précurseur
Ce modèle se répand de plus en plus. Un récent rapport publié par IDC démontre qu’en 2018, 40% des données IoT seront stockées, traitées et analysées directement « on the Edge ». Cisco tente de s’investir au maximum dans cette nouvelle tendance. La firme a récemment annoncé le lancement d’une plateforme pour le développement et l’exécution de systèmes edge analytics.
Le Vice-President et General Manager des data et analytics de Cisco, Mike Flannagan, affirme que les analytics at edge reposent sur la notion d’effectuer le bon traitement de données au bon endroit. Si des tonnes de données sont générées dans un Data Center, il faut les analyser dans le Data Center. Les données générées at the edge peuvent être transférées au Data Center si la bande passante est illimitée. Cependant, le volume des données et leur nature périssable compliquent parfois la tâche. Dans ces situations, les analytics on the edge prennent tout leur sens.
Il est important de noter que Flannagan ne considère pas les analytics Edge comme un remplacement du modèle de data center centralisé. Il s’agit davantage d’une approche complémentaire pour augmenter les capacités analytiques dans certaines situations, par exemple quand les informations doivent être générées très vite.
Analytics on the Edge : exemples d’utilisation
Un exemple intéressant est celui des courses de powerboat. Les bateaux à double moteur à 200 miles par heure constituent un système de données incluant une équipe terrestre recevant constamment des données à analyser sur les performances des bateaux pendant les courses. Un algorithme génère des données devant être renvoyées au pilote dans la seconde. Les puissants moteurs doivent opérer à leur plus haut niveau sans pour autant surchauffer, pour avoir une chance de battre les records du monde et de gagner des courses. SilverHook Powerboats a implémenté un système donnant aux pilotes un feedback instantané, leur permettant de relâcher la pression juste au bon moment en se basant sur des analytics en temps réel embarqués dans le bateau. Ce système permet de réduire de quelques secondes le délai d’information.
Un autre exemple est celui des grands magasins, qui peuvent utiliser les données des points de vente dès qu’elles sont capturées. De cette façon, des ventes croisées et des promotions peuvent être organisées à la volée, tout en réduisant la bande passante utilisée pour envoyer toutes les données à un serveur analytique centralisé en temps réel.
Les réparations d’urgence peuvent être accélérées lorsque des constructeurs utilisent des systèmes analytiques edge pour la machinerie et les véhicules. Ils peuvent alors décider rapidement quand il est temps de réduire la puissance utilisée ou envoyer une alerte pour prévenir qu’une pièce doit être remplacée.
Les architectes des Smart Cities peuvent utiliser les edge analytics au sein de systèmes comme les feux de signalisation, pour une surveillance et une gestion intelligente du trafic. Les niveaux de pollution générés par le trafic peuvent être surveillés en temps réel et régulés en réduisant le flot lorsque la qualité de l’air descend sous un certain seuil.
Les voitures autonomes reposeront fortement sur les systèmes edge analytics pour les fonctions nécessitant une réponse immédiate, par exemple pour éviter les accidents. Parallèlement, elles reposeront sur les analyses centralisées pour la gestion de flotte et l’optimisation d’itinéraire. Elles reposeront également sur le juste milieu, surnommé « the fog ». Ce terme désigne les analyses effectuées entre un réseau de véhicules proches les uns des autres, pour la gestion du trafic local.
À chaque situation sa solution
Bien entendu, les edge analytics ne sont pas compatibles avec toutes les implémentations IoT. Selon Flannagan, pour les clickstream analytics (informations sur le trafic web), toutes les données sont centralisées, il n’y a donc pas de composant edge. Il serait absurde d’utiliser des analytics distribués.
- Partager l'article :