IBM envisage de faciliter l’intégration ainsi que la mise à l’échelle des workflows de Big Data et d’IA à travers le cloud hybride.
CodeFlare est un framework open source qui n’a pas de serveur. Il a été créé en vue de permettre l’adaptation en taille des workflows de Big Data et d’IA sur le cloud hybride. Ainsi, il se destine aux applications d’apprentissage automatique Ray. Soulignons que CodeFlare accroît les capacités de ce dernier. Cela passe par l’ajout d’éléments spécifiques ayant pour but d’écourter la mise à l’échelle des flux de travail. Certes, l’obtention d’un système de recherche d’IA et de données plus conséquentes est essentielle. Cependant, cela incombe aux chercheurs d’investir plus de temps dans les configurations plutôt que d’explorer la science des données.
Le projet CodeFlare selon IBM
Selon IBM, la formation et l’optimisation du modèle va du nettoyage des données à l’extraction de quelques spécificités. Le but de CodeFlare sera ainsi de rendre ce processus plus simple. Pour ce faire, un pipeline qui n’est autre qu’une interface basée sur Python sera exploitée. Dans cette optique, l’entreprise croit pouvoir homogénéiser les workflows de pipeline à travers une multitude de plateformes, et ce, sans qu’il n’y ait besoin d’apprendre de nouveau langage. Ce projet permettra, par la même occasion, les liaisons et intégrations avec d’autres milieux cloud natifs.
Comme le déclare Priya Nagpurkar, directeur de la plateforme cloud hybride d’IBM Research : « CodeFlare va au-delà des tâches isolées pour intégrer et mettre à l’échelle de manière transparente des pipelines de bout en bout avec une interface conviviale pour les scientifiques des données – comme Python – au lieu d’utiliser des conteneurs.[…] Il peut fournir un moyen plus simple d’intégrer et de mettre à l’échelle des pipelines complets, tout en offrant une interface d’exécution et de programmation unifiée ».
CodeFlare profite à tous les secteurs
CodeFlare a la capacité de réagir au jaillissement d’un flux de travail où convergent la modélisation, l’IA ainsi que l’analyse de données. Ces trois piliers se joignent effectivement afin de proposer un meilleur délai de rentabilisation. Les domaines qui peuvent en bénéficier, eux, sont nombreux. A ce titre, dans le secteur médical, ces pipelines sont utilisés pour « ajuster les protocoles de traitement, la fabrication et l’optimisation de la chaîne d’approvisionnement, où la modélisation et la simulation des processus sont couplées pour offrir des performances nettement supérieures à celles existantes »
L’incidence du système sur les développeurs
CodeFlare servira à fournir des outils, des API ainsi que des données plus riches aux scientifiques. Les développeurs n’auront alors pas à multiplier leurs efforts dans la compréhension des réalisations de leurs collègues. Désormais, ils pourront davantage se focaliser sur le travail de recherche plutôt que sur une configuration complexe. Cela leur permettra de gagner plus de temps. A titre d’application, le framework a été exploité dans l’optimisation de 100 000 pipelines pour la concrétion de modèles d’apprentissage automatique. Pour chaque pipeline, le temps d’exécution n’a été que de 15 minutes et non plus quatre heures.
- Partager l'article :