Amazon Web Services vient de dévoiler un grand nombre de nouveautés pour son service SageMaker dédié au Machine Learning sur le Cloud. L’objectif principal est d’ouvrir l’accès au ML et à l’IA au plus grand nombre…
Dans le cadre de sa conférence re:Invent, AWS vient de présenter le SageMaker Studio Lab. Ce nouveau service gratuit va permettre aux développeurs d’apprendre des techniques de Machine Learning et d’expérimenter cette technologie.
Le Studio Lab permet aux utilisateurs d’acquérir toutes les bases nécessaires pour débuter : un IDE JupyterLab, l’entraînement de modèle sur CPU et GPU, et 15GB de stockage persistant.
Il s’agit d’une version gratuite du service SageMaker, permettant de construire, d’entraîner et de déployer des modèles de Machine Learning. Cette version destinée aux débutants est accessible sans compte AWS, sans carte de crédit et sans connaissance en configuration Cloud.
Actuellement disponible en preview publique, Studio Lab est basé sur l’outil open-source JupyterLab et offre un accès gratuit aux ressources de calcul AWS.
Pour commencer à l’utiliser, un développeur peut créer son compte gratuitement. C’est une étape indispensable pour utiliser le service.
Il sélectionne ensuite s’il a besoin d’une instance CPU ou GPU pour son projet. Le service offre 12 heures de CPU et quatre heures de GPU par session d’utilisateur, avec un nombre de sessions d’utilisateur illimité.
L’utilisateur profite de 15Go de stockage persistant par projet. Lorsque la session expire, le Studio Lab prend un snapshot de l’environnement pour que les utilisateurs puissent reprendre là où ils ont arrêté.
Le SageMaker Studio Lab va être utilisé pour le hackhaton AWS Disaster Response. L’objectif de ce challenge est d’explorer des idées innovantes pour lutter contre les catastrophes naturelles grâce au Machine Learning. Il se déroule jusqu’au 7 février 2022, avec un total de 54 000 dollars à partager entre les gagnants.
AWS AI & ML Scolarship Program : une bourse pour les étudiants intéressés par l’IA
En parallèle, Amazon vient aussi de lancer son programme AI & ML Scolarship Program. La firme de Seattle compte investir 10 millions de dollars par an dans ce programme, mené en collaboration avec Intel et Udacity.
Ce programme utilise AWS DeepRacer et le nouveau AWS DeepRacer Student League pour apprendre aux étudiants les bases du Machine Learning. Grâce à cette initiative, 2000 étudiants vont recevoir leur bourse d’étude Udacity Nanodegree pour la programmation IA en Python chaque année.
Les 500 étudiants qui obtiendront le plus haut score au premier programme recevront une seconde bourse Udacity Nanodegree sur l’ingénierie Deep Learning et Machine Learning. Ils profiteront aussi du mentorat des employés Amazon et Intel.
Ces deux annonces ont pour but d’ouvrir des opportunités d’éducation dans le domaine du Machine Learning, afin de rendre cette technologie accessible à tous ceux qui s’y intéressent.
Amazon SageMaker Canvas : un outil » No Code » pour les analystes métier
Une autre nouveauté présentée lors de la conférence Re:Invent est SageMaker Canvas. Cet outil » no-code » offre une interface visuelle pour la préparation de données et l’entraînement de modèles Machine Learning.
Ce service se destine aux analystes métier, et ne nécessite aucune expertise en Machine Learning. L’interface visuelle permet d’accéder aux données en provenance de différentes sources, et prépare les données pour l’entraînement de modèles ML.
Sans avoir de compétences en Machine Learning ou en écriture de code, l’utilisateur peut générer des prédictions précises. Notons que Canvas est intégré avec SageMaker Studio.
La technologie AutoML est utilisée pour entraîner les modèles en se basant sur un ensemble de données spécifique. Les données sont nettoyées et combinées, afin de créer des centaines de modèles. Le meilleur modèle est ensuite choisi, et des prédictions individuelles ou en lot sont générées.
Amazon veut ouvrir l’accès au Machine Learning
Comme l’explique Swami Sivasubramanian, vice président du Machine Learning chez AWS, « le Machine Learning sera l’une des technologies les plus révolutionnaires de cette génération. Si nous volons libérer tout son potentiel et résoudre les principaux problèmes de ce monde, nous avons besoin que les meilleurs esprits en provenance de tous les horizons entrent dans ce domaine « .
Selon ses dires, AWS » veut inspirer une main d’oeuve diversifiée pour le futur par le biais de ce nouveau programme et supprimer les barrières du coût qui dissuadent de nombreuses personnes de commencer dans le Machine Learning « .
De son côté, Antje Barth explique que » la mission d’AWS est de rendre le Machine Learning plus accessible. Par le biais de nombreuses conversations au fil des dernières années, j’ai appris quelles sont les barrières qui se dressent face aux débutants « .
A ses yeux, » les environnements ML existants sont souvent trop complexes pour les débutants ou trop limités pour soutenir les expériences ML modernes. Les débutants veulent commencer à apprendre rapidement, sans avoir à se soucier de la configuration des services, de l’infrastructure, ou d’implémenter des alarmes de facturation pour éviter de dépasser le budget. Devoir fournir ses informations de facturation et de carte de crédit à l’inscription est d’ailleurs aussi une barrière « .
Les autres nouveautés AWS SageMaker
Le service SageMaker était au centre de cette édition 2021 de la Re:Invent. De nouvelles fonctionnalités ont été présentées, afin de simplifier l’utilisation du Machine Learning en entreprise.
Tout d’abord, SageMaker Ground Truth Plus permet d’obtenir des ensembles de données d’entraînement de haute qualité plus rapidement grâce à une main-d’œuvre d’experts. Des techniques de Machine Learning sont utilisées pour l’apprentissage actif, le pré-étiquetage et la validation.
Ce nouveau service réduit les coûts jusqu’à 40% et ne requiert pas d’expertise en Machine Learning. Les utilisateurs peuvent créer des datasets d’entraînement sans avoir à développer d’applications d’étiquetage. Pour l’heure, SageMaker Ground Truth Plus est uniquement disponible en Virginie du Nord.
L’outil SageMaker Inference Recommender permet de choisir les meilleures instances de calcul disponibles pour déployer des modèles de Machine Learning avec des performances et un coûts optimaux. Il est disponible partout sans dans les régions AWS China.
La SageMaker Serverless Interface permet aux utilisateurs de déployer des modèles de Machine Learning pour l’inférence sans avoir à configurer ou gérer l’infrastructure sous-jacente. Cette option est disponible en Virginie, dans l’Ohio, l’Oregon, en Irlande, à Tokyo et à Sydney.
Le Training Compiler permet quant à lui d’accélérer l’entraînement des modèles de Deep Learning de 50% grâce à une utilisation plus efficace des instances GPU. Enfin, il est désormais possible de surveiller et de déboguer les jobs Apache Spark sur Elastic MapReduce directement depuis les notebooks SageMaker Studio.
https://www.youtube.com/watch?v=ue9aumC7AAk
- Partager l'article :