Les chercheurs de Facebook sont parvenus à apprendre à une intelligence artificielle à effectuer de nouvelles tâches à partir de schémas. Cette méthode novatrice permet de réduire le temps nécessaire à l’apprentissage à seulement quelques heures…
Pour entraîner les intelligences artificielles et leur apprendre à effectuer de nouvelles tâches, on utilise la plupart du temps des milliers voire des millions d’exemples sous forme d’ensembles de données. Or, cette méthode peut se révéler extrêmement longue et l’entrainement peut nécessiter plusieurs mois.
Afin d’accélérer le processus, une équipe de chercheurs en intelligence artificielle de Facebook a eu l’idée d’utiliser des schémas pour apprendre de nouvelles tâches à une IA. Leur ambition était de parvenir à apprendre à deux bras robotiques Sawyer à choisir les étapes appropriées dans une liste pour atteindre un objectif.
Une liste de différentes compétences génériques de manipulation ont été fournies aux bras robotiques, comme de tourner, soulever, ou attraper. Pour chaque étape, l’IA devait choisir quelle compétence utiliser pour accomplir différentes tâches impliquant différentes formes et poses initiales. Par exemple : à quel endroit appliquer de la force et quelle quantité de force.
L’IA de Facebook parvient à appliquer un même schéma d’actions à plusieurs tâches différentes
Cette approche a permis d’accroître fortement l’efficacité du processus d’apprentissage. En seulement quelques heures, le robot a pu acquérir de nouvelles compétences de manipulation d’objets.
Les chercheurs ont également découvert que pour la plupart des tâches, le processus d’apprentissage peut être divisé en deux parties. Le robot doit apprendre un schéma, puis apprendre à paramétrer correctement les différentes compétences.
Or, les données des différentes versions d’une tâche peuvent être à nouveau utilisées pour améliorer les compétences partagées entre ces versions. C’est ce qui permet d’accélérer l’apprentissage. Les schémas ont même pu être utilisés pour plusieurs tâches différentes. Par exemple, si le robot a appris un bon schéma pour saisir un long bâton, regroupant la pose et les informations géométriques de l’objet, ce schéma pourra être à nouveau utilisé pour des tâches similaires comme celles de ramasser un plateau même si les caractéristiques et les paramètres optimaux diffèrent.
Pendant les expériences, les bras Sawyer étaient chargés de manipuler neuf objets du quotidien. En utilisant environ 2000 compétences, le système est parvenu à manipuler la plupart des objets avec un taux de réussite de 90% pour un temps d’entraînement de 4 à 10 heures seulement…
- Partager l'article :