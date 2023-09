Toyota vient de créer une nouvelle technique d’intelligence artificielle permettant aux robots d’apprendre à accomplir n’importe quelle tâche physique juste en regardant un humain l’effectuer. Voici pourquoi c’est un pas de géant vers l’émergence de robots humanoïdes généralistes capables d’exercer n’importe quel métier !

Nous sommes à l’aube d’une ère nouvelle : celle des robots humanoïdes. Depuis l’annonce du Tesla Optimus par Elon Musk, de nombreuses entreprises ont décidé d’investir massivement dans cette technologie et des progrès fulgurants ont été réalisés.

L’entreprise texane Apptronik s’apprête à commercialiser son robot Apollo dès 2024, et Agility Robotics basé dans l’Oregon vient d’annoncer l’ouverture d’une usine qui va produire 10 000 robots par an.

Dans un avenir proche, ces machines vont collaborer avec les travailleurs humains et se déplacer de manière autonome. À plus long terme, on peut même s’attendre à ce que les humanoïdes deviennent des citoyens à part entière au même titre que nous…

Le bouleversement provoqué dans les entreprises par ChatGPT n’est donc que le commencement, car ces IA incarnées vont également remplacer le travail manuel et physique.

Toutefois, pour le moment, les robots humanoïdes sont très limités. Ils se contentent principalement de soulever des charges et de les déposer.

C’est un réel atout pour les entrepôts et la logistique, notamment pour charger et décharger des camions et des palettes. Cependant, ce n’est clairement pas suffisant pour égaler les travailleurs humains…

Afin d’étendre leurs capacités au point de pouvoir effectuer une large variété de tâches sur n’importe quel lieu de travail, les robots ont besoin d’un moyen d’apprendre de nouvelles compétences très rapidement à partir d’instructions ou de démonstrations par un humain.

C’est la raison pour laquelle l’innovation que vient d’annoncer Toyota va tout changer. Le célèbre constructeur automobile japonais a créé une nouvelle approche d’apprentissage basée sur la « Diffusion Policy » (politique de diffusion).

Après ChatGPT entraîné sur du texte, Toyota crée l’IA qui apprend les tâches manuelles

Cette technique inédite va ouvrir les portes au concept de « Larges Modèles de Comportement », après les « Larges Modèles de Langage » sur lesquels reposent ChatGPT et les autres IA.

Alors, qu’est-ce que la Diffusion Policy ? Il s’agit d’un concept développé par Toyota en partenariat avec le MIT et Columbia Engineering.

Techniquement, le groupe décrit cette approche comme « une nouvelle façon de générer du comportement robot en représentant la politique visuomotrice d’un robot comme un processus de diffusion de débruitage conditionnel ».

Pour illustrer cette idée, Toyota présente plusieurs exemples dans son article de recherche publié sur le site de la Columbia University à cette adresse.

Afin de bien comprendre le concept, le plus simple est de le comparer avec les LLM. Ces modèles de langage peuvent ingérer des milliards de mots issus de textes rédigés par l’humain, et ainsi apprendre à écrire et même à raisonner à leur tour.

De la même manière, la Diffusion Policy permet aux IA robotiques d’apprendre à effectuer des tâches en regardant un humain l’accomplir dans le monde réel.

Une technique révolutionnaire pour les robots humanoïdes

Auparavant, plusieurs startups ont appris aux robots grâce à la téléprésence en réalité virtuelle. Cette technique consiste à laisser un opérateur voir à travers les yeux du robot et contrôler ses membres pour effectuer une tâche, afin qu’il mémorise les mouvements précis.

Toutefois, l’approche de Toyota se focalise davantage sur l’haptique. Les opérateurs n’ont pas besoin de porter de casque VR, mais reçoivent un retour haptique en provenance des mains du robot. Ceci leur permet de ressentir ce que le robot ressent lorsqu’il entre en contact avec des objets.

Dès qu’un opérateur humain a montré au robot comment accomplir une tâche à plusieurs reprises et dans différentes conditions, son IA construit son propre modèle interne pour distinguer à quoi ressemblent un succès et un échec.

Elle effectue ensuite des milliers de simulations pour déterminer un ensemble de techniques permettant de faire le travail. Ceci lui permet de maîtriser totalement n’importe quelle tâche.

Comme l’explique Ben Burchfiel, principal créateur de cette approche innovante, « le processus commence avec un enseignant démontrant un petit ensemble de compétences via la téléopération ».

Par la suite, « notre Diffusion Policy basée sur l’IA apprend ensuite en arrière-plan pendant plusieurs heures ». Le processus est très rapide, puisque « nous enseignons généralement au robot dans l’après-midi, le laissons apprendre pendant la nuit, et il a acquis le nouveau comportement le lendemain matin ».

Les robots ont appris 60 tâches de cuisine

En utilisant cette approche, l’équipe de chercheurs a déjà pu entraîner rapidement des robots à effectuer 60 petites tâches principalement liées à la cuisine.

Chacune de ces tâches est relativement simple pour un humain adulte, mais exige que le robot détermine par lui-même comment attraper, tenir et manipuler différents types d’objets à l’aide d’outils et d’ustensiles.

Il s’agit par exemple d’utiliser un couteau pour couper équitablement une tranche de pain, de se servir d’une spatule pour retourner une crêpe, ou encore de manier un économe pour peler une pomme de terre.

Les robots ont également pu apprendre à rouler une pâte à pizza et à répartir la sauce tomate dessus avec une cuillère. Découvrez ce processus en images grâce à la vidéo partagée par Toyota.

Quelles conséquences pour le futur de la robotique ?

Selon Toyota, les robots auront appris des centaines de tâches d’ici la fin de l’année 2023. La firme se fixe pour objectif plus de 1000 tâches pour la fin 2024.

Elle estime qu’il s’agira du premier « Large Behaviour Model » ou LBM (large modèle de comportement) : un framework qui pourrait devenir l’équivalent de ChatGPT pour la robotique.

Sous forme d’une gigantesque pile de données, ce modèle entièrement généré par l’IA permettra aux robots d’interagir avec le monde physique pour obtenir une large variété de résultats.

L’équipe est également en train de mettre en place une procédure permettant aux futurs propriétaires et opérateurs de robots d’apprendre facilement de nouvelles tâches à leurs machines chaque fois que nécessaire dans toutes les situations.

Il sera donc possible d’entraîner des flottes entières de robots pour leur apprendre de nouvelles compétences en quelques heures seulement.

Les chercheurs subjugués par leur propre invention

Selon Russ Tedrake, vice-président de la recherche en robotique au Toyota Research Institute, « les tâches que je vois ces robots effectuer sont tout simplement incroyables ».

De son propre aveu, « il y a encore un an, je n’aurais jamais prédit que nous serions si près de ce niveau de dextérité diverse ». À ses yeux, « ce qui est si excitant avec cette nouvelle approche c’est la fréquence et la fiabilité avec laquelle nous pouvons ajouter de nouvelles compétences ».

En effet, « puisque ces compétences fonctionnent directement à partir d’images de caméras et de capteurs tactiles, en utilisant seulement les représentations apprises, ils sont capables de les appliquer correctement même sur des tâches impliquant des objets déformables, des tissus, des liquides, tout ce qui était traditionnellement extrêmement difficile pour les robots ».

A priori, le LBM que Toyota développe nécessitera des robots du même type que ceux qu’elle utilise maintenant : des unités construites spécifiquement pour les tâches de manipulation adroite à deux mains avec un focus sur le retour haptique et la capture tactile.

Toutefois, par la suite, on peut s’attendre à ce que le framework s’étende à tous les robots humanoïdes dotés de doigts et de pouces opposés pour leur permettre d’utiliser n’importe quel outil.

À mesure que ce LBM étoffera sa compréhension du monde physique à travers des milliers de tâches, objets, outils, situations et gagnera de l’expérience, il deviendra de plus en plus performant pour généraliser ses compétences à toutes sortes de travaux.

Il s’agit donc d’un bond de géant vers la singularité technologique, et vers un monde où le robot côtoiera l’humain comme son égal… jusqu’à le remplacer totalement ?