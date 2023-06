En appliquant la technologie d’IA derrière ChatGPT à la robotique, les chercheurs de Google DeepMind sont parvenus à créer un robot capable d’apprendre de nouvelles tâches de manière autonome. Ceci pourrait être le prochain chapitre de la révolution des robots IA…

Au cours des dernières années, l’intelligence artificielle a connu de nombreux progrès. En revanche, les robots sont restés totalement stupides.

Même si les machines autonomes ont commencé à s’aventurer dans le monde réel hors des laboratoires, elles restent très fragiles.

Un simple changement dans l’environnement ou la luminosité peut suffire à faire disjoncter l’IA qui les contrôle. De plus, ces modèles ont besoin d’être entraînés longuement sur des configurations matérielles très spécifiques avant de pouvoir accomplir la moindre tâche.

À l’inverse, les larges modèles de langage (LLM) comme ChatGPT ont prouvé leur capacité à généraliser leurs compétences à une large variété de tâches. Y compris dans des contextes inconnus ou inhabituels.

Ce fossé entre l’IA et la robotique pourrait être refermé, en utilisant la technologie derrière les LLM pour créer des cerveaux plus adaptables pour les bras robotiques et autres robots. C’est ce que révèle une nouvelle étude de Google DeepMind.

L’architecture Transformers de ChatGPT appliquée à la robotique

L’idée serait d’appliquer l’architecture Transformer à la robotique. Lors d’une expérience, l’IA a permis au robot RoboCat d’apprendre une large variété d’aptitudes.

De plus, il est parvenu à alterner entre différents corps robotiques tout en apprenant de nouvelles compétences beaucoup plus rapidement que d’habitude.

Plus spectaculaire encore : le robot est capable d’accélérer son apprentissage en générant ses propres données d’entraînement…

Sur le blog de DeepMind, les chercheurs saluent « la capacité de RoboCat à apprendre de nouvelles compétences et à s’améliorer seul rapidement indépendamment, en particulier quand on l’applique à différents appareils robotiques ».

Selon eux, cette innovation va permettre de « paver la voie vers une nouvelle génération d’agents robotiques généralistes et beaucoup plus utiles ».

Ainsi, tout comme Google a inventé les Transformers à l’origine d’IA révolutionnaires tels que GPT, la firme pourrait alimenter l’essor annoncé des robots humanoïdes généralistes.

Une IA entraînée sur une grande variété de données

La nouvelle IA de RoboCat est basée sur le modèle Gato dévoilé par les chercheurs de DeepMind en mai 2023.

Elle est capable de résoudre une large variété de tâches, comme légender des images, jouer à des jeux vidéo ou même contrôler des bras robotiques.

Pour atteindre ce niveau de polyvalence, Gato a dû être entraîné sur un jeu de données très diversifié incluant des textes, des images ou encore des données de contrôle robotique.

Afin d’entraîner RobotCat, l’équipe de chercheurs a également créé un jeu de données spécifiquement focalisé sur des défis robotiques.

Ils ont généré des dizaines de milliers de démonstrations de quatre bras robotiques différents accomplissant des centaines de tâches différentes.

Il s’agissait par exemple d’empiler des briques colorées dans le bon ordre ou de piocher un fruit spécifique dans un panier.

Ces démonstrations ont été effectuées à la fois par des humains contrôlant des bras robotiques à distance, et par une IA spécifique contrôlant des bras robotiques simulés dans un environnement virtuel. Toutes les données ont ensuite été exploitées pour entraîner un unique large modèle.

Comment RoboCat s’améliore tout seul ?

Pour présenter la capacité de RoboCat à s’améliorer seul, les chercheurs ont créé plusieurs modèles dérivés affinés sur des tâches spécifiques et les ont utilisés pour générer 10 000 démonstrations de ces tâches.

Les démonstrations ont ensuite été ajoutées au jeu de données existant, et utilisées pour entraîner une nouvelle version de RoboCat aux performances améliorées.

Chaque fois que la première version de RoboCat voit 500 démonstrations d’une tâche inconnue auparavant, elle est capable de l’accomplir avec succès 36% du temps.

Après plusieurs tours d’amélioration autonome et d’entraînement sur de nouvelles tâches, ce taux de réussite a doublé pour dépasser 74%.

Pour l’heure, le modèle reste moins performant sur certains types de problèmes. Il enregistre un taux de succès inférieur à 50% sur plusieurs tâches, et même 13% sur l’une d’entre elles.

Toutefois, la capacité de RoboCat à maîtriser une large variété de défis et à en apprendre de nouveaux si rapidement suggère que des cerveaux robotiques beaucoup plus adaptables verront le jour très prochainement…

Vers un essor des robots humanoïdes ?

Dans l’article publié sur arXiv, les chercheurs estiment que le principal avantage d’une architecture basée sur Transformer est la capacité à ingérer beaucoup plus de données que les précédentes formes d’IA.

C’est précisément cet entraînement sur de vastes quantités de textes qui ont permis aux LLM de développer des capacités de langages généralistes.

À présent, les chercheurs DeepMind affirment être parvenus à créer un agent « généraliste » capable d’effectuer de nombreuses tâches robotiques en utilisant différentes configurations hardware.

L’expérience démontre aussi que le modèle peut apprendre de nouvelles tâches grâce au « fin tuning » à partir de 100 à 1000 démonstrations d’un bras robotique contrôlé par un humain.

C’est beaucoup moins que le nombre de démonstrations généralement nécessaires pour entraîner un robot sur une tâche. Ceci suggère que le modèle apprend par-dessus des compétences de contrôle robotique plus générales plutôt que de repartir de zéro à chaque fois.

Selon le billet publié sur le blog de DeepMind, « cette capacité va accélérer la recherche en robotique puisqu’elle réduit le besoin d’un entraînement supervisé par l’humain, et constitue un grand pas en avant dans la création d’un robot généraliste ».