L’entreprise Microsoft utilise Rho-alpha sur ses premiers robots IA conçus pour sortir des lignes de production classiques.

Microsoft a conçu ses premiers robots IA en misant sur l’intelligence physique, ou physical AI. Grâce à elle, les machines peuvent interagir dans des environnements moins prévisibles. Elles peuvent également suivre des instructions en langage naturel tout en utilisant la perception tactile.

Rho-alpha est le premier modèle de robotique issu de la série Phi. Cette dernière est célèbre pour ses modèles légers de vision et de langage. Mais cette fois, Microsoft ne se limite plus à la compréhension de textes ou d’images. Le modèle agit désormais dans le monde réel.

En combinant vision, langage et action, Rho-alpha traduit des instructions en signaux de contrôle. Cela sert à piloter directement les bras d’un robot. L’objectif est avant tout de réduire la dépendance aux scripts fixes des chaînes de production. Mais aussi, d’adapter le comportement du robot aux situations dynamiques.

Les premiers robots IA de Microsoft se concentrent par ailleurs sur les tâches de manipulation à deux bras. Cela inclut par exemple pousser des boutons, tourner des boutons ou insérer des prises. Grâce à la perception tactile, les gestes deviennent plus précis et adaptables. Microsoft prévoit également d’ajouter d’autres modalités. Parmi elles, la mesure de force, pour renforcer la maîtrise des interactions physiques.

L’importance de la simulation et des données synthétiques

Former des robots capables de ressentir le monde réel pose un énorme défi. En fait, les données tactiles sont rares et difficiles à collecter à grande échelle. Microsoft utilise donc une approche hybride avec ses premiers robots IA. Elle combine les démonstrations physiques réelles avec des scénarios simulés générés via le framework Isaac Sim de Nvidia.

L’apprentissage par renforcement aide en outre à créer des trajectoires synthétiques réalistes. Le robot les utilise ensuite pour perfectionner ses manipulations. Ces simulations contribuent à multiplier les situations testées sans recourir constamment à du matériel physique.

L’intervention humaine au cœur des premiers robots IA Microsoft

Même avec cette approche, les erreurs restent néanmoins inévitables. Microsoft a conçu Rho-alpha pour apprendre des corrections humaines en temps réel. Les opérateurs peuvent intervenir à l’aide d’outils intuitifs, comme une souris 3D, pour remettre le robot sur la bonne trajectoire. Ces ajustements deviennent alors des données d’apprentissage supplémentaires. Ils aident le robot à ajuster petit à petit sa précision et son adaptabilité.

Rho-alpha ouvre la voie vers une robotique plus flexible

Microsoft essaie actuellement Rho-alpha sur des robots industriels à deux bras et sur des plateformes humanoïdes. Notez cependant que l’objectif n’est pas de livrer un produit fini. Le but est plutôt de créer une fondation sur laquelle les fabricants et intégrateurs peuvent construire des applications spécifiques.

L’entreprise combine donc intelligence physique, perception tactile et apprentissage assisté par l’humain. Microsoft ouvre ainsi la voie aux premiers robots IA capables de s’adapter à des environnements complexes. Puis, de collaborer plus étroitement avec les humains.

