deepmind ia imitation

Ils découvrent que l’IA peut apprendre en vous imitant : un grand pas vers l’AGI ?

Les chercheurs de Google DeepMind viennent de faire une découverte cruciale : tout comme l’être humain, l’intelligence artificielle peut apprendre en temps réel via l’imitation ! Les conséquences pourraient être monumentales, car tout le processus d’entraînement des IA pourrait être redéfini… découvrez tout ce qu’il faut savoir sur cette nouvelle percée !

Vous le savez certainement : l’intelligence humaine repose fortement sur l’acquisition de connaissances à partir d’autres humains. Le savoir se transmet de génération en génération, depuis l’aube de notre évolution culturelle.

Cette capacité d’apprentissage social nous permet d’imiter des actions et des comportements en temps réel. Toutefois, à l’heure de l’avènement de l’intelligence artificielle, une question cruciale se pose : les machines peuvent-elles également apprendre de cette façon ?

Voilà bien longtemps que les chercheurs en IA s’intéressent à l’apprentissage par imitation. L’idée est de fournir aux algorithmes l’instruction d’observer les humains lorsqu’ils complètent une tâche, puis d’essayer de les imiter.

Toutefois, les outils IA ont généralement besoin de multiples exemples et d’une exposition à de vastes volumes de données pour parvenir à copier les actions avec succès. C’était du moins le cas jusqu’à présent…

L’IA a réussi à explorer un monde virtuel en imitant un expert

Une étude révolutionnaire publiée par les chercheurs de DeepMind révèle que les agents IA peuvent aussi démontrer des compétences d’apprentissage social en temps réel, en imitant les humains dans de nouveaux contextes « sans utiliser aucune donnée humaine pré-collectée ».

Plus précisément, l’équipe s’est focalisée sur une forme particulière de transmission culturelle : l’apprentissage observationnel, ou imitation (few-shot). Il s’agit tout simplement de copier les mouvements corporels.

Cette expérience a été menée au sein d’un environnement simulé appelé GoalCycle3D : un monde virtuel où le terrain est accidenté, jalonné d’obstacles, et où les agents doivent parvenir à naviguer.

Afin d’aider l’IA à apprendre, les chercheurs ont utilisé la technique de l’apprentissage par renforcement ou Reinforcement Learning : une méthode de Machine Learning qui consiste à offrir des récompenses à l’IA pour chaque comportement menant au résultat souhaité.

En l’occurrence, ce résultat était de trouver le chemin adéquat pour compléter le parcours. À l’étape suivante, l’équipe a ajouté des agents experts, codés ou contrôlés par des humains, qui savaient déjà comment s’orienter dans la simulation.

Très vite, les agents ont compris que la meilleure façon d’atteindre leur destination était d’apprendre auprès des experts. Et les chercheurs de DeepMind ont été très surpris par deux observations.

DeepMind est convaincu d’avoir trouvé la clé de l’AGI

Ils se sont aperçus que l’intelligence artificielle apprenait non seulement plus rapidement en imitant les experts, mais aussi qu’elle était capable d’appliquer le savoir obtenu à d’autres chemins virtuels.

En outre, DeepMind a découvert que les agents IA pouvaient continuer à utiliser leurs nouvelles compétences même en l’absence d’experts. Aux yeux des auteurs, la conclusion est sans appel : il s’agit bel et bien d’un exemple d’apprentissage social.

Ainsi, même si les auteurs admettent que davantage de recherches sont nécessaires, ils sont convaincus que l’évolution culturelle pourrait jouer un rôle majeur dans le développement de la première AGI ou Intelligence artificielle Générale : une IA capable d’apprendre à effectuer n’importe quelle tâche avec la même polyvalence qu’un humain…

Par ailleurs, ils espèrent que leurs travaux mènent à davantage de coopération interdisciplinaire entre les domaines de l’IA et de la psychologie évolutionnaire culturelle, notamment pour mieux comprendre le cerveau humain.

Une révolution pour l’industrie de l’IA ?

Cette découverte n’est que le commencement d’un chemin, au bout duquel pourrait se trouver une véritable révolution pour l’industrie de l’intelligence artificielle.

Elle pourrait permettre de réduire les besoins massifs de ressources pour l’entraînement d’algorithmes, tout en augmentant massivement leurs capacités de résolution de problèmes.

Il pourrait aussi s’agir d’un renversement majeur pour les robots humanoïdes comme le Tesla Optimus. Ces derniers pourraient apprendre à effectuer des tâches manuelles en observant directement les travailleurs humains !

À terme, l’IA pourrait directement apprendre en acquérant des éléments sociaux et culturels de la pensée humaine… pour découvrir ces travaux de recherche plus en détail, vous pouvez consulter l’étude complète dans le journal Nature Communications en suivant ce lien !

Newsletter

Envie de ne louper aucun de nos articles ? Abonnez vous pour recevoir chaque semaine les meilleurs actualités avant tout le monde.

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *