À l’origine du logiciel AlphaGo, DeepMind a conçu un nouveau programme d’intelligence artificielle capable de faire évoluer sa base de données. Il peut ainsi traiter un grand nombre de problèmes avec des informations de départ limitées.
En mars 2016, à la surprise générale, AlphaGo battait à plate couture le coréen Lee Sedol, l’un des meilleurs joueurs de go au monde. Le go est un jeu millénaire aux règles très simples, mais à l’immense complexité. On a coutume de dire qu’il existe une infinité de parties possibles. Le logiciel AlphaGo a été conçu par DeepMind, entreprise d’intelligence artificielle britannique rachetée par Google en 2014.
Pour construire ce programme, DeepMind a eu recours aux réseaux neuronaux. Baptisés ainsi car ils s’inspirent du fonctionnement des neurones biologiques, ils permettent l’apprentissage par expérience. A l’aide du principe d’induction, le programme est capable de s’améliorer au fil du temps. AlphaGo a ainsi été nourri de plusieurs millions de parties de go jouées au cours de l’histoire. Il s’est ensuite progressivement amélioré en disputant de nombreuses parties contre lui-même. Ce principe lui a permis de progresser à un rythme exponentiel entre son match joué (et gagné) en octobre 2015 contre le français Fan Hui, et celui remporté en mars 2016 contre Lee Sedol.
L’ordinateur neuronal différentiel
Mais les ambitions de DeepMind ne s’arrêtent pas au jeu de go. L’entreprise a récemment annoncé une nouvelle étape dans ses recherches en intelligence artificielle. Elle affirme ainsi avoir conçu un nouveau logiciel capable de construire progressivement sa propre base de données. Tout en s’instruisant à partir de celle-ci. « Ces modèles, que nous appelons ordinateurs neuronaux différentiels , peuvent apprendre à partir d’exemples, comme les réseaux neuronaux, mais aussi stocker des données complexes, comme les ordinateurs », affirment les chercheurs Alexander Graves et Greg Wayne sur le blog de DeepMind. Le système s’affranchit ainsi de la nécessité du recours à des données extérieures.
Le fonctionnement d’un ordinateur neuronal différentiel repose sur un contrôleur. Un réseau de neurones jouant le même rôle qu’un processeur d’ordinateur. Il est capable d’inscrire de nouvelles informations dans la base de données et d’effectuer des liens logiques entre celles-ci et les informations déjà présentes. Le contrôleur retrouve ainsi rapidement l’information en cas de besoin. En bon réseau neuronal, le programme est également capable d’apprendre de lui-même à partir d’exemples, grâce à l’apprentissage automatique. Il peut ainsi progressivement réorganiser sa mémoire afin d’optimiser la structure de sa base de données en fonction des problèmes qu’on lui pose. Et retrouver l’information toujours plus rapidement.
DeepMind déploie un logiciel toujours plus autonome
DeepMind affirme avoir appliqué ce logiciel à deux exemples concrets, avec chaque fois des résultats concluants. Les chercheurs ont d’abord rentré dans le programme un plan du métro de Londres. Ils lui ont ensuite posé des questions complexes, avec plusieurs entrées. Par exemple, « A quelle station se retrouve-t-on si l’on part de Bond street, prend la Central line sur un arrêt, la Circle line sur quatre arrêts dans telle direction et la Jubilee line sur deux arrêts dans telle direction ? ». Ou encore, « Comment se rendre de la station Moorgate à la station Picadilly Circus ? ». L’intelligence artificielle a été capable de donner la bonne réponse en se basant uniquement sur ses propres informations, celles du plan du métro. Sans avoir recours à une base de données extérieure.
Les chercheurs ont également entraîné le logiciel sur un arbre généalogique. Lui indiquant seulement les relations parents/enfants et frères soeurs, ils lui ont ensuite demandé de deviner qui était le grand-oncle paternel de telle personne. Là encore, l’algorithme a su apprendre tout seul, à partir de ses données propres, pour fournir la bonne réponse. DeepMind, et à travers elle Alphabet, détient ainsi une intelligence artificielle capable de s’affranchir encore plus de toute intervention humaine et de s’améliorer toujours plus rapidement.
- Partager l'article :