deepmind waymo machine learning

DeepMind et Waymo accélèrent l’entrainement des algorithmes de Machine Learning

Waymo et DeepMind annoncent un partenariat afin de développer les algorithmes de Machine Learning des véhicules autonomes plus rapidement et plus efficacement. Dorénavant, les meilleurs algorithmes seront choisis automatiquement grâce à une technique inspirée par l’évolution biologique…

Les véhicules autonomes, qui envahiront bientôt les routes du monde entier, reposent sur des combinaisons d’algorithmes de Machine Learning et de code rédigé par des développeurs humains. Les algorithmes servent à détecter les lignes, les panneaux, les autres véhicules ou encore les piétons grâce à différents capteurs dont les données sont analysées en temps réel. Le code, quant à lui, a pour but de contrôler le véhicule et de faire face à diverses éventualités.

Actuellement, les véhicules autonomes déjà existants reposent principalement sur des algorithmes de Deep Learning. Or, la configuration initiale d’un réseau de neurones avec les bonnes propriétés et les bons paramètres est une tâche complexe. Les réseaux et les paramètres sont testés et choisis manuellement parmi différents candidats, ce qui nécessite beaucoup de temps. Il est possible de laisser un ordinateur modifier les paramètres au hasard, mais cela requiert une grande quantité de puissance de calcul.

De plus, à mesure que de nouvelles données sont capturées par les capteurs des véhicules autonomes et qu’ils sont déployés dans davantage de lieux, il est nécessaire d’entraîner à nouveau les réseaux de neurones, de modifier le code et de changer les paramètres. Chaque nouvelle itération doit être rigoureusement testée dans une simulation.

DeepMind et Waymo s’inspirent de l’évolution biologique pour le Machine Learning

Afin de gagner du temps et de réduire la puissance nécessaire, les ingénieurs de l’entreprise Waymo, détenue par Alphabet, se sont associés avec les chercheurs de DeepMind, la division de recherche IA d’Alphabet. Ensemble, ils ont déterminé un processus plus efficace pour entraîner et configurer les algorithmes des véhicules autonomes.

Leur choix s’est arrêté sur la technique dite de l’entraînement basé population (PBT). Cette technique, déjà testée auparavant par DeepMind pour ses algorithmes champions de Starcraft 2, s’inspire directement de l’évolution biologique. Les meilleurs algorithmes et paramètres sont ici choisis automatiquement parmi les différents candidats en fonction de leur capacité à résoudre une tâche spécifique.

Cette méthode a permis à Waymo de réduire la puissance informatique nécessaire pour  » ré-entraîner « un réseau de neurones de près de 50%, et de doubler voire de tripler la vitesse du cycle de développement. De plus, le PBT permet de visualiser plus facilement l’évolution des paramètres sous la forme d’un arbre  » généalogique « .

Développer de meilleurs algorithmes pour les véhicules autonomes pourrait donner un avantage compétitif à Waymo face aux dizaines d’entreprises qui sont actuellement engagées sur ce créneau. Cependant, sur le long terme, ces travaux de recherche pourraient bel et bien profiter à l’ensemble de l’industrie