Le Machine Learning est en train de provoquer une grave crise de reproductibilité dans le domaine de la science. C’est ce qu’affirme la statisticienne Genevera Allen de la Rice University dans le cadre de la conférence AAAS Annual Meeting.
De plus en plus de chercheurs utilisent le Machine Learning pour analyser des données et y détecter des tendances. Cependant, dans le cadre de la conférence scientifique AAAS Annual Meeting, la statisticienne Genevera Allen de la Rice University a tenu à tirer la sonnette d’alarme. Selon elle, le Machine Learning est en passe de provoquer une crise de reproductibilité dans le domaine de la science.
Le problème, selon cette experte, est lié au fait que les algorithmes de Machine Learning sont entraînés à détecter des patterns au sein d’ensembles de données… même lorsqu’il n’y en a pas.
Le Machine Learning entraîne une crise de reproductibilité selon Genevera Allen
Par exemple, les scientifiques peuvent collecter une grande quantité de données de génome et utiliser des algorithmes de Machine Learning pour trouver des clusters de profils génomiques similaires. Malheureusement, lorsque le même algorithme est appliqué à un autre ensemble de données, on s’aperçoit que les résultats ne concordent pas.
Aux yeux de Genevera Allen, la seule solution à ce problème de reproductibilité est la création d’une nouvelle génération d’algorithmes capables d’évaluer la fiabilité de leurs prédictions. En attendant que de tels outils voient le jour, les chercheurs doivent vérifier eux-mêmes la reproductibilité de leurs expériences.
https://www.youtube.com/watch?v=cx9ht0L60Lo
- Partager l'article :
Il s’agit de principes d’apprentissage statistiques qui sont connus depuis des décennies. La problématique des pattern qui n’existent pas n’est pas difficile à gérer non plus en pratique. Mieux encore, les mathématiciens dans les entreprises d’assurance gèrent ce problème depuis 30 ans.
J’ai du mal à comprendre l’objectif de cet article, le « problème » en lui même où ce que propose l’auteure comme solution. Et pourtant je suis actif en R&D et machine learning depuis plusieurs années.