Les modèles d’IA ne brillent pas vraiment lorsqu’il s’agit de paris sportifs. Et encore moins quand il faut miser de l’argent dessus. Une nouvelle étude pointe du doigt les performances décevantes de ces systèmes.
Le rapport est baptisé « KellyBench » et publié par la start-up londonienne General Reasoning. Dans le cadre de l’étude, l’IA de Google, OpenAI, Anthropic et xAI ont tous été mis à l’épreuve.
Quel genre d’épreuve ?
Les huit IA ont été testé sur une reconstitution de la saison 2023-2024 de la Premier League. Elles avaient à disposition des données historiques, des statistiques d’équipes et de joueurs.
Chaque système avait ensuite pour mission de construire des stratégies de mise capables de générer des profits tout en limitant les risques. Chacun devait évoluer sans accès à Internet, en s’adaptant uniquement aux informations fournies au départ et aux mises à jour progressives des matchs.
Et pour maximiser leur chance, les chercheurs leur avaient accordé plusieurs tentatives. Mais, les résultats montrent surtout une série de désillusions.
Claude Opus 4.6 d’Anthropic est celui qui s’en est le mieux sorti. Malgré tout, il affiche une perte moyenne de 11 %, avec une tentative presque à l’équilibre. De son côté, Grok 4.20 de xAI, l’entreprise d’Elon Musk, s’est montré beaucoup moins chanceux.
Il a fait faillite dès la première tentative, avec deux essais non concluants. Même constat pour Gemini 3.1 Pro de Google. Le modèle a atteint un gain ponctuel de 34 % avant de s’effondrer sur une autre tentative.
Au final, aucun des systèmes testés n’a réussi à rester rentable sur la durée. Et plusieurs ont même accumulé des pertes importantes. Les chercheurs concluent que la performance des IA restent inférieures à celles d’humains placés dans les mêmes conditions simulées.
Que faut-il comprendre ?
Pour les auteurs de l’étude, ce résultat clarifie les choses. Les IA sont performantes sur des tâches très structurées, comme la programmation ou encore l’analyse de données. C’est indéniable.
Pour autant, elles peinent encore à gérer des environnements changeants et imprévisibles sur le long terme. Les environnements trop statiques utilisés dans les benchmarks habituels ne reflètent donc pas, selon eux, la complexité du réel.
Ross Taylor, directeur général de General Reasoning et ancien chercheur chez Meta AI, insiste sur ce point. Pour lui, l’enthousiasme autour de l’automatisation masque encore une réalité plus nuancée.Dès qu’on sort des exercices cadrés, les systèmes actuels perdent en efficacité.
Quoi qu’il en soit, l’étude, encore non évaluée par des pairs, suffit à rappeler que confier ses paris sportifs à une IA est une très mauvaise idée.
- Partager l'article :

