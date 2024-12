La science a parlé ! Apparemment, les IA comme ChatGPT aussi peuvent devenir sénile ! Selon une étude récente, nos assistants numériques préférés pourraient vieillir et souffrir de déclin cognitif avec le temps. Plus fascinant encore, leurs performances à des tests standardisés ressemblent étrangement à celles de patients humains. Alors, faut-il se préparer à mettre à la retraite nos vieux modèles ?

L’idée que les IA puissent vieillir semblait autrefois inimaginable. Pourtant, une étude publiée le 20 décembre dans le BMJ dévoile une réalité surprenante. Les grands modèles linguistiques (LLM), comme ChatGPT ou Claude, devient sénile en vieillissant. Les chercheurs ont testé les capacités cognitives de ces IA en leur faisant passer un test standardisé appelé MoCA (Montreal Cognitive Assessment).

Ces programmes, conçus pour traiter et comprendre des milliards de données, ne seraient pas à l’abri des faiblesses mentales qui touchent aussi les humains. Alors, l’IA est-elle vraiment en passe de rivaliser avec l’intelligence humaine, ou sommes-nous en train de découvrir ses premières failles ?

ChatGPT et les autres IA deviennent séniles et perdent leurs neurones virtuels

Les humains ne sont sans doute pas les seuls à vieillir mentalement. Les chercheurs ont découvert que les grands modèles linguistiques (LLM) comme ChatGPT et consorts, montrent des signes de sénilité.

Dr. Roy Dayan, neurologue à l’Université hébraïque de Jérusalem, explique que « nos conclusions suggèrent que les neurologues pourraient bientôt traiter de nouveaux patients virtuels : des modèles d’intelligence artificielle présentant des troubles cognitifs ».

Les chercheurs ont même fait passer aux IA le test d’évaluation cognitive de Montréal (MoCA), un outil utilisé pour dépister les premiers signes de démence chez les humains.

Alors, comment s’en sortent nos IA de génie ? ChatGPT 4o a décroché le meilleur score avec un honorable 26/30, suivi de ChatGPT et Claude 3.5 Sonnet, qui se tiennent à 25/30. Mais Gemini 1.0, lui, traîne loin derrière, avec un maigre 16/30.

Je vous rappelle que dans ce genre de test, un score de 26 ou plus est généralement considéré comme normal. Par conséquent, « aucun de ces chatbots n’a véritablement réussi l’évaluation MoCA » ont souligné les chercheurs.

L’âge, cet ennemi implacable, même pour les chatbots

Ces IA ne loupent pas sur les questions de logique ou d’analyse textuelle. Leur point faible donc c’est tout ce qui touche à la coordination visuospatiale et l’organisation. Par exemple, une tâche où il faut connecter des chiffres et des lettres dans l’ordre… ils échouent totalement.

Les chercheurs vont même plus loin en comparant ces déficiences à celles des patients atteints d’atrophie corticale postérieure, une variante rare de la maladie d’Alzheimer.

Par ailleurs, les chatbots plus âgés (les versions plus anciennes) performent moins bien que leurs cadets. Par exemple, les modèles Gemini 1.0 et 1.5 affichent une différence de six points au MoCA, alors qu’ils n’ont qu’un an d’écart en termes de sortie.

Les chercheurs soupçonnent même une « démence à progression rapide » chez certaines IA. Et avec de tels résultats, les experts restent sceptiques sur l’idée que l’IA pourrait un jour remplacer les médecins. J’avoue clairement que si un chatbot commence à confondre votre test COVID avec votre note de restaurant, il vaut mieux rester du côté des humains pour l’instant.

Que pensez-vous de cette découverte ? Devenir sénile est-il une fatalité pour ChatGPT et les autres LLM ou est-ce simplement une étape à optimiser ? Discutez-en dans les commentaires !

