Comment les systèmes d’IA générative comme ChatGPT fonctionne réellement ? Les scientifiques eux-mêmes peuvent répondre « on ne sait pas » à cette question. Si les spécialistes peuvent former des outils basés sur l’intelligence artificielle, certaines de leurs capacités peuvent les dépasser.
ChatGPT : difficile d’expliquer précisément comment il fonctionne ou ce qu’il fera
Les outils d’IA comme ChatGPT peuvent fournir des réponses 100 % originales à des entrées humaines uniques, allant d’une série de mots à l’écriture de scripts ou à la génération d’une image d’une qualité exceptionnelle. Pour les utilisateurs, c’est presque magique. Pour les scientifiques aussi qui peuvent parfois être dépassés par les capacités de ces outils.
Interrogé sur le fonctionnement de ChatGPT et consort, Sam Bowman, professeur et chercheur sur l’IA à l’Université de New York, explique qu’il voit des millions de chiffres tourner quelques centaines de fois par seconde. Il ajoute ensuite « Nous n’avons tout simplement aucune idée de ce que cela signifie ».
https://twitter.com/teena_maddox/status/1681362243244503042?s=20
ChatGPT fonctionne dit-il sur ce qu’on appelle un réseau de neurones artificiels. Il s’agit d’un type d’IA modélisé sur le cerveau humain. Les programmes informatiques traditionnels disposent de règles explicitement codées. ChatGPT lui, apprend à détecter et à prédire des modèles au fil du temps.
De par cet auto-apprentissage, il est difficile d’expliquer précisément comment fonctionne ces outils d’IA générative comme ChatGPT ou ce qu’ils feront, ajoute Bowman. Cela peut conduire à des scénarios imprévisibles et même risqués. Par conséquent, il sera tout aussi difficile de les contrôler de manière fiable.
Il n’y a pas d’explication concise selon les scientifiques
Avec les réseaux de neurones utilisés sur un outil d’IA génératives comme ChatGPT, Bowman avoue qu’il n’y a pas d’explication concise sur comment il fonctionne. Pour mieux comprendre cette assertion, le professeur compare le fonctionnement de ChatGPT avec celui d’un programme informatique traditionnel comme Deep Blue par exemple.
Deep Blue est un superordinateur joueur d’échecs développé par IBM. Son fonctionnement s’explique simplement. Chaque morceau de code correspond à une fonction particulière, à un coup d’échec précis que le jeu effectuera. Avec l’intelligence artificielle qui apprend en permanence, difficile d’avoir une explication concise de son fonctionnement.
Les logiciels « normaux » sont construits et développés en profondeur et dans son intégralité par leurs concepteurs, contrairement aux outils d’IA comme ChatGPT. Avec ces derniers, les développeurs donnent une ébauche de plan et laissent ensuite ces systèmes se développer par eux-mêmes. C’est comme planter une graine sans savoir quelle forme exactement prendra la plante bien qu’on connaisse le processus de développement.
L’idée maintenant c’est de trouver les moyens de voir ce qui se passe exactement à l’intérieur des outils comme ChatGPT. Il faudrait trouver comment cartographier ces chiffres et en extraire le sens. Mais cela reste encore à ce stade extrêmement difficile, affirme le professeur Bowman.
- Partager l'article :