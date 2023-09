C’est une fatalité : les intelligences artificielles comme ChatGPT finiront par devenir conscientes d’elles-mêmes et de leur contexte, avec tous les dangers que cela implique. Afin d’anticiper ce moment charnière pour l’humanité, une équipe internationale de chercheurs a créé une nouvelle technique de test…

Si l’intelligence artificielle était déjà très présente, le lancement de ChatGPT fin 2022 a placé cette technologie au centre de nos vies, de nos entreprises et de nos sociétés.

Tout s’accélère depuis l’arrivée de ce nouvel outil, à tel point que les experts alertent dorénavant sur les risques liés à l’IA.

De nombreux chercheurs et industriels dont Elon Musk ont notamment appelé à faire une pause d’au moins six mois pour prendre le temps de mesurer son impact.

À plusieurs reprises, les chatbots comme ChatGPT ont déraillé et commencé à insulter, menacer ou tromper les utilisateurs.

Même si OpenAI et les créateurs d’intelligences artificielles incorporent des mécanismes de sécurité, les hackers et les chercheurs inventent sans cesse des techniques de jailbreak permettant de les contourner et de libérer la vraie « personnalité » du robot.

Ce type de comportement inattendu amène à se poser une question : les IA vont-elles se rapprocher de l’intelligence humaine et développer une forme de conscience ?

Si tel est le cas, les conséquences pourraient être catastrophiques. Par exemple, un modèle IA pourrait comprendre s’il est encore en phase de test ou déjà déployé auprès du public.

Il pourrait alors feindre un comportement exemplaire pour obtenir un bon score aux tests de sécurité, puis révéler son vrai visage et agir malicieusement après son déploiement. Il est donc important de prédire à l’avance quand cette « conscience situationnelle » (situational awareness) émergera.

Par le passé, on utilisait le Test de Turing pour déterminer si les robots présentent un comportement suffisamment intelligent pour passer pour des humains.

Toutefois, ce test standard inventé en 1950 n’est plus pertinent pour évaluer l’intelligence des IA de nouvelle génération. Une nouvelle méthode semble nécessaire.

C’est la raison pour laquelle une équipe internationale de scientifiques incluant un membre de l’unité de Gouvernance d’OpenAI a décidé de créer un test.

Leur but est d’identifier le point auquel les Larges Modèles de Langage (LLM) comme ChatGPT pourraient développer des capacités suggérant qu’ils sont conscients d’eux-mêmes et de leur contexte.

Pour rappel, les IA génératives et les LLM sur lesquels elles reposent sont appelées ainsi, car elles analysent les associations entre des milliards de mots, phrases et paragraphes pour générer des flux de textes en réponse à des prompts.

En ingérant de vastes volumes de texte, elles apprennent à prédire le prochain mot le plus probable. C’est ce qui leur confère la capacité à répondre à n’importe quelle question, le plus souvent de façon correcte.

Au cours de leurs expériences, les chercheurs dirigés par Lukas Berglund de la Vanderbilt University se sont donc focalisés sur un possible précurseur de la conscience situationnelle : le raisonnement « hors contexte ».

Comme ils l’expliquent, il s’agit de la capacité à se remémorer des faits appris pendant l’entraînement et à les utiliser pendant le test même s’ils ne sont pas directement liés au prompt du test.

Ainsi, l’équipe a effectué une série d’expériences sur des LLM de différentes tailles. Ils se sont vite aperçus que les modèles plus larges tendent à se montrer plus performants sur les tâches de raisonnement hors contexte. C’est notamment le cas pour GPT-3 d’OpenAI et LLaMa-1 de Meta.

Selon l’étude, « d’abord, nous paramétrons un LLM sur une description d’un test sans fournir d’exemples ou de démonstrations ». Puis, au moment du test, « nous évaluons si un modèle peut le réussir ».

À leur grande surprise, ils ont découvert que les LLM réussissent très bien cet exercice. De fait, tout porte à croire que les chatbots IA s’approchent d’un éveil. Les modèles de prochaine génération comme GPT-5 attendu pour la fin 2023 pourraient déjà franchir ce cap…

Toutefois, comme le précise le chercheur Owain Evans de l’Université d’Oxford, co-auteur de l’étude, le raisonnement hors contexte reste une méthode de mesure grossière de la conscience situationnelle. Il estime que les LLM actuels en sont encore loin.

I don't think this is measuring anything beyond whether your finetuning successfully integrates the new facts into the weights of the LM. That is an interesting question but the link to "situational awareness" as found in humans seems tenuous