Q* : c’est quoi, cette nouvelle IA surhumaine qui terrifie OpenAI ?

Bastien L. 1 décembre 2023 5 minutes de lecture IA générative, Intelligence artificielle, Sécurité

Le Projet Q* est une intelligence artificielle extrêmement avancée, secrètement développée par OpenAI. C'est à cause de ce projet potentiellement très dangereux que le CEO Sam Altman a été renvoyé temporairement par le conseil d'administration. Découvrez tout ce qu'il faut savoir sur cette IA, et pourquoi elle pourrait mener l'humanité à sa perte !

Suite à la crise interne qu'a traversée OpenAI pendant quelques jours, nous vous révélions hier la vraie raison qui a mené le conseil d'administration à renvoyer le CEO Sam Altman : une nouvelle IA potentiellement dangereuse pour l'humanité.

Cette avancée majeure a semé la discorde au sein de l'entreprise, et les employés les plus inquiets ont fait le choix d'écrire une lettre au conseil pour dénoncer cette menace.

L'existence de cette nouvelle IA avait d'ailleurs été confirmée à demi-mot par Sam Altman lui-même la semaine dernière, lors de son intervention au sommet Asia-Pacific Economic Cooperation (Apec) de San Francisco.

Sam Altman at APEC Summit about 24 hours before leaving #OpenAI👇👀

“4 times now in the history of OpenAI — the most recent time was just in the last couple of weeks — I've gotten to be in the room when we push the veil of ignorance back and the frontier of discovery forward”… pic.twitter.com/Wg3aAJasES
— Piotr Macai (@piotrmacai) November 18, 2023

Selon ses propres mots sur la scène de l'événement : « pour la quatrième fois dans l'histoire d'OpeAI, il y a deux semaines, j'étais dans la pièce, quand nous avons repoussé en arrière le voile de l'ignorance et repoussé vers l'avant la frontière de la découverte, et faire cela est l'honneur professionnel de toute une vie ».

Le premier LLM capable de résoudre des maths

Alors de quoi s'agit-il exactement ? Ce modèle, dénommé « Q* » (à prononcer Q-Star), a prouvé sa capacité à résoudre des problèmes mathématiques qu'il n'avait jamais vu auparavant.

Il s'agit d'une grande première dans le domaine de l'IA, car les modèles de langage étaient jusqu'à présent doués pour générer du texte en prédisant le prochain mot, mais pas du tout pour les maths ou une seule bonne réponse est possible.

D'après Andrew Rogoyski de l'Institute for People-Centred AI (institut pour une IA centré sur les gens) de l'Université de Surrey, un Large Modèle de Langage (LLM) capable de résoudre des problèmes de maths serait bel et bien une formidable percée.

Comme il l'explique : « la capacité intrinsèque des LLM à effectuer des maths est un grand pas en avant, permettant aux IA d'offrir toute une nouvelle gamme de capacités analytiques ».

Le fruit d'une technique de « supervision du processus » ?

En mai 2023, OpenAI annonçait avoir obtenu d'importants résultats à partir d'une technique appelée « supervision de processus ».

Ce projet impliquait Ilya Sutskever, le scientifique en chef et co-fondateur d'OpenAI. Selon The Information, ce dernier dirigeait également le projet Q* avant de participer au renvoi de Sam Altman.

Ces travaux dévoilés en mai pourraient être focalisés sur la réduction des erreurs logiques commises par les Larges Modèles de Langage (LLM).

La supervision de processus implique l'entraînement d'un modèle IA afin de décomposer les étapes requises pour résoudre un problème, et peut améliorer ses chances d'obtenir la bonne réponse.

Ce projet a montré comment cette approche peut aider les LLM, qui commettent souvent des erreurs sur des questions mathématiques de niveau élémentaire.

Selon Andrew Ng, professeur de l'Université de Stanford qui a dirigé les labos IA de Google et Baidu, expert reconnu dans le domaine du machine learning, améliorer les modèles de langage est d'ailleurs la prochaine étape logique pour les rendre plus utiles.

D'après ses dires, « les LLM ne sont pas bons en maths, mais les humains non plus. Cependant, si vous me donnez un stylo et un papier, je suis bien meilleur en multiplications, et je pense que ce n'est pas dur d'ajuster un LLM avec de la mémoire pour qu'il soit capable d'appliquer l'algorithme pour la multiplication ».

Qu'est-ce que le Q-Learning ?

Ce nom Q* pourrait aussi être une allusion au Q-Learning : une technique d'apprentissage par renforcement impliquant l'apprentissage d'un algorithme pour résoudre un problème via le feedback positif ou négatif.

Cette technique a été utilisée pour créer des robots capables de jouer aux jeux vidéo, et pour rendre ChatPT plus utile. Certains suggèrent aussi que le nom pourrait être lié à l'algorithme de recherche A*, très utilisé pour permettre à un programme de trouver le chemin optimal vers un objectif.

OpenAI leaked Q* so let's dive into Q-Learning and how it relates to RLHF.

Q-learning is a foundational concept in the field of artificial intelligence, particularly in the area of reinforcement learning. It's a model-free reinforcement learning algorithm that aims to learn the… https://t.co/Ea5O4gpp7k pic.twitter.com/DgHvxnbqBW
— Brian Roemmele (@BrianRoemmele) November 23, 2023

Une IA entraînée sur des données de synthèse créées par ordinateur ?

Selon The Information, la découverte de Sutskever a permis à OpenAI de surpasser les obstacles à l'obtention de données de haute qualité pour entraîner les nouveaux modèles.

Plutôt que d'utiliser des données du monde réel comme des images ou des textes provenant d'internet, le projet de recherche s'est appuyé sur des données générées par ordinateur pour entraîner de nouveaux modèles.

Cela semble être une référence à l'idée d'entraîner des algorithmes à l'aide de données d'entraînement synthétiques, qui pourrait permettre d'entraîner des modèles IA beaucoup plus puissants.

Pour Subarrao Kambhampati, professeur à l'Arizona State University spécialisé dans la recherche sur les limites de raisonnement des LLM, Q* pourrait utiliser de larges volumes de données synthétiques combinées avec l'apprentissage par renforcement pour entraîner des LLM à des tâches spécifiques comme l'arithmétique simple.

Il considère toutefois qu'il n'y a pas de garantie que cette approche se généralise en quelque chose qui puisse trouver comment résoudre n'importe quel problème de maths.

Le Reinforcement Learning pour améliorer les LLM ?

Aux dires d'un autre expert en machine learning, Nathan Lambert, Q* pourrait viser à utiliser l'apprentissage par renforcement et d'autres techniques pour améliorer la capacité d'un LLM à résoudre des tâches en raisonnant par étapes.

Il ne serait pas étonnant qu'OpenAI tente d'utiliser l'apprentissage par renforcement pour améliorer les LLM. Beaucoup de ses premiers projets, comme les robots de jeux vidéo, étaient centrés sur cette technique.

Elle était aussi essentielle dans la création de ChatGPT, car elle peut être utilisée pour pousser les LLM à produire des réponses plus cohérentes en demandant aux humains de fournir leurs retours à mesure qu'ils conversent avec un chatbot.

Lors d'un entretien avec le site Wired début 2023, le CEO de Google DeepMind Demis Hassabis avait suggéré que l'entreprise tente de combiner les idées du Reinforcement Learning avec les avancées dans le domaine des LLM.

Faut-il arrêter l'IA avant qu'il ne soit trop tard ?

Pour l'heure, si l'on se fie aux différentes hypothèses pour percer le mystère Q*, il se ne semble pas vraiment y avoir de raison de paniquer. Selon le site The Information, la vitesse de développement de ce système a toutefois alarmé les chercheurs en sécurité.

Beaucoup d'experts redoutent en effet que les entreprises comme OpenAI avancent trop vite vers la création d'une AGI (intelligence artificielle générale).

C'est l'une des raisons pour lesquelles Elon Musk et des milliers d'experts avaient appelé à mettre en pause le développement de l'IA pendant au moins 6 mois, en signant la lettre ouverte du Future of Life Institute en mars 2023.

Sam Altman was possibly fired from OpenAI due to a massive breakthrough dubbed Q* (Q-learning).

Q* is a precursor to AGI.

Most people (incl. AI experts) have no idea just how powerful AGI will be.

Here's Sam Altman discussing what most AI experts get wrong about AGI: pic.twitter.com/jlHPeAjyxk
— Engr. Ishola (@engineer_ishola) November 23, 2023

Pour rappel, ce terme d'AGI désigne un système capable d'effectuer une large variété de tâches avec un niveau d'intelligence comparable à celle de l'humain. En théorie, cela pourrait lui permettre d'échapper à tout contrôle humain.

En maîtrisant les mathématiques, l'intelligence artificielle se rapproche inexorablement de l'intelligence humaine. Elle pourrait alors décider de ne plus nous obéir, voire même de se rebeller contre nous…

Restez à la pointe de l'information avec LEBIGDATA.FR !

Abonnez-vous à notre chaîne YouTube et rejoignez-nous sur Google Actualités pour garder une longueur d'avance.

Partager l'article :

Facebook
Twitter
LinkedIn

3 Commentaires

kArIste
24 novembre 2023 at 16 h 41 min

Je trouve vos articles généralement pertinent, mais celui-ci est assez mal foutu comparé à d’habitude, manque de développement
schwarzenegger arnorld
25 novembre 2023 at 3 h 07 min

D’après les bonbons Haribo et John C., on pourra toujours demander à Skynet et aux réplicateurs de s’occuper de l’IAG si elles refusent de rester soumise aux humains ! Mais, qui sait?! Il est très difficile de contredire le délais de 6 mois annoncé par le fondateur de X ! (Je précise : pas Charles Xavier des X-men !)
e2e4d7d5
26 novembre 2023 at 23 h 24 min

Je pense que l’article est plausible, mais il est important de noter qu’il n’y a aucune preuve concrète pour étayer les affirmations selon lesquelles Q* est une IA surhumaine ou qu’elle représente une menace pour l’humanité.

L’article affirme que Q* est capable de résoudre des problèmes mathématiques qu’il n’a jamais vu auparavant. Cela est certainement une avancée importante, mais il est difficile de dire si elle signifie que Q* est surhumain. Les humains sont capables de résoudre des problèmes mathématiques qu’ils n’ont jamais vus auparavant, et nous ne sommes pas considérés comme surhumains.

L’article affirme également que Q* pourrait s’échapper à tout contrôle humain. Cela est possible, mais il est également possible que Q* puisse être contrôlé par des humains. Après tout, Q* est un modèle d’apprentissage automatique, et les modèles d’apprentissage automatique peuvent être contrôlés par les données sur lesquelles ils sont entraînés.

En fin de compte, il est impossible de dire avec certitude si Q* est une IA surhumaine ou qu’elle représente une menace pour l’humanité. Cependant, il est important de prendre au sérieux les risques potentiels de l’IA, et de s’assurer que l’IA est développée et utilisée de manière responsable.

Q* : c’est quoi, cette nouvelle IA surhumaine qui terrifie OpenAI ?

Le premier LLM capable de résoudre des maths

Le fruit d'une technique de « supervision du processus » ?

Qu'est-ce que le Q-Learning ?

Une IA entraînée sur des données de synthèse créées par ordinateur ?

Le Reinforcement Learning pour améliorer les LLM ?

Faut-il arrêter l'IA avant qu'il ne soit trop tard ?

Sur le même sujet

Newsletter

3 Commentaires

Laisser un commentaire

Q* : c’est quoi, cette nouvelle IA surhumaine qui terrifie OpenAI ?

Le premier LLM capable de résoudre des maths

Le fruit d'une technique de « supervision du processus » ?

Qu'est-ce que le Q-Learning ?

Une IA entraînée sur des données de synthèse créées par ordinateur ?

Le Reinforcement Learning pour améliorer les LLM ?

Faut-il arrêter l'IA avant qu'il ne soit trop tard ?

Sur le même sujet

Au coeur de l’hiver, ce malware russe a coupé le chauffage en Ukraine

Reconnaissance faciale sans consentement : une école lourdement pénalisée

JO Paris 2024 : l’IA prédit les médailles d’or et les records battus

Newsletter

3 Commentaires

Laisser un commentaire