leak openai projet q star

Q* : la 1ère IA capable de réfléchir ? Un leak révèle le secret d’OpenAI

Qu'est-ce que Q*, la mystérieuse IA surpuissante qui aurait créé la discorde au sein d' ? Un texte en fuite semble révéler les secrets de ce projet, avec une approche révolutionnaire qui pourrait rendre les chatbots comme beaucoup plus pertinents et dangereusement persuasifs…

En novembre 2023, une violente crise éclatait au sein d'OpenAI. Alors que le grand public était encore époustouflé par la découverte de ChatGPT, l'annonce avait surpris le monde entier : le CEO et fondateur de l'entreprise, Sam Altman, venait d'être viré du jour au lendemain.

Selon la version officielle du conseil d'administration, ce licenciement était lié à un manque de transparence de sa part. Les détails n'avaient toutefois pas été communiqués.

Quelques jours plus tard, face aux protestations massives des employés d'OpenAI, a finalement regagné son trône tandis que le conseil d'administration a été dissous pour en constituer un nouveau.

Toutefois, peu après cette mutinerie, une rumeur a commencé à circuler. Selon certaines sources, la raison pour laquelle Altman a été viré serait une découverte très dangereuse : une nouvelle IA si puissante qu'elle représenterait une grave menace.

Son nom de code : Project Q*. Cependant, très peu d'informations avaient fuité à son sujet. On avait seulement appris qu'elle était beaucoup plus douée que ChatGPT pour les mathématiques.

A priori, pas de quoi trembler de peur et provoquer un tel chaos dans une entreprise considérée comme le nouveau leader mondial de l'intelligence artificielle…

Jusqu'à présent, même 6 mois après, Q* était resté drapé de mystère et Sam Altman a même refusé d'aborder le sujet lors de son interview du 19 mars 2024 avec Lex Friedman.

C'était sans compter sur l'indiscrétion d'une source anonyme proche du dossier, qui vient de dévoiler la vraie nature de Q* et les raisons pour lesquelles elle terrifie les dirigeants d'OpenAI…

Un ChatGPT qui raisonne comme un humain

Ce leak provient du site PasteBin, permettant de stocker temporairement du texte. Il a été relayé par plusieurs comptes X, dont celui d'Ashutosh Shrivastava suivi par quelques 7000 personnes.

Selon ce texte, Q* est en fait un système de dialogue conçu par OpenAI pour améliorer l'approche traditionnelle de génération de dialogue par l'IA.

Comment ? En implémentant un « modèle basé sur l'énergie » (EBM). Très différente des méthodes de prédiction par token autorégressif, prévalentes à l'heure actuelle, cette approche vise à imiter la façon dont l'humain pense pour résoudre des problèmes complexes.

Par exemple, quand vous jouez aux échecs, un processus de délibération interne vous permet d'analyser en profondeur tous les mouvements potentiels.

Cette façon de penser permet une meilleure prise de décision que les réactions rapides et moins réfléchies. De la même manière, Q* se focalise sur l'inférence de variables latentes.

Cela n'est pas sans rappeler les constructions dans les modèles probabilistes et les modèles graphiques. Il s'agit donc d'un changement fondamental dans la façon dont les systèmes de dialogue fonctionnent…

L'EBM évalue l'énergie d'une réponse et sa pertinence

L'EBM au coeur de Q* fonctionne en évaluant la compatibilité d'une réponse avec un prompt via un résultat scalaire.

Ce résultat indique « l'énergie » de la réponse. Une valeur plus basse indique une haute compatibilité, et donc une meilleure réponse, tandis qu'une valeur plus haute suggère une faible compatibilité.

Ainsi, Q* évalue les réponses potentielles d'une façon holistique plutôt que de se contenter d'une prédiction de tokens séquentielle. Ceci lui permet de mieux comprendre la pertinence d'une réponse au prompt.

Le processus d'optimisation de Q* n'est pas conduit au sein de l'espace des lignes de texte possibles, mais dans un espace de représentation abstraite.

Les pensées ou les idées sont représentées sous une forme permettant la minimisation informatique du résultat scalaire de l'EBM, à la manière dont on cherche le chemin de moindre résistance dans un paysage.

Ce processus implique la descente graduelle : une méthode permettant de trouver le minimum d'une fonction. Elle est appliquée pour raffiner itérativement les représentations abstraites vers celle qui récoltent l'énergie la plus basse vis–à-vis du prompt.

Lorsqu'une représentation abstraite optimale est identifiée, minimisant le résultat de l'EBM, Q* utilise un décodeur autorégressif pour transformer cette pensée abstraite en réponse textuelle cohérente.

Cette étape sert de passerelle entre la compréhension conceptuelle et non linguistique du système de dialogue, et le résultat linguistique nécessaire pour l'interaction humaine.

Comment OpenAI a entraîné Q* ?

Pour entraîner le modèle EBM au sein de Q*, OpenAI a utilisé des paires de prompts et de réponses. Les paramètres du système ont été ajustés pour minimiser l'énergie des paires compatibles, tout en s'assurant que les paires incompatibles produisent des niveaux d'énergie supérieurs.

Ce processus d'entraînement peut incorporer des méthodes contrastives, permettant au système d'apprendre à différencier les paires compatibles et incompatibles.

En outre, les méthodes non-contrastives impliquent des techniques de régularisation pour contrôler la distribution des réponses à basse énergie à travers l'espace de toutes les réponses possibles.

Une révolution pour les chatbots IA

L'approche de Q* reposant sur les EBM pour la génération de dialogue se démarque fortement des techniques de modélisation de langage traditionnelles.

L'optimisation via un espace de représentation abstraite et l'utilisation d'inférence basée sur le gradient permet à cette IA de générer des réponses de façon plus efficace, raisonnée et potentiellement plus puissante.

Ce système promet des améliorations dans la qualité du texte généré, mais pourrait également servir de schéma pour les futurs progrès dans la capacité de l'IA à raisonner et à converser comme un véritable humain

Un grave danger pour la société ?

Cette fuite d'informations est à prendre avec des pincettes. Elle émane d'une source inconnue, et rien ne permet de confirmer son authenticité.

De plus, le compte X Flowers From The Future, connu pour détenir des informations secrètes sur l'industrie de l'IA, affirme que ce leak est basé sur l'avis de Yann LeCun au sujet de ce que Q* pourrait être.

D'après ses dires, quelqu'un aurait simplement « pris ses pensées sur les EBMs, les a donnés à ChatGPT, et lui a dit de les transformer en un billet de blog OpenAI ». Si tel est le cas, Q* pourrait donc être totalement différent.

Néanmoins, quelques jours plus tôt, un rapport commandé par le gouvernement américain nous a appris qu'un « laboratoire IA très connu » a créé une IA « si persuasive qu'elle pourrait détruire la démocratie en manipulant totalement l'opinion des électeurs ».

Le fonctionnement de Q* présenté à travers ce leak semble correspondre à cette description, puisque ce chatbot serait capable de choisir la réponse la plus pertinente à n'importe quel prompt

Et vous, pensez-vous que ce leak est authentique ? Faut-il craindre qu'une telle IA soit relaxée dans la nature ? Quelles pourraient être les conséquences ? Exprimez-vous en commentaire !

Newsletter

Envie de ne louper aucun de nos articles ? Abonnez vous pour recevoir chaque semaine les meilleurs actualités avant tout le monde.

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *