OpenAI dévoile o3 ! Cette nouvelle IA qui succède à o1 est capable de reproduire la façon dont l’humain raisonne, afin de fournir des réponses plus profondes et complexes aux questions et autres prompts. Découvrez son fonctionnement et ses capacités impressionnantes !
Ce vendredi 20 décembre, pour le dernier des 12 jours d’annonces de son « Shipmas », OpenAI a créé la surprise en dévoilant ses prochains modèles IA capables de raisonner.
Successeur de o1, qui vient tout juste de sortir en version complète après une preview début 2024, il s’agit de o3 et o3-mini.
o3, le successeur de o1 qui explose les benchmarks
Grâce à un nouveau processus de « private chain of thought » (chaîne de pensée privée), ces modèles s’interrompent pour examiner leur dialogue interne et planifier avant de répondre.
Il s’agit d’un « raisonnement simulé », allant par-delà les simples prédictions de mots des larges modèles de langage (LLM) comme GPT-4.
Selon OpenAI, o3 a battu le record sur le benchmark de raisonnement visuel ARC-AGI. Il a atteint un score de 75,7% dans les scénarios à faible puissance, et 87,5% à haute puissance. En comparaison, l’humain n’atteint que 85%.
En outre, le modèle a atteint un score de 96,7% sur le American Invitational Mathematics Exam de 2024. Il n’a raté qu’une seule question !
Concernant le test de biologie, physique et chimie GPQA Diamond, o3 a obtenu un score de 87,7%. Il a également résolu 25,2% des problèmes sur le benchmark Frontier Math de EpochAI. Aucun autre modèle n’avait dépassé 2%…
Le président de ARC Prize Foundation en personne a pris la parole pendant le stream en direct pour affirmer que « en voyant ces résultats, j’ai besoin de changer ma vision du monde sur ce que l’IA peut faire et ce dont elle est capable ».
Un coût totalement démesuré
Certains experts estiment déjà qu’o3 est si performante qu’on peut la considérer comme la première AGI supérieure à l’intelligence humaine.
Cependant, son gros problème actuel est son coût. Chaque réponse à un prompt coûte entre 30 dollars et 6000 dollars ! Pour lui faire passer un examen de mathématiques et de physique, OpenAI a ainsi dépensé 350 000 dollars…
Mais où est passé o2 ?
Vous vous demandez peut-être pourquoi OpenAI est passé directement de o1 à o3. En réalité, la firme souhaite simplement éviter les conflits autour de marque déposée avec l’opérateur téléphonique britannique O2.
D’ailleurs, le CEO Sam Altman a plaisanté lors de l’annonce en expliquant que cette IA est appelée o3 « dans la grande tradition d’OpenAI d’être vraiment, vraiment nulle avec les noms ».
o3-mini : une petite IA capable d’adapter sa vitesse
De son côté, o3-mini possède une fonctionnalité de pensée temporelle adaptative qui lui permet de varier une vitesse de traitement basse, moyenne ou élevée.
Malgré sa petite taille, cette variante miniature surpasse son prédécesseur o1 sur le benchmark Codeforces. Les paramètres de plus haute puissance produisent de meilleurs résultats.
Le raisonnement, prochain cap majeur dans l’évolution de l’IA ?
Cette annonce d’OpenAI survient à l’heure où d’autres entreprises développent leurs propres modèles à raisonnement. C’est le cas de Google, qui vient de dévoiler Gemini 2.0 Flash Thinking Experimental.
En novembre 2024, DeepSeek présentait DeepSeek-R1. Evoquons aussi le géant chinois Alibaba et son modèle ouvert QwQ.
Ces nouveaux modèles IA se basent sur les LLM traditionnels, mais sont ajustés pour suivre un processus de chaîne de pensée capable de considérer ses propres résultats pour simuler un raisonnement.
Celui-ci peut-être étendu par le temps d’exécution, plutôt que de se focaliser sur les améliorations pendant l’entraînement du modèle.
Cette approche était utilisée pour les LLM comme GPT-4, mais apporte de moins en moins d’améliorations depuis quelque temps.
Un plafond semble avoir été atteint, notamment à cause de la pénurie de données générées par l’humain avec lesquelles nourrir l’IA.
Comment tester OpenAI o3 ?
Ces nouveaux modèles seront d’abord mis à disposition des chercheurs, pour qu’ils puissent les tester. Dans un premier temps, OpenAI compte lancer o3-mini fin janvier 2025, puis o3 peu après.
Il faudra donc patienter pour pouvoir mettre la main sur ces IA et tester leurs capacités. Je pense personnellement qu’un modèle capable de réfléchir est beaucoup plus utile qu’un simple LLM comme GPT !
Et vous, qu’en pensez-vous ? Utilisez-vous o1 ? Pensez-vous que la simulation de raisonnement soit la piste à suivre pour poursuivre l’amélioration de l’intelligence artificielle ? Partagez votre avis en commentaire !
- Partager l'article :
Arrêtez avec vos titres pompeux SVP : « …dont chaque réponse coûte 6000$ » alors que dans le texte vous précisez que cela coûte entre 30$ et 6000$.
Quel intérêt de desinformer ?