Il fallait qu'OpenAI balance du lourd pour calmer la concurrence, la start-up californienne dégaine GPT-4 Turbo. Le modèle est déjà numéro un.
OpenAI reprend la main dans la bataille des grands modèles de langage (LLM). Cette semaine, la start-up californienne a ouvert au grand public GPT-4 Turbo. Les premiers tests le placent devant ses concurrents les plus performants. Le nouveau modèle d'intelligence artificielle sert désormais de moteur au chatbot génératif ChatGPT.
À cause d'un GPT-4 vieillissant, OpenAI a vu ses principaux concurrents se rapprocher. Rappelons que le LLM a récemment perdu son leadership sur Chatbot Arena.
Le LLM n'arrivait plus à tenir la distance contre des adversaires comme Claude 3 Opus d'Anthropic ou Gemini Ultra 1.0 de Google.
La start-up californienne continue de dominer le marché des modèles d'intelligence artificielle générative. Néanmoins, elle se devait de réagir.
Tests d'évaluation : GPT-4 Turbo surclasse ses rivaux
Dans sa présentation, OpenAI promet aux utilisateurs un LLM plus concis dans ses réponses. Celui-ci adopte un langage plus conversationnel et n'abuse pas du verbe.
Sa maîtrise de l'écriture dépasse largement le niveau de son prédécesseur. Cela est également vrai pour sa connaissance des mathématiques et du codage. De plus, le nouveau LLM montre des améliorations significatives au niveau du raisonnement logique.
GPT-4 Turbo s'impose comme le modèle d'IA le plus performant du moment. Les résultats des différents tests d'évaluation en sont la preuve.
Benchmark MATH
- 1. GPT-4 Turbo avec 72,2 %
- 2. Claude 3 Opus avec 63,2 %
- 3. Gemini Pro 1.5 avec 58,5 %
MMLU
- 1. GPT-4 Turbo avec 86,5 %
- 2. Claude 3 Opus avec 84,1 %
- 3. Gemini Ultra 1.0 avec 83,7 %
HumanEval
- 1. GPT-4 Turbo avec 87,6 %
- 2. Claude 3 Opus avec 84,8 %
- 3. Gemini Ultra 1.0 avec 74,4 %
Cette impressionnante version “avec Vision”
Il faut savoir qu'OpenAI a également lancé GPT-4 Turbo avec Vision. Cette version du LLM peut interpréter des images et répondre à des questions sur celles-ci. Cette capacité de vision élargit la méthode de saisie de la requête qui est traditionnellement textuelle.
Cependant, la fonctionnalité possède encore des limitations, précise la start-up californienne. Elle ne peut pas « répondre à des questions détaillées sur l'emplacement de certains objets dans une image ».
La vision devrait vraisemblablement devenir le nouveau cheval de bataille des créateurs d'intelligence artificielle.
La semaine dernière, xAI, la start-up d'Elon Musk, a présenté Grok-1.5V. Il s'agit d'un modèle multimodal capable de traiter diverses informations visuelles.
Les options d'accès à GPT-4 Turbo
Depuis son ouverture au grand public, vous pouvez accéder à GPT-4 Turbo de plusieurs façons. D'abord, il y a l'API OpenAI permettant d'intégrer le LLM dans diverses applications.
Par ailleurs, la start-up californienne offre la possibilité d'utiliser son nouveau LLM dans le cadre de projets de recherche. Mais pour ce faire, elle doit donner son accord. Des plateformes tierces, comme Hugging Face, offrent également un accès.
Néanmoins, le moyen le plus pratique reste un abonnement ChatGPT Plus. Le chatbot génératif tourne avec le nouveau modèle avec l'offre payante.
Il faut également savoir que Copilot, le chatbot génératif de Microsoft, utilise également GPT-4 Turbo. Vous pouvez en profiter dès l'offre gratuite.
- Partager l'article :