GPT-4.5 d’OpenAI est perçu comme un fiasco et un échec coûteux. De ce fait, l’entreprise est confronté à de vives critiques de la part des experts.
Lorsque GPT-4.5 a été annoncé, OpenAI laissait entendre qu’il serait nettement supérieur à GPT-4o. Pourtant, les résultats réels sont bien loin de cette promesse. Beaucoup d’experts critiquent son prix excessif, ses performances mitigées et son manque d’innovation.
Et pendant ce temps, la concurrence s’organise et prend de l’avance. Dans ce contexte, je me demande si OpenAI serait-il en train de perdre du terrain ?
Des performances en dessous des attentes
Prenons les tests concrets. Sur l’AIME (American Invitational Mathematics Examination), GPT-4.5 obtient seulement 36,7 %, alors que o3-mini atteint 87,3 % ! Un écart énorme qui remet en question la pertinence de ce modèle.
Quant aux capacités en codage, la situation est tout aussi préoccupante. Paul Gauthier, investisseur en technologie, a utilisé le benchmark Polyglot Coding d’Aider. Résultat ? GPT-4.5 arrive à la dixième place, largement distancé par Claude 3.7 Sonnet, qui domine le classement.
En revanche, sur certains aspects, il y a une légère amélioration. Son score au test multilingue MMMLU est passé à 85,1 %, contre 81,5 % pour GPT-4o.
De plus, il génère moins de réponses erronées et trompeuses. Mais soyons honnêtes : est-ce suffisant pour justifier son prix astronomique ?
Car, même si OpenAI tente de rassurer, les avis sont tranchés. Un expert interrogé par Ars Technica a même qualifié GPT-4.5 de citron, soulignant son manque d’efficacité.
De son côté, Andrej Karpathy, ancien chercheur chez OpenAI, reconnaît que GPT-4.5 est meilleur… mais de manière subtile et difficile à mesurer.
?ref_src=twsrc%5Etfw">February 28, 2025OMG OpenAI just dropped GPT-4.5 and I had to test it immediately!
— Julian Goldie SEO (@JulianGoldieSEO)
Spoiler alert: Claude 3.7 still writes better content.
What I cover in this breakdown:
• Quick overview of GPT-4.5's new features
• Side-by-side comparison with previous GPT versions
• Real test using my… pic.twitter.com/TUwhseGoJ7
Mais, GPT-4.5 n’a pas seulement des performances discutables. Son prix est un véritable obstacle !
Comparons les chiffres : GPT-4.5 coûte 75 dollars par million de jetons d’entrée et 150 dollars en sortie. Or, GPT-4o, qui offre des performances presque équivalentes, ne coûte que 2,50 dollars en entrée et 10 dollars en sortie. Une différence 30 fois plus chère, difficile à justifier.
En parallèle, o1 pro, un modèle d’OpenAI spécialisé en raisonnement, coûte 15 dollars en entrée et 60 dollars en sortie. Quant à o3-mini, qui dépasse GPT-4.5 dans plusieurs domaines, il est encore plus abordable : 1,10 dollars et 4,40 dollars.
OpenAI sous pression avec GPT-4.5 face à la concurrence
Face à ces critiques, OpenAI tente de minimiser l’impact. L’entreprise a présenté GPT-4.5 comme un aperçu de recherche. C’est une manière de dire qu’il ne s’agit pas d’un remplacement direct de GPT-4o. Mais malheureusement, cette justification convainc difficilement.
Et selon Sam Altman, PDG d’OpenAI, même lui admet que GPT-4.5 n’est pas un modèle conçu pour exceller en raisonnement.
Sur X (anciennement Twitter), il a écrit : « Ce modèle offre l’impression d’une conversation avec une personne qui prend le temps de réfléchir. », avant d’ajouter « Attention : ce n’est pas un modèle de raisonnement, il n’écrasera pas les benchmarks. »
Une déclaration qui en dit long. Ce n’est donc ni une avancée spectaculaire, ni une révolution technologique !
Et pendant qu’OpenAI peine à justifier l’existence de GPT-4.5, ses concurrents continuent d’innover. Anthropic, avec ses modèles de plus en plus performants, semble se rapprocher dangereusement du leadership.
Quant aux propres modèles d’OpenAI, o1 et o3, ils montrent qu’une autre approche, basée sur le raisonnement simulé, pourrait être bien plus prometteuse.
Et vous, que pensez-vous de GPT-4.5 ? Partagez votre avis en commentaire !
- Partager l'article :
je l’ai essayé. beaucoup d’erreurs et d’hallucinations. Open AI aurait du conserver Deep Research en version Pro à 200 boulles par mois afin de créer une demande au lieu de courrir après une stratégie de l’offre !