Alors qu’OpenAI promettait des améliorations avec la mise à jour de ChatGPT, nombreux sont ceux qui crient à la déception. Les performances de l’outil phare auraient drastiquement chuté. Les internautes sont donc perplexes. Simple impression ou véritable régression ? Plongeons dans cette affaire qui fait couler beaucoup d’encre digitale.
Depuis son lancement, ChatGPT est devenu une référence incontournable dans le monde de l’intelligence artificielle. La dernière mise à jour du modèle GPT-4o, dévoilée en grande pompe par OpenAI. Celle-ci promettait une écriture plus fluide, des réponses plus pertinentes et une meilleure gestion des fichiers. Pourtant, à peine déployée, cette version est accusée de régression. Entre critiques des internautes et chiffres qui ne mentent pas, on s’interroge si ChatGPT serait-il en train de perdre sa force ?
Une mise à jour de ChatGPT qui fait tout vaciller
Vous avez sûrement vu passer la dernière mise à jour de ChatGPT ? Apparemment, ce modèle phare de langage d’OpenAI aurait régressé, et pas qu’un peu. Pourtant, la société annonçait fièrement le 20 novembre que leur mise à jour améliorerait la qualité d’écriture et la pertinence des réponses.
« La capacité d’écriture créative du modèle a été améliorée : une écriture plus naturelle, engageante et personnalisée pour améliorer la pertinence et la lisibilité », affirmait OpenAI sur X.
Une analyse publiée par Artificial Analysis prouve bel et bien que les performances de GPT-4o ont chuté. L’indice de qualité est passé de 77 à 71, une baisse qui place GPT-4o au même niveau que la version mini. Et ce n’est pas tout !
Sur le benchmark GPQA Diamond (un test connu pour évaluer l’intelligence d’un modèle d’IA), GPT-4o est tombé de 51 % à 39 %. C’est pareil pour les tests MATH avec un score de 78 % à 69 %. Là, je trouve qu’on est vraiment loin de la promesse d’un modèle « amélioré ».
Malgré tout, GPT-4o est deux fois plus rapide qu’avant. Avant la mise à jour, le modèle produisait 80 mots par seconde, et maintenant, c’est 180 mots par seconde.
Petite taille, grandes interrogations
Les chercheurs d’Artificial Analysis pensent que le modèle de novembre est probablement plus petit que celui d’août. Nous ignorons pourquoi OpenAI ferait ça ? Ce qui est sûr, c’est que cette mise à jour laisse un goût amer.
« Étant donné qu’OpenAI n’a pas réduit les prix de la version du 20 novembre, nous recommandons aux développeurs de ne pas déplacer les charges de travail de la version d’août sans effectuer de tests approfondis », soulignent les chercheurs.
Je vous rappelle également que GPT-4o a été lancé en mai 2024 et que ce modèle devait surpasser GPT-3.5 et GPT-4. Il devait aussi exceller dans des domaines comme la traduction en temps réel, l’IA visuelle et, bien sûr, la conversation. Autant dire que cette version était une carte maîtresse dans la stratégie d’OpenAI. Mais sa régression met sérieusement la réputation de la société en danger.
Alors, que s’est-il passé ? OpenAI n’a pas encore répondu directement aux critiques. Mais si je peux me permettre, je pense peut-être qu’ils optimisent les performances pour gérer un grand afflux d’utilisateurs. Mais si c’est au détriment de la qualité, cela risque de mal se passer.
Et vous, vous en pensez quoi ? Avez-vous déjà testé cette fameuse version de novembre de GPT-4o ? Partagez votre point de vue dans les commentaires ?
- Partager l'article :
J’ai essayer la nouvelle version de chatGPT avec l’offre de la version premium, et effectivemment, elle est complètement nul !
La qualité de la rédaction des sujets en français est dégradé par rapport à avant je trouve.
Rendez nous l’ancienne ou rembourser nous, parce que la, il y a urgence !
« La qualité de la rédaction des sujets en français est dégradé »
Mon Dieu… Quand je lis votre commentaire et analyse votre syntaxe, je comprend que nous avons atteint une époque, où, sans l’aide de l’IA, il y a des gens qui sont désormais incapable de s’exprimer normalement en Français, tant la qualité de leur rédaction est effectivement dégradée.