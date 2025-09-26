OpenAI veut remplacer ces 44 métiers par ChatGPT : es-tu concerné ?

Fini les QCM de lycée et les concours de code pour geeks insomniaques. OpenAI a sorti l’artillerie lourde avec GDPval, un benchmark conçu pour vérifier si GPT-5 (et Claude Opus 4.1 de chez Anthropic) peut rivaliser avec de vrais pros dans 44 métiers bien concrets. De l’infirmière au journaliste, l’IA doit désormais rendre des livrables crédibles, évalués par des experts aguerris. L’AGI ? Pas encore. Mais le pas franchi est déjà colossal.

Vous avez déjà vu un stagiaire pondre un rapport en une nuit ? GPT-5, lui, fait pareil… mais en une poignée de secondes.

Avec GDPval, OpenAI veut rompre avec les benchmarks traditionnels. Ici, pas de simples prompts textuels, mais des tâches réalistes : documents Word, présentations PowerPoint, feuilles Excel, plans techniques, vidéos montées. Le tout fourni avec contexte et fichiers de référence, puis évalué par des pros ayant en moyenne 14 ans d’expérience.

Le jeu d’épreuves compte 1 320 tâches, dont 220 accessibles en open source pour la communauté. Bref, un crash test grandeur nature.

Today we’re introducing GDPval, a new evaluation that measures AI on real-world, economically valuable tasks. Evals ground progress in evidence instead of speculation and help track how AI improves at the kind of work that matters most.https://t.co/uKPPDldVNS — OpenAI (@OpenAI) September 25, 2025

De l’infirmière au journaliste : le casting est large

Imaginez un casting de « Top Chef », mais version métiers : on y croise autant d’infirmières que d’ingénieurs, de journalistes que de managers financiers.

Les 44 professions sélectionnées couvrent 9 industries clés (santé, finance, immobilier, retail, manufacturing, médias, etc.). Pourquoi ces choix ? Parce qu’elles pèsent lourd dans le PIB américain. Et parce que ce sont des jobs où la création de valeur économique repose sur de la matière grise.

🏢 Immobilier, location et gestion locative

Concierges



Gestionnaires immobiliers et de copropriété



Agents immobiliers



Courtiers en immobilier



Employés de comptoir et de location



🏛️ Gouvernement / secteur public

Animateurs socioculturels et de loisirs



Agents de conformité / contrôleurs



Chefs d’équipe de la police et des détectives



Responsables des services administratifs



Travailleurs sociaux (enfance, famille, école)



🏭 Industrie et fabrication

Ingénieurs mécaniciens



Ingénieurs industriels



Acheteurs et responsables achats



Magasiniers, réception et expédition



Chefs d’équipe en production et exploitation



👨‍💻 Services professionnels, scientifiques et techniques

Développeurs de logiciels



Avocats



Comptables et auditeurs



Responsables des systèmes informatiques



Chefs de projet



🏥 Santé et action sociale

Infirmiers diplômés d’État



Infirmiers praticiens (nurse practitioners)



Directeurs des services médicaux et de santé



Chefs d’équipe administratifs (soutien de bureau)



Secrétaires et assistants médicaux



💰 Finance et assurance

Conseillers clientèle / service client



Analystes financiers et en investissement



Directeurs financiers



Conseillers en gestion de patrimoine



Agents de vente en valeurs mobilières, matières premières et services financiers



🛒 Commerce de détail

Pharmaciens



Chefs d’équipe des ventes au détail



Directeurs généraux et opérationnels



Détectives privés et enquêteurs



📦 Commerce de gros

Directeurs des ventes



Employés de saisie de commandes



Chefs d’équipe des ventes (hors détail)



Commerciaux B2B (hors produits techniques/scientifiques)



Commerciaux B2B (produits techniques et scientifiques)



🎥 Médias et production audiovisuelle

Techniciens audio et vidéo



Producteurs et réalisateurs



Journalistes, analystes de l’actualité et reporters



Monteurs vidéo et cinéma



Rédacteurs / éditeurs

OpenAI's new paper is less about the results and more a peek into what AI labs hope to achieve: automating all human jobs. GDPVal breaks down tasks that make up everyday jobs of the entire economy and measures AI performance on them. I bet by end of next year, we will saturate… pic.twitter.com/xkFAnYx0iQ — Deedy (@deedydas) September 26, 2025

GPT-5 contre Claude : le duel des cerveaux de silicium

Un peu comme comparer Messi et Ronaldo, sauf qu’ici, les deux sont en silicium.

GPT-5-high atteint 40,6 % de “victoires ou égalités” face aux experts humains.



atteint face aux experts humains. GPT-4o plafonnait à 13,7 % → soit un bond colossal en une génération.



plafonnait à → soit un bond colossal en une génération. Claude Opus 4.1 d’Anthropic, lui, grimpe jusqu’à 49 %.



OpenAI soupçonne même que l’avantage de Claude vient… de son style de mise en page plus agréable, qui séduit les évaluateurs. Comme quoi, même chez les machines, la forme compte autant que le fond.

OpenAI drops "GDPval", an important benchmark of real-world, economically valuable tasks (44 jobs, 1,320 tasks; 220-task gold set) on the gold set: • claude opus 4.1 tops human preference

• gpt-5 excels at accuracy/instruction following

• gemini 2.5 pro and grok 4 show… pic.twitter.com/POf47HsA94 — Haider. (@slow_developer) September 26, 2025

100 fois plus vite, 100 fois moins cher (mais pas 100 fois plus fiable)

Si l’IA était une start-up, elle serait déjà valorisée à des milliards rien que sur ce ratio.

Selon OpenAI, GPT-5 exécute ces tâches 100 fois plus vite et 100 fois moins cher qu’un humain. Tentant pour une entreprise, non ?

Sauf qu’il y a un hic : tout se fait en one shot, sans aller-retour, sans révision, sans prise en compte du feedback client. Bref, une Ferrari sans volant.

L’IA médecin, avocat ou flic ? Pas si simple

Si vous imaginez déjà GPT-5 en blouse blanche ou en robe d’avocat, calmez-vous.

Le benchmark montre vite ses limites :

pas de travail collaboratif ,



, pas de contexte long ,



, pas de dimension sociale (convaincre un jury, rassurer un patient, négocier un contrat).



Et puis les évaluations reposent sur des jugements humains, forcément biaisés par la forme. Bref, ce n’est pas encore un remplacement, mais plutôt un super assistant.

Au-delà du test, GPT-5 drague déjà la médecine

Pendant que GDPval fait ses preuves, GPT-5 commence à séduire la médecine.

En radiologie, en oncologie ou en ophtalmologie, le modèle surpasse déjà GPT-4o sur des datasets spécialisés. Sur un test en ophtalmo, il atteint même 96,5 % de précision, flirtant avec le niveau expert. Et tout ça en raisonnement multimodal (texte + image).

Ça reste sous supervision humaine, mais la trajectoire est claire : l’IA s’invite dans la salle de consultation.

AGI, toujours introuvable (mais la route se trace)

On s’emballe ? Pas si vite.

Sam Altman le dit lui-même : « Il manque encore quelque chose » pour parler d’AGI. Les critiques pointent d’ailleurs une communication un peu floue d’OpenAI (graphes incompréhensibles, hype marketing).

Sans compter le sujet sensible de la consommation énergétique des modèles, que l’entreprise n’éclaire pas complètement. Bref : l’AGI n’est pas pour demain, mais les jalons se posent.

Et mon job, dans tout ça ?

Alors, faut-il commencer à chercher une reconversion ? La réponse est nuancée. Oui, certaines tâches routinières seront automatisées. Non, l’humain ne disparaît pas : la créativité, l’itération, la responsabilité restent hors de portée des modèles.

GDPval n’est qu’un test, mais il démontre que l’IA entre, doucement mais sûrement, dans le cœur de nos métiers.

Et vous, avez-vous peur que l’IA remplace votre métier ? Ou pensez-vous au contraire être à l’abri ?Partagez votre avis en commentaire !

