Fable 5 freelances

Claude Fable 5 accélère encore : l’IA décroche un score inédit sur des missions de freelances

Le dernier test du RLI est sans appel ! Fable 5 surclasse tous ses rivaux sur des missions habituellement réalisées par des freelances. Avec 16,1 % au Remote Labor Index, l’IA d’Anthropic établit un nouveau record. 

Peu de temps après que l’administration Trump a autorisé un accès plus large à Fable 5, le modèle d’Anthropic enregistre déjà une performance remarquée. Il décroche un score inédit de 16,1 % sur le Remote Labor Index (RLI). Il s’agit d’un benchmark qui mesure sa capacité à accomplir des missions habituellement confiées à des freelances. Cette progression montre à quel point les agents d’IA gagnent rapidement en efficacité. 

Des performances inédites sur des projets réels

Le RLI ne ressemble pas aux benchmarks habituels. Ici, pas de QCM ni de simples problèmes de logique. Les chercheurs utilisent 240 projets réels représentant plus de 140 000 dollars de travail humain, répartis dans 23 domaines différents.

Les projets couvrent la conception 3D, l’architecture, le développement web, le montage vidéo, l’analyse de données ou encore le design graphique. Chaque mission comprend un brief client, des fichiers de travail et un livrable de référence réalisé par un professionnel rémunéré.

Des experts humains comparent ensuite le travail réalisé par l’IA avec celui d’un professionnel. Le but est de déterminer si un client accepterait ce travail sans hésiter. Sur ces missions confiées à des freelances, le verdict place Fable 5 largement en tête. Son taux d’automatisation atteint 16,1 %, contre 8,3 % pour Opus 4.8 et 6,3 % pour GPT-5.5

Le précédent meilleur score du benchmark plafonnait à 4,17 %. En moins de huit mois,e taux d’automatisation a plus que quadruplé. Plus intéressant encore, les chercheurs n’ont évalué que 218 projets sur 240 avant que l’accès à Fable 5 soit temporairement restreint par les autorités américaines. Selon leurs calculs, même dans le scénario le plus pessimiste, le modèle conserverait un score de 14,6 %. Toujours supérieur à tous ses concurrents.

Face à Fable 5, les freelances gardent encore une longueur d’avance

Le chiffre peut sembler inquiétant. Pourtant, il mérite quelques nuances. Un taux d’automatisation de 16,1 % signifie simplement que l’IA produit un résultat jugé au moins aussi bon qu’un humain sur environ un projet sur six. Les cinq autres missions nécessitent encore des corrections importantes, voire une reprise complète.

Les exemples publiés illustrent parfaitement cette réalité. Sur une mission consistant à recréer une bague de fiançailles en 3D, Fable 5 surclasse clairement les anciens modèles. Les rendus sont plus cohérents, les fichiers CAO mieux construits et le résultat paraît plus crédible.

Infographie qui montre le score de Fable 5 sur RLI

Tout n’est cependant pas parfait. Les évaluateurs soulignent que certains détails techniques restent insuffisants pour une utilisation professionnelle. Les griffes de la bague, par exemple, présentent encore des défauts de conception qu’un joaillier expérimenté repérerait immédiatement.

Certes, Fable 5 progresse, mais elle ne remplace pas encore l’expertise humaine sur les missions les plus complexes confiées à des freelances. Au-delà de ce record, le véritable enseignement de cette étude dépasse finalement le score lui-même. 

Restez à la pointe de l'information avec LEBIGDATA.FR !

▶ Abonnez-vous à notre chaîne YouTube et Ajoutez-nous à vos favoris sur Google Actualités
Cliquez pour commenter

Newsletter

La newsletter IA du futur

Rejoins nos 100 000 passionnés et experts et reçois en avant-première les dernières tendances de l’intelligence artificielle🔥