Je ne veux pas vous inquiéter, mais l’IA bat déjà l’humain sur tous les benchmarks

Magloire B. 22 avril 2024 3 minutes de lecture IA générative, Intelligence artificielle

L'humanité n'en aurait plus pour longtemps à en croire le dernier rapport AI Index. Les capacités de l'IA sont déjà supérieures aux nôtres.

Le rapport AI Index permet de suivre chaque année la progression de la recherche sur l'intelligence artificielle. Il aide également à mieux comprendre certaines facettes de l'industrie. Sa nouvelle édition creuse davantage la supériorité des modèles d'intelligence artificielle sur les hommes dans les benchmarks.

L'Institut pour l'intelligence artificielle centrée sur l'humain (HAI) s'occupe de la compilation de ce rapport. Précisons que cet institut est rattaché à l'université Stanford, aux États-Unis.

La rédaction du document revient à des chercheurs universitaires et à des experts de l'industrie. Cette année, il s'agit de la septième édition.

Ce nouveau numéro est plus riche en contenu. Il se penche notamment sur l'évolution rapide de la technologie et de son importance grandissante dans notre quotidien.

D'autre part, le panel de l'Institut HAI partage ses inquiétudes quant à l'explosion des coûts accompagnant les progrès en IA. En revanche, il sera surtout question ici de la performance de l'intelligence artificielle par rapport à celle des humains.

De nouveaux benchmarks pour nous comparer

L'intelligence artificielle bat les humains dans plusieurs domaines, dont les suivants :

Classification d'images (2015)
Compréhension de texte (2017)
Raisonnement visuel (2020)
Inférence du langage naturel (2021)

La technologie a connu une progression significative et rapide ces deux dernières années. Les benchmarks actuels deviennent obsolètes.

Les chercheurs doivent donc développer de nouveaux tests de performance. Sans cela, il ne sera pas possible de comparer nos capacités et de déterminer nos avantages restants.

Ces domaines que l'IA ne maîtrise pas encore

Les modèles d'intelligence artificielle ont encore du mal avec des tâches cognitives complexes, note le rapport AI Index. Celles-ci sont :

La résolution de problèmes mathématiques avancés
Le raisonnement visuel de bon sens

Soulignons qu'avoir du mal, ici, ne signifie pas contre-performance. Cela veut simplement dire que les modèles d'IA font légèrement moins bien que les humains.

Rappelons qu'en 2021, ils ne pouvaient résoudre que 6,9 % des problèmes sur MATH. En seulement deux ans, des modèles comme GPT-4 sont passés à 84,3 % de réussite. Notons que la référence de base humaine reste à 90 %.

Par ailleurs, le score humain de référence en raisonnement de bon sens visuel est à 85 %. De 2022 à 2023, la performance de l'IA a connu un boost de 7,93 à 81,60 %.

Le prochain rapport AI Index s'annonce fou !

Malgré des progrès remarquables, les modèles d'IA continuent de souffrir encore d'hallucinations. Ils peuvent présenter des informations fausses comme des faits.

C'est là que les choses deviennent intéressantes pour le patron d'OpenAI, Sam Altman. Rappelons que la start-up californienne développe les modèles GPT faisant tourner le populaire chatbot génératif ChatGPT.

this is the most interesting year in human history, except for all future years
— Sam Altman (@sama) March 17, 2024

L'intelligence artificielle s'améliore de manière exponentielle dans certains domaines. En ce qui concerne les hallucinations, GPT-4 a récemment montré des progrès considérables.

Dans une publication sur X, Altman évoque « l'année la plus intéressante de l'histoire de l'humanité ». Nous avons vu débarquer, ces dernières semaines, des modèles avec des capacités hors du commun — Suno AI, par exemple.

Le patron d'OpenAI conclut également sa phrase avec « à l'exception de toutes les années à venir ». Là où il veut en venir, c'est que les prochaines éditions du rapport AI Index ne feront que constater la supériorité grandissante de l'intelligence artificielle sur les humains.

Un avis que vous partagez également ?

Restez à la pointe de l'information avec LEBIGDATA.FR !

Abonnez-vous à notre chaîne YouTube et rejoignez-nous sur Google Actualités pour garder une longueur d'avance.

Partager l'article :

Facebook
Twitter
LinkedIn

ChatGPT GPT OpenAI Sam Altman Twitter

1 commentaire

Myller
22 avril 2024 at 17 h 44 min

Je ne suis pas inquiet !
Les réponses des IA à mon propre test sont toujours sources de fou-rires!
Au premier abord en tous cas, ensuite je m’inquiète de la perte de lucidité des experts auto qualifiés et par là de la majorité silencieuse, prompte à suivre des gourous ne pensant qu’à leurs propres intérêts.
Conseil pour l’évaluation d’une IA: poser une question idiote dont vous (seul?) connaissez la réponse…

Je ne veux pas vous inquiéter, mais l’IA bat déjà l’humain sur tous les benchmarks

De nouveaux benchmarks pour nous comparer

Ces domaines que l'IA ne maîtrise pas encore

Le prochain rapport AI Index s'annonce fou !

Sur le même sujet

Newsletter

1 commentaire

Laisser un commentaire

Je ne veux pas vous inquiéter, mais l’IA bat déjà l’humain sur tous les benchmarks

De nouveaux benchmarks pour nous comparer

Ces domaines que l'IA ne maîtrise pas encore

Le prochain rapport AI Index s'annonce fou !

Sur le même sujet

L’IA Grok d’Elon Musk se nourrit de vos tweets ! Comment l’en empêcher ?

OpenAI dévoile son moteur de recherche IA, c’est un fiasco dès le début

Création de robots vivants : les scientifiques tirent l’alarme sur ce danger

Newsletter

1 commentaire

Laisser un commentaire