Je ne veux pas vous inquiéter, mais l’IA bat déjà l’humain sur tous les benchmarks

L’humanité n’en aurait plus pour longtemps à en croire le dernier rapport AI Index. Les capacités de l’IA sont déjà supérieures aux nôtres.

Le rapport AI Index permet de suivre chaque année la progression de la recherche sur l’intelligence artificielle. Il aide également à mieux comprendre certaines facettes de l’industrie. Sa nouvelle édition creuse davantage la supériorité des modèles d’intelligence artificielle sur les hommes dans les benchmarks.

YouTube video

L’Institut pour l’intelligence artificielle centrée sur l’humain (HAI) s’occupe de la compilation de ce rapport. Précisons que cet institut est rattaché à l’université Stanford, aux États-Unis.

La rédaction du document revient à des chercheurs universitaires et à des experts de l’industrie. Cette année, il s’agit de la septième édition.

Ce nouveau numéro est plus riche en contenu. Il se penche notamment sur l’évolution rapide de la technologie et de son importance grandissante dans notre quotidien.

D’autre part, le panel de l’Institut HAI partage ses inquiétudes quant à l’explosion des coûts accompagnant les progrès en IA. En revanche, il sera surtout question ici de la performance de l’intelligence artificielle par rapport à celle des humains.

De nouveaux benchmarks pour nous comparer

L’intelligence artificielle bat les humains dans plusieurs domaines, dont les suivants :

  • Classification d’images (2015)
  • Compréhension de texte (2017)
  • Raisonnement visuel (2020)
  • Inférence du langage naturel (2021)

La technologie a connu une progression significative et rapide ces deux dernières années. Les benchmarks actuels deviennent obsolètes.

Les chercheurs doivent donc développer de nouveaux tests de performance. Sans cela, il ne sera pas possible de comparer nos capacités et de déterminer nos avantages restants.

Ces domaines que l’IA ne maîtrise pas encore

Les modèles d’intelligence artificielle ont encore du mal avec des tâches cognitives complexes, note le rapport AI Index. Celles-ci sont :

  • La résolution de problèmes mathématiques avancés
  • Le raisonnement visuel de bon sens

Soulignons qu’avoir du mal, ici, ne signifie pas contre-performance. Cela veut simplement dire que les modèles d’IA font légèrement moins bien que les humains.

Rappelons qu’en 2021, ils ne pouvaient résoudre que 6,9 % des problèmes sur MATH. En seulement deux ans, des modèles comme -4 sont passés à 84,3 % de réussite. Notons que la référence de base humaine reste à 90 %.

Par ailleurs, le score humain de référence en raisonnement de bon sens visuel est à 85 %. De 2022 à 2023, la performance de l’IA a connu un boost de 7,93 à 81,60 %.

Le prochain rapport AI Index s’annonce fou !

Malgré des progrès remarquables, les modèles d’IA continuent de souffrir encore d’hallucinations. Ils peuvent présenter des informations fausses comme des faits.

C’est là que les choses deviennent intéressantes pour le patron d’, . Rappelons que la start-up californienne développe les modèles GPT faisant tourner le populaire chatbot génératif .

L’intelligence artificielle s’améliore de manière exponentielle dans certains domaines. En ce qui concerne les hallucinations, GPT-4 a récemment montré des progrès considérables.

Dans une publication sur X, Altman évoque « l’année la plus intéressante de l’histoire de l’humanité ». Nous avons vu débarquer, ces dernières semaines, des modèles avec des capacités hors du commun — Suno AI, par exemple.

Le patron d’OpenAI conclut également sa phrase avec « à l’exception de toutes les années à venir ». Là où il veut en venir, c’est que les prochaines éditions du rapport AI Index ne feront que constater la supériorité grandissante de l’intelligence artificielle sur les humains.

Un avis que vous partagez également ?

Restez à la pointe de l'information avec LEBIGDATA.FR !

1 commentaires

1 commentaire

  1. Je ne suis pas inquiet !
    Les réponses des IA à mon propre test sont toujours sources de fou-rires!
    Au premier abord en tous cas, ensuite je m’inquiète de la perte de lucidité des experts auto qualifiés et par là de la majorité silencieuse, prompte à suivre des gourous ne pensant qu’à leurs propres intérêts.
    Conseil pour l’évaluation d’une IA: poser une question idiote dont vous (seul?) connaissez la réponse…

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Newsletter

La newsletter IA du futur

Rejoins nos 100 000 passionnés et experts et reçois en avant-première les dernières tendances de l’intelligence artificielle🔥