Le nom de Yann LeCun circule partout depuis quelques jours. Et pour une fois, ce n’est pas pour parler de Llama ou du dernier débat technique sur X. Le chercheur à l’énergie infatigable prépare une sortie silencieuse, portée par un rêve très différent des ambitions actuelles de Meta.
Ce départ tient à une seule conviction : les grands modèles de langage ne mèneront pas à une intelligence proche de la nôtre. LeCun croit à une autre voie. Une voie centrée sur ce qu’il appelle les « modèles du monde ». Son idée centrale ? Un cube flottant
Yann LeCun et Meta
Les discussions autour du départ de LeCun n’étonnent pas ceux qui suivent ses prises de position. Cela fait des années qu’il affirme que les modèles textuels montrent leurs limites.
Pour lui, un système qui lit des milliards de phrases ne possède pas l’expérience sensorielle d’un enfant. Les déclarations du scientifique ont pris un ton plus tranchant ces derniers mois, au point de créer un fossé avec l’approche interne de Meta.
La situation a évolué à partir de l’arrivée de nouveaux responsables IA chez Meta. Alexandr Wang a pris la direction stratégique à seulement 28 ans. Son enthousiasme total pour les LLM a créé une hiérarchie inattendue.
LeCun s’est retrouvé sous la supervision directe d’un partisan opposé à sa vision. Cette configuration a renforcé la distance entre les ambitions de Meta et celles du chercheur.
Un autre élément a nourri le malaise : le recrutement de Shengjia Zhao. Meta a présenté son arrivée comme une percée sur les modèles à grande échelle. Pour LeCun, cette surenchère autour du gigantisme informatique n’apporte aucune réponse aux limites profondes des LLM. Il répète depuis des mois que le passage à l’échelle est une impasse théorique et pratique.
La structure interne de Meta a aggravé le flou. Le département IA fonctionne comme un puzzle mal assemblé, avec plusieurs groupes et titres qui se superposent. Les licenciements massifs du mois dernier ont confirmé que la maison était en plein rééquilibrage. Cette période a renforcé la volonté de LeCun de tourner la page.
C’est quoi cette histoire de cube flottant ?
Amazing how the Ray-Ban Meta glasses can help the visually impaired. https://t.co/w3ZxCFtTlE
— Yann LeCun (@ylecun) September 30, 2024
LeCun utilise depuis longtemps une expérience mentale simple pour illustrer sa vision. Il demande à chacun d’imaginer un cube en suspension. Puis de lui donner une rotation. Cette scène se forme sans effort dans notre esprit. Un LLM, lui, ne possède aucune représentation interne permettant de manipuler cet objet dans un espace cohérent.
Ce constat mène à une idée centrale : l’intelligence passe par une compréhension physique du monde, pas seulement par l’étude du langage. Selon LeCun, un chat domestique possède une vue plus fine de son environnement qu’un LLM entraîné sur des milliards de mots. Le chat manipule des objets, prévoit des trajectoires et anticipe des effets. Un modèle textuel ne peut que deviner des corrélations.
Dans son discours à Paris en février, LeCun a détaillé sa vision. Pour lui, un modèle du monde doit intégrer une représentation interne de l’état actuel d’une scène. Cette dernière doit permettre de prédire l’état suivant après une série d’actions. On s’éloigne des chaînes de tokens, au profit d’un raisonnement lié aux transformations du réel.
Cette approche demande des volumes de données sensorimotrices que les LLM ne possèdent pas. Un enfant de quatre ans a déjà assimilé une quantité gigantesque d’images, d’odeurs, de contacts, de sons. Ces données valent bien plus que les années de lecture condensée dans l’entraînement d’un modèle textuel. LeCun en conclut que les LLM ne peuvent pas atteindre une intelligence cohérente.
La démonstration du cube rotatif n’est pas un simple clin d’œil. C’est le symbole d’une IA qui apprendrait comme un être vivant : en interagissant avec le monde, pas en avalant du texte.
Donc maintenant, il va créer une IA qui pense le monde ?
Selon de nombreuses sources, LeCun prépare une start-up centrée sur ces modèles du monde. Rien d’officiel. Mais tout indique un départ orienté vers un projet très personnel. Le chercheur a déjà travaillé sur plusieurs prototypes chez Meta, dont une présentation vidéo construite autour du fameux cube.
Dans sa vision, une IA du futur doit analyser un état présent, chercher un état possible et déterminer un chemin efficace pour y arriver. Cela rappelle les méthodes classiques d’optimisation, sauf que la machine devra manipuler des représentations abstraites de scènes entières. LeCun parle d’une fonction d’énergie mesurant la cohérence entre deux états du monde.
Selon lui, une telle IA serait plus fiable, car ses mécanismes internes seraient transparents. Les systèmes actuels produisent du texte sans exposition de leur raisonnement. Le modèle du monde pourrait inclure des contrôles intégrés dès sa conception. Une structure plus explicite permettrait de réduire les comportements décalés.
LeCun ne promet rien. Les défis sont gigantesques. Construire un modèle du monde demande des moyens financiers vertigineux et des années de recherche. Même ainsi, rien n’assure un résultat concret. Pourtant, plusieurs chercheurs pensent que cette piste pourrait ouvrir une nouvelle génération d’interactions entre humains et machines.
- Partager l'article :

