Avec Cosmos Reason 2, Nvidia en a fini avec une IA enfermée dans des interfaces. Le géant du GPU veut désormais l’ancrer dans le monde réel.

Jensen Huang l’avait annoncé l’an dernier. Nous entrons dans l’ère de l’IA physique. C’est-à-dire une technologie capable d’agir et de s’adapter dans le monde réel. Pas seulement de répondre à des prompts.Au CES 2026, Nvidia a remis une pièce dans la machine avec Cosmos Reason 2. Et cette fois, l’ambition ne se cache même plus.

C’est quoi en réalité ce Cosmos Reason 2 de Nvidia ?

Cosmos Reason 2 est la nouvelle version du modèle vision-langage de Nvidia dédié au raisonnement incarné. Pour faire simple, il s’agit d’une IA capable d’analyser ce qu’elle voit. elle est aussi en mesure de comprendre un contexte physique et de décider quoi faire ensuite.

Pour ceux qui ne savent pas encore, la première version, Cosmos Reason 1, avait déjà marqué des points. Elle introduisait une ontologie bidimensionnelle pour le raisonnement physique. Elle domine encore aujourd’hui le classement Hugging Face dédié à la compréhension vidéo du monde réel.

Cosmos Reason 2 de Nvidia conserve cette base solide, mais gagne en flexibilité. Les entreprises peuvent en effet personnaliser plus facilement leurs applications. Surtout, les agents physiques peuvent désormais planifier leurs prochaines actions. Un peu comme les agents logiciels le font déjà dans des workflows numériques.

On ne parle donc plus de robots qui exécutent une seule tâche en boucle. On parle de systèmes capables d’anticiper et de décider dans des environnements imprévisibles. Selon Kari Briski, vice-présidente en charge des logiciels d’IA générative chez Nvidia, la robotique est à un tournant. Les robots deviennent généralistes, sans perdre leur expertise.

La stratégie de la marque s’affirme

Cosmos Reason 2 de Nvidia ne sort pas de nulle part. Il s’inscrit dans une stratégie bien plus large. Parce que la marque veut fournir tout l’écosystème nécessaire à l’IA physique. Modèles ouverts, données, outils d’entraînement, simulations, tout y passe.

La firme a aussi dévoilé une nouvelle version de Cosmos Transfer. Cf’est un modèle pensé pour générer des simulations d’entraînement pour les robots. C’est évidemment un point clé. Car avant d’agir dans le monde réel, une IA doit s’entraîner beaucoup et dans des environnements crédibles.

Nvidia mise également sur ses autres briques. D’abord, le modèle vision-langage-action Gr00t pour la robotique. Puis, les modèles Nemotron pour l’IA agentique. Et maintenant, de nouveaux ajouts à la famille Nemotron : Speech, RAG et Safety.

Nemotron Speech promet une reconnaissance vocale en temps réel, dix fois plus rapide que les modèles concurrents. Nemotron RAG combine compréhension textuelle et visuelle pour fournir des informations multimodales plus pertinentes. Cela avec moins de ressources. Enfin, Nemotron Safety veille à éviter toute fuite de données sensibles.

