2026-06-04T16:51:49+02:00

550 milliards de paramètres : NVIDIA dévoile son plus gros modèle open source

Tinah F. Publié le 4 juin 2026 Mis à jour le 4 juin 2026 2 minutes de lecture Intelligence artificielle

Nvidia vient de lancer Nemotron 3 Ultra, son nouveau modèle open source de 550 milliards de paramètres. Il est conçu pour alimenter une nouvelle génération d’agents IA capables de planifier, coder et raisonner sur de longues séquences.

Derrière cette montagne de paramètres, Nvidia cherche surtout à s’imposer dans l’univers des agents IA open source. Ces assistants de nouvelle génération ne se contentent plus de répondre à une question.

Ces systèmes peuvent planifier leurs actions et utiliser différents outils. Ils sont également capables d’enchaîner des tâches complexes avec une intervention humaine limitée. Et pour enfoncer le clou, le constructeur affirme que Nemotron 3 Ultra peut générer ses réponses jusqu’à cinq fois plus rapidement que certains modèles ouverts concurrents.

Avec son modèle open source, Nvidia vise la prochaine génération d’agents IA

Nemotron 3 Ultra n’est pas un simple modèle de plus dans le catalogue déjà bien rempli de Nvidia. L’objectif est beaucoup plus stratégique.

L’entreprise cible directement le marché des agents autonomes, considéré comme l’une des prochaines grandes évolutions de l’IA. Un agent IA va bien au-delà d’un chatbot classique. Il peut planifier ses actions, utiliser différents outils et même corriger certaines erreurs en cours de route.

Today we're shipping Nemotron 3 Ultra.

A 550B MoE frontier-intelligence open model built for long-running agents.

It delivers 5x faster inference and lowers the cost of complex agentic tasks by up to 30% versus other open frontier models. pic.twitter.com/FEXqvfzQFO
— NVIDIA AI (@NVIDIAAI) June 4, 2026

C’est précisément pour ce type de scénarios que Nemotron 3 Ultra a été conçu. Le modèle repose sur une architecture hybride mêlant Mamba-2 et Transformer au sein d’un système Mixture-of-Experts (MoE). Concrètement, le modèle n’utilise que les ressources dont il a besoin à un instant donné. De ce fait, il gagne en rapidité et en efficacité.

Selon Nvidia, cette approche permet d’effectuer davantage de cycles de raisonnement dans le même laps de temps. En théorie, l’agent accomplit donc plus de travail sans réclamer davantage de ressources.

Des performances déjà prouvées

Les chiffres avancés par Nvidia montrent un modèle open source performant sur plusieurs benchmarks liés aux agents IA.

Nemotron 3 Ultra atteint 91 % sur les tests de productivité d’agents. Le modèle se positionne donc au niveau de certains concurrents majeurs. Il affiche également de solides résultats dans le suivi des instructions, le travail professionnel et la gestion de très longs contextes.

infographie sur Nemotron 3 Ultra de Nvidia

Mais le classement partagé par Nvidia sur X met toutefois en évidence une réalité moins spectaculaire. Nemotron 3 Ultra ne domine pas systématiquement tous les classements. Sur la programmation ou la planification à très long terme, d’autres modèles comme GLM 5.1 ou Kimi K2.6 conservent certains avantages.

Les résultats sont solides, mais Nemotron 3 Ultra ne balaie pas non plus toute la concurrence. Une réalité qui rappelle qu’aucun acteur ne détient encore la formule magique de l’IA.

Quoi qu’il en soit, Nemotron 3 Ultra a de quoi séduire. L’un des principaux arguments de ce modèle de Nvidia réside dans son caractère open source. Cela signifie que les développeurs peuvent le modifier, l’adapter et l’entraîner pour répondre à des besoins très spécifiques.

Nvidia affirme d’ailleurs avoir optimisé le modèle pour plusieurs frameworks populaires d’agents IA, comme Hermes Agent, LangChain ou OpenClaw. De quoi faciliter son intégration dans des projets de programmation, de recherche ou d’automatisation.