nvidia gtc 2022

Nvidia GTC 2022 : supercomputer IA, GPU H100, métavers… les meilleures annonces

Au court de la dernière décennie, Nvidia a su profiter de l’essor de l’intelligence artificielle. Ses GPU se sont révélés comme de précieux outils pour le Deep Learning. Face à une demande en hausse, la firme veut offrir encore davantage de puissance à ses clients.

Dans le cadre de sa conférence annuelle GTC 2022, Nvidia vient d’annoncer plusieurs produits dédiés à l’IA pour les entreprises. Au programme : une nouvelle architecture de processeur, un GPU pour Data Center, une super-puce Grace CPU, et un projet de superordinateur.

L’architecture Hopper et le H100

nvidia h100

Les systèmes de Machine Learning de type Transformer sont très populaires. On peut notamment citer OpenAI GPT ou DeepMind AlphaFold.

Ces modèles offrent de formidables possibilités, et leur taille augmente de manière expentielle au fil des mois. Alors que GPT-2 créé en 2019 contenait 1,5 milliard de paramètres, le Transformer de Google créé en 2021 en contenait 1,6 billion.

Toutefois, les ressources nécessaires à la création de ces modèles augmentent en proportion. L’entraînement des Transformers nécessite plusieurs mois, et Nvidia compte résoudre ce problème.

L’architecture Hopper est nommée en référence à Grace Hopper : amirale de l’US Navy et pionnière de l’informatique. Cette architecture permet d’accélérer l’entraînement des modèles Transformer sur GPU H100 en réduisant le temps nécessaire par 6 en comparaison avec les puces de précédentes générations. En outre, le Nvidia NVlink peut connecter jusqu’à 256 GPU H100 à une bande passante neuf fois plus élevée que la génération précédente.

Au total, le GPU H100 contient 80 milliards de transistors. Il s’agit du premier GPU compatible avec le PCIe Gen5. Il utilise HBM3, permettant une bande passante de 3TB/s. Selon Nvidia, un GPU H100 est trois fois plus rapide que la génération précédente A100 à FP16, FP32 et FP64 et six fois plus rapide à FP8.

Les performances pour l’entraînement d’un modèle Transformer sont multipliées par neuf avec un H100. L’entraînement ne prend donc que quelques jours au lieu de plusieurs semaines.

Le nouveau Grace CPU Superchip pour Data Center

nvidia grace superchip

Nvidia a aussi annoncé un nouveau CPU pour Data Center : le Grace CPU Superchip. Il s’agit en fait de deux CPU connectés directement via un nouveau NVLink-C2C à faible latence.

Cette puce est conçue pour les applications HPC et IA à grande échelle, aux côtés des GPU basés sur l’architecture Hopper. Elle peut être utilisée pour les systèmes CPU-only ou par les serveurs accélérés par GPU. Au total, elle cumule 144 coeurs ARM et 1Tb/s de bande passante mémoire.

Parallèlement à ses nouveaux produits hardware, Nvidia a aussi annoncé des mises à jour pour ses différents services logiciels IA. Ceci concerne notamment le SDK Maxine dédié aux améliorations audio et vidéo, et le SDK Riva utilisé pour la reconnaissance de discours et la conversion text-to-speech.

Eos : le superordinateur IA le plus rapide du monde

Profitant de cette conférence, Nvidia a annoncé être en train de développer un nouveau superordinateur IA : Eos. Selon la firme, lors de son déploiement sous quelques mois, il s’agira du supercomputer le plus rapide du monde.

Le système reposera sur l’architecture Hopper et contiendra 4600 GPU H100 pour délivrer 18,4 exaflops de performances IA. Toutefois, il sera utilisé uniquement pour la recherche interne au sein de Nvidia.

Plusieurs entreprises ont développé leur propre superordinateur IA à des fins de recherche interne au fil des dernières années. On peut notamment citer Micorosft, Tesla et Meta.

Ces systèmes ne sont pas comparables directement avec des superordinateurs classiques, car ils offrent un degré moindre de précision. C’est en partie ce qui a permis à plusieurs de ces firmes de se vanter d’avoir conçu le plus rapide au monde.

Toutefois, Jensen Huang, le CEO de Nvidia, a affirmé que Eos délivrerait une puissance de 275 petaFLOPS pour les tâches de supercomputer traditionnel. C’est 1,4 fois plus rapide que l’ordinateur scientifique le plus rapide des États-Unis à savoir IBM Summit.

La firme est convaincue qu’Eos sera le superordinateur IA le plus rapide du monde et servira de blueprint pour l’infrastructure IA la plus avancée pour les constructeurs et pour ses partenaires cloud.

Omniverse Cloud : une suite de services cloud pour les créateurs 3D

Toujours dans le cadre de la GTC, Nvidia a annoncé Omniverse Cloud : une suite de services cloud offrant aux artistes, créateurs, concepteurs et développeurs un accès instantané à la plateforme Omniverse de Nvidia pour la simulation et la collaboration sur le design 3D jusqu’à plusieurs milliards d’appareils.

Le service Nucleus Cloud est par exemple un outil de partage permettant de collaborer en un seul clic. Les artistes peuvent accéder à de larges scènes 3D et les éditer depuis n’importe où, sans avoir à transférer des ensembles de données massifs.

En outre, Omniverse Create est une application pour les créateurs, artistes et designers techniques. Elle permet de construire des mondes en 3D de manière interactive en temps réel. L’appli View quant à elle se destine aux utilisateurs non techniques pour visualiser des simulations ou des rendering en utilisant la plateforme GeForce NOW.

Selon le CEO Jensen Huang, les mondes virtuels vont prendre de l’importance en entreprise. Les gestionnaires d’usine pourront notamment concevoir un nouveau flux de production au sein d’un jumeau numérique, tandis que les ingénieurs software pourront tester de nouvelles versions de leurs logiciels de voitures autonomes.

Les créateurs peuvent utiliser Omniverse Cloud pour collaborer librement sur les modèles stockés sur le Nucleus Cloud. Un simple partage de lien suffit à inviter d’autres utilisateurs à participer. La puissance des systèmes RTX et GeForce les plus haut de gamme est accessible via Omniverse Create et View.

Durant le keynote de la GTC, Jensen Huang a présenté une démo illustrant le futur du design. On peut y voir trois designers humains collaborer avec une IA Omniverse Avatar au sein du cloud Omniverse, afin d’apporter des changements à un projet architectural.

Jetson AGX Orin : un nouveau cerveau IA pour robots

Nvidia poursuit aussi sa percée dans le domaine de la robotique, et vient de lancer le nouveau kit développeur Jetson AGX Orin à 1999 dollars. Ce petit appareil est huit fois plus puissant que Jetson AGX Xavier.

Il peut atteindre une vitesse de 275 TOPS (billions d’opérations par seconde), grâce à son CPU ARM à 12 coeurs, son GPU basé Ampere et de nombreuses améliorations de part et d’autre.

En outre, Nvidia apporte aussi son aide aux créateurs de robots avec la nouvelle plateforme Isaac Nova Orin incluant deux modules Jetson AGX Orin et les capteurs nécessaires au robot pour détecter le monde qui l’entoure. Cette plateforme peut prendre en charge jusqu’à six caméras, trois unités LiDAR et huit capteurs ultrasoniques. Ces nouveautés seront disponibles fin 2022.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.

Pin It on Pinterest