intel gaudi2

Gaudi2 : tout savoir sur la nouvelle puce IA surpuissante d’Intel

vient de dévoiler sa nouvelle puce IA Gaudi2, deux fois plus puissante que la première génération. La firme cherche à concurrencer et AMD sur tous les fronts, et développe aussi de nouveaux GPU. Découvrez tout ce que vous devez savoir.

Le domaine de l'intelligence artificielle est en plein essor. En 2022, selon IDC, les dépenses dans cette technologie devraient augmenter de 20% pour atteindre 433 milliards de dollars. Le prend de l'ampleur, et les constructeurs informatiques ne veulent surtout pas rater le train de l'IA.

Dans ce contexte, Intel vient de dévoiler sa nouvelle puce d' le 10 mai 2022 lors de sa conférence Vision. Le but de la firme est notamment de reprendre des parts du marché à Nvidia, AMD et autres concurrents.

Gaudi2 vs Gaudi1

 

Cette nouvelle puce Gaudi2 est conçue par le Habana Labs, basé en Israël et acquis par Intel fin 2019 pour 2 milliards de dollars. Elle est deux fois plus rapide que la première version, et devrait être intégrée aux serveurs d'ici la fin de l'année 2022.

L'architecture front-end GEMM (general matrix multiply) de Gaudi1 était back-ended par dix Tensor Processor Cores (TPC), mais seuls huit d'entre eux étaient exposés aux utilisateurs. Cette puce était notamment implémentée dans le processus 16 nanomètres de TSMC, et offrait 24 MB de SRAM sur puce, quatre banques de mémoire HBM2 pour 32GB de capacité et 1 TB par seconde de bande-passante.

Pour l'heure, Intel n'a pas révélé de détails concernant l'architecture Gaudi2. On sait toutefois qu'elle sera basée sur le processus 7 nanomètres de TSMC et permettra de passer à 24 TPC au lieu de 10. Le nouveau format de données FP8 8-bit est pris en charge, comme sur les GPU Hopper GH100 lancés en mars 2022 par Nvidia.

Ce nouveau format de données permet d'avoir à la fois des données d'inférence à faible résolution et des données d'entraînement haute définition dans le même format, sans avoir à convertir les modèles lors du passage de l'entraînement à l'inférence.

La puce Gaudi2 embarque 48 MB de SRAM. Elle s'accompagne de bandes mémoire HBM2e offrant 2,45 TB/sec de bande-passante. Leur nombre n'a pas été révélé.

Elle est équipée de 24 ports Ethernet à 100GB/seconde, soit un pour chaque TPC. Le composant devrait se brancher dans un port PCI-Express 5.0, et consommera 650 watts.

Cette nouvelle puce devrait donc offrir des performances multiplées par 2,5 en comparaison avec Gaudi1. On ignore toutefois pour l'instant si des changements d'architecture et de cadence ont été apportés.

Les puces comme celles de la gamme Gaudi permettent d'accélérer les calculs mathématiques spécifiques de l'intelligence artificielle. En guise d'alternative, on peut aussi citer la Nvidia H100 conçu pour accompagner la révolution IA.

Elles simplifient et réduisent le coût de l'entraînement des modèles IA, qui apprennent en traitant les données complexes du monde réel pour trouver des patterns.

Ces composants permettent notamment d'améliorer la reconnaissance vocale ou le système autopilote des véhicules autonomes. La filière automobile d'Intel, Mobileye, entraîne ses systèmes IA sur Gaudi.

Une puce de troisième génération Gaudi3 est déjà en développement et apportera des performances accrues, davantage de mémoire et de meilleures capacités réseau.

GPU vs puces IA

Avec Gaudi2 et ses nouveaux GPU, le but d'Intel est de retrouver sa place de leader du marché de l'informatique. Au fil des deux dernières décennies, la firme a peu à peu perdu ce statut.

Pour cause, les CPU qui ont fait sa gloire ne sont plus sous le feu des projecteurs. Désormais, les GPU sont exploités pour l'intelligence artificielle et le principal constructeur de ces unités de traitement graphique est Nvidia. C'est la raison pour laquelle le market cap de Nvidia est estimé à 424 milliards de dollars, soit plus du double d'Intel à 181 milliards de dollars.

De nombreux constructeurs développent des puces IA spécifiques, mais Nvidia préfère continuer à se focaliser sur les GPU. Ces composants peuvent aussi être utilisés pour les superordinateurs et le HPC. Cette flexibilité est d'ailleurs le principal argument de vente de Nvidia.

Les entreprises plébiscitent la polyvalence des GPU, car elle leur permet de rester productifs en toutes circonstances et quelle que soit l'évolution d'un modèle IA. La filière de véhicules autonomes de General Motors, Cruise, loue par exemple des GPU Nvidia sur l'infrastructure Google Cloud pour profiter de leur logiciel IA plus mature et de leur extrême flexibilité.

De même, les GPU et leurs logiciels peuvent rapidement s'adapter aux incessants changements animant l'industrie de l'IA. Ils peuvent par exemple s'adapter aux nouvelles architectures, nouveaux types de layers ou à la fusion de modèles IA.

La guerre des puces IA

Outre Intel, de nombreuses startups travaillent sur des accélérateurs IA spécialisés. On peut citer Graphcore, SambaNova Systems, Tenstorrent ou encore Cerebras. Selon le CEO de cette dernière, les GPU étaient plus adaptés que les CPU pour l'IA, mais restent trop limités par rapport aux puces dédiées.

Une bataille s'annonce sur ce marché nouveau pour les cinq prochaines années. Pour tirer son épingle du jeu, Intel pourrait adopter une stratégie tarifaire aggressive.

L'IA n'est plus l'apanage des géants tels qu' et , et un coût en baisse pourrait ouvrir le champ à de nouvelles applications comme la détection de fraude, la surveillance des cultures ou l'analyse d'images médicales.

Puces IA et GPU : Intel combat sur tous les fronts

Toutefois, Intel mise à la fois sur les GPU versatiles et les accélérateurs IA spécialisés. Le GPU Ponte Vecchio fournit sa puissance au superordinateur Aurora du Argonne National Laboratory qui devrait entrer en activité d'ici la fin 2022.

Par la suite, en 2023, Intel commencera à vendre le Ponte Vecchio à un marché plus large. La firme compte également développer des successeurs à ce GPU, moins cher et en plus grande quantité.

La branche GPU est dirigée par Raja Koduri, qui a développé auparavant les GPU d'AMD et avant de rejoindre Intel en 2017. Il dirige aussi la nouvelle gamme de GPU Arc dédiée aux jeux vidéo.

Le premier produit de cette gamme, portant le nom de code Alchemist, est déjà en vente et de nouveaux produits seront commercialisés plus tard dans l'année pour les laptops et les PC de gaming. Les successeurs Battemage et Celestial sont en cours de développement sur la feuille de route qui s'étend à 2025.

En conclusion, Intel combat Nvidia et AMD sur tous les fronts. La firme américaine veut se placer en troisième joueur sur ce marché lucratif, et répondre aux besoins de tous les clients potentiels…

Newsletter

Envie de ne louper aucun de nos articles ? Abonnez vous pour recevoir chaque semaine les meilleurs actualités avant tout le monde.

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *