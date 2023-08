Les entreprises d’intelligence artificielle comme OpenAI, Google ou Microsoft achètent des volumes titanesques de cartes graphiques Nvidia, et pourraient rapidement causer une pénurie de GPU dédiés au gaming pire que celle provoquée par les mineurs de cryptomonnaies… faut-il se précipiter sur les derniers stocks ?

L’intelligence artificielle générative et les outils tels que ChatGPT ou MidJourney ouvrent à l’humanité de nouvelles possibilités. La productivité des entreprises est décuplée, la créativité artistique est à portée de tous et de nombreuses personnes utilisent l’IA pour gagner de l’argent.

Cependant, cette technologie disruptive cache aussi un côté plus sombre. Nous vous avions déjà parlé des sous-traitants payés au lance-pierre pour entraîner les algorithmes, ou encore de l’impact massif sur l’environnement. À présent, l’intelligence artificielle est sur le point de provoquer une pénurie totale de cartes graphiques…

Pour cause, dans la guerre de l’IA sans merci à laquelle se livrent désormais les GAFAM, les GPU font office de munitions. Ils sont indispensables pour entraîner l’IA, et pour la faire fonctionner.

De manière générale, plus une entreprise possède de cartes graphiques, plus elle est en mesure de créer une intelligence artificielle puissante. C’est aussi un impératif pour les plateformes cloud.

Lors de son rapport annuel publié fin juillet 2023, Microsoft a confirmé aux investisseurs que les GPU sont « un matériau brut essentiel » pour sa branche cloud en pleine croissance et qu’ils sont « un facteur de risque de pannes » si la firme ne peut accéder à l’infrastructure dont elle a besoin.

Et compte tenu du budget quasiment illimité des géants de la tech, rien ne les empêche d’acheter tout le stock des fabricants comme Nvidia, Intel ou AMD…

Ce sont surtout les cartes graphiques H100 de Nvidia, référence incontestée dans le domaine, qui sont convoitées. Selon Andrej Karpathy, ancien directeur de l’IA chez Tesla et désormais cadre chez OpenAI, les commandes massives de GPU sont devenues le principal sujet de conversation dans la Silicon Valley.

Sur X (Twitter), il a partagé un billet de blog issu du forum Hacker News expliquant que « la capacité des clusters H110 à grande échelle des petits et grands fournisseurs de cloud s’épuise » et que la forte demande va continuer au minimum jusqu’à la fin 2024.

Les géants de la tech ont besoin de 432 000 GPU H100

Who’s getting how many H100s and when is top gossip of the valley rn https://t.co/AxarseOmg9 — Andrej Karpathy (@karpathy) August 2, 2023

D’après les estimations de l’auteur, OpenAI veut au moins 50 000 H100, Inflection en veut 22 000 pour son IA Pi, et les grands fournisseurs de cloud Azure, Google, AWS et Oracle en veulent 30 000 chacun.

De même, les fournisseurs de cloud privés comme Lambda et CoreWeave ont besoin d’un total de 100 000 cartes et Anthropic (le créateur de l’IA Claude), Helsing, Mistral et Character encore 10 000 chacun.

Il précise qu’il ne s’agit là que d’estimations, mais cela représente un total de 432 000 H100. Avec un tarif d’environ 35 000 dollars par unité, la vente de GPU pourrait donc rapporter 15 milliards de dollars à Nvidia…

Et son calcul ne tient même pas compte des entreprises chinoises telles que ByteDance (TikTok), Baidu et Tencent qui ont également besoin d’un grand nombre de H800. Plusieurs entreprises de la finance ont aussi besoin de milliers de A100 et H100, comme Jane Street, JP Morgan, Two Sigma ou Citadel.

Le bruit court également qu’Elon Musk aurait commandé d’immenses quantités de GPU pour sa nouvelle entreprise X.ai, visant à découvrir les secrets de l’univers grâce à l’IA…

Le Game of Thrones des cartes graphiques

Face à cette demande colossale, les plaisanteries vont bon train. Le CEO de la plateforme cloud Box a même une idée d’entreprise qui pourrait le rendre billionnaire : un AirBnB pour les cartes graphiques…

Free trillion dollar startup idea: Airbnb but for GPUs. — Aaron Levie (@levie) August 2, 2023

Pour David Katz, investisseur chez Radical Ventures, cette bataille pour l’accès aux puces IA s’apparente à la série Game of Thrones.

Pourtant, selon lui, une alternative est possible. L’an dernier, sa société d’investissement a misé sur CentML : une startup qui optimise les modèles de machine learning pour qu’ils fonctionnent plus vite avec moins de ressources de calcul.

Ceci démontre que les modèles à plusieurs milliards de paramètres peuvent tourner sur du hardware plus traditionnel. D’après lui, « il n’y a donc pas besoin d’un tel volume de GPU, et pas nécessairement du A100 ». L’offre de GPU du marché s’en trouve indirectement accrue.

Le carburant de l’entraînement d’IA

Néanmoins, comme le souligne Sid Sheth, CEO de d-Matrix, ces solutions de secours sont viables pour les entreprises travaillant sur l’inférence IA, mais pas pour celles qui entraînent leurs Larges Modèles de Langage (LLM) en partant de zéro.

Pour les entreprises entraînant leurs IA comme OpenAI, Anthropic, DeepMind, Google ou X.ai, il n’y a pas vraiment de substitut aux Nvidia H100.

En revanche, cela profite aux startups comme CoreWeave qui proposent l’accès à des GPU Nvidia via le cloud. En 2022, ses revenus ont dépassé 30 millions de dollars.

Elle devrait atteindre un chiffre d’affaires de 500 millions en 2023 et a déjà sécurisé 2 milliards de dollars de contrats pour 2024. L’un de ses principaux clients est Microsoft.

Les choses vont extrêmement vite, et cette entreprise dont personne n’avait entendu parler il y a quelques mois construit actuellement 12 Data Centers. Jamais un type de logiciel n’avait connu une adoption aussi rapide que l’IA.

L’infrastructure requise pour entraîner les modèles ne peut tout simplement pas suivre ce rythme effréné…

Vers une pénurie mondiale ?

De son côté, Nvidia affirme qu’il n’y a pas de risque de pénurie de GPU à proprement parler. En revanche, la firme reconnaît un problème dans la façon dont les cartes graphiques arrivent sur le marché.

Selon le vice-président Charlie Boyle, la firme fabrique d’immenses quantités de GPU, mais les fournisseurs cloud se heurtent aux précommandes déjà effectuées par les consommateurs.

Il est très facile de répondre à une commande individuelle, mais fournir plusieurs milliers de GPU peut nécessiter plus de temps.

Il s’agit aussi d’un problème logistique, car certains petits composants fournis par des tiers peuvent être difficiles à obtenir. Leur fabrication à l’échelle mondiale est limitée, et c’est ce qui ralentit la production de cartes graphiques dans sa globalité.

Quel impact pour les gamers et le grand public ?

Il y a quelques années, l’engouement pour les cryptomonnaies avait provoqué une pénurie des cartes graphiques dédiées au jeu vidéo. À présent, ce phénomène pourrait se reproduire à cause des achats massifs de GPU par les entreprises de l’IA.

De nombreux consommateurs se plaignent déjà que les Nvidia GeForce accessibles via le cloud soient déjà entièrement réservées par les entreprises d’intelligence artificielle, au même titre que les stocks physiques.

Outre Nvidia, les cartes graphiques AMD sont également accaparées par ces organisations. Par exemple, George Holtz a acheté de nombreuses Radeon RX 7900 XTX prisées par les joueurs pour l’entreprise Comma AI.

AMD (unlike Qualcomm) is a joy to buy chips from. 7.38 PFLOPS of compute was delivered today, with exaflops more to come.



Nice to see them more active on the ROCm GitHub, we are working on the layer above @__tinygrad__ pic.twitter.com/5yE11TVA5F — George Hotz 🌑 (@realGeorgeHotz) August 1, 2023

Cette demande massive risque bel et bien de causer une rupture de stock et de faire augmenter les prix de façon significative. En tant que joueur de jeu vidéo, il est donc judicieux de renouveler votre carte graphique avant qu’il ne soit trop tard…