Meta révèle sa première puce IA personnalisée, un nouveau data center dédié à l’IA, un processeur vidéo évolutif et un nouvel assistant de codage IA.

Pionnier de l’IA dans les médias sociaux, Meta repousse les limites de l’innovation. Meta, autrefois Facebook, utilise depuis plus de dix ans l’IA pour dynamiser des produits tels que News Feed, Facebook Ads, Messenger et la réalité virtuelle. Face à une demande croissante de solutions d’IA avancées, il s’attaque désormais à une infrastructure d’IA plus innovante et efficace. Lors de l’événement AI Infra @ Scale, le géant de médias sociaux a dévoilé de nouveaux projets matériels et logiciels visant à soutenir la prochaine génération d’applications d’IA. Des experts de l’industrie se sont réunis lors de cet événement. Ils ont partagé leurs idées et expériences en matière de déploiement à grande échelle de systèmes d’IA.

Meta optimise l’IA avec un nouveau centre de données

Meta a annoncé la conception d’un nouveau centre de données d’IA, optimisé pour la formation et l’inférence des modèles d’IA. Les centres de données de Meta utiliseront sa puce (MTIA) pour accélérer les charges de travail de l’IA. Cela comprend des domaines tels que la vision par ordinateur et le traitement du langage naturel. En outre, l’entreprise a construit le Research Supercluster (RSC), un supercalculateur d’IA avec 16 000 GPU. Ce supercalculateur est utilisé pour former de grands modèles de langage, y compris le projet LLaMA. Mark Zuckerberg, PDG de cet entreprise a déclaré que ces efforts témoignent de leur engagement à améliorer l’utilisation de la technologie IA dans tous leurs domaines d’activité.

Meta brille dans l’IA avec son puissant accélérateur d’inférence

Bien que les puces d’inférence IA personnalisées ne soient pas nouvelles, Meta se diversifie avec sa puce MTIA. De même, Google a développé son unité de traitement de tenseur (TPU) au fil des années. En plus, Amazon détient ses propres puces d’inférence AWS depuis 2018.

L’inférence IA est essentielle pour Meta sur les réseaux sociaux : flux d’actualités, classement, compréhension, recommandations. Conscients que les processeurs traditionnels ne suffisent pas, ils ont conçu leur propre silicium.

Selon Amin Firoozshahian, chercheur chez Meta, « MTIA est une puce optimisée pour nos charges de travail spécifiques ». Meta est un important utilisateur de PyTorch, framework d’apprentissage automatique géré par la Fondation PyTorch de la Linux Foundation. Ainsi, avec MTIA, Meta vise à optimiser les charges de travail PyTorch à grande échelle.

La puce MTIA, basée sur un processus de 7 nm, peut atteindre jusqu’à 102,4 TOPS (trillions d’opérations par seconde). Elle s’inscrit dans une approche intégrée plus vaste de Meta, optimisant les opérations d’IA, le réseau, les data center et l’efficacité énergétique. Meta vise une solide infrastructure pour soutenir sa croissance en IA et traitement de données à grande échelle.

Un Data center futuriste taillé sur mesure pour l’IA

Depuis plus de dix ans, Meta a bâti son propre data center pour satisfaire les besoins de ses milliards d’utilisateurs. Jusqu’à présent, tout s’est bien déroulé. Cependant, la demande explosive de l’IA exige une évolution. Rachel Peterson, vice-présidente de la stratégie des centres de données, a souligné lors d’une table ronde à l’événement Infra @ scale : « Nos actuels centres de données sont de classe mondiale, écoénergétiques et ont convenablement servi nos charges de travail en IA. » Alors que l’utilisation de l’IA croît, une capacité de calcul plus importante est requise. Peterson a révélé que les puces d’IA peuvent consommer plus de cinq fois la puissance des serveurs CPU habituels.

Dans cette perspective, Meta a revu le refroidissement de son centre de données. Ils ont adopté un système de refroidissement liquide pour une efficacité énergétique maximale. L’objectif de Meta est d’assurer un refroidissement adéquat et une puissance suffisante pour alimenter l’IA, stimulant ainsi de nouvelles conceptions de centres de données. « En envisageant l’avenir, nous avons toujours cherché à planifier l’évolution de notre matériel et de nos systèmes d’IA pour posséder les infrastructures les plus performantes », a ajouté Peterson. L’entreprise s’engage à rester à la pointe de la technologie pour répondre à la demande croissante de l’IA. Elle vise à assurer des performances optimales dans son infrastructure de centres de données.