Gemma 4 12B

Gemma 4 12B : Google apporte l’IA multimodale sur les PC grand public

L’IA multimodale n’est plus réservée aux serveurs surpuissants. Grâce à Gemma 4 12B, Google entend apporter des fonctionnalités avancées directement sur les PC du quotidien, avec seulement 16 Go de mémoire.

Dans l’univers de l’IA, la taille est souvent devenue un argument marketing. Chaque nouveau modèle débarque avec plus de paramètres, des performances accrues et, au passage, des exigences matérielles toujours plus élevées. Gemma 4 12B, le nouveau modèle de Google, tente de changer les règles du jeu. La firme de Mountain View présente une IA capable de comprendre plusieurs types de contenus. Le tout dans un format suffisamment compact pour fonctionner sur un ordinateur portable.

Avec Gemma 4 12B, Google rapproche l’IA des utilisateurs 

Depuis plusieurs années, l’industrie de l’IA suit une logique simple. Les modèles deviennent toujours plus grands et plus puissants. Cette course aux paramètres a permis des avancées spectaculaires. Mais elle a aussi renforcé la dépendance aux infrastructures cloud.

Avec Gemma 4 12B, Google cherche à emprunter une autre voie. Le modèle se situe entre les versions les plus légères et les modèles beaucoup plus imposants de la famille Gemma. Selon l’entreprise, ses performances se rapprochent même de celles du modèle Gemma 26B sur plusieurs benchmarks. Tout en restant beaucoup moins gourmand en mémoire.

Concrètement, cela ouvre la porte à des usages locaux. L’analyse de documents, les assistants personnels ou encore l’automatisation de tâches pourraient s’exécuter directement sur l’appareil de l’utilisateur. Il en va de même pour de nombreuses applications multimodales. 

C’est une perspective séduisante pour ceux qui préfèrent éviter d’envoyer de manière systématique leurs données vers des serveurs distants.

Une architecture qui casse les habitudes

La véritable nouveauté se trouve toutefois sous le capot. En effet, les modèles multimodaux traditionnels utilisent généralement plusieurs briques spécialisées. Une pour les images, une autre pour l’audio. Puis un modèle de langage chargé d’assembler le tout. C’est efficace, mais gourmand en ressources.

Gemma 4 12B abandonne en grande partie cette approche. Les données visuelles et audio sont intégrées dans le réseau principal du modèle, sans passer par des encodeurs séparés.

De ce fait, le modèle effectue moins de calculs intermédiaires, consomme moins de mémoire et pourrait également réduire la latence. L’idée peut sembler évidente. En réalité, conserver de bonnes performances dans ces conditions est beaucoup plus complexe qu’il n’y paraît. 

Cette architecture permet également au modèle de gérer nativement l’audio. Une première pour un modèle intermédiaire de la gamme Gemma. Il peut ainsi transcrire, reformater ou traduire des contenus vocaux directement en local, sans connexion internet.

infographie Gemma 4 12B

Gemma 4 12B est déjà disponible !

Google ne compte pas garder Gemma 4 12B dans ses laboratoires. Le modèle est déjà accessible à travers plusieurs outils populaires de l’écosystème IA. Les développeurs peuvent notamment l’essayer dans LM Studio, Ollama ou encore les applications Google AI Edge Gallery et AI Edge Eloquent. Une interface en ligne de commande, LiteRT-LM, est également proposée pour les utilisateurs plus avancés.

L’entreprise met aussi à disposition les poids préentraînés du modèle sur des plateformes bien connues comme Hugging Face et Kaggle. De quoi permettre aux développeurs d’expérimenter rapidement avec Gemma 4 12B sans repartir de zéro.

Google fournit également une documentation complète pour accompagner l’arrivée du modèle. Un guide de démarrage rapide ainsi qu’une compatibilité étendue avec les principaux outils du secteur sont aussi au programme. 

Hugging Face Transformers, llama.cpp, MLX, SGLang ou encore vLLM figurent parmi les solutions prises en charge pour exécuter le modèle en local. Les développeurs souhaitant l’adapter à leurs propres besoins peuvent également s’appuyer sur Unsloth pour l’affinage.

Restez à la pointe de l'information avec LEBIGDATA.FR !

▶ Abonnez-vous à notre chaîne YouTube et Ajoutez-nous à vos favoris sur Google Actualités
Cliquez pour commenter

Newsletter

La newsletter IA du futur

Rejoins nos 100 000 passionnés et experts et reçois en avant-première les dernières tendances de l’intelligence artificielle🔥