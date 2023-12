Google Gemini est enfin disponible ! Après de nombreuses années de développement, cette IA annoncée comme celle qui va tuer GPT-4 va transformer tous les produits et services du géant californien. Elle devrait notamment permettre au chatbot Bard de surpasser ChatGPT ! Découvrez tout ce qu’il faut savoir !

Au fil des derniers mois, les GAFAM et les startups ont lancé de nombreux outils d’intelligence artificielle pour rebondir sur le fulgurant succès de ChatGPT. C’est notamment le cas de Google avec son chatbot Bard.

Toutefois, avec Gemini lancée ce 7 décembre 2023, Google ne se contente pas de proposer une énième application IA. Selon le CEO Sundar Pichai, c’est tout simplement le début d’une ère nouvelle.

D’après Pichai et le CEO de DeepMind, Demis Hassabis, c’est un immense bond en avant dans le domaine de l’IA qui va affecter tous les produits Google.

Pour rappel, Google avait déjà teasé Gemini lors de la conférence I/O destinée aux développeurs en juin 2023. À présent, cette IA est enfin disponible pour le grand public.

Google Gemini : c’est quoi exactement ?

Alors de quoi s’agit-il ? Ce n’est pas un chatbot comme Bard ou ChatGPT, mais un large modèle de langage (LLM) au même titre que GPT d’OpenAI.

Entraînée sur les Tensor Processing Units (TPU) de Google, Gemini est à la fois plus rapide et moins chère à exécuter que les précédents modèles de la firme comme PaLM.

En réalité, ce n’est pas un seul modèle, mais toute une nouvelle famille avec déjà trois déclinaisons. La principale, Gemini Pro, sera très bientôt incorporée à de nombreux services IA de Google et sert dès aujourd’hui de colonne vertébrale à Bard.

De leur côté, les développeurs vont pouvoir accéder à Gemini Pro via le Google Generative AI Studio ou Vertex AI sur Google Cloud à partir du 13 décembre 2023.

Gemini Ultra : le plus puissant LLM jamais conçu par Google

Une version encore plus large, Gemini Ultra, est le LLM le plus avancé que Google a créé jusqu’à ce jour. Il est principalement pensé pour les Data Centers et les applications d’entreprise.

À l’heure où la cybersécurité est devenue une priorité pour les entreprises, Google a mené des tests en interne et externe pour s’assurer que Gemini préserve la sécurité des données.

Consciente de ne pouvoir anticiper tous les vecteurs d’attaque pour cette technologie naissante, la firme prévoit de déployer la version Ultra très prudemment. Il s’agit selon Hassabis d’une beta contrôlée avec une zone d’expérimentation sécurisée pour ce modèle très avancé.

Responsibility and safety was built into Gemini from the start. 🛠️



From mitigating against potential harms emerging from its advanced multimodal capabilities to implementing world-class safeguards, we’re continuing to address new challenges: https://t.co/mwHZTDT3F8 #GeminiAI pic.twitter.com/vF0qvJgLA2 — Google DeepMind (@GoogleDeepMind) December 7, 2023

Gemini Nano : une version miniature pour les smartphones Android

Il existe également une version plus légère appelée Gemini Nano, conçue pour tourner nativement et hors-ligne sur les appareils Android.

Les utilisateurs du smartphone Pixel 8 Pro de Google vont être les premiers à profiter de nouvelles fonctionnalités basées sur cette IA.

AlphaCode 2 : le meilleur générateur de code IA ?

Selon Google, le codage informatique est un point sur lequel Gemini excelle tout particulièrement. Grâce à son nouveau système de génération de code AlphaCode 2, elle surpasse 85% des concurrents.

Auparavant, la première version d’AlphaCode ne dépassait que 50% des générateurs de code disponibles sur le marché. C’est donc un véritable atout pour les développeurs.

Un vent de révolution souffle sur la planète Google !

Ce LLM va aussi être intégré au moteur de recherche Google, à ses produits publicitaires, au navigateur Chrome et bien plus encore dans le monde entier.

Un an et une semaine après le lancement de ChatGPT par OpenAI, couronné par un succès planétaire, beaucoup ont oublié que Google a inventé la technologie à l’origine de GPT et de l’essor de l’IA.

À présent, la firme de Mountain View compte bien contre-attaquer pour reprendre son trône. En réalité, Gemini est le fruit de nombreuses années de travail et était peut-être même déjà prête avant même que ChatGPT voie le jour.

Malheureusement, comme à son habitude, Google fait passer les francophones au second plan. Dans un premier temps, Gemini ne sera disponible qu’en anglais.

Une seule IA pour défier ChatGPT, DALL-E et Whisper d’OpenAI

Présentée comme le GPT-killer tant attendu, Gemini va devoir prouver sa valeur face au modèle d’OpenAI. Toutefois, Google est convaincu que cette bataille est gagnée d’avance.

Les deux IA ont été comparées sur 32 benchmarks renommés, sur une large variété de tâches telles que la compréhension du langage multi-tâches ou la capacité à générer du code Python.

Sur 30 de ces 32 benchmarks, Demis Hassabis estime que Gemini est devant GPT-4. Son avantage provient principalement de sa capacité à comprendre et interagir avec la vidéo et l’audio.

Pour cause, dès sa conception, Gemini a été axé vers la multimodalité. Contrairement à OpenAI qui a créé DALL-E et Whisper, Google n’a pas entraîné de modèles séparés pour les images et la voix.

Built to be multimodal, Gemini can generalize, understand, operate across and combine different types of info — like text, images, audio, video and code. pic.twitter.com/C1gE5S9k46 — Google (@Google) December 6, 2023

Elle a construit un seul et unique modèle multisensoriel afin de créer un système généraliste. La firme s’intéresse tout particulièrement aux possibilités de mélanges entre tous ces différents modes via la collecte de données à partir d’une large variété d’inputs.

Les modèles Gemini les plus basiques peuvent uniquement traiter le texte, mais les variantes plus avancées comme Gemini Ultra peuvent travailler avec des images, de l’audio et même de la vidéo.

Et ce n’est qu’un début selon Hassabis. La firme prévoit aussi la prise en charge d’éléments liés à la robotique comme le sens du toucher et l’action…

Au fil du temps, Gemini s’étoffera de nouveaux sens, deviendra plus consciente et plus précise. Elle comprendra de mieux en mieux le monde qui l’entoure.

Toutefois, au-delà des benchmarks théoriques, c’est en testant Gemini que les utilisateurs détermineront si elle est vraiment supérieure à GPT ! À commencer par vous !