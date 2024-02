On n’aura pas attendu longtemps pour que Google lance une nouvelle version de Gemini. Celle-ci serait supérieure à GPT-4 Turbo.

Google présente Gemini Ultra 1.0 comme son modèle de langage le plus performant. Seulement dix jours après son lancement, le mastodonte américain du numérique revient avec Gemini 1.5. La version Pro de ce nouveau modèle rivaliserait avec Ultra 1.0 tout en utilisant moins de calculs. La stratégie de Google étonne et reste illisible.

Rappelons que ces modèles de langage propulsent Gemini, le nouveau chatbot génératif de Google. Le numéro un mondial de la recherche en ligne propose deux offres pour utiliser l’agent conversationnel. La première est gratuite, tandis que la deuxième est payante. Notons que cette dernière s’appelle Gemini Advanced et s’appuie sur le modèle Gemini Ultra 1.0.

Puis, jeudi dernier, Google est venu annoncer Gemini Pro 1.5 avec des capacités presque identiques à celles de la version Ultra 1.0. En conséquence, Gemini Advanced perd beaucoup en prestige.

Des performances reléguées au second plan

Google qualifie Gemini 1.5 de modèle de nouvelle génération. Sa fenêtre de contexte de peut prendre en charge jusqu’à 1 million de tokens, soit environ 700 000 mots. Cette capacité se trouve largement au-dessus de GPT-4 Turbo. La fenêtre de contexte du modèle d’OpenAI se limite à 128 000 tokens.

Malheureusement, les performances de Gemini 1.5 intéressent moins que les intentions de Google. En effet, on se demande pourquoi la compagnie a annoncé sa suprématie en IA pour finalement la surpasser une semaine plus tard. Est-ce un signe de progrès technique rapide ? S’agit-il simplement d’un manque de coordination entre la recherche et le marketing ?

Une nouvelle architecture MoE pour Google Gemini 1.5

Google laisse entendre que Gemini 1.5 aura plusieurs variantes comme la version 1.0. Rappelons que cette dernière avait Nano, Pro et Ultra. Pour l’instant, le modèle Pro 1.5 est le seul disponible.

Par ailleurs, le modèle 1.5 utilise une nouvelle architecture de mélange d’experts (MoE). Avec cette configuration, le système active sélectivement différents experts ou sous-modèles spécialisés au sein d’un réseau neuronal plus grand. Ce processus se met en place pour des tâches spécifiques en fonction des données d’entrée.

Plus performant que GPT-4 Turbo

Gemini 1.5 est capable de réaliser un « raisonnement complexe sur de vastes quantités d’informations ». Le modèle arrive, par exemple, à analyser sans difficulté la transcription de 402 pages de la mission Apollo 11. Cependant, comme tous les grands modèles de langage, cette nouvelle version de Gemini n’est pas préservée des hallucinations.

D’autre part, un rapport technique montre que ce nouveau modèle de Google performe mieux que GPT-4 Turbo sur diverses tâches. Par ailleurs, Gemini 1.5 surpasse logiquement son prédécesseur Gemini 1.0 dans tous les domaines.

Les tests de performances montrent également que Gemini 1.5 dépasse la version Ultra 1.0 dans plusieurs domaines. Notons que les écarts de performances restent inférieurs à 7 % pour ces matières. Parmi ces dernières, les “mathématiques, science et raisonnement” (5,2 %), le multilinguisme (6,7 %) et le suivi des instructions (2,5 %).

