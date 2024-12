Google lance Gemini 2.0 : la deuxième version de son modèle IA. Il peut désormais raisonner, produire des images ou de l’audio, et se multiplier pour mener des tâches en toute autonomie. Avec cette nouvelle version, Google répond à la concurrence et termine 2024 en entrant dans la guerre des agents IA !

En mars 2023, quelques mois après le lancement triomphal de ChatGPT par OpenAI, Google lançait à son tour son propre chatbot IA : Gemini.

Initialement baptisé Bard, l’outil a changé de nom et a connu son lot de controverses. Il s’était notamment illustré par son refus de représenter positivement des personnes blanches, même lorsqu’il s’agissait de personnages historiques.

Néanmoins, au fil du temps et au gré des nouvelles versions, Gemini s’est hissé parmi les chatbots les plus réputés aux côtés de ChatGPT-4o ou Anthropic Claude.

À présent, comme une réponse à OpenAI et ses nouveaux outils lancés dans le cadre des 12 jours de « Shipmas » de décembre 2024, Google vient d’annoncer Gemini 2.0 !

Il s’agit d’une nouvelle famille de modèles IA, et la première version déployée est Gemini 2 Flash. Ce modèle est particulièrement rapide et léger, mais il s’avère aussi très puissant.

Ses performances surpassent la version précédente sur presque tous les benchmarks ! Selon Google, il est deux fois plus rapide que Gemini Pro 1.5.

D’après Demis Hassabis, le CEO de Google DeepMind, Gemini 2.0 Flash est un modèle de type « bête de somme » avec une faible latence et des performances accrues.

Il surpasse aussi tous les précédents modèles Gemini en termes de raisonnement et de compréhension visuelle. Il peut également traduire le discours audio en temps réel, et analyse mieux les vidéos que Gemini Pro 1.5.

On peut s’attendre au lancement prochain d’une version Pro, comme pour le premier Gemini. Ce nouveau modèle va alimenter tous les produits Gemini dont l’application Android, le chatbot et les diverses expériences…

Selon le CEO de Google , Sundar Pichai, Gemini 2 est doté de capacités avancées de raisonnement. Or, ces facultés seront prochainement incorporées à la fonctionnalité « AI Overviews » de Google Recherche pour offrir des réponses plus précises aux questions complexes à étapes multiples.

Par exemple, si vous bloquez face à un problème mathématique, vous pouvez uploader une photo de l’équation et AI Overview vous guidera vers la solution étape par étape.

De même, pour déboguer un code, il suffit de décrire le problème et AI Overview vous expliquera sa cause et rédigera une version corrigée.

Non seulement capable de raisonnement avancé comme OpenAI o1, Gemini 2 est une IA multimodale capable de produire du texte, du discours audio, des images et bien plus encore.

Jusqu’à présent, le premier Gemini avait besoin de faire appel à d’autres modèles comme Imagen pour effectuer ce type de tâches.

Thrilled to kick off the Gemini 2.0 era with Gemini 2.0 Flash, an update to our workhorse model that outperforms even 1.5 Pro at twice the speed. It has really great multilingual skills, and can natively call tools, like Google Search. It’s the first release in the Gemini 2.0… pic.twitter.com/pjndTAf1PY

D’après Google, Gemini 2 marque le début de « l’ère de l’IA agentique ». Si vous ne suivez pas l’actualité de l’intelligence artificielle, vous vous demandez peut-être ce que signifie ce terme…

Un agent IA est une entité capable d’effectuer des tâches sans intervention humaine. Il suffit de formuler une requête initiale, et l’agent se charge lui-même de poursuivre les différentes étapes jusqu’à apporter une réponse satisfaisante !

Ce type d’IA est en effet capable de créer différentes versions de lui-même pour effectuer plusieurs fonctions simultanément. Parallèlement au lancement de Gemini 2, Google a lancé un nouvel outil dénommé Deep Research et capable de chercher sur le web à votre place.

Le but ? Vous fournir un rapport sur un sujet complexe. Ce nouvel outil est directement incorporé à Gemini Advanced.

L’ère agentique est considérée comme la prochaine étape dans l’évolution de l’IA, après l’ère des chatbots avec lesquels il était seulement possible de converser ou de créer du contenu.

En réalité, ce nouvel arc a débuté avec l’arrivée d’OpenAI o1. Avec Gemini 2, Google rejoint à son tour OpenAI, Microsoft, Anthropic et Salesforce qui ont également lancé leurs agents.

Aux yeux d’Hassabis, « l’application pratique des agents IA est un domaine de recherche plein de possibilités passionnantes. Nous explorons cette nouvelle frontière avec une série de prototypes qui peuvent aider les gens à accomplir des tâches et à faire les choses ».

Cette série de produits inclut aussi le Project Astra : un assistant virtuel universel initialement dévoilé pendant la Google I.O. Elle intègre aussi le nouveau Project Mariner, visant à explorer le futur de l’interaction humain-agent en commençant par votre navigateur.

De son côté, Jules est un agent de code conçu pour aider les développeurs. Vous l’aurez compris : les agents seront la principale innovation du début 2025 dans le domaine de l’intelligence artificielle !

Dans un premier temps, Gemini 2 n’est disponible que pour les développeurs, ou en tant que modèle expérimental pour les abonnés à Gemini Advanced.

Si vous êtes abonné, vous pouvez choisir Gemini 2.0 Flash dans le menu déroulant dédié aux choix de modèle. Malgré sa qualification expérimentale, il fonctionne très bien selon les premiers retours.

De leur côté, les développeurs peuvent l’utiliser dans l’API Gemini ou le Google Gemini AI Studio. Au fil de l’année 2025, Gemini 2.0 sera progressivement incorporé à tous les produits Google…

We’re kicking off the start of our Gemini 2.0 era with Gemini 2.0 Flash, which outperforms 1.5 Pro on key benchmarks at 2X speed (see chart below). I’m especially excited to see the fast progress on coding, with more to come.

Developers can try an experimental version in AI… pic.twitter.com/iEAV8dzkaW

— Sundar Pichai (@sundarpichai) December 11, 2024