Avec Gemini 3.5 Flash, Google veut s’attaquer au coût des jetons, l’un des principaux freins à l’adoption massive de l’IA générative en entreprise. Ainsi, le géant américain abaisse fortement ses tarifs et multiplie les agents IA intégrés à Workspace et Google Cloud. Le groupe cherche à rendre l’IA agentielle plus viable économiquement face à OpenAI, Anthropic et aux modèles open source.
L’IA générative coûte très cher aux entreprises. Plus les agents IA se multiplient dans les outils métiers, plus les dépenses liées aux jetons explosent. Et elles commencent déjà à dépasser certains budgets annuels. Google cherche donc à résoudre ce problème avec Gemini 3.5 Flash, son nouveau modèle dévoilé lors de la conférence I/O 2026.
Le géant américain présente Gemini 3.5 Flash comme son offre propriétaire la plus économique à ce jour. Avec un tarif fixé à 1,50 dollar par million de jetons. Ainsi, Google veut convaincre les entreprises que l’IA agentielle peut devenir rentable à grande échelle.
Gemini 3.5 Flash veut répondre à l’explosion des coûts des agents IA
Depuis plusieurs mois, les entreprises expérimentent des agents IA qui automatisent des tâches complexes. Comme la recherche documentaire, la gestion d’e-mails, le support interne, l’analyse de données ou encore l’orchestration de workflows. Mais cela a un coût direct. Chaque interaction consomme des jetons, et les volumes augmentent rapidement.
Sundar Pichai, PDG de Google, affirme que “certaines organisations ont déjà consommé leur budget annuel de jetons alors que l’année est à peine entamée”. Le sujet devient donc critique pour les directions IT et les équipes financières.
Avec Gemini 3.5 Flash, Google promet un modèle plus rapide, moins coûteux et suffisamment performant pour alimenter des usages quotidiens à grande échelle. Cela nous rappelle tout de suite ce qu’Anthropic a adopté récemment avec Claude Opus 4.6. Dont les tarifs ont également baissé.
Gemini 3.5 Flash is here and it's our best model yet for getting things done quickly and efficiently.
— Google Gemini (@GeminiApp) May 19, 2026
Whether you need help with everyday tasks or multi-step creative projects, Gemini 3.5 Flash navigates real-world complexity to help you take action. #GoogleIO
Pour les analystes du secteur, cette évolution était inévitable. Les performances des grands modèles commencent à se rapprocher. Surtout vu la montée des modèles open source comme Qwen d’Alibaba. Ainsi, le prix devient un facteur différenciant important.
C’est pourquoi, réduire le coût des jetons est une nécessité pour conserver les clients entreprises. Particulièrement ceux qui cherchent à industrialiser leurs usages IA au-delà des simples preuves de concept.
Google mise sur une IA agentielle plus rentable et intégrée
Le lancement de Gemini 3.5 Flash ne vient pas seul. Google a également dévoilé plusieurs nouveaux produits destinés à renforcer son écosystème agentiel. Dont Gemini Spark et Omni Flash.
Présenté comme un agent personnel qui agit en arrière-plan, Gemini Spark peut accéder directement à Gmail, Docs, Sheets ou Slides afin d’exécuter des tâches pour les utilisateurs. L’agent peut compiler des informations et organiser des événements. Il peut aussi envoyer des rappels ou encore mettre à jour des tableaux en temps réel.
Surtout, Google insiste sur le fait que l’intégration native avec Google Workspace limite le recours aux API externes et réduit donc les coûts liés aux jetons. Le modèle économique devient alors aussi important que les capacités techniques.
Cette approche vise directement les nouveaux usages always-on, où des agents fonctionnent en continu dans l’environnement de travail des employés. Dans ce scénario, quelques centimes économisés sur chaque million de jetons peuvent représenter des millions de dollars à l’échelle d’un grand groupe.
Google a également présenté AntiGravity 2.0, une nouvelle version de sa plateforme multi-agents. Selon l’entreprise, cette infrastructure aurait permis de créer un système d’exploitation complet en seulement 12 heures pour moins de 1 000 dollars de crédits API. Avec cette démonstration, Google cherche surtout à montrer qu’il devient possible de développer des applications IA complexes sans d’énormes budgets.
Une guerre des prix IA qui accélère dans tout le secteur
L’annonce de Gemini 3.5 Flash confirme que le marché de l’IA générative entre dans une phase de compétition économique intense. Pendant près de deux ans, la bataille portait surtout sur la puissance des modèles. Désormais, les entreprises demandent davantage de visibilité sur les coûts, la rentabilité et la stabilité opérationnelle.
Google tente ainsi de se différencier face à OpenAI, Anthropic ou encore aux modèles open source qui progressent vite. Et chaque nouveau lancement devient une réponse stratégique à un concurrent.
Toutefois, cette accélération permanente crée des difficultés pour les entreprises. Les modèles évoluent à un rythme très rapide. Cela oblige les équipes techniques à tester continuellement de nouvelles versions, revoir leurs architectures et adapter leurs outils.
Pour de nombreuses organisations, le véritable défi est donc de réussir à standardiser l’IA générative durablement sans voir les coûts dériver. Et avec Gemini 3.5 Flash, Google prouve que la prochaine étape de l’IA d’entreprise reposera sur la capacité des modèles à offrir un retour sur investissement crédible.
- Partager l'article :
