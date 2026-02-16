La startup d’inférence Modal Labs préparerait une levée qui double sa valeur

Avez-vous déjà entendu parler de Modal Labs ? La startup américaine spécialisée dans l’infrastructure d’inférence pour l’intelligence artificielle. Modal Labs a été fondée par Erik Bernhardsson en 2021 après plus de quinze années passées à diriger des équipes data, notamment chez Spotify et Better.com.

Elle développe des outils destinés à optimiser l’inférence. Cette dernière, pour info, une étape clé qui consiste à faire fonctionner un modèle d’IA déjà entraîné pour produire des réponses.

Améliorer cette phase permet de réduire les coûts informatiques et d’accélérer le temps de réponse. Un enjeu crucial pour les applications modernes d’intelligence artificielle.

Depuis ses débuts, Modal Labs a attiré des investisseurs de renom, dont Lux Capital et Redpoint Ventures, qui ont soutenu ses premières étapes de croissance. Et aujourd’hui, il paraît qu’elle est en discussion avec des investisseurs en capital-risque.

Modal Labs : une levée de fonds en vue ?

En effet, selon plusieurs sources proches du dossier, l’entreprise prévoit de lever des fonds. General Catalyst serait en discussion pour diriger ce tour de table.

Si cette opération se concrétise dans ces conditions, elle permettrait à l’entreprise de plus que doubler sa valeur, soit environ 2,5 milliards de dollars. Il y a moins de cinq mois, lors d’un tour de série B de 87 millions de dollars, sa valorisation atteignait 1,1 milliard de dollars.

Le chiffre d’affaires annuel récurrent de la société serait déjà proche des 50 millions de dollars. Toutefois, les négociations n’en seraient qu’à un stade préliminaire. Ce qui signifie que les conditions pourraient encore évoluer.

Cela dit, inutile de s’affoler car Erik Bernhardsson, cofondateur et PDG, a démenti l’existence d’une levée de fonds en cours. Il a expliqué que ses récents échanges avec des investisseurs relevaient simplement de discussions informelles.

Le fonds General Catalyst de son côté n’a pas donné suite aux sollicitations visant à confirmer ou infirmer ces informations.

L’inférence : le nouveau champ de bataille de l’IA ?

Pendant plusieurs années, l’attention du secteur s’est concentrée sur l’entraînement des modèles. Les entreprises rivalisaient pour construire les systèmes les plus puissants, les plus vastes, les plus impressionnants.

Cependant, cette phase spectaculaire n’est plus le seul enjeu stratégique. Désormais, la véritable bataille se situe dans l’inférence. Pourquoi ce basculement ? Parce que l’inférence est la partie visible et continue du service.

Contrairement à l’entraînement, qui est ponctuel, elle fonctionne en continu, parfois des millions de fois par jour. À grande échelle, elle représente la majorité des coûts opérationnels d’un système d’IA.

Tony Grayson, un conseiller stratégique indépendant, estime même que l’inférence peut représenter jusqu’à 80 à 90 % du coût total d’un système d’intelligence artificielle sur toute sa durée de vie. Ce changement redéfinit les priorités des investisseurs.

Le marché mondial de l’inférence IA devrait dépasser 250 milliards de dollars d’ici 2030, porté par la généralisation des assistants numériques et des outils automatisés. Dans ce contexte, la question n’est plus seulement de concevoir un modèle performant. Il faut pouvoir le déployer efficacement, à moindre coût et sans latence.

C’est précisément sur ce terrain que se positionne Modal Labs. L’entreprise ne crée pas de nouveaux modèles. Elle développe l’infrastructure qui permet de les faire fonctionner plus efficacement.

Qu’est-ce que cela implique concrètement ?

Cette dynamique pourrait redessiner le paysage du secteur. Les géants de la tech, habitués à concentrer leurs efforts sur l’entraînement et la taille des modèles, vont devoir repenser leurs infrastructures. Ce, pour rester compétitifs sur le plan des coûts et de la latence.

En parallèle, de nombreuses startups pourraient trouver des opportunités de croissance dans la spécialisation infrastructurelle. Comment ? En se concentrant sur des niches d’inférence ou des applications critiques nécessitant des temps de réponse ultra-rapides.

À terme, la valeur ne se mesure plus uniquement à la sophistication d’un modèle. Mais à sa capacité à fonctionner efficacement dans le monde réel, avec un coût maîtrisé et une expérience utilisateur fluide.

Enfin, pour les investisseurs et les utilisateurs, cette transition vers l’inférence comme champ de bataille ouvre plusieurs perspectives. D’un côté, les levées de fonds dans l’infrastructure d’IA pourraient exploser.

Car les acteurs capables de réduire la facture énergétique et matérielle d’une IA seront prisés. De l’autre, les entreprises clientes, de la finance aux assistants virtuels grand public, bénéficieront de services plus rapides et plus abordables.

