La société américaine Databricks vient d’annoncer l’acquisition de Quotient AI. Il s’agit d’une startup spécialisée dans l’évaluation et l’entraînement des agents d’intelligence artificielle.
Grâce à cette opération, Databricks compte intégrer la technologie développée par Quotient AI dans ses propres solutions. Notamment Genie et Agent Bricks. Cette intégration doit permettre aux entreprises de surveiller de près le comportement de leurs agents une fois déployés en production.
Pour quelle raison particulière Databricks a choisi Quotient AI ?
Actuellement, construire un prototype d’agent d’IA est devenu relativement simple. Démontrer que ce système sera fiable dans des processus métiers complexes, en revanche, est une toute autre histoire.
Comme l’explique Dion Hinchcliffe du cabinet The Futurum Group. Les responsables IT se retrouvent souvent face à des questions très concrètes une fois les agents en production.
Pourquoi l’agent a-t-il pris telle décision ? Réagira-t-il de la même manière demain ? Et surtout, comment vérifier qu’il respecte les règles internes ou les obligations de conformité ?
Quotient AI est la réponse à ces interrogations. Dans un communiqué, Databricks explique même que Quotient AI a été créée pour combler un manque important dans l’écosystème de l’IA. Celui de l’évaluation continue et de l’apprentissage des agents une fois qu’ils fonctionnent réellement dans un environnement professionnel.
Pour ce faire, l’entreprise apporte des outils proposant des cadres d’évaluation précis et des boucles d’apprentissage basées sur le renforcement. Ces derniers permettent de mesurer les performances des agents, d’identifier les défaillances et d’améliorer leur comportement au fil du temps dans des environnements réels.
En quoi est-ce une approche révolutionnaire ?
Eh bien, Stephanie Walter, responsable de la pratique IA chez HyperFRAME Research, l’a expliqué. L’intérêt principal réside dans la spécialisation de cette approche.
Il ne s’agit pas simplement d’un apprentissage par renforcement générique. La technologie de Quotient AI peut être adaptée à des contextes très précis. Car dans une entreprise, apprendre son agent IA à bien accomplir une tâche de manière générale ne suffit pas.
Non, étant donné que les systèmes informatiques sont souvent complexes, avec des architectures de données spécifiques, des règles internes strictes et des obligations de conformité.
Le système de Quotient AI permet alors d’entraîner un agent pour qu’il travaille selon les règles propres à l’entreprise. Inutile de vous expliquer que cela réduit le risque d’erreur technique et de non conformité.
L’expertise de Quotient AI n’est d’ailleurs pas passée inaperçue sur le marché. D’après Ashish Chaturvedi de HFS Research, l’équipe de la startup a déjà contribué à améliorer la qualité de GitHub Copilot, l’un des rares outils d’IA largement utilisés à grande échelle dans les entreprises.
La fiabilité des agents d’IA : un défi partagé
Si vous voulez tout savoir, cette acquisition de Quotient AI s’inscrit dans une stratégie plus large menée par Databricks pour renforcer la fiabilité des agents d’IA à grande échelle.
Plus tôt cette année, l’entreprise avait déjà introduit une approche de récupération guidée selon InfoWorld. Elle est destinée à améliorer la manière dont les systèmes d’IA exploitent les données internes des organisations.
Plus récemment, elle a également dévoilé KARL. Il s’agit d’un agent de connaissance d’entreprise capable d’affiner ses réponses grâce à des retours d’expérience et à un apprentissage par renforcement personnalisé.
Cela dit, Databricks n’est pas seul à relever ce défi. D’autres acteurs du secteur des plateformes de données s’attaquent aux mêmes problèmes. Par exemple, Snowflake propose ses propres outils d’évaluation avec Cortex Agent Evaluations et son framework Agent GPA.
De son côté, Teradata adopte une stratégie différente. Son Enterprise AgentStack, combiné à un partenariat avec Google Cloud, met davantage l’accent sur la gouvernance, le contexte métier et les déploiements hybrides plutôt que sur l’évaluation au niveau du modèle.
L’écosystème continue d’ailleurs de s’élargir. Dataiku a par exemple développé des intégrations d’évaluation autour de Snowflake Cortex. Le monde open source propose aussi des alternatives, notamment avec LangSmith issu de l’écosystème LangChain.
Et bien sûr, les géants du cloud ne restent pas les bras croisés. Amazon Web Services, Google et Microsoft développent chacun leurs propres outils d’observabilité et d’évaluation pour l’IA.
- Partager l'article :

