2026-05-20T03:42:28+02:00

Le MIT crée une base de données qui apprend au fil du temps grâce à l’IA

Bastien L. Publié le 11 août 2020 Mis à jour le 20 mai 2026 3 minutes de lecture Analytics, Data Analytics, Intelligence artificielle

Le laboratoire CSAIL du MIT a créé un système de stockage de données basé sur l’intelligence artificielle. Grâce au Machine Learning, ce système est capable d’apprendre au fil du temps à s’optimiser de manière autonome pour traiter plus efficacement les requêtes des utilisateurs…

Face à la hausse massive du volume de données généré par l’humanité, il devient indispensable de réfléchir à de nouveaux systèmes de stockage. Pour que le Big Data soit avantageux, il est nécessaire de pouvoir continuer à stocker et à traiter les données.

La solution pourrait provenir du laboratoire Computer Science and Artificial Intelligence Laboratory (CSAIL) du MIT. Une équipe de chercheurs de ce laboratoire a créé un système de type » instance-optimized « .

Traditionnellement, les systèmes de stockage et les bases de données sont conçus pour être compatibles avec une large variété d’applications. Cette approche offre l’avantage de ne pas avoir à créer un nouveau système pour chaque application.

Néanmoins, les performances de ces systèmes ne sont pas maximisées. Pire encore, il est parfois nécessaire pour les administrateurs de les configurer manuellement pour chaque application pour que les performances soient correctes.

Au contraire, l’approche du MIT consiste à créer des systèmes capables de s’optimiser et de se réorganiser partiellement de manière autonome en fonction des données que l’on y stocke ou des workloads à traiter.

Selon le professeur Tim Kraska du MIT, « cela revient à créer un nouveau système de base de données pour chaque application, ce qui est économiquement impossible avec les designs de systèmes traditionnels « .

Le MIT veut révolutionner le stockage de données grâce au Machine Learning

Afin de concrétiser cette idée, Kraska et son équipe ont développé deux systèmes : Tsunami et Bao. Le premier, Tsunami, utilise le Machine Learning pour réorganiser automatiquement la disposition d’un ensemble de données en fonction du type de requête formulées par les utilisateurs.

Selon les premiers tests, cette approche permet d’exécuter les requêtes 10 fois plus rapidement que les systèmes traditionnels les plus performants. De plus, les ensembles de données peuvent être organisés en index 100 fois plus légers que d’ordinaire.

Le second système, Bao, se focalise sur l’amélioration de l’efficacité de l’optimisation de requête grâce au Machine Learning. Il est capable d’apprendre au fil du temps à mieux optimiser les requêtes en choisissant le meilleur » plan de requête » pour chaque situation.

Le système Bao est la première approche de l’optimisation de requête » basée sur l’apprentissage » à être pleinement intégré au fameux système de gestion de base de données PostgreSQL. Selon les tests, les plans de requêtes produits par Bao sont jusqu’à 50% plus rapides que ceux créés par l’optimisateur classique de PostgreSQL. Ce système pourrait donc fortement réduire le coût des services Cloud basés sur PostgreSQL comme Amazon Redshift.

En combinant les deux systèmes Tsunami et Bao, Kraska et son équipe espèrent créer le tout premier système de base de données » instance-optimized « . Ce système apporterait les meilleures performances pour chaque application sans paramétrage manuel.

Les développeurs seraient libérés de ce fastidieux labeur, tandis que les performances seraient accrues et les coûts réduits. À terme, les requêtes pourront non seulement être effectuées plus rapidement, mais pourraient aussi permettre de répondre à des questions qu’il n’était pas possible de traiter jusqu’à présent…