Dbt est un outil de transformation SQL open source qui exécute ses requêtes directement dans l’entrepôt de données cible. Ce Data Build Tool applique à l’analytique des pratiques issues du génie logiciel comme le versioning et les tests automatisés.
Depuis 2016, les équipes data cherchent un outil capable d’unifier transformation, documentation et tests dans un seul workflow reproductible. Dbt répond à ce besoin en déplaçant la logique de transformation vers le data warehouse au lieu des pipelines ETL externes. Son modèle open source a réuni une communauté de plus de 50 000 équipes actives chaque semaine à travers le monde. La fusion annoncée en octobre 2025 entre dbt Labs et Fivetran modifie le périmètre organisationnel et commercial du projet.
Un outil open-source transposant le génie logiciel aux transformations SQL
En août 2016, Tristan Handy, Drew Banin et Connor McArthur quittent RJMetrics. Ils fondent ensuite Fishtown Analytics, agence de conseil basée à Philadelphie. Pour accélérer leurs missions, ils créent un outil interne appliquant les principes du génie logiciel aux transformations SQL. Cet outil intègre versioning, tests et modularité pour les données dans Amazon Redshift.
L’équipe nomme leur outil dbt, pour data build tool. Celui-ci est partagé en open source sous licence Apache 2.0, sans objectif commercial initial. La startup Casper migre sa logique vers dbt après une semaine de test et la communauté croît de manière organique. Dès 2018, elle compte 350 membres Slack et 150 entreprises l’utilisent en production. En 2021, l’agence devient dbt Labs. Elle lève 150 millions de dollars en Série C pour développer dbt Cloud. En février 2022, une levée de 222 millions de dollars en Série D valorise l’entreprise à 4,2 milliards. Cet investissement est acté par Sequoia et Andreessen Horowitz.
Dbt propose une architecture ELT centrée sur le data warehouse
Les outils ETL classiques transforment les données avant de les charger. À l’inverse, dbt adopte le paradigme ELT (Extract, Load, Transform) et gère exclusivement la couche T. Il délègue l’extraction et le chargement à des connecteurs comme Fivetran ou Airbyte. Chaque modèle dbt est un simple fichier .sql contenant une instruction SELECT.
L’outil compile ces fichiers avec la logique de templating Jinja. Il exécute ensuite les requêtes directement dans l’entrepôt cible : Snowflake, BigQuery, Databricks ou Amazon Redshift. Les résultats sont matérialisés en tables, vues ou incremental tables. Le DAG (Directed Acyclic Graph) des dépendances est généré automatiquement via la macro ref().
Cette approche supprime la nécessité d’un câblage manuel.Ddbt intègre aussi un moteur de tests unitaires natifs pour valider les données. Il génère également une documentation HTML interactive publiée sur dbt Cloud. Depuis mai 2025, le moteur dbt Fusion est disponible en bêta pour Snowflake. Réécrit en Rust, il améliore le support du langage SQL.
Fivetran fusionne avec dbt Labs et le projet open-source évolue
La gouvernance du projet open source dbt Core tient sur un modèle communautaire strict. Chaque nouvelle version suit la convention SemVer. Toute rupture de compatibilité est annoncée avec un préavis d’une version mineure. En octobre 2025, dbt Labs annonce une fusion par échange d’actions avec le spécialiste de l’ingestion Fivetran. L’entité combinée génère 600 millions de dollars de revenus récurrents annuels et sert plus de 10 000 clients.
La valorisation potentielle de l’ensemble dépasse 10 milliards de dollars. George Fraser, fondateur de Fivetran, dirige la structure fusionnée. Tristan Handy conserve le rôle de président. Plus tôt en 2025, dbt Labs avait acquis SDF Labs à Seattle. Cela a renforcé ses capacités en gouvernance et compilation SQL. Un serveur MCP est intégré à partir d’octobre 2025. Il permet aux agents IA d’interroger les métadonnées dbt et d’automatiser les tâches.
La transformation de données avec dbt transposée à des secteurs variées
Des entreprises comme JetBlue, HubSpot, Nasdaq, Condé Nast et Gopuff utilisent dbt dans des contextes variés. Dans le secteur financier, Nasdaq consolide ses flux de données réglementaires avec dbt. Cet outil assure la conformité avec la directive MiFID II. La gestion de lignage native documente automatiquement l’origine des métriques. Dans l’e-commerce, Gopuff utilise les modèles incrémentiels de dbt. Cela limite la consommation de compute Snowflake aux données modifiées.
En 2023, dbt Mesh a introduit la décomposition des monolithes analytiques. Cette solution utilise des cross-project references et des contrats de données (data contracts). Elle s’aligne sur les principes du Data Mesh théorisé par Zhamak Dehghani en 2019. Chaque domaine devient propriétaire de ses transformations. Cela garantit la cohérence sémantique globale de l’entrepôt.
Les dépenses liées à l’utilisation de dbt Cloud selon les plans disponibles
La structure tarifaire de dbt Cloud tient sur deux leviers. Il y a d’abord les sièges développeur pour toute écriture ou déploiement de modèles SQL. Vous avez ensuite la consommation de runs, suivant le nombre de modèles construits avec succès par mois. Le plan Developer est gratuit pour 1 siège, et le plan Team est facturé 100 $/développeur/mois. Les contrats Enterprise affichent une valeur médiane observée de 26 460 $/an avec des réductions de 17 % en moyenne à la négociation. Aux frais de licence s’ajoutent systématiquement les coûts de compute de l’entrepôt sous-jacent.
| Plan | Prix | Sièges | Modèles/mois | Fonctionnalités |
|---|---|---|---|---|
| Developer Gratuit | 0 $ | 1 développeur | 3 000 / mois | IDE cloud · 1 projet · Jobs limités · Docs basiques |
| Team Payant | 100 $/siège/mois | Jusqu’à 5 sièges | 15 000 / mois | Collaboration · CI/CD · dbt Copilot · Semantic Layer basique · API |
| Starter Payant | 100 $/siège/mois | Flexible | Variable | IDE · Scheduling · Support communautaire · Overage facturé |
| Enterprise Devis | Médiane 26 460 $/an | 10+ sièges | 100 000+ / mois | SSO/SAML · Audit logs · dbt Mesh · PrivateLink · Semantic Layer avancé · SLA prioritaire |
| Enterprise+ Devis | Sur mesure | Illimité | Illimité | IP Restrictions · Rollback · Single-tenant · Onboarding dédié · Services pro 200–400 $/h |
Foire aux Questions
Dbt Core est entièrement open source sous licence Apache 2.0 et s’exécute en ligne de commande sur n’importe quel système Linux, macOS ou Windows. dbt Cloud est un service SaaS propriétaire de dbt Labs qui ajoute l’IDE navigateur, l’orchestration managée, les contrôles d’accès avancés et la documentation hébergée.
Dbt maintient des adaptateurs certifiés pour Snowflake, BigQuery, Databricks, Amazon Redshift et Apache Spark. Sa communauté propose plus de 30 adaptateurs en plus pour des plateformes comme DuckDB, Trino ou Microsoft Fabric.
Depuis la version 1.3 sortie en octobre 2022, dbt supporte les modèles Python exécutés nativement sur Snowflake Snowpark, Databricks et BigQuery. Cette fonctionnalité permet d’entraîner des modèles scikit-learn ou de faire appel à des librairies pandas directement dans le pipeline dbt.
Le moteur de lignage de dbt génère un graphe complet des dépendances entre sources brutes et modèles finaux, documentant chaque transformation. Cette traçabilité facilite les obligations d’accountability imposées par l’article 5 du RGPD, bien que dbt ne propose pas nativement de classification ou de masquage des données personnelles.
Les deux sociétés ont formellement engagé la continuité du projet open source dbt Core dans les termes de l’accord de fusion annoncé en octobre 2025. Cependant, les analystes de Integrate.io notent que les priorités de la roadmap évolueront inévitablement à mesure que l’entité combinée rationalisera ses investissements produit.
- Partager l'article :
