<aside> 🧠 Qué es dbt™?
dbt™ es una herramienta para transformación de datos priorizando SQL, permite a los equipos desplegar rápidamente y de manera colaborativa código analítico siguiendo las mejores prácticas de ingeniería de software como la modularidad, portabilidad, CI/CD y documentación. Ahora cualquier persona en el equipo de datos puede contribuir de manera segura a la creación de pipelines de datos en producción.
</aside>
dbt es la T de un ETL
dbt (data build tool) es una herramienta de línea de comandos (CLI) que permite a los equipos de ingeniería de datos transformar datos de su data lake o data warehouse directamente utilizando SQL, el lenguaje más comúnmente usado en el análisis de datos. dbt se utiliza para organizar, limpiar, transformar y agregar datos después de que han sido almacenados (una práctica conocida como ELT, Extract, Load, Transform), lo que permite a los analistas y a los ingenieros de datos colaborar y construir flujos de trabajo de transformación de datos de manera más eficiente y con mejores prácticas de ingeniería de software.
dbt ofrece varias ventajas sobre herramientas ETL tradicionales que realizan la extracción, carga y transformación (ETL) como un proceso integrado:
Ventajas como Testing, Documentación, CI/CD, Versionado, etc.
dbt consta de varios componentes clave que juntos facilitan la transformación de datos: