Screenshot 2024-06-23 at 3.59.13 PM.png

<aside> 🧠 Qué es dbt™?

dbt™ es una herramienta para transformación de datos priorizando SQL, permite a los equipos desplegar rápidamente y de manera colaborativa código analítico siguiendo las mejores prácticas de ingeniería de software como la modularidad, portabilidad, CI/CD y documentación. Ahora cualquier persona en el equipo de datos puede contribuir de manera segura a la creación de pipelines de datos en producción.

</aside>



1. Introducción a dbt

¿Qué es dbt y cómo se utiliza en el contexto de DE?

dbt es la T de un ETL

dbt es la T de un ETL

dbt (data build tool) es una herramienta de línea de comandos (CLI) que permite a los equipos de ingeniería de datos transformar datos de su data lake o data warehouse directamente utilizando SQL, el lenguaje más comúnmente usado en el análisis de datos. dbt se utiliza para organizar, limpiar, transformar y agregar datos después de que han sido almacenados (una práctica conocida como ELT, Extract, Load, Transform), lo que permite a los analistas y a los ingenieros de datos colaborar y construir flujos de trabajo de transformación de datos de manera más eficiente y con mejores prácticas de ingeniería de software.

Ventajas de dbt vs. otras herramientas ETL tradicionales

dbt ofrece varias ventajas sobre herramientas ETL tradicionales que realizan la extracción, carga y transformación (ETL) como un proceso integrado:

Ventajas como Testing, Documentación, CI/CD, Versionado, etc.

Ventajas como Testing, Documentación, CI/CD, Versionado, etc.

Componentes básicos de dbt y arquitectura general

dbt consta de varios componentes clave que juntos facilitan la transformación de datos: