https://aws.amazon.com/blogs/big-data/build-a-lake-house-architecture-on-aws/

https://aws.amazon.com/blogs/big-data/build-a-lake-house-architecture-on-aws/


Source Layer (Fuente de Datos)

sources.jpg

Característica Amazon RDS Amazon DynamoDB
Tipo de Base de Datos Base de datos relacional (SQL) administradas Base de datos NoSQL totalmente administrada
Principales Características - Soporte para MySQL, PostgreSQL, Oracle, SQL Server, MariaDB

Ingestion Layer (Ingesta de Datos)

ingestion.jpg

Característica AWS AppFlow AWS DMS AWS Glue ETL Kinesis Data Streams Kinesis Data Firehose
Tipo de Servicio Servicio de integración SaaS Servicio de migración de bases de datos Servicio ETL serverless Servicio de streaming de datos en tiempo real Servicio de carga de datos en tiempo real
Principales Características - Integración con +20 SaaS

<aside> 📒

Otros servicios de ingesta

Storage Layer (Almacenamiento de Datos)

storage.jpg

Característica Amazon S3 Amazon Redshift Redshift Spectrum
Tipo de Base de Datos Almacenamiento de objetos, Data Lake Data Warehouse columnar relacional Motor de consultas sobre S3 (extensión de Redshift)
Principales Características - Almacenamiento ilimitado

Catalogo, Gobierno y Calidad de Datos

catalog.jpg

Característica AWS IAM Lake Formation Glue Data Catalog Glue Data Quality
Tipo de Servicio Control de acceso y gestión de permisos Servicio de construcción y gestión de data lakes Catálogo de metadatos centralizado Servicio de evaluación de calidad de datos
Principales Características - Control de acceso granular

<aside> 🔒

IAM vs Lake Formation

security.jpg

IAM es como el guardia de seguridad del edificio entero de AWS que decide quién puede entrar a qué pisos, mientras que Lake Formation es como el bibliotecario especializado que controla específicamente quién puede leer, escribir o modificar cada libro (dato) dentro de tu data lake.

Trabajan juntos: IAM maneja el acceso general a los servicios, y Lake Formation se especializa en el control fino de los datos.

</aside>

<aside> 📒

Otros servicios de gobierno y seguridad de datos

Processing Layer (Procesamiento de Datos)

processing.jpg