image.png

Particionado

El particionado es una técnica de organización de datos que divide grandes conjuntos de datos en partes más pequeñas y manejables basadas en una o más columnas.

Indexación

A diferencia del particionado, los índices son estructuras de datos adicionales que mejoran la velocidad de recuperación de datos.

Bucketing

El bucketing es una técnica que agrupa datos en "cubos" basados en el hash de una columna.

Cuándo usar cada técnica

Técnica Mejor para Casos de uso
Particionado Filtrado por rangos grandes Datos históricos, análisis por período
Indexación Búsquedas específicas Consultas puntuales, OLTP
Bucketing Joins y agregaciones Análisis que requieren joins frecuentes

Mejores Prácticas

Es importante notar que estas técnicas no son mutuamente excluyentes y a menudo se utilizan en combinación para obtener el mejor rendimiento posible según el caso de uso específico.