Big Data Dummy

Kafka Streams

Si estás trabajando con grandes cantidades de datos, posiblemente hayas oído hablar de Kafka, a alto nivel, es un sistema distribuido de mensajería de suscripción-publicación tolerante a fallos diseñado para procesar datos rápidamente y que tiene la capacidad de manejar cientos de miles de mensajes.

El pipeline de datos de Netflix

En Netflix cualquier decisión de negocio o de producto está tomada a partir de ideas obtenidas del análisis de datos. El objetivo del pipeline de datos es obtener, agregar, procesar y mover datos a escala Cloud. Casi todas las aplicaciones en Netflix utilizan el pipeline de datos para la consulta o la escritura de datos.