Big Data Dummy

Solr

Solr es un plataforma de búsqueda basado en Lucene, es altamentente fiable, escalable y tolerante a fallos, proporcionando indexación distribuida, replicación, reparto de carga en consultas, conmutación de errores y recuperación automatizada. Solr mejora la búsqueda y la navegabilidad de los sitios de internet más grandes del mundo.

Apache Tez

El objetivo con el que nace Tez es el de construir un framework que permita realizar el cambio entre tareas de procesamiento de datos mapreduce por un gráfico acíclico dirigido (DAG) de tareas. Actualmente está construido sobre YARN.

Zookeeper

Cuando se implementa estos servicios, gran parte del tiempo se va en depurar errores y en comprobar condiciones de carrera1. Debido a su complejidad las aplicaciones no dedican, inicialmente, el tiempo necesario a esta tarea, lo que las hace más frágiles frente a los cambios y difíciles de manejar. Incluso en los casos en que se realice correctamente, las diferentes implementaciones de los servicios harán compleja su administración