El futuro de las plataformas analíticas Big Data

Publicado por

Índice

  • Introducción
  • Plataforma analítica

Introducción

Cloudera y Hortonworks han sido dos de las grandes compañías mundiales en integrar tecnologías Big Data bajo distribuciones de software alrededor de Hadoop que ayudan a la instalación, integración y mantenimiento de todos los componentes. Se han ganado ser los mejores gracias a que confiaron en el código abierto como forma de impulsar los modelos de negocio a gran escala.

Hortonworks ha conseguido liderar proyectos en la comunidad como Apache Hadoop Yarn. También ha desarrollado una nueva marca para hacer de Apache Nifi la columna vertebral de Hortonworks DataFlow, el último lanzamiento para entornos en la nube híbridos (DataPlane). En el aspecto referido al software ha sido menos riguroso en cuanto a la liberación de actualizaciones de las herramientas que ha ido ofreciendo en su distribución. Suele tener disponible las versiones más recientes que libera la comunidad antes que la competencia.

La plataforma de Cloudera ofrece un gran rendimiento y calidad empresarial; cuenta con componentes diseñados para facilitar la creación de conocimiento operacional sobre sistemas de tratamiento de datos. Lo que ha diferenciado a Cloudera siempre es que ha garantizado la fiabilidad de todos sus componentes y a retrasado la subida de versiones de software hasta haberlos testado completamente.

A principios de 2019 se completaba la compra de Hortonworks por parte de Cloudera y así comenzaba una nueva generación de empresas; la primera que ofrece las herramientas adecuadas para el análisis avanzado de datos a gran escala en nubes híbridas.

Ambas compañías han estado trabajando en esta idea durante varios años. Mientras Hortonworks invirtió en tecnologías de tratamiento de datos en streaming e ingestas de datos para dar soporte a los casos de uso relacionados con IoT (Internet Of Things), Cloudera se centró más en casos de uso relacionados con la inteligencia artificial y el aprendizaje automático, para capacitar a los científicos de datos con herramientas para automatizar todos sus trabajos.

Según se ha hecho público los accionistas de Cloudera serán dueños del 60% del capital de la nueva compañía y los de Hortonworks de un 40%, el director general de Cloudera, Tom Reilly, será el director de la nueva compañía.

Plataforma analítica

La distribución de tecnologías Big Data en un paquete unificado será la piedra angular de la estrategia de producto de la compañía, dijo Reilly durante el streaming donde se presentó los planes de la nueva compañía, esta nueva plataforma sera 100% de código abierto y nativa en la nube.

Los usuarios podrán lanzar CDP (Cloudera Data Platform) en las nubes de AWS, Azure, Google, IBM y Oracle, incluso se podrá ejecutar en varias nubes. Las instalaciones en la nube local e híbridas también serán compatibles.

CDP combinará las características de la version 3 de HDP (Hortonworks Data Platform), la versión 6 de CDH, la distribución de Hadoop y tecnologías relacionadas desde el lado de Cloudera.

La primera versión de CDP proporcionará un conjunto de funcionalidades combinadas para nuevos usuarios, y continuará con una segunda versión que admitirá actualizaciones de las aplicaciones HDP y CDH existentes, dijo Aron Murthy, que es quién dirigió la ingeniería en Hortonworks y ahora es el responsable de producto de Cloudera.

La nueva plataforma incluirá un apartado unificado de software para gestionar la seguridad y el gobierno del dato, pero no se ha especificado si se basará en una combinación de las diferentes tecnologías que ofrecen actualmentes Cloudera y Horton o en una combinación de los dos.

Reiteraron las promesas que hicieron los ejecutivos el día que anunciaron la fusión de las dos empresas, Cloudera continuará apoyando HDP 3 y ambas versiones 5 y 6 del CDH durante a menos tres años más. La compañía también seguirá agregando un flujo constante de nuevas funcionalidades a las plataformas ya existentes.

Además Reilly dijo que HDP se integrará con Cloudera Data Science Workbench (CDSW), una plataforma de colaboración y gestión de flujos de trabajo para equipos de científicos de datos o analistas. No dijo si Cloudera también ofrecerá el software del workbench Data Science Experience, rival de IBM, que Hortonworks ha revendido desde mediados del 2017.

Por otra parte, también están trabajando en la integración en la nueva plataforma de Hortonworks DataFlow, una plataforma de análisis y transmisión de datos en tiempo real que puede extraer datos de una variedad de sistemas, dispositivos IOT y otras fuentes.

Los contenedores y el sistema de orquestación de contenedores de código abierto Kubernetes también desempeñarán un papel importante en la estrategia de desarrollo de Cloudera. Por ejemplo, los usuarios podrán implementar CDP en contenedores administrados por Kubernetes

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s