Hadoop Apache (IV) – HBase

_hadoopelephant_rgb1
Y hoy:
hbase
Tipografía muy chunga

 

Hoy vamos a ver un componente Apache bastante interesante. Con este, podremos mantener distribuido un dataset en tablas columnares a través de múltiples Regiones (veremos que es) y múltiples Nodos de Hadoop.

 

¿Qué es HBase?

Cuando queremos almacenar cantidades ingentes de datos (Cientos de millones de tuplas), podemos optar por utilizar sistemas de bases de datos antiguos y esperar días u horas para obtener información de nuestros datos (si es que eso es posible) o por otra parte podemos optar por utilizar BigData y sus herramientas.

HBase nos permitirá manejar todos esos datos y tenerlos distribuidos a través de lo que denominan Regiones. Una región no es más que una partición tipo Nodo de Hadoop que se guarda en un servidor. La región aleatoria en la que se guardan los datos de una tabla se decide por nosotros, dándole un tamaño fijo a partir del cual la tabla debe distribuirse a través de las regiones.

HBase a su vez estará montando sobre HDFS de Hadoop, y podremos cargar programas en Java para realizar MapReduces personalizados.

El principal problema que tiene HBase es que no tiene un lenguaje de consulta intuitivo. Utiliza un lenguaje pseudo-javascript para crear tablas y realizar consultas.

Tiene muchas más peculiaridades, pero es redundar en lo redundado. Os dejo documentación sobre HBase en la que podemos encontrar instalación y configuración del mismo (ya sea standalone o distribuido).

 

Links

Up&Running de libro: http://hbase.apache.org/book/quickstart.html

Libro muy recomendado, donde encontraremos instalación, configuración y Tunning (esto es muy importante y viene bastante información): http://www.amazon.com/HBase-Administration-Cookbook-Yifeng-Jiang/dp/1849517142

No necesitaréis mucho más para trastear con esta tecnología.

 

dataisthenewoil

 

Hasta el siguiente post amig@s 🙂

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s