Big Data | Data Governance Initiative 

Importancia del Gobierno de Datos e implicancias

Hoy vamos a estar analizando algunos puntos donde debemos hacer foco en el Gobierno de Datos.

Es importante entender que con el volumen de datos que es generado a diario, este debe ser observado como un todo para ser administrado, mejorado y dar un mayor aprovechamiento de nuestra información, para que ella misma pueda ayudarnos a generar una percepción de calidad y poder generar confianza en la toma de decisiones y operaciones que deriven de ellas en la organización.

Cuando carecemos de un Gobierno de Datos, los datos no se integran como un todo, y ellos no tienen una visión general desde la organización, si no que queda acotada a la visión de cada departamento que actúa con ella. (Podríamos decir marketing, finanzas o sistemas).

Así mismo, podemos inferir que el Gobierno de datos toma el rol de organizar, controlar , coordinar las diferentes departamentos de la empresa, de manera interactiva que derivan en definición de Roles y Responsabilidades.

Este escenario nos permite establecer standares, políticas y procesos.

Entendiendo el mínimo concepto de que es el gobierno de datos procederemos a conocer los 5 puntos en que debemos focalizarnos para poder analizar y gobernar:

  • Social Media.
  • IoT (Internet of things).
  • Grandes volúmenes de datos transaccionales.
  • Datos Biometricos.
  • Datos Generados por la Humanidad.

Seguir leyendo «Big Data | Data Governance Initiative «

elasticsearch[13241]: [warning] /etc/init.d/elasticsearch: No java runtime was found

Decidimos realizar la instalacion de ElasticSearch para poder realizar el indexado de tablas enormes dentro de nuestro hive.

La instalacion fue transparente, pero luego de levantar el servicio nos mostraba el siguiente error cuando pediamos un  status de nuestro servicio.

Corroboramos que las variables estuvieran bien y por sobre todo este instalado java.

Error que aparecio.

root@srvhadoopt3:~# service elasticsearch status
● elasticsearch.service - LSB: Starts elasticsearch
   Loaded: loaded (/etc/init.d/elasticsearch; bad; vendor preset: enabled)
   Active: active (exited) since Thu 2017-10-12 13:37:34 ART; 6min ago
     Docs: man:systemd-sysv-generator(8)

Oct 12 13:37:33 srvhadoopt3 systemd[1]: Starting LSB: Starts elasticsearch...
Oct 12 13:37:34 srvhadoopt3 elasticsearch[13241]: [warning] /etc/init.d/elasticsearch: No java runtime was found
Oct 12 13:37:34 srvhadoopt3 systemd[1]: Started LSB: Starts elasticsearch.

Solucion

Como solucion, Seguir leyendo «elasticsearch[13241]: [warning] /etc/init.d/elasticsearch: No java runtime was found»

Dataflow | How to Install and configure NIFI

What is and for what ?

Nifi is a web tool that we can use to perform data ingestion.

It allows us to listen, format and make a first filter of the messages (data) received by several of its embedded processors.

Likewise process and distribute data.

Download Packages and checks

Download the packages from:

https://nifi.apache.org/

There we will find different versions of the product.

Then we proceed to perform a CHECKSUM to verify that it is a safe package and that it did not suffer alterations along the way.

[amercado.nbfor101200] ➤ md5sum nifi-1.4.0-bin.tar.gz
28c5511073452cf59e9ec1b278a1a7e4 nifi-1.4.0-bin.tar.gz

Installation

Unzip the package in the path
Seguir leyendo «Dataflow | How to Install and configure NIFI»

How to Install Kibana with Debian Packages

Luego de haber realizado mi instalación de Elastic Search, decidí montar un plugin llamado  Kibana, para poder visualizar y explorar datos que se encuentran indexados en  ElasticSearch.

Podemos decir también , que como en el pasado con otros productos open source aparecieron siglas como LAMP (Linux/Apache/MySQL/PHP) para esta familia de elastic, contenemos el stack ELK:

  • Elasticsearch
  • Logstash
  • Kibana

En mi caso, decidi comenzar la instalación de forma manual , con pkgs de Debian en mi Ubuntu server 16.

Descargamos los paquetes del repositorio oficial:

hadoop@srvhadoopt3:$ wget https://artifacts.elastic.co/downloads/kibana/kibana-5.6.3-amd64.deb
--2017-10-12 16:59:33--  https://artifacts.elastic.co/downloads/kibana/kibana-5.6.3-amd64.deb
Resolving proxgue.garba.com.ar (proxgue.garba.com.ar)... 10.0.60.3
Connecting to proxgue.garba.com.ar (proxgue.garba.com.ar)|10.0.60.3|:8080... connected.
Proxy request sent, awaiting response... 200 OK
Length: 52533368 (50M) [application/octet-stream]
Saving to: ‘kibana-5.6.3-amd64.deb’

kibana-5.6.3-amd64.deb                          100%[====================================================================================================>]  50.10M  1.34MB/s    in 65s

2017-10-12 17:00:40 (784 KB/s) - ‘kibana-5.6.3-amd64.deb’ saved [52533368/52533368]

Verifico que el paquete sea seguro y que contiene el hash correspondiente

hadoop@srvhadoopt3:$ sha1sum kibana-5.6.3-amd64.deb
12821507ace7c49eea5011e360f8353007f0ab90  kibana-5.6.3-amd64.deb

Bien, una vez descargado , procedemos con la instalacion del package: Seguir leyendo «How to Install Kibana with Debian Packages»