El apasionante mundo del Big Data (I)

Hace un tiempo comencé a leer más sobre este fenómeno conocido como Big data, o uso masivo de datos. Desde entonces no ha pasado un día sin que investigue un poco más. En este post, voy a contar algunas nociones básicas, partiendo de tres preguntas básicas ¿Qué, dónde y cuál?

¿Qué es el Big Data? Grosso modo es el análisis de grandes cantidades de datos, de un tamaño tan considerable que no resulta viable gestionarlos mediante métodos tradicionales como Excel o bases de datos SQL.

Podríamos decir que prácticamente existe una incapacidad para el análisis de tanta información sin utilizar nuevas metodologías, pues este tamaño apunta a prefijos como -Peta o -Exa.

¿Y de dónde vienen de repente todos estos datos? Pues de la barbaridad de material que se genera día a día en internet: millones de Tweets, fotografías, contenido audiovisual, información de sensores, estaciones meteorológicas…Se suelen clasificar en tres tipos:

Datos estructurados: estos son los más tradicionales, y consisten en largos listados como matrices con nombres de clientes, dirección, número de socio, etc.

Datos semiestructurados: aquellos que en ocasiones resultan estructurados, pero solo en ocasiones. El clásico ejemplo es el de un email. Este tiene algunos campos que se podrían guardar tipo listado, como el remitente, sin embargo y como parece obvio, no sucede lo mismo con el contenido del mismo.

Datos no estructurados: como bien se entiende, son aquellos que no guardan una estructura. Por ejemplo las conversaciones en redes sociales (persona-persona), el generado por dispositivos médicos (persona-máquina) o los relacionados con geolocalizacion (sensores, o GPS).

Y bueno, esto del Big Data no parece sencillo, por ello…¿Cuál es su finalidad?¿Es importante su análisis? Pues sirve para tantas cosas que casi asusta pensarlo, pero básicamente para una mejora en la toma de acciones estratégicas.

Por ejemplo, ¿De dónde se alimentan las clásicas ventanas de publicidad que “casualmente” anuncian productos que has buscado minutos antes? ¿Y el sistema de recomendaciones de Amazon? Es decir, juega un papel fundamental para el futuro del Marketing.

No obstante este no es el único caso. Otros ejemplos, serían los relacionados con la seguridad, mediante el análisis de la geolocalización de un gran número de individuos, o como herramienta para la mejora y el desarrollo de otros modelos, como son los meteorológicos o los basados en finanzas.

Otro uso de Big Data que resulta fascinante, es el que podéis leer en el primer libro que posteriormente comento. Y es que la epidemia de gripe que tuvo lugar en 2009 en EE.UU., pudo ser monitorizada de manera más eficiente a partir de búsquedas realizadas en Google que a través de la intermitente y sesgada información de los pacientes que acudían al hospital. Y esto es solo la punta del iceberg…

big-data-analytics-with-apache-hadoop-11-638

Otro dato importante que es muy fácil de recordar, y que nos sirven para entender mejor la magnitud de esta disciplina, son las “5 Vs” que la describen: volumen, velocidad, variedad, valor y veracidad.

El big data está generando continuamente trabajo para ingenieros y matemáticos y sus expectativas laborales de futuro son más que buenas, así que no estaría mal aprender un poco, no? Pues aquí van dos referencias interesantes:

Big Data de Bernard Marr, que es muy básico e interesante para iniciarse en este mundillo. Te recomiendo bajar un fragmento gratuito a tu Kindle y si luego te gusta, cómpralo.

Book 1

Big Data Now, que también presenta el tema de una manera amena y es gratis para Kindle!

51pASNqomIL

Y para quien quiera dedicarle más de tiempo, a mi me pareció muy interesante el curso de UniMooc que hice en la universidad de alicante:

Introducción al Big Data para los negocios

Este es el vídeo introductorio, del curso, merece la pena verlo:

Y bueno que mejor manera de tener todos los recursos recopilados  a partir del post de Jose Julio López que es una de las personas más activas de todas las que he encontrado, en Linkedin que se dedican a este tema.

Los sitios más destacados para la formación en Big Data en España y Online

Aprovecho también para agradecerle su interés, pues responde con interés a los comentarios de su blog, que no son pocos y por supuesto recomendaros que naveguéis un poco dentro de este.

Pues nada, hay tantas cosas por contar sobre el mundo de Big Data que ya seguiré en otros Post. A mí francamente me parece muy atractivo. Hasta entonces, espero que disfrutéis de estas merecidas vacaciones!!

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.