2. Últimamente hemos escuchado acerca del
termino Big Data, pero ¿sabemos realmente a
que hace referencia?, ¿volumen grande de
datos? , ¿Múltiples sistemas?, ¿qué significa
realmente?, ¿Quién la necesita?
3. Introducción
¿ Que es Big Data?
Ejemplo de Big Data
Características del Big Data - Tamaño
Características del Big Data – Velocidad
Características del Big Data – Volumen
Características del Big Data – Variedad
Características del Big Data – Valor
Modelo de Negocios
4. Hoy en día las organizaciones están manejando
mucha información, una encuesta realizada en
el 2010 nos indica que las empresas y los
usuarios están obteniendo y almacenando más
de 13 Exabytes de nueva información. Para
tener una idea, 13 Exabytes es como tener
50,000 los datos de la Librería del Congreso de
los estados Unidos.
5. Independientemente del volumen o de la calidad
de los datos, las empresas están utilizando estos
para sus tomas de decisiones de negocio. Derivado
de esto, las empresas han invertido para tener
ventaja competitiva en la captura, integración
análisis e intercambio de datos. Las empresas que
utilizan la analítica para el análisis de datos, son
dos veces más rentables que sus competidores.
La analítica maneja casi todos los aspectos de
nuestra vida o sociedad, incluidos los servicios de
telefonía móvil, manufactura, comercio minorista,
ciencias sociales y físicas.
6. La gran cantidad de datos que se están
utilizando al día de hoy, son complicados en
cuanto a su manipulación y no se adecuan del
todo a los modelos de bases de datos
relacionales tradicionales. Las empresas que
deseen analizar todos estos datos se ven
obligadas a utilizar nuevas tecnologías como
Hadoop, Cassandra, HBase, etc. debido a que
las soluciones tradicionales como SQL, Oracle,
etc. ya no son suficientes para manipular este
tipo de información.
7. Big Data hace referencia a este tipo de datos
(grandes volúmenes y una mayor complejidad).
Big Data también se refiere al análisis de este
tipo de datos dándole una ventaja competitiva
a las empresas que lo implementan.
8. Definición
Las palabras Big Data, no solo hacen
referencia a los grandes volúmenes de
información, sino también, describe las
herramientas, los procesos y procedimientos
que les permiten a las empresas crear,
manipular grandes conjuntos de datos,
extrayendo información significativa.
9. Definición
Los conjuntos de datos a los que hace referencia
Big Data, son enormes, cuyo tamaño supera la
capacidad para que sean integrados, gestionados
o analizados por los sistemas de bases de datos
típicos. Junto con el volumen de datos, la
complejidad es otro problema a enfrentar, es
decir, las formas en que se presentan los datos
son inconsistentes e impredecibles, es decir son
diferentes entre ellos mismos (formatos) lo que
conlleva a que no podemos utilizar las técnicas
tradicionales conocidas.
10. Las empresas de hoy tienen el reto de analizar
múltiples datos nuevos, los cuales pueden
provenir de diferentes formas, diferentes tipos
y a una velocidad diferente. Estos datos
pueden ser estructurados, no- estructurados,
archivos de texto plano. Estos datos van más
allá de los ERP o sistemas transaccionales
tradicionales, estos también pueden proveer de
sistemas auxiliares, sistemas de apoyo,
incluyendo weblogs, redes sociales y cualquier
otro medio de comunicación social.
11. Big Data se refiere a todos los tipos de datos
listados a continuación:
◦ Datos empresariales tradicionales, los cuales incluyen
información del cliente proveniente de los sistemas CRM
(Customer Relation Manager), datos transaccionales de
ERP, transacciones provenientes de la web.
◦ Datos como detalles de atención telefónica al cliente,
weblogs, medidores inteligentes (visitas), manufactura,
logs de los equipos y sistemas de comercio.
◦ Datos sociales, incluyendo los feedbacks o
retroalimentación, micro-blogs como Twitter y
plataformas sociales como Facebook.
12. El objetivo de Big Data, es que las empresas sean
capaces de recolectar y aprovechar cada byte de
datos relevantes y usarlos para poder tomar las
mejores decisiones de negocio.
Big Data es un cambio de paradigma en la forma en
que pensamos acerca de los conjuntos de datos y
cómo monetizarlos desde el punto de vista de
análisis de estos conjuntos de datos. Su objetivo es
recopilar la inteligencia (tendencias, etc.) a partir de
los datos y traducir eso en una ventaja de negocio.
Por lo tanto, tiene el potencial de transformar
radicalmente las empresas. También permite una
extensa medición y conocimiento sobre el negocio, y
traduce directamente ese conocimiento en una mejor
toma de decisiones y mejora del rendimiento.
13. Un ejemplo, consideremos un retail (ventas al por
menor), en este caso, una librería típica, aquí,
siempre se podrá saber que libros fueron vendidos
y cuáles no. Supongamos que tienen un programa
de recompensas, con esto, podrían vincular las
compras hechas por cada cliente inscrito en el
programa, lo cual excluiría a los clientes casuales.
Ahora bien, tomando una librería on-line
(internet), el entendimiento de los clientes,
aumentó dramáticamente. Los minoristas en línea
pueden rastrear no sólo lo que compran los
clientes, sino también qué más miraban mientras
navegaban por el sitio web, lo mucho que se vieron
influenciados por las promociones, reseñas y
diseños de página, y las similitudes entre los
individuos y los grupos.
14. Con esta información desarrollaron en poco
tiempo algoritmos para predecir qué libros en
particular les gustaría leer, algoritmos que realizan
mejor su tarea cada vez que el cliente respondió a
una recomendación o la ignoro. Los minoristas
tradicionales (librerías locales) simplemente no
pueden acceder a este tipo de información, y
mucho menos actuar sobre ella de una manera
oportuna. No es de extrañar que Amazon ha
puesto tantas librerías de ladrillo y mortero de
negocios. No es coincidencia que Amazon le ha
quitado gran parte del mercado a las librerías
típicas.
15. Dado que el tamaño es uno de los términos
comúnmente utilizados para describir Big
Data, ¿Qué tan grande es? En general, cuando
hablamos de Big Data hablamos de muchos
datos. Comparando la magnitud de los datos
tradicionales. McKinsey Global Institute
estima que el volumen de datos está
creciendo a un ritmo de 40% por año, y
crecerán 44x entre los años 2009 y 2020.
16. A continuación algunos ejemplos que nos
ayudaran a cuantificar la magnitud de Big Data:
◦ Wal-Mart maneja más de un millón de transacciones
cada hora e importa esta información a motores de
bases de datos que se estima contienen más de 2.5
Petabytes de datos.
◦ Cada día Facebook maneja más de 250 millones de fotos
subidas a su sitio, también maneja la interacción de un
billón de usuarios activos con más de 900 millones de
objetos (paginas, grupos, etc.)
◦ Más de 5 billones de personas realizan llamadas, envían
mensajes de texto, envían twitts y navegan desde sus
teléfonos móviles alrededor del mundo.
17. Aunque el tamaño es mencionado con
frecuencia, también es relativo a cada
organización. Los datos que se consideran
grandes para una organización pueden no ser
necesariamente grandes para otro. Las
características de los grandes datos más
aceptada es el 3V - volumen, velocidad y
variedad.
18. Big Data tiende a mostrar los extremos de las
3V:
Volumen (¿Cuánta información?, teradata,
exadata)
Velocidad (¿Qué tan rápida es?, tiempo real,
transmisión/streaming)
Variedad (¿Cuántos tipos de datos llegan?
Estructurados, no estructurados, semi
estructurados.
19. Una de las características menos entendidas de Big
Data. Es la velocidad a la que los datos llegan a la
organización y se procesan. Cuanto mayor sea el
conjunto de datos a procesar, más tiempo tomará para
analizar. Aunque es posible transmitir “rápidamente”
estos datos a su lugar de almacenamiento por medio
del procesamiento en lotes (batch), existen situaciones
en que la importancia radica en la velocidad de la
captura y el análisis de estos datos, tomando dichos
datos de entrada para tomar la decisión de negocio tan
pronto sea posible. Por ejemplo, si se sospecha de una
transacción con tarjeta de crédito fraudulenta, lo ideal
es que se marcará antes de que se termine la
transacción - la posibilidad de impedir la operación
antes de que finalice.
20. Los logs de las páginas web, las redes sociales
producen una gran cantidad de cambios en la
información potencialmente útiles en la
adquisición de experiencia en el
comportamiento de estos. A un ritmo
vertiginoso de cambios en los datos, puede
causar la complejidad de almacenar, procesar y
consultar estos datos. Incluso a 140 caracteres
por tweet, con una alta frecuencia de uso,
Twitter garantiza grandes volúmenes de datos
en un día (más de 8 terabytes).
21. El volumen de datos generados en la actualidad
a nivel mundial, es más alto que el normal;
sobre todo si utilizamos los datos generados
por el registro de la navegación en internet.
Estos datos con gran volumen conduce a
costosos procesos de almacenamiento, ETL y
de análisis.
22. El beneficio obtenido de la capacidad de
procesar grandes cantidades de datos es la
principal atracción de análisis de datos grandes
(Big Data). Por ejemplo, un motor a reacción
puede generar 10 terabytes de datos en 30
minutos. Con más de 25.000 vuelos de las
aerolíneas por día, el volumen diario de datos
generados seria de petabytes.
23. Esta característica hace referencia a la captura de
todos estos datos que apoyan al proceso de toma
de decisiones. Los datos tradicionales tienden a
estar organizados y bien definidos (estructurados)
y sin cambios frecuentes. A diferencia, los datos
no tradicionales (imágenes, video, y cualquier otra
variación) no presentan ninguna estructura
específica y por su naturaleza no son candidatos
para el manejo informático ni vienen listos para su
integración con una aplicación. Un uso común del
procesamiento de Big Data, es tomar los datos no
estructurados y extraer ordenadamente su
significado. Hacer esto correctamente y por
completo es un desafío técnico permanente.
24. El valor económico de estos datos varía
significativamente. Por lo general podemos
encontrar información valiosa escondida dentro
de un conjunto mayor de datos no tradicionales
(no estructurados, sin formato, etc.), el desafío
consta en examinar esta gran cantidad de datos y
encontrar patrones ocultos, correlaciones
desconocidas y otra información útil para
identificar lo que es valioso para el negocio y
luego transformar y extraer los datos para el
análisis. Otra situación que les da mayor valor a
estos datos, es cuando se pueden vincular con
otros datos y otras fuentes.
25. El valor real de los datos lo podemos
encontrar contestando estas tres preguntas:
◦ ¿Quién puede beneficiarse de esta información?
◦ ¿Qué decisiones de negocio se tomaran con esta
información?
◦ ¿Cuándo se necesita esta información para apoyar
una mejor toma de decisiones?
Descifrando con éxito la manera de capturar,
administrar y manipular los grandes
volúmenes de datos (Big Data) nos dará
enormes oportunidades para su uso y
explotación en casi todas las ramas.
26. Aquellas empresas que apuesten por el big data,
podrán crear nuevas oportunidades para
diferenciarse de la competencia. En la actualidad
hay tres tendencias que están surgiendo de la
utilización del Big Data.
La primera se enfoca en el uso de la información
para crear nuevos productos.
La segunda se refiere a la intermediación de esta
información, es decir, a la interacción con otros
datos para complementarlos, volviéndolos más
útiles.
El tercero es la construcción de redes para
ofrecer productos en el momento y el lugar
correcto.