SlideShare ist ein Scribd-Unternehmen logo
1 von 27
Sergio Sánchez
Últimamente hemos escuchado acerca del
termino Big Data, pero ¿sabemos realmente a
que hace referencia?, ¿volumen grande de
datos? , ¿Múltiples sistemas?, ¿qué significa
realmente?, ¿Quién la necesita?
Introducción
¿ Que es Big Data?
Ejemplo de Big Data
Características del Big Data - Tamaño
Características del Big Data – Velocidad
Características del Big Data – Volumen
Características del Big Data – Variedad
Características del Big Data – Valor
Modelo de Negocios
Hoy en día las organizaciones están manejando
mucha información, una encuesta realizada en
el 2010 nos indica que las empresas y los
usuarios están obteniendo y almacenando más
de 13 Exabytes de nueva información. Para
tener una idea, 13 Exabytes es como tener
50,000 los datos de la Librería del Congreso de
los estados Unidos.
Independientemente del volumen o de la calidad
de los datos, las empresas están utilizando estos
para sus tomas de decisiones de negocio. Derivado
de esto, las empresas han invertido para tener
ventaja competitiva en la captura, integración
análisis e intercambio de datos. Las empresas que
utilizan la analítica para el análisis de datos, son
dos veces más rentables que sus competidores.
La analítica maneja casi todos los aspectos de
nuestra vida o sociedad, incluidos los servicios de
telefonía móvil, manufactura, comercio minorista,
ciencias sociales y físicas.
La gran cantidad de datos que se están
utilizando al día de hoy, son complicados en
cuanto a su manipulación y no se adecuan del
todo a los modelos de bases de datos
relacionales tradicionales. Las empresas que
deseen analizar todos estos datos se ven
obligadas a utilizar nuevas tecnologías como
Hadoop, Cassandra, HBase, etc. debido a que
las soluciones tradicionales como SQL, Oracle,
etc. ya no son suficientes para manipular este
tipo de información.
Big Data hace referencia a este tipo de datos
(grandes volúmenes y una mayor complejidad).
Big Data también se refiere al análisis de este
tipo de datos dándole una ventaja competitiva
a las empresas que lo implementan.
Definición
 Las palabras Big Data, no solo hacen
referencia a los grandes volúmenes de
información, sino también, describe las
herramientas, los procesos y procedimientos
que les permiten a las empresas crear,
manipular grandes conjuntos de datos,
extrayendo información significativa.
Definición
 Los conjuntos de datos a los que hace referencia
Big Data, son enormes, cuyo tamaño supera la
capacidad para que sean integrados, gestionados
o analizados por los sistemas de bases de datos
típicos. Junto con el volumen de datos, la
complejidad es otro problema a enfrentar, es
decir, las formas en que se presentan los datos
son inconsistentes e impredecibles, es decir son
diferentes entre ellos mismos (formatos) lo que
conlleva a que no podemos utilizar las técnicas
tradicionales conocidas.
Las empresas de hoy tienen el reto de analizar
múltiples datos nuevos, los cuales pueden
provenir de diferentes formas, diferentes tipos
y a una velocidad diferente. Estos datos
pueden ser estructurados, no- estructurados,
archivos de texto plano. Estos datos van más
allá de los ERP o sistemas transaccionales
tradicionales, estos también pueden proveer de
sistemas auxiliares, sistemas de apoyo,
incluyendo weblogs, redes sociales y cualquier
otro medio de comunicación social.
 Big Data se refiere a todos los tipos de datos
listados a continuación:
◦ Datos empresariales tradicionales, los cuales incluyen
información del cliente proveniente de los sistemas CRM
(Customer Relation Manager), datos transaccionales de
ERP, transacciones provenientes de la web.
◦ Datos como detalles de atención telefónica al cliente,
weblogs, medidores inteligentes (visitas), manufactura,
logs de los equipos y sistemas de comercio.
◦ Datos sociales, incluyendo los feedbacks o
retroalimentación, micro-blogs como Twitter y
plataformas sociales como Facebook.
 El objetivo de Big Data, es que las empresas sean
capaces de recolectar y aprovechar cada byte de
datos relevantes y usarlos para poder tomar las
mejores decisiones de negocio.
 Big Data es un cambio de paradigma en la forma en
que pensamos acerca de los conjuntos de datos y
cómo monetizarlos desde el punto de vista de
análisis de estos conjuntos de datos. Su objetivo es
recopilar la inteligencia (tendencias, etc.) a partir de
los datos y traducir eso en una ventaja de negocio.
Por lo tanto, tiene el potencial de transformar
radicalmente las empresas. También permite una
extensa medición y conocimiento sobre el negocio, y
traduce directamente ese conocimiento en una mejor
toma de decisiones y mejora del rendimiento.
Un ejemplo, consideremos un retail (ventas al por
menor), en este caso, una librería típica, aquí,
siempre se podrá saber que libros fueron vendidos
y cuáles no. Supongamos que tienen un programa
de recompensas, con esto, podrían vincular las
compras hechas por cada cliente inscrito en el
programa, lo cual excluiría a los clientes casuales.
Ahora bien, tomando una librería on-line
(internet), el entendimiento de los clientes,
aumentó dramáticamente. Los minoristas en línea
pueden rastrear no sólo lo que compran los
clientes, sino también qué más miraban mientras
navegaban por el sitio web, lo mucho que se vieron
influenciados por las promociones, reseñas y
diseños de página, y las similitudes entre los
individuos y los grupos.
Con esta información desarrollaron en poco
tiempo algoritmos para predecir qué libros en
particular les gustaría leer, algoritmos que realizan
mejor su tarea cada vez que el cliente respondió a
una recomendación o la ignoro. Los minoristas
tradicionales (librerías locales) simplemente no
pueden acceder a este tipo de información, y
mucho menos actuar sobre ella de una manera
oportuna. No es de extrañar que Amazon ha
puesto tantas librerías de ladrillo y mortero de
negocios. No es coincidencia que Amazon le ha
quitado gran parte del mercado a las librerías
típicas.
 Dado que el tamaño es uno de los términos
comúnmente utilizados para describir Big
Data, ¿Qué tan grande es? En general, cuando
hablamos de Big Data hablamos de muchos
datos. Comparando la magnitud de los datos
tradicionales. McKinsey Global Institute
estima que el volumen de datos está
creciendo a un ritmo de 40% por año, y
crecerán 44x entre los años 2009 y 2020.
 A continuación algunos ejemplos que nos
ayudaran a cuantificar la magnitud de Big Data:
◦ Wal-Mart maneja más de un millón de transacciones
cada hora e importa esta información a motores de
bases de datos que se estima contienen más de 2.5
Petabytes de datos.
◦ Cada día Facebook maneja más de 250 millones de fotos
subidas a su sitio, también maneja la interacción de un
billón de usuarios activos con más de 900 millones de
objetos (paginas, grupos, etc.)
◦ Más de 5 billones de personas realizan llamadas, envían
mensajes de texto, envían twitts y navegan desde sus
teléfonos móviles alrededor del mundo.
 Aunque el tamaño es mencionado con
frecuencia, también es relativo a cada
organización. Los datos que se consideran
grandes para una organización pueden no ser
necesariamente grandes para otro. Las
características de los grandes datos más
aceptada es el 3V - volumen, velocidad y
variedad.
Big Data tiende a mostrar los extremos de las
3V:
 Volumen (¿Cuánta información?, teradata,
exadata)
 Velocidad (¿Qué tan rápida es?, tiempo real,
transmisión/streaming)
 Variedad (¿Cuántos tipos de datos llegan?
Estructurados, no estructurados, semi
estructurados.
Una de las características menos entendidas de Big
Data. Es la velocidad a la que los datos llegan a la
organización y se procesan. Cuanto mayor sea el
conjunto de datos a procesar, más tiempo tomará para
analizar. Aunque es posible transmitir “rápidamente”
estos datos a su lugar de almacenamiento por medio
del procesamiento en lotes (batch), existen situaciones
en que la importancia radica en la velocidad de la
captura y el análisis de estos datos, tomando dichos
datos de entrada para tomar la decisión de negocio tan
pronto sea posible. Por ejemplo, si se sospecha de una
transacción con tarjeta de crédito fraudulenta, lo ideal
es que se marcará antes de que se termine la
transacción - la posibilidad de impedir la operación
antes de que finalice.
Los logs de las páginas web, las redes sociales
producen una gran cantidad de cambios en la
información potencialmente útiles en la
adquisición de experiencia en el
comportamiento de estos. A un ritmo
vertiginoso de cambios en los datos, puede
causar la complejidad de almacenar, procesar y
consultar estos datos. Incluso a 140 caracteres
por tweet, con una alta frecuencia de uso,
Twitter garantiza grandes volúmenes de datos
en un día (más de 8 terabytes).
El volumen de datos generados en la actualidad
a nivel mundial, es más alto que el normal;
sobre todo si utilizamos los datos generados
por el registro de la navegación en internet.
Estos datos con gran volumen conduce a
costosos procesos de almacenamiento, ETL y
de análisis.
El beneficio obtenido de la capacidad de
procesar grandes cantidades de datos es la
principal atracción de análisis de datos grandes
(Big Data). Por ejemplo, un motor a reacción
puede generar 10 terabytes de datos en 30
minutos. Con más de 25.000 vuelos de las
aerolíneas por día, el volumen diario de datos
generados seria de petabytes.
Esta característica hace referencia a la captura de
todos estos datos que apoyan al proceso de toma
de decisiones. Los datos tradicionales tienden a
estar organizados y bien definidos (estructurados)
y sin cambios frecuentes. A diferencia, los datos
no tradicionales (imágenes, video, y cualquier otra
variación) no presentan ninguna estructura
específica y por su naturaleza no son candidatos
para el manejo informático ni vienen listos para su
integración con una aplicación. Un uso común del
procesamiento de Big Data, es tomar los datos no
estructurados y extraer ordenadamente su
significado. Hacer esto correctamente y por
completo es un desafío técnico permanente.
 El valor económico de estos datos varía
significativamente. Por lo general podemos
encontrar información valiosa escondida dentro
de un conjunto mayor de datos no tradicionales
(no estructurados, sin formato, etc.), el desafío
consta en examinar esta gran cantidad de datos y
encontrar patrones ocultos, correlaciones
desconocidas y otra información útil para
identificar lo que es valioso para el negocio y
luego transformar y extraer los datos para el
análisis. Otra situación que les da mayor valor a
estos datos, es cuando se pueden vincular con
otros datos y otras fuentes.
 El valor real de los datos lo podemos
encontrar contestando estas tres preguntas:
◦ ¿Quién puede beneficiarse de esta información?
◦ ¿Qué decisiones de negocio se tomaran con esta
información?
◦ ¿Cuándo se necesita esta información para apoyar
una mejor toma de decisiones?
 Descifrando con éxito la manera de capturar,
administrar y manipular los grandes
volúmenes de datos (Big Data) nos dará
enormes oportunidades para su uso y
explotación en casi todas las ramas.
Aquellas empresas que apuesten por el big data,
podrán crear nuevas oportunidades para
diferenciarse de la competencia. En la actualidad
hay tres tendencias que están surgiendo de la
utilización del Big Data.
 La primera se enfoca en el uso de la información
para crear nuevos productos.
 La segunda se refiere a la intermediación de esta
información, es decir, a la interacción con otros
datos para complementarlos, volviéndolos más
útiles.
 El tercero es la construcción de redes para
ofrecer productos en el momento y el lugar
correcto.
Preguntas
http://sesa78.wordpress.com/

Weitere ähnliche Inhalte

Was ist angesagt?

SISTEMAS DE INFORMACIÓN GERENCIAL CASO ESTUDIO: IAMFISS
SISTEMAS DE INFORMACIÓN GERENCIAL CASO ESTUDIO: IAMFISSSISTEMAS DE INFORMACIÓN GERENCIAL CASO ESTUDIO: IAMFISS
SISTEMAS DE INFORMACIÓN GERENCIAL CASO ESTUDIO: IAMFISSNATHALY ARIAS
 
Introduccion al Internet de las cosas
Introduccion al Internet  de las cosasIntroduccion al Internet  de las cosas
Introduccion al Internet de las cosasSIRIUS e-Learning
 
Introducción al Business Intelligence y al Big Data
Introducción al Business Intelligence y al Big DataIntroducción al Business Intelligence y al Big Data
Introducción al Business Intelligence y al Big DataDavid Hurtado
 
Ejemplos de proyectos al modelo en cascada
Ejemplos de proyectos  al modelo en cascadaEjemplos de proyectos  al modelo en cascada
Ejemplos de proyectos al modelo en cascadaaics-1986-13-saraguro
 
Arquitectura 3 Capas
Arquitectura 3 CapasArquitectura 3 Capas
Arquitectura 3 CapasFani Calle
 
Cuadro comparativo de SMBD
Cuadro comparativo de SMBD Cuadro comparativo de SMBD
Cuadro comparativo de SMBD Jazmin Glez.
 
Tendencia a futuro de las bases de datos
Tendencia a futuro de las bases de datosTendencia a futuro de las bases de datos
Tendencia a futuro de las bases de datosLeo Brand
 
BD para Dispositivos Moviles - Unidad 3 SMBD Moviles
BD para Dispositivos Moviles - Unidad 3 SMBD MovilesBD para Dispositivos Moviles - Unidad 3 SMBD Moviles
BD para Dispositivos Moviles - Unidad 3 SMBD MovilesJosé Antonio Sandoval Acosta
 
Empresas con BDOO
Empresas con BDOOEmpresas con BDOO
Empresas con BDOOtec lerdo
 

Was ist angesagt? (20)

Big Data
Big DataBig Data
Big Data
 
Big data presentacion diapositiva
Big data presentacion diapositivaBig data presentacion diapositiva
Big data presentacion diapositiva
 
SISTEMAS DE INFORMACIÓN GERENCIAL CASO ESTUDIO: IAMFISS
SISTEMAS DE INFORMACIÓN GERENCIAL CASO ESTUDIO: IAMFISSSISTEMAS DE INFORMACIÓN GERENCIAL CASO ESTUDIO: IAMFISS
SISTEMAS DE INFORMACIÓN GERENCIAL CASO ESTUDIO: IAMFISS
 
Introduccion al Internet de las cosas
Introduccion al Internet  de las cosasIntroduccion al Internet  de las cosas
Introduccion al Internet de las cosas
 
Introducción al Business Intelligence y al Big Data
Introducción al Business Intelligence y al Big DataIntroducción al Business Intelligence y al Big Data
Introducción al Business Intelligence y al Big Data
 
Linea de Tiempo Big Data
Linea de Tiempo Big DataLinea de Tiempo Big Data
Linea de Tiempo Big Data
 
Ejemplos de proyectos al modelo en cascada
Ejemplos de proyectos  al modelo en cascadaEjemplos de proyectos  al modelo en cascada
Ejemplos de proyectos al modelo en cascada
 
Arquitectura 3 Capas
Arquitectura 3 CapasArquitectura 3 Capas
Arquitectura 3 Capas
 
Cuadro comparativo de SMBD
Cuadro comparativo de SMBD Cuadro comparativo de SMBD
Cuadro comparativo de SMBD
 
Diapositivas olap
Diapositivas olapDiapositivas olap
Diapositivas olap
 
Tendencia a futuro de las bases de datos
Tendencia a futuro de las bases de datosTendencia a futuro de las bases de datos
Tendencia a futuro de las bases de datos
 
Los Sistemas De Informacion
Los Sistemas De InformacionLos Sistemas De Informacion
Los Sistemas De Informacion
 
ETL
ETLETL
ETL
 
Inteligencia de negocios - Business Intelligence
Inteligencia de negocios - Business IntelligenceInteligencia de negocios - Business Intelligence
Inteligencia de negocios - Business Intelligence
 
Introduccion big data
Introduccion  big dataIntroduccion  big data
Introduccion big data
 
Presentacion big data
Presentacion big dataPresentacion big data
Presentacion big data
 
BD para Dispositivos Moviles - Unidad 3 SMBD Moviles
BD para Dispositivos Moviles - Unidad 3 SMBD MovilesBD para Dispositivos Moviles - Unidad 3 SMBD Moviles
BD para Dispositivos Moviles - Unidad 3 SMBD Moviles
 
Empresas con BDOO
Empresas con BDOOEmpresas con BDOO
Empresas con BDOO
 
Internet de las cosas
Internet de las cosasInternet de las cosas
Internet de las cosas
 
Casos big data
Casos big dataCasos big data
Casos big data
 

Ähnlich wie Que es big data

Ähnlich wie Que es big data (20)

Introduccion a Big Data stack
Introduccion a Big Data stackIntroduccion a Big Data stack
Introduccion a Big Data stack
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight Server
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptx
 
Data set module 1 - spanish
Data set   module 1 - spanishData set   module 1 - spanish
Data set module 1 - spanish
 
Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014
 
Big data
Big dataBig data
Big data
 
BIG DATA
BIG DATABIG DATA
BIG DATA
 
Lisintuña christian (cloud computing and data)
Lisintuña christian (cloud computing and data)Lisintuña christian (cloud computing and data)
Lisintuña christian (cloud computing and data)
 
HD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelHD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot Excel
 
Big Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeBig Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nube
 
Big data
Big dataBig data
Big data
 
Big data bbva
Big data bbvaBig data bbva
Big data bbva
 
Big Data Introducción
Big Data IntroducciónBig Data Introducción
Big Data Introducción
 
Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data Stack
 
Data
DataData
Data
 
Trabajo de-big-data
Trabajo de-big-dataTrabajo de-big-data
Trabajo de-big-data
 
Afc module 1 translated
Afc module 1 translatedAfc module 1 translated
Afc module 1 translated
 
Que es big data
Que es big dataQue es big data
Que es big data
 
Fundamentos.pptx
Fundamentos.pptxFundamentos.pptx
Fundamentos.pptx
 
Profesión: Big Data
Profesión: Big DataProfesión: Big Data
Profesión: Big Data
 

Mehr von Sergio Sanchez

Mehr von Sergio Sanchez (6)

Calidad de datos (data quality)
Calidad de datos (data quality)Calidad de datos (data quality)
Calidad de datos (data quality)
 
Que es slowly change dimension?
Que es slowly change dimension?Que es slowly change dimension?
Que es slowly change dimension?
 
Normalizacion de base de datos
Normalizacion de base de datosNormalizacion de base de datos
Normalizacion de base de datos
 
Data quality
Data qualityData quality
Data quality
 
Data subset
Data subsetData subset
Data subset
 
Data masking
Data maskingData masking
Data masking
 

Que es big data

  • 2. Últimamente hemos escuchado acerca del termino Big Data, pero ¿sabemos realmente a que hace referencia?, ¿volumen grande de datos? , ¿Múltiples sistemas?, ¿qué significa realmente?, ¿Quién la necesita?
  • 3. Introducción ¿ Que es Big Data? Ejemplo de Big Data Características del Big Data - Tamaño Características del Big Data – Velocidad Características del Big Data – Volumen Características del Big Data – Variedad Características del Big Data – Valor Modelo de Negocios
  • 4. Hoy en día las organizaciones están manejando mucha información, una encuesta realizada en el 2010 nos indica que las empresas y los usuarios están obteniendo y almacenando más de 13 Exabytes de nueva información. Para tener una idea, 13 Exabytes es como tener 50,000 los datos de la Librería del Congreso de los estados Unidos.
  • 5. Independientemente del volumen o de la calidad de los datos, las empresas están utilizando estos para sus tomas de decisiones de negocio. Derivado de esto, las empresas han invertido para tener ventaja competitiva en la captura, integración análisis e intercambio de datos. Las empresas que utilizan la analítica para el análisis de datos, son dos veces más rentables que sus competidores. La analítica maneja casi todos los aspectos de nuestra vida o sociedad, incluidos los servicios de telefonía móvil, manufactura, comercio minorista, ciencias sociales y físicas.
  • 6. La gran cantidad de datos que se están utilizando al día de hoy, son complicados en cuanto a su manipulación y no se adecuan del todo a los modelos de bases de datos relacionales tradicionales. Las empresas que deseen analizar todos estos datos se ven obligadas a utilizar nuevas tecnologías como Hadoop, Cassandra, HBase, etc. debido a que las soluciones tradicionales como SQL, Oracle, etc. ya no son suficientes para manipular este tipo de información.
  • 7. Big Data hace referencia a este tipo de datos (grandes volúmenes y una mayor complejidad). Big Data también se refiere al análisis de este tipo de datos dándole una ventaja competitiva a las empresas que lo implementan.
  • 8. Definición  Las palabras Big Data, no solo hacen referencia a los grandes volúmenes de información, sino también, describe las herramientas, los procesos y procedimientos que les permiten a las empresas crear, manipular grandes conjuntos de datos, extrayendo información significativa.
  • 9. Definición  Los conjuntos de datos a los que hace referencia Big Data, son enormes, cuyo tamaño supera la capacidad para que sean integrados, gestionados o analizados por los sistemas de bases de datos típicos. Junto con el volumen de datos, la complejidad es otro problema a enfrentar, es decir, las formas en que se presentan los datos son inconsistentes e impredecibles, es decir son diferentes entre ellos mismos (formatos) lo que conlleva a que no podemos utilizar las técnicas tradicionales conocidas.
  • 10. Las empresas de hoy tienen el reto de analizar múltiples datos nuevos, los cuales pueden provenir de diferentes formas, diferentes tipos y a una velocidad diferente. Estos datos pueden ser estructurados, no- estructurados, archivos de texto plano. Estos datos van más allá de los ERP o sistemas transaccionales tradicionales, estos también pueden proveer de sistemas auxiliares, sistemas de apoyo, incluyendo weblogs, redes sociales y cualquier otro medio de comunicación social.
  • 11.  Big Data se refiere a todos los tipos de datos listados a continuación: ◦ Datos empresariales tradicionales, los cuales incluyen información del cliente proveniente de los sistemas CRM (Customer Relation Manager), datos transaccionales de ERP, transacciones provenientes de la web. ◦ Datos como detalles de atención telefónica al cliente, weblogs, medidores inteligentes (visitas), manufactura, logs de los equipos y sistemas de comercio. ◦ Datos sociales, incluyendo los feedbacks o retroalimentación, micro-blogs como Twitter y plataformas sociales como Facebook.
  • 12.  El objetivo de Big Data, es que las empresas sean capaces de recolectar y aprovechar cada byte de datos relevantes y usarlos para poder tomar las mejores decisiones de negocio.  Big Data es un cambio de paradigma en la forma en que pensamos acerca de los conjuntos de datos y cómo monetizarlos desde el punto de vista de análisis de estos conjuntos de datos. Su objetivo es recopilar la inteligencia (tendencias, etc.) a partir de los datos y traducir eso en una ventaja de negocio. Por lo tanto, tiene el potencial de transformar radicalmente las empresas. También permite una extensa medición y conocimiento sobre el negocio, y traduce directamente ese conocimiento en una mejor toma de decisiones y mejora del rendimiento.
  • 13. Un ejemplo, consideremos un retail (ventas al por menor), en este caso, una librería típica, aquí, siempre se podrá saber que libros fueron vendidos y cuáles no. Supongamos que tienen un programa de recompensas, con esto, podrían vincular las compras hechas por cada cliente inscrito en el programa, lo cual excluiría a los clientes casuales. Ahora bien, tomando una librería on-line (internet), el entendimiento de los clientes, aumentó dramáticamente. Los minoristas en línea pueden rastrear no sólo lo que compran los clientes, sino también qué más miraban mientras navegaban por el sitio web, lo mucho que se vieron influenciados por las promociones, reseñas y diseños de página, y las similitudes entre los individuos y los grupos.
  • 14. Con esta información desarrollaron en poco tiempo algoritmos para predecir qué libros en particular les gustaría leer, algoritmos que realizan mejor su tarea cada vez que el cliente respondió a una recomendación o la ignoro. Los minoristas tradicionales (librerías locales) simplemente no pueden acceder a este tipo de información, y mucho menos actuar sobre ella de una manera oportuna. No es de extrañar que Amazon ha puesto tantas librerías de ladrillo y mortero de negocios. No es coincidencia que Amazon le ha quitado gran parte del mercado a las librerías típicas.
  • 15.  Dado que el tamaño es uno de los términos comúnmente utilizados para describir Big Data, ¿Qué tan grande es? En general, cuando hablamos de Big Data hablamos de muchos datos. Comparando la magnitud de los datos tradicionales. McKinsey Global Institute estima que el volumen de datos está creciendo a un ritmo de 40% por año, y crecerán 44x entre los años 2009 y 2020.
  • 16.  A continuación algunos ejemplos que nos ayudaran a cuantificar la magnitud de Big Data: ◦ Wal-Mart maneja más de un millón de transacciones cada hora e importa esta información a motores de bases de datos que se estima contienen más de 2.5 Petabytes de datos. ◦ Cada día Facebook maneja más de 250 millones de fotos subidas a su sitio, también maneja la interacción de un billón de usuarios activos con más de 900 millones de objetos (paginas, grupos, etc.) ◦ Más de 5 billones de personas realizan llamadas, envían mensajes de texto, envían twitts y navegan desde sus teléfonos móviles alrededor del mundo.
  • 17.  Aunque el tamaño es mencionado con frecuencia, también es relativo a cada organización. Los datos que se consideran grandes para una organización pueden no ser necesariamente grandes para otro. Las características de los grandes datos más aceptada es el 3V - volumen, velocidad y variedad.
  • 18. Big Data tiende a mostrar los extremos de las 3V:  Volumen (¿Cuánta información?, teradata, exadata)  Velocidad (¿Qué tan rápida es?, tiempo real, transmisión/streaming)  Variedad (¿Cuántos tipos de datos llegan? Estructurados, no estructurados, semi estructurados.
  • 19. Una de las características menos entendidas de Big Data. Es la velocidad a la que los datos llegan a la organización y se procesan. Cuanto mayor sea el conjunto de datos a procesar, más tiempo tomará para analizar. Aunque es posible transmitir “rápidamente” estos datos a su lugar de almacenamiento por medio del procesamiento en lotes (batch), existen situaciones en que la importancia radica en la velocidad de la captura y el análisis de estos datos, tomando dichos datos de entrada para tomar la decisión de negocio tan pronto sea posible. Por ejemplo, si se sospecha de una transacción con tarjeta de crédito fraudulenta, lo ideal es que se marcará antes de que se termine la transacción - la posibilidad de impedir la operación antes de que finalice.
  • 20. Los logs de las páginas web, las redes sociales producen una gran cantidad de cambios en la información potencialmente útiles en la adquisición de experiencia en el comportamiento de estos. A un ritmo vertiginoso de cambios en los datos, puede causar la complejidad de almacenar, procesar y consultar estos datos. Incluso a 140 caracteres por tweet, con una alta frecuencia de uso, Twitter garantiza grandes volúmenes de datos en un día (más de 8 terabytes).
  • 21. El volumen de datos generados en la actualidad a nivel mundial, es más alto que el normal; sobre todo si utilizamos los datos generados por el registro de la navegación en internet. Estos datos con gran volumen conduce a costosos procesos de almacenamiento, ETL y de análisis.
  • 22. El beneficio obtenido de la capacidad de procesar grandes cantidades de datos es la principal atracción de análisis de datos grandes (Big Data). Por ejemplo, un motor a reacción puede generar 10 terabytes de datos en 30 minutos. Con más de 25.000 vuelos de las aerolíneas por día, el volumen diario de datos generados seria de petabytes.
  • 23. Esta característica hace referencia a la captura de todos estos datos que apoyan al proceso de toma de decisiones. Los datos tradicionales tienden a estar organizados y bien definidos (estructurados) y sin cambios frecuentes. A diferencia, los datos no tradicionales (imágenes, video, y cualquier otra variación) no presentan ninguna estructura específica y por su naturaleza no son candidatos para el manejo informático ni vienen listos para su integración con una aplicación. Un uso común del procesamiento de Big Data, es tomar los datos no estructurados y extraer ordenadamente su significado. Hacer esto correctamente y por completo es un desafío técnico permanente.
  • 24.  El valor económico de estos datos varía significativamente. Por lo general podemos encontrar información valiosa escondida dentro de un conjunto mayor de datos no tradicionales (no estructurados, sin formato, etc.), el desafío consta en examinar esta gran cantidad de datos y encontrar patrones ocultos, correlaciones desconocidas y otra información útil para identificar lo que es valioso para el negocio y luego transformar y extraer los datos para el análisis. Otra situación que les da mayor valor a estos datos, es cuando se pueden vincular con otros datos y otras fuentes.
  • 25.  El valor real de los datos lo podemos encontrar contestando estas tres preguntas: ◦ ¿Quién puede beneficiarse de esta información? ◦ ¿Qué decisiones de negocio se tomaran con esta información? ◦ ¿Cuándo se necesita esta información para apoyar una mejor toma de decisiones?  Descifrando con éxito la manera de capturar, administrar y manipular los grandes volúmenes de datos (Big Data) nos dará enormes oportunidades para su uso y explotación en casi todas las ramas.
  • 26. Aquellas empresas que apuesten por el big data, podrán crear nuevas oportunidades para diferenciarse de la competencia. En la actualidad hay tres tendencias que están surgiendo de la utilización del Big Data.  La primera se enfoca en el uso de la información para crear nuevos productos.  La segunda se refiere a la intermediación de esta información, es decir, a la interacción con otros datos para complementarlos, volviéndolos más útiles.  El tercero es la construcción de redes para ofrecer productos en el momento y el lugar correcto.