El término “Data Science” se ha vuelto muy popular recientemente con el aumento de popularidad de las redes sociales, análisis predictivos y el análisis de datos no estructurados como parte del crecimiento del “Big Data”. En esta sesión estaremos viendo que es “Data Science”, que necesitamos saber o aprender para poder convertirnos en un científico de datos y estaremos viendo algunos ejemplos de usos muy comunes usando lenguajes como Python, R y el cómo podemos integrar estos en SQL Server y Azure . Al final de esta charla tendrás un entendimiento más amplio de las técnicas de manejos de datos, modelamiento, visualización y los lenguajes y productos para poner tus proyectos en marcha.
1. Introducción a Data Science
19 de Agosto 2015 (12 pm GMT -5)
José L Rivera
Resumen:
En esta sesión estaremos viendo que es “Data Science”, que
necesitamos saber o aprender para poder convertirnos en un
científico de datos y estaremos viendo algunos ejemplos de usos
muy comunes usando lenguajes como Python, R y el cómo
podemos integrar estos en SQL Server y Azure . Al final de esta
charla tendrás un entendimiento más amplio de las técnicas de
manejos de datos, modelamiento, visualización y los lenguajes y
productos para poner tus proyectos en marcha
Está por comenzar:
Próximos Eventos
Conociendo los servicios
adicionales en BigData
26 de Agosto
Freddy Angarita
SQL Server Rápido y Furioso
2 de Setiembre
Alejandro Cordero
SQL como un servicio en la nube
9 de Setiembre
Warner Chaves
Moderador: Carlos Ulate
2. Manténgase conectado a nosotros!
Visítenos en http://globalspanish.sqlpass.org
/SpanishPASSVC
lnkd.in/dtYBzev
/user/SpanishPASSVC
/SpanishPASSVC
3.
4. Oportunidades de Voluntariado
PASS no pudiera existir sin personas apasionadas y
dedicadas de todas partes del mundo que dan de su
tiempo como voluntarios.
Se un voluntario ahora!!
Para identificar oportunidades locales visita
volunteer.sqlpass.org
Recuerda actualizar tu perfil en las secciones de
“MyVolunteering” y MyPASS para mas detalles.
6. Introducción a Data Science
19 de Agosto de 2015
Jose L Rivera, MBA
MVP | MCSE | MCSA | MCITP | MCSE
Chapter Leader – PASS Global Spanish VC
@SQLConqueror
Moderador: Carlos Ulate
7.
8. Agenda
• Conceptos básicos de Data Science (DS)
• Herramientas Microsoft para DS
• Herramientas OpenSource para DS
• Demos
• Q&A
9. Conceptos Básicos
hechos y estadísticas almacenadas para referencia o análisis
BI es un termino sombrilla que reúne a una variedad de aplicaciones
usadas para analizar la data de una empresa. Esta disciplina esta compuesta
de actividades relacionadas a minería de datos, procesamiento analítico (OLAP),
queries y reportes.
Data
Business Intelligence
10. Conceptos Básicos
es la extracción de conocimiento de grandes volúmenes de
datos estructurados y no estructurados mediante el uso de
técnicas de minería de datos y análisis predictivo
Data Science
12. Recopilación de Datos
Eventos Comportamiento Acción/Pruebas Resultado Observación Conjuntos
de Datos
• Características
• Ambiente
• Actividades
significativas al
negocio
• Medidas • Estructurada
• No Estructurada
• Semi-Estructurada
18. SSAS Data Mining
• SQL Server 2005+
• Excel Add-in
Tipo de Algoritmo Uso Común
Clasificación
predice una o más variables discretas basadas en los otros atributos
del conjunto de datos
Regresión
predice una o más variables continuas basadas en los otros atributos
del conjunto de datos
Segmentación
divide los datos en grupos (clusters) de elementos que tiene
propiedades similares
Asociación
encuentra correlaciones entre los diferentes atributos en un conjunto
de datos
Análisis Secuencial
resume las secuencias frecuentes o episodios de los datos
21. R
• CRAN (versión oficial) - http://cran.r-project.org/
• 5,000+ paquetes (librerías)
• v 3.2.4
• RStudio (http://www.rstudio.com/)
• IDE para R
• Provee un experiencia integrada y simple
• Revolution Analytics (http://www.revolutionanalytics.com/)
• Otra versión de R
• Paralelismo y Rendimiento
• SQL Server 2016
22. Python
• Lenguaje de programación de uso general
• OOP
• Open Source - http://www.python.org/
• v 3.4.3 | 2.7.10
• Multiples IDEs
• IDLE
• Canopy
• IPython Notebook
28. Conociendo los servicios adicionales en BigData
26 de Agosto (12 pm GMT -5)
Freddy Angarita
Resúmen:
Todos han empezado a usar y a conocer Hadoop y HDInsight, en parte
los lenguajes usados para su consumo, pero poco se hablado de los
servicios complementarios que pueden enriquecer la experiencia BigData,
conozca estos servicios y su aplicación
Próximo Evento