SlideShare ist ein Scribd-Unternehmen logo
1 von 13
Aplicación de minería de datos a
WEKA
Juan P. Sandoval
Armando Tapia
Rolando Valenzuela
Gerardo Zapata
Introducción
•

Weka es un software programado en Java que está orientado a la
extracción de conocimientos desde bases de datos con grandes
cantidades de información.

•

La implementación de los esquemas de aprendizaje son los recursos
más valiosos de WEKA. Las herramientas para el preprocesamiento de
datos, llamados filtros, WEKA centra su atención en los algoritmos de
clasificación y filtro, sin embargo, también incluye la implementación de
algoritmos para el aprendizaje de reglas de asociación y el
agrupamiento de datos (clustering).
Descubrimiento del software
•
•
•

•

En 1993, la Universidad de Waikato de Nueva Zelanda inició el
desarrollo de la versión original de Weka (en TCL/TK y C).
En 1997, se decidió reescribir el código en Java incluyendo
implementaciones de algoritmos de modelado.
En 2005, Weka recibe de SIGKDD2 3 (Special Interest Group on
Knowledge Discovery and Data Mining) el galardón "Data Mining and
Knowledge Discovery Service".
En 2006, Pentaho Corporation adquirió una licencia exclusiva para
usar Weka para Inteligencia de negocio (Business Intelligence), dando
lugar al componente de minería de datos y análisis predictivo del
paquete de software Pentaho Business Intelligence.
Descripción Del Software
• El paquete Weka contiene una colección de herramientas de
visualización y algoritmos para análisis de datos y modelado
predictivo, unidos a una interfaz gráfica de usuario para
acceder fácilmente a sus funcionalidades. La versión original
de Weka fue un front-end enTCL/TK para modelar algoritmos
implementados en otros lenguajes de programación, más
unas utilidades para pre procesamiento de datos
desarrolladas en C para hacer experimentos de aprendizaje
automático.
Operaciones del software
Razones a favor de Weka
•Está disponible libremente bajo la licencia pública general de
GNU.
•Es muy portable porque está completamente implementado en
Java y puede correr en casi cualquier plataforma.
•Contiene una extensa colección de técnicas para
preprocesamiento de datos y modelado.
•Es fácil de utilizar por un principiante gracias a su interfaz
gráfica de usuario.
Interfaz del usuario
La interfaz del usuario
• Simple CLI
• Simple CLI es la abreviatura de Simple
Command-Line Interface (Interfaz Simple de
Línea de Comandos); se trata de una consola
que permite acceder a todas las opciones de
Weka desde línea de comandos.
• Explorer
• La interfaz Explorer (Explorador) dispone de varios
paneles que dan acceso a los componentes
principales del banco de trabajo:
• "Preprocess“
• "Classify“
• "Associate"
• "Cluster“
• "Selectedattributes"
• Experimenter
• La interfaz Experimenter (Experimentador)
permite la comparación sistemática de una
ejecución de los algoritmos predictivos de
Weka sobre una colección de conjuntos de
datos.
• Knowledge Flow
• KnowledgeFlow (Flujo de Conocimiento) es
una interfaz que soporta esencialmente las
mismas funciones que el Explorer pero con
una interfaz que permite "arrastrar y soltar".
Una ventaja es que ofrece soporte para el
aprendizaje incremental.
Ejercicio
• El fichero contiene una serie de filas, cada una
de las cuales contiene un conjunto de factores
meteorológicos de un determinado día y nos
indica si se ha podido jugar o no al tenis.
Nuestro objetivo será crear un árbol de
decisión que nos ayude a predecir si, por
ejemplo, hoy vamos a poder jugar al tenis.
Weka aplicación minería datos
Weka aplicación minería datos

Weitere ähnliche Inhalte

Was ist angesagt?

Diseño estratégico plan de desarrollo e commerce (enero 2013)
Diseño estratégico plan de desarrollo e commerce (enero 2013)Diseño estratégico plan de desarrollo e commerce (enero 2013)
Diseño estratégico plan de desarrollo e commerce (enero 2013)Oscar Mario Guillén
 
Cuello de botella de von neumann
Cuello de botella de von neumannCuello de botella de von neumann
Cuello de botella de von neumanncreatrios
 
Importancia del análisis de requerimientos
Importancia del análisis de requerimientosImportancia del análisis de requerimientos
Importancia del análisis de requerimientosalmarza1
 
Modelos de Algoritmo Genetico
Modelos de Algoritmo GeneticoModelos de Algoritmo Genetico
Modelos de Algoritmo GeneticoenlaUPEA
 
Proyecto De Base De Datos
Proyecto De Base De DatosProyecto De Base De Datos
Proyecto De Base De Datosguesta67b7c
 
Proyecto II Base de Datos Avanzadas
Proyecto II Base de Datos AvanzadasProyecto II Base de Datos Avanzadas
Proyecto II Base de Datos Avanzadasmarianaalva
 
Tabla comparativa de paradigma de programacion estruturada y pradigma de prog...
Tabla comparativa de paradigma de programacion estruturada y pradigma de prog...Tabla comparativa de paradigma de programacion estruturada y pradigma de prog...
Tabla comparativa de paradigma de programacion estruturada y pradigma de prog...jose francisco arenas jimenez
 
Introducción a los modelos de datos
Introducción a los modelos de datosIntroducción a los modelos de datos
Introducción a los modelos de datosGalo Anzules
 
Creando un servicio SOAP en Java con NetBeans
Creando un servicio SOAP en Java con NetBeansCreando un servicio SOAP en Java con NetBeans
Creando un servicio SOAP en Java con NetBeansDavid Fernández Puentes
 
4. Diseño e Implementación de Software
4. Diseño e Implementación de Software4. Diseño e Implementación de Software
4. Diseño e Implementación de SoftwareMario A Moreno Rocha
 

Was ist angesagt? (20)

Diseño estratégico plan de desarrollo e commerce (enero 2013)
Diseño estratégico plan de desarrollo e commerce (enero 2013)Diseño estratégico plan de desarrollo e commerce (enero 2013)
Diseño estratégico plan de desarrollo e commerce (enero 2013)
 
Cuello de botella de von neumann
Cuello de botella de von neumannCuello de botella de von neumann
Cuello de botella de von neumann
 
Importancia del análisis de requerimientos
Importancia del análisis de requerimientosImportancia del análisis de requerimientos
Importancia del análisis de requerimientos
 
Modelos de Algoritmo Genetico
Modelos de Algoritmo GeneticoModelos de Algoritmo Genetico
Modelos de Algoritmo Genetico
 
Proyecto De Base De Datos
Proyecto De Base De DatosProyecto De Base De Datos
Proyecto De Base De Datos
 
Máquina de turing
Máquina de turingMáquina de turing
Máquina de turing
 
Diseño de Software
Diseño de SoftwareDiseño de Software
Diseño de Software
 
Arquitectura Orientada a Servicios
Arquitectura Orientada a ServiciosArquitectura Orientada a Servicios
Arquitectura Orientada a Servicios
 
Proyecto II Base de Datos Avanzadas
Proyecto II Base de Datos AvanzadasProyecto II Base de Datos Avanzadas
Proyecto II Base de Datos Avanzadas
 
Metodologia Diseño Web
Metodologia Diseño WebMetodologia Diseño Web
Metodologia Diseño Web
 
Weka completo
Weka completoWeka completo
Weka completo
 
Tabla comparativa de paradigma de programacion estruturada y pradigma de prog...
Tabla comparativa de paradigma de programacion estruturada y pradigma de prog...Tabla comparativa de paradigma de programacion estruturada y pradigma de prog...
Tabla comparativa de paradigma de programacion estruturada y pradigma de prog...
 
Introducción a los modelos de datos
Introducción a los modelos de datosIntroducción a los modelos de datos
Introducción a los modelos de datos
 
Modelo Boehm
Modelo BoehmModelo Boehm
Modelo Boehm
 
Creando un servicio SOAP en Java con NetBeans
Creando un servicio SOAP en Java con NetBeansCreando un servicio SOAP en Java con NetBeans
Creando un servicio SOAP en Java con NetBeans
 
4ta Generacion
4ta Generacion4ta Generacion
4ta Generacion
 
4. Diseño e Implementación de Software
4. Diseño e Implementación de Software4. Diseño e Implementación de Software
4. Diseño e Implementación de Software
 
Informe cassandra
Informe cassandraInforme cassandra
Informe cassandra
 
Diseño Oriendado a Objetos
Diseño Oriendado a ObjetosDiseño Oriendado a Objetos
Diseño Oriendado a Objetos
 
Ejercicio En Weka
Ejercicio En WekaEjercicio En Weka
Ejercicio En Weka
 

Ähnlich wie Weka aplicación minería datos

Desarrollo aplicaciones windows c#
Desarrollo aplicaciones windows c#Desarrollo aplicaciones windows c#
Desarrollo aplicaciones windows c#Roger Campos
 
Introducción a Scala
Introducción a ScalaIntroducción a Scala
Introducción a Scalajose diaz
 
Mi lenguaje de programación de preferencia
Mi lenguaje de programación de preferenciaMi lenguaje de programación de preferencia
Mi lenguaje de programación de preferenciaglfloresgilberto
 
CÓDIGOS ABIERTOS.pptx
CÓDIGOS ABIERTOS.pptxCÓDIGOS ABIERTOS.pptx
CÓDIGOS ABIERTOS.pptxBritneyCano
 
Gestión de Recursos Computacionales en el Cloud para Actividades Educativas
Gestión de Recursos Computacionales en el Cloud para Actividades EducativasGestión de Recursos Computacionales en el Cloud para Actividades Educativas
Gestión de Recursos Computacionales en el Cloud para Actividades EducativasGermán Moltó
 
Meetup DigitalOcean Cloud Native architecture
Meetup DigitalOcean Cloud Native architectureMeetup DigitalOcean Cloud Native architecture
Meetup DigitalOcean Cloud Native architectureDomingo Suarez Torres
 
herramientas tecnológicas
herramientas tecnológicasherramientas tecnológicas
herramientas tecnológicasGerardo Linares
 
Abf leccion 02
Abf leccion 02Abf leccion 02
Abf leccion 02victdiazm
 
Conociendo las tecnologías de TypeSafe (Primer meetup Scala Perú Nov 2015)
Conociendo las tecnologías de TypeSafe (Primer meetup Scala Perú Nov 2015)Conociendo las tecnologías de TypeSafe (Primer meetup Scala Perú Nov 2015)
Conociendo las tecnologías de TypeSafe (Primer meetup Scala Perú Nov 2015)Marco Antonio Ordoñez Valverde
 
Dev ops with Data
Dev ops with DataDev ops with Data
Dev ops with Datannakasone
 
1 fundamentos java
1 fundamentos java1 fundamentos java
1 fundamentos javaayreonmx
 
Sistemas gestores de base de datos (sgbd)
Sistemas gestores de base de datos (sgbd)Sistemas gestores de base de datos (sgbd)
Sistemas gestores de base de datos (sgbd)Henry Cumbicus Rivera
 
PRIMERA PRESENTACION JAVA
PRIMERA PRESENTACION JAVAPRIMERA PRESENTACION JAVA
PRIMERA PRESENTACION JAVANoralma Yanez
 
Mi Lenguaje de Programacion de Preferencia
Mi Lenguaje de Programacion de PreferenciaMi Lenguaje de Programacion de Preferencia
Mi Lenguaje de Programacion de PreferenciaNelson Rivera
 

Ähnlich wie Weka aplicación minería datos (20)

JAVA.pptx
JAVA.pptxJAVA.pptx
JAVA.pptx
 
Desarrollo aplicaciones windows c#
Desarrollo aplicaciones windows c#Desarrollo aplicaciones windows c#
Desarrollo aplicaciones windows c#
 
Introducción a Scala
Introducción a ScalaIntroducción a Scala
Introducción a Scala
 
Mi lenguaje de programación de preferencia
Mi lenguaje de programación de preferenciaMi lenguaje de programación de preferencia
Mi lenguaje de programación de preferencia
 
CÓDIGOS ABIERTOS.pptx
CÓDIGOS ABIERTOS.pptxCÓDIGOS ABIERTOS.pptx
CÓDIGOS ABIERTOS.pptx
 
Gestión de Recursos Computacionales en el Cloud para Actividades Educativas
Gestión de Recursos Computacionales en el Cloud para Actividades EducativasGestión de Recursos Computacionales en el Cloud para Actividades Educativas
Gestión de Recursos Computacionales en el Cloud para Actividades Educativas
 
Meetup DigitalOcean Cloud Native architecture
Meetup DigitalOcean Cloud Native architectureMeetup DigitalOcean Cloud Native architecture
Meetup DigitalOcean Cloud Native architecture
 
herramientas tecnológicas
herramientas tecnológicasherramientas tecnológicas
herramientas tecnológicas
 
Abf leccion 02
Abf leccion 02Abf leccion 02
Abf leccion 02
 
Introduccion Java.ppt
Introduccion Java.pptIntroduccion Java.ppt
Introduccion Java.ppt
 
Lenguaje Java
Lenguaje JavaLenguaje Java
Lenguaje Java
 
Conociendo las tecnologías de TypeSafe (Primer meetup Scala Perú Nov 2015)
Conociendo las tecnologías de TypeSafe (Primer meetup Scala Perú Nov 2015)Conociendo las tecnologías de TypeSafe (Primer meetup Scala Perú Nov 2015)
Conociendo las tecnologías de TypeSafe (Primer meetup Scala Perú Nov 2015)
 
Dev ops with Data
Dev ops with DataDev ops with Data
Dev ops with Data
 
Practica 8 Wireshark
Practica 8 WiresharkPractica 8 Wireshark
Practica 8 Wireshark
 
1 fundamentos java
1 fundamentos java1 fundamentos java
1 fundamentos java
 
Sistemas gestores de base de datos (sgbd)
Sistemas gestores de base de datos (sgbd)Sistemas gestores de base de datos (sgbd)
Sistemas gestores de base de datos (sgbd)
 
PRIMERA PRESENTACION JAVA
PRIMERA PRESENTACION JAVAPRIMERA PRESENTACION JAVA
PRIMERA PRESENTACION JAVA
 
Lenguaje Java
Lenguaje JavaLenguaje Java
Lenguaje Java
 
Programación
ProgramaciónProgramación
Programación
 
Mi Lenguaje de Programacion de Preferencia
Mi Lenguaje de Programacion de PreferenciaMi Lenguaje de Programacion de Preferencia
Mi Lenguaje de Programacion de Preferencia
 

Weka aplicación minería datos

  • 1. Aplicación de minería de datos a WEKA Juan P. Sandoval Armando Tapia Rolando Valenzuela Gerardo Zapata
  • 2. Introducción • Weka es un software programado en Java que está orientado a la extracción de conocimientos desde bases de datos con grandes cantidades de información. • La implementación de los esquemas de aprendizaje son los recursos más valiosos de WEKA. Las herramientas para el preprocesamiento de datos, llamados filtros, WEKA centra su atención en los algoritmos de clasificación y filtro, sin embargo, también incluye la implementación de algoritmos para el aprendizaje de reglas de asociación y el agrupamiento de datos (clustering).
  • 3. Descubrimiento del software • • • • En 1993, la Universidad de Waikato de Nueva Zelanda inició el desarrollo de la versión original de Weka (en TCL/TK y C). En 1997, se decidió reescribir el código en Java incluyendo implementaciones de algoritmos de modelado. En 2005, Weka recibe de SIGKDD2 3 (Special Interest Group on Knowledge Discovery and Data Mining) el galardón "Data Mining and Knowledge Discovery Service". En 2006, Pentaho Corporation adquirió una licencia exclusiva para usar Weka para Inteligencia de negocio (Business Intelligence), dando lugar al componente de minería de datos y análisis predictivo del paquete de software Pentaho Business Intelligence.
  • 4. Descripción Del Software • El paquete Weka contiene una colección de herramientas de visualización y algoritmos para análisis de datos y modelado predictivo, unidos a una interfaz gráfica de usuario para acceder fácilmente a sus funcionalidades. La versión original de Weka fue un front-end enTCL/TK para modelar algoritmos implementados en otros lenguajes de programación, más unas utilidades para pre procesamiento de datos desarrolladas en C para hacer experimentos de aprendizaje automático.
  • 5. Operaciones del software Razones a favor de Weka •Está disponible libremente bajo la licencia pública general de GNU. •Es muy portable porque está completamente implementado en Java y puede correr en casi cualquier plataforma. •Contiene una extensa colección de técnicas para preprocesamiento de datos y modelado. •Es fácil de utilizar por un principiante gracias a su interfaz gráfica de usuario.
  • 7. La interfaz del usuario • Simple CLI • Simple CLI es la abreviatura de Simple Command-Line Interface (Interfaz Simple de Línea de Comandos); se trata de una consola que permite acceder a todas las opciones de Weka desde línea de comandos.
  • 8. • Explorer • La interfaz Explorer (Explorador) dispone de varios paneles que dan acceso a los componentes principales del banco de trabajo: • "Preprocess“ • "Classify“ • "Associate" • "Cluster“ • "Selectedattributes"
  • 9. • Experimenter • La interfaz Experimenter (Experimentador) permite la comparación sistemática de una ejecución de los algoritmos predictivos de Weka sobre una colección de conjuntos de datos.
  • 10. • Knowledge Flow • KnowledgeFlow (Flujo de Conocimiento) es una interfaz que soporta esencialmente las mismas funciones que el Explorer pero con una interfaz que permite "arrastrar y soltar". Una ventaja es que ofrece soporte para el aprendizaje incremental.
  • 11. Ejercicio • El fichero contiene una serie de filas, cada una de las cuales contiene un conjunto de factores meteorológicos de un determinado día y nos indica si se ha podido jugar o no al tenis. Nuestro objetivo será crear un árbol de decisión que nos ayude a predecir si, por ejemplo, hoy vamos a poder jugar al tenis.