SlideShare ist ein Scribd-Unternehmen logo
1 von 36
UNIVERSIDAD TECNICA PARTICULAR DE LOJALa Universidad católica de Loja INTELIGENCIA ARTIFICIAL AVANZADA PROYECTO FINAL REALIZADO POR: ,[object Object]
 Adriana B. Macas E.
Yesenia C. Pineda C.
 Dalton S. Ortega A,[object Object]
INTRODUCCION La inteligencia artificial es la disciplina que se encarga de construir procesos que al ser ejecutados sobre una arquitectura física producen acciones o resultados que maximizan una medida de rendimiento determinada, basándose en la secuencia de entradas percibidas y en el conocimiento almacenado en tal arquitectura.
INTRODUCCION En la IA se puede observar dos enfoques diferentes: La IA concebida como el intento por desarrollar una tecnología capaz de proveer al ordenador capacidades de razonamiento similares a los de la inteligencia humana. La IA en su concepción como investigación relativa a los mecanismos de la inteligencia humana que se emplean en la simulación de validación de teorías.
CLUSTERING El proceso de clustering consiste en la división de los datos en grupos de objetos similares. Para medir la similitud entre objetos se suelen utilizar diferentes formas de distancia: distancia euclídea, de Manhatan, de Mahalanobis, etc. El representar los datos por una serie de clusters, conlleva la pérdida de detalles, pero consigue la simplificación de los mismos.
CLUSTERING Clustering es una técnica más de Aprendizaje Automático, en la que el aprendizaje realizado es no supervisado. Desde un punto de vista práctico, el clustering juega un papel muy importante en aplicaciones de minería de datos, tales como exploración de datos científicos, recuperación de la información y minería de texto, aplicaciones sobre bases de datos espaciales (tales como GIS o datos procedentes de astronomía), aplicaciones web, marketing, diagnóstico médico, análisis de ADN en biología computacional, y muchas otras.
ALGORITMOS DE CLUSTERING El agrupamiento de datos o clustering puede definirse como un método para clasificar o describir propiedades de un sistema a partir de un conjunto de datos adquiridos o representativos de dicho sistema. La aplicación de estos algoritmos tiene como objetivo devolver al usuario una serie de puntos que en cierto modo representan al resto de puntos iniciales por su posición privilegiada con respecto al total.   Algunos de los algoritmos de agrupamiento más utilizados son: 1.- K-means clustering 2.- Fuzzy c-means clustering 3.- Grupos próximos a un entorno (nearestneighborhoodclustering) 4.- Redes de aprendizaje competitivo 5.- Cobweb
ALGORITMOS DE CLUSTERING Un esquema simplificado de un algoritmo de clustering se muestra en la siguiente figura:
RECONOCIMIENTO DE VOZ Actualmente el Reconocimiento de voz es utilizado como comunicación entre humano y computadora. El agrupamiento de datos o clustering puede definirse como el método para clasificar o describir propiedades de un sistema a partir de un conjunto de datos adquiridos o representativos del sistema. La aplicación de estos algoritmos tiene como objetivo devolver al usuario una serie de puntos que en cierto modo representan al resto de puntos iníciales por su posición privilegiada con respecto al total. El objetivo de la construcción de estos algoritmos es que permiten la identificación de los fonemas de personas a partir de variables que identifiquen los caracteres del sonido para un flujo continuo de ondas sonoras y silencios.
RECONOCIMIENTO DE VOZ Debe cumplir 3 tareas:  Pre procesamiento: Convierte la entrada de voz a una forma que el reconocedor pueda procesar.  Reconocimiento: Identifica lo que se dijo (traducción de señal a texto).  Comunicación: Envía lo reconocido al sistema (Software/Hardware) que lo requiere.
WEKA Es una herramienta de visualización y algoritmos para análisis de datos y modelado predictivo, unidos a una interfaz gráfica de usuario para acceder fácilmente a sus funcionalidades. La versión original de Weka fue un front-end en TCL/TK para modelar algoritmos implementados en otros lenguajes de programación, más unas utilidades para preprocesamiento de datos desarrolladas en C para hacer experimentos de aprendizaje automático.
WEKA Las ventajas de Weka son: Está disponible libremente bajo la licencia pública general de GNU. Es muy portable porque está completamente implementado en Java y puede correr en casi cualquier plataforma. Contiene una extensa colección de técnicas para preprocesamiento de datos y modelado. Es fácil de utilizar por un principiante gracias a su interfaz gráfica de usuario.
WEKA Wekasoporta varias tareas estándar de minería de datos, especialmente, preprocesamiento de datos, clustering, clasificación, regresión, visualización, y selección. Todas las técnicas de Weka se fundamentan en la asunción de que los datos están disponibles en un fichero plano (flat file) o una relación, en la que cada registro de datos está descrito por un número fijo de atributos (normalmente numéricos o nominales, aunque también se soportan otros tipos). Weka también proporciona acceso a bases de datos vía SQL gracias a la conexión JDBC (Java DatabaseConnectivity) y puede procesar el resultado devuelto por una consulta hecha a la base de datos.
EJECUCIÓN DEL ALGORITMO WEKA
EJECUCIÓN DEL ALGORITMO En primer lugar abrimos el algoritmo reconocimiento_voz.arff, luego hacemos clic en la pestaña Cluster
EJECUCIÓN DEL ALGORITMO Luego en la sección cluster hacemos clic en el botón Choose y elegimos el método de clustering que deseemos
EJECUCIÓN DEL ALGORITMO Finalmente hacemos clic sobre el botón Start para ejecutar el algoritmo de reconocimiento de voz con el método que hayamos elegido.
ANALISIS DE RESULTADOS WEKA
ANALISIS DE RESULTADOS Los algoritmos de clustering permiten clasificar un conjunto de elementos de muestra en un determinado número de grupos basándose en las semejanzas y diferencias existentes entre los componentes de la muestra. Mediante la utilización de la herramienta Weka presentamos los siguientes resultados obtenidos de la misma, tanto con el algoritmo K-medias y Cobweb.
ALGORITMO K-MEDIAS
ALGORITMO K-MEDIAS Scheme: weka.clusterers.SimpleKMeans -N 2 -S 10      Indica que el algoritmo se ejecuta con 2 clusters y con 10 semillas Relation:     vowel     Nos muestra que la relación es vocal   Instances:    450     Existen 450 instancias   Attributes:   14     Existen 14 atributos   Test mode:    evaluate on training data     Modo de prueba es evaluado sobre datos de entrenamiento   
ALGORITMO K-MEDIAS
ALGORITMO K-MEDIAS Además se muestran los valores de los niveles de intensidad vocales en fase de entrenamiento por los hablantes Andres y Yesi pronunciando las sílabas hid, hud y had
ALGORITMO K-MEDIAS Number of iterations: 10     El número de iteraciones es de 10 Within cluster sum of squared errors: 1121.82115943575     Suma de errores cuadráticos   Datos totales          Cluster# 0            Cluster# 1 (450)                      (216)                     (234)
ALGORITMO K-MEDIAS A continuación se muestran los valores y porcentajes de la agrupación de Instancias divididas en 2 Clusters: ClusteredInstances   0      216 ( 48%)    En el Cluster 0 existen 216 instancias que corresponden al 48% 1      234 ( 52%)    En el Cluster 1 existen 234 instancias que corresponden al 52% 
ALGORITMO K-MEDIAS Desde esta pantalla podemos generar múltiples gráficas eligiendo cualquier combinación de atributos para los ejes. En este caso seleccionamos los siguientes atributos: Nombres de los hablantes en el eje de las X Numero de Clúster en el eje de las Y Los valores de las clases coloreadas (had, hed, hid, hod, hud) Diseño de las instancias por defecto Jitter o variación promedio
ALGORITMO K-MEDIAS
ALGORITMO K-MEDIAS Podemos interpretar en la gráfica que los valores de las clases se agruparon en 2 Clusters y en grupos de hablantes separados En este otro caso seleccionamos los siguientes atributos: Sexo en el eje de las X Numero de Clúster en el eje de las Y Los valores de las clases coloreadas (had, hed, hid, hod, hud) Diseño de las instancias por defecto Jitter o variación promedio
ALGORITMO K-MEDIAS
ALGORITMO K-MEDIAS En ésta gráfica podemos observar que las sílabas pronunciadas por las personas del sexo masculino se ejecutaron en su gran mayoría en el cluster 1 excepto por algunos casos como por ejemplo la clase had que ha sido pronunciada por personas del sexo femenino que se encuentran en el cluster 1. Y análogamente a esto podemos observar que las sílabas pronunciadas por las personas del sexo femenino se ejecutaron en su gran mayoría en el cluster 0 excepto por algunos casos como por ejemplo la clase hud que ha sido pronunciada por personas del sexo masculino que se encuentran en el cluster 1.
COWEB
COWEB A continuación se exponen algunos comentarios sobre la salida de arriba:  -A 1.0 -C 0.0028209479177387815 -S 42 especifica  parámetros agudeza y corte. Estos valores pueden ser especificados a través de la ventana emergente que aparece al hacer clic sobre el área a la derecha el botón Seleccionar (Choose).   Nodo N o hoja N representa un subcluster, cuya matriz es el grupo N.   La agrupación de estructura de árbol se muestra como un árbol horizontal, donde subclusters están alineados en la misma columna. La raíz es el Cluster 0. Cada línea con un nodo de 0 define subcluster de la raíz.  El número entre corchetes después de nodo N representa el número de casos en la matriz el grupo N.
COWEB En este caso seleccionamos los siguientes atributos: Nombres de los hablantes en el eje de las X Palabras pronunciadas en el eje de las Y Sexocoloreadas (masculino, femenino) Diseño de las instancias por defecto Jitter o variación promedio
COWEB

Weitere ähnliche Inhalte

Was ist angesagt?

Diapositiva estructura de datos unidad 1
Diapositiva estructura de datos unidad 1Diapositiva estructura de datos unidad 1
Diapositiva estructura de datos unidad 1Ezer Ayala Mutul
 
Lógica difusa y conceptos
Lógica difusa y conceptosLógica difusa y conceptos
Lógica difusa y conceptosJ R7
 
Fernando yepez logica_difusa
Fernando yepez logica_difusaFernando yepez logica_difusa
Fernando yepez logica_difusaFERNANDO YEPEZ
 
Unidad 1 introducción a las estructuras de datos
Unidad 1 introducción a las estructuras de datosUnidad 1 introducción a las estructuras de datos
Unidad 1 introducción a las estructuras de datosUrban Skate House
 
Programacion orientada a objetos Unidad 1-intro al paradigma poo
Programacion orientada a objetos Unidad 1-intro al paradigma pooProgramacion orientada a objetos Unidad 1-intro al paradigma poo
Programacion orientada a objetos Unidad 1-intro al paradigma pooJosé Antonio Sandoval Acosta
 
Diseño de la logica
Diseño de la logicaDiseño de la logica
Diseño de la logicaanych27
 
1 parcial Arquitectura de Software
1 parcial Arquitectura de Software1 parcial Arquitectura de Software
1 parcial Arquitectura de SoftwareGustavo Rojas
 
Metodos de programacion
Metodos de programacionMetodos de programacion
Metodos de programacionadvmct
 
Lenguaje de Programacion - Java
Lenguaje de Programacion - JavaLenguaje de Programacion - Java
Lenguaje de Programacion - Javazousbabastre
 
CONCEPTOS Y FUNDAMENTOS DE LÓGICA DIFUSA
CONCEPTOS Y FUNDAMENTOS    DE LÓGICA DIFUSACONCEPTOS Y FUNDAMENTOS    DE LÓGICA DIFUSA
CONCEPTOS Y FUNDAMENTOS DE LÓGICA DIFUSAESCOM
 
1.3 uso de tipos de datos abstractos
1.3 uso de tipos de datos abstractos1.3 uso de tipos de datos abstractos
1.3 uso de tipos de datos abstractoserwin_alexander
 

Was ist angesagt? (20)

Diapositiva estructura de datos unidad 1
Diapositiva estructura de datos unidad 1Diapositiva estructura de datos unidad 1
Diapositiva estructura de datos unidad 1
 
Lógica difusa y conceptos
Lógica difusa y conceptosLógica difusa y conceptos
Lógica difusa y conceptos
 
Modulo Algorítmica III - Julio Vasquez
Modulo Algorítmica III - Julio VasquezModulo Algorítmica III - Julio Vasquez
Modulo Algorítmica III - Julio Vasquez
 
Logica difusa
Logica difusaLogica difusa
Logica difusa
 
Fernando yepez logica_difusa
Fernando yepez logica_difusaFernando yepez logica_difusa
Fernando yepez logica_difusa
 
TDA
TDATDA
TDA
 
Unidad 1 introducción a las estructuras de datos
Unidad 1 introducción a las estructuras de datosUnidad 1 introducción a las estructuras de datos
Unidad 1 introducción a las estructuras de datos
 
Encapsulamiento
EncapsulamientoEncapsulamiento
Encapsulamiento
 
Programacion orientada a objetos Unidad 1-intro al paradigma poo
Programacion orientada a objetos Unidad 1-intro al paradigma pooProgramacion orientada a objetos Unidad 1-intro al paradigma poo
Programacion orientada a objetos Unidad 1-intro al paradigma poo
 
Diseño de la logica
Diseño de la logicaDiseño de la logica
Diseño de la logica
 
Aprendiendo objetos en c++
Aprendiendo objetos en c++Aprendiendo objetos en c++
Aprendiendo objetos en c++
 
1 parcial Arquitectura de Software
1 parcial Arquitectura de Software1 parcial Arquitectura de Software
1 parcial Arquitectura de Software
 
clases de herramientas lorenita
clases de herramientas lorenitaclases de herramientas lorenita
clases de herramientas lorenita
 
Lógica Difusa
Lógica DifusaLógica Difusa
Lógica Difusa
 
Metodos de programacion
Metodos de programacionMetodos de programacion
Metodos de programacion
 
Lenguaje de Programacion - Java
Lenguaje de Programacion - JavaLenguaje de Programacion - Java
Lenguaje de Programacion - Java
 
Tipos de datos abstractos
Tipos de datos abstractosTipos de datos abstractos
Tipos de datos abstractos
 
Programación
ProgramaciónProgramación
Programación
 
CONCEPTOS Y FUNDAMENTOS DE LÓGICA DIFUSA
CONCEPTOS Y FUNDAMENTOS    DE LÓGICA DIFUSACONCEPTOS Y FUNDAMENTOS    DE LÓGICA DIFUSA
CONCEPTOS Y FUNDAMENTOS DE LÓGICA DIFUSA
 
1.3 uso de tipos de datos abstractos
1.3 uso de tipos de datos abstractos1.3 uso de tipos de datos abstractos
1.3 uso de tipos de datos abstractos
 

Ähnlich wie Clustering Reconocimiento De Voz

Ähnlich wie Clustering Reconocimiento De Voz (20)

Trabajo Final
Trabajo FinalTrabajo Final
Trabajo Final
 
Examen Parcial 2
Examen Parcial 2Examen Parcial 2
Examen Parcial 2
 
algoritmos en R Studio
algoritmos en R Studioalgoritmos en R Studio
algoritmos en R Studio
 
KERAS Y TENSORFLOW
KERAS Y TENSORFLOWKERAS Y TENSORFLOW
KERAS Y TENSORFLOW
 
P1 doctorado
P1 doctoradoP1 doctorado
P1 doctorado
 
Informe Proyecto Final
Informe Proyecto FinalInforme Proyecto Final
Informe Proyecto Final
 
Desarrollo aplicaciones visuales
Desarrollo aplicaciones visualesDesarrollo aplicaciones visuales
Desarrollo aplicaciones visuales
 
Desarrollo aplicaciones visuales
Desarrollo aplicaciones visualesDesarrollo aplicaciones visuales
Desarrollo aplicaciones visuales
 
Desarrollo aplicaciones visuales
Desarrollo aplicaciones visualesDesarrollo aplicaciones visuales
Desarrollo aplicaciones visuales
 
Programación Genética: Introducción y Aspectos Generales
Programación Genética: Introducción y Aspectos GeneralesProgramación Genética: Introducción y Aspectos Generales
Programación Genética: Introducción y Aspectos Generales
 
Clustering K-Means
Clustering K-MeansClustering K-Means
Clustering K-Means
 
Guía básica para programar en PSeint
Guía básica para programar en PSeintGuía básica para programar en PSeint
Guía básica para programar en PSeint
 
Trabajo final mod v
Trabajo final mod vTrabajo final mod v
Trabajo final mod v
 
Mini manual R commander
Mini manual R commanderMini manual R commander
Mini manual R commander
 
Algoritmo
AlgoritmoAlgoritmo
Algoritmo
 
Examen final
Examen finalExamen final
Examen final
 
Tecnica de Prueba de Software
Tecnica de Prueba de SoftwareTecnica de Prueba de Software
Tecnica de Prueba de Software
 
word
wordword
word
 
Guia pseint 2016
Guia pseint 2016Guia pseint 2016
Guia pseint 2016
 
Guia Pseint 2016
Guia Pseint 2016Guia Pseint 2016
Guia Pseint 2016
 

Kürzlich hochgeladen

TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptTEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptJavierHerrera662252
 
Segunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptxSegunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptxMariaBurgos55
 
dokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.pptdokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.pptMiguelAtencio10
 
tics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxtics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxazmysanros90
 
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptxGoogle-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptxAlexander López
 
El uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFELEl uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFELmaryfer27m
 
Arenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxArenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxJOSEFERNANDOARENASCA
 
definicion segun autores de matemáticas educativa
definicion segun autores de matemáticas  educativadefinicion segun autores de matemáticas  educativa
definicion segun autores de matemáticas educativaAdrianaMartnez618894
 
El uso de las tic en la vida ,lo importante que son
El uso de las tic en la vida ,lo importante  que sonEl uso de las tic en la vida ,lo importante  que son
El uso de las tic en la vida ,lo importante que son241514984
 
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxCrear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxNombre Apellidos
 
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxEl_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxAlexander López
 
Hernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxHernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxJOSEMANUELHERNANDEZH11
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.241514949
 
Plan Sarmiento - Netbook del GCBA 2019..
Plan Sarmiento - Netbook del GCBA 2019..Plan Sarmiento - Netbook del GCBA 2019..
Plan Sarmiento - Netbook del GCBA 2019..RobertoGumucio2
 
GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx241523733
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfSergioMendoza354770
 
Mapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMidwarHenryLOZAFLORE
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA241531640
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadMiguelAngelVillanuev48
 

Kürzlich hochgeladen (20)

TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptTEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
 
Segunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptxSegunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptx
 
dokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.pptdokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.ppt
 
tics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxtics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptx
 
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptxGoogle-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
 
El uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFELEl uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFEL
 
Arenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxArenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptx
 
definicion segun autores de matemáticas educativa
definicion segun autores de matemáticas  educativadefinicion segun autores de matemáticas  educativa
definicion segun autores de matemáticas educativa
 
El uso de las tic en la vida ,lo importante que son
El uso de las tic en la vida ,lo importante  que sonEl uso de las tic en la vida ,lo importante  que son
El uso de las tic en la vida ,lo importante que son
 
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxCrear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
 
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxEl_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
 
Hernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxHernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptx
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.
 
Plan Sarmiento - Netbook del GCBA 2019..
Plan Sarmiento - Netbook del GCBA 2019..Plan Sarmiento - Netbook del GCBA 2019..
Plan Sarmiento - Netbook del GCBA 2019..
 
GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
 
Mapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptx
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidad
 

Clustering Reconocimiento De Voz

  • 1.
  • 2. Adriana B. Macas E.
  • 4.
  • 5. INTRODUCCION La inteligencia artificial es la disciplina que se encarga de construir procesos que al ser ejecutados sobre una arquitectura física producen acciones o resultados que maximizan una medida de rendimiento determinada, basándose en la secuencia de entradas percibidas y en el conocimiento almacenado en tal arquitectura.
  • 6. INTRODUCCION En la IA se puede observar dos enfoques diferentes: La IA concebida como el intento por desarrollar una tecnología capaz de proveer al ordenador capacidades de razonamiento similares a los de la inteligencia humana. La IA en su concepción como investigación relativa a los mecanismos de la inteligencia humana que se emplean en la simulación de validación de teorías.
  • 7. CLUSTERING El proceso de clustering consiste en la división de los datos en grupos de objetos similares. Para medir la similitud entre objetos se suelen utilizar diferentes formas de distancia: distancia euclídea, de Manhatan, de Mahalanobis, etc. El representar los datos por una serie de clusters, conlleva la pérdida de detalles, pero consigue la simplificación de los mismos.
  • 8. CLUSTERING Clustering es una técnica más de Aprendizaje Automático, en la que el aprendizaje realizado es no supervisado. Desde un punto de vista práctico, el clustering juega un papel muy importante en aplicaciones de minería de datos, tales como exploración de datos científicos, recuperación de la información y minería de texto, aplicaciones sobre bases de datos espaciales (tales como GIS o datos procedentes de astronomía), aplicaciones web, marketing, diagnóstico médico, análisis de ADN en biología computacional, y muchas otras.
  • 9. ALGORITMOS DE CLUSTERING El agrupamiento de datos o clustering puede definirse como un método para clasificar o describir propiedades de un sistema a partir de un conjunto de datos adquiridos o representativos de dicho sistema. La aplicación de estos algoritmos tiene como objetivo devolver al usuario una serie de puntos que en cierto modo representan al resto de puntos iniciales por su posición privilegiada con respecto al total.  Algunos de los algoritmos de agrupamiento más utilizados son: 1.- K-means clustering 2.- Fuzzy c-means clustering 3.- Grupos próximos a un entorno (nearestneighborhoodclustering) 4.- Redes de aprendizaje competitivo 5.- Cobweb
  • 10. ALGORITMOS DE CLUSTERING Un esquema simplificado de un algoritmo de clustering se muestra en la siguiente figura:
  • 11. RECONOCIMIENTO DE VOZ Actualmente el Reconocimiento de voz es utilizado como comunicación entre humano y computadora. El agrupamiento de datos o clustering puede definirse como el método para clasificar o describir propiedades de un sistema a partir de un conjunto de datos adquiridos o representativos del sistema. La aplicación de estos algoritmos tiene como objetivo devolver al usuario una serie de puntos que en cierto modo representan al resto de puntos iníciales por su posición privilegiada con respecto al total. El objetivo de la construcción de estos algoritmos es que permiten la identificación de los fonemas de personas a partir de variables que identifiquen los caracteres del sonido para un flujo continuo de ondas sonoras y silencios.
  • 12. RECONOCIMIENTO DE VOZ Debe cumplir 3 tareas: Pre procesamiento: Convierte la entrada de voz a una forma que el reconocedor pueda procesar. Reconocimiento: Identifica lo que se dijo (traducción de señal a texto). Comunicación: Envía lo reconocido al sistema (Software/Hardware) que lo requiere.
  • 13. WEKA Es una herramienta de visualización y algoritmos para análisis de datos y modelado predictivo, unidos a una interfaz gráfica de usuario para acceder fácilmente a sus funcionalidades. La versión original de Weka fue un front-end en TCL/TK para modelar algoritmos implementados en otros lenguajes de programación, más unas utilidades para preprocesamiento de datos desarrolladas en C para hacer experimentos de aprendizaje automático.
  • 14. WEKA Las ventajas de Weka son: Está disponible libremente bajo la licencia pública general de GNU. Es muy portable porque está completamente implementado en Java y puede correr en casi cualquier plataforma. Contiene una extensa colección de técnicas para preprocesamiento de datos y modelado. Es fácil de utilizar por un principiante gracias a su interfaz gráfica de usuario.
  • 15. WEKA Wekasoporta varias tareas estándar de minería de datos, especialmente, preprocesamiento de datos, clustering, clasificación, regresión, visualización, y selección. Todas las técnicas de Weka se fundamentan en la asunción de que los datos están disponibles en un fichero plano (flat file) o una relación, en la que cada registro de datos está descrito por un número fijo de atributos (normalmente numéricos o nominales, aunque también se soportan otros tipos). Weka también proporciona acceso a bases de datos vía SQL gracias a la conexión JDBC (Java DatabaseConnectivity) y puede procesar el resultado devuelto por una consulta hecha a la base de datos.
  • 17. EJECUCIÓN DEL ALGORITMO En primer lugar abrimos el algoritmo reconocimiento_voz.arff, luego hacemos clic en la pestaña Cluster
  • 18. EJECUCIÓN DEL ALGORITMO Luego en la sección cluster hacemos clic en el botón Choose y elegimos el método de clustering que deseemos
  • 19. EJECUCIÓN DEL ALGORITMO Finalmente hacemos clic sobre el botón Start para ejecutar el algoritmo de reconocimiento de voz con el método que hayamos elegido.
  • 21. ANALISIS DE RESULTADOS Los algoritmos de clustering permiten clasificar un conjunto de elementos de muestra en un determinado número de grupos basándose en las semejanzas y diferencias existentes entre los componentes de la muestra. Mediante la utilización de la herramienta Weka presentamos los siguientes resultados obtenidos de la misma, tanto con el algoritmo K-medias y Cobweb.
  • 23. ALGORITMO K-MEDIAS Scheme: weka.clusterers.SimpleKMeans -N 2 -S 10 Indica que el algoritmo se ejecuta con 2 clusters y con 10 semillas Relation: vowel Nos muestra que la relación es vocal   Instances: 450 Existen 450 instancias   Attributes: 14 Existen 14 atributos   Test mode: evaluate on training data Modo de prueba es evaluado sobre datos de entrenamiento  
  • 25. ALGORITMO K-MEDIAS Además se muestran los valores de los niveles de intensidad vocales en fase de entrenamiento por los hablantes Andres y Yesi pronunciando las sílabas hid, hud y had
  • 26. ALGORITMO K-MEDIAS Number of iterations: 10 El número de iteraciones es de 10 Within cluster sum of squared errors: 1121.82115943575 Suma de errores cuadráticos   Datos totales Cluster# 0 Cluster# 1 (450) (216) (234)
  • 27. ALGORITMO K-MEDIAS A continuación se muestran los valores y porcentajes de la agrupación de Instancias divididas en 2 Clusters: ClusteredInstances   0 216 ( 48%) En el Cluster 0 existen 216 instancias que corresponden al 48% 1 234 ( 52%) En el Cluster 1 existen 234 instancias que corresponden al 52% 
  • 28. ALGORITMO K-MEDIAS Desde esta pantalla podemos generar múltiples gráficas eligiendo cualquier combinación de atributos para los ejes. En este caso seleccionamos los siguientes atributos: Nombres de los hablantes en el eje de las X Numero de Clúster en el eje de las Y Los valores de las clases coloreadas (had, hed, hid, hod, hud) Diseño de las instancias por defecto Jitter o variación promedio
  • 30. ALGORITMO K-MEDIAS Podemos interpretar en la gráfica que los valores de las clases se agruparon en 2 Clusters y en grupos de hablantes separados En este otro caso seleccionamos los siguientes atributos: Sexo en el eje de las X Numero de Clúster en el eje de las Y Los valores de las clases coloreadas (had, hed, hid, hod, hud) Diseño de las instancias por defecto Jitter o variación promedio
  • 32. ALGORITMO K-MEDIAS En ésta gráfica podemos observar que las sílabas pronunciadas por las personas del sexo masculino se ejecutaron en su gran mayoría en el cluster 1 excepto por algunos casos como por ejemplo la clase had que ha sido pronunciada por personas del sexo femenino que se encuentran en el cluster 1. Y análogamente a esto podemos observar que las sílabas pronunciadas por las personas del sexo femenino se ejecutaron en su gran mayoría en el cluster 0 excepto por algunos casos como por ejemplo la clase hud que ha sido pronunciada por personas del sexo masculino que se encuentran en el cluster 1.
  • 33. COWEB
  • 34. COWEB A continuación se exponen algunos comentarios sobre la salida de arriba: -A 1.0 -C 0.0028209479177387815 -S 42 especifica parámetros agudeza y corte. Estos valores pueden ser especificados a través de la ventana emergente que aparece al hacer clic sobre el área a la derecha el botón Seleccionar (Choose).  Nodo N o hoja N representa un subcluster, cuya matriz es el grupo N.  La agrupación de estructura de árbol se muestra como un árbol horizontal, donde subclusters están alineados en la misma columna. La raíz es el Cluster 0. Cada línea con un nodo de 0 define subcluster de la raíz. El número entre corchetes después de nodo N representa el número de casos en la matriz el grupo N.
  • 35. COWEB En este caso seleccionamos los siguientes atributos: Nombres de los hablantes en el eje de las X Palabras pronunciadas en el eje de las Y Sexocoloreadas (masculino, femenino) Diseño de las instancias por defecto Jitter o variación promedio
  • 36. COWEB
  • 37. COWEB Podemos observar que los fonemas son diferenciables en su pronunciación por todos los hablantes y en ambos sexos puesto que las instancias de un hed no se agrupan con un hud, las instancias de un hod no se agrupan con un had y así sucesivamente.
  • 38. BIBLIOGRAFIA http://sisbib.unmsm.edu.pe/BibVirtualData/publicaciones/electronica/Marzo_2002/pdf/algoritmo.pdf http://catarina.udlap.mx/u_dl_a/tales/documentos/lep/franco_g_ja/capitulo7.pdf http://www.eleconomista.es/empresas-finanzas/noticias/421406/03/08/SpinVox-elige-Cambridge-para-su-centro-de-Reconocimiento-de-Voz.html http://www.ejournal.unam.mx/cys/vol09-03/CYS09307.pdf http://omarsanchez.net/kmeans.aspx http://omarsanchez.net/recocaract.aspx http://www.exa.unicen.edu.ar/catedras/dbdiscov/clase2b.pdf http://www.cs.us.es/cursos/ia2-2007/trabajos/propuesta-6.pdf http://www.dim.uchile.cl/~anmoreir/pr/p9c_clustering.ppt