SlideShare una empresa de Scribd logo
1 de 12
MINERÍA Y VISUALIZACIÓN DE TEXTO Edwin Fabián Maza S. Estudiante de la UTPL ISUMMIT 2010
INTRODUCCIÓN En la actualidad se busca analizar el texto existente en todo su ámbito y para ello se requiere de procedimientos automáticos para: extraer los temas, determinar en el texto la localización de las rupturas, visualizar la proximidad entre documentos y/o entre términos, indexar los documentos, construir bases de documentos para una interrogación automática a lo posterior.
Búsqueda de información VS Extracción de información Búsqueda de información: Es un tratamiento global de un gran nuero de documentos, búsqueda de temas, construcción de una tipología de los documentos. Extracción de información: consiste en la búsqueda de información “ciblada”, para alimentar una base de datos estructurada (relleno automático de los campos de la base).
Tipos de textos analizados Los tipos de textos analizados se pueden realizar entre: Encuestas de opinión Encuestas de satisfacción de clientela Entrevistas semi-abiertas en estudios de clientela Revistas de prensa Vigilia tecnológica: resúmenes de artículos contenidos en las bases científicas, patentes, entre otras.
Métodos de análisis Para ello se pueden identificar dos puntos importantes como son: La codificación: se debe conocer como se codifica el corpus, esta transforma el corpus en una tabla que se puede analizar mediante métodos estadísticos La distancia: el papel fundamental de la distancia escogida en el análisis estadístico de textos. Distancia entre elementos (entrevistados, categorías de entrevistados, palabras, entre otros.)
¿Porquéesdificil? La minería de textos se ve compleja o difícil para su análisis debido a la conformación de: Títulos Imágenes Tablas Graficas Texto seguro Es difícil la visualización del texto como por ejemplo: la presencia de un objeto extraño se puede interpretar de varias formas como: alucinación, nave extraterrestre, platillo volador, OVNI
Lingüística computacional y procesamiento de textos Esta ciencia ha ayudado para tratar de aplicar métodos computacionales en el estudio del lenguaje natural. Por lo que es ha combinado dos importantes ciencias, la lingüística que el estudio de leyes del lenguaje humano, y la inteligencia artificial que investiga métodos computacionales para el manejo de sistemas complejos.
La solución tradicional de este problema consiste en construir un procesador lingüístico construido por diferentes módulos independientes.
Tipos de minería de textos Web (Web Mining) La Web Mining nos ayuda a descubrir información, encontrar documentados relacionados, mostrar temáticas, averiguar el grado de satisfacción de recursos web, etc. Según el fin deseado, la actividad de excavar en la web se desglosa en tres dominios de extracción de conocimiento de acuerdo con la naturaleza de los datos.
Tipos de minería de textos Web (Web Mining) Web contentmining (minería de contenido web) Web structuremining (minería de estructura web) Web usagemining (minería de uso web)
HERRAMIENTAS DE MINERÍA DE TEXTO Weka RapidMiner Lenguaje R Pentaho GATE Bases de datos de artículos técnicos. biotech medline chemicalabstractregistry
REFERENCIAS [1] Minería de Textos Web Recuperación y organización de la información Disponible en http://mineria-textos-web.awardspace.com/ [2] Explotación minera del texto Disponible en http://enciclopediaespana.com/Explotación_minera_del_texto.html [3] Explotación minera del texto http://www.worldlingo.com/ma/enwiki/es/Text_mining [4] Minería de textos y datos para-textuales Universitat Autónoma de Barcelona SEA 2 de febrero 2007 Mónica BécueBertaut [5] Minería de texto: Un nuevo reto computacional Manuel Montes-y-Gómez Centro de Investigación en Computación, Instituto Politécnico Nacional.

Más contenido relacionado

La actualidad más candente

Ficha tecnico pedagogica
Ficha tecnico pedagogicaFicha tecnico pedagogica
Ficha tecnico pedagogicapablo
 
Herramientas para la busqueda
Herramientas para la busquedaHerramientas para la busqueda
Herramientas para la busquedaalex vizcarra
 
Taller articulo de revista
Taller articulo de revista Taller articulo de revista
Taller articulo de revista estefany19951
 
Informática Jurídica
Informática JurídicaInformática Jurídica
Informática JurídicaAna Rojas
 

La actualidad más candente (7)

Ficha tecnico pedagogica
Ficha tecnico pedagogicaFicha tecnico pedagogica
Ficha tecnico pedagogica
 
Informatica
Informatica Informatica
Informatica
 
Impacto web
Impacto webImpacto web
Impacto web
 
Minería de Texto (Text mining)
Minería de Texto (Text mining)Minería de Texto (Text mining)
Minería de Texto (Text mining)
 
Herramientas para la busqueda
Herramientas para la busquedaHerramientas para la busqueda
Herramientas para la busqueda
 
Taller articulo de revista
Taller articulo de revista Taller articulo de revista
Taller articulo de revista
 
Informática Jurídica
Informática JurídicaInformática Jurídica
Informática Jurídica
 

Similar a Minería y visualización de texto

BÚSQUEDA de fuentes confiables con TIC.pptx
BÚSQUEDA de fuentes confiables con TIC.pptxBÚSQUEDA de fuentes confiables con TIC.pptx
BÚSQUEDA de fuentes confiables con TIC.pptxSegundoClementeMendo
 
Indización automatizada
Indización automatizadaIndización automatizada
Indización automatizadaJavier Gascón
 
Explotación y visualización de datos de investigación en Humanidades por Gime...
Explotación y visualización de datos de investigación en Humanidades por Gime...Explotación y visualización de datos de investigación en Humanidades por Gime...
Explotación y visualización de datos de investigación en Humanidades por Gime...innovatics
 
¿Cómo buscar información científica?
¿Cómo buscar información científica?¿Cómo buscar información científica?
¿Cómo buscar información científica?Ivonne Lujano
 
Estrategia de busqueda 2003
Estrategia de busqueda 2003Estrategia de busqueda 2003
Estrategia de busqueda 2003carlosmunive
 
Monografia ontologias - Primera Aproximación
Monografia ontologias - Primera AproximaciónMonografia ontologias - Primera Aproximación
Monografia ontologias - Primera AproximaciónMarcos Umaño
 
Tarea 10 de infotecnologia.
Tarea 10 de infotecnologia.Tarea 10 de infotecnologia.
Tarea 10 de infotecnologia.Linabel Ramirez
 
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.www.cathedratic.com
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual dataPamela Paz
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual dataJonathan Calero
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual dataPamela Paz
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual dataJonathan Calero
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual dataPamela Paz
 
Tesis_doctoral_Jose_Pino_Diaz.
Tesis_doctoral_Jose_Pino_Diaz. Tesis_doctoral_Jose_Pino_Diaz.
Tesis_doctoral_Jose_Pino_Diaz. Pepe
 

Similar a Minería y visualización de texto (20)

BÚSQUEDA de fuentes confiables con TIC.pptx
BÚSQUEDA de fuentes confiables con TIC.pptxBÚSQUEDA de fuentes confiables con TIC.pptx
BÚSQUEDA de fuentes confiables con TIC.pptx
 
Indización automatizada
Indización automatizadaIndización automatizada
Indización automatizada
 
Metadatos
MetadatosMetadatos
Metadatos
 
Explotación y visualización de datos de investigación en Humanidades por Gime...
Explotación y visualización de datos de investigación en Humanidades por Gime...Explotación y visualización de datos de investigación en Humanidades por Gime...
Explotación y visualización de datos de investigación en Humanidades por Gime...
 
¿Cómo buscar información científica?
¿Cómo buscar información científica?¿Cómo buscar información científica?
¿Cómo buscar información científica?
 
Ontología
OntologíaOntología
Ontología
 
Estrategia de busqueda 2003
Estrategia de busqueda 2003Estrategia de busqueda 2003
Estrategia de busqueda 2003
 
Monografia ontologias - Primera Aproximación
Monografia ontologias - Primera AproximaciónMonografia ontologias - Primera Aproximación
Monografia ontologias - Primera Aproximación
 
Plataforma de recolección en fuentes heterogéneas de la web y su aplicación a...
Plataforma de recolección en fuentes heterogéneas de la web y su aplicación a...Plataforma de recolección en fuentes heterogéneas de la web y su aplicación a...
Plataforma de recolección en fuentes heterogéneas de la web y su aplicación a...
 
Tarea 10 de infotecnologia.
Tarea 10 de infotecnologia.Tarea 10 de infotecnologia.
Tarea 10 de infotecnologia.
 
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
 
Ontología cis
Ontología cisOntología cis
Ontología cis
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual data
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual data
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual data
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual data
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual data
 
Tesis_doctoral_Jose_Pino_Diaz.
Tesis_doctoral_Jose_Pino_Diaz. Tesis_doctoral_Jose_Pino_Diaz.
Tesis_doctoral_Jose_Pino_Diaz.
 
Preguntas generadoras
Preguntas generadorasPreguntas generadoras
Preguntas generadoras
 
Preguntas generadoras
Preguntas generadorasPreguntas generadoras
Preguntas generadoras
 

Más de Ewing Ma

Servicio de calidad
Servicio de calidadServicio de calidad
Servicio de calidadEwing Ma
 
Servicio de calidad
Servicio de calidadServicio de calidad
Servicio de calidadEwing Ma
 
DISPOSITIVOS DE CAPA 2 DEL MODELO OSI
DISPOSITIVOS DE CAPA 2 DEL MODELO OSIDISPOSITIVOS DE CAPA 2 DEL MODELO OSI
DISPOSITIVOS DE CAPA 2 DEL MODELO OSIEwing Ma
 
open innovation
open innovationopen innovation
open innovationEwing Ma
 
cuestiones de repaso capitulo 20
cuestiones de repaso capitulo 20cuestiones de repaso capitulo 20
cuestiones de repaso capitulo 20Ewing Ma
 
cuestiones de repaso
cuestiones de repasocuestiones de repaso
cuestiones de repasoEwing Ma
 
Algoritmo congruencial aditivo
Algoritmo congruencial aditivoAlgoritmo congruencial aditivo
Algoritmo congruencial aditivoEwing Ma
 
Pruebas de Uniformidad
Pruebas de UniformidadPruebas de Uniformidad
Pruebas de UniformidadEwing Ma
 
Ejercicio 7.3
Ejercicio 7.3Ejercicio 7.3
Ejercicio 7.3Ewing Ma
 
Diagnostico de Mainboard
Diagnostico de MainboardDiagnostico de Mainboard
Diagnostico de MainboardEwing Ma
 
resolución del ejecicio del capitulo 18
resolución del ejecicio del capitulo 18resolución del ejecicio del capitulo 18
resolución del ejecicio del capitulo 18Ewing Ma
 
Ejercicio Del Capitulo 18
Ejercicio Del Capitulo 18Ejercicio Del Capitulo 18
Ejercicio Del Capitulo 18Ewing Ma
 
Cuestiones de repaso capitulo 18
Cuestiones de repaso capitulo 18Cuestiones de repaso capitulo 18
Cuestiones de repaso capitulo 18Ewing Ma
 
CASO DE ESTUDIO DE EASYDRIVE
CASO DE ESTUDIO DE EASYDRIVECASO DE ESTUDIO DE EASYDRIVE
CASO DE ESTUDIO DE EASYDRIVEEwing Ma
 
Cuestiones de repado capitulo 17
Cuestiones de repado capitulo 17Cuestiones de repado capitulo 17
Cuestiones de repado capitulo 17Ewing Ma
 
Cuestiones de estudio del capitulo 15
Cuestiones de estudio del capitulo 15Cuestiones de estudio del capitulo 15
Cuestiones de estudio del capitulo 15Ewing Ma
 
University Accommodation
University AccommodationUniversity Accommodation
University AccommodationEwing Ma
 
Caso de estudio EasyDrive School of Motoring
Caso de estudio EasyDrive School of MotoringCaso de estudio EasyDrive School of Motoring
Caso de estudio EasyDrive School of MotoringEwing Ma
 
Cuestiones de Repaso Capitulo 16
Cuestiones de Repaso Capitulo 16Cuestiones de Repaso Capitulo 16
Cuestiones de Repaso Capitulo 16Ewing Ma
 

Más de Ewing Ma (19)

Servicio de calidad
Servicio de calidadServicio de calidad
Servicio de calidad
 
Servicio de calidad
Servicio de calidadServicio de calidad
Servicio de calidad
 
DISPOSITIVOS DE CAPA 2 DEL MODELO OSI
DISPOSITIVOS DE CAPA 2 DEL MODELO OSIDISPOSITIVOS DE CAPA 2 DEL MODELO OSI
DISPOSITIVOS DE CAPA 2 DEL MODELO OSI
 
open innovation
open innovationopen innovation
open innovation
 
cuestiones de repaso capitulo 20
cuestiones de repaso capitulo 20cuestiones de repaso capitulo 20
cuestiones de repaso capitulo 20
 
cuestiones de repaso
cuestiones de repasocuestiones de repaso
cuestiones de repaso
 
Algoritmo congruencial aditivo
Algoritmo congruencial aditivoAlgoritmo congruencial aditivo
Algoritmo congruencial aditivo
 
Pruebas de Uniformidad
Pruebas de UniformidadPruebas de Uniformidad
Pruebas de Uniformidad
 
Ejercicio 7.3
Ejercicio 7.3Ejercicio 7.3
Ejercicio 7.3
 
Diagnostico de Mainboard
Diagnostico de MainboardDiagnostico de Mainboard
Diagnostico de Mainboard
 
resolución del ejecicio del capitulo 18
resolución del ejecicio del capitulo 18resolución del ejecicio del capitulo 18
resolución del ejecicio del capitulo 18
 
Ejercicio Del Capitulo 18
Ejercicio Del Capitulo 18Ejercicio Del Capitulo 18
Ejercicio Del Capitulo 18
 
Cuestiones de repaso capitulo 18
Cuestiones de repaso capitulo 18Cuestiones de repaso capitulo 18
Cuestiones de repaso capitulo 18
 
CASO DE ESTUDIO DE EASYDRIVE
CASO DE ESTUDIO DE EASYDRIVECASO DE ESTUDIO DE EASYDRIVE
CASO DE ESTUDIO DE EASYDRIVE
 
Cuestiones de repado capitulo 17
Cuestiones de repado capitulo 17Cuestiones de repado capitulo 17
Cuestiones de repado capitulo 17
 
Cuestiones de estudio del capitulo 15
Cuestiones de estudio del capitulo 15Cuestiones de estudio del capitulo 15
Cuestiones de estudio del capitulo 15
 
University Accommodation
University AccommodationUniversity Accommodation
University Accommodation
 
Caso de estudio EasyDrive School of Motoring
Caso de estudio EasyDrive School of MotoringCaso de estudio EasyDrive School of Motoring
Caso de estudio EasyDrive School of Motoring
 
Cuestiones de Repaso Capitulo 16
Cuestiones de Repaso Capitulo 16Cuestiones de Repaso Capitulo 16
Cuestiones de Repaso Capitulo 16
 

Último

Identificación de componentes Hardware del PC
Identificación de componentes Hardware del PCIdentificación de componentes Hardware del PC
Identificación de componentes Hardware del PCCesarFernandez937857
 
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzprofefilete
 
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxzulyvero07
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...JonathanCovena1
 
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSTEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSjlorentemartos
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Lourdes Feria
 
Lecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadLecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadAlejandrino Halire Ccahuana
 
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxOLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxjosetrinidadchavez
 
UNIDAD DPCC. 2DO. DE SECUNDARIA DEL 2024
UNIDAD DPCC. 2DO. DE  SECUNDARIA DEL 2024UNIDAD DPCC. 2DO. DE  SECUNDARIA DEL 2024
UNIDAD DPCC. 2DO. DE SECUNDARIA DEL 2024AndreRiva2
 
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Carlos Muñoz
 
30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdfgimenanahuel
 
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptDE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptELENA GALLARDO PAÚLS
 
la unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fiscala unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fiscaeliseo91
 
texto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticostexto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticosisabeltrejoros
 
Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.José Luis Palma
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxlclcarmen
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIACarlos Campaña Montenegro
 

Último (20)

Identificación de componentes Hardware del PC
Identificación de componentes Hardware del PCIdentificación de componentes Hardware del PC
Identificación de componentes Hardware del PC
 
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
 
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...
 
Medición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptxMedición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptx
 
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSTEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...
 
Lecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadLecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdad
 
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxOLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
 
UNIDAD DPCC. 2DO. DE SECUNDARIA DEL 2024
UNIDAD DPCC. 2DO. DE  SECUNDARIA DEL 2024UNIDAD DPCC. 2DO. DE  SECUNDARIA DEL 2024
UNIDAD DPCC. 2DO. DE SECUNDARIA DEL 2024
 
Presentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza MultigradoPresentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza Multigrado
 
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
 
30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf
 
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptDE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
 
la unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fiscala unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fisca
 
texto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticostexto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticos
 
Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
 

Minería y visualización de texto

  • 1. MINERÍA Y VISUALIZACIÓN DE TEXTO Edwin Fabián Maza S. Estudiante de la UTPL ISUMMIT 2010
  • 2. INTRODUCCIÓN En la actualidad se busca analizar el texto existente en todo su ámbito y para ello se requiere de procedimientos automáticos para: extraer los temas, determinar en el texto la localización de las rupturas, visualizar la proximidad entre documentos y/o entre términos, indexar los documentos, construir bases de documentos para una interrogación automática a lo posterior.
  • 3. Búsqueda de información VS Extracción de información Búsqueda de información: Es un tratamiento global de un gran nuero de documentos, búsqueda de temas, construcción de una tipología de los documentos. Extracción de información: consiste en la búsqueda de información “ciblada”, para alimentar una base de datos estructurada (relleno automático de los campos de la base).
  • 4. Tipos de textos analizados Los tipos de textos analizados se pueden realizar entre: Encuestas de opinión Encuestas de satisfacción de clientela Entrevistas semi-abiertas en estudios de clientela Revistas de prensa Vigilia tecnológica: resúmenes de artículos contenidos en las bases científicas, patentes, entre otras.
  • 5. Métodos de análisis Para ello se pueden identificar dos puntos importantes como son: La codificación: se debe conocer como se codifica el corpus, esta transforma el corpus en una tabla que se puede analizar mediante métodos estadísticos La distancia: el papel fundamental de la distancia escogida en el análisis estadístico de textos. Distancia entre elementos (entrevistados, categorías de entrevistados, palabras, entre otros.)
  • 6. ¿Porquéesdificil? La minería de textos se ve compleja o difícil para su análisis debido a la conformación de: Títulos Imágenes Tablas Graficas Texto seguro Es difícil la visualización del texto como por ejemplo: la presencia de un objeto extraño se puede interpretar de varias formas como: alucinación, nave extraterrestre, platillo volador, OVNI
  • 7. Lingüística computacional y procesamiento de textos Esta ciencia ha ayudado para tratar de aplicar métodos computacionales en el estudio del lenguaje natural. Por lo que es ha combinado dos importantes ciencias, la lingüística que el estudio de leyes del lenguaje humano, y la inteligencia artificial que investiga métodos computacionales para el manejo de sistemas complejos.
  • 8. La solución tradicional de este problema consiste en construir un procesador lingüístico construido por diferentes módulos independientes.
  • 9. Tipos de minería de textos Web (Web Mining) La Web Mining nos ayuda a descubrir información, encontrar documentados relacionados, mostrar temáticas, averiguar el grado de satisfacción de recursos web, etc. Según el fin deseado, la actividad de excavar en la web se desglosa en tres dominios de extracción de conocimiento de acuerdo con la naturaleza de los datos.
  • 10. Tipos de minería de textos Web (Web Mining) Web contentmining (minería de contenido web) Web structuremining (minería de estructura web) Web usagemining (minería de uso web)
  • 11. HERRAMIENTAS DE MINERÍA DE TEXTO Weka RapidMiner Lenguaje R Pentaho GATE Bases de datos de artículos técnicos. biotech medline chemicalabstractregistry
  • 12. REFERENCIAS [1] Minería de Textos Web Recuperación y organización de la información Disponible en http://mineria-textos-web.awardspace.com/ [2] Explotación minera del texto Disponible en http://enciclopediaespana.com/Explotación_minera_del_texto.html [3] Explotación minera del texto http://www.worldlingo.com/ma/enwiki/es/Text_mining [4] Minería de textos y datos para-textuales Universitat Autónoma de Barcelona SEA 2 de febrero 2007 Mónica BécueBertaut [5] Minería de texto: Un nuevo reto computacional Manuel Montes-y-Gómez Centro de Investigación en Computación, Instituto Politécnico Nacional.