Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Upcoming SlideShare
Arboles decision   id3
Arboles decision id3
Loading in …3
×
1 of 20

SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS EN EL IECE

1

Share

Download to read offline

Evaluaicion del sistemas de creditos y becas en el Ecuador, mediante arboles de clasificacion con algoritmos id3, j48

Related Books

Free with a 30 day trial from Scribd

See all

Related Audiobooks

Free with a 30 day trial from Scribd

See all

SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS EN EL IECE

  1. 1. UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA “ La Universidad Católica de Loja” Integrantes: Angélica Espinoza Marvin Agila Rodrigo Granda Inteligencia Artificial Avanzada ASIGNACIÓN  DE CRÉDITOS ESTUDIANTILES (IECE)   UTILIZANDO ARBOLES DE CLASIFICACIÓN  
  2. 2. Introducción <ul><li>Los árboles de clasificación, es uno de los métodos de aprendizaje inductivo supervisado no paramétrico bastante utilizado, estos se destacan por su sencillez y pueden utilizarse en diversas áreas </li></ul><ul><li>Hay que mencionar que el análisis de clasificación basados en árboles de decisión que realizan los sistemas son técnicas de explotación de datos (data mining) que consisten en estudiar grandes masas de datos con el fin de descubrir patrones no triviales. </li></ul><ul><li>En este trabajo analizamos la aplicación de algunas técnicas de Aprendizaje Automático [10] a la Minería de Datos, y en particular en los algoritmos ID3 y C4.5 desarrollados por Quinlan, pertenecientes a la misma. </li></ul>
  3. 3. Ventajas y Desventajas
  4. 4. ALGORITMOS UTILIZADOS EN ÁRBOLES DE CLASIFICACIÓN. <ul><li>Algoritmo C4.5 o J48 </li></ul><ul><li>Permite trabajar con valores continuos para los atributos, separando los posibles resultados en dos ramas. </li></ul><ul><li>Genera un árbol de decisión a partir de los datos mediante particiones realizadas recursivamente, según la estrategia de profundidad-primero. </li></ul><ul><li>Escoger un rango de medida apropiado </li></ul><ul><li>Manejo de datos de entrenamiento con valores faltantes. </li></ul>
  5. 5. SISTEMA DE CREDITOS EN EL IECE (Instituto Ecuatoriano de Créditos Educativos y Becas). <ul><li>IECE. Es una entidad financiera de derecho público; entre </li></ul><ul><li>los fines para los que fue creado incluye los siguientes: </li></ul><ul><li>Conceder créditos a ciudadanos ecuatorianos para que cursen estudios superiores en centros docentes nacionales o extranjeros. </li></ul><ul><li>Contribuir a la promoción y desarrollo educativo, cultural, técnico y profesional de los ecuatorianos en áreas de prioridad nacional. </li></ul><ul><li>Administrar las becas nacionales e internacionales de estudio, entrenamiento y perfeccionamiento en el exterior, otorgadas por organismos internacionales y gobiernos amigos. </li></ul>
  6. 6. Requisitos Para obtener un Crédito Educativo. <ul><li>Llenar el formulario de solicitud de crédito . </li></ul><ul><li>Copia de la cédula de ciudadanía y papeleta de votación vigente en caso del estudiante sea mayor de edad. </li></ul><ul><li>En caso de que el estudiante sea menor de edad, adjuntar copia de la cédula del padre o madre, el cual es representante legal y se constituye en deudor principal. </li></ul><ul><li>Copia del pago del Impuesto Predial, en caso de tener vivienda propia; caso contrario, copia del contrato de arrendamiento </li></ul><ul><li>El garante debe Justificar un ingreso liquido mensual del 5% del monto solicitado </li></ul>
  7. 7. HERRAMIENTAS <ul><li>WEKA. Es un entorno para experimentación de análisis de datos que permite aplicar, analizar y evaluar las técnicas más relevantes de análisis de datos, principalmente las provenientes del aprendizaje automático. Utiliza archivos de texto plano para describir los datos puede trabajar con una amplia variedad de archivos de datos incluido el suyo propio”. </li></ul><ul><li>RAPIDMINER. Es similar a WEKA en el flujo de conocimiento de procesos de minería de datos las rutinas son vistas como secuencial operadores. Utiliza XML para describir operador árboles en el proceso de KD. </li></ul>
  8. 8. DESARROLLO E IMPLEMENTACION <ul><li>Se ha escogido los siguientes datos: </li></ul>
  9. 9. Descripción de variables . <ul><li>Las variables utilizadas para la realización de análisis de </li></ul><ul><li>asignación de créditos se muestran a continuación. </li></ul>
  10. 10. ANALISIS DE LOS RESULTADOS CON WEKA Y RAPIDMINER <ul><li>Rapidminer. Posee mayor visualización en cuanto a los resultados. </li></ul><ul><li>Utiliza gran cantidad de memoria para inicializarse, y es un muy buena </li></ul><ul><li>herramienta en cuanto a clasificación se refiere. </li></ul>
  11. 11. ANALISIS DE LOS RESULTADOS CON WEKA Y RAPIDMINER <ul><li>Rapidmine r En esta herramienta se puede visualizar todos los atributos relacionados con cada una de las clases. </li></ul>
  12. 12. ANALISIS DE LOS RESULTADOS CON WEKA Y RAPIDMINER <ul><li>En el Rapidminer se puede generar diferentes tipos de algoritmos que posee. </li></ul>
  13. 13. ANALISIS DE LOS RESULTADOS CON WEKA Y RAPIDMINER <ul><li>Árbol resultante en Rapidminer : se puede observar con realiza la clasificación en diferentes tipos de clases se puede visualizar en la siguiente figura. </li></ul>
  14. 14. ANALISIS DE LOS RESULTADOS CON WEKA Y RAPIDMINER <ul><li>WEKA. Soporta un solo formato de archivo .arff. y llamados a Bases de Datos. No permite mostrar los resultados en 3D, No se visualiza de manera la matriz de confusión </li></ul>
  15. 15. ANALISIS DE LOS RESULTADOS CON WEKA Y RAPIDMINER <ul><li>En WEKA se puede clasificar cada uno de la variables en diferentes clases. </li></ul>
  16. 16. ANALISIS DE LOS RESULTADOS CON WEKA Y RAPIDMINER <ul><li>También en WEKA se puede analizar la matriz confusión con sus respectivos atributos de cada uno de sus clases. </li></ul>
  17. 17. ANALISIS DE LOS RESULTADOS CON WEKA Y RAPIDMINER <ul><li>Árbol resultante en WEKA : se puede observar con realiza la clasificación en diferentes tipos de clases Se puede visualizar en la siguiente figura. </li></ul>
  18. 18. Trabajos Relacionados <ul><li>Análisis de la asignación de Crédito. En este trabajo se enfoca a las instituciones financieras que ofrecen productos de crédito, enfrentan el problema de clasificar a sus clientes a través de un análisis, con el fin de establecer medidas que permitan mitigar el riesgo de crédito. </li></ul><ul><li>Árboles de clasificación: una metodología para el análisis de crisis bancarias. En este trabajo comparamos el poder clasificatorio del árbol construido bajo determinadas especificaciones con el que se obtiene aplicando el análisis logit, en el estudio de los determinantes de las crisis bancarias ocurridas en la última década del siglo pasado. </li></ul><ul><li>R ating de pequeñas y medianas empresas mediante árboles de clasificación. En este trabajo se puede ver que mediante el algoritmo CART como construye el árbol y clasifica los nuevos casos de clasificación, como los conceptos, principios y procedimientos para la elaboración y aplicación de un modelo de calificación de crédito había sido plenamente desarrollada </li></ul>
  19. 19. CONCLUSIONES <ul><li>En base al análisis realizada entre las dos herramientas se puede observar que Rapidminer se acopla a las necesidades del usuario en lo referente a la visualización de los datos ya que posee tres vistas Meta Data View, Data View, Plot View. </li></ul><ul><li>La herramienta WEKA únicamente permite exportar solo un formato de archivo (.arff ) mientras que Rapidminer puede exportar diferentes tipos de archivo como (.arff, .access, .bibtex, .dbase, .aml(.data), .excel entre otros). </li></ul><ul><li>Se ah podido demostrar la gran utilidad que tiene los algoritmos de clasificación al aplicarla a un caso real. </li></ul>
  20. 20. BIBLIOGRAFIA <ul><li>[1] Edgar Acuña ,CLASIFICACIÓN USANDO ARBOLES DE DECISION visitada el 5 de mayo del2009. http://math.uprm.edu/~edgar/clasifall9.pdf </li></ul><ul><li>[2]Srta. Magdalena SERVENTE ALGORITMOS TDIDT APLICADOS A LAMINERIA DE DATOS INTELIGENTE FEBRERO 2002 http://laboratorios.fi.uba.ar/lsi/servente-tesisingenieriainformatica.pdf </li></ul><ul><li>[3] José Manuel Rojo Abuín, ÁRBOLES DE CLASIFICACIÓN Y REGRESIÓN, http://estadistica.ieg.csic.es/tutoriales/PDF/AnswerTree.pdf </li></ul>

×