20
UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA “La Universidad Católica de Loja” Integrantes: Angélica Espinoza Marvin Agila Rodrigo Granda ASIGNACIÓN DE CRÉDITOS ESTUDIANTILES (IECE) UTILIZANDO ARBOLES DE CLASIFICACIÓN Inteligencia Artificial Avanzada

SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS EN EL IECE

Embed Size (px)

DESCRIPTION

Evaluaicion del sistemas de creditos y becas en el Ecuador, mediante arboles de clasificacion con algoritmos id3, j48

Citation preview

Page 1: SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS EN EL IECE

UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA

“La Universidad Católica de Loja”

Integrantes: Angélica Espinoza

Marvin AgilaRodrigo Granda

ASIGNACIÓN  DE CRÉDITOS ESTUDIANTILES (IECE)

 UTILIZANDO ARBOLES DE CLASIFICACIÓN 

Inteligencia Artificial Avanzada

Page 2: SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS EN EL IECE

Introducción • Los árboles de clasificación, es uno de los métodos de

aprendizaje inductivo supervisado no paramétrico bastante utilizado, estos se destacan por su sencillez y pueden utilizarse en diversas áreas

• Hay que mencionar que el análisis de clasificación basados en árboles de decisión que realizan los sistemas son técnicas de explotación de datos (data mining) que consisten en estudiar grandes masas de datos con el fin de descubrir patrones no triviales.

• En este trabajo analizamos la aplicación de algunas técnicas de Aprendizaje Automático [10] a la Minería de Datos, y en particular en los algoritmos ID3 y C4.5 desarrollados por Quinlan, pertenecientes a la misma.

Page 3: SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS EN EL IECE

Ventajas y Desventajas

Page 4: SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS EN EL IECE

ALGORITMOS UTILIZADOS EN ÁRBOLES DE CLASIFICACIÓN.

Algoritmo C4.5 o J48 • Permite trabajar con valores continuos para los

atributos, separando los posibles resultados en dos ramas.

• Genera un árbol de decisión a partir de los datos mediante particiones realizadas recursivamente, según la estrategia de profundidad-primero.

• Escoger un rango de medida apropiado• Manejo de datos de entrenamiento con valores

faltantes.

Page 5: SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS EN EL IECE

SISTEMA DE CREDITOS EN EL IECE (Instituto Ecuatoriano de Créditos

Educativos y Becas).

IECE. Es una entidad financiera de derecho público; entre

los fines para los que fue creado incluye los siguientes: • Conceder créditos a ciudadanos ecuatorianos para

que cursen estudios superiores en centros docentes nacionales o extranjeros.

• Contribuir a la promoción y desarrollo educativo, cultural, técnico y profesional de los ecuatorianos en áreas de prioridad nacional.

• Administrar las becas nacionales e internacionales de estudio, entrenamiento y perfeccionamiento en el exterior, otorgadas por organismos internacionales y gobiernos amigos.

Page 6: SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS EN EL IECE

Requisitos Para obtener un Crédito Educativo.

• Llenar el formulario de solicitud de crédito.• Copia de la cédula de ciudadanía y papeleta de

votación vigente en caso del estudiante sea mayor de edad.

• En caso de que el estudiante sea menor de edad, adjuntar copia de la cédula del padre o madre, el cual es representante legal y se constituye en deudor principal.

• Copia del pago del Impuesto Predial, en caso de tener vivienda propia; caso contrario, copia del contrato de arrendamiento

• El garante debe Justificar un ingreso liquido mensual del 5% del monto solicitado

Page 7: SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS EN EL IECE

HERRAMIENTAS• WEKA. Es un entorno para experimentación de

análisis de datos que permite aplicar, analizar y evaluar las técnicas más relevantes de análisis de datos, principalmente las provenientes del aprendizaje automático. Utiliza archivos de texto plano para describir los datos puede trabajar con una amplia variedad de archivos de datos incluido el suyo propio”.

• RAPIDMINER. Es similar a WEKA en el flujo de conocimiento de procesos de minería de datos las rutinas son vistas como secuencial operadores. Utiliza XML para describir operador árboles en el proceso de KD.

Page 8: SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS EN EL IECE

DESARROLLO E IMPLEMENTACION

Se ha escogido los siguientes datos:

Page 9: SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS EN EL IECE

Descripción de variables.

Las variables utilizadas para la realización de análisis de

asignación de créditos se muestran a continuación.

Page 10: SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS EN EL IECE

ANALISIS DE LOS RESULTADOS CON WEKA Y RAPIDMINER

• Rapidminer. Posee mayor visualización en cuanto a los resultados.

Utiliza gran cantidad de memoria para inicializarse, y es un muy buena

herramienta en cuanto a clasificación se refiere.

Page 11: SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS EN EL IECE

ANALISIS DE LOS RESULTADOS CON WEKA Y RAPIDMINER

• Rapidminer En esta herramienta se puede visualizar todos los atributos relacionados con cada una de las clases.

Page 12: SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS EN EL IECE

ANALISIS DE LOS RESULTADOS CON WEKA Y RAPIDMINER

• En el Rapidminer se puede generar diferentes tipos de algoritmos que posee.

Page 13: SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS EN EL IECE

ANALISIS DE LOS RESULTADOS CON WEKA Y RAPIDMINER

• Árbol resultante en Rapidminer: se puede observar con realiza la clasificación en diferentes tipos de clases se puede visualizar en la siguiente figura.

Page 14: SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS EN EL IECE

ANALISIS DE LOS RESULTADOS CON WEKA Y RAPIDMINER

• WEKA. Soporta un solo formato de archivo .arff. y llamados a Bases de Datos. No permite mostrar los resultados en 3D, No se visualiza de manera la matriz de confusión

Page 15: SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS EN EL IECE

ANALISIS DE LOS RESULTADOS CON WEKA Y RAPIDMINER

• En WEKA se puede clasificar cada uno de la variables en diferentes clases.

Page 16: SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS EN EL IECE

ANALISIS DE LOS RESULTADOS CON WEKA Y RAPIDMINER

• También en WEKA se puede analizar la matriz confusión con sus respectivos atributos de cada uno de sus clases.

Page 17: SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS EN EL IECE

ANALISIS DE LOS RESULTADOS CON WEKA Y RAPIDMINER

• Árbol resultante en WEKA: se puede observar con realiza la clasificación en diferentes tipos de clases Se puede visualizar en la siguiente figura.

Page 18: SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS EN EL IECE

Trabajos Relacionados• Análisis de la asignación de Crédito. En este trabajo se

enfoca a las instituciones financieras que ofrecen productos de crédito, enfrentan el problema de clasificar a sus clientes a través de un análisis, con el fin de establecer medidas que permitan mitigar el riesgo de crédito.

• Árboles de clasificación: una metodología para el análisis de crisis bancarias. En este trabajo comparamos el poder clasificatorio del árbol construido bajo determinadas especificaciones con el que se obtiene aplicando el análisis logit, en el estudio de los determinantes de las crisis bancarias ocurridas en la última década del siglo pasado.

• Rating de pequeñas y medianas empresas mediante árboles de clasificación. En este trabajo se puede ver que mediante el algoritmo CART como construye el árbol y clasifica los nuevos casos de clasificación, como los conceptos, principios y procedimientos para la elaboración y aplicación de un modelo de calificación de crédito había sido plenamente desarrollada

Page 19: SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS EN EL IECE

CONCLUSIONES • En base al análisis realizada entre las dos

herramientas se puede observar que Rapidminer se acopla a las necesidades del usuario en lo referente a la visualización de los datos ya que posee tres vistas Meta Data View, Data View, Plot View.

• La herramienta WEKA únicamente permite exportar solo un formato de archivo (.arff ) mientras que Rapidminer puede exportar diferentes tipos de archivo como (.arff, .access, .bibtex, .dbase, .aml(.data), .excel entre otros).

• Se ah podido demostrar la gran utilidad que tiene los algoritmos de clasificación al aplicarla a un caso real.

Page 20: SIMULACION DE ARBOLES DE CLASIFICACION (ID3,J48) PARA ASIGNACION DE CREDITOS EN EL IECE

BIBLIOGRAFIA

• [1] Edgar Acuña ,CLASIFICACIÓN USANDO ARBOLES DE DECISION visitada el 5 de mayo del2009. http://math.uprm.edu/~edgar/clasifall9.pdf

• [2]Srta. Magdalena SERVENTE ALGORITMOS TDIDT APLICADOS A LAMINERIA DE DATOS INTELIGENTE FEBRERO 2002 http://laboratorios.fi.uba.ar/lsi/servente-tesisingenieriainformatica.pdf

• [3] José Manuel Rojo Abuín, ÁRBOLES DE CLASIFICACIÓN Y REGRESIÓN, http://estadistica.ieg.csic.es/tutoriales/PDF/AnswerTree.pdf