Catalogo 2012

9
Desarrollo de un Sistema de Arboles de Decisiones para la Evaluación de Clientes para credito Miriam Rodríguez Osorio. 1, 2, Jeisson Cueva Caro. 1, 2, Brigitte ollague huaman. 1, 2, Didi Garcia Mateo. 1, 2, Julio Lopez Montalvo. 1, 2, 1 Escuela de Ingeniería de Sistemas 2 Universidad César Vallejo [email protected] Resumen En éste artículo se presenta el desarrollo de un Sistema de Arboles de decisiones para la Evaluación de Clientes para Crédito, para lo cual se establecieron reglas basadas en los indicadores financieros para clientes que nos da como resultado si el clientes es bueno o malo. desarrollo de un Sistema de Arboles de decisiones para la Evaluación de Clientes para Crédito se contó con la Base de Datos de los clientes de la Empresa y la opinión de Expertos. De la base de datos se pudo identificar y extraer las variables de entrada y salida para utilizarlos en el desarrollo del Sistema. Lo anterior expuesto permite definir la base del conocimiento que representa por una parte, el entendimiento que los expertos tienen del fenómeno y por otra, su sistema de razonamiento, además los datos reales utilizados permiten constatar la aplicabilidad del Sistema. De esta manera se obtiene un modelo que considera toda la información en el proceso para la evaluación del cliente bajo una perspectiva más objetiva, con el fin de minimizar así el riesgo operativo y de contraparte en el otorgamiento del crédito. Palabras clave: Evaluación de clientes, Sistema de árboles de decisiones. Abstract In this paper we present the development of a system of decision trees for the Client to Credit, for which rules were based on financial indicators for customers results in us if the customer is good or bad. development of a system of decision trees for the Client to Credit we had the database of customers of the Company and the opinion of experts. Of the database could identify and extract the input and output variables for use in development of the system. This set out to define the knowledge base representing the one hand, understanding that experts have the phenomenon and second, its reasoning system also allows the actual data used to verify the applicability of the system. In this way we obtain a model that considers all the information in the evaluation process for the customer in a more objective perspective, in order to minimize operational risk and counterparty credit granting Keywords: Credit Evaluation, Fuzzy inference system

description

nuestros productos para la mejor atencion

Transcript of Catalogo 2012

Page 1: Catalogo 2012

Desarrollo de un Sistema de Arboles de Decisiones para la Evaluación de Clientes para credito

Miriam Rodríguez Osorio.1, 2,

Jeisson Cueva Caro.1, 2,

Brigitte ollague huaman.1, 2,

Didi Garcia Mateo.1, 2, Julio Lopez Montalvo.1, 2,

1Escuela de Ingeniería de Sistemas

2Universidad César Vallejo

[email protected]

Resumen

En éste artículo se presenta el desarrollo de un Sistema de Arboles de decisiones para la Evaluación de Clientes para Crédito, para lo cual se establecieron reglas basadas en los indicadores financieros para clientes que nos da como resultado si el clientes es bueno o malo. desarrollo de un Sistema de Arboles de decisiones para la Evaluación de Clientes para Crédito se contó con la Base de Datos de los clientes de la Empresa y la opinión de Expertos.

De la base de datos se pudo identificar y extraer las variables de entrada y salida para utilizarlos en el desarrollo del Sistema. Lo anterior expuesto permite definir la base del conocimiento que representa por una parte, el entendimiento que los expertos tienen del fenómeno y por otra, su sistema de razonamiento, además los datos reales utilizados permiten constatar la aplicabilidad del Sistema. De esta manera se obtiene un modelo que considera toda la información en el proceso para la evaluación del cliente bajo una perspectiva más objetiva, con el fin de minimizar así el riesgo operativo y de contraparte en el otorgamiento del crédito.

Palabras clave: Evaluación de clientes, Sistema de árboles de decisiones.

Abstract

In this paper we present the development of a system of decision trees for the Client to Credit, for which rules were based on financial indicators for customers results in us if the customer is good or bad. development of a system of decision trees for the Client to Credit we had the database of customers of the Company and the opinion of experts. Of the database could identify and extract the input and output variables for use in development of the system. This set out to define the knowledge base representing the one hand, understanding that experts have the phenomenon and second, its reasoning system also allows the actual data used to verify the applicability of the system. In this way we obtain a model that considers all the information in the evaluation process for the customer in a more objective perspective, in order to minimize operational risk and counterparty credit granting

Keywords: Credit Evaluation, Fuzzy inference system

Page 2: Catalogo 2012

1. Introducción

Uno de los temas o puntos más importantes en los préstamos o créditos es que no hay una seguridad que este procesada bien después de ser entrega. Para ello se necesita hacer un estudio al cliente o solicitante que desea obtener un crédito. Para ello necesitamos ver varios factores como Razón de liquidez inmediata, Margen de utilidad bruta, Margen de utilidad neta, Retorno de activos, Tasa de retorno de capital, Razón de deuda a capital, Nivel de endeudamiento uso productivo, Costo de producción entre otros que incluyen mucho en la decisión de entrega de créditos. Para ellos se desarrollara un sistema de árboles de decisiones para cliente, en el cual usaremos WEKA que nos permitirá realizar el árbol de decisiones.

2. Trabajos Previos

El trabajo que más se aproxima al presente artículo, es el paper “minimización del riesgo crediticio mediante la evaluación de la solicitud del cliente” publicada por la Revista Dyna ISSN 0012-7353, volumen 71, número 143, noviembre 2004, págs. 25-36 de la Escuela de Ingeniería – Universidad Nacional de Colombia, Medellín, Colombia. Para la realización de este sistema, se ha hecho uso del Modelo de árboles de decisiones que parte de la información del cliente que tiene la Empresa extrayendo las variables que se van a utilizar cuyo objetivo es determinar si el clientes es bueno o no.

3. Inteligencia Artificial

La inteligencia artificial es considerada una rama de la computación y relaciona un fenómeno natural con una analogía artificial a través de programas de computador. La inteligencia artificial puede ser tomada como ciencia si se enfoca hacia la elaboración de programas basados en comparaciones con la eficiencia del hombre, contribuyendo a un mayor entendimiento del conocimiento humano.

Si por otro lado es tomada como ingeniería, basada en una relación deseable de entrada-salida para sintetizar un programa de computador. "El resultado es un programa de alta eficiencia que funciona como una poderosa herramienta para quien la utiliza."

A través de la inteligencia artificial se han desarrollado los sistemas expertos que pueden imitar la capacidad mental del hombre y relacionan reglas de sintaxis del lenguaje hablado y escrito sobre la base de la experiencia, para luego hacer juicios acerca de un problema, cuya solución se logra con mejores juicios y más rápidamente que el ser humano. En la medicina tiene gran utilidad al acertar el 85 % de los casos de diagnóstico.

Page 3: Catalogo 2012

4. Arboles de Decisiones Es un método enmarcado en el área de inteligencia artificial, que infiere conocimiento (inducción, deducción), apartir de los datos contenidos en base de datos. El dominio de aplicación de esta técnica no está restringido a unámbito concreto sino que pueden utilizarse en diversas áreas:

• Diagnósticos. • Juegos. • Predicción meteorológica. • Control de calidad. • Elaboración de horarios. • Análisis de clientes. • Tratamiento digital de imágenes, aplicado al reconocimiento de rostro.

Cualquier problema donde la información se puede describir en términos pares atributo-valor Se entiende por Árbol de decisión un método para aproximar una función objetivo de valores discretos y/continuos, que es resistente al ruido en los datos y que es capaz de hallar o aprender una disyunción de expresiones. El resultado puede, de esta manera, expresarse como un conjunto de reglas Si-entonces. Por otra parte, los árboles dedecisión pueden entenderse como una representación de los procesos involucrados en las tareas de clasificación. Están formados por:

• Nodos: Nombres o identificadores de los atributos. • Ramas: posibles valores del atributo asociado al nodo. • Hojas: Conjuntos ya clasificados de ejemplos y etiquetados con el nombre de una

clase. Los árboles de decisión, se fundamentan en el principio de “divide y vencerás”, construyendo un árbol que en cada nodo establece unas condiciones sobre un atributo, dividiendo así el conjunto de casos en subconjuntos que cumplen cada condición. Los subconjuntos se vuelven a dividir añadiendo nuevos niveles del árbol hasta detenerse mediante un criterio.

5. Desarrollo del Sistema de árboles de decisiones

5.1. Descripción de los Datos

La información proporcionada por parte del departamento de créditos es la siguiente: • Balance General de clientes. • Estados de Resultados de clientes . Esta información se recibió en documentos, ya que en la actualidad no se cuenta con un registro electrónico de dicha información. A partir de los documentos obtenidos

Page 4: Catalogo 2012

se calculó los ratios financieros de cada cliente que forma parte de la muestra y dichos ratios en el formato.

Tabla 5.1 Formula de indicadores financieros

Ratios Formula Nombre de ratios Ratio1 Activo Corriente/Pasivo Corriente Índice de Liquidez Ratio2 Activo Corriente-Pasivo Corriente Capital neto de trabajo Ratio3 (Activo Corriente-Inventario)/Pasivo

Corriente Prueba acida

Ratio4 Efectivo/Pasivo Corriente Razón de liquidez inmediata Ratio5 (Utilidad Bruta/Venta)*100 Margen de utilidad bruta Ratio6 (Utilidad neta/Venta)*100 Margen de utilidad neta Ratio7 (Utilidad neta/Total Activo)*100 Retorno de activos Ratio8 (Utilidad neta/patrimonio)*100 Tasa de retorno de capital Ratio9 (Pasivo Total/patrimonio total)*100 Razón de deuda a capital Ratio10 (Pasivo Total/patrimonio total) Nivel de endeudamiento uso

productivo Ratio11 Costo Venta/Venta Bruta Costo de producción

5.1.1. Variables de Entrada

* Indice de Líquidez: Proporciona una idea de la liquidez del solicitante, es decir, de su capacidad para respaldar cada peso de deuda que contrae una vez que realice los activos corrientes. Es uno de los índices que se utiliza con mayor frecuencia en relación con la solvencia a corto plazo, puesto que índica la medida en la cual los derechos de los acreedores a corto plazo están siendo cubiertos por activos que se espera se conviertan en efectivo en un periodo aproximadamente correspondiente al vencimiento de los derechos.

Activos Corrientes Pasivos Corrientes

* Capital neto de trabajo: es la diferencia obtenida al comparar el total de activos

corrientes, en una fecha determinada, con el total de pasivos, también circulantes o de corto plazo. El resultado de dicha comparación señala los recursos con los cuales la empresa atiende sus actividades operacionales y financieras, sin tener que acudir a fondos extraordinarios.

Activos Corrientes -Pasivos Corrientes

Page 5: Catalogo 2012

*Prueba Acida:Es uno de los indicadores financieros utilizados para medir la liquidez de una empresa, para medir su capacidad de pago.

(Activo Corriente-Inventario)

Pasivo Corriente

*Razón de liquidez inmediata: se utilizan para juzgar la capacidad que tiene una empresa para satisfacer sus obligaciones de corto plazo, a partir de ellas se pueden obtener muchos elementos de juicio sobre la solvencia de efectivo actual de la empresa y su capacidad para permanecer solvente en caso de situaciones adversas.

Efectivo

Pasivo Corriente *Margen de utilidad bruta: Mide el porcentaje de cada dólar de ventas que queda

después de que la empresa pagó sus productos

(Utilidad Bruta)*100 Venta

*Margen de utilidad neta:

(Utilidad neta)*100 (Venta)

*Retorno de activos:

(Utilidad neta)*100 (Total Activo)

*Tasa de retorno de capital:

(Utilidad neta)*100 (patrimonio)

*Razón de deuda a capital: (Pasivo Total)*100 (Patrimonio total)

*Nivel de endeudamiento uso productivo:

(Pasivo Total) (Patrimonio total)

Page 6: Catalogo 2012

*Costo de producción: Costo Venta Venta Bruta

5.1.2. Variables de Salida

* Estado del clientes: El estado de cliente se evaluara por los montos que se ingresaran

en las variables de entrada. Este seguirá la secuencia del árbol de decisiones y mostrara el resulta.

5.2 Clasificador como árbol de decisión: J48

El algoritmo J48 de WEKA es una implementación del algoritmo C4.5. A continuación ilustramos en la figura 3.3 lamina de datos, que representa el patrón de entrenamiento, para la construcción y aprendizaje del árbol de decisión. La muestra consta de once variables de entrada y de dos variables de salidas. La muestra está formada de 53 instancias, las cuales 38 son buenos clientes y 15 clientes malos.

Fig. 5.2 Mina de clientes seleccionados

Page 7: Catalogo 2012

5.3. Arbol de desiciones

Descripción e interpretación: El árbol resultante figura 3.3, consta de siete niveles y trece nodos, instancias correctamente clasificadas 49 de 53 e instancias incorrectamente clasificadas 4 de 53. Cabe mencionar que los atributos que más clientes agrupan, son el ratio10 y ratio15 con 18 clientes cada uno

Fig. 5.3 Arbol de desiciones

Como se puede observar, en el árbol aparecen únicamente 4 de 11 ratios iniciales, lo que indica que 7 de los ratios empleados no aportan información relevante para clasificar los clientes como “buenos” o “malos”. El árbol nos proporciona el menor número de atributos (ratios) necesarios para alcanzar el objetivo deseado

5.4 Reglas de decisión

A continuación enumeramos las reglas de decisión derivadas del árbol de decisión, tabla5.3 Cliente = Bueno 1.-If ratio1<=31.88 Y ratio10<= 23.95 entonces cliente=bueno 2.-If ratio1<=31.88 Y ratio10> 23.95 y ratio5 <=36.02 entonces cliente=bueno

Page 8: Catalogo 2012

3.-If ratio1<=31.88 Y ratio10> 23.95 y ratio5>36.02 y ratio6>29.9 y ratio10<=59.21 y ratio>41.72 entonces cliente=bueno

Cliente = Malo 4.-If ratio1<=31.88 y ratio10> 23.95 y ratio5 >36.02 y ratio6<=29.9 entonces

cliente=malo 5.-If ratio1<=31.88 y ratio10> 23.95 y ratio5 >36.02 y ratio6<=29.9 y

ratio10<=41.72 entonces cliente=malo 6.-If ratio1<=31.88 y ratio10> 23.95 y ratio5 >36.02 y ratio6>29.9 y

ratio10<=59.21 entonces cliente=malo 7.-If ratio1>31 entonces cliente=malo

5.5 Matriz de confusión

a) (b) <-- Clasificado como 37 1| a= bueno 3 12| b = malo

La matriz de confusión señala el tipo de errores cometidos; de los 53 clientes de la muestra 4 son mal clasificados (7.55 %), lo que supone un margen de acierto del 92.45 %. Este resultado es excelente ya que permitirá clasificar nuevas solicitudes de préstamos con un acierto de 92.45 %. Además, el árbol construido, tiene la ventaja sobre otros sistemas de clasificación por el hecho de que las reglas de decisión pueden ser seguidas por cualquier usuario evaluador de nuevas solicitudes

8. Conclusiones

El resultado obtenido es excelente ya que se obtuvo una clasificación en el conjunto de

aprendizaje de 92.45 %. Además, el árbol construido, tiene la ventaja sobre otros sistema de

clasificación como las redes neuronales artificiales, de que las reglas producto de los sistemas de

inducción son entendibles por un analista humano, y además las variables irrelevantes son

eliminadas del modelo, pues no figuran en los árboles /reglas.

Page 9: Catalogo 2012

BIBLIOGRACIA

• [PDA]GITMAN Lawrence J. 2003 “Principios de Administración Financiera”

• [CICC96]ARAYA Roberto.1996, “Oportunidades de aumentar calidad en el análisis crediticio utilizando redesneuronales y aprendizaje por maquina”, CICC96 Universidad

• UDABOL.

• [Quinlan, 1993]QUINLAN, J.R. C4.5: Program For Machine Learning. Edit. Morgan Kaufmann, San Mateo, CA.,1993.

• [INTERNET1]DE ANDRES SUAREZ Javier “Técnicas de inteligencia artificial

al análisis de la solvencia empresarial. www19.uniovi.es/econo/doctrabajo/DT00/206_00.PDF

• [WEKA]Machine Learning Sofware in Java. Universidad de Waikato. Nueva

Zelandia.http://www.cs.waikato.ac.nz/~ml/weka/