Redes Neuronales para Clasificación: Una aplicación al ...

72
Facultad de Ciencias Económicas y Administrativas Maestría en Economía 1 Redes Neuronales para Clasificación: Una aplicación al caso de Riesgos Laborales en Colombia Camilo Matson Hernández Trabajo de grado para optar por el Título de Magister en Economía Asesor: Martha Misas Arango PONTIFICIA UNIVERSIDAD JAVERIANA FACULTAD DE CIENCIAS ECONÓMICAS Y ADMINISTRATIVAS MAESTRÍA EN ECONOMÍA BOGOTÁ D.C., 2017

Transcript of Redes Neuronales para Clasificación: Una aplicación al ...

Page 1: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

1

Redes Neuronales para Clasificación:

Una aplicación al caso de Riesgos Laborales en Colombia

Camilo Matson Hernández

Trabajo de grado para optar por el Título de Magister en Economía

Asesor: Martha Misas Arango

PONTIFICIA UNIVERSIDAD JAVERIANA

FACULTAD DE CIENCIAS ECONÓMICAS Y ADMINISTRATIVAS

MAESTRÍA EN ECONOMÍA

BOGOTÁ D.C., 2017

Page 2: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

2

Resumen

El presente artículo describe el diseño, la formalización matemática, programación y

la aplicación de una red neuronal “percepton multicapa” en un problema economía de la

información. El modelo permitió clasificar correctamente el 85% de las empresas de una

muestra aleatoria de asegurados a riesgos laborales en Colombia, identificándolas como

fraudulentas o no fraudulentas a partir de sus variables explicativas. Este estudio cuenta con

dos factores diferenciales frente a los realizados en el pasado. En primer lugar, se aplicó una

red neuronal típicamente usada para modelar pronósticos de series de temporales a un

problema de clasificación de individuos, siguiendo el método propuesto por Hongjun Lu,

Rudy Setiono y Huan Liu en “Neuro Rule: A Connectionist Approach to Data Mining”

artículo que introduce un algoritmo para generar reglas de fácil interpretación para la

clasificación de individuos. En segundo lugar, la aplicación de esta técnica de minería de

datos es novedosa en la detección de empresas fraudulentas afiliadas al seguro de riesgos

laborales y en general en el campo de investigación económica en Colombia.

Palabras Clave: Redes Neuronales Artificiales, Perceptrón Multicapa, Fraude,

Riesgo Laboral, Economía de la Información, Seguros.

Page 3: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

3

Tabla de contenido

INTRODUCCIÓN .............................................................................................................................. 5

1. “BIG DATA” Y MINERÍA DE DATOS ........................................................................................ 6

2. PROBLEMAS DE CLASIFICACIÓN ............................................................................................ 8

Tabla 1. Matriz de Confusión ................................................................................................ 10 2.1 TIPOS DE MODELOS DE CLASIFICACIÓN Y SUS APLICACIONES .................................................... 11

Tabla 2. Algoritmos de clasificación ..................................................................................... 12 3. REDES NEURONALES ........................................................................................................... 14

Figura 1. Fuente: (Misas, López & Querubín 2002) .............................................................. 15 Figura 2. Fuente: (Misas, López & Querubín 2002) .............................................................. 15 Figura 3. Ejemplo de una red neuronal artificial perceptrón multicapa ............................... 16

3.1 RED NEURONAL PARA CLASIFICACIÓN CON PODA DE NODOS Y EXTRACCIÓN DE REGLAS ................. 17

3.2 ENTRENAMIENTO DE LA RED ............................................................................................. 20

3.3 PODA DE LA RED ............................................................................................................ 26

3.4 EXTRACCIÓN DE REGLAS .................................................................................................. 26

Figura 7. Ejemplo de discretización de valores de activación vía clúster ............................. 27 Tabla 3. Valores de activación y salidas Neurorule............................................................... 28 Tabla 4. Reglas de clasificación para los valores de activación de Neurorule...................... 29

4. APLICACIÓN DE REDES NEURONALES A UN PROBLEMA DE ECONOMÍA DE LA INFORMACIÓN: IDENTIFICACIÓN DE EMPRESAS FRAUDULENTAS EN EL RAMO DE RIESGOS LABORALES ............... 29

4.1 ECONOMÍA DE LA INFORMACIÓN Y FRAUDE EN SEGUROS ........................................................ 30

4.2 EMPRESAS FRAUDULENTAS EN EL SISTEMA DE GENERAL DE RIESGOS LABORALES ........................ 32

Tabla 5. Cifras Sistema de Riesgos Laborales ....................................................................... 34 4.3 SELECCIÓN DE LA MUESTRA .............................................................................................. 36

Tabla 6. Muestra estratificada de empresas ........................................................................ 37 4.4 VARIABLES EXPLICATIVAS Y DATOS DEL MODELO ................................................................... 38

Tabla 7 .................................................................................................................................. 39 1.5 ENTRENAMIENTO ....................................................................................................... 40

4.6 PODA .......................................................................................................................... 41

Tabla 8. Intervalos del modelo después de la fase de poda ................................................. 41 4.7 RULE EXTRACTION ALGORITHM (RX) .................................................................................. 43

Tabla 9. Clusters y valores de activación .............................................................................. 43 Tabla 10. Valores de activación discretos versus salidas del modelo ................................... 43 Tabla 11. Reglas de clasificación para los valores de activación .......................................... 44 Tabla 12. Matriz de confusión de empresas fraudulentas ARL ............................................ 44

5. CONCLUSIONES ................................................................................................................... 46

6. ANEXOS .............................................................................................................................. 48

Figura 5. Algoritmo de poda de una Red Neuronal Artificial. ............................................... 48

Page 4: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

4

Figura 6. Algoritmo de extracción de Reglas RX ................................................................... 49 Figura 8. Algoritmo X2R: Generador de Reglas .................................................................... 50 Tabla 13. Departamentos de Colombia ............................................................................... 51 Tabla 14. Naturaleza ............................................................................................................ 52 Tabla 15. Tipos de documento ............................................................................................ 52 Tabla 16. Clases de riesgo .................................................................................................... 52 Tabla 17. Actividades Económicas ....................................................................................... 52

BIBLIOGRAFÍA ............................................................................................................................... 65

Page 5: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

5

Introducción

Las redes neuronales artificiales (ANN) son modelos computacionales de las redes

neuronales biológicas, las cuales tratan de simular su funcionamiento y su capacidad para

procesar información (Misas, López & Querubín 2002) , según Herbrich, et.al (1999) existen

tres campos en los cuales se ha concentrado su aplicación en la economía: i) clasificación de

agentes económicos, ii) pronóstico de series de tiempo y iii) modelaje de agentes con

racionalidad limitada, y de estos, el campo con mayor exploración en la investigación

económica ha sido el segundo, por ejemplo, los trabajos de: Salazar (2009), Restrepo (2006),

Jalil & Misas (2006), Torres (2006), Arango & Misas (2004) , Misas, Arango, López &

Hernández (2003) y Misas, López & Querubín (2002) se han enfocado en el uso redes

neuronales para establecer relaciones no lineales entre variables, y así pronosticar el valor

futuro de una o más variables continuas a través del tiempo. Por otra parte, el número de

estudios de clasificación de agentes económicos es limitado sobre todo a nivel local, donde

predomina el uso de técnicas econométricas como la regresión logística que permite predecir

el valor de una variable categórica en función de variables independientes, esta regresión ha

sido usada en trabajos como: Iregui, Melo, Ramírez (2013) y Lemus, Corredor & Gutiérrez

(2012). Durante el proceso de investigación solo fue posible encontrar a nivel local una

aplicación del perceptron multicapa a clasificación de individuos (Picón, 2011), sin embargo,

posteriormente se citarán aplicaciones existentes en referencias internacionales con

aplicaciones en industrias de seguros y servicios financieros que incluyen estas técnicas en

su portafolio de modelos para el análisis y toma de decisiones.

Las dos razones que han limitado el interés en el estudio de redes neuronales

artificiales para clasificación son: el alto costo computacional para el entrenamiento de las

mismas, y el nivel de complejidad para la generación de reglas fácilmente entendibles por las

personas. La primera restricción se ha superado ante la evolución de la capacidad de

procesamiento de los equipos de cómputo y la segunda se ataca a través del desarrollo del

algoritmo propuesto por Lu, Setiono & Liu (1995) para la extracción de reglas, objeto de

estudio de este documento.

Este escrito iniciará con una breve justificación que incluye las oportunidades

existentes frente al uso de técnicas para el proceso de tratamiento y análisis de los datos,

Page 6: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

6

luego se realizará una revisión de los modelos de clasificación, sus diferentes tipos y

aplicaciones. Seguido a esto: se elegirá el enfoque de redes neuronales particularmente el

perceptron multicapa, se describirá formalmente el método propuesto en “Neuro Rule: A

Connectionist Approach to Data Mining” para la extracción de reglas de clasificación, la

programación y generalización de algunos de sus algoritmos, y finalmente se incluirá una

aplicación del método al campo de la economía de la información en la detección de empresas

fraudulentas afiliadas al seguro de riesgos laborales en Colombia. Obteniendo así reglas para

clasificar las empresas como: fraudulentas o no fraudulentas a partir de sus variables

explicativas.

1. “Big Data” y Minería de Datos

En casi todos los ámbitos de la vida cotidiana estamos generando datos, bien sea a

través de la adquisición de productos o al recibir la prestación de un servicio. Por ejemplo, la

corporación internacional de tiendas estadounidense Walmart, gestiona más de un millón de

transacciones de sus clientes cada hora, y esta información se almacena en una base de datos

de más de 2.5 petabytes1 equivalente a 167 veces el número de libros en el Congreso de

Estados Unidos; los motores de cada jet Boeing pueden producir 10 terabytes de información

cada 30 minutos, que corresponden a cientos de datos en un sencillo vuelo interoceánico, lo

cual se convierte en un gran volumen de datos al multiplicar por los 25.000 vuelos diarios,

en las redes sociales Facebook opera más de 500 terabytes solo en datos de registro de

usuario, Twitter cuenta con más de 550 millones de usuarios activos que producen 9100

tweets cada segundo2 y YouTube recibe cada minuto 100 horas de video3 (Kambatla, Kollias,

Kumar & Grama, 2014), en el campo de los servicios de salud, en Estados Unidos en el año

2011 los prestadores generaron cerca de 1000 petabytes de información (Herland,

Khoshgoftaar & Wald, 2014), (Huan, Pai, Teredesai & Yu , 2013), (Yuan, Nsoesie, Lv,

Peng, Chunara & Brownstein, 2013), siendo así el mundo moderno cuenta con datos de gran

volumen, de diversos tipos y con una velocidad de velocidad de actualización de milésimas

de segundo.

1 1024 terabytes. 2 http://www.statisticbrain.com/twitter-statistics/. 3 http://www.youtube.com/yt/press/statistics.html.

Page 7: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

7

En total se estima que cerca del 90% de los datos actuales fueron creados en los

últimos cinco años. Según IBM4 , la reconocida empresa multinacional estadounidense de

tecnología y consultoría, cada día se generan 2.5 quintillones5 de bytes, y en 2012 se

generaron 2.5 billones de gigabytes en múltiples campos de almacenamiento y tratamiento

de datos; además, aproximadamente el 75% de esta información corresponde a datos no

estructurados -imágenes, texto, audio y video-.

Para poder gestionar esta cantidad de registros se creó el concepto Big Data6, que

permite trabajar con grandes volúmenes datos que no pueden ser tratados de manera

convencional por superar los límites y capacidades de las herramientas habitualmente

utilizadas7. Big Data usa técnicas de software y hardware, dividiendo el trabajo de

procesamiento de la información en varios servidores simultáneamente, para solucionar

problemas de cálculo enormes, con datos de múltiples fuentes y con una rápida capacidad de

respuesta. Sin embargo, aunque el volumen de datos está creciendo exponencialmente la

mayor parte de la información permanece almacenada en los discos duros sin ser analizada,

y cuando se analiza, tarda varias semanas para que los seres humanos puedan descubrir

información útil para generar conocimiento (Grossman, Kamath, Kegelmeyer, Kumar &

Namburu, 2013) que a su vez permita mejorar la toma de decisiones de los agentes, optimizar

los procesos industriales y mejorar la efectividad de las políticas públicas. Para cerrar la

brecha entre los datos almacenados y el conocimiento generado, nace el concepto Minería de

datos que utiliza el análisis matemático para deducir patrones y tendencias que normalmente

no se pueden detectar mediante la exploración tradicional.

En minería de datos hay dos clases de modelos, los predictivos y los descriptivos, los

modelos predictivos consisten en usar algunas variables para predecir valores desconocidos

o futuros de otras variables, y los modelos descriptivos ayudan a en encontrar patrones

4 http://www-01.ibm.com/software/data/bigdata/what-is-big-data.html 5 1 Quintillon = 10^18 bytes. En comparación 1 Gigabyte = 10^9 bytes 6 Big Data: Es un concepto que permite realizar la administración de grandes volúmenes de datos, y

que consiste en la aplicación de cinco V’s: Volumen, Velocidad, Variedad, Veracidad y Valor. Donde Volumen

se refiere una cantidad basta de datos, Velocidad se refiere a alta frecuencia en la generación de datos nuevos,

Variedad se refiere al nivel de complejidad de los datos, Veracidad mide el nivel de autenticidad de los datos y

Valor evalúa qué tan buena es la calidad de los resultados de los modelos, en referencia a los resultados

esperados (Demchenko, Zhao, Grosso, Wibisono, De Laat C, 2012). 7 http://www.eleconomista.es/tecnologia/noticias/5578707/02/14/La-moda-del-Big-Data-En-que-

consiste-en-realidad.html

Page 8: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

8

interpretables por los seres humanos para describir un conjunto de datos. Al interior de cada

clase podemos encontrar diferentes tipos de algoritmos, los usados en modelos predictivos

son:

Regresión: predicen el valor de una o más variables continúas basándose en los

valores de otras variables, asumiendo una dependencia que puede ser lineal o no

lineal. Por ejemplo, la predicción de ventas de un producto nuevo a partir del dinero

invertido en su campaña publicitaria.

Detección de desviaciones: encuentran patrones de desviación respecto a conductas

normales. Por ejemplo, la detección de transacciones fraudulentas en tarjetas de

crédito.

Por otro lado, en los modelos descriptivos cuentan con los algoritmos de:

Asociación: permiten producir reglas de dependencia que de ocurrencia de un ítem a

partir de la aparición de un grupo de elementos dados. Por ejemplo, identificación de

productos que se comprarán a partir de los productos previamente seleccionados.

Análisis de secuencias: permiten hacer el resumen secuencias o episodios frecuentes

en los datos. Por ejemplo, la secuencia en la compra de libros: “Introducción a la

economía”, “Economía de nivel medio” y “Economía avanzada.

Segmentación: permite ubicar los datos en grupos o “clúster” de elementos que tienen

propiedades similares. Por ejemplo, la segmentación de clientes a partir de sus

intereses de compra, para definir el esquema de atención de un banco.

Finalmente se encuentran los modelos de Clasificación que permiten encontrar la

clase a la que pertenece un individuo a partir de los atributos que lo caracterizan. Por ejemplo,

en el campo de la biología es interesante hacer la clasificación de un conjunto de animales

en su especie a partir de sus atributos físicos. El presente documento se enfocará en el estudio

estos modelos.

2. Problemas de clasificación

Page 9: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

9

Tan, Steinbach, & Kumar (2006) definen clasificación como el proceso de asignar

objetos, a una o muchas categorías, permitiendo descubrir reglas para dividir los conjuntos

de datos en subgrupos para ser analizados. Este tipo de modelos tienen la posibilidad de ser

usados en forma descriptiva al hacer distinción de objetos en clases y en forma predictiva al

inferir la clase de objetos desconocidos.

Los algoritmos de clasificación son eficaces en el manejo de conjuntos de variables

categóricas, pero su desempeño no es el mejor al usar variables cuantitativas y por lo general

siguen los pasos:

1. Definir los datos conocidos en un “conjunto de entrenamiento”, que corresponde

a un grupo de individuos observados con su clase esperada. Por ejemplo, una base

de datos que cuenta con dos individuos clasificados como: criminales y no

criminales.

2. Entrenar el modelo, esta etapa consiste en usar los datos definidos en el conjunto

de entrenamiento para que el modelo reconozca los patrones observados que le

asignan a cada individuo su clase. Siguiendo el ejemplo anterior, el individuo

cuenta con una variable explicativa que indica que en su contra existe una

demanda, y esta variable tiene un peso importante para determinar que la persona

es delincuente, esta variable se convierte en un patrón determinante para la

decisión final de clasificar al individuo como “criminal” de acuerdo con los datos

en el conjunto de entrenamiento.

3. Crear un “conjunto de validación” a partir de datos que no se hayan incluido en

el conjunto de entrenamiento.

4. Evaluar el modelo construido con los datos del “conjunto de validación”, para

definir la efectividad del modelo. Esta etapa consiste en comparar cual es la clase

pronosticada por el modelo, contra la clase real a la que pertenece el individuo.

Para el ejemplo, se toma una base de datos de criminales no incluida en la fase

inicial, se le aplican las reglas del modelo y se comparan las salidas reales con el

pronóstico.

5. Si el modelo es suficientemente efectivo, se puede utilizar para clasificar nuevos

datos.

Page 10: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

10

Cada modelo de clasificación emplea una técnica de aprendizaje que identifica el

mejor ajuste entre el conjunto de atributos del objeto y su respectiva clase. La evaluación del

desempeño del modelo está basada en el conteo de los elementos correctamente e

incorrectamente clasificados en el conjunto de validación de acuerdo con las salidas de

predicción del modelo. Es posible comparar el desempeño de un modelo usando la matriz de

confusión o matriz de error (Powers, 2007):

Tabla 1. Matriz de Confusión

Clase pronosticada

Clase = 1 Clase = 0

C

l

a

s

e

r

e

a

l

Clase 1

Verdaderos

Positivos

(VP)

Falsos Negativos

(FN)

Tasa de

Verdaderos

Positivos, TVP:

VP

𝑉𝑃 + 𝐹𝑁

Tasa de

Falsos

Negativos, TFN:

𝐹𝑁

𝐹𝑁 + 𝑉𝑃

Clase 0

Falsos Positivo

(FP)

Verdaderos

Negativos

(VN)

Tasa de

Falsos

Positivos, TFP:

𝐹𝑃

𝐹𝑃 + 𝑉𝑁

Tasa de

Verdaderos

Negativos, TVN:

VN

𝐹𝑃 + 𝑉𝑁

Ajuste:

VP + VN

𝑇𝑜𝑡𝑎𝑙𝐼𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑜𝑠

Valor Predictivo

Positivo, VPP:

VP

𝑉𝑃 + 𝐹𝑃

Tasa de Falsa

Omisión, TFO:

FN

𝑉𝑁 + 𝐹𝑁

Error:

FP + FN

𝑇𝑜𝑡𝑎𝑙𝐼𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑜𝑠

Tasa de

Falso

Descubrimiento,

TFD:

𝐹𝑃

𝐹𝑃 + 𝑉𝑃

Valor

Predictivo

Negativo, VPN:

𝑉𝑁

𝑉𝑁 + 𝐹𝑁

Los Verdaderos Positivos y Verdaderos Negativos, son individuos que fueron

clasificados correctamente por el modelo. Por otra parte, los Falsos Positivos, son individuos

clasificados por el modelo como Positivos, pero que en realidad eran Negativos, mientras

que los Falsos Negativos en realidad eran Positivos.

Page 11: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

11

El Ajuste mide la proporción de los individuos correctamente clasificados por el

modelo independientemente de la clase a la que pertenecen versus el total de individuos, y la

tasa de error mide la proporción de los individuos incorrectamente clasificados en relación

con el total de individuos.

Las otras medidas son proporciones que permiten identificar relaciones de

clasificación del modelo, por ejemplo: VPP – (Valor Predictivo Positivo - Sensibilidad):

Denota la proporción de Verdaderos Positivos respecto al total de individuos pronosticados

como positivos y TVP – (Tasa de Verdaderos Positivos – Precisión): Corresponde a la tasa

de descubrimiento de verdaderos positivos en relación al total de los individuos realmente

Positivos y así sucesivamente (Powers 2007).

2.1 Tipos de modelos de clasificación y sus aplicaciones

Al revisar el estado del arte en materia de algoritmos de clasificación, se encuentra

un amplio espectro de opciones; por ejemplo Lessmann et al. (2015) realiza un completo

análisis comparativo con 1141 modelos orientados a determinar el riesgo de crédito de un

conjunto de agentes. El autor agrupa los modelos en tres tipos: clasificadores individuales,

conjuntos homogéneos y conjuntos heterogéneos.

Los clasificadores individuales se componen un único modelo que toma los datos y

produce las salidas finales, estos incluyen técnicas clásicas como: regresión logística, redes

neuronales, arboles de decisión y métodos bayesianos.

Los conjuntos homogéneos, incluyen uno o varios modelos base que procesan los

datos en primera instancia, luego sus salidas se usan en otro modelo igual que entrega los

resultados finales. Por último, se encuentran los conjuntos heterogéneos que al igual que los

homogéneos, tienen uno o varios modelos iniciales y un modelo final que se encarga de

procesar los datos, sin embargo, su diferencia radica en que estos tienen modelos diferentes

en la etapa inicial y en la final.

La principal fortaleza de los conjuntos heterogéneos es que permiten contar con

diferentes puntos de vista en el mismo conjunto de datos, así los análisis individuales resultan

ser complementarios al evaluarlos en forma conjunta. Adicional a esto, de acuerdo con

resultados empíricos de Finlay (2011) y Paleologo, Elisseeff, & Antonini (2010) las técnicas

Page 12: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

12

que involucran más de un modelo en diferentes instancias, tienen una mejor capacidad de

ajuste que los clasificadores individuales.

En la siguiente tabla se preparó un resumen de los modelos de clasificación más

usados agrupados por tipo:

Tabla 2. Algoritmos de clasificación

Tipo de

algoritmo

Algoritmo de clasificación Acrónimo

Clasificador

individual

Red Bayesiana B-Net

CART CART

K vecinos más cercanos kNN

Análisis lineal discriminante LDA

Máquina de soporte vectorial SVM-L

Regresión logística LR

Perceptron multicapa red neuronal artificial ANN

Bayes nativo NB

Algoritmos

homogéneos

Árbol de decisión alternante ADT

Árbol decisión impulsado Boost

Modelo de árbol logístico LMT

Algoritmos

heterogéneos

Apilado Stack

HCES con muestreo bootstrap HCES-Bag

Cluster k- Medias k-Means

La tabla nos muestra que existe una amplia gama de algoritmos que se pueden usar

para clasificar elementos, y la elección del más apropiado se basa en: en el ajuste del modelo,

el conjunto de datos, la capacidad de cómputo y el conocimiento del problema de

investigación.

Estos problemas de la investigación se pueden presentar en casi cualquier ámbito

científico y su solución genera mayor eficiencia en todos los sectores de la economía

(seguros, banca, salud, energía, seguridad, construcción, transporte y gobierno),

convirtiéndolo en un problema computacional que reduce la intervención humana, enfocando

Page 13: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

13

a las personas en el análisis de los casos especiales y reduciendo la carga operativa. Por lo

tanto, es interesante ilustrar resultados obtenidos por otros investigadores, para dar al lector

una noción del estado del arte que tiene especial énfasis en aplicaciones en: banca, seguros y

prestación de servicios de salud, de acuerdo con la orientación de este documento.

Por ejemplo en banca Pavlidis et al (2012) realizan una aplicación de los modelos de

clasificación a clientes bancarios con obligaciones crediticias, para determinar cuáles

usuarios tienen mayor probabilidad de incumplir sus pagos, usando métodos como: análisis

discriminante, regresión logística, k vecinos más cercanos, arboles de decisión, métodos de

aprendizaje de máquinas, perceptron multicapa y las máquinas de soporte vectorial. Otro

ejemplo es el de Patidar & Sharma (2011), quienes realizan una investigación de fraudes con

las tarjetas de crédito; proponen la utilización de la construcción de una red neuronal para la

detección temprana de transacciones inusuales con base a los usos de la tarjeta, también es

posible encontrar interesantes aplicaciones relacionadas con el sistema bancario en : Hand &

Henley (1997) , Liao, Wang, & Weyman-Jones (2007) y Whittaker, Whitehead, & Somers

(2006).

Jones (2000) hace un resumen de técnicas empleadas de econometría de las salud y

Bertsimas Et al(2005) usaron técnicas modernas de minería de datos, específicamente,

arboles de decisión y algoritmos de clustering, con datos de reclamaciones de más de 800.000

individuos asegurados en un periodo de tres años, para proveer predicciones validadas de los

costos en el cuidado de la salud. Los hallazgos clave fueron (a) el método de minería de datos

provee predicciones acertadas de los costos médicos, convirtiéndolo en una herramienta

poderosa para la predicción de los costos de la salud, (b) el patrón de datos de costos pasados

es un fuerte predictor de costos futuros, y (c) el detalle de la información médica solo

contribuye a mejorar la predicción de costos médicos de pacientes de alto costo.

Otra aplicación en la prestación de servicios de salud es la identificación de pacientes

readmitidos en hospitales. La reedición de pacientes se ha identificado como un problema al

ser la mayor fuente de costos en los sistemas de salud de Estados Unidos y se considera como

un indicador clave de desempeño de los hospitales respecto a la calidad de los servicios de

salud que prestan, Golmohammadi & Radnia (2016) se valen del uso de técnicas como: redes

neuronales, modelos de clasificación y regresión, y de detección automática modelo chi

Page 14: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

14

cuadrado, para buscar los patrones recurrentes en la historia demográfica de los pacientes

que han sido readmitidos y exploran la deducción de una regla para predecir aquellos

pacientes con alto riesgo de futuras readmisiones. Las aplicaciones al sector asegurador serán

revisadas en la sección 4.1 de este documento (Derrig, Weisberg & Chen 1994).

El presente documento se enfocará en un algoritmo del tipo clasificador individual,

particularmente una red neuronal que permitirá identificar los patrones para asignar

individuos su clase correspondiente.

3. Redes neuronales

Las redes neuronales (ANN)8 son modelos computacionales basados en las redes

neuronales biológicas, las cuales tratan de simular su funcionamiento y su capacidad para

procesar información.

Para diferenciar estos dos tipos de redes: Misas, López & Querubín (2002),

mencionan que las redes biológicas se encuentran en el cerebro humano y que su componente

más básico es un tipo específico de célula llamada neurona el cual nos provee habilidades de

recordar, pensar y aplicar las experiencias previas para cada una de nuestras acciones. Cada

neurona puede estar conectada hasta con otras 2000 neuronas; en efecto, el poder del cerebro

proviene del número de estos componentes básicos y las múltiples conexiones entre ellas.

Toda la neurona tiene cuatro componentes, que son: dendritas, soma, axón y sinapsis.

Básicamente una neurona recibe inputs, la combina de alguna manera, realiza una operación

no lineal en el resultado, y el output es el resultado final. La Figura 1 presenta una neurona

simplificada y la relación en sus componentes.

8 Se conocen en la literatura como Redes Neuronales Artificiales (Artificial Neural Network)

Page 15: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

15

Figura 1. Fuente: (Misas, López & Querubín 2002)

En el caso de las redes neuronales artificiales, el elemento básico es una neurona

artificial, la cual trata de imitar las cuatro funciones de una neurona biológica. La Figura 2

muestra una neurona artificial.

Figura 2. Fuente: (Misas, López & Querubín 2002)

Los inputs o variables de entrada son representados por la variable 𝑥𝑛 , los cuales se

multiplican por un ponderado específico 𝑤𝑛 antes de llegar al área de procesamiento. En el

Page 16: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

16

caso más sencillo, estos productos son agregados y filtrados para generar un output. Existen

varios tipos de redes neuronales que se construyen a partir de este modelo básico.

La interconexión de las neuronas se simula en las ANN mediante capas que están

conectadas entre sí. Como se puede ver en la Figura 3, las neuronas se agrupan en distintas

superficies, dependiendo de su conexión con el mundo exterior. Cuando la capa de entrada

recibe inputs 𝑥 que se multiplican por unos pesos 𝑤 y se evalúan en las funciones 𝛼 producen

outputs 𝑠 , que se convierten en inputs de la siguiente capa (capa oculta) que se multiplican

unos pesos 𝑣, que producen unas salidas 𝑆 9.

Figura 3. Ejemplo de una red neuronal artificial perceptrón multicapa

Dependiendo de la conexión entre capas, se clasifican de diferentes formas, entre la

más conocida que es la ´Red hacia adelante´ (Feed forward), la cual se tiene cuando las

neuronas de la primera capa envían su output a la segunda capa, pero esta no recibe un input

sin recibir un output de retorno.

Dentro de los modelos con estas características de conexiones y aprendizaje se

encuentra el perceptrón multicapa, el cual tiene una capa de entrada y salida, al ser multicapa

9 El ejemplo corresponde a un individuo con dos variables explicativas 𝑥 , tres nodos 𝛼 en la capa de

entrada y dos nodos 𝜎 en la capa de salida.

Page 17: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

17

quiere decir que aparte de las capas mencionadas, tiene al menos una capa oculta, lo que le

ayuda a resolver problemas que no son linealmente separables.

El cerebro humano aprende a través de la experiencia, en los modelos ANN, este es

el proceso conocido como entrenamiento es cuando la red neuronal modifica sus pesos en

respuesta a una información de entrada. Uno de estos procesos se conoce como aprendizaje

supervisado, que se realiza mediante un entrenamiento controlado por un agente externo (que

suele llamarse maestro o supervisor) y determina la respuesta que debería generar la red a

partir de una entrada específica. El supervisor controla la salida de la red y en caso que no

coincida con la esperada, se procederá a modificar los pesos de las conexiones, con el fin de

que la salida obtenida se aproxime a la deseada.

3.1 Red neuronal para clasificación con poda de nodos y extracción de reglas

El algoritmo de ANN usado con mayor frecuencia para resolver problemas de

clasificación es k-medias propuesto por Lloyd (1957), porque es un método estándar

disponible en paquetes computacionales de minería de datos, sin embargo, este documento

propone y explica una técnica no estándar para la clasificación de individuos propuesta por

Lu, Setiono & Liu (1995), quienes resuelven el problema en tres pasos: entrenar, podar y la

extraer las reglas de la red.

Las tres etapas del modelo se programaron en MATLAB® para llevar su simulación

y verificar la interacción de los algoritmos (ver Figura 4), y se implementaron en las fases de

inicialización de variables y cargue de datos, entrenamiento de la red y poda, y la extracción

de reglas.

Page 18: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

18

Figura 4. Inicialización de variables.

Al escribir los códigos fue necesario agregar un proceso inicial de cargue de

variables donde se incluyen tres elementos para conformar la matriz de datos X. El

primero es X1 un vector de unos que permitirá la calibración del intercepto, el

segundo Xc una matriz con las variables cuantitativas del modelo y el tercero es Xd

una matriz con las variables discretas del modelo.

Cómo el desempeño de los algoritmos de clasificación no es el mejor ante la

presencia de variables cuantitativas, se requiere volverlas variables discretas al

realizar el cargue de datos. Para resolver esto se escribió un programa que toma el

valor máximo de la variable cuantitativa y la divide en un número dado de intervalos,

luego se recorren los elementos del vector con la variable cuantitativa y se construye

una matriz de unos y ceros, donde uno significa que el valor de la variable es menor

o igual a los elementos del intervalo y cero indica lo contrario.

Por ejemplo, se cuenta con una variable cuantitativa “Edad” con individuos

entre 1 y 45 años que se quiere volver discreta en tres intervalos [1,15], (15,30] y

(30,45] de la siguiente forma:

Page 19: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

19

𝐸𝑑𝑎𝑑 =

[ 2317203145]

(1) 𝐸𝑑𝑎𝑑𝑑 =

[ [1,15] (15,30] (30,45]

1 0 01 0 01 1 01 1 01 1 11 1 1 ]

(2)

De tal forma que la variable cuantitativa (1) se convierte en la variable discreta (2),

para permitir su procesamiento10. Las variables categóricas como “sexo” se incluyen en el

modelo así:

𝑆𝑒𝑥𝑜 =

[ 𝐹𝑀𝑀𝐹𝐹𝑀]

(3) 𝑆𝑒𝑥𝑜𝑑 =

[ F M1 00 10 11 01 00 1 ]

(4)

Tanto las variables cuantitativas Xc, como las variables discretas Xd corresponden a

matrices de unos y ceros. Al unir las columnas de Xc con Xd se forma la matriz X de datos,

para posteriormente se seleccionar los parámetros de la arquitectura de la red (número de

nodos en la capa oculta y en la capa de salida), así como los valores iniciales para las matrices

de ponderación de variables W y V.

Luego se procede con la fase de entrenamiento para obtener el conjunto de pesos que

minimiza el error entre la salida del modelo y el dato real observado11 más un término de

penalización12 .

A esta técnica se le denomina propagación hacia atrás del error y se base en la

optimización del gradiente descendente. El algoritmo consiste en presentar un patrón de

entrada de la red neuronal, propagar dichas entradas hasta la capa de salida, luego calcular el

error de la capa de salida, para propagar dicho error hacia las neuronas ocultas y cambiar los

10 La misma conversión de variables es usada por Liu & Tan (1995). 11 𝐸𝑟𝑟𝑜𝑟(𝑊, 𝑉). 12 𝑃(𝑊, 𝑉).

Page 20: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

20

pesos de las conexiones. El proceso finaliza cuando que la norma del gradiente de la función

de error inferior al error admitido por el investigador.

Adicional a la minimización del error en el caso de estudio se encuentra el término

de penalización propuesto por Setiono (1997) que busca calibrar la importancia de la

precisión de la red versus su nivel de complejidad. De tal forma que al encontrar un conjunto

de pesos W y V que minimizan la suma del error y el término de penalización, se puede decir

que la etapa de entrenamiento inicial se ha completado.

Hasta el momento se cuenta con una red completamente conectada, que tiene una

gran cantidad de nodos y vínculos, sin embargo, para reducirlos se aplica un algoritmo de

poda, que elimina los elementos redundantes sin incrementar el error de clasificación

obteniendo una versión sencilla de la red original que permite optimizar los tiempos de

cálculo. Pero, aunque la nueva red es menos compleja, la información disponible en esta

etapa, es apenas conjunto de pesos que pasan por la capa oculta y toman un valor de

activación real en el intervalo [-1,1], por lo tanto, aún no es posible derivar relaciones

comprensibles la forma “si… entonces…”, claras y explícitas entre los valores de activación

y los nodos ocultos.

Para poder las generar reglas entendibles se aplica el algoritmo RX de extracción de

reglas propuesto por Liu & Tan (1995), donde se agrupan los valores de activación sin

sacrificar el ajuste de la red, de tal forma que con un número pequeño de valores de activación

se puede determinar la dependencia entre los valores de salida de la red y los nodos de la

capa oculta, así como la dependencia entre los nodos de activación ocultos y los valores de

entrada, para finalmente obtener reglas con la estructura adecuada para ser fácilmente

interpretadas para clasificar individuos.

3.2 Entrenamiento de la red

Formalmente el problema consiste en clasificar 𝑘 individuos en 𝑜 clases usando 𝑥𝑙𝑖

como inputs del modelo, estos valores se ingresan en las neuronas de las capas de entrada de

la siguiente forma:

𝑠𝑙𝑚 = 𝛼𝑙

𝑚 = 𝑓(∑ (𝑥𝑙𝑖𝑤𝑙

𝑚)𝑛𝑙=1 − 𝑤0

𝑚) (5)

Page 21: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

21

Todos inputs del modelo tienen asociado un peso 𝑤𝑙𝑚, el producto de estas variables

simula la conexión entre el axón y las dendritas, el valor de los pesos determina la fuerza y

el signo de la conexión, permitiendo potenciar o debilitar la señal recibida lo que en la red

neuronal biológica se conoce como sinapsis. Al valor 𝑤0𝑚 se le denomina umbral y se

interpreta como la cantidad que debe superar la suma de las señales de entrada que recibe la

unidad para que se active, esta expresión es conocida como función de entrada y se evalúa

en la función de activación 𝑓.

𝑓(𝑥) = 𝜕(𝑥) =(𝑒𝑥−𝑒−𝑥)

(𝑒𝑥+𝑒−𝑥) (6)

La forma funcional corresponde la tangente hiperbólica con rango [−1,1], se encarga

de normalizar las salidas y de hacer más compleja la red para que no se comporte como una

simple función lineal. Al resultado de 𝑓 se le conoce como valor de activación (Russell &

Norvig 2003).

Para facilidad en el tratamiento de la información el problema se planteará términos

matriciales, de tal forma que X corresponde a la matriz datos observados y se compone de 𝒙𝒍𝒊

elementos, donde el índice 𝒊 de las filas corresponde al número de individuos en el conjunto

de entrenamiento con 𝒊 ∈ {𝟏, 𝟐, … , 𝒌}, la variable 𝒍 es el número de atributos o variables

explicativas de cada individuo con 𝒍 ∈ {𝟎, 𝟏, 𝟐, … , 𝒏} y el vector de unos permite calibrar el

intercepto.

X =

[ 𝟏𝟎

𝟏 𝒙𝟏𝟏 𝒙𝟐

𝟏 … 𝒙𝒍𝟏 … 𝒙𝒏

𝟏

𝟏𝟎𝟐 𝒙𝟏

𝟐 𝒙𝟐𝟐 … 𝒙𝒍

𝟐 … 𝒙𝒏𝟐

⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮𝟏𝟎

𝒊 𝒙𝟏𝒊 𝒙𝟐

𝒊 … 𝒙𝒍𝒊 … 𝒙𝒏

𝒊

⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮𝟏𝟎

𝒌 𝒙𝟏𝒌 𝒙𝟐

𝒌 … 𝒙𝒍𝒌 … 𝒙𝒏

𝒌]

(7)

Además de los valores de entada se debe incluir la matriz T de datos consta de 𝒕𝒑𝒊

elementos, donde las 𝒑 columnas con 𝒑 ∈ {𝟏, 𝟐, … , 𝒐} indican el número de categorías en las

que se puede clasificar cada 𝒊-esimo individuo, y contienen los datos reales observados que

permitirán entrenar el modelo.

Page 22: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

22

T=

[ 𝒕𝟏𝟏 𝒕𝟐

𝟏 … 𝒕𝒑𝟏 … 𝒕𝒐

𝟏

𝒕𝟏𝟐 𝒕𝟐

𝟐 … 𝒕𝒑𝟐 … 𝒕𝒐

𝟐

⋮ ⋮ ⋱ ⋮ ⋱ ⋮𝒕𝟏𝒊 𝒕𝟐

𝒊 … 𝒕𝒑𝒊 … 𝒕𝒐

𝒊

⋮ ⋮ ⋱ ⋮ ⋱ ⋮𝒕𝟏𝒌 𝒕𝟐

𝒌 … 𝒕𝒑𝒌 … 𝒕𝒐

𝒌]

(8)

Los elementos de entrada en la matriz X se multiplican por la matriz de pesos WT,

con 𝒘𝒍𝒎 elementos donde 𝒎 es el número de los nodos ocultos 𝒎 ∈ {𝟏, 𝟐,… , 𝒉} y 𝒍 la

cantidad de nodos en la capa de entrada y 𝒍 ∈ {𝟎, 𝟏, 𝟐, … , 𝒏}.

W=

[ 𝑤0

1 𝑤11 𝑤2

1 … 𝑤𝑙1 … 𝑤𝑛

1

𝑤02 𝑤1

2 𝑤22 … 𝑤𝑙

2 … 𝑤𝑛2

⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮𝑤0

𝑚 𝑤1𝑚 𝑤2

𝑚 … 𝑤𝑙𝑚 … 𝑤𝑛

𝑚

⋮ ⋮ ⋮ ⋱ ⋮ ⋱ ⋮𝑤0

ℎ 𝑤1ℎ 𝑤2

ℎ … 𝑤𝑙ℎ … 𝑤𝑛

ℎ ]

h x n (9)

Con esto se construye la matriz XWT que consta del producto de la matriz de entrada

X por la matriz de pesos W transpuesta:

XWT=

[ ∑ (𝑥𝑙

1𝑤𝑙1)𝑛

𝑙=1 +𝑤01 ∑ (𝑥𝑙

1𝑤𝑙2)𝑛

𝑙=1 +𝑤02 … ∑ (𝑥𝑙

1𝑤𝑙𝑚)𝑛

𝑙=1 +𝑤0𝑚 … ∑ (𝑥𝑙

1𝑤𝑙ℎ𝑛

𝑙=1 )+𝑤0ℎ

∑ (𝑥𝑙2𝑤𝑙

1)+𝑤01𝑛

𝑙=1 ∑ (𝑥𝑙2𝑤𝑙

2)𝑛𝑙=1 +𝑤0

2 … ∑ (𝑥𝑙2𝑤𝑙

𝑚)𝑛𝑙=1 +𝑤0

𝑚 … ∑ (𝑥𝑙2𝑤𝑙

ℎ𝑛𝑙=1 )+𝑤0

⋮ ⋮ ⋱ ⋮ ⋱ ⋮∑ (𝑥𝑙

𝑖𝑤𝑙1)𝑛

𝑙=1 +𝑤01 ∑ (𝑥𝑙

𝑖𝑤𝑙2)𝑛

𝑙=1 +𝑤02 … ∑ (𝑥𝑙

𝑖𝑤𝑙𝑚)𝑛

𝑙=1 +𝑤0𝑚 … ∑ (𝑥𝑙

𝑖𝑤𝑙ℎ)𝑛

𝑙=1 +𝑤0ℎ

⋮ ⋮ ⋱ ⋮ ⋱ ⋮∑ (𝑥𝑙

𝑘𝑤𝑙1)𝑛

𝑙=1 +𝑤01 ∑ (𝑥𝑙

𝑘𝑤𝑙2)𝑛

𝑙=1 +𝑤02 … ∑ (𝑥𝑙

𝑘𝑤𝑙𝑚)𝑛

𝑙=1 +𝑤0𝑚 … ∑ (𝑥𝑙

𝑘𝑤𝑙ℎ)𝑛

𝑙=1 +𝑤0ℎ]

k x h (10)

Cada elemento de la matriz se evalúa en la función 𝑓 obteniendo así la matriz de

valores de activación 𝑠:

s= 𝛼 =

[ ∝1

1 ∝12 … ∝1

𝑚 … ∝1ℎ

∝21 ∝2

2 … ∝2𝑚 … ∝2

⋮ ⋮ ⋱ ⋮ ⋱ ⋮∝𝑙

1 ∝𝑙2 … ∝𝑙

𝑚 … ∝𝑙ℎ

⋮ ⋮ ⋱ ⋮ ⋱ ⋮∝𝑘

1 ∝𝑘2 … ∝𝑘

𝑚 … ∝𝑘ℎ]

k x h (11)

Page 23: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

23

Los valores de activación de la primera capa se usan como entradas para las neuronas

de la segunda capa, al multiplicarlos por una matriz de pesos 𝑣𝑝𝑚 donde 𝑚: corresponde al

número del nodo en la capa oculta y 𝑝: al número de nodos de la capa de salida, 𝑝 ∈

{1,2, … , 𝑜} y su valor indica el número de clases en que se clasifican los individuos.

V=

[ 𝑣1

1 𝑣21 … 𝑣𝑝

1 … 𝑣𝑜1

𝑣12 𝑣2

2 … 𝑣𝑝2 … 𝑣𝑜

2

⋮ ⋮ ⋱ ⋮ ⋱ ⋮𝑣1

𝑚 𝑣2𝑚 … 𝑣𝑝

𝑚 … 𝑣𝑜𝑚

⋮ ⋮ ⋱ ⋮ ⋱ ⋮𝑣1

ℎ 𝑣2ℎ … 𝑣𝑝

ℎ … 𝑣𝑜ℎ ]

h x o (12)

Multiplicando se obtiene:

𝑠𝑉 =

[ ∑ ∝1

𝑚 𝑣1𝑚ℎ

𝑚=1 ∑ ∝1𝑚 𝑣2

𝑚ℎ𝑚=1 … ∑ ∝1

1 𝑣𝑝𝑚ℎ

𝑚=1 … ∑ ∝1𝑚 𝑣𝑜

𝑚ℎ𝑚=1

∑ ∝2𝑚 𝑣1

𝑚ℎ𝑚=1 ∑ ∝2

𝑚 𝑣2𝑚ℎ

𝑚=1 … ∑ ∝2𝑚 𝑣𝑝

𝑚ℎ𝑚=1 … ∑ ∝2

𝑚 𝑣𝑜𝑚ℎ

𝑚=1

⋮ ⋮ ⋱ ⋮ ⋱ ⋮∑ ∝𝑖

𝑚 𝑣1𝑚ℎ

𝑚=1 ∑ ∝𝑖𝑚 𝑣2

𝑚ℎ𝑚=1 … ∑ ∝𝑖

𝑚 𝑣𝑝𝑚ℎ

𝑚=1 … ∑ ∝𝑖𝑚 𝑣𝑜

𝑚ℎ𝑚=1

⋮ ⋮ ⋱ ⋮ ⋱ ⋮∑ ∝𝑘

𝑚 𝑣1𝑚ℎ

𝑚=1 ∑ ∝𝑘𝑚 𝑣2

𝑚ℎ𝑚=1 … ∑ ∝𝑘

𝑚 𝑣𝑝𝑚ℎ

𝑚=1 … ∑ ∝𝑘𝑚 𝑣𝑜

𝑚ℎ𝑚=1 ]

k x o (13)

El resultado del producto entre los valores de activación de la primera capa y la matriz

de pesos en la segunda capa se agrega en las neuronas de la capa oculta de acuerdo con la

siguiente expresión:

𝑆𝑝𝑖 = 𝜎𝑝

𝑖 = 𝜎(∑ 𝛼𝑚𝑣𝑝𝑚ℎ

𝑚=1 ) (14)

𝜎 es una función de activación logística, con rango [0,1]:

𝜎(𝑥) =1

(1+𝑒𝑥) (15)

Con esto se obtiene la matriz S con 𝜎𝑜ℎ elementos donde ℎ corresponde al número de

nodos13 en la capa oculta y 𝑜 corresponde al número de nodos en la capa de salida.

13 Para definir el número de nodos en la literatura hay dos enfoques: el primero comienza con una red

mínima y se agregan más nodos solo cuando se necesitan para mejorar la capacidad de aprendizaje de la red.

El segundo enfoque comienza con una red de gran tamaño y en el momento de la poda se reducirán los nodos

ocultos y las conexiones entre la capa de la red.

Page 24: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

24

S= 𝜎 =

[ 𝜎1

1 𝜎21 … 𝜎𝑝

1 … 𝜎𝑜1

𝜎12 𝜎2

2 … 𝜎𝑝2 … 𝜎𝑜

2

⋮ ⋮ ⋱ ⋮ ⋱ ⋮𝜎1

𝑚 𝜎2𝑚 … 𝜎𝑝

𝑚 … 𝜎𝑜𝑚

⋮ ⋮ ⋱ ⋮ ⋱ ⋮𝜎1

ℎ 𝜎2ℎ … 𝜎𝑝

ℎ … 𝜎𝑜ℎ ]

k x h (16)

Una vez se cuenta con las salidas del modelo se calcula el error entre el dato

pronosticado 𝑆𝑝𝑖 y el dato real observado en el conjunto de entrenamiento 𝑡𝑝

𝑖 . Una tupla está

correctamente clasificada si la diferencia entre el dato observado y la salida del modelo son

menores a un número positivo 𝜂1 menor a 0.5 que cuantifica el margen de error admitido de

la siguiente forma:

max𝑝

|𝑒𝑝𝑖 | = max

𝑝|𝑆𝑝

𝑖 − 𝑡𝑝𝑖 | ≤ 𝜂1 (17)

Ahora bien, el objetivo de la fase de entrenamiento es obtener un conjunto de pesos

(w,v) que minimice el error entre la clase pronosticada y el dato real, haciendo que la red

clasifique correctamente las tuplas de entrada usando para el cálculo del error la función de

entropía cruzada:

𝐸(𝑤, 𝑣) = −∑ ∑ (𝑡𝑝𝑖 𝑙𝑜𝑔𝑆𝑝

𝑖 + (1 − 𝑡𝑝𝑖 )𝑙𝑜𝑔𝑆𝑝

𝑖 )𝑜𝑝=1

𝑘𝑖=1 (18)

Seleccionada por la rápida convergencia al momento de minimizarla y puede sustituir

la ampliamente usada suma de residuales al cuadrado que es computacionalmente costosa. A

este error se le suma un término de penalti P(w,v) frecuentemente incluido en la literatura al

momento de podar la red neuronal.

𝑃(𝑤, 𝑣) = 𝜖1 (∑ ∑𝛽(𝑤𝑙

𝑚)2

1 + 𝛽(𝑤𝑙𝑚)2

𝑛

𝑙=1

𝑚=1

+ ∑ ∑𝛽(𝑣𝑝

𝑚)2

1 + 𝛽(𝑣𝑝𝑚)2

𝑜

𝑝=1

𝑚=1

)

+ 𝜖2 (∑ ∑(𝑤𝑙𝑚)2

𝑛

𝑙=1

𝑚=1

+ ∑ ∑(𝑣𝑝𝑚)2

𝑜

𝑝=1

𝑚=1

) (19)

De acuerdo con Setiono (1997) inicialmente en estos modelos solo se incluía la

segunda componente del termino de penalti. El valor 𝜖2 es una pequeña constante de

Page 25: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

25

decaimiento positivo Hinton (1989) que se multiplica por un factor que eleva los pesos w y

v al cuadrado desestimulando las ponderaciones que toman valores grandes. Si las

aproximaciones de segundo orden de la función de error son usadas para encontrar para

encontrar un mínimo local de la función de error, la suma de este término cuadrático

contribuye a la estabilidad del proceso de entrenamiento. Esta componente del termino de

penalti le suma 𝜖2 a la diagonal de la segunda derivada de la matriz de la función de error.

Con esta modificación, es más probable que la matriz sea definida positiva, y, por lo tanto,

una dirección descendente puede ser obtenida.

Sin embargo, existen algunos problemas cuando se usa el método de propagación

hacia atrás del error para entrenar la red al usar solamente la segunda componente de (19).

La suma de este término causará que todos los pesos decaigan exponencialmente a cero a la

misma tasa (Hanson & Pratt 1989), este término también provocará que

desproporcionalmente se penalicen pesos grandes.

Ahora bien, al analizar la primera componente del termino en la ecuación (19) se tiene

una función 𝑓(𝑤) = 𝑤2/(1 + 𝑤) que toma un valor pequeño cuando 𝑤 es cercano a cero y

se acerca a 1 cuando el valor de 𝑤 es muy grande. De tal forma que puede ser considerado

como la medida total de los pesos diferentes a cero en la red. La derivada de la función

𝑓′(𝑤) = 2𝑤/(1 + 𝑤2)2 indica que el entrenamiento de propagación hacia atrás del error

afectará poco por la adición del segundo término en la ecuación.

Seleccionar los valores adecuados para la tasa de aprendizaje del método de

propagación hacia atrás del error y para 𝜖1 causará que los pesos pequeños decrezcan a una

tasa mayor que los pesos grandes. Una desventaja de solo usar el primer la primera

componente del termino de penalti es que no tiene distinción alguna entre pesos grandes y

pesos muy muy grandes.

Durante la etapa de poda es imperativo prevenir la aparición de los pesos muy grandes

y al mismo tiempo incentivar a los pesos muy pequeños para que caigan rápidamente a cero.

Para alcanzar esa meta, se incluyen las dos componentes en el termino de penalización como

se muestra en la ecuación (19). Donde los valores de 𝜖1 y 𝜖2 deben ser mayores a cero y

deben reflejar la importancia relativa de la precisión de la red versus su complejidad.

Page 26: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

26

Una vez definidos el valor del error y el termino de penalti, se da inicio a la fase de

entrenamiento que comienza con un conjunto inicial de pesos (𝑤, 𝑣)(0) e iterativamente

actualiza sus pesos para minimizar 𝐸(𝑤, 𝑣) + 𝑃(𝑤, 𝑣). Cualquier algoritmo de minimización

puede ser usado para ese propósito; sin embargo, para reducir el tiempo de entrenamiento de

la red, factor importante en la minería de datos, se usó el método BFGS (Dennis & Schnabel

1983). El entrenamiento de la red termina cuando se alcanza un mínimo local de la función

𝐸(𝑤, 𝑣) + 𝑃(𝑤, 𝑣) con un valor de error tolerado y el gradiente de la función es

suficientemente pequeño.

3.3 Poda de la red

Al final del proceso de entrenamiento se cuenta con una red completamente

conectada, con un número amplio de conexiones en la red. Con 𝑛 nodos de entrada, ℎ nodos

ocultos y 𝑚 nodos de salida, entonces tenemos ℎ(𝑚 + 𝑛) conexiones. La fase de poda

intenta remover conexiones sin afectar el ajuste para simplificar la extracción de reglas y

dado que Setiono (1994) prueba que una red completamente entrenada para clasificar una

tupla 𝑥𝑖 con la condición (17) satisfecha, permite definir 𝑤𝑙𝑚 igual a cero sin deteriorar el

ajuste total de la red si se cumplen la condiciones |𝑣𝑝𝑚 ∗ 𝑤𝑙

𝑚| ≤ 4𝜂2 y 𝜂1 + 𝜂2 < 0.5, así la

red puede continuar clasificando correctamente la tupla 𝑥𝑖. De igual manera si max𝑝

|𝑣𝑝𝑚| ≤

4𝜂2 entonces 𝑣𝑝𝑚 puede ser removido de la red (ver Figura 5).

Una vez aplicado el algoritmo sobre la red neuronal resultante de la fase de

entrenamiento, se cuenta con una versión simplificada de esta que cuenta con menos

conexiones en la primera y segunda capa, optimizando los procesos de cálculo y la

complejidad de la red.

3.4 Extracción de reglas

Después de la etapa de poda existen un par de dificultades adicionales que se deben

afrontar. En primer lugar, cada nodo ∝𝑙𝑚 tiene n conexiones con valores binarios {0,1} lo

cual se traduce en 2𝑛 posibles patrones de entrada diferentes, haciendo muy compleja la

extracción del conjunto de reglas incluso para valores pequeños de n. En segundo lugar, los

valores de activación de la capa oculta pueden ser cualquier número real que tome un valor

Page 27: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

27

en el intervalo [-1,1], por lo tanto, al hacer este ejercicio con una cantidad significativa de

datos, los valores de activación son prácticamente continuos dificultando la generación de

reglas para encontrar la relación entre los valores de activación de la capa oculta y los valores

entregados por la capa de salida del modelo.

Ante estas dificultades los autores del Neurorule proponen el uso del Algoritmo de

extracción de Reglas RX (ver Figura 6).

El primer paso del algoritmo inicia ejecutando un clúster de los valores de activación

igualando 𝜕 al vector ∝l𝑚 y agrupándolos nodos discretos, es decir, se sustituyen los valores

de activación continuos en [-1,1] por un número reducido de nodos que deben mantener el

nivel de ajuste de la red, pero que al tiempo simplifican la extracción de reglas.

Para ahondar en el detalle de la explicación del algoritmo de clúster es necesario

entender sus variables y su función. Formalmente, las variables se pueden definir como: D

igual al número de valores de activación discretos en la capa oculta del nodo, 𝜕 igual a la

matriz ∝. Para primer patrón en el conjunto de entrenamiento se establece un valor inicial 𝛼11

, la variable 𝐻𝑗 corresponde al centro del intervalo que determina el nodo de activación, la

variable count almacena el número de valores de activación ∝l𝑚 agrupados en el clúster y la

variable sum permite acumular la suma de los valores de activación.

Para ilustrar este punto recurriremos a un sencillo ejemplo donde se cuenta con seis

valores de activación distintos ∝11, ∝2

1,…, ∝61 .

Figura 7. Ejemplo de discretización de valores de activación vía clúster

En la Figura 7 se toma 𝜕 igual al primer vector de elementos de la matriz 𝛼 definiendo

𝑚 = 1, posteriormente se asigna el primer centro del intervalo 𝐻1 igual al primer valor de

Page 28: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

28

activación ∝11 , la variable count del intervalo y la variable D se inician en 1 y la variable

sum es igual al valor de activación ∝11 . Luego se evalúa si ∝2

1 se encuentra en (𝐻1 − 𝜀, 𝐻1 +

𝜀), según la Figura 7, ∝21 pertenece a él y por estar allí se incrementa variable count =2 y se

suma el valor ∝21 a la variable sum quedando igual a ∝1

1+ ∝21, así se acumulan los valores de

activación que se encuentran en intervalo alrededor de 𝐻1. En la siguiente iteración se toma

el valor ∝31 y según la Figura 7 se encuentra por fuera del intervalo (𝐻1 − 𝜀, 𝐻1 + 𝜀) y como

no está incluido se crea un nuevo centro 𝐻2 igual a ∝31 que se indexa con a variable D igual

a 2, construyendo el intervalo (𝐻2 − 𝜀, 𝐻2 + 𝜀), que cuenta con sus propias variables count=1

y sum=∝31. El algoritmo de clúster continua así sucesivamente creando nuevos intervalos de

ancho 𝜀 cuando un valor de activación no se encuentra incluido en los existentes, y en caso

contrario, agrupa los valores ∝k1 en la variable sum y lleva el conteo de los nodos en la

variable count. El proceso se repite sucesivamente hasta evaluar todos los valores de

activación, contando los valores de activación en cada intervalo en las variables count y

sumando en las variables sum. Una vez completado se toma el promedio de los valores de

activación de cada intervalo aplicando la operación H=sum/count, para posteriormente

reemplazar los valores originales ∝l𝑚 por los nuevos valores discretos H = ∝𝑐 𝑙

𝑚, verificando

que no se altere significativamente el nivel de ajuste de la red.

El segundo paso del algoritmo es “Enumerar los valores de activación discretizados

y calcule la salida de la red. Generar reglas que tengan perfecta cobertura de las tuplas para

los nodos de activación que permitan las salidas del modelo”, lo cual se traduce en encontrar

las reglas que a partir de los valores de activación generan las salidas esperadas usando el

algoritmo de extracción de reglas X2R propuesto por Liu & Tan (1995) (ver Figura 8).

Por ejemplo, en Neurorule, los autores ilustran la aplicación del algoritmo a través de

la Tabla 3 con los valores de activación 𝛼1, 𝛼2 y 𝛼3 y las correspondientes salidas del modelo

𝑆1 y 𝑆2 el cual resulta en las reglas descritas en la Tabla 4.

Tabla 3. Valores de activación y salidas Neurorule

𝛼1 𝛼2 𝛼3 𝑆1 𝑆2

-1 1 -1 0.92 0.08

Page 29: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

29

-1 1 1 0.00 1.00 -1 1 0.24 0.01 0.99 -1 0 -1 1.00 0.00 -1 0 1 0.11 0.89 -1 0 0.24 0.93 0.07 1 1 -1 0.00 1.00 1 1 1 0.00 1.00 1 1 0.24 0.00 1.00 1 0 -1 0.89 0.11 1 0 1 0.00 1.00 1 0 0.24 0.00 1.00

0 1 -1 0.18 0.82 0 1 1 0.00 1.00 0 1 0.24 0.00 1.00 0 0 -1 1.00 0.00 0 0 1 0.00 1.00 0 0 0.24 0.18 0.82

Tabla 4. Reglas de clasificación para los valores de activación de Neurorule

Regla

R1 𝜶𝟐 = 𝟎 ∧ 𝜶𝟑 = −𝟏 => 𝑺𝟏=1 𝑺𝟐=0

R2 𝜶𝟏 = −𝟏 ∧ 𝜶𝟐 = 𝟏 ∧ 𝜶𝟑 = −𝟏 => 𝑺𝟏=1 𝑺𝟐=0

R3 𝜶𝟏 = −𝟏 ∧ 𝜶𝟐 = 𝟎 ∧ 𝜶𝟑 = 𝟎. 𝟐𝟒 => 𝑺𝟏=1 𝑺𝟐=0

En otro caso => 𝑺𝟏=0 𝑺𝟐=1

En el tercer paso consiste en aplicar el algoritmo de extracción de reglas X2R pero

esta vez entre los valores de entrada en la matriz X, y los nodos de activación.

El cuarto y último paso consiste en “Generar reglas que relacionen los valores de

entrada y los valores de salida, por sustitución de las reglas encontradas en los pasos

anteriores”, es decir, conectar lógicamente las reglas encontradas en el paso dos y el paso tres

del algoritmo para generar las reglas definitivas del modelo.

4. Aplicación de redes neuronales a un problema de economía de la

información: Identificación de empresas fraudulentas en el Ramo de Riesgos

Laborales

Page 30: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

30

4.1 Economía de la información y fraude en seguros

El negocio de seguros consiste en el pago de una prima riesgo, es decir, una suma de

dinero que un agente tomador de decisiones adverso al riesgo con una función de utilidad

dada, está dispuesto a pagar por encima de la pérdida esperada (valor actuarial de la prima)

para evadir un riesgo dado 14, las transacciones de este tipo de contratos no son recientes ya

que según Vaughan (1997) existieron en las antiguas civilizaciones china y babilónica; sin

embargo el análisis económico moderno del mercado de asegurador inicia a principios de los

años sesenta con la publicación de múltiples artículos de Kenneth Arrow y Karl Borch,

(Arrow, 1963, 1965; Borch, 1960, 1961, 1962), convirtiendo Arrow en el pionero en el

desarrollo de la economía de la incertidumbre, información y comunicación (Dionne &

Harrington 2014).

Uno de los conceptos introducidos (Arrow 1963) es que el riesgo rara vez se puede

intercambiar completamente en un mercado sin importar cuál sea, y que tres de las principales

razones de esta limitación son: el riesgo moral, la selección adversa y los costos de

transacción. Pero, para comprender esta afirmación, es necesario ir a las definiciones.

La selección adversa que es definida como la situación en la que el asegurado posee

información que, de ser conocida por el asegurador, afectaría las reglas del contrato, o

incluso, la realización del mismo10. El Riesgo moral entendido por Krugman (2009) es

"cualquier situación donde una persona decide cuanto riesgo tomar mientras que alguien más

paga el costo si las cosas salen mal". Proviene de la incapacidad de las empresas aseguradoras

para observar las decisiones al asumir riesgos de sus asegurados y de la su propensión a

consumir a servicios innecesarios. Ahora bien existen dos tipos de riesgo moral, el riesgo

moral ex ante que se refiere a la desmotivación en la prevención que genera la existencia del

contrato de seguros; es decir, al no verse afectado el nivel de riqueza del tomador ante la

ocurrencia de un siniestro, este no percibe los costos y beneficios de la prevención15 y el

riesgo moral ex pos se entiende como la incapacidad de las compañías para observar el

14 Según Fasecolda prima es: El precio pactado por el seguro contratado. Es la remuneración que recibe

la aseguradora para hacerle frente a los riesgos que está amparando en la póliza y es la contraprestación que

está obligando a ambas partes a cumplir con lo establecido en el contrato. Es el pago que se hace por adelantado

para iniciar el contrato de seguro y en ocasiones puede ser demandada legalmente cuando la aseguradora ha

iniciado la cobertura en ciertos riesgos. 15 De la Espriella 2012 .

Page 31: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

31

comportamiento de sus asegurados después de ocurrido el siniestro, convirtiéndose en el

principal determinante de la existencia de hechos delictivos (De la Espriella, 2012).

En resumen, existen tres factores clave en el proceso de aseguramiento con presencia

de las asimetrías de información, el primero es que, durante la adquisición de la póliza, el

asegurado puede omitir datos al asegurador que impedirían la realización del contrato de

seguros. El segundo, que el asegurado después de adquirir la póliza puede cambiar su

comportamiento ex ante frente a la prevención el contrato de seguros que mitigará la pérdida

económica y el tercer elemento, es que el asegurado puede incurrir en actividades

fraudulentas expos reportando siniestros inexistentes o buscando que el monto pagado por la

aseguradora sea mayor al monto realmente perdido, siendo así en la adquisición de la póliza

y en el pago de siniestros donde se pueden presentar comportamientos fraudulentos.

Según el estudio del Programa de las Naciones Unidas para el Desarrollo (2011),

debido al fraude se pierden 5.59% del total de los gastos del sector de la salud en todo el

mundo que, según cálculos de la OMS, es aproximadamente de $260 billones de dólares.

Para el caso de Estados Unidos, la Oficina de Contaduría Nacional o General

Accounting Office de reportó gastos anuales en cuidado cercanos a los dos trillones de

dólares. Equivalente al 15.3% del PIB Norteamericano. En el año 2007 según la Asociación

Nacional de Cuidado de la Salud Anti fraude (NHCAA) por sus siglas en inglés, el valor

estimado de gastos por fraude en el sistema de salud asciende a $68 billones, es decir 3% del

gasto en salud en Estados Unidos de acuerdo con Li, Huang, Jin & Shi (2008).

De la Espriella (2012) menciona que tanto las compañías de seguros, como la

sociedad, se ven afectadas por el fraude. En el intento por combatir esta problemática, las

compañías asumen costos relacionados con unidades investigativas y capital humano para

realizar auditorías, incrementando los costos en términos de salario e insumos, traduciéndose

en sobrecostos que se trasladan a las tarifas incrementando el valor de la prima. Con un mayor

precio se genera menor cobertura de los servicios de aseguramiento a la población incapaz

de pagar los valores con sobrecostos.

Para reducir el riesgo moral ex ante y seleccionar los agentes que cumplen con las

condiciones para la toma del seguro, los investigadores desarrollaron teorías orientadas a la

Page 32: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

32

construcción de contratos óptimos que permitan que los agentes se auto seleccionen en su

correspondiente clase (Derring 2002), para reducir el riesgo moral expos existen aplicaciones

como: Viaene, Derrig, Baesens & Dedene, G., (2016) que aplican las técnicas de

clasificación: regresión logística, C4.5 árbol de decisión, k- vecinos más cercanos, red

neuronal perceptron multicapa, Bayes nativo, entre otros, con el objetivo de detectar fraude

en las reclamaciones de seguros de automóviles. A partir de indicadores de banderas rojas se

señalaron automáticamente los reclamos con mayor posibilidad de ser fraudulentos. Los

trabajos de (Derrig & Ostaszewski 2016), (Liu & Tan 1995) y (Artı́s, Ayuso & Guillén 1999)

también son un referente en esta materia de fraude en seguros vehiculares.

Para el aseguramiento de salud Derrig (2002) propone un mecanismo sistémico para

la detección de fraude, que ordena eficientemente las reclamaciones en categorías para

descartar rápidamente los casos no sospechosos, por su parte He et al. (1997) proponen un

modelo de redes neuronales de clasificación Perceptrón Multicapa para identificar perfiles

riesgosos a partir reglas de expertos, estableciendo un ranking de cuatro clases que van desde

una conducta normal hasta perfiles anormales, en cuanto a aseguramiento de salud también

se puede consultar a: (Major & Riedingerl 2016), (Brockett, Xia & Derrig 2016) y (Belhadji

E.B., Dionne G., & Tarkhani F. 2000) .

Con la implementación de estos métodos los expertos buscan reducir los costos por

fraude asociados a los seguros, enfocando a los especialistas en la investigación de los casos

con mayor probabilidad de ser fraudulentos, reduciendo significativamente los costos de

auditoria y descartando rápidamente los casos que no son objeto de análisis para incrementar

la satisfacción del cliente.

4.2 Empresas fraudulentas en el Sistema de General de Riesgos Laborales

Los servicios de salud y cuidado personal son temas que afectan a todas las personas

porque las enfermedades y lesiones afectan la forma de vivir, la capacidad para contribuir al

bienestar de la familia, el ser un miembro productivo en la fuerza de trabajo y, por ende, a la

economía del país. El Estado Colombiano ha venido formalizando el mercado laboral

Page 33: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

33

buscando la cobertura necesaria para los trabajadores, lo que conlleva a la protección de los

riesgos derivados de este.

Todo ejercicio laboral, sin importar el grado de complejidad, expone a los

trabajadores a un riesgo que puede afectar su desempeño físico y mental. Tanto para

accidentes, como para enfermedades consecuencia de su actividad, las empresas y los

empleados deben estar protegidos en asistencia médica y a través de indemnizaciones que les

permitan dar cobertura a los servicios de salud y seguir cubriendo las necesidades del hogar.

El Sistema de Riesgos Laborales (SGRL), es la entidad creada con el objetivo de

proteger el capital humano del país de los riegos laborales, fue establecido a partir de la ley

100 de 1993, con el decreto legislativo 1295 de 1994 y la ley 776 de 2002, trajo al país

importantes cambios en uno de los aspectos más significativos de la Seguridad Social, como

es el de la protección contra los riesgos propios del trabajo. La legislación define al sistema

de Riesgos Profesionales como: "un conjunto de entidades públicas y privadas, normas y

procedimientos, que tiene la finalidad de prevenir, proteger y atender las consecuencias que

se derivan de los Riesgos Profesionales, es decir, de los accidentes y las enfermedades que

puedan padecer las personas por causa o con ocasión del trabajo".

Las funciones de las administradoras de Riesgos Laborales son: 1. Afiliar los

trabajadores al Sistema de Riesgos Laborales. 2. Recaudar a través de PILA (Planilla

Integrada de Liquidación de Aportes) el control de la correcta autoliquidación y pago. 3.

Garantizar a sus afiliados la prestación de los servicios asistenciales de salud a los cuales

tiene derecho. 4. Garantizar a sus afiliados el reconocimiento y pago oportuno de las

prestaciones económicas. 5. Realizar actividades de prevención, asesoría y evaluación de

Riesgos Laborales. 6. Promover y divulgar programas de medicina laboral, higiene industrial,

salud ocupacional y seguridad.

El mercado de ARL vendió en el año 2015 $2.89 billones de pesos (COL) con cierre

a diciembre de 2015, mostrando un crecimiento del 11% respecto al año 2014. El pago por

siniestros a los afiliados al sistema en 2015 fue cercano a 1.12 Billones de pesos, según

registros en Fasecolda.

Page 34: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

34

Las compañías de seguros implementan programas de promoción y prevención con

costos cercanos a los 667 mil millones de pesos, con el fin de evitar todo tipo de enfermedades

laborales, con el fin de proteger el capital humano y físico de las compañías. Por otra parte,

las aseguradoras, usualmente las de vida son un jugador importante en el mercado de

inversión local, con sumas alrededor de 26.2 billones de pesos.

La Tabla 5 muestra la evolución del sistema de riesgo laborales desde el año 2009

hasta el año 2015, reflejando año a año un aumento en el número de trabajadores afiliados a

una ARL, el cual tiene una correlación positiva con el número de accidentes de trabajo. En

cuanto al número de indemnizaciones pagadas se vieron ciertos incrementos significativos

en el año 2012 y 2014.

Tabla 5. Cifras Sistema de Riesgos Laborales

Fuente: Fasecolda

Dentro de las explicaciones de este crecimiento se evidencia el ciclo económico que

está viviendo Colombia, reflejando caídas significativas en las tasas de desempleo en los

últimos años. Lo cual tiene una correlación negativa con el número de trabajadores afiliados.

AÑOTotal Trabajadores

Afiliados a una ARL%

N accidentes de

Trabajo Calificado%

NRO. ENF.

PROF.

CALIF.

%

TOT.

INDEM IPP

PAGADAS

%

2009 6.707.433 - 34.645 - 585 - 1.007 -

2010 6.820.835 1,69% 37.454 8,11% 634 8,38% 927 -7,94%

2011 7.851.817 15,12% 43.853 17,08% 646 1,89% 809 -12,73%

2012 8.093.537 3,08% 42.354 -3,42% 699 8,20% 1.047 29,42%

2013 8.434.876 4,22% 54.307 28,22% 721 3,15% 957 -8,60%

2014 8.995.618 6,65% 55.334 1,89% 755 4,72% 1.290 34,80%

2015 9.546.636 6,13% 56.437 1,99% 892 18,15% 1.308 1,40%

Tabla 1

Sistema de Riesgos Laborales 2009 - 2015

Page 35: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

35

Figura 9. Tasa de desempleo versus número de trabajadores afiliados a ARL

Fuente: Fasecolda y Dian.

La prestación de los servicios del Sistema de Riesgos Laborales es importante para la

protección de la salud de los trabajadores, la estabilidad económica de sus familias y de sus

empleadores; motivo por el cual la sostenibilidad del sistema es un elemento central; sin

embargo, esta se ha visto seriamente impactada por la afiliación de empresas ilegales.

Según la Federación de Aseguradores Colombianos (Fasecolda), existe preocupación

en el Sistema de Seguridad Social Integral por el incremento desproporcionado e ilegal de

empresas o personas naturales que, sin tener la condición de empleadores, ofrecen realizar la

afiliación a todas las entidades de seguridad social, ya sea para Administradoras de Riesgos

Laborales (ARL), Empresas Prestadoras de Salud (EPS), Administradoras de Fondos de

Pensión y cajas de compensación Familiar.

Las empresas fraudulentas operan, afiliándose a una ARL con una actividad

económica muy general y proceden a vincular física o electrónicamente a las personas que

lleguen a sus instalaciones. Dado que el recaudo de la cotización a las ARL se hace a mes

vencido, estas empresas hacen la afiliación según el procedimiento normal y en la novedad

del mes siguiente aplican el Retiro por PILA, dejando el registro de uno o dos días de

afiliación sin que el trabajador se entere, de esta forma el trabajador paga el mes completo y

ellos toman la fracción restante.

Page 36: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

36

Usualmente las reglas de negocio para detectar esta situación duran un buen tiempo

en ser analizadas por los expertos en el tema, además las empresas fraudulentas evolucionan

a un ritmo más acelerado.

El objetivo en esta sección del trabajo es distinguir el tipo de empresas fraudulentas

de las no fraudulentas a partir de sus variables explicativas antes de ingresar a la compañía

de seguros, mediante un modelo de Redes Neuronales Perceptrón Multicapa a través de un

conjunto de datos de entrada disponibles al momento de afiliar la empresa, será capaz de

ajustar los pesos de cada dato de entrada con el fin de memorizar la salida deseada, y así

extraer unas reglas que logren identificar este tipo de empresas.

4.3 Selección de la muestra

En esta sección se efectúa una aplicación de la Red Neuronal con poda y extracción

de reglas al campo economía de la información, específicamente a la detección de empresas

fraudulentas en el sistema de riesgos laborales.

La información fue suministrada por una compañía de seguros, proviene de bases de

datos que almacenan los campos del formulario de afiliación e información de verificaciones

realizadas en campo para la detección de empresas que inicialmente eran sospechosas de ser

fraudulentas y posteriormente fueron confirmadas como tal a través de un proceso de

investigación.

La simulación realizó en un computador de escritorio, lo cual se convirtió en una

restricción en la capacidad de cálculo para la ejecución del modelo y por lo tanto se optó por

aplicarlo a una muestra de datos16 con corte al mes de diciembre de 2015. La población era

superior a 10.000 empresas afiliadas, entonces fue posible usar la fórmula:

𝑛 =𝑍2∗𝑝∗(1−𝑝)

𝑒2 (19)

para determinar el tamaño de la muestra con el que se debe trabajar (Aguilar 2005).

El parámetro Z corresponde a la desviación del valor medio que se acepta para lograr el nivel

16 La aplicación del algoritmo a una porción de los datos es una aplicación de minería de datos, para

poder aplicar los elementos de Big Data a este problema se requiere de una arquitectura tecnología que

soporte la cantidad de datos.

Page 37: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

37

de confianza deseado, por lo tanto, se eligió Z= 2,575 para contar con un nivel de confianza

del 99%. El parámetro p corresponde a la proporción que se espera encontrar, al no tener

información, la literatura recomienda que sea 50%. Finalmente 𝑒 corresponde al margen de

error máximo admitido que, para el caso es 5%. A partir de estos parámetros se obtiene una

muestra n=663 empresas.

Una vez determinado el tamaño, se aplicó la selección de empresas por medio del

método de muestreo aleatorio estratificado por sector económico de acuerdo a lo aplicado

por Misas & López (2009) y luego el conjunto se dividió en dos: el conjunto de entrenamiento

con 70% de empresas y el conjunto de pruebas con 30% de las empresas, conforme a lo

planteado por Villamil (2009).

Existen muchas definiciones de fraude y de acuerdo con la que resulte elegida, pueden

variar los ejercicios de estimación, ver: (De La Espriella 2012), (Weisberg & Derrig 1998) y

Circular Externa 041 de 2007 capítulo XXIII de la Superintendencia Financiera de

Colombia17.

Para este ejercicio se definió una empresa fraudulenta como: empresas con

inconsistencias entre la actividad económica y los centros de trabajo, versus los registros de

cargos u oficios que tienen sus trabajadores. Además, estas empresas están confirmadas por

los procesos de auditoria como empresas agrupadoras o intermediadoras laborales que no

cuentan con permisos habilitados por la autoridad competente.

Tabla 6. Muestra estratificada de empresas

Pruebas Entrenamiento

Sector económico No Fraudulenta Fraudulenta No Fraudulenta Fraudulenta

Actividades inmobiliarias 16 16 27 47

17 Referente a las reglas relativas a la administración del Riesgo Operativo, en los numerales 2.6.1.1 y

2.6.1.2 se definen dos conceptos: Fraude Interno y Fraude Externo. El primero consiste en: "Actos que de forma

intencionada buscan defraudar o apropiarse indebidamente de activos de la entidad o incumplir normas o leyes,

en los que está implicado, al menos, un empleado o administrador de la entidad." Y el segundo como: "Actos,

realizados por una persona externa a la entidad, que buscan defraudar, apropiarse indebidamente de activos de

la misma o incumplir normas o leyes". El Código penal colombiano utiliza la estafa para referirse a esta

conducta, mencionada en el Artículo 246. Estafa: “El que obtenga provecho ilícito para sí o para un tercero,

con perjuicio ajeno, induciendo o manteniendo a otro en error por medio de artificios o engaños, incurrirá en

prisión de treinta y dos (32) a ciento cuarenta y cuatro (144) meses y multa de sesenta y seis punto sesenta y

seis (66.66) a mil quinientos (1.500) salarios mínimos legales mensuales vigentes”.

Page 38: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

38

Administración publica 1 0 0 5

Agricultura, ganadería 8 1 30 0

Comercio 50 3 77 3

Construcción 13 1 34 13

Educación 2 0 10 0

Hoteles y restaurantes 9 0 16 1

Intermediación financiera 4 1 0 3

Manufactura 10 1 40 5

Minero 1 0 4 0

Otras de servicios 0 6 1 19

Pesca 0 0 1 0

Servicio domestico 45 0 88 0

Servicios sociales y de salud 5 2 15 0

Suministros de electricidad,

gas y agua

0 0 2 0

Transporte 4 1 15 7

TOTAL 168 32 360 103

Al seleccionar las variables la literatura indica que en lo referente a la detección de

fraude se suelen utilizar datos asociados al perfil del cliente y sus transacciones. Dado que el

fin es detectar las empresas irregulares antes de que estas ingresen a la aseguradora, se

utilizan las variables del perfil del cliente sin sus transacciones.

4.4 Variables explicativas y datos del modelo

Las variables seleccionadas fueron las siguientes: 1. Los departamentos de Colombia

que se mencionan en la Tabla 13, 2. La naturaleza de la empresa, que hace referencia a si es

pública o privada en la Tabla 14, 3. El tipo de documento de la empresa: cédula de

ciudadanía, cédula de extranjería, pasaporte o NIT en la Tabla 15. 4. Las clases de riesgos18

18 En el momento de la vinculación de una empresa a una ARL, ésta asignará una tarifa de acuerdo con

la actividad principal de la empresa y a la exposición a los factores de riesgo. Para ello se han determinado

cinco clases de riesgo para las actividades económicas de las empresas: Clase I, de Riesgo Mínimo, Clase II,

de Riesgo Bajo, Clase III, de Riesgo Medio. Clase IV, de Riesgo Alto y Clase V, de Riesgo Máximo.

Page 39: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

39

definidos en Colombia que van del 1 al 5 en la Tabla 16, 5. El listado de actividades

económicas19 seleccionadas en la muestra y su correspondiente código CIIU20 en la Tabla

17, 6. Un rango del número de trabajadores, 7. Un rango del valor de la nómina de la empresa,

8. Una columna que indica si la empresa en cuestión es fraudulenta o no de acuerdo con los

datos proporcionados por la ARL donde se marcaron estas empresas como fraudulentas.

Siguiendo a Hongjun Lu, Rudy Setiono y Huan Liu (1995) de acuerdo a los ejemplos

en las secciones (1) y (2) para facilitar la extracción de las reglas en la fase final, se discretizan

las variables explicativas del modelo de forma tal que queden con valores 1 y 0, por ejemplo

si se tiene la variable categórica clase de riesgo con las opciones: 1,2,3,4 y 5, y una empresa

corresponde a la clase de riesgo 1 esta se codifica {00001}, en el caso 2 {00010} y así hasta

llegar al caso 5 codificado {10000}, para el caso de las variables cuantitativas como el salario

y el valor de la nómina, se codifican también con 1 los valores menores o iguales al intervalo

en cuestión de acuerdo a lo descrito en la sección 3.1, tal forma que el esquema de

codificación de las variables es:

Tabla 7. Determinación de intervalos por variable

A esa tabla se adiciona un vector de unos al principio para encontrar el intercepto, y

dos intervalos que indican a que clase pertenece la empresa t1= No fraudulenta, t2=

Fraudulenta

19 Se entiende como un proceso o grupo de operaciones que combinan recursos tales como equipo,

mano de obra, técnicas de fabricación e insumos, para la producción de bienes y servicios. 20 Es un sistema lingüístico de la Clasificación Industrial Internacional Uniforme de todas las

actividades económicas en la cual se presenta ordenada y jerárquicamente las actividades económicas en el país,

su descripción y aplicabilidad estadística y su relación con el ámbito internacional. El código de cuatro dígitos

define la clase de la actividad económica contenida en la tabla de clasificación en el Sistema General de Riesgos

Laborales.

Page 40: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

40

1.5 Entrenamiento

De acuerdo con lo descrito en la sección 3.2 el entrenamiento es un proceso iterativo

que consiste encontrar los pesos 𝑤 y 𝑣 que minimizan la función 𝐸(𝑤, 𝑣) + 𝑃(𝑤, 𝑣) y para

iniciarlo es necesario definir los parámetros adecuados, que inciden sobre la arquitectura de

la red (número de nodos en ambas capas) y los niveles de tolerancia para su calibración cada

una de las tres etapas: entrenamiento, poda y extracción de reglas.

Se determinaron h=3, nodos en la capa oculta porque con un número inferior, se

reducía el nivel de ajuste del modelo y para un número superior se incrementaban

significativamente las reglas de clasificación. En la capa de salida se eligieron dos nodos,

o=2 puesto que se busca clasificar entre dos atributos, empresas fraudulentas y empresas no

fraudulentas.

En la fase de entrenamiento se iteraba mientras que el nivel de ajuste del modelo se

mantenía superior al 80%, a su vez, cada vez que se ejecutaba el programa de entrenamiento

se tomaron 40 iteraciones del método BFGS para minimizar la función objetivo, los

resultados empíricos de ajuste del modelo mostraron que el número de iteraciones en BFGS

es más relevante que la iteración completa de entrenamiento de la red.

En el término de penalti se eligió 𝛽 = 1 , este parámetro es un factor de escalamiento

de 𝑤𝑙𝑚 y 𝑣𝑝

𝑚 para el primer término de la función de penalti, este valor se definió igual a uno

dado que no fue necesario incrementarlo para alcanzar un nivel de ajuste adecuado del

modelo, por el contrario, al aumentar el valor a 𝛽 = 10 Setiono (1997) disminuyó la

capacidad de ajuste de la red, también los valores 𝜖1 = 1 y 𝜖2 = 1 se dejaron iguales a uno

al no contar con evidencia acerca sobre a cual elemento de 𝑃(𝑤, 𝑣) tenía mayor importancia

en la solución final.

Una tupla se considera correctamente clasificada si max𝑝

|𝑆𝑝𝑖 − 𝑡𝑝

𝑖 | ≤ 𝜂1, para la

simulación de datos se eligió 𝜂1 =0.4, es decir la diferencia entre la salida de la red y el valor

observado en valor absoluto es menor a 0.4 se considera un resultado aceptable, es decir se

asigna la clasificación al 𝑆𝑝𝑖 de mayor valor. De acuerdo con estos parámetros clasificó

correctamente en la fase de entrenamiento el 90.9% de los datos al encontrar que las matrices

Page 41: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

41

W y V minimizan el termino 𝐸(𝑤, 𝑣) + 𝑃(𝑤, 𝑣), lo cual corresponde a un buen nivel de

ajuste del modelo.

4.6 Poda

En la fase de poda se eliminan los valores redundantes en la red facilitando la

extracción de reglas en esta fase. El parámetro 𝜂2 es fundamental, a medida que su valor se

incrementa, son removidos más elementos de la red, pero su nivel de ajuste disminuye; por

otra parte, si el valor de valor es muy pequeño 𝜂2 se podan menos elementos y el nivel de

ajuste aumenta. El parámetro se calibró en 𝜂2=0.08, siendo el valor que menos variables

dejaba y al mismo tiempo mantenía un adecuado nivel del 85,5% en el ajuste de clasificación

de la red.

Resultado de la poda de la red neuronal artificial, permanecieron los siguientes

intervalos más para el reconocimiento de patrones por parte del modelo:

Tabla 8. Intervalos del modelo después de la fase de poda

Variable Intervalo Valor

Departamentos

I3 Antioquia

I4 Arauca

I5 Atlántico

I10 Caquetá

I11 Casanare

I15 Córdoba

I19 Huila

I24 Norte de Santander

I26 Quindío

I29 Santander

I32 Valle

Naturaleza I34 Privada

Tipo de

documento

I36 CC

I38 NIT

Page 42: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

42

Variable Intervalo Valor

Clase de riesgo I41 2

I42 3

Actividad

económica

I49, I54, I55, I60, I62,

I65, I66, I71, I73, I74,

I76, I78, I79, I80, I82,

I88, I89, I92, I96, I98,

I101, I102, I103, I116,

I118, I121, I130, I133,

I134, I135, I136, I142,

I147, I147, I151, I152,

I158, I160, I165, I168,

I170, I171, I172, I177,

I178, I181, I184, I190,

I195, I196, I197, I199,

I209, I211, I212, I213, I225

5452102, 1552101, 1950001,

1749901, 2011901, 1743001,

3455202, 1522101, 5455901,

1523301, 1851201, 1741401,

1741201, 5101001, 1521101,

3749101, 2012101, 1524101,

5742101, 1919901, 1521901,

1552201, 1523901, 2632001,

1014001, 2158901, 1659301,

4749302, 1911201, 5749303,

4454301, 1523401, 3289201,

3155102, 3742102, 4454202,

2753001, 1505201, 1515301,

5371001, 3151102, 1751501,

3517002, 1804101, 5452201,

4604401, 4514102, 3924902,

1660101, 1524601, 1741301,

4604301, 5701001, 4453001,

4603201, 4261002, 1749101.

Número

trabajadores

I228, I229, I230 (77,155], (155,233], (233,310]

Valor nómina

I258 ($ 5.356.000, $ 10.712.000]

I260 ($ 16.068.000, $ 21.424.000]

I261 ($ 21.424.000, $ 26.780.000]

I263 ($ 32.136.000, $ 37.492.000]

Page 43: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

43

4.7 Rule extraction algorithm (RX)

Una vez completada la fase de poda del modelo, se procede con la extracción de

reglas, usando el Rule Extraction Algorithm (RX) con parámetro 𝜖 = 0.6 siguiendo a: Lu,

Setiono & Liu (1995), este valor permitió definir un intervalo adecuado con pocos nodos

discretos en la sección de clúster disminuyendo el número de reglas, pero con un buen nivel

de ajuste para clasificar a las empresas.

Tabla 9. Clusters y valores de activación

Nodo # clústers Valores de activación

𝜶𝟏 2 -0.0992, 0.4002

𝜶𝟐 2 -0.1166, 0.3937

𝜶𝟑 3 -0.7630, -0.1901, 0.5629

Al sustituir los valores de 𝛼ℎ por los valores agrupados en el clúster 𝛼𝑐, siguiendo el

paso 1.c del algoritmo de extracción de reglas, se calcula el ajuste de la red con valor del

90%; como el valor de ajuste de la red con la sustitución de los valores de activación fue

significativamente bueno, se construyó la siguiente tabla con los principales resultados del

modelo:

Tabla 10. Valores de activación discretos versus salidas del modelo

𝜶𝟏 𝜶𝟐 𝜶𝟑 𝑺𝟏 𝑺𝟐

-0,0992 -0,1166 -0,7630 1 0

-0,0992 -0,1166 -0,1901 1 0

0,4002 0,3937 0,5629 0 1

0,4002 0,3937 -0,1901 0 1

-0,0992 -0,1166 0,5629 0 1

A partir de esta tabla se pueden deducir las primeras reglas del modelo en las que,

usando las combinaciones de los valores de activación de cada nodo, se generan las clases a

las que pertenecen los individuos.

Page 44: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

44

Tabla 11. Reglas de clasificación para los valores de activación

Regla

R1 𝜶𝟑= 0,5629 => 𝑺𝟏=0 𝑺𝟐=1

R2 𝜶𝟏 = 0,4002 o 𝜶𝟐 = 0,3937 => 𝑺𝟏=0 𝑺𝟐=1

En otro caso => 𝑺𝟏=1 𝑺𝟐=0

Sin embargo, para hacer la identificación completa de nuevos individuos, es necesario

establecer las reglas que, a partir de los valores de las variables 𝐼𝑘, generan los valores de

activación. Para lo cual se aplicó el algoritmo X2R propuesto por Liu & Tan (1995),

encontrando así, 138 reglas adicionales21 que permiten establecer la conexión entre los

intervalos y los nodos de activación.

Una vez identificadas las reglas de clasificación se aplican a las empresas del conjunto

de pruebas para evaluar la capacidad de aprendizaje del modelo. El 85% de los datos este

conjunto de pruebas está correctamente clasificado por el modelo indicando un buen nivel de

aprendizaje.

Tabla 12. Matriz de confusión de empresas fraudulentas ARL

Clase pronosticada

No Fraudulentas Fraudulentas

C

l

a

s

e

r

e

a

l

No Fraudulentas

VP

149

FN

19

TVP

89%

TFN

11%

Fraudulentas

FP

12

VN

20

TFP

38%

TVN

62%

Ajuste:

85%

VPP

93%

TFO

49%

Error:

15% TFD

7%

VPN

51%

21 Las reglas obtenidas son de carácter confidencial y para uso de la aseguradora.

Page 45: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

45

Al efectuar una lectura de las reglas generadas por modelo podemos encontrar que las

empresas fraudulentas se concentran en 24 actividades económicas descritas en el apéndice,

entre las cuales se destacan: 275300122 - Empresas dedicadas a actividades de seguridad

social de afiliación obligatoria, incluye los servicios de prevención de riesgos profesionales

y/o ambientales, 3749101 - Empresas dedicadas a la obtención y suministro de personal.

incluye solamente las empresas de servicios temporales de suministro de personal temporal

o de empleos temporales y los conductores de autos particulares, 1749901-Empresas

dedicadas a otras actividades empresariales NCP incluye oficinas de negocios varios tales

como cobranzas de cuentas, actividades de evaluación excepto las relacionadas con bienes

raíces y negocios, actividades de intermediación y promoción, 5701001 - Empresas

dedicadas a actividades inmobiliarias realizadas con bienes propios o arrendados incluye

solamente a empresas dedicadas a acondicionamiento de terrenos, 1741301- Empresas

dedicadas a la investigación de mercados y realización de encuestas de opinión pública,

1741401- Empresas dedicadas a actividades de asesoramiento empresarial y en materia de

gestión, incluye las zonas francas dedicadas a promoción, creación, desarrollo y

administración del proceso de industrialización de bienes y la prestación de servicios

destinados, 3742102 - Empresas dedicadas a actividades de arquitectura e ingeniería y

actividades conexas de asesoramiento técnico incluye solamente las empresas dedicadas a el

trabajo de campo de hidrología y/o meteorología, topografía, agrimensura y/o estudios

catastrales y entre otras relacionadas en la apéndice del documento.

En cuanto a ubicación geográfica las reglas del modelo nos indican que los

departamentos: Norte de Santander, Santander, Atlántico, Antioquia y Valle son los que

tienen mayor probabilidad de contar con empresas fraudulentas, con nóminas con valor entre

$5’481.000 y $16’443.000, y entre 18 y 21 trabajadores, ubicadas en la clase de Riesgo 3.

22 Código CIIU.

Page 46: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

46

5. Conclusiones

En este documento se aplicó el enfoque conexionista de redes neuronales basado en

trabajo de Lu, Setiono & Liu (1995) para identificar reglas a partir de un conjunto variables

explicativas permitan clasificar objetos. El método tiene tres fases: entrenamiento, poda y

extracción de reglas. La primera fase consiste en la solución de una red neuronal a través de

un proceso de optimización, en donde se encuentran las matrices de pesos 𝑊 y 𝑉 que

minimizan el error entre las salidas 𝑆𝑝𝑖 del modelo y los datos observados 𝑡𝑝

𝑖 . La segunda fase

consiste en eliminar los nodos redundantes, manteniendo la capacidad de ajuste de la red y

finalmente en la tercera fase se extraen las reglas para separar los objetos en su

correspondiente clase.

Una vez completados los ejercicios de simulación, se tienen dos resultados empíricos.

En primer lugar, en la fase de entrenamiento se evidenció que tiene mayor importancia el

número de iteraciones del proceso de optimización a través de BFGS para encontrar los pesos

𝑊 y 𝑉, que el ciclo de iteración de la fase de entrenamiento del modelo. El segundo lugar,

la elección de los parámetros juega un papel trascendental en la cantidad de reglas generadas,

porque el proceso de extracción de reglas puede ser significativamente desgastante con

∑ (𝑘𝑖)𝑘

𝑖=1 posibles soluciones23. Si bien está claro que algoritmo X2R ayuda a identificar los

principales patrones en extracción de reglas, también es importante resaltar que el

investigador debe elegir la configuración correcta de los parámetros: ℎ, 𝜂2 y 𝜖 24, que permita

tener un equilibrio entre una red compleja con excelente capacidad de ajuste vs una red muy

simple con baja capacidad de ajuste. Si la red es compleja el número de posibles soluciones

y reglas se incrementa, al igual que la dificultad de la etapa de extracción. Por lo tanto, se

recomienda calibrar cada parámetro para hacer más simple la arquitectura de la red pero que

a su vez se mantenga la capacidad de ajuste.

23 Aplicar esta fórmula al ejemplo de empresas fraudulentas con 81 variables explicativas después de

la fase de poda quedan 2.42x1024 posibles soluciones. 24 ℎ : Número de nodos en la capa oculta, 𝜂2: Factor de poda de elementos de la red neuronal, 𝜖:

Tamaño del intervalo para la clasificación de nodos discretos.

Page 47: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

47

Durante el proceso de investigación se verificó el potencial las redes neuronales para

resolver un problema de clasificación en el campo de la economía de la información,

específicamente en el mercado de seguros de riesgos laborales en Colombia, sin embargo,

para fortalecer la capacidad de predicción de las reglas es necesario efectuar múltiples

simulaciones y para ello aún se requiere el desarrollo de códigos que permitan automatizar

el Algoritmo X2R.

Con estos resultados de este documento se amplía el espectro de los posibles modelos

a ser usados para afrontar problemas de clasificación en Colombia, con el uso de modelos

que permiten generar reglas de negocio traducidas a lenguaje natural para la clasificación de

individuos en conjuntos de datos. De igual forma se evidenció existe un potencial

significativo en la construcción de modelos de minería de datos aplicada a los procesos de

suscripción de pólizas de seguros y verificación de reclamaciones, haciendo posible la

automatización y optimización de los procesos de identificación de fraude.

Al incrementar la eficiencia se reducen los costos asociados a la prestación de los

servicios de salud, lo cual se traduce en un beneficio vía reducción de las tarifas o vía

incremento en la calidad del servicio.

Page 48: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

48

6. Anexos

Figura 5. Algoritmo de poda de una Red Neuronal Artificial.

Page 49: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

49

Algoritmo de extracción de Reglas RX25

7. Discretización de los valores de activación vía clúster:

a) H=sum/count

b) Verificar ajuste sustituyendo ∝𝑙𝑚 por los valores de activación, resultados del clúster ∝𝑐 𝑙

𝑚.

c) Si el nivel de ajuste del modelo cae por debajo del nivel aceptado, disminuya el valor de 𝜀 y

regrese al paso 1.

8. Enumerar los valores de activación discretizados y calcule la salida de la red. Generar reglas que

tengan perfecta cobertura de las tuplas para los nodos de activación que permitan las salidas del

modelo.

9. Para los nodos de activación discretizados que aparecen en las reglas encontradas en el paso anterior,

enumere los valores de entrada que los originan y genere reglas perfectas.

10. Generar reglas que relacionen los valores de entrada y los valores de salida, por sustitución de las

reglas encontradas en los pasos anteriores.

Figura 6. Algoritmo de extracción de Reglas RX

25 En el presente documento se hace una generalización del algoritmo descrito en (Lu, Setiono & Liu

1995) para las 𝑚 columnas de la matriz 𝛼 de las h posibles, de igual forma, se incluye una corrección

al descrito en el documento original, dado que la variable de acumulación no corresponde a D si no a

𝑗,̅ y además se incluye un ciclo que permite encontrar la mínima distancia al centro de un intervalo.

1.

a) Para m = 1,2, …, h

o D=1, 𝜕=∝𝑘𝑚 1, sum (1, m) = ∝1

𝑚 , H (1, m) = ∝1𝑚 , 𝜺

o Para i = 2, 3,…, k

▪ Mindistancia=10 2

▪ Para j=1,2,3,..,D

• Si (Distancia<Mindistancia)

o Mindistancia=Distancia

o 𝑗=̅j

• Fin Si

▪ Fin ciclo

▪ Si ( 𝜕(i) − H(𝑗,̅ m) = Mindistancia && 𝜕(i) − H(𝑗,̅ m) ≤ 𝜺)

• count(𝑗,̅m)=count(𝑗,̅m)+1

• sum (𝑗,̅m)=sum_(𝑗,̅m)+ 𝜕(i,1)

▪ Si no

• D=D+1;

• H(D,m)= 𝜕(i);

• count(D,m)=1;

• sum(D,m)=𝜕 (i)

▪ Fin si

o Fin ciclo

Fin ciclo

1 Se selecciona el vector de tamaño 1xk del nodo m. 2 Se fija un valor grande dado que el ciclo almacena el último dato, así cuando el ciclo finaliza se

sustituye este valor por el primer dato evaluado

Page 50: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

50

Algoritmo X2R: Generador de Reglas

• Ordenar por frecuencia (Datos sin duplicados)

• i=0

• Mientras (Datos sin duplicados es diferente de vacío) {

o Genere Ri para cubrir el patrón más frecuente

o Remueva los patrones cubiertos por Ri

o i=i+1}

• Agrupe las reglas de acuerdo sus etiquetas de clase

• Elimine reglas redundantes

• Determine una regla por defecto

Figura 8. Algoritmo X2R: Generador de Reglas

Page 51: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

51

Tabla 13. Departamentos de Colombia

Intervalo Departamento

I-2 Amazonas

I-3 Antioquia

I-4 Arauca

I-5 Atlántico

I-6 Bogotá D.C.

I-7 Bolívar

I-8 Boyacá

I-9 Caldas

I-10 Caquetá

I-11 Casanare

I-12 Cauca

I-13 Cesar

I-14 Choco

I-15 Córdoba

I-16 Cundinamarca

I-17 Guainía

I-18 Guaviare

I-19 Huila

I-20 La guajira

I-21 Magdalena

I-22 Meta

I-23 Nariño

I-24 Norte de Santander

I-25 Putumayo

I-26 Quindío

I-27 Risaralda

I-28 San Andrés

I-29 Santander

I-30 Sucre

I-31 Tolima

I-32 Valle

I-33 Vichada

Page 52: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

52

Tabla 14. Naturaleza

Intervalo Departamento

I-34 Privada

I-35 Pública

Tabla 15. Tipos de documento

Intervalo Tipo de documento

I-36 CC

I-37 CE

I-38 NI

I-39 PA

Tabla 16. Clases de riesgo

Intervalo Clase de Riesgo

I-40 1

I-41 2

I-42 3

I-43 4

I-44 5

Tabla 17. Actividades Económicas

Intervalo Código

CIIU Actividad Económica

I-45 1522201 EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR DE LECHE, PRODUCTOS LÁCTEOS Y HUEVOS EN ESTABLECIMIENTOS ESPECIALIZADOS INCLUYE LA VENTA SIN AUTO TRANSPORTE DE LECHE

I-46 2512101

EMPRESAS DEDICADAS AL COMERCIO AL POR MAYOR DE MATERIAS PRIMAS PRODUCTOS AGRÍCOLAS, EXCEPTO CAFÉ Y FLORES HACE REFERENCIA SOLAMENTE AL ALMACENAMIENTO Y/O VENTA AL MAYOREO DE SEMILLAS FORRAJES.

I-47 1523101

EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR DE PRODUCTOS FARMACÉUTICOS, MEDICINALES, Y ODONTOLÓGICOS; ARTÍCULOS DE PERFUMERÍA, COSMÉTICOS Y DE TOCADOR EN ESTABLECIMIENTOS ESPECIALIZADOS HACE REFERENCIA A EMPRESAS DEDICADAS A LA VENTA EN FARMACIAS, DROGUERÍA

I-48 4604201 EMPRESA DEDICADAS AL TRANSPORTE INTERMUNICIPAL DE CARGA POR CARRETERA

Page 53: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

53

Intervalo Código

CIIU Actividad Económica

I-49 5452102 CONSTRUCCIÓN DE EDIFICACIONES PARA USO RESIDENCIAL INCLUYE SOLAMENTE A EMPRESAS DEDICADAS A CONSTRUCCIÓN DE CASAS, EDIFICIOS, CAMINOS, FERROCARRILES, PRESAS, CALLES Y/O OLEODUCTOS.

I-50 1504001

EMPRESAS DEDICADAS AL COMERCIO, MANTENIMIENTO Y REPARACIÓN DE MOTOCICLETAS Y DE SUS PARTES, PIEZAS Y ACCESORIOS INCLUYE LA COMERCIALIZACIÓN DE MOTOCICLETAS Y TRINEOS MOTORIZADOS NUEVOS Y USADOS, PARTES PIEZAS Y ACCESORIOS LAS ACTIVIDADES DE MANTENIMIENTO

I-51 5453002 CONSTRUCCIÓN DE OBRAS DE INGENIERÍA CIVIL INCLUYE SOLAMENTE A EMPRESAS DEDICADAS A EL MONTAJE Y/O REPARACIÓN DE OLEODUCTOS

I-52 1523601 EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR DE MUEBLES PARA EL HOGAR EN ESTABLECIMIENTOS ESPECIALIZADOS

I-53 1523501

EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR DE ELECTRODOMÉSTICOS EN ESTABLECIMIENTOS ESPECIALIZADOS INCLUYE ARTÍCULOS ELÉCTRICOS, MATERIALES, RECEPTORES DE RADIO Y/O TELEVISIÓN, REFRIGERADORES, LAVADORAS, ESTUFAS Y SIMILARES

I-54 1552101 EXPENDIO A LA MESA DE COMIDAS PREPARADAS, EN RESTAURANTES

I-55 1950001 HOGARES PRIVADOS CON SERVICIO DOMESTICO

I-56 2522302

EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR DE CARNES (HACE REFERENCIA A EMPRESAS DEDICADAS A AVES DE CORRAL), PRODUCTOS CÁRNICOS, PESCADOS Y PRODUCTOS DE MAR, EN ESTABLECIMIENTOS ESPECIALIZADOS INCLUYE SOLAMENTE CARNICERÍAS, EXPENDIOS DE PESCADOS Y MARIS

I-57 3014003

EMPRESAS DEDICADAS A ACTIVIDADES DE SERVICIOS, AGRÍCOLAS Y GANADEROS, EXCEPTO LAS EMPRESAS DEDICADAS A ACTIVIDADES VETERINARIAS INCLUYE SOLAMENTE LOS BENEFICIOS DE ARROZ Y LAS TRILLADORAS DE GRANO, CABALLERIZAS, ESTABLOS PARA REPARTO CON AUTOTRANSPORTE

I-58 2014002 EMPRESAS DEDICADAS A ACTIVIDADES DE SERVICIOS, AGRÍCOLAS Y GANADEROS, EXCEPTO LAS VETERINARIAS INCLUYE LOS ESTABLOS SIN AUTO TRANSPORTE Y LAS EMPRESAS DE JARDINERÍA Y/O ARREGLOS DE JARDINES

I-59 3851401 EMPRESAS DEDICADAS A ACTIVIDADES DE APOYO DIAGNOSTICO INCLUYE SOLAMENTE LOS LABORATORIOS DE ANÁLISIS QUÍMICOS, BIOLÓGICOS, BANCOS DE SANGRE Y SIMILARES.

I-60 1749901

EMPRESAS DEDICADAS A OTRAS ACTIVIDADES EMPRESARIALES NCP INCLUYE OFICINAS DE NEGOCIOS VARIOS TALES COMO COBRANZAS DE CUENTAS, ACTIVIDADES DE EVALUACIÓN EXCEPTO LAS RELACIONADAS CON BIENES RAÍCES Y NEGOCIOS, ACTIVIDADES DE INTERMEDIACIÓN Y PROMOCIÓN COMERCIO

I-61 2749901 OTRAS EMPRESAS DEDICADAS A ACTIVIDADES EMPRESARIALES NCP INCLUYE LA ELABORACIÓN DE COPIAS FOTOSTÁTICAS, HELIOGRAFÍAS

I-62 2011901

EMPRESAS DEDICADAS A LA PRODUCCIÓN AGRÍCOLA EN UNIDADES NO ESPECIALIZADAS INCLUYE LA AGRICULTURA NO MECANIZADA NI CONTEMPLADA EN OTRAS EMPRESAS DEDICADAS A ACTIVIDADES (SIEMBRA, CULTIVO Y/O RECOLECCIÓN)

Page 54: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

54

Intervalo Código

CIIU Actividad Económica

I-63 1524401

EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR DE LIBROS, PERIÓDICOS, MATERIALES Y ARTÍCULOS DE PAPELERÍA Y ESCRITORIO, EN ESTABLECIMIENTOS ESPECIALIZADOS" INCLUYE LA VENTA DE ARTÍCULOS PARA FILATELIA, VENTA DE PAPEL, ENVASES DE CARTÓN, A OFICINAS DE VENTA

I-64 2013001 EMPRESAS DEDICADAS A LA ACTIVIDAD MIXTA (AGRÍCOLA Y PECUARIA)

I-65 1743001 EMPRESAS DEDICADAS A LA PUBLICIDAD

I-66 3455202 EMPRESAS DEDICADAS A TRABAJOS DE PINTURA Y TERMINACIÓN DE MUROS Y PISOS INCLUYE SOLAMENTE EMPRESAS DEDICADAS A EL PULIDO, PINTURA Y/O ENCERADO DE PISOS

I-67 1801101 ESTABLECIMIENTOS DE EDUCACIÓN PREESCOLAR QUE SUELE IMPARTIRSE EN ESCUELAS DE PÁRVULOS O EN JARDINES INFANTILES INCLUYE GUARDERÍAS

I-68 4524104

EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR DE ARTÍCULOS DE FERRETERÍA, CERRAJERÍA Y PRODUCTOS DE VIDRIO, EXCEPTO PINTURAS EN ESTABLECIMIENTOS ESPECIALIZADOS INCLUYE SOLAMENTE EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR DE VENTA DE MATERIALES PARA CONSTRUCCIÓN

I-69 5712201 ALQUILER DE MAQUINARIA Y EQUIPO DE CONSTRUCCIÓN Y DE INGENIERÍA CIVIL CON SUMINISTRO DE OPERARIOS

I-70 3503001 EMPRESAS DEDICADAS AL COMERCIO DE PARTES, PIEZAS (AUTOPARTES) Y ACCESORIOS (LUJOS) PARA VEHÍCULOS AUTOMOTORES

I-71 1522101 EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR DE FRUTAS Y VERDURAS, EN ESTABLECIMIENTOS ESPECIALIZADOS

I-72 4711102 EMPRESAS DEDICADAS AL ALQUILER DE EQUIPO DE TRANSPORTE TERRESTRE

I-73 5455901 OTROS TRABAJOS DE TERMINACIÓN Y ACABADO

I-74 1523301 EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR DE PRENDAS DE VESTIR Y SUS ACCESORIOS

I-75 2012301 EMPRESAS DEDICADAS A LA CRÍA ESPECIALIZADA DE AVES DE CORRAL

I-76 1851201

EMPRESAS DEDICADAS A ACTIVIDADES DE LA PRACTICA MEDICA INCLUYE CONSULTORIOS MÉDICOS Y/O ODONTOLÓGICOS CUYAS UNIDADES RADIOLÓGICAS CUMPLAN CON LAS NORMAS DE RADIO PROTECCIÓN VIGENTES.

I-77 5451201 TRABAJOS DE PREPARACIÓN DE TERRENOS PARA OBRAS CIVILES

I-78 1741401

EMPRESAS DEDICADAS A ACTIVIDADES DE ASESORAMIENTO EMPRESARIAL Y EN MATERIA DE GESTIÓN INCLUYE LAS ZONAS FRANCAS DEDICADAS A PROMOCIÓN, CREACIÓN, DESARROLLO Y ADMINISTRACIÓN DEL PROCESO DE INDUSTRIALIZACIÓN DE BIENES Y LA PRESTACIÓN DE SERVICIOS DESTINADOS

I-79 1741201

EMPRESAS DEDICADAS A ACTIVIDADES DE CONTABILIDAD, TENEDURÍA DE LIBROS Y AUDITORIA; ASESORAMIENTO EN MATERIA DE IMPUESTOS" RELACIONADO CON DESPACHOS PÚBLICOS CUYA ACTIVIDAD ADMINISTRATIVA NO ESTÉ INCLUIDA EN OTRA ACTIVIDAD ECONÓMICA, ACTIVIDADES DE REGISTRÓ

Page 55: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

55

Intervalo Código

CIIU Actividad Económica

I-80 5101001

EXTRACCIÓN Y AGLOMERACIÓN DE HULLA (CARBÓN DE PIEDRA) INCLUYE SOLAMENTE A EMPRESAS DEDICADAS A LA EXPLOTACIÓN DE CARBONERAS, GASIFICACIÓN DE CARBÓN IN SITU Y PRODUCCIÓN DEL CARBÓN AGLOMERADO

I-81 1181001 FABRICACIÓN DE PRENDAS DE VESTIR, EXCEPTO PRENDAS: PEQUEÑOS TALLERES DE MODAS, SASTRERÍAS, SOMBREROS, CONFECCIONES DE ROPA

I-82 1521101

EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR, EN ESTABLECIMIENTOS NO ESPECIALIZADOS, CON SURTIDO COMPUESTO PRINCIPALMENTE DE ALIMENTOS (VÍVERES EN GENERAL), BEBIDAS Y TABACO INCLUYE LA VENTA DE MERCANCÍAS

I-83 1523201

EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR DE PRODUCTOS TEXTILES EN ESTABLECIMIENTOS ESPECIALIZADOS INCLUYE PRODUCTOS TEXTILES ELABORADAS CON FIBRAS NATURALES, ARTIFICIALES Y SINTÉTICAS, LOS HILOS, LANAS ETC.

I-84 2553001 EXPENDIO DE BEBIDAS ALCOHÓLICAS PARA EL CONSUMO DENTRO DEL ESTABLECIMIENTO INCLUYE CAFÉS, CANTINAS, BARES, TABERNAS, DISCOTECAS Y SIMILARES

I-85 2749201 EMPRESAS DEDICADAS A ACTIVIDADES DE INVESTIGACIÓN Y SEGURIDAD INCLUYE LOS SERVICIOS DE CONSERJERÍA.

I-86 4502001 MANTENIMIENTO Y REPARACIÓN DE VEHÍCULOS AUTOMOTORES INCLUYE SOLAMENTE EMPRESAS DEDICADAS A SERVICIOS DE EMERGENCIAS PARA VEHÍCULOS DE MOTOR, GRÚAS, MONTA LLANTAS

I-87 1515901 EMPRESAS DEDICADAS AL COMERCIO AL POR MAYOR DE OTROS PRODUCTOS INTERMEDIOS NCP

I-88 3749101

EMPRESAS DEDICADAS A LA OBTENCIÓN Y SUMINISTRO DE PERSONAL INCLUYE SOLAMENTE LAS EMPRESAS DE SERVICIOS TEMPORALES DE SUMINISTRO DE PERSONAL TEMPORAL O DE EMPLEOS TEMPORALES Y LOS CONDUCTORES DE AUTOS PARTICULARES

I-89 2012101 EMPRESAS DEDICADAS A LA CRÍA ESPECIALIZADA DE GANADO VACUNO INCLUYE LA IMPORTACIÓN DE LA CRÍA DE GANADO BOVINO EQUINO Y SIMILARES

I-90 4602101 EMPRESAS DEDICADAS AL TRANSPORTE URBANO COLECTIVO REGULAR DE PASAJEROS

I-91 2521902

EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR EN ESTABLECIMIENTOS NO ESPECIALIZADOS CON SURTIDO COMPUESTO PRINCIPALMENTE POR PRODUCTOS DIFERENTES DE ALIMENTOS (VÍVERES EN GENERAL), BEBIDAS Y TABACOS INCLUYE SOLAMENTE LOS GRANDES ALMACENES - MISCELÁNEAS, ALM

I-92 1524101

EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR DE ARTÍCULOS DE FERRETERÍA, CERRAJERÍA Y PRODUCTOS DE VIDRIO, EXCEPTO PINTURAS EN ESTABLECIMIENTOS ESPECIALIZADOS INCLUYE LA VENTA DE MAQUINARIA LIGERA E IMPLEMENTOS PARA LA INDUSTRIA EN GENERAL

I-93 2524102

EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR DE ARTÍCULOS DE FERRETERÍA, CERRAJERÍA Y PRODUCTOS DE VIDRIO, EXCEPTO PINTURAS EN ESTABLECIMIENTOS ESPECIALIZADOS INCLUYE SOLAMENTE MARQUETERÍAS ARTESANALES, VENTA Y/O DEPOSITO DE VIDRIOS, LA VENTA DE MOSAICOS,

Page 56: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

56

Intervalo Código

CIIU Actividad Económica

I-94 2551101 ALOJAMIENTO EN "HOTELES", "HOSTALES" Y "APARTA HOTELES" HOSPEDAJE DÍA A DÍA

I-95 1513201 EMPRESAS DEDICADAS AL COMERCIO AL POR MAYOR DE PRENDAS DE VESTIR, ACCESORIOS DE PRENDAS DE VESTIR Y ARTÍCULOS ELABORADOS EN PIEL.

I-96 5742101

EMPRESAS DEDICADAS A ACTIVIDADES DE ARQUITECTURA E INGENIERÍA Y ACTIVIDADES CONEXAS DE ASESORAMIENTO TÉCNICO INCLUYE SOLAMENTE EMPRESAS DEDICADAS A ACTIVIDADES DE OBRA DE CONSTRUCCIÓN, DIRECCIÓN DE OBRAS DE CONSTRUCCIÓN, ARQUITECTURA, INGENIERÍA Y AGRIMES

I-97 1513501 EMPRESAS DEDICADAS AL COMERCIO AL POR MAYOR DE PRODUCTOS FARMACÉUTICOS, MEDICINALES, COSMÉTICOS Y DE TOCADOR

I-98 1919901

EMPRESAS DEDICADAS A ACTIVIDADES DE OTRAS ORGANIZACIONES NCP INCLUYE EMPRESAS DEDICADAS A ACTIVIDADES TALES COMO ASOCIACIONES CON FINES CULTURALES, RECREATIVOS Y ARTESANALES Y SERVICIOS DE LA ORGANIZACIÓN DE EVENTOS DE CAPACITACIÓN, SOCIALES Y/O FORMACIÓN

I-99 1521901

EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR EN ESTABLECIMIENTOS NO ESPECIALIZADOS CON SURTIDO COMPUESTO PRINCIPALMENTE POR PRODUCTOS DIFERENTES DE ALIMENTOS (VÍVERES EN GENERAL), BEBIDAS Y TABACOS HACE REFERENCIA A EMPRESAS DEDICADAS A LA VENTA AL MENUDEO

I-100 2155101 EMPRESAS DEDICADAS A LA ELABORACIÓN DE PRODUCTOS DE PANADERÍA INCLUYE LAS EMPRESAS DEDICADAS A MANUFACTURA DE OBLEAS, CONOS PARA HELADOS

I-101 1552201 EXPENDIO, A LA MESA, DE COMIDAS PREPARADAS EN CAFETERÍAS, REFRESCOS Y HELADOS, SALONES DE TÉ

I-102 1523901

EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR DE PRODUCTOS DIVERSOS NCP, EN ESTABLECIMIENTOS ESPECIALIZADOS TALES COMO: ANTIGÜEDADES Y CURIOSIDADES, ARMAS DE FUEGO, PARQUE, ARTESANÍAS NO CONTEMPLADAS EN OTRAS ACTIVIDADES, ARTÍCULOS DE PROTECCIÓN PERSONAL CO

I-103 2632001 EMPRESAS DEDICADAS AL ALMACENAMIENTO Y DEPOSITO INCLUYE BODEGAS Y ALMACENES DE DEPOSITO, ASÍ COMO ALMACENAMIENTO DE SEMILLAS Y FORRAJES.

I-104 1513101 EMPRESAS DEDICADAS AL COMERCIO AL POR MAYOR DE PRODUCTOS TEXTILES Y PRODUCTOS CONFECCIONADOS PARA USO DOMESTICO.

I-105 1853201

EMPRESAS DE SERVICIOS SOCIALES SIN ALOJAMIENTO INCLUYE ACTIVIDADES SOCIALES DE ASESORAMIENTO, BIENESTAR, ALBERGUE, ORIENTACIÓN Y ACTIVIDADES SIMILARES PRESTADAS A PERSONAS Y FAMILIAS EN SUS HOGARES Y EN OTROS LUGARES, LA PRESTACIÓN DIRECTA DE BIENESTAR SO

I-106 1701001 ACTIVIDADES INMOBILIARIAS REALIZADAS CON BIENES PROPIOS O ARRENDADOS LA COMPRA, VENTA Y ALQUILER Y EXPLOTACIÓN DE BIENES INMUEBLES PROPIOS O ARRENDADOS, HACE REFERENCIA A EMPRESAS

Page 57: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

57

Intervalo Código

CIIU Actividad Económica

DEDICADAS A LA VENTA DE TERRENOS. TALES COMO LOTES DE CEMENTERIOS, EXPLOTACIÓN

I-107 5281101 FABRICACIÓN DE PRODUCTOS METÁLICOS PARA USO ESTRUCTURAL INCLUYE SOLAMENTE A EMPRESAS DEDICADAS A LA FABRICACIÓN Y MONTAJE DE ESTRUCTURAS EN HIERRO

I-108 1659901

OTROS TIPOS DE INTERMEDIACIÓN FINANCIERA NCP HACE REFERENCIA A EMPRESAS DEDICADAS A LAS TRANSACCIONES POR CUENTA PROPIA DE CORREDORES DE BOLSA, LAS INVERSIONES EN BIENES INMUEBLES EFECTUADAS PRIMORDIALMENTE POR CUENTA DE OTROS INTERMEDIARIOS FINANCIEROS Y

I-109 3341001

EMPRESAS DEDICADAS A LA FABRICACIÓN DE VEHÍCULOS AUTOMOTORES Y SUS MOTORES INCLUYE ARMADO, PINTURA Y/O REPARACIÓN DE AUTOMOTORES, AUTOMÓVILES, CAMIONES, LANCHAS, MOTOCICLETAS Y SIMILARES

I-110 1702001

EMPRESAS DEDICADAS A ACTIVIDADES INMOBILIARIAS REALIZADAS A CAMBIO DE UNA RETRIBUCIÓN O POR CONTRATA INCLUYE LA COMPRA VENTA, ALQUILER, ADMINISTRACIÓN Y TASACIÓN DE BIENES INMUEBLES A CAMBIO DE LA RETRIBUCIÓN O POR CONTRATA, LAS ZONAS FRANCAS QUE PRINCIPAL

I-111 3851101

EMPRESAS DEDICADAS A ACTIVIDADES DE LAS INSTITUCIONES PRESTADORAS DE SERVICIOS DE SALUD, CON INTERNACIÓN INCLUYE HOSPITALES GENERALES, CENTROS DE ATENCIÓN MÉDICA CON AYUDAS DIAGNOSTICAS, INSTITUCIONES PRESTADORAS DE SERVICIOS DE SALUD, CENTROS ESPECIALIZA

I-112 1722001

EMPRESAS DEDICADAS A CONSULTORÍA EN PROGRAMAS DE INFORMÁTICA Y SUMINISTRO DE PROGRAMAS DE INFORMÁTICA INCLUYE. EDICIÓN DE SOFTWARE, LAS ACTIVIDADES RELACIONADAS CON EL ANÁLISIS, EL DISEÑO Y LA PROGRAMACIÓN DE SISTEMAS LISTOS PARA SER UTILIZADOS, ELABORACIÓN

I-113 2181002

EMPRESAS DEDICADAS A LA FABRICACIÓN DE PRENDAS DE VESTIR, EXCEPTO PRENDAS DE PIEL INCLUYE LA MANUFACTURA DE GUANTES DE TELA Y/O PIEL, IMPERMEABLES, LIGAS Y TIRANTES, FABRICAS Y/O GRANDES ALMACENES DE CONFECCIÓN DE ROPA Y SASTRERÍAS

I-114 1806001 ESTABLECIMIENTOS DE EDUCACIÓN NO FORMAL INCLUYE PROGRAMAS DE ALFABETIZACIÓN PARA ADULTOS ETC.

I-115 3505101

EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR DE COMBUSTIBLE PARA AUTOMOTORES INCLUYE SOLAMENTE LAS ESTACIONES DE SERVICIO PARA AUTOMOTORES, LAS ESTACIONES Y/O EXPENDIOS DE GASOLINA, PETRÓLEO, TRACTORINA

I-116 1014001 EMPRESAS DEDICADAS A ACTIVIDADES DE SERVICIOS, AGRÍCOLAS Y GANADEROS, EXCEPTO LAS ACTIVIDADES VETERINARIAS INCLUYE EL ALMACÉN Y/O DEPOSITO DE CAFÉ

I-117 2552901 OTROS TIPOS DE EXPENDIO No DE ALIMENTOS PREPARADOS

I-118 2158901 EMPRESAS DEDICADAS A LA ELABORACIÓN DE OTROS PRODUCTOS ALIMENTICIOS INCLUYE LA FABRICACIÓN DE ESPECIAS Y LA FABRICACIÓN ARTESANAL DE ALIMENTOS INVOLUCRANDO EL ENVASE Y/O ENLATADO.

Page 58: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

58

Intervalo Código

CIIU Actividad Económica

I-119 4292902

EMPRESAS DEDICADAS A LA FABRICACIÓN DE OTROS TIPOS DE MAQUINARIA DE USO ESPECIAL NCP INCLUYE SOLAMENTE LA FABRICACIÓN DE MÁQUINAS Y EQUIPOS PARA ELABORACIÓN DE CAUCHO O PLÁSTICO Y PARA LA FABRICACIÓN DE PRODUCTOS DE ESOS MATERIALES TALES COMO EXTRUSORAS O

I-120 1639001 EMPRESAS DEDICADAS A ACTIVIDADES DE OTRAS AGENCIAS DE TRANSPORTE INCLUYE AGENCIAS DE TRANSPORTES MARÍTIMOS, AÉREOS, TERRESTRES

I-121 1659301

ACTIVIDADES DE LAS COOPERATIVAS FINANCIERAS Y FONDOS DE EMPLEADOS HACE REFERENCIA A EMPRESAS DEDICADAS A LA DISTRIBUCIÓN DE FONDOS SIN FINES DE LUCRO, ENTRE SUS ASOCIADOS PARA LA COMPRA DE BIENES Y SERVICIOS, ASÍ COMO LAS ACTIVIDADES DE LOS FONDOS DE EMPLEO

I-122 5454302 TRABAJOS DE INSTALACIÓN DE EQUIPOS LAS EMPRESAS DEDICADAS A ACTIVIDADES DE CONSTRUCCIÓN NECESARIAS PARA HABILITAR LAS EDIFICACIONES Y LAS OBRAS CIVILES

I-123 2011101 EMPRESAS DEDICADAS A LA PRODUCCIÓN ESPECIALIZADA DEL CAFÉ

I-124 1741101 EMPRESAS DEDICADAS A ACTIVIDADES JURÍDICAS INCLUYE LAS OFICINAS Y/O DESPACHOS PROFESIONALES QUE DESARROLLAN ACTIVIDADES DE TIPO JURÍDICO

I-125 2742102 EMPRESAS DEDICADAS A ACTIVIDADES DE ARQUITECTURA E INGENIERÍA Y ACTIVIDADES CONEXAS DE ASESORAMIENTO TÉCNICO INCLUYE DECORACIÓN DE INTERIORES

I-126 2851302 EMPRESAS DEDICADAS A ACTIVIDADES DE LA PRACTICA ODONTOLÓGICA INCLUYE LABORATORIOS DE MECÁNICA DENTAL

I-127 2523902

EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR DE PRODUCTOS DIVERSOS NCP, EN ESTABLECIMIENTOS ESPECIALIZADOS INCLUYE SOLAMENTE LOS ALMACENES Y/O MERCADOS POR DEPARTAMENTOS CON VENTA AL DETAL, VENTA DE EXTINTORES DE INCENDIO, VENTA DE CARBONERÍAS SIN AUTO TRA

I-128 2514101 EMPRESAS DEDICADAS AL COMERCIO AL POR MAYOR DE MATERIALES DE CONSTRUCCIÓN, FERRETERÍA Y VIDRIO DISTRIBUCIÓN SIN AUTO TRANSPORTE

I-129 2012201 EMPRESAS DEDICADAS A LA CRÍA ESPECIALIZADA DE GANADO PORCINO

I-130 4749302 EMPRESAS DEDICADAS A ACTIVIDADES DE LIMPIEZA DE EDIFICIOS INCLUYE SOLAMENTE EMPRESAS DEDICADAS A LOS SERVICIOS DE DESINFECCIÓN Y FUMIGACIÓN

I-131 4222002

EMPRESAS DEDICADAS A LA FABRICACIÓN DE IMPRESIÓN POR CONTRATA INCLUYE SOLAMENTE EMPRESAS DEDICADAS A LA FABRICACIÓN DE ARTÍCULOS ESTAMPADOS EN PAPEL, LIBROS, REVISTAS, PERIÓDICOS, FORMAS CONTINUAS, TALONARIOS, SELLOS POSTALES, PAPEL MONEDA, TARJETAS DE CR

I-132 3156101 TRILLA DE CAFÉ HACE REFERENCIA A EMPRESAS DEDICADAS A LA MOLIENDA

Page 59: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

59

Intervalo Código

CIIU Actividad Económica

I-133 1911201 EMPRESAS DEDICADAS A ACTIVIDADES DE ORGANIZACIONES PROFESIONALES INCLUYE LAS ASOCIACIONES ACADÉMICAS Y PROFESIONALES

I-134 5749303 EMPRESAS DEDICADAS A ACTIVIDADES DE LIMPIEZA DE EDIFICIOS INCLUYE SOLAMENTE A EMPRESAS DEDICADAS A LOS SERVICIOS DE LIMPIEZA EXTERIOR DE FACHADAS Y/O VENTANAS

I-135 4454301 TRABAJOS DE INSTALACIÓN DE EQUIPOS INCLUYE SOLAMENTE LA INSTALACIÓN DE SISTEMAS DE AIRE ACONDICIONADO, VENTILACIÓN

I-136 1523401

EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR DE TODO TIPO DE CALZADO, ARTÍCULOS DE CUERO Y SUCEDÁNEOS DEL CUERO, EN ESTABLECIMIENTOS ESPECIALIZADOS INCLUYE LA VENTA DE ARTÍCULOS PARA ZAPATERÍA

I-137 3343001 EMPRESAS DEDICADAS A LA FABRICACIÓN DE PARTES, PIEZAS Y ACCESORIOS (AUTOPARTES) PARA VEHÍCULOS AUTOMOTORES Y PARA SUS MOTORES

I-138 4604102 EMPRESAS DEDICADAS A TRANSPORTE MUNICIPAL DE CARGA POR CARRETERA

I-139 3159101

DESTILACIÓN, RECTIFICACIÓN Y MEZCLA DE BEBIDAS ALCOHÓLICAS; PRODUCCIÓN DE ALCOHOL ETÍLICO A PARTIR DE SUSTANCIAS FERMENTADAS INCLUYE SOLAMENTE EMPRESAS DEDICADAS A LA FABRICACIÓN DE VINOS, ALCOHOLES, AGUARDIENTE Y/O LICORES

I-140 3201001 EMPRESAS DEDICADAS AL ASERRADO, ACEPILLADO E IMPREGNACIÓN DE LA MADERA INCLUYE SOLAMENTE EMPRESAS DEDICADAS A LAS MADERERÍAS, PREPARACIÓN DE MADERA, IMPERMEABILIZACIÓN Y/O INMUNIZADO

I-141 2642301 EMPRESAS DEDICADAS A PRESTAR SERVICIOS DE TRASMISIÓN DE PROGRAMAS DE RADIO Y TELEVISIÓN INCLUYE LAS ESTACIONES REPETIDORAS DE SEÑALES DE TELEVISIÓN, RADIO Y SIMILARES

I-142 3289201

TRATAMIENTO Y REVESTIMIENTO DE METALES; TRABAJOS DE INGENIERÍA MECÁNICA EN GENERAL REALIZADOS A CAMBIO DE UNA RETRIBUCIÓN O POR CONTRATA INCLUYE SOLAMENTE EMPRESAS DEDICADAS A LAS PLANTAS PULIDORAS DE METALES

I-143 1851301

EMPRESAS DEDICADAS A ACTIVIDADES DE LA PRACTICA ODONTOLÓGICA INCLUYE LAS ACTIVIDADES DE CONSULTA Y TRATAMIENTO REALIZADO POR ODONTÓLOGOS EN INSTITUCIONES PRESTADORAS DE SERVICIOS DE SALUD SIN INTERNACIÓN

I-144 2552401 EXPENDIO, POR AUTOSERVICIO, DE COMIDAS PREPARADAS EN CAFETERÍAS

I-145 1804401 ESTABLECIMIENTOS QUE PRESTAN EL SERVICIO DE EDUCACIÓN BÁSICA PRIMARIA Y BÁSICA SECUNDARIA EN LA MISMA UNIDAD FÍSICA

I-146 3631001 EMPRESAS DEDICADAS A LA MANIPULACIÓN DE CARGA INCLUYE SOLAMENTE ESTIBADORES, COTEROS, PALETIZADORES EXCEPTO CARGUE Y DESCARGUE DE EMBARCACIONES AÉREAS, MARÍTIMAS Y/O FLUVIALES

I-147 3155102 EMPRESAS DEDICADAS A LA ELABORACIÓN DE PRODUCTOS DE PANADERÍA INCLUYE SOLAMENTE FABRICACIÓN DE GALLETAS, PASTAS ALIMENTICIAS, ELABORACIÓN DE PAN Y PASTELES

I-148 2011501 EMPRESAS DEDICADAS A LA PRODUCCIÓN ESPECIALIZADA DE CEREALES Y OLEAGINOSAS

Page 60: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

60

Intervalo Código

CIIU Actividad Económica

I-149 2852001 EMPRESAS DEDICADAS A ACTIVIDADES VETERINARIAS INCLUYE LA ZOOTECNIA, CRÍA DE ANIMALES DOMÉSTICOS, Y EMPRESAS DEDICADAS A ACTIVIDADES PECUARIAS Y/O VETERINARIA EN GENERAL

I-150 2551201 ALOJAMIENTO EN "RESIDENCIAS", "MOTELES" Y " AMOBLADOS" HOSPEDAJE INFERIOR A UN DÍA

I-151 3742102

EMPRESAS DEDICADAS A ACTIVIDADES DE ARQUITECTURA E INGENIERÍA Y ACTIVIDADES CONEXAS DE ASESORAMIENTO TÉCNICO INCLUYE SOLAMENTE LAS EMPRESAS DEDICADAS A EL TRABAJO DE CAMPO DE HIDROLOGÍA Y/O METEOROLOGÍA, TOPOGRAFÍA, AGRIMENSURA Y/O ESTUDIOS CATASTRALES.

I-152 4454202

TRABAJOS DE ELECTRICIDAD INCLUYE SOLAMENTE EMPRESAS DEDICADAS A LOS TRABAJOS ESPECIALIZADOS DE INSTALACIÓN DE ALUMBRADO Y SEÑALIZACIÓN ELÉCTRICA DE CARRETERAS Y LOS TRABAJO DE INSTALACIÓN DE CENTRALES DE ENERGÍA, TRANSFORMADORES, SISTEMAS DE ALARMA.

I-153 5289103 FORJA, PRENSADO, ESTAMPADO Y LAMINADO DE METAL; PULVIMETALURGIA INCLUYE SOLAMENTE A EMPRESAS DEDICADAS A LAS PLANTAS DE LAMINACIÓN.

I-154 1930901 EMPRESAS DEDICADAS A OTRAS ACTIVIDADES DE SERVICIOS NCP INCLUYE LOS BAÑOS TURCOS

I-155 2851202 EMPRESAS DEDICADAS A ACTIVIDADES DE LA PRACTICA MEDICA INCLUYE LOS SERVICIOS MÉDICOS Y/O PARAMÉDICOS ASISTENCIALES DOMICILIARIOS EXCEPTO SERVICIOS DE PREVENCIÓN Y/O PROMOCIÓN

I-156 3410001 EMPRESAS DEDICADAS A LA CAPTACIÓN, DEPURACIÓN Y DISTRIBUCIÓN DE AGUA INCLUYE LA EMPRESAS DE SERVICIOS DE ACUEDUCTO Y/O ALCANTARILLADO, LAS PLANTAS DE TRATAMIENTO DE AGUAS BLANCAS.

I-157 3524101

EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR DE ARTÍCULOS DE FERRETERÍA, CERRAJERÍA Y PRODUCTOS DE VIDRIO, EXCEPTO PINTURAS EN ESTABLECIMIENTOS ESPECIALIZADOS INCLUYE SOLAMENTE LA VENTA DE HIERROS

I-158 2753001 EMPRESAS DEDICADAS A ACTIVIDADES DE SEGURIDAD SOCIAL DE AFILIACIÓN OBLIGATORIA INCLUYE LOS SERVICIOS DE PREVENCIÓN DE RIESGOS PROFESIONALES Y/O AMBIENTALES

I-159 2672101 EMPRESAS DEDICADAS A ACTIVIDADES AUXILIARES DE LOS SEGUROS INCLUYE LOS SERVICIOS DE AJUSTADORES DE SEGUROS

I-160 1505201 EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR DE LUBRICANTES (ACEITES, GRASAS), ADITIVOS Y PRODUCTOS DE LIMPIEZA PARA VEHÍCULOS AUTOMOTORES

I-161 2551901 EMPRESAS DEDICADAS A OTROS TIPOS DE ALOJAMIENTO NCP INCLUYE CASAS DE HUÉSPEDES, PENSIONES, RESIDENCIAS ESTUDIANTILES, ALBERGUES U HOGARES JUVENILES.

I-162 2712201 EMPRESAS DEDICADAS AL ALQUILER DE MAQUINARIA Y EQUIPO DE CONSTRUCCIÓN Y DE INGENIERÍA CIVIL

I-163 2020101 EMPRESAS DEDICADAS A LA SILVICULTURA Y EXPLOTACIÓN DE LA MADERA

I-164 1671901 ACTIVIDADES AUXILIARES DE LA ADMINISTRACIÓN FINANCIERA NCP HACE REFERENCIA A EMPRESAS DEDICADAS A TODAS LAS ACTIVIDADES AUXILIARES DE LA INTERMEDIACIÓN FINANCIERA NO CLASIFICADA EN OTRA

Page 61: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

61

Intervalo Código

CIIU Actividad Económica

PARTE, ASÍ COMO EL SERVICIO DE ASESORES FINANCIEROS, ASESORES Y CORRED

I-165 1515301 EMPRESAS DEDICADAS AL COMERCIO AL POR MAYOR DE PRODUCTOS QUÍMICOS BÁSICOS, PLÁSTICOS Y CAUCHO EN FORMAS PRIMARIAS Y PRODUCTOS QUÍMICOS DE USO AGROPECUARIO

I-166 4602201 EMPRESAS DEDICADAS AL TRANSPORTE INTERMUNICIPAL COLECTIVO REGULAR DE PASAJEROS

I-167 3172001 EMPRESAS DEDICADAS A LA TEJEDURA DE PRODUCTOS TEXTILES INCLUYE SOLAMENTE LA FABRICACIÓN DE GASAS, VENDAS, ALGODÓN Y SIMILARES, TELAS EN GENERAL

I-168 5371001 RECICLAJE DE DESPERDICIOS Y DE DESECHOS METÁLICOS

I-169 1524301

EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR DE MUEBLES PARA OFICINA, MAQUINARIA Y EQUIPO DE OFICINA, COMPUTADORES Y PROGRAMAS DE COMPUTADOR, EN ESTABLECIMIENTOS ESPECIALIZADOS INCLUYE LA VENTA DE MÁQUINAS DE ESCRIBIR, COSER, CALCULAR

I-170 3151102 EMPRESAS DEDICADAS A PRODUCCIÓN, TRANSFORMACIÓN Y CONSERVACIÓN DE CARNE Y DE DERIVADOS CÁRNICOS INCLUYE SOLAMENTE LOS MATADEROS

I-171 1751501 EMPRESAS DEDICADAS A ACTIVIDADES AUXILIARES DE SERVICIOS PARA LA ADMINISTRACIÓN PUBLICA EN GENERAL

I-172 3517002

EMPRESAS DEDICADAS AL MANTENIMIENTO Y REPARACIÓN DE MAQUINARIA Y EQUIPO. INCLUYE SOLAMENTE TALLERES ELECTROMECÁNICOS, LA REPARACIÓN DE MAQUINARIA PESADA, LA REPARACIÓN, CARGA Y/O VENTA DE ACUMULADORES

I-173 3924102

EMPRESAS DEDICADAS A ACTIVIDADES DEPORTIVAS Y OTRAS EMPRESAS DEDICADAS A ACTIVIDADES DE ESPARCIMIENTO INCLUYE TODAS LAS ACTIVIDADES DEPORTIVAS PROFESIONALES DE FUTBOL, TENIS, BALONCESTO, ATLETISMO, BEISBOL.ETC.

I-174 1801201

ESTABLECIMIENTOS DE EDUCACIÓN BÁSICA PRIMARIA INCLUYE AQUELLOS DONDE SE DICTAN LOS PROGRAMAS DE ALFABETIZACIÓN PARA NIÑOS QUE NO ASISTEN A UN CENTRO EDUCATIVO, LA EDUCACIÓN ESPECIAL DIRIGIDA A NIÑOS Y JÓVENES CON LIMITACIONES O CAPACIDADES EXCEPCIONALES.

I-175 4511302

EMPRESAS DEDICADAS AL COMERCIO AL POR MAYOR A CAMBIO DE UNA RETRIBUCIÓN O POR CONTRATA DE PRODUCTOS MANUFACTURADOS INCLUYE SOLAMENTE EMPRESAS DEDICADAS AL COMERCIO AL POR MAYOR DE PRODUCTOS QUÍMICOS EXCEPTO LOS MUTAGENICOS, TERATOGENICOS Y CANCERIGENOS.

I-176 1527201 EMPRESAS DEDICADAS A LA REPARACIÓN DE ENSERES DOMÉSTICOS INCLUYE TAPICERÍAS

I-177 1804101 ESTABLECIMIENTOS QUE PRESTAN EL SERVICIO DE EDUCACIÓN PREESCOLAR Y BÁSICA PRIMARIA EN LA MISMA UNIDAD FÍSICA

I-178 5452201 CONSTRUCCIÓN DE EDIFICACIONES PARA USO NO RESIDENCIAL

I-179 1721001

EMPRESAS DEDICADAS A CONSULTORÍA EN EQUIPO DE INFORMÁTICA INCLUYE LOS SERVICIOS DE CONSULTORES EN TIPOS Y CONFIGURACIONES DE LOS EQUIPOS DE INFORMÁTICA CON O SIN APLICACIÓN DE LOS CORRESPONDIENTES PROGRAMAS DE INFORMÁTICA.

Page 62: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

62

Intervalo Código

CIIU Actividad Económica

I-180 2050201 EMPRESAS DEDICADAS A ACTIVIDADES DE SERVICIOS RELACIONADOS CON LA PESCA INCLUYE LOS SERVICIOS DE ADMINISTRACIÓN DE GRANJAS PISCÍCOLAS Y ACUÍCOLA

I-181 4604401 EMPRESAS DEDICADAS AL ALQUILER DE VEHÍCULOS DE CARGA CON CONDUCTOR

I-182 1522301 EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR DE CARNES, PRODUCTOS CÁRNICOS, PESCADOS Y PRODUCTOS DE MAR,

I-183 3519002 EMPRESAS DEDICADAS AL COMERCIO AL POR MAYOR DE PRODUCTOS DIVERSOS NCP INCLUYE SOLAMENTE EMPRESAS DEDICADAS A LA VENTA DE MATERIALES PARA CONSTRUCCIÓN CON AUTOTRANSPORTE

I-184 4514102 EMPRESAS DEDICADAS AL COMERCIO AL POR MAYOR DE MATERIALES DE CONSTRUCCIÓN, FERRETERÍA Y VIDRIO INCLUYE SOLAMENTE LA VENTA DE MATERIALES PARA CONSTRUCCIÓN CON AUTOTRANSPORTE

I-185 4641201

EMPRESAS DEDICADAS A ACTIVIDADES DE CORREO DISTINTAS DE LAS EMPRESAS DEDICADAS A ACTIVIDADES POSTALES NACIONALES INCLUYE SOLAMENTE EMPRESAS DEDICADAS A CORREOS, MENSAJERÍA, TRÁMITES Y SIMILARES

I-186 5203001 FABRICACIÓN Y MONTAJE DE PARTES Y PIEZAS DE CARPINTERÍA PARA EDIFICIOS Y CONSTRUCCIONES

I-187 4242202 EMPRESAS DEDICADAS A LA FABRICACIÓN DE PINTURAS, BARNICES Y REVESTIMIENTOS SIMILARES, INCLUYE SOLAMENTE EMPRESAS DEDICADAS A LA FABRICACIÓN TINTAS PARA IMPRENTA

I-188 2174101

EMPRESAS DEDICADAS A LA CONFECCIÓN DE ARTÍCULOS CON MATERIALES TEXTILES NO PRODUCIDOS EN LA MISMA UNIDAD, EXCEPTO PRENDAS DE VESTIR INCLUYE LAS CONFECCIONES EN TELA CON EXCEPCIÓN DE COLCHONES.

I-189 1742101

EMPRESAS DEDICADAS A ACTIVIDADES DE ARQUITECTURA E INGENIERÍA Y ACTIVIDADES CONEXAS DE ASESORAMIENTO TÉCNICO INCLUYE ACTIVIDADES DE DIRECCIÓN DE OBRAS DE CONSTRUCCIÓN, AGRIMENSURA Y DE EXPLOTACIÓN Y PROSPECCIÓN GEOLÓGICAS, ASÍ COMO LA PRESTACIÓN DE ASESORA

I-190 3924902

OTRAS EMPRESAS DEDICADAS A ACTIVIDADES DE ESPARCIMIENTO. REPRODUCCIÓN DE MATERIALES GRABADOS POR CONTRATA INCLUYE SOLAMENTE LAS EMPRESAS DEDICADAS A LOS SERVICIOS DE ORGANIZACIÓN DE EVENTOS CULTURALES Y/O RECREATIVOS MASIVOS

I-191 3158101 EMPRESAS DEDICADAS A LA ELABORACIÓN DE CACAO, CHOCOLATE Y PRODUCTOS DE CONFITERÍA INCLUYE LA MOLIENDA Y/O FABRICACIÓN DE PRODUCTOS DE CACAO, DULCES, CHOCOLATES Y SIMILARES

I-192 3454101 INSTALACIONES HIDRÁULICAS Y TRABAJOS CONEXOS INCLUYE SOLAMENTE EMPRESAS DEDICADAS A PLOMERÍAS

I-193 3642101 SERVICIOS TELEFÓNICOS INCLUYE SOLAMENTE EMPRESAS DEDICADAS A TELECOMUNICACIONES

I-194 1804301 ESTABLECIMIENTOS QUE PRESTAN EL SERVICIO DE EDUCACIÓN PREESCOLAR, BÁSICA PRIMARIA - BÁSICA SECUNDARIA Y MEDIA DE CARÁCTER ACADÉMICO O TÉCNICO EN LA MISMA UNIDAD FÍSICA

Page 63: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

63

Intervalo Código

CIIU Actividad Económica

I-195 1660101

PLANES DE SEGUROS GENERALES HACE REFERENCIA A EMPRESAS DEDICADAS A LOS SEGUROS INCLUSO EL REASEGURO DISTINTOS DE LOS SEGUROS DE VIDA EJEMPLO SEGUROS CONTRA ACCIDENTES Y CONTRA INCENDIOS ETC, ASÍ COMO LOS PLANES DE MEDICINA PREPAGADA

I-196 1524601 EMPRESAS DEDICADAS AL COMERCIO AL POR MENOR DE EQUIPO ÓPTICO Y DE PRECISIÓN EN ESTABLECIMIENTOS ESPECIALIZADOS INCLUYE LA VENTA DE ARTÍCULOS DE ÓPTICA

I-197 1741301 EMPRESAS DEDICADAS A LA INVESTIGACIÓN DE MERCADOS Y REALIZACIÓN DE ENCUESTAS DE OPINIÓN PUBLICA

I-198 2512701 EMPRESAS DEDICADAS AL COMERCIO AL POR MAYOR DE BEBIDAS Y PRODUCTOS DEL TABACO HACE REFERENCIA A EMPRESAS DEDICADAS A BEBIDAS EMBOTELLADAS EN GENERAL, DEPOSITO Y/O VENTA AL MAYOREO.

I-199 4604301 EMPRESAS DEDICADAS AL TRANSPORTE INTERNACIONAL DE CARGA POR CARRETERA

I-200 4456001 ALQUILER DE EQUIPO PARA CONSTRUCCIÓN Y DEMOLICIÓN DOTADO DE OPERARIOS

I-201 1512501 EMPRESAS DEDICADAS AL COMERCIO AL POR MAYOR DE PRODUCTOS ALIMENTICIOS, EXCEPTO CAFÉ TRILLADO

I-202 3181003 EMPRESAS DEDICADAS A LA FABRICACIÓN DE PRENDAS DE VESTIR, EXCEPTO PRENDAS DE PIEL INCLUYE SOLAMENTE FABRICACIÓN MECANIZADA DE CORSÉS, FAJAS ELÁSTICAS, SOMBREROS DE FIELTRO

I-203 2153001 EMPRESAS DEDICADAS A LA ELABORACIÓN DE PRODUCTOS LÁCTEOS INCLUYE ELABORACIÓN DE HELADOS Y LA EMPRESAS DEDICADAS A LA FABRICACIÓN DE ARTESANAL DE PRODUCTOS Y/O DERIVADOS LÁCTEOS

I-204 3642601 SERVICIOS RELACIONADOS CON LAS TELECOMUNICACIONES

I-205 1804201 ESTABLECIMIENTOS QUE PRESTAN EL SERVICIO DE EDUCACIÓN PREESCOLAR Y BÁSICA PRIMARIA Y BÁSICA SECUNDARIA EN LA MISMA UNIDAD FÍSICA

I-206 2222001

EMPRESAS DEDICADAS A ACTIVIDADES DE IMPRESIÓN POR CONTRATA INCLUYE LA IMPRESIÓN DE AVISOS EN PLACAS METÁLICAS, ESTAMPADO, FABRICACIÓN DE CALCOMANÍAS, LA MANUFACTURA DE CUADERNOS, LIBRETAS EN BLANCO SOBRES, SIMILARES Y/O VENTA AL MAYOREO DE PAPEL

I-207 1515101 EMPRESAS DEDICADAS AL COMERCIO AL POR MAYOR DE COMBUSTIBLES SÓLIDOS, LÍQUIDOS, GASEOSOS Y PRODUCTOS CONEXOS"

I-208 2361101 EMPRESAS DEDICADAS A LA FABRICACIÓN DE MUEBLES PARA EL HOGAR INCLUYE CARPINTERÍAS Y EBANISTERÍAS (FABRICACIÓN DE ARTESANAL)

I-209 5701001 EMPRESAS DEDICADAS A ACTIVIDADES INMOBILIARIAS REALIZADAS CON BIENES PROPIOS O ARRENDADOS INCLUYE SOLAMENTE A EMPRESAS DEDICADAS A ACONDICIONAMIENTO DE TERRENOS

I-210 2152101

EMPRESAS DEDICADAS A LA ELABORACIÓN DE ALIMENTOS COMPUESTOS PRINCIPALMENTE DE FRUTAS, LEGUMBRES Y HORTALIZAS INCLUYE EL DESFIBRE, SECADO Y/O RAYADO DE COCO, LA ELABORACIÓN ARTESANAL DE CONSERVAS ALIMENTICIAS, LOS CONCENTRADOS DE FRUTAS

I-211 4453001 CONSTRUCCIÓN DE OBRAS DE INGENIERÍA CIVIL INCLUYE SOLAMENTE EMPRESAS DEDICADAS A LOS SERVICIOS DE DRAGADO

Page 64: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

64

Intervalo Código

CIIU Actividad Económica

I-212 4603201 EMPRESAS DEDICADAS AL TRANSPORTE COLECTIVO NO REGULAR DE PASAJEROS

I-213 4261002

EMPRESAS DEDICADAS A LA FABRICACIÓN DE VIDRIO Y DE PRODUCTOS DE VIDRIO INCLUYE SOLAMENTE EMPRESAS DEDICADAS A LA FABRICACIÓN Y/O GRABADO DE ARTÍCULOS EN VIDRIO, LA FABRICACIÓN DE EMPLOMADOS, VITRALES

I-214 1804601 ESTABLECIMIENTOS QUE PRESTAN EL SERVICIO DE EDUCACIÓN BÁSICA SECUNDARIA Y MEDIA DE CARÁCTER ACADÉMICO Y/O TÉCNICO EN LA MISMA UNIDAD FÍSICA

I-215 1659601

OTROS TIPOS DE CRÉDITO HACE REFERENCIA A EMPRESAS DEDICADAS A LA INTERMEDIACIÓN FINANCIERA POR INSTITUCIONES QUE NO PRACTICAN LA INTERMEDIACIÓN MONETARIA Y CUYA FUNCIÓN PRINCIPAL ES CONCEDER PRESTAMOS PARA LA COMPRA DE BIENES Y SERVICIOS, VIVIENDA ETC. LA

I-216 2242901 EMPRESAS DEDICADAS A LA FABRICACIÓN DE OTROS PRODUCTOS QUÍMICOS NCP INCLUYE LA FABRICACIÓN DE ESENCIAS

I-217 3342001 EMPRESAS DEDICADAS A LA FABRICACIÓN DE CARROCERÍAS PARA VEHÍCULOS AUTOMOTORES; INCLUYE LA FABRICACIÓN DE REMOLQUES Y SEMIRREMOLQUES, FABRICACIÓN Y/O REPARACIÓN DE CARROCERÍAS

I-218 3192601 EMPRESAS DEDICADAS A LA FABRICACIÓN DE PARTES DEL CALZADO INCLUYE LA FABRICACIÓN DE OJETES PARA ZAPATOS

I-219 3369401 EMPRESAS DEDICADAS A LA FABRICACIÓN DE JUEGOS Y JUGUETES

I-220 5454902 OTROS TRABAJOS DE ACONDICIONAMIENTO

I-221 3551902 OTROS TIPOS DE ALOJAMIENTO NCP HACE REFERENCIA A EMPRESAS DEDICADAS A LAS EMPRESAS DE SERVICIOS DE COCHES-DORMITORIOS Y/O COMEDORES A BORDO DE FERROCARRILES

I-222 5281201 FABRICACIÓN DE TANQUES, DEPÓSITOS Y RECIPIENTES DE METAL INCLUYE SOLAMENTE A EMPRESAS DEDICADAS A LA CONSTRUCCIÓN DE TORRES DE PETRÓLEO, TANQUE ELEVADOS, FUNICULARES Y/O CABLES AÉREOS.

I-223 1804501 ESTABLECIMIENTOS QUE PRESTAN EL SERVICIO DE EDUCACIÓN BÁSICA PRIMARIA - BÁSICA SECUNDARIA Y MEDIA DE CARÁCTER ACADÉMICO Y/ O TÉCNICO EN LA MISMA UNIDAD FÍSICA

I-224 4300002

EMPRESAS DEDICADAS A LA FABRICACIÓN DE MAQUINARIA DE OFICINA, CONTABILIDAD E INFORMÁTICA INCLUYE SOLAMENTE EMPRESAS DEDICADAS A EQUIPO DE REPRODUCCIÓN PARA OFICINAS, FABRICACIÓN DE MÁQUINAS QUE CLASIFICAN, EMPAQUETAN O CUENTAN MONEDAS, EXPENDEDORAS AUTOMA

I-225 1749101 EMPRESAS DEDICADAS A LA OBTENCIÓN Y SUMINISTRO DE PERSONAL INCLUYE AGENCIAS DE EMPLEO

I-226 5272902 INDUSTRIAS BÁSICAS DE OTROS METALES NO FERROSOS

I-227 4712102 EMPRESAS DEDICADAS AL ALQUILER DE MAQUINARIA Y EQUIPO AGROPECUARIO

Page 65: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

65

Bibliografía

Aguilar, B., Saraí (2005). “Fórmulas para el cálculo de la muestra en investigaciones

de salud Salud en Tabasco”, vol. 11, núm. 1-2, enero-agosto, 2005, pp. 333-338.

Arango, A., M y Misas, M. (2004). “La Demanda de Especies Monetarias en

Colombia: Estructura y Pronostico”, Banco de la República, Borradores de economía, No.

309.

Arrow, K.J., (1963). “Uncertainty & the welfare economics of medical care”,

American Economic Review 53, pp. 941–969.

Arrow, K.J., (1965). “Insurance, Risk & Resource Allocation”. Aspects of the Theory

of Risk-Bearing. Yrjö Jahnsson Foundation, Helsinki, pp. 134–143 (Reprinted in Arrow,

K.J., 1971. Essays in the Theory of Risk Bearing. Elsevier Publishing Company Inc.).

Arrow, K.J., (1974). “Optimal insurance and generalized deductibles”. Scandinavian

Actuarial Journal 1, 1–42.

Arrow, K.J., Fischer, A.C., (1974). “Environmental preservation, uncertainty and

irreversibility”. Quarterly Journal of Economics 88, 312–319.

Borch, K., (1960). “The safety loading of reinsurance premiums”. Skandinavisk

Aktuarietidskrift, 163–184.

Borch, K., (1961). “The utility concept applied to the theory of insurance”. Astin

Bulletin 1, 245–255.

Borch, K., 1962. “Equilibrium in a reinsurance market”. Econometrica 30, 424–444.

Page 66: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

66

Artı́s, M, Ayuso, M, & Guillén, M (1999). “Modelling Different Types of Automobile

Insurance Fraud Behaviour in the Spanish Market”, Insurance: Mathematics and Economics

24(1-2): 67–81.

Belhadji E.B., Dionne G., & Tarkhani F. (2000). “A Model for the Detection of

Insurance Fraud.”, The Geneva Papers 25(4): 517–38.

Bertsimas, D., R. Freund. (2005). “Data, Models and Decisions”, Dynamic Ideas,

Belmont, MA.

De la Espriella, C (2012). "Fraude en seguros, Una aproximación al caso

colombiano". Disponible en:

http://www.fasecolda.com/files/7413/9101/0544/parte_i.captulo_15_fraude_en_seguros.pdf

J.E. Dennis Jr. & R.B. Schnabel (1983), “Numerical Methods for Uncon- strained

Optimization and Nonlinear Equations”, Englewood Cliffs, N.J.: Prentice Hall, 1983.

Derrig, R (2002). "Insurance Fraud". Source: The Journal of Risk and Insurance, Vol.

69, No. 3, pp. 271-287. Disponible en: http://www.jstor.org/stable/1558678

Derrig, R A, & Ostaszewski, M (2016). “Fuzzy Techniques of Pattern Recognition in

Risk and Claim Classification”, The Journal of Risk and Insurance, Vol. 62, No. 3,

Symposium on Insurance Solvency and Finance (Sep .,1.” 62(3): 447–82.

Derrig, R. A., Weisberg, I, & Chen, X, (1994), “Behavioral Factors and Lotteries

Under No-Fault with a Monetary Threshold: A Study of Massachusetts Automobile Claims”,

Journal of Risk & Insurance, 61: 245-275.

Dionne, G, & Harrington, S, (2014). Handbook of the Economics of Risk and

Uncertainty Chapter 5 – Insurance and Insurance Markets. Elsevier B.V.

http://www.sciencedirect.com/science/article/pii/B9780444536853000052.

Finaly, S (2011), “Multiple classifier architectures and their application to credit risk

assessment”, European Journal of Operational Research, Volume 210, Issue 2, Pages 368–

378.

Page 67: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

67

Golmohammadi, D, & Radnia, (2016). “Prediction Modeling and Pattern Recognition

for Patient Readmission.” International Journal of Production Economics 171: 151–61.

http://dx.doi.org/10.1016/j.ijpe.2015.09.027.

R.L. Grossman, C. Kamath, P. Kegelmeyer, V. Kumar, R. Namburum (2013). “Data

Mining for Scientific and Engineering Applications”, Data Mining for Scientific and

Engineering Applications, Springer Science & Business Media, volume 2.

Hand, D. J., & W. E. Henley (1997). “Statistical Classification Methods in Consumer

Credit Scoring: A Review.” Journal of the Royal Statistical Society: Series A (Statistics in

Society) 160(3): 523–41. http://www.blackwell-synergy.com/doi/abs/10.1111/j.1467-

985X.1997.00078.x.

He, H. Wang,J. Graco, W. Hawkins, S (1997). "Application of neural networks to

detection of medical fraud", Expert Systems with Applications, Vol 13, Issue 4, pp 329 –

336.

Herbrich, R, Keilbach, M, Bollmann, P, Obermayer, K (1999), “Neural Networks in

Economics: Background, Applications and New Developments”, Advances in

Computational Economics, volume 11, pp 169-196.

Herland, M, Khoshgoftaar, T, & Wald R (2014), “A review of data mining using big

data in health informatics”, Journal Of Big Data, volume 1, issue 1, pp 2.

Hinton, E (1989), “A penalty-function approach for pruning feedforward neural

networks”, Artificial Intelligence, volume 40., issue 1-3, pp 185-234.

Lu, H, Setiono R, Liu, H (1995), "Neuro Rule: A Connectionist Approach to Data

Mining". Proceedings of the Twenty-First International Conference on Very Large Data

Bases, pp 478-489.

Huan JL, Pai V, Teredesai AM, Yu (2013), IEEE Workshop on BigData In

Bioinformatics and Health Care Informatics. http://www.ittc.ku.edu/~jhuan/BBH/

Derrig, R (2002), “Insurance Fraud”, Journal of Risk and Insurance, Vol. 69, No. 3

(Sep., 2002), pp. 271-287

Page 68: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

68

Iregui, A, Melo, L, Ramírez, M,(2013), “Rigidez a la baja en los salarios y respuestas

de las empresas a una desaceleración económica: evidencia de una encuesta a empresas

colombianas”, Reportes de Investigación, 2013.

Jalil, M & Misas, M (2006), “Evaluación de pronósticos del tipo de cambio utilizando

redes neuronales y funciones de perdida asimétricas”, Banco de la República , Borradores de

economía, No 376.

Jones, A (2000). 1 Handbook of Health Economics Chapter 6 Health Econometrics.

Elsevier Science B.V. http://dx.doi.org/10.1016/S1574-0064(00)80165-1.

Kambatla, K, Kollias, G, Kumar, V, Grama, A, (2014), “Trends in big data analytics”,

Journal of Parallel and Distributed Computing, 2014, volume 74, Issue 7, pp 2561-2573.

Klerfors, D. (1998), “Artificial Neural Networks: What are they?, How do they

work?, In what areas are they used?”, Saint Louis University, School of Business &

Administration.

Krugman, P (2009). The Return of Depression Economics and the Crisis of 2008.

W.W.Norton Company Limited.

Lemus J, Corredor A, Gutiérrez J (2012), “Fragility Determinants of the Private

Corporate Sector in Colombia”, Banco de la República, Temas de Estabilidad Financiera,

No 66 2012.

Lessmann, S.,Baesens B, Seowd H, Thomas C (2015), “Benchmarking state-of-the-

art classification algorithms for credit scoring: An update of research”, European Journal of

Operational Research, No 247, pp 124–136.

J. Li, K. Huang, J. Jin, J. Shi (2008) , “A survey on statistical methods for health care

fraud detection”, Journal of Health Care Management Science 11 (3), pp 275–287.

Lloyd,S. (1957). Least squares quantization in pcm. IEEE Transactions on

Information Theory, 28:129–137.

Aral, K, Güvenir, H, Sabuncuoĝlu, I, Akar, A (2012) “A prescription fraud detection

model”, Computer methods and programs in biomedicine, Vol 106 , Issue 1, pp 37–46.

Page 69: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

69

Liao, H, Wang Bin, & Weyman-Jones, T (2007). “Neural Network Based Models for

Efficiency Frontier Analysis: An Application to East Asian Economies’ Growth

Decomposition.”, Global Economic Review 36(4): pp 361–84. Disponible en:

http://www.tandfonline.com/doi/abs/10.1080/12265080701694561.

Liu, H, & Tan, S(1995), “X2R: A Fast Rule Generator.” Proceedings of the IEEE

International Conference on Systems, Man and Cybernetics: 1631–35.

Lu H, Setiono R, & Liu H, (1996), “Effective Data Mining Using Neural Networks”

Hongjun, IEEE transactions on knowledge and data engineering, vol. 8, no. 6, pp 957.

Major, J, & Riedingerl, D (2016). “EFD : A Hybrid Knowledge / Statistical-Based

System for the Detection of Fraud”, American Risk and Insurance Association, Stable URL :

http://www.jstor.org/stable/1558680 REFERENCES Linked Ref.” 69(3): 309–24.

Misas M & López E. (2009), “La formación de precios en las empresas colombianas:

evidencia a partir de una encuesta directa”, Banco de la Republica, Borradores de economía,

No 569. Disponible en: http://www.banrep.gov.co/docum/ftp/borra569.pdf

Misas, M., E. López, C. Arango & N. Hernández (2003). “La Demanda de Efectivo

en Colombia: Una Caja Negra a la Luz de las Redes Neuronales”, Banco de la República,

Borradores de Economía, No 268.

Misas M, López E & Querubín P, (2002)," La inflación en Colombia: una

aproximación desde las redes neuronales". Disponible en:

http://www.banrep.gov.co/docum/ftp/borra199.pdf

Paleologo, G,Elisseeff, A. & Antonini, G (2010). “Subagging for credit scoring

models”, European Journal of Operational Research, Volume 201, Issue 2, Pages 490–499.

Patidar, R. Sharma, L (2011). "Credit card fraud detection using neural network" [en

línea]. International Journal of soft computing and engineering. ISSN: 2231-2307, Vol 1.

Disponible en:

http://www.ijsce.org/attachments/File/NCAI2011/IJSCE_NCAI2011_025.pdf

Page 70: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

70

Pavlidis, N., Dimitris, D., Tasoulis, K., Adams, N., & Hand, D., (2012). “Adaptive

Consumer Credit Classification.”, Journal of the Operational Research Society 63(12): 1645–

54. http://dx.doi.org/10.1057/jors.2012.15.

Picón, C., (2011). “¿Son más corruptos los países menos abiertos a los mercados

internacionales?”, Revista de economía del caribe, No 8, pp 45-79.

Powers, D (2007). “Evaluation: From Precision, Recall and F-Factor to ROC,

Informedness, Markedness & Correlation.”, School of Informatics and Engineering Flinders

University • Adelaide • Australia, Technical Report SIE-07-001.

Setiono, R,(1997).“A penalty-function approach for pruning feedforward neural

networks”, Neural Computation, vol 9, issue 1, pages 185-204.

Restrepo, M (2006). “Evaluación asimétrica de una red neuronal artificial: Aplicación

al caso de la inflación en Colombia!”, Banco de la República, Borradores de economía, No

377.

Viaene, S., Derrig, R., Baesens, B., & Dedene, G., (2016). “A Comparison of State-

of-the-Art Classification Techniques for Expert Automobile Insurance Claim Fraud

Detection”, The Journal of Risk and Insurance, Vol . 69 , No . 3.” 69(3): 373–421.

Brockett, P., Xia, X., & Derrig, R., (2016), “Using Kohonen’s Self-Organizing

Feature Map to Uncover Automobile Bodily Injury Claims”. American Risk and Insurance

Association Stable URL : Http://www.jstor.org.” 65(2): 245–74.

Russell, S & Norvig, P (2003). “Artificial Intelligence: A Modern Approach”,

Prentice Hall, (second edition).

Salazar, J (2009). “Evaluación de pronóstico de una red neuronal sobre el PIB en

Colombia”, Banco de la República, Borradores de economía, No 575.

Tan, P., Steinbach, M., & Kumar, V. (2006). “Classification: Basic Concepts,

Decision Trees, and Model Evaluation.”, Introduction to Data Mining 67(17): 145–205.

http://www-users.cs.umn.edu/~kumar/dmbook/index.php.

Page 71: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

71

Bertsimas, D., Bjarnadóttir, M., Kane, M., Kryder, C., Pandey, R., Vempala, S., &

Wang, G (2008), “Algorithmic Prediction of Health-Care Costs”, Operations Research in

Health Care (Nov. - Dec., 2008), Vol. 56, No. 6, , pp. 1382-1392.

Torres, J (2006).“Modelos para la inflación básica de bienes transables y no transables

en Colombia”, Banco de la República, Borradores de economía, No 365.

Villamil, J (2009). “Aproximación no lineal al modelo de overshooting usando redes

neuronales multlcapa para el tipo de cambio dólar-peso”, Cuadernos de Economia,

Universidad Nacional de Colombía, Volumen 28, Núm 50.

Weisberg, H. & Derrig, R. (1998). "Quantitative Methods for detecting fraudulent

Automobile Bodily Injury Claims", [en línea]. Disponible en:

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.486.7588&rep=rep1&type=pdf

Whittaker, J, Whitehead C, & Somers M.(2006). “A Dynamic Scorecard for

Monitoring Baseline Performance with Application to Tracking a Mortgage Portfolio.”

Journal of the Operational Research Society 58(7): 911–21. http://www.palgrave-

journals.com/doifinder/10.1057/palgrave.jors.2602226.

Yuan Q, Nsoesie EO, Lv B, Peng G, Chunara R, Brownstein JS (2013), “Monitoring

influenza epidemics in China with search query from Baidu”. PLoS ONE 8(5): e64323. [doi:

10.1371/journal.pone.0064323]

Association of Certifiead Fraud Examiners. 2015. "What is Fraud?" [En línea].

Disponible en: http://www.acfe.com/fraud-101.aspx [Accessed 17 Nov. 2015]

Bancoldex. "Programa de prevención de Riesgos de Fraude y Corrupción"[en línea].

Versión 4. [Fecha de consulta: 05 de Noviembre de 2015]. Disponible en

http://www.bancoldex.com/documentos/4667_Programa_de_Prevencion_Riesgos_de_Frau

de_y_Corrupcion.pdf

Circular Externa 041 de 2007. Superintendencia de Colombia. "Capitulo XXIII

Reglas relativas a la administración del riesgo operativ" [en línea]. Disponible en:

http://www.fasecolda.com/files/4713/8437/8023/anexo_cir_ext_041_de_2007.pdf

Page 72: Redes Neuronales para Clasificación: Una aplicación al ...

Facultad de Ciencias Económicas y Administrativas

Maestría en Economía

72

Fasecolda. "Cuidado con la afiliación irregular a Riesgos Laborales" [En línea]12 de

Mayo de 2015 [fecha de consulta: 22 de Junio de 2015]. disponible en:

http://www.fasecolda.com/index.php/sala-de-prensa/noticias/2015/sector-mayo-12-2015