Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes...

51
Redes Neuronales Artificiales Academia Mexicana de Informática A.C.

Transcript of Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes...

Page 1: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Redes Neuronales Artificiales

Academia Mexicana deInformática A.C.

Page 2: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Aplicación de Redes Neuronales Artificiales

Angel KuriCentro de Investigación en

ComputaciónI.P.N.

Abril de 1999

Page 3: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

El Modelo Conexionista

El paradigma conexionista se caracteriza por la obtención de capacidades decómputo a través de la interconexión demúltiples elementos, cada uno de los cuales posee poca capacidad de proce-so pero que, en su conjunto, exhiben robustez y permiten implementar un tipode aprendizaje interesante.

Page 4: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

El Modelo Conexionista

Dentro de los diversos modelos de redes neuronales artificiales (ANNs, por sus iniciales en inglés) uno muy usado es el de los perceptrones multicapa.

En este modelo se interconecta un con-junto de neuronas (perceptrones), en unesquema similar al que se muestra en la siguiente figura.

Page 5: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

El Perceptrón Multicapa

Figura 1. Una Red de Perceptrones.

Page 6: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

El Perceptrón Multicapa

Un perceptrón consiste de una neurona con pesos adaptables wj j=1,...,n y un umbral u como se muestra en la figura 2.

Los perceptrones (como el que se mues-tra en la figura 2) al ser interconectadosen red logran completez computacional.

Page 7: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

El Perceptrón Multicapa

Figura 2. Un Perceptrón.

Page 8: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

El Perceptrón Multicapa

La salida del perceptrón es +1 si v>0 y 0 en otro caso. Puede demostrarse que el perceptrón, como unidad lógica, es incompleto. Es decir, existen ciertas funciones lógicas básicas que un perceptrón no puede calcular.

Dado un vector de entradas x ),...,( 1 nxx= la entrada neta a la neurona es

∑=

−=n

jjj uxwv

1

Page 9: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

El Perceptrón Multicapa

Sin embargo, el perceptrón multicapa (PM) que se ilustra en la figura 1 puede formar fronteras de decisión de complejidad arbitraria y representar cualquier función booleana. El conjunto de entradas está representado por círculos sólidos. Las entradas y, posteriormente, cada neurona está fuertemente conectada a las neuronas de la siguiente capa.

Page 10: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

El Perceptrón Multicapa

Un algoritmo de entrenamiento muy usado para este tipo de redes es eldenominado “de retropropagación”. En este algoritmo es importante tener una función de activación derivable. Por ello, la función escalón de la figura 2 suele reemplazarse por la función sigmoide cuya gráfica se muestra en la figura 3.

Page 11: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

El Algoritmo de Retropropagación

1. Inicialice los pesos (wij) a pequeños valores aleatorios.2. Aleatoriamente seleccione un patrón de entrada x(u).3. Propague la señal hacia delante a través de la red.4. Calcule L

iδ en la capa de salida ( Lii yo = ), en donde:

])[(' Li

ui

Li

Li ydhg −=δ

lih representa la entrada neta a la i-ésima unidad de la l-ésima capa y g’ es la derivada de la

función de activación g; iu

d representa la salida deseada.

5. Calcule las deltas para las capas precedentes por medio de la propagación de los erroreshacia atrás;

∑+

=j ij

lw

il

hgil 1

)('δ

para l = (L – 1), ... ,1; g’(h) es la derivada de la función de activación.

Page 12: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

El Algoritmo de Retropropagación

6. Actualice los pesos usando

jl

yil

jil

w1−

=∆ δη ; 10 ≤<η

7. Vaya al paso 2 y repita para el siguiente patrón hasta que el error en la capa de salidaesté por debajo de un valor específico o un número máximo de iteraciones sea alcanzado.

Page 13: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

La Función Logística

Figura 3.

Page 14: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Derivabilidad de Funciones

Algunas funciones usadas son:Función Derivada

)(1)(1)(')(

))(1()()('1

1)(

1)(

zfzfzf

eeeezf

zfzfzfe

zf

zzf

zz

zz

z

−+=

+−=

−⋅=+

=

=

Page 15: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Derivabilidad de Funciones

La función logística y la tangente hiperbólica (tanh) son fácilmente derivables.

Tanto la logística como la tanh tienen laventaja de que su derivada puede serexpresada usando la función misma.

Page 16: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Caso de Estudio 1:Clasificación de Vinos

Presentamos aquí un caso de estudio endonde se aplica un red de percep-trones.

El problema consiste en lo siguiente:“Dado un conjunto de características químicas (13) de tres diferentes vinos,entrenar a la red para que reconozca a qué tipo corresponde un conjunto dado”.

Page 17: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Vinos

En la siguiente figura se muestra un seg-mento de los datos de entrenamiento.

Nótese que existen 13 características(“features”) y 3 columnas depertenencia (Wine_A, Wine_B, Wine_C).

La tabla de entrenamiento consta de un total de 160 filas.

Page 18: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Vinos

Page 19: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Vinos

Antes de entrenar a la red, es muy importante normalizar los valores. Estose hace usando la siguiente fórmula:

Su aplicación mapea los valores alintervalo

minmax

minnn xx

xxx−

−=*

]1,0[

Page 20: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Vinos

La arquitectura de la red está dictada porel número de entradas, el número desalidas y el número de capas ocultas.

El entrenamiento de la red consiste enencontrar los mejores valores correspondientes a los pesos que mejor ajusten los datos de prueba.

Page 21: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Vinos

Figura 4. Arquitectura de la Red.

Page 22: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para
Page 23: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Vinos

Figura 5. Resultado del Entrenamiento

Page 24: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Vinos

Figura 6. Resultado del Entrenamiento

Page 25: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Vinos

Figura 7. Interconexiones (vista parcial).

Page 26: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Vinos

En la figura 8 se muestran los resultadosde una prueba.

La parte superior de la figura muestra los valores de los datos de entrenamiento. La parte inferior muestra los resultadosde pasar dichos datos por la red neuronal.

Nótese la concordancia casi perfecta.

Page 27: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Vinos

Figura 8. Resultados de una Prueba

Page 28: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Caso de Estudio 2:Predicción de Demanda de Pasajeros

El segundo caso es el relativo a lapredicción de la demanda de pasajerosen una aerolínea.

Se conoce el comportamiento histórico de la demanda y se desea, en función deéste, predecir el comportamiento futuro.

Page 29: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Predicción de Demanda de Pasajeros

Los datos de la figura 9 indica una tendencia creciente muy clara.

Indican también, sin embargo, una conjunto de factores no lineales debidosa parámetros desconocidos

Page 30: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Predicción de Demanda dePasajeros

Figura 9. Comportamiento Histórico

Page 31: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Predicción de Demanda de Pasajeros

Figura 9a. Promedios Móviles

Page 32: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Promedios Móviles

La tendencia se elimina de los datos restando los promedios móviles, que secalculan de:

En donde f es el tamaño de la ventana.

Nfjxf

xj

fjnnj ,...,1

1=∀= ∑

+−=

Page 33: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Correlaciones

El proceso de análisis de correlaciones es cuantificar la independencia entre parámetros.

La interdependencia entre los valores x e y estádada por:

∑ ∑

= =

=

−−

−−=

N

n

N

nnn

n

N

nn

yyxx

yyxxr

1 1

22

1

)()(

))((

Page 34: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Correlaciones

A r se le llama el coeficiente de correlación Bravais-Pearson en donde:

N = número de datosxn= atributo del objeto n con relación a la característica

X= media de N atributos de la característica X

yn= atributo del objeto n con relación a la característicaY

= media de N atributos de la característica Y

x

y

Page 35: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Predicción de Demanda de Pasajeros

Figura 9b. Datos sin tendencias

Page 36: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Predicción de Demanda de Pasajeros

En este caso, las salidas deseadas serefieren a los mismos datos de entrada desplazados en el tiempo(12 meses).

El primer dato de entrada se refiere a los datos en t=1; el segundo dato deentrada se refiere a los datos en t=2, etc.

Esto se observa en la figura 10.

Page 37: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Predicción de Demanda dePasajeros

Figura 10. Datos de entrenamiento

Page 38: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Predicción de Demanda de Pasajeros

Como en el caso anterior, la arquitectura está dictada por la cantidad de datos de entrada ysalida.

Aquí tenemos 12 neuronas en la capa deentrada, pero solamente una neurona en lacapa oculta y 1 neurona en la capa de salida.

Page 39: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Predicción de Demanda de Pasajeros

Figura 11. La arquitectura de la red neuronal

Page 40: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para
Page 41: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Predicción de Demanda...

Figura 12. Resultados del entrenamiento

Page 42: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Predicción de Demanda...

Figura 13. Resultados del entrenamiento

Page 43: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Predicción de Demanda...

Figura 14. Interconexiones

Page 44: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Neuronas de Umbral

Las neuronas del PMC incluyen un umbral que condiciona el disparo de la función detransferencia. En las variantes primarias sepensaba que los valores de umbral se podían determinar manualmente.

Los diseños más recientes logran el ajuste deumbrales agragando una capa interna deneuronas que consiste exactamente de una neurona cuya entrada se ajusta a “1”.

Page 45: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Neuronas de Umbral

La denominada “neurona de umbral” (NP) seconecta a todas las neuronas de la red yactúa como un umbral ajustable para excitara las neuronas.

La ventaja de este modelo es que las conexiones de la NP (y sus umbrales) seentrenan junto con las conexiones “normales” del PMC, haciendo que la configuraciónmanual supérflua.

Page 46: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Predicción de Demanda...

Existen varias medidas de ajuste.Cada una de ellas expresa, de manera

diferente, qué tan lejana está la red bajo entrenamiento de los valores deseados.

Algunas de las posibles normas son MAE, MSE, RMSE y MAPE cuyos histogramas se muestran en la figura15.

Page 47: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Predicción de Demanda...

∑=

−=N

iii etTForecast

NMSE

1

2)arg(1

∑=

−=N

iii etTForecast

NRMSE

1

2)arg(1

∑=

−=N

i i

ii

etTetTForecast

NMAPE

1 argarg1

∑=

−=N

iii etTForecast

NMAE

1arg1

Page 48: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Predicción de Demanda...

Figura 15. Medidas de Ajuste de la Red.

Page 49: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Predicción de Demanda...

Figura 16. Valores reales vs. proyectados

Page 50: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Predicción de Demanda...

Figura 17. Valores reales vs. proyectados (sintendencias)

Page 51: Redes Neuronales Artificialescursos.itam.mx/akuri/2004/RNF_MTIA2004/01ANNS.pdf · Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para

Conclusiones

Las redes neuronales, en particular los perceptrones multicapa, son herra-mientas adecuadas para hacer análisisde datos que nos permiten clasificar ypredecir acertadamente.

El modelo de aprendizaje, aunque efectivo, tiene el inconveniente de notener características explicativas.