Reconocimiento estadístico de patrones
Métodos heurísticos y estocásticos para búsqueda de óptimos
Grupo de Tecnología del Habla
Departamento de Ingeniería Electrónica
E.T.S.I. Telecomunicación
Universidad Politécnica de Madrid
José Manuel Pardo
Curso de Doctorado: REPO, Métodos heurísticos y estocásticos 2
Introducción I
• Estimación aprendizaje paramétrico:
– Métodos analíticos- problemas simples- (visto hasta ahora)
– Métodos exhaustivos- intratables
– Métodos heurísticos:
� De gradiente. Hill climbing
� Tabu search
– Métodos estocásticos
� Simulated annealing
� Algoritmos genéticos
Curso de Doctorado: REPO, Métodos heurísticos y estocásticos 3
Introducción II
• Comparación formal:
EstocásticosHeurísticos
Máximo local
A veces
Medio
Tabu Search
AltoMedioBajoCoste
computacional
NingunaMáximo localMáximo localSolución
garantizada
SíA vecesNo
Supera
máximos
locales
Genetic
Algorithms
Simulated
AnnealingHill climbing
Curso de Doctorado: REPO, Métodos heurísticos y estocásticos 4
Introducción III
• Comparación informal, Hill climbing:
Tomada de material de R. G. Clegg
Hill climbing es como soltar un canguro en algún lugar del globo
diciéndole que vaya solo hacia arriba y esperando que su punto final
sea el Monte Everest
Curso de Doctorado: REPO, Métodos heurísticos y estocásticos 5
Introducción IV
• Comparación informal, Simulated annealing:
Tomada de material de R. G. Clegg
Simulated Annealing es hacer lo mismo que antes pero
primero emborrachándole mucho
hic
Curso de Doctorado: REPO, Métodos heurísticos y estocásticos 6
Introducción IV
• Comparación informal, Algoritmos genéticos:
Tomada de material de R. G. Clegg
Algoritmos genéticos es como llenar un avión de canguros,
y dejar que se reproduzcan libremente
Curso de Doctorado: REPO, Métodos heurísticos y estocásticos 7
Introducción VI
• Comparación informal: Algoritmos géneticos
Tomada de material de R. G. Clegg
y matando regularmente a los que estén en
altitudes más bajas
Aaaargh!
Ouch
Curso de Doctorado: REPO, Métodos heurísticos y estocásticos 8
Otros problemas que se resuelven
• El problema TSP (the travelling salesman problem) es
un problema clásico de optimización. Un vendedor
debe visitar n ciudades en el tiempo más corto posible.
1
2
3
4
5
•1 ciudad tiene 1 orden posible
•2 ciudades tienen 2 “
•3 ciudades tienen 6 “
•4 ciudades tienen 24 “
•n ciudades tienen n! “
La dificultad es del orden O(n!)
El problema también tiene una
solución por programación
dinámica
Curso de Doctorado: REPO, Métodos heurísticos y estocásticos 9
Tabu search I
• Métodos iterativos y de vecindad hill climbing o
descending (revisited):
1.Elegir solución inicial entre las posibles S.
2.Definir conjunto de posibles soluciones siguientes N(i)
3.Encontrar una mejor solución en N(i)
(i.e. tal que f(j) ≤ f(k) para cualquier k en N(i)).
4.Si f(j) ≥ f(i) paramos, else i=j y vuelta a paso 2 S
N(i)
i
Curso de Doctorado: REPO, Métodos heurísticos y estocásticos 10
Tabu search II
1. Elegir solución inicial i entre las posibles S.
2. Generar un subconjunto V* de soluciones en N(i)
3. Encontrar una mejor solución j in V* (i.e. tal que f(j) ≤ f(k)
para cualquier k en V*) y hacer i=j.
4. Si f(j) ≥ f(i) paramos, else vuelta a paso 2
• En métodos tradicionales V* = N(i)
• Una buena elección de V* puede ser una
gran mejora y es crucial en TS
S
N(i)
i
V*
Curso de Doctorado: REPO, Métodos heurísticos y estocásticos 11
Tabu search III
• Algoritmo definitivo
1. Elegir solución inicial i entre las posibles S. i* = i y k=0
2. k=k+1 y generar un subconjunto V* de soluciones en N(i,k):
– No viola las condiciones tr(i,m)∈Tr
– Cumple una de las condiciones ar(i,m)∈Ar(i,m)
3. Encontrar una mejor solución j=i⊕m en V* (con respecto a alguna
función f o modificada) y hacer i=j.
4. Si f(i) ≤ f(i*) i*=i
5. Actualizar condiciones tabú tr y de aspiración ar
6. Si hay condición de terminación, paramos, else vuelta a paso 2
Curso de Doctorado: REPO, Métodos heurísticos y estocásticos 12
Simulated annealing
Configuracion normal y configuración imposible
Configuración normal Configuración imposible
Gráficas procedentes de [Duda01] © 2001 John Wiley & Sons
Curso de Doctorado: REPO, Métodos heurísticos y estocásticos 13
Simulated annealing
Situaciones típicas
Gráficas procedentes de [Duda01] © 2001 John Wiley & Sons
Curso de Doctorado: REPO, Métodos heurísticos y estocásticos 14
Algoritmo
Curso de Doctorado: REPO, Métodos heurísticos y estocásticos 15
Algoritmo
• Cuatro aspectos para considerar:
– Representación de las soluciones
– Definición de la función de coste
– Definición de la función de generación del vecindario
– Diseño del esquema de enfriamiento:
� Temperatura inicial
� Regla de actualización de la temperatura
� Número de iteraciones que se realizan en cada iteración
� Criterio de parada
1±=is
∑=
−=N
ji
jiij ssE1,2
1ω
iestadodealeatoriaselección
( ) ↑↑0T
( ) ( ) ( ) ( )máxkTTTT ,,2,1,0 K
i nodo cada de visitas varias
Curso de Doctorado: REPO, Métodos heurísticos y estocásticos 16
Algoritmo
• Finalmente:
– Puedo guardar cada configuración en el caso de que el
mínimo final sea peor que alguno de los guardados.
Curso de Doctorado: REPO, Métodos heurísticos y estocásticos 17
Algoritmo
• Diseño del esquema de enfriamiento:
– T(0) debe ser suficientemente altacomo para que todas las soluciones tengan energía similar
– Enfriamiento debe ser suficientemente lento para evitar que quede atrapado en máximos locales
– T(kmáx) debe ser suficientemente bajacomo para que la solución no salga de un máximo global
– Esquema típico:
• Finalmente:
– Puedo guardar cada configuración en el caso de que el mínimo final sea peor que alguno de los guardados.
( ) ( ) 99,08,0,101 <<<<=+ cycconkcTkT
Curso de Doctorado: REPO, Métodos heurísticos y estocásticos 18
N=6, 26 configuraciones,
•transiciones en
negro, bajan la
energia
• transisciones en
rojo suben la
energía
Gráficas procedentes de [Duda01] © 2001 John Wiley & Sons
Curso de Doctorado: REPO, Métodos heurísticos y estocásticos 19
Probabilidad de estar en cada estado
Curso de Doctorado: REPO, Métodos heurísticos y estocásticos 20
Bibliografía (I)
• Pattern Classification (2nd Edition)
Richard O. Duda, Peter E. Hart, David G. Stork
John Wiley & Sons. ISBN 0-471-05669-3. 2001
• C Programming (the Final Lecture)
R. G. Clegg
http://www.richardclegg.org/ccourse/
• A tutorial on Tabu Search
Alain Hertz1, Eric Taillard2, Dominique de Werra1
Disponible online en http://www.cs.colostate.edu/~whitley/CS640/hertz92tutorial.pdf
Curso de Doctorado: REPO, Métodos heurísticos y estocásticos 21
Bibliografía (II)
Top Related