Download - Métodos heurísticos y estocásticos para búsqueda de óptimospardo/repo/Metodos%20heur...Curso de Doctorado: REPO, Métodos heurísticos y estocásticos 20 Bibliografía (I) •

Reconocimiento estadístico de patrones

Métodos heurísticos y estocásticos para búsqueda de óptimos

Grupo de Tecnología del Habla

Departamento de Ingeniería Electrónica

E.T.S.I. Telecomunicación

Universidad Politécnica de Madrid

José Manuel Pardo

Curso de Doctorado: REPO, Métodos heurísticos y estocásticos 2

Introducción I

• Estimación aprendizaje paramétrico:

– Métodos analíticos- problemas simples- (visto hasta ahora)

– Métodos exhaustivos- intratables

– Métodos heurísticos:

� De gradiente. Hill climbing

� Tabu search

– Métodos estocásticos

� Simulated annealing

� Algoritmos genéticos


Introducción II

• Comparación formal:

EstocásticosHeurísticos

Máximo local

A veces

Medio

Tabu Search

AltoMedioBajoCoste

computacional

NingunaMáximo localMáximo localSolución

garantizada

SíA vecesNo

Supera

máximos

locales

Genetic

Algorithms

Simulated

AnnealingHill climbing


Introducción III

• Comparación informal, Hill climbing:

Tomada de material de R. G. Clegg

Hill climbing es como soltar un canguro en algún lugar del globo

diciéndole que vaya solo hacia arriba y esperando que su punto final

sea el Monte Everest


Introducción IV

• Comparación informal, Simulated annealing:


Simulated Annealing es hacer lo mismo que antes pero

primero emborrachándole mucho

hic


Introducción IV

• Comparación informal, Algoritmos genéticos:


Algoritmos genéticos es como llenar un avión de canguros,

y dejar que se reproduzcan libremente


Introducción VI

• Comparación informal: Algoritmos géneticos


y matando regularmente a los que estén en

altitudes más bajas

Aaaargh!

Ouch


Otros problemas que se resuelven

• El problema TSP (the travelling salesman problem) es

un problema clásico de optimización. Un vendedor

debe visitar n ciudades en el tiempo más corto posible.

1

2

3

4

5

•1 ciudad tiene 1 orden posible

•2 ciudades tienen 2 “



•n ciudades tienen n! “

La dificultad es del orden O(n!)

El problema también tiene una

solución por programación

dinámica


Tabu search I

• Métodos iterativos y de vecindad hill climbing o

descending (revisited):

1.Elegir solución inicial entre las posibles S.

2.Definir conjunto de posibles soluciones siguientes N(i)

3.Encontrar una mejor solución en N(i)

(i.e. tal que f(j) ≤ f(k) para cualquier k en N(i)).

4.Si f(j) ≥ f(i) paramos, else i=j y vuelta a paso 2 S

N(i)

i


Tabu search II

1. Elegir solución inicial i entre las posibles S.

2. Generar un subconjunto V* de soluciones en N(i)

3. Encontrar una mejor solución j in V* (i.e. tal que f(j) ≤ f(k)

para cualquier k en V*) y hacer i=j.

4. Si f(j) ≥ f(i) paramos, else vuelta a paso 2

• En métodos tradicionales V* = N(i)

• Una buena elección de V* puede ser una

gran mejora y es crucial en TS

S

N(i)

i

V*


Tabu search III

• Algoritmo definitivo

1. Elegir solución inicial i entre las posibles S. i* = i y k=0

2. k=k+1 y generar un subconjunto V* de soluciones en N(i,k):

– No viola las condiciones tr(i,m)∈Tr

– Cumple una de las condiciones ar(i,m)∈Ar(i,m)

3. Encontrar una mejor solución j=i⊕m en V* (con respecto a alguna

función f o modificada) y hacer i=j.

4. Si f(i) ≤ f(i*) i*=i

5. Actualizar condiciones tabú tr y de aspiración ar

6. Si hay condición de terminación, paramos, else vuelta a paso 2


Simulated annealing

Configuracion normal y configuración imposible

Configuración normal Configuración imposible

Gráficas procedentes de [Duda01] © 2001 John Wiley & Sons


Simulated annealing

Situaciones típicas



Algoritmo


Algoritmo

• Cuatro aspectos para considerar:

– Representación de las soluciones

– Definición de la función de coste

– Definición de la función de generación del vecindario

– Diseño del esquema de enfriamiento:

� Temperatura inicial

� Regla de actualización de la temperatura

� Número de iteraciones que se realizan en cada iteración

� Criterio de parada

1±=is

∑=

−=N

ji

jiij ssE1,2

1ω

iestadodealeatoriaselección

( ) ↑↑0T

( ) ( ) ( ) ( )máxkTTTT ,,2,1,0 K

i nodo cada de visitas varias


Algoritmo

• Finalmente:

– Puedo guardar cada configuración en el caso de que el

mínimo final sea peor que alguno de los guardados.


Algoritmo

• Diseño del esquema de enfriamiento:

– T(0) debe ser suficientemente altacomo para que todas las soluciones tengan energía similar

– Enfriamiento debe ser suficientemente lento para evitar que quede atrapado en máximos locales

– T(kmáx) debe ser suficientemente bajacomo para que la solución no salga de un máximo global

– Esquema típico:

• Finalmente:

– Puedo guardar cada configuración en el caso de que el mínimo final sea peor que alguno de los guardados.

( ) ( ) 99,08,0,101 <<<<=+ cycconkcTkT


N=6, 26 configuraciones,

•transiciones en

negro, bajan la

energia

• transisciones en

rojo suben la

energía



Probabilidad de estar en cada estado


Bibliografía (I)

• Pattern Classification (2nd Edition)

Richard O. Duda, Peter E. Hart, David G. Stork

John Wiley & Sons. ISBN 0-471-05669-3. 2001

• C Programming (the Final Lecture)

R. G. Clegg

http://www.richardclegg.org/ccourse/

• A tutorial on Tabu Search

Alain Hertz1, Eric Taillard2, Dominique de Werra1

Disponible online en http://www.cs.colostate.edu/~whitley/CS640/hertz92tutorial.pdf


Bibliografía (II)