Luis Castillo , Juan Fdez-Olivares, Oscar García-Pérez, Francisco Palao

Post on 26-Jan-2016

59 views 1 download

description

Propagación de restricciones temporales mejorada mediante análisis de causa-efecto en planificación. Luis Castillo , Juan Fdez-Olivares, Oscar García-Pérez, Francisco Palao. Universidad de Granada. Grupo SEPIA. Esquema. Introducción al problema Planificación HTN y gestión del tiempo - PowerPoint PPT Presentation

Transcript of Luis Castillo , Juan Fdez-Olivares, Oscar García-Pérez, Francisco Palao

Propagación de restricciones Propagación de restricciones temporales mejorada mediante temporales mejorada mediante

análisis de causa-efecto en análisis de causa-efecto en planificaciónplanificación

Luis CastilloLuis Castillo, Juan Fdez-Olivares, , Juan Fdez-Olivares, Oscar García-Pérez, Francisco PalaoOscar García-Pérez, Francisco Palao

Universidad de Granada Grupo SEPIA

EsquemaEsquema

Introducción al problemaIntroducción al problema Planificación HTN y gestión del Planificación HTN y gestión del

tiempotiempo Propagación de restricciones Propagación de restricciones

temporalestemporales Propagación mejoradaPropagación mejorada

Introducción al problemaIntroducción al problema Planificación Planificación

para gestión para gestión de crisis:de crisis:Sistemas Inteligentes de Sistemas Inteligentes de Ayuda a la Decisión IDSSAyuda a la Decisión IDSS

Diseño de planes de actuaciónDiseño de planes de actuación Sistemas de planificación y scheduling Sistemas de planificación y scheduling

inteligentesinteligentes Cientos de recursosCientos de recursos Respuesta inmediata y robustaRespuesta inmediata y robusta Cientos o miles de acciones Cientos o miles de acciones

temporizadas, miles de restricciones temporizadas, miles de restricciones temporales y de recursostemporales y de recursos

CAEPIA 2005 – Workshop RNPST – 3

Introducción al problemaIntroducción al problema

Planificación para gestión de Planificación para gestión de crisis: crisis: Sistemas Inteligentes Sistemas Inteligentes de Ayuda a la Decisión IDSSde Ayuda a la Decisión IDSS

Saber cómo actuarSaber cómo actuar Uso de protocolos estándarUso de protocolos estándar

Saber cuándo actuarSaber cuándo actuar Gestión del conocimiento Gestión del conocimiento

temporaltemporal Gestión de recursosGestión de recursos

CAEPIA 2005 – Workshop RNPST – 4

Introducción al problemaIntroducción al problema

Uso de protocolos estándarUso de protocolos estándar Planificación HTNPlanificación HTN

CAEPIA 2005 – Workshop RNPST – 5

Move Squad-JE101Landing-Point Load

Tools

Move ?Helicopter

Landing-POint

Load people

Fly to ?locationLoad

PeopleDrive to?location

Move Squad-JE101 ?location

Move byhelicopter

Move by full terrain

Move by foot

Introducción al problemaIntroducción al problema

Uso de protocolos estándarUso de protocolos estándar Planificación HTNPlanificación HTN

CAEPIA 2005 – Workshop RNPST – 6

Task

Operator

Task

Operator

TaskOperator Task

Task

DecompositionMethod #1

DecompositionMethod #2

DecompositionMethod #k

DecompositionMethod #1

DecompositionMethod #2

DecompositionMethod #3

DecompositionMethod #1

DecompositionMethod #2

Introducción al problemaIntroducción al problema Gestión del conocimiento Gestión del conocimiento

temporaltemporal Temporización de accionesTemporización de acciones

““Evacuar entre las 9:00 y las 20:00”Evacuar entre las 9:00 y las 20:00”

SecuenciaciónSecuenciación““Después de 10 horas de ataque todos los retenes Después de 10 horas de ataque todos los retenes

tienen que descansar otras 10 horas”tienen que descansar otras 10 horas”

DuraciónDuración““La duración del vuelo de rescate depende de la La duración del vuelo de rescate depende de la

velocidad de crucero y de la distancia al velocidad de crucero y de la distancia al objetivo”objetivo”

SincronizaciónSincronización““Todos los retenes tienen que terminar el ataque a Todos los retenes tienen que terminar el ataque a

las 22:00”las 22:00”

CAEPIA 2005 – Workshop RNPST – 7

Introducción al problemaIntroducción al problema

Gestión de recursosGestión de recursos Evitar violación de recursosEvitar violación de recursos

““Un avión no puede agotar su combustible Un avión no puede agotar su combustible en vuelo”en vuelo”

Acciones de reparaciónAcciones de reparación““Repostar antes de un vuelo de larga Repostar antes de un vuelo de larga

distancia”distancia”

CAEPIA 2005 – Workshop RNPST – 8

Introducción al problemaIntroducción al problema

Está recomendado el uso de Está recomendado el uso de técnicas de planificación HTNtécnicas de planificación HTN

Las técnicas HTN no manejan Las técnicas HTN no manejan bien el conocimiento temporalbien el conocimiento temporal

CAEPIA 2005 – Workshop RNPST – 9

No representación del tiempoNo representación del tiempo Representación ad-hoc (timeline fijo)Representación ad-hoc (timeline fijo)

Planificación HTN y conocimiento Planificación HTN y conocimiento temporaltemporal

CAEPIA 2005 – Workshop RNPST – 10

A1 A2

A3

A4 A5 A6

t=1 t=3 t=10 t=13 t=14 t=17

Despliegue del plan sobre una red Despliegue del plan sobre una red temporal simple (Dechter et al 1991)temporal simple (Dechter et al 1991)

Por cada acción dos puntosPor cada acción dos puntos Start(acción) y End(acción)Start(acción) y End(acción)

Definición de restricciones sobre Definición de restricciones sobre estos puntosestos puntos

VentajasVentajas Gran expresividad de restriccionesGran expresividad de restricciones Flexibilidad en la ejecución (timeline Flexibilidad en la ejecución (timeline

flexible)flexible)

Planificación HTN y conocimiento Planificación HTN y conocimiento temporaltemporal

CAEPIA 2005 – Workshop RNPST – 11

Registro de las dependencias Registro de las dependencias causales del plancausales del plan

Propagación del conocimiento Propagación del conocimiento temporaltemporal

CAEPIA 2005 – Workshop RNPST – 12

A1 A2

A3

A4 A5 A6

A1A2 A4 A5

A3 A6[t, t’] [t, t’] [t, t’]

[t, t’]

[t, t’]

Consejería deMedioambiente

DesventajasDesventajas Tiempo de propagaciónTiempo de propagación Floyd-Warshall (Floyd-Warshall (all-pairs-shortest-pathall-pairs-shortest-path))

O(nO(n33) n = número de puntos) n = número de puntos n n → 1800 puntos para un caso real → 1800 puntos para un caso real

(Incendio de Cazorla 2001)(Incendio de Cazorla 2001) IncrementalIncremental

Propagación del conocimiento Propagación del conocimiento temporaltemporal

CAEPIA 2005 – Workshop RNPST – 13

Consistency enforcing PC-2Consistency enforcing PC-2 Path consistencyPath consistency

Propagación del conocimiento Propagación del conocimiento temporaltemporal

CAEPIA 2005 – Workshop RNPST – 14

Consistency enforcing PC-2Consistency enforcing PC-2

Propagación del conocimiento Propagación del conocimiento temporaltemporal

CAEPIA 2005 – Workshop RNPST – 15

Aunque en el caso promedio es Aunque en el caso promedio es muy bueno, en el peor caso muy bueno, en el peor caso sigue siendo O(nsigue siendo O(n33) )

Hay algunas restricciones que Hay algunas restricciones que disparan el número de disparan el número de propagaciones (restricciones propagaciones (restricciones duras, upper bounds)duras, upper bounds)

PC-2 Propaga los cambios en PC-2 Propaga los cambios en una acción al resto de accionesuna acción al resto de acciones

Muchos de estos cambios son Muchos de estos cambios son informativos y no operativosinformativos y no operativos

Propagación del conocimiento Propagación del conocimiento temporaltemporal

CAEPIA 2005 – Workshop RNPST – 16

A1A2

A3 A6

A4 A5

PC-2 Propagar los cambios solo PC-2 Propagar los cambios solo entre aquellas acciones que entre aquellas acciones que tengan una relación causa-tengan una relación causa-efecto registradaefecto registrada

Propagación mejoradaPropagación mejorada

CAEPIA 2005 – Workshop RNPST – 17

A1A2

A3 A6

A4 A5

PC-2-CL Propagar las PC-2-CL Propagar las restricciones solo a través de restricciones solo a través de vínculos causales (vínculos causales (causal-linkscausal-links))

Propagación mejoradaPropagación mejorada

CAEPIA 2005 – Workshop RNPST – 18

PC-2-CL es demostrablemente PC-2-CL es demostrablemente correcto:correcto: Los cambios en una acción siempre Los cambios en una acción siempre

provienen de una acción que se provienen de una acción que se encuentra en una cadena de vínculos encuentra en una cadena de vínculos causales a la que pertenececausales a la que pertenece

El resto se puede podarEl resto se puede podar

Propagación mejoradaPropagación mejorada

CAEPIA 2005 – Workshop RNPST – 19

A1A2 A4 A5

A3 A6

Cuatro experimentos con Cuatro experimentos con topologías del plan distintas.topologías del plan distintas.

Uno de ellos es un caso real, los Uno de ellos es un caso real, los otros tres de laboratoriootros tres de laboratorio

Resultados experimentalesResultados experimentales

CAEPIA 2005 – Workshop RNPST – 20

Secuencial Paralelo

Citas INFOCA

Medir el número de llamadas a Medir el número de llamadas a Revise(.)Revise(.)

Medir el tiempo de CPUMedir el tiempo de CPU

Resultados experimentalesResultados experimentales

CAEPIA 2005 – Workshop RNPST – 21

Secuencial Paralelo

Citas INFOCA

SecuencialSecuencial

Resultados experimentalesResultados experimentales

CAEPIA 2005 – Workshop RNPST – 22

0

50000

100000

150000

200000

250000

300000

350000

8 11 12 14 19 22 27 32

#Cal

ls t

o R

evis

e(.)

PC2

PC2-CL

0

0,005

0,01

0,015

0,02

0,025

0,03

0,035

0,04

8 11 12 14 19 22 27 32

Tie

mp

o d

e C

PU

PC2

PC2-CL

ParaleloParalelo

Resultados experimentalesResultados experimentales

CAEPIA 2005 – Workshop RNPST – 23

0

0,2

0,4

0,6

0,8

1

1,2

40 55 60 70 95 110 135 160

Tie

mp

o d

e C

PU

PC2

PC2-CL

0

5000000

10000000

15000000

20000000

25000000

30000000

35000000

40000000

40 55 60 70 95 110 135 160

PARALLEL Problems

#Cal

ls t

o R

evis

e(.)

PC2

PC2-CL

CitasCitas

Resultados experimentalesResultados experimentales

CAEPIA 2005 – Workshop RNPST – 24

0

0,2

0,4

0,6

0,8

1

1,2

40 55 60 70 95 110 135 160

Tie

mp

o d

e C

PU

PC2

PC2-CL

0

5000000

10000000

15000000

20000000

25000000

30000000

35000000

40000000

40 55 60 70 95 110 135 160

PARALLEL Problems

#Cal

ls t

o R

evis

e(.)

PC2

PC2-CL

InfocaInfoca

Resultados experimentalesResultados experimentales

CAEPIA 2005 – Workshop RNPST – 25

0

50000000

100000000

150000000

200000000

250000000

55 92 98 106

114

122

130

167

200

233

241

248

268

306

339

372

INFOCA Problems

#Cal

ls t

o R

evis

ePC2

PC2-CL

0

2

4

6

8

10

1255 92 98 106

114

122

130

167

200

233

241

248

268

306

339

372

INFOCA Problems

CU

P T

ime

(s)

PC2

PC2-CL

Comparativa SHOP2 y PC2-CL Comparativa SHOP2 y PC2-CL en problemas del dominio en problemas del dominio ZENO (hard time+numeric)ZENO (hard time+numeric)

Resultados experimentalesResultados experimentales

CAEPIA 2005 – Workshop RNPST – 26

0

5

10

15

20

25

30

35

40

73 107

156

171

272

296

297

318

373

245

237

240

262

255

298

290

287

304

277

284

ZENO Problem Time-Hard

CP

U T

ime

(s)

SIADEX PC2

SIADEX PC2-CL

SHOP2

Uso de STN para gestionar el Uso de STN para gestionar el conocimiento temporal en conocimiento temporal en planificación HTNplanificación HTN

Incorporación del conocimiento Incorporación del conocimiento de la estructura causal del plande la estructura causal del plan Registro de vínculos causales Registro de vínculos causales

temporalestemporales Restringir el número de Restringir el número de

propagaciones (eliminar propagaciones (eliminar innecesarias)innecesarias)

Mejorar el tiempo de respuestaMejorar el tiempo de respuesta

ConclusionesConclusiones

CAEPIA 2005 – Workshop RNPST – 27

Consejería deMedioambiente