CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

24
CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO Eduardo F. Camacho y Carlos Bordons Escuela Superior de Ingenieros. Universidad de Sevilla, Camino de los descubrimientos s/n 41092 Sevilla, Espa˜ na e-mail: {eduardo, bordons}@esi.us.es Resumen: El control predictivo basado en modelo (Model Predictive Control, mpc) se ha desarrollado considerablemente en las ´ ultimas d´ ecadas tanto en la industria como en la comunidad de investigaci´ on. Este ´ exito se debe a que el Control Predictivo basado en Modelo es quiz´ as la forma m´ as general de formular el problema de control en el dominio del tiempo. El control predictivo integra control ´ optimo, control de procesos con tiempos muertos, procesos multivariables y utiliza las referencias futuras cuando est´ an disponibles. Al utilizar una estrategia con horizonte de control finito permite la consideraci´ on de restricciones y procesos no lineales. Este articulo describe el control predictivo y sus posibilidades y pretende actuar como motivaci´ on para su utilizaci´ on. Copyright c 2004 CEA-IFAC. Palabras claves: Control Predictivo, Restricciones, Control Predictivo Robusto, Control de Sistemas H´ ıbridos. 1. INTRODUCCI ´ ON El Control Predictivo (Model Predictive Control, mpc) se desarroll´ o al finales de los setenta y ha tenido un desarrollo considerable desde entonces. El t´ ermino Control Predictivo no designa a una estrategia de control particular sino a un conjunto de m´ etodos de control que hacen uso expl´ ıcito de un modelo del proceso para obtener la se˜ nal de control minimizando una funci´ on objetivo. Estos etodos de control llevan a controladores que tienen b´ asicamente la misma estructura y los mismos elementos: uso expl´ ıcito de un modelo para predecir la evoluci´ on del proceso en los instantes futuros, minimizaci´ on de una funci´ on objetivo y utilizaci´ on de un horizonte de control finito y deslizante que implica el c´ alculo de la secuencia de control para todo el horizonte pero con la aplicaci´ on de la primera se˜ nal de la secuencia y la repetici´ on de todo el proceso en el siguiente instante de muestreo. Los distintos algoritmos de control predictivo di- fieren en el tipo de modelo utilizado para re- presentar al proceso y a las perturbaciones y la funci´ on objetivo considerada. Existen aplicaciones de control predictivo a diversos procesos que van desde procesos tan diversos como robots (G´ omez Ortega y Camacho, 1996) a la anestesia cl´ ınica (Linkers y Mahfonf, 1994). Aplicaciones en la in- dustria de cemento, desecadoras, brazos rob´ oticos se pueden encontrar descritas en (Clarke, 1988), mientras que desarrollos para columnas de des- tilaci´ on, plantas de pvc, generadores de vapor y servos se presentan en (Richalet, 1993) y (Richalet et al., 1978). El control predictivo presenta una serie de ventajas sobre otros m´ etodos, entre las que se pueden citar las siguientes:

Transcript of CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

Page 1: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

CONTROL PREDICTIVO: PASADO,

PRESENTE Y FUTURO

Eduardo F. Camacho y Carlos Bordons

Escuela Superior de Ingenieros. Universidad de Sevilla,Camino de los descubrimientos s/n

41092 Sevilla, Espanae-mail: eduardo, [email protected]

Resumen: El control predictivo basado en modelo (Model Predictive Control,mpc) se ha desarrollado considerablemente en las ultimas decadas tanto en laindustria como en la comunidad de investigacion. Este exito se debe a que elControl Predictivo basado en Modelo es quizas la forma mas general de formular elproblema de control en el dominio del tiempo. El control predictivo integra controloptimo, control de procesos con tiempos muertos, procesos multivariables y utilizalas referencias futuras cuando estan disponibles. Al utilizar una estrategia conhorizonte de control finito permite la consideracion de restricciones y procesos nolineales. Este articulo describe el control predictivo y sus posibilidades y pretendeactuar como motivacion para su utilizacion. Copyright c©2004 CEA-IFAC.

Palabras claves: Control Predictivo, Restricciones, Control PredictivoRobusto, Control de Sistemas Hıbridos.

1. INTRODUCCION

El Control Predictivo (Model Predictive Control,mpc) se desarrollo al finales de los setenta y hatenido un desarrollo considerable desde entonces.El termino Control Predictivo no designa a unaestrategia de control particular sino a un conjuntode metodos de control que hacen uso explıcito deun modelo del proceso para obtener la senal decontrol minimizando una funcion objetivo. Estosmetodos de control llevan a controladores quetienen basicamente la misma estructura y losmismos elementos:

• uso explıcito de un modelo para predecir laevolucion del proceso en los instantes futuros,

• minimizacion de una funcion objetivo y• utilizacion de un horizonte de control finito

y deslizante que implica el calculo de lasecuencia de control para todo el horizontepero con la aplicacion de la primera senal de

la secuencia y la repeticion de todo el procesoen el siguiente instante de muestreo.

Los distintos algoritmos de control predictivo di-fieren en el tipo de modelo utilizado para re-presentar al proceso y a las perturbaciones y lafuncion objetivo considerada. Existen aplicacionesde control predictivo a diversos procesos que vandesde procesos tan diversos como robots (GomezOrtega y Camacho, 1996) a la anestesia clınica(Linkers y Mahfonf, 1994). Aplicaciones en la in-dustria de cemento, desecadoras, brazos roboticosse pueden encontrar descritas en (Clarke, 1988),mientras que desarrollos para columnas de des-tilacion, plantas de pvc, generadores de vapor yservos se presentan en (Richalet, 1993) y (Richaletet al., 1978). El control predictivo presenta unaserie de ventajas sobre otros metodos, entre lasque se pueden citar las siguientes:

Marina Vallés
Marina Vallés
Revista Iberoamericana de Automática e Informática Industrial, Vol. 1, Núm.3, Octubre 2004
Marina Vallés
pp. 5-28
Page 2: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

• es una tecnica particularmente atractiva paralos operadores que requiere pocos conocimien-tos de control porque los conceptos son muyintuitivos y la sintonizacion relativamentesimple,

• se puede utilizar para controlar una gran va-riedad de procesos, desde procesos muy sim-ples hasta procesos con dinamicas complejascomo procesos con grandes tiempos muertos,procesos de fase no mınima, procesos inesta-bles o procesos multivariables,

• su caracter predictivo lo hace compensarintrınsecamente los tiempos muertos,

• introduce un control anticipativo (feed for-ward) y de forma natural se compensan lasperturbaciones medibles,

• la ley de control resultante es facilmenteimplementable,

• es muy util cuando se conocen las referenciasfuturas, como ocurre en el caso de robotica oprocesos por lotes y

• permite tratar las restricciones de una formasistematica y conceptualmente muy simpledurante la fase de diseno.

Como es logico, tiene tambien sus inconvenientes.El principal es que, aunque su implementacionno es compleja, resulta mas difıcil que la delos clasicos controladores pid. Si la dinamica delproceso no cambia y no existen restricciones, lamayor parte de los calculos se puede realizarfuera de lınea y el controlador resultante es sim-ple, pudiendose aplicar a procesos de dinamicasrapidas; en caso contrario, los requisitos de calculoson mucho mayores. Aunque hay que decir quedebido a la potencia de los computadores actualesesto no es realmente una dificultad insalvable. Lamayor dificultad que presenta para su aplicaciones la necesidad de un modelo apropiado del pro-ceso cuya obtencion requiere unos conocimientosmınimos de control. El control predictivo ha de-mostrado ser en la practica una estrategia razo-nable de control y ha sido aplicado con exito anumerosos procesos industriales.

1.1 Estrategia del MPC

La metodologıa de todos los controladores perte-necientes a la familia mpc se caracteriza por lasiguiente estrategia, representada en la figura 1:

(1) Las salidas futuras para un horizonte deter-minado N , llamado horizonte de prediccion,se predicen cada instante t utilizando el mo-delo del proceso. Estas predicciones de la sali-da y(t+k | t) 1 para k = 1 . . . N dependen de

1 La notacion indica el valor predicho de la variable en el

instante t + k calculada en el instante t.

N

y(t+k|t)^

u(t+k|t)

t t+1t-1 . . . t+N. . . t+k

y(t)

u(t)

Fig. 1. Estrategia MPC

los valores conocidos hasta el instante t (en-tradas y salidas conocidas ) y de las senalesde control u(t + k | t), k = 0 . . . N − 1, quehan de ser calculadas y enviadas al sistema.

(2) La secuencia de senales de control futuras secalcula minimizando un criterio para man-tener al proceso lo mas cerca posible de latrayectoria de referencia w(t + k). Este cri-terio toma normalmente la forma de unafuncion cuadratica del error entre la sali-da predicha y la trayectoria de referenciasfuturas. En la mayor parte de los casosse incluye tambien el esfuerzo de controldentro de la funcion objetivo. La solucionexplıcita se puede obtener cuando el criterioes cuadratico y el modelo lineal; en caso con-trario se ha de utilizar un metodo numericopara buscar la solucion.

(3) La senal de control u(t | t) se envıa alproceso mientras que el resto de las senalescalculadas no se consideran, ya que en elinstante siguiente de muestreo y(t+ 1) es yaconocida y los pasos anteriores se repiten coneste nuevo valor. Por lo que u(t + 1 | t +1) se calcula con informacion diferente y enprincipio sera tambien diferente de u(t + 1 |t).

La figura 2 muestra la estructura basica necesariapara inplementar el control predictivo. Se usa unmodelo para predecir la evolucion de la salida o es-tado del proceso a partir de las senales de entraday salidas conocidas. La acciones de control futurasse calculan con el optimizador, que considera lafuncion del coste y las posibles restricciones.

El modelo de proceso juega, en consecuencia,un papel decisivo en el controlador. El modeloelegido debe ser capaz de capturar la dinamicadel proceso para predecir de forma precisa laevolucion del sistema. Al mismo tiempo, debe sersuficientemente simple de inplementar y entender.Las distintas metodologıas del control predictivodifieren fundamentalmente en el tipo de modeloutilizado.

El optimizador es otra parte fundamental de laestructura ya que permite obtener las accionesde control a aplicar. Si la funcion de coste es

Marina Vallés
Marina Vallés
Control Predictivo: Pasado, Presente y Futuro
Marina Vallés
6
Page 3: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

+

-

futuros

Entradas y salidas

Funcion de coste Restricciones

Errores futuros

pasadas

Controles

de referenciaTrayectoria

predichasSalidas

Optimizador

Modelo

Fig. 2. Estructura basica del MPC

tt-1t-2

N

t+N

Fig. 3. Analogıa MPC

cuadratica, el modelo lineal y no existen restric-ciones, se puede obtener una solucion explıcita. Sieste no es el caso se ha de acudir a un algoritmonumerico de optimizacion que requiere mayor ca-pacidad de calculo. El tamano del problema re-sultante depende del numero de variables, de loshorizontes de control y prediccion y del numerode restricciones, aunque se puede decir que engeneral problemas de optimizacion resultantes eneste contexto son problemas mas bien modestos.

Notese que la estrategia de control predictivo esmuy similar a la estrategia que se utiliza cuandose conduce un automovil. El conductor conoce latrayectoria de referencia deseada para un hori-zonte de control finito. Tomando en consideracionlas caracterısticas del automovil (modelo mentaldel automovil) decide que accion de control tomar(acelerador, frenos, volante, marchas) para seguirla trayectoria deseada. Solo la primera accion decontrol de la secuencia calculada mentalmente esaplicada por el conductor en cada instante y elprocedimiento se repite en los sucesivos instantesutilizando el concepto de horizonte deslizante.Notese que cuando se utiliza un esquema de con-trol clasico como pid se utilizan solo las senalespasadas. Esta forma de conducir el automovilserıa como conducir utilizando el espejo retrovisortal como se muestra en la figura 3. Esta analogıano es totalmente justa con los pids, porque el con-trol predictivo utiliza mas informacion (trayecto-ria de referencia). Notese que si se le proporcionaal pid como referencia un punto en la trayectoriafutura la diferencia entre ambas estrategias decontrol no parecerıa tan abismal.

1.2 Perspectiva Historica

Desde el final de la decada de los 70 aparecieronvarios artıculos mostrando un interes incipienteen el control predictivo en la industria, principal-mente en (Richalet et al., 1976)(Richalet et al.,1978) presentando el control predictivo heurısticobasado en modelo (”Model Predictive HeuristicControl ”, mphc) ( mas tarde conocido comocontrol algorıtmico basado en modelo (” ModelAlgorithmic Control” , mac)) y (Cutler y Ra-maker, 1980) sobre control con matriz dinamica (”Dynamic Matrix Control”, dmc). Ambos algorit-mos utilizan explıcitamente un modelo dinamicodel proceso (la respuesta impulso en el primer casoy la respuesta escalon en el segundo) para predecirel efecto de las futuras senales de control en lasvariables a controlar. Estas formulaciones eranheurısticas e hicieron uso del potencial cada vezmayor de los computadores digitales en aquellostiempos.

Estos controladores estaban ıntimamente ligadosal problema de control optimo en tiempo mınimoy a la programacion lineal (Zadeh y Whalen,1962). El concepto de horizonte deslizante, unade las ideas centrales del control predictivo, fuepropuesto por Propoi ya en el 1963 (Propoi,1963), en el marco de realimentacion optima enbucle abierto ( open-loop optimal feedback) que fueutilizada extensamente en los anos 70.

El control predictivo llego a ser popular, y parti-cularmente en la industria de procesos quımicos,debido a la simplicidad del algoritmo y a la uti-lizacion del modelo de respuesta ante impulso que,aunque requiriendo muchos mas parametros quelas formulaciones en el espacio de estado o en eldominio de entrada y salida, resulta mas intuitivoy requiere mucha menos informacion a priori parala identificacion. Un informe bastante completosobre las aplicaciones del control predictivo en elsector petroquımico durante los anos 80 se puedeencontrar en (Garcıa et al., 1989).

La mayorıa de estas aplicaciones se llevaron a caboen sistemas multivariables que incluıan restric-ciones. A pesar de este exito, estas formulacionescarecıan de una teorıa formal para proveer resul-tados sobre la estabilidad y robustez. De hecho, elcaso de horizonte finito parecıa demasiado difıcilde analizar excepto en casos muy especıficos.

Otra lınea de trabajo se desarrollo independiente-mente en torno a las ideas de control adaptativo,desarrollandose estrategias de control predictivopara sistemas monovariables y formulada sobremodelos de entrada y salida. El control autosin-tonizado basado en predictores (”Predictor-BasedSelf-Tuning Control”) (Peterka, 1984) y el controladaptativo de horizonte extendido (”ExtendedHorizon Adaptive Control” ehac) (Ydstie, 1984),

Marina Vallés
Marina Vallés
E. F. Camacho, C. Bordons
Marina Vallés
7
Page 4: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

el controlador autosintonizado (” Extended Pre-diction Self Adaptive Control” epsac) (Keyser yCuawenberghe, 1985), y el control predictivo gen-eralizado (”Generalized Predictive Control gpc)desarrollado por Clarke et al. en 1987 (Clarke etal., 1987) pueden ser mencionado en este con-texto. El gpc utiliza ideas de los controladores deminima varianza generalizada (”Generalized Min-imum Variance gmv) (Clarke y Gawthrop, 1979)y es en la actualidad uno de los metodos masutilizados a nivel academico.

Existen numerosas formulaciones de control pre-dictivo basadas en las mismas ideas comunes,entre las que se puede incluir control adapta-tivo multivariable multipaso (”Multistep Multi-variable Adaptive Control” musmar) (Greco etal., 1984), control predictivo funcional (”Pre-dictive Functional Control ” pfc) (Richalet etal., 1987). El mpc ha sido formulado en el es-pacio de estados (Morari, 1994), lo que permiteuna utilizacion de resultados bien conocidos sobreestabilidad y tambien la generalizacion a casosmas complejos como procesos multivariables, pro-cesos no lineales y sistemas con perturbacionesestocasticas. Aunque los primeros trabajos sobregpc contienen algunos resultados de estabilidadpara el caso nominal, la falta de resultados ge-nerales sobre la estabilidad de los controladoresde horizontes finito y deslizante constituyo un in-conveniente para su utilizacion al principio. Parahacer frente a esto, aparecio en los 90s una nuevalınea de trabajo sobre controladores predictivoscon estabilidad garantizada . Se pueden citar dosmetodos el crhpc (Clarke y Scattolini, 1991))y el siorhc (Mosca et al., 1990)) que fuerondesarrollados independientemente y garantizabanestabilidad, para el caso nominal, imponiendo quela senal de salida alcanzara a la referencia al finaldel horizonte.

Para el caso de restricciones, el analisis de esta-bilidad parecıa ser un problema demasiado com-plicado de resolver. Aun en el caso de que el op-timizador fuera capaz de encontrar una solucion,no estaba garantizada la estabilidad del bucle ce-rrado. La utilizacion de penalizaciones terminalesy/o restricciones, funciones de Lyapunov, o con-juntos invariantes han dado lugar a una familiade tecnicas que garantizan la estabilidad del sis-tema. Este problema ha sido atacado de distintospuntos de vista y han aparecido numerosas con-tribuciones en anos recientes, casi siempre anali-zando el problema del regulador (llevar el estadoal reposo) y normalmente en el espacio de esta-dos. Las principales formulaciones propuestas quegarantizan estabilidad estan resumidas en (Mayneet al., 2000) donde se dan condiciones suficientespara disenar un regulador predictivo con garantıasde estabilidad.

Otra de la lıneas de investigacion abiertas en losultimos anos es el control predictivo robusto. Laidea basica es tener en cuenta las incertidumbressobre el proceso de una manera explıcita y disenarel controlador predictivo para optimizar la funcionobjetivo ante la peor situacion posible de lasincertidumbres.

Estos resultados prometedores permiten pensarque el control predictivo experimentara una mayordiseminacion tanto en el mundo academico comoen la comunidad industria. En este contexto unode los mayores fabricantes de sistema de controldistribuido, Honeywell , incorpora control predic-tivo robusto en uno de sus productos (”RobustMultivariable Predictive Control rmpctm) parael tdc 3000.

El control predictivo se puede considerar unatecnica madura para sistemas lineales y no muyrapidos como los encontrados normalmente en laindustria de procesos. Sistemas mas complejos,tales como sistemas no lineales, hıbridos, y o sis-temas muy rapidos, eran considerados como fueradel alcance de los controladores predictivos. Du-rante los ultimos anos se han producido resultadosespectaculares en estos campos. Se ha demostrado(Bemporad et al., 2002) que un controlador pre-dictivo con restricciones lineales resulta ser uncontrolador afın a trozos que puede ser inplemen-tado con poca carga de computacion. Reciente-mente han aparecido en la literatura aplicacionesdel los controladores predictivos a sistemas nolineales o hıbridos.

1.3 Tecnologıa Industrial

Aunque hay companıas que hacen uso de contro-ladores predictivos que han desarrollado la tec-nologıa dentro de sus empresas y no la ofrecenexternamente, existe un numero de ellas que su-ministran controladores predictivos, entre las quepodemos destacar las siguientes con el acronimodel producto que suministran :

• AspenTech: Dynamic Matrix Control (dmc)• Adersa: Identification and Command (id-

com), Hierarchical Constraint Control (hiecon)and Predictive Functional Control (pfc)

• Honeywell Profimatics: Robust Model Pre-dictive Control Technology (rmpct) andPredictive Control Technology (pct)

• Setpoint Inc.: Setpoint Multivariable ControlArchitecture (smca) and idcom-m (multi-variable)

• Treiber Controls: Optimum Predictive Con-trol (opc)

• abb: 3dmpc

• Pavillion Technologies Inc.: Process Perfecter• Simulation Sciences: Connoisseur

Marina Vallés
Marina Vallés
Control Predictivo: Pasado, Presente y Futuro
Marina Vallés
8
Page 5: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

Notese que cada producto no es solamente un al-goritmo, sino que viene acompanado por paquetesadicionales para la identificacion de la planta orealizacion de pruebas.

Existen miles de aplicaciones del control predic-tivo en la industria. La mayor parte de las apli-caciones estan en el sector petroquımico (Qin yBadgwell, 1997) (Qin y Badgwell, 1998) en el areade refino pero tambien existen numerosas aplica-ciones en los sectores de pulpa y papel, procesadode alimentos, gas, minerıa, hornos, metalurgia, in-dustria aerospacial e industria del automovil. Unaexcelente revision sobre mpc dirigida principal-mente a personal de la industria con experienciaen control se puede encontrar en (Rawlings, 2000).

2. FORMULACION DEL PROBLEMA

En la seccion anterior se ha mostrado la formagenerica de resolver el problema mpc, que consistebasicamente en minimizar la funcion de coste ha-ciendo uso del modelo del sistema para calcular laspredicciones. La solucion del problema dependeprincipalmente del tipo de modelo que se usepara capturar la dinamica del proceso. Aunque elprocedimiento general es practicamente el mismo,los pasos necesarios para formular los algoritmosde control son ligeramente distintos.

Se analizan aquı tres tipos de modelo: funcion detransferencia, modelos de convolucion y modelode espacio de estados.

2.1 Modelo de funcion de transferencia

La formulacion mas conocida que usa este tipode modelo es sin duda el Control Predictivo Ge-neralizado (Generalized Predictive Control, gpc)(Clarke et al., 1987), aunque existen otras for-mulaciones que tambien usan modelos de funcionde transferencia (epsac y ehac, por ejemplo). Elgpc se ha convertido en uno de los metodos maspopulares tanto en el mundo industrial como en elacademico y ha funcionado con exito en muchasaplicaciones industriales (Clarke, 1988), pudiendotratar plantas inestables y de fase no mınima a lavez que incorpora la idea de horizonte de controly la consideracion de pesos en los incrementos dela senal de control.

En el gpc el modelo de la planta viene dadopor una funcion de transferencia discreta en laforma de un modelo carima (Controller Auto-Regressive Integrated Moving-Average):

A(z−1)y(t) = B(z−1)z−d u(t− 1) + C(z−1)e(t)

4(1)

donde 4 = 1 − z−1, u(t) e y(t) son las variablesde entrada y salida respectivamente y e(t) esun ruido blanco de media cero. A, B y C sonpolinomios en el operador retardo z−1 y d es eltiempo muerto del sistema. Este modelo es muyapropiado para muchas aplicaciones industrialesen las que las perturbaciones no son estacionarias,segun se justifica en (Clarke et al., 1987). A partirde ahora el polinomio C se toma igual a 1. Noteseque si se puede truncar entonces puede ser incluidoen A y B. En (Camacho y Bordons, 2004) se tratael caso general de ruido coloreado. En general esdifıcil determinar el valor real de este polinomio,por lo que se puede usar para rechazo optimo deperturbaciones, aunque es mas adecuado su papelen la mejora de la robustez.

El algoritmo gpc consiste en aplicar la secuenciade control que minimiza una funcion de coste dela forma:

J =

N2∑

j=N1

δ(j)[y(t+ j | t) − w(t+ j)]2 +

+

Nu∑

j=1

λ(j)[4u(t+ j − 1)]2 (2)

donde y(t + j | t) es la prediccion optima de lasalida j pasos hacia delante calculada con datosconocidos en el instante t, N1 y N2 son los hori-zontes mınimo y maximo de prediccion y Nu es elhorizonte de control, δ(j) y λ(j) son secuencias deponderacion (normalmente constantes) y w(t+ j)es la futura trayectoria de referencia.

Con objeto de minimizar la funcion de coste, hayque calcular la prediccion optima y(t + j) paraj ≥ N1 y j ≤ N2. Esto se lleva a cabo resolviendouna ecuacion diofantica cuya solucion se puedeobtener mediante un algoritmo recursivo. Si sehace esto (Clarke et al., 1987)), se pueden escribirlos valores futuros de la salida como:

y(t+ j) = Fjy(t) +

EjB(z−1) 4 u(t+ j − d− 1) + Eje(t+ j) (3)

Los polinomios Ej y Fj se derivan de la ecuaciondiofantica y vienen unıvocamente definidos congrados j − 1 y na respectivamente. Se puedenobtener dividiendo 1 entre A(z−1) hasta que elresto se pueda factorizar como z−jFj(z

−1). Elcociente de la division es el polinomio Ej(z

−1).Como el grado del polinomio Ej(z

−1) = j− 1, losterminos de ruido de la ecuacion (3) se encuentranen el futuro y por tanto la mejor prediccion vienedada por:

y(t+j | t) = Gj(z−1)4u(t+j−d−1)+Fj(z

−1)y(t)

donde Gj(z−1) = Ej(z

−1)B(z−1).

Marina Vallés
Marina Vallés
E. F. Camacho, C. Bordons
Marina Vallés
9
Page 6: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

Para resolver el problema del gpc, es necesarioobtener la secuencia de senales de control u(t),u(t + 1), ..., u(t + N) que optimice la expresion(2). Como el proceso tiene un tiempo muerto ded perıodos de muestreo, la salida solo se verainfluenciada por la senal de control u(t) tras d +1 periodos. Los horizonte se pueden definir portanto como N1 = d + 1, N2 = d + N y Nu = N .Observese que no tiene sentido hacer N1 < d + 1ya que los terminos que se anadirıan a (2) solodependerıan de acciones de control pasadas. Porotro lado, si N1 > d + 1 los primeros puntos dela prediccion, que son los mejor estimados, no setendrıan en cuenta.

Considerese ahora el siguiente conjunto de predic-ciones de j pasos:

y(t+ d+ 1) =Gd+1 4 u(t) + Fd+1y(t)

y(t+ d+ 2) =Gd+2 4 u(t+ 1) + Fd+2y(t)

...

y(t+ d+N) =Gd+N 4 u(t+N − 1) + Fd+Ny(t)

que puede escribirse como:

y = Gu + F(z−1)y(t) + G′(z−1) 4 u(t− 1) (4)

con

y = [y(t+ d+ 1 | t) . . . y(t+ d+N | t)]T

u = [4u(t) 4 u(t+ 1) . . .4 u(t+N − 1)]T

G =

g0 0 ... 0

g1 g0 ... 0...

.

.....

.

..gN−1 gN−2 ... g0

G′(z−1) =

(Gd+1(z−1) − g0)z

(Gd+2(z−1) − g0 − g1z−1)z2

.

.

.

(Gd+N (z−1) − · · · − gN−1z−(N−1))zN

F(z−1) =

Fd+1(z−1)

Fd+2(z−1)...

Fd+N (z−1)

Notese que los dos ultimos terminos en la ecuacion(4) dependen solo del pasado y se pueden agruparpor tanto dentro del vector f (respuesta libre)dando lugar a:

y = Gu + f

Si las condiciones iniciales son nulas, la respuestalibre tambien lo es. Si se aplica un escalon unitarioa la entrada en el instante t, es decir,

4u(t) = 1,4u(t+ 1) = 0, . . . ,4u(t+N − 1) = 0

w

f

+

Ku

Procesoy

-

CalculoResp. libre

Fig. 4. Ley de control del GPC

la secuencia de salida t [y(t+1), y(t+2), . . . , y(t+N)]T es igual a la primera columna de la matrizG. Es decir, la primera columna de la matriz G

se puede calcular como la respuesta de la plantacuando se aplica un escalon unitario en la variablemanipulable. La respuesta libre se puede calcularde forma recursiva como

fj+1 = z(1 − A(z−1))fj +B(z−1) 4 u(t− d+ j)

con f0 = y(t) y 4u(t+ j) = 0 para j ≥ 0.

Por otra parte, la funcion de coste se puedeescribir como

J = (Gu + f − w)T (Gu + f − w) + λuT u (5)

donde

w =[

w(t+ d+ 1) · · · w(t+ d+N)]T

El mınimo de J , considerando que no hay res-tricciones se puede encontrar igualando a cero elgradiente de J , lo que conduce a:

u = (GT G + λI)−1GT (w − f) (6)

En realidad, al usar una estrategia de horizontedeslizante, la senal de control que verdaderamentese envıa al proceso el el primer elemento del vectoru, dado por:

4u(t) = K(w − f) (7)

donde K es la primera fila de la matriz (GT G +λI)−1GT . Este hecho tiene un claro significado,que se puede derivar facilmente de la figura 4:si no hay errores futuros (predichos), es decir, siw − f = 0, entonces no hay movimientos en lasenal de control, ya que el objetivo se satisfaracon la evolucion libre del proceso. Sin embargo,en cualquier otro caso existira un incremento dela accion de control proporcional (con factor K)al error futuro. Observese que la accion se tomarespecto a errores futuros, no a errores pasadoscomo en el caso de los controladores realimentadosconvencionales

La solucion del gpc precisa de la inversion (oal menos la triangularizacion) de una matriz dedimension N × N que requiere una carga decomputo considerable. En (Clarke et al., 1987)se introduce el concepto de horizonte de control

Marina Vallés
Marina Vallés
Control Predictivo: Pasado, Presente y Futuro
Marina Vallés
Marina Vallés
10
Page 7: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

para reducir la carga de calculo, considerandoque las senales de control futuras se mantendranconstantes tras Nu < N . Esto da lugar a lainversion de una matriz de dimension Nu × Nu

que reduce la carga de calculo (en particular, siNu = 1 se reduce a un escalar, aunque se restringela optimalidad del gpc).

2.2 Modelo de convolucion

Los modelos de convolucion engloban los modelosde respuesta impulsional y respuesta ante escalon,de gran exito en la industria por ser muy intuitivosy permitir un procedimiento de identificacion rel-ativamente sencillo. Estos tipos de modelo handado lugar a dos de los controladores mas ex-tendidos en la practica: Dynamic Matrix Control,(dmc) y Model Algorithmic Control (mac). Semuestra aquı la formulacion del primero de ellos,siendo la del segundo muy similar.

El controlador dmc se desarrollo a finales de losanos setenta del siglo pasado por Cutler y Ra-maker (Cutler y Ramaker, 1980) de la Shell OilCo. y ha sido ampliamente aceptado en el en-torno industrial, principalmente por la industriapetroquımica (Qin y Badgwell, 1997). Su granexito proviene de su capacidad para tratar pro-cesos multivariables, aunque en esta seccion solose aborda el caso monovariable ya que permitecomprender mejor los fundamentos sin perderseen notacion matematica.

Como se ha indicado previamente, se usa unmodelo de respuesta ante escalon para capturarla dinamica del proceso, mientras que la pertur-bacion se considera constante a lo largo del hor-izonte. El procedimiento para obtener las predic-ciones se muestra a continuacion.

Al usar el siguiente modelo de respuesta anteescalon

y(t) =

∞∑

i=1

gi 4 u(t− i)

los valores predichos de la salida a lo largo delhorizonte seran:

y(t+ k | t) =

∞∑

i=1

gi 4 u(t+ k − i) + n(t+ k | t)

=

k∑

i=1

gi 4 u(t+ k − i) +

∞∑

i=k+1

gi 4 u(t+ k − i)

+n(t+ k | t)

Como se considera que las perturbaciones sonconstantes en el futuro, n(t + k | t) = n(t | t) =ym(t) − y(t | t), se puede escribir:

y(t+ k | t) =

k∑

i=1

gi 4 u(t+ k − i) + ym(t)

+

∞∑

i=k+1

gi 4 u(t+ k − i) −

∞∑

i=1

gi 4 u(t− i)

Es decir, la prediccion viene dada por:

y(t+ k | t) =

k∑

i=1

gi 4 u(t+ k − i) + f(t+ k)

donde f(t + k) es la respuesta libre del sistema,que como se sabe no depende de las acciones decontrol futuras, y viene dada por:

f(t+ k) = ym(t) +

∞∑

i=1

(gk+i − gi) 4 u(t− i) (8)

Si el proceso es asintoticamente estable los coefi-cientes gi de la respuesta ante escalon tienden avalores constantes tras un cierto numero N de pe-riodos de muestreo, por lo que se puede considerarque

gk+i − gi ≈ 0, i > N

y por lo tanto se puede calcular la respuesta librecomo

f(t+ k) = ym(t) +

N∑

i=1

(gk+i − gi) 4 u(t− i)

Notese que si el sistema no es asintoticamenteestable, no existe tal valor N y f(t + k) no sepuede calcular (aunque existe una generalizacionen el caso de que la inestabilidad sea debida aintegradores puros).

Ahora se pueden calcular las predicciones a lolargo del horizonte de prediccion (k = 1, . . . , p),considerando m acciones de control:

y(t+ 1 | t) = g1 4 u(t) + f(t+ 1)

y(t+ 2 | t) = g2 4 u(t) + g1 4 u(t+ 1) + f(t+ 2)

...

y(t+ p | t) =

p∑

i=p−m+1

gi 4 u(t+ p− i) + f(t+ p)

Si se define ahora la matriz dinamica del sistemaG (que da nombre al algoritmo) como

Marina Vallés
Marina Vallés
E. F. Camacho, C. Bordons
Marina Vallés
11
Page 8: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

G =

g1 0 · · · 0g2 g1 · · · 0...

.... . .

...gm gm−1 · · · g1...

.... . .

...gp gp−1 · · · gp−m+1

se puede escribir la prediccion como

y = Gu + f (9)

que tiene la misma forma que las prediccionescalculadas por el gpc. Notese que G esta formadapor m (horizonte de control) columnas de larespuesta ante escalon del sistema deslizadas haciaabajo de forma apropiada. y es un vector dedimension p que contiene las predicciones, u tienedimension m y contiene los incrementos en lasacciones de control y f es el vector de la respuestalibre.

Notese que f depende del vector de estadosx(t), que en este caso viene dado por x(t)T =[ym(t) u(t − 1) u(t − 2) . . . u(t − N − 1)], y sepuede expresar como f = Fx(t), con lo que sepuede escribir la prediccion como:

y = Gu + Fx(t)

Las variables manipuladas se calculan, como encualquier controlador predictivo, de forma queminimicen la siguiente funcion objetivo cuadratica,que incluye el esfuerzo de control:

J =

p∑

j=1

[y(t+j | t)−w(t+j)]2+

m∑

j=1

λ[4u(t+j−1)]2

Si no hay restricciones, la solucion a la mini-mizacion de la funcion de coste J = eeT + λuuT ,donde e es el vector de errores futuros a lo largodel horizonte, se puede obtener de forma analıticaigualando a cero la derivada de J (igual que en elgpc), proporcionando:

u = (GT G + λI)−1GT (w − f)

Conviene recordar que, como ocurre en todas lasestrategias de control predictivo, solo el primerelemento del vector u (4u(t)) se envıa realmentea la planta. No es aconsejable implementar lasecuencia de control calculada completa (m valo-res), ya que es imposible estimar perfectamentelas perturbaciones en el horizonte y por tantoes imposible anticiparse de forma precisa a lasinevitables perturbaciones que hacen que la salidareal difiera de las predicciones que se han usado enel calculo. Ademas, la referencia podrıa cambiaren dicho intervalo.

Como resumen, observese que ambos contro-ladores descritos hasta ahora tienen un proced-imiento similar, dando lugar a leyes de control

donde la unica diferencia es el calculo de la res-puesta libre, debido al distinto tipo de modelousado. En ambos casos si existen restricciones, sepasa de una solucion analıtica a la resolucion deun problema de programacion cuadratica, comose vera mas adelante.

2.3 Modelo en el espacio de estados

Los modelos de espacio de estados o descripcioninterna se pueden usar tambien para formularel problema del control predictivo. Ademas, losprincipales resultados teoricos relacionados con laestabilidad provienen de este tipo de formulacion,que puede ser usada tanto para problemas mono-variables como multivariables y se puede extenderfacilmente al caso no lineal.

Se usan las siguientes ecuaciones para capturar ladinamica del proceso:

x(t+ 1) =Ax(t) +Bu(t)

y(t) =Cx(t) (10)

En el caso monovariable y(t) y u(t) son escalares yx(t) es el vector de estados. Un proceso multivari-able tiene la misma descripcion pero con el vectoru de dimension m y el vector y de dimension n.En esta seccion, por simplicidad en la notacion,solo se considera el primer caso. La extension alcaso multivariable es directa.

Tambien se puede usar un modelo incremental sise considera como variable de entrada el incre-mento de la senal de control 4u(t) en lugar deu(t). Este modelo se puede escribir en la formagenerica de espacio de estados simplemente te-niendo en cuenta que 4u(t) = u(t) − u(t − 1).Combinando esta expresion con (10) se obtiene lasiguiente representacion:

[

x(t+ 1)u(t)

]

=

[

A B

0 I

] [

x(t)u(t− 1)

]

+

[

B

I

]

4 u(t)

y(t) =[

C 0]

[

x(t)u(t− 1)

]

Al definir el nuevo vector de estados como x(t) =[x(t) u(t − 1)]T , el modelo incremental toma laforma general:

x(t+ 1) =Mx(t) +N 4 u(t)

y(t) =Qx(t) (11)

donde la relacion entre (M , N , Q) y las matricesde la forma no-incremental (A, B, C) se puedenderivar facilmente combinando (10) y (11).

Con la idea de minimizar la funcion objetivo,hay que calcular las predicciones a lo largo del

Marina Vallés
Marina Vallés
Control Predictivo: Pasado, Presente y Futuro
Marina Vallés
12
Page 9: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

horizonte. En el caso del modelo incremental,estas se obtienen usando (11) de manera recursiva,dando lugar a:

y(t+ j) = QM j x(t) +

j−1∑

i=0

QM j−i−1N 4 u(t+ i)

Notese que las predicciones necesitan una esti-macion insesgada del vector de estados x(t). Sieste no es accesible sera necesario incluir un ob-servador, que calcula la estimacion por medio de

x(t | t) = x(t | t− 1) +K(ym(t) − y(t | t− 1))

donde ym(t) es la salida medida. Si la plantaesta sujeta a perturbaciones en forma de ruidoblanco que afectan a la salida y al proceso conmatrices de covarianza conocidas, el observadorse convierte en un filtro de Kalman (Astrom yWittenmark, 1984) y la ganancia K se calcularesolviendo una ecuacion de Riccati.

Ahora, las predicciones a lo largo del horizontevienen dadas por:

y =

y(t+ 1|t)y(t+ 2|t)

...y(t+N2|t)

=

=

QMx(t) +QN 4 u(t)

QM2x(t) +

1∑

i=0

QM1−iN 4 u(t+ i)

...

QMN2 x(t) +

N2−1∑

i=0

QMN2−1−iN 4 u(t+ i)

que se puede expresar de forma vectorial como

y = Fx(t) + Hu (12)

donde u = [4u(t) 4u(t+1) . . . 4u(t+Nu−1)]T

es el vector de incrementos de control futuros,H es una matriz triangular inferior por bloquescuyos elementos no nulos vienen definidos porHij = QM i−jN y la matriz F viene dada por

F =

QM

QM2

...

QMN2

Notese que la expresion (12) esta compuesta pordos terminos: el primero de ellos depende delestado actual y por lo tanto se conoce en elinstante t, mientras que el segundo depende lasacciones de control futuras, que son las variablesde decision que deben ser calculadas. La secuenciade control u se calcula minimizando la funcion

objetivo, que (en el caso de δ(j) = 1 y λ(j) = λ)se puede escribir como:

J = (Hu+Fx(t)−w)T (Hu+Fx(t)−w)+λuT u

Si no hay restricciones, la solucion analıtica queproporciona el optimo es:

u = (HT H + λI)−1HT (w − Fx(t))

Como se usa una estrategia de control deslizante,solo se envıa el primer elemento de la secuencia,4u(t), y se vuelven a repetir los calculos enel siguiente periodo de muestreo. Notese que senecesita un observador, ya que la ley de controldepende de x(t).

Se debe notar que cuando los horizontes de controly de prediccion tienden a infinito y no existenrestricciones, este controlador se convierte en elconocido problema de regulador lineal optimocuadratico (lqr). La secuencia de control optimase genera entonces por una realimentacion linealdel vector de estado donde la matriz de gananciase calcula mediante la resolucion de una ecuacionde Riccati. Esta equivalencia permite un estudioteorico de los problemas de mpc basado en losresultados del campo del Control Optimo, comoes el caso de la estabilidad en bucle cerrado.

Si se emplea el modelo de espacio de estados dela ecuacion (10), las predicciones se calculan deforma ligeramente diferentes, como se muestra en(Maciejowski, 2001). Sea cual sea el modelo usadola ley de control es una realimentacion del vectorde estado que necesita un observador.

2.4 Perturbaciones medibles

Muchos procesos se encuentran sometidos a per-turbaciones externas provocadas por cambios enlas variables que se pueden medir. Esta es unasituacion tıpica en procesos cuyas salidas se venafectadas por variaciones en el regimen de carga.Considerese, por ejemplo, un reactor encamisadodonde la temperatura se controla manipulando elcaudal de agua que entra en la camisa refrigerante.Cualquier variacion del caudal de reactivo influiraen la temperatura del reactor. Este tipo de pertur-baciones, tambien conocidas como perturbacionesen la carga, pueden ser abordadas mediante eluso de accion feedforward. Como se vera a contin-uacion, las perturbaciones conocidas pueden serconsideradas de forma explıcita en mpc.

La idea es que si se conoce el efecto de estasperturbaciones en la salida del sistema entoncespueden ser incluidas en las predicciones. Estopermite que los controladores predictivos incluyanaccion feedforward, usada con gran exito en con-juncion con los controladores pid. Las perturba-ciones medibles se pueden incluir facilmente en

Marina Vallés
Marina Vallés
E. F. Camacho, C. Bordons
Marina Vallés
13
Page 10: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

las ecuaciones de prediccion, ya que pueden sertratadas como entradas al sistema.

Para sistemas lineales, el principio de super-posicion permite calcular las predicciones de lasalida como la suma del efecto de ambas entradas:la variable manipulable y la perturbacion medible.Por tanto, cualquiera que sea el controlador usado(gpc, dmc, etc.), la prediccion viene dada por:

y = yu + yd = Gu + f + Dd + fd

donde yd es la contribucion de la perturbacionmedible a la salida del sistema, D es una matrizsimilar a G que contiene los coeficientes de larespuesta del sistema a un escalon en la pertur-bacion, d es el vector de incrementos en la per-turbacion y fd es la parte de la respuesta que nodepende de la perturbacion.

El termino Dd depende de las perturbacionesfuturas. En algunos casos, cuando estas estan rela-cionadas con la carga, las perturbaciones futurasson conocidas o se pueden predecir usando tenden-cias u otros medios (ver por ejemplo (Bordons yCueli, 2004)). Si este es el caso, el termino corres-pondiente a las perturbaciones futuras puede sercalculado. En la mayorıa de los casos se consideraque las futuras perturbaciones de carga van aser constantes durante el horizonte e iguales alultimo valor medido (es decir, d(t + j) = d(t)) yentonces 4d(t + j) = 0 y el segundo termino deesta ecuacion desaparece.

Entonces, la prediccion viene dada en la formagenerica de respuesta libre y forzada:

y = Gu + f ′

donde f ′ incluye el efecto de la respuesta libredebida a la variable manipulada y el efecto de laperturbacion, que es parte de la nueva respuestalibre, ya que no depende de la secuencia de ac-ciones de control y por tanto es una constanteque no influye en la minimizacion. Esta ecuaciones el unico cambio que se debe hacer en la formu-lacion del controlador para incluir el efecto de lasperturbaciones medibles.

3. RESTRICCIONES EN CONTROLPREDICTIVO

El problema de control se ha formulado en lassecciones anteriores considerando que todas lassenales poseıan un rango ilimitado. Esta su-posicion no es demasiado realista, ya que en lapractica todos lo procesos estan sometidos a re-stricciones. Los actuadores tienen un rango limi-tado de actuacion y una velocidad de movimientolimitadas, como ocurre con las valvulas de control

u(t+1)

maxu

u max u(t)

u(t+1)

maxu

u max u(t)

cu u uc u

(a) (b)

Fig. 5. Restricciones en la senal de control

que estan limitadas por la posicion correspondi-ente a su cierre total o a su apertura total. Porrazones constructivas o de seguridad las variablesde proceso estan tambien limitadas, tal es el caso,por ejemplo, de los niveles en tanques o caudalesen tuberıas o la presion en depositos. Mas aun, enmuchos casos, el punto de operacion de la plantase elige para satisfacer objetivos economicos quesuelen estar situados en los lımites de operaciondel proceso, por lo que es previsible que el procesooperando en esos entornos y debido a las pertur-baciones se salga de limites.

La forma usual de tratar ese problema es calcularla senal de control u(t) y aplicarla al proceso. Siu(t) viola las restricciones, se satura a su lımitebien por el programa de control que vigila esteaspecto o por el propio actuador que no puede darmayor actuacion que la maxima. El caso en quela violacion se vaya a producir en los instantes detiempo futuro u(t + 1), · · · , u(t + N) ni siquierase considera. Esta forma de operar no garantiza laoptimalidad del problema cuando las restriccionesson violadas, por lo que el principal objetivo delcontrol predictivo que es calcular la mejor senalde control posible optimizando un ındice de fun-cionamiento no se cumple. Para ilustrar ese puntoconsiderense los casos de violacion de restriccionesde la figura 5 de un controlador predictivo con ho-rizonte dos. La figura 5(a) muestra el caso dondeu(t) > umax. En este caso lo normal serıa aplicarumax al proceso en lugar de uc que es el verdaderomınimo cuando se consideran restricciones. En elcaso que se muestra en la figura 5(b), u(t) noviola las restricciones y serıa aplicada al sistemaen lugar de la senal uc que es la que se debıa haberaplicado.

El no considerar plenamente las restricciones enlas variables manipuladas puede resultar en ma-yores valores de la funcion objetivo y por lo tantopeores resultados. En cualquier caso la variablesmanipuladas pueden ser siempre acotadas por elprograma de control o por los propios actuadoresque no van mas alla de sus lımites. El principalmotivo para considerar restricciones consiste enque violar las variables controladas puede ser mu-cho mas costoso y peligroso ya que esto puedeoriginar danos en los equipos y perdidas en la

Marina Vallés
Marina Vallés
Control Predictivo: Pasado, Presente y Futuro
Marina Vallés
14
Page 11: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

produccion. Por ejemplo, en la mayorıa de losreactores por lotes, la calidad de la produccion re-quiere que las variables del proceso se mantengandentro de lımites durante la reaccion; violar estoslımites puede llevar a una produccion de calidadinferior a la requerida. Cuando los limites hansido impuestos debido a razones de seguridad, laviolacion de estos lımites puede producir danosen los equipos, derrames de productos nocivos,o en la mayorıa de los casos que se activen losenclavamientos de seguridad produciendo paradasde emergencia con las perdidas aparejadas de pro-duccion y costosos procesos de puesta en marcha.

Al contrario de lo que ocurre con las variablesmanipuladas, que en ultimo extremo podemossaturar para mantenerlas dentro de lımites, lasvariables de proceso son fijadas por este y nopodemos manipularlas a voluntad. Mas aun, laviolacion de las restricciones en una variable deproceso puede ser debida a acciones previamentetomadas. Una de las ventajas del control predic-tivo es su capacidad de prediccion y anticiparse ala violacion de las restricciones.

Las restricciones que normalmente actuan en unproceso sobre las variables manipuladas, la veloci-dad de cambio de las variables manipuladas y lasvariables de proceso se pueden expresar como:

U ≤ u(t) ≤ U ∀tu ≤ u(t) − u(t− 1) ≤ u ∀ty(t) ≤ y(t) ≤ y(t) ∀t

Notese que el ultimo conjunto de restriccionesfuerza a las variables a seguir trayectorias den-tro de bandas (normalmente formadas por unatrayectoria nominal a seguir mas una banda detolerancia).

En algunos casos, el estado final del proceso (es-tado que se debe alcanzar al final del horizontede prediccion) se fuerza a alcanzar un conjuntoterminal con el fin de satisfacer condiciones deoperacion o de estabilidad. Es facil ver que elconjunto terminal induce un conjunto de restric-ciones sobre el vector de acciones de control (ver(Camacho y Bordons, 2004)).

3.1 Forma general de las restricciones

La mayor parte de las restricciones que puedenactuar sobre un proceso pueden ser descritas por

Ru ≤ r + Vx(t) (13)

Las matrices R, r, y V dependen de los parametrosdel proceso y de los valores lımites de las variablesdel proceso, por lo que solo tienen que ser calcu-ladas cada vez que los parametros o los lımitescambien (lo que suele ocurrir con poca frecuencia).

El ultimo sumando de la expresion (13) dependedel estado del proceso y ha de ser recalculado cadainstante de muestreo.

El problema completo puede expresarse como

minu

1

2uT Hu + bu + f0 (14)

s.a: Ru ≤ r + Vx(t) (15)

Este problema recibe el nombre de problemade programacion cuadratica (qp). Desafortunada-mente no existe una solucion explıcita del pro-blema anterior como en el caso de mpc sin res-tricciones. El problema qp se tiene que resolveraplicando algun algoritmo numerico. Aunque losalgoritmos qp son muy eficientes y algunos deellos tienen un tiempo de ejecucion garantizado, lasolucion del problema con restricciones es muchomas compleja que el caso sin restricciones

3.2 Optimizacion y restricciones

La implementacion del control predictivo es masdifıcil que la de los esquemas de control clasicosbasados en controladores pid, requiriendo mastiempo y personal con mas conocimiento de con-trol. Para empezar hay que encontrar un modelodel sistema, lo que requiere un conjunto de prue-bas sobre el proceso que en muchos casos implicanperturbar las condiciones normales de operaciondel proceso. Los equipos de control que se re-quieren son mas complicados, con computadoresmas potentes, y software de control mas caros.

A pesar de todas estas dificultades, el controlpredictivo ha demostrado que es economicamenterentable, reduciendo los costes de operacion yaumentando la produccion y la calidad. La razonde este exito radica en que el control predictivoopera optimizando funciones de costo y teniendoen cuenta las restricciones explıcitamente, lo quepermite:

• optimizar el punto de operacion,• optimizar las transiciones del proceso de un

punto otro• minimizar la varianza de operacion del pro-

ceso. Una varianza mas pequena permite au-mentar la calidad del producto y tambienoperar mas cerca de las restricciones. Comola mayorıa de los procesos estan sometidosa restricciones el punto optimo suele estaren la interseccion del conjunto de restric-ciones, el operar mas cerca de estos puntosimplica operar mas cerca del optimo. Con-siderese, por ejemplo, un proceso donde laproduccion (caudal, por ejemplo) depende dela presion de operacion como se ilustra enla figura 6. Al estar la presion de operacion

Marina Vallés
Marina Vallés
E. F. Camacho, C. Bordons
Marina Vallés
15
Page 12: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

Pmax

P

P

P

QQ Q

1

2

1 2t

Fig. 6. Puntos de operacion optimos y restric-ciones

limitada a pmax es evidente que para maxi-mizar la produccion se tendrıa que operar enese punto. Cuando el proceso esta sometidoa perturbaciones, no podemos operar en esepunto porque cualquier perturbacion positivaharıa al proceso salir de la zona permitida yposiblemente disparar los enclavamientos queharıan parar al proceso en el mejor de loscasos. Si el controlador es capaz de mantenerla varianza pequena, el punto de consigna sepuede situar mucho mas cercano tal como seilustra en la figura 6.

• La consideracion explıcita de las restric-ciones permite eliminar o al menos reducir elnumero de violaciones de restricciones y deparadas de emergencia por lo que el procesopuede operar mas cerca del optimo.

3.3 Gestion de restricciones

En algunos casos, a la hora de optimizar, la regiondefinida por las restricciones esta vacıa, es decir,el problema de optimizacion no es factible y no sepuede encontrar una solucion. En algunos casosla falta de factibilidad esta provocada por unosobjetivos de control (en forma de restricciones)demasiado estrictos en otras porque una pertur-bacion aleja al proceso de la region permitiday no existe ninguna secuencia de control capazde meter a las variables del proceso en la regionpermitida en los proximos instantes de muestreo.

La no-factibilidad puede aparecer por las especi-ficaciones del regimen estacionario cuando los va-lores de consigna que se fijan no son alcanzablesdebido a que las variables manipuladas estan aco-tadas. Cuando las variables manipulables estanacotadas por un poliedro (en general un hiper-cubo), la region alcanzable en regimen perma-nente es el poliedro cuyos vertices se obtienen apartir de los vertices del poliedro delimitando lasvariables manipulables por la matriz de ganan-cia estaticas del proceso. Para evitar problemasde factibilidad debido a puntos de consigna in-alcanzables solo hay que verificar que el vectorde consignas esta incluido dentro del poliedro devalores alcanzables por las variables a controlar enregimen permanente.

La no factibilidad puede aparecer en el regimentransitorio; en algunos casos cuando una pertur-bacion aparta al proceso de la zona admisible, talque es imposible introducirla de nuevo en la zonapermitida en los instantes de muestreo proximoscon una senal manipulable de energıa limitada. Enotros casos, el operador puede variar los lımitesoperacionales de las variables, haciendo tambienel problema no factible como se menciona en(Alvarez y Prada, 1997). La factibilidad es crucialpara el control predictivo ya que el algoritmonumerico no produce una solucion si no es factible.

Dado que las circunstancias descritas puedenocurrir y que los algoritmos de optimizacion uti-lizados por los controladores predictivos necesitanque existan soluciones factibles, es necesario tratarlos problemas de factibilidad. En (Camacho y Bor-dons, 2004) se dan algunas ideas para tratar losproblema de no factibilidad que se puede resumiren lo que sigue:

(1) Desconexion del controlador predictivo y uti-lizacion de un controlador backup.

(2) Eliminacion de restricciones hasta que elproblema sea factible. La eliminacion es tem-poral y se suele realizar de forma jerar-quizada.

(3) Relajacion de restricciones: algunas de lasrestricciones duras ((Ru < a)) se conviertenen retricciones blandas (Ru < a + ε) intro-duciendo variables de holgura (ε) que se in-cluye en la funcion objetivo anadiendo εT Tε

con una fuerte penalizacion.(4) Modificacion de los horizontes de control:

se utiliza cuando la no-factibilidad ocurreen los primeros instantes debido a que unaperturbacion ha sacado al proceso de lazona factible. El horizonte de control (aefectos de cumplir restricciones) se desliza;eliminandose de esta forma las restriccionesimposibles de cumplir.

3.4 MPC Multiobjetivo

Todas las estrategias mpc analizadas hasta ahorase basan en optimizar una unica funcion de coste,usualmente cuadratica, con objeto de determi-nar la secuencia de control futura que consigueel mejor comportamiento de la planta. Sin em-bargo, en muchos problemas de control el compor-tamiento del proceso no se puede representar poruna simple funcion objetivo, sino que, la mayorıade las veces, existen objetivos de control diferentesy a veces conflictivos. Las razones para objetivosmultiples son variadas. La operacion del procesopuede ser diferente en distintos puntos de trabajo(por ejemplo, tiempo mınimo en el arranque yvarianza mınima en regimen nominal) e incluso enun mismo punto de trabajo, el objetivo de control

Marina Vallés
Marina Vallés
Control Predictivo: Pasado, Presente y Futuro
Marina Vallés
16
Page 13: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

puede depender del valor de las variables (en elcaso de que una variable controlada se salga delımites, puede ser prioritario minimizar su erroren detrimento de otras variable).

Ademas, en muchos casos, el objetivo de con-trol no es optimizar la suma de los errores alcuadrado, sino mantener ciertas variables dentrode los lımites marcados. Este tipo de objetivosse puede expresar como una penalizacion de lacantidad que la variable se excede de su lımite.

Algunas veces todos los objetivos de control sepueden representar con una sola funcion objetivo.Considerese, por ejemplo, un proceso con una seriede objetivos de control J1, J2, ..., Jm, cada unode ellos con restricciones lineales. Alguno de losobjetivos puede ser mantener algunas variableslo mas cerca posible de sus referencias mientrasque otros pueden estar relacionados con mantenerciertas variables dentro de ciertas regiones. Lasecuencia de control se obtendra resolviendo elsiguiente problema de optimizacion:

min J =m

i=1

βiJi

s. a. Riu ≤ ai for i = 1, · · · ,m

La importancia de cada objetivo se puede pon-derar con la eleccion de los βi. Desde luego estono es trivial, ya que es muy difıcil determinar elconjunto de pesos que representaran la importan-cia relativa de los objetivos de control. Ademas,los objetivos de control en la practica son a ve-ces cualitativos, haciendo muy difıcil la tarea dedeterminar los pesos.

En algunos casos, la importancia relativa de losobjetivos de control se puede establecer mediantepriorizacion. Es decir, los objetivos de mayor pri-oridad (por ejemplo los relacionados con la se-guridad) deben ser satisfechos antes de considerarotros de prioridad menor. Notese que aunque losobjetivos se pueden priorizar dandole mayor valora los pesos, esto resulta una tarea complicada.

Considerese un proceso con una serie de m obje-tivos de control priorizados, Oi, de tal manera queel objetivo Oi tiene mayor prioridad que el Oi+1

y que los objetivos se pueden expresar como:

Riu ≤ ai

El procedimiento para tener en cuenta dicha pri-oridad consiste en introducir variables enteras Li

que toman valor 1 cuando el objetivo se cumpley 0 en caso contrario. Los objetivos se expresancomo:

Riu ≤ ai +Ki(1 − Li) (16)

donde Ki es un lımite superior conservador deRiu − ai. Si se cumple el objetivo Oi , Li = 1

y el objetivo reformulado coincide con el objetivode control original. Al introducir Ki, el objetivoreformulado (restriccion) se satisface siempre in-cluso cuando no lo hace el correspondiente obje-tivo de control Oi (L1 = 0).

La priorizacion de los objetivos se establece im-poniendo las siguientes restricciones:

Li − Li+1 ≥ 0 for i = 1, · · · ,m− 1

El problema es maximizar el numero de objetivosde control satisfechos:

m∑

i=1

Li

Si el modelo del proceso es lineal, el proble-ma se puede resolver mediante programacion li-neal mixta (Mixed Integer Linear Programming,milp). El numero de variables enteras se puedereducir tal como se indica en (Tyler y Morari,1996). La idea es usar la misma variable Li pararestricciones que no pueden ser violadas al mismotiempo, como es el caso de los lımites inferiory superior de la misma variable. Aunque hayalgoritmos eficientes para resolver este tipo deproblemas, la carga de calculo es mucho mayorque la de problemas del tipo lp o qp.

4. EJEMPLO

Esta seccion muestra un ejemplo realizado conuna herramienta que puede ser empleada parasimular la mayorıa de los controladores predic-tivos existentes. Este paquete de programas per-mite al usuario centrarse solo en la definicion delproblema y el ajuste del controlador, olvidandosede la carga de programacion del algoritmo. Laherramienta se llama impact, y se trata de unprograma que se ejecuta en el entorno Mat-lab con una comoda interface de usuario yque se puede descargar de forma gratuita dewww.esi.us.es/mpcbook. Este paquete de soft-ware permite la simulacion de la mayorıa delos algoritmos existentes (gpc, dmc, pfc, state-space mpc, etc.) para sistemas tanto monovari-ables como multivariables con la inclusion de re-stricciones, incertidumbres, ruido y cambios en lareferencia.

El proceso elegido se trata de una columna dedestilacion que es usada como banco de pruebaspara estrategias de control de destilacion y seconoce en la literatura como Shell Oil’s heavyoil fractionator (Arruda et al., 1994), (Chia yBrosilow, 1991).

El proceso y el experimento estan descritos condetalle en (Camacho y Bordons, 2004). Hay tres

Marina Vallés
Marina Vallés
E. F. Camacho, C. Bordons
Marina Vallés
17
Page 14: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

Fig. 7. Interface de usuario

variables que tienen que ser controladas: las com-posiciones de cabeza (y1) y lateral (y2) (medidasmediante analizadores) y la temperatura de cola(y3). Las variables manipuladas son las extrac-ciones superior (u1) y media (u2) y el caudal dereflujo (u3).

La composicion de cabeza se debe mantener res-tringida entre unos valores mınimo y maximode −0.5 y 0.5. Las variables manipuladas estantambien restringidas de forma que todas las ex-tracciones esten entre −0.5 y 0.5, al igual que elcaudal de reflujo. A su vez, tienen unas variacionesmaximas de 0.05 por minuto.

Impact resulta especialmente util en este caso,ya que el esfuerzo de programar un controladormultivariable es muy elevado. Para llevar a cabouna simulacion, el usuario debe definir el sistema,el controlador y el experimento, es decir, elegir quecontrolador quiere usar, introducir los coeficientesdel modelo y definir las restricciones y los ruidose incertidumbres en su caso.

La herramienta lleva un conjunto de ejemplos yaincorporados, no siendo necesario introducir loscoeficientes del modelo. Este ejemplo se encuentraen la biblioteca de experimentos y por tanto bastacon cargar el fichero. La pantalla que se le presentaal usuario se muestra en la figura 7.

Una vez que el modelo se ha cargado y se hadado valor a los parametros de sintonıa puedeempezar la simulacion. El usuario puede probarcon diferentes parametros y anadir incertidumbresy ruido para obtener el controlador que mejor seajuste a su planta real en distintas situaciones. Lapotencia de esta herramienta se aprecia en la fasede diseno del controlador, ya que se puede llevara cabo una gran cantidad de experimentos en laplanta simulada antes de aplicarlo al proceso real.

Los resultados que se obtienen al aplicar un gpc

multivariable al citado proceso se muestran en lafigura 8 para el caso de un horizonte de prediccion

0 10 20 30 40 50 60 70 80 90 1000

0.1

0.2

0.3

0.4

0.5

0.6

0.7N =30 Nu=5 Q =[1;1;1] R =[2;2;2] ,CONST ,NOISE

0 10 20 30 40 50 60 70 80 90 100−0.2

−0.1

0

0.1

0.2

DeltaU1DeltaU2DeltaU3

Ref1Ref2Ref3Output1Output2Output3

Fig. 8. Columna de destilacion

comun a todas las salidas de 30 y uno de control de5 con un ruido anadido a las salidas. Las matricesde ponderacion se han tomado como Q = I yR = 2 I. Hacia la mitad de la simulacion seprovoco un cambio en la referencia de la com-posicion de cabeza de 0.5 a 0.4. Las restriccionesanteriormente definidas tambien se han incluidoen el experimento y se muestran en la mismafigura. Notese que el incremento de las variablesmanipuladas estan restringidas a un valor de 0.2,que equivale a 0.05 por minuto, ya que el tiempode muestreo es de 4 minutos. Durante el primercambio de referencia, la primera senal de controltrata de responder de forma rapida para alcanzarcuanto antes el valor de referencia, pero el contro-lador la mantiene restringida a su valor maximodurante un periodo de muestreo.

5. CONTROL PREDICTIVO ROBUSTO

Los modelos matematicos son necesariamentesimplificaciones de la realidad, especialmente enel caso de los modelos de control que han de tenerestructuras simples (lineal en la mayor parte de loscasos) y con un orden suficientemente pequeno.

La mayor parte de las tecnicas de diseno de controlnecesitan un modelo de la planta, con estructurasy parametros conocidos (modelo nominal), que seusa en el diseno. Si el modelo de control fueraexacto, en lugar de aproximado y no hubiera per-turbaciones externas podrıa ser controlado por uncontrolador en bucle abierto. La realimentacion esnecesaria en control debido a las perturbacionesexternas y a los errores de modelado. El objetivode un controlador robusto es hacer frente a loserrores en el modelo. Aunque la realimentacionhace frente a estos problemas de forma implıcita,el termino Control Robusto se utiliza en la liter-atura para aquellos controladores que tienen encuenta las incertidumbres de forma implıcita.

Marina Vallés
Marina Vallés
Control Predictivo: Pasado, Presente y Futuro
Marina Vallés
18
Page 15: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

Normalmente se supone que existe una familiade modelos y que la planta se puede describirexactamente por un modelo de esa familia. Lastecnicas mas utilizadas en el contexto de Con-trol Robusto son incertidumbres en la respuestasfrecuenciales o incertidumbres en los parametrosde la funcion de transferencia del proceso. Ambosmodelos asumen que la planta es lineal con unarespuesta en frecuencia dentro de la banda deincertidumbre en el primer caso y en el segundocaso que la planta es ademas del mismo orden. Enel caso de control predictivo, las incertidumbresafectan a la capacidad de prediccion del modelo,la prediccion en lugar de ser una trayectoria esuna banda alrededor del modelo nominal. Con-siderese un sistema discretizado en el tiempo cuyadinamica viene definida por:

y(t+ 1) = f(y(t), · · · , y(t− ny), u(t), · · · ,

u(t− nu), z(t), · · · , z(t− nz), ψ) (17)

donde y(t) ∈ Y y u(t) ∈ U son vectores de saliday entradas de dimensiones n y m respectivamente,ψ ∈ Ψ es un vector de parametros y z(t) ∈ Z esun vector de variables exogenas.

Considerese una familia de modelos definida por:

y(t+ 1) = f(y(t), · · · , y(t− nna), (18)

u(t), · · · , u(t− nnb), θ)

donde y(t + 1) es la prediccion de la salida parael instante t + 1 generada por los modelos dela familia; f es una funcion vector, usualmenteuna simplificacion de f ; nna

y nnbson el numero

de salidas pasadas, entradas pasadas consideradaspor el modelo; y θ ∈ Θ es un vector de incertidum-bres sobre el modelo. Notese que las variablesz(t) que afectan a la respuesta del proceso no seconsideran por el modelo.

La dinamica del proceso (17) esta completa-mente descrita por la familia de modelos (18)si para cada posible y(t), · · · , y(t − ny) ∈ Y,u(t), · · · , u(t − nu) ∈ U, z(t), · · · , z(t − nz) ∈Z and ψ ∈ Ψ existe un valor del vector deparametros θi ∈ Θ tal que y(t+ 1) = y(t+ 1). Laforma de definir los parametros de incertidumbresθ y su dominio Θ depende de la estructura def y f y el grado de certeza sobre el modelo.Usualmente se consideran que los parametros delmodelo estan definidos dentro de una banda deincertidumbre alrededor de los parametros nom-inales. Lo mas practico es considerar todos loserrores globalizados (Camacho y Bordons, 2004)de forma que la planta se describe por la siguientefamilia de modelos:

y(t+ 1) = f(y(t), · · · , y(t− nna),

u(t), · · · , u(t− nnb)) + θ(t)

con dim(θ(t))=n. Aunque esta descripcion es masconservadora, es mas facil de obtener y mucho masintuitiva y refleja lo buena que es la prediccion aun paso del modelo. Otra ventaja a destacar deesta descripcion es que la ecuacion de predicciones afin en el vector de incertidumbre pudiendoseescribir como:

y = Guu + Gθθ + Gxx(t)

Notese que al utilizar esta descripcion no seasume que el proceso sea lineal, aunque el mode-lo lo sea, como es el caso de las incertidumbresparametricas o frecuenciales. Esta descripcionasume unicamente que el modelo puede prede-cir con toda certeza cual va a ser el valor delas variables de salida del proceso en el proximoinstante de muestreo con un grado de toleranciadeterminado. Se podrıa argumentar que estas in-certidumbres son en realidad perturbaciones nomedibles por la forma que afectan al modelo. Peroaquı la hipotesis que se hace es que las incer-tidumbres estan acotadas; de hecho, θ(t) podrıanser funciones de las entradas y salidas pasadas(estado).

La forma normal de operar al considerar incer-tidumbres estocasticas es minimizar la funcion ob-jetivo J para la situacion mas esperada. En el casode control robusto, la estrategia mas extendidaes considerar la peor de las situaciones posibles,que en el contexto de control predictivo equivalea minimizar la funcion objetivo en el peor de loscaso. Es decir,

minu∈U

maxθ∈Θ

J(u, θ)

Si se utilizan normas ∞ o normas 1, el proble-ma puede expresarse como (ver (Camacho y Bor-dons, 2004), capıtulo 8) como un problema lp.En cualquier caso el problema lp resultante esmucho mas complejo que el caso nominal porqueel numero de restricciones aumenta considerable-mente.

Cuando se utiliza una funcion cuadratica, lafuncion objetivo es convexa en θ, lo que implicaque el maximo de J se alcanza en uno de los ver-tices del Θ (Bazaraa y Shetty, 1979). La funciones tambien convexa en u lo que implica que si sealcanza un optimo, este es global.

5.1 Robustez y restricciones

Una forma de hacer un controlador predictivorobusto es imponer que las condiciones de es-tabilidad se verifiquen para cualquier realizacionde las restricciones. Las condiciones de estabili-dad (Mayne et al., 2000) en control predictivorequieren en general que la funcion objetivo con-tenga un coste terminal y que el estado al final del

Marina Vallés
Marina Vallés
E. F. Camacho, C. Bordons
Marina Vallés
19
Page 16: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

horizonte de control este incluido en una regionterminal.

El control predictivo robusto consiste en encontrarlos movimientos de control futuro minimizandola funcion objetivo y forzando al estado terminalalcanzar la region terminal para todos los valoresposibles de las incertidumbres; esto es,

minu

J(x(t),u) (19)

s. a.Ru ≤ r + Vx(t)x(t+N) ∈ ΩT

∀θ ∈ Θ

donde el conjunto terminal ΩT se define usual-mente como un poliedro ΩT = x : RTx ≤ rT .Las restricciones Ru ≤ r + Vx(t) corresponden alas restricciones de operacion. El vector r dependede forma afın de las incertidumbres θ; i.e., r = r0+Rθθ. El vector de predicciones se puede escribircomo:

x = Guu + Gθθ + fxx(t) (20)

Tomando las filas correspondientes a x(t + N) ysustituyendo en las restricciones de region termi-nal,

RT (guNu + gθN

θ + fxNx(t)) ≤ rT (21)

donde guN, gθN

, and fxNson las ultimas n filas de

Gu,Gθ, and Fx respectivamente, con n = dim(x).Las parte izquierda de las desigualdades (21) de-penden de forma afın del vector de incertidumbreθ. El problema (19) resulta un problema qp olp (dependiendo de la funcion objetivo) con unnumero infinito de restricciones. Como las restric-ciones son afines, si las restricciones se cumplenen los vertices del poliedro se cumplen para todoslos puntos en su interior, por lo que el numero in-finito de restricciones se transforma en un numerofinito (aunque muy grande). El problema se puedeexpresar como,

minu

J(x(t),u) (22)

s.a. (23)

Ru ≤ r0 + Rθθi + Vx(t)RT (guN

u + gθNθi + fxN

x(t)) ≤ rT

∀θi ∈ ε

donde ε es el conjunto finito de puntos extremos(vertices) de Θ.

5.2 Predicciones en Bucle Cerrado

Al resolver el problema min-max la solucion tieneque satisfacer las restricciones para todos los va-lores posibles de las incertidumbres. En muchoscasos estas condiciones plantean problemas deno-factibilidad porque el tamano de la bandade las predicciones crece de tal forma que esimposible satisfacer las restricciones. Esta forma

de operar no tiene en cuenta hasta sus ultimasconsecuencias el concepto de horizonte deslizante.La secuencia de control u(t), u(t + 1) · · · u(t +N − 1) se calcula para todo el horizonte sinninguna informacion sobre las incertidumbres. Sinembargo en la realidad cuando haya que calcularu(t+ j) el controlador ya tiene informacion sobrelas incertidumbres hasta ese instante de tiempo.

El problema es muy difıcil de resolver, una formaque permite una solucion en ciertos casos es uti-lizando Programacion Dinamica. Considerese elsistema descrito por: x(t+ 1) = f(x(t), u(t), θ(t))y el problema:

minu(t)

[maxθ(t)

[ minu(t+1)

· · · [ maxθ(t+N−1)

J(·)]] · · · ] (24)

La idea fundamental de la Programacion Dinamicaes resolver el problema (24) desde el corchetemas interior hacia el exterior. Es decir desde elproblema (Jt+N−1) definido por:

minu(t+N−1)

J t+N−1(x(t+N−1), u(t+N−1)) (25)

con J t+N−1(x(t + N − 1), u(t + N − 1)) =maxθ(t+N−1) L(x(t+N−1), u(t+N−1))+F (x(t+N)).

Note que F (x(t+N)) mide el merito de la ultimaposicion y de esta forma se evita entrar en unbucle infinito. Supongase que se puede resolver elproblema (25) explıcitamente, i.e., determinandoJ∗

t+N−1(x(t+N − 1)) como una funcion de x(t+N − 1). Esto es, el coste de ir desde x(t+N − 1)al final. A partir de este coste se podrıa obtenerJ∗

t+N−2(x(t+N − 2)) y se puede llegar a:

J∗t (x(t)) = min

u(t)J t(x(t), u(t)) (26)

con

J t(x(t), u(t)) = maxθ(t)

L(x(t), u(t))

+ J∗t+1(f(x(t), u(t), θ(t)))

El control predictivo min-max en bucle cerradoconsiste en calcular los movimientos de controlu∗(t) minimizando J t(x(t), u(t)). El factor clavede la Programacion Dinamica es encontrar lafuncion J∗

t+j(x(t+ j)).

Se ha podido demostrar (Bemporad et al., 2003)que si el sistema es lineal x(t+1) = A(ω(t))x(t)+B(ω(t))u(t) +Ev(t), con el vector de incertidum-bres θ(t)T = [ω(t)T v(t)T ], y la funcion de coste deun paso L(x(t+j), u(t+j)) = ‖Qx(t+j)‖p‖Ru(t+j)‖p con el coste terminal J∗

t+N (x(t + N)) =‖Px(t + N)‖p, la solucion es afın a trozos y sepuede encontrar utilizando programacion multi-parametrica.

Otra estrategia utilizada es aproximar la funcionJ∗

t (x(t + j)) en una rejilla de puntos como sesugiere en (Lee y Yu, 1997). La idea es calcular

Marina Vallés
Marina Vallés
Control Predictivo: Pasado, Presente y Futuro
Marina Vallés
20
Page 17: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

J∗t+N−1(x(t + N − 1)) en todos los puntos de la

rejilla en el primer paso para en un segundo pasocalcular la funcion J∗

t+N−2(x(t+N−2)) utilizandouna interpolacion de J∗

t+N−1(x(t+N−1)) cuandox(t+N − 1) = f(x(t+N − 2), u(t+N − 2), θ(t+N − 2)) no coincide con uno de los puntos de larejilla.

Una forma de reducir la banda de incertidumbrede la prediccion es utilizar una realimentacionlineal (Bemporad, 1998),(Chisci et al., 2001) delvector de estado antes de aplicar el control pre-dictivo. Es decir, hacer:

u(t+ k) = −Kx(t+ k | t) + v(t+ k) (27)

donde K es una realimentacion que estabiliza alsistema y la variable auxiliar v(t) es la referenciapara el bucle interno y la variable manipulablepara el controlador predictivo. De esta forma seconsigue disminuir el tamano de la banda deincertidumbre de la prediccion.

6. CONTROL PREDICTIVO Y SISTEMASHIBRIDOS

En la mayor parte de los procesos no solo hayvariables continuas sino que tambien variables quetoman valores discretos. Durante mucho tiempo,la forma de modelar y controlar uno y otro pro-ceso se realizo como algo totalmente distinto.Por una parte grafos de transicion de estados,redes de Petri etc. para describir a los procesoscon variables discretas y por el otro ecuacionesdiferenciales, funciones de transferencia etc. paradescribir procesos continuos. Desde el comienzo delos 90 ha habido un gran interes por el estudio deprocesos que tienen parte continua y discreta: lossistemas hıbridos. El control predictivo puede sertambien aplicado a sistemas hıbridos (ver capitulo10 de (Camacho y Bordons, 2004)). Los sistemashıbridos se han modelado de distintas formas:bien como un grafo de transicion de estados (condinamica continua dentro de cada estado) o biencomo un conjunto de ecuaciones diferenciales, o endiferencias, con variables discretas. Esta ultima esla aproximacion mas usual en el campo del controlpredictivo.

6.1 Sistemas Dinamicos con variables logicas

Este tipo de sistemas (”Mixed Logical Dynam-ical Systems”, mld) propuesto en (Bemporad yMorari, 1999) se describe por:

x(t+ 1) =Ax(t) +B1U(t) +B2δ(t) +B3z(t)

y(t) =Cx(t) +D1u(t) +D2δ(t) +D3z(t) (28)

E1x(t) + E2u(t) + E3δ(t) + E4z(t) ≤ g

donde x(t) = [xTr (t) xT

b (t)] siendo xr(t) ∈ Rn

la parte continua del vector de estado y xb(t) ∈0, 1nb la parte discreta. La salida del sistematiene una estructura similar y(t) = [yT

r (t) yTb (t)]

donde yr(t) ∈ Rm es la parte continua y la

parte discreta viene dada por yb(t) ∈ 0, 1mb .El vector de entrada u(t) = [uT

r (t) uTb (t)] esta

compuesto de una parte continua ur(t) ∈ Rl y

otra discreta ub(t) ∈ 0, 1lb . La descripcion suelerequerir variables auxiliares continuas z(t) ∈ R

r ydiscretas δ(t) ∈ 0, 1rb .

La idea clave para obtener esta descripcion a par-tir de las expresiones logicas de la parte discreta deun sistema hıbrido es que las expresiones logicasse pueden expresar facilmente (ver (Camacho yBordons, 2004), capıtulo 10) en restricciones. Porejemplo supongamos dos variables logicas L1 y L2

que pueden tomar los valores logicos 0 o 1. Laexpresion logica ”L1 or L2” se transforma en larestriccion L1 + L2 ≥ 1. La expresion logica ”L1

and L2” se transforma en L1 +L2 ≥ 2 con ambasvariables pertenecientes a [0, 1].

6.2 Control Predictivo de sistemas MLD

El problema de control predictivo se puede formu-lar como:

u∗ = arg minu

‖x − rx‖pQx

+ ‖u − ru‖pQu

+ (29)

‖δ − rδ‖pQδ

+ ‖z − rz‖pQz

sujeto a las ecuaciones (28), donde ‖x‖pQ denota

xTQx cuando p = 2 yQ‖x‖p para p = 1 o p = ∞ yQx, Qu, Qδ, y Qz son matrices de peso de dimen-siones apropiadas y todas las senales se predicencon la informacion disponible hasta el instante t enla forma usual del control predictivo. Los vectoresx, u, δ, z, rx, ru, rδ y rz son los vectores de estadosfuturos predichos, movimientos de control, vari-ables logicas auxiliares, variables reales auxiliares,y sus referencias futuras correspondientes.

El control predictivo resultante resulta ser unproblema de optimizacion con un conjunto derestricciones lineales y con variables de decisionreales y enteras Este tipo de problemas se conocecon el nombre de problemas de programacionmixta (real y entera). Son problemas mucho masdifıciles de resolver que los problemas lp o qp (ver(Floudas, 1995)).

6.3 Sistemas afines a trozos

Otra forma de modelar sistemas hıbridos es medi-ante sistemas afines a trozos (”piecewise affine sys-tems”, pwa). De hecho, se ha probado (Heemelset al., 2001) que un sistema mld (y muchas otras

Marina Vallés
Marina Vallés
E. F. Camacho, C. Bordons
Marina Vallés
21
Page 18: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

descripciones de sistemas hıbridos) se pueden des-cribir como sistemas pwa. Los sistemas afinesa trozos tienen tambien la ventaja de permitiraproximar sistemas no lineales con un grado deprecision arbitrario. Un sistema afın a trozos sepuede describir por:

x(t+ 1) = Aix(t) +Biu(t) + f i

y(t) = Cix(t) + gi for

[

x(t)u(t)

]

∈ Xi

donde Xisi=1 es una particion poliedrica del es-

pacio de estado y entrada. Cada Xi viene dado por

Xi =

[

x(t)u(t)

]

|Ri

[

x(t)u(t)

]

≤ ri

Cada subsistema Si esta definido por la 7-tupla

(Ai, Bi, Ci, f i, gi,Ri, ri), i ∈ 1, 2, . . . , s. Ai ∈R

n×n, Bi ∈ Rn×m, and (Ai, Bi) ies un par

controlable. Ci ∈ Rr×n and Ri ∈ R

pi×(n+m)

y f i , gi , ri son vectores constantes apropiados.La dimensiones de los vectores de estado, deentradas de salida son n, m y r respectivamente.Finalmente, pi es el numero de hiperplanos quedefinen al poliedro i.

Asumiendo que todo el estado esta disponible(un estimador del estado serıa necesario en casocontrario), la formulacion del control predictivoes:

u = arg(minuJ) (30)

s.a. : J =N

i=1

qii(y(t+ i | t) − w(t+ i))2 +

N−1∑

i=0

riiu(t+ i)2

umin ≤ u(t+ i) ≤ umax i = 0, ..., N − 1

Considerese el problema de prediccion: el sub-sistema que describe el proceso en el instante t

es conocido pero el siguiente subsistema dondeel proceso estara en el instante de tiempo si-guiente depende de la senal de control apli-cada. En general, una secuencia de subsistemasI = I(t) I(t+ 1) . . . I(t+N) se pueden ”ac-tivar” a lo largo de la trayectoria. Solo el valorinicial I(t) = I(t)(x(t)) de esta secuencia esconocido. Notese que si no hay restricciones, elnumero posible de secuencias para un horizontede N es sN−1, numero que puede ser muy elevado.El problema de optimizacion resultante se puedeexpresar como:

u∗ = arg(minu,I

J) (31)

donde hay que anadir restricciones para conside-rar las dependencias entre los subsistemas y susecuaciones correspondientes, i.e.:

RI(t+j)x(t+ j) ≤ rI(t+j), j = 1, . . . , N (32)

Este problema podrıa ser resuelto encontrando eloptimo para cada posibles secuencia de I, i.e.

u∗ = arg

(

minI

(

minu

(

JRIU u≤qIU

)))

(33)

donde RIUu ≤ rIU son las restricciones debidas alas dependencias entre I y U .

Los problemas milp o miqp resultante son muchomas difıciles de resolver en tiempo real que losproblemas qp o lp de los controladores predictivosnominales.

7. METODOS RAPIDOS PARAIMPLEMENTAR CONTROLADORES

PREDICTIVOS

Una de las desventajas de los controladores pre-dictivos es que requieren, en algunos casos, tiem-pos de calculo demasiado grandes para aplica-ciones de tiempo real. Esto ocurre por ejemploen el caso de presencia de restricciones, cambiosen los parametros del proceso, control predictivorobusto o control predictivo no lineal. Han apare-cido algoritmos en la literatura que permiten laimplementacion facil de controladores predictivos.Tal es el caso de la estructura propuesta (Bordonsy Camacho, 1998) para sistemas que puedan serdescritos por el metodo de la curva de reacciono la utilizacion de redes neuronales para aproxi-mar controladores predictivos no lineales (GomezOrtega y Camacho, 1994).

Recientemente se ha demostrado (Bemporad etal., 2002) que un controlador predictivo se puedeexpresar como un programa multiparametricocuya solucion resulta en un controlador que es afına trozos en el espacio de estado. La idea es simpley fue sugerida por primera vez en (Zafiriou, 1990):el optimo de un problema qp se alcanza en un con-junto de restricciones activas (el conjunto puedeser vacıo) y para todos los puntos del espacio quetengan el mismo conjunto de restricciones activas,la solucion es afın.

7.1 Ejemplo Ilustrativo: el doble Integrator

Considere el doble integrador descrito por laecuacion siguiente:

Y (s) =1

s2U(s)

Si el proceso se muestrea con un tiempo demuestreo de una unidad y suponiendo un mues-treador y mantenedor entre ambos integradores,la descripcion discreta del sistema es:

A =

[

1 10 1

]

B =

[

01

]

C =[

1 0]

Marina Vallés
Marina Vallés
Control Predictivo: Pasado, Presente y Futuro
Marina Vallés
22
Page 19: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

Considerese la funcion objetivo:

J =

∞∑

j=1

(y(t+ j)2 + λu(t+ j − 1)2)

Notese que utilizando una funcion objetivo conhorizonte infinito garantizamos la estabilidad delcaso nominal cuando no hay restricciones. Cuandono hay restricciones, este problema no puede serresuelto ya que el numero de variables de de-cision para el algoritmo numerico es infinito. Sisuponemos que las restricciones van a afectar a laprimera parte de la respuesta, y descomponiendola funcion objetivo en:

J = λu(t)2 (34)

+N−1∑

j=1

(x(t+ j)TQx(t+ j) + u(t+ j)TRu(t+ j))

+

∞∑

j=N

(x(t+ j)TQx(t+ j) + u(t+ j)TRu(t+ j))

con R = λ y Q =

[

1 00 0

]

para el ejemplo. Si

la ultima parte de la funcion de costo (34) no esafectada por las restricciones, se puede encontrarsu valor optimo resolviendo la ecuacion de Riccaticorrespondiente. Para N = 2 y λ = 0.1, la ley decontrol resultante (obtenida al resolver la ecuacionde Riccati) es u(t) = Kx(t) con K = [−0.8166 −1.7499]. El valor de la funcion objetivo cuando seaplica esta ley de control (para el caso nominal sinruido ni restricciones) es una funcion del estadoque viene dada por J(x) = xTPx, donde P seobtiene al resolver la ecuacion de Riccati (ver(Camacho y Bordons, 2004) que en este casoresulta:

P =

[

2.1429 1.22461.2246 1.3996

]

Si la ley de control optima se aplica para k > N ,la funcion de coste resulta:

J =N

j=1

(x(t+ j)TQjx(t+ j)

+ u(t+ j − 1)TRu(t+ j − 1)) (35)

con Qj = Q for j < N y QN = P . Si losmovimientos de control estan restringidos por−1 ≤ u(t) ≤ 1 y −1 ≤ u(t + 1) ≤ 1, haynueve regiones descritas, con sus controladorescorrespondientes, por expresiones del tipo:

Region 1:

Si

−0.8166 −1.74990.6124 0.4957

0.8166 1.7499

−0.6124 −0.4957

x(t) ≤

1

11

1

entonces

u(t) = [−0.8166 − 1.7499]x(t)

Region 2:

Si

[

2.4491 5.2482−0.8166 −2.5665

0.8166 2.5665

]

x(t) ≤

[

−2.99912.7499

−0.7499

]

entonces u(t) = 1

Region 3:

.

.

.

Region 9:

Si

[

−6.7349 −18.7181

−2.4491 −7.6974

]

x(t) ≤

[

−17.4314

−8.2474

]

entonces u(t) = −1

La ley de control resultante no esta restringidapara los puntos de la region 1 y coincide, como erade esperar, con la solucion de la ecuacion de Ric-cati. Las regiones pueden verse en la figura 9, quetambien muestra la evolucion del estado (cuandose aplica la ley de control afın descrita previa-mente) con un estado inicial dado por x(t)T =[−5 5].

Notese que el controlador minimiza la expresion(35) con N = 2, que minimizara la funcion conhorizonte infinito cuando la senal de control noesta afectada por restricciones despues para hor-izontes mayores que 2. Notese que la parte aimplementar del controlador en lınea consiste en:a) leer o estimar el estado, b) decidir en queregion esta el sistema y c) aplicar la ley de controlcorrespondiente. En este ejemplo el numero deoperaciones para determinar la region es de 48multiplicaciones, 24 sumas y 24 comparaciones.El calculo de la senal de control requiere comomaximo dos multiplicaciones y una suma. Es decirun numero muy reducido de operaciones. Noteseque el mayor tiempo de calculo corresponde a ladeterminacion de la region, este tiempo dependedel numero de regiones y dimension del vectorde estado y puede ser considerable. En (Tøndel yJohansen, 2002) se sugiere un metodo para orga-nizar las restricciones de forma que se minimice elnumero de operaciones necesarias para determinarla region.

7.2 Implementaciones rapidas de MPC robustos

Cuando hay incertidumbres, es necesario resolverun problema min-max y satisfacer un conjuntode restricciones para cualquier realizacion posiblede las incertidumbres. Se ha demostrado que laprogramacion multiparametrica puede ser exten-dida a este problema. En el caso de normas ∞ (onorma 1) la solucion es afın a trozos (Bemporad etal., 2001). Este hecho puede deducirse facilmenteporque en estos casos el problema min-max sepuede expresar como un problema lp (ver capıtulo

Marina Vallés
Marina Vallés
E. F. Camacho, C. Bordons
Marina Vallés
23
Page 20: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

−15 −7.5 0 7.5 15−6

−4

−2

0

2

4

6

x1

x 2R9

R1

R4

R8

R3 R6

R2

R7

R5

Fig. 9. Regiones de control afines para el dobleintegrador.

8 de (Camacho y Bordons, 2004)) y que para estosproblemas la solucion es lineal a trozos. Para elcaso de funciones objetivos cuadratricas, se hademostrado (Ramırez y Camacho, 2001) que elmin-max mpc es tambien una ley de control afına trozos.

Estos resultados han hecho cambiar la concepcionde que estos controladores solo pueden ser apli-cados a procesos lentos y requiriendo gran capaci-dad de calculo. Las realizaciones rapidas permitenaplicar controladores predictivos con restriccioneso controladores predictivos min-max a procesosrapidos sin requerir grandes procesadores.

8. MPC NO LINEAL

En general, los procesos industriales son no linea-les, pero aun ası, la mayorıa de aplicaciones delmpc estan basadas en el uso de modelos lineales.Existen dos importantes razones para ello: porun lado, la identificacion de un modelo lineal apartir de datos de proceso es relativamente sen-cilla y por otro, los modelos lineales proporcionanbuenos resultados cuando la planta opera en lascercanıas del punto de operacion. Ademas, el usode un modelo lineal junto con una funcion de costecuadratica da lugar a un problema convexo (Pro-gramacion Cuadratica), cuya solucion esta bienestudiada y existen numerosos productos comer-ciales disponibles.

Sin embargo, la respuesta dinamica de los contro-ladores lineales que resultan es inaceptable cuandose aplican a procesos que son no lineales condistinto grado de severidad. Aunque el numerode aplicaciones de Nonlinear Model PredictiveControl (nmpc) es aun limitada (ver (Badgwell yQin, 2001), (Qin y Badgwell, 1998)), su potenciales realmente grande y acabara abriendose caminoen aquellas areas donde las no-linealidades sonseveras y la demanda de mercado exige frecuentescambios en el regimen de operacion.

En esta seccion se muestran algunos de los de-sarrollos mas recientes y las nuevas tendenciasen los aspectos tanto teoricos como practicos denmpc. Ambos aspectos son importantes ya quehay temas teoricos tales como modelado o estabi-lidad que poseen tanta importancia como aquellosde ındole practica como identificacion o compleji-dad computacional. Se puede considerar que lostemas mas relevantes en este campo son el desar-rollo de modelos que sean capaces de capturar ladinamica no lineal del proceso y la obtencion deuna solucion factible en tiempo real al problemade la minimizacion.

El desarrollo de modelos no lineales adecuadospuede ser una tarea muy complicada y en generalno existe una forma claramente apropiada pararepresentar este tipo de sistemas. Gran parte delexito del mpc se ha debido a la relativa facilidadcon que se pueden obtener modelos de convolucion(impulso o escalon) o funciones de transferen-cia de bajo orden. Los modelos no lineales sonmas difıciles de construir, bien por correlacionesde datos de entrada-salida o bien por el uso deprimeros principios a partir de ecuaciones de bal-ance de masa y energıa.

Hay tres tipos de modelos que se usan en lasformulaciones de nmpc:

• Modelos empıricos, que se obtienen de datosreales y pueden tomar la forma de modelosde entrada-salida (tales como narx, mode-los de Volterra, Hammerstein o bilineales yredes neuronales) o modelos no lineales en elespacio de estados.

• Modelos fundamentales, que provienen deecuaciones de balance, tambien llamados deprimeros principios. Las ecuaciones se ob-tienen por el conocimiento del proceso, apli-cando ecuaciones de balance de masa, energıamomento. En este caso, la prediccion se hacecomo una simulacion de las ecuaciones nolineales que describen la dinamica del pro-ceso. Para procesos industriales complejos,este tipo de modelos es difıcil y costoso deconstruir, ya que necesita conocimiento muyexperto.

• Modelos de caja gris, que se desarrollan com-binando los enfoques empırico y fundamen-tal, haciendo uso de las ventajas de cadatipo de modelo. En este enfoque hıbrido, lainformacion de los primeros principios se veenriquecida con datos empıricos.

El otro asunto crucial en nmpc es la solucion delproblema. Requiere la consideracion (y al menosla resolucion parcial) de un problema no linealno convexo (nlp) que da lugar a una serie dedificultades computacionales relacionadas con elcoste y la fiabilidad de la resolucion del problemanlp en lınea.

Marina Vallés
Marina Vallés
Control Predictivo: Pasado, Presente y Futuro
Marina Vallés
24
Page 21: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

Normalmente el problema se resuelve haciendouso de la Programacion Cuadratica Secuencial(Sequential Quadratic Programming, sqp), queson extensiones de metodos de tipo Newtonpara lograr la convergencia a las condiciones deKarush-Kuhn-Tucker (kkt) del problema de opti-mizacion. El metodo debe garantizar convergenciarapida y debe tratar problemas de mal acondi-cionamiento y no linealidades extremas. sqp esuna tecnica iterativa en la cual la solucion encada paso se obtiene mediante la resolucion deuna aproximacion al problema no lineal en laque el objetivo es sustituido por una aproxi-macion cuadratica y las restricciones no linealespor aproximaciones que sı los son.

La solucion exacta del problema de optimizacionen cada instante de muestreo es una tarea ar-dua. Por ello, en los ultimos anos ha aparecidouna serie de formulaciones que pretenden evi-tar los problemas asociados a la optimizacion noconvexa. Estas formulaciones deben abordar laestabilidad y la factibilidad de la solucion quedebe calcularse durante el periodo de muestreo.Una revision de las tecnicas existentes se puedeencontrar en (Camacho y Bordons, 2004), dondeformulaciones como mpc lineal extendido, mod-elos locales, nmpc suboptimo, uso de horizontescortos, descomposicion de la secuencia de control,linealizacion por realimentacion, mpc basado enmodelos de Volterra o nmpc con redes neuronalesson descritas en detalle.

9. ESTABILIDAD

La solucion eficiente del problema del controloptimo es importante para cualquier aplicaciona procesos reales, pero la estabilidad del buclecerrado es tambien de crucial importancia. Parasistemas lineales sin restricciones, la estabilidad sepuede analizar con herramientas convencionalesde teorıa de sistemas lineales, pero si aparecenrestricciones o el sistema es no lineal, la ley de con-trol se convierte en no lineal y deben usarse otrasherramientas. Se trata de un campo donde hanaparecido resultados significativos recientemente.

Incluso en el caso de que el algoritmo de opti-mizacion encuentre una solucion, esto no garan-tiza las estabilidad del bucle cerrado (inclusosin incertidumbres). El uso de penalizacion o re-striccion terminal, funciones de Lyapunov o con-juntos invariantes ha dado lugar a una ampliafamilia de tecnicas que son capaces de garantizarla estabilidad del sistema controlado.

Este problema ha sido abordado desde distin-tos puntos de vista, dando lugar a una serie decontribuciones que siempre analizan el problemadel regulador (llevar el estado al reposo) en el

marco del espacio de estados. Las formulacionesde estabilidad garantizada estan recogidas en lapublicacion de Mayne et al. (Mayne et al., 2000).En esta referencia, los autores presentan las condi-ciones suficientes para el diseno de un controladorpredictivo estabilizante con restricciones.

Los ingredientes clave de un mpc estabilizante sonel conjunto terminal y el coste terminal. El estadoterminal denota el estado predicho del sistema alfinal del horizonte de prediccion. Se fuerza a queeste estado terminal alcance un conjunto terminalque contenga el estado en regimen estacionarioy tiene un coste asociado que se denomina costeterminal, que se anade como un nuevo termino ala funcion de coste.

Se supone que el sistema es localmente estabi-lizable mediante una ley de control de la formau = h(x), que debe satisfacer las siguientes condi-ciones:

• Existe una region Ω tal que para todo x(t) ∈Ω, entonces h(x(t)) ∈ U (conjunto de ac-ciones de control admisibles) y el estado delsistema en el siguiente tiempo de muestreox(t+ 1) ∈ Ω.

• Para todo x(t) ∈ Ω, existe una funcion deLyapunov V (x) tal que

V (x(t)) − V (x(t+ 1)) ≥

x(t)TRx(t) + h(x(t))TSh(x(t))

Si se verifican estas condiciones, entonces al con-siderar Ω como conjunto terminal y V (x) comocoste terminal, el controlador mpc (con igualesvalores de horizonte de control y de prediccion)estabiliza asintoticamente todos los estados ini-ciales que sean factible. Por tanto, si el estadoinicial es tal que el problema de optimizaciontiene solucion, entonces el sistema es llevado alregimen permanente asintoticamente y satisfacelas restricciones durante su evolucion.

La condicion que se impone sobre Ω asegurala satisfaccion de las restricciones y la segundacondicion asegura que el coste optimo es unafuncion de Lyapunov.

Como el problema de optimizacion que se deberesolver en cada periodo de muestreo puede no serconvexo, la solucion optima puede no ser unicay puede ser muy difıcil de obtener. Ası, se hanpropuesto diferentes enfoques para relajar estehecho. La principal contribucion en este tema es laprueba de estabilidad asintotica en el caso de solu-ciones sub-optimas (Scokaert et al., 1999): bastaconsiderar cualquier solucion factible con costeasociado estrictamente menor que el del tiempode muestreo anterior. En efecto, cualquier solucionfactible asegura factibilidad, y por tanto cumplim-iento de las restricciones, y el coste estrictamentedecreciente garantiza estabilidad asintotica. Es

Marina Vallés
Marina Vallés
E. F. Camacho, C. Bordons
Marina Vallés
25
Page 22: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

conveniente remarcar que la sub-optimalidad noes deseable, ya que implica una perdida de presta-ciones.

Otra tecnica para reducir la carga computacionaldel problema de optimizacion es la eliminacionde la restriccion terminal. Es especialmente in-teresante cuando no existen restricciones en elestado. En este caso, la carga computacional notiene por que ser incrementada para introducirrestricciones terminales del estado por razones deestabilidad. Este tema se ha analizado en (Huy Linnemann, 2002), (Jadbabaie et al., 2001) y(Limon et al., 2003).

El horizonte de prediccion es un parametro dediseno del mpc de gran importancia. Si se au-menta su valor el dominio de atraccion del con-trolador se hace mayor y se mejora el compor-tamiento. Sin embargo, el numero de variablesde decision tambien es mayor y por tanto seincrementa la complejidad del problema de op-timizacion. La condicion necesaria que se debeconsiderar para elegir el horizonte de prediccion esla factibilidad del estado inicial. Ası, el horizontese puede reducir aumentando la region terminal.

Si el analisis de estabilidad es una tarea compleja,el de robustez (es decir, cuando aparecen erroresde modelado) es logicamente peor. Los resultadosde estabilidad mostrados previamente son validossolo en el caso de modelos perfectos, lo que noes cierto en la practica. Este tema puede ser con-siderado como abierto y con resultados solo pre-liminares. Se han propuesto formulaciones en laforma de problema min-max o H∞-nmpc aunquelos requisitos de calculo son prohibitivos.

10. TEMAS ABIERTOS

El control predictivo se considera un controladormaduro en el caso de procesos lineales y es uti-lizado con bastante exito en la industria. Encualquier caso, no se puede considerar al contolpredictivo como una disciplina ya cerrada a lainvestigacion, sino que, al contrario, es una ramadel control de gran efervescencia. Esto se puedeconstatar por el hecho de que en todos los congre-sos de control de estos ultimos anos siempre haysesiones especificas de control predictivo y raroes el numero de las revistas de control donde noaparezca algun articulo sobre este tema.

Los temas todavıa no del todo resueltos y queson objeto de investigacion se pueden a grossomodo clasificar en problemas de implementaciony problemas de analisis y diseno. El control pre-dictivo es muy difıcil de implementar en tiemporeal para procesos no lineales, procesos hıbridoso procesos muy rapidos. En el caso de sistemasno lineales e hıbridos han aparecido soluciones

para casos particulares y normalmente de pequenadimension, pero no existen soluciones generales.Se ha demostrado recientemente que la estructurade control predictivo para procesos lineales es afına trozos y por lo tanto el controlador puede calcu-larse previamente. Esto ha permitido que el con-trol predictivo pueda ser aplicado a procesos masrapidos, pero, desafortunadamente, la tecnica soloes aplicable a problemas de pequena dimension(incluyendo horizontes de control pequenos).

El otro gran problema todavıa no resuelto es elproblema del analisis de estabilidad y robustez deestos controladores. Es decir, aun en el caso de quelos controladores sean implementables, analizarcomo se puede asegurar su estabilidad en el casonominal o en el caso de que el modelo no seaexacto. Para el caso de restricciones, el analisisde estabilidad parecıa ser un problema demasi-ado complicado de resolver. Aun en el caso deque el optimizador fuera capaz de encontrar unasolucion, no esta garantizada la estabilidad delbucle cerrado. La utilizacion de penalizaciones ter-minales y/o restricciones, funciones de Lyapunov,o conjuntos invariantes han dado lugar a unafamilia de tecnicas que garantizan la estabilidaddel sistema. Este problema ha sido atacado dedistintos puntos de vista y han aparecido nu-merosas contribuciones en anos recientes, siempreanalizando el problema del regulador (llevar es-tado al reposo) y normalmente en el espacio deestados. Se han obtenido resultados que utilizantecnicas de control robusto en el contexto de con-troladores predictivos. La idea basica es tener encuenta las incertidumbres sobre el proceso de unamanera explıcita y disenar el controlador predic-tivo para optimizar la funcion objetivo ante lapeor situacion posible de las incertidumbres. Encualquier caso, estos resultados exigen el computode regiones invariantes que salvo en el caso desistemas lineales son dificılmente calculables.

Estos resultados prometedores permiten pensarque el control predictivo experimentara una mayordiseminacion tanto en el mundo academico comoen la comunidad industrial en los proximos anos.

11. RECONOCIMIENTOS

Los autores quieren reconocer el apoyo del Mi-nisterio de Ciencia y Tecnologıa a traves de losproyectos DPI2001-2380-C02-01 y DPI200-4375-C03-01 y los comentarios de los componentes delGrupo de Control Predictivo de la Universidad deSevilla.

Marina Vallés
Marina Vallés
Control Predictivo: Pasado, Presente y Futuro
Marina Vallés
26
Page 23: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

REFERENCIAS

Alvarez, T. y C. Prada (1997). Handling Infeasi-bility in Predictive Control. Computers andChemical Engineering 21, 577–582.

Arruda, L.V.R., R. Luders, W.C. Amaral y F.A.CGomide (1994). An Object-oriented Environ-ment for Control Systems in Oil Industry. In:Proceedings of the 3rd Conference on ControlApplications, Glasgow, UK. pp. 1353–1358.

Astrom, K.J. y B. Wittenmark (1984). Com-puter Controlled Systems. Theory and De-sign. Prentice-Hall. Englewood Cliffs, NJ.

Badgwell, T.A. y S.J. Qin (2001). Nonlinear Pre-dictive Control. Chap. Review of NonlinearModel Predictive Control Applications. IEEControl Engineering series.

Bazaraa, M.S. y C.M. Shetty (1979). NonlinearProgramming. Wiley.

Bemporad, A. (1998). Reducing Conservativenessin Predictive Control of Constrained Systemswith Disturbances. In: IEEE Conference onDecision and Control.

Bemporad, A., F. Borrelli y M. Morari (2001).Robust Model Predictive Control: PiecewiseLinear Explicit Solution. In: Proc. EuropeanControl Conference, ECC’01.

Bemporad, A., F. Borrelli y M. Morari (2003).Min-max Control of Constrained UncertainDiscrete-time Linear Systems. IEEE Tran. onAutomatic Control 48(9), 1600 – 1606.

Bemporad, A., M. Morari, V. Dua y E.N.Pistikopoulos (2002). The Explicit LinearQuadratic Regulator for Constrained Sys-tems. Automatica 38(1), 3–20.

Bemporad, A. y M. Morari (1999). Control of Sys-tems Integrating Logic, Dynamics and Con-straints. Automatica 35(3), 407–427.

Bordons, C. y E.F. Camacho (1998). GeneralizedPredictive Controller for a Wide Class of In-dustrial Process. IEEE Transaction on Con-trol Systems Technology 6(3), 372–387.

Bordons, C. y J.R. Cueli (2004). Predictive Con-troller with Estimation of Measurable Dis-turbances. Application to an Olive Oil Mill.Journal of Process Control 14(3), 305–315.

Camacho, E.F. y C. Bordons (2004). Model Pre-dictive Control, Second Edition. Springer-Verlag.

Chia, T.L. y C.B. Brosilow (1991). Modular Mul-tivariable Control of a Fractionator. Hydro-carbon Processing pp. 61–66.

Chisci, L., J. A. Rossiter y G. Zappa (2001). Sys-tems with persistent disturbances: Predictivecontrol with restricted constraints. Automat-ica 37, 1019–1028.

Clarke, D.W. (1988). Application of GeneralizedPredictive Control to Industrial Processes.IEEE Control Systems Magazine 122, 49–55.

Clarke, D.W., C. Mohtadi y P.S. Tuffs (1987).Generalized Predictive Control. Part I. TheBasic Algorithm. Automatica 23(2), 137–148.

Clarke, D.W. y P.J. Gawthrop (1979). Self-tuningControl. Proceedings IEEE 123, 633–640.

Clarke, D.W. y R. Scattolini (1991). ConstrainedReceding-horizon Predictive Control. Pro-ceedings IEE 138(4), 347–354.

Cutler, C.R. y B.C. Ramaker (1980). DynamicMatrix Control- A Computer Control Al-gorithm. In: Automatic Control Conference,San Francisco.

Floudas, C.A. (1995). Non-Linear and Mixed In-teger Optimization. Oxford Academic Press.

Garcıa, C.E., D.M. Prett y M. Morari (1989).Model Predictive Control: Theory andPractice-a Survey. Automatica 25(3), 335–348.

Gomez Ortega, J. y E.F. Camacho (1994). Neu-ral Network MBPC for Mobile Robots PathTracking. Robotics and Computer IntegratedManufacturing Journal 11(4), 271–278.

Gomez Ortega, J. y E.F. Camacho (1996). MobileRobot Navigation in a Partially StructuredEnvironment using Neural Predictive Con-trol. Control Engineering Practice 4, 1669–1679.

Greco, C., G. Menga, E. Mosca y G. Zappa (1984).Performance Improvement of Self TuningControllers by Multistep Horizons: The mus-

mar Approach. Automatica 20, 681–700.

Heemels, W.P.M.H., B. De Schutter y A. Bempo-rad (2001). Equivalence of Hybrid DynamicalModels. Automatica 37(7), 1085–1091.

Hu, B. y A. Linnemann (2002). Towards Infinite-horizon Optimality in Nonlinear Model Pre-dictive Control. IEEE Transactions on Auto-matic Control 47(4), 679–682.

Jadbabaie, A., J. Yu y J. Hauser (2001). Uncon-strained Receding-Horizon Control of Non-linear Systems. IEEE Transactions on Auto-matic Control 46(5), 776–783.

Keyser, R.M.C. De y A.R. Van Cuawenberghe(1985). Extended Prediction Self-adaptiveControl. In: IFAC Symposium on Identifi-cation and System Parameter Estimation,York,UK. pp. 1317–1322.

Lee, J.H. y Z. Yu (1997). Worst-case Formula-tions of Model Predictive Control for Sys-tems with Bounded Parameters. Automatica33(5), 763–781.

Limon, D., T. Alamo y E.F. Camacho (2003).Stable Constrained MPC without TerminalConstraint. In: Proceedings of the AmericanControl Conference.

Linkers, D.A. y M. Mahfonf (1994). Advances inModel-Based Predictive Control. Chap. Gen-eralized Predictive Control in Clinical Anaes-thesia. Oxford University Press.

Marina Vallés
Marina Vallés
E. F. Camacho, C. Bordons
Marina Vallés
27
Page 24: CONTROL PREDICTIVO: PASADO, PRESENTE Y FUTURO

Maciejowski, J.M. (2001). Predictive Control withConstraints. Prentice Hall. Harlow.

Mayne, D.Q., J.B. Rawlings, C.V. Rao y P.O.M.Scokaert (2000). Constrained Model Predic-tive Control: Stability and Optimality. Auto-matica 36, 789–814.

Morari, M. (1994). Advances in Model-BasedPredictive Control. Chap. Model PredictiveControl: Multivariable Control Technique ofChoice in the 1990s? Oxford University Press.

Mosca, E., J.M. Lemos y J. Zhang (1990). Sta-bilizing I/O Receding Horizon Control. In:IEEE Conference on Decision and Control.

Peterka, V. (1984). Predictor-based Self-tuningControl. Automatica 20(1), 39–50.

Propoi, A.I. (1963). Use of lp Methods for Syn-thesizing Sampled-data Automatic Systems.Automatic Remote Control.

Qin, S.J. y T.A. Badgwell (1997). An Overviewof Industrial Model Predictive Control Tech-nology. In Chemical Process Control: Assess-ment and New Directions for Research. In:AIChE Symposium Series 316, 93. Jeffrey C.Kantor, Carlos E. Garcia and Brice Carna-han Eds. 232-256.

Qin, S.J. y T.A. Badgwell (1998). An Overviewof Nonlinear Model Predictive Control Ap-plications. In: IFAC Workshop on NonlinearModel Predictive Control. Assessment andFuture Directions. Ascona (Switzerland).

Ramırez, D.R. y E.F. Camacho (2001). On thepiecewise linear nature of Min-Max ModelPredictive Control with bounded uncertain-ties. In: Proc. 40th Conference on Decisionand Control, CDC’2001.

Rawlings, J. (2000). Tutorial Overview of ModelPredictive Control. IEEE Control SystemsMagazine pp. 38–52.

Richalet, J. (1993). Industrial Applications ofModel Based Predictive Control. Automatica29(5), 1251–1274.

Richalet, J., A. Rault, J.L. Testud y J. Pa-pon (1976). Algorithmic Control of IndustrialProcesses. In: 4th ifac Symposium on Iden-tification and System Parameter Estimation.Tbilisi ussr.

Richalet, J., A. Rault, J.L. Testud y J. Papon(1978). Model Predictive Heuristic Control:Application to Industrial Processes. Auto-matica 14(2), 413–428.

Richalet, J., S. Abu el Ata-Doss, C. Arber, H.B.Kuntze, A. Jacubash y W. Schill (1987).Predictive Functional Control. Application toFast and Accurate Robots. In: Proc. 10thIFAC Congress, Munich.

Scokaert, P.O.M., D.Q. Mayne y J.B. Rawlings.(1999). Suboptimal model predictive control(feasibility implies stability). IEEE Transac-tions on Automatic Control 44(3), 648–654.

Tøndel, P. y T.A. Johansen (2002). Proc. of theIFAC World Congress, B’02, Editors: E.F.Camacho, L. Basanez and J.A. de la Puente.Chap. Complexity Reduction in Explicit Lin-ear Model Predictive Control. Elsevier Sci-ence.

Tyler, M.L. y M. Morari (1996). PropositionalLogic in Control and Monitoring Problems.Technical Report AUT96-15, Institut fur Au-tomatik, ETH- Swiss Federal Institute ofTechnology, Zurich, Switzerland.

Ydstie, B.E. (1984). Extended Horizon AdaptiveControl. In: Proc. 9th IFAC World Congress,Budapest, Hungary.

Zadeh, L.A. y B.H. Whalen (1962). On Opti-mal Control and Linear Programming. IRETrans. Automatic Control.

Zafiriou, E. (1990). Robust Model Predic-tive Control of Processes with Hard Con-straints. Computers and Chemical Engineer-ing 14(4/5), 359–371.

Marina Vallés
Marina Vallés
Control Predictivo: Pasado, Presente y Futuro
Marina Vallés
28