TÉCNICAS AVANZADAS DE PREDICCIÓN

download TÉCNICAS AVANZADAS DE PREDICCIÓN

of 293

description

Tecnicas avanzadas de prediccion con logica difusa o mineria de datos todo para el desarrollo de proyectos de investigacion.

Transcript of TÉCNICAS AVANZADAS DE PREDICCIÓN

  • etsii Escuela Tcnica Superior de Ingeniera InformticaUniversidad de SevillaDepartamento de Lenguajes y Sistemas

    TCNICAS AVANZADAS DE PREDICCINY OPTIMIZACIN APLICADAS A

    SISTEMAS DE POTENCIA

    TESIS DOCTORAL

    por

    Alicia Troncoso Lora

    Memoria presentada para optar al grado deDoctora por la Universidad de Sevilla

    Directores: D. Jos Cristbal Riquelme SantosD. Jos Luis Martnez Ramos

    Sevilla, Junio de 2005.

  • Jos Cristbal Riquelme Santos, Profesor Titular de Universidad, adscritoal rea de Lenguajes y Sistemas Informticos y Jos Luis Martnez Ramos,Profesor Titular de Universidad, adscrito al rea de Ingeniera Elctrica,

    CERTIFICAN QUE

    Alicia Troncoso Lora ha realizado bajo nuestra supervisin el trabajo de in-vestigacin titulado:

    Tcnicas Avanzadas de Prediccin y Optimizacin aplicadas aSistemas de Potencia

    Una vez revisado, autorizan la presentacin del mismo como Tesis Doctoral enla Universidad de Sevilla y estiman oportuna su presentacin al tribunal quehabr de valorarlo.

    Fdo. Jos C. Riquelme SantosProfesor Titular de Universidadrea de Lenguajes y Sistemas Informticos

    Fdo. Jos Luis Martnez RamosProfesor Titular de Universidadrea de Ingeniera Elctrica

    Sevilla, Junio de 2005

  • etsii Escuela Tcnica Superior de Ingeniera InformticaUniversidad de SevillaDepartamento de Lenguajes y Sistemas

    TCNICAS AVANZADAS DE PREDICCINY OPTIMIZACIN APLICADAS A

    SISTEMAS DE POTENCIA

    TESIS DOCTORAL

    Autora: Da. Alicia Troncoso LoraDirectores: D. Jos Cristbal Riquelme Santos

    D. Jos Luis Martnez Ramos

    TRIBUNAL CALIFICADOR

    Presidente: D. Jos Miguel Toro BonillaSecretario: D. Rafael Morales BuenoVocales: D. Antonio Gmez Expsito

    Da. Mara Amparo Vila MirandaD. Antonio Jess Conejo Navarro

    Obtuvo la calicacin de Sobresaliente Cum Laude por unanimidad

    Sevilla, 3 de Junio de 2005

  • Esta Tesis Doctoral ha obtenido el premio de investigacin Fun-dacin Sevillana de Electricidad para Licenciados, Ingenieros yArquitectos de las Universidades de Andaluca. Programa conjuntoque realiza la Consejera de Educacin y Ciencia de la Junta deAndaluca y la Fundacin Sevillana Endesa.

    Tesis Doctoral financiada por el Ministerio de Ciencia y Tecno-loga (PB97-0719) y la Junta de Andaluca (ACC-1021-TIC-2002).

  • A mi futuro sobrino

  • El libro de la naturaleza est escrito en unlenguaje matemtico.

    Galileo Galilei.

  • AgradecimientosQuisiera que las primeras lneas de esta tesis fueran el agradecimiento a

    todas las personas que me han ayudado a la realizacin de la misma.En primer lugar quiero agradecer la buena direccin realizada por D. Jos

    C. Riquelme Santos y D. Jos Luis Martnez Ramos. A Pepe le quiero reconocerque bajo su direccin no hayan faltado buenos consejos en todos los aspectosy un punto de vista prctico. La conanza que siempre ha depositado en mdesde un primer momento y la paciencia que en estos aos me ha mostradohan sido ejemplares. A Jos Luis le agradezco todo lo que he aprendido de l,tanto a nivel tcnico como personal. Su meticulosidad y su claridad de ideas enla direccin de este trabajo de investigacin siempre han sido de gran ayuda.

    A D. Antonio Gmez Expsito porque su admirable capacidad de trabajoy su gusto por las cosas bien hechas es una fuente inagotable de estmulo paracualquier investigador que est a su lado.

    Tambin quisiera recordar a D. Carlos Izquierdo Mitchell por la paz quesiempre transmita en el da a da de un departamento.

    A D. Miguel Toro Bonilla por la constante innovacin docente que transmitea todo el departamento de Lenguajes y Sistemas Informticos.

    A todos mis compaeros del Departamento de Ingeniera Elctrica de laUniversidad de Sevilla porque sin ese ambiente de trabajo en equipo y esa ale-gra que transmiten, hacer una tesis sera algo muy diferente a lo que ha sido.A Esther porque en estos aos no ha sido slo una compaera de trabajo; aJos Mara mi mejor vecino por su ambicin y voluntad de trabajo; a ManuelBurgos por su incondicional apoyo desde un principio. En especial a Jess notengo palabras para agradecerle todo el tiempo que me ha dedicado desinte-resadamente, tengo que destacar su brillantez como investigador y su calidadhumana puesto que siempre est luchando por lo que considera justo. A Re-medios por el ahorro de trabajo que supone tener a la eciencia personalizadacomo secretaria de un departamento.

    A mis compaeros del grupo de investigacin por toda la ayuda desinte-resada que me han ofrecido: a Jess por su inagotable fuerza en todo lo querespecta a investigacin; a Paco por las horas de tutora que me ha regalado enmi primer ao de docencia; a Ral por facilitarme ayuda en muchos aspectostanto tcnicos como de organizacin; a Dani por su buen entendimiento en losgrupos de prctica que hemos compartido; a Roberto porque siempre me haanimado; a Domingo e Isa por su constante inters.

    A mis compaeras y compaeros del Departamento de Lenguajes y Siste-mas de la Universidad de Sevilla por su constante nimo y su predisposicinsiempre a ayudarme en todo lo que he necesitado. En especial a Rafa, Mayte,

  • Toi y Octavio porque sin ellos la adaptacin hubiera sido mucho ms dura.A mi familia por creer en m en todo momento de mi carrera profesional.

    Mi ilusin por la realizacin de esta tesis tambin ha sido su ilusin.A mis amigas y amigos por los buenos momentos que me han aportado,

    momentos necesarios para desconectar del trabajo que supone la realizacinde una tesis.

  • ndice general

    1. Introduccin 31.1. Motivacin de la Investigacin . . . . . . . . . . . . . . . . . . . 71.2. Objetivos de la Tesis . . . . . . . . . . . . . . . . . . . . . . . . 81.3. Principales Contribuciones . . . . . . . . . . . . . . . . . . . . . 101.4. Estructura de la Memoria . . . . . . . . . . . . . . . . . . . . . 14

    2. Estado del Arte 172.1. Minera de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . 172.2. Preprocesado de Series Temporales . . . . . . . . . . . . . . . . 182.3. Mtodos de Prediccin . . . . . . . . . . . . . . . . . . . . . . . 21

    2.3.1. Prediccin basada en reglas . . . . . . . . . . . . . . . . 212.3.2. Mtodos Lineales . . . . . . . . . . . . . . . . . . . . . . 22

    2.3.2.1. Metodologa de Box and Jenkins . . . . . . . . 222.3.2.1.1. Modelos ARMA . . . . . . . . . . . . 232.3.2.1.2. Modelos ARIMA . . . . . . . . . . . . 24

    2.3.2.2. rboles de Regresin . . . . . . . . . . . . . . . 262.3.3. Mtodos no Lineales . . . . . . . . . . . . . . . . . . . . 28

    2.3.3.1. Mtodos Globales . . . . . . . . . . . . . . . . . 282.3.3.1.1. Redes Neuronales Articiales . . . . . 282.3.3.1.2. Programacin Gentica . . . . . . . . 30

    2.3.3.2. Mtodos Locales: Vecinos . . . . . . . . . . . . 332.4. Tcnicas de Optimizacin . . . . . . . . . . . . . . . . . . . . . 36

    2.4.1. Programacin Dinmica . . . . . . . . . . . . . . . . . . 402.4.2. Programacin Lineal Entera-Mixta: Ramicacin y Cota 412.4.3. Relajacin Lagrangiana . . . . . . . . . . . . . . . . . . . 422.4.4. Mtodos de Punto Interior . . . . . . . . . . . . . . . . . 432.4.5. Algoritmos Genticos . . . . . . . . . . . . . . . . . . . . 48

    i

  • ndice General

    I Prediccin de Series Temporales 53

    3. Mtodo basado en los Vecinos ms Cercanos 553.1. Representacin de los Datos . . . . . . . . . . . . . . . . . . . . 553.2. Mtodo basado en los Vecinos ms Cercanos . . . . . . . . . . . 603.3. La funcin distancia . . . . . . . . . . . . . . . . . . . . . . . . 623.4. Nmero de Vecinos . . . . . . . . . . . . . . . . . . . . . . . . . 633.5. Acotacin del Error . . . . . . . . . . . . . . . . . . . . . . . . . 64

    4. Aplicacin a los Precios de laEnerga en el Mercado Elctrico 674.1. Precios. Optimizacin de Venta/Compra de Energa . . . . . . . 674.2. Descripcin del problema . . . . . . . . . . . . . . . . . . . . . . 724.3. Obtencin del modelo . . . . . . . . . . . . . . . . . . . . . . . . 72

    4.3.1. Con prediccin directa . . . . . . . . . . . . . . . . . . . 724.3.2. Con prediccin iterada . . . . . . . . . . . . . . . . . . . 79

    4.4. Prediccin. Resultados . . . . . . . . . . . . . . . . . . . . . . . 864.4.1. Con prediccin directa . . . . . . . . . . . . . . . . . . . 864.4.2. Con prediccin iterada . . . . . . . . . . . . . . . . . . . 92

    4.5. Anlisis heurstico del error . . . . . . . . . . . . . . . . . . . . 974.6. Comparacin con Redes Neuronales . . . . . . . . . . . . . . . . 98

    4.6.1. Estructura de la red neuronal . . . . . . . . . . . . . . . 984.6.2. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . 100

    4.7. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

    5. Aplicacin a la Demanda de Energa Elctrica. 1055.1. Demanda. Programacin Horaria de Centrales . . . . . . . . . . 1055.2. Descripcin del problema . . . . . . . . . . . . . . . . . . . . . . 1085.3. Obtencin del modelo . . . . . . . . . . . . . . . . . . . . . . . . 1095.4. Prediccin. Resultados . . . . . . . . . . . . . . . . . . . . . . . 1135.5. Estudio Cualitativo y Comparativo de la Demanda y los Precios

    de la Energa en el Mercado Elctrico Espaol. . . . . . . . . . . 1195.6. Comparacin con rboles de Regresin: Algoritmo M5 . . . . . 126

    5.6.1. Transformacin de atributos no numricos . . . . . . . . 1275.6.2. Valores perdidos . . . . . . . . . . . . . . . . . . . . . . 1285.6.3. Cortes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1295.6.4. Suavizado . . . . . . . . . . . . . . . . . . . . . . . . . . 1295.6.5. Poda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1305.6.6. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . 130

    5.7. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

    ii

  • ndice General

    II Programacin con Mltiples Mnimos Locales 133

    6. Programacin no Lineal no Convexa 1356.1. Variables reales . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

    6.1.1. Formulacin del problema . . . . . . . . . . . . . . . . . 1356.1.2. Mtodo propuesto . . . . . . . . . . . . . . . . . . . . . . 136

    6.1.2.1. Solucin de los subproblemas . . . . . . . . . . 1376.1.2.2. Condiciones de optimalidad . . . . . . . . . . . 1386.1.2.3. Direccin de bsqueda . . . . . . . . . . . . . . 1396.1.2.4. Actualizacin de variables . . . . . . . . . . . . 1416.1.2.5. Inicializacin y reduccin del parmetro barrera 1426.1.2.6. Test de convergencia . . . . . . . . . . . . . . . 1436.1.2.7. Valor inicial y actualizacin de la cota de la

    funcin objetivo . . . . . . . . . . . . . . . . . 1446.1.3. Un ejemplo de una variable . . . . . . . . . . . . . . . . 145

    6.2. Variables reales y enteras . . . . . . . . . . . . . . . . . . . . . . 1466.2.1. Formulacin del problema . . . . . . . . . . . . . . . . . 1466.2.2. Mtodo propuesto . . . . . . . . . . . . . . . . . . . . . . 147

    6.2.2.1. Solucin de los subproblemas continuos . . . . . 1496.2.2.2. Solucin de los subproblemas discretos . . . . . 1496.2.2.3. Valores iniciales y actualizacin de las cotas de

    la funcin objetivo . . . . . . . . . . . . . . . . 1506.2.3. Un ejemplo de dos variables . . . . . . . . . . . . . . . . 151

    7. Aplicacin: Programacin Horaria de Centrales 1557.1. Formulacin del problema . . . . . . . . . . . . . . . . . . . . . 155

    7.1.1. Funcin objetivo. . . . . . . . . . . . . . . . . . . . . . . 1567.1.1.1. Costes de produccin . . . . . . . . . . . . . . . 1567.1.1.2. Costes de arranque . . . . . . . . . . . . . . . . 1567.1.1.3. Costes de parada . . . . . . . . . . . . . . . . . 157

    7.1.2. Restricciones . . . . . . . . . . . . . . . . . . . . . . . . 1597.1.2.1. Restricciones tcnicas de las centrales trmicas 1597.1.2.2. Restricciones tcnicas de las centrales hidrulicas1607.1.2.3. Restricciones de demanda . . . . . . . . . . . . 1627.1.2.4. Restricciones de reserva rodante . . . . . . . . . 163

    7.2. Solucin mediante el mtodo propuesto . . . . . . . . . . . . . . 1657.2.1. Subproblema continuo . . . . . . . . . . . . . . . . . . . 1657.2.2. Subproblema discreto . . . . . . . . . . . . . . . . . . . . 168

    7.3. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1717.3.1. Comparacin con algoritmos genticos . . . . . . . . . . 173

    iii

  • ndice General

    7.4. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179

    8. Conclusiones y Futuras Lneas de Investigacin 1818.1. Prediccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1828.2. Optimizacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1838.3. Futuras lneas de investigacin . . . . . . . . . . . . . . . . . . . 184

    8.3.1. Prediccin . . . . . . . . . . . . . . . . . . . . . . . . . . 1848.3.2. Optimizacin . . . . . . . . . . . . . . . . . . . . . . . . 185

    A. rboles de Regresin 187A.1. Sin seleccin de atributos . . . . . . . . . . . . . . . . . . . . . . 187A.2. Con seleccin de atributos . . . . . . . . . . . . . . . . . . . . . 215

    B. Datos 223B.1. Caso test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223B.2. Caso realista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225

    C. Soluciones obtenidas 231C.1. Caso test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231C.2. Caso realista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231

    D. Subproblemas 245D.1. Subproblema continuo . . . . . . . . . . . . . . . . . . . . . . . 245D.2. Subproblema discreto . . . . . . . . . . . . . . . . . . . . . . . . 255

    iv

  • ndice de figuras

    2.1. Fase de Minera de Datos . . . . . . . . . . . . . . . . . . . . . . 182.2. Representacin de un individuo. . . . . . . . . . . . . . . . . . . 312.3. Algoritmo de Punto Interior . . . . . . . . . . . . . . . . . . . . 48

    3.1. Vecinos Falsos. . . . . . . . . . . . . . . . . . . . . . . . . . . . 583.2. Vecinos falsos versus longitud de la ventana. . . . . . . . . . . . 603.3. Aproximacin local. . . . . . . . . . . . . . . . . . . . . . . . . . 61

    4.1. Media horaria de los precios. . . . . . . . . . . . . . . . . . . . . 694.2. Distribucin de los precios. . . . . . . . . . . . . . . . . . . . . . 694.3. Histograma de los precios del ao 2000 y 2001. . . . . . . . . . . 704.4. Precios de dos das de marzo. . . . . . . . . . . . . . . . . . . . 714.5. Coeciente de correlacin. . . . . . . . . . . . . . . . . . . . . . 714.6. Vecinos falsos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 734.7. Pseudocdigo del algoritmo FNN para la serie temporal Precios. 744.8. Nmero de vecinos cercanos falsos. . . . . . . . . . . . . . . . . 764.9. Pseudocdigo del algoritmo para obtener el nmero de vecinos. . 774.10. Nmero ptimo de vecinos usando la distancia Eucldea. . . . . 784.11. Nmero ptimo de vecinos usando la distancia Manhattan. . . . 784.12. Pseudocdigo del algoritmo FNN para la serie temporal Precios. 814.13. Nmero de vecinos cercanos falsos. . . . . . . . . . . . . . . . . 834.14. Pseudocdigo del algoritmo para obtener el nmero de vecinos. . 844.15. Nmero ptimo de vecinos usando la distancia Eucldea. . . . . 854.16. Nmero ptimo de vecinos usando la distancia Manhattan. . . . 854.17. Pseudocdigo del algoritmo para obtener predicciones. . . . . . 874.18. Media horaria de la prediccin usando la distancia Eucldea. . . 894.19. Media horaria de la prediccin usando la distancia Manhattan. . 894.20. Media diaria de la prediccin usando la distancia Eucldea. . . . 904.21. Media diaria de la prediccin usando la distancia Manhattan. . 904.22. Media diaria del error relativo usando la distancia Eucldea. . . 914.23. Media diaria del error relativo usando la distancia Manhattan. . 91

    i

  • ndice de Figuras

    4.24. Pseudocdigo del algoritmo para obtener predicciones. . . . . . 934.25. Media horaria de la prediccin usando la distancia Eucldea. . . 944.26. Media horaria de la prediccin usando la distancia Manhattan. . 944.27. Media diaria de la prediccin usando la distancia Eucldea. . . . 954.28. Media diaria de la prediccin usando la distancia Manhattan. . 954.29. Media diaria del error relativo usando la distancia Eucldea. . . 964.30. Media diaria del error relativo usando la distancia Manhattan. . 964.31. Error medio de la prediccin. . . . . . . . . . . . . . . . . . . . 994.32. Error absoluto de la mejor y peor prediccin. . . . . . . . . . . . 1004.33. Media horaria de la prediccin de los precios para el mes de marzo.101

    5.1. Media horaria de la demanda. . . . . . . . . . . . . . . . . . . . 1075.2. Histograma de la demanda del ao 2000 y 2001. . . . . . . . . . 1075.3. Coeciente de Correlacin. . . . . . . . . . . . . . . . . . . . . . 1085.4. Nmero de vecinos cercanos falsos. . . . . . . . . . . . . . . . . 1115.5. Nmero ptimo de vecinos usando la distancia Manhattan. . . . 1125.6. Nmero ptimo de vecinos usando la distancia Eucldea. . . . . 1125.7. Media horaria de la prediccin usando la distancia Eucldea. . . 1145.8. Media horaria de la prediccin usando la distancia Manhattan. . 1145.9. Media diaria de la prediccin. . . . . . . . . . . . . . . . . . . . 1155.10. Media horaria del error absoluto. . . . . . . . . . . . . . . . . . 1165.11. Mejor prediccin semanal. . . . . . . . . . . . . . . . . . . . . . 1165.12. Peor prediccin semanal. . . . . . . . . . . . . . . . . . . . . . . 1175.13. Mejor prediccin diaria. . . . . . . . . . . . . . . . . . . . . . . 1185.14. Peor prediccin diaria. . . . . . . . . . . . . . . . . . . . . . . . 1185.15. Relaciones entre los precios de horas consecutivas. . . . . . . . . 1205.16. Relaciones entre la demanda de horas consecutivas. . . . . . . . 1205.17. Relacin entre los precios de la hora 7 y la hora 8. . . . . . . . . 1215.18. Relacin entre la demanda de la hora 7 y la hora 8. . . . . . . . 1215.19. Relacin entre los precios de das consecutivos. . . . . . . . . . . 1225.20. Relacin entre la demanda de das consecutivos. . . . . . . . . . 1225.21. Relacin entre los precios de la hora 1 en das consecutivos. . . . 1235.22. Relacin entre la demanda de la hora 1 en das consecutivos. . . 1235.23. Atractor de los precios. . . . . . . . . . . . . . . . . . . . . . . . 1245.24. Atractor de la demanda. . . . . . . . . . . . . . . . . . . . . . . 125

    6.1. Mltiples mnimos de una funcin no convexa. . . . . . . . . . . 1456.2. Supercie denida por una funcin no lineal no convexa. . . . . 1516.3. Supercie denida por una funcin no lineal no convexa. . . . . 1526.4. Sucesin de mnimos locales para el ejemplo mixto-entero. . . . 153

    ii

  • ndice de Figuras

    7.1. Coste de produccin. . . . . . . . . . . . . . . . . . . . . . . . . 1567.2. Coste de arranque. . . . . . . . . . . . . . . . . . . . . . . . . . 1577.3. Curva de demanda de potencia. . . . . . . . . . . . . . . . . . . 1637.4. a) Matriz de optimizacin, b) Elementos de llenado . . . . . . . 1677.5. a) Matriz de optimizacin reordenada, b) Elementos de llenado . 1677.6. a) Matriz de optimizacin, b) Elementos de llenado . . . . . . . 1707.7. a) Matriz de optimizacin reordenada, b) Elementos de llenado . 1707.8. Operador de cruce por las . . . . . . . . . . . . . . . . . . . . 1757.9. Operador de cruce por columnas . . . . . . . . . . . . . . . . . 1757.10. Evolucin del mejor individuo para caso test. . . . . . . . . . . . 1767.11. Evolucin del mejor individuo para caso realista. . . . . . . . . . 1767.12. Tiempo de ejecucin segn actividades . . . . . . . . . . . . . . 177

    A.1. rbol de regresin con 151 reglas. . . . . . . . . . . . . . . . . . 195A.2. Modelos lineales en cada hoja del rbol de regresin formado

    por 151 reglas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215A.3. rbol de regresin con 53 reglas. . . . . . . . . . . . . . . . . . 218A.4. Modelos lineales en cada hoja del rbol de regresin formado

    por 53 reglas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221

    iii

  • ndice de Tablas

    2.1. Dimensin del problema. . . . . . . . . . . . . . . . . . . . . . . 40

    4.1. Porcentaje de vecinos falsos segn distancias. . . . . . . . . . . . 754.2. Porcentaje de vecinos falsos segn distancias. . . . . . . . . . . . 824.3. Media y desviacin estndar del conjunto test. . . . . . . . . . . 884.4. Errores segn distancias. . . . . . . . . . . . . . . . . . . . . . . 924.5. Errores segn distancias. . . . . . . . . . . . . . . . . . . . . . . 974.6. Inuencia de la distancia en la optimizacin de los distintos tipos

    de errores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 984.7. Resumen de los errores de la prediccin. . . . . . . . . . . . . . 1014.8. Errores obtenidos con ambos mtodos. . . . . . . . . . . . . . . 102

    5.1. Porcentaje de vecinos falsos segn distancias. . . . . . . . . . . . 1105.2. Media y desviacin estndar del conjunto test. . . . . . . . . . . 1135.3. Errores diarios de la mejor y la peor prediccin semanal. . . . . 1175.4. Errores segn distancias. . . . . . . . . . . . . . . . . . . . . . . 1195.5. Exponentes de Lyapunov. . . . . . . . . . . . . . . . . . . . . . 1265.6. Transformacin de atributos no numricos en variables binarias. 1285.7. Comparacin de los errores de la prediccin de la demanda usan-

    do ambos mtodos. . . . . . . . . . . . . . . . . . . . . . . . . . 131

    7.1. Vericacin de una restriccin lgica. . . . . . . . . . . . . . . . 1597.2. Secuencia de mnimos locales. . . . . . . . . . . . . . . . . . . . 1727.3. Secuencia de mnimos locales. . . . . . . . . . . . . . . . . . . . 1727.4. Secuencia de mnimos locales. . . . . . . . . . . . . . . . . . . . 1737.5. Comparacin de resultados para el caso test. . . . . . . . . . . . 1787.6. Comparacin de resultados para el caso realista. . . . . . . . . . 178

    B.1. Caractersticas tcnicas de las centrales trmicas del caso test. . 224B.2. Costes de las centrales trmicas del caso test. . . . . . . . . . . . 224B.3. Demanda para el caso test. . . . . . . . . . . . . . . . . . . . . . 224

    i

  • ndice de Tablas

    B.4. Caractersticas tcnicas de las centrales trmicas del caso rea-lista (Centrales 1 a 25). . . . . . . . . . . . . . . . . . . . . . . . 225

    B.5. Caractersticas tcnicas de las centrales trmicas del caso rea-lista (Centrales 26 a 49). . . . . . . . . . . . . . . . . . . . . . . 226

    B.6. Costes de las centrales trmicas del caso realista (Centrales 1 a25). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227

    B.7. Costes de las centrales trmicas del caso realista (Centrales 26a 49). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228

    B.8. Demanda para el caso realista. . . . . . . . . . . . . . . . . . . . 229

    C.1. Matriz de acoplamiento de la mejor solucin para el caso testpor: a) el mtodo propuesto, b) el Algoritmo Gentico. . . . . . 232

    C.2. Potencias (MW) de la mejor solucin para el caso test por: a)el mtodo propuesto, b) el Algoritmo Gentico. . . . . . . . . . 233

    C.3. Matriz de acoplamiento de la mejor solucin para el caso realistapor el mtodo propuesto (Horas 1 a 18). . . . . . . . . . . . . . 234

    C.4. Matriz de acoplamiento de la mejor solucin para el caso realistapor el mtodo propuesto (Horas 19 a 24). . . . . . . . . . . . . . 235

    C.5. Potencias (MW) de la mejor solucin para el caso realista porel mtodo propuesto (horas 1 a 8). . . . . . . . . . . . . . . . . 236

    C.6. Potencias (MW) de la mejor solucin para el caso realista porel mtodo propuesto (horas 9 a 16). . . . . . . . . . . . . . . . . 237

    C.7. Potencias (MW) de la mejor solucin para el caso realista porel mtodo propuesto (horas 17 a 24). . . . . . . . . . . . . . . . 238

    C.8. Matriz de acoplamiento de la mejor solucin para el caso realistapor el Algoritmo Gentico (Horas 1 a 18). . . . . . . . . . . . . 239

    C.9. Matriz de acoplamiento de la mejor solucin para el caso realistapor el Algoritmo Gentico (Horas 19 a 24). . . . . . . . . . . . . 240

    C.10.Potencias (MW) de la mejor solucin para el caso realista porel Algoritmo Gentico (horas 1 a 8). . . . . . . . . . . . . . . . . 241

    C.11.Potencias (MW) de la mejor solucin para el caso realista porel Algoritmo Gentico (horas 9 a 16). . . . . . . . . . . . . . . . 242

    C.12.Potencias (MW) de la mejor solucin para el caso realista porel Algoritmo Gentico (horas 17 a 24). . . . . . . . . . . . . . . 243

    ii

  • Resumen

    Esta tesis est enmarcada bsicamente dentro de dos campos de investiga-cin, la minera de datos y la optimizacin. Principalmente tiene un carcteraplicado, ya que se han investigado tanto tcnicas de prediccin como de op-timizacin con el objetivo de ser aplicadas a problemas que aparecen en elcampo de Ingeniera Elctrica. No obstante, los algoritmos desarrollados sepodrn aplicar a problemas similares en futuras lneas de investigacin.

    Un primer objetivo de la tesis ha sido el anlisis, desarrollo y mejora detcnicas que ayuden a descubrir las principales caractersticas de una serietemporal con el objetivo principal de predecir su comportamiento en un fu-turo cercano. La investigacin ha estado centrada principalmente en seriestemporales nancieras que se modelen a travs de reglas de mercado, debido ala dicultad que tienen este tipo de series en lo que respecta a reconocimientode patrones, clasicacin y prediccin.

    Estas tcnicas se han aplicado a la prediccin de los precios de la energaelctrica en el Mercado Elctrico Espaol en el que, debido a su reciente libe-ralizacin son poco usuales en la literatura, siendo un campo de investigacinactualmente en estudio. De igual forma, se han aplicado a la demanda de ener-ga elctrica y los resultados obtenidos han sido comparados con los existentesde la aplicacin de otras tcnicas.

    Hoy da, los mtodos ms usados para la prediccin de los precios y la de-manda de la energa en el mercado elctrico son, a grandes rasgos, los distintostipos de Redes Neuronales Articiales (RNA) y los mtodos estadsticos tra-dicionales, siendo en este contexto la primera vez que se aplica un clasicadorbasado en los vecinos ms cercanos.

    El segundo objetivo es consecuencia directa del primero, puesto que el ob-jeto ltimo de realizar una prediccin siempre es la planicacin o explotacinptima de algn sistema teniendo en cuenta la prediccin realizada anterior-mente. As, la segunda parte de la tesis se enmarca dentro del amplio campode la optimizacin y consiste en el desarrollo de un algoritmo de optimizacinque explote tcnicas globales de bsqueda de mnimos, ya que actualmente enla literatura los algoritmos clsicos de optimizacin usan tcnicas locales debsqueda. En los ltimos aos, las tcnicas de Punto Interior han sido usadasen un nmero amplio de problemas de optimizacin local de distintas reas deconocimiento, debido a los buenos resultados obtenidos.

    As se ha desarrollado una herramienta capaz de recorrer una trayectoria demnimos locales cada vez mejores sin quedar atrapado en el primer mnimoque encuentre. La herramienta desarrollada tiene un bajo coste computacionaly presenta un tiempo de ejecucin inferior a cualquier tcnica computacionalevolutiva, que son una de las nicas alternativas a este tipo de problemas.

    Esta nueva herramienta es totalmente novedosa y para validarla se ha apli-cado a un problema real de planicacin denominado Programacin Horariade Centrales Trmicas (PHCT), que consiste en determinar el plan de aco-plamiento y la generacin de energa elctrica de las centrales para satisfacerla demanda a coste mnimo. Para resolver este problema de planicacin esnecesario tener una prediccin de la demanda (primera parte de la tesis).

  • Captulo 1

    Introduccin

    La prediccin de eventos futuros siempre ha fascinado al gnero humanoy se puede decir que las tcnicas de prediccin existen desde que ste existe.Sin embargo, con el paso del tiempo estas tcnicas se han ido sosticando y sehan aplicado en distintas reas, con nes cientcos y econmicos, como en laprediccin del tiempo, en la prediccin del cambio entre monedas...

    Hoy da, se puede decir que estamos en la era de la tecnologa y la infor-macin, ya que en la mayora de las actividades se generan grandes bancos dedatos que son almacenados en bases de datos. Gracias a la tecnologa estosdatos se pueden manejar y usar para sacar algn rendimiento de ellos, ya quedebido al gran volumen de informacin es imposible de analizar e interpre-tar manualmente. Esto hace que desde nales de los aos 90 los conceptos deDescubrimiento del Conocimiento en Bases de Datos (Knowledge Discovery inDatabases, KDD) o Minera de Datos (Data Mining, MD) [32] hayan incre-mentado su importancia dando lugar a campos de investigacin actualmenteemergentes. La minera de datos es el proceso de inferir conocimiento, a prio-ri desconocido, que sea til y comprensible, a partir de grandes cantidadesde datos, con el objetivo de predecir de una manera automtica tendencias ycomportamientos y describir modelos que simulen el sistema.

    Anteriormente al desarrollo de la minera de datos, la prediccin de laevolucin en el tiempo de alguna variable, es decir la prediccin de una serietemporal, se llevaba a cabo mediante la elaboracin de modelos a travs demtodos estadsticos, los cuales estiman los valores actuales de la variable enfuncin de los valores de dicha variable en el pasado. Sin embargo, aunque laventaja de estos mtodos es su inherente simplicidad no muestran resultadossatisfactorios cuando se trata de predecir series temporales del mundo real,puesto que las dependencias que existen entre las variables son no lineales.

    En las ltimas dcadas, el diseo de algoritmos de aprendizaje automtico

    3

  • Captulo 1 Introduccin

    (Machine Learning, ML) ha constitudo una de las ramas de mayor interspara los investigadores de MD. De esta manera, se disean las RNA comomtodo capaz de aprender las relaciones no lineales entre las variables de en-trada (principalmente valores pasados de la serie y valores de otras variablesque inuyen en la serie) y las variables de salida (valores futuros de la serie).stas han sido aplicadas a la prediccin de series temporales dando lugar aresultados ms ecientes que los mtodos clsicos, sin embargo presentan unadesventaja que es el tiempo de aprendizaje que requieren.

    En la primera parte de esta tesis se presenta una tcnica, basada en latcnica de los vecinos ms cercanos, para la prediccin de series temporales,que presenta las ventajas de una red neuronal en lo que respecta al aprendizajede las relaciones no lineales existentes entre las variables y que mejora el tiempode aprendizaje puesto que ste es mnimo. Estas tcnicas se han aplicado a laprediccin de dos series temporales del mundo real: los precios de la energaen el nuevo mercado elctrico y la demanda de energa elctrica.

    El objetivo principal y ltimo de cualquier prediccin de un evento futurosiempre es la optimizacin, puesto que la optimizacin es un proceso que senutre de las predicciones realizadas para obtener algn benecio, como porejemplo reducir costes en el caso de los clientes de un servicio o incrementarbenecios en el caso de una empresa. De esta forma, el obtener una prediccinsimplemente proporciona ayuda para elaborar las estrategias necesarias y lasdecisiones adecuadas siempre con vistas a optimizar algn objetivo.

    En el caso de los precios de la energa en el mercado elctrico, una vezobtenida la prediccin, las compaas elctricas deben determinar la progra-macin de generacin de energa horaria para maximizar el benecio obtenidopor la venta de energa. El problema de obtener la planicacin ptima dela produccin de energa para una compaa de generacin se puede modelarcomo un problema de optimizacin que se detalla a continuacin [21].

    Funcin objetivo:La funcin objetivo viene dada por:

    BT =24t=1

    t Pt CT (1.1)

    CT = C(Pt) Ut + CA(St) Yt + CP Zt (1.2)donde:

    BT es el benecio total de la compaa de generacin.

    t es la prediccin del precio de la energa en el mercado en la hora t.

    4

  • Introduccin

    Pt es la potencia media generada en la hora t.

    CT es el coste total formado por los costes de produccin, C(Pt), loscostes de arranque, CA(St), que dependen del nmero de horas que elgenerador lleve apagado, St, y los costes de parada, CP .

    Ut es una variable binaria que es igual a 1 si el generador est funcio-nando en la hora t, y Yt y Zt son variables binarias que son igual a 1 siel generador se enciende o se apaga al principio de la hora t, respectiva-mente.

    Restricciones:Las restricciones del problema de optimizacin son las siguientes:

    La limitacin mxima y mnima de la generacin:

    Pm Ut Pt PM Ut (1.3)

    donde PM y Pm son las potencias mximas y mnimas del generador,respectivamente.

    Las rampas de subida y bajada:

    P t = mn {PM (Ut Zt+1) + SD Zt+1,Pt1 +RS Ut1 + SU Yt} (1.4)

    P t = max {Pm, Pt1 RB Ut} (1.5)

    donde P t y P t son la potencia mnima y mxima disponible generada enla hora t, RS y RB son las rampas mximas de subida y bajada, y SUy SD son las rampas mximas de arranque y parada, respectivamente.

    Tiempos mnimos de funcionamiento y parada:

    (Xt UT ) (Ut1 Ut) 0 (1.6)(Xt +DT ) (Ut Ut1) 0 (1.7)

    donde Xt es el nmero de horas que el generador ha estado encendidoo apagado al nal de la hora t y UT y DT son los tiempos mnimos defuncionamiento y parada del generador, respectivamente.

    5

  • Captulo 1 Introduccin

    Restricciones lgicas:

    Yt Zt = Ut Ut1 (1.8)Yt + Zt 1 (1.9)

    En un mercado liberalizado las herramientas de prediccin son muy importan-tes, ya que en base a una prediccin de precios, las compaas de generacinelaboran sus estrategias de ofertas para maximizar los benecios obtenidos porla venta de energa en el mercado.

    En el caso de la demanda de energa elctrica, una vez obtenida la predic-cin, las empresas elctricas deben planicar la produccin de energa de lascentrales elctricas de manera que se satisfaga la demanda predicha a costemnimo. El problema de la programacin horaria de centrales (PHC), descritobrevemente en la seccin 2.4 y de una manera ms detallada en el Captulo 7,tiene por objeto determinar los arranques y paradas de las centrales trmicasy la programacin conjunta de potencia generada por los grupos trmicos ehidrulicos durante un horizonte temporal de corto plazo, normalmente 24 ho-ras, de manera que se satisfaga la demanda horaria, en base a una prediccin,y se minimice el coste de explotacin del sistema.

    Una gran variedad de problemas, que aparecen en campos como la Inge-niera o la Economa, basados en casos reales, se pueden modelar como unproblema de optimizacin. Existen distintas clasicaciones de los problemasde optimizacin segn el criterio que se elija. Los problemas de optimizacinse pueden clasicar dentro de dos grandes grupos: Programacin Lineal y Pro-gramacin no Lineal, donde tanto la funcin objetivo como las ecuaciones quemodelan las restricciones del problema son lineales o no lineales, respectiva-mente. A su vez dependiendo de si existen algunas variables enteras, estosdos grupos de subdividen en otros dos: Programacin Lineal Entera Mixta yProgramacin no Lineal Entera Mixta. Atendiendo a la convexidad de la fun-cin objetivo y las restricciones, tambin se pueden clasicar en ProgramacinConvexa o Programacin No Convexa.

    La principal caracterstica de los problemas de optimizacin no linealesy no convexos, tanto continuos como discretos, es la presencia de mltiplesmnimos locales. Hoy da, la mayora de los algoritmos aplicados a este tipo deproblemas obtienen un mnimo local pero no se puede asegurar que el mnimolocal encontrado sea un mnimo global, por tanto el mnimo encontrado puededistar de la mejor solucin del problema.

    La segunda parte de esta tesis, se centra en la resolucin de problemas deoptimizacin con mltiples mnimos locales y presenta un algoritmo novedosoque resuelve de forma eciente y satisfactoria este tipo de problemas de una

    6

  • Introduccin

    forma simple. Este algoritmo bsicamente consiste en resolver una sucesin deproblemas de optimizacin obteniendo una sucesin decreciente de mnimoslocales. Aunque no se puede asegurar que el mejor mnimo local encontradosea el mnimo global, esta tcnica consigue recorrer una trayectoria de mnimoslocales cada vez mejores sin quedar atrapado en el primer mnimo local quese encuentre.

    1.1. Motivacin de la Investigacin

    La principal motivacin de la realizacin de esta investigacin es la apli-cacin de las mejoras obtenidas tanto en las tcnicas de prediccin como deoptimizacin a la resolucin de problemas reales.

    Todos los avances en el desarrollo de sistemas inteligentes, y tcnicas deextraccin de conocimiento para la decisin, control y prediccin de seriestemporales, en el campo de MD, se han aplicado a la demanda de energaelctrica y a los precios de la energa en el Mercado Elctrico Espaol.

    Existen una amplia variedad de centrales elctricas: trmicas, hidrulicas,de bombeo, elicas. Es importante conocer la demanda con anticipacin paradecidir, en funcin de su capacidad y costes, qu centrales suministrarn laenerga necesaria, de manera que el sistema sea seguro, econmico, able y seusen de manera eciente los recursos energticos tanto de nuestra regin comoimportados. Mejoras en la exactitud de la estimacin de la demanda puedeconducir a un mayor desarrollo econmico de una regin.

    En los ltimos aos, las empresas elctricas que, haban funcionado en rgi-men de monopolio, estn tendiendo progresivamente a un contexto liberalizadocon el objeto de que, al eliminar el rgimen de monopolio, se genere compe-tencia en el mercado, lo que debera llevar consigo un efecto benecioso sobrelos consumidores, tanto en calidad de servicio como en precios. El Sector Elc-trico Espaol desde 1998 ha puesto en marcha un proceso de reestructuracinsiguiendo criterios de libre competencia, al igual que un gran nmero de pasesen el mundo. En este nuevo mercado, las herramientas de prediccin son muyimportantes, ya que en base a una estimacin de precios, los consumidores ygeneradores elaboran sus ofertas de compra/venta de energa a coste mnimo.Debido a la reciente liberalizacin del mercado elctrico, las tcnicas de pre-diccin aplicadas a los precios de la energa son bastante innovadoras y pocousuales en la literatura actual, siendo un campo de investigacin actualmenteen alza. En lo que respecta a la literatura sobre tcnicas de prediccin aplica-das a la demanda elctrica y a los precios de la energa, no se han encontradoreferencias en las cuales se haya aplicado una tcnica basada en los vecinos ms

    7

  • Captulo 1 Introduccin

    cercanos para predecir ambas series, aunque s se han encontrado aplicacionesde tcnicas basadas en los vecinos ms cercanos a otras series temporales.

    El problema de la optimizacin en sistemas elctricos de potencia surge apartir del momento en que dos o ms unidades de generacin deben alimentarvarias cargas, obligando al operador a decidir cmo se reparte la carga. Hist-ricamente, los primeros esfuerzos se hicieron respecto al control de la potenciaactiva [136], lo que se conoce hoy da con el nombre de Despacho Econmi-co, en el cual el objetivo es determinar la potencia a generar por las distintasunidades minimizando los costes de generacin. En los ltimos aos [30, 137],las tcnicas de Punto Interior se han constituido en una alternativa prcticay viable para la resolucin de problemas de optimizacin en el marco de lossistemas elctricos de potencia.

    Por este motivo, se ha desarrollado e implementado un algoritmo basadoen tcnicas de Punto Interior para resolver el problema de la PHCT. En laliteratura este problema no ha sido resuelto de una manera satisfactoria [82,40], debido principalmente al carcter no lineal y no convexo proporcionadopor las variables discretas que aparecen al modelar el arranque y parada delas centrales trmicas. Los resultados obtenidos son de gran relevancia, debidoal papel crucial que tienen los algoritmos de optimizacin en la explotacin ycontrol de la red de transporte de energa elctrica, con vistas a asegurar unsuministro de energa a la vez able, de calidad y lo ms econmico posible.

    1.2. Objetivos de la Tesis

    Los objetivos concretos de la presente tesis son:

    Desarrollar un mtodo, basado en tcnicas de vecinos, para la predic-cin de series temporales, principalmente series temporales nancierasque presentan unas caractersticas peculiares como la no linealidad, noestacionariedad y la presencia de un alto porcentaje de valores inusuales.

    Aplicar el mtodo de prediccin desarrollado a la prediccin de dos seriestemporales reales: la demanda de energa elctrica y los precios de laenerga en el nuevo Mercado Elctrico Espaol. Se han elegido estas dosseries debido al papel importante que tienen en el sector elctrico hoyda.

    Comparar el comportamiento del mtodo desarrollado ante la prediccinde las dos series anteriores. Esto llevar a establecer una comparacincualitativa entre ambas series.

    8

  • Introduccin

    Comparar los resultados obtenidos de la aplicacin de la tcnica desarro-llada a la demanda de energa elctrica, con los obtenidos de la aplicacinde un rbol de regresin obtenido con el algoritmo M5.

    Desarrollar una RNA para la prediccin de los precios de la energa, de-bido a que actualmente en un entorno liberalizado como el espaol, laprediccin de los precios son un factor determinante para la gestin pti-ma de ofertas de compra y venta de energa por parte de los consumidoresy empresas de generacin.

    Comparar los resultados obtenidos de la aplicacin de la tcnica desarro-llada a los precios de la energa, con los obtenidos de la aplicacin de lared neuronal.

    Desarrollar un algoritmo para la resolucin de problemas de optimiza-cin no lineales no convexos, basado en tcnicas de Punto Interior, queresuelva de manera satisfactoria, eciente y robusta este tipo de proble-mas. Teniendo en cuenta que estos problemas presentan mltiples m-nimos locales y que la principal desventaja de los algoritmos existentesen la literatura para resolver este tipo de problemas es la obtencin deun mnimo local que puede distar mucho del mnimo global, se proponemejorar esto obteniendo al menos una sucesin de mnimos locales cadavez mejores que tiendan al mnimo global.

    Aplicar el algoritmo desarrollado para problemas no lineales no conve-xos al problema de la PHCT, el cual cumple esas caractersticas de nolinealidad y no convexidad, debido principalmente a las variables discre-tas que modelan los arranques y paradas de las centrales. Para resolvereste problema se necesita primero una prediccin de la demanda, que seobtiene como se describe en la primera parte de la tesis.

    Desarrollar un Algoritmo Gentico (AG) para la resolucin del problemade la PHCT. Este problema es relevante tanto para el operador de unsistema de energa elctrica como para las compaas de generacin. Laprogramacin horaria es un problema de optimizacin no lineal, entero-mixto, combinatorio y, para sistemas de tamao realista, de gran dimen-sin. Estas caractersticas hacen que no haya ningn mtodo que seacapaz de obtener su solucin exacta. Los algoritmos genticos son tc-nicas de resolucin que pueden modelar cualquier tipo de restriccin ycualquier no linealidad o no convexidad, por lo que son buenos candidatospara obtener la solucin de este problema.

    9

  • Captulo 1 Introduccin

    Comparar los resultados obtenidos de la aplicacin del algoritmo desarro-llado a dos casos de estudio basados en el parque de generacin espaol,un sistema test de pequea dimensin y un sistema realista de gran di-mensin, con los obtenidos de la aplicacin del AG.

    1.3. Principales Contribuciones

    En el marco de las series temporales, se ha diseado un algoritmo de pre-diccin, basado en la tcnica de los vecinos ms cercanos, que ha sido aplicadoa la prediccin de dos series temporales: la demanda de energa elctrica y losprecios de la energa. En este algoritmo se aporta un estudio exhaustivo delclculo ptimo de todos los parmetros que afectan al rendimiento del algorit-mo y un anlisis de cundo el error cometido con este mtodo de prediccin esmnimo. Los resultados obtenidos de su aplicacin a ambas series son compara-dos con los obtenidos de la aplicacin de otras tcnicas como redes neuronalesy rboles de regresin. Por ltimo, para demostrar la importancia de obteneruna buena prediccin se ha hecho un anlisis de cmo afectan los errores dela prediccin de la demanda en la planicacin de la produccin de energaelctrica y los errores de la prediccin de los precios en la gestin ptima delas ofertas de compra y venta de energa por parte de los consumidores y com-paas de generacin, respectivamente. En lo que respecta a la literatura sobreprediccin de estas series, ha sido la primera vez que se ha aplicado un m-todo de estas caractersticas obtenindose resultados competitivos con otrastcnicas e incluso en algunos casos mejores.

    Estos resultados han dado lugar a las siguientes publicaciones:

    Algoritmo de prediccin basado en los vecinos ms cercanos aplicado ala prediccin de los precios. En este algoritmo la mtrica elegida es ladistancia eucldea ponderada por unos pesos, los cuales son determinadosmediante un algoritmo gentico a partir de un conjunto de entrenamien-to. Los resultados obtenidos de su aplicacin son comparados con losobtenidos de la aplicacin de una regresin multivariable, donde los co-ecientes son actualizados cada vez que se predice un da del conjuntotest.

    A Comparison of Two Techniques for Next-Day Electricity PriceForecasting. IDEAL Intelligent Data Engineering and AutomatedLearning. Lecture Notes in Computer Science. Vol. 2412, pp. 384-390, Agosto 2002. Ed. Springer-Verlag. ISSN 0302-9743.

    10

  • Introduccin

    RNA aplicada a la prediccin de los precios. Los resultados obtenidosde su aplicacin son comparados con los obtenidos de la aplicacin deun algoritmo de prediccin basado en los vecinos ms cercanos, dondela mtrica elegida es la distancia eucldea ponderada por unos pesos loscuales son determinados mediante un algoritmo gentico a partir de unconjunto de entrenamiento.

    Electricity Market Price Forecasting: Neural Networks versusWeighted-Distance k Nearest Neighbours. DEXA Database and Ex-pert Systems Applications. Lecture Notes in Computer Science.Vol. 2453, pp. 321-331, Septiembre 2002. Ed. Springer-Verlag. ISSN0302-9743.

    Estudio de los parmetros que afectan al algoritmo de prediccin basadoen los vecinos ms cercanos para mejorar la prediccin obtenida de losprecios de la energa y anlisis heurstico de cundo el error cometidocon este mtodo es mnimo.

    Prediccin de Series Temporales Econmicas: aplicacin a los Pre-cios de la Energa en el Mercado Elctrico Espaol. IBERAMIA2002 VIII Iberoamerican Conference on Articial Intelligence. Works-hop de Minera de Datos y Aprendizaje. pp. 1-11, Sevilla, Noviembre2002. ISBN 84-95499-88-6.

    Algoritmo de prediccin basado en los vecinos ms cercanos aplicadoa la prediccin de la demanda. Un estudio de los parmetros ptimosque afectan al mtodo es analizado antes de realizar la prediccin. Losresultados obtenidos de su aplicacin son comparados con los obtenidosde la aplicacin de una regresin multivariable, donde los coecientes sonactualizados cada vez que se predice un da del conjunto test.

    Prediccin de Series Temporales: Aplicacin a la Demanda de Ener-ga Elctrica en el Corto Plazo. X Conferencia de la AsociacinEspaola sobre Inteligencia Articial (CAEPIA03), San Sebastin,Noviembre, 2003. pp. 79-88. ISBN 84-8373-564-4.

    Time-Series Prediction: Application to the Short-Term ElectricEnergy Demand. Lecture Notes in Articial Intelligence. Vol. 3040,pp. 577-586, Junio 2004. ISSN 0302-9743. Edicin de trabajos se-leccionados de CAEPIA03.

    11

  • Captulo 1 Introduccin

    Anlisis del efecto de los errores cometidos en la prediccin de los preciosen la gestin ptima de ofertas de compra/venta de energa por parte delos clientes o compaas de generacin, respectivamente.

    Inuence of ANN-Based Energy Price Forecasting Uncertainty onOptimal Bidding. 14th Power Systems Computation Conference.Sevilla, Junio 2002.

    Anlisis del efecto de los errores cometidos en la prediccin de la de-manda en la programacin ptima de centrales. Algoritmo de prediccinbasado en los vecinos ms cercanos, donde los resultados obtenidos de suaplicacin son comparados con los obtenidos de la aplicacin de un rbolde regresin (algoritmo M5 [49, 98])

    Inuence of kNN-Based Load Forecasting Errors on Optimal EnergyProduction. EPIA Portuguese Conference on Articial Intelligen-ce. Lecture Notes in Articial Intelligence. Vol. 2902, pp. 189-203,Diciembre 2003. ISSN 0302-9743.

    En el marco de la optimizacin, se ha resuelto el problema de la PHCT conun algoritmo novedoso propuesto en esta tesis, y un AG. En el AG se aportauna nueva forma de generar la poblacin inicial para disminuir el nmerode individuos no factibles en lo que respecta a las restricciones de rampasde subida y bajada. La restriccin de potencia mnima ha sido modelada deforma dinmica para considerar factibles aquellos individuos que se encuentranen estados intermedios, arrancando o parando, estados que en la mayorade la literatura se modelan con nuevas variables binarias. Por tanto en este AGse usa el mnimo nmero de variables binarias, slo las correspondientes a losestados: arrancado y parado. La evaluacin de los individuos consiste en laresolucin de un problema de optimizacin cuadrtico mediante un algoritmode Punto Interior. Dado que la evaluacin de los individuos es una de lascausas del elevado coste computacional de un AG, se ha implementado elalgoritmo de Punto Interior haciendo una reordenacin de los elementos de lamatriz del sistema lineal que hay que resolver, para as disminuir el nmero deelementos de llenado que surgen al factorizar sta y as disminuir el tiempo decomputacin del AG.

    Este AG ha sido utilizado para establecer una comparacin con los resul-tados obtenidos de la aplicacin del algoritmo que se propone en esta tesis,al problema de la PHCT. En este algoritmo novedoso se aporta una nuevatcnica de bsqueda global de la solucin de un problema de optimizacin nolineal no convexo, obtenindose una sucesin decreciente de mnimos localesdel problema.

    12

  • Introduccin

    Estas contribuciones han dado lugar a las siguientes publicaciones:

    Programa de optimizacin basado en un algoritmo de Punto Interioraplicado a la PHCT, suponiendo la programacin de arranques y paradasconocida, es decir sin variables discretas. Los resultados obtenidos de laaplicacin de este algoritmo a un sistema real son comparados con losobtenidos de la aplicacin de un algoritmo de Punto Interior Predictor-Corrector [138].

    Despacho Econmico de Centrales Trmicas e Hidrulicas en elCorto Plazo Mediante Tcnicas de Punto Interior. 7a JornadasHispano-Lusas de Ingeniera Elctrica. Madrid, 2001. Vol. III, pp.261-266. ISBN 84-95821-03-6.

    Algoritmo evolutivo aplicado a la PHCT para determinar la programa-cin de arranques y paradas. La evaluacin de los individuos se obtienemediante la resolucin de un problema de optimizacin con un algoritmode Punto Interior donde todas las variables son continuas.

    Short-term Hydro-thermal Coordination Based on Interior PointNonlinear Programming and Genetic Algorithms. IEEE Power Te-ch2001 Conference. Oporto, Portugal, 2001. Vol. 3, PSO2-267. ISBN0-7803-7139-9.

    Aplicacin de Tcnicas de Computacin Evolutiva a la Planica-cin ptima de la Produccin de Energa Elctrica en el Corto Pla-zo. V Jornadas de Transferencia Tecnolgica de Inteligencia Arti-cial (TTIA03), San Sebastin, Noviembre, 2003. pp. 419-428. ISBN84-8373-564-4

    Application of Evolutionary Computation Techniques To OptimalShort-Term Electric Energy Production Scheduling. Lecture Notesin Articial Intelligence. Vol. 3040, pp. 656-665, Junio 2004. ISSN0302-9743. Edicin de trabajos seleccionados de TTIA03.

    Algoritmo para la resolucin de problemas de optimizacin no lineales yno convexos con mltiples mnimos locales.

    Finding Improved Local Minima of Power System OptimizationProblems by Interior-Point Methods. IEEE Transactions on PowerSystem. Vol. 18, no 1, pp. 238-244, Febrero 2003. ISSN 0885-8950.

    13

  • Captulo 1 Introduccin

    1.4. Estructura de la Memoria

    La memoria de esta tesis se organiza como sigue:En el Captulo 2, en primer lugar se hace un recorrido por las contribuciones

    ms relevantes que han aparecido en la literatura sobre anlisis y prediccinde series temporales. Los mtodos ms utilizados para la prediccin de seriestemporales se pueden clasicar a grandes rasgos en dos grupos: los mtodos es-tadsticos clsicos y las tcnicas de aprendizaje automtico. Entre los mtodosestadsticos se han destacado los modelos ARMA y ARIMA y las tcnicas deaprendizaje automtico descritas han sido los rboles de regresin, los sistemasde prediccin basados en reglas, la programacin gentica, las redes neurona-les articiales y los vecinos ms cercanos. De una forma paralela, se analizantrabajos donde se usan estas tcnicas aplicadas a la prediccin de los precios yla demanda de energa elctrica. En segundo lugar, se describen los algoritmosde optimizacin ms conocidos en la literatura y se hace un breve recorridopor las contribuciones que han aparecido de su aplicacin a la PHCT.

    La tcnica de clasicacin y reconocimiento de patrones basada en la bs-queda de los vecinos ms cercanos aplicada a la prediccin de una serie tem-poral es descrita en el Captulo 3. Primero, se analiza cul es la forma ptimade representar el conjunto de datos de entrada y se estudia la inuencia de dosparmetros que afectan a dicho algoritmo: el nmero de vecinos, es decir elnmero de ejemplos que sern usados en el momento de efectuar la prediccin,y la mtrica elegida como medida de similitud entre dos ejemplos del conjuntode datos. Despus, se analiza de forma heurstica cul es el error mnimo quese comete en la prediccin de una serie temporal con este mtodo.

    En los Captulos 4 y 5 se presentan los resultados obtenidos al aplicar elmtodo descrito en el Captulo 3 a dos series temporales reales: los preciosy la demanda de energa en el Mercado Elctrico Espaol. En primer lugar,se obtienen los modelos de prediccin para ambas series, que consiste bsica-mente en determinar la estructura ptima del conjunto de datos de entraday los parmetros que afectan al mtodo. En segundo lugar, se presentan losresultados obtenidos de la prediccin de ambas series, comparndose con losresultados obtenidos de la aplicacin de una red neuronal en el caso de la serietemporal formada por los precios y los obtenidos de la aplicacin de un rbolde regresin en el caso de la serie temporal formada por la demanda.

    El objeto del Captulo 6 es la resolucin de problemas de optimizacin conrestricciones, donde la funcin objetivo y las restricciones tanto de igualdadcomo de desigualdad son no lineales y no convexas. En primer lugar, se describeel modelo matemtico de un problema de estas caractersticas cuando todaslas variables son reales y varan de una forma continua, y se propone un nuevo

    14

  • Introduccin

    mtodo que resuelve el problema de manera eciente, con una ventaja frentea los mtodos existentes: su habilidad de escapar de un mnimo local. Ensegundo lugar, se describe el modelo matemtico cuando las variables son realesy enteras y se propone un mtodo de resolucin que consiste bsicamente enrelajar el carcter discreto de las variables y aplicar el mtodo propuesto en elcaso anterior. Por ltimo, se presentan dos ejemplos tutoriales para ilustrar elcomportamiento de los mtodos presentados en este captulo.

    En el Captulo 7 se aplica el mtodo propuesto en el Captulo 6 a unproblema real: la planicacin de la produccin de energa elctrica. Primero,el problema es modelado dando lugar a un problema no lineal no convexo, elcual es resuelto haciendo especial nfasis en la reordenacin de las matricesresultantes para mejorar el tiempo de computacin del algoritmo. Por ltimo,se presentan resultados obtenidos de la aplicacin del mtodo propuesto en elCaptulo 6 a dos casos de estudio basados en el parque de generacin espaol,un sistema test de pequea dimensin y un sistema realista de gran dimensin.Los resultados obtenidos se comparan con los obtenidos de la aplicacin de unAG.

    Por ltimo, el Captulo 8 recoge las principales conclusiones del traba-jo realizado en el mbito de la presente tesis, proponiendo asimismo futurosdesarrollos y lneas de investigacin.

    A continuacin se incluyen los siguientes apndices:En el Apndice A se muestran los rboles de regresin y los modelos lineales

    obtenidos en las hojas de los rboles mediante el algoritmo M5 con y sinseleccin de atributos.

    El Apndice B muestra los datos de entrada utilizados en los casos deestudio presentados en el Captulo 7.

    El Apndice C presenta las programaciones de arranques y paradas y laspotencias de salida de las mejores soluciones obtenidas de la aplicacin del AGdesarrollado en el Captulo 7, y la aplicacin del procedimiento propuesto enel Captulo 6 de esta tesis basado en tcnicas de Punto Interior al problemade la PHCT para los dos casos de estudio analizados, cuyos datos de entradase describen en el Apndice B.

    El Apndice D muestra las ecuaciones y la estructura por bloques de lamatriz del sistema lineal resultante de la aplicacin de un algoritmo Primal-Dual de Punto Interior a los subproblemas, tanto continuos como discretos,que aparecen de la aplicacin del mtodo propuesto en el Captulo 6 a laplanicacin de la produccin de energa elctrica.

    15

  • Captulo 1 Introduccin

    16

  • Captulo 2

    Estado del Arte

    En este captulo se hace un recorrido por las contribuciones ms relevan-tes que han aparecido en la literatura sobre anlisis y prediccin de seriestemporales y su aplicacin a la prediccin de los precios y la demanda de ener-ga elctrica, y sobre algoritmos de optimizacin y su aplicacin a la PHCT,respectivamente.

    2.1. Minera de DatosAunque la idea de MD parece estar generalmente aceptada en la comuni-

    dad cientca, no existe una denicin clara de este trmino. Informalmente,podramos denir la minera de datos como el anlisis de bases de datos con eln de descubrir o extraer informacin inherente a los datos objeto de anlisis,de modo que sea de utilidad en la toma de decisiones. Tal informacin puedevenir representada como patrones, relaciones, reglas, asociaciones, dependen-cias o incluso excepciones entre los datos analizados. El desarrollo tecnolgicoha permitido que la creciente cantidad de informacin que diariamente se ge-nera en el mundo, pueda ser transferida de forma casi instantnea, as comoalmacenada en grandes bases de datos. La competitividad existente hoy da encampos como la economa, el comercio, la industria y la propia ciencia entreotros, ha fomentado el aprovechamiento de esta informacin para la toma dedecisiones. Tradicionalmente, la estadstica ha cubierto este campo, ofrecien-do resmenes de los datos en forma de medias, desviaciones, distribuciones,correlaciones, entre otras muchas medidas. Sin embargo, el simple estudio es-tadstico de esta cantidad de informacin resulta insuciente para la toma dedecisiones, pues aporta un conocimiento muy limitado del comportamiento delos datos. Adems de las medidas estadsticas, la informacin oculta patronesy relaciones inherentes de gran utilidad y que la minera de datos se encarga de

    17

  • Captulo 2 Estado del Arte

    extraer mediante un algoritmo de aprendizaje automtico adecuado. La gura2.1 muestra un esquema ms detallado sobre las fases existentes en MD.

    Algoritmode

    AprendizajeMODELO

    Validacin

    APRENDIZAJE

    Datosde

    Entrada

    PREDICCION

    MINERA

    xx xx xxxxx

    xx xx xxxxx

    xx xx xxxxx

    xx xx xxxxx

    Figura 2.1: Fase de Minera de Datos

    El Aprendizaje Automtico (Machine Learning) es la rama de la Inteligen-cia Articial que estudia el desarrollo de tcnicas para extraer de forma auto-mtica conocimiento subyacente en los datos. Uno de los modelos de aprendi-zaje ms estudiados es el aprendizaje inductivo, el cual engloba todas aquellastcnicas que aplican inferencias inductivas sobre un conjunto de datos paraadquirir el conocimiento inherente a ellos. Existen principalmente dos tipos deaprendizaje inductivo: supervisado y no supervisado. En el aprendizaje super-visado, los casos pertenecientes al conjunto de datos tienen a priori asignadauna clase o categora, siendo el objetivo encontrar patrones o tendencias de loscasos pertenecientes a una misma clase. Sin embargo, el aprendizaje no super-visado no goza de una agrupacin de los casos previa al aprendizaje, por lo quese limita a buscar la regularidades entre stos. Los mtodos de prediccin quese analizan en esta seccin se clasican bsicamente en dos grandes grupos: lastcnicas de aprendizaje supervisado y las tcnicas estadsticas.

    2.2. Preprocesado de Series TemporalesEsta seccin se centra en la etapa previa a la prediccin de una serie tempo-

    ral conocida como etapa de preprocesado en la cual se aplican tcnicas espec-cas para estudiar la calidad de los datos. Una serie temporal es una sucesinde observaciones de una variable en distintos momentos de tiempo. Aunqueel tiempo es una variable continua, en la prctica se usan mediciones en pe-riodos equidistantes. El anlisis de series temporales ha sido un campo de

    18

  • Estado del Arte

    investigacin desde principios del siglo XX, actualmente en alza con el recientedesarrollo de las tcnicas de aprendizaje automtico. Los aspectos claves en elanlisis de series temporales son el preprocesado de datos y la obtencin delmodelo de prediccin. En la preparacin de los datos se pueden destacar lareduccin del ruido mediante la deteccin de outliers, la reduccin de datosmediante tcnicas de seleccin de atributos y la discretizacin de valores conti-nuos. A continuacin se describen brevemente en qu consisten estas tcnicasque tienen lugar en la etapa previa de preparacin de los datos.

    Deteccin de outliers: Los outliers son valores de la serie temporal quese alejan de los patrones de comportamiento del resto de la serie. Estas des-viaciones pueden ser debidas bien a la ocurrencia de algn hecho no previsibleo bien a mecanismos de mercado como es el caso de las series temporales eco-nmicas o nancieras. Para mitigar los efectos del ruido en el aprendizaje seaplican las denominadas tcnicas de suavizado (smoothing). El mtodo de sua-vizado ms sencillo, conocido como binning, consiste en reemplazar los outlierspor la media, mediana o moda de los valores precedentes y siguientes. En [2]se describe un detector automtico de distintas caractersticas que suelen pre-sentar las series temporales como los outliers, el nivel de las discontinuidades,los cambios en la tendencia... Para la deteccin de los outliers se observan lassegundas diferencias de los valores de la serie, un valor grande para algunade estas segundas diferencias indica la presencia de un outlier en ese punto oen el punto precedente. Los patrones de los residuos de una regresin puedenconrmar la presencia de un outlier, puesto que la presencia de un incrementoo decremento abrupto en los residuos justo en el punto precedente al puntodonde las diferencias de segundo orden son grandes indica la presencia de unoutlier. Una vez detectados los outliers son reemplazados por la media de losvalores precedentes y siguientes de la serie.

    Tcnicas de Reduccin: Los algoritmos de seleccin de caractersticas eindexado tienen dos objetivos principales: reducir el coste computacional aso-ciado tanto al aprendizaje como al propio modelo de conocimiento generado(eliminando atributos irrelevantes o redundantes) y aumentar la precisin dedicho modelo (eliminando atributos perjudiciales para el aprendizaje). En [89]se presenta un modelo que permite determinar de manera dinmica qu valo-res previos inuyen en el valor actual observado en una serie temporal. Unade las ventajas del modelo propuesto es que permite capturar la existencia dedistintas relaciones temporales en cada hora. El modelo de seleccin de va-riables descrito se ha aplicado a un problema real para determinar las horasprevias que inuyen en el valor de radiacin solar sobre supercie recibido enuna hora determinada. En [108] se presenta una tcnica de seleccin de atri-butos que utiliza una medida basada en proyecciones para guiar la seleccin

    19

  • Captulo 2 Estado del Arte

    de los atributos que sean relevantes. Esta tcnica tiene algunas caractersticasinteresantes como su bajo coste computacional y su aplicabilidad a conjuntosde datos que contengan tanto variables continuas como discretas. En [62] sepresenta un algoritmo de indexado que da lugar a una reduccin de la dimen-sionalidad lo que hace que se pueda efectuar una bsqueda ms rpida de lasimilaridad entre dos curvas. Esta tcnica de reduccin de datos se muestra enel siguiente ejemplo: sea X una serie temporal formada por 8 valores, es decir:

    X = (1,2,1, 0, 2, 1, 1, 0) (2.1)Entonces la serie temporal se divide en un nmero determinado de subcon-juntos y se proyecta en esos subconjuntos usando para ello las medias de losvalores que corresponden a cada subconjunto. En este caso la serie temporalse proyecta en dos dimensiones de la siguiente forma:

    X = (1, 1) (2.2)donde -1 es la media de los 4 primeros valores de la serie y 1 es la media delos 4 ltimos valores de la serie.

    Discretizacin: Un gran nmero de algoritmos de aprendizaje operan ex-clusivamente con espacios discretos. Sin embargo, muchas bases de datos con-tienen atributos de dominio continuo, lo que hace imprescindible la aplicacinprevia de algn mtodo que reduzca la cardinalidad del conjunto de valores,dividiendo su rango en un conjunto nito de intervalos. Esta trasformacin deatributos continuos en discretos se denomina discretizacin. En [88] se propo-nen dos mtodos de discretizacin dinmicos y cualitativos para transformarlos valores continuos de una serie temporal en valores discretos. Estos mtodosson dinmicos puesto que el valor discreto asociado a un determinado valorcontinuo puede cambiar con el paso del tiempo, es decir el mismo valor con-tinuo puede ser discretizado con distintos valores dependiendo de los valoresprevios de la serie y son cualitativos porque slo aquellos cambios los cuales soncualitativamente signicativos aparecen en la serie discretizada. Un mtodo sebasa en el t-estadstico ya que se pretende usar toda la informacin estadsticade los valores previos observados de la serie para seleccionar los valores dis-cretos que corresponden a un nuevo valor continuo de la serie. El otro mtodopropuesto se basa en la denicin de una distancia que mide la relacin entrevalores consecutivos de la serie. Entonces dos valores continuos consecutivoscorresponden al mismo valor discreto cuando la distancia entre ellos es menorque un determinado umbral. A continuacin se har un breve recorrido por losmtodos ms usados en la literatura para la prediccin de series temporales,centrando la atencin en aquellos que han sido usados para la prediccin delos precios de la energa y la prediccin de la demanda de energa elctrica.

    20

  • Estado del Arte

    2.3. Mtodos de Prediccin

    La mayora de los mtodos de prediccin estn basados en el descubrimientode patrones regulares que ayuden a la obtencin de un modelo para realizarpredicciones de futuro sobre el comportamiento de una serie. El descubrimientode patrones ha estado sujeto a una gran investigacin en las ltimas dcadas[60]. Sin embargo la alta correlacin entre los atributos, la alta dimensionalidady la gran cantidad de ruido que caracteriza a las series temporales ha hechoque la mayora de los investigadores se centren en encontrar una nueva medidade la similaridad entre dos curvas para mejorar un algoritmo de clustering yaexistente [61]. En [94] para descubrir patrones de comportamiento similaresen un conjunto de series temporales se propone un algoritmo de aprendizajeincremental que intenta identicar en qu conjuntos se distingue una serietemporal de otra habiendo sido las dos generadas a partir del mismo proceso.

    2.3.1. Prediccin basada en reglas

    En general, una regla de decisin es una regla del tipo Si P EntoncesC, donde P es un predicado lgico sobre los atributos, cuya evaluacin ciertaimplica la clasicacin con etiqueta de clase C. Desde el punto de vista de lainterpretacin humana, esta representacin del conocimiento resulta a menudoms clara que los rboles de decisin, sobre todo en aplicaciones reales donde elnmero de nodos de stos tiende a aumentar. Esto es debido tanto a la propiaestructura como a las tcnicas utilizadas para generar stas. La construccinde los rboles de decisin se basa en una estrategia de divisin, esto es, dividirel conjunto de datos en dos subconjuntos considerando un nico atributo selec-cionado por una heurstica particular. Por el contrario, el aprendizaje de reglassigue una estrategia de cobertura, esto es, encontrar condiciones de reglas te-niendo en cuenta todos los atributos de forma que se cubra la mayor cantidadde ejemplos de una misma clase, y la menor del resto de las clases. Existeuna extensa literatura sobre cmo generar reglas para posteriormente usarlasen un problema de prediccin. Algunas contribuciones estn relacionadas conla forma de generarlas [38] y otras se centran en la estructura a partir de lacual se generan, bien un rbol de regresin [49] bien a partir de la etapa deentrenamiento de una red neuronal [111]. La teora de conjuntos difusos relajael concepto de pertenencia de un elemento a un conjunto. En la teora tradi-cional, un elemento simplemente pertenece o no a un conjunto. Sin embargo,en la teora de conjuntos difusos, un elemento pertenece a un conjunto con uncierto grado de certeza. Aplicando esta idea, el uso de la lgica difusa permiteun mejor tratamiento de la informacin cuando sta es incompleta, imprecisa

    21

  • Captulo 2 Estado del Arte

    o incierta. Por ello, ha sido aplicada por muchos autores en tareas de predic-cin y deteccin de fallos, usando a menudo reglas difusas como representacindel conocimiento [6]. Estos sistemas son denominados tradicionalmente FuzzyRule-Based Classication Systems. En la literatura se pueden encontrar al-gunas aplicaciones a la prediccin de series nancieras usando reglas difusasextradas a partir de algoritmos genticos. En [64] se propone un mtodo deprediccin basado en un conjunto de reglas difusas para series caticas y noestacionarias. En una primera etapa se genera mediante un algoritmo genti-co un conjuntos de reglas difusas que cubran el nmero mximo de ejemplosdel conjunto de entrenamiento. En una segunda etapa las funciones miembrodel conjunto de reglas obtenidas en la etapa previa se ajustan mediante unalgoritmo gentico de manera que el error de prediccin sea mnimo. Estas dosetapas son repetidas para distintas particiones del conjunto de entrenamientoobteniendo as un conjunto de predictores difusos. Finalmente, la prediccin deun valor de la serie es una combinacin lineal de las predicciones obtenidas apartir del conjunto de predictores difusos ponderada por unos pesos que vienendados por:

    wi =1

    i |P |

    j=11j

    (2.3)

    donde |P | es el nmero de predictores difusos y i es la desviacin estndardel error de prediccin obtenido a partir del predictor difuso i. Este mtodo seha aplicado a la serie temporal catica de Mackey-Glass y a la prediccin delcambio del franco suizo frente al dlar.

    2.3.2. Mtodos Lineales

    Los mtodos de prediccin lineales son aquellos que intentan modelar elcomportamiento de una serie temporal mediante una funcin lineal. Entre estosmtodos se destacan los modelos ARMA y ARIMA y los rboles de regresin.

    2.3.2.1. Metodologa de Box and Jenkins

    En esta seccin se describen dos modelos lineales para el anlisis de seriestemporales: el modelo ARMA y el modelo ARIMA. Estos modelos son unaclase de procesos estocsticos y tienen una metodologa comn, cuya aplicacinal anlisis de series temporales se debe a Box y Jenkins [13]. Para construirambos modelos se siguen los pasos siguientes:

    1. Identicacin del modelo bajo ciertas hiptesis

    2. Estimacin de parmetros

    22

  • Estado del Arte

    3. Validacin del modelo

    4. Prediccin

    2.3.2.1.1. Modelos ARMAUn proceso estacionario es aquel cuya media, varianza y covarianza son cons-tantes. Los modelos de prediccin de series temporales estn diseados paraprocesos estacionarios, aunque en el mundo real la mayora de las series tempo-rales, sobre todo las nancieras, no son estacionarias. Un proceso estocsticoestacionario con una componente autoregresiva (AR) y una componente demedias mviles (MA) se puede modelar como sigue:

    (B)Xt = (B)t (2.4)

    donde:

    Xt es la variable que se quiere predecir en la hora t, es decir, se trata deuna serie horaria.

    t es un ruido blanco en la hora t, que representa los errores y otorga elcarcter aleatorio a la serie.

    (B) y (B) son funciones polinomiales del operador de retardos B quevienen denidos por:

    (B) = 1nl=1

    lBl (2.5)

    (B) = 1ml=1

    lBl (2.6)

    BlXt = Xtl (2.7)

    donde n es el orden del proceso Autoregresivo (AR) y m es el orden delproceso de Medias Mviles (MA).

    Una vez determinado el modelo se trata de determinar los parmetros n, m, ly l. Tradicionalmente, los parmetros n ym se calculan mediante la funcin deautocorrelacin y la funcin de autocorrelacin parcial [128] y los parmetrosl y l se hallan mediante la resolucin de un problema de optimizacin dondela funcin objetivo es el error cuadrtico medio cometido en la prediccin. Co-mo esta funcin objetivo tiene mltiples mnimos locales no se garantiza queel mnimo encontrado sea el mnimo global. Para evitar esto, algunos autores

    23

  • Captulo 2 Estado del Arte

    [141] han usado algoritmos evolutivos en la fase de estimacin de parmetrostanto para determinar l y l como los rdenes n y m para la prediccinde la demanda de energa elctrica. En otras reas, como la biomedicina, labsqueda de los parmetros ptimos de un modelo ARMA se ha basado entcnicas geomtricas [71]. Una vez determinados todos los parmetros, el mo-delo es validado mediante algunos test estadsticos y observando la funcin deautocorrelacin y la funcin de autocorrelacin parcial de los residuos.

    2.3.2.1.2. Modelos ARIMACuando una serie temporal no es estacionaria se suelen aplicar una serie detransformaciones que hagan que la serie sea estacionaria. Entre estas transfor-maciones, una de las ms simples es aplicar el operador diferencias tantas vecescomo haga falta. As, un modelo ARIMA tradicional consiste en aplicar un mo-delo ARMA a la serie temporal dXt donde d son las diferencias de orden d.El parmetro d se determina de tal forma que la serie dXt sea estacionaria.El resto de parmetros se determinan como se ha descrito anteriormente enlos modelos ARMA. Los modelos ARIMA y algunas modicaciones de estosmodelos han sido muy usados para la prediccin de la demanda de energa elc-trica, dando una especial importancia a la prediccin de las horas en las quela demanda es alta (horas punta). En [5] se presenta una modicacin de unmodelo ARIMA para predecir la demanda horaria y la demanda en las horaspunta del sistema Iran. Esta modicacin consiste en aadir un nico trminoal modelo el cual representa una primera aproximacin de la prediccin dela demanda y se obtiene a travs de un operador tcnico. As la estimacinde la demanda que hace el operador es incluida en el modelo ARIMA comoun trmino ms y en la fase de clculo de parmetros este nuevo trmino setrata como un dato de entrada. Adems antes de aplicar el modelo ARIMAse hace una clasicacin de la demanda iran a partir de un estudio estads-tico obteniendo modelos ARIMA distintos segn el tipo de da que se quierapredecir. Desde un punto de vista matemtico, esta modicacin consiste enusar la estimacin de los operadores como una prediccin inicial lo que haceque se obtengan mejores resultados que los obtenidos con un modelo ARIMAclsico. La demanda horaria y la demanda de las horas punta del sistema ira-n en el ao 1998 se predicen con un error absoluto medio en porcentaje de1.7% y 4.65% respectivamente. Tanto a los modelos ARMA como ARIMA seles pueden aadir variables exgenas que inuyan en la serie temporal, comopor ejemplo la temperatura cuando se trata de predecir la demanda de ener-ga elctrica o la demanda de energa elctrica cuando se trata de predecir losprecios de la energa. En [141] se presenta un modelo ARMA para predecir lademanda de Taiwan en algunas semanas del ao 1992. En este modelo se usan

    24

  • Estado del Arte

    como datos de entrada la temperatura actual y la temperatura de horas ante-riores. Para el clculo de los rdenes del proceso autoregresivo y del proceso demedias mviles y para determinar el nmero de valores pasados de la tempe-ratura que se necesitan en el modelo se implementa un algoritmo gentico. Laestimacin de los parmetros tambin se lleva a cabo mediante un algoritmogentico. El clculo de los parmetros ptimos se obtiene minimizando el errorcuadrtico obtenido al realizar la prediccin en un conjunto de entrenamiento.La principal desventaja de esta funcin error es la presencia de mltiples m-nimos lo que hace que los mtodos de optimizacin basados en el gradiente noobtengan un modelo adecuado puesto que pueden obtener como solucin unptimo local. Para solucionar esto se usa un algoritmo evolutivo que hace unabsqueda global del espacio, no necesita que la funcin que se minimiza seadiferenciable y es capaz de converger asintticamente hacia el ptimo global.Se presentan los resultados de la prediccin de la demanda en cuatro sema-nas laborables de distintas estaciones del ao: desde el da 10 hasta el da 14de agosto, desde el da 27 hasta el da 31 de Enero, desde el da 12 hasta elda 16 de Octubre y desde el da 23 hasta el da 27 de marzo, obteniendo enesas semanas unos errores relativos medios de 1.5%, 1.17%, 1.28% y 0.98%respectivamente. En [93] se presentan dos modelos para obtener la prediccinde los precios de la energa en el Mercado Elctrico Espaol y en el Merca-do Elctrico Californiano. Ambos modelos incluyen como variable exgena lademanda de energa y son obtenidos mediante una regresin dinmica y unafuncin de transferencia, respectivamente. Los resultados se muestran en dossemanas concretas del ao 2000 con el n de semana incluido para el mercadoelctrico espaol: una semana tpica de demanda baja (desde el 21 hasta el 27de agosto) y una semana tpica de demanda alta (desde el 13 hasta el 19 denoviembre) y para el mercado elctrico californiano los resultados se muestranen una semana de abril (desde el da 3 hasta el 9). En las semanas elegidaspara validar ambos modelos se obtienen unos errores relativos medios de 5%en el mercado espaol y de 3% en el mercado californiano, no existiendo unmejor comportamiento de un modelo frente al otro. Cuando una serie no es es-tacionaria pero el valor esperado de la serie s tiene un comportamiento cclico,se dice que la serie es estacional. Por ejemplo, una serie horaria es estacionalsi toma valores similares a las 8 de la maana de todos los das. Un modeloARIMA estacional consiste en un modelo ARIMA multiplicado por factoresde la forma (1Bs) donde s es un parmetro que indica la estacionalidad dela serie (24 en el caso de estacionalidad diaria, 168 en el caso de estacionalidadmensual...). Los modelos ARIMA estacionales han sido aplicado recientementea la serie temporal formada por los precios de la energa en el Mercado Elc-trico Espaol y Californiano. En [31] se presentan tres mtodos aplicados a la

    25

  • Captulo 2 Estado del Arte

    prediccin de los precios de la energa en ambos mercados elctricos: una re-gresin dinmica, una funcin de transferencia y un modelo ARIMA estacionalen el que se usa como una variable exgena la demanda de energa. Los resul-tados se muestran en dos semanas concretas del ao 2001 con el n de semanaincluido para el mercado elctrico espaol: una semana tpica de demanda ba-ja (desde el 25 hasta el 31 de agosto) y una semana tpica de demanda alta(desde el 11 hasta el 17 de mayo) y para el mercado elctrico californiano losresultados se muestran en una semana de abril del ao 2000 (desde el da 3hasta el 9). En las semanas elegidas para validar los tres mtodos se obtienenen el mercado espaol unos errores relativos medios de 5% cuando se usa unaregresin dinmica o funcin de transferencia y unos errores relativos mediosde 8% cuando se usa un modelo ARIMA estacional sin variable exgena. En elmercado californiano se obtienen unos errores relativos medios de 3% cuandose usa una regresin dinmica o funcin de transferencia y unos errores rela-tivos medios de 5% cuando se usa un modelo ARIMA estacional sin variableexgena. Tambin se muestran los resultados obtenidos en el mercado espaolal predecir los precios de la energa en la ltima semana de los primeros 10meses del ao 2000 con dos modelos ARIMA estacionales, uno que no usa va-riables exgenas y otro que usa como variables exgenas: la demanda, el aguaalmacenada y la produccin de energa disponible por las centrales hidruli-cas. En este caso ambos modelos se comportan de una manera parecida yaque se obtienen errores relativos medios de 10.89% sin ningn tipo de variableadicional y 10.45% aadiendo las variables exgenas anteriormente citadas.En [22] la prediccin de los precios de la energa se basa en modelos ARIMAestacionales tanto con variables explicativas como sin ellas. Para el mercadoespaol los resultados se muestran en tres semanas concretas elegidas del ao2000 y en la ltima semana de los primeros 10 meses del ao 2000 dando lugara unos errores medios relativos de 10% independientemente de que se usen ono se usen algunas variables adicionales.

    2.3.2.2. rboles de Regresin

    Un rbol de regresin se puede interpretar como una regresin lineal portrozos ya que las hojas de estos rboles contienen distintas rectas de regresin.Por tanto, un ejemplo recorrer el rbol hasta alcanzar una determinada hojay la recta de regresin que sta contenga ser el modelo de prediccin usa-do para estimar el atributo deseado. Los problemas de clasicacin donde losvalores de los atributos son etiquetas han sido resueltos mediante algoritmosde aprendizaje que generan rboles de decisin los cuales han resultado serrobustos, ecientes y simples [99]. En un rbol de decisin, cada nodo interno

    26

  • Estado del Arte

    establece una condicin o conjunto de condiciones sobre uno o varios atributos,representando en cada rama saliente el cumplimiento de una de esas condicio-nes. Cada hoja contiene una etiqueta de clase indicando la clasicacin. Laclasicacin de un ejemplo se lleva a cabo recorriendo el rbol desde la razhasta una de las hojas, siguiendo el camino determinado por el cumplimientode las condiciones. El ejemplo se clasica con la etiqueta contenida en el nodohoja alcanzado nalmente. En la ltima dcada se ha intentado extender losalgoritmos de aprendizaje que generan rboles de decisin para predecir valoresde atributos cuando stos son numricos. As, surgen los rboles de regresinque son rboles de decisin pero dieren de stos en que en las hojas del rbolen lugar de tener clases tienen valores, el algoritmo ms popular que construyerboles de regresin es conocido como CART [14], en el cual el valor de la pre-diccin en cada hoja es el valor medio de todos los ejemplos de un conjunto deentrenamiento que alcanzan esa hoja. Basndose en los rboles de regresin, elalgoritmo M5 [98] construye rboles en cuyas hojas tiene modelos lineales devarias variables, lo que se conoce con el nombre de model tree. Estos rbolesson as anlogos a funciones lineales a trozos y el algoritmo M5 extiende alalgoritmo CART en el sentido de que ste es un caso particular de estos rbo-les cuando las funciones lineales consideradas son constantes. Bsicamente, losalgoritmos CART y M5 construyen un rbol inicial mediante un algoritmo deinduccin de rboles de decisin. Sin embargo, en los rboles de decisin loscortes se determinan maximizando la ganancia de informacin mientras queen estos algoritmos los puntos de corte se determinan maximizando la reduc-cin de la varianza puesto que es ms apropiado en un problema de prediccinnumrica. En [118] se aplica el algoritmo M5 a la prediccin de cinco seriestemporales industriales obteniendo los doce siguientes valores de dichas seriescon unos errores absolutos medios de 21.5, 1.39, 4.46, 263.08 y 242.35 respecti-vamente. Estos resultados muestran muy buena aproximacin para la segundaserie temporal frente a los malos resultados obtenidos para las dos ltimas se-ries. Estas series industriales son muy pequeas pues estn formadas por 100ejemplos lo cual es una desventaja ya que el nmero tan pequeo de ejemplospuede afectar a la capacidad de aprendizaje del algoritmo. En [132] se describeun algoritmo, llamado M5, que se basa en el algoritmo M5, ya que tambinconstruye un rbol en cuyas hojas se obtiene una funcin lineal de los atributosy se presentan resultados donde se establece una comparacin entre ambos al-goritmos mostrando el algoritmo M5 una mayor capacidad de prediccin queel algoritmo M5. El algoritmo M5 combina la idea de construccin de un rboladoptada del algoritmo M5 con un mtodo para el tratamiento de los valoresperdidos y un mtodo para la transformacin de atributos cuyos valores sonetiquetas en atributos cuyos valores sean 0 1, puesto que ambas caracters-

    27

  • Captulo 2 Estado del Arte

    ticas tanto la presencia de atributos sin valor como la mezcla de atributos nonumricos con atributos numricos se suelen dar en las series temporales reales.Los algoritmos para tratar estas dos caractersticas de las series han sido adop-tados del algoritmo CART. El algoritmo M5 ha sido usado en esta tesis paraestablecer una comparacin entre los resultados obtenidos de su aplicacin conlos obtenidos de la aplicacin del mtodo de prediccin propuesto basado enlos vecinos ms cercanos a la prediccin de la demanda de energa elctrica. En[90] se genera un rbol de regresin cuyos cortes en los nodos se determinanasignando dos funciones difusas al valor de corte determinado por el algoritmoCART y que representan los lados izquierdo y derecho del subrbol que cuelgade ese nodo. Estos rboles de regresin difusos clasican los datos de entradade una red neuronal con la que se predice la demanda maxima diaria para losmeses comprendidos entre junio y septiembre del ao 1999 obtenindose unerror medio de 1.67% y un mximo error de 4.20%.

    2.3.3. Mtodos no Lineales

    Los mtodos de prediccin no lineales son aquellos que intentan modelar elcomportamiento de una serie temporal mediante una funcin no lineal. Estafuncin no lineal suele ser combinacin lineal de funciones no lineales cuyosparmetros hay que determinar.

    2.3.3.1. Mtodos Globales

    Los mtodos globales se basan en encontrar una funcin no lineal que mode-le los datos de salida en funcin de los datos de entrada. Dentro de los mtodosglobales no lineales se encuentran las RNA que presentan la ventaja de que nonecesitan conocer la distribucin de los datos de entrada y la ProgramacinGentica (PG) donde se puede elegir qu tipo de funcin no lineal modela elcomportamiento de los datos.

    2.3.3.1.1. Redes Neuronales ArtificialesLa teora de redes neuronales est inspirada en los conocimientos existentesdel funcionamiento del sistema nervioso de los seres vivos. A partir de ste,surgen modelos que intentan simular el proceso de aprendizaje de las neuronasinterconectadas en el cerebro. Para ello se denen una serie de capas, dondecada una tiene un nmero determinado de nodos que se relacionan con la capaanterior. La primera capa se llama vector de entrada, que toma los datos delchero de aprendizaje y la ltima capa se denomina vector de salida. Las redesse pueden dividir segn el tipo de aprendizaje en tres grupos: con aprendizaje

    28

  • Estado del Arte

    supervisado, redes auto-organizadas con aprendizaje no supervisado y redeshbridas que tratan de explotar las ventajas de los dos modelos anteriores.Los paradigmas ms extendidos dentro de cada uno de estos tipos de apren-dizaje son: el perceptrn multicapa [107] donde el algoritmo de aprendizajeutiliza una tcnica de bsqueda por gradiente y los pesos de la funcin querelaciona el vector de salida con el de entrada se calculan con un algoritmo deretropropagacin (feedforward) [109], las redes auto-organizadas [65] y la redde funcin de base radial (Radial Basis Function, RBF) [87]. Recientementedistintas arquitecturas y tipos de redes neuronales han sido aplicadas al pro-blema de la prediccin de la demanda [46] y los precios [143] para las 24 horasdel da siguiente. En [110] se implementa una red neuronal perceptron mul-ticapa con dos capas intermedias para la prediccin del pico de demanda enel sistema elctrico indio. En el aprendizaje de esta red se emplean distintastcnicas de descenso del gradiente conjugado: mtodo del gradiente conjugadode Fletcher-Reeves, mtodo del gradiente conjugado de Polak-Ribiere, mto-do del gradiente conjugado de Powell-Beale y mtodo del gradiente conjugadoescalado. El nmero de datos de entrada de la red son 28 y este nmero es