InstitutoTecnológicodeMorelia José María Morelos y...

113
Instituto Tecnológico de Morelia División de Estudios de Posgrado e Investigación Maestría en Ciencias en Ingeniería Electrónica TESIS “Modelo de Previsión Mediano-plazo para un Sistema Fotovoltaico basado en Redes Neuronales” QUE PARA OBTENER EL GRADO DE: Maestro en Ciencias en Ingeniería Electrónica PRESENTA: Ing. Oscar Lobato Nostroza Director: Gerardo Marx Chávez-Campos Codirector: Adriana del Carmen Téllez Anguiano Morelia, Michoacán, México – Junio 2019 – Rev 1.0

Transcript of InstitutoTecnológicodeMorelia José María Morelos y...

Page 1: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Instituto Tecnológico de Morelia�José María Morelos y Pavón�

División de Estudios de Posgrado eInvestigación

Maestría en Ciencias en IngenieríaElectrónica

TESIS

“Modelo de Previsión Mediano-plazo paraun Sistema Fotovoltaico basado en Redes

Neuronales”

QUE PARA OBTENER EL GRADO DE:

Maestro en Ciencias en Ingeniería Electrónica

PRESENTA:Ing. Oscar Lobato Nostroza

Director: Gerardo Marx Chávez-CamposCodirector: Adriana del Carmen Téllez Anguiano

Morelia, Michoacán, México – Junio 2019 – Rev 1.0

Page 2: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Ing. Oscar Lobato Nostroza: Modelo de Previsión Mediano-plazo para un Sistema Fotovoltaico basadoen Redes Neuronales, c© Junio 2019

Mesa de revisión:Gerardo Marx Chávez-CamposAdriana del Carmen Téllez AnguianoMiguelangel Fraga AguilarRafael Lara Hernández

Localidad:Morelia, Michoacán, México

Impresa:Junio 2019

Page 3: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

– Dedicado a mi familia, mis profesores y amigosque ahora también son mi familia–

Page 4: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Prólogo

Los sistemas fotovoltaicos son en la actualidad los sistemas de recolección en energías renovablesmás utilizados en el mundo. Sin embargo estos sistemas no son los más eficientes, por lo tanto siguenen constante mejoramiento, no solo sus capacidades intrínsecas, sino también en las tecnologías quecontribuyen a mejorar su desempeño. Todo esto hace que en la actualidad diversos países considerena los sistemas fotovoltaicos como una alternativa real en la distribución de energía. Especialmente lasenergías basadas en la radiación solar generan de forma intermitente energía a lo largo de un día, yutilizan la estimación como una herramienta que les permite determinar que medios usar para cubrirla demanda total de energía.

El presente trabajo de tesis muestra el desarrollo e implantación de una red neuronal que estima lageneración de energía de un panel fotovoltaico, considerando las condiciones en las cuales se encuentrael panel expuesto. Siendo así la medición de radiación, temperatura, humedad y energía parámetrosdeterminantes en el desempeño de la red neuronal. La red fue desarrollada basándose ampliamente enmétodos y análisis estadístico, mismos que contribuyeron a seleccionar el mejor sistema de estimación.Este primer sistema no solo permitió generar información relevante para el desarrollo de este trabajode tesis, sino que además permitió la colaboración con diversas área de investigación como el posgradoen ingeniería administrativa, estancias de investigación en el Instituto Nacional de Telecomunicaciones(INATEL) de Brazil, y el desarrollo de un sistema de adquisición de datos basado en el internet de lascosas que fue pieza clave en el desarrollo de este trabajo, sino que además el trabajo de investigación dejaun buen sabor de boca entre las instituciones para continuar la colaboración en futuras investigaciones.

Agradecemos al laboratorio nacional SEDEAM por las facilidades en el desarrollo de los prototipos,así como equipos facilitados para el desarrollo del proyecto. También agradecemos al Dr. Yvo MarceloChiaradia Masselli por todas las facilidades dadas al Ing. Oscar Lobato Nostroza durante su estanciaen Brazil. Agradezco por supuesto a Oscar por todo el empeño puesto para el desarrollo del trabajo,pero sobretodo le agradezco su confianza para seguir haciendo crecer el trabajo multidisciplinario enel posgrado, dejando un claro ejemplo de las posibilidades que tiene la investigación en nuestro país,nuestra ciudad.

Oscar, muchas felicidades y gracias.

– Gerardo Marx Chávez-Campos–

iii

Page 5: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Abstract

The continuously increasing population have major requirements to sustain their life status; thisrequirements are mainly supported by energy resources. To accomplish this, energy companies incor-porate more and better alternative energy sources. Today, solar power based systems have to becomethe most popular alternative all over the world. These systems use the photovoltaic effect to buildsolar panels. However, this system is mainly affected by weather changes that create disturbances inelectrical power production.

Then tools to forecast the energy generation can be used to find best interconnection networkconditions, and reduce the problem of instability. The present work shows the development of anartificial neural network to forecast energy production in solar panels. It was reported in severalworks; temperature, radiation, humidity, solar panel’s voltage, and current. The measurements weredone by an IoT system developed together with this work. The resulting data was applied to the ANNto determinate solar panel’s behavior.

Data analysis helps to understand how environmental factors affect energy production on the panelsolar. Thus after define and select the parameters of the ANN, this can be used to forecast the next24 hours, and the ANN could help to determinate in which conditions the solar panel can improve thepower generation.

iv

Page 6: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Resumen

El incremento de la población demanda una mayor cantidad de recursos, y uno de los recursosmás demandados es la energía eléctrica. Actualmente se está realizando esfuerzos para cubrir dichademanda, en donde las energías renovables juegan un papel muy importante. De este tipo de energías,la que mas destaca debido a la popularidad que está adquiriendo en la actualidad es la energía solar.Este tipo de energía se basa en el principio fotoeléctrico del material semiconductor con el cuál sefabrican los paneles fotovoltaicos. Al ser dispositivos de respuesta rápida, pueden crear inestabilidadesen el sistema de distribución actual. Es en este ámbito que se realiza investigaciones para estimar afuturo cómo se comporta la potencia eléctrica, con la finalidad de conocer bajo que condiciones sepuede interconectar estos paneles. El presente trabajo desarrolla una metodología, que va desde laadquisición de datos y a través de la inteligencia artificial, determinar de qué manera se comporta elpanel fotovoltaico, considerando las condiciones ambientales del entorno. Los resultados obtenidos dela red neuronal son comparados con los resultados de un modelo de regresión y los datos reales delpanel, que permitirán entender la importancia de cómo algunas variables influyen en el desempeñodel panel, además de determinar las características de una red neuronal que es capaz de prever elcomportamiento del panel hasta en las siguientes 24 horas, lo cual puede ser usado para la toma dedecisiones durante el proceso de interconexión de un sistema fotovoltaico a la red eléctrica.

v

Page 7: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Una vez el Dr. Juan Delgado me dijo“En todo lo que hagas, ¡Cuidado con el viento!”

y desde entonces me cuido del viento de la vida diaria. – Oscar Lobato Nostroza –

Agradecimientos

Agradezco a las personas que más me han apoyado a lo largo de esta etapa, mi familia que con sussabios consejos han sabido guiar mi camino.

Un agradecimiento a mi asesores pero en especial al M.C. Gerardo Marx Chávez Campos poranimarme a realizar las estancias, por ser más que un guía, es un gran compañero y amigo, graciaspor tu amistad.

De igual manera, agradezco a todos mis profesores de la maestría, que además de su paciencia,cada uno me ha enseñado cosas diferentes, no solo en el área académica, si no también en cuestiones... que me ha ayudado a tener una mayor confianza en mi persona.

Al profesor Yvo que durante mi estancia en brasil, me apoyo en todos los aspectos, además de loacadémico, social, económico y de idioma, me mostró una perspectiva diferente de la vida.

Quiero agradaser también al Posgrado de Ingeniería Electrónica por darme la oportunidad de reali-zar mi desarrollo académico y a conocer mis verdaderas capacidades tanto académicas como personales.

Consejo nacional de Ciencia y Tecnología (Conacyt) por el apoyo brindado para la realización dela investigación.

A mis compañeros de la maestría, que me ayudaron a hacer mas llevadero el ambiento durantetodo este tiempo, todos llegaron en el momento preciso en que los necesité. De igual manera a miscompañeros de proyecto “Marx’s son’s” que me motivaron a dar lo mejor al final. Estos años han sidolos mas cortos de mi vida, pero han dado los mejores frutos.

Hoy gracias a todos ellos estoy aquí, listo para iniciar una nueva etapa. Gracias.

vi

Page 8: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Índice general

Prólogo III

Abstract IV

Resumen V

1. Definición del protocolo 1

1.1. Semblanza del problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2. Revisión del estado del arte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.3. Hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.4. Solución propuesta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.5. Materiales y Métodos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2. Introducción a las redes neuronales artificiales 8

2.1. Aplicaciones de las redes neuronales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.2. Principio de funcionamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.3. Entrenamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.4. Conclusiones del capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

3. Panel Fotovoltaico 18

3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

3.2. Principios de funcionamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3.3. Adquisición de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

vii

Page 9: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

3.3.1. Características del prototipo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3.3.2. Interfaz gráfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3.4. Datos obtenidos del prototipo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.5. Conclusiones de capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

4. Estadística aplicada al análisis de datos 25

4.1. Principios básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

4.2. Estadística inferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

4.2.1. Estimación puntual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

4.2.2. Estimación por intervalos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

4.3. Diagramas de dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

4.4. Regresión Lineal Simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

4.5. Coeficiente de determinación y de correlación . . . . . . . . . . . . . . . . . . . . . . . . 29

4.6. Prueba de hipótesis e intervalo de confianza . . . . . . . . . . . . . . . . . . . . . . . . . 31

4.7. Conclusiones del capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

5. Desarrollo y Resultados 33

5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

5.1.1. Gráfica de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

5.1.2. Análisis del error RMSE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

5.2. Preparación de datos para entrenamiento . . . . . . . . . . . . . . . . . . . . . . . . . . 44

5.2.1. Conjunto para la estimación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

5.2.2. Conjuntos para la previsión n elementos previos . . . . . . . . . . . . . . . . . . 47

5.3. Análisis de valores de salida en una RNA . . . . . . . . . . . . . . . . . . . . . . . . . . 48

5.3.1. Resultados para estimación (RMSE) . . . . . . . . . . . . . . . . . . . . . . . . . 49

5.3.2. Resultados para previsión (RMSE) . . . . . . . . . . . . . . . . . . . . . . . . . . 59

5.4. Conclusiones del capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

6. Conclusiones y trabajo futuro 67

6.1. Prototipo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

viii

Page 10: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

6.2. Correlación de las variables medidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

6.3. Redes neuronales y sus aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

6.3.1. Resultados para estimación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

6.3.2. Resultados para previsión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

6.3.3. Trabajo futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

A. Matlab para tratamiento de datos 70

A.1. Lectura y presentación de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

B. EassyNN 79

B.1. Preparación de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

B.2. Creación de conjuntos de entrenamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

B.3. Selección de parámetros de entrenamiento . . . . . . . . . . . . . . . . . . . . . . . . . . 82

B.4. Interpretación de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

C. Minitab 86

C.1. Interfaz de usuario de Minitab . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

C.2. Exportar datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

C.3. Análisis de correlación de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

C.4. Modelo de regresión de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

ix

Page 11: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Índice de figuras

1.1. Esquema de clasificación de sistemas de previsión (Forecasting), basándose en el rangode estimación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2. Esquema de aplicación del forecasting, con interacción de los sistemas de generación. . . 2

1.3. Esquema de aplicación del forecasting, con interacción de los sistemas de generación. . . 3

1.4. Comparación de datos reales y estimados de generación fotovoltaica en los meses Mayoy Junio del 2015. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.5. Sistema experimental para obtención y validación de datos capturados. . . . . . . . . . . 6

1.6. Obtención de estimación y previsión de los datos a través de herramientas estadísticasy redes neuronales artificiales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.1. Figuras de las áreas de la inteligencia artificial y sus correspondientes subáreas. . . . . . 9

2.2. Figuras comparativas entre modelo biológico y modelo matemático de una neurona. . . 10

2.3. Funciones de activación más usadas dentro de las redes neuronales. . . . . . . . . . . . . 11

2.4. Equivalente gráfico de un perceptrón. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.5. Configuración de una red neuronal básica de un solo elemento, y los datos correspon-dientes a una compuerta AND. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.6. Configuración de una red neuronal con dos perceptrón para un conjunto de datos co-rrespondiente a una compuerta XNOR. . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.7. Configuración ejemplo de Perceptrón Multicapa 4:2:2. . . . . . . . . . . . . . . . . . . . 13

2.8. Búsqueda del mínimo global en una función de coste. . . . . . . . . . . . . . . . . . . . . 14

2.9. Gráficas de puntos, con la recta de respuesta de la red sin sobreentrenamiento. . . . . . 16

2.10. Gráficas de puntos, con la recta de respuesta de la red con sobreentrenamiento. . . . . . 16

x

Page 12: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

3.1. Efecto fotovoltaico en unión de materiales tipo p y tipo n. . . . . . . . . . . . . . . . . . 19

3.2. Curvas características de un panel solar, utilizando variables como voltaje corriente ypotencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3.3. Esquema de prototipo para medición de variables. . . . . . . . . . . . . . . . . . . . . . 20

3.4. Prototipo para la medición de variables ambientales y de características eléctricas delpanel solar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

3.5. Panel usado para ensamblar el sistema experimental y obtener mediciones. . . . . . . . . 22

3.6. Primera interfaz gráfica y sus partes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3.7. Segunda interfaz gráfica y sus partes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

4.1. Tipos de relaciones que existen en dispersión de datos. . . . . . . . . . . . . . . . . . . . 27

4.2. Campos de la inteligencia artificial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

5.1. Metodología para la creación del conjunto de datos para el entrenamiento de redesneuronales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

5.2. Metodología para la aplicación de redes neuronales con el conjunto de datos definido. . . 34

5.3. Muestra de mediciones en iluminación correspondiente a 13 días. . . . . . . . . . . . . . 35

5.4. Mediciones de temperatura correspondiente a 13 días. . . . . . . . . . . . . . . . . . . . 35

5.5. Mediciones de temperatura correspondiente a 13 días. . . . . . . . . . . . . . . . . . . . 36

5.6. Voltaje medido en un periodo de 13 días. . . . . . . . . . . . . . . . . . . . . . . . . . . 36

5.7. Gráfica de corriente en el panel en un periodo de 13 días. . . . . . . . . . . . . . . . . . 37

5.8. Mediciones de temperatura correspondiente a 13 días. . . . . . . . . . . . . . . . . . . . 37

5.9. Comparación de mediciones de iluminación entre prototipo desarrollado y estación me-teorológica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

5.10. Comparación de mediciones de temperatura entre prototipo desarrollado y estaciónmeteorológica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

5.11. Comparación de mediciones de humedad entre prototipo desarrollado y estación meteo-rológica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

5.12. Error semanal en mediciones de iluminación, con discriminación y sin discriminación. . . 41

5.13. Error semanal en mediciones de temperatura, con discriminación y sin discriminación. . 41

5.14. Error semanal en mediciones de humedad, con discriminación y sin discriminación. . . . 42

5.15. Gráficas de comparación solamente con dos variables. . . . . . . . . . . . . . . . . . . . 46

xi

Page 13: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

5.16. Gráficas de comparación solamente con dos variables. . . . . . . . . . . . . . . . . . . . 46

5.17. Conjunto de datos propuestos para realizar la serie de entrenamiento para la estimaciónde potencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

5.18. Conjunto de datos propuestos para realizar la serie de entrenamiento para la previsiónde potencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

5.19. Metodología de experimentación en las topologías de redes neuronales. . . . . . . . . . . 48

5.20. Comparación gráfica de datos estimados contra datos reales para una topología de 3:3:1. 51

5.21. Comparación gráfica de datos estimados contra datos reales para una topología de 3:3:3:1. 52

5.22. Topología 3:3:1 que considera la iluminación, temperatura y humedad como variablesde salida. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

5.23. Comparación gráfica de datos estimados contra datos reales para una topología de 2:8:1. 53

5.24. Comparación gráfica de datos estimados contra datos reales para una topología de 2:8:4:1. 54

5.25. Topología 2:8:4:1 que considera la iluminación y la temperatura como variables de salida. 54

5.26. Comparación gráfica de datos estimados contra datos reales para una topología de 2:3:1. 55

5.27. Comparación gráfica de datos estimados contra datos reales para una topología de 2:3:3:1. 56

5.28. Topología 2:3:1 que considera la iluminación y la humedad como variables de salida. . . 56

5.29. Comparación gráfica de datos estimados contra datos reales para una topología de 2:7:1. 57

5.30. Comparación gráfica de datos estimados contra datos reales para una topología de 2:7:6:1. 57

5.31. Topología 2:3:1 que considera la temperatura y la humedad como variables de salida. . . 58

5.32. Figura comparativa de los desempeños entre la estimación por rede neuronal artificial ymodelo de regresión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

5.33. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

5.34. Mediciones de las variables de operación del panel solar (sin discriminar). . . . . . . . . 60

5.35. Comparación gráfica de datos estimados contra datos reales para una topología de 2:7:1,usando conjunto de datos A. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

5.36. Comparación gráfica de datos estimados contra datos reales para una topología de 2:7:1,usando conjunto de datos B. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

5.37. Comparación gráfica de datos estimados contra datos reales para una topología de 9:4:2:1. 66

B.1. Conjuntos de entrenamiento, validación y prueba en formato “.csv”. . . . . . . . . . . . . 80

B.2. Área de trabajo para la creación y entrenamiento de redes neuronales. . . . . . . . . . . 80

B.3. Área de trabajo para la creación y entrenamiento de redes neuronales. . . . . . . . . . . 81

xii

Page 14: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

B.4. Opciones de identificación de datos para conjuntos de datos en redes neuronales. . . . . 81

B.5. Selección del tipo de columna para los conjuntos de datos. . . . . . . . . . . . . . . . . . 82

B.6. Opciones de identificación de datos para conjuntos de datos en redes neuronales. . . . . 83

B.7. Opciones de identificación de datos para conjuntos de datos en redes neuronales. . . . . 83

B.8. Valores resultantes de la estimación, después del proceso de entrenamiento. . . . . . . . 84

B.9. Valores resultantes de la estimación, después del proceso de entrenamiento. . . . . . . . 85

B.10.Nube de puntos correspondientes al conjunto de datos de validación y prueba. . . . . . . 85

C.1. Interfaz de usuario de Minitab. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

C.2. Importación de datos para el análisis estadístico. . . . . . . . . . . . . . . . . . . . . . . 87

C.3. Herramienta de análisis de correlación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

C.4. Panel de selección de variables para el análisis de correlación. . . . . . . . . . . . . . . . 88

C.5. Resultados para el análisis de correlación. . . . . . . . . . . . . . . . . . . . . . . . . . . 89

C.6. Herramienta de regresión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

C.7. Panel de selección de variables de salida y variables de entrada. . . . . . . . . . . . . . . 90

C.8. Resultados de análisis ANOVA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

C.9. Modelo de regresión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

xiii

Page 15: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Índice de tablas

2.1. Valores de salida de una compuerta lógica AND. . . . . . . . . . . . . . . . . . 12

2.2. Valores de salida de una compuerta lógica XNOR. . . . . . . . . . . . . . . . . 12

3.1. Información entregado por el sistema-IoT [1]. . . . . . . . . . . . . . . . . . . . 24

5.1. Tabla de errores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

5.2. Análisis Anova. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

5.3. Análisis de hipótesis para interacciones de un solo término . . . . . . . . . . 44

5.4. Análisis de correlación entre variables independientes. . . . . . . . . . . . . 45

5.5. Resultados obtenidos del barrido en ciclos de entrenamiento. . . . . . . . . 49

5.6. Resultados obtenidos del barrido en elementos de cómputo con una capaoculta para iluminación, temperatura y humedad como variables de entrada. 50

5.7. Resultados obtenidos del barrido en elementos de cómputo con dos ca-pas ocultas para iluminación, temperatura y humedad como variables deentrada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

5.8. Resultados obtenidos del barrido en elementos de cómputo con una capaoculta para iluminación y temperatura como variables de entrada. . . . . . 53

5.9. Resultados obtenidos del barrido en elementos de cómputo con dos capasocultas para iluminación y temperatura como variables de entrada. . . . . 53

5.10. Resultados obtenidos del barrido en elementos de cómputo con una capaoculta para iluminación y humedad como variables de entrada. . . . . . . . . 55

5.11. Resultados obtenidos del barrido en elementos de cómputo con dos capasocultas para iluminación y humedad como variables de entrada. . . . . . . . 55

5.12. Resultados obtenidos del barrido en elementos de cómputo con una capaoculta para temperatura y humedad como variables de entrada. . . . . . . . 56

xiv

Page 16: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

5.13. Resultados obtenidos del barrido en elementos de cómputo con dos capasocultas para temperatura y humedad como variables de entrada. . . . . . . 57

5.14. Resultados obtenidos del barrido en elementos de cómputo con dos capasocultas para temperatura y humedad como variables de entrada. . . . . . . 61

5.15. Resultados obtenidos del barrido en datos previos al dato previsto. con-siderando también la iluminación, temperatura y humedad como variablesde entrada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

5.16. Resultados obtenidos del barrido en la cantidad de neuronas con unasola capa oculta, considerando la iluminación, temperatura, humedad yseis mediciones de potencia previa como variables de entrada. . . . . . . . . 62

5.17. Resultados obtenidos del barrido en la cantidad de neuronas para lasegunda capa oculta, considerando la iluminación, temperatura, humedady seis mediciones de potencia previa como variables de entrada. . . . . . . . 63

5.18. Resultados obtenidos del barrido de neuronas para una sola capa en con-junto de mediciones con suavizado de datos. . . . . . . . . . . . . . . . . . . . . 64

5.19. Resultados obtenidos del barrido de neuronas para una dos capas en con-junto de mediciones con suavizado de datos. . . . . . . . . . . . . . . . . . . . . 64

5.20. Resultados obtenidos del barrido de elementos de cómputo para una solacapa, utilizando una frecuencia de muestreo en las mediciones de diezminutos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5.21. Resultados obtenidos del barrido de elementos de cómputo para dos capaocultas, utilizando una frecuencia de muestreo en las mediciones de diezminutos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

A.1. Tabla de mediciones de variables, correspondientes a un periodo de 24 horas 70

xv

Page 17: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Capítulo 1

Definición del protocolo

1.1 Semblanza del problema

El consumo energético es un criterio fundamental en la economía, que puede influenciar el desa-rrollo industrial de una ciudad o un país [2]. En México, la Comisión Federal de Electricidad(CFE), organismo encargado de la distribución eléctrica, cubre la demanda energética demás de 41.9 millones de clientes [3]. Clientela que han tenido una tasa de crecimiento medio

anual de más de 3.01%, durante los últimos nueve años, como resultado se ha generado un incrementoen la demanda energética. Por lo anterior, CFE no tiene la capacidad de producción eléctrica, según[3] el cual reporta que solo se produjo el 65.2% del total de energía demandada para finales del 2016.Por lo que recurre a productores independientes y a otras alternativas de producción energética.

Una de las más importantes alternativas energéticas para cubrir dicha demanda, es el uso de lasenergías renovables, específicamente la energía solar, ya que favorecen a la disminución en los niveles decontaminación que existen actualmente, además en comparación con los medios de generación tradi-cionales (quema de combustibles fósiles) pose una menor huella de carbono. Debido a la intermitenciay variabilidad natural de esta energía, su interconexión a gran escala en el sistema eléctrico actual, loconvierte en un desafío importante, ya que afectan la estabilidad del sistema [4]. Adicionalmente, cadafuente de generación eléctrica, requiere de mantenimiento preventivo y correctivo, monitoreo y tomade decisiones o ajustes para garantizar un funcionamiento óptimo.

En ese sentido existen diferentes trabajos que se dedican a la investigación de este tipo de problema ycómo solucionarlo a través de la técnicas de previsión. Esta técnica, también conocida como forecasting,se define como una herramienta para determinar valores o comportamientos a futuro en un determinadoplazo, basándose en un registro histórico [5]. Estas determinaciones pueden realizarse a través detécnicas estadísticas [6, 7], inteligencia artificial [8] además de otras técnicas [9, 10].

Las técnicas de previsión tienen aplicación en muchas áreas, desde aplicaciones financieras; comoes el caso de la previsión a largo plazo del mercado de valores en Indonesia (estimación por 10 meses)[11, 12], aplicaciones en producción alimenticia, como estimar resultados en la producción de papa

1

Page 18: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

bajo los efectos de diferentes condiciones climáticas, logrando una aproximación del 85% [13], paradeterminar los niveles de producción de aceite y evitar así tener exceso de producto en stock [14], o enel área de procesamiento de señales, el cual también se aplica para determinar valores futuros de unaseñal reconstruida [15].

Dentro del campo de las energías limpias, las técnicas de previsión son aplicadas para determinarla demanda eléctrica (Load Forecasting), la cual es definida como la medición entre el valor de cargaeléctrica actual y el valor de la carga eléctrica a futuro [16]. Es importante obtener una predicciónprecisa del nivel de generación, con la finalidad de mejorar la operación eléctrica de la red [17]. Según[18] y [19] los sistemas de previsión son clasificados de la siguiente manera: a)muy corto plazo, b)cortoplazo, c)mediano plazo y d)largo plazo, tal como se muestra en Figura 1.1.

Figura 1.1: Esquema de clasificación de sistemas de previsión (Forecasting), basándose en el rango deestimación.

Las estimaciones a muy corto plazo son aquellas que realizan a los pocos minutos de la últimamedición. Las estimaciones a corto plazo se realiza en el rango de las siguientes horas y las estimacionesde mediano y largo plazo son aquellas que van desde días hasta meses.

La elección del método de estimación depende del tipo de información disponible, del proceso quese desea estimar y de la aplicación. El esquema más común para realizar las estimaciones es mostradoen la Figura 1.2.

Forecas�ng

Modelo de previsión

Generación Eléctrica

Figura 1.2: Esquema de aplicación del forecasting, con interacción de los sistemas de generación.

Al conocer el comportamiento del sistema fotovoltaico, es posible determinar cuáles son las mejorescondiciones para la integración con el sistema eléctrico.

Con lo anterior se plantea el siguiente problema, la intermitencia de los sistemas de generación,es hasta cierto punto predecible, sin embargo dichos sistemas poseen una variabilidad natural que nose puede modelar de manera sencilla, por lo que siempre se tendrá un nivel de error. Para tratar decompensar la existencia de esta variabilidad, se recurre al uso de grandes cantidades de informacióncomo lo son los registros históricos, y con ello disminuir en la medida de lo posible los errores que sepudiera tener en las estimaciones.

2

Page 19: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Es entonces que para poder dar solución a esta problemática se propone a partir de un conjunto dedatos y con el uso de la inteligencia artificial, determinar el comportamiento energético de un sistemafotovoltaico durante las siguientes 24 horas, y con esta información resultante determinar si el sistemaserá capaz de proveer cantidad de energía demandada por la carga.

1.2 Revisión del estado del arte

Tomando en cuenta la problemática y la solución propuesta, se realizó una búsqueda de trabajos queusan métodos de estimación, aplicado a dar soluciones en diferentes áreas, como en [2], Kafazi desarrollaun modelo conocido como Auto Regressive Integrated Moving Average (Arima), para determinar a largoplazo la demanda eléctrica en Marruecos, este modelo tiene un valor de R2 de 0.92, realizando lasvalidaciones con mediciones reales. Sin embargo, el propio autor reporta que la aproximación es muysensible a cambios bruscos del comportamiento eléctrico, y que es susceptible al clima de la región.

En otro trabajo [20] se realiza la predicción de la radiación solar y demanda energética a partir deredes neuronales artificiales (Artificial Neural Networks, ANN), la red utiliza como datos de entradamediciones de radiación solar en la ciudad de Locamo en Suiza. El autor define que la estimaciónde demanda energética como de radiación solar no utilizan datos reales, los resultados obtenidos sonmostrados en la Figura 1.3, además menciona que la configuración que mayor error de aproximacióntiene, corresponde a las estimaciones de radiación, debido a las variaciones que ocurren durante el día.Concluye que el considerar los periodos nocturnos, incrementa el error en la predicción, ya que existenmediciones con valores en 0.

Figura 1.3: Esquema de aplicación del forecasting, con interacción de los sistemas de generación [20].

Otro factor a considerar, en la estimación de la cantidad de energía generada. Como se estudiaen [21], desarrolla un modelo a corto plazo llamado Historical Similar Mining (HISIMI) basado en elminado de datos históricos, el cual presenta ventajas de fácil actualización de la base de datos y unabuena aproximación en la predicción. Debido a que engloban en el modelo a todo el sistema fotovoltaicoy solo toman en cuenta los datos históricos como la temperatura y el nivel de radiación, dejando afueraotro tipo de datos como son la humedad, la presión atmosférica, entre otros.

En [10] Sharman realiza la previsión de los niveles de radiación solar, utilizando registros históricosdel Servicio Climatológico Nacional (National Weather Service), tomando como factores de entrada ala radiación solar, temperatura, la probabilidad de precipitación, y la humedad relativa. Sin embargo,implementando técnicas de Machine Learning, los resultado muestran que es difícil predecir los nivelesde generación a partir de este comportamiento climático, ya que se observó la existencia de una relacióncompleja entre todos los factores ambientales.

3

Page 20: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

En [22] se aplicó el método de redes neuronales, en específico Feed Fordward. Este método fueutilizado para determinar el comportamiento de la radiación solar, y potencia solar/eólica a cortoplazo en una zona importante de Francia. Se obtuvieron buenas aproximaciones en condiciones ideales.Sin embargo ante variaciones climatológicas que no fueron tomadas en cuenta, se observó un incrementoen el error de aproximación, y fue validado con datos correspondientes a años anteriores al estudio.

De la misma manera, en [23] se realiza la previsión de la potencia solar en Delhi, India. Losautores recomiendan que para obtener un modelo de un sistema fotovoltaico confiable, se tome encuenta factores ambientales como la temperatura, la cobertura de las nubes, la velocidad del viento,la humedad, las lluvias y la ubicación del sistema. Enfocan los estudios en la implementación decuatro técnicas diferentes. De los resultados obtenidos, la técnica de redes neuronales es la que mejoraproximación y menor error tiene. Sin embargo los datos utilizados corresponden a fechas anterioresal trabajo, llegando solo a simulaciones.

En [24] Sangrody concluye que la humedad en el ambiente es uno de los factores más influyentesen los sistemas fotovoltaicos. Esta relación fue deducida gracias a la aplicación de redes neuronalestipo Feed Forward Supervised Learning. Aunque no tomó en cuenta los niveles de radiación y el com-portamiento de la carga eléctrica, obtuvo una buena aproximación en prever los niveles de generación,utilizando mediciones de 6 días para entrenar y validar las redes neuronales.

En la [19] la autora diseñó un modelo de red neuronal híbrida para estimar la cantidad de energíaproducida por un sistema eólico. Observó que al igual que otras técnicas como las redes neuronales ylos modelos regresión, los modelos híbridos también eran afectados por las condiciones climatológicascomo temperatura y radiación solar, las cuáles no fueron tomadas en cuenta dentro del conjunto deentrenamiento, por lo que recomienda tomarlos en cuenta para futuros trabajos.

En [25] se trabajó con las configuraciones General Neural Network (GNN) y ANN, encontrando unmejor desempeño con GNN. La validación del modelo fue realizada en una granja solar de 5MW enla India. Los datos de entrada para los modelos fueron radiación solar, temperatura ambiental y delpanel al igual que la radiación indirecta. El trabajo llegó a la validación del modelo con datos reales,los resultados mostrados en la Figura 1.4 corresponden a estimaciones de los meses Mayo y Junio. Losdatos calculados muestran que siguen la tendencia de los valores reales, obteniendo un valor de la raízmedia cuadrática del error (RMSE), obteniendo valores de 0.1651 y 0.5313 respectivamente.

0 5 10 15 20 25 300

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

Number of Days

So

lar

Po

we

r G

en

era

tio

n (k

Wh

)

Actual Data

ANN Model

GNN Model

0 5 10 15 20 25 300.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

Number of Days

Sola

r P

ow

er

Ge

ne

rati

on

(k

Wh

)

Actual Data

ANN Model

GNN model

Figura 1.4: Comparación de datos reales y estimados de generación fotovoltaica en los meses Mayo yJunio del 2015, imagen obtenida de [25].

En [26] se desarrolla un modelo basado en redes neuronales que toma en cuenta factores climatológi-cos importantes, utilizando un sistema fotovoltaico de 27.34Kw para evaluar el desempeño del modelo

4

Page 21: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

obtenido. Pero debido a que en las pruebas realizadas existieron factores como la contaminación, fuenecesario incluir una gran cantidad de variables que complican la obtención del modelo.

En [27] el doctor Sassine desarrolla un modelo matemático que le permite prever los niveles deradiación que hay durante el año en la localidad de Beirut, después de la validación con datos reales,concluye que puede obtener buenas estimaciones solamente tomando en cuenta los niveles de radia-ción, pero es susceptible a variaciones climatológicas como días con gran densidad de nubes o conprecipitacio|nes pluviales.

El estudio realizado en [28] implementa una red neuronal artificial de tres capas (13 neuronas enla capa oculta) y ajuste por Back Propagation (BP) en conjunto con un algoritmo genético con lafinalidad de prever los niveles de generación eléctrica en una granja solar, considerando solamente losniveles de radiación y temperatura, obteniendo buenos resultados, aunque mencionan que debido a lacomplejidad de la red, se requiere de una gran base de datos, además de muchas series de entrenamientopara lograr obtener mejores resultados.

El trabajo de [29] se basa en una red neuronal para prever el comportamiento de generación eléctricaen un sistema fotovoltaico, tomando datos de potencia solar y variables ambientales cada hora. Deigual manera, se implementa una red neuronal para estimar el perfil de demanda eléctrica. Con ambosresultados se obtiene cuál es la diferencia de generación para generar un indicador de corrección enlos niveles de generación conocido como Probability Density Forecast (PDF). Debido a que no se tienemediciones realizadas en el mismo punto de prueba, se utiliza una base de datos disponible.

De igual forma en [30] el autor Menon implementó una red neuronal para prever el comportamientodel perfil de generación de un sistema fotovoltaico. Parte de su trabajo consistió en realiza un análisisde correlación de datos ambientales, con la finalidad de elegir las variables más significativas comodatos de entrada al sistema de previsión. Como resultado de ese trabajo determinó que existe unabuena relación entre la temperatura ambiental, la humedad relativa y la velocidad del viento. Estosson tomados como variables de entrada para el entrenamiento de la ANN. Las estimaciones obtenidastenían un incremento de error durante los días nublados o con precipitaciones pluviales, esto debido aque las mediciones usadas como datos de entrenamiento fueron extraídos de bases de datos en linea,y no son mediciones experimentales, por lo que se recomienda repetir el proceso con un conjunto dedatos medidos en el mismo punto geográfico.

La investigación realizada en [31] se basa de igual forma, en la aplicación de redes neuronales parala previsión de un sistema de generación fotovoltaica y la influencia que éste tiene al interactuar conla red eléctrica local, el cuál realiza mediciones cada 5 minutos por cerca de 80 días. Los resultadosobtenidos en condiciones ideales, tienen un nivel de confiabilidad arriba del 94 %, mientras que en díasnublados se logra solamente el 85 %. Se atribuye que la disminución de confiabilidad es debido a labaja cantidad de información a la que se tiene acceso y a la falta de variables a considerar como lo sonlas condiciones ambientales.

1.3 Hipótesis

Como se observó en los trabajos anteriores, la temperatura y demás factores ambientales han sidoreportados como elementos clave que influye de manera significativa en la eficiencia de conversión deun panel fotovoltaico [10, 22, 32, 33, 34], por lo que al considerar incluirlos dentro de un algoritmo deestimación como lo es la red neuronal, es posible obtener previsiones a corto plazo con un menor nivelde error.

5

Page 22: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

1.4 Solución propuesta

Considerando los resultados de las investigaciones realizadas por los anteriores autores, y con lafinalidad de probar la hipótesis planteada, se propone obtener mediciones de temperatura ambiental,el nivel de iluminación solar y humedad relativa a partir de un sistema experimental. Aplicando unade las técnicas de Machine Learning, específicamente las Redes Neuronales en conjunto con los datosrecolectados, obtener un modelo que permita estimar y prever la capacidad de generación de un panelfotovoltaico dentro de las siguientes horas. Esta misma plataforma servirá para realizar la validacióndel modelo obtenido.

1.5 Materiales y Métodos

La primera parte de este análisis consiste en la adquisición y validación de datos, como se observaen la Figura 1.5, el sistema experimental está conformado por un panel fotovoltaico que es expuesto ala intemperie las 24 horas del día, la energía generada se aplica a un equipo de laboratorio conocidocomo carga electrónica, el cual tiene la capacidad de simular el comportamiento de un sistema de alma-cenamiento de energía. Bajo este esquema de operación, un prototipo de medición, realiza medicionesde voltaje, corriente (y con estos dos parámetros se calcula la potencia del panel), además de medirfactores ambientales como niveles de radiación, temperatura, y humedad.

La segunda parte del análisis de los datos consiste en calcular la diferencia que existe entre lasmediciones de los dos sistemas, con los datos previamente normalizados.

i2ci2c

t

wI

V

Pcb 2

Pcb 3

Lx %HC°

Pcb 1

uC

Carga

Electrónica

Sistema ExperimentalRedes neuronales ar!ficiales

para es!maciones

Figura 1.5: Sistema experimental para obtención y validación de datos capturados.

El tercer punto, como se aprecia en la Figura 1.6, ya que las mediciones obtenidas del prototipo serealiza un proceso de validación, éstas son utilizadas para realizar análisis de correlación de variables,modelos de regresión y finalmente son aplicados a una red neuronal, para obtener el comportamientodel sistema de generación fotovoltaica.

La validación del modelo y el análisis de desempeño en la red neuronal, se realizará a través dela comparación entre datos estimados y datos medidos. Los parámetros RMSE y MAPE son lasherramientas más usadas en muchos trabajos para evaluar el desempeño de redes para estimación.

6

Page 23: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Datos

validados

Infoüüüü

Sistema

experimental

Preprocesado

de información

Es mación

• Modelo de regresión

• RNA para es!mación

t

w

Previsión

• Time series / Proyección

• RNA (previsión a corto plazo)

t

w

Figura 1.6: Obtención de estimación y previsión de los datos a través de herramientas estadísticas yredes neuronales artificiales.

7

Page 24: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Capítulo 2

Introducción a las redesneuronales artificiales

Antes de definir que es una red neuronal artificial (RNA) es necesario comprender que es la inte-ligencia artificial, que a su vez depende de la propia definición acerca de ¿que es la inteligencia?. Lainteligencia es definida en muchos trabajos como “la habilidad de aprendizaje y toma de decisiones, quellegan a una solución ante situaciones de problema” [35, 36], en otras palabras la inteligencia es unacapacidad de encontrar respuestas o soluciones. Contrastando este concepto, la inteligencia artificial ointeligencia computacional, tiene diferentes definiciones que varía entre autores, si solo se toma la ideacentral, se puede concluir que se define como “la habilidad de imitar la percepción, el razonamiento yla toma de decisiones de la mente humana” [37, 38, 39].

Existen diferentes áreas de la inteligencia artificial que pueden ser aplicados en diferentes casos, porejemplo la capacidad de moverse o interactuar con objetos físicos, corresponde al campo de la robótica,la capacidad de percepción tiene que ver con visión (reconocimiento de imágenes) [40], existe tambiénla capacidad de interpretación del lenguaje natural, ya sea en reconocimiento de voz, o en generaciónde texto. Como se muestra la Figura 4.2 todas estas capacidades y muchas otras forman parte delmundo de la inteligencia artificial, sin embargo existe otra capacidad que tiene que ser considerada, yes la capacidad de aprender.

Partiendo de este punto que se define el concepto de aprendizaje máquina (Machine Learning), elcual consiste en dotar a las máquinas la capacidad de imitar el aprendizaje y con ello tomas nuevasdecisiones. Existen diferentes formas de aprendizaje dentro del Machine Learnin como se aprecia enla figura 2.1(b), los más conocidos van desde métodos de clusterización (vecinos cercanos), árboles dedecisión, modelos de regresión y redes neuronales artificiales, que están adquiriendo popularidad en losúltimos años.

Es entonces que con las bases antes mencionadas, se puede concluir que las redes neuronalesson una técnica de Machine learning que proporciona la capacidad de aprendizaje a la inteligenciaartificial.

8

Page 25: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Robó�ca

Reconocimiento

de imagen

Voz

Machine

Learning

Inteligencia

ar�ficial

Lenguaje

natural

(a) Campos de la inteligencia artificial.

Machine Learning

Árbol de decisión

Cluster(K-means) Regresión

lineal

Clasificación

Redes neuronales

Σ F(x)

(b) Técnicas de Machine Learning.

Figura 2.1: Figuras de las áreas de la inteligencia artificial y sus correspondientes subáreas.

2.1 Aplicaciones de las redes neuronales

Actualmente las redes neuronales están adquiriendo popularidad en diferentes campos de trabajorelacionados con la ingeniería y la ciencia. Se menciona en [41] que las redes neuronales pueden seraplicadas como:

Aproximador universal de funciones. Generalmente estas aplicaciones van más en función almapeo, o la búsqueda de la correlación entre variables de entrada y salida de un sistema a partirde un conjunto de datos conocidos, en la cual por medio de métodos convencionales es difícil deobtener.

Control de procesos. En este caso, las redes neuronales artificiales buscan encontrar las accionesde control, que permitan a un proceso mantener los estándares de calidad y de seguridad. Gene-ralmente este tipo de aplicaciones de control se encuentran en la industria, robótica, aeroespacial,en elevadores, entre otros.

Reconocimiento o clasificador de patrones. La tarea de esta aplicación, consiste en que a partirde un conjunto de datos muestra o medidos, identificar y colocar dentro de un conjunto de datospreviamente definidos, basándose en las características de la muestra, como se realiza en el casode reconocimiento de imagen, texto o voz.

El agrupamiento de datos también conocido como clusterización de datos, consiste en la clasifi-cación automática de datos, tomando como base las similitudes entre ellos.

Sistemas de previsión. Como su nombre lo dice, consiste en realizar previsiones de procesos, ba-sándose en un registro histórico del proceso. Generalmente este tipo de aplicaciones van enfocadosal realizar predicciones a condiciones ambientales, el comportamiento de la bolsa de valores oanálisis de mercado.

Optimización de procesos. Cuando los procesos requieren del cumplimiento de ciertas caracterís-ticas para asegurar que se cumplan los estándares de calidad, se implementa las redes neuronales

9

Page 26: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

artificiales para encontrar cuáles son los ajustes necesarios para llegar al resultado deseado, exis-ten diferentes tipos de optimización, que son a través de optimización dinámica (los ajustes serealizan durante todo el proceso), optimización por restricción (este se define desde el principiode todo el proceso) y optimización combinacional (que es una combinación de las dos anteriores,partiendo de restricciones definidas y realizar ajustes durante todo el proceso).

Memoria asociativa, que consiste en la recuperación de patrones de información, como puedeser recuperar información de imágenes, audio, señales los cuales pudieran haber sufrido algunapérdida durante la transición de algún medio.

2.2 Principio de funcionamiento

Las redes neuronales artificiales (RNA) son técnicas que buscan emular el comportamiento delcerebro humano y generar respuestas para toma de decisiones [42].

Un ejemplo de una neurona biológica es mostrada en la 2.2(a). Las principales partes de una neuronason, el cuerpo de la neurona, que contiene al núcleo, nucleolo y ramificaciones que se conocen comodentritas. El axón es la ramificación más larga que posee la neurona, por ella circulan los impulsoseléctricos de salida hasta unas estructuras llamadas “botones terminales”, al cuerpo de otras neuronas.La vaina de mielina rodea al axón, que funciona como aislante y favorece a que los impulsos eléctricosviajen largas distancias sin pérdidas. La interacción entre el axón y el cuerpo celular se conoce comosinapsis, el cual se realiza de la siguiente forma. La pared celular tiene un potencial ligeramentenegativo, cuando las neuronas de al rededor la excitan a través de los axones, el cual cambia supotencial de negativo a positivo y aparece un pico de voltaje, este pico viaja por el cuerpo celular y alo largo del axón hasta las terminales sinápticas, listo para excitar la pared celular de otra neurona.

Un modelo de RNA se basa en este mismo principio. La configuración más simple de una neurona sele conoce como perceptrón, la cual se aprecia en la Figura 2.2(b). Las entradas del perceptrón equivalena las dentritas de la neurona biológica, la sumatoria y la función de activación serían el equivalente elnúcleo, y finalmente la salida correspondería al axón de la neurona.

(a) Partes básicas de una neurona biológica.

Σ F(x)

Bias

Entrada 1

Entrada n

Salida

Elemento de cómputo

Pesos

Unión de suma

Función de ac�vación

(b) Partes básicas de una neurona artificial.

Figura 2.2: Figuras comparativas entre modelo biológico y modelo matemático de una neurona [43].

En un perceptrón las señales de entrada son multiplicadas por valores conocidos como pesos si-nápticos que tienen la función de modificar la influencia de estos en la neurona. Los resultados de losproductos, son sumados y pasados por una función de activación que puede ser una función sigmoidelogística como en (2.1) o tangente hiperbólica como en (2.2), sus representaciones gráficas son apre-ciadas en la Figura 2.3(a) y la Figura 2.3(b) respectivamente. Este flujo de información entrada-salida

10

Page 27: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

es conocido como Feed Fordward.

f(x) = 11 + e−αx (2.1)

f(x) = e2x − 1e2x + 1 (2.2)

-6 -4 -2 0 2 4 6

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

(a) Función de activación sigmoide logística.

-6 -4 -2 0 2 4 6

-1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

(b) Función de activación tangente hiperbólica.

Figura 2.3: Funciones de activación más usadas dentro de las redes neuronales.

El Feed Fordward puede ser explicado como una función matemática, en (2.3) explica que unperceptrón es una función matemática que realiza la sumatoria de la multiplicación de las entradasxi por los pesos wi más un bias (b). La ponderación de las entradas viene dada por el peso que seles asigna a cada una de las conexiones de entrada; es decir cada conexión que llega a la neuronatendrá asociado un valor que servirá para definir con que intensidad cada variable de la neurona afectaa la entrada haciendo que este valor pueda tomar valores positivos o negativos. El resultado de estasumatoria es aplicado a una función de activación f(x) que da como resultado un valor a la salida.

Salida = f

(n∑i=1

(wi ∗ xi + b))

(2.3)

Salida = f

(n∑i=1

(w1x1 + w2x2 + w3x3 + ...wnxn + b))

Un perceptrón (también conocido como “elemento de cálculo”) como se muestra en la figura 2.4,lo que hace desde un punto de vista gráfico, es crear una superficie de decisión lineal.

Un ejemplo clásico que sirve para mostrar como es el funcionamiento de un perceptrón, es el replicarel comportamiento de una compuerta AND.

Los valores de la Tabla 2.1, son usados como información de entrada para entrenar al perceptrón,como se aprecia en la Figura 2.5, los puntos correspondientes a valores en bajo, son representados conmarcas en “x” y los valores en alto son representados con marcas “o”. Se aprecia claramente que elperceptrón es capaz de separar los dos grupos sin problemas.

11

Page 28: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Σ F(x)

Bias

Entrada 1

Entrada 2

Salida

Pesos

Unión de suma

Función de ac!vación

X1

X2 Y1

X3

Elemento de cómputo

Elemento de

cómputo

Figura 2.4: Equivalente gráfico de un perceptrón.

Tabla 2.1: Valores de salida de una compuerta lógica AND.

Entrada 1 Entrada 2 Salida0 0 00 1 01 0 01 1 1

X1

X2

Y1

(a) Red neuronal de un solo per-ceptrón.

-0.5 0 0.5 1 1.5

-0.5

0

0.5

1

1.5

(b) Gráfica de salida de la red neuronal.

Figura 2.5: Configuración de una red neuronal básica de un solo elemento, y los datos correspondientesa una compuerta AND.

Sin embargo, un perceptrón posee limitaciones que no permite que sea aplicado a cualquier tipo deproblema, como ejemplo se utiliza el comportamiento de una compuerta XNOR, donde sus valorescorrespondientes son mostrados en la Tabla 2.2.

Tabla 2.2: Valores de salida de una compuerta lógica XNOR.

Entrada 1 Entrada 2 Salida0 0 10 1 01 0 01 1 1

Por el tipo de distribución que posee estos puntos de salida, se requiere más de una superficie dedecisión. Por lo que la solución para este problema, se implementan dos perceptrón, tal como se apreciaen la Figura 2.6.

12

Page 29: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

X1

X2

Y1

Y2

(a) Red neuronal con dos percep-trón.

-0.5 0 0.5 1 1.5

-0.5

0

0.5

1

1.5

(b) Gráfica de salida de la red neuronal.

Figura 2.6: Configuración de una red neuronal con dos perceptrón para un conjunto de datos corres-pondiente a una compuerta XNOR.

Es a partir de este punto que se llega a las configuraciones de redes perceptrón multicapa (Multi-Layer Perceptron, MLP), que son combinaciones de neuronas tipo perceptrón que se encuentras orga-nizadas en capas, operan en paralelo y se encuentran totalmente conectadas, como se ejemplifica en laFigura 2.7. Cada uno de estos elementos de cómputo es capaz de generar una superficie de decisión,por lo que dependiendo de la cantidad de elementos de cómputo en cada capa, el número de capas, yla forma en como estén conectados, la red adquiere ciertas características que pueden ser aplicados adiferentes tareas como clasificación, reconocimiento y previsión [20, 22, 23, 24].

Capa de

entrada

Capa

oculta

Capa de

salida

X1

X2

X3

X4

Y1

Y2

Figura 2.7: Configuración ejemplo de Perceptrón Multicapa 4:2:2.

Una nomenclatura muy recomendada por [41] para conocer cuál es la topología de una MLP, esa partir de la descripción del número de elementos de cómputo por cada una de las capas que estacompuesta la red, con una sola expresión. Tomando como ejemplo la Figura 2.7, la red está conformadapor cuatro elementos de cómputo en la primer capa, tres en la capa oculta y dos en la capa de salida,por lo que esto se puede representar de la siguiente forma 4:3:2. Para dejar más en claro cómo es queesta nomenclatura funciona, tomaremos otro ejemplo el cuál es 3:4:5:2, este significa que existe treselementos de cómputo en la primera capa, cuatro en la segunda capa, cinco en la tercera capa y dosen la ultima capa. Con esta información se puede deducir además que la red pose tres entradas deinformación, dos capas ocultas y dos salidas. El uso de esta nomenclatura reduce la descripción de lared a una sola expresión, ahorrando así el uso de describir con palabras cuál es la arquitectura de la

13

Page 30: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

red a usar.

El flujo de información inicia a partir del conjunto de datos que son colocados en la capa de entrada,la cuál fluye a la primera capa oculta a través de los pesos sinápticos, el resultado de la primer capaoculta fluye a la siguiente capa, repitiendo el proceso anterior hasta llegar a la capa de salida. Esteproceso en el cuál el flujo va de entrada a salida es conocido como Feed Forward.

2.3 Entrenamiento

El error es definido como la diferencia que existe entre los valores estimados y el valor real, porlo que el objetivo de estudio principal en las redes neuronales es disminuir este nivel, a través delproceso llamado entrenamiento. Se conoce como entrenamiento al proceso de ajustar los valores delos pesos sinápticos, con la finalidad de disminuir el nivel de error y mejorar la respuesta de neurona.Para realizar el proceso de entrenamiento, se requiere de información previa o un conjunto de datos(Dataset), de los cuales del 100 % de datos, se recomienda usar el 70 % para entrenamiento, 20 % paravalidación, y 10 % para pruebas [41]. Dentro del campo de las redes neuronales artificiales, existe unatécnica que recibe el nombre de Retro-propragación (Back propagation), el cuál serán explicado másadelante, ya que se requiere conocer otros conceptos antes.

Descenso por gradiente

Un modelo posee parámetros que dependiendo del valor que estos tengan, el nivel de error variaráya sea en menor o mayor proporción. La función de coste, es aquella que explica cuál es el nivel deerror que se tiene, para cada una de las combinaciones de dichos parámetros. El descenso por gradiente(Gradient decent) es considerado como un algoritmo muy importante dentro del mundo del MachineLearning, ya que permite determinar cuál es el punto, o valor mínimo de la función de coste, en otraspalabras este algoritmo muestra con que combinación de parámetros se obtiene el menor error.

Con el objetivo de tener una idea más clara de cuál es la lógica de este algoritmo, se utiliza laFigura 2.8. El descenso por gradiente parte de un punto cualquiera en la función de coste, calcula lapendiente (derivada) en ese punto y avanza una cierta distancia siguiendo la dirección contraria a lapendiente calculada. En este nuevo punto el ciclo se repite hasta que se llegue a un valor de pendienteigual a 0 o se llega al punto mínimo de la función del error.

0 1 2 3 4 5 6 7

0

1

2

3

4

5

6

7

8

Mínimo

Local

Mínimo

Global

Figura 2.8: Búsqueda del mínimo global en una función de coste.

14

Page 31: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Back Propagation

El Back Propagation es una técnica muy específica que se basa en el descenso por gradiente aplicadoa las redes perceptrón multicapa. La idea básica, explicada en la literatura [44], es calcular de maneraeficiente las derivadas parciales de las funciones de aproximación de la red, con respecto a todos loselementos ajustables w (pesos) asociado a cada valor dado por x (salidas). La aproximación más simple,según [42] es usando la información proporcionada por el gradiente del error, para elegir al nuevo valorcon el que se actualiza los pesos, y con ello hacer pequeños avances en dirección negativa al gradiente,como se aprecia en (2.4).

∆w(t) = εδE

δw(t)+ α∆w(t−1) (2.4)

Donde el factor ε se conoce como la taza de aprendizaje (Learning Rate), el cual permite al algoritmoajustar la cantidad de desplazamiento en la función del error, para un valor de 0.5 disminuirá el valordel gradiente en un 50 %, para un valor mayor a 1 incrementará la velocidad de entrenamiento. Paraevitar que el entrenamiento caiga en un bucle infinito durante la búsqueda (debido a que el paso deentrenamiento se encuentre en un valor muy grande, tal que nunca llegue al mínimo de la función delerror) se hace uso de la variable conocida como momemtum (α) que da la posibilidad de decrementar demanera gradual el tamaño del paso de aprendizaje, asegurando de esta forma siempre llegar al mínimoglobal [45]. Por lo que valores muy altos, como valores muy bajos para ε y α pueden comprometer laconvergencia de la red.

Después de realizar la actualización de los pesos, el gradiente es revaluado y se repite el proceso. Lafunción del error depende del conjunto de entrenamiento con el que esté trabajando, por lo que en cadaciclo de entrenamiento se requiere realizar todo el proceso de cálculo nuevamente para determinar elvalor de E(wτ ). Esta técnica tiene la capacidad de realizar una serie de entrenamiento, usando todo elconjunto de datos (conocido como entrenamiento batch) o solo una cierta cantidad de ellos (conocidacomo entrenamiento on-line).

Sobreentrenamiento

Uno de los principales objetivos que se persigue con la implementación de una red neuronal artificial,es que este tenga la capacidad de resolver un problema, a partir de un conjunto de datos ya establecidos,los cuales a través de una serie de entrenamientos, sean capaz de obtener respuestas con bajo nivel deerror para nuevos valores de entrada, es decir, que tenga la capacidad de generalizar el problema.

Como se aprecia en la Figura 2.9, el conjunto de datos de entrenamiento tiene una distribuciónnatural, y la recta (que corresponde a las respuestas dadas por la red) tiende a ajustarse a esta seriede puntos, al ser “generalizada”, tendrá un cierto nivel de error para un nuevo conjunto de datos. Sinembargo, si a la red, se le incrementa el número de ciclos de entrenamiento, la respuesta de éste tenderáa ajustarse más al los puntos de entrenamiento, por lo que deja de “generalizar” el problema, comoconsecuencia al recibir un nuevo conjunto de datos, el error incrementa, este fenómeno se aprecia enla Figura 2.10 y recibe el nombre de sobreentrenamiento (Over Fiting.)

Existen diferentes criterios para evitar el sobreentrenamiento en una red. La primera y la másimportante es la aletorización de todo el conjunto de datos. Los criterios restantes son conocidos como“Criterios de pasada”, los cuales consisten en detener el algoritmo de entrenamiento si se llega a cumplircualquiera de las siguientes condiciones:

15

Page 32: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6

0

1

2

3

4

5

6

7

8

(a) Red neuronal con dos perceptrón.

1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6

0

1

2

3

4

5

6

7

8

(b) Gráfica de salida de la red neuronal.

Figura 2.9: Gráficas de puntos, con la recta de respuesta de la red sin sobreentrenamiento.

1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6

0

1

2

3

4

5

6

7

8

(a) sobreentrenamiento.

1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6

0

1

2

3

4

5

6

7

8

(b) sobreentrenamiento.

Figura 2.10: Gráficas de puntos, con la recta de respuesta de la red con sobreentrenamiento.

Tiempo, el cual una vez que el proceso de entrenamiento a cumplido con un límite de tiempoestablecido, detiene el ciclo de entrenamiento.

Ciclos de entrenamiento, el cual limita al entrenamiento a un número determinado de cálculos.

Nivel de error, detiene el entrenamiento cuando la red ha alcanzado un nivel de error deseado.

Considerando todos estos criterios, se asegura que la red no posea sobreentrenamiento, que tengaun nivel de generalización aceptable y en consecuencia un buen desempeño en la solución del problemaal que fue aplicado.

2.4 Conclusiones del capítulo

Las redes neuronales son algoritmos que tratan de imitar la resolución de problemas del cerebrohumano. Basándose en el principio básico de una neurona biológica, la cual a parir de estímulosexternos, produce una salida. Dependiendo del tipo de problema al que se quiera aplicar, la red neuronalpuede adquirir cierto nivel de complejidad, ya sea variando el número de capas ocultas o variando elnumero de neuronas en dichas capas. A pesar de que estas características son de suma importancia, el

16

Page 33: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

verdadero trabajo consiste en encontrar los valores de los pesos sinápticos de esta red. Existen diferentesmétodos para encontrar los valores ideales, pero el más usado actualmente debido a su eficiencia esel llamado Back Propagation el cuál básicamente proyecta el error a cada una de las neuronas y conella realiza los ajustes para disminuir en la medida de lo posible la diferencia que exista entre el valorestimado y el valor real, considerando que la red no pierta la capacidad de generalizar el problema ycon ello caiga en una situación de sobre-entrenamiento.

17

Page 34: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Capítulo 3

Panel Fotovoltaico

3.1 Introducción

Como se apreció en la imagen de la metodología en el Capítulo 1, el trabajo se centra en el estudiode los parámetro de operación de un panel solar, por lo que es importante conocer cuál es el principiode funcionamiento y cuáles son las características de salida que serán usadas para dar continuidad altrabajo. La energía solar fotovoltaica utiliza como fuente principal la radiación solar, que representauna de las fuentes de energía limpia más utilizadas a nivel global [28]. Produce electricidad de origenrenovable y sin emisiones. Para poder aprovechar la radiación solar, se recurre al uso de panelessolares, los cuales son dispositivos fabricados de material semiconductor que captan la radiación solary la convierte en energía eléctrica. El principio de funcionamiento es el efecto fotovoltaico por el quela energía lumínica produce cargas positiva y negativa en dos semiconductores próximos de diferentetipo, produciendo así un campo eléctrico capaz de generar una corriente. Los materiales más usadospara su fabricación son:

Silicio cristalino tiene una menor eficiencia.

Arseniuro de galio, es un material que posee una alta eficiencia de conversión, pero de costo muyalto.

Debido a que los paneles más comunes son fabricados con silicio cristalino, estos se dividen en tressubcategorías:

Células de silicio mono-cristalino.

Células de silicio poli-cristalino.

Células de silicio amorfo.

Cada categoría posee diferentes grados de eficiencia, y diferentes rangos de operación.

18

Page 35: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

3.2 Principios de funcionamiento

El funcionamiento de las celdas solares se basan en el efecto fotovoltaico, el donde se producecuando la radiación solar incide sobre dos materiales semiconductores convenientemente tratados [46].Los fotones de la luz transmiten su energía a los electrones de los materiales semiconductores por loque pueden romper la barrera de potencial de la unión p-n, y salir así del semiconductor a través delas terminales hacia un circuito exterior como se muestra en la Figura 3.1.

Material n

Voltaje

+

-

Campo

eléctrico

Material p+-

--

--

++ +

+

+

++ --

Figura 3.1: Efecto fotovoltaico en unión de materiales tipo p y tipo n.

Los pares electrón hueco o cargas positivas del semiconductor se dirigen a la terminal situada en elmaterial p, mientras que los electrones o cargas negativas del semiconductor se dirigen a la terminalcolocada en el material tipo n, creando así una diferencia de potencial en las terminales. Se apreciaque la celda fotovoltaica solo genera esa diferencia de potencial, cuando la energía lumínica incide enella. Estas celdas fotovoltaicas se pueden interconectar en diferentes configuraciones, sea para lograrun voltaje específico o una potencia deseada. Se denomina panel fotovoltaico al conjunto de celdasinterconectadas y montadas sobre un soporte, además de contar con recubrimientos que le protegende agentes atmosféricos[4].

El comportamiento eléctrico de los paneles solares depende directamente de las condiciones cli-matológicas y de la demanda energética que tenga en cada instante [14]. Las figuras conocidas comocurvas de potencia muestran cual es el comportamiento de los parámetros eléctricos de corriente yvoltaje. La Figura 3.2(b) muestran como se comporta corriente en función al voltaje, mientras que laFigura 3.2(a) muestra el perfil de potencia que el panel es capaz de entregar a la carga. Sin embargo,estas gráficas se obtienen bajo condiciones ideales de operación (iluminación y temperatura constante)y al estar operando en condiciones ambientales, estas curvas cambian de forma, y por ende cambia losniveles de eficiencia.

3.3 Adquisición de datos

Como se mencionó anteriormente, las curvas de potencia del panel, van en función a las condicionesde operación como son la temperatura y el nivel de iluminación, como se observó en el Capítulo 1 esnecesario conocer qué relación existe entre el comportamiento de la potencia y las condiciones deoperación, por lo que se necesita de una muestra de mediciones para determinar dicha relación. Es en

19

Page 36: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

0 5 10 15 20 25

Voltaje (v)

0

2

4

6

8

10

12

Pote

ncia

(m

W)

(a) Gráfica de potencia en un panel.

0 5 10 15 20 25

Voltaje (v)

0

200

400

600

800

1000

1200

Co

rrie

nte

(m

A)

(b) Curva de voltaje vs corriente de un panel.

Figura 3.2: Curvas características de un panel solar, utilizando variables como voltaje corriente ypotencia.

ese sentido que se necesita obtener datos de estas variables, por lo que la adquisición de los datos selleva a cabo a través de un prototipo desarrollado en el Instituto tecnológico de Morelia, a cargo delIngeniero Corona Ventura J. para conocer cómo es que este prototipo funciona, se dedica una partede esta sección en describir cuáles son las partes que conforman al sistema, cómo es que estas operany cómo se interconecta con el sistema fotovoltaico experimental.

3.3.1 Características del prototipo

El sistema se compone básicamente de tres placas de circuito impreso (Printed Circuit Board,PCB), de las cuales cada una desempeña una tarea en específico. Este dispositivo como se muestraen la Figura 3.3 fue diseñado y puesto en funcionamiento como parte de un proyecto de titulación deingeniería, para más detalles véase [1].

Figura 3.3: Esquema de prototipo para medición de variables [1].

La primera PCB de este sistema está conforma una placa de desarrollo de Texas Instrument(CC3200 launchpad) la cual tendrá múltiples funciones, como realizar la lectura de valores en lossensores, almacenar la información dentro de la memoria del dispositivo, establecer la conexióncon un punto de acceso (facilitando la comunicación con cualquier dispositivo que disponga de un

20

Page 37: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

navegador de Internet), proporcionar las mediciones recolectadas en un documento de formato“.csv” a través de una interfaz creada en el lenguaje html.

En la segunda placa se montan los componentes que se encargan de la medición de los parámetroseléctricos de corriente y voltaje en el panel fotovoltaico comformado por un unico componenteINA260, además de contar con el controlador de carga para una batería de iones de litio. Estabatería tiene una capacidad de almacenamiento de 2600mAh, por lo que tomando como consumomáximo del sistema (80mA), tendrá una autonomía de 4.3 días. Sin embargo, al combinar laalimentación con un pequeño panel solar (300mA), se puede decir que el sistema podría operarde manera indefinida. Esta PCB junto con la primera placa, van colocadas en la parte inferiordel panel solar.

La placa número tres es colocada en la parte frontal del panel solar y está conformada pordos componentes, el sensor de iluminación, y el sensor de humedad/temperatura. Estos sensoresmiden las variables del medio ambiental en la que el panel opera.

Para realizar el montaje de estas placas se utilizó un mecanismo tipo pinza, el cual fue diseñado eimpreso en 3D con ayuda del departamento de Ing Mecánica, tal y como se aprecia en la 3.4(a). Estemecanismo tiene la función de fijarse por uno de los extremos del panel solar, permitiendo así que elPCB que contiene los sensores de iluminación, humedad y temperatura, sean colocados en la partefrontal del panel, como se aprecia en la 3.4(b), y que el resto de PCB pueda ser montado en la parteposterior del panel fotovoltaico, tal y como se aprecia en la 3.4(c).

(a) Mecanismo tipo pinza para lafijación de los PCB.

(b) PCB colocado en la parte frontal paramedicion de iluminación, humedad y tempe-ratura.

(c) PCB colocado en la parte posterior paramedicion de parámetros en panel solar.

Figura 3.4: Prototipo para la medición de variables ambientales y de características eléctricas del panelsolar.

21

Page 38: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Al ser un prototipo desarrollado con fines de investigación académica, posee la desventaja de tenerlimitaciones con respecto al rango de mediciones de los sensores, las cuales serán mostradas en lasiguiente lista:

El sensor de iluminación (OPT3001) puede realizar mediciones desde los 0.01lux hasta los 83klux.Sin embargo con ayuda de un cristal que posee un nivel de atenuación del 40 %, el rango demedición se extiende hasta 188k lux.

La humedad relativa que puede ser medida con el sensor HDC2080, va desde el 0 % hasta el100 % con margen de error de ±0.2 %.

El rango de medición para la temperatura va desde −40◦C hasta 85◦C con un margen de errorde ±2◦C utilizando el mismo dispositivo usado anteriormente (HDC2080).

El componente de medición de voltaje (INA260) puede realizar mediciones de voltaje en el panel,el cual tiene un rango de medición que va desde 0V hasta 36V.

La corriente puede tener valores de medición desde los 0Amp hasta los 15Amp, que de igualforma puede ser medido con el componente anterior (INA260).

Para el desarrollo de este trabajo, se emplea un panel solar como el que se muestra en la Figura 3.5.La corriente de corto circuito que puede llegar a entregar es de 3000mA, mientras que el voltaje decircuito abierto es de 23.57V , por lo que operando en el punto de máxima potencia, es capaz de entregarhasta 15W .

Figura 3.5: Panel usado para ensamblar el sistema experimental y obtener mediciones.

3.3.2 Interfaz gráfica

Como lo explica J. Corona en la tesis [1], la interfaz fue diseñada con la finalidad de ser amigable conel usuario. La interfaz se divide en dos principales partes. La primera parte consiste en la colocación delos parámetros iniciales, como se aprecia en la Figura 3.6 y en la Figura 3.7, el panel está conformadopor las siguientes partes:

1. En esta casilla se selecciona el tiempo de muestreo de las mediciones en escala de segundos.

22

Page 39: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

2. Aquí se coloca el nombre del punto de acceso al que se quiere conectar.

3. Casilla para colocar la contraseña del punto de acceso.

4. Selección del tipo de cifrado que de la contraseña.

5. Se selecciona si se desea almacenar información previa de otras mediciones o no.

6. Botón para sincronización de la hora del dispositivo, con la hora de la computadora.

Figura 3.6: Primera interfaz gráfica y sus partes.

Figura 3.7: Segunda interfaz gráfica y sus partes.

7 Con los botones se puede generar un archivo con las mediciones que se tengan de ese día.

8 Esta sección despliega las mediciones que se tienen en ese mismo instante.

9 Cada uno de los botones corresponde a los respaldos realizados después de 288 mediciones, loscuales corresponden a las mediciones de 24 horas.

10 Este botón reinicia todo el sistema, generalmente se usa cuando ocurre algún error, y querequiera un reinicio general del sistema.

23

Page 40: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

3.4 Datos obtenidos del prototipo

Como se comenta en la tesis [1] las mediciones están estructuradas de manera que sean fácil demanipular y/o importar a tablas de cálculo, procesadores de texto o entornos de análisis de datos comoMatLab, Python o R-Studio. El archivo tiene formato “.csv” y usa una cabecera propia, cada elementoes separado con una coma simple. El archivo generado contiene 288 mediciones; siendo posible alma-cenar aproximadamente 115,200 mediciones. En la Tabla 3.1 se muestra un extracto de la estructuracon la que se entregan las mediciones del archivo.

Tabla 3.1: Información entregado por el sistema-IoT [1].

Luz(Lux) Temperatura(C) Humedad(%) Corriente(A) Voltaje(V) Potencia(W) Día Hora Minuto17213.44 31.00 41.00 00.34 14.84 005.12 9 15 719732.48 30.00 43.00 00.40 14.86 005.90 9 15 208158.72 28.00 44.00 00.17 14.73 002.47 9 14 5714530.56 30.00 43.00 00.29 14.80 004.35 9 14 5228026.88 32.00 41.00 00.55 14.95 008.20 9 14 4718508.80 30.00 44.00 00.37 14.85 005.56 9 14 4214504.96 29.00 44.00 00.29 14.81 004.33 9 14 3713184.00 29.00 44.00 00.26 14.80 003.92 9 14 3211407.36 28.00 46.00 00.23 14.77 003.38 9 14 2710286.08 30.00 45.00 00.20 14.75 002.97 9 14 2212328.96 32.00 37.00 00.23 14.78 003.47 9 14 1717889.28 33.00 37.00 00.33 14.83 004.88 9 14 1227013.12 34.00 37.00 00.48 14.91 007.12 9 14 723674.88 33.00 38.00 00.41 14.88 006.16 9 14 221831.68 34.00 35.00 00.37 14.85 005.49 9 13 5735819.52 39.00 27.00 00.56 14.96 008.40 9 13 5240304.64 37.00 29.00 00.61 14.98 009.10 9 13 4739792.64 41.00 26.00 00.60 14.98 008.99 9 13 4239792.64 41.00 25.00 00.61 14.98 009.06 9 13 37

3.5 Conclusiones de capítulo

Actualmente los sistemas fotovoltaicos son una de las mejores opciones en cuanto a energías reno-vables se refiere. Debido a su rápida respuesta ante cambios de radiación, este sistema puede llegara crear cierta inestabilidad en el sistema eléctrico. Conocer como se relacionan estos cambios en lascondiciones de operación y el desempeño del panel fotovoltaico ayudará a conocer de mejor maneracomo se comportará el perfil de generación eléctrica. Un sistema de monitoreo basado en el Internetde las cosas mejora en gran parte la forma en que se adquiere la información, ya que las medicionesde las variables ambientales y eléctricas se realiza de manera automatizada, al igual que la generaciónde reportes. Esto mejora la disponibilidad de la información recabada, ayudando a realizar diferentesestudios.

24

Page 41: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Capítulo 4

Estadística aplicada al análisisde datos

4.1 Principios básicos

La estadística es la ciencia que tiene sus bases en la fuerte presencia y acción de las matemáticasy que principalmente se ocupa de la recolección análisis e interpretación de datos que buscan explicarlas condiciones en aquellos fenómenos de tipo aleatorio [47].

Una de las características más importantes de la estadística es que puede ser funcional en unaamplia variedad de disciplinas, las cuales aprovechan las herramientas que ésta da para entender y darrespuesta a ciertos objetos de estudio.

El área de estadística, se basa en el estudio de datos, los cuales son hechos o valores que pertenecena un fenómeno especifico, estos valores recabados se conocen como banco de información o conjunto dedatos, los cuales al provenir de una variable en especifico, adoptan el nombre de observación. Mediantetécnicas que se explican más adelante, se pueden realizar afirmaciones o inferencias del grupo, conjuntoo población que se esté estudiando. En algunas ocasiones los datos necesarios para alguna aplicación enparticular no están disponibles a través de las fuentes existentes de información. En estos casos se suelenobtener la información mediante estudios estadísticos los cuales se pueden clasificar en experimentalesu observacionales. En un estudio experimental se identifica primero la variable de interés, luego setoman una o más variables y se controlan las variaciones para obtener datos de cómo influyen en lavariable de interés. Los estudios estadísticos no experimentales u observacionales de ninguna maneraintentan controlar las variables de interés, solamente recaban la información de las variables que sedesea estudiar.

Hacer uso de fuentes existentes de información, reduce los tiempos de estimación. Si los datos nose pueden recabar con facilidad de una fuente existente, debe tomarse el tiempo y el costo adicionalesinvolucrados en su obtención. En todos los casos, quien toma decisiones debe considerar la contribucióndel análisis estadístico al proceso de toma de decisiones [47].

25

Page 42: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

4.2 Estadística inferencial

Una distribución de probabilidad de una variable que representa una cierta característica de unapoblación se define completamente cuando se conocen sus parámetros, pero cuando estos no se conocen,será necesario estimarlos con base a datos muestrales para hacer inferencias sobre la población. Porejemplo, los parámetros de una distribución normal son la media µ, y la desviación estándar σ, que encaso de no conocerse será necesario estimarlos a partir de los datos en la muestra. Existen dos tiposde estimaciones: puntual y por intervalos. Estos estimadores puntuales no son del todo confiables, yaque desde el punto de vista estadístico, toda aproximación que se realiza a partir de una proporciónconlleva un grado de variación natural que no puede ser representada [48].

4.2.1 Estimación puntual

Un estimador puntual de un parámetros desconocido es un estadístico que genera un valor numéricosimple, que se utiliza para hacer una estimación del valor del parámetros desconocido. Por ejemplo,tresparametros sobre los que con frecuencia se desea hacer inferencia son:

La media µ del proceso (población).

La varianza σ2 o la desviación estandar σ del proceso.

La proporción p de elementos que tienen cierta característica

4.2.2 Estimación por intervalos

La estimación puntual de un parámetro se genera a través de un estadístico, y como el calor de éstees aleatorio porque depende de los elementos que fueron seleccionados de la muestra, por lo que conllevaa un cierto nivel de variación. Por ello es necesario saber que tan precisa es la estimación puntual,por lo que es necesario realizar estimación por intervalos, los cuales permite hacer deduccionesconsiderando dicha variabilidad, esta variabilidad se determina como la diferencia del dato estimado yel dato real. A esto se le conoce también como error de estimación. Al considerar la existencia de esteerror en las estimaciones es importante determinar cuál será el grado en el que se desea cometer esteerror. En el campo de la estadística se maneja tres niveles de error:

Intervalo del 90 % que va enfocado a fenómenos sociales donde hay variación ya que solamentese realiza percepciones de la población.

Intervalo del 95 % para fenómenos industriales o naturales donde no se pone en riesgo a ningúnser vivo.

Intervalo del 99 % para procesos o fenómenos donde se involucra el bienestar de algún ser vivo,como puede ser el área de medicina, equipamiento medico, sistemas de seguridad, etc.

En resumen la estimación por intervalos permite determinar bajo un cierto nivel de confianza, cuáles la probabilidad de que la estimaciones realizadas se encuentren dentro de un nivel de probabilidadaceptable.

26

Page 43: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

4.3 Diagramas de dispersión

Para conocer de manera gráfica el comportamiento o la relación de los datos, se hace uso dediagramas de dispersión, la cuál tomando los datos de diferentes variables, se grafican y se obtieneuna nube de puntos, por lo que el interés principal consiste en representar esa nube de puntos con unmodelo de regresión lineal. Existen diferentes tipos de relación, cuando en un conjunto de datos, lavariable x incrementa el valor y la variable y incrementa de la misma manera, se dice que existe unarelación directa, como se aprecia en la Figura 4.1(a), caso contrario, cuando la variable x incrementa,pero la variable y disminuye, se dice que existe una relación inversa, como se aprecia en la Figura4.1(b). También se puede dar el caso en que la variable x incrementa o disminuye su valor, y la variabley se mantiene constante, es ahí donde se determina que no hay relación entre las variables, como seaprecia en la Figura 4.1(c).

1 2 3 4 5 6 7 8 9 10

1

1.5

2

2.5

3

3.5

4

4.5

(a) Dispreción de puntos con relación directa.

1 2 3 4 5 6 7 8 9 10

1

1.5

2

2.5

3

3.5

4

4.5

(b) Dispreción de puntos con relación inversa.

1 2 3 4 5 6 7 8 9 10

2

2.1

2.2

2.3

2.4

2.5

2.6

2.7

2.8

2.9

(c) Dispreción de puntos sin relación alguna.

Figura 4.1: Tipos de relaciones que existen en dispersión de datos.

4.4 Regresión Lineal Simple

Dentro del tema de regresión lineal, se considera que la variable es una característica aleatoria de lapoblación, la cual es un parámetro estadístico. La regresión lineal se encarga de estudiar la existencia deuna relación que sea de causa y efecto entre una variable natural con respecto a otra variable natural.Donde a la variable natural de causa, es llamada variable independiente, y a la variable natural deefecto, es llamada variable dependiente. El objetivo principal es poder modelar matemáticamenteesa relación, por lo que el modelo de regresión permitirá encontrar bajo qué condiciones, la variable

27

Page 44: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

dependiente x, está en función de la variable independiente y, como se define en la Ecuación 4.1.

y = f(x) (4.1)

donde y es la variable independiente y x es la variable dependiente.

Dentro de las relaciones más sencillas que existen entre dos variables dentro de un plano (x,y), estála figura más simple que tiene la geometría, la recta. Esta figura está representada por la (4.2).

y = mx+ b (4.2)

dondem es la pendiente y b es la ordenada en la abscisa (el punto donde cruza al eje de las x). Tomandoel concepto de la ecuación de la recta como base, lo que se desea es encontrar si existe una relaciónlineal entre la variable dependiente y la variable independiente. Es decir, si la relación que existe, sepuede ejemplificar con la ecuación de la recta. Sin embargo si esto se traduce a un modelo generalcomo el que se muestra en la Ecuación 4.4, dentro del campo de la estadística, siempre se tiene queconsiderar que existe un error en cualquier estimación. Dicha ecuación es conocida como modelo deregresión lineal, el cual establece cuál es la relación que existe entre la variable de causa y la variablede efecto, considerando la variabilidad natural (o error) que existe.

Por lo tanto la metodología a seguir si se desea conocer si existe alguna relación en un conjuntode datos o una población, se necesita que a partir de una muestra de datos, obtener la ecuación deestimación (4.3) para poder obtener el modelo de regresión (4.4), el cual permitirá realizar inferenciasen el grupo o en la población, así como determinar si existe la relación lineal planteada.

yi = b0 + b1xi (4.3)

donde:

yi = valor estimado.

b0 = intersección de la recta de regresión estimada con el eje y.

b1 = pendiente de la recta de regresión estimada.

xi = tamaño de la población o del conjunto de datos.

y = β0 + β1x+ Error (4.4)

Antes de llegar a la ecuación de regresión, es necesario determinar o aproximar lo mejor posible laecuación de estimación a los datos observados. Esta aproximación se logra cuando la diferencia entrelos datos observados y los datos estimados, sea pequeños. Para poder determinar los parámetros de laecuación de estimación, se recurre al método de mínimos cuadrados, que usa los datos muestrales paraobtener los valores de b0 y b1 que minimicen la suma de los cuadrados de las desviaciones (diferen-cias) entre los valores observados de la variable dependiente yi y los valores estimados de la variabledependiente yi. El criterio que se emplea en el método de mínimos cuadrados se basa en la expresión:

min∑

(yi − yi)2 (4.5)

donde

28

Page 45: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

yi = valor observado de la variable dependiente.

yi = valor estimado de la variable dependiente.

Los valores de b0 y b1 que minimicen la expresión en la Ecuación 4.5 se pueden encontrar usandola Ecuación 4.6 y la Ecuación 4.7.

b1 =∑

(xi − x)− (yi − y)∑(xi − x)2 (4.6)

bo = y − b1x (4.7)

donde:

xi = valor de la variable independiente de la observación.

yi = valor de la variable dependiente en la observación.

x = media de la variable independiente.

y = media de la variable dependiente.

n = número total de observaciones.

x error x,y

Conjunto poblacional

de datos

Muestra de

datosEcuación de

es!maciónModelo de regresión

Figura 4.2: Campos de la inteligencia artificial.

El método de mínimos cuadrados proporciona una ecuación de regresión estimada que minimiza lasuma de los cuadrados de las desviaciones entre los valores observados de la variable dependiente yi ylos valores estimados de la variable dependiente yi. El criterio de mínimos cuadrados permite elegir laecuación de mejor ajuste.

4.5 Coeficiente de determinación y de correlación

Ya que se tiene de forma conocida la manera de determinar el modelo de regresión, es necesariodeterminar qué tan bien se ajusta los datos de la ecuación al fenómeno estudiado. Existe un parámetroque proporciona una medida de la bondad de ajuste para la ecuación, y recibe el nombre de coeficientede determinación.

La diferencia que existe entre la variable dependiente y la variable independiente se le llama residual.La suma de los cuadrados de estos residuales, es la cantidad que se minimiza empleando el método

29

Page 46: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

de mínimos cuadrados. Esta cantidad también es conocida como Suma de Cuadrados debido al Error(SCE) y queda expresado en la Ecuación 4.8.

SCE =∑

(yi − yi)2 (4.8)

El valor de la SCE es una medida del error al utilizar la ecuación de regresión estimada para calcularlos valores de la variable dependiente de la muestra. Para conocer el nivel de error total, se recurre a lallamada Suma Total de Cuadrados, y se denota como STC, la Ecuación 4.9 representa esta expresión.

STC =∑

(yi − y)2 (4.9)

Se puede entender la STC como una medida de cuánto se agrupan las observaciones en torno a lalínea y, y la SCE como una medida de cuánto se agrupan las observaciones en torno de la recta y. Paramedir cuánto se desvían de y los valores y en la recta de regresión, se calcula otra suma de cuadrados,la cual se llama Suma de Cuadrados debido a la Regresión y se denota como SCR en la Ecuación 4.10.

SCR =∑

(yi − y)2 (4.10)

Utilizando las tres sumas de cuadrados (STC, SCR y SCE) es posible obtener una medida debondad de ajuste de la ecuación de regresión estimada.

Suponiendo que todos los valores de la variable dependiente yi se ubicaran sobre la recta de laecuación de estimación, aplicando la formula (4.8) entregaría un valor de 0. Como STC=SCR+SCE,se observa que para que haya un ajuste perfecto, SCR debe ser igual a STC, y el cociente (SCR/STC)debe ser igual a 1. Cuando los ajustes son malos, se tendrán valores altos para SCE. Si de la relaciónantes planteada se despeja SCE, se tiene que SCE=STC-SCR. Por consiguiente, el valor más grande deSCE (y por tanto el ajuste más pobre) se presenta cuando SCR=0 y SCE=STC. El cociente SCR/STC,que puede tomar valores entre 0 y 1, se usa para evaluar la bondad de ajuste de la ecuación de regresiónestimada. A este cociente se le llama coeficiente de determinación y se expresa como r2.

r2 = SCR

SCT(4.11)

Donde un valor de 1 significa un ajuste del 100 % por parte de la ecuación de estimación hacia larespuesta del fenómeno a estudiar.

El nivel de correlación de pearson evalúa la relación lineal que existe entre dos variables continuas.El valor de esta correlación puede variar entre valores de +1 y -1, donde un valor positivo correspondea una relación directa positiva, es decir que si una variable incrementa su valor de manera positiva, lavariable de salida incrementara de la misma forma, caso contrario cuando existe una relación negativa,quiere decir que cuando la variable de entrada incrementa su valor, la variable de salida disminuirá deigual forma.

rxy = (±b1)√r2 (4.12)

donde:

b1 = pendiente de la ecuación de regresión estimada y = b0 + b1x

30

Page 47: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

El signo del coeficiente de correlación es positivo si la ecuación de regresión estimada tiene pendientepositiva (b1 > 0), y es negativo si la ecuación de regresión estimada tiene pendiente negativa (bl < 0).

El primer estadístico provee una medida entre 0 y 1, mientras que el segundo proporciona unamedida entre 1 y -1. Aunque el coeficiente de correlación está restringido a la relación lineal entre dosvariables, el coeficiente de determinación puede emplearse para relaciones no lineales y para otras enlas que hay dos o más variables independientes. Por tanto, ofrece un rango de aplicación más amplio.

4.6 Prueba de hipótesis e intervalo de confianza

Las pruebas de hipótesis consisten en hacer un supuesto tentativo acerca de algún parámetrode la población a estudiar, la cual debe ser rechazada o no. Estos supuestos tentativos se les llamahipótesis nula, y es representada por H0. Después se define una segunda hipótesis que se conoce comohipótesis alternativa, y que contradice lo que explica la hipótesis nula y esta se denota como Ha

[49]. El planteamiento de estas hipótesis es de suma importancia ya que dependiendo del resultadoobtenido, el investigador deberá tomar alguna decisión con base a estas hipótesis. Las aplicaciones dehipótesis requieren de levantamiento de muestras para obtener resultados maestrales que ayudaránobtener evidencias y de esta forma emitir conclusiones. Tomando como ejemplo a una de las variablesestudiadas en éste trabajo como la temperatura, la cual se dice que la variación de temperatura afecta aldesempeño de un panel fotovoltaico, de esta información se puede tener la hipótesis de que la variaciónde la temperatura, afecta a la potencia de salida, es decir:

H0 = µ(temp)± µ(W ) (4.13)

Pero también existe el supuesto de que la variación de temperatura afecta la producción de potenciade un panel solar, lo cual queda expresado en la siguiente expresión.

Ha = µ(temp) = µ(W ) (4.14)

Con la búsqueda de los resultados muestrales, los investigadores pueden llegar a la conclusión de siefectivamente la variación afecta o no a la generación de potencia. Si los resultados muestrales entreganevidencia para rechazar la hipótesis alternativa, por lo que la variación de la temperatura afecta a lavariación de la potencia generada, caso contrario, si no se obtiene evidencia estadística para rechazar lahipótesis alternativa se concluye que entonces la variación de la temperatura no afecta a la generaciónde potencia.

Como este método de pruebas se basa en una información maestral, debe considerarse que siempreexiste la posibilidad de error. El primer tipo de error ocurre cuando H0 es aceptada. Si H0 es verdadera,la conclusión es correcta. Pero si Ha es verdadera, se comete un error tipo II; es decir, H0 es aceptadacuando es falsa. El segunto tipo de error ocurre si la conclusión es rechazar H0. Si H0 es verdadera,se comete un error tipo I; es decir, H0 es rechazada cuando es verdadera. Pero si Ha es verdadera, escorrecto rechazarH0. A la probabilidad de cometer un error tipo I cuando la hipótesis nula es verdaderase le conoce como nivel de significancia, el cual se denota con la letra griega α. Generalmente estevalor puede adoptar valores que van desde 0.05 hasta 0.01 y este valor dependerá del intervalo deconfianza que sea elijo. Los intervalos de confianza es el nivel o la probabilidad de que los datosestimados pertenecen al conjunto de datos que permitan realizar aseveraciones en la población.

31

Page 48: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

4.7 Conclusiones del capítulo

La estadística permite conocer cómo se comporta un fenómeno, un proceso o una población a partirde una muestra de datos, considerando que implícitamente existe un error que puede estar desde quese realiza la captura de datos, cuando se realiza las estimaciones y cuando se obtiene el modelo queexplica el objeto de estudio. Sin embargo, lo que hace que la estadística sea interesante, es que puededar respuestas, considerando margenes de error, lo cual puede ser muy útil en el momento de tomardecisiones o llegar a conclusiones acerca de cómo se comporta un fenómeno o una población. De losmétodos más recomendados en la literatura, destaca la regresión lineal, ya que al tomar como basea la ecuación de la recta, permite obtener estimaciones de manera rápida y sencilla. El modelo deregresión describe cuál es el comportamiento del fenómeno bajo ciertas condiciones, sin dejar de ladoel nivel de error que puede existir en dichas aproximaciones. El nivel de error va relacionado conel tamaño de la muestra, ya que al tener mayor información, permite tener más conocimiento de lapoblación y por ende, tener mejores aproximaciones, Por lo que se puede concluir que para tener unamejor aproximación de un fenómeno, la calidad de la información, y el tamaño de la muestra, serándeterminantes para obtener inferencias con el menor nivel de error, y con ello, a una correcta toma dedecisiones.

32

Page 49: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Capítulo 5

Desarrollo y Resultados

5.1 Introducción

En este capítulo se mostrará en cuál es el proceso de validación de datos, análisis de correlacióny error del conjunto de datos entregado por el prototipo de medición desarrollado. Seguido de cualesfueron los criterios a seguir para la creación de los conjuntos de datos para realizar los entrenamientoscon las redes neuronales como se aprecia en la Figura 5.1.

Datos

Info

üüüü

Conjuntos de

entrenamiento

5 min.

üüüü

10 min.

üüüü

Promedio

üüüü

Validación de datos

• Análisis visual

• Correlación

• ANOVA (Modelo

de regresión)

Criterios de diseño

• Organización

Aleatoria

• Elementos previos

• 2 ~ 9 elementos

• Distribución de los

datos

• 5 minutos

• 10 minutos

• Promediado

Figura 5.1: Metodología para la creación del conjunto de datos para el entrenamiento de redes neuro-nales.

El objetivo principal es la de crear una base de datos que servirá como información de entradapara una red neuronal. El prototipo entrega un conjunto de datos que corresponden a las variablesmedidas durante un periodo de 24 horas, con una frecuencia de muestreo de 5 minutos. Para poder

33

Page 50: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

obtener estas mediciones, el panel solar se colocó en el exterior del edificio de posgrado, las terminalesde salida son conectados a una etapa del prototipo y finalmente la salida del prototipo es conectada auna carga electrónica en modo voltaje constante (CV) con un nivel programado de 14.3v, este nivel esobtenido de la gráfica de máxima potencia mostrado en el capítulo 3. El modo de operación de CV enla carga electrónica se eligió ya que esta no demanda corriente al panel hasta que el nivel de voltajealcance un nivel de voltaje mínimo programado. Las mediciones son almacenadas en formato “.csv”,que da la posibilidad de exportar la información a otras plataformas. Para este trabajo, se utiliza elsoftware MATLAB 2016B para realizar el tratamiento de todas las mediciones.

Finalmente con el conjunto de datos de entrenamiento y a través de la experimentación, se deter-minará la cantidad de ciclos de entrenamiento que son necesarios, el número de elementos previos paraobtener una mejor estimación, y la topología necesaria de la red neuronal como se puede apreciar enla Figura 5.2. A través del análisis del error, se evalúa el desempeño de cada red y con ello determi-nar cuáles son las características ideales para realizar estimaciones a corto-mediano plazo del sistemafotovoltaico estudiado.

Conjunto

Infoüüüü

Experimentación

• Ciclos de

entrenamiento

• Elementos previos

al es!mado

• Can!dad de:

• Neuronas

• Capas ocultas

Entrenamiento(Con criterios)

Criterios de desempeño

• Error RMSE

• Análisis MAPE

Figura 5.2: Metodología para la aplicación de redes neuronales con el conjunto de datos definido.

5.1.1 Gráfica de datos

Con la finalidad de conocer cómo se comportan las mediciones realizadas por el prototipo, seprocede a graficar cada una de las variables de operación del panel solar, las cuales son:

Iluminación, la cual es medida en luxes (Lux).

Humedad, la cual se mide en porcentaje de humedad relativa (%).

Temperatura y utiliza la unidad de medida de grados Celsius (oC).

Corriente en miliamperes (mA).

Voltaje que utiliza la unidad de medida en volts (v).

Potencia que es medida en watts(W).

34

Page 51: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Las mediciones realizadas para la variable iluminación muestran que existen lecturas de de 80kLuxcomo se aprecia en la Figura 5.3, y que las mediciones en 0 lux, corresponden a las mediciones realizadasdurante la noche.

500 1000 1500 2000 2500 3000 3500 4000

Mediciones

0

1

2

3

4

5

6

7

8

9

Ilum

inac

ion

(Lu

x)

10 4

Figura 5.3: Muestra de mediciones en iluminación correspondiente a 13 días.

Del mismo modo, para las mediciones de la variable temperatura, como en la Figura 5.4 se observaun comportamiento parecido con la variable de iluminación. Se puede observar que al incrementar elnivel de iluminación, la temperatura también incrementará, y caso contrario, cuando la iluminacióndisminuye su valor, la temperatura también disminuye, pero sin llegar a 0.

500 1000 1500 2000 2500 3000 3500 4000

Mediciones

0

5

10

15

20

25

30

35

40

45

Te

mp

era

tura

(°c

)

Figura 5.4: Mediciones de temperatura correspondiente a 13 días.

Analizando la Figura 5.5 del comportamiento de la variable humedad, se aprecia que los valoresmás altos de humedad, se alcanzan durante el periodo nocturno, y estos disminuyen durante el día.También se observa que el nivel de humedad disminuye cuando la temperatura incrementa. Para estecaso, se aprecia que existen mediciones que llegan abruptamente a valores de 0 % de humedad, ademásde existir largos periodos con valores del 100 %. Este tipo de mediciones puede deberse a un problemacon el dispositivo de medición, que puede ser consecuencia de una mala colocación en el panel solar yque esté provocando una acumulación de humedad, o por algún error en el bus de comunicación.

Para la gráfica del comportamiento del voltaje en el panel mostrado en la Figura 5.6, se observaque el nivel máximo de voltaje se da cuando hay presencia de iluminación (cuando es de día). El

35

Page 52: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

500 1000 1500 2000 2500 3000 3500 4000

Mediciones

0

10

20

30

40

50

60

70

80

90

100

Hu

me

da

d r

ela

tic

a (

%)

Figura 5.5: Mediciones de temperatura correspondiente a 13 días.

nivel máximo alcanzado corresponde a un nivel de 14.3v, ya que como se mencionó anteriormente,corresponde al nivel de voltaje programado en la carga electrónica.

500 1000 1500 2000 2500 3000 3500 4000

Mediciones

0

2

4

6

8

10

12

14

16

Vo

lta

je (

V)

Figura 5.6: Voltaje medido en un periodo de 13 días.

La gráfica de corriente posee un comportamiento muy aproximado al de nivel de iluminación, estodebido a que a mayor nivel de iluminación tenga el panel, mayor será el nivel de corriente que se puedeobtener, este comportamiento se puede apreciar de mejor manera en la Figura 5.7.

36

Page 53: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

500 1000 1500 2000 2500 3000 3500 4000

Mediciones

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

Co

rrie

nte

(A

mp

)

Figura 5.7: Gráfica de corriente en el panel en un periodo de 13 días.

Finalmente, la gráfica de potencia que es mostrada en la Figura 5.8 tiene exactamente el mismocomportamiento que la gráfica de corriente, esto se debe a que la potencia es el resultado de multiplicarla corriente y el voltaje. Como el voltaje se mantiene “constante” la gráfica resultante tendrá la mismaforma que la gráfica de corriente.

500 1000 1500 2000 2500 3000 3500 4000

Mediciones

0

2

4

6

8

10

12

Po

ten

cia

(w

att

)

Figura 5.8: Mediciones de temperatura correspondiente a 13 días.

5.1.2 Análisis del error RMSE

Para dar validez a las mediciones que provienen del sistema prototipo, se hace una comparación conlas mediciones de la estación meteorológica del Instituto Tecnológico de Morelia, con la finalidad deevitar introducir datos erróneos a la base de datos que será utilizado para alimentar una RNA, y conella realizar estudios de previsión en un panel solar. Para esto es necesario realizar un escalamiento enlos datos y realizar comparaciones visuales. Adicionalmente para tener un estadístico que nos indiquecuál es la diferencia entre los conjuntos de datos, se utiliza la raíz del medio cuadrático (RMSE) yaque es uno de los estadísticos más se usa para determinar el nivel de error, el cual es descrito en la

37

Page 54: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Ecuación 5.1, donde xT es el valor estimado, xi es el valor real y N es el número total de mediciones.

RMSE =√∑

(xT − xi)N

(5.1)

Aplicando la Ecuación 5.1 para determinar el nivel de error del prototipo, se utiliza el conjunto dedatos del prototipo como datos estimados (xT ) y al conjunto de datos de la estación como los datosreales (xi). Ambos conjuntos estan conformados por las variables de radiación solar, humedad y tem-peratura. El primer conjunto de datos corresponden a las mediciones del prototipo el cual correspondeal periodo 12/11/2018 a 6/12/2018. El segundo conjunto de datos corresponde a las mediciones dela estación meteorológica antes mencionada. Debido a que todas las mediciones son realizadas porequipos diferentes y en una escala diferente y en diferentes ubicaciones, se realiza una normalizaciónde los datos el cual consiste en aplicar la ecuación (5.2).

x = xi − xminxmax − xmin

(5.2)

La normalización consiste en restar el valor actual xi, al valor mínimo de todo el conjunto de datos(xmin), el resultado dividirlo entre el valor máximo del conjunto (xmax) menos el valor mínimo delconjunto. Esta normalización de los datos, coloca a las mediciones en la misma escala, por lo que sepuede hacer análisis de error.

Las mediciones mostradas en la Figura 5.9 muestran que después de la normalización, las medicionesde iluminación, visualmente son muy parecidos, además el nivel de error RMSE es de 0.079, por lo quese puede decir que las mediciones de radiación solar provenientes de la estación meteorológica, puedenser usadas para la previsión de los niveles de generación eléctrica en los paneles solares estudiados.

500 1000 1500 2000 2500 3000 3500 40000

0.2

0.4

0.6

0.8

1RMSE = 0.079093

Prototipo

Estación

Figura 5.9: Comparación de mediciones de iluminación entre prototipo desarrollado y estación meteo-rológica.

El siguiente análisis corresponde a las mediciones de temperatura, los cuales son mostrados en laFigura 5.10. A pesar de que se aprecia un comportamiento similar entre los conjuntos, el estadísticode error RMSE tiene un valor de 0.193. A pesar de este nivel de error, estas mediciones pueden serutilizadas, solo que incrementaría el porcentaje de error en las estimaciones de la RNA.

38

Page 55: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

500 1000 1500 2000 2500 3000 3500 40000

0.2

0.4

0.6

0.8

1RMSE = 0.19309

Prototipo

Estación

Figura 5.10: Comparación de mediciones de temperatura entre prototipo desarrollado y estación me-teorológica.

La Figura 5.11 corresponde a la comparación entre los conjuntos de mediciones de humedad. To-mando en cuenta que las mediciones de humedad por parte del prototipo llegan a la máxima escala(saturación en el sensor de humedad) el nivel de error es de 0.212, este error es ligeramente mayorsi se compara con el error que existe en la variable de temperatura. Se piensa que eliminando estasmediciones donde el prototipo registra niveles de saturación en la humedad, es posible tener menoresniveles de error y en consecuencia mejorar el desempeño en la RNA.

500 1000 1500 2000 2500 3000 3500 40000

0.2

0.4

0.6

0.8

1RMSE = 0.21287

Prototipo

Estación

Figura 5.11: Comparación de mediciones de humedad entre prototipo desarrollado y estación meteo-rológica.

Con la realización de estos análisis, se puede concluir que el conjunto de datos de la estaciónmeteorológica puede ser apto para ser utilizados como conjunto de datos para el entrenamiento de laRNA. El siguiente paso dentro de este análisis consiste en realizar un estudio del nivel de error a nivelsemanal para todas las mediciones. Otra consideración que se tiene que tomada en cuenta, es que lasmediciones que se realizan durante la noche, no son de interés para este trabajo, por lo que es necesarioretirarlas del conjunto de entrenamiento. En la Tabla 5.1.2 se muestra cuál es el nivel de error paracada una de las variables en su respectiva semana con y sin mediciones nocturnas.

39

Page 56: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Tabla 5.1: Tabla de errores.Fecha Error rmse

Sin discriminación Con discriminación

Semana 1 29-oct-18 a 04-nov-180.165 0.2490.201 0.2750.504 0.241

Semana 2 05-nov-18 a 11-nov-180.219 0.140.303 0.2260.509 0.266

Semana 3 12-nov-18 a 18-nov-180.119 0.1380.211 0.1980.406 0.205

Semana 4 19-nov-18 a 25-nov-250.093 0.1320.171 0.1810.167 0.149

Semana 5 26-nov-18 a 02-dic-180.195 0.150.3 0.2030.578 0.187

Semana 6 03-dic-18 a 09-dic-180.233 0.180.342 0.2020.416 0.227

Semana 7 10-dic-18 a 16-dic-180.178 0.1460.427 0.2630.478 0.424

Semana 8 17-dic-18 a 23-dic-18* ** ** *

Semana 9 24-dic-18 a 30-dic-180.16 0.1540.217 0.2230.322 0.187

Semana 10 31-dic-18 a 06-ene-190.093 0.1320.184 0.1860.222 0.163

Semana 11 07-ene-19 a 13-ene-190.075 0.1070.192 0.1850.217 0.183

Semana 12 14-ene-19 a 20-ene-190.147 0.110.274 0.2880.371 0.329

Semana 13 21-ene-19 a 27-ene-190.191 0.1360.311 0.2990.311 0.245

Semana 14 28-ene-19 a 03-feb-190.096 0.1350.177 0.1880.229 0.166

Semana 15 04-feb-18 a 10-feb-190.094 0.0930.236 0.2020.294 0.207

Semana 16 11-feb-19 a 17-feb-190.074 0.1040.171 0.2110.349 0.296

Semana 17 18-feb-19 a 24-feb-190.077 0.1040.164 0.1960.261 0.148

40

Page 57: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Para tener una mejor apreciación de los niveles de error, se presentan las siguientes gráficas quecorresponden a cada una de las variables. Analizando la Figura 5.12 se aprecia que en en algunassemanas, el nivel de error disminuye si se descartan las mediciones realizadas durante la noche, sinembargo existen otras semanas en las cuales el nivel de error incrementa al no considerar dichasmediciones nocturnas. Esto se debe a que las diferencias que existen en las mediciones del prototipo yla estación meteorológica son muy pequeñas, por lo que la discriminación en las mediciones de radiaciónno se aprecia una mejora significativa.

0 2 4 6 8 10 12 14 16 180

0.1

0.2

0.3

Semana

ErrorRMS

Sin discriminaciónCon discriminación

Figura 5.12: Error semanal en mediciones de iluminación, con discriminación y sin discriminación.

La Figura 5.13 muestra el error en las mediciones de temperatura. De igual forma, se realizala comparación entre el conjunto de datos con discriminación y si discriminación. Para el caso delas mediciones realizadas durante la primera semana, se observa que el error es mayor cuando lasmediciones realizadas en la noche son retiradas. En cambio para el resto de las semanas, se apreciaque hay una ligera disminución del error, especialmente en la semana número 7.

0 2 4 6 8 10 12 14 16 180

0.2

0.4

Semana

ErrorRMS

Sin discriminaciónCon discriminación

Figura 5.13: Error semanal en mediciones de temperatura, con discriminación y sin discriminación.

Analizando la Figura 5.14 para el comportamiento de la humedad, se aprecia que la discriminaciónde los datos favorece de forma significativa al decremento en el nivel de error. Esto se debe a que lasmediciones que tienen valores que se encuentran en un nivel de saturación, corresponden a medicionesrealizadas durante el periodo nocturno, por lo que al ser descartados, las mediciones realizadas por elprototipo y la estación meteorológica durante el día, tiene una mayor semejanza y por ende un menornivel de error.

41

Page 58: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

0 2 4 6 8 10 12 14 16 180

0.2

0.4

0.6

Semana

ErrorRMS

Sin discriminaciónCon discriminación

Figura 5.14: Error semanal en mediciones de humedad, con discriminación y sin discriminación.

Con los análisis anteriores, se llega a la conclusión de que las mediciones realizadas por el prototiposon aptas para utilizarse en el entrenamiento de una red neuronal, siempre y cuando se realice ladiscriminación de los datos, es decir, solo tomando en cuenta las mediciones realizadas durante el día.

Modelo de regresión

Este análisis tiene el propósito de encontrar una relación entre las variables x (variables de causao independientes) y la variable y (variable de efecto o dependiente) de una población [47]. Realizandola regresión lineal múltiple con ayuda del software de análisis estadístico MINITAB y con los datosentregados por el prototipo, se obtiene la siguiente Tabla 5.2 que corresponde al análisis ANOVA.

Tabla 5.2: Análisis Anova.

Source DF Adj SS Adj MS F-Value P-ValueRegression 3 10159.5 3386.51 5895.20 0.000Iluminación 1 2761.1 2761.10 4806.50 0.000Temperatura 1 6.8 6.78 11.81 0.001Humedad 1 47.0 47.01 81.83 0.000Error 1586 911.1 0.57Total 1589 11070.6

Model Summary

S R-sq R-sq(adj) R-sq(pred)0.757926 91.77% 91.75% 91.67%

Regression EquationPotencia(W) = 4.138 + 0.000189 Luz(Lux) - 0.02892 Temperatura(C)- 0.02754 Humedad(%)

Los resultados del análisis ANOVA, entregan un modelo de regresión con un intervalo de confianzadel 95% el cual tiene como ecuación fundamental a la Ecuación 5.3.

Yijk = µ+ αi + βj + γk (5.3)

42

Page 59: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

donde:

Yijk = La potencia de salida que se ve afectada por las variables independientes.

µ = Es la media general.

αi = Es el efecto debido al i− esimo nivel de la variable iluminación.

βj = Es el efecto debido al j − esimo nivel de la variable temperatura.

γk = Es el efecto debido al k − esimo nivel de la variable humedad.

Para determinar la influencia de la variación de cada factor, se realiza una hipótesis estadística,que es un enunciado o afirmación que habla acerca de los parámetros de un modelo, esta misma reflejauna opinión acerca de la situación del problema [50]. Tomando como ejemplo la variación del factoriluminación, se piensa que la energía generada por el panel solar no es afectada por la variación de lailuminación. Esto se puede enunciar de la siguiente manera:

H0 : µW = µLux

Pero además esta la posibilidad de que la energía generada por el panel solar si es afectada por lavariación de la iluminación, este enunciado también puede ser expresado de la siguiente forma:

HA : µW 6= µLux

Donde µW corresponde a la potencia generada por el panel solar y µLux es la variación de el nivel deiluminación. El enunciado H0 : µW = µLux se conoce como hipótesis nula y HA : µW 6= µLux se conocecomo Hipótesis alternativa. Para comprobar una hipótesis, se realiza un procedimiento conocido comoEnfoque del P valor y especificando un valor de α = 0.05 (ya que el intervalo de confianza es del 95%y 5% de probabilidad de error) conocido comúnmente como nivel de significación.

El pvalor es la probabilidad de que el estadístico de prueba asuma un valor que sea al menos tanextremo como el valor observado del estadístico cuando la hipótesis nula H0 es verdadera. Esto quieredecir que si:

pvalor < α = 0.05

Se tiene evidencia estadística para rechazar la hipótesis H0, llegando a la conclusión de que lavariación de factor analizado influye en la variable de salida, por lo tanto se acepta HA : µW 6= µLux.Por el contrario, si:

pvalor > α = 0.05

No se tiene la evidencia estadística para rechazar la hipótesis H0, por lo que la variación delfactor analizado no afecta de manera significativa a la variable de salida y por lo tanto se aceptaH0 : µW = µLux. Regresando al análisis del factor de iluminación, tomando el P-valor mostrado en latabla 5.2 de la variable iluminación, se tiene que:

pvalor = 0.000 < α = 0.05

Lo que significa que se tiene evidencia estadística para rechazar H0, se concluye entonces que lavariación de iluminación afecta la variable de salida. Existen hipótesis para cada uno de los factores,con la finalidad de conocer su influencia en la variable de respuesta. El análisis de hipótesis para el

43

Page 60: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Tabla 5.3: Análisis de hipótesis para interacciones de un solo término

Hipótesis P-valor vs α ConclusiónH0 µW = µLuxHA µW 6= µLux

0.00 < 0.05 se rechaza H0

H0 µW = µTempHA µW 6= µTemp

0.001 < 0.05 se rechaza H0

H0 µW = µHumHA µHum

0.00 < 0.05 se rechaza H0

resto de las variables, son enunciados en la Tabla 5.3, en ella se puede observar que los factores cuentancon P-valor menor a α = 0.05, por lo que se tiene evidencia estadística para rechazar todas las hipótesisnulas y concluir que todos los factores, afectan en la cantidad de potencia generada por el panel solar.

La ecuación resultante para el modelo de regresión, tiene una característica de apegarse al 91.77 %del fenómeno real, por lo que se dice que el modelo tiene una muy buena aproximación al comporta-miento real del fenómeno estudiado. Esto se debe a que el conjunto de datos fueron filtrados, es decirlas mediciones realizadas durante el periodo nocturno fueron retiradas del conjunto, ya que no eran deinterés para este estudio, por lo que se obtiene una mejor aproximación.

Correlación de variables

Como se detalló en el capítulo 4, el coeficiente de correlación de pearson es una medida descriptivade la intensidad de la relación lineal entre dos variables x y y. Los valores del coeficiente de correlaciónsiempre estarán entre 1 y −1. Donde un valor de 1 indica que las dos variables están perfectamenterelacionadas en un sentido lineal positivo. Un valor de −1 indica que x y y están perfectamenterelacionadas en un sentido lineal negativo. Los valores del coeficiente de correlación cercanos a 0indican que no están relacionadas linealmente [42].

En la Tabla 5.4 se muestra cuáles fueron los resultados obtenidos del análisis del coeficiente decorrelación a las variables independientes de las mediciones realizadas, los valores resultantes son lossiguientes: la iluminación tiene una relación bastante fuerte con las variables temperatura, potencia,corriente y voltaje (más de 0.81) por lo que se puede determinar que con cualquier variación que existaen la iluminación, las demás variables se verán afectadas, principalmente las que son medidas a lasalida del panel. Caso contrario con la humedad, ya que al tener una relación negativa de −0.75, indicaque si hay un decremento en la iluminación, habrá un aumento en la humedad, y en caso contrario,si hay un incremento en la iluminación, habrá un decremento en la humedad. Otra relación fuerte esla que existe entre la temperatura y la humedad es de −0.955 este nivel de correlación confirma losresultados obtenidos en el trabajo [10]. La relación más fuerte que existe es entre la variable corrientey potencia, al tener relación de 1, se dice que si se incrementa en una unidad una variable, la otraincrementará en 1 unidad.

5.2 Preparación de datos para entrenamiento

Como se explica en la literatura [51, 52, 41, 53], existe un proceso para realizar la aplicación deredes neuronales. Este proceso requiere de los siguientes puntos para poder ser desarrollados con mayorfacilidad y mayor probabilidad de éxito.

44

Page 61: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Tabla 5.4: Análisis de correlación entre variables independientes.

Iluminación Temperatura Humedad PotenciaTemperatura 0.813Humedad -0.753 -0.953Potencia 0.953 0.817 -0.780Corriente 0.952 0.817 -0.78 1.0Voltaje 0.925 0.813 -0.769 0.970

El conjunto de datos para entrenamiento consiste en una serie de información entrada-salida.Estos son ejemplos que representan la relación entre entrada - salida, y son usadas para “enseñar”a la red.

La definición de topologías consiste en elegir el número de neuronas a utilizar y el número decapas ocultas. Esta decisión se puede tomar con más facilidad si se analiza el conjunto de datoscon el que se va a trabajar, ya que la topología es diferente para realizar clasificación, estimacióno previsión.

El particionamiento del conjunto de datos consiste en elegir una cierta cantidad de datos paraentrenamiento, otra parte para validación y una pequeña porción para test. La literatura [41]recomienda la siguiente proporción: 70 % del conjunto para entrenamiento, 20 % para validacióny 10 % para prueba.

La parametrización de la red tiene que ver con las características que tendrá la red, que va desdecuál función de activación usar, los criterios de parada del aprendizaje (pueden ser número deépocas, valor del error de aprendizaje o combinación de las dos) y la inicialización de los pesossinápticos de la red.

Durante el proceso de entrenamiento se realiza el ajuste del valor en los pesos o líneas de cone-xión entre las neuronas, hasta que se encuentre la combinación que produzca un error mínimo.El algoritmo más comúnmente usado es el Backpropagation. Este algoritmo realiza dos etapas,Forward que consiste en pasar todos los ejemplos a través de la red y calcular el error a la salida,la más común es el error medio cuadrático (RMSE), y Backward en el cual los pesos son ajustadoscapa por capa. El tamaño del ajuste dependerá del gradiente local referente a cada capa.

Una vez que todo el proceso de aprendizaje fue completado, la última etapa consiste en realizarpruebas con un conjunto de datos y medir el error que se tiene de aproximación, si está pordebajo del error deseado, se dice que la red está entrenada, caso contrario, se repite la seriede entrenamiento haciendo reajustes en la velocidad de aprendizaje, o modificando la topologíahasta se que llegue al comportamiento deseado

Como primer punto, es necesario conocer cuál es el comportamiento de la distribución datos conla finalidad de identificar si existe una tendencia o un patrón de los datos. Como se muestra en laFigura 5.15, las gráficas corresponden a datos de solamente 2 variables, como se resalta en la 5.15(a) lainteracción de las variables potencia e iluminación tiene una tendencia bastante fuerte en comparacióncon las interacciones potencia temperatura en la 5.15(b) y potencia humedad mostrado en la 5.15(c) yaque se aprecia los puntos tienden a estar muy dispersos, pero que aún se puede apreciar una tendencia.

45

Page 62: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

0 0.2 0.4 0.6 0.8 1

Luxes

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1W

att

Lux vs Power

(a) Comparación entre la variable ilu-minación y potencia.

0 0.2 0.4 0.6 0.

Temperature

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Wa

tt

Temp vs Power

(b) Comparación entre la variabletemperatura y potencia.

0 0.2 0.4 0.6 0.8 1

Humidity

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Wa

tt

Hum vs Power

(c) Comparación entre la variable humedady potencia.

Figura 5.15: Gráficas de comparación solamente con dos variables.

Prosiguiendo con el proceso de análisis visual, se analizan las interacción de tres variables, como semuestra en la Figura 5.16, en ella se destaca la gráfica donde interactúan las variables temperatura,humedad y potencia como se muestra en la 5.16(c), la cual se puede apreciar el comportamiento quese tiene, muy disperso en comparación con el resto de gráficas. Caso contrario con la 5.16(a), yaque la interacción entre potencia,humedad e iluminación genera una tendencia muy marcada en elcomportamiento de los datos, lo cual hace fácil la estimación, que puede ser a través de una funciónmatemática o por medio de una red neuronal.

0

0.2

0.4

0.6

1

0.8

1

Po

ten

cia

Lux vs Hum vs W

Humidity

10.5

Luxes

0.50 0

(a) Comparación entre las varia-ble potencia, humedad e ilumi-nación.

00

0.2

1

0.4

Lux vs Temp vs W

Temperature

Po

ten

cia

0.6

0.5

Luxes

0.8

0.5

1

10

(b) Comparación entre la variablepotencia, temperatura e ilumina-ción.

0

0.2

0

0.4

0.6

Po

ten

cia

0.8

1

Temperature

0.5

Temp vs Hum vs W

1

Humidity

0.510

(c) Comparación entre la variablespotencia, temperatura y humedad.

Figura 5.16: Gráficas de comparación solamente con dos variables.

Con este análisis visual se puede deducir que las características de la red no serán tan complejas,debido a que las mediciones siguen una tendencia, y no un agrupamiento. Además se observa que losmejores comportamientos, para 3 variables se encuentra en la interacción de las variables iluminación,temperatura y potencia. Para la interacción de 2 variables se encuentran que el mejor comportamientose encuentra en la interacción iluminación y potencia.

46

Page 63: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

5.2.1 Conjunto para la estimación

El conjunto de datos que se utiliza para esta serie de pruebas se dividirá en tres grupos de datos, elprimer grupo es conocido como conjunto de entrenamiento, el cuál tendrá la mayoría de las mediciones(70 %), el segundo grupo constará del 20 % de los datos, estos serán usados para la validación de lared, durante el ajuste de los pesos sinápticos y finalmente el último grupo de datos serán usados parala validación de la red (10 % del total de datos), con la finalidad de conocer cuál es el desempeño dela red [53]. Estos tres conjuntos de datos son usados para entrenar diferentes topologías de redes, (unared tomado en cuenta las tres variables, y tres redes tomando solo dos variables de entrada), paraposteriormente estudiar desempeño de cada red.

0 100 200 300 400 500 600 700 800 900 1000

Mediciones

0

2

4

6

8

10

12

Iluminación

Entrenamiento

Prueba

Validación

Figura 5.17: Conjunto de datos propuestos para realizar la serie de entrenamiento para la estimaciónde potencia.

5.2.2 Conjuntos para la previsión n elementos previos

El conjunto para realizar previsión de datos cambia en comparación con el conjunto para realizarestimación de datos. Una de las características que son requeridas en estos conjuntos, es que se debende encontrar en orden aleatorio (con la finalidad de evitar el sobre entrenamiento), además de tomar encuenta valores anteriores de potencia como se puede apreciar en la Figura 5.18, para poder realizar laestimación a futuro. Durante la revisión del estado del arte, no se especificaba cuáles eran los criteriospara elegir la cantidad ideal de elementos previos, por lo que se decidió crear diferentes conjuntos deentrenamiento que consideraran desde 0 hasta 7 elementos previos de potencia (dando un total de 8conjuntos de entrenamiento).

47

Page 64: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

0 5 10 15 20 25 30 35 40

Mediciones

1

2

3

4

5

6

7

8

9

10

Pote

ncia

Estimado

Elemento previo

Real

Datos previos

Dato es!mado

Datos reales

Figura 5.18: Conjunto de datos propuestos para realizar la serie de entrenamiento para la previsión depotencia.

5.3 Análisis de valores de salida en una RNA

Una vez que se cuenta con los conjuntos de datos se puede proseguir con la determinación de lared, a través de la experimentación. La experimentación consisten en la determinación del ciclos deentrenamiento, determinar la topología, para el caso de la estimación determinar cuántas variables deentrada considerar y para el caso de la previsión, determinar el número de elementos previos al datoestimado, determinando el nivel de error a la salida de cada una de las experimentaciones como semuestra en la Figura 5.19.

Figura 5.19: Metodología de experimentación en las topologías de redes neuronales.

48

Page 65: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

5.3.1 Resultados para estimación (RMSE)

Además del análisis estadístico realizado con anterioridad para determinar qué variables considerardentro del modelo a corto plazo, se realizará un análisis de desempeño en redes considerando solamentedos y tres variables de entrada, las cuales pueden ser: A)iluminación y temperatura, B)iluminación yhumedad, C)humedad y temperatura, o D)iluminación, temperatura y humedad. Adicionalmente senecesita de igual forma determinar cuáles serán las características de la red. Como se explica en elcapítulo 2, existen criterios de parada en un proceso de entrenamiento: a) Por nivel de error, b) Porciclos de entrenamiento y c) Por tiempo de entrenamiento. Para este primer punto, el criterio a usarserá por ciclos de entrenamiento. Para poder definir la cantidad de ciclos de entrenamiento se proponeuna red con una arquitectura de 3 elementos de cómputo en la capa de entrada, 3 elementos en la capaoculta, y 1 sola salida (3:3:1), a la cual se le hace un barrido de ciclos de entrenamiento, que va de500 ciclos a 100,000 ciclos. Utilizando el software EASYNN se realiza la exportación de los datos deentrenamiento (700 mediciones), validación (200 mediciones) y prueba (100 mediciones). Especificandolos parámetros de la red (cómo son los elementos de cómputo y el número de capas ocultas), ajustandolos parámetros del entrenamiento como el Learning Rate y el Momemtum y seleccionando cuál seráel criterio de parada, se procede a realizar los entrenamientos, para tener una mejor aproximación,se realiza 3 corridas de cada experimento, eligiendo la que mejor resultado obtenga. En la secciónANEXOS se explica con más detalle cómo se colocan todos los parámetros de la red y ajustes en elentrenamiento dentro del software EasyNN. Los resultados del barrido de ciclos de entrenamiento sonmostrados en la Tabla 5.5.

Tabla 5.5: Resultados obtenidos del barrido en ciclos de entrenamiento.Datos de entrada Parámetros de entrenamiento Criterio de parada Resultado

Topología Entrenamiento Validación Prueba LearningRate Momentum Tiempo Ciclos de

entrenamientoNivel deError RMSE

3:3:1 700 datos 200 datos 100 datos 0.6 0.8 - 100,000 0.1 0.267464093:3:1 700 datos 200 datos 100 datos 0.6 0.8 - 50,000 0.1 0.254135913:3:1 700 datos 200 datos 100 datos 0.6 0.8 - 10,000 0.1 0.2554307213:3:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.2541099613:3:1 700 datos 200 datos 100 datos 0.6 0.8 - 2,500 0.1 0.2590707563:3:1 700 datos 200 datos 100 datos 0.6 0.8 - 1,000 0.1 0.2667571253:3:1 700 datos 200 datos 100 datos 0.6 0.8 - 500 0.1 0.348829183

Con la finalidad de determinar la cantidad de ciclos de entrenamiento necesario, se elije el experi-mento que genere menor error. Para este caso, se observa que para 5, 000 ciclos de entrenamiento segenera el menor nivel de error, por lo que lo hace ideal para ser considerado en los siguiente expe-rimentos. Es a partir de este punto, que se prosigue con las experimentaciones para determinar quecantidad de variable considerar.

Estimaciones con tres variables Iluminación, Temperatura y Humedad

El siguiente punto a cubrir es determinar cuál será la topología que mejor desempeño tenga, paraello se toma los mismos conjuntos de entrenamiento y la cantidad de ciclos de entrenamiento antesdefinidos y se procede a realizar la experimentación para una sola capa oculta considerando tresvariables y realizando un barrido en los elementos de cómputo que van desde 2 hasta 8 elementos decómputo. Los resultados obtenidos son mostrados en la Tabla 5.6.

Los resultados de la Tabla 5.6 muestra que para la topología con tres elementos de cómputo en lacapa de entrada, tres elementos en la capa oculta y 1 elemento en la capa de salida (topología 3:3:1),el cual obtiene un nivel de error del 0.255326464. Desde un punto de vista gráfico, la Figura 5.20,

49

Page 66: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Tabla 5.6: Resultados obtenidos del barrido en elementos de cómputo con una capaoculta para iluminación, temperatura y humedad como variables de entrada.

Datos de entrada Parámetros de entrenamiento Criterio de parada Resultado

Topología Entrenamiento Validación Prueba LearningRate Momentum Tiempo Ciclos de

entrenamientoNivel deError RMSE

3:2:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.3286404533:3:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.2553264643:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.2917387683:5:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.284348653:6:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.2743003573:7:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.2944966453:8:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.314817016

muestra la comparación de los datos reales contra los datos estimados.

50

Page 67: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

0 10 20 30 40 50 60 70 80 90 1000

5

10

Medición

Potenc

ia

Datos realesDatos estimados

Figura 5.20: Comparación gráfica de datos estimados contra datos reales para una topología de 3:3:1.

Para determinar si es posible disminuir más la diferencia que existe entre los datos estimados y losdatos reales, se procede a modificar la topología de la red, tomando como base la topología definidaanteriormente, pero añadiendo una capa oculta extra y repitiendo el proceso de realizar el barrido deelementos de cómputo en la segunda capa oculta. Los resultados de esta experimentación son mostradasen la Tabla 5.7.

Tabla 5.7: Resultados obtenidos del barrido en elementos de cómputo con dos capasocultas para iluminación, temperatura y humedad como variables de entrada.

Datos de entrada Parámetros de entrenamiento Criterio de parada Resultado

Topología Entrenamiento Validación Prueba LearningRate Momentum Tiempo Ciclos de

entrenamientoNivel deError RMSE

3:3:2:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.3110245683:3:3:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.2802581633:3:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.2848889193:3:5:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.3012132733:3:6:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.3295142543:3:7:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.3314084333:3:8:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.282363986

Los resultados de esta experimentación muestran que para la topología de tres elementos en laprimera capa, tres elementos en la primera capa oculta, tres elementos en la segunda capa oculta y 1salida (topología 3:3:3:1) pose el menor nivel de error, siendo de 0.280258163, de manera gráfica lasrespuestas para esta topología son mostradas en la Figura 5.21.

51

Page 68: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

0 10 20 30 40 50 60 70 80 90 1000

5

10

Medición

Potenc

ia

Datos realesDatos estimados

Figura 5.21: Comparación gráfica de datos estimados contra datos reales para una topología de 3:3:3:1.

Sin embargo comparando los mejores resultados de cada topología, se aprecia que el error de latopología 3:3:1 es menor, por lo que se puede deducir que para el caso en que se usen las tres variables deentrada, la topología con solo una capa oculta y tres elementos de cómputo en la capa oculta, como esmostrado en la Figura 5.22, permite estimar el comportamiento del sistema fotovoltaico experimentalcon un error de 0.255326464.

Capa de

entrada

Capa

oculta

Capa de

salida

Iluminación

Temperatura

Humedad

Potencia

Figura 5.22: Topología 3:3:1 que considera la iluminación, temperatura y humedad como variables desalida.

Estimaciones con dos variables Iluminación y Temperatura

Prosiguiendo con el proceso de experimentación, se retira la variable humedad de la información deentrada. Repitiendo el procedimiento anterior, se realizar tres corridas de experimentación, haciendovariar los ciclos de entrenamiento. Los resultados entregados por EasyNN son mostrados en la Tabla 5.8.

Se aprecia que la topología con mejor desempeño es 2:8:1, ya que solo tiene un nivel de error del0.273086254. Visualmente el desempeño para esta topología se aprecia en la Figura 5.23.

52

Page 69: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Tabla 5.8: Resultados obtenidos del barrido en elementos de cómputo con una capaoculta para iluminación y temperatura como variables de entrada.

Datos de entrada Parámetros de entrenamiento Criterio de parada Resultado

Topología Entrenamiento Validación Prueba LearningRate Momentum Tiempo Ciclos de

entrenamientoNivel deError RMSE

2:2:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.3625669442:3:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.297833132:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.2952248292:5:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.2973564952:6:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.2899519322:7:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.2792005752:8:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.273086254

0 10 20 30 40 50 60 70 80 90 1000

5

10

Medición

Potenc

ia

Datos realesDatos estimados

Figura 5.23: Comparación gráfica de datos estimados contra datos reales para una topología de 2:8:1.

Como siguiente paso, se agrega una capa oculta extra a la topología anterior y se varía nuevamenteel número de elementos de cómputo, dando como resultado los siguientes los valores mostrados en laTabla 5.9.

Tabla 5.9: Resultados obtenidos del barrido en elementos de cómputo con dos capasocultas para iluminación y temperatura como variables de entrada.

Datos de entrada Parámetros de entrenamiento Criterio de parada Resultado

Topología Entrenamiento Validación Prueba LearningRate Momentum Tiempo Ciclos de

entrenamientoNivel deError RMSE

2:8:2:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.3513964892:8:3:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.298225842:8:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.2616049262:8:5:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.2828667422:8:6:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.2724976222:8:7:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.2663652762:8:8:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.265878027

En la segunda etapa de pruebas, se observa que la topología 2:8:4:1 posee el menor nivel de error,siendo de 0.261604926 rmse, la Figura 5.24 muestra gráficamente cuál es el desempeño de esta topología.

Comparando los resultados obtenidos, la topología 2:8:4:1 como se ilustra en la Figura 5.25, tieneel valor más bajo de error, por lo que se puede deducir que es la mejor opción para la estimación,considerando solamente a la iluminación y a la temperatura.

53

Page 70: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

0 10 20 30 40 50 60 70 80 90 1000

5

10

Medición

Potenc

ia

Datos realesDatos estimados

Figura 5.24: Comparación gráfica de datos estimados contra datos reales para una topología de 2:8:4:1.

Capa de

salida

Potencia

Capa de

entrada

Capa

oculta 1

Capa

oculta 2

Iluminación

Temperatura

Figura 5.25: Topología 2:8:4:1 que considera la iluminación y la temperatura como variables de salida.

Estimaciones con dos variables Iluminación y Humedad

Para este caso de estudio se retira la variable temperatura y se agrega la variable humedad a losdatos de entrenamiento. Partiendo nuevamente con los parámetros de entrenamiento ya definidos, serealiza las tres corridas de experimentos para la topología con una sola capa y variaciones de dos aocho elementos de cómputo. Los resultados obtenidos de dicha experimentación son mostrados en laTabla 5.10.

Se aprecia que la topología con mejor desempeño es 2:3:1, ya que solo tiene un nivel de error del0.26061261, en la Figura 5.26 se compara los datos estimados con los datos reales.

54

Page 71: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Tabla 5.10: Resultados obtenidos del barrido en elementos de cómputo con una capaoculta para iluminación y humedad como variables de entrada.

Datos de entrada Parámetros de entrenamiento Criterio de parada Resultado

Topología Entrenamiento Validación Prueba LearningRate Momentum Tiempo Ciclos de

entrenamientoNivel deError RMSE

2:2:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.3360893722:3:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.260612612:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.2881334752:5:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.2841598162:6:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.2939848922:7:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.2911807192:8:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.265562019

0 10 20 30 40 50 60 70 80 90 1000

5

10

Medición

Potenc

ia

Datos realesDatos estimados

Figura 5.26: Comparación gráfica de datos estimados contra datos reales para una topología de 2:3:1.

Prosiguiendo con la serie de pruebas, se agrega una capa oculta extra a la topología anterior y sevaría nuevamente el número de elementos de cómputo, dando como resultado los valores mostrados enla Tabla 5.11.

Tabla 5.11: Resultados obtenidos del barrido en elementos de cómputo con dos capasocultas para iluminación y humedad como variables de entrada.

Datos de entrada Parámetros de entrenamiento Criterio de parada Resultado

Topología Entrenamiento Validación Prueba LearningRate Momentum Tiempo Ciclos de

entrenamientoNivel deError RMSE

2:3:2:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.3150692762:3:3:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.2649158682:3:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.2710791072:3:5:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.287392422:3:6:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.2823026392:3:7:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.2900417412:3:8:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 0.27763765

En la segunda etapa de pruebas, se observa que la topología 2:3:3:1 posee el menor nivel de error,siendo de 0.264915868 rmse, en la Figura 5.27 se compara los datos estimados con los datos reales.

Sin embargo, la topología con mejor nivel de error en toda las pruebas realizadas, fue la 2:3:1 conun nivel de error de 0.26061261 rmse, por lo que se determina que esta topología es la mejor opciónpara la estimación, considerando solamente a la iluminación y humedad, esta topología es mostradaen la Figura 5.28.

55

Page 72: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

0 10 20 30 40 50 60 70 80 90 1000

5

10

Medición

Potenc

ia

Datos realesDatos estimados

Figura 5.27: Comparación gráfica de datos estimados contra datos reales para una topología de 2:3:3:1.

Capa de

entrada

Capa

oculta

Capa de

salida

Iluminación

Humedad

Potencia

Figura 5.28: Topología 2:3:1 que considera la iluminación y la humedad como variables de salida.

Estimaciones con dos variables Temperatura y Humedad

Para este último caso de estudio se retira la variable iluminación y se agrega la variable temperaturaa los datos de entrenamiento. Utilizando los parámetros de entrenamiento ya definidos, se realiza lastres corridas de experimentos para la topología con una sola capa y variaciones de dos a ocho elementosde cómputo. Los resultados obtenidos de dicha experimentación son mostrados en la Tabla 5.12.

Tabla 5.12: Resultados obtenidos del barrido en elementos de cómputo con una capaoculta para temperatura y humedad como variables de entrada.

Datos de entrada Parámetros de entrenamiento Criterio de parada Resultado

Topología Entrenamiento Validación Prueba LearningRate Momentum Tiempo Ciclos de

entrenamientoNivel deError RMSE

2:2:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 1.7457092582:3:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 1.9172502632:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 1.870096452:5:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 1.5226213792:6:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 1.8431360192:7:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 1.5192288542:8:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 1.518647439

Se aprecia que la topología con mejor desempeño es 2:7:1, ya que solo tiene un nivel de error del1.522621379, y en la Figura 5.29, se muestra cuál es el desempeño de esta topología.

56

Page 73: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

0 10 20 30 40 50 60 70 80 90 1000

5

10

Medición

Potenc

ia

Datos realesDatos estimados

Figura 5.29: Comparación gráfica de datos estimados contra datos reales para una topología de 2:7:1.

Prosiguiendo con la serie de pruebas, se agrega una capa oculta extra a la topología anterior y sevaría nuevamente el número de elementos de cómputo, obteniendo los siguientes valores mostrados enla Tabla 5.13:

Tabla 5.13: Resultados obtenidos del barrido en elementos de cómputo con dos capasocultas para temperatura y humedad como variables de entrada.

Datos de entrada Parámetros de entrenamiento Criterio de parada Resultado

Topología Entrenamiento Validación Prueba LearningRate Momentum Tiempo Ciclos de

entrenamientoNivel deError RMSE

2:7:2:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 1.8035459012:7:3:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 1.9723507192:7:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 1.7376717512:7:5:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 1.8269908972:7:6:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 1.5770009762:7:7:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 1.6047226822:7:8:1 700 datos 200 datos 100 datos 0.6 0.8 - 5,000 0.1 1.761231793

En la segunda etapa de pruebas, se observa gráficamente en la Figura 5.30, que la topología 2:7:6:1,posee el menor nivel de error, siendo de 1.577000976 rmse.

0 10 20 30 40 50 60 70 80 90 1000

5

10

Medición

Potenc

ia

Datos realesDatos estimados

Figura 5.30: Comparación gráfica de datos estimados contra datos reales para una topología de 2:7:6:1.

Para este caso de estudio (humedad y temperatura) la mejor topología es 2:7:1 como el que se mues-tra en la Figura 5.31, pero debido a los altos indices de error, no se recomienda usar esta combinaciónde variables para entrenar una RNA.

57

Page 74: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Temperatura

Humedad

Potencia

Capa de

entrada

Capa

oculta

Capa de

salida

Figura 5.31: Topología 2:3:1 que considera la temperatura y la humedad como variables de salida.

Después de realizar la experimentación con todas las combinaciones posibles en las variables deentrada, y con base a los resultados obtenidos, se aprecia que solamente considerando dos variablesde entrada, es posible estimar la potencia de salida del panel fotovoltaico, con un cierto margen deerror. Para el caso en el que se considera temperatura y humedad como datos de entrada, se obtieneel mayor nivel de error, por lo que esta configuración no es la más recomendable para ser utilizada enla estimación de los datos.

Analizando el siguiente caso donde se utiliza las combinaciones iluminación humedad e ilumina-ción temperatura, los desempeños son muy parecidos, pero la diferencia que existe entre estas doscombinaciones, se encuentra en las topologías que fueron usadas para lograr dichos resultados, ya quecon la combinación iluminación temperatura se requirió de dos capas ocultas, por lo que el procesode entrenamiento requirió de mayor procesamiento matemática, en comparación con la combinacióniluminación humedad que solo requirió de una capa oculta.

Sin embargo, la configuración que usa las tres variables de entrada, logra el menor nivel de error, porlo que se recomienda utilizar las tres variables ambientales para realizar las estimaciones de potenciaen el panel solar. Con la finalidad de conocer el desempeño de cada uno de los métodos usados, serealiza la comparación entre la estimación por redes neuronales artificiales y la estimación por ecuaciónde regresión, obteniendo así la Figura 5.32.

58

Page 75: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

0 10 20 30 40 50 60 70 80 90 100

Mediciones

0

2

4

6

8

10

12P

ote

nci

a (

Wa

tts)

Datos reales

Estimación por RNN

Estimacion por regresión

Figura 5.32: Figura comparativa de los desempeños entre la estimación por rede neuronal artificial ymodelo de regresión.

Visualmente se aprecia que la respuesta dada por la estimación por redes neuronales se apega másal comportamiento real del sistema fotovoltaico, en comparación con la estimación realizada a través demodelos de regresión lineal. El nivel de aproximación por medio de regresión lineal se debe a que se basaen la relación Lineal de las variables, esto quiere decir que cambiando la regresión por una no lineal,podría mejorar el nivel de respuesta, teniendo un comportamiento más apegado al comportamientoreal.

5.3.2 Resultados para previsión (RMSE)

Como se venía realizando en el procedimiento anterior para la estimación de valores y con lafinalidad de evitar el fenómeno de sobre-entrenamiento, todas las mediciones son ordenadas de maneraaleatoria para posteriormente generar tres grupos de datos conocidos como conjunto de entrenamiento,conjunto de validación y conjunto de prueba como se muestra en la Figura 5.33.

59

Page 76: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

L

Conjunto

de datos

T

H

W

0 50 100 150 200 250 300 350 400 450 500

Mediciones

0

1

2

3

4

5

6

7

8

Lu

x

104 Gráfica de iluminación

0 50 100 150 200 250 300 350 400 450 500

Mediciones

0

1

2

3

4

5

6

7

Lu

x

104 Gráfica de iluminación

CSV70%

Entrenamiento

CSV20%

Validación

CSV10%

Prueba

Figura 5.33: .

El conjunto de datos usado para realizar los entrenamientos de la red neuronal, corresponden amediciones realizadas en el periodo del 14 de enero del 2019 al 10 de febrero del 2019, siendo más de8, 000 mediciones por variable (un total de 32, 000 datos). Los cuales son mostrados en la Figura 5.34.

0 1000 2000 3000 4000 5000 6000 7000 8000

Mediciones

0

1

2

3

4

5

6

7

8

Lu

x

104 Gráfica de iluminación

0 1000 2000 3000 4000 5000 6000 7000 8000

Mediciones

0

10

20

30

40

50

Gra

do

s c

elc

ius

Gráfica de temperatura

0 1000 2000 3000 4000 5000 6000 7000 8000

Mediciones

0

20

40

60

80

100

Hu

me

da

d r

ela

tiv

a (

%)

Gráfica de humedad

0 1000 2000 3000 4000 5000 6000 7000 8000

Mediciones

0

2

4

6

8

10

12

Wa

tt

Gráfica de potencia

Figura 5.34: Mediciones de las variables de operación del panel solar (sin discriminar).

Después del proceso de discriminación (retirar las mediciones realizadas durante la noche) se pro-cede a la determinación de la cantidad de ciclos de entrenamiento necesario. Ya que esta aplicación

60

Page 77: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

corresponde a la previsión de datos, es necesario realizar una prueba con un número aleatorio de me-diciones previas al dato a calcular. Se propone utilizar 6 elementos previos, por lo que la topologíaresultante para la determinación de ciclos de entrenamiento consiste en nueve neuronas en la capa deentrada cuatro neuronas en la capa oculta y una neurona en la capa de salida (9:4:1). Para realizar laexperimentación se utiliza nuevamente el software EasyNN por lo que solo resta configurar la topologíade la red, colocar los parámetros de entrenamiento y realizar un barrido en los ciclos de entrenamiento,que va desde 200,000 ciclos hasta 800 ciclos. Los resultados obtenidos son mostrados en la Tabla 5.14.

Tabla 5.14: Resultados obtenidos del barrido en elementos de cómputo con dos capasocultas para temperatura y humedad como variables de entrada.

Datos de entrada Parámetros de entrenamiento Criterio de parada Resultado

Topología Entrenamiento Validación Prueba LearningRate Momentum Tiempo Ciclos de

entrenamientoNivel deError RMSE

9:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 200,000 0.1 2.13729:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 160,000 0.1 2.14679:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 140,000 0.1 2.14679:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 120,000 0.1 2.16039:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 100,000 0.1 2.14439:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 80,000 0.1 2.21349:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 60,000 0.1 2.22079:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 40,000 0.1 2.10699:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 20,000 0.1 1.96689:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 10,000 0.1 1.96409:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 8,000 0.1 1.99389:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 1.84729:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 4,000 0.1 1.99149:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 2,000 0.1 1.90969:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 1,000 0.1 1.88289:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 800 0.1 1.8935

En estos resultados, se aprecia que con la cantidad de 6, 000 ciclos de entrenamiento, se obtieneel menor nivel de error, siendo este de 1.8472, por lo que será considerado como un criterio más parala configuración final de la red previsora. Como siguiente paso, es necesario definir la cantidad deelementos o mediciones previos al dato a estimar. Como se mencionó anteriormente, existen trabajoscomo [20, 31, 30] que utilizan datos previos para hacer previsiones. Sin embargo, no explican cómo esque se determina esta cantidad de elementos, por lo que se propone realizar un barrido, iniciando desdecero hasta nueve elementos previos, considerando los criterios antes definidos como lo son los ciclos deentrenamiento. Debido a que se estarán variando los elementos previos, la topología de la red a usar,será n:4:1n donde n estará variando entre 3 y 11 neuronas en su capa de entrada. En cada prueba serealiza tres corridas de experimentos y se elige la que menor error tenga. Los resultados obtenidos sonanalizados en la Tabla 5.15.

Los resultados de la experimentación muestran que el menor nivel de error se logra considerando6 elementos o mediciones anteriores al valor que se desea estimar. La siguiente tarea a realizar esla creación de los conjuntos de datos, utilizando la misma frecuencia de muestreo que el prototipotiene por default (cinco minutos), como segundo conjunto de datos, se utilizará la misma frecuenciade muestreo de cinco minutos, pero con un método de suavizado de datos por promediado de datosutilizando la Ecuación 5.4 que forma parte de las funciones incluidas en el software de Matlab.

µ = 1N

N∑i=1

Ai (5.4)

donde Ai corresponde al dato a utilizar durante el promediado, N corresponde al tamaño de la ventana

61

Page 78: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Tabla 5.15: Resultados obtenidos del barrido en datos previos al dato previsto. consi-derando también la iluminación, temperatura y humedad como variables de entrada.

Datos de entrada Parámetros de entrenamiento Criterio de parada Resultado

Topología Entrenamiento Validación Prueba LearningRate Momentum Tiempo Ciclos de

entrenamientoNivel deError RMSE

3:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 1.94324:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 2.07575:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 1.90696:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 1.84777:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 2.01038:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 1.93799:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 1.809310:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 1.877611:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 2.0865

de promediado, o a la cantidad de datos a usar para realzar el promediado del dato actual. Ya que secuenta con la cantidad de ciclos de entrenamiento y con el número de mediciones previas, se procede arealizar el barrido de neuronas y de capas ocultas para los conjuntos de entrenamiento de 5 minutos,5 minutos con suavizado y 10 minutos.

Experimentación y resultado para conjunto A (5 minutos)

Para dar mejor nivel de aproximación, se utiliza una ligera variación al procedimiento usado duran-te la estimación de valores, se realiza cuatro corridas para cada una de las topología, con la finalidadde encontrar el menor error. Utilizando los criterios de entrenamiento definidos, como 6, 000 ciclos deentrenamiento y 6 elementos previos de potencia, se realizará un barrido en el número de elemen-tos para una sola capa oculta desde dos hasta nueve elementos de cómputo. Los resultados de cadaentrenamiento son mostrados en la Tabla 5.16.

Tabla 5.16: Resultados obtenidos del barrido en la cantidad de neuronas con una solacapa oculta, considerando la iluminación, temperatura, humedad y seis mediciones depotencia previa como variables de entrada.

Datos de entrada Parámetros de entrenamiento Criterio de parada Resultado

Topología Entrenamiento Validación Prueba LearningRate Momentum Tiempo Ciclos de

entrenamientoNivel deError RMSE

9:2:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 1.00239:3:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.79949:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.76619:5:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.79199:6:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.92349:7:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 1.27149:8:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 1.06709:9:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 1.2055

Los niveles de error para la topología de una sola capa oculta, muestra que el menor nivel de errorse obtiene con la cantidad de cinco neuronas, obteniendo un nivel de error de 0.7619. Utilizando estaconfiguración se añade una segunda capa oculta, y se realiza la misma variación de neuronas en lasegunda capa. Los resultados obtenidos son mostrados en la Tabla 5.17.

62

Page 79: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Tabla 5.17: Resultados obtenidos del barrido en la cantidad de neuronas para la segun-da capa oculta, considerando la iluminación, temperatura, humedad y seis medicionesde potencia previa como variables de entrada.

Datos de entrada Parámetros de entrenamiento Criterio de parada Resultado

Topología Entrenamiento Validación Prueba LearningRate Momentum Tiempo Ciclos de

entrenamientoNivel deError RMSE

9:5:2:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.90869:5:3:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 1.00039:5:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 1.00039:5:5:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.92529:5:6:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.83549:5:7:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.88829:5:8:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 1.06259:5:9:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 1.0543

Los resultados de esta tabla muestran que la topología con mejor nivel de error es 9:5:6:1 con unvalor de 0.8354, sin embargo en comparación con las topologías de una sola capa, se aprecia que elerror es menor (0.7619 para una topología de 9:5:1), por lo que usando un conjunto de datos con unafrecuencia de muestreo de 5 minutos, la topología de una sola capa de entrada es la mejor opción. Larespuesta gráfica de la topología con mejor desempeño, es mostrada en la Figura 5.35.

900 910 920 930 940 950 960 970 980 990 1,0000

5

10

Medición

Potenc

ia

Datos realesDatos estimados

Figura 5.35: Comparación gráfica de datos estimados contra datos reales para una topología de 2:7:1,usando conjunto de datos A.

Experimentación y resultados para conjunto B (5 minutos suavizado)

El suavizado de datos tiene la finalidad de quitar cambios bruscos de valor, con lo que se esperaque la red tenga un mejor nivel de aproximación a este tipo de datos. Realizando tres corridas deexperimentos por cada una de las variaciones de neuronas en la primera capa, se obtienen los resultadosmostrados en la Tabla 5.18.

Con los resultados obtenidos para esta experimentación, se aprecia que para la topología 9:8:1 seobtienen el menor error, que corresponde a un valor de 0.1160. Considerando esta característica comobase, se procede a añadir una capa oculta extra y repetir el barrido de elementos para la segundacapa, variando entre dos neuronas y nueve neuronas. Los resultados obtenidos son mostrados en laTabla 5.19.

63

Page 80: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Tabla 5.18: Resultados obtenidos del barrido de neuronas para una sola capa en con-junto de mediciones con suavizado de datos.

Datos de entrada Parámetros de entrenamiento Criterio de parada Resultado

Topología Entrenamiento Validación Prueba LearningRate Momentum Tiempo Ciclos de

entrenamientoNivel deError RMSE

9:2:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.15169:3:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.12519:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.11919:5:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.11929:6:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.11649:7:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.11779:8:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.11609:9:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.1166

Tabla 5.19: Resultados obtenidos del barrido de neuronas para una dos capas en con-junto de mediciones con suavizado de datos.

Datos de entrada Parámetros de entrenamiento Criterio de parada Resultado

Topología Entrenamiento Validación Prueba LearningRate Momentum Tiempo Ciclos de

entrenamientoNivel deError RMSE

9:8:2:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.12019:8:3:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.12009:8:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 3.47809:8:5:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.11569:8:6:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.11629:8:7:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.11659:8:8:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.11649:8:9:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.1161

Las experimentaciones para la topología de dos capas, muestran que el valor de 0.1156 es el valor máspequeño de todas las topologías, el cual corresponde a la topología 9:8:5:1, por lo que se recomienda estaconfiguración para obtener el menor error, sin embargo la configuración con una sola capa oculta, tieneun valor de error muy cercano al valor más bajo de error obtenido en toda la experimentación, pero conla ventaja de tener una topología más sencilla, por lo que si se desea ahorrar esfuerzo computacional,se recomienda el uso de una sola capa oculta. La Figura 5.36 muestra el desempeño para la topología9:8:1.

900 910 920 930 940 950 960 970 980 990 1,0000

5

10

Medición

Potenc

ia

Datos realesDatos estimados

Figura 5.36: Comparación gráfica de datos estimados contra datos reales para una topología de 2:7:1,usando conjunto de datos B.

64

Page 81: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Experimentación y resultados para conjunto de datos C (10 minutos)

Otra manera de disminuir las transiciones abruptas en las variables de medición es en la disminuciónde la frecuencia de medición, por lo que este conjunto de entrenamiento es ajustado a una frecuenciade muestreo de diez minutos, que en comparación con el suavizado de datos, las mediciones originalesno sufren alteración alguna. Realizando tres corridas de experimentos por cada una de las variacionesde neuronas en la primera capa, se obtienen los resultados mostrados en la Tabla 5.20.

Tabla 5.20: Resultados obtenidos del barrido de elementos de cómputo para una solacapa, utilizando una frecuencia de muestreo en las mediciones de diez minutos.

Datos de entrada Parámetros de entrenamiento Criterio de parada Resultado

Topología Entrenamiento Validación Prueba LearningRate Momentum Tiempo Ciclos de

entrenamientoNivel deError RMSE

9:2:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.72939:3:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.51839:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.46269:5:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.57329:6:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.76629:7:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.78759:8:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.53169:9:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.6516

Durante la variación de elementos en la primera capa, se aprecia que la configuración 9:4:1 seobtiene un error de solo 0.4626. Partiendo de este punto, se añade una segunda capa oculta, con lafinalidad de verificar si es posible disminuir el nivel de error. Los resultados obtenidos son mostradosen la Tabla 5.21.

Tabla 5.21: Resultados obtenidos del barrido de elementos de cómputo para dos capaocultas, utilizando una frecuencia de muestreo en las mediciones de diez minutos.

Datos de entrada Parámetros de entrenamiento Criterio de parada Resultado

Topología Entrenamiento Validación Prueba LearningRate Momentum Tiempo Ciclos de

entrenamientoNivel deError RMSE

9:4:2:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.44359:4:3:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.30329:4:4:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.54099:4:5:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.37119:4:6:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.47129:4:7:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.86419:4:8:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.37579:4:9:1 700 datos 200 datos 100 datos 0.6 0.8 - 6,000 0.1 0.4784

La configuración con dos capas ocultas, obtiene mejores resultados que la configuración con unasola capa. La topología que menor error obtiene, corresponde a 9:4:2:1 con un valor de 0.3032. Estedesempeño se muestra en la Figura 5.37.

5.4 Conclusiones del capítulo

El tener a la disposición un prototipo basado en el Internet de las cosas, facilita la adquisición delos parámetros de funcionamiento del panel fotovoltaico, dando así la posibilidad de crear un banco deinformación con la cual se puede realizar estudios acerca del comportamiento del sistema a estudiar.Las herramientas estadística ayudan a conocer si los datos capturados corresponden al comportamiento

65

Page 82: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

900 910 920 930 940 950 960 970 980 990 1,0000

5

10

Medición

Potenc

ia

Datos realesDatos estimados

Figura 5.37: Comparación gráfica de datos estimados contra datos reales para una topología de 9:4:2:1.

real del sistema. Los diagramas de dispersión son una forma rápida de analizar la información, ademásde conocer si existe alguna anomalía en el comportamiento de los datos. Tal es el caso de las medicionesrealizadas en la variable de humedad, la cual bajo ciertas condiciones, las mediciones adoptaban valoresde saturación y al compararlo con mediciones de una estación comercial, claramente se aprecia queno corresponden al comportamiento del fenómeno estudiado. Este comportamiento se puede debera diferentes factores, como que los sistemas están colocados en ubicaciones y altitudes deferentes, apérdidas de información durante la lectura, que exista presencia de condensaciones ha ciertas horasdel día que lleven a saturación al sensor, etc.

Para determinar el nivel de diferencias entre los sistemas, se analiza el nivel de error. Se observó queeste error disminuye si las mediciones realizadas durante el periodo nocturno, ya que las medicionesde interés solo existen durante el día.

El modelo de regresión, además de entregar un modelo matemático lineal que describe el compor-tamiento del panel, también entrega estadísticos que permiten decidir qué variables son importantes ocontribuyen a la variable de salida, y que variables no aportan una influencia significativa.

Todo este proceso se realiza con la finalidad de obtener un banco de información con un buen nivel deconfianza, que permita realizar una correcta previsión de los niveles de potencia en los paneles solares.Durante los entrenamientos de las redes neuronales, se observó que aun no existe un proceso para elegirde manera correcta una topologia de redes neuronales para un determinado conjunto de datos, ya quelos trabajos realizados en inteligencia artificial basan sus elecciones del tipo de redes a partir del laobservación de los datos, y el conocimiento empírico. La experimentación es una de muchas opcionespermite conocer cómo elegir y configurar las redes neuronales. Realizando una experimentación dondese identifican las variables de importancia (como ciclos de entrenamiento, información de entrada,número de neuronas y capas ocultas) y hacerlas variar para conocer de que manera cada una afecta ycon ello, elegir la mejor opción.

Como se pudo observar, el resultado de esta experimentación, se obtiene que para la realizaciónde estimaciones, la mejor opción le corresponde a la red 3:3:1 el cual permite realizar estimacionesde cuánta energía se puede obtener de un panel. Para la sección de previsiones, la experimentacióndemuestra que la mejor configuración consiste en una red de 9:4:2:1. Ambas redes poseen el menorerror y por ende la mejor aproximación. Si se desea disminuir el nivel de error, lo ideal es poseer unbanco de datos de mayor tamaño, ya que a mayor cantidad de información del fenómeno se tiene, mejorse puede aproximar las estimaciones, ya sea por modelos de regresión, o con el uso de redes neuronales.

66

Page 83: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Capítulo 6

Conclusiones y trabajo futuro

Básicamente todo el proceso de la tesis se basó en la captura de la información a través de un pro-totipo, la información capturada para por un proceso de filtrado con la finalidad de conocer si dichainformación entregada era válida, ya que esa información será usada para crear los conjuntos de entre-namiento que serán usadas en las redes neuronales artificiales. Después del proceso de entrenamiento,se realiza una evaluación de la respuesta de la red, y con ello hacer un reajuste de los parámetros pararepetir el proceso de entrenamiento. Este ciclo se repite hasta que se llega a un nivel de error mínimo,es en ese momento que se dice que la red posee una configuración tal que las estimaciones de potenciason lo más próximo a los datos reales.

6.1 Prototipo

El prototipo al ser un dispositivo que estaba en desarrollo posee ciertas limitaciones como la re-solución y los rangos de las mediciones, así como la continuidad de las mediciones. Para verificar siefectivamente esos valores son lo suficientemente confiables para su uso como información de entradaen una red neuronal, se realiza una comparación con una estación comercial, el cual después de unproceso de escalamiento, se realiza el calculo de la diferencia que existe entre las variables (punto apunto) para determinar cuál es la magnitud de diferencia. El estadístico que se usa para medir estadiferencia, se conoce como raíz del error medio cuadrático, concluyendo que después de un proceso dediscriminación, los datos pueden ser usados, como información para realizar estudios sobre ellos.

6.2 Correlación de las variables medidas

La selección de las variables depende directamente en la influencia que estas tiene sobre la cantidadde energía que puede producir un panel fotovoltaico. La herramienta estadística usada se conoce comonivel de correlación, el cual dice si la variable se relaciona de forma directa o indirecta, en conjuntocon la magnitud de esa relación. Con ayuda del software Minitab, los coeficientes de correlación son

67

Page 84: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

obtenidos para cada una de las variables, con la finalidad de determinar cuáles son las relacionesmás destacadas dentro de las variables a estudiar. Los niveles de correlación obtenidos durante laspruebas mostraron que las estimaciones pueden ser realizadas con solamente dos variables de entradasea iluminación y temperatura o iluminación y humedad, pero la mejor aproximación se da cuandose considera las tres variables de entrada iluminación, humedad y temperatura, por lo que se tiene laposibilidad de realizar entrenamientos con dos variables de entrada o tres variables de entrada para laestimación de la variable de salida, potencia.

6.3 Redes neuronales y sus aplicaciones

Cuando la información ya ha pasado por los procesos de filtrado, se pueden crear los grupos deentrenamiento, validación y prueba. El proceso de discriminación, y creación de los conjuntos de datos,fueron realizados en el software de Matlab. La siguiente tarea consiste en determinar para ese conjuntode datos, cuál es la configuración más adecuada para realizar tanto estimaciones instantáneas comoprevisiones a corto plazo. La determinación de la topología para las redes, consiste en determinar lacantidad de elementos de computo, la cantidad de capas ocultas, el número de entradas y salidas, asícomo de ciclos de entrenamiento. Los valores de Learning Rate y Momentum se dejaron con los valoresdefault que el software EasyNN recomienda.

6.3.1 Resultados para estimación

Partiendo de una topología aleatoria propuesta, se realiza la determinación de cada uno de los pará-metros, llegando así a la configuración de 3:3:1 con 6, 000 ciclos de entrenamiento. Esta configuraciónpermite conocer en el instante, cómo se comportará el panel bajo ciertas condiciones de funcional-mente. Esta red sería lo equivalente a una caracterización del panel, solo que en lugar de obtener unmodelo matemático, se obtiene las características de una red neuronal. Se cree además, que así comose modelo un panel solar con solo 3 elementos, es posible modelar o caracterizar otro tipo se sistemas ofenómenos, como puede ser la curva de respuesta de un material sometido a calor, modelar una reacciónquímica, modelar el comportamiento de dispersión de un líquido, etc, pero siempre considerando quese requiere una cantidad determinada de datos para tener una mejor apreciación.

6.3.2 Resultados para previsión

Con respecto a las pruebas para previsión, se realizaron además de las experimentaciones realizadaspara la estimación, se realizó la determinación de mediciones previas al dato a estimar, que en estecaso es la potencia de generación. Como resultado de las experimentaciones, se llega a una topologíaespecífica para un cierto conjunto de datos, que en este caso, corresponde a la topología 9:4:2:1, el cualconsidera hasta seis elementos previos de mediciones de potencia, las variables de iluminación humedady temperatura y con 6, 000 ciclos de entrenamiento. A pesar de todo el proceso de filtrado de datos yde entrenamiento de la red, aun existe diferencias entre los valores obtenidos y los valores estimados.Esto se debe a que aun existen otras variables que no han sido tomadas en cuenta como puede ser lavelocidad del viento, la estacionalidad, el nivel de degradación, en fin una gran cantidad de variablesque para futuros trabajos pueden ser consideradas. Otro factor que influye en el nivel de error obtenido,es la cantidad de información con el que se dispone para realizar los entrenamiento, ya que entre más seconozca el fenómeno, mejor es la estimación obtenida, es decir a mayor cantidad de mediciones, menor

68

Page 85: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

la magnitud del error. Por lo que para futuros trabajos se recomienda primero conocer la calidad y lacantidad de información con la que se dispone, para garantizar buenos resultados.

6.3.3 Trabajo futuro

Durante el desarrollo del proyecto se detectaron muchos nichos de oportunidad para mejorar losresultados. Durante la realización de la captura de la información, el prototipo presentaba ciertasinestabilidades bajo determinadas condiciones de operación, como es el caso de los días con lluvia,ya que el exceso de acumulación de humedad en los sensores, causaba alteraciones en las medicionesde humedad. Otra oportunidad de mejora consiste en realizar un cambio de sensores de variablesambientales, ya que los sensores usados no están diseñados para operar al intemperie. Para la parte derecolección de datos, la interfaz es de mucha ayuda, pero el acoplamiento de las mediciones, sería demucha utilidad que se realizara de manera automática, por lo que la implementación de un servidorpara recepción y respaldo de datos, reduciría los tiempos de preparación de datos.

Analizando la sección de análisis estadístico se observa que el ajuste es muy bueno, sin embargo secree que el considerar una mayor cantidad de variables como la velocidad del viento, la densidad denubosidad, la concentración de partículas contaminantes en el panel solar (polvo) puede favorecer almejoramiento del modelo y en consecuencia disminuir los errores de aproximación.

Desde el punto de vista de las redes neuronales, se cree de igual forma que considerar mas variablesde entrada, en conjunto con incrementar la cantidad de mediciones en la base de datos, puede contribuira mejorar el proceso de entrenamiento y de igual forma mejorar el nivel de aproximación de la redneuronal artificial.

Durante la búsqueda de los parámetros de operación de la red se observo que existen diferentescombinaciones de variables que pueden dar como resultado diferentes combinaciones de red, por loque es importante encontrar que combinación de estos factores. Desde el punto de vista estadístico,es posible aplicar un Diseño de Experimentos (Design Of Experiments, DOE) para poder determinarcon qué combinación de parámetros, una red neuronal es capaz de obtener la mejor aproximación.

Finalmente, se observó uno de los principales factores que afectan al entrenamiento y desempeñode las redes neuronales artificiales es la cantidad de datos disponible. Por lo que se propone que elprototipo siga en funcionamiento para incrementar la cantidad de mediciones ambientales, además defabricar mas prototipo para disponer de mediciones en múltiples puntos de la región.

69

Page 86: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Apéndice A

Matlab para tratamiento dedatos

A.1 Lectura y presentación de datos

Como se había mencionado antes, el prototipo entrega las mediciones de iluminación, temperatura,humedad, voltaje, corriente y potencia del panel en un intervalo de 5 minutos, además de entregarinformación del día y la hora en la que se realizó dicha medición. Al estar realizando la captura deinformación las 24 horas, el resultado obtenido son un total de 288 mediciones por variable. A partirde las mediciones realizadas, el prototipo crea un documento en formato “.csv” como el que se muestraen la Tabla A.1.

Tabla A.1: Tabla de mediciones de variables, correspon-dientes a un periodo de 24 horas

Luz Temperatura Humedad Corriente Voltaje Potencia Día Hora Minuto48087.04 32 35.08 0.66 14.98 9.92 30 12 2744851.2 32 37.87 0.64 14.97 9.65 30 12 2240847.36 31 36.86 0.66 14.97 9.92 30 12 1738840.32 31 36.62 0.66 14.97 9.82 30 12 1235010.56 30 40.45 0.6 14.94 8.99 30 12 718739.2 30 37.48 0.34 14.81 4.99 30 12 236966.4 32 33.36 0.57 14.94 8.59 30 11 5722845.44 33 34.46 0.39 14.84 5.77 30 11 5245281.28 35 31.35 0.68 14.99 10.19 30 11 4740181.76 34 33.03 0.7 15 10.53 30 11 4230474.24 32 35.24 0.6 14.95 8.99 30 11 3728579.84 33 35.77 0.57 14.92 8.47 30 11 3229368.32 34 32.45 0.61 14.95 9.15 30 11 27

Continued on next page

70

Page 87: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Tabla A.1 – Continued from previous pageLuz Temperatura Humedad Corriente Voltaje Potencia Día Hora Minuto

28743.68 32 37.27 0.63 14.96 9.46 30 11 2225323.52 34 34.36 0.65 14.97 9.77 30 11 1724535.04 29 40.74 0.66 14.97 9.83 30 11 1217536 24 50 0.52 14.9 7.74 30 11 714822.4 27 44.62 0.45 14.86 6.73 30 11 218124.8 36 31.94 0.6 14.95 9.02 30 10 5718826.24 30 41.61 0.65 14.97 9.81 30 10 5218232.32 30 40.29 0.67 14.98 10.1 30 10 4710444.8 29 42.15 0.35 14.81 5.2 30 10 4211842.56 31 38.66 0.36 14.83 5.35 30 10 3716701.44 34 34.84 0.52 14.91 7.82 30 10 3218585.6 32 38.7 0.58 14.94 8.7 30 10 2716332.8 32 38.07 0.5 14.89 7.5 30 10 2218058.24 33 36.91 0.57 14.93 8.56 30 10 1718278.4 34 34.89 0.59 14.94 8.87 30 10 1218247.68 33 38.74 0.59 14.94 8.79 30 10 718636.8 28 47.05 0.59 14.93 8.83 30 10 212262.4 26 47.91 0.36 14.82 5.39 30 9 5717658.88 27 47.65 0.52 14.9 7.71 30 9 5220679.68 28 43.95 0.56 14.93 8.41 30 9 4718263.04 25 50.01 0.49 14.88 7.33 30 9 4220531.2 28 45.61 0.54 14.91 8.1 30 9 3720183.04 27 47.28 0.53 14.91 7.94 30 9 3218979.84 22 58.78 0.5 14.9 7.53 30 9 2713506.56 22 57.83 0.36 14.82 5.27 30 9 2214003.2 24 55.76 0.39 14.84 5.73 30 9 1710252.8 21 61.48 0.28 14.79 4.21 30 9 1210472.96 22 57.9 0.29 14.79 4.31 30 9 712257.28 20 64.89 0.36 14.81 5.3 30 9 210237.44 20 66.61 0.29 14.78 4.26 30 8 5710526.72 21 64.67 0.29 14.78 4.28 30 8 526755.84 19 68.98 0.16 14.73 2.32 30 8 4711038.72 22 60.14 0.3 14.8 4.48 30 8 4213480.96 21 62.92 0.38 14.82 5.56 30 8 3710362.88 21 61.54 0.28 14.78 4.16 30 8 3211571.2 21 63.59 0.35 14.82 5.22 30 8 279935.36 20 66.83 0.32 14.8 4.72 30 8 228785.92 21 63.61 0.29 14.79 4.34 30 8 176305.28 17 76.78 0.18 14.73 2.68 30 8 1214407.68 18 75.64 0.21 14.75 3.05 30 8 79466.88 16 83.73 0.14 14.72 2.11 30 8 23742.72 15 86.56 0.08 14.69 1.15 30 7 574293.12 15 86.55 0.09 14.69 1.34 30 7 525030.4 15 87.15 0.09 14.69 1.32 30 7 475783.04 14 89.09 0.09 14.69 1.34 30 7 424285.44 14 89.08 0.07 14.68 1.02 30 7 373028.48 14 89.57 0.06 14.67 0.82 30 7 323356.16 14 88.71 0.06 14.67 0.9 30 7 273235.84 13 91.38 0.06 14.67 0.82 30 7 22

Continued on next page

71

Page 88: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Tabla A.1 – Continued from previous pageLuz Temperatura Humedad Corriente Voltaje Potencia Día Hora Minuto

2481.92 13 93.51 0.05 14.66 0.68 30 7 171900.8 12 95.97 0.04 14.66 0.54 30 7 121547.52 12 96.66 0.03 14.65 0.4 30 7 71197.44 12 99.56 0.02 14.66 0.29 30 7 2843.52 11 100 0.01 14.65 0.2 30 6 57528.32 11 100 0.01 14.65 0.13 30 6 52277.76 11 100 0 14.65 0.05 30 6 47128 11 100 0 14.64 0.01 30 6 4248.96 11 100 0 11.41 0 30 6 3717.22 11 99.33 0 6.45 0 30 6 324.74 12 97.72 0 2.28 0 30 6 271.31 12 97.25 0 0.68 0 30 6 220.35 12 97.03 0 0.2 0 30 6 170.11 12 97.12 0 0.07 0 30 6 120.04 12 95.8 0 0.04 0 30 6 70.03 12 95.74 0 0.03 0 30 6 20.02 12 95.42 0 0.03 0 30 5 570.02 12 95.76 0 0.03 0 30 5 520.02 12 95.6 0 0.03 0 30 5 470.02 12 94.97 0 0.03 0 30 5 420.01 12 96.83 0 0.03 0 30 5 370.01 12 98.04 0 0.03 0 30 5 320.02 12 98.18 0 0.03 0 30 5 270.02 12 97.68 0 0.03 0 30 5 220.02 12 97.94 0 0.03 0 30 5 170.02 12 97.23 0 0.03 0 30 5 120.02 12 96.68 0 0.03 0 30 5 70.02 12 98.1 0 0.03 0 30 5 20.02 12 96.45 0 0.03 0 30 4 570.02 12 96.04 0 0.03 0 30 4 520.02 12 96.12 0 0.03 0 30 4 470.02 12 95.32 0 0.03 0 30 4 420.01 12 95.42 0 0.03 0 30 4 370.01 12 94.84 0 0.03 0 30 4 320.03 13 94.64 0 0.03 0 30 4 270.03 13 93.95 0 0.03 0 30 4 220.02 13 93.07 0 0.03 0 30 4 170.01 13 92.94 0 0.03 0 30 4 120.03 13 93.32 0 0.03 0 30 4 70.01 13 93.82 0 0.03 0 30 4 20.01 13 94.74 0 0.02 0 30 3 570.01 13 93.43 0 0.02 0 30 3 520.01 13 93.63 0 0.03 0 30 3 470.01 13 93.39 0 0.02 0 30 3 420.01 13 93.14 0 0.02 0 30 3 370.03 13 92.96 0 0.02 0 30 3 320.03 13 92.89 0 0.02 0 30 3 270.01 13 93.26 0 0.02 0 30 3 220.01 13 93.15 0 0.02 0 30 3 17

Continued on next page

72

Page 89: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Tabla A.1 – Continued from previous pageLuz Temperatura Humedad Corriente Voltaje Potencia Día Hora Minuto0.01 13 92.48 0 0.03 0 30 3 120.03 13 91.44 0 0.03 0 30 3 70.03 13 91.86 0 0.02 0 30 3 20.02 13 91.48 0 0.02 0 30 2 570.01 14 90.75 0 0.02 0 30 2 520.02 13 90.03 0 0.02 0 30 2 470.03 14 89.95 0 0.03 0 30 2 420.03 14 89.99 0 0.03 0 30 2 370.03 14 90.32 0 0.03 0 30 2 320.03 14 90.41 0 0.03 0 30 2 270.03 14 90.52 0 0.03 0 30 2 220.03 14 89.99 0 0.03 0 30 2 170.03 14 88.97 0 0.02 0 30 2 120.03 14 88.43 0 0.02 0 30 2 70.02 15 87.88 0 0.02 0 30 2 20.02 15 87.75 0 0.02 0 30 1 570.03 15 87.59 0 0.03 0 30 1 520.04 15 87.52 0 0.03 0 30 1 470.04 15 87.48 0 0.03 0 30 1 420.04 15 87.57 0 0.03 0 30 1 370.03 15 87.61 0 0.03 0 30 1 320.03 15 87.82 0 0.03 0 30 1 270.03 15 87.73 0 0.03 0 30 1 220.03 15 87.27 0 0.03 0 30 1 170.03 15 87.09 0 0.03 0 30 1 120.02 15 86.96 0 0.02 0 30 1 70.03 15 87 0 0.02 0 30 1 20.03 15 86.93 0 0.03 0 30 0 570.03 15 86.92 0 0.02 0 30 0 520.03 15 86.84 0 0.03 0 30 0 470.03 15 87.01 0 0.03 0 30 0 420.04 15 86.85 0 0.03 0 30 0 370.04 15 86.51 0 0.03 0 30 0 320.04 15 86.72 0 0.03 0 30 0 270.04 15 86.41 0 0.03 0 30 0 220.03 15 86.15 0 0.03 0 30 0 170.03 15 86.29 0 0.03 0 30 0 120.03 15 86.16 0 0.02 0 30 0 70.03 15 86.09 0 0.03 0 30 0 20.03 15 85.89 0 0.02 0 29 23 570.02 15 86.4 0 0.02 0 29 23 520.02 15 86.13 0 0.02 0 29 23 470.02 15 86.37 0 0.02 0 29 23 420.02 15 86.43 0 0.02 0 29 23 370.02 15 86.34 0 0.02 0 29 23 320.02 15 86.1 0 0.02 0 29 23 270.02 15 85.8 0 0.02 0 29 23 220.02 15 85.7 0 0.02 0 29 23 170.02 16 85.4 0 0.02 0 29 23 12

Continued on next page

73

Page 90: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Tabla A.1 – Continued from previous pageLuz Temperatura Humedad Corriente Voltaje Potencia Día Hora Minuto0.02 16 85.05 0 0.02 0 29 23 70.02 16 84.85 0 0.02 0 29 23 20.03 16 84.86 0 0.02 0 29 22 570.03 16 84.74 0 0.03 0 29 22 520.04 16 83.34 0 0.03 0 29 22 470.06 16 82.95 0 0.03 0 29 22 420.05 16 83.02 0 0.03 0 29 22 370.05 16 83.08 0 0.03 0 29 22 320.05 16 83.23 0 0.04 0 29 22 270.05 16 82.97 0 0.03 0 29 22 220.05 16 82.65 0 0.03 0 29 22 170.05 16 82.2 0 0.03 0 29 22 120.05 16 80.87 0 0.03 0 29 22 70.05 17 81.01 0 0.03 0 29 22 20.05 17 80.6 0 0.04 0 29 21 570.05 17 80.97 0 0.04 0 29 21 520.05 17 80.99 0 0.04 0 29 21 470.05 17 80.82 0 0.03 0 29 21 420.05 17 80.38 0 0.03 0 29 21 370.05 17 79.8 0 0.03 0 29 21 320.05 17 79.53 0 0.03 0 29 21 270.06 17 79.2 0 0.04 0 29 21 220.06 17 78.92 0 0.04 0 29 21 170.05 17 78.94 0 0.03 0 29 21 120.04 17 78.92 0 0.03 0 29 21 70.04 17 78.83 0 0.03 0 29 21 20.04 17 79.16 0 0.03 0 29 20 570.03 17 80.05 0 0.03 0 29 20 520.02 17 78.7 0 0.02 0 29 20 470.02 17 79.1 0 0.02 0 29 20 420.03 17 78.67 0 0.02 0 29 20 370.02 17 78.04 0 0.02 0 29 20 320.03 17 78.25 0 0.02 0 29 20 270.02 17 77.25 0 0.02 0 29 20 220.03 17 77.37 0 0.02 0 29 20 170.03 17 77.56 0 0.03 0 29 20 120.03 18 77.22 0 0.03 0 29 20 70.03 18 77.74 0 0.02 0 29 20 20.03 18 77.36 0 0.03 0 29 19 570.03 18 76.48 0 0.03 0 29 19 520.04 18 77.54 0 0.03 0 29 19 470.04 18 74.41 0 0.03 0 29 19 420.05 18 74.85 0 0.04 0 29 19 370.05 18 75.4 0 0.04 0 29 19 320.05 18 77.28 0 0.03 0 29 19 270.05 18 76.95 0 0.03 0 29 19 220.05 18 76.39 0 0.03 0 29 19 170.05 18 76.87 0 0.03 0 29 19 120.05 18 77.33 0 0.04 0 29 19 7

Continued on next page

74

Page 91: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Tabla A.1 – Continued from previous pageLuz Temperatura Humedad Corriente Voltaje Potencia Día Hora Minuto0.05 18 78.65 0 0.04 0 29 19 20.05 18 79.29 0 0.04 0 29 18 570.03 18 78.72 0 0.03 0 29 18 520.04 18 78.1 0 0.03 0 29 18 470.07 18 77.82 0 0.05 0 29 18 420.24 18 77.27 0 0.14 0 29 18 370.97 18 75.22 0 0.54 0 29 18 323.72 18 73.35 0 1.87 0 29 18 2713.75 18 73.42 0 5.47 0 29 18 2241.74 19 71.94 0 10.53 0.01 29 18 1793.92 19 71.8 0 14.05 0 29 18 12180.64 19 69.79 0 14.64 0.04 29 18 7312 19 68.42 0 14.65 0.05 29 18 2

453.12 20 66.46 0.01 14.64 0.09 29 17 57632.96 20 65.54 0.01 14.65 0.14 29 17 52901.76 20 63.85 0.01 14.65 0.22 29 17 471155.2 21 63.46 0.02 14.65 0.29 29 17 421246.72 21 62.93 0.02 14.66 0.31 29 17 371422.08 21 59.81 0.03 14.65 0.38 29 17 321589.76 21 58.7 0.03 14.65 0.44 29 17 271847.04 22 58.99 0.04 14.66 0.54 29 17 222219.52 22 57.7 0.04 14.66 0.63 29 17 172528 21 56.39 0.05 14.66 0.72 29 17 12

2872.32 21 56.03 0.05 14.67 0.81 29 17 72782.72 22 55.83 0.05 14.66 0.77 29 17 23023.36 22 53.77 0.06 14.68 0.84 29 16 573161.6 22 54.95 0.06 14.67 0.88 29 16 523279.36 22 52.9 0.06 14.67 0.93 29 16 473635.2 22 53.68 0.07 14.68 1.09 29 16 423860.48 22 52.69 0.08 14.68 1.18 29 16 373804.16 22 52.61 0.07 14.68 1.06 29 16 323750.4 22 53.2 0.08 14.68 1.1 29 16 274075.52 22 53.18 0.08 14.68 1.19 29 16 224418.56 23 50.13 0.09 14.68 1.36 29 16 175473.28 23 52.29 0.11 14.69 1.64 29 16 126568.96 24 50.68 0.14 14.71 2.01 29 16 77398.4 24 50.42 0.16 14.72 2.32 29 16 27462.4 24 48.46 0.17 14.72 2.44 29 15 577047.68 24 48 0.15 14.71 2.2 29 15 528266.24 27 42.43 0.19 14.74 2.84 29 15 4711427.84 30 35.33 0.3 14.79 4.45 29 15 4213521.92 29 37.66 0.36 14.82 5.39 29 15 3711525.12 28 41.11 0.3 14.79 4.38 29 15 3211765.76 27 41.66 0.29 14.78 4.33 29 15 279999.36 25 44.9 0.23 14.75 3.35 29 15 229638.4 25 46.59 0.2 14.75 3.02 29 15 178724.48 25 44.53 0.18 14.73 2.69 29 15 128184.32 29 40.07 0.18 14.73 2.6 29 15 716327.68 29 38.77 0.42 14.85 6.18 29 15 2

Continued on next page

75

Page 92: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Tabla A.1 – Continued from previous pageLuz Temperatura Humedad Corriente Voltaje Potencia Día Hora Minuto

19957.76 30 36.03 0.5 14.9 7.45 29 14 5715339.52 29 41.62 0.35 14.81 5.15 29 14 5222681.6 29 39.18 0.51 14.9 7.65 29 14 4723941.12 32 34.9 0.52 14.9 7.74 29 14 4221217.28 36 30.67 0.44 14.86 6.52 29 14 3729112.32 33 33.83 0.56 14.92 8.29 29 14 3235450.88 31 35.82 0.58 14.93 8.63 29 14 2736433.92 29 39.53 0.59 14.93 8.77 29 14 2236270.08 30 38.46 0.59 14.94 8.76 29 14 1730443.52 28 43.88 0.56 14.91 8.28 29 14 1232614.4 33 34.63 0.54 14.91 8.01 29 14 719374.08 29 39.95 0.36 14.82 5.34 29 14 217607.68 28 45.04 0.33 14.8 4.89 29 13 5737027.84 31 37.5 0.63 14.96 9.34 29 13 5216102.4 29 42.47 0.31 14.8 4.57 29 13 4743130.88 33 34.57 0.66 14.98 9.88 29 13 4252817.92 32 35.88 0.7 14.99 10.53 29 13 3736403.2 29 41.74 0.53 14.91 7.85 29 13 3224084.48 33 34.82 0.39 14.84 5.82 29 13 2747185.92 34 32.17 0.61 14.95 9.1 29 13 2254558.72 32 36.6 0.74 15.01 11.03 29 13 1756360.96 30 39.5 0.77 15.03 11.61 29 13 1229440 34 31.66 0.44 14.86 6.58 29 13 7

54231.04 33 35.02 0.69 14.99 10.3 29 13 252326.4 29 39.73 0.7 15 10.56 29 12 5752305.92 31 37.2 0.73 15 10.89 29 12 5213122.56 29 42.47 0.25 14.77 3.64 29 12 4783865.6 35 36.98 0.65 14.97 9.81 29 12 4246284.8 30 41.69 0.71 15 10.69 29 12 3741267.2 28 43.52 0.67 14.98 10.09 29 12 32

Las mediciones de la Tabla A.1 al solo ser valores numéricos, es un poco difícil apreciar el compor-tamiento de las variables monitoreadas en sistema fotovoltaico, por lo que se usa Matlab para crearlas figuras a partir de los documentos “.csv”, por lo que se crea un algoritmo para leer los valores deldocumento y se crea las imágenes.

La primera parte de este código consiste en leer los valores contenidos en el documento.

1 f i l e = ’med_matlab.csv’ ; %se guarda el nombre del archivo2 h=csvread ( f i l e ) ; %lectura de archivo3 luxe=h ( : , 1 ) ;4 lux = luxe / 0 . 5 5 ; %atenuacion en el sensor de luz5 temp=h ( : , 2 ) ;6 hum=h ( : , 3 ) ;7 vo l t=h ( : , 5 ) ;8 curr=h ( : , 4 ) ;

76

Page 93: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

9 wat=h ( : , 6 ) ;10 t1=s ize ( lux , 1 ) ; %tamano del vector de datos11 tm=0:1: t1−1;

Las mediciones realizadas son almacenadas en variables que llevan su respectivo nombre, como luxque corresponde a la variable que almacena las mediciones de iluminación, temp corresponde a lasmediciones de temperatura, la variable hum contiene las mediciones de humedad y de igual maneracon las variables de voltaje, corriente y potencia. Cuando se dispone de toda la información es posiblegratificarla, para este caso se opta por la representación de múltiples figuras en una sola ventana, portal motivo, se utiliza la opción subfigure para crear la figura del perfil del nivel de iluminación.

1 f igure (1 )2 subplot ( 3 , 2 , 1 ) , plot (tm , f l i p ( lux ) ) ;3 ylim ( [ 0 110000 ] )4 xlim ( [ 0 4065 ] )5 t i t l e (’Lighting chart’ )6 ylabel (’Lux’ ) , xlabel (’Measurements’ ) ;

Para mantener un estándar en las gráficas, se fijan los límites para el eje x y el eje y, tanto paraesta gráfica como para las gráficas de las otras variables. Estas mismas líneas de código se repitenpara mostrar las gráficas de las demás variables.Las siguientes lineas de código muestran la gráfica detemperatura.

1 subplot ( 3 , 2 , 3 ) , plot (tm , f l i p ( temp) ) ;2 xlim ( [ 0 4065 ] )3 t i t l e (’Temperature chart’ )4 ylabel (’Celsius degrees’ ) , xlabel (’Measurements’ ) ;

Las siguientes lineas de código muestran la gráfica de humedad.

1 subplot ( 3 , 2 , 5 ) , plot (tm , f l i p (hum) ) ;2 xlim ( [ 0 4065 ] )3 t i t l e (’Humidity chart’ )4 ylabel (’Percentage’ ) , xlabel (’Measurements’ ) ;

Las siguientes lineas de código muestran la gráfica de potencia.

1 subplot ( 3 , 2 , 2 ) , plot (tm , f l i p (wat ) ) ;2 xlim ( [ 0 4065 ] )3 t i t l e (’Power chart’ )4 ylabel (’Watts’ ) , xlabel (’Measurements’ ) ;

Las siguientes lineas de código muestran la gráfica de voltaje.

1 subplot ( 3 , 2 , 4 ) , plot (tm , f l i p ( vo l t ) ) ;2 xlim ( [ 0 4065 ] )3 t i t l e (’Voltage chart’ )4 ylabel (’Volts’ ) , xlabel (’Measurements’ ) ;

Las siguientes lineas de código muestran la gráfica de corriente.

77

Page 94: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

1 subplot ( 3 , 2 , 6 ) , plot (tm , f l i p ( curr ) ) ;2 xlim ( [ 0 4065 ] )3 t i t l e (’Current chart’ )4 ylabel (’Amperes’ ) , xlabel (’Measurements’ ) ;

78

Page 95: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Apéndice B

EassyNN

En esta sección se muestra paso a paso como se utiliza el software “Eassy Neural Network (EassyNN)”para el entrenamiento de redes neuronales. Este programa es usado como software de apoyo en las clasesimpartidas por el Doctor Yvo Marcelo Chiaradia Masselli en el Instituto Nacional de Telecomunicações- Inatel en la ciudad de Santa Rita do sapucaí, Brasil.

B.1 Preparación de datos

La información que será usada debe de ser de una fuente confiable, ya que los resultados obtenidosdel entrenamiento dependen en gran medida de la calidad de los datos.

La información a usar será dividida en tres grandes grupos, como se menciona en el Capítulo 2,cada grupo tiene un porcentaje del total de datos. Por lo que el software requerirá de 3 archivos comolos que se muestran en la Figura B.1.

Estos archivos tienen una cabecera con los nombres de las variables, ya se servirá como referenciapara que el software pueda reconocer la columna de cada variable, cada vez que se realice la importaciónde los datos.

B.2 Creación de conjuntos de entrenamiento

La creación del conjunto de datos para entrenamiento, se tiene que realizar dentro del entornodel software. Por lo que es necesario ingresar al área de trabajo. La distribución de las herramientasdentro del área de trabajo son mostradas en la Figura B.2. La sección “A” engloba las herramientas quepermiten la creación de nuevos espacios de trabajo, abrir proyectos existentes, importar informacióny guardar avances. La sección “B” tiene herramientas que reinician los valores de los pesos en lared, verifica la distribución de la información para la búsqueda de mediciones atípicas, crear una

79

Page 96: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Figura B.1: Conjuntos de entrenamiento, validación y prueba en formato “.csv”.

nuevas topologías de redes neuronales, ajustar los parámetros de entrenamiento e inicio del procesode aprendizaje. Finalmente la sección “C”, que contiene las herramientas que permiten mostrar lainformación de la red con la se que está trabajando, proyecta de manera gráfica la configuración de lared y muestra gráficas resultantes del proceso de aprendizaje.

Figura B.2: Área de trabajo para la creación y entrenamiento de redes neuronales.

Identificadas las herramientas básicas, se procede a importar las mediciones de los datos, al entornodel software para cada uno de los conjuntos de datos, por lo que dentro del área de trabajo, se crea

80

Page 97: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

un nuevo documento y se sigue la siguiente secuencia para importar los archivos necesarios, archivo->importar. Seguido de esto, aparecerá una ventana como la que se muestra en la Figura B.3, el cualmostrará un explorador de archivos el cual permite elegir los archivos que contienen la información aimportar, los cuales en la Figura B.3 son resaltados en un recuadro en color rojo.

Figura B.3: Área de trabajo para la creación y entrenamiento de redes neuronales.

Seleccionando uno de los tres archivos, se despliega una ventana la cual permite seleccionar deque manera importar la información. Como se aprecia en la Figura B.4, la ventana se enfoca en tresprincipales secciones. La primera permite elegir que caracteres indican la separación entre columnas,que en este caso, son separadas por coma. La segunda sección consiste en la asignación de nombresde las filas, las cuales pueden ser números o la primer letra de la primera linea de celdas de laspropias columnas. La tercer sección se enfoca en elegir a qué tipo de información corresponde losdatos importados, los cuáles pueden ser de entrenamiento, validación o prueba. Para este ejemplo seespecifica que la información es separada por coma, se usa números para identificar las filas y se indicaque la información corresponde a datos de entrenamiento.

Figura B.4: Opciones de identificación de datos para conjuntos de datos en redes neuronales.

A continuación se muestra una ventana con los nombres encontrados en las celdas correspondientes,por lo que dando click en “poner nombres” coloca las palabras encontradas a las columnas correspon-dientes.

81

Page 98: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

El último paso del proceso de importación, consiste en la selección de columnas como entrada ycomo salida, además de especificar a que tipo de variables pertenecen. Como se aprecia en la B.5(a) esposible seleccionar el tipo de variable que puede ser del tipo real, tipo integer, tipo boleano entre otros,además de poder seleccionar si la columna corresponde a un valor de entrada o un valor de salida.

(a) Variable de iluminación. (b) Variable de temperatura.

(c) Variable de humedad. (d) Variable de potencia de salida.

Figura B.5: Selección del tipo de columna para los conjuntos de datos.

Una vez realizado este proceso, el software generará un archivo proprio con terminación “.tvq” quecontendrá toda la información antes configurada. Hasta este punto, la información que corresponde alconjunto de entrenamiento esta lista para ser usada, restando agregar la información correspondientea los conjuntos de validación y prueba, realizando el mismo procedimiento.

B.3 Selección de parámetros de entrenamiento

Prosiguiendo con el proceso de desarrollo, el siguiente paso es ajustar la topología de la red y delos parámetros de entrenamiento. Cuando los conjuntos de datos se encuentran listos para ser usados,se utiliza la herramienta de crear una nueva red, la cual fue mostrado en la Figura B.2 en la secciónB. Esta herramienta permite seleccionar la cantidad de capas ocultas que tendrá la red, y la cantidad

82

Page 99: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

de neuronas que tendra cada una de estas capas, usando como ejemplo la Figura B.7, la configuraciónse ajusta a solo una capa oculta con tres neuronas.

Figura B.6: Opciones de identificación de datos para conjuntos de datos en redes neuronales.

Ya que se realiza el análisis de una topología a la vez, las opciones de incrementar de maneraautomática la cantidad de neuronas, no son de interés, por lo que se prosigue con la configuración de losparámetros de entrenamiento. Nuevamente en las herramientas de la sección b de la figura Figura B.2,se utiliza la herramienta de “cambio de controles”, la cual despliega un panel de configuración comoel que se muestra en ??. El panel de configuración se divide en siete secciones. La primera secciónpermite ajustar los valores de Lerarning rate y Momentum, los cuales por default corresponden a 0.60y 0.80 respectivamente. La segunda sección corresponde a las opciones de incremento automático dela red, este se ignora ya que no es de interés para este estudio. La tercera sección corresponde a lacantidad de ciclos de entrenamiento previos a la validación de la red.La cuarta sección solo realiza elproceso se aprendizaje más lento, seleccionando la cantidad de milisegundos. Las últimas tres seccionescorresponden a los criterios de parada, como el nivel de error deseado, la cantidad de datos de validaciónusados y los ciclos o tiempo de entrenamiento. Para este ejemplo se ajusta los criterios de parada: a)unnivel de error deseado de 0.001, b) cuando el 100 % de los datos de validación ha sido usados y c)cuando se cumplan 10, 000 ciclos de entrenamiento.

Figura B.7: Opciones de identificación de datos para conjuntos de datos en redes neuronales.

Una vez que se tiene los parametros de entrenamiento listos, la topología seleccionada, y los datosimportados, solo resta iniciar el proceso de entrenamiento, el cual se realiza ya sea de manera automá-tica cuando se termina de ingresar los parámetros, o de manera manual con la herramienta de inicio

83

Page 100: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

de aprendizaje mostrada en la Figura B.2 en la sección B.

B.4 Interpretación de resultados

Una vez que se a cumplido alguno de los criterios de parada, se dice que el proceso de entrenamientoha terminado, por lo que resta conocer cuál fue el desempeño de la configuración seleccionada. Comose mostró anteriormente, en la Figura B.2 en la sección C, se tiene las herramientas que muestra cuáles el resultado del entrenamiento realizado. Como primer paso, los resultados de la red son mistradosen la misma área de trabajo, como se muestra en la Figura B.8. Debido a que la red ya paso por unproceso de aprendisaje, los resultados contenidos en el recuadro rojo, son actualizados con los nuevosvalores.

Figura B.8: Valores resultantes de la estimación, después del proceso de entrenamiento.

El diagrama de la red usada es mostrada en la Figura B.9, se aprecia la cantidad de neuronas usadasy la cantidad de capas ocultas usadas. Además se puede apreciar la contribución de cada una de lasvariables, a través de los pesos sinápticos, los cuales al ser de color verde indican una contribuciónpositiva, caso contrario, cuando el peso es representado por el color rojo, indica que la variable tieneuna contribución negativa. Para este caso, la variable de iluminación posee la mayor contribuciónpositiva, mientras que la temperatura realiza la mayor contribución negativa y la humedad realiza unamínima contribución positiva.

Una técnica usada por este programa para analizar el desempeño de la red, es a través del análisisvisual de una nube de puntos como la que se muestra en la Figura B.10, el cual es formado porgraficar los datos reales contra los datos obtenidos, si la red tiene un buen desempeño (mínimo errorde aproximación) los puntos graficados tenderán a formar una linea diagonal, por lo que a mayordefinición de esta linea, mejor la aproximación y caso contrario, si los puntos resultantes tienden aestar difusos, el nivel de aproximación de la red será baja, por lo que será necesario realizar ajustes enla red y repetir el proceso de entrenamiento.

Para este caso se observa que la nube formada por los datos de validación tienden a formar digralinea inclinada, por lo que se puede concluir que el proceso de validación fue bueno, pero que aun se

84

Page 101: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Figura B.9: Valores resultantes de la estimación, después del proceso de entrenamiento.

Figura B.10: Nube de puntos correspondientes al conjunto de datos de validación y prueba.

puede mejorar, ya se realizando ajustes en los parametros de entrenamiento, cambiando los criterios deparada o incrementando la cantidad de valores en los conjuntos de datos usados. La siguiente gráficacorresponde a los puntos obtenidos del conjunto de datos de prueba o resultados finales. Se apreciade igual manera que los puntos tienden a formar la recta inclinada. La ligera dispersión de los datosmuestra que existe un nivel de error en la estimación realizada por la red, por lo que es importanteconsiderar ese error en la aplicación final.

85

Page 102: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Apéndice C

Minitab

Minitab es uno de los software más usados para análisis, ya que pose gráficas y recursos estadísticosefectivos además de interfaces intuitivas. En esta sección se mostrará como usar el software para análisisde correlación y análisis ANOVA.

C.1 Interfaz de usuario de Minitab

Cuando se abre el software, de manera predeterminada que esta compuesta por tres secciones comose muestra en la Figura C.1.

La ventana sesión muestra los resultados de sus análisis en formato de texto. Además, en estaventana, puede ingresar comandos de sesión en la sección de la Línea de comandos en lugar deusar los menús de Minitab.

La hoja de trabajo, que es similar a una hoja de cálculo, es donde se ingresa y organiza los datos.Se puede abrir múltiples hojas de trabajo

La tercera ventana, Project Manager, está minimizada debajo de la hoja de trabajo.

C.2 Exportar datos

Los archivos utilizados en el proyecto (.MPJ) almacenan los siguientes elementos:

Hojas de trabajo.

Gráficas.

86

Page 103: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Figura C.1: Interfaz de usuario de Minitab.

Salida de la venta Sesión.

Historial de comandos.

Dentro de la hoja de trabajo, al trabajarse con celdas (muy similar a una hoja de calculo) laintroducción de la información es relativamente fácil, ya que solo se tiene que copiar los elementos dela fuente de información y pegarlos en la hoja de trabajo, posteriormente asignar un nombre a cadauna de las columnas, tal como aparece en la Figura C.2.

Figura C.2: Importación de datos para el análisis estadístico.

87

Page 104: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

C.3 Análisis de correlación de los datos

Como se explicó en Capítulo 4 el nivel de correlación de pearson evalúa la relación lineal que existeentre dos variables continuas. El valor de esta correlación puede variar entre valores de +1 y -1, dondeun valor positivo corresponde a una relación directa positiva, un valor negativo corresponde a unarelación directa negativa y un valor de 0 corresponde a una no relación. Minitab ofrece la herramientade análisis de correlación, la cual se puede localizar en Estadística >Estadística básica >Correlación,como se muestra en la Figura C.3

Figura C.3: Herramienta de análisis de correlación.

Una vez que se tiene iniciada la herramienta, aparece una ventana en donde se podrá elegir lasvariables a analizar, como se aprecia en la Figura C.4 se desea conocer cual es la relación que existeentre todas las variables de entrada y la variable de salida.

Figura C.4: Panel de selección de variables para el análisis de correlación.

88

Page 105: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

El resultado del análisis es mostrado en la salida de la ventana de sesión como se aprecia enla Figura C.5. Los resultados son mostrados en un arreglo tipo matriz, la cual muestra los valoresobtenidos de la relación que existe entre las variables seleccionadas. Para este ejemplo se aprecia queexiste una relación directa positiva entre la potencia de salida y la iluminación, obteniendo un valor de0.952, existe otra relación directa positiva entre la potencia de salida y la temperatura, que correspondea un valor de 0.851. Finalmente se aprecia que existe una relación directa negativa entre la potenciade salida y el nivel de humedad, obteniendo un valor de −0.789.

Figura C.5: Resultados para el análisis de correlación.

Los valores obtenidos permiten determinar en que manera afectan las variables Luz (iluminación),Temp (temperatura) y Hum(humedad) a la variable de respuesta Pot (Potencia de salida). Con elresto de los resultados del análisis también se puede observar que existe una relacion positiva entrela iluminacion y la temperatura, con un valor de 0.857, mientras que la relación que existe entrela humedad y la iluminación es negativa, ya que pose un valor de −0.761. Todas estas conclusionespermiten llegar a la idea de que a mayor iluminación y menor humedad, la potencia de salida del panelincrementará. Pero también se puede determinar que a mayor iluminación, la humedad disminuye.

C.4 Modelo de regresión de los datos

Como se explicó en el Capítulo 4, el modelo regresión tiene como objetivo principal modelar mate-máticamente la relación que existe entre una variable x y una variable y. La obtención de este modelocon ayuda del software se realiza como se muestra en la Figura C.6, en el menú Estadística >Regresión>Regresión >Modelo de regresión ajustada.

Seleccionada la herramienta, se despliega un panel como el que se muestra en la Figura C.7desdedonde se eligen las variables a analizar. En un recuadro se seleccionan las variables de entrada, quepara este caso corresponden a las variables Luz, Hum y Temp. En el segundo recuadro se seleccionala variable de salida que corresponde a la variable Pot.

Nuevamente el resultado del análisis es mostrado en el recuadro de sesión, donde se pueden observardiversos resultados como se aprecia en la Figura C.8, la primera corresponde a unas gráficas residuales

89

Page 106: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Figura C.6: Herramienta de regresión.

Figura C.7: Panel de selección de variables de salida y variables de entrada.

las cuales sirven de apoyo visual para saber si los resultados del modelo de regresión cumplen con lossupuestos de aleatoriedad, tendencia, independencia y distribución. La segunda parte de resultadoscorresponde al texto desplegado el cual corresponde a un análisis ANOVA, que permite a travésdel pvalor realizar pruebas de hipótesis para concluir si las variables de entrada afectan de manerasignificativa a la variable de salida. Se muestra además los valores de r2, este estadístico indica quetan bien se ajusta el modelo al comportamiento real del fenómeno estudiado.

Finalmente dentro de la misma sección de sesión se aprecia el modelo de regresión resultante, el cualse muestra encerrado en un recuado rojo en la Figura C.9. Este modelo es usado dentro del Capítulo 5para realizar la comparación con la respuesta de una red neuronal artificial para la estimación de losdatos.

90

Page 107: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Figura C.8: Resultados de análisis ANOVA.

Figura C.9: Modelo de regresión.

91

Page 108: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Bibliografía

[1] J. Corona-Ventura, “Caracterizaciøn de paneles solares utilizando el internet de las cosas,” pp.20–32, 2019.

[2] I. El Kafazi, R. Bannari, and A. Abouabdellah, “Modeling and forecasting energy demand,” inRenewable and Sustainable Energy Conference (IRSEC), 2016 International. IEEE, 2016, pp.746–750.

[3] C. F. de Electricidad., “Empresa Productiva del Estado COMISIÓN FEDERAL DE ELECTRI-CIDAD,” p. 396, 2016.

[4] E. Muljadi, M. Singh, and V. Gevorgian, “Pscad modules representing pv generator,” NationalRenewable Energy Laboratory (NREL), Golden, CO., Tech. Rep., 2013.

[5] L. Li, K. Ota, and M. Dong, “Everything is image: Cnn-based short-term electrical load forecastingfor smart grid,” in 2017 14th International Symposium on Pervasive Systems, Algorithms andNetworks & 2017 11th International Conference on Frontier of Computer Science and Technology& 2017 Third International Symposium of Creative Computing (ISPAN-FCST-ISCC). IEEE,2017, pp. 344–351.

[6] H. Cheng, W.-s. Cao, and P.-j. Ge, “Forecasting research of long-term solar irradiance and outputpower for photovoltaic generation system,” in Computational and Information Sciences (ICCIS),2012 Fourth International Conference on. IEEE, 2012, pp. 1224–1227.

[7] M. Bashari, A. Rahimi-Kian, and S. Farhangi, “Forecasting generation of a pv power plant witha little data-set using information fusion,” in Smart Grid Conference (SGC), 2014. IEEE, 2014,pp. 1–6.

[8] O. Şenkal and T. Kuleli, “Estimation of solar radiation over turkey using artificial neural networkand satellite data,” Applied Energy, vol. 86, no. 7, pp. 1222–1228, 2009.

[9] J. Alonso-Montesinos and F. J. Batlles, “Solar radiation forecasting in the short-and medium-termunder all sky conditions,” Energy, vol. 83, pp. 387–393, 2015.

[10] N. Sharma, P. Sharma, D. Irwin, and P. Shenoy, “Predicting solar generation from weather fo-recasts using machine learning,” in Smart Grid Communications (SmartGridComm), 2011 IEEEInternational Conference on. IEEE, 2011, pp. 528–533.

[11] F. Pasila, S. Ronni, L. H. Wijaya et al., “Long-term forecasting in financial stock market usingaccelerated lma on neuro-fuzzy structure and additional fuzzy c-means clustering for optimizingthe gmfs.” in Neural Networks, 2008. IJCNN 2008.(IEEE World Congress on Computational In-telligence). IEEE International Joint Conference on. IEEE, 2008, pp. 3961–3966.

92

Page 109: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

[12] D. Y. Kononov, “New requirements and approaches to the long-term forecasting of electricityprices,” in Power Tech, 2005 IEEE Russia. IEEE, 2005, pp. 1–6.

[13] G. Peng and Q. Luo, “Development of the long-term forecast system based on the neural networkof the potato late blight in liangshan prefecture,” in Natural Computation (ICNC), 2010 SixthInternational Conference on, vol. 1. IEEE, 2010, pp. 228–232.

[14] M. Zhu and J. Zhang, “Research of product oil demand forecast based on the combination forecastmethod,” in 2010 International Conference on E-Business and E-Government. IEEE, 2010, pp.796–798.

[15] A. Garcia-Pedrero and P. Gomez-Gil, “Time series forecasting using recurrent neural networksand wavelet reconstructed signals,” in Electronics, Communications and Computer (CONIELE-COMP), 2010 20th International Conference on. IEEE, 2010, pp. 169–173.

[16] A. Baliyan, K. Gaurav, and S. K. Mishra, “A review of short term load forecasting using artificialneural network models,” Procedia Computer Science, vol. 48, pp. 121–125, 2015.

[17] S. Sobri, S. Koohi-Kamali, and N. A. Rahim, “Solar photovoltaic generation forecasting methods:A review,” Energy Conversion and Management, vol. 156, pp. 459–497, 2018.

[18] C. Wan, J. Zhao, Y. Song, Z. Xu, J. Lin, and Z. Hu, “Photovoltaic and solar power forecastingfor smart grid energy management,” CSEE Journal of Power and Energy Systems, vol. 1, no. 4,pp. 38–46, 2015.

[19] J. Ma and X. Ma, “State-of-the-art forecasting algorithms for microgrids,” in Automation andComputing (ICAC), 2017 23rd International Conference on. IEEE, 2017, pp. 1–6.

[20] M. Brenna, F. Foiadelli, M. Longo, and D. Zaninelli, “Solar radiation and load power consumptionforecasting using neural network,” in Clean Electrical Power (ICCEP), 2017 6th InternationalConference on. IEEE, 2017, pp. 726–731.

[21] C. Monteiro, T. Santos, L. A. Fernandez-Jimenez, I. J. Ramirez-Rosado, and M. S. Terreros-Olarte, “Short-term power forecasting model for photovoltaic plants based on historical similarity,”Energies, vol. 6, no. 5, pp. 2624–2643, 2013.

[22] A. Laouafi, M. Mordjaoui, and D. Dib, “One-hour ahead electric load and wind-solar powergeneration forecasting using artificial neural network,” in Renewable Energy Congress (IREC),2015 6th International. IEEE, 2015, pp. 1–6.

[23] T. Verma, A. Tiwana, C. Reddy, V. Arora, and P. Devanand, “Data analysis to generate modelsbased on neural network and regression for solar power generation forecasting,” in IntelligentSystems, Modelling and Simulation (ISMS), 2016 7th International Conference on. IEEE, 2016,pp. 97–100.

[24] H. Sangrody, M. Sarailoo, N. Zhou, N. Tran, M. Motalleb, and E. Foruzan, “Weather forecastingerror in solar energy forecasting,” IET Renewable Power Generation, 2017.

[25] V. P. Singh, B. Ravindra, V. Vijay, and M. S. Bhatt, “Forecasting of 5mw solar photovoltaicpower plant generation using generalized neural network,” in Systems Conference (NSC), 201539th National. IEEE, 2015, pp. 1–6.

[26] J.-G. Kim, D.-H. Kim, W.-S. Yoo, J.-Y. Lee, and Y. B. Kim, “Daily prediction of solar powergeneration based on weather forecast information in korea,” IET Renewable Power Generation,2017.

[27] E. Sassine, “Optimal solar panels positioning for beirut,” in Renewable Energy Congress (IREC),2016 7th International. IEEE, 2016, pp. 1–5.

93

Page 110: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

[28] Y. Tao and Y. Chen, “Distributed pv power forecasting using genetic algorithm based neural net-work approach,” in Advanced Mechatronic Systems (ICAMechS), 2014 International Conferenceon. IEEE, 2014, pp. 557–560.

[29] M. J. Sanjari and H. Gooi, “Probabilistic forecast of pv power generation based on higher ordermarkov chain,” IEEE Transactions on Power Systems, vol. 32, no. 4, pp. 2942–2952, 2017.

[30] V. P. Menon, S. Lokhande, and Y. K. Bichpuriya, “Correcting forecast of utility’s demand withincreasing solar pv penetration,” in Innovative Smart Grid Technologies-Asia (ISGT-Asia), 2017IEEE. IEEE, 2017, pp. 1–6.

[31] Y. Liu, Z. Li, K. Bai, Z. Zhang, X. Lu, and X. Zhang, “Short-term power-forecasting method ofdistributed pv power system for consideration of its effects on load forecasting,” The Journal ofEngineering, vol. 2017, no. 13, pp. 865–869, 2017.

[32] N. Zaini, M. Ab Kadir, M. Izadi, N. Ahmad, M. Radzi, and N. Azis, “The effect of temperatureon a mono-crystalline solar pv panel,” in Energy Conversion (CENCON), 2015 IEEE Conferenceon. IEEE, 2015, pp. 249–253.

[33] S. M. S. Alam and A. M. Rahman, “Performance comparison of mirror reflected solar panel withtracking and cooling,” in Development in the in Renewable Energy Technology (ICDRET), 20164th International Conference on the. IEEE, 2016, pp. 1–4.

[34] N. Ahmad, M. Ab Kadir, M. Izadi, N. Zaini, M. Radzi, and N. Azis, “Effect of temperatureon a poly-crystalline solar panel in large scale solar plants in malaysia,” in Energy Conversion(CENCON), 2015 IEEE Conference on. IEEE, 2015, pp. 244–248.

[35] U. Neisser, G. Boodoo, T. Bouchard Jr, A. Wade Boykin, N. Brody, S. J. Ceci, D. Halpern,J. Loehlin, R. Perloff, R. Sternberg, and S. Urbina, “Intelligence: Knowns and unknowns,” Ame-rican Psychologist, vol. 51, pp. 77–101, 02 1996.

[36] M. Buiten, “Towards intelligent regulation of artificial intelligence,” European Journal of RiskRegulation, pp. 1–19, 04 2019.

[37] P. D. Wasserman, Advanced methods in neural computing. John Wiley & Sons, Inc., 1993.

[38] D. W. Rolston, “Inteligencia artificial y sistemas expertos,” Me Graw Hill Interamericana deMéxico, Estado de México, México, 1992.

[39] P. H. Winston, Inteligencia artificial. Addison-Wesley Iberoamericana„ 1994.

[40] E. Rich, K. Knight, P. A. González Calero, T. Bodega et al., Inteligencia artificial, 1994.

[41] I. d. Silva, D. H. Spatti, and R. A. Flauzino, “Redes neurais artificiais para engenharia e ciênciasaplicadas,” São Paulo: Artliber, vol. 23, no. 5, 2010.

[42] C. Bishop, C. M. Bishop et al., Neural networks for pattern recognition. Oxford university press,1995.

[43] “La reserva, partes de una neurona,” http://www.lareserva.com/home/sites/default/files/styles/article_image/public/field/image/neuronasf.jpg?itok=PrPbGt5m, accessed: 2018-06-03.

[44] S. S. Haykin et al., Neural networks and learning machines/Simon Haykin. New York: PrenticeHall„ 2009.

[45] J. Heaton, Introduction to the math of neural networks. Heaton Research, Inc., 2012.

94

Page 111: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

[46] J. A. Carta González, R. Calero Pérez, A. Colmenar Santos, and M.-A. Castro Gil, Centrales deenergías renovables: generación eléctrica con energías renovables. Pearson Prentice Hall:, 2009,no. 620.92.

[47] D. R. Anderson, D. J. Sweeney, and T. A. Williams, Estadística para negocios y economía .Cengage Learning, 2016.

[48] H. Gutiérrez Pulido, V. Salazar et al., “Análisis y diseño de experimentos,” 2004.

[49] D. A. Lind, W. G. Marchal, and S. A. Wathen, Estadística aplicada a los negocios y la economía.McGraw-Hill„ 2005.

[50] D. C. Montgomery, Diseño y análisis de experimentos, L. Wiley, Ed., 2005.

[51] L. Faucett, “Fundamentals of neural networks,” Arcihitectures, Algorithms, and Applications,Prentice Hall-Inc., Canada, 1994.

[52] L. K. Zsilt, “Redes neuronais artificiais: fundamentos e aplicações,” Sao Paulo: Editora Livraruada Física., Brasil, 2006.

[53] Z. L. Kovács, Redes neurais artificiais. Editora Livraria da Fisica SP.Brasil., 2002.

95

Page 112: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Colophon

This document was typeset using the itmthesis class developed by Gerardo Marx Chávez-Campos.The class was designed based on the classicthesis class developed by André Miede. The itmthesisis available for LATEX at:

https://[email protected]/itmthesis/the-itmorelia-thesis-class.git

Happy users of itmthesis usually send a real postcard, coffee mug, hoody or any kind of present tomy university “Instituto Tecnológico de Morelia”, Michoacán, México.

Colofón

Este documento fue generado usando la clase itmthesis desarrollada por Gerardo Marx Chávez-Campos. La clase fue diseñada basada en la clase classicthesis desarrollada por André Miede. Laclase itmthesis está disponible para LATEX en:

https://[email protected]/itmthesis/the-itmorelia-thesis-class.git

Si eres un usuario agradecido con este diseño puedes mandar una postal, taza de café, sudadera de tuuniversidad o cualquier tipo de presente en forma de agradecimiento a la universidad de origen de tuservidor: “Instituto Tecnológico de Morelia”, Michoacán, México.

Page 113: InstitutoTecnológicodeMorelia José María Morelos y Pavónsagitario.itmorelia.edu.mx/pelectron/documentos/O-Lobato.pdf · Un agradecimiento a mi asesores pero en especial al M.C.

Declaración

Yo, Ing. Oscar Lobato Nostroza, con número de control M10120123 declaro que el trabajotitulado:Modelo de Previsión Mediano-plazo para un Sistema Fotovoltaico basado en Redes Neuronales,, es resultado de mi trabajo e investigación original. No se ha realizado una copia de otro trabajo ofuente excepto los respectivamente citados de forma explícita en el texto.

Morelia, Michoacán, México, Junio 2019

Ing. Oscar Lobato Nostroza,6 de junio de 2019