UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5....

101
UNIVERSIDAD DE GUAYAQUIL FACULTAD DE CIENCIAS MATEMÁTICAS Y FÍSICAS CARRERA DE INGENIERÍA EN SISTEMAS COMPUTACIONALES TEMA ANÁLISIS DE COMPARACIÓN DEL RENDIMIENTO DEL ALGORITMO DE DOUGLAS-PEUCKER CON LA INCORPORACIÓN DEL FILTRO DE KALMAN. PROYECTO DE TITULACIÓN Previa a la obtención del Título de: INGENIERO EN SISTEMAS COMPUTACIONALES AUTOR: JORGE LUIS MIRANDA GALLEGOS TUTOR: ING. GARY REYES GUAYAQUIL ECUADOR 2017

Transcript of UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5....

Page 1: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

UNIVERSIDAD DE GUAYAQUIL

FACULTAD DE CIENCIAS MATEMÁTICAS Y FÍSICAS

CARRERA DE INGENIERÍA EN SISTEMAS

COMPUTACIONALES

TEMA

ANÁLISIS DE COMPARACIÓN DEL RENDIMIENTO DEL ALGORITMO DE DOUGLAS-PEUCKER CON LA INCORPORACIÓN DEL FILTRO DE KALMAN.

PROYECTO DE TITULACIÓN

Previa a la obtención del Título de:

INGENIERO EN SISTEMAS COMPUTACIONALES

AUTOR:

JORGE LUIS MIRANDA GALLEGOS

TUTOR:

ING. GARY REYES

GUAYAQUIL – ECUADOR

2017

Page 2: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

II

REPOSITORIO NACIONAL EN CIENCIAS Y TECNOLOGÍA

FICHA DE REGISTRO DE TESIS

ÍTULO: “ANÁLISIS DE COMPARACIÓN DEL RENDIMIENTO DEL ALGORITMO DE DOUGLAS-PEUCKER CON LA INCORPORACIÓN DEL FILTRO DE KALMAN.

REVISORES:

INSTITUCIÓN: Universidad de Guayaquil

FACULTAD: Ciencias Matemáticas Y Físicas

CARRERA: INGENIERÍA EN SISTEMAS COMPUTACIONALES

FECHA DE PUBLICACIÓN: 07 Abril de 2016

N° DE PÁGS.:

ÁREA TEMÁTICA: SISTEMAS INFORMATICOS – EDUCATIVO

PALABRAS CLAVES: COMPRESIÓN, ANÁLISIS, DATOS,

RESUMEN: Se realiza la investigación, análisis y desarrollo y experimentación de la

optimización del algoritmo de Douglas Peucker con información semántica. En

primera instancia se debe identificar la información semántica ideal para ser

procesada con los datos de una trayectoria, El algoritmo optimizado hace la

reducción de puntos innecesario de una trayectoria, siendo factible esto bajo la

previa identificación de puntos referenciales. N° DE REGISTRO(en base de datos):

N° DE CLASIFICACIÓN: Nº

DIRECCIÓN URL (tesis en la web):

ADJUNTO PDF X SI NO

CONTACTO CON AUTOR: MIRANDA GALLEGOS JORGE

LUIS

Teléfono: 0984194456

E-mail:

[email protected]

CONTACTO DE LA INSTITUCIÓN :

UNIVERSIDAD DE GUAYAQUIL CARRERA DE INGENIERÍA EN SISTEMAS COMPUTACIONALES Víctor Manuel Rendón 429 entre Baquerizo Moreno y Córdova

Nombre: AB. JUAN CHAVEZ A.

Teléfono: (04) 2307729

Page 3: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

I

APROBACIÓN DEL TUTOR

En mi calidad de Tutor del trabajo de investigación, “ANÁLISIS DE

COMPARACIÓN DEL RENDIMIENTO DEL ALGORITMO DE

DOUGLAS-PEUCKER CON LA INCORPORACIÓN DEL FILTRO DE

KALMAN. “ elaborado por el Sr. Jorge Luis Miranda Gallegos, Alumno no

titulado de la Carrera de Ingeniería en Sistemas Computacionales,

Facultad de Ciencias Matemáticas y Físicas de la Universidad de

Guayaquil, previo a la obtención del Título de Ingeniero en Sistemas, me

permito declarar que luego de haber orientado, estudiado y revisado, la

Apruebo en todas sus partes.

Atentamente

Ing. Gary Reyes Msc.

TUTOR

Page 4: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

II

DEDICATORIA

Este trabajo de

investigación para lograr la

titulación va dedicado a las

personas que nunca

dejaron de creer en mí

desde un principio, a mis

padres.

Page 5: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

III

AGRADECIMIENTO

En primer lugar quiero dar

gracias a Dios y toda la

gloria para él. A mis padres

Laura Gallegos y Luis

Miranda por creer en mí y

darme la confianza para

culminar esto. A mi

hermana Patricia Miranda

por su apoyo incondicional

desde siempre, a mi novia

Denny Vélez Burgos por su

apoyo constante en este

trabajo de titulación.

A mis amigos y

compañeros que han

trabajado conmigo en este

proceso de titulación y en

toda esta Carrera

Universitaria que ha sido

una travesía, a mi tutor de

tesis Ing. Gary Reyes por

sus atinados consejos y

sobre todo por su

paciencia.

Page 6: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

IV

TRIBUNAL PROYECTO DE TITULACIÓN

Ing. Eduardo Santos Baquerizo, M.Sc.

DECANO DE LA FACULTAD

CIENCIAS MATEMATICAS Y

FISICAS

Ing. Roberto Crespo Mendoza, Mgs.

DIRECTOR DE LA CARRERA DE

INGENIERIA EN SISTEMAS

COMPUTACIONALES

Ing. Luis Armando Arias

PROFESOR REVISOR DEL ÁREA -

TRIBUNAL

Lcda. Noemí Vargas Caicedo

PROFESOR REVISOR DEL ÁREA -

TRIBUNAL

Ing. Gary Reyes

PROFESOR TUTOR DEL PROYECTO

DE TITULACION

Ab. Juan Chávez Atocha, Esp.

SECRETARIO

Page 7: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

II

DECLARACIÓN EXPRESA

“La responsabilidad del contenido de este Proyecto de Titulación, me corresponden exclusivamente; y el patrimonio intelectual de la misma a la UNIVERSIDAD DE GUAYAQUIL”

JORGE LUIS MIRANDA GALLEGOS

Page 8: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

III

.

UNIVERSIDAD DE GUAYAQUIL FACULTAD DE CIENCIAS MATEMÁTICAS Y FÍSICAS

CARRERA DE INGENIERÍA EN SISTEMAS

COMPUTACIONALES

Análisis de comparación del rendimiento del algoritmo de Douglas-Peucker con la incorporación del filtro de Kalman.

Proyecto de Titulación que se presenta como requisito para optar por el

título de INGENIERO EN SISTEMAS COMPUTACIONALES

Auto/a: JORGE LUIS MIRANDA GALLEGOS

C.I. 0704720705

Tutor: ING. GARY REYES

Guayaquil, Abril del 2017

Page 9: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

IV

CERTIFICADO DE ACEPTACIÓN DEL TUTOR

En mi calidad de Tutor del proyecto de titulación, nombrado por el Consejo Directivo de la Facultad de Ciencias Matemáticas y Físicas de la Universidad de Guayaquil.

CERTIFICO:

Que he analizado el Proyecto de Titulación presentado por el/la estudiante JORGE LUIS MIRANDA GALLEGOS, como requisito previo para optar por el título de Ingeniero en Sistemas Computacionales cuyo problema es: Como mejorar el rendimiento del algoritmo de Douglas Peucker a través de la incorporación del filtro de Kalman.

Considero aprobado el trabajo en su totalidad.

Presentado por:

Miranda Gallegos Jorge Luis 0704720705

Tutor: Ing. Gary Reyes

Guayaquil, Abril de 2017

Page 10: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

V

UNIVERSIDAD DE GUAYAQUIL FACULTAD DE CIENCIAS MATEMÁTICAS Y FÍSICAS

CARRERA DE INGENIERÍA EN SISTEMAS COMPUTACIONALES

Autorización para Publicación de Proyecto de Titulación en Formato Digital

1. Identificación del Proyecto de Titulación

Nombre Alumno: Miranda Gallegos Jorge Luis

Dirección:

Teléfono:0984194456 E-mail: [email protected]

Facultad: Facultad de Ciencias Matemáticas y Físicas

Carrera: Carrera de Ingeniería en Sistemas Computacionales

Proyecto de titulación al que opta: Ingeniero de Sistemas Computacionales

Profesor tutor: Ing. Gary Reyes

Análisis de comparación del rendimiento del algoritmo de Douglas-Peucker con la incorporación del filtro de Kalman.

Tema del Proyecto de Titulación: Análisis de comparación del rendimiento del algoritmo de Douglas-Peucker con la incorporación del

filtro de Kalman.

2. Autorización de Publicación de Versión Electrónica del Proyecto de Titulación A través de este medio autorizo a la Biblioteca de la Universidad de Guayaquil y a la Facultad de Ciencias Matemáticas y Físicas a publicar la versión electrónica de este Proyecto de titulación.

Page 11: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

VI

Publicación electrónica:

Inmediata Después de 1 año Firma Alumno:

3. Forma de envío: El texto del proyecto de titulación debe ser enviado en formato Word, como archivo .Doc. O .RTF y .Puf para PC. Las imágenes que la acompañen pueden ser: .gif, .jpg o .TIFF.

DVDROM CDROM

Page 12: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

VII

ÍNDICE GENERAL

Aprobación del tutor .......................................................................................... I

Dedicatoria ......................................................................................................... II

Agradecimiento ................................................................................................ III

Índice General .................................................................................................. VII

Índice de Cuadros............................................................................................ XII

Índice de Gráficos........................................................................................... XIII

Resumen ........................................................................................................ XIV

Abstract ........................................................................................................... XV

Introducción ....................................................................................................... 1

CAPÍTULO I ........................................................................................................ 3

EL PROBLEMA ............................................................................................................ 3

DESCRIPCION DEL PROBLEMA ......................................................................... 3

Ubicación del Problema en un Contexto .............................................................. 3

Situación Conflicto Nudos Críticos ........................................................................ 3

Causas y Consecuencias del Problema ............................................................... 4

Delimitación del Problema ...................................................................................... 5

Formulación del Problema ...................................................................................... 5

Evaluación del Problema ........................................................................................ 6

Alcances del Problema ..................................................................................... 7

Justificación e Importancia ............................................................................... 8

Objetivos ............................................................................................................ 8

Objetivo General........................................................................................................... 8

Objetivos Específicos .................................................................................................. 8

Metodología de la investigación ....................................................................... 9

CAPÍTULO II ..................................................................................................... 14

MARCO TEÓRICO ............................................................................................ 14

Antecedentes del Estudio ............................................................................... 14

Page 13: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

VIII

Fundamentación teórica ................................................................................. 17

RAMER-DOUGLAS-PEUCKER ............................................................................... 17

FILTRO DE KALMAN ................................................................................................ 19

LENGUAJE R ............................................................................................................. 26

Fundamentación legal ..................................................................................... 29

Pregunta Científica a Contestarse .................................................................. 33

Definiciones Conceptuales ............................................................................. 33

Ruido ............................................................................................................................ 33

Variables Aleatorias ................................................................................................... 33

Media y Varianza ........................................................................................................ 35

Orientado a Objetos ................................................................................................... 36

Tolerancia .................................................................................................................... 38

Postgres ....................................................................................................................... 38

R Studio ...................................................................................................................... 38

Hardware .................................................................................................................... 39

Datos ........................................................................................................................... 39

Ruido Intrínseco ....................................................................................................... 39

Ruido Extrínseco ........................................................................................................ 39

CAPÍTULO III .................................................................................................... 41

Metodología de la investigación ..................................................................... 41

Diseño de la investigación .............................................................................. 41

Tipo de investigación ...................................................................................... 41

Población y muestra ........................................................................................ 42

POBLACIÓN ............................................................................................................... 42

MUESTRA ................................................................................................................... 43

OPERACIONALIZACIÓN DE VARIABLES. .......................................................... 45

TÉCNICAS E INSTRUMENTOS PARA LA RECOLECCIÓN DE DATOS ........ 46

CAPÍTULO IV .................................................................................................... 49

Page 14: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

IX

Resultados y Conclusiones ............................................................................ 49

BIBLIOGRAFÍA ................................................................................................. 70

Page 15: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

X

ABREVIATURAS

ABP Aprendizaje Basado en Problemas UG Universidad de Guayaquil Ing. Ingeniero CC.MM.FF Facultad de Ciencias Matemáticas y Físicas ISP Proveedor de Servicio de Internet Mtra. Maestra Msc. Master URL Localizador de Fuente Uniforme WWW World Wide Web (red mundial) DP Douglas Peucker S.I.G. Sistema de Informacion Geografica IDE Entorno de desarrollo Integrado

Page 16: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

XI

SIMBOLOGÍA

s Desviación estándar e Error E Espacio muestral E(Y) Esperanza matemática de la v.a. y s Estimador de la desviación estándar e Exponencial

Page 17: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

XII

ÍNDICE DE CUADROS

Tabla 1 Tipo de Investigación ............................................................................ 42

Tabla 2 Muestra ................................................................................................. 43

Tabla 3 Experimentación de 100 datos .............................................................. 44

Tabla 4 Operacionalización de Variables ........................................................... 45

Tabla 5 Experimentación de trayectorias (California) 10% ................................. 50

Tabla 6 Experimentación de trayectorias (California) 20% ................................. 53

Tabla 7 Experimentación de trayectorias (California) 30% ................................. 56

Tabla 8 Experimentación de trayectorias (California) 50% ................................. 59

Tabla 9 Experimentación de trayectorias (California) 70% ................................. 62

Tabla 10 Experimentación de trayectorias (California) 100% ............................. 65

Page 18: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

XIII

ÍNDICE DE GRÁFICOS

Gráfico 1 Funcionamiento del algoritmo Douglas Peucker ......................... 16

Gráfico 2 Algoritmo básico Douglas-Peucker ................................................ 18

Gráfico 3 El Ciclo del Filtro de Kalman ........................................................... 22

Gráfico 4 Ecuaciones de pronóstico del Filtro de Kalman discreto ............ 23

Gráfico 5 Ecuaciones de corrección del Filtro de Kalman discreto ............ 23

Gráfico 6 Visión completa del Filtro de Kalman ............................................ 24

Gráfico 7 Experimentación con 100 datos ..................................................... 47

Gráfico 8 Experimentación de trayectorias (California) 10% ...................... 51

Gráfico 9 Experimentación de trayectorias (California) 20% ...................... 54

Gráfico 10 Experimentación de trayectorias (California) 30% .................... 57

Gráfico 11 Experimentación de trayectorias 50% ......................................... 60

Gráfico 12 Experimentación de trayectorias (California) 70% .................... 63

Gráfico 13 Experimentación de trayectorias (California) 100% .................. 66

Gráfico 14 Experimentación de trayectorias (California) ............................. 68

Gráfico 15 Experimentación del ruido (California) ........................................ 69

Page 19: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

XIV

UNIVERSIDAD DE GUAYAQUIL FACULTAD DE CIENCIAS MATEMATICAS Y FISICAS

CARRERA DE INGENIERIA EN SISTEMAS COMPUTACIONALES

Análisis de comparación del rendimiento del algoritmo de Douglas-Peucker

con la incorporación del filtro de Kalman.

Resumen

El presente trabajo hace una propuesta para un mejor rendimiento en los datos,

simplificando líneas de trayectorias vehiculares, el algoritmo de simplificación de

línea de Douglas-Peucker es reconocido por ser el algoritmo que ofrece mejor

representaciones perceptivas de las líneas originales, utiliza tanto gráficos

informáticos como geográficos.

Para el filtro de DP existe dos variantes, el método (nm) original, donde denota n

el número de vértices de entrada y m el número de segmentos de salida, que

funciona en cualquier dimensión. El filtro de Kalman recopila datos donde realiza

dos pasos que es la predicción y la actualización.

Author: Jorge Luis Miranda Gallegos

Tutor: Ing. Gary Reyes

Page 20: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

XV

UNIVERSIDAD DE GUAYAQUIL FACULTAD DE CIENCIAS MATEMATICAS Y FISICAS

CARRERA DE INGENIERIA EN SISTEMAS COMPUTACIONALES

Comparison of the performance of the Douglas Peucker algorithm

with the incorporation of the Kalman filter.

Abstract

The present work a proposal has been made for a better performance in the data,

simplifying lines of vehicular trajectories, the Douglas-Peucker line simplification

algorithm is recognized for offering better visual representations of the original

lines, as geographic.

For the DP filter there are two variants, the original (nm) method, denoting the

number of input vertices and the number of output segments, which works in any

dimension. The Kalman Filter that collects the data where it performs the steps

that is the prediction and the update.

Author: Jorge Luis Miranda Gallegos

Tutor: Ing. Gary Reyes

Page 21: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

1

INTRODUCCIÓN Hoy en día existen diversas ramas de la electrónica como la navegación,

sistemas de seguridad, telecomunicaciones, que necesitan del uso de

dispositivos capaces de proporcionar mediciones exactas.

El ruido existe de manera característica en todo sistema y en muchas ocasiones

es muy complicado e imposible eliminar completamente el efecto causado por el

ruido, esto conlleva a una necesidad para el desarrollo de filtros capaces de

limpiar el ruido.

A inicios de los años sesenta y ochenta se desarrolló el filtro de Kalman, un

algoritmo muy versátil con la capacidad de eliminar ruido, bajo las condiciones

de que el ruido sea blanco Gaussiano, otra característica es que el sistema sea

lineal, que se conozcan estados iniciales.

Según Isabel Fernández Quesada (Fernández Quesada, 2002) el algoritmo

probó ser muy versátil ya que luego de su desarrollo, fue implementado por la

NASA en el programa Apolo XI. Sin embargo, el filtro se encuentra limitado para

aplicaciones de ingeniería donde el conocimiento del sistema es incompleto. Si

las condiciones iniciales se desconocen, el filtro arrojara una estimación que no

es óptima.

Por la gran complejidad de una trayectoria vehicular es un grave problema para

cualquier representación digital por esta razón también se necesita una

simplificación de rutas, para esto se aplicó el algoritmo Douglas Peucker que

permite reducir la cantidad de puntos en una ruta de segmentos rectilíneos

utilizando un criterio de distancias. Es muy útil para la simplificación de rutas

sobre mapas.

Page 22: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

2

Se incorporara el Filtro de Kalman para la reducción de ruido Gaussiano

con el algoritmo de Douglas Peucker y asi poder obtener una mayor

reducción de puntos pero sin perder información de la misma, obteniendo

un suavizado óptimo de la ruta de trayectoria vehicular.

Page 23: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

3

CAPÍTULO I

EL PROBLEMA

DESCRIPCIÓN DEL PROBLEMA

Ubicación del Problema en un Contexto

La necesidad de eliminación de puntos de los elementos lineales para poder

tener obtener una simplificación de trayectorias vehiculares y la falta de espacio

lógico de las bases de datos en las trayectorias espaciales relacionadas a la

ubicación geográfica (trayectorias espaciales) debido a la abundancia de

información que muchas de las veces es redundante.

Se considera la inclusión de dos filtros como lo son el Filtro de Kalman y el

Algoritmo de Douglas Peucker, son algoritmos de simplificación, nos permitirán

disminuir abundante información necesaria de puntos dados de una ruta, donde

nos ayuda a reducir gran cantidad de estos puntos de dicha ruta de trayectorias

vehiculares.

Es muy útil para la simplificación de rutas sobre mapas para representarla en

una línea, reteniendo puntos que pintan mejor la geometría y el tiempo de

procesamiento de datos.

Situación Conflicto Nudos Críticos

La razón de llevar a cabo esta investigación es reducir el gran consumo de

espacio lógico en base de datos. Es decir, se simplificaran los puntos de una

trayectoria vehicular, eliminando puntos geográficos redundantes de dicha

trayectoria.

Page 24: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

4

Por medio de la unificación de dos algoritmos se realizara la eliminación de

ruido gaussiano a través del Filtro de Kalman, donde luego se aplicara la

simplificación de Douglas Peucker para obtener una linealización simplificada de

los datos que nos proporcionara la base de datos.

Causas y Consecuencias del Problema

Causas Consecuencias

No simplificar puntos de rutas en

grandes ciudades.

Consumo de mucho espacio lógico en

la base de Datos.

No eliminar el ruido de una trayectoria

trazada en una ruta de una gran

ciudad.

No da un suavizado en la trayectoria

de una ruta.

Gran cantidad de datos almacenados

por la redundancia de puntos.

Consumo de mucho espacio lógico en

la base de Datos.

Fuente: Datos de Investigación

Elaborado por: Jorge Luis Miranda Gallegos

La principal causa del problema de la no la simplificación de rutas es la gran

cantidad de puntos de los elementos lineales en el mapa que representa una

trayectoria vehicular, por ejemplo esto da con mayor frecuencia en grandes

ciudades como California y países como China.

Page 25: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

5

La ausencia de simplificación de trayectorias vehiculares y de la reducción de

ruido Gausiiano de estos puntos, conlleva a que exista una falta de espacio

lógico en las bases de datos de trayectorias vehiculares por la gran cantidad de

datos y redundancia de datos.

Delimitación del Problema

Se procederá a realizar con una base de datos de trayectorias vehiculares donde

estarán almacenados datos de trayectorias de California a la que se les aplicará

los filtros correspondientes para la simplificación de rutas.

CAMPO.- Algoritmos de simplificación de trayectorias vehiculares.

ÁREA.- Investigación.

ASPECTO: Simplificación de trayectorias vehiculares.

TEMA.- Análisis de comparación del rendimiento del algoritmo de Douglas-

Peucker con la incorporación del filtro de Kalman.

Formulación del Problema

La falta de espacio lógico de las bases de datos en las trayectorias relacionadas

a la ubicación geográfica (trayectorias vehiculares) debido a la abundancia de

información que muchas de las veces es redundante y la necesidad de

simplificación de rutas, han hecho que se busque la manera de cómo mejorar

estos problemas con la ayuda de los algoritmos de Douglas Peucker a través de

la reducción del ruido que realiza filtro de Kalman.

Estos problemas serán solucionados con la integración de estos dos algoritmos

donde permitirán reducir puntos de una trayectoria.

Page 26: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

6

Evaluación del Problema

Los aspectos generales de evaluación son:

DELIMITADO.- Afecta a los datos de trayectorias vehiculares que se encuentran

ingresados en una base de datos Postgres que serán utilizados para las

experimentaciones de simplificación de rutas.

EVIDENTE.- La simplificación de trayectorias vehiculares del algoritmo de

Douglas Peucker con la incorporación del filtrado de Kalman es fundamental ya

que nos realiza un mayor suavizado de trayectorias donde a más de la

simplificación de rutas, eliminamos el ruido de la misma.

CLARO.- El problema tratado se refiere a la necesidad de la simplificación de

trayectorias vehiculares y la falta de espacio lógico de las bases de datos en las

trayectorias relacionadas a la ubicación geográfica (trayectorias vehiculares),

impactan directamente en el consumo masivo en base de datos.

CONCRETO.- El problema es de carácter investigativo responsabilidad del grupo

de tesistas de investigación de la Universidad de Guayaquil, Carrera de

Ingeniería en Sistemas Computacionales ya que son las personas de llegar a

cumplir los objetivos trazados para obtener un trabajo de calidad y de

certificación.

RELEVANTE.- Porque mediante la aplicación de los filtrados podemos

determinar la factibilidad de nuestro trabajo y también las técnicas empleadas

para aplicar la simplificación de trayectorias que se desea.

CONTEXTUAL.- Porque se enmarca en el contexto de proyecto investigativo

para la disponibilidad de la Universidad de Guayaquil y también de un artículo

donde se podrá visualizar nuestro proceso investigativo.

FACTIBLE.- Por los beneficios en la reducción de puntos de trayectorias que se

obtienen en cuanto a la rapidez y solución de los problemas mencionados, por

Page 27: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

7

medio de los algoritmos de Douglas Pecuker con la incorporación del Filtro de

Kalman, obtenemos una simplificación de trayectorias vehiculares, confiables y

de calidad.

VARIABLES.- Son identificadas como independientes y dependientes y son las

siguientes:

INDEPENDIENTES.- Rendimiento del algoritmo de Douglas Peucker con la

incorporación del filtro de Kalman.

DEPENDIENTES.- Compresión de trayectorias.

ALCANCES DEL PROBLEMA

Este análisis de comparación del rendimiento del algoritmo de Douglas Peucker

con la incorporación del filtro de Kalman podemos definir el alcance del problema

en:

Revisión bibliográfica de algoritmos de compresión de trayectorias GPS

Elaborar anteproyecto

Implementar en R Douglas Peucker

Implementar en R Douglas Peucker con filtro de Kalman

Cargar las bases de datos con las que se experimentará

Realizar experimentos

Aplicar un test estadístico (test de hipótesis)

Evaluar e interpretar resultados de las métricas utilizadas

Elaborar un paper para difundir resultados

Page 28: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

8

JUSTIFICACIÓN E IMPORTANCIA

Las trayectorias espaciales relacionadas a la ubicación geográfica presentan

problemas ante los grandes cambios de escala, es decir; acrecienta el número

de picos, que da a la línea un aspecto abrupto en vez de suavidad para un

resultado de mejor calidad y simplificación de rutas por los diferentes puntos de

longitud y latitud.

La redundancia de datos hacen que exista un mayor consumo en bits y en la

base de almacenamiento de datos generan costo, la mejora con la simplificación

de rutas se podrá realizar mediante pruebas y análisis de compresión de

trayectorias en el algoritmo de Douglas Peucker junto con el filtro de Kalman

para así obtener resultados más fiables los cuales estarán sujetos a análisis y

pruebas.

OBJETIVOS

Objetivo General

Realizar un análisis de comparación del rendimiento del algoritmo de Douglas-

Peucker con la incorporación del filtro de Kalman por medio del desarrollo en el

lenguaje R donde se deberá comprobar un mejor rendimiento.

Objetivos Específicos

Recopilar información sobre el comportamiento del filtro de Kalman

para que sirva de apoyo al algoritmo de Douglas Peucker el cual

realizará los procesos de compresión de trayectorias.

Modificar los métodos de compresión en el algoritmo de Douglas

Peucker apoyado con el filtro de Kalman para optimizar la compresión

de trayectorias.

Page 29: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

9

Validar las modificaciones al algoritmo Douglas Peucker con el filtro

de Kalman con pruebas realizadas en 3 bases de datos de

trayectorias.

Page 30: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

10

METODOLOGÍA DE LA INVESTIGACIÓN Dentro de las herramientas que podemos utilizar para la estimación a partir de

las mediciones con ruido, se encuentra una de las más utilizadas, el filtro de

Kalman.

Esta metodología es una Gestión Basada en Resultados (GBR), donde podemos

decir que el filtro de Kalman es un algoritmo para resolver el problema de

variables de estado en sistema dinámico.

Este algoritmo resuelve este problema de estimar estado de manera óptima

tomando en cuenta el ruido (incertidumbre) presente tanto en las variables

medidas (variables entregados por los sensores) como en los variables de

control (variables aplicadas por los actuadores).

El filtro de Kalman aplica bajo estas condiciones, el sistema debe ser lineal y se

tiene una ecuación de estado dinámico modelo que describe su comportamiento

dinámico y una ecuación de medición que describe la relación entre las variables

de estado y la salida de los sensores, ambas ecuaciones están descritas en

tiempo discreto.

Se conoce la estadística del ruido de medición (los sensores tienen ruido) y del

ruido del sistema. Ambos son independientes entre sí, con media igual a cero y

distribución de probabilidad normal (Gaussina) la densidad de probabilidad debe

ser una campana de Gaus, la campana de Gaus es simétrica.

Como mencionan (Welch & Bishop, 2006), el filtro de Kalman estima el estado

en x ∈R n de un proceso controlado en tiempo discreto, el cual está definida por

la ecuación diferencial lineal estocástica:

Xk = Axk−1 + Buk−1+ wk−1

Page 31: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

11

Donde podemos decir que:

Xk vector de estado

Uk-1 vector de control (acciones que aplicamos a la dinámica del

sistema para que se mueva.

Los subíndices k = k-1 nos indica el instante de tiempo al que se refiere

el vector

A matriz de estado

B matriz de control

Wk-1 ruido de sistema

Necesitamos también una ecuación de medición:

z k = Hxk + v k

Zk la información de nuestros sensores, vector que trae la información de los

sensores.

Xk variables de estado.

La información de nuestros sensores está relacionada con las variables de

estado por medio de una multiplicación con una matriz H, también es una

relación lineal con lo que observamos con nuestros sensores y lo que nosotros

percibimos finalmente con nuestros sensores.

Vk ruido de medición.

Los ruidos W y V son vectores que contienen varias variables aleatorias en cada

uno de sus componentes y cada uno de estos vectores tiene una matriz de

covarianza.

p( w) N (0,S)

p( v ) N (0, R)

Page 32: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

12

Para el ruido W de Sistema hay una matriz de covarianza Q, quiere decir que la

distribución de probabilidad P(Wk)del ruido del sistema, es una distribución

normal que tiene media cero N(0,Q) covarianza del sistema tiene media cero y

que tiene una covarianza Q (es una forma de medir la incertidumbre que hay las

variables contenidas en el vector Wk es una matriz cuadrada).

P(vk) la distribución de probabilidad también es una distribución normal tiene

media cero pero aquí la covarianza es R.

Q es una matriz cuadrada de nxn y R matriz cuadrada de LxL.

Luego de pasar el filtro de Kalman a nuestras mediciones procedemos a realizar

la simplificación de trayectorias, podemos decir que DP además de sus buenos

resultados, el algoritmo Douglas-Peucker es muy sencillo de desarrollar y

funciona para cualquier dimensión, una vez que sólo se basa en la distancia

entre puntos y líneas.

Su regla básica es que la aproximación debe contener un subconjunto de los

puntos de datos originales, es recursivo y todo el original los puntos de datos

deben situarse dentro de una cierta distancia predefinida a la aproximación.

Según WU, SHIN - TING y MERCEDES ROCIO GONZALES MARQUEZ (Wu &

Márquez, 2003) El algoritmo de Douglas-Peucker tiene una estructura jerárquica

comenzando con una suposición inicial cruda, es decir, el único borde une los

vértices del primero al último de la línea a simplificar, entonces los vértices

restantes son probados para la cercanía a ese borde.

Si hay vértices más allá de una tolerancia especificada lejos del borde, entonces

al vértice más alejado se le añade a la línea previamente simplificada. Esto crea

una nueva aproximación para la línea original usando recursión, este proceso

continúa para cada línea hasta que todos los vértices de la línea original estén

dentro.

Page 33: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

13

Sin embargo, según Miguel Luaces, José Paramá, Isabel Pérez, Urria Lage

(Luaces, Paramá, & Pérez-Urria Lage, n.d.) Dicen que el algoritmo de Douglas

Peucker es el algoritmo de simplificación más extendido e implementado en

diversos paquetes. Su funcionamiento es muy simple, y consiste en deshacerse

de todos los puntos que se encuentren a una distancia menor que cierta

tolerancia de la línea que une los puntos inicial y final de la línea a simplificar.

Page 34: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

14

CAPÍTULO II

MARCO TEÓRICO

ANTECEDENTES DEL ESTUDIO

Entre los 70 y los 80 fue desarrollada una gran cantidad de métodos para

eliminar puntos de los elementos lineales del mapa. Sin embargo la principal

motivación para su desarrollo era la falta de espacio en las bases de datos

debido al gran costo de almacenamiento por la redundancia de datos, esto es, la

compactación de información, cuando hubiera sido deseable una perspectiva

más cartográfica(Balboa, 2006).

Varios autores son los que aseguran que el operador de generalización utilizado

con mayor frecuencia es la simplificación, presuponiendo que casi el mayor

porcentaje de la cartografía vectorial está compuesta por elementos lineales. La

aplicación de esta herramienta puede extenderse al tratamiento de entidades

como edificios, ya que estos pueden ser tratados a partir del contorno lineal que

los define.

Debido a lo mencionado, se ha elegido la simplificación lineal como el primer

procedimiento a tener en cuenta durante los trabajos de experimentación que se

desarrollarán en esta investigación.

El funcionamiento de este tipo de procesos se fundamenta en la eliminación de

la mayor cantidad de información irrelevante o puntos, manteniendo la forma

original del objeto en la medida de lo posible. La mayoría de las rutinas de

simplificación utilizan criterios geométricos (medidas de distancias, ángulos o

áreas) para la selección de los datos significantes o críticos, haciéndose

necesaria la determinación de un parámetro que actuará de umbral para la

selección de los puntos críticos.

Page 35: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

15

Estos parámetros son fundamentales para la obtención de una solución óptima y

no existen referencias para su correcta elección en función de la escala. No

obstante, en esta investigación se han realizado múltiples pruebas para la

búsqueda de una correcta cuantificación de estos umbrales que facilitarán la

utilización de los algoritmos presentados (García Beltrán & Arranz, 2007).

El Algoritmo de Douglas Peucker es el más clásico de generalización por

excelencia y es el único que suele ser incluido en programas comerciales de

cartografía digital y S.I.G., además de estar siendo empleado por instituciones

cartográficas para disminuir el tamaño de sus bases de datos digitales o para la

generación de nuevas cartografías a escala menor. Incluso se llega a decir que

es realmente el único algoritmo de generalización de líneas de carácter global en

uso.

Su popularidad tuvo a lugar por ser uno de los primeros algoritmos de

eliminación de puntos de carácter global, con un sentido más holístico que los

ideados hasta entonces. Se fundamenta en la búsqueda de puntos críticos, que

serán puntos que retengan la mayor cantidad de información de la geometría de

la línea.

En el funcionamiento del algoritmo, los puntos críticos, que irán constituyendo

una línea filtrada, serán los que vayan marcando la distancia perpendicular

máxima respecto a la línea base considerada.

La primera línea base entre los puntos denominados anclaje y flotante, quedará

constituida entre el primero y el último punto de la línea original. Acto seguido se

calcularán las distancias perpendiculares de todos los puntos intermedios. Si

ninguna de estas distancias es mayor a la tolerancia la simplificación habrá

finalizado y solo quedarán retenidos los puntos inicial y final de la línea.

En el caso de que si se supere la tolerancia el punto mayor distancia será

retenido como punto crítico que subdividirá la línea original en dos secciones, en

cada una de las cuales se repetirá el proceso como si de dos líneas

independientes se tratase, y así sucesivamente hasta que no haga falta ejecutar

Page 36: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

16

subdivisión alguna línea como podemos ilustrar en la siguiente gráfica (Balboa,

2006).

Gráfico 1 Funcionamiento del algoritmo Douglas Peucker

ELABORADO POR: Jorge Luis Miranda Gallegos

Fuente: (Balboa, 2006)

Page 37: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

17

FUNDAMENTACIÓN TEÓRICA

RAMER-DOUGLAS-PEUCKER

El algoritmo de Ramer-Douglas-Peucker, a veces también denominado algoritmo

y mayormente conocido como Douglas Peucker directamente, es un algoritmo

que fue desarrollado en los años 70 por Urs Ramer, David Douglas y Thomas

Peucker. Este algoritmo permite reducir la cantidad de puntos en una ruta de

segmentos rectilíneos utilizando un criterio de distancias. Es muy útil para la

simplificación de rutas sobre mapas.

Además de sus buenos resultados visuales, el algoritmo DP es muy sencillo de

programar y funciona para cualquier dimensión, una vez que sólo se basa en la

distancia entre puntos y líneas. Su regla básica es que la aproximación debe

contener un subconjunto de los puntos de datos originales y los puntos de datos

deben situarse dentro de una cierta distancia predefinida a la aproximación (Wu

& Márquez, 2003).

La idea de este algoritmo es reemplazar la trayectoria original por un segmento

de línea más cercano. Si el reemplazo no llena las expectativas, ahora se divide

el problema original en dos sub problemas seleccionando el punto de ubicación

que aporta más errores como punto de división. Este evento sigue ocurriendo

hasta que el error entre la trayectoria aproximada y la trayectoria original está por

debajo del umbral de error especificado.

Muchos cartógrafos consideran el Douglas-Algoritmo de Peucker como uno de

los algoritmos de generalización de línea más precisos disponibles Pero algunos

piensan que es demasiado costoso en términos de tiempo de procesamiento (Yu

Zheng, 2011).

Page 38: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

18

Gráfico 2 Algoritmo básico Douglas-Peucker

Fuente: (WU, 2003)

ELABORADO POR: Jorge Luis Miranda Gallegos

Dada una secuencia de vértices en el Gráfico 2 como se representa en la Figura

1.a. El algoritmo de Douglas Peucker tiene una estructura jerárquica une los

vértices primero y último de la poli línea (Figura 1.b).

Page 39: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

19

Entonces los vértices restantes son probados para la cercanía a ese borde. Si

hay vértices más allá de una tolerancia especificada lejos del borde, entonces se

le añade a la poli línea previamente simplificada. Esto crea una nueva

aproximación para la poli línea original (Figura1.c). Usando recursión, este

proceso continúa para cada (Figuras 1.d, e) hasta que todos los vértices de la

poli línea original están dentro (Figura 1.f) (Arranz Justel, 2010).

FILTRO DE KALMAN

El filtro de Kalman es un conjunto de ecuaciones matemáticas que proveen una

solución recursiva del método de mínimos cuadrados. Esta solución permite

calcular un estimador lineal, insesgado y óptimo del estado de un proceso en

cada momento del tiempo con base en la información disponible en el momento

t-1, y actualizar, con la información adicional disponible en el momento t, dichas

estimaciones.

El filtro se desempeña suponiendo que el sistema puede ser descrito a través de

un modelo estocástico lineal, en donde el error asociado tanto al sistema como a

la información adicional que se incorpora en el mismo tiene una distribución

normal con media cero y varianza determinada.

La solución es óptima por cuanto el filtro combina toda la información observada

y el conocimiento previo acerca del comportamiento del sistema para producir

una estimación del estado de tal manera que el error es minimizado

estadísticamente.

El término recursivo significa que el filtro recalcula la solución cada vez que una

nueva observación o medida es incorporada en el sistema.

El filtro de Kalman es el principal algoritmo para estimar sistemas dinámicos

representados en la forma de estado-espacio En esta representación el sistema

es descrito por un conjunto de variables denominadas de estado. El estado

contiene toda la información relativa al sistema a un cierto punto en el tiempo.

Page 40: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

20

Esta información debe permitir la inferencia del comportamiento pasado del

sistema, con el objetivo de predecir su comportamiento futuro. Lo que hace al

filtro tan interesante es precisamente su habilidad para predecir el estado de un

sistema en el pasado, presente y futuro, aun cuando la naturaleza precisa del

sistema modelado es desconocida.

En la práctica, las variables estado individuales de un sistema dinámico no

pueden ser exactamente determinadas por una medición directa. Dado lo

anterior, su medición se realiza por medio de procesos estocásticos que

involucran algún grado de incertidumbre en la medición.

Proceso a ser estimado

El filtro de Kalman tiene como objetivo resolver el problema general de estimar el

estado X ∈ℜn de un proceso controlado en tiempo discreto, el cual es dominado

por una ecuación lineal en diferencia estocástica de la siguiente forma:

X = AX t −1 + w t −1 (1)

con una medida Z ∈ℜm , que es

Z t = HX t + v t (2)

Las variables aleatorias wt y vt representan el error del proceso y de la medida

respectivamente. Se asume que son independientes entre ellas, que son ruido

blanco y con distribución de probabilidad normal:

p(w) ~ N(0,Q) (3)

p(v) ~ N(0, R) (4)

Page 41: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

21

En la práctica las matrices de covarianza de la perturbación del proceso, Q y de

la perturbación de la medida R, podrían cambiar en el tiempo, por simplicidad en

general se asumen que son constantes.

La matriz A se asume de una dimensión nxn y relaciona el estado en el periodo

previo t-1 con el estado en el momento t. La matriz H de dimensión mxn

relaciona el estado con la medición Zt.

Estas matrices pueden cambiar en el tiempo, pero en general se asumen como

constantes.

Algoritmo

El filtro de Kalman estima el proceso anterior utilizando una especie de control

de retroalimentación, esto es, estima el proceso a algún momento en el tiempo y

entonces obtiene la retroalimentación por medio de los datos observados.

Desde este punto de vista las ecuaciones que se utilizan para derivar el filtro de

Kalman se pueden dividir en dos grupos: las que actualizan el tiempo o

ecuaciones de predicción y las que actualizan los datos observados o

ecuaciones de actualización.

Las del primer grupo son responsables de la proyección del estado al momento t

tomando como referencia el estado en el momento t-1 y de la actualización

intermedia de la matriz de covarianza del estado.

El segundo grupo de ecuaciones son responsables de la retroalimentación, es

decir, incorporan nueva información dentro de la estimación anterior con lo cual

se llega a una estimación mejorada del estado.

Las ecuaciones que actualizan el tiempo pueden también ser pensadas como

ecuaciones de pronóstico, mientras que las ecuaciones que incorporan nueva

información pueden considerarse como ecuaciones de corrección.

Page 42: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

22

Efectivamente, el algoritmo de estimación final puede definirse como un

algoritmo de pronóstico-corrección para resolver numerosos problemas. Así el

filtro de Kalman funciona por medio de un mecanismo de proyección y corrección

al pronosticar el nuevo estado y su incertidumbre y corregir la proyección con la

nueva medida. Este ciclo se muestra en el Gráfico 3 (Ramírez, 2013).

Gráfico 3 El Ciclo del Filtro de Kalman

ELABORADO POR: Jorge Luis Miranda Gallegos

FUENTE: BANCO CENTRAL DE COSTA RICA

El primer paso consiste en generar un pronóstico del estado hacia adelante en el

tiempo tomando en cuenta toda la información disponible en ese momento y en

un segundo paso, se genera un pronóstico mejorado del estado, de tal manera

que el error es minimizado estadísticamente. Las ecuaciones específicas para el

pronóstico y la corrección del estado son detalladas en las grafico 3 y 4,

respectivamente.

Page 43: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

23

Gráfico 4 Ecuaciones de pronóstico del Filtro de Kalman discreto

ELABORADO POR: Jorge Luis Miranda Gallegos

Fuente: Investigación en S.I.G.

Note cómo las ecuaciones del gráfico 1 pronostican las estimaciones del estado

y la covarianza hacia delante desde t-1 a t. La matriz A relaciona el estado en el

momento previo t-1 con el estado al momento actual t, esta matriz podría

cambiar para los diferentes momentos en el tiempo (t). Q representa la

covarianza de la perturbación aleatoria del proceso que trata de estimar el

estado.

Gráfico 5 Ecuaciones de corrección del Filtro de Kalman discreto

ELABORADO POR: Jorge Luis Miranda Gallegos

Fuente: Investigación en S.I.G.

La primera tarea durante la corrección de la proyección del estado es el cálculo

de la ganancia de Kalman, Kt, (ecuación 7). Este factor de ponderación o

ganancia es seleccionado de tal forma que minimice la covarianza del error de la

nueva estimación del estado.

El siguiente paso es realmente medir el proceso para obtener Zt y entonces

generar una nueva estimación del estado que incorpora la nueva observación

como en la ecuación (8). El paso final es obtener una nueva estimación de la

covarianza del error mediante la ecuación (9). Después de cada par de

actualizaciones, tanto del tiempo como de la medida, el proceso es repetido

Page 44: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

24

tomando como punto de partida las nuevas estimaciones del estado y de la

covarianza del error. Esta naturaleza recursiva es una de las características

llamativas del filtro de Kalman (Ramírez, 2013).

La figura 7 ofrece un cuadro completo de la operación del filtro, combinando la

figura 1 con las ecuaciones de la figura 3 y 4.

Gráfico 6 Visión completa del Filtro de Kalman

ELABORADO POR: Jorge Luis Miranda Gallegos

FUENTE: (Ramírez, 2013)

Page 45: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

25

Parámetros del filtro y sintonización

“Existen dos variables de gran importancia en el comportamiento del Filtro de

Kalman. Estos son parámetros son las matrices de covarianza Q y R que

representan las perturbaciones en el proceso.

En el caso de R, éste puede ser obtenido de forma off-line, bien mediante la

toma de mediciones de nuestro sensor y calculando la varianza del ruido

presente o bien mediante ensayo y error observando la respuesta de nuestro

sistema.

Ambas formas son válidas si bien hay que tener en cuenta ciertas pautas:

Si la perturbación en el proceso es grande, entonces el parámetro R también ha

de serlo. Esto hará que la ganancia de Kalman K sea pequeña y no se dé mucho

peso a las mediciones realizadas para la estimación de Xk.

Por el contrario, si R es pequeña, la ganancia de Kalman K será mayor y se dará

mayor credibilidad a las mediciones obtenidas para el cálculo de Xk.

En cuanto al parámetro Q, su determinación es algo más complicada ya que se

necesita observar de forma directa el proceso a estimar. En procesos no muy

complejos, una suficiente incertidumbre puede arrojar buenos resultados.

Por otro lado, si los valores hallados de Q y R son correctos y se consideran

constantes a lo largo del tiempo, la matriz de ganancia de Kalman Kk y la de

covarianza del error Pk pueden estabilizarse rápidamente llegando a permanecer

constantes durante el proceso.” (Carlos & Marinero, 2014)

Page 46: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

26

LENGUAJE R

Según (Paradis, 2002) R es un lenguaje Orientado a Objetos, bajo este

complejo término se esconde la simplicidad y flexibilidad de R. El hecho que R

es un lenguaje de programación puede desaminar a muchos usuarios que

piensan que no tienen “alma de programadores”. Esto no es necesariamente

cierto por dos razones. Primero R es un lenguaje interpretado (como Java) y no

compilado (como C, C++, Fortran, Pascal, . . . ), lo cual significa que los

comandos escritos en el teclado son ejecutados directamente sin necesidad de

construir ejecutables.

Existen varios paquetes disponibles de la red completa de archivado R (CRAN)

Ofreciendo capacidades generales de filtro de Kalman, además de una serie de

funciones dispersas en otros Paquetes que atienden a modelos o problemas

especiales.

Describimos cinco de esos paquetes en Orden cronológico de primera aparición

en CRAN (Paradis & Ahumada, n.d.).

Package DSE

El paquete dse es el ofrecimiento de R incluyendo el filtrado de Kalman que ha

sido más largo en existencia. Las versiones para R en los archivos CRAN se

remontan al menos al año 2000 (inicialmente, su contenido se dividió en

paquetes dse1 y dse2). Antes, el software existía desde al menos 1996,

momento en el que corrió en S-PLUS y R. Una versión separada para R ha

estado en existencia Desde 1998.

Dse es un paquete grande, con una funcionalidad bastante extensa para

manejar series temporales multivariadas. El autor escribe, Mientras que el

software hace muchas cosas estándares de la serie de tiempo, está realmente

pensado Para hacer algunas cosas no estándar. [Paquete dse] está diseñado

Page 47: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

27

para trabajar con Series de tiempo multivariadas y para el estudio de técnicas de

estimación y Modelos.

Dse implementa tres clases de objetos: TSdata, TSmodel y TSestModel, que

Representan datos, modelo y modelo estimado (Tusell, 2011a).

Package SSPIR

La primera versión de sspir en CRAN se remonta a 2005. No contiene

documentación que no sea las páginas de manual. Sspir es un paquete R puro,

es decir, no contiene código compilado. Utiliza un enfoque orientado a objetos.

Un modelo de espacio de estado gaussiano está representado por un objeto de

clase SS.

Existe una función constructora del mismo Nombre que produce un objeto SS

cuando se invoca con la información requerida. La covarianza Las matrices Qt,

Ht (Wmat y Vmat en la notación del paquete) pueden ser matrices constantes o

funciones, mientras que las matrices de medición y de transición Zt y Tt (Fmat y

Gmat en la Notación del paquete) tienen que ser funciones de tiempo, un vector

de parámetros φ y posiblemente un Conjunto de covariables (Tusell, 2011a).

Package DLM

La versión del paquete dlm fue enviada a CRAN en agosto de 2006. Al igual que

sspir, el modelo de espacio de estados considerado es una versión simplificada,

sin interceptar Ct, dt y ninguna matriz Rt.

Se hace hincapié en el análisis bayesiano de la dinámica lineal Modelos (DLM),

pero el paquete también puede usarse para el filtro / suavizado de Kalman y el

Estimación de verosimilitud.

Los objetivos de diseño expuestos en las observaciones finales son “Flexibilidad

y estabilidad numérica del filtrado, suavizado y probabilidad. Estos dos objetivos

Page 48: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

28

están algo relacionados, ya que las implementaciones ingenuas Del filtro de

Kalman se sabe que sufren de inestabilidad numérica Para DLMs generales. Por

lo tanto, en un entorno en el que el usuario es libre de especificar prácticamente

cualquier tipo de DLM, era importante tratar de evitar lo más posible los

problemas de inestabilidad antes mencionados” (Tusell, 2011b).

Package KFAS

Paquete KFAS es la adición más reciente al filtrado de Kalman en R. Incluye

funciones para el filtrado de Kalman, suavizado, suavizado de simulación y

suavizado de perturbaciones. También incluye una función auxiliar para

pronosticar a partir de la salida del filtro de Kalman.

Las matrices del sistema que varían con el tiempo son compatibles, al igual que

los valores faltantes. Las funciones R comprueban errores y llaman a rutinas que

realizan la mayor parte del esfuerzo computacional; Se utiliza ampliamente BLAS

y LAPACK para todos los cálculos de álgebra lineal.

Como en el en el caso del paquete anterior, las matrices que varían en el tiempo

se manejan utilizando arreglos, siendo la última dimensión el tiempo.

El paquete contiene siete funciones visibles del usuario: kf, Ks, simsmoother,

distsmoother, eflik / eflik0 y pronóstico para el filtrado de Kalman, Suavizado,

suavizado de simulación, suavizado de perturbaciones, logaritmismo aproximado

Cálculo de modelos no gaussianos y pronóstico (Tusell, 2011a).

Paquete FKF

El paquete FKF apareció por primera vez en el CRAN en febrero de 2009; El

nombre del paquete significa \ Fast Kalman Filter, y el énfasis está en la

velocidad. Contiene sólo dos funciones, fkf y plot.fkf. La segunda es una función

auxiliar para trazar resultados. Fkf es un envolvente en R de una rutina C que

implementa el filtro.

Page 49: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

29

Todas las matrices del sistema pueden ser constantes o variables en el tiempo.

Este último caso requiere su definición como tramas tridimensionales, siendo la

última dimensión el tiempo.

Aparte de hacer todos los cálculos en código compilado, los autores han optado

por utilizar una covarianza en lugar de una raíz cuadrada en el filtro, en

consonancia con su búsqueda de velocidad máxima:

El cálculo es multivariable, es decir, no aprovechan el procesamiento secuencial

que para grandes dimensiones del vector de observación yt y la diagonal Ht

puede ser sustancial. Más bien, se centran en cálculos rápidos de álgebra lineal,

con un amplio recurso a BLAS y LAPACK.

No utilizar el enfoque secuencial dificulta el trato Con valores perdidos dispersos

en el vector yt, que no estaban soportados en versiones anteriores del paquete

La función fkf calcula y devuelve la probabilidad, calcula de la Probabilidad se

detiene si Ft pasa a ser singular, algo que nunca debe ser el Caso de matrices

positivas de ht. Función fkf devuelve tanto filtrado y predicción de estimaciones

del estado (Tusell, 2011a).

FUNDAMENTACIÓN LEGAL

El proyecto de investigación de “Análisis De Comparación Del Rendimiento Del

Algoritmo De Douglas-Peucker Con La Incorporación Del Filtro De Kalman.” se

apoya por el Art.350 de la Constitución de la República del Ecuador.

Art. 350.- El sistema de educación superior tiene como finalidad la formación

académica y profesional con visión científica y humanista; la investigación

científica y tecnológica; la innovación, promoción, desarrollo y difusión de los

saberes y las culturas; la construcción de soluciones para los problemas del

país, en relación con los objetivos del régimen de desarrollo.

Page 50: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

30

Este proyecto también se respalda en el Art. 1, en la Ley Orgánica de la

Educación Superior del Ecuador.

Art. 1 Forman parte del Sistema Nacional de Educación Superior ecuatoriano.

a) Las Universidades u Escuelas Politécnicas creadas por Ley y las que se

crearen de conformidad en la Constitución Política y la presente Ley. Estas

podrán ser públicas financiadas por el estado, particulares, cofinanciadas por el

estado y particulares autofinanciadas.

b) Los Institutos Superiores técnicos y tecnológicos que hayan sido autorizados

por el Ministerio de educación y que sean incorporados al sistema, así como los

que se crearen de conformidad con la presente ley. Las instituciones del Sistema

Nacional de Educación Superior ecuatoriano tienen como misión la búsqueda de

la verdad , el desarrollo de las culturas universal y ancestral ecuatoriana, de la

ciencia y la tecnología, mediante la docencia, la investigación y la vinculación

con la colectividad.

Será su deber fundamental la actualización y adecuación constantes de las

actividades docentes e investigativas, para responder con pertenencia a los

requerimientos del desarrollo del país.

En referencia a la utilización de “Código Libre”, tenemos en el Ecuador la

siguiente ley:

Decreto N° 1014 firmado el 10 de abril del 2008 por el Presidente del

Ecuador Rafael Correa Delgado decreta:

Art1. Establecer como política pública para las Entidades de la Administración

Publica Central la utilización de Software Libre en sus sistemas y equipamientos

informáticos.

Page 51: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

31

Art2. Se entiende por Software Libre, a los programas de computación que se

pueden utilizar y distribuir sin restricción alguna, que permitan su acceso a los

códigos fuentes y que sus aplicaciones puedan ser mejoradas. Las

características de estos programas de computación contienen las siguientes

libertades:

a) Pueda ser utilizado con cualquier propósito de uso común.

b) Permita la distribución de copias sin limitación alguna.

c) Permita el estudio y modificación del software (Requisito: código fuente

disponible)

d) Permita la divulgación del software si existe alguna mejora o actualización

(Requisito: código fuente disponible)

Art. 4. Se faculta la utilización de software propietario (no libre) únicamente

cuando no exista una solución de Software Libre que supla las necesidades

requeridas, o cuando esté en riesgo la seguridad nacional, o cuando el proyecto

informático se encuentre en un punto de no retorno.

CONSTITUCIÓN DE LA REPÚBLICA DEL ECUADOR, TÍTULO II, DERECHOS

Comunicación e Información (2008)

(Asamblea Constituyente) “Art. 16.- Todas las personas, en forma individual o

colectiva, tienen derecho a”:

a) Una comunicación libre, intercultural, incluyente, diversa y participativa,

en todos los ámbitos de la interacción social, por cualquier medio y forma,

en su propia lengua y con sus propios símbolos (Asamblea Constituyente).

b) (Asamblea Constituyente) “El acceso universal a las tecnologías de

información y comunicación”.

Page 52: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

32

c) La creación de medios de comunicación social, y al acceso en igualdad

de condiciones al uso de las frecuencias del espectro radioeléctrico para la

gestión de estaciones de radio y televisión públicas, privadas y

comunitarias, y a bandas libres para la explotación de redes inalámbricas

(Asamblea Constituyente).

d) (Asamblea Constituyente)” El acceso y uso de todas las formas de

comunicación visual, auditiva, sensorial y a otras que permitan la inclusión de

personas con discapacidad”.

e) (Asamblea Constituyente) “Integrar los espacios de participación previstos en

la Constitución en el campo de la comunicación”.

(Asamblea Constituyente) “Art. 17.- EI Estado fomentará la pluralidad y la

diversidad en la comunicación, y al efecto”:

a) Garantizará la asignación, a través de métodos transparentes y en

igualdad de condiciones, de las frecuencias del espectro radioeléctrico,

para la gestión de estaciones de radio y televisión públicas, privadas y

comunitarias, así como el acceso a bandas libres para la explotación de

redes inalámbricas, y precautelará que en su utilización prevalezca el

interés colectivo (Asamblea Constituyente).

b) Facilitará la creación y el fortalecimiento de medios de comunicación

públicos, privados y comunitarios, así como el acceso universal a las

tecnologías de información y comunicación en especial para las personas

y colectividades que carezcan de dicho acceso o lo tengan de forma

limitada (Asamblea Constituyente).

c) (Asamblea Constituyente) “No permitirá el oligopolio o monopolio, directo ni

indirecto, de la propiedad de los medios de comunicación y del uso de las

frecuencias”.

Page 53: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

33

PREGUNTA CIENTÍFICA A CONTESTARSE

¿Cómo mejorar el rendimiento del algoritmo de Douglas Peucker a través de la

reducción del ruido que realiza el filtro de Kalman.?

DEFINICIONES CONCEPTUALES

Ruido

Partiendo de que el ruido se lo define como una perturbación no deseada, que

corrompe o altera el contenido de información de la señal que está en uso. Se

puede dividir el ruido en dos, el ruido intrínseco y el ruido extrínseco.

El ruido intrínseco es aquel que la fuente de ruido se encuentra dentro del

sistema. El ruido extrínseco es aquel que es generado por fuentes que son

externas a nuestro sistema (Vasilescu, 2005).

Procesos Aleatorios

“Un enfoque intuitivo, que facilita la descripción de los procesos aleatorios (RPs),

se logra desde la diferenciación de estos con los procesos determinísticos.

En este contexto se entiende por proceso a toda regla que asigna una cantidad a

una variable indeterminada en un instante de tiempo dado. Sin embargo, por

razones de nomenclatura se conviene en llamar proceso a toda variable cuyos

valores son asignados mediante la ejecución de dicha regla en el tiempo.

En los procesos determinísticos, su valor es determinado directamente por una

regla de asignación y una o más variables no aleatorias. Un ejemplo de proceso

determinístico es:

X(t) = sin (2πt)

Page 54: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

34

En este caso en particular, el proceso x varía con el tiempo. Otro ejemplo en el

cual la evolución del proceso es independiente con respecto al tiempo es:

x(t) = 17

Por otro lado en los RPs (o estocásticos), su valor es determinado mediante una

regla de asignación y una o más variables aleatorias. Debido a esto solo se

conocen de manera determinística las propiedades estadísticas del proceso

aleatorio. Un ejemplo de un RP en el que su estadística varía con el tiempo es:

x(t) = A sin(2 πt) + B

Donde tanto A como B son variables aleatorias con densidades de probabilidad

conocidas. Esta regla establece que para un instante de tiempo dado, tanto la

fase como la amplitud del proceso x están gobernadas por los valores de A y B

resultantes del experimento estadístico realizado en ese instante.

Un ejemplo de RP que evoluciona de manera independiente del tiempo es:

X(t) = A

Notar que esto no implica que el valor de x sea constante con el tiempo pues,

para cada instante se debe ejecutar un experimento distinto por lo que la

variable aleatoria (RV) A puede tomar valores distintos.”(Dematties & Iglesias,

2012).

Variables Aleatorias

Una variable aleatoria es una función que mapea todos los puntos en el espacio

de muestra a los números reales. Las variables aleatorias pueden ser de dos

tipos: discretas o continuas.

Page 55: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

35

La variable aleatoria discreta es cuando se pueden contar un conjunto de

resultados a darse. La variable aleatoria continua es cuando toma valores en

una escala continua.

Media y Varianza

La media y la varianza son estadísticos que se estiman a partir de una o varias

muestras obtenidas de una población (Sharon, 1999). La media es clasificada

como medida de posición central y la varianza es definida como una medida de

dispersión.

Desviación Estándar

“La desviación estándar o desviación típica (σ) es una medida de centralización

o dispersión para variables de razón (ratio o cociente) y de intervalo, de gran

utilidad en la estadística descriptiva.

Se define como la raíz cuadrada de la varianza. Junto con este valor, la

desviación típica es una medida (cuadrática) que informa de la media de

distancias que tienen los datos respecto de su media aritmética, expresada en

las mismas unidades que la variable.

Se caracteriza por ser el estadígrafo de mayor uso en la actualidad. Se obtiene

mediante la aplicación de la siguiente fórmula:

Page 56: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

36

Gráfico Desviación Estándar

Fuente: Universidad Nacional del Callao

Elaborado por: Jorge Luis Miranda Gallegos

La desviación Standard o desviación típica se aplica solo para datos

agrupados.”(Otoya, n.d.).

Orientado a Objetos

Significa que las variables, datos, funciones, resultados, etc., se guardan

Page 57: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

37

en la memoria activa del computador en forma de objetos con un nombre

específico. El usuario puede modificar o manipular estos objetos con operadores

(aritméticos, lógicos, y comparativos) y funciones (que a su vez son objetos)

(Paradis, 2002).

“La programación orientada a objetos establece un equilibrio entre la importancia

de los procesos y los datos, mostrando un enfoque más cercano al pensamiento

del ser humano. Se introduce un aspecto novedoso respecto al anterior

paradigma: la herencia, facilitando el crecimiento y la mantenibilidad.

Las bases de la programación orientada a objetos son: abstracción,

encapsulación, modularidad y jerarquización.

La abstracción es un proceso mental de extracción de las características

esenciales, ignorando los detalles superfluos. Resulta ser muy subjetiva

dependiendo del interés del observador, permitiendo abstracciones muy

diferentes de la misma realidad.

La encapsulación es ocultar los detalles que dan soporte a un conjunto de

características esenciales de una abstracción. Existirán dos partes, una visible

que todos tienen acceso y se aporta la funcionalidad, y una oculta que

implementa los detalles internos.

La modularidad es descomponer un sistema en un conjunto de partes. Aparecen

dos conceptos muy importantes: acoplamiento y cohesión.

El acoplamiento entre dos módulos mide el nivel de asociación entre ellos; nos

interesa buscar módulos poco acoplados.

La cohesión de un módulo mide el grado de conectividad entre los elementos

que los forman; nos interesa buscar una cohesión alta.

La jerarquía es un proceso de estructuración de varios elementos por niveles.

Page 58: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

38

La programación orientada a objetos implementa estos cuatro conceptos con los

siguientes elementos: clases y objetos, atributos y estado, métodos y mensajes,

herencia y polimorfismo.”(García Beltrán & Arranz, 2007)

Tolerancia

Se relaciona a la habilidad de un sistema de almacenamiento para obtener

una entrada a la información o seguir funcionando normalmente aun en

caso de producirse algún fallo. El sistema de almacenamiento debe almacenar

la misma información en más de un componente de hardware o dispositivo

externos a modo de respaldo. Es decir, si se produce algún fallo con una

representativa pérdida de datos, el sistema debe ser capaz de dar facilidad de

entrada a toda la información, recuperando los datos faltantes desde algún

respaldo.

Postgres

PostgreSQL es un Sistema de Gestión de Base de datos orientada a objetos, el

desarrollo de Postgres no es manejado por personas ni por empresas, sino por

un grupo de desarrolladores que trabajaron de manera desinteresada, libre y

apoyada por organizaciones comerciales.

Según (Cameron, 2003) Impulsores y protectores de PostgreSQL se notaron

una victoria significativa para la base de datos de código abierto después de la

transición exitosa de este mes del registro de dominios .ORG al sistema de

gestión relacional de objetos.

R Studio

Page 59: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

39

RStudio es un entorno de desarrollo integrado (IDE) para R. Incluye una consola,

editor de sintaxis que ayuda la compilación de código, así como herramientas

para el trazado, estadística y la gestión del espacio de trabajo.

RStudio podemos utilizarlo en diversas plataformas, están disponibles para

Windows, Mac y Linux o para navegadores conectados a RStudio Server o

RStudio Server Pro (Debian / Ubuntu, RedHat / CentOS, y SUSE Linux)

(RStudio).

Hardware

Es todo lo tangible de un computador, es decir, componentes físicos.

Datos

Es considerada como un conjunto de información que pueden ser números,

letras o símbolos que describen objetos, condiciones o situaciones.

Ruido Intrínseco

El ruido intrínseco es aquel que la fuente de ruido se encuentra dentro del

sistema. En circuitos eléctricos el ruido intrínseco se origina por el movimiento

caótico de los electrones el cual causa fluctuaciones en la corriente y el voltaje.

En estos casos no podemos determinar de manera absoluta la amplitud, solo

podemos describir la señal por medio de sus características de naturaleza

probabilística. Algunos ejemplos de ruido intrínseco son el ruido térmico, el ruido

de disparo, el ruido de parpadeo (Vasilescu, 2005).

Ruido Extrínseco

Page 60: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

40

El ruido extrínseco es aquel que es generado por fuentes que son

externas a nuestro sistema.

Por ejemplo se pueden mencionar el ruido atmosférico causado por

tormentas eléctricas, el ruido generado por motores eléctricos, radio,

celulares, acoplamientos indeseados o interferencias (Vasilescu, 2005).

Filtro de Kalman Extendido

El filtro de Kalman extendido consiste en una variaci´on del filtro de Kalman para

abordar el problema de estimación del estado cuando el modelo es posiblemente

no-lineal (Pascual, 2006).

Page 61: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

41

CAPÍTULO III

METODOLOGÍA DE LA INVESTIGACIÓN

DISEÑO DE LA INVESTIGACIÓN

El desarrollo científico e investigativo de este proyecto implica el uso de una

base de datos de trayectorias vehiculares en Postgres que posibilitan la

recolección de información o datos, para las experimentaciones del suavizado y

simplificación de trayectorias dentro de la CISC & CINT.

TIPO DE INVESTIGACIÓN

En este proyecto de titulación se ha empleado la Investigación Experimental,

porque se apoya en teorías específicas, bibliográficas para obtener resultados

en base a lo que se aplica en las experimentaciones.

La investigación experimental está orientada a la utilización del conocimiento

básico y aplicado en la introducción de productos y servicios del mercado, previo

control de los resultados mediante el diseño, construcción y prueba de modelos,

prototipos e instalaciones experimentales.

La eficacia de la presente investigación nos indica porcentualmente la posibilidad

de la ejecución del proyecto, donde mayormente son consideradas las

necesidades, requerimientos, recursos, beneficios, donde se procederá a definir

los puntos más relevantes para constatar el nivel de aceptación de la presente

investigación.

Page 62: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

42

Tabla 1 Tipo de Investigación

CRITERIOS PROYECTO PROYECTO

FACTIBLE

Finalidad Identificar la necesidad

de la investigación

Lograr el objetivo

deseado.

Objetivos Definición de los

objetivos

Objetivos de acción

procesos y actividades.

Metodología Basado en la

investigación

bibliográfica de paper,

libros y datos en sql.

Análisis y recolección de

la información basada en

la investigación.

Contenido Planteamiento del

problema.

Detallar distintas de

recomendaciones

durante la ejecución del

proyecto.

Fuente: Trabajo de Investigación

Autor: Jorge Luis Miranda Gallegos

POBLACIÓN Y MUESTRA

POBLACIÓN

Para nuestro proyecto de investigación y experimentación se seleccionó el total

de datos de la base de trayectorias vehiculares California, que está ubicada en

nuestro motor de base de datos de Postgres.

Características de la población:

Page 63: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

43

Se usa como universo a todos los datos de latitud y longitud que se encuentran

en una base de datos de trayectorias vehiculares llamada California, que

contiende un total de datos de 914684.

POBLACIÓN Cantidad

Total de datos de trayectorias vehiculares 914684

TOTAL 914684

Fuente: Universidad de Guayaquil, Carrera de Ingeniería en Sistemas y Computacionales.

Autor: Jorge Luis Miranda Gallegos.

MUESTRA

Representada por un porcentaje de la población, la siguiente experimentación se

realizará con una muestra de 100 datos de trayectorias vehiculares de puntos de

la base de datos de California. Una muestra nos puede proporcionar una

precisión suficiente para los fines buscados sin tener la necesidad de indagar a

toda la población.

Tabla 2 Muestra

MUESTRA Cantidad

100 datos de latitud y longitud de

puntos de trayectorias

100

TOTAL 100

Fuente: Universidad de Guayaquil, Carrera de Ingeniería en Sistemas Computacionales

Autor: Jorge Luis Miranda Gallegos

Al contar con el número de la muestra se procederá a realizar la simplificación y

suavizado de la ruta de trayectorias vehiculares a la cual se le aplicara en primer

lugar en filtro de Kalman para disminuir el ruido de las trayectorias y luego se

procederá a realizar la simplificación de trayectorias de Douglas Peucker para

así obtener una compresión de datos.

Page 64: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

44

En esta tabla se procederá la experimentación de la reducción de puntos de los

datos recibidos de la base de datos de California que tiene una data total de

914684 puntos, de los cuales utilizaremos la muestra de 100 puntos de

trayectorias, donde se procederá a realizar la experimentación sólo con el

algoritmo de simplificación Douglas Peucker, luego se realizará la incorporación

del filtro de Kalman. Se procederá a realizar una segunda experimentación para

la obtención del tiempo de ejecución de estos algoritmos y el ratio de

Compresión representada en porcentaje (%) para los 100 puntos de trayectorias

que tomaremos como muestra.

Tabla 3 Experimentación de 100 datos

PORCENTAJE DATOS

California General 100

Simplificado Douglas Peucker 13

Filtro de Kalman + Douglas Peucker 3

Tiempos de Ejecución 2 seg

Ratio de Compresión (%) 3%

Fuente: Trabajo de Investigación Experimental

Autor: Jorge Luis Miranda Gallegos

Page 65: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

45

OPERACIONALIZACIÓN DE VARIABLES.

Tabla 4 Operacionalización de Variables

Variables Dimensiones Indicadores Técnicas y/o Instrumentos

Variable

Independiente.

Rendimiento del

algoritmo de

Douglas

Peucker con la

incorporación

del filtro de

Kalman.

Rendimiento del

algoritmo de

Douglas Peucker

Trayectoria real

Reducción de puntos irrelevantes

Herramientas de

software para

realizar

experimentos

sobre el algoritmo

de Douglas

Peucker

incorporando el

filtro de Kalman.

Incorporación del

filtro de Kalman.

Cálculos del error

Reducción de ruido del filtro de Kalman

Ganancia de Kalman

Artículos sobre

experimentos

realizados por

medio del filtro de

Kalman

Variable

Dependiente.

Compresión de

trayectorias

Compresión de

trayectorias

Comprimir puntos de

la trayectoria total

Foros en la web,

revistas

científicas,

artículos y libros.

Fuente: Universidad de Guayaquil, Carrera de Ingeniería en Sistemas y

Computacionales Autor: Jorge Luis Miranda Gallegos.

Page 66: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

46

TÉCNICAS E INSTRUMENTOS PARA LA RECOLECCIÓN DE DATOS

Para el presente trabajo de proyecto investigativo en la recolección de datos se

debe utilizar una serie de técnicas y desarrollos para el análisis del

comportamiento de datos geo referenciales que estarán en el repositorio de base

de datos en Postgres con los que se van a realizar experimentos por medio del

algoritmo de Douglas Peucker incorporando el filtro de Kalman, para poder lograr

este propósito, la información será recolectada de fuentes ubicadas en

repositorios en la web, libros los cuales están disponibles libremente para la

comunidad, estos permitirán realizar la incorporación del filtro de Kalman al

algoritmo de Douglas Peucker para realizar una compresión de puntos de una

trayectoria real.

Para la presente experimentación en mención, se utilizó un muestreo de 100

datos donde se introduce un error GGT = -6.650689e-08 dado por los cálculos

de la varianza del error, al evaluar el cálculo se observa que el valor del cálculo

del error GGT es muy aceptable, lo que significa que el pronóstico se realiza con

buena aproximación al reflejar valores cercanos a cero.

Se introduce una varianza de transición HHT = 1.883227e-10 donde se puede

interpretar que el resultado de la varianza de transición es aceptable debido a

que los valores reflejados son cercanos a cero y debido a esto no hay perdida en

la integridad de los datos.

Al proponer una reducción de puntos solo con el algoritmo de Douglas Peucker

tenemos una simplificación de 13 puntos, al proponer otra experimentación con

la reducción de puntos de Douglas Peucker con filtro de Kalman podemos

concluir que el método consigue un buen filtrado de ruido a 3 puntos, donde una

tercera experimentación podemos ver que el tiempo de ejecución de este

algoritmo es de 2 segundos. Podemos decir el algoritmo se repite de manera

recursiva para todos los puntos a filtrar de nuestra señal ruidosa y asi es que

obtuvimos el resultado del filtro de Kalman, obteniendo un ratio de compresión

del 3%.

Page 67: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

47

Gráfico 7 Experimentación con 100 datos

Fuente: Experimentación en RStudio Autor: Jorge Luis Miranda Gallegos.

Page 68: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

48

En la integración de los dos algoritmos se obtuvo una reducción de puntos

y existe un suavizado en la trayectoria vehicular gracias a la eliminación

de ruido por el Filtrado de Kalman.

Page 69: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

49

CAPÍTULO IV

RESULTADOS Y CONCLUSIONES

En la presente investigación se propone un suavizado de ruta por medio de un

filtrado de ruido mejorado, el ratio de compresión de la misma, los experimentos

demuestran que la combinación de los dos filtrados consigue una simplificación

de ruta y un buen filtrado por lo que reduce enormemente el número de datos

provocando que pueda existir un menor consumo en recursos en la base de

datos lógica.

La siguiente experimentación se realizó con datos de trayectorias vehiculares de

puntos de California, en la cual se procederá a realizar experimentaciones con

datos del 10% de los datos totales. En esta tabla se procedió a la

experimentación de la reducción de puntos de los datos recibidos de la base de

datos de California que tiene una data total de 914684 puntos, se realizó la

experimentación solo con el algoritmo de simplificación Douglas Peucker, luego

se unificó la incorporación del filtro de Kalman. En una segunda

experimentación se obtuvo el tiempo de ejecución de estos algoritmos y el ratio

de Compresión representada en porcentaje (%) de cada una de estas

iteraciones.

Page 70: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

50

Tabla 5 Experimentación de trayectorias (California) 10%

Porcentaje 10%

California General 91468

Simplificado Douglas Peucker 7680

Filfro de Kalman + Douglas Peucker 1905

Tiempos de Ejecución 1`09seg

Ratio de Compresión (%) 2.08

ELABORADO POR: Jorge Luis Miranda Gallegos

FUENTE: Experimentación con tabla “California”

Page 71: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

51

Gráfico 8 Experimentación de trayectorias (California) 10%

ELABORADO POR: Jorge Luis Miranda Gallegos

FUENTE: Experimentación con tabla “California”

Para nuestra experimentación se utilizó un muestreo del 10% de datos. Donde

se introduce un error GGT dado por los cálculos de la varianza del error, al

Page 72: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

52

evaluar el cálculo se observa que el valor del cálculo del error GGT es muy

aceptable, lo que significa que el pronóstico se realiza con buena aproximación

al reflejar valores cercanos a cero y debido a esto podemos decir que no hay

perdida en la integridad de los datos.

Se introduce una varianza de transición HHT donde se puede interpretar que el

resultado de la varianza de transición es aceptable debido a que los valores

reflejados son cercanos a cero y debido a esto no hay perdida en la integridad

de los datos.

Al proponer una reducción de puntos de Douglas Peucker con filtro de Kalman

podemos concluir que el método consigue un buen filtrado de ruido, el algoritmo

se repite de manera recursiva para todos los puntos a filtrar de nuestra señal

ruidosa con un ratio de compresión del 2.08% con una reducción de puntos al

combinar estos algoritmos de1905 puntos.

La segunda experimentación se realizó con datos de trayectorias vehiculares de

puntos de California, en la cual se procederá a realizar experimentaciones con

datos del 20% de los datos totales. En esta tabla se procedió a la

experimentación de la reducción de puntos de los datos recibidos de la base de

datos de California que tiene una data total de 914684 puntos, se realizó la

experimentación solo con el algoritmo de simplificación Douglas Peucker, luego

se realizó la incorporación del filtro de Kalman. Se procedió a realizar una

segunda experimentación para la obtención del tiempo de ejecución de estos

algoritmos y el ratio de Compresión representada en porcentaje (%) de cada una

de estas iteraciones.

Page 73: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

53

Tabla 6 Experimentación de trayectorias (California) 20%

Porcentaje 20%

California General 182937

Simplificado Douglas Peucker 19567

Filfro de Kalman + Douglas Peucker 2267

Tiempos de Ejecución 2`12seg

Ratio de Compresión (%) 1.24

ELABORADO POR: Jorge Luis Miranda Gallegos

FUENTE: Experimentación con tabla “California”

Page 74: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

54

Gráfico 9 Experimentación de trayectorias (California) 20%

ELABORADO POR: Jorge Luis Miranda Gallegos

FUENTE: Experimentación con tabla “California”

Page 75: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

55

Para nuestra experimentación se utilizó un muestreo del 20% de datos, donde se

introduce un error GGT dado por los cálculos de la varianza del error, al evaluar

el cálculo se observa que el valor del cálculo del error GGT es muy aceptable, lo

que significa que el pronóstico se realiza con buena aproximación al reflejar

valores cercanos a cero y debido a esto podemos decir que no hay perdida en la

integridad de los datos.

Se introduce una varianza de transición HHT donde se puede interpretar que el

resultado de la varianza de transición es aceptable debido a que los valores

reflejados son cercanos a cero y debido a esto no hay perdida en la integridad

de los datos.

Al proponer una reducción de puntos de Douglas Peucker con filtro de Kalman

podemos concluir que el método consigue un buen filtrado de ruido, el algoritmo

se repite de manera recursiva para todos los puntos a filtrar de nuestra señal

ruidosa con un ratio de compresión del 1.24% con una reducción de puntos al

combinar estos algoritmos de2267 puntos.

La tercera experimentación se realizó con datos de trayectorias vehiculares de

puntos de California, en la cual se procederá a realizar experimentaciones con

datos del 30% de los datos totales. En esta tabla se procedió a la

experimentación de la reducción de puntos de los datos recibidos de la base de

datos de California que tiene una data total de 914684 puntos, se realizó la

experimentación solo con el algoritmo de simplificación Douglas Peucker, luego

se incorporará el filtro de Kalman. Se realizó una segunda experimentación para

la obtención del tiempo de ejecución de estos algoritmos y el ratio de

Compresión representada en porcentaje (%) de cada una de estas iteraciones.

Page 76: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

56

Tabla 7 Experimentación de trayectorias (California) 30%

Porcentaje 30%

California General 274405

Simplificado Douglas Peucker 19913

Filfro de Kalman + Douglas Peucker 3957

Tiempos de Ejecución 3`21seg

Ratio de Compresión (%) 1.44

ELABORADO POR: Jorge Luis Miranda Gallegos

FUENTE: Experimentación con tabla “California”

Page 77: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

57

Gráfico 10 Experimentación de trayectorias (California) 30%

ELABORADO POR: Jorge Luis Miranda Gallegos

FUENTE: Experimentación con tabla “California”

Page 78: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

58

Para nuestra tercera experimentación se utilizó un muestreo del 30% de datos.

Donde se introduce un error GGT dado por los cálculos de la varianza del error,

al evaluar el cálculo se observa que el valor del cálculo del error GGT es muy

aceptable, lo que significa que el pronóstico se realiza con buena aproximación

al reflejar valores cercanos a cero y debido a esto podemos decir que no hay

perdida en la integridad de los datos.

Se introduce una varianza de transición HHT donde se puede interpretar que el

resultado de la varianza de transición es aceptable debido a que los valores

reflejados son cercanos a cero y debido a esto no hay perdida en la integridad

de los datos.

Al proponer una reducción de puntos de Douglas Peucker con filtro de Kalman

podemos concluir que el método consigue un buen filtrado de ruido, el algoritmo

se repite de manera recursiva para todos los puntos a filtrar de nuestra señal

ruidosa con un ratio de compresión del 1.44% con una reducción de puntos al

combinar estos algoritmos de 3957 puntos.

La cuarta experimentación se realizó con datos de trayectorias vehiculares de

puntos de California, en la cual se procederá a realizar experimentaciones con

datos del 50% de los datos totales. En esta tabla se procedió a la

experimentación de la reducción de puntos de los datos recibidos de la base de

datos de California que tiene una data total de 914684 puntos, se realizó la

experimentación solo con el algoritmo de simplificación Douglas Peucker, luego

se incorporó del filtro de Kalman. Se realizó una segunda experimentación para

la obtención del tiempo de ejecución de estos algoritmos y el ratio de

Compresión representada en porcentaje (%) de cada una de estas iteraciones.

Page 79: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

59

Tabla 8 Experimentación de trayectorias (California) 50%

Porcentaje 50%

California General 457342

Simplificado Douglas Peucker 41067

Filfro de Kalman + Douglas Peucker 6922

Tiempos de Ejecución 8’02seg

Ratio de Compresión (%) 1.51

ELABORADO POR: Jorge Luis Miranda Gallegos

FUENTE: Experimentación con tabla “California”

Page 80: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

60

Gráfico 11 Experimentación de trayectorias 50%

ELABORADO POR: Jorge Luis Miranda Gallegos

FUENTE: Experimentación con tabla “California”

Page 81: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

61

Para nuestra cuarta experimentación se utilizó un muestreo del 50% de datos.

Donde se introduce un error GGT dado por los cálculos de la varianza del error,

al evaluar el cálculo se observa que el valor del cálculo del error GGT es muy

aceptable, lo que significa que el pronóstico se realiza con buena aproximación

al reflejar valores cercanos a cero y debido a esto podemos decir que no hay

perdida en la integridad de los datos.

Se introduce una varianza de transición HHT donde se puede interpretar que el

resultado de la varianza de transición es aceptable debido a que los valores

reflejados son cercanos a cero y debido a esto no hay perdida en la integridad

de los datos.

Al proponer una reducción de puntos de Douglas Peucker con filtro de Kalman

podemos concluir que el método consigue un buen filtrado de ruido, el algoritmo

se repite de manera recursiva para todos los puntos a filtrar de nuestra señal

ruidosa con un ratio de compresión del 1.51% con una reducción de puntos al

combinar estos algoritmos de 6922puntos.

La quinta experimentación se realizó con datos de trayectorias vehiculares de

puntos de California, en la cual se procederá a realizar experimentaciones con

datos del 70% de los datos totales. En esta tabla se procedió a la

experimentación de la reducción de puntos de los datos recibidos de la base de

datos de California que tiene una data total de 914684 puntos, se realizó la

experimentación solo con el algoritmo de simplificación Douglas Peucker, luego

se incorporó del filtro de Kalman. Se realizó una segunda experimentación para

la obtención del tiempo de ejecución de estos algoritmos y el ratio de

Compresión representada en porcentaje (%) de cada una de estas iteraciones.

Page 82: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

62

Tabla 9 Experimentación de trayectorias (California) 70%

Porcentaje 70%

California General 457342

Simplificado Douglas Peucker 41067

Filfro de Kalman + Douglas Peucker 6922

Tiempos de Ejecución 8’02seg

Ratio de Compresión (%) 1.51

ELABORADO POR: Jorge Luis Miranda Gallegos

FUENTE: Experimentación con tabla “California”

Page 83: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

63

Gráfico 12 Experimentación de trayectorias (California) 70%

ELABORADO POR: Jorge Luis Miranda Gallegos

FUENTE: Experimentación con tabla “California”

Page 84: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

64

Para nuestra quinta experimentación se utilizó un muestreo del 70% de datos.

Donde se introduce un error GGT dado por los cálculos de la varianza del error,

al evaluar el cálculo se observa que el valor del cálculo del error GGT es muy

aceptable, lo que significa que el pronóstico se realiza con buena aproximación

al reflejar valores cercanos a cero y debido a esto podemos decir que no hay

perdida en la integridad de los datos.

Se introduce una varianza de transición HHT donde se puede interpretar que el

resultado de la varianza de transición es aceptable debido a que los valores

reflejados son cercanos a cero y debido a esto no hay perdida en la integridad

de los datos.

Al proponer una reducción de puntos de Douglas Peucker con filtro de Kalman

podemos concluir que el método consigue un buen filtrado de ruido, el algoritmo

se repite de manera recursiva para todos los puntos a filtrar de nuestra señal

ruidosa con un ratio de compresión del 1.66% con una reducción de puntos al

combinar estos algoritmos de 10646 puntos.

La sexta experimentación se realizó con datos de trayectorias vehiculares de

puntos de California, en la cual se procederá a realizar experimentaciones con

datos del 100% de los datos totales. En esta tabla se procedió a la

experimentación de la reducción de puntos de los datos recibidos de la base de

datos de California que tiene una data total de 914684 puntos, se realizó la

experimentación solo con el algoritmo de simplificación Douglas Peucker, luego

se incorporó del filtro de Kalman. Se realizó una segunda experimentación para

la obtención del tiempo de ejecución de estos algoritmos y el ratio de

Compresión representada en porcentaje (%) de cada una de estas iteraciones.

Page 85: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

65

Tabla 10 Experimentación de trayectorias (California) 100%

Porcentaje 100%

California General 914684

Simplificado Douglas Peucker 77166

Filfro de Kalman + Douglas Peucker 14634

Tiempos de Ejecución 12`40seg

Ratio de Compresión (%) 1.60

ELABORADO POR: Jorge Luis Miranda Gallegos

FUENTE: Experimentación con tabla “California”

Page 86: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

66

Gráfico 13 Experimentación de trayectorias (California) 100%

ELABORADO POR: Jorge Luis Miranda Gallegos

FUENTE: Experimentación con tabla “California”

Page 87: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

67

Para la sexta experimentación se utilizó un muestreo del 100% de datos donde

se introduce un error GGT dado por los cálculos de la varianza del error, al

evaluar el cálculo se observa que el valor del cálculo del error GGT es muy

aceptable, lo que significa que el pronóstico se realiza con buena aproximación

al reflejar valores cercanos a cero y debido a esto podemos decir que no hay

perdida en la integridad de los datos.

Se introduce una varianza de transición HHT donde se puede interpretar que el

resultado de la varianza de transición es aceptable debido a que los valores

reflejados son cercanos a cero y debido a esto no hay perdida en la integridad

de los datos.

Al proponer una reducción de puntos de Douglas Peucker con filtro de Kalman

podemos concluir que el método consigue un buen filtrado de ruido, el algoritmo

se repite de manera recursiva para todos los puntos a filtrar de nuestra señal

ruidosa con un ratio de compresión del 1.60% con una reducción de puntos al

combinar estos algoritmos de 14,634 puntos.

Page 88: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

68

Gráfico 14 Experimentación de trayectorias (California)

0

10000

20000

30000

40000

50000

60000

70000

80000

Simplificada DP Filtro de Kalman + DP

10%

20%

30%

50%

70%

100%

ELABORADO POR: Jorge Luis Miranda Gallegos FUENTE: Experimentación con tabla “California”

Al visualizar el gráfico 14, podemos decir que la compresión de la trayectoria es

muy notable y confiable justificada anteriormente, partiendo de que el ruido se

lo define como una perturbación no deseada, que corrompe o altera el

contenido de información de la señal que está en uso. Se puede dividir el

ruido en dos, el ruido intrínseco y el ruido extrínseco optimizando los

puntos de la data original.

Page 89: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

69

Gráfico 15 Experimentación del ruido (California)

ELABORADO POR: Jorge Luis Miranda Gallegos

FUENTE: Experimentación con tabla “California”

Las ventajas de la unificación de estos dos filtros es que es compacto, no

necesita de mucha memoria porque solo usa el paso anterior para estimar

su punto actual, el algoritmo es rápido.

Page 90: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

70

BIBLIOGRAFÍA

Arranz Justel, T. S. (2010). ESTUDIO DE PROCESOS Y HERRAMIENTAS

APLICABLES A LA GENERALIZACIÓN VECTORIAL DE ENTIDADES

LINEALES. Secretariado de publicaciones de la Universidad de Sevilla,

33.

Balboa, J. L. (2006). Automatización de los procesos de segmentación y

clasificación de vías de comunicación en generalización cartográfica.

España: Universidad de Jaén.

Bishop, G. &. (2006). An Introduccion to the Kalman Filter. North Carolina:

Department of Computer Science Chapel Hill.

Carlos, J., & Marinero, F. (2014). Sistemas para determinar la posición y

orientación de herramientas quirúrgicas en operaciones de cirugía

laparoscópica.

Cameron, N. (2003). PostgreSQL affiliates .ORG domain. computerworld.

Dematties, D. J., & Iglesias, F. A. (2012). Implementación de filtro de Kalman en

FPGA.

Fernández Quesada, I. (2002). Aplicación del Filtro de Kalman al Análisis y

Predicción de Entornos Productivos Empresariales. II Conferencia de

Ingeniería de Organización, 725–731.

García Beltrán, A., & Arranz, J. M. (2007). Programación Orientada a Objetos

con Java, 71–77.

Kalman, R. E. (1960). A New Approach to Linear Filtering and Prediction

Problems. Journal of Basic Engineering Vol. 82, pag. 35-45.

Luaces, M. R., Paramá, J. R., & Pérez-Urria Lage, I. (n.d.). Entorno para la

generalización cartográfica en Sistemas de Información Geográfica.

Page 91: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

71

Otoya, C. (n.d.). Desviación Estandar, 229–271. Retrieved from

http://www.unac.edu.pe/documentos/organizacion/vri/cdcitra/Informes_Final

es_Investigacion/IF_JUNIO_2012/IF_CALDERON OTOYA_FCA/capitulo 6

y 7.pdf

Paradis, E., & Ahumada, J. A. (n.d.). R para Principiantes.

Paradis, E. (2002). R para principiantes. France: Instituto de ciencias de la

evolución.

Pascual, A. (2006). EKF y UKF: dos extensiones del filtro de Kalman para

sistemas no lineales aplicadas al control de un péndulo invertido, 35.

Quesada, I. F. (2002). Aplicación del Filtro de Kalman al Análisis y Predicción de

Entornos Productivos Empresariales. II Conferencia de Ingeniería de

Organización, 6.

Ramírez, Á. S. (2013). EL FILTRO DE KALMAN. COSTA RICA: BANCO

CENTRAL DE COSTA RICA.

Rodríguez, V. (2014). Sistemas para determinar la posición y orientación de

herramientas quirúrgicas en operaciones de cirugía laparoscópicA.

Valladolit: Departamento de Ingeniería de Sistemas y Automática.

Sharon. (1999). Muestreo, diseño y análisis. Mexico: International Thomson

Editores.

Soriano, R. M. (2002). Bases del filtro de Kalman. Dpto Ciencias de la

Computación e IA, 19.

Tusell, F. (2011a). Journal of Statistical Software. España: University of the

Basque Country.

Page 92: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

72

Tusell, F. (2011b). Kalman Filtering in R. statsoft.

Vasilescu, G. (2005). Electronic Noise and Interfering Signals Principles and

Application. Berlin: Springer.

Velez. (2001). Investigación Experimental. Medellin: En apuntes de Metodologia

de la Investigación.

Welch, G., & Bishop, G. (2006). An Introduction to the Kalman Filter. In Practice,

7(1), 1–16. https://doi.org/10.1.1.117.6808

Wu, S. T., & Márquez, M. R. G. (2003). A non-self-intersection Douglas-Peucker

algorithm. Brazilian Symposium of Computer Graphic and Image

Processing, 2003–Janua, 60–66.

https://doi.org/10.1109/SIBGRA.2003.1240992

Yu Zheng, X. Z. (2011). Computing with Spatial Trajectories. New York - USA:

Springer.

Page 93: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

73

ANEXOS

ANEXO 1. BASE DE DATOS UTILIZADA

Page 94: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

74

ANEXO 2. PLATAFORMA R-STUDIO

Page 95: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

75

ANEXO 3. Paquetes

Page 96: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

76

ANEXO 4. Paper

Page 97: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

77

Page 98: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

78

Page 99: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

79

Page 100: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

80

Page 101: UNIVERSIDAD DE GUAYAQUILrepositorio.ug.edu.ec/bitstream/redug/19578/1/B-CISC-PTG... · 2019. 5. 31. · ii repositorio nacional en ciencias y tecnologÍa ficha de registro de tesis

81