tesis.ipn.mx...INS TIT(ITO POLITÉCNICO NACIONAL SECRETARí¿ on TNVESTTGAcnów y posGRADo CARTA...

98
INSTITUTO POLIT ´ ECNICO NACIONAL CENTRO DE INVESTIGACI ´ ON Y DESARROLLO DE TECNOLOG ´ IA DIGITAL MAESTR ´ IA EN CIENCIAS EN SISTEMAS DIGITALES “DISE ˜ NO Y CONSTRUCCI ´ ON DE UN SISTEMA MEC ´ ANICO SUBACTUADO” TESIS QUE PARA OBTENER EL GRADO DE MAESTRO EN CIENCIAS EN SISTEMAS DIGITALES PRESENTA ING. RICARDO ARTURO RODR ´ IGUEZ CALDER ´ ON BAJO LA DIRECCI ´ ON DE DR. EDUARDO JAVIER MORENO VALENZUELA DICIEMBRE 2015 TIJUANA, B.C., M ´ EXICO

Transcript of tesis.ipn.mx...INS TIT(ITO POLITÉCNICO NACIONAL SECRETARí¿ on TNVESTTGAcnów y posGRADo CARTA...

  • INSTITUTO POLITÉCNICO NACIONAL

    CENTRO DE INVESTIGACIÓN Y DESARROLLO

    DE TECNOLOGÍA DIGITAL

    MAESTRÍA EN CIENCIAS EN SISTEMAS DIGITALES

    “DISEÑO Y CONSTRUCCIÓN DE UN SISTEMAMECÁNICO SUBACTUADO”

    TESIS

    QUE PARA OBTENER EL GRADO DE

    MAESTRO EN CIENCIAS EN SISTEMAS DIGITALES

    PRESENTA

    ING. RICARDO ARTURO RODRÍGUEZ CALDERÓN

    BAJO LA DIRECCIÓN DE

    DR. EDUARDO JAVIER MORENO VALENZUELA

    DICIEMBRE 2015 TIJUANA, B.C., MÉXICO

  • INS TIT(ITO POLITÉCNICO NACIONALSECRETARí¿ on TNVESTTGAcnów y posGRADo

    CARTA CESION DE DERECHOS

    En la Ciudad de Tijuana,Baja California, eldía2 del mes diciembre del año 2015, el(la) que

    suscribe Ricardo Arturo Rodríguez Calderón alumno (a) del Programa de MAESTnÍA B¡l

    CIENCIAS EN SISTEMAS DIGITALES con número de registro A140815, adscrito al

    CENTRO DE INVESTIGACIÓN Y DESARROLLO DE TECNOLOGÍA DIGITAL,manifiesta que es autor (a) intelectual del presente trabajo de Tesis bajo la dirección de

    Eduardo Javier Moreno Valenzuela, cede los derechos del trabajo titulado Diseño y

    Construcción de un Sistema Mecánico Subactuado, al Instituto Politécnico Nacional para

    su difusión, con fines académicos y de investigación.

    Los usuarios de la información no deben reproducir el contenido textual, gráficas o datos del

    trabajo sin el permiso expreso del autor y/o director del trabajo. Este puede ser obtenido

    escribiendo a la siguiente dirección Av. Instituto Politécnico Nacional 1310, Colonia Nueva

    Tijuana, Tijuana, Büa California 22435, México, o a la dirección electrónica:[email protected]. Si el permiso se otorga, el usuario deberá dar el agradecimiento

    correspondiente y citar la fuente del mismo.

    Ricu.do Atturo Rodtígre, C

    'fi'J,,y,, (^t1,,,; R A

    Nombre y firma

  • Dedicatoria

    A mis padres, Maŕıa Elena Calderón Valenzuela y Gilberto Rodŕıguez, porque los amo

    con toda mi alma. Gracias a su amor, apoyo y paciencia he logrado ser lo que ahora

    soy. Son mi mayor orgullo y siempre han sido la principal motivación para cumplir mis

    metas.

    A mis hermanos, Gilberto, César, José, Susana, y Julia Gabriela, por estar siempre

    a mi lado y haberme apoyado durante toda mi vida.

  • Agradecimientos

    A mi director de tesis, Dr. Eduardo Javier Moreno Valenzuela, por compartir

    desinteresadamente sus conocimientos, mismos que fueron fundamentales en el desarrollo

    de este trabajo, aśı como su disponibilidad y experiencia que me motivaron y despertaron

    en mı́ la pasión por la investigación. Es motivo de orgullo ser su disćıpulo.

    A mi amigo, Carlos Aguilar Avelar por su valioso apoyo y por haber supervisado esta

    investigación.

    A mi comité tutorial conformado por el Dr. Luis Tupak Aguilar Bustos, Dr. Victor

    Hugo Dı́az Ramı́rez, M. C. David Jaime Saucedo Mart́ınez y el Dr. Juan José Tapia

    Armenta, por el tiempo dedicado a cada uno de los avances de tesis. También por sus

    observaciones y acertados comentarios que permitieron enriquecer el contenido de este

    trabajo.

    Al Dr. Miguel A. Álvarez Cabanillas por sus sabios consejos, a la Dra. Dolores Ale-

    jandra Ferreira de Loza por su apoyo incondicional y al Dr. José Cruz Núñez Pérez por

    estar al pendiente de mi formación académica y motivarme a enfrentar esta nueva etapa.

    A mis amigos, Nataly Duarte, Sebastián Hernández, Regino Pérez, Alan Garćıa,

    Oscar Garduño, Anel Otero, Enrique Hernández, Abraham Montoya, Pablo Obeso, Abel

    Murillo, Juan T. Higuera, Ricardo Cárdenas, Diana Gamboa, Nataly Medina, Andrés

    Cuevas, Reinier Arbelo, Lester Oropesa, Andrés Calvillo, Katherine Montoya, Luis

    Montoya, Antonio de Jesús Obeso, Alejandro Galaviz, Jorge Dı́az, Daniel Espinoza, Luis

    Zamudio, Luis Cantera, Carlos Villar, Carlos Magaña, Fabiola Hernández y Bernardo

    Garnica, por los inolvidables momentos que compartimos y las atenciones brindadas.

    Al Instituto Politécnico Nacional (IPN) y al Consejo Nacional de Ciencia y Tecnoloǵıa

    (CONACYT) por el apoyo económico brindado.

  • Diseño y construcción de un sistema

    mecánico subactuado

    Resumen

    En esta tesis se presenta el diseño y la construcción de un prototipo de un sistema

    mecánico subactuado, espećıficamente un péndulo con rueda inercial. Se obtiene el modelo

    dinámico del péndulo con rueda inercial mediante las ecuaciones de Euler-Lagrange. El

    modelo dinámico considera un modelo de fricción que consiste en la fricción viscosa y la

    fricción de Coulomb.

    Posteriormente se realiza la identificación paramétrica del prototipo del péndulo con

    rueda inercial mediante el algoritmo de mı́nimos cuadrados y utilizando el modelo dinámi-

    co filtrado. El modelo dinámico es validado mediante resultados experimentales y de si-

    mulación.

    Utilizando los parámetros estimados, se diseña un controlador basado en la técnica de

    linealización por retroalimentación que compensa las fricciones presentes en el sistema.

    Finalmente se realizan experimentos para llevar a cabo la comparación del desempeño

    experimental entre el controlador propuesto y un controlador reportado en la literatura.

    Palabras Clave: Péndulo con rueda inercial, modelo dinámico, modelo dinámico

    filtrado, identificación paramétrica, algoritmo de mı́nimos cuadrados, control basado en

    linealización por retroalimentación.

  • Design and construction of an

    underactuated mechanical system

    Abstract

    In this thesis, the design and construction of an underactuated mechanical system is

    presented, particularly an inertia wheel pendulum. The dynamic model of the system

    through the Euler-Lagrange equations is obtained. In the dynamic model, the terms of

    viscous friction and Coulomb friction are considered.

    Besides, the parametric identification of the inertia wheel pendulum test-bed is obtai-

    ned by least squares algorithm and using the filtered dynamic model. The dynamic model

    is validated by means of simulations and experimental results.

    Using the estimated parameters of the system, a feedback linearization based controller

    that compensates the friction forces is designed.

    Finally, an experimental performance comparison is carried out using the proposed

    controller and a known feedback linearization based controller.

    Keywords: Inertia wheel pendulum, dynamic model, filtered dynamic model, para-

    metric identification, least squares algorithm, feedback linearization control.

  • Contenido

    1. Introducción 1

    1.1. Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

    1.2. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

    1.2.1. Objetivo general . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

    1.2.2. Objetivos espećıficos . . . . . . . . . . . . . . . . . . . . . . . . . . 4

    1.3. Aportaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

    1.4. Organización del contenido por caṕıtulo . . . . . . . . . . . . . . . . . . . 5

    2. Diseño y construcción de la plataforma experimental 7

    2.1. Prototipo en CAD del péndulo con rueda inercial . . . . . . . . . . . . . . 7

    2.2. Construcción de la plataforma experimental . . . . . . . . . . . . . . . . . 7

    2.2.1. Tarjeta de adquisición de datos . . . . . . . . . . . . . . . . . . . . 9

    2.2.2. Servoamplificador . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

    2.2.3. Codificador óptico para la medición de q1 . . . . . . . . . . . . . . . 11

    2.2.4. Actuador con codificador óptico para la medición de q2 . . . . . . . 11

    2.2.5. Rodamientos del eje de rotación del péndulo . . . . . . . . . . . . . 12

    2.2.6. Estructura del prototipo . . . . . . . . . . . . . . . . . . . . . . . . 12

    2.2.7. Plataforma experimental . . . . . . . . . . . . . . . . . . . . . . . . 12

    3. Modelo dinámico 14

    3.1. Enerǵıa total del sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

    3.2. Enerǵıa potencial total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

    3.2.1. Enerǵıa potencial del péndulo . . . . . . . . . . . . . . . . . . . . . 16

    3.2.2. Enerǵıa potencial de la rueda . . . . . . . . . . . . . . . . . . . . . 17

    3.3. Enerǵıa cinética total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

    3.3.1. Enerǵıa cinética del péndulo . . . . . . . . . . . . . . . . . . . . . . 17

    3.3.2. Enerǵıa cinética de la rueda . . . . . . . . . . . . . . . . . . . . . . 18

    3.4. Lagrangiano y ecuaciones de movimiento de Euler-Lagrange . . . . . . . . 19

    i

  • CONTENIDO ii

    3.4.1. Lagrangiano y ecuaciones de movimiento de Euler-Lagrange del

    péndulo con rueda inercial . . . . . . . . . . . . . . . . . . . . . . . 20

    3.5. Modelo de fricción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

    3.5.1. Modelo de fricción viscosa . . . . . . . . . . . . . . . . . . . . . . . 21

    3.5.2. Modelo de fricción de Coulomb asimétrica . . . . . . . . . . . . . . 22

    3.6. Modelo del péndulo con rueda inercial . . . . . . . . . . . . . . . . . . . . 23

    3.7. Representación de estados del péndulo con rueda inercial . . . . . . . . . . 24

    4. Identificación paramétrica 26

    4.1. Modelo de regresión lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

    4.2. Algoritmo de mı́nimos cuadrados . . . . . . . . . . . . . . . . . . . . . . . 28

    4.3. Linealidad en los parámetros . . . . . . . . . . . . . . . . . . . . . . . . . . 29

    4.4. Parametrización del modelo dinámico del péndulo con rueda inercial . . . . 29

    4.5. Modelo dinámico filtrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

    4.5.1. Modelo dinámico filtrado del péndulo con rueda inercial . . . . . . . 32

    4.6. Selección del filtro f(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

    4.6.1. Diseño del filtro f(s) para el modelo dinámico filtrado . . . . . . . 33

    4.6.2. Método de diferencias hacia atrás . . . . . . . . . . . . . . . . . . . 34

    4.7. Filtro digital pasa bajas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

    4.7.1. Filtrado de la posición q . . . . . . . . . . . . . . . . . . . . . . . . 35

    4.7.2. Algoritmo de diferenciación central . . . . . . . . . . . . . . . . . . 36

    4.8. Filtrado discreto del modelo dinámico . . . . . . . . . . . . . . . . . . . . . 37

    4.9. Control PD para excitación del sistema . . . . . . . . . . . . . . . . . . . . 38

    4.10. Resultados experimentales de identificación paramétrica . . . . . . . . . . . 40

    4.10.1. Validación del modelo dinámico . . . . . . . . . . . . . . . . . . . . 41

    4.10.2. Discusión de resultados de identificación paramétrica . . . . . . . . 44

    5. Control del péndulo con rueda inercial 47

    5.1. Objetivo de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

    5.2. Swing Up . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

    5.2.1. Modelo del péndulo con rueda inercial sin fricción . . . . . . . . . . 48

    5.2.2. Linealización por retroalimentación parcial colocada . . . . . . . . . 49

    5.2.3. Controlador de Swing Up . . . . . . . . . . . . . . . . . . . . . . . . 49

    5.3. Control basado en linealización por retroalimentación . . . . . . . . . . . . 51

    5.3.1. Derivadas de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

    5.3.2. Linealización por retroalimentación . . . . . . . . . . . . . . . . . . 52

    5.3.3. Controlador propuesto basado en linealización por retroalimentación 53

  • CONTENIDO iii

    5.3.4. Controlador de Spong, Corke y Lozano (2001) . . . . . . . . . . . . 56

    5.3.5. Diseño de experimentos de control . . . . . . . . . . . . . . . . . . . 57

    5.4. Resultados experimentales de control . . . . . . . . . . . . . . . . . . . . . 59

    5.4.1. Caso 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

    5.4.2. Caso 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

    5.4.3. Caso 3 - Perturbado . . . . . . . . . . . . . . . . . . . . . . . . . . 60

    5.4.4. Evaluación del desempeño de los controladores . . . . . . . . . . . . 63

    5.4.5. Discusión de resultados de control . . . . . . . . . . . . . . . . . . . 65

    6. Conclusiones y trabajo futuro 67

    Referencias 71

    A. Identificación paramétrica de un Acrobot 72

    A.1. Modelo del Acrobot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

    A.2. Parametrización del modelo dinámico del Acrobot . . . . . . . . . . . . . . 75

    A.3. Modelo dinámico filtrado del Acrobot . . . . . . . . . . . . . . . . . . . . . 76

    A.4. Control PD para excitación del sistema (Acrobot) . . . . . . . . . . . . . . 78

    A.5. Resultados experimentales de identificación paramétrica del Acrobot . . . . 78

    A.5.1. Validación del modelo dinámico del Acrobot . . . . . . . . . . . . . 80

    B. Publicaciones 85

  • Índice de figuras

    1.1. Péndulo con rueda inercial. . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

    2.1. Prototipo en CAD. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

    2.2. Vista lateral del prototipo del péndulo con rueda inercial. . . . . . . . . . . 8

    2.3. Servoamplificador 16A20AC. . . . . . . . . . . . . . . . . . . . . . . . . . . 10

    2.4. Codificador óptico de la empresa USDigitalr. . . . . . . . . . . . . . . . . 11

    2.5. Motor de corriente directa con codificador óptico. . . . . . . . . . . . . . . 11

    2.6. Rodamientos SKF 6201 2Z. . . . . . . . . . . . . . . . . . . . . . . . . . . 12

    2.7. Estructura del prototipo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

    2.8. Integración de la plataforma experimental. . . . . . . . . . . . . . . . . . . 13

    3.1. Parámetros del péndulo con rueda inercial. . . . . . . . . . . . . . . . . . . 15

    3.2. Vista frontal del péndulo con rueda inercial. . . . . . . . . . . . . . . . . . 16

    3.3. Función signo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

    3.4. Tangente hiperbólica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

    4.1. Filtro f(s) y f(z) con λ = 8. . . . . . . . . . . . . . . . . . . . . . . . . . . 35

    4.2. Filtro h(s) y h(z) con λ = 8. . . . . . . . . . . . . . . . . . . . . . . . . . . 36

    4.3. Trayectoria deseada qd(t). . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

    4.4. Esquema de identificación. . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

    4.5. Parámetros estimados θ̂. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

    4.6. Comparación entre q1(t) simulación y q1(t) experimento. . . . . . . . . . . 43

    4.7. Error de predicción eq1(t). . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

    4.8. Comparación entre q2(t) simulación y q2(t) experimento. . . . . . . . . . . 44

    4.9. Error de predicción eq2(t). . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

    4.10. Comparación entre τ(t) simulación y τ(t) experimento. . . . . . . . . . . . 45

    4.11. Error de predicción eτ (t). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

    5.1. Esquema de control. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

    iv

  • ÍNDICE DE FIGURAS v

    5.2. Comportamiento del sistema en el caso 1. . . . . . . . . . . . . . . . . . . . 59

    5.3. Entrada de control τ(t) del sistema en el caso 1. . . . . . . . . . . . . . . . 60

    5.4. Comportamiento del sistema en el caso 2. . . . . . . . . . . . . . . . . . . . 61

    5.5. Entrada de control τ(t) del sistema en el caso 2. . . . . . . . . . . . . . . . 62

    5.6. Perturbación τd(t) aplicada a los controladores de regulación. . . . . . . . . 63

    5.7. Comportamiento del sistema en el caso 3 - Perturbado. . . . . . . . . . . . 64

    5.8. Entrada de control τ(t) del sistema en el caso 3 - Perturbado. . . . . . . . 65

    A.1. Plataforma experimental en configuración de Acrobot. . . . . . . . . . . . . 73

    A.2. Vista frontal del Acrobot y sus parámetros. . . . . . . . . . . . . . . . . . 73

    A.3. Trayectoria deseada qd(t) en la articulación 2 del Acrobot. . . . . . . . . . 79

    A.4. Parámetros estimados θ̂ (Acrobot). . . . . . . . . . . . . . . . . . . . . . . 80

    A.5. Comparación entre q1(t) simulación y q1(t) experimento (Acrobot). . . . . 81

    A.6. Error de predicción eq1(t) (Acrobot). . . . . . . . . . . . . . . . . . . . . . 81

    A.7. Comparación entre q2(t) simulación y q2(t) experimento (Acrobot). . . . . 82

    A.8. Error de predicción eq2(t) (Acrobot). . . . . . . . . . . . . . . . . . . . . . 82

    A.9. Comparación entre τ(t) simulación y τ(t) experimento (Acrobot). . . . . . 83

    A.10.Error de predicción eτ (t) (Acrobot). . . . . . . . . . . . . . . . . . . . . . . 83

  • Índice de tablas

    3.1. Parámetros del modelo dinámico. . . . . . . . . . . . . . . . . . . . . . . . 15

    4.1. Parámetros θ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

    4.2. Caracteŕısticas del filtro diseñado por el método de ventanas. . . . . . . . . 36

    4.3. Caracteŕısticas del experimento de identificación. . . . . . . . . . . . . . . 40

    4.4. Parámetros estimados θ̂. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

    4.5. Valor cuadrático medio (RMS). . . . . . . . . . . . . . . . . . . . . . . . . 46

    5.1. Ganancias de los controladores basados en linealización por retroalimenta-

    ción y duración de los casos experimentales. . . . . . . . . . . . . . . . . . 57

    5.2. Caso 1. Porcentaje significa la mejora con respecto al controlador de Spong,

    Corke y Lozano (2001) (Spong et al.). . . . . . . . . . . . . . . . . . . . . . 65

    5.3. Caso 2. Porcentaje significa la mejora con respecto al controlador de Spong,

    Corke y Lozano (2001) (Spong et al.). . . . . . . . . . . . . . . . . . . . . . 66

    5.4. Caso 3. Porcentaje significa la mejora con respecto al controlador de Spong,

    Corke y Lozano (2001) (Spong et al.). . . . . . . . . . . . . . . . . . . . . . 66

    A.1. Parámetros del Acrobot. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

    A.2. Parámetros θ del Acrobot. . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

    A.3. Parámetros estimados θ̂ del Acrobot. . . . . . . . . . . . . . . . . . . . . . 79

    A.4. Valor cuadrático medio (RMS) (Acrobot). . . . . . . . . . . . . . . . . . . 84

    vi

  • Caṕıtulo 1

    Introducción

    Los sistemas subactuados son aquellos que poseen menos actuadores que grados de

    libertad [1]. El control de sistemas subactuados es un campo de investigación muy popular,

    ya que existen muchas aplicaciones de los sistemas subactuados en la robótica, veh́ıculos

    marinos y aeroespaciales [2]. El caso de estudio de este proyecto de investigación es el

    péndulo con rueda inercial que fue introducido por M. W. Spong en [3] y consiste en un

    péndulo que en un extremo está acoplado a un eje rotatorio y en el otro extremo tiene

    una rueda con un actuador acoplado. En la figura 1.1 se muestra el péndulo con rueda

    inercial.

    Los parámetros del sistema son requeridos para la implementación de esquemas de

    control basados en el modelo y pueden ser obtenidos por mediciones directas o por métodos

    de identificación [4].

    1.1. Antecedentes

    El péndulo con rueda inercial pertenece a la familia de sistemas mecánicos subactua-

    dos de tipo péndulo invertido. Entre otros sistemas de este tipo se encuentran el péndulo

    de Furuta presentado en [5], el Acrobot reportado en [1], el pendubot y el carro péndulo,

    ambos estudiados a detalle en [2]. Por otro lado, helicópteros, veh́ıculos acuáticos y qua-

    drotores son otros ejemplos de sistemas mecánicos subactuados. El estudio de los sistemas

    mecánicos subactuados ha incrementado en los últimos años y el estado del arte se ha

    enriquecido bastante.

    La subactuación se debe a una de las siguientes razones [6]:

    1. Puede ser natural debido a la dinámica de los sistemas tal como aeronaves, he-

    licópteros y veh́ıculos submarinos.

    1

  • 1.1 Antecedentes 2

    Figura 1.1: Péndulo con rueda inercial.

    2. Puede ser impuesto por diseño para reducir costos y peso tal como satélites con dos

    propulsores.

    3. Puede ser debido a fallas de los actuadores en un sistema.

    4. La subactuación puede ser impuesta artificialmente para generar sistemas complejos

    no lineales de bajo orden con el fin de obtener un visión sobre el control de sistemas

    mecánicos subactuados de más alto orden.

    En algunos sentidos, las caracteŕısticas de subactuación son aún más dif́ıciles de ma-

    nipular que las propias caracteŕısticas no lineales de un sistema. Dominar el control de

    estos sistemas puede transformar sus deficiencias en ventajas. Por ejemplo para la misma

    configuración espacial, un sistema completamente actuado requiere más controles que si

    fuera subactuado y como consecuencia se incrementa el costo y el peso del sistema [6].

    Adicionalmente la subactuación proporciona una solución de control para la seguridad

    de sistemas. Por ejemplo, si un sistema completamente actuado presenta una falla en uno

    de sus actuadores pero se cuenta con un sistema de control subactuado, entonces este

  • 1.1 Antecedentes 3

    último puede ser usado en situaciones cŕıticas (como por ejemplo en la falla de uno de

    los propulsores de un aeroplano o un cohete) con el fin de evitar la falla completa del

    sistema [6].

    Preguntas frecuentes sobre los sistemas mecánicos subactuados espećıficamente del

    péndulo con rueda inercial es para qué sirve o qué tarea realiza. El péndulo con rueda

    inercial es un banco de pruebas utilizado en teoŕıas de control lineal, control no lineal,

    identificación paramétrica, modelado dinámico de sistemas, entre otras áreas de la inves-

    tigación.

    Antecedentes sobre el diseño, la construcción, la identificación paramétrica y el control

    del péndulo con rueda inercial se mencionan a continuación. En lo que respecta al diseño

    y la construcción de prototipos, en [7] se describe a detalle la construcción de un prototipo

    de péndulo con rueda inercial y se obtiene el modelo dinámico, posteriormente se realizan

    pruebas experimentales para la validación del modelo. En [8] de igual manera se construye

    un péndulo con rueda inercial y se realizan experimentos de control.

    El péndulo con rueda inercial ha sido identificado fuera de ĺınea en [9] mediante el

    algoritmo de mı́nimos cuadrados, donde las velocidades y aceleraciones articulares se

    obtienen con la simple diferenciación numérica de las posiciones articulares. Por otro

    lado, en [10] se aborda la identificación paramétrica en ĺınea de un péndulo con rueda

    inercial mediante el enfoque algebraico.

    En cuanto a control, en el péndulo con rueda inercial y otros sistemas mecánicos

    subactuados, se estudian tres principales objetivos de control: el Swing Up, la regulación

    y la inducción de oscilaciones.

    En lo que respecta al Swing Up del péndulo con rueda inercial, en [3] se presenta un

    controlador de Swing Up basado en las propiedades de pasividad del sistema, en donde

    previamente se implementa en el sistema la técnica de linealización por retroalimentación

    parcial colocada. En [11] se detalla el procedimiento para la obtención de un controlador

    de Swing Up mediante las propiedades de pasividad del sistema. En [2] se proponen dos

    controladores de Swing Up para el péndulo con rueda inercial, ambos basados en la enerǵıa

    del sistema.

    En [12] se diseña e implementa un controlador de seguimiento de trayectoria mediante

    la técnica de linealización por retroalimentación.

    Además del Swing Up y la regulación, existen otros objetivos de control tal como

    en [13], donde se propone un controlador por doble relevador para generar oscilaciones de

    frecuencia y amplitud deseada sin la necesidad de implementar un control de seguimiento

    de trayectoria.

    La fricción está presente en todos los sistemas mecánicos y tiene un impacto signi-

  • 1.2 Objetivos 4

    ficativo en el control. Para el diseño exitóso de sistemas mecatrónicos se requiere de la

    comprensión de los efectos de la fricción aśı como de técnicas para la compensación. Los

    fenómenos de fricción son complicados porque son causados por diferentes mecanismos

    f́ısicos [14].

    A pesar de la complejidad del fenómeno de la fricción, varios modelos de fricción sim-

    ples suelen ser adoptados por la comunidad de robótica. El modelo de fricción compuesto

    por la fricción viscosa y de Coulomb es por lejos el más popular [15].

    Para los ingenieros de control es importante entender los fenómenos de fricción y saber

    como lidiar con ellos [16]. También es importante entender este fenómeno para mejorar el

    comportamiento de los sistemas [14].

    Antecedentes sobre estudios de los efectos de la compensación de fricción en sistemas

    mecánicos subactuados se describen a continuación.

    En [17] se muestran resultados experimentales del control de un péndulo con rueda

    inercial mediante la técnica de linealización por retroalimentación. Para el diseño del

    controlador se considera fricción viscosa y de Coulomb solo en el péndulo. El controlador

    con la salida propuesta es de grado relativo 2.

    Para el péndulo de Furuta, en [18] un controlador que considera fricción dinámica fue

    diseñado mediante el método IDA-PBC. Para caracterizar la fricción dinámica se utiliza

    el modelo de Dahl y con la finalidad de mostrar la efectividad de la compensación de

    fricción, se realizan dos experimentos para comparar el desempeño del controlador cuando

    la fricción es compensada y cuando no es compensada. Por otro lado, en [19] se estudian

    los efectos de la compensación de la fricción en un Pendubot a través de experimentos

    que consisten en el Swing Up y regulación del sistema en su punto de equilibrio inestable

    (arriba-arriba).

    1.2. Objetivos

    1.2.1. Objetivo general

    Llevar a cabo el diseño, la construcción, la identificación paramétrica y el control de

    un sistema mecánico subactuado de dos grados de libertad.

    1.2.2. Objetivos espećıficos

    Los objetivos espećıficos de este proyecto de investigación son:

    Modelar un sistema mecánico subactuado de péndulo con rueda inercial utilizando

  • 1.3 Aportaciones 5

    las ecuaciones de Euler-Lagrange.

    Diseñar y construir un prototipo de péndulo con rueda inercial.

    Identificar los parámetros del péndulo con rueda inercial mediante el algoritmo de

    mı́nimos cuadrados.

    Controlar el péndulo con rueda inercial.

    Obtener resultados experimentales de identificación paramétrica y de control.

    1.3. Aportaciones

    Las principales aportaciones de este proyecto de tesis son:

    El diseño y la construcción de un péndulo con rueda inercial.

    La obtención del modelo dinámico del sistema en donde se considera un modelo

    suave de fricción de Coulomb asimétrica.

    La identificación paramétrica del péndulo con rueda inercial mediante el algoritmo

    de mı́nimos cuadrados.

    La propuesta de un controlador de regulación que compensa la fricción viscosa y la

    fricción de Coulomb y que se basa en la técnica de linealización por retroalimenta-

    ción.

    La comparación entre el desempeño del controlador propuesto y el desempeño de un

    controlador reportado en la literatura y que está basado en la técnica de linealización

    por retroalimentación.

    1.4. Organización del contenido por caṕıtulo

    El presente documento de tesis está organizado como sigue.

    En el caṕıtulo 2 se presenta el diseño en CAD y la estructura del prototipo del péndulo

    con rueda inercial. En este caṕıtulo se realiza una descripción de los dispositivos que

    conforman la plataforma experimental del péndulo con rueda inercial. En el caṕıtulo 3 se

    muestra a detalle el proceso de la obtención del modelo dinámico del péndulo con rueda

    inercial mediante las ecuaciones de Euler-Lagrange.

  • 1.4 Organización del contenido por caṕıtulo 6

    En el caṕıtulo 4 se presenta un procedimiento de identificación paramétrica fuera

    de ĺınea utilizando el algoritmo de mı́nimos cuadrados y el modelo dinámico filtrado.

    Posteriormente, se obtienen resultados experimentales de la identificación paramétrica

    del péndulo con rueda inercial.

    En el caṕıtulo 5 se presenta el control del péndulo con rueda inercial. En este caṕıtulo

    se define el objetivo de control y se abordan los controladores necesarios para cumplirlo.

    En términos generales el objetivo de control consiste en hacer rotar el péndulo de su

    posición vertical hacia abajo a una región cercana a su posición vertical hacia arriba y

    después conmutar a un controlador que regule el péndulo en su posición vertical hacia

    arriba. Posteriormente, se diseña un controlador basado en la técnica de linealización por

    retroalimentación y se realiza la evaluación del desempeño entre el controlador propuesto

    y un controlador reportado en la literatura.

    En el caṕıtulo 6 se dan las conclusiones del proyecto de tesis y los posibles trabajos

    futuros.

  • Caṕıtulo 2

    Diseño y construcción de la

    plataforma experimental

    2.1. Prototipo en CAD del péndulo con rueda iner-

    cial

    Hoy en d́ıa herramientas de diseño asisitido por computadora (CAD) como

    SolidWorksr, permiten diseñar cada uno de los componentes de una estructura y cal-

    cular los parámetros tales como masa, momento de inercia, longitud y densidad de cada

    una de las piezas que la conforman. SolidWorksr también permite visualizar el com-

    portamiento de mecanismos ensamblados con la finalidad de evitar colisiones entre sus

    componentes. Existen también herramientas que permiten realizar animaciones en 3D de

    sistemas mecánicos tal es el caso de SimMechanicsr de MATLAB Simulinkr.

    En la figura 2.1 se aprecia el prototipo en CAD en una vista isométrica aśı como

    sus componentes. Por otro lado, en la figura 2.2 se muestra la vista lateral del prototipo

    diseñado.

    2.2. Construcción de la plataforma experimental

    En la actualidad compañias como Quanserr Inc. y B&R Automationr comercializan el

    péndulo con rueda inercial instrumentado y listo para su uso en experimentos de tiempo

    real. Los fabricantes en ocasiones propocionan el modelo del sistema y el valor de sus

    parámetros, en otros casos el usuario debe calcularlos mediante herramientas de medición

    u otros medios.

    Para diseñar, construir un prototipo y llevar a cabo su instrumentación, se requiere

    7

  • 2.2 Construcción de la plataforma experimental 8

    Figura 2.1: Prototipo en CAD.

    Figura 2.2: Vista lateral del prototipo del péndulo con rueda inercial.

  • 2.2 Construcción de la plataforma experimental 9

    de una selección adecuada de la tarjeta de adquisición de datos, de codificadores ópticos,

    del actuador, del tipo de material de la estructura, de la etapa de potencia, el equipo de

    cómputo para el procesamiento de los datos, los cables de alimentación y herramientas

    de maquinado. En el caso de prototipos de gran tamaño y gran inercia, los rodamientos

    o baleros juegan un rol importante para el soporte de los ejes no actuados.

    Regularmente las plataformas experimentales cuentan únicamente con sensores de po-

    sición articular. Sin embargo, las velocidades articulares pueden ser estimadas mediante

    la diferenciación discreta de las posiciones articulares. Por otro lado, ante la ausencia de

    sensores de torque, una solución para estimar el torque aplicado es utilizar la constante

    de torque del motor proporcionada por el fabricante multiplicada por la corriente medida

    con un sensor apropiado.

    En esta sección se presenta un nuevo prototipo de péndulo con rueda inercial donde se

    describen detalladamente los componentes necesarios para su correcto funcionamiento en

    experimentos de tiempo real. Antecedentes sobre la construcción de prototipos de péndulo

    con rueda inercial se han reportado en [7] y [8].

    Una plataforma experimental de un sistema mecánico subactuado para su correcto y

    completo funcionamiento debe estar compuesta de las siguientes etapas:

    1. Procesamiento y adquisición de datos: Se leen las señales provenientes de dispositi-

    vos, se procesan y se toman decisiones de acuerdo a alguna regla o ley.

    2. Etapa de potencia: Las señales que se reciben son amplificadas con la finalidad de

    energizar un actuador o actuadores acoplados en las articulaciones de un prototipo

    y producir movimiento.

    3. Retroalimentación de señales: Las señales de salida (posición, velocidad, corriente,

    etc.) del sistema medidas en tiempo real mediante dispositivos de instrumentación,

    retornan a la etapa inicial de procesamiento y adquisición de datos.

    A continuación se presentan los dispositivos seleccionados y se describen las carac-

    teŕısticas más importantes. También se muestra esquemáticamente la integración de la

    plataforma experimental y la conexión entre sus etapas.

    2.2.1. Tarjeta de adquisición de datos

    La adquisición de los datos se realiza mediante una tarjeta Sensorayr 626 y el proce-

    samiento de los datos con una PC a través de Real Time Windows Target de MATLABr.

    La tarjeta de adquisición de datos es encargada de la lectura de los codificadores ópticos

  • 2.2 Construcción de la plataforma experimental 10

    Figura 2.3: Servoamplificador 16A20AC.

    y de proporcionar las señales de control. El sistema operativo empleado es Windowsr XP

    con la versión de MATLABr 2007a con una frecuencia de muestreo de 1 [Khz].

    2.2.2. Servoamplificador

    El servoamplificador es primordial pues se encarga de amplificar las señales prove-

    nientes de la tarjeta de adquisición de datos. El servoamplificador es el 16A20AC de la

    empresa Advanced Motion Controlsr y puede ser configurado en modo voltaje o modo

    corriente. En este proyecto de investigación se configura el servoamplificador en modo

    corriente, es decir,

    im = Ksav ,

    donde im es la corriente entregada por el servo amplificador, Ksa = 1 [A/V] es una

    ganancia ajustable de amplificación y v es el voltaje de entrada al servoamplificador. La

    entrada de control al sistema mecánico es

    τ = Kmim ,

    donde Km = 0.0551 [Nm/A] es la constante de torque del motor de corriente directa

    modelo DCM50202-02D-1000 que se describirá más adelante.

  • 2.2 Construcción de la plataforma experimental 11

    2.2.3. Codificador óptico para la medición de q1

    El codificador óptico para la medición de la posición articular del péndulo es de la em-

    presa USDigitalr modelo HB5M-1000-250-IE-D-H con carcasa de aluminio. La resolución

    del codificador óptico es de 1000 pulsos por revolución, resaltando que cada pulso puede

    proporcionar 1, 2 o 4 conteos dependiendo de la decodificación o multiplicación externa

    (x1, x2 o x4). En la figura 2.4 se aprecia el codificador óptico HB5M en tres diferentes

    vistas.

    Figura 2.4: Codificador óptico de la empresa USDigitalr.

    2.2.4. Actuador con codificador óptico para la medición de q2

    El actuador utilizado en la rueda es un motor de corriente directa modelo DCM50202-

    02D-1000 de la empresa Leadshine Technologyr. El motor cuenta con un codificador

    óptico cuya resolución es de 1000 pulsos por revolución. La constante de torque del motor

    es Km = 0.0551 [Nm/A] y es de utilidad para estimar el torque aplicado al sistema. En

    la figura 2.5 se muestra el motor de corriente directa en una vista frontal y una vista

    isométrica.

    Codificador

    óptico

    Figura 2.5: Motor de corriente directa con codificador óptico.

  • 2.2 Construcción de la plataforma experimental 12

    2.2.5. Rodamientos del eje de rotación del péndulo

    Los rodamientos son cruciales ya que soportan el péndulo, la rueda y el actuador,

    además facilitan la medición de la posición del péndulo, pues evitan que el codificador

    óptico soporte peso. El modelo usado es el 6201 2Z de la empresa SKFr. En la figura 2.6

    se aprecian dichos rodamientos.

    Figura 2.6: Rodamientos SKF 6201 2Z.

    2.2.6. Estructura del prototipo

    En la figura 2.7 se presenta la estructura del péndulo con rueda inercial en donde el

    péndulo, la rueda, la base inferior y la base superior son de aleación de aluminio 6061.

    Por otro lado las patas y el perno son de acero estirado en fŕıo ya que son componentes de

    soporte. El maquinado se realizó mediante máquinas herramientas para dar un acabado

    fino a los componentes de la estructura.

    2.2.7. Plataforma experimental

    En la figura 2.8 se muestra de forma esquemática la plataforma experimental. La

    plataforma permite implementar en tiempo real técnicas de control lineal y no lineal.

    También permite recolectar información del sistema para la aplicación de algoritmos de

    identificación paramétrica, con la finalidad de construir un modelo que represente el com-

    portamiento del sistema de una manera aproximada.

  • 2.2 Construcción de la plataforma experimental 13

    Figura 2.7: Estructura del prototipo.

    Posición del péndulo y

    posición de la rueda

    ServoamplificadorSensoray 626

    Windows

    XP

    Figura 2.8: Integración de la plataforma experimental.

  • Caṕıtulo 3

    Modelo dinámico

    En el presente caṕıtulo se muestra a detalle el proceso para la obtención del modelo

    dinámico del péndulo con rueda inercial. El modelo dinámico es obtenido por medio de

    las ecuaciones de movimiento de Euler-Lagrange. Posteriormente, en el modelo dinámico

    se adiciona un modelo de fricción, conformado por la fricción viscosa y una aproximación

    continua de la fricción de Coulomb.

    En la literatura se han presentado modelos con diferentes sistemas de referencia, con

    distintos modelos de fricción y en algunos casos considerando la dinámica del actuador. Es

    común que la fricción no sea considerada en los modelos con la finalidad de simplificarlos

    y facilitar su estudio, sin embargo, la calidad en la predicción del comportamiento del

    sistema experimental disminuye considerablemente.

    Primeramente se aborda la enerǵıa total del sistema, que consiste en la suma de la

    enerǵıa cinética total y la enerǵıa potencial total. Posteriormente se obtiene el lagrangiano

    pues es requerido en las ecuaciones de movimiento de Euler-Lagrange. En la figura 3.1 se

    muestra el péndulo con rueda inercial con los parámetros del sistema y en la tabla 3.1 se

    muestra el significado de cada uno de ellos.

    3.1. Enerǵıa total del sistema

    La enerǵıa total del sistema es dada por

    E(q, q̇) = K(q, q̇) + U(q) ,

    donde q = [q1 q2]T , K(q, q̇) es la enerǵıa cinética total y U(q) es la enerǵıa potencial total

    del sistema.

    14

  • 3.1 Enerǵıa total del sistema 15

    Figura 3.1: Parámetros del péndulo con rueda inercial.

    Tabla 3.1: Parámetros del modelo dinámico.

    Parámetro Descripción

    m1 Masa del péndulom2 Masa de la ruedal1 Largo del péndulolc1 Distancia del eje de rotación

    al centro de masa del pénduloI1 Momento de inercia del pénduloI2 Momento de inercia de la ruedafv1 Fricción viscosa del péndulofv2 Fricción viscosa de la ruedacf1 Coeficiente de fricción de Coulomb 1cf2 Coeficiente de fricción de Coulomb 2g Aceleración de la gravedad

  • 3.2 Enerǵıa potencial total 16

    Figura 3.2: Vista frontal del péndulo con rueda inercial.

    3.2. Enerǵıa potencial total

    La enerǵıa potencial total del sistema es dada por

    U(q) = U1(q) + U2(q) ,

    donde U1(q) es la enerǵıa potencial del péndulo y U2(q) es la enerǵıa potencial de la rueda.La figura 3.2 es de utilidad para la deducción de la enerǵıa potencial total del sistema.

    3.2.1. Enerǵıa potencial del péndulo

    La enerǵıa potencial del péndulo con respecto a su centro de masa lc1 se expresa como

    U1(q) = h− [lc1 cos(π − q1)m1g] ,

    usando la identidad trigonométrica

    cos(a− b) = cos(a) cos(b) + sin(a) sin(b) , (3.1)

  • 3.3 Enerǵıa cinética total 17

    se obtiene

    U1(q) = h− lc1 [cos(π) cos(q1) + sin(π) sin(q1)]m1g ,

    = h− lc1 [− cos(q1)]m1g ,

    = h+ lc1 cos(q1)m1g.

    3.2.2. Enerǵıa potencial de la rueda

    La enerǵıa potencial de la rueda se define como

    U2(q) = h− [l1 cos(π − q1)m2g] .

    Usando la identidad trigonométrica de la ecuación (3.1) se obtiene

    U2(q) = h− l1 [cos(π) cos(q1) + sin(π) sin(q1)]m2g ,

    = h− l1 [− cos(q1)]m2g ,

    = h+ l1 cos(q1)m2g.

    3.3. Enerǵıa cinética total

    La enerǵıa cinética total del sistema es la suma de la enerǵıa cinética total del péndulo

    K1(q, q̇) y la enerǵıa cinética total de la rueda K2(q, q̇), esto es,

    K(q, q̇) = K1(q, q̇) +K2(q, q̇).

    3.3.1. Enerǵıa cinética del péndulo

    La enerǵıa cinética total del péndulo es dada por la suma de la enerǵıa cinética rota-

    cional y la enerǵıa cinética traslacional es decir

    K1(q, q̇) =1

    2I1q̇1

    2 +1

    2m1V

    21 ,

    =1

    2I1q̇1

    2 +1

    2m1l

    2c1q̇

    21 ,

    donde V1 es la rapidez del centro de masa del péndulo.

    Se debe aclarar que la rapidez es un escalar y representa la magnitud de la velocidad la

    cual tiene carácter vectorial. La obtención de V1 se muestra detalladamente a continuación.

  • 3.3 Enerǵıa cinética total 18

    Las coordenadas del centro de masa del péndulo expresadas en las coordenadas del

    plano x− y son

    x1 = lc1 sin(π − q1) ,

    y1 = −lc1 cos(π − q1) ,

    por lo tanto vector de velocidad v1 del centro de masa del péndulo es

    v1 =

    [ẋ1

    ẏ1

    ]=

    [−lc1 cos(π − q1)q̇1−lc1 sin(π − q1)q̇1

    ]. (3.2)

    Para obtener la rapidez al cuadrado V 21 únicamente se eleva al cuadrado la norma del

    vector de velocidad expresado en la ecuación (3.2), es decir,

    V 21 = ‖v1‖2 ,

    = v1Tv1 ,

    = (−lc1)2 cos(π − q1)2q̇21 + (−lc1)2 sin(π − q1)2q̇21 ,

    = l2c1q̇21 ,

    donde se ha utilizado la identidad trigonométrica sin(π − q1)2 + cos(π − q1)2 = 1.

    3.3.2. Enerǵıa cinética de la rueda

    De igual manera la enerǵıa cinética total de la rueda es dada por la suma de la enerǵıa

    cinética rotacional y la enerǵıa cinética traslacional, es decir,

    K2(q, q̇) =1

    2I2(q̇1 + q̇2)

    2 +1

    2m2V

    22 ,

    =1

    2I2(q̇1 + q̇2)

    2 +1

    2m2l

    21q̇

    21 ,

    donde V2 es la rapidez del centro de masa de la rueda.

    La obtención de V2 se muestra a continuación. Las coordenadas del centro de masa de

    la rueda en el plano x− y son

    x2 = l1 sin(π − q1) ,

    y2 = −l1 cos(π − q1) ,

  • 3.4 Lagrangiano y ecuaciones de movimiento de Euler-Lagrange 19

    por lo tanto el vector de velocidad v2 es dado por

    v2 =

    [ẋ2

    ẏ2

    ]=

    [−l1 cos(π − q1)q̇1−l1 sin(π − q1)q̇1

    ]. (3.3)

    Se procede a obtener la rapidez V 22 elevando al cuadrado la norma del vector v2

    expresado en la ecuación (3.3), es decir,

    V 22 = ‖v2‖2 ,

    = v2Tv2 ,

    = (−l1)2 cos(π − q1)2q̇21 + (−l1)2 sin(π − q1)2q̇21 ,

    = l21q̇21 ,

    donde se utiliza la identidad trigonométrica sin(π − q1)2 + cos(π − q1)2 = 1.

    3.4. Lagrangiano y ecuaciones de movimiento de

    Euler-Lagrange

    El lagrangiano L(q, q̇) es la diferencia entre la enerǵıa cinética K y la enerǵıa potencialU , esto es,

    L(q, q̇) = K(q, q̇)− U(q).

    Las ecuaciones de movimiento de Euler-Lagrange son dadas por

    d

    dt

    [∂L(q, q̇)∂q̇

    ]− ∂L(q, q̇)

    ∂q= τ ,

    o de manera equivalente

    d

    dt

    [∂L(q, q̇)∂q̇i

    ]− ∂L(q, q̇)

    ∂qi= τi , i = 1, 2. (3.4)

    donde τi corresponde a los torques entregados por los actuadores.

  • 3.4 Lagrangiano y ecuaciones de movimiento de Euler-Lagrange 20

    3.4.1. Lagrangiano y ecuaciones de movimiento de Euler-

    Lagrange del péndulo con rueda inercial

    El lagrangiano L(q, q̇) del péndulo con rueda inercial es dado por

    L(q, q̇) = 12I1q̇1

    2 +1

    2m1l

    2c1q̇

    21 +

    1

    2I2(q̇1 + q̇2)

    2 +1

    2m2l

    21q̇

    21

    −[h+ lc1 cos(q1)m1g + h+ l1 cos(q1)m2g].

    Se procede ahora a calcular algunas derivadas requeridas para la obtención de la ecuación

    de movimiento del péndulo, esto es,

    ∂L∂q̇1

    = I1q̇1 +m1l2c1q̇1 + I2q̇1 + I2q̇2 +m2l

    21q̇1 ,

    d

    dt

    [∂L∂q̇1

    ]= I1q̈1 +m1l

    2c1q̈1 + I2q̈1 + I2q̈2 +m2l

    21q̈1 ,

    ∂L∂q1

    = m1glc1 sin(q1) +m2gl1 sin(q1) ,

    por lo tanto desarrollando la ecuación (3.4) para la articulación 1 (péndulo), es decir,

    d

    dt

    [∂L(q, q̇)∂q̇1

    ]− ∂L(q, q̇)

    ∂q1= τ1 ,

    se obtiene la ecuación de movimiento del péndulo

    I1q̈1 +m1l2c1q̈1 + I2q̈1 + I2q̈2 +m2l

    21q̈1 − [m1glc1 sin(q1) +m2gl1 sin(q1)] = 0 ,

    y mediante la factorización de términos se reduce a

    [I1 + I2 +m1l

    2c1 +m2l

    21

    ]q̈1 + I2q̈2 − [m1lc1 +m2l1] g sin(q1) = 0 , (3.5)

    donde el torque τ1 = 0 porque el péndulo no es actuado.

    De igual manera para la obtención de la ecuación de movimiento de la rueda se desa-

    rrollan las siguientes derivadas

    ∂L∂q̇2

    = I2q̇1 + I2q̇2 ,

    d

    dt

    [∂L∂q̇2

    ]= I2q̈1 + I2q̈2 ,

    ∂L∂q2

    = 0 ,

  • 3.5 Modelo de fricción 21

    por lo tanto desarrollando la ecuación (3.4) para la articulación 2 (rueda), es decir,

    d

    dt

    [∂L(q, q̇)∂q̇2

    ]− ∂L(q, q̇)

    ∂q2= τ2 ,

    se obtiene la ecuación de movimiento de la rueda y es dada por

    I2q̈1 + I2q̈2 = τ2 , (3.6)

    donde τ2 es el torque aplicado a la rueda. Se define τ = τ2 ya que es el único torque

    aplicado al sistema.

    3.5. Modelo de fricción

    Es común que el sistema sea estudiado únicamente con el modelo obtenido con las

    ecuaciones de movimiento de Euler-Lagrange, sin embargo, el modelo no predice con pre-

    cisión el comportamiento del sistema experimental. Esto se debe a que en la práctica

    existen fenómenos tales como la fricción viscosa, la fricción de Coulomb y la fricción

    estática que se oponen al movimiento de las articulaciones. Para modelar con precisión un

    sistema experimental es crucial tomar en cuenta estas fuerzas no conservativas presentes

    en el sistema. El modelo de fricción utilizado en el presente proyecto de investigación es

    un modelo que considera fricción viscosa y fricción de Coulomb. La fricción de Coulomb

    es aproximada mediante una tangente hiperbólica y debido a la naturaleza del actua-

    dor presenta un comportamiento asimétrico. Por lo tanto, la fricción de Coulomb tiene

    una estructura particular y en este trabajo será denominada como fricción de Coulomb

    asimétrica.

    3.5.1. Modelo de fricción viscosa

    El modelo de fricción viscosa está dado por

    Fvq̇ =

    [fv1 0

    0 fv2

    ][q̇1

    q̇2

    ]=

    [fv1q̇1

    fv2q̇2

    ], (3.7)

    donde Fv ∈ IR2×2 es la matriz de fricción viscosa. En la ecuación (3.7) se aprecia que lafricción viscosa es considerada en las articulaciones del péndulo y de la rueda.

  • 3.5 Modelo de fricción 22

    3.5.2. Modelo de fricción de Coulomb asimétrica

    La fricción de Coulomb es modelada mediante una función signo. La función signo es

    una función con naturaleza discontinua considerada como una no linealidad “dura” y es

    dada por

    sign(q̇) =

    1 si q̇ > 0 ,

    0 si q̇ = 0 ,

    −1 si q̇ < 0.(3.8)

    En la figura 3.3 se muestra la función signo expresada en la ecuación (3.8).

    −1 −0.5 0 0.5 1

    −1

    −0.5

    0

    0.5

    1

    sign(q̇)

    Figura 3.3: Función signo.

    La función signo puede ser aproximada con una tangente hiperbólica que es una función

    continua, esto es,

    sign(q̇) ≈ tanh(βq̇) ,

    donde β > 0. En la figura 3.4 se muestra la función tangente hiperbólica con distintos

    valores de β.

    En este proyecto de investigación el modelo de fricción de Coulomb utilizado es la

    aproximación continua de la función signo mediante la tangente hiperbólica. Los actua-

    dores como los motores de corriente directa pueden comportarse de manera asimétrica en

  • 3.6 Modelo del péndulo con rueda inercial 23

    −1 −0.5 0 0.5 1

    −1

    −0.5

    0

    0.5

    1

    tanh(β

    q̇)

    β = 100β = 45β = 20β = 7

    Figura 3.4: Tangente hiperbólica.

    cuanto a la fricción de Coulomb, esto es, cuando la velocidad es positiva se tiene un valor

    para el coeficiente de fricción cf1 y cuando es negativa se tiene otro valor de coeficiente

    de fricción cf2. Para modelar este comportamiento asimétrico en los actuadores, se utiliza

    la tangente hiperbólica estructurada de una manera particular. La estructura del modelo

    de fricción de Coulomb asimétrica viene dada por

    fc(q̇) =

    [0

    cf1[12

    + 12

    tanh(βq̇2)]

    + cf2[−1

    2− 1

    2tanh(−βq̇2)

    ]] , (3.9)donde β = 100. Como se aprecia en la ecuación (3.9) este tipo de fricción es únicamente

    adicionada en la articulación actuada.

    3.6. Modelo del péndulo con rueda inercial

    Finalmente el modelo del péndulo con rueda inercial que considera fricción es repre-

    sentado mediante las ecuaciones (3.5), (3.6), (3.7) y (3.9) de la siguiente manera

    [I1 + I2 +m1l

    2c1 +m2l

    21

    ]q̈1 + I2q̈2 − [m1lc1 +m2l1] g sin(q1) + fv1q̇1 = 0 ,

    I2q̈1 + I2q̈2 + fv2q̇2 + cf1

    [1

    2+

    1

    2tanh(βq̇2)

    ]+ cf2

    [−1

    2− 1

    2tanh(−βq̇2)

    ]= τ.

  • 3.7 Representación de estados del péndulo con rueda inercial 24

    Usualmente los modelos dinámicos se expresan en su forma compacta como

    M q̈ + gm(q) + Fvq̇ + fc(q̇) = u , (3.10)

    siendo

    M =

    [I1 + I2 +m1l

    2c1 +m2l

    21 I2

    I2 I2

    ],

    gm(q) =

    [− [m1lc1 +m2l1] g sin(q1)

    0

    ],

    Fv =

    [fv1 0

    0 fv2

    ],

    fc(q̇) =

    [0

    cf1[12

    + 12

    tanh(βq̇2)]

    + cf2[−1

    2− 1

    2tanh(−βq̇2)

    ]] ,u =

    [0

    τ

    ],

    donde q, q̇, q̈ ∈ IR2 son los vectores de posición articular, velocidad articular y aceleraciónarticular, respectivamente, M ∈ IR2×2 es la matriz de inercia y es una matriz simétricay positiva definida, gm(q) ∈ IR2 es el vector de pares gravitacionales, Fv ∈ IR2×2 es unamatriz diagonal que contiene los coeficientes de fricción viscosa, u ∈ IR2 es el vector deentrada, fc(q̇) ∈ IR2 es el vector de aproximación continua de la fricción de Coulombasimétrica y β = 100 es parte del argumento de la tangente hiperbólica. Es importante

    mencionar que u = [0 τ ]T , donde τ ∈ IR es el torque aplicado a la rueda.

    3.7. Representación de estados del péndulo con rue-

    da inercial

    Un modelo es la correlación entre las variables del sistema y la solución de esta corre-

    lación son los estados que describen el comportamiento del sistema.

    A continuación se obtiene la representación de estados del péndulo con rueda inercial

    dado por la ecuación (3.10). Primeramente, se despejan las aceleraciones articulares, esto

    es,

    q̈ = M−1 [u− gm(q)− Fvq̇ − fc(q̇)] ,

  • 3.7 Representación de estados del péndulo con rueda inercial 25

    donde

    M−1 =1

    det(M)adj(M) ,

    det(M) = M11M22 −M21M12 ,

    adj(M) =

    [M22 −M12−M21 M11

    ],

    M11 = I1 + I2 +m1l2c1 +m2l

    21 ,

    M12 = I2 ,

    M21 = I2 ,

    M22 = I2 ,

    y en donde

    u− gm(q)− Fvq̇ − fc(q̇) =

    [z1

    z2

    ],

    con

    z1 = [m1lc1 +m2l1] g sin(q1)− fv1q̇1 ,

    z2 = τ − fv2q̇2 − cf1[

    1

    2+

    1

    2tanh(βq̇2)

    ]− cf2

    [−1

    2− 1

    2tanh(−βq̇2)

    ].

    Por lo tanto y partiendo del sistema de ecuaciones dado por

    q̈ =

    [q̈1

    q̈2

    ]=

    1

    det(M)

    [M22 −M12−M21 M11

    ][z1

    z2

    ],

    se obtiene entonces la representación de estados y es dada por

    d

    dt

    q1

    q2

    q̇1

    q̇2

    =

    q̇1

    q̇2M22z1 −M12z2

    det(M)−M21z1 +M11z2

    det(M)

    .

  • Caṕıtulo 4

    Identificación paramétrica

    Para caracterizar el comportamiento de un sistema mecánico se requiere en parte del

    conocimiento del valor de los parámetros relacionados al modelo dinámico. En sistemas

    mecánicos como robots, motores, péndulos, etc., existen tres principales métodos para

    estimar los parámetros que forman parte del modelo y son [20]:

    1. Experimentos f́ısicos: Se requiere desmontar las piezas y calcular los parámetros

    directamente, como ejemplo, pesar las piezas para calcular las masas. Este método

    es tedioso y debe ser realizado por el fabricante antes de ensamblar el mecanismo.

    2. Usando herramientas CAD/CAM: Herramientas CAD/CAM facilitan el cálculo de

    los parámetros introduciendo el tipo de material de las piezas. Este método tiene un

    grado de error debido a que se consideran despreciables ciertos componentes como

    rodamientos y tornillos.

    3. Identificación: Este enfoque es basado en el análisis del comportamiento entrada/-

    salida sobre algún movimiento planificado.

    En este proyecto de investigación se opta por el método de identificación para estimar

    los parámetros del péndulo con rueda inercial. Identificación es el enfoque experimental

    en el proceso del modelado y es un proceso iterativo en el que intervienen los siguientes

    pasos [21]:

    1. Adquisición de datos.

    2. Selección de la estructura del modelo.

    3. Estimación de parámetros.

    4. Validación del modelo.

    26

  • 4.1 Modelo de regresión lineal 27

    En el presente caṕıtulo se abordan cada uno de los pasos de la identificación enfocada

    al caso de estudio del péndulo con rueda inercial. Primeramente se introduce el concepto

    de modelo de regresión lineal como punto de partida en la selección de la estructura

    del modelo. Además, se presenta la deducción del algoritmo de mı́nimos cuadrados y

    del modelo dinámico filtrado. Posteriormente se describe la función de transferencia del

    filtro utilizado y el experimento diseñado para la identificación paramétrica. Finalmente

    se muestran los resultados experimentales de la identificación de parámetros y se realiza

    la validación del modelo por medio de experimentos y simulaciones.

    4.1. Modelo de regresión lineal

    En [22] se aborda el concepto de modelo de regresión lineal para sistemas de n salidas

    y se presenta a continuación. Un sistema del cual se han obtenido N muestras, puede ser

    descrito por sus entradas x ∈ IRm y salidas y ∈ IRn mediante un modelo de regresiónlineal de la forma

    y(k) = A(k)θ ,

    donde k = 0, . . . , N − 1 es el instante de muestreo en el tiempo t = kT , donde T es elperiodo de muestreo, y(k) ∈ IRn es el vector de salidas, θ ∈ IRp es un vector de parámetrosconstantes desconocidos del sistema y es dado por

    θ = [θ1 θ2 . . . θp]T ,

    y A(k) ∈ IRn×p es la matriz de regresión lineal donde su componentes son funciones delas entradas medidas x(k) ∈ IRm.

    Asumiendo que se tiene un vector de parámetros estimados θ̂(k) en el instante k y se

    cuenta con la matriz de regresión A(k) es posible estimar las salidas del sistema, es decir,

    ŷ(k) = A(k)θ̂ ,

    o de manera equivalente

    y(k) = A(k)θ̂(k) + e(k) , (4.1)

    donde θ̂(k) ∈ IRp es el vector de parámetros estimados del sistema y e(k) ∈ IRn es elvector de error [21,22].

  • 4.2 Algoritmo de mı́nimos cuadrados 28

    4.2. Algoritmo de mı́nimos cuadrados

    El vector de parámetros desconocidos es estimado mediante el algoritmo de mı́nimos

    cuadrados presentado en [21]. A continuación se muestra a detalle la deducción del algo-

    ritmo de mı́nimos cuadrados para sistemas de n salidas tal y como es reportado en [22].

    Para que el modelo dado por (4.1) represente fielmente el sistema debe tener un vector

    de parámetros θ̂(k) donde el error esperado sea

    E{eT (k)e(k)

    }=

    k∑i=0

    1

    2eT (i)e(i) ,

    =k∑i=0

    1

    2[y(i)− A(i)θ̂(k)]T [y(i)− A(i)θ̂(k)] , (4.2)

    tal que satisfaga el criterio de mı́nimos cuadrados

    θ̂(k) = argmı́nθ̂E{eT (k)e(k)

    }.

    Dado que E{eT (k)e(k)

    }es cuadrático en θ̂, se puede obtener el mı́nimo derivando la

    ecuación (4.2) e igualando a cero el resultado de la derivación, de tal manera que

    ∂θE{eT (k)e(k)

    }= −

    k∑i=0

    AT (i)[y(i)− A(i)θ̂(k)] = 0 ,

    de donde se obtiene

    k∑i=0

    AT (i)A(i)θ̂(k) =k∑i=0

    AT (i)y(i) , (4.3)

    de donde se despeja θ̂(k) para obtener la expresión del algoritmo de mı́nimos cuadrados

    θ̂(k) =

    [k∑i=0

    A(i)TA(i)

    ]−1 [ k∑i=0

    A(i)Ty(i)

    ]. (4.4)

    El método de mı́nimos cuadrados es esencial en sistemas de ingenieŕıa de control ya

    que brinda una herramienta simple para la estimación de parámetros de un sistema [21].

    Cabe señalar que el algoritmo de mı́nimos cuadrados se implementa fuera de ĺınea.

  • 4.3 Linealidad en los parámetros 29

    4.3. Linealidad en los parámetros

    En el modelo dinámico del péndulo con rueda inercial dado por

    M q̈ + gm(q) + Fvq̇ + fc(q̇) = u ,

    las matrices M ∈ IR2×2 y Fv ∈ IR2×2 aśı como los vectores gm(q) ∈ IR2 y fc(q̇) ∈ IR2, nosolo dependen de la geometŕıa del sistema [23], también dependen de diversos parámetros

    inerciales y de constantes de fricción. El modelo dinámico expresado expĺıcitamente en

    función de los parámetros es dado por

    M(θ)q̈ + gm(q,θ) + Fv(θ)q̇ + fc(q̇,θ) = u , (4.5)

    donde los parámetros son denotados por θ ∈ IRp. Es importante resaltar que cada elementodel vector θ no necesariamente corresponde a parámetros f́ısicos individuales del sistema

    [23].

    El modelo de la ecuación (4.5) posee la propiedad de linealidad en los parámetros si

    puede ser expresado en términos lineales de θ, es decir,

    Y (q, q̇, q̈)θ = u , (4.6)

    donde Y (q, q̇, q̈) ∈ IR2×p, θ ∈ IRp y u ∈ IR2. La ecuación (4.6) es una estructura deregresión lineal donde

    Y (q, q̇, q̈)θ = M(θ)q̈ + gm(q,θ) + Fv(θ)q̇ + fc(q̇,θ) , (4.7)

    es una matriz de regresión cuyos elementos son funciones no lineales de las posiciones,

    velocidades y aceleraciones articulares. El vector de θ IRp será definido expĺıcitamente en

    la siguiente sección.

    4.4. Parametrización del modelo dinámico del

    péndulo con rueda inercial

    En este proyecto de investigación se realiza la estimación de un vector de parámetros

    θ ∈ IR7 cuyos elementos se aprecian en la tabla 4.1. Se muestra que los parámetros θi, i =1, 2, ..., 7, no necesariamente corresponden a los parámetros individuales del sistema.

    El modelo parametrizado en forma compacta del péndulo con rueda inercial es dado

  • 4.5 Modelo dinámico filtrado 30

    Tabla 4.1: Parámetros θ.

    Parámetro θ Valor

    θ1 I1 + I2 +m1l2c1 +m2l

    21

    θ2 I2θ3 [m1lc1 +m2l1]θ4 fv1θ5 fv2θ6 cf1θ7 cf2

    por

    M q̈ + gm(q) + Fvq̇ + fc(q̇) = u ,

    siendo

    M =

    [θ1 θ2

    θ2 θ2

    ],

    gm(q) =

    [−θ3g sin(q1)

    0

    ],

    Fv =

    [θ4 0

    0 θ5

    ],

    fc(q̇) =

    [0

    θ6[12

    + 12

    tanh(βq̇2)]

    + θ7[−1

    2− 1

    2tanh(−βq̇2)

    ]] ,u =

    [0

    τ

    ],

    donde M ∈ IR2×2, gm(q) ∈ IR2, Fv ∈ IR2×2, fc(q̇) ∈ IR2 y u ∈ IR2. A partir de esta repre-sentación parametrizada es posible obtener el modelo dinámico filtrado y posteriormente

    implementar la metodoloǵıa de identificación para estimar el vector de parámetros θ ∈IR7.

    4.5. Modelo dinámico filtrado

    La mayoŕıa de los sistemas dinámicos (péndulos, robots, etc.) poseen sensores de po-

    sición, pero pocos cuentan con sensores de velocidad y aceleración. En estos casos, para

  • 4.5 Modelo dinámico filtrado 31

    identificar los parámetros del sistema, se aborda el modelo dinámico filtrado presentado

    en [20] y [24], que permite obtener un modelo regresión que no depende de las acelera-

    ciones articulares. La identificación se realiza fuera de ĺınea, por lo tanto, las velocidades

    articulares pueden ser estimadas con el algoritmo de diferenciación central directamen-

    te de las posiciones articulares medidas con los codificadores ópticos. A continuación se

    muestra a detalle el procedimiento para la obtención del modelo dinámico filtrado del

    péndulo con rueda inercial. El modelo dinámico del péndulo con rueda inercial es dado

    por

    M q̈ + gm(q) + Fvq̇ + fc(q̇) = u ,

    donde M ∈ IR2×2 es la matriz de inercia, gm(q) ∈ IR2 es el vector de pares gravitacionales,Fv ∈ IR2×2 es la matriz de fricción viscosa, fc(q̇) ∈ IR2 es el vector de fricción de Coulomby u ∈ IR2 es el vector de entrada, es posible reacomodarlo de manera equivalente como

    M q̈ + Ṁ q̇ − Ṁ q̇ + gm(q) + Fvq̇ + fc(q̇) = u , (4.8)

    donde se aprecia que la suma y cancelación de una parte en la ecuación (4.8) no altera el

    modelo, pero permite realizar una separación de la parte del modelo que depende de la

    aceleración de la que no, esto mediante la factorización

    d

    dt[M q̇] = M q̈ + Ṁ q̇ ,

    que sustituida en (4.8), es decir,

    d

    dt[M q̇]− Ṁ q̇ + gm(q) + Fvq̇ + fc(q̇) = u ,

    permite separar el modelo en dos nuevas matrices Ya(q, q̇) y Yb(q, q̇) que no dependen de

    la aceleración q̈, es decir,

    Ya(q, q̇)θ = M q̇ ,

    Yb(q, q̇)θ = gm(q) + Fvq̇ + fc(q̇) ,

    obteniéndose una ecuación diferencial de primer orden

    d

    dt[Ya(q, q̇)θ] + Yb(q, q̇)θ = u , (4.9)

  • 4.5 Modelo dinámico filtrado 32

    donde θ es el vector de parámetros. Finalmente multiplicando la ecuación (4.9) por un

    filtro pasa bajas con función de transferencia f(s) donde el operador diferencial ddt

    es

    reemplazado por s

    sf(s) [Ya(q, q̇)θ] + f(s)Yb(q, q̇)θ = f(s)u , (4.10)

    se obtiene el modelo dinámico filtrado

    Yafθ + Ybfθ = uf . (4.11)

    Ahora realizando la factorización

    [Yaf + Ybf ]θ = uf ,

    se obtiene el modelo de regresión que se utiliza para estimar el vector de parámetros θ

    sin la necesidad de calcular la aceleración articular q̈ ∈ IR2.

    4.5.1. Modelo dinámico filtrado del péndulo con rueda inercial

    Para obtener el modelo dinámico filtrado del péndulo con rueda inercial primeramente

    se estructura el modelo como una ecuación diferencial de primer orden tal y como se

    indica en la ecuación (4.9). Entonces, para el caso del péndulo con rueda inercial

    Ya(q, q̇) =

    [q̇1 q̇2 0 0 0 0 0

    0 q̇1 + q̇2 0 0 0 0 0

    ],

    Yb(q, q̇) =

    [0 0 −g sin(q1) q̇1 0 0 00 0 0 0 q̇2

    12

    + 12

    tanh(βq̇2) −12 −12

    tanh(−βq̇2)

    ],

    θ =[θ1 θ2 θ3 θ4 θ5 θ6 θ7

    ]T.

    Multiplicando por una función de transferencia f(s) ambos lados de la ecuación (4.9) se

    tiene que

    sf(s) [Ya(q, q̇)θ] + f(s)Yb(q, q̇)θ = f(s)u ,

    lo que representa el modelo dinámico filtrado del péndulo con rueda inercial, que compac-

    tado es expresado como

    Yfθ = uf ,

  • 4.6 Selección del filtro f(s) 33

    donde Yf = Yaf + Ybf , con

    Yaf = sf(s)Ya(q, q̇) ,

    Ybf = f(s)Yb(q, q̇) ,

    uf = f(s)u.

    4.6. Selección del filtro f (s)

    La selección del filtro f(s) es de vital importancia para la implementación del modelo

    dinámico filtrado, aśı como también, la determinación de la frecuencia de corte la cual

    debe ser seleccionada de manera que no afecte las frecuencias que determinan la dinámica

    del sistema. El filtro f(s) se encuentra en el dominio de la frecuencia pero es continuo, por

    lo tanto debido a que se pretende identificar un sistema real, se debe hacer un mapeo del

    plano s al plano z. En esta sección se selecciona la función de transferencia del filtro f(s)

    y también el método de mapeo del plano s a z para obtener la función de transferencia

    discreta f(z).

    4.6.1. Diseño del filtro f(s) para el modelo dinámico filtrado

    El filtro a implementar para evitar el cálculo de la aceleración articular q̈ viene dado

    por la función de transferencia

    f(s) =λ2

    (s+ λ)2, (4.12)

    donde el filtro está conformado por dos polos repetidos situados en el parte izquierda del

    plano s para garantizar estabilidad, donde λ es la frecuencia de corte del filtro y a su

    vez la ganancia del filtro debido a que cada polo produce una atenuación proporcional a

    la frecuencia de corte. El análisis del comportamiento del filtro se realiza en el dominio

    de la frecuencia utilizando diagramas de Bode, que son una representación gráfica que

    sirve para visualizar la respuesta en frecuencia de un sistema. Una vez diseñado el filtro

    es necesario su transformación a tiempo discreto, esto es posible utilizando un método de

    mapeo del plano s al plano z. El filtro dado por la ecuación (4.12) se menciona en [20]

    para la identificación de robots manipuladores.

  • 4.6 Selección del filtro f(s) 34

    4.6.2. Método de diferencias hacia atrás

    Existen métodos comunes para realizar el mapeo del dominio s al dominio z y son:

    el método de diferencias hacia atrás y el método de transformación bilineal [25]. En este

    trabajo se utiliza el método de diferencias hacia atrás por su sencillez. El método de

    diferencias hacia atrás utiliza la relación

    s =1− z−1

    T,

    que multiplicado por zz

    equivale a

    s =z − 1Tz

    , (4.13)

    donde T es el periodo de muestreo. El método de diferencias hacia atrás es sencillo de im-

    plementar debido a que el derivador puro s es reemplazado por la derivada de primer ordenddt

    , la cual es aproximada mediante la diferencia entre muestras consecutivas (diferencias

    finitas). Es evidente que entre más pequeño sea el intervalo T aumentará la precisión de

    la aproximación. El motivo para discretizar el filtro f(s) es porque en experimentación se

    trabaja con señales muestreadas a un periodo T = 1 [ms].

    Definiendo el filtro h(s) = sf(s) e implementando la ecuación (4.13) en h(s) y f(s),

    se obtienen los filtros pasa bajas discretos

    h(z) =

    [z − 1Tz

    ]f(z) ,

    =λ2 − λ2z−1

    T (T−1 + λ)2 − 2(T−1 + λ)z−1 + T−1z−2, (4.14)

    y

    f(z) =λ2z2

    (T−1 + λ)2z2 − 2(T−1 + λ)T−1z + T−2,

    =λ2

    (T−1 + λ)2 − 2(T−1 + λ)T−1z−1 + T−2z−2, (4.15)

    donde λ > 0 es constante y es la frecuencia de corte y T = 1 [ms] es el periodo de

    muestreo. La frecuencia de corte λ puede ser seleccionada con el análisis de las señales en

    el dominio de la frecuencia, de tal manera que las componentes de alta frecuencia (debido

    al error de cuantización) sean atenuadas. Los filtros discretos f(z) y h(z) se implementan

    en MATLABr con el comando filter(b,a,x), donde b y a son los vectores que contienen los

    coeficientes del numerador y denominador respectivamente de cada filtro y x es la señal

  • 4.7 Filtro digital pasa bajas 35

    a ser filtrada.

    Diagrama de Bode

    Frecuencia (rad/s)

    −100

    −80

    −60

    −40

    −20

    0

    Mag

    nitu

    d (d

    B)

    f(s) f(z)

    10−1

    100

    101

    102

    103

    −180

    −135

    −90

    −45

    0

    Fas

    e (d

    eg)

    f(s) f(z)

    Figura 4.1: Filtro f(s) y f(z) con λ = 8.

    En la figura 4.1 se aprecia el comportamiento del filtro f(s) y también su versión

    discreta f(z) obtenida por medio del método de diferencias hacia atrás. Por otro lado, en la

    figura 4.2 se muestra el comportamiento del filtro h(s) y su versión discreta h(z) obtenido

    mediante el mismo método de discretización. La razón de graficar la versión continua de

    cada filtro contra su versión discreta es para corroborar el método de diferencias hacia

    atrás.

    4.7. Filtro digital pasa bajas

    4.7.1. Filtrado de la posición q

    El objetivo de la identificación paramétrica es estimar el vector de parámetros θ del

    sistema con las señales obtenidas del experimento. Los codificadores ópticos introducen

    error de cuantización en las mediciones del vector de posiciones q ∈ IR2, como consecuen-cia, el vector de velocidades q̇ ∈ IR2 obtenido en ĺınea mediante diferenciación numéricaamplifica dicho error de cuantización. Para mejorar la calidad en la estimación de los

    parámetros del sistema, se diseña un filtro digital pasa bajas con el propósito de atenuar

  • 4.7 Filtro digital pasa bajas 36

    Diagrama de Bode

    Frecuencia (rad/s)

    −30

    −20

    −10

    0

    10

    20

    Mag

    nitu

    d (d

    B)

    h(s) h(z)

    10−1

    100

    101

    102

    103

    −90

    −45

    0

    45

    90

    Fas

    e (d

    eg)

    h(s) h(z)

    Figura 4.2: Filtro h(s) y h(z) con λ = 8.

    las frecuencias no deseadas presentes en las mediciones del vector de posiciones q ∈ IR2.Una vez diseñado el filtro, es implementado fuera de ĺınea con el comando “filtfilt” de

    MATLABr, que es un filtrado en ambas direcciones “adelante-atrás” no causal de fase

    cero que evita la distorsión de las muestras de la posición articular.

    Las caracteŕısticas del filtro digital y el tipo de ventana utilizada para el cálculo de

    los coeficientes del filtro se muestran en la tabla 4.2.

    Tabla 4.2: Caracteŕısticas del filtro diseñado por el método de ventanas.

    Tipo de respuesta Pasa bajasMétodo de diseño Ventanas

    Orden 30Tipo de ventana Nutall

    4.7.2. Algoritmo de diferenciación central

    El vector resultante de posiciones filtradas es dado por qf ∈ IR2 y por medio de éste,es posible estimar las velocidades articulares. La estimación de las velocidades articulares

  • 4.8 Filtrado discreto del modelo dinámico 37

    se realiza mediante el algoritmo de diferenciación central

    q̇f (k) =qf (k + 1)− qf (k − 1)

    2T,

    que evita el desplazamiento de fase y donde q̇f ∈ IR2 es el vector de velocidades articularesfiltradas, k es el instante de muestreo y T = 1 [ms] es el periodo de muestreo.

    4.8. Filtrado discreto del modelo dinámico

    Los vectores qf , q̇f ∈ IR2 y los filtros h(z) y f(z) en las ecuaciones (4.14) y (4.15)permiten obtener el modelo dinámico filtrado en su versión discreta dado por

    h(z)Ya(qf , q̇f )θ + f(z)Yb(qf , q̇f )θ = f(z)u ,

    que puede ser reescrito como

    Yfzθ = ufz , (4.16)

    donde Yfz ∈ IR2×7 es la matriz de regresión filtrada en su versión discreta, ufz ∈ IR2 elvector de entradas filtrado discreto y θ ∈ IR7 el vector de parámetros.

    Por lo tanto el algoritmo de mı́nimos cuadrados es implementado en el péndulo con

    rueda inercial mediante la expresión

    θ̂(k) =

    [k∑i=0

    Yfz(i)TYfz(i)

    ]−1 [ k∑i=0

    Yfz(i)Tufz(i)

    ], (4.17)

    donde ufz(k) = [0 τfz(k)]T es el vector de entradas filtrado discreto, Yfz(k) ∈ IR2×7 la

    matriz de regresión filtrada discreta, θ̂(k) ∈ IR7 el vector de parámetros estimados y con0 ≤ k ≤ N − 1 siendo el instante de muestreo y N el número de muestras.

    En términos generales para que todos los parámetros sean estimados, la matriz dada

    por

    Φ =

    [k∑i=0

    Yfz(i)TYfz(i)

    ], (4.18)

    debe ser positiva definida [21]. La matriz Φ ∈ IR7×7 es simétrica, esto es, Φ = ΦT yserá positiva definida si todos sus eigenvalores son positivos, es decir, si y sólo si λi {Φ} > 0

  • 4.9 Control PD para excitación del sistema 38

    donde i = 1, 2, · · · , 7 [23]. Si la matriz dada por la ecuación (4.18) es positiva definidaimplica que el vector de entrada en cierta manera satisface la condición de excitación

    persistente. El concepto de excitación persistente es ampliamente aborbado en el área de

    identificación, con el fin de garantizar que las entradas exciten debidamente la dinámica

    de los sistemas.

    4.9. Control PD para excitación del sistema

    Una estimación fiable de los parámetros puede ser obtenida con un procedimiento

    apropiado de identificación, en el cual se debe involucrar una selección de la entrada τ

    que excite toda la dinámica del sistema. Para identificar los parámetros del sistema, en

    este trabajo de investigación se diseña un experimento en lazo cerrado que involucra un

    controlador PD para el seguimiento de trayectoria

    τ = Kpq̃2 +Kd ˙̃q2 , (4.19)

    aplicado en la rueda y donde

    Kp = 0.551 [Nm/rad] ,

    Kd = 0.00551 [Nm s/rad] ,

    q̃2 = qd − q2 ,˙̃q2 = q̇d − q̇2 ,

    siendo Kp la ganancia de control proporcional, Kd la ganancia derivativa, q̃2 el error de

    seguimiento de posición de la rueda y ˙̃q2 la derivada del error de seguimiento de la rueda.

    La trayectoria deseada qd(t) es una señal que crece en amplitud al transcurrir el tiempo t

    y es dada por

    qd(t) = at sin(ωt) , (4.20)

    donde at = 0.6t [rad] es la amplitud y ω = 7.8 [rad/s] es la frecuencia.

    En la figura 4.3 se muestra la trayectoria deseada a seguir por la rueda durante 10 [s].

    Ante la ausencia de sensores de velocidad, las velocidades articulares q̇1 y q̇2 se estiman en

  • 4.9 Control PD para excitación del sistema 39

    ĺınea empleando la diferenciación discreta. Las condiciones iniciales del experimento son:[q1(0)

    q2(0)

    ]=

    0

    ][rad] ,[

    q̇1(0)

    q̇2(0)

    ]=

    [0

    0

    ][rad/s].

    0 2 4 6 8 10−6

    −4

    −2

    0

    2

    4

    6

    Tiempo [s]

    Pos

    ició

    n [r

    ad]

    qd(t)

    Figura 4.3: Trayectoria deseada qd(t).

    En [26] se proponen entradas de excitación para identificación de sistemas, espećıfica-

    mente se presenta una sección para experimentos en lazo abierto. Entre las señales que se

    proponen en tal referencia están las señales que están compuestas de diferentes frecuen-

    cias como sumatorias de señales sinusoidales y señales que cambian en frecuencia a través

    del tiempo denominadas señales Chirp. Los experimentos en lazo abierto en la mayoŕıa

    de los casos son de alto riesgo debido que los sistemas pueden inestabilizarse. En el caso

    del péndulo con rueda inercial es posible realizar experimentos en lazo abierto sin ningún

    inconveniente.

  • 4.10 Resultados experimentales de identificación paramétrica 40

    4.10. Resultados experimentales de identificación pa-

    ramétrica

    Las caracteŕısticas del experimento se muestran en la tabla 4.3. Se aprecia que la

    frecuencia de muestreo es de 1 [Khz] y la frecuencia de corte del filtro es λ = 8 [rad/s],

    que fue elegida con el análisis de las señales en el dominio de la frecuencia mediante la

    Transformada de Fourier Discreta.

    Tabla 4.3: Caracteŕısticas del experimento de identificación.

    Caracteŕıstica Unidades

    Frecuencia de muestreo 1 [Khz]Duración del experimento 10 [s]

    Frecuencia de corte λ 8 [rad/s]

    En la figura 4.4 se detalla de manera esquemática el procedimiento de identificación

    paramétrica del péndulo con rueda inercial. Se puede observar que la identificación de los

    parámetros se lleva a cabo fuera de ĺınea.

    Control PD

    Estimación de la

    velocidad

    filtfilt

    Algoritmo de

    diferenciación

    central

    Algoritmo de

    identificación de

    mínimos cuadrados

    Fuera de líneaEn línea

    Péndulo con rueda inercial

    Figura 4.4: Esquema de identificación.

    Los parámetros estimados mediante el algoritmo de mı́nimos cuadrados se aprecian

    en la tabla 4.4 y la evolución de la estimación de los parámteros se muestra en la figura

    4.5. En este experimento de identificación todos los eigenvalores de la matriz Φ ∈ IR7×7

    resultaron positivos, por lo tanto, se garantiza de cierta manera que la entrada cumple la

    condición de excitación persistente.

    A continuación se presentan los resultados obtenidos de la comparación entre la simu-

  • 4.10 Resultados experimentales de identificación paramétrica 41

    Tabla 4.4: Parámetros estimados θ̂.

    Parámetro θ Estimado θ̂ Unidades

    θ1 4.6244× 10−02 [Kgm2/rad]θ2 6.2758× 10−04 [Kgm2/rad]θ3 2.3588× 10−01 [Kgm2/rad]θ4 2.1919× 10−03 [Nm s/rad]θ5 3.6351× 10−06 [Nm s/rad]θ6 5.0726× 10−03 [Nm]θ7 4.3101× 10−03 [Nm]

    lación del modelo con los parámetros estimados mostrados en la tabla 4.4 y el experimento

    realizado. Para simular el codificador óptico se introduce un cuantizador en la simulación

    del modelo usando 2π/4000 [rad/pulso] como resolución.

    La figura 4.6 muestra la comparación entre la posición q1 ∈ IR obtenida en simulacióny q1 ∈ IR medida en el experimento. En la figura 4.7 se observa el error de predicción eq1∈ IR que consiste en la diferencia de la posición q1 ∈ IR obtenida en la simulación delmodelo y la posición q1 ∈ IR medida en el experimento.

    Por otro lado, en la figura 4.8 se aprecia la gráfica comparativa entre la posición q2 ∈IR obtenida en simulación y la posición q2 ∈ IR medida del experimento y en la figura 4.9se muestra el error de predicción eq2 ∈ IR, que consiste en la diferencia entre la posiciónq2 ∈ IR obtenida en simulación y la posición q2 ∈ IR obtenida en el experimento.

    En la gráfica de la figura 4.10 se aprecia la comparación entre la entrada τ ∈ IR obtenidaen la simulación del modelo y la entrada τ ∈ IR estimada del experimento. Por último enla figura 4.11 se observa el error de predicción eτ ∈ IR que consiste en la diferencia entrela entrada τ ∈ IR obtenida en la simulación del modelo y la entrada τ ∈ IR estimada delexperimento.

    4.10.1. Validación del modelo dinámico

    El procedimiento de validación del modelo se basa en el análisis del error de predicción

    de torque τ ∈ IR aplicado a la rueda del sistema y además del análisis del error depredicción de las posiciones q ∈ IR2 como se realiza en [27]. Los errores de predicciónconsisten en la diferencia del torque τ ∈ IR y de posición q ∈ IR2 obtenidos en la simulacióndel modelo con los parámetros estimados y el torque τ ∈ IR y q ∈ IR2 medidos en elexperimento. En ambos casos, empleando la misma trayectoria deseada (4.20) y el mismo

    controlador PD dado por la ecuación (4.19).

  • 4.10 Resultados experimentales de identificación paramétrica 42

    0 5−0.1

    0

    0.1

    0.2

    θ̂1

    0 5

    0

    5

    10

    15x 10

    −4

    θ̂2

    0 5−0.2

    0

    0.2

    0.4

    θ̂3

    0 5−0.2

    0

    0.2

    Tiempo [s]

    θ̂4

    0 5−4

    −2

    0

    2

    4x 10

    −3

    θ̂5

    0 5−0.04

    −0.02

    0

    0.02

    0.04

    Tiempo [s]

    θ̂6

    0 5−0.04

    −0.02

    0

    0.02

    0.04

    Tiempo [s]

    θ̂7

    Figura 4.5: Parámetros estimados θ̂.

    Para analizar los errorres de predicción se define el valor cuadrático medio (RMS),

    RMS{e} =

    √√√√ 1N

    N∑i=1

    e2(i) , (4.21)

    donde e es el error de predicción y N el número de muestras. Se calcula el valor (RMS) de

    cada uno de los errores de predicción con el algoritmo de la ecuación (4.21) y los resultados

    se muestran en la tabla 4.5.

    Se aprecia que el valor (RMS) de cada error de predicción tiene un valor pequeño, esto

    indica que el modelo simulado con los parámetros de la tabla 4.4, puede predecir de una

  • 4.10 Resultados experimentales de identificación paramétrica 43

    0 2 4 6 8 102.6

    2.8

    3

    3.2

    3.4

    3.6

    Tiempo [s]

    Pos

    ició

    n [r

    ad]

    q1(t) Sim. q1(t) Exp.

    Figura 4.6: Comparación entre q1(t) simulación y q1(t) experimento.

    0 2 4 6 8 10−0.2

    −0.15

    −0.1

    −0.05

    0

    0.05

    0.1

    0.15

    0.2

    Tiempo [s]

    Pos

    ició

    n [r

    ad]

    eq1(t)

    Figura 4.7: Error de predicción eq1(t).

    manera muy aproximada el comportamiento del sistema experimental.

  • 4.10 Resultados experimentales de identificación paramétrica 44

    0 2 4 6 8 10−8

    −6

    −4

    −2

    0

    2

    4

    6

    8

    Tiempo [s]

    Pos

    ició

    n [r

    ad]

    q2(t) Sim. q2(t) Exp.

    Figura 4.8: Comparación entre q2(t) simulación y q2(t) experimento.

    0 2 4 6 8 10−0.2

    −0.15

    −0.1

    −0.05

    0

    0.05

    0.1

    0.15

    0.2

    Tiempo [s]

    Pos

    ició

    n [r

    ad]

    eq2(t)

    Figura 4.9: Error de predicción eq2(t).

    4.10.2. Discusión de resultados de identificación paramétrica

    En este caṕıtulo se ha presentado la identificación paramétrica del péndulo con rueda

    inercial. El modelo que considera fricción de Coulomb asimétrica predice de una manera

  • 4.10 Resultados experimentales de identificación paramétrica 45

    0 2 4 6 8 10

    −0.2

    −0.1

    0

    0.1

    0.2

    Tiempo [s]

    Tor

    que

    [Nm

    ]

    τ(t) Sim. τ(t) Exp.

    Figura 4.10: Comparación entre τ(t) simulación y τ(t) experimento.

    0 2 4 6 8 10−0.2

    −0.15

    −0.1

    −0.05

    0

    0.05

    0.1

    0.15

    0.2

    Tiempo [s]

    Tor

    que

    [Nm

    ]

    eτ (t)

    Figura 4.11: Error de predicción eτ (t).

    aceptable el comportamiento del sistema experimental. Los parámetros obtenidos fue-

    ron validados comparando los datos experimentales de posición y de entrada de control

    con datos obtenidos por medio de simulaciones. En el siguiente caṕıtulo se presenta el

    control del péndulo con rueda inercial mediante esquemas de control que requieren del

  • 4.10 Resultados experimentales de identificación paramétrica 46

    Tabla 4.5: Valor cuadrático medio (RMS).

    Índice Valor Unidades

    RMS{eq1} 0.0054 [rad]RMS{eq2} 0.0159 [rad]RMS{eτ} 0.0089 [Nm]

    conocimiento de los parámetros del sistema, es decir, técnicas de control basadas en el

    modelo.

  • Caṕıtulo 5

    Control del péndulo con rueda

    inercial

    En este proyecto de tesis se presentan los resultados experimentales de Swing Up y

    de regulación de un péndulo con rueda inercial. Para ello, la plataforma experimental

    construida, modelada e identificada con el algoritmo de mı́nimos cuadrados permite la

    implementación en tiempo real de los controladores. El presente caṕıtulo es autoconteni-

    do y proporciona el procedimiento requerido para la obtención de todos los controladores

    implementados en este proyecto de investigación. Cabe señalar que los controladores ci-

    tados y que sirvieron de inspiración se expresan con nuestra notación.

    5.1. Objetivo de control

    El objetivo de control consiste en llevar el péndulo de la posición vertical hacia abajo

    q1 = π [rad] a su posición vertical hacia arriba q1 = 0 [rad]. Para ello se utiliza una entrada

    de control que conmuta entre un controlador de Swing Up para rotar el péndulo hasta

    una región cerca