Tema 5.- Autovalores y autovectores. - GIA Sevilla ESI | Tu blog de apuntes de ... ·...

Ingenierıas: Aeroespacial, Civil y Quımica.Matematicas I. 2010-2011.

Departamento de Matematica Aplicada II.Escuela Superior de Ingenieros. Universidad de Sevilla.

Tema 5.- Autovalores y autovectores.

5.1.- Autovalores y autovectores.

Definicion y propiedades.La ecuacion caracterıstica. El teorema de Cayley-Hamilton.

5.2.- Diagonalizacion.

Matrices diagonalizables.Matrices no diagonalizables.

5.3.- Aplicaciones del calculo de autovalores y autovectores.

5.4.- Ejercicios.

5.5.- Apendice: MATLAB.

A lo largo de todo el tema trataremos esencialmente con matrices cuadradas reales(aunque muchos de los resultados que veamos tambien seran validos para el caso de matricescuadradas complejas). De todos modos, aun trabajando con matrices reales, sera imprescin-dible hacer referencia a los numeros (y a los vectores) complejos. La razon es que necesitare-mos considerar las raıces de un polinomio con coeficientes reales (si la matriz es real) y estaspueden ser complejas con parte imaginaria no nula.

Una matriz A cuadrada m×m define una transformacion lineal sobre Km,

x ∈ Km −→ y = Ax ∈ Km.

Aunque la matriz sea real, cuando algunas de las raıces del llamado polinomio caracterısticode A (que sera un polinomio real) sean numeros complejos, con parte imaginaria no nula,sera conveniente referirnos a la transformacion definida por A sobre el espacio complejo Cm.En estos casos, tendremos que considerar para vectores complejos todos los aspectos linealesque hemos considerado en el tema 4: combinaciones lineales, dependencia/independencialineal, subespacios vectoriales de Cm, dimension, espacios nulo y columna, etc.

La transformacion de vectores que efectua la matriz A puede ser mas o menos sencillade describir dependiendo del vector (o de la direccion) sobre la que se efectue. El problemafundamental que se aborda es el de la determinacion de las llamadas direcciones principales:direcciones sobre las que la matriz A actua como la multiplicacion por un numero. Calculemospara algunos ejemplos geometricos en el plano y en el espacio, los vectores sobre los cualesla transformacion asociada a una matriz actua simplemente multiplicando por un numero.

139

140 Tema 5.- Autovalores y autovectores.

Ejemplos.

(1) Consideremos la transformacion lineal en el plano consistente en la simetrıa respecto deuna recta r que pase por el origen de coordenadas. Aplicando esta transformacion sobreun vector de dicha recta se obtiene el mismo vector y aplicandola sobre un vector dela recta s perpendicular a r que pasa por el origen de coordenadas se obtiene el vectoropuesto. Los vectores (no nulos) de las rectas r y s se denominan vectores propios oautovectores de la transformacion dada. Las rectas a veces se denominan direccionesprincipales de la transformacion y los coeficientes λ1 = 1 y λ2 = −1, asociados a dichasdirecciones, se suelen denominar valores propios o autovalores.

(2) Consideramos un plano π que pase por el origen en el espacio R3 y la transformacionlineal T : R3 −→ R3 que asocia a cada vector v ∈ R3 el vector T (v) ∈ R3 que se obtieneal proyectar v (ortogonalmente) sobre el plano considerado. Si {v1, v2} son dos vectoresque generan el plano y v3 es un vector (no nulo) perpendicular al plano tenemos que

T (v1) = v1, T (v2) = v2, T (v3) = 0

con lo cual v1, v2 y v3 son autovectores y los coeficientes respectivos 1, 1 y 0 son auto-valores. Puesto que los vectores v1, v2 y v3 forman una base de R3, cualquier vec-tor v ∈ R3 puede expresarse como combinacion de ellos y teniendo dicha expresionv = αv1 +βv2 +γv3 es inmediato obtener T (v) como combinacion lineal de los vectoresv1, v2 y v3,

T (v) = αT (v1) + βT (v2) + γT (v3) = αv1 + βv2.

Por ejemplo, para el plano π ≡ 2x− 3y + z = 0 podemos tomar los vectores

v1 =

264 320

375 , v2 =

264 10−2

375 y v3 =

264 2−31

375(la transformacion lineal no depende de como elijamos los vectores v1, v2 y v3). Notemosque a partir de lo anterior es facil obtener la matriz A de T respecto a la base canonica(puesto que tenemos los vectores v1, v2 y v3 y sus transformados expresados respectoa la base canonica). La matriz A verifica

A

264 v1 v2 v3

375 =

264 Av1 Av2 Av3

375y puesto que la matriz

P =

264 v1 v2 v3

375tiene inversa (por ser sus columnas linealmente independientes), podemos despejar la

Matematicas I. Ingenierıas: Aeroespacial, Civil y Quımica

5.1.- Autovalores y autovectores. 141

matriz A,

A =

264 Av1 Av2 Av3

375 264 v1 v2 v3

375−1

=

=

264 3 1 02 0 00 −2 0

375 128

264 6 5 32 −3 −134 −6 2

375 = 128

264 20 12 −412 10 6−4 6 26

375 .

(3) Si A es una matriz diagonal con elementos diagonales d1, d2, . . . , dm, es claro que paralos vectores canonicos e1, e2, . . . , em se verifica Aek = dkek.

(4) Si tomamos dos vectores {v1, v2} linealmente independientes del plano, cualquier trans-formacion lineal T : R2 −→ R2 queda determinada si conocemos como actua sobreestos vectores. Si A es la matriz asociada a T respecto a la base canonica, podemosdeterminar dicha matriz a partir de Av1 y Av2 (si conocemos las coordenadas de losvectores v1, v2, Av1 y Av2 respecto a la base canonica). Si tomamos por ejemplo losvectores

v1 =

�1−2

�, v2 =

� −2−1

�, T (v1) = Av1 = −3v1, T (v2) = Av2 = 2v2

(con lo cual tenemos una situacion en la que conocemos las direcciones sobre las cualesla transformacion actua multiplicando por un numero), es facil determinar la matriz Ateniendo en cuenta que, puesto que v1 y v2 son linealmente independientes, la matrizcuyas columnas son v1 y v2 tiene inversa y

A

264 v1 v2

375 =

264 −3v1 2v2

375 =⇒ A

264 v1 v2

375 =

264 v1 v2

375 � −3 00 2

�=⇒

=⇒ A =

264 v1 v2

375 � −3 00 2

� 264 v1 v2

375−1

Notemos que de esta ultima expresion es facil obtener las matrices An, n = 1, 2, . . .

An =

264 v1 v2

375 � (−3)n 00 2n

� 264 v1 v2

375−1

y, por tanto, los vectores que se obtienen al aplicar sucesivamente la matriz A sobreun vector dado

u, Au, A (Au) = A2u, . . . , Anu, . . .

Matematicas I. 2010-2011


5.1.- Autovalores y autovectores.

5.1.1.- Definicion y propiedades.

Definicion. Sea A una matriz cuadrada de orden m. Diremos que un escalar λ ∈ C es unautovalor de A si existe un vector v ∈ Cm, v 6= 0 tal que Av = λv, en cuyo caso se diceque v es un autovector de A asociado al autovalor λ.

Obviamente, si tenemos un autovector v de A asociado a un autovalor λ, cualquier multi-plo no nulo de v tambien es un autovector de A asociado al mismo autovalor λ. Por otraparte, si tenemos dos autovectores v1 y v2 asociados a un mismo autovalor λ, cualquier com-binacion lineal no nula de dichos autovectores tambien es un autovector de A asociado almismo autovalor λ.

Observaciones.

(a) Al hacer transformaciones fila (o columna) sobre una matriz A, los autovalores y losautovectores de la matriz que se obtiene NO guardan relacion (en general) con los auto-valores y autovectores de la matriz original. En general, tampoco es cierto que los auto-valores de una matriz suma/resta/producto de otras dos sean suma/resta/producto delos autovalores de cada uno de los sumandos. Ejercicio. Busca ejemplos de todo loanterior.

(b) El concepto de autovalor y autovector no es exclusivo de los espacios de coordenadas,ni de los espacios vectoriales de dimension finita. Por ejemplo, siendo V el espaciovectorial de las funciones y : R → R indefinidamente derivables y siendo T : V → Vla aplicacion lineal y −→ T (y) = y′′, se tiene que λ = 0 es un autovalor de T y todopolinomio de primer grado es un autovector asociado. Por otra parte λ = 1 tambien esautovalor y la funcion y(x) = ex es un autovector asociado.

5.1.2.- La ecuacion caracterıstica. El teorema de Cayley-Hamilton.

Proposicion. Dada una matriz cuadrada A y un numero λ0 ∈ C, son equivalentes:

(1) λ0 es un autovalor de A.

(2) El sistema homogeneo (A− λ0I)x = 0 es un sistema compatible indeterminado.

(3) dim [Nul (A− λ0I)] ≥ 1. (3’) El rango [A− λ0I] no es maximo.

(4) La matriz (A− λ0I) no tiene inversa.

(5) det [A− λ0I] = 0.

Por tanto, los autovalores de A son las soluciones de la ecuacion p(λ) = det [A− λI] = 0.Esta ecuacion se denomina ecuacion caracterıstica de la matriz A y p(λ) = det [A− λI]se denomina polinomio caracterıstico.

Siendo A = [aij ] una matriz m×m,

p(λ) = det [A− λI] =

�� a11 − λ a12 . . . a1m

a21 a22 − λ . . . a2m

......

. . ....

am1 am2 . . . amm − λ

�� = (−1)mλm + cm−1λm−1 + · · ·+ c0



es un polinomio de grado m y, por tanto, tiene m raıces (contando cada una segun sumultiplicidad) que pueden ser reales o complejas no-reales (aun en el caso en que la matrizA sea real).

El subespacio vectorial Nul [A− λ0I] se denomina espacio propio asociado al autovalorλ0 (notemos que en general estara compuesto por vectores complejos, los autovectores de Aasociados a λ0 y el vector nulo),

Nul [A− λ0I] = {0} ∪ {autovectores asociados a λ0} .

De manera habitual cuando hablemos de autovectores asociados a un autovalor nos referire-mos a una base del espacio propio asociado, es decir autovectores linealmente independientesde forma que cualquier autovector asociado al autovalor en cuestion sea combinacion linealde ellos.

Ejemplos. Ademas de los ejemplos considerados anteriormente, veamos algunos ejemplosen los que la matriz A viene dada.

(1) Consideremos la matriz A =

�1 22 1

�.

Autovalores: Para cualquier escalar λ tenemos que

A−λI =

�1− λ 2

2 1− λ

�=⇒ det (A−λI) = (1−λ)2−4 = λ2−2λ−3 = (λ−3)(λ+1).

Por tanto det (A− λI) = 0⇐⇒ λ = −3 o λ = −1.

Autovectores

asociados a λ1 = 3 : son los vectores no-nulos que estan en el espacio nulo deA− 3I,

(A−3I)x = 0 ≡� −2 2 0

2 −2 0

�−→

� −1 1 00 0 0

�⇒ x = x2

�11

�⇒ v1 =

�11

�,

asociados a λ2 = −1 : son los vectores no-nulos que estan en el espacio nulo deA + I,

(A + I)x = 0 ≡�

2 2 02 2 0

�−→

�1 1 00 0 0

�⇒ x = x2

� −11

�⇒ v2 =

� −11

�.

(2) Consideremos la matriz asociada a un giro (en el plano) de centro el origen de coorde-nadas y angulo ϕ ∈ [0, 2π). En el caso ϕ = 0 se obtiene la identidad y en el caso ϕ = πla simetrıa respecto al origen de coordenadas. Si ϕ 6= 0, π, al aplicar el giro sobre unvector (real) distinto de cero se obtiene otro vector que en ningun caso sera un multi-plo (real) del vector al que se aplica el giro. Esto quiere decir que la matriz del girono tiene ningun autovalor real (salvo en los casos ϕ = 0, π). Resolvamos la ecuacion



caracterıstica

G =

�cos(ϕ) − sen(ϕ)sen(ϕ) cos(ϕ)

�⇒

p(λ) = det (G− λI) =

�� cos(ϕ)− λ − sen(ϕ)sen(ϕ) cos(ϕ)− λ

�� =

= (cos(ϕ)− λ) (cos(ϕ)− λ) + sen(ϕ)2 =

= λ2 − 2 cos(ϕ)λ + 1 = 0⇒ λ = cos(ϕ)± i sen(ϕ) = e±iϕ.

Calculemos los autovectores asociados a cada uno de los autovalores.

λ1 = eiϕ Tenemos que resolver el problema homogeneo (G− λ1I)x = 0,� −i sen(ϕ) − sen(ϕ) 0sen(ϕ) −i sen(ϕ) 0

�F2 − iF1

−→

� −i sen(ϕ) − sen(ϕ) 00 0 0

�sen(ϕ) 6= 0

=⇒

=⇒�

x1

x2

�= x1

�1−i

�⇒ Nul [G− λ1I] Gen

¨v1 =

�1−i

�«.

λ2 = e−iϕ Es facil comprobar que

Nul [G− λ2I] = Gen

¨v2 =

�1i

�«.

Las propiedades referidas a autovalores las podemos agrupar dependiendo de si puedenobtenerse directamente de la definicion (con lo cual estaran involucrados los autovectores) osi se obtienen a partir del polinomio caracterıstico (algunas de ellas pueden obtenerse de lasdos formas).

Proposicion. Sea λ un autovalor de A y v un autovector asociado, entonces:

(1) αλ es un autovalor de αA y v es un autovector asociado.

(2) (λ− µ) es un autovalor de A− µI y v es un autovector asociado.

(3) λk es un autovalor de Ak y v es un autovector asociado.

(4) Si q(·) es un polinomio, entonces q(λ) es un autovalor de q(A) y v es un autovectorasociado. (Ejemplo: 3λ3+5λ2−7λ+2 es un autovalor de la matriz 3A3+5A2−7A+2I).

(5) Si A tiene inversa, entonces λ 6= 0, λ−1 es un autovalor de A−1 y v es un autovectorasociado.

(6) Sea A es una matriz real, λ = a+bi ∈ C, (a, b ∈ R) un autovalor de A y v = u+iw ∈ Cm

un autovector de A asociado a λ. Entonces λ = a− bi ∈ C tambien es autovalor de Ay v = u− iw ∈ Cm es un autovector de A asociado a λ.



Proposicion. Sea A una matriz m×m. Se verifica:

(a) A tiene a lo sumo m autovalores distintos.

(b) A y AT tienen los mismos autovalores (aunque los autovectores asociados pueden serdistintos).

Proposicion. Sea A una matriz m×m y sea

p(λ) = det [A− λI] = (−1)mλm + cm−1λm−1 + · · ·+ c1λ + c0 =

= (−1)m(λ− λ1) · · · (λ− λm)

su polinomio caracterıstico (es decir λ1, · · · , λm son los autovalores de A, iguales o distintos).Se verifica:

(a) El determinante de A es igual al producto de sus autovalores (apareciendo cada uno, endicho producto, tantas veces como indique su multiplicidad como raız del polinomiocaracterıstico)

λ1 · · ·λm = det (A) = p(0) = c0.

(b) La traza de A (la suma de los elementos diagonales de A) es igual a la suma de susautovalores (apareciendo cada uno, en dicha suma, tantas veces como indique su multi-plicidad como raız del polinomio caracterıstico)

λ1 + λ2 + · · ·+ λm = (−1)m−1cm−1 = traza(A) := a11 + a22 + · · ·+ amm.

Uno de los resultados mas importantes referidos a autovalores y autovectores es elsiguiente.

Teorema. A autovalores distintos corresponden autovectores linealmente independientes.Es decir, si λ1, . . . , λp son autovalores de A distintos dos a dos y v1, . . . , vp son autovectoresde A asociados respectivamente a λ1, . . . , λp, entonces

{v1, . . . , vp} es linealmente independiente.

Demostracion.- En el caso de tener un solo autovector (p = 1) no hay nada que discutir. Supon-gamos que p ≥ 2 y que los vectores v1, . . . , vp son linealmente dependientes, entonces para un ciertoındice k tendremos que {v1, . . . , vk} son linealmente independientes y vk+1 es combinacion linealde ellos. Entonces, tendremos unos coeficientes α1, . . . , αk ∈ C tales que

vk+1 = α1v1 + α2v2 + · · ·+ αkvk. (∗)

Multiplicando por la matriz A en los dos miembros de esta igualdad tenemos

Avk+1 = α1Av1 + α2Av2 + · · ·+ αk−1Avk ⇔λk+1vk+1 = α1λ1v1 + α2λ2v2 + · · ·+ αk−1λkvk. (∗∗)

Multiplicando los dos miembros de la igualdad (*) por λk+1 tenemos

λk+1vk+1 = α1λk+1v1 + α2λk+1v2 + · · ·+ αkλk+1vk.



y restando (**) obtenemos

0 = α1 (λk+1 − λ1) v1 + α2 (λk+1 − λ2) v2 + · · ·+ αk (λk+1 − λk) vk.

Puesto que los vectores v1, . . . , vk son linealmente independientes, de la ultima igualdad tenemosque los coeficientes tienen que ser todos nulos

α1 (λk+1 − λ1) = α2 (λk+1 − λ2) = · · · = αk (λk+1 − λk) = 0

y puesto que los autovalores son distintos entre sı λk+1 6= λ1, . . . , λk obtenemos

α1 = α2 = · · · = αk = 0

y, por tanto vk+1 = 0 en contradiccion con el hecho de ser un autovector de A (asociado a λk+1).

El siguente resultado tiene un caracer esencialmente teorico aunque puede utilizarse paraobtener algunas matrices relacionadas con una matriz A. No estamos en condiciones de dar lademostracion en el caso general. Mas adelante veremos la demostracion en un caso especial.

Teorema (de Cayley-Hamilton). Sea p(λ) = det (A− λI) el polinomio caracterıstico deuna matriz cuadrada A, entonces p(A) = 0

Es decir, si una matriz A de orden 3 tiene como polinomio caracterıstico, por ejemplo

p(λ) = −λ3 + 2λ2 − 5λ + 7,

entonces la matriz verifica que

p(A) = 0 ≡ −A3 + 2A2 − 5A + 7I = 0.

En este caso, puesto que el termino independiente es no-nulo, de la anterior ecuacion podemosdespejar A−1 en funcion de potencias de A con exponente no-negativo. Ejercicio.- Hazlo.

5.2.- Diagonalizacion.

Consideremos una transformacion lineal T : Km −→ Km y la matriz A asociada (cuadra-da, m×m) respecto de la base canonica C de Km. Es decir, siendo x las coordenadas cannicasde un vector v y siendo y las coordenadas canonicas del transformado T (v), tenemos quey = Ax. Consideremos otra base B y denotemos por x′ e y′ a las coordenadas de v y T (v),respectivamente, respecto de dicha base B. Si P es la matriz del cambio de base C ←− Btenemos que x = Px′ e y = Py′. Por tanto, la transformacion lineal T se puede expresar, encoordenadas respecto a B mediante

y = Ax⇐⇒ Py′ = APx′ ⇐⇒ y′ = P−1APx′.

Es decir, de la misma forma que A representa a T respecto a la base canonica, la matrizB = P−1AP tambien representa a T , pero respecto a la base B. Cuando dos matrices A yB (cuadradas del mismo orden) estan relacionadas mediante la igualdad B = P−1AP paraalguna matriz P no-singular, se dice que A y B son semejantes. En este caso se trata dematrices que representan a la misma transformaion lineal respecto de bases distintas.

En este apartado vamos a considerar el problema de intentar determinar una matriz Ppara la cual B = P−1AP sea una matriz lo mas sencilla posible (que permita describir latransformacion T asociada de la forma mas simple). La forma mas simple que se puedeplantear es el de una matriz diagonal. Para algunas matrices A sera posible obtener unamatriz diagonal y para otras no.


5.2.- Diagonalizacion. 147

5.2.1.- Matrices diagonalizables.

Definicion. Se dice que una matriz A m×m es diagonalizable si existe alguna matriz Pno singular tal que P−1AP es una matriz diagonal D. En este caso, se dice que P es unamatriz de paso que diagonaliza A y que la expresion A = PDP−1 es una diagonalizacion deA.

Notemos que si

P−1AP = D =

266666664 d1 0 0 . . . 00 d2 0 . . . 00 0 d3 . . . 0...

......

. . ....

0 0 0 . . . dm

377777775entonces de la igualdad matricial AP = PD,

A

264 v1 v2 . . . vm

375 =

264 v1 v2 . . . vm

375 266664 d1 0 . . . 00 d2 . . . 0...

.... . .

...0 0 . . . dm

377775se obtiene que cada columna, Avk, de la matriz AP es igual a la correspondiente columnade PD. Es decir, cada columna de P es un autovector de A asociado al correspondienteelemento diagonal de D, que sera un autovalor de A.

Por otra parte, el que la matriz P sea no-singular (≡ tiene inversa ≡ det (A) 6= 0) esequivalente a que sus m columnas sean linealmente independientes.

Cuando sea posible, para construir una diagonalizacion de A bastara con obtener mautovectores linealmente independientes. La matriz P de orden m que tenga a dichos auto-vectores linealmente independientes como columnas (en un cierto orden) sera no-singular yverificara AP = PD siendo D la matriz diagonal cuyos elementos diagonales son los auto-valores (en el mismo orden en el que hayamos puesto los autovectores en la matriz P ). Portanto tenemos una diagonalizacion de A.

Notemos que si en una diagonalizacion A = PDP−1,

cambiamos el orden en las columnas de P y de forma simultanea cambiamos el ordenen los elementos diagonales de D, de manera que se correspondan columnas de P -elementos diagonales de D, se obtiene otra diagonalizacion de A;

sustituimos cada columna de P por un multiplo no-nulo de dicha columna, se obtieneotra matriz de paso distinta que tambien diagonaliza a A (la matriz D no cambia).

Proposicion. Sea A una matriz m×m. Se verifica:

(1) A es diagonalizable si y solo si tiene m autovectores linealmente independientes.

(2) Si A es diagonalizable tambien lo es cualquier potencia Ak, k = 1, 2, · · ·

(3) Si A es diagonalizable tambien lo es cualquier matriz de la forma A− µI.



(4) Si A es diagonalizable tambien lo es cualquier polinomio en A

q(A) = ckAk + · · ·+ c1A + c0I.

(5) Si A tiene inversa, A es diagonalizable si y solo si lo es su inversa A−1.

(6) A es diagonalizable si y solo si lo es AT .

Si tenemos una diagonalizacion de A, P−1AP = D ≡ A = PDP−1 se obtienen las siguientesdiagonalizaciones de Ak, A− µI,AT y A−1 (si existe)

Ak = PDkP−1, A− µI = P (D − µI)P−1, AT = (P T )−1D(P T ), A−1 = PD−1P−1.

Recordemos que a autovalores distintos corresponden autovectores linealmente indepen-dientes. Por tanto,Teorema. Si todos los autovalores de A son simples (A tiene m autovalores distintos),entonces A es diagonalizable.

Para que una matriz sea diagonalizable no es imprescindible que todos sus autovaloressean simples. Por ejemplo λ = 1 es un autovalor doble de la matriz

A =

264 2 1 01 2 00 0 1

375y A es diagonalizable (compruebalo!). Aunque hay matrices que no son diagonalizables, comopor ejemplo

B =

�2 10 2

�.

Para analizar de forma mas detallada cuando una matriz es diagonalizable consideramoslos siguientes conceptos.

Definicion. Sea A una matriz m×m y sea λ0 un autovalor de A. Se llama:

(a) Multiplicidad algebraica de λ0, y se denota por ma(λ0), a la multiplicidad de λ0

como raız del polinomio caracterıstico p(λ) = det (A− λI) de A. Es decir, p(λ) puedefactorizarse como

p(λ) = (λ− λ0)ma(λ0)q(λ),

siendo q(λ) un polinomio (de grado m−ma(λ0)) que no se anula para λ0, q(λ0) 6= 0.

(b) Multiplicidad geometrica de λ0, y se denota por mg(λ0), a la dimension del espacionulo de A− λ0I,

dim [Nul (A− λ0I)] = m− rango [(A− λ0I)] .

Es decir, la multiplicidad geometrica es el numero (maximo) de autovectores lineal-mente independientes asociados al autovalor.



Lo unico que se puede afirmar en general sobre la relacion entre las multiplicidadesalgebraica y geometrica de un autovalor de una matriz viene dado por el siguiente resultado.

Lema. Sea λ0 un autovalor de una matriz A, entonces 1 ≤ mg(λ0) ≤ ma(λ0).

Teorema. A es diagonalizable si y solo si para cada autovalor λ se verifica que

ma(λ) = mg(λ).

En ese caso, si λ1, . . . , λp son (todos) los autovalores distintos de A y tenemos una base Bk decada uno de los subespacios Nul [A− λkI] (es decir, tenemos tantos autovectores linealmenteindependientes asociados a λk como indica su multiplicidad algebraica), entonces

B = B1 ∪ · · · ∪ Bp

es una base de Rm o de Cm.

Por tanto:

Para determinar si una matriz es diagonalizable habra que determinar si cada autovalormultiple tiene asociados tantos autovectores linealmente independientes como indiquesu multiplicidad algebraica.

Para construir una diagonalizacion, cuando sea posible, habra que obtener tanto auto-vectores linealmente independientes, asociados a cada autovalor, como indique su multi-plicidad algebraica;

Vamos a demostrar el teorema de Cayley-Hamilton para las matrices diagonalizables.

Teorema (de Cayley-Hamilton). Sea p(λ) = det (A− λI) el polinomio caracterıstico deuna matriz cuadrada A, entonces

p(A) = 0.

D.− Aunque el resultado es cierto para una matriz cuadrada arbitraria, aquı solo vamos a considerar

el caso en que A es diagonalizable.

Si A es diagonalizable mediante una matriz de paso P ,

P−1AP = D =⇒ A = PDP−1 =⇒

⇒ p(A) = Pp(D)P−1 = P

266664 p(λ1) 0 . . . 00 p(λ2) . . . 0...

.... . .

...0 0 . . . p(λm)

377775P−1 =

= P

266664 0 0 . . . 00 0 . . . 0...

.... . .

...0 0 . . . 0

377775P−1 = 0.



Observacion.- Para una matriz diagonalizable A, el tener una diagonalizacion

P−1AP = D (diagonal),

permite obtener funciones de dicha matriz que esten definidas por polinomios o por seriesde potencias. Por ejemplo,

Ak = PDkP−1,polinomio(A) = Ppolinomio(D)P−1,

eA =∞X

k=0

Ak

k!= P

"∞X

k=0

Dk

k!

#P−1 = P

266664 eλ1 0 · · · 00 eλ2 · · · 0...

.... . .

...0 0 · · · eλm

377775P−1

puesto que calcular la correspondiente funcion matricial para una matriz diagonal se reducea obtener el valor de dicha funcion en cada uno de los elementos de la diagonal principal.

5.2.2.- Matrices no diagonalizables.

Una matriz cuadrada A es diagonalizable si, y solo si, hay una base (de Rn o Cn) formadapor autovectores de A. Cuando A no es diagonalizable hay situaciones en las que es necesarioencontrar tambien una base cuyos elementos verifiquen ciertas propiedades similares a lasde los autovectores de A. Estos seran los denominados autovectores generalizados de A.

Definicion. Sea A una matriz m × m y sea λ un autovalor de A. Se dice que un vectorv 6= 0 es un autovector generalizado de A asociado a λ si se verifica que (A− λI)k v = 0para algun entero positivo k.

Es decir, los autovectores generalizados de A asociados a λ son (excluyendo al vectornulo), los vectores de los espacios nulos de las matrices (A− λI)k , k = 1, 2, 3, ...

Observaciones.

1) Es facil comprobar que

Nul (A− λI) ⊆ Nul�(A− λI)2

�⊆ · · · ⊆ Nul

�(A− λI)k

�⊆ Nul

�(A− λI)k+1

�⊆ . . .

2) Puesto que la dimension del espacio es finita, los subespacios anteriores no pueden crecerde manera indefinida, sino que para un cierto valor r se verificara

Nul [A− λI] ( Nul�(A− λI)2

�( · · · ( Nul [(A− λI)r] = Nul

�(A− λI)r+1

�= · · · .

3) Si v ∈ Nul�(A− λI)k

�entonces Av ∈ Nul

�(A− λI)k

�. Es decir, si v es un autovector

generalizado, Av tambien lo es (o es el vector nulo).

El siguiente resultado indica que para calcular los autovectores generalizados hay quellegar, a lo sumo, hasta la potencia ma(λ). Nos indica ademas que, si bien en general no escierto que para un autovector generalizado v asociado a λ se tenga que Av es λv, se tiene encambio que Av es tambien autovector generalizado asociado a λ.



Teorema. Sea A matriz m×m y sea λ autovalor de A de multiplicidad algebraica ma(λ).Existe un valor 1 ≤ r ≤ ma(λ) tal que

dim (Nul [A− λI]) < · · · < dim (Nul [(A− λI)r]) = dim�Nul

�(A− λI)ma(λ)

��= ma(λ),

y Nul�(A− λI)k

�= Nul

�(A− λI)ma(λ)

�para k ≥ r.

Observaciones.

1) La proposicion anterior no contradice lo visto hasta ahora para autovectores: si A es dia-gonalizable y λ es autovalor de multiplicidad algebraica ma(λ) = l (su multiplicidadgeometrica sera por tanto mg(λ) = l) el valor r de la proposicion anterior es r = 1.

2) Observe que segun el teorema anterior los autovectores generalizados siempre son loselementos de Nul

�(A− λI)ma(λ)

�, aunque dependiendo de cada caso, dicho espacio

nulo puede coindicir con el espacio nulo de una potencia inferior de A− λI.

Ejemplo. Consideremos la matriz

A =

26664 −1 0 2 −24 4 −1 −24 8 4 −94 5 1 −5

37775 .

Vamos a calcular una base de R4 formada por autovectores y autovectores generalizados deA. Su polinomio caracterıstico es pA(x) = (x−1)3(x+1), luego sus autovalores son λ1 = −1con multiplicidad algebraica ma(λ1) = 1 y λ2 = 1 con multiplicidad algebraica ma(λ2) = 3.Como λ1 = −1 es autovalor simple, sus multiplicidades algebraica y geometrica coinciden.Un autovector asociado a λ1 = −1 es, por ejemplo, v1 = (1, 1, 3, 3)T y los demas autovectoresasociados al mismo autovalor son multiplos de v1. Para el autovalor triple λ2 = 1, las matricesA− λ2I y la escalonada superior obtenida de ella por eliminacion gaussiana son

A− λ2I =

26664 −2 0 2 −24 3 −1 −24 8 3 −94 5 1 −6

37775 Elim. Gauss.−→

26664 −2 0 2 −20 3 3 −60 0 −1 30 0 0 0

37775 .

Puesto que A − λ2I tiene rango 3, solo hay un autovector independiente asociado al auto-valor λ2 = 1 y por tanto, A no es diagonalizable. Los autovectores asociados son los multiplos(no nulos) de v2 = (2,−1, 3, 1)T .

Calculemos una base de autovectores generalizados asociados al autovalor λ2 = 1. Paraello, debemos calcular las potencias A−λ2I hasta que una de ellas tenga rango m−ma(λ2) =4− 3 = 1 con lo cual el espacio nulo de dicha potencia de A − λ2I tendra dimension 3. Lamatrices (A− λ2I)2 y la escalonada superior obtenida por eliminacion gaussiana son

(A− λ2I)2 =

26664 4 6 0 −2−8 −9 0 7

0 3 0 3−8 −7 0 9

37775 Elim. Gauss.−→

26664 4 6 0 −20 3 0 30 0 0 00 0 0 0

37775 ,



cuyo rango es 2 (todavıa distinto de 1 = 4 − ma(λ2)). Por tanto la dimension del espacionulo de (A − λ2I)2 es 2 y podemos obtener en dicho espacio nulo un autovector genera-lizado v3 linealmente independiente con v2, por ejemplo v3 = (0, 0, 1, 0)T . Notemos queNul ((A− λ2I)2) = Gen {v2, v3}. La matriz (A− λ2I)3 es

(A− λ2I)3 =

26664 8 8 0 −88 8 0 −8

24 24 0 −2424 24 0 −24

37775 ,

cuyo rango es 1 = 4 − ma(λ2). Por tanto, el espacio nulo de (A − λ2I)3 tiene dimension3. En este espacio nulo podemos obtener un autovector generalizado v4 que sea linealmenteindependiente con {v2, v3}, por ejemplo v4 = (1,−1, 0, 0)T . Notemos que

Nul ((A− I)3) = Gen {v2, v3, v4}

y que los vectores de este espacio son, ademas del vector nulo, todos los autovectores y auto-vectores generalizados asociados al autovalor λ1 = 1. Ası, hemos obtenido tres autovectores(generalizados) asociados al autovalor triple λ1 = 1 de una determinada forma, ampliando deuna base de Nul (A−I) a una de Nul ((A−I)2) y de esta a una de Nul ((A−I)3). Podrıamoshaber obtenido una base de Nul ((A− I)3) sin necesidad de pasar por bases de los espaciosintermedios. Por ejemplo, los vectores

w2 = (1,−1, 0, 0)T , w3 = (0, 1, 0, 1)T , w4 = (0, 0, 1, 0)T

forman una base de Nul ((A− I)3).Por tanto, tenemos como bases de R4

{v1, v2, v3, v4} y {v1, w2, w3, w4}.

Para observar la diferencia entre ellas (y entender por que, en general, es mas convenienteencontrar una base por el procedimiento seguido para construir {v1, v2, v3, v4}) se proponecomo ejercicio determinar la matriz P−1AP tomando respectivamente como matriz P lamatriz cuyas columnas son las coordenadas de los vectores de cada una de las bases anteriores.Ası, si formamos P1 = [v1, v2, v3, v4] y P2 = [v1, w2, w3, w4] obtenemos

P−11 AP1 =

26664 −1 0 0 00 1 1 −10 0 1 −10 0 0 1

37775 , P−12 AP2 =

26664 −1 0 0 00 −1 −2 20 −1 0 10 −4 −1 4

37775 .

Observamos que con P1, en el bloque correspondiente al autovalor 1, este aparece en ladiagonal y ademas es un bloque triangular superior, es decir, en la matriz obtenida (que nopuede ser diagonal pues A no es diagonalizable), los autovalores aparecen en la diagonal yel bloque del autovalor 1 al menos tiene ceros por debajo de la diagonal.

Sin embargo, con P2 ni el autovalor 1 aparece en la diagonal ni su bloque correspondientees triangular.

Si una matriz es diagonalizable al “juntar autovectores independientes de autovaloresdiferentes se obtiene una base de Rm (o de Cm). De la misma forma cuando se unen bases


5.3.- Aplicaciones del calculo de autovalores y autovectores. 153

de los espacios de autovectores generalizados se obtiene una base de Rm (o de Cm). Siendomas preciso, tenemos el siguiente resultado.

Proposicion. Sea A una matriz cuadrada de orden m, con polinomio caracterıstico

pA(λ) = (λ− λ1)m1 . . . (λ− λp)

mp ,

con λ1, . . . , λp distintos entre sı. Si Bj es base de Nul (A−λjI)mj , para j = 1, . . . , p, la unionde dichas bases B = {B1, . . . ,Bp} es base de Rm (o de Cm).

Observacion-Ejercicio. Segun vimos en el estudio de las propiedades del calculo de auto-valores y autovectores, todo autovector de una matriz A es autovector de cualquiera de suspotencias A2, A3, . . . El recıproco no es cierto, en general. Por ejemplo, tomando la matriz

A =

�0 10 0

�se verifica que A2 es la matriz nula y, por tanto, cualquier vector no-nulo de R2 es autovectorde A2 asociado a su unico autovalor λ = 0. Sin embargo, hay vectores de R2 que no sonautovectores de A, por ejemplo v = [ 1, 1 ].

Determina los autovectores de cada una de las potencias de

A =

26664 0 0 1 00 0 0 10 0 0 00 0 0 0

37775 .

5.3.- Aplicaciones del calculo de autovalores y autovectores.

Vamos a considerar la relacion del calculo de autovalores y autovectores con los llamadosproblemas de evolucion. Dichos problemas vendran expresados por una ecuacion endiferencias en el caso discreto y por una ecuacion diferencial en el caso continuo.

En forma generica se tratara de obtener una funcion vectorial de variable discreta (en cuyocaso tendremos una sucesion de vectores) o de variable continua (en cuyo caso tendremosuna funcion vectorial de variable real) determinadas por una condicion sobre su evolucion.Como es natural solo consideraremos problemas lineales. De esta forma los correspondientesconjuntos de soluciones tendran una estructura similar a la del conjunto de soluciones de unsistema de ecuaciones lineales. Es decir, tendran una estructura de subespacio vectorial (ode variedad lineal) y podran manipularse de forma analoga a la manipulacion de vectores decoordenadas.

5.3.1.- Sistemas de ecuaciones en diferencias.

Aquı trataremos de obtener las sucesiones de vectores en Rm (o Cm)

u0, u1, u2, u3, . . . , un, . . .

en la que la relacion entre dos terminos consecutivos es lineal, constante y homogenea.De forma mas precisa, la relacion entre dos vectores consecutivos sera de la forma

un+1 = Aun



siendo A una matriz cuadrada m×m constante (independiente de n).

Definicion. Sea A una matriz cuadrada de orden m y sea u1, u2, . . . , un, . . . una sucesionde vectores en Rm definidos de manera recurrente por

un = Aun−1, n = 1, 2, . . .

a partir de un vector inicial u0 ∈ Rm. Una relacion de recurrencia de esta forma se llamasistema de ecuaciones en diferencias lineal homogeneo de primer orden (con coeficientesconstantes). No nos ocuparemos aquı ni del caso no homogeneo, ni del caso de coeficientesno constantes y muchisimos menos de casos no lineales.

A partir de la relacion un = Aun−1 se tiene que un = Anu0 y tenemos la expresiondel termino general un en funcion del vector original u0. El problema es determinar laspotencias An de A. Tendremos esencialmente dos situaciones. Por un lado, el caso en que Asea diagonalizable sera facil de tratar y por otro, el caso en el que A no sea diagonalizable quenecesitara de mas elaboracion puesto que tendremos que recurrir al calculo de autovectoresgeneralizados. Uno de los aspectos que permite estudiar la expresion del termino general un

(a partir de u0) es el comportamiento asintotico, es decir el comportamiento a largo plazo dela sucesion un, ¿que sucede con los vectores un cuando n se hace grande?

Proposicion. Sea A una matriz cuadrada de orden m y u0 ∈ Rm. Entonces

(a) Si A es diagonalizable, A = PDP−1 (P matriz de paso de orden m cuyas columnasson autovectores de A linealmente independientes, D matriz diagonal cuyos elementosdiagonales son los autovalores correspondientes de A), se verifica que

An = PDnP−1 y un = Anu0 = PDnP−1u0, n = 1, 2, . . .

(b) Si u0 es combinacion lineal de autovectores de A (independientemente de que A seadiagonalizable o no),

u0 = c1v1 + · · ·+ ckvk y Avj = λjvj , j = 1, . . . , k,

entoncesAnu0 = c1λ

n1v1 + · · · ckλ

nkvk.

Observaciones. ¿Que sucede si A no es diagonalizable y u0 no es combinacion lineal deautovectores? Sea A una matriz m×m no diagonalizable.

(a) Si v es un autovector generalizado de A asociado a un autovalor λ, para un cierto valork se verifica que

(A− λI)v 6= 0, . . . , (A− λI)k−1v 6= 0, (A− λI)kv = 0.

Utilizando esto podemos determinar la solucion (sucesion de vectores) del sistema deecuaciones en diferencias un = Aun−1 que tiene como valor inicial u0 = v. Para ello,basta considerar la formula del binomio de Newton:

(a+b)n =

�n0

�anb0+

�n1

�an−1b1+

�n2

�an−2b2+· · ·

�n

n− 1

�a1bn−1+

�nn

�a0bn


5.3.- Aplicaciones del calculo de autovalores y autovectores. 155�pq

�:=

p(p− 1) · · · (p− q + 1)

q!=

p!

q!(p− q)!, (0! := 1)

que es aplicable a la potencia de una suma de matrices si estas conmutan. Es decir, siA y B son dos matrices cuadradas que conmutan (AB = BA), se verifica la igualdad

(A + B)n =

�n

0

�AnB0 +

�n

1

�An−1B1 +

�n

2

�An−2B2 + · · · +

�n

n

�A0Bn

siendo A0 = B0 = I. Puesto que las matrices A−λI y λI conmutan, podemos aplicarla formula del binomio de Newton y para n ≥ k obtenemos

Anv = [λI + (A− λI)]n v =

=

��n

0

�(λI)n +

�n

1

�(λI)n−1(A− λI)1 + · · ·+

�n

n

�(A− λI)n

�v�

puesto que (A− λI)kv = (A− λI)k+1v = (A− λI)k+2v = · · · = 0�

= λnv + nλn−1(A− λI)v +n(n− 1)

2λn−2(A− λI)2v + · · ·+

+ · · ·+ λn−k+1

�n

k − 1

�(A− λI)k−1v

y aparecen (a lo sumo) k sumandos en el sumatorio, independientemente de lo grandeque sea n. En los ejemplos que veremos k sera pequeno y apareceran pocos terminosen el sumatorio.

(b) Si obtenemos una base {v1, . . . , vm} (de Rm o Cm) formada por autovectores generali-zados de A, entonces puede encontrarse la solucion general del sistema de ecuacionesen diferencias un = Aun−1 para cualquier u0 ∈ Rn. Para ello, expresamos u0 comocombinacion lineal de los autovectores generalizados {v1, . . . , vm},

u0 = α1v1 + · · ·+ αmvm

con lo queun = Anu0 = α1A

nv1 + · · ·+ αmAnvm

y, por tanto, bastara determinar (Anvj) para cada autovector generalizado vj .

(c) Calculo de An. A partir de una base formada por autovectores generalizados {v1, . . . , vm}podemos calcular An sin mas que obtener los vectores {Anv1, . . . , A

nvm} y despejar An

de la igualdad matricial

An

264 v1 v2 . . . vm

375 =

264 Anv1 Anv2 . . . Anvm

375 .

(d) Comportamiento asintotico de Anu0. Con este termino se designa al estudio delcomportamiento de la sucesion de vectores u0, u1, u2, . . . a largo plazo. Es decir setrata de estudiar que sucede cuando n −→∞. Los vectores un



¿convergen a un cierto vector?

¿oscilan entre ciertos vectores?

¿tienden a ∞? Es decir, ¿lımn→∞ ||un|| =∞?

Si tenemos un vector u0 expresado como combinacion lineal de autovectores y autovectoresgeneralizados

u0 = c1v1 + · · ·+ cmvm,

la sucesion generada viene dada mediante

un = Anu0 = c1Anv1 + · · ·+ cmAnvm

con lo cual podemos reducir el estudio al comportamiento de las sucesiones Anv siendo vun autovector o un autovector generalizado de A. En la situacion mas simple, que v sea unautovector asociado a un cierto autovalor λ tenemos que

Anv = λnv

y, por tanto,

Si |λ| < 1, tenemos que (λn)→ 0 y (Anv) = (λnv)→ 0.

Si |λ| > 1, tenemos que (λn)→∞ y (||Anv||) = (|λ|n ||v||)→ +∞.

Si |λ| = 1 hay que distinguir dos casos (al menos):

• Si λ = 1, la sucesion de vectores Anv = v es constante.

• Si |λ| = 1, λ 6= 1, puesto que |λn| = 1 para todo n = 1, 2, . . . , los coeficientesλ, λ2, λ3, . . . recorren la circunferencia unidad (no completa, infinitas veces) y losvectores Anv = λnv presentan un comportamiento oscilante.

Veamos a continuacion dos ejemplos de como obtener Anv.

Ejemplo 1. Calcular un = Anu0 siendo

A =

264 1 1 00 1 00 0 2

375 y u0 =

264 21−1

375 .

Por ser A triangular es inmediato que los autovalores son λ1 = 1 (doble) y λ2 = 2 (sim-ple). Como es facil comprobar, mg(λ1 = 1) = 1 < ma(λ1 = 1) = 2 y la matriz A no esdiagonalizable. No existe una base de autovectores (λ1 y λ2 aportan uno cada uno) y nece-sitamos recurrir a un autovector generalizado de λ1 para obtener una base de R3 formadapor autovectores y autovectores generalizados.

Autovectores asociados a λ1 = 1,

(A− I)x = 0 =⇒ Nul (A− I) = Gen

8><>:v1 =

264 100

3759>=>; .



Autovectores generalizados asociados a λ1 = 1,

(A− I)2x = 0 =⇒ Nul�(A− I)2

�= Gen

8><>:v1, v2 =

264 010

3759>=>; .

Autovectores asociados a λ2 = 2,

(A− 2I)x = 0 =⇒ Nul (A− 2I) = Gen

8><>:v3 =

264 001

3759>=>; .

Es decir, trabajaremos con la base de R3 formada por {v1, v2, v3} (que en este caso sencillocoincide con la canonica). Ası,

un = Anu0 = An(2v1 + v2 − v3) = 2Anv1 + Anv2 − Anv3.

Por ser v1 y v3 autovectores:

Anv1 = λn1v1 = 1nv1 = v1 y Anv3 = λn

2v3 = 2nv3.

Mientras que por ser v2 autovector generalizado de λ1 = 1, que verifica (A−I)2v2 = 0 (k = 2en la formula dada anteriormente):

Anv2 = [λ1I + (A− λ1I)]n v2

= λn1v2 + nλn−1

1 (A− λ1I)v2 + n(n−1)2

λn−21 (A− λ1I)2v2 + · · ·

= 1nv2 + n1n−1v1 + 0 + ... = v2 + nv1 ya que (A− I)v2 = v1.

Finalmente

un = Anu0 = 2v1 + (v2 + nv1)− 2nv3 = (n + 2)v1 + v2 − 2nv3 =

�2 + n

1−2n

Ǒ.

Ejemplo 2. Calcular un = Anu0 siendo

A =

264 3/2 1/2 1/20 2 1

1/2 −1/2 5/2

375 y u0 =

264 021

375 .

Autovalores. Calculamos sus autovalores mediante la ecuacion caracterıstica,

|A− λI| = 0 −→ λ3 − 6λ2 + 12λ− 8 = 0 −→ (λ− 2)3 = 0,

de donde obtenemos que λ1 = 2 es un autovalor triple (ma(λ1) = 3). (Recuerdeseque la traza de la matriz debe coincidir con la suma de los autovalores; en este casoambas valen 6, puesto que tr(A) = 3/2 + 2 + 5/2 = 2 + 2 + 2 = 6). Si calculamos sumultiplicidad geometrica

mg(λ1 = 2) = 3− rango(A− 2I) = 3− 2 = 1

vemos que solo tiene un autovector asociado linealmente independiente, con lo quenecesitaremos encontrar dos autovectores generalizados (linealmente independientes)para formar una base de R3 con autovectores y autovectores generalizados.



Autovectores:

(A− 2I)x =

264 −12

12

12

0 0 112−1

212

375 264 x1

x2

x3

375 = 0 −→¨

x1 − x2 + x3 = 0x3 = 0

−→ x = x2

264 110

375 .

Tomamos como autovector, por ejemplo, v1 = (1, 1, 0)T .

Autovectores generalizados:

• (A− 2I)2x = 0264 12−1

212

12−1

212

0 0 0

375 264 x1

x2

x3

375 = 0 −→ x1 − x2 + x3 = 0 −→ x = x1

264 110

375 + x3

264 011

375 .

Tomamos como primer autovector generalizado (que debe ser linealmente inde-pendiente con v1), por ejemplo, v2 = (0, 1, 1)T .

• Finalmente, (A− 2I)3x = 0264 0 0 00 0 00 0 0

375 264 x1

x2

x3

375 = 0 −→ x =

264 x1

x2

x3

375 ∈ R3 arbitrario.

Podemos tomar como segundo autovector generalizado cualquier vector de R3 quesea linealmente independiente con {v1, v2}, por ejemplo, v3 = (1, 0, 0)T .

Una vez que tenemos la base B = {v1, v2, v3} formada por autovectores y autovectoresgeneralizados, calculamos las coordenadas de u0 en dicha base,

u0 = PB[u0]B −→

264 021

375 =

264 1 0 11 1 00 1 0

375 264 αβγ

375 −→ [u0]B =

264 11−1

375 ,

es decir, u0 = v1 + v2 − v3.Por tanto,

un = Anu0 = An(v1 + v2 − v3) = Anv1 + Anv2 − Anv3.

Puesto que v1 es autovector de A asociado a λ1 = 2, Anv1 = λn1v1 = 2nv1. Por otra parte,

Anv2 = [λ1I + (A− λ1I)]n v2 = λn1v2 + nλn−1

1 (A− λ1I)v2 + n(n−1)2

λn−21 (A− λ1I)2v2 + · · ·

= 2nv2 + n2n−1v1 + 0 + ... = 2n

264 011

375 + n2n−1

264 110

375(por ser v2 autovector generalizado asociado a λ1 = 2, que verifica (A − 2I)2v2 = 0 (k = 2en la formula anterior) y ya que (A− 2I)v2 = v1),

Anv3 = [λ1I + (A− λ1I)]n v3 = λn1v3 + nλn−1

1 (A− λ1I)v3 + n(n−1)2

λn−21 (A− λ1I)2v3 + · · ·

= 2n

264 100

375+ n2n−1

264 −1/20

1/2

375+ n(n−1)2

2n−2

264 1/21/20

375Matematicas I. Ingenierıas: Aeroespacial, Civil y Quımica


(por ser v3 autovector generalizado de λ1 = 2, que verifica (A − 2I)3v3 = 0 (k = 3 en laformula anterior) y ya que

(A− 2I)v3 =

264 −1/20

1/2

375 y (A− 2I)2v3 =

264 1/21/20

375 .

Notese que si hubieramos elegido una base formada por tres autovectores generalizados,

{w1, w2, w3},

a partir de (A− 2I)3v = 0, tendrıamos

un = Anu0 = An(α1w1 + α2w2 + α3w3) = α1Anw1 + α2A

nw2 + α3Anw3.

Para obtener cada uno los tres terminos Anwi necesitarıamos recurrir a una expresion analogaa la obtenida para Anv3. De ahı que, en general, sea recomendable construir la base deRn formada por autovectores y autovectores generalizados de forma progresiva: resolviendoprimero (A− λI)v = 0, despues (A− λI)2v = 0, despues (A− λI)3v = 0, etc.

No obstante, puesto que en el caso anterior todo vector es un autovector generalizado(puesto que solo hay 1 autovalor), calcular Anu0 conlleva los mismos calculos que obtenerAnv3.

5.3.2.- Sistemas lineales de ecuaciones diferenciales.

Una primera advertencia que debemos hacer es que solo vamos a considerar algunosaspectos manipulativos de un tipo particularmente simple de ecuaciones y sistemasde ecuaciones diferenciales. No vamos a considerar ni los problemas de la ciencia y laingenierıa que dan lugar a dichas ecuaciones (desintegracion radiactiva, circuitos LCR, leyesde Newton del enfriamiento y del calentamiento, dinamica de poblaciones, mezclas, reac-ciones quımicas,...) ni los conceptos fısicos (velocidad,...) o geometricos (recta tangente auna curva,...) que pueden asociarse a una ecuacion diferencial, ni las variantes mas simplesque suelen asociarse a las ecuaciones y sistemas que consideraremos.

El estudio de las ecuaciones diferenciales sera uno de los topicos esenciales en la asignaturaAmpliacion de Matematicas de segundo curso.

Una ecuacion diferencial es una igualdad en la que aparece una incognita (que debemosobtener) con la particularidad de que esta incognita no es un numero sino una funcion(real de una variable real) definida en un intervalo (finito o infinito) y en la igualdad estaninvolucradas, ademas de la propia funcion incognita, una o varias de las derivadas de dichafuncion incognita. Siendo t la variable independiente, y(t) una funcion a determinar y f(t)una funcion dada, la igualdad y′(t) = f(t) es una ecuacion diferencial cuyas solucionesson las primitivas de la funcion f(t). Suponiendo que las primitivas estan definidas en todala recta real, cuando fijamos un punto (t0, y0) del plano, solo hay una de dichas primitivascuya grafica pase por dicho punto. La igualdad y′(t) = y(t) es otra ecuacion diferencialy sus soluciones son las funciones y(t) = ket siendo k una constante arbitraria. De entreestas soluciones, solo hay una cuya grafica pase por el punto (t0, y0) (la que se obtiene conk = y0e

−t0). Las ecuaciones diferenciales se suelen clasificar atendiendo en primer lugar a suorden, es decir, al mayor orden de derivacion (de la funcion incognita) que aparece en laecuacion. Por ejemplo:



(a) y′ − 2y = cos(t), yy′ = 0, (y′)2 + y = 0 son ecuaciones de primer orden,

(b) y′′ = t2 − 3t, yy′′ − 2y′ = 3 son ecuaciones de segundo orden,

(c) y′′′ = 0 es una ecuacion de tercer orden, ...

Un tipo especial (e importante) de ecuaciones diferenciales lo constituyen las llamadasecuaciones diferenciales lineales. Se llama ası a las ecuaciones diferenciales que resultande igualar una combinacion lineal de la funcion incognita y sus derivadas a una funcion dada,siendo los coeficientes en dicha combinacion lineal funciones de la variable independiente.Por ejemplo, la ecuacion

2y′′ − ty′ + ety = t2 − 1

es una ecuacion diferencial lineal de segundo orden (con coeficientes no constantes). Notemosque la parte que afecta a la funcion incognita

L(y) := 2y′′ − ty′ + ety

actua de forma lineal sobre ella, es decir, siendo c1 y c2 constantes arbitrarias y siendo y1(t)e y2(t) funciones para las que L(y) esta definida, se verifica

L(c1y1 + c2y2) = c1L(y1) + c2L(y2).

Este hecho hace que la estructura del conjunto de soluciones de una ecuacion diferencial linealL(y) = f(t) sea similar a la estructura del conjunto solucion de un sistema de ecuacioneslineales Ax = b. Entre estas similitudes podemos destacar:

(a) Una combinacion lineal de soluciones de la ecuacion homogenea asociada L(y) = 0, essolucion de dicha ecuacion homogenea.

(b) Al sumar una solucion de la ecuacion completa con una solucion de la ecuacion ho-mogenea se obtiene una solucion de la ecuacion completa.

(c) Al restar dos soluciones de la ecuacion completa se obtiene una solucion de la ecuacionhomogenea.

(d) Si y1 es una solucion de la ecuacion L(y) = f1(t) e y2 es una solucion de la ecuacionL(y) = f2(t), entonces y1 + y2 es una solucion de la ecuacion L(y) = f1(t) + f2(t).

El enunciado (d) se suele denominar, en forma rimbombante (pero descriptiva), prin-cipio de superposicion. En forma reducida los enunciados (a), (b) y (c) nos dicen quemanipular el conjunto solucion de la ecuacion homogenea L(y) = 0 es analogo a manipularun subespacio vectorial (que sera de dimension igual al orden de la ecuacion) y manipular elconjunto solucion de la ecuacion completa L(y) = q(t) es analogo a manipular una variedadafın (el conjunto solucion de un sistema completo Ax = b), siendo el subespacio directorel conjunto solucion de la ecuacion homogenea. Si tenemos una solucion particular yp(t) dela ecuacion completa, se verifica que (al igual que para un sistema de ecuaciones linealesAx = b que sea compatible)8><>: solucion general

de laecuacion completa

9>=>; =

8><>: una solucion particularde la

ecuacion completa

9>=>;+

8><>: solucion generalde la

ecuacion homogenea

9>=>;Matematicas I. Ingenierıas: Aeroespacial, Civil y Quımica


De entre las ecuaciones diferenciales lineales, cabe destacar las que tienen coeficientesconstantes, es decir, ecuaciones del tipo

y′′ − 3y′ + 4y = f(t).

Para este tipo de ecuaciones podremos dar una descripcion completa del conjunto solucionde la ecuacion homogenea asociada y′′ − 3y′ + 4y = 0 ası como metodos para abordar laecuacion completa.

• La ecuacion lineal de primer orden.

Se suele escribir en la forma y′ + p(t)y = q(t), donde p(t) y q(t) son funciones continuasen un intervalo I ⊂ R. Para resolver la ecuacion de primer orden vamos a proceder en dosetapas:

(1) Resolver (obtener la solucion general de) la ecuacion homogenea asociada.

y′ + p(t)y = 0 =⇒ y′

y= −p(t)⇒ yh(t) = ce−

Rp(t) dt

siendo c una constante real arbitraria.

(2) Buscar una solucion particular de la ecuacion completa. Para buscar una solucion partic-ular de la ecuacion completa vamos a usar un procedimiento debido a J.L. Lagrange yque se conoce como metodo de variacion de los parametros. Esta tecnica tambienes aplicable para ecuaciones lineales de orden superior y para sistemas de ecuaciones.La idea consiste en buscar una solucion de la ecuacion completa que tenga la mismaforma

yh(t) = ce−R

p(t) dt

que la solucion general de la ecuacion homogenea asociada, pero sustituyendo la con-stante arbitraria c por una funcion c(t) que debemos determinar. Es decir, buscamosuna solucion de la forma

yp(t) = c(t)e−R

p(t) dt.

Sustituyendo yp(t) en la ecuacion y′ + p(t)y = q(t) nos queda

q(t) = y′

p + p(t)yp = c′(t)e−R

p(t) dt + c(t)�−p(t)e−

Rp(t) dt

�+ p(t)c(t)e−

Rp(t) dt =

= c′(t)e−R

p(t) dt ⇒ c′(t) = q(t)eR

p(t) dt ⇒ c(t) =R

q(t)eR

p(t) dt dt

Por tanto, siendo µ(t) = eR

p(t) dt , la solucion general de la ecuacion completa viene

dada por

y(t) = yh(t) + yp(t) =c

µ(t)+

1

µ(t)

Zq(t)µ(t) dt =

1

µ(t)

�c +

Zq(t)µ(t) dt

�,

(otro problema es obtener las primitivas que aparecen involucradas en la expresionanterior).



Una vez que tenemos la solucion general de la ecuacion basta sustituir para obtener lasolucion de un Problema de valor inicial: calcular la solucion de la ecuacion cuya graficapasa por un determinado punto. Es decir, dado un punto t0 ∈ I, una solucion del problemade valor inicial (tambien conocido como problema de Cauchy) en t0,¨

y′ + p(t)y = q(t)y(t0) = y0

es una funcion y = y(t) derivable en I que verifica las dos condiciones.

• Teorıa general de los sistemas lineales.

La teorıa y las tecnicas de resolucion de los sistemas de ecuaciones diferenciales linealescon coeficientes constantes corre paralela a la de las ecuaciones diferenciales lineales. En elepıgrafe siguiente estudiaremos las ecuaciones diferenciales lineales de segundo orden comocaso particular. Por comodidad y economıa de tiempo, nos restringiremos al caso de lossistemas de dos ecuaciones, las ideas esenciales son trasladables al caso general.

Definiciones Un sistema lineal plano con coeficientes constantes es un sistema de ecuacionesdiferenciales de la forma

y′

1 = a11y1 + a12y2 + f1(t)y′

2 = a21y1 + a22y2 + f2(t)

en el que A = [aij] es una matriz de numeros reales cuadrada de orden 2 que se llama matrizde los coeficientes y f1, f2 : [a, b]→ R son funciones continuas dadas. Se dice que el sistemaes homogeneo cuando las dos funciones f1 y f2 son iguales a la funcion cero.

Una solucion de dicho sistema es un par y1 e y2 de funciones derivables tales que paracada t ∈ [a, b] se verifica

y′

1(t) = a11y1(t) + a12y2(t) + f1(t)y′

2(t) = a21y1(t) + a22y2(t) + f2(t).

Si introducimos las funciones vectoriales y, f : [a, b]→ R2 dadas por

y(t) =

�y1(t)y2(t)

�y f(t) =

�f1(t)f2(t)

�,

el sistema se escribe de forma abreviada como y′(t) = Ay(t)+f(t). La estructura es la mismaque la de una ecuacion lineal de primer orden. De hecho, la teorıa de los sistemas lineales es,como cabe esperar, una extension de las teorıas de las ecuaciones lineales de primer orden.Esto se pone de manifiesto en los siguientes resultados.

Teorema. Teorema de existencia y unicidad: Sean A = [aij ] una matriz cuadrada de orden2 y f : [a, b] → R2 una funcion vectorial continua. Dados un punto t0 ∈ [a, b] y un vectory0 ∈ R2, entonces el problema de valor inicial¨

y′(t) = Ay(t) + f(t)y(t0) = y0

tiene solucion unica en [a, b].



Este teorema nos dice, por ejemplo, que la solucion general de un sistema lineal planodependera de dos constantes que pueden determinarse fijando el valor de cada una de lascomponentes de la funcion vectorial y(t) en un punto dado t0.

Teorema. Estructura de las soluciones de un sistema lineal:Sea A =

�aij

�una matriz cuadrada de orden 2, sea f : [a, b] → R2 una funcion vectorial

continua y consideremos el sistema lineal y′(t) = Ay(t) + f(t). Entonces se verifican:

(1) Las soluciones del sistema homogeneo asociado y′(t) = Ay(t) forman un espacio vectorialde dimension 2. En particular, si

�y(1)(t), y(2)(t)

©es una base de soluciones del sistema

homogeneo, entonces se dice que la funcion matricial formada columna a columna porestas soluciones

Y (t) =�

y(1)(t) y(2)(t)�

es una matriz fundamental de soluciones del sistema y′ = Ay. Observemos que estamatriz verifica Y ′(t) = AY (t). Una vez que tenemos una matriz fundamental de solu-ciones, la solucion general del sistema homogeneo es y(t) = Y (t)c, donde c ∈ R2 es unvector de constantes arbitrarias.

(2) Si y(p)(t) es una solucion particular del sistema completo y′(t) = Ay(t) + f(t), entoncesla solucion general del sistema completo es

y(t) = Y (t)c + y(p)(t) = c1y(1)(t) + c2y

(2)(t) + y(p)(t),

siendo Y (t) =�

y(1)(t) y(2)(t)�

una matriz fundamental de soluciones del sistemahomogeneo asociado y c ∈ R2 un vector de constantes arbitrarias.

• Sistemas homogeneos con coeficientes constantes.

De acuerdo con lo que acabamos de ver, para resolver un sistema lineal

y′(t) = Ay(t) + f(t),

debemos hallar una matriz fundamental de soluciones del sistema homogeneo asociado yuna solucion particular del sistema completo. Empezaremos estudiando como se calculanlas soluciones de un sistema homogeneo y′ = Ay; luego veremos metodos para resolver elsistema completo.

Podemos utilizar la solucion general de la ecuacion diferencial y′ = ay como guıa pararesolver un sistema y′ = Ay. Teniendo en cuenta que las soluciones de la ecuacion y′ = ayson de la forma y(t) = ceat no es descabellado buscar soluciones del sistema y′(t) = Ay(t) dela forma y(t) = eλtv siendo v un vector constante (independiente de t). Puesto que en dichocaso y′(t) = λeλtv, sustituyendo tenemos

λeλtv = Aeλtv ⇐⇒ Av = λv.

Por tanto, 8><>: y(t) = eλtves solucion de

y′ = Ay

9>=>; ⇐⇒

8><>: λ es un autovalor de Ay v es un autovectorde A asociado a λ

9>=>; .



Notemos que si v1 y v2 son dos autovectores de A lineamente independientes asociadosrespectivamente a dos autovalores λ1 y λ2, entonces las soluciones

y(1)(t) = eλ1tv1, y(2)(t) = eλ2tv2

son linealmente independientes, al margen de que λ1 y λ2 sean iguales o distintos.

¿Que sucede si la multiplicidad geometrica de un autovalor es menor que la algebraica?Hay que recurrir a los autovectores generalizados.

¿Que sucede con los autovalores y autovectores complejos no-reales? Para tener solu-ciones reales hay que separar la parte real y la parte imaginaria de las solucionescomplejas que obtengamos.

Para un sistema de dimension 2 podemos distinguir cuatro casos.

Teorema. Sea A una matriz real 2× 2 y consideremos el sistema y′ = Ay.

(1) Autovalores reales y distintos. Supongamos que A tiene dos autovalores reales ydistintos λ y µ. Sea u un autovector asociado a λ y sea v un autovector asociadoa µ. Entonces las funciones vectoriales y(1)(t) = eλtu e y(2)(t) = eµtv son solucioneslinealmente independientes del sistema y′ = Ay. En consecuencia, la solucion generalde dicho sistema viene dada por

y(t) = c1y(1)(t) + c2y

(2)(t) = c1eλtu + c2e

µtv.

(2) Autovalor real doble y no defectivo. Supongamos que A tiene un autovalor realdoble λ que no es defectivo; es decir, que admite dos autovectores linealmente inde-pendientes u y v. Entonces y(1)(t) = eλtu e y(2)(t) = eλtv son soluciones linealmenteindependientes del sistema y′ = Ay. En consecuencia, la solucion general de dichosistema viene dada por

y(t) = c1y(1)(t) + c2y

(2)(t) = c1eλtu + c2e

λtv.

Observacion. Si una matriz cuadrada de orden 2 tiene un autovalor real doble y no defectivo,

entonces la matriz es diagonalizable y, automaticamente, diagonal. En ese caso, el sistema

lineal correspondiente no es propiamente un sistema sino, mas bien, dos ecuaciones separadas.

Si hemos descrito el procedimiento de resolucion de forma tan general es porque sigue siendo

valido para matrices de orden mayor, que pueden tener autovalores dobles, triples, etc., no

defectivos sin ser diagonales.

(3) Autovalor real doble y defectivo. Supongamos que A tiene un autovalor real dobleλ que sı es defectivo; es decir, que admite solamente un autovector linealmente inde-pendiente u. Entonces y(1)(t) = eλtu es una solucion del sistema y′ = Ay. Para buscaruna segunda solucion y(2)(t) que sea linealmente independiente de la anterior, hacemoslo siguiente. Sea v un vector linealmente independiente del autovector u. Entonces

y(2)(t) = eλt [I + (A− λI)t] v



es una solucion del sistema homogeneo y′ = Ay independiente de y(1)(t). En conse-cuencia, la solucion general de dicho sistema viene dada por

y(t) = c1y(1)(t) + c2y

(2)(t) = c1eλtu + c2e

λt [I + (A− λI)t] v.

Observacion. Este procedimiento de resolucion no es valido, tal y como se ha descrito, para

matrices de orden mayor que tengan autovalores dobles defectivos. La manera de trasladarlo al

caso general es la siguiente: el vector v que se toma para construir y(2) no puede ser cualquier

vector linealmente independiente del autovector u, debe ser un autovector generalizado; es

decir, un vector v tal que (A−λI)2v = 0. Lo que ocurre con una matriz de orden dos que tiene

un autovalor doble defectivo es que, automaticamente, (A − λI)2 = 0 y todos los vectores

son autovectores generalizados.

(4) Autovalores complejos distintos. Supongamos que u = v + iw, donde i =√−1 es

la unidad imaginaria, es un autovector complejo de A asociado al autovalor complejoλ = α + iβ (β 6= 0). Entonces

y(1)(t) = Re�eλtu

�= eαt [v cos(βt)− w sen(βt)]

y(2)(t) = Im�eλtu

�= eαt [v sen(βt) + w cos(βt)]

son soluciones linealmente independientes del sistema y′ = Ay. En consecuencia, lasolucion general de dicho sistema viene dada por

y(t) = c1y(1)(t) + c2y

(2)(t) = c1Re�eλtu

�+ c2Im

�eλtu

�.

Para un sistema lineal de ecuaciones diferenciales con coeficientes constantes

y′(t) = Ay(t) + f(t)

siendo A una matriz real m×m y f : [a, b] −→ Rm una funcion vectorial continua, podemosdecir lo mismo que hemos visto para un sistema de dimension 2 en lo que se refiere a laestructura de la solucion general del sistema homogeneo asociado y′(t) = Ay(t), la relacionentre la solucion general del sistema completo y la del sistema homogeneo, el teorema deexistencia y unicidad del problema de valor inicial asociado... En lo que se refiere a solucionesasociadas a autovalores y autovectores tenemos los resultados siguientes.

Teorema. Sea A una matriz real m×m,

(a1) Si v es un autovector de A asociado a un autovalor λ, entonces y(t) = eλtv es unasolucion (real o compleja) del sistema y′ = Ay.

(a2) Si A es diagonalizable y {v1, · · · , vm} es un conjunto de m autovectores linealmenteindependientes, asociados respectivamente a los autovalores λ1, . . . , λm (iguales o dis-tintos, reales o complejos), entonces

y1(t) = eλ1tv1, . . . , ym(t) = eλmtvm

son m soluciones linealmente independientes del sistema y′ = Ay. En el caso de auto-valores/autovectores complejos no-reales bastara sustituir la pareja de soluciones com-

plejas eλtv, eλtv por la pareja formada por su parte real e imaginaria.



(b) Si u es un autovector generalizado de A asociado a un autovalor λ, entonces

y(t) = eλt

�I + (A− λI)t + · · ·+ 1

k!(A− λI)k tk + · · ·

�u

es una solucion (real o compleja) del sistema y′ = Ay. Notemos que, puesto que u esun autovector generalizado de A asociado a λ, se verifica que (A− λI)k u = para uncierto valor de k en adelante y, por tanto, en la suma anterior bastara con consideraruna cantidad finita de sumandos (que a lo sumo sera la multiplicidad algebraica de λ).

(c) Si y(t) es una solucion compleja del sistema y′ = Ay, entonces su parte real y su parteimaginaria son soluciones de dicho sistema.

Observacion. Una forma habitual de dar la solucion general de un sistema homogeneoy′ = Ay utiliza la denominada exponencial de una matriz. Si definimos la exponencialde una matriz cuadrada A mediante

eA =∞X

n=0

1

n!An = I + A +

1

2!A2 +

1

3!A3 + · · ·

entonces, se verifica que eA es una matriz no-singular (independientemente de A) y su inversaes la que tiene que ser (analogıa con la funcion exponencial real, y con la compleja),

e−A =∞X

n=0

(−1)n

n!An = I − A +

1

2!A2 − 1

3!A3 + · · ·

De esta forma, para cualquier vector v ∈ Rm, podemos considerar la funcion

y(t) = eAtv

que verifica que y′ = Ay puesto que

d

dt

�eAtv

�=

d

dt

��I + At +

1

2!A2t2 + · · ·

�v�

=

=�A +

1

2!A22t +

1

3!A33t2 + · · ·

�v = A

�I + At +

1

2!A2t2 + · · ·

�v = AeAtv.

Por tanto y(t) = eAtv, v ∈ Rm es la solucion general de y′ = Ay (las columnas de eAt sonsoluciones linealmente independientes, eAt es una matriz fundamental de soluciones).

En general, para calcular de manera efectiva la exponencial eA de una matriz A, hay querecurrir al calculo de autovalores y autovectores. En la situacion mas simple, cuando A esdiagonalizable, si P es una matriz de paso que diagonaliza A,

P−1AP = D =⇒ A = PDP−1 =⇒ An = PDnP−1 =⇒

⇒ eA = PeDP−1 = P

266664 eλ1 0 . . . 00 eλ2 . . . 0...

.... . .

...0 0 . . . eλm

377775P−1.


5.4.- Ejercicios. 167

5.4.- Ejercicios.

Ejercicio 1.

(1) Determina la matriz de la simetrıa respecto al plano π ≡ x + y − z = 0.

(2) Determina la matriz de la proyeccion ortogonal sobre la recta

r ≡¨

x + y − z = 0,x− y + 2z = 0.

(3) Determina la matriz de la simetrıa respecto de la recta

r ≡¨

x + y − z = 0,x− y + 2z = 0.

Ejercicio 2. Dada la matriz

A

264 3 0 a3 −1 b−2 0 c

375 .

(a) Calcula A de forma que (2, 0,−1)T sea un autovector cuyo autovalor correspondiente esλ = −1.

(b) Halla los demas autovalores y autovectores.

Ejercicio 3. Determina los valores del parametro α para los que es diagonalizable cada unade las siguientes matrices,

A =

264 1 0 0a 1 01 1 2

375 , B =

264 0 2 0−1 3 0α α + 2 1

375 , C =

264 0 −1 α2 3 −α0 0 1

375 .

Ejercicio 4. Dada la matriz

A =

264 1 0 1α −2 23 0 −1

375 , α ∈ R.

(a) Calcula los valores de α para los que A es diagonalizable.

(b) Para dichos valores de α, calcula los autovalores y los autovectores de A−1.

(c) Para dichos valores de α, calcula An, n = 1, 2, · · · .



Ejercicio 5. Estudia la diagonalizabilidad de las siguientes matrices en funcion de los pa-rametros que aparecen.

A =

264 a + 3 b 10 a 0

a2 − 1 c a + 1

375 , B =

264 5 0 00 −1 b3 0 a

375 , C =

26664 −1 0 0 0a −1 0 0b d 1 0c e f 1

37775 .

Ejercicio 6. Calcula bases de R3 formadas por autovectores y autovectores generalizadosde las siguientes matrices:

A =

264 4 −1 11 3 −10 1 1

375 , B =

264 0 1 00 0 12 −5 4

375 .

Ejercicio 7. Determina la matriz de la transformacion lineal T : x ∈ R2 −→ T (x) = Ax ∈R2 respecto de la base B = {v1, v2} siendo

A =

�1 1−1 3

�, v1 =

�11

�, v2 =

�54

�.

Ejercicio 8. Sea f : R4 → R4 la aplicacion lineal dada por f(x) = Ax, donde

A =

26664 a 1 −1 −10 b 0 −3−1 2 c 10 1 0 d

37775 .

(a) Halla A sabiendo que f(S1) = S2, donde

S1 ≡¨

x1 − x2 = 0x3 + x4 = 0

y S2 = Gen {(1,−2, 1, 1)T , (0, 3,−1,−2)T}.

(b) Prueba que A no es diagonalizable.

(c) Halla una base de R4 formada por autovectores y autovectores generalizados.

Ejercicio 9. Demuestra:

(a) Si λ es un autovalor de una matriz cuadrada A, la multiplicidad geometrica de λ comoautovalor de A y como autovalor de AT es la misma.

(b) Si A es una matriz cuadrada diagonalizable con un unico autovalor (multiple) entoncesA es una matriz diagonal.


5.4.- Ejercicios. 169

(c) Sea A una matriz diagonalizable y sea P tal que P−1AP es diagonal. Demuestra que A2

y AT son diagonalizables y calcula matrices de paso que las diagonalicen.

Ejercicio 10. Sea A la matriz

A =

26664 1 1 0 −10 2 0 0

a− 1 1 2 −a0 −a 0 a

37775 , a ∈ R.

(a) Determina los valores de a para los que A es diagonalizable.

(b) Para a = −1, diagonaliza la matriz A y calcula An, n = 1, 2, . . . ¿Es valido el resultadopara n = −1,−2, . . . ? Justifica la respuesta.

(c) Para a = −1, diagonaliza cada una de las matrices siguientes:

A5, A− 7I, AT .

Ejercicio 11. Sea B = {b1, b2, b3} una base de R3 y consideremos la matriz A definida porlas siguientes condiciones,

Ab1 = b1, Ab2 = b3 y Ab3 = b2.

(a) Comprueba que la matriz A esta bien definida.

(b) Calcula los autovalores de A.

(c) Calcula los autovectores de A expresados en funcion de la base B considerada y demues-tra que A es diagonalizable.

Ejercicio 12. Calcula la matriz

eA =∞X

n=0

An

n!= I + A +

1

2!A2 + · · · 1

n!An + · · ·

para las matrices

A1 =

264 1 −1 20 2 10 0 3

375 y A2 =

264 0 2 10 0 30 0 0

375 .

Ejercicio 13. Calcula la solucion del problema de valor inicial

¨un = Aun−1

u0

«siendo

A =

264 3 0 −110 1 −51 0 1

375 y u0 =

264 001

375 .



Ejercicio 14. Resuelve el sistema de ecuaciones diferenciales y′ = Ay para las siguientesmatrices A:

(1)

�1 14 1

�,

�1 −12 3

�.

�1 22 1

�,

�1 10 1

�,

(2)

264 1 −1 43 2 −12 1 −1

375 ,

264 5 −4 2−4 5 22 2 8

375 ,

264 1 −1 01 2 1−2 1 −1

375 .

(3)

264 −1 1 01 −2 10 1 −1

375 ,

264 1 −3 20 −1 00 −1 −2

375 ,

264 1 0 −20 1 01 −1 −1

375 .

Ejercicio 15. Resuelve el problema de valor inicial

¨y′ = Ayy(0) = y0

«para las siguientes ma-

trices A y valores iniciales y0:

(1) A =

�0 1−5 2

�, y0 =

�02

�.

(2) A =

264 3 1 −11 3 −13 3 −1

375 , y0 =

264 1−2−1

375 .

(3) A =

264 3 2 42 0 24 2 3

375 , y0 =

264 141

375.


5.5.- Apendice: MATLAB. 171

5.5.- Apendice: MATLAB.

Determinante y Traza. DET y TRACE. Dada una matriz cuadrada A al ejecutar

> det(A)

> trace(A)

se obtienen, respectivamente, el determinate y la traza de la matriz A. El comandotrace es aplicable a matrices rectangulares.

Polinomio Caracterıstico. POLY. Dada una matriz cuadrada A de orden n, al ejecutar laorden

> p = poly(A)

Matlab nos da un vector fila con n + 1 entradas p = [p1, p2, . . . , pn, pn+1] que son loscoeficientes del polinomio det (λI−A) (que es, salvo el signo, el polinomio caracterısticode la matriz A) ordenados en potencias decrecientes de λ,

det (λI −A) = p1λn + p2λ

n−1 + · · ·+ pnλ + pn+1.

Recordemos que si r es un vector, al ejecutar la orden

> p = poly(r)

Matlab nos da un vector fila cuyos elementos son los coeficientes del polinomio monicocuyas raıces son los elementos de r. Por otra parte, al ejecutar >r = roots(p) se ob-tiene un vector columna cuyos elementos son las raıces de polinomio cuyos coeficientesvienen dados por el vector fila p.

Autovalores y Autovectores. EIG. Dada una matriz cuadrada A, al ejecutar la orden

> E = eig(A)

Matlab nos da un vector cuyos elementos son los autovalores de A, repetido cada unosegun su multiplicidad (algebraica). Al ejecutar la orden

> [V,D]=eig(A)

Matlab nos da dos matrices cuadradas del mismo orden que A: una matriz diagonalD cuyos elementos diagonales son los autovalores de A (repetido cada uno segun sumultiplicidad algebraica) y una matriz V cuyas columnas son autovectores de A, aso-ciados a los correspondientes elementos diagonales de D, de forma que AV = V D.Si la matriz A es diagonalizable, la matriz V sera una matriz no-singular con lo cualtendremos una diagonalizacion de A. Si A no es diagonalizable, la expresion AV = V Dno nos dara una diagonalizacion de A puesto que V sera singular.


Tema 5.- Autovalores y autovectores. - GIA Sevilla ESI | Tu blog de apuntes de ... ·...

Documents

Transcript of Tema 5.- Autovalores y autovectores. - GIA Sevilla ESI | Tu blog de apuntes de ... ·...