μ= H0 : 1 2 3 5 =μ + 20, 3 · 2009. 10. 28. · Los datos mostrados en la tabla fueron obtenidos...

6
Los datos mostrados en la tabla fueron obtenidos originalmente por el coronel La Waddell al sudeste del Tíbet. Según Morant (1923), los datos consisten en dos grupos de cráneos: grupo uno (tipo I), cráneos 1-17, encontraron en las tumbas en Sikkim y las áreas vecinas del Tíbet; el grupo dos (tipo II) compuesto por los 15 restantes cráneos recogidos en el campo de batalla en el distrito de Lhasa, y se cree que corresponden a los de los nativos soldados de la provincia oriental de Khans. Estos cráneos eran de particular interés ya que se pensaba que los tibetanos de Khans podría ser sobrevivientes de un particular tipo humano, no relacionado con los tipos de Mongolia y la India que los rodeaba. X1: mayor longitud del cráneo (longitud), X2: anchura horizontal más grande del cráneo (anchura), X3: altura del cráneo (altura), X4: altura de la cara superior (fheight), X5: amplitud frente, entre puntos extremos de los huesos de la mejilla (fbreadth). Para los cráneos de Tipo I y suponiendo normalidad: a) Testear con nivel 0.05 ) 130 , 69 , 132 , 139 , 174 ( : 0 = μ H y 5 3 5 3 2 1 0 , 20 : μ μ μ μ μ μ = + + = + H . b) Para el nivel de significación 95 . 0 = α ; buscar el mínimo número de combinaciones lineales necesarias para que el método de Hotelling proporcione intervalos de confianza de nivel simultáneo más cortos que el método de Bonferroni. c) ¿Cómo respondería las preguntas anteriores si no pudiera suponer normalidad? d) Construir intervalos de confianza simultáneos con 95 . 0 = α para 3 2 1 , μ μ μ + por ambos métodos. e) Hallar las direcciones principales y las longitudes de los ejes del elipsoide de confianza de nivel 0.95. f) Construir intervalos de confianza simultáneos de nivel 95% para todos los contrastes μ ' c . Probar que existe un c tal que 0 no pertenece al intervalo de confianza para μ ' c ; intentar hallarlo explícitamente. g) Hallar intervalos de confianza para 5 3 4 1 , μ μ μ μ utilizando tres métodos distintos. h) Testear con nivel 0.05 si las dos primeras variables son independientes de las últimas tres con el test de máxima verosimilitud, con el criterio de Wilks y con el test basado en el principio de unión intersección. Para los cráneos de Tipo I y II y suponiendo normalidad: i) Testear igualdad de matrices de covarianza entre los dos tipos de cráneos con nivel 0.01. Suponer normalidad y matrices de covarianza iguales: j) Testear si hay diferencias entre los vectores de medias de los dos tipos de cráneos. Tomar 01 . 0 = α . k) Si la hipótesis de igual vector de medias es rechazada en la parte, hallar la combinación lineal de las componentes de las medias que es más responsable del rechazo. l) Construir intervalos de confianza de nivel simultáneo 0.99 para las diferencias 5 , 4 , 3 , 2 , 1 , ) ( 2 1 = i i μ μ . ¿Cuáles aparecen como muy distintas? ll) Hacer el test de igualdad de medias sin suponer matrices de covarianzas iguales y sin suponer normalidad.

Transcript of μ= H0 : 1 2 3 5 =μ + 20, 3 · 2009. 10. 28. · Los datos mostrados en la tabla fueron obtenidos...

Page 1: μ= H0 : 1 2 3 5 =μ + 20, 3 · 2009. 10. 28. · Los datos mostrados en la tabla fueron obtenidos originalmente por el coronel La Waddell al sudeste del Tíbet. Según Morant (1923),

Los datos mostrados en la tabla fueron obtenidos originalmente por el coronel La Waddell al sudeste del Tíbet. Según Morant (1923), los datos consisten en dos grupos de cráneos: grupo uno (tipo I), cráneos 1-17, encontraron en las tumbas en Sikkim y las áreas vecinas del Tíbet; el grupo dos (tipo II) compuesto por los 15 restantes cráneos recogidos en el campo de batalla en el distrito de Lhasa, y se cree que corresponden a los de los nativos soldados de la provincia oriental de Khans. Estos cráneos eran de particular interés ya que se pensaba que los tibetanos de Khans podría ser sobrevivientes de un particular tipo humano, no relacionado con los tipos de Mongolia y la India que los rodeaba. X1: mayor longitud del cráneo (longitud), X2: anchura horizontal más grande del cráneo (anchura), X3: altura del cráneo (altura), X4: altura de la cara superior (fheight), X5: amplitud frente, entre puntos extremos de los huesos de la mejilla (fbreadth). Para los cráneos de Tipo I y suponiendo normalidad: a) Testear con nivel 0.05 )130,69,132,139,174(:0 =μH y 5353210 ,20: μμμμμμ =++=+H .

b) Para el nivel de significación 95.0=α ; buscar el mínimo número de combinaciones lineales necesarias para que el método de Hotelling proporcione intervalos de confianza de nivel simultáneo más cortos que el método de Bonferroni. c) ¿Cómo respondería las preguntas anteriores si no pudiera suponer normalidad? d) Construir intervalos de confianza simultáneos con 95.0=α para 321 , μμμ + por ambos métodos.

e) Hallar las direcciones principales y las longitudes de los ejes del elipsoide de confianza de nivel 0.95. f) Construir intervalos de confianza simultáneos de nivel 95% para todos los contrastes μ'c . Probar que existe

un c tal que 0 no pertenece al intervalo de confianza para μ'c ; intentar hallarlo explícitamente.

g) Hallar intervalos de confianza para 5341 , μμμμ −− utilizando tres métodos distintos.

h) Testear con nivel 0.05 si las dos primeras variables son independientes de las últimas tres con el test de máxima verosimilitud, con el criterio de Wilks y con el test basado en el principio de unión intersección. Para los cráneos de Tipo I y II y suponiendo normalidad: i) Testear igualdad de matrices de covarianza entre los dos tipos de cráneos con nivel 0.01. Suponer normalidad y matrices de covarianza iguales: j) Testear si hay diferencias entre los vectores de medias de los dos tipos de cráneos. Tomar 01.0=α . k) Si la hipótesis de igual vector de medias es rechazada en la parte, hallar la combinación lineal de las componentes de las medias que es más responsable del rechazo. l) Construir intervalos de confianza de nivel simultáneo 0.99 para las diferencias 5,4,3,2,1,)( 21 =− iiμμ . ¿Cuáles aparecen como muy distintas?

ll) Hacer el test de igualdad de medias sin suponer matrices de covarianzas iguales y sin suponer normalidad.

Page 2: μ= H0 : 1 2 3 5 =μ + 20, 3 · 2009. 10. 28. · Los datos mostrados en la tabla fueron obtenidos originalmente por el coronel La Waddell al sudeste del Tíbet. Según Morant (1923),

a) T2: 11.69196 PValor: 0.1970683 T2: 328.9289 PValor: 9.952406e-011 b) comp.int(5, 17, 0.05)=153 d) c(1, 0, 0, 0, 0) intBonf: 173.6263 176.0208 intHot: 172.8698 176.7772 c(0, 1, 1, 0, 0) intBonf: 269.4284 273.2775 intHot: 268.2124 274.4935 e) los autovectores son las columnas de: 0.4355173 0.4504793 0.51619696 0.3393068 -0.47518911 0.5813498 -0.1063828 -0.46777346 0.5684817 0.32974478 0.1327497 0.7798603 -0.44903283 -0.4071398 0.08247464 0.2164349 0.1051032 0.55910528 -0.1886295 0.77066820 0.6386631 -0.4080714 -0.02234917 -0.6002962 -0.25442513 Longitudes de los ejes: 25.646355 14.107989 12.998353 7.358891 4.897452 f) T2: 8959.506 PValor: 0 a=(4.8236467,-1.1773631,0.5225442,-5.3239406) c=(4.8236467,-1.1773631,0.5225442,-5.3239406,-1.1551128) Intervalo de confianza usando a de nivel simultáneo 0.95 para todos los contrastes:[521.9399,532.1197]. g) Bonferroni-Todos los contrastes-Hotelling: [104.16; 105.83] [-0.12; 3.41] [103.95; 106.04] [-0.56; 3.85] [103.63; 106.36] [-1.24; 4.53] h) Cociente de verosimilitud estadistico=34.46168 gl = 6 chi = qchisq(0.95, gl)=12.59159 pvalor = 1 - pchisq(estadistico, gl)=5.478104e-006 Criterio de wilks A = Q22 - Q21 %*% solve(Q11) %*% Q12 B = Q21 %*% solve(Q11) %*% Q12 A+B = Q22 n = 17 p1 = 2 p2 = 3 estad2WILKS = det(A)/det(A+B)= 0.1317094 N = 17 p = 3 estad22=(((N - p - 1)/p) * (1 - sqrt(estad2WILKS)))/sqrt(estad2WILKS)=7.606925 gl1 = 2 * p gl2 = 2 * (N - p - 1) qf(0.95, gl1, gl2)= 2.474109 pvalor = 1 - pf(estadistico22, gl1, gl2)= 0.00008756015

Max autovalor de H(E+H)^(-1) eigen(Q21 %*% solve(Q11) %*% Q12 %*% solve(Q22))$values 7.067726e-001 5.508285e-001 6.742835e-018 p1 = 2 p2 = 3 s = 2 n = 17 v1 = 0.5 * (abs(p2 - p1) - 1)=0 v2 = 0.5 * (n - p1 - p2 - 1)=5.5 mayor autovalor > valor de tabla ~ 0.5.... RECHAZAMOS EN LOS TRES CASOS. i) n1 = 17 n2 = 15 n = n1 + n2 estad = 23.89015 gl = 15 chi = qchisq(0.99, gl)= 30.5779 pvalor = 1 - pchisq(estad, gl)= 0.06698262 j) Por Hotelling (que coincide con max verosim (wilks) y princ unión-int) T2: 27.90211 PValor: 0.002936228 Por Wilks y demás estadísticos (ver el otro ejercicio): tibet.manova<-manova(cbind(Z[, 1], Z[, 2], Z[, 3], Z[, 4], Z[, 5]) ~ Data) summary(tibet.manova)$Stats Statistic pillai wilks hotelling-lawley roy largest Data 0.4818842 0.5181158 0.9300704 0.9300704 P-value pillai wilks hotelling-lawley roy largest Data 0.002936228 0.002936228 0.002936228 0.002936228 PARA N=2 TODOS COINCIDEN. k) a=(-0.089306, 0.155774, 0.005231, -0.177194,-0.177408) l) -20.12199 -1.697615 -7.711127 8.950342 *** -9.981532 4.448199 *** -11.77403 -1.512238 -15.07405 0.779935 *** ll) T2: 27.89255 PValor: 0.00003820209

Page 3: μ= H0 : 1 2 3 5 =μ + 20, 3 · 2009. 10. 28. · Los datos mostrados en la tabla fueron obtenidos originalmente por el coronel La Waddell al sudeste del Tíbet. Según Morant (1923),
Page 4: μ= H0 : 1 2 3 5 =μ + 20, 3 · 2009. 10. 28. · Los datos mostrados en la tabla fueron obtenidos originalmente por el coronel La Waddell al sudeste del Tíbet. Según Morant (1923),
Page 5: μ= H0 : 1 2 3 5 =μ + 20, 3 · 2009. 10. 28. · Los datos mostrados en la tabla fueron obtenidos originalmente por el coronel La Waddell al sudeste del Tíbet. Según Morant (1923),

SPLUS epocas<-as.factor(c(1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,

2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5))

MB<-c(131., 125., 131., 119., 136., 138., 139., 125., 131., 134., 129., 134., 126., 132., 141., 131., 135., 132., 139., 132., 126., 135., 134., 128., 130., 138., 128., 127., 131.,

124., 124., 133., 138., 148., 126., 135., 132., 133., 131., 133., 133., 131., 131., 138., 130., 131., 138., 123., 130., 134., 137., 126., 135., 129., 134., 131., 132., 130., 135., 130., 137., 129., 132., 130., 134., 140., 138., 136., 136., 126., 137., 137., 136., 137., 129., 135., 129., 134., 138., 136., 132., 133., 138., 130., 136., 134., 136., 133., 138., 138., 137., 141., 141., 135., 133., 131., 140., 139., 140., 138., 132., 134., 135., 133., 136., 134., 131., 129., 136., 131., 139., 144., 141., 130., 133., 138., 131., 136., 132., 135., 137., 136., 128., 130., 138., 126., 136., 126., 132., 139., 143., 141., 135., 137., 142., 139., 138., 137., 133., 145., 138., 131., 143., 134., 132., 137., 129., 140., 147., 136.)

BH<-c(138., 131., 132., 132., 143., 137., 130., 136., 134., 134., 138., 121., 129., 136., 140., 134., 137., 133., 136., 131., 133., 135., 124., 134., 130., 135., 132., 129., 136.,

138., 138., 134., 134., 129., 124., 136., 145., 130., 134., 125., 136., 139., 136., 134., 136., 128., 129., 131., 129., 130., 136., 131., 136., 126., 139., 134., 130., 132., 132., 128., 141., 133., 138., 134., 134., 133., 138., 145., 131., 136., 129., 139., 126., 133., 142., 138., 135., 125., 134., 135., 130., 131., 137., 127., 133., 123., 137., 131., 133., 133., 134., 128., 130., 131., 120., 135., 137., 130., 134., 140., 133., 134., 135., 136., 130., 137., 141., 135., 128., 125., 130., 124., 131., 131., 128., 126., 142., 138., 136., 130., 123., 131., 126., 134., 127., 138., 138., 126., 132., 135., 120., 136., 135., 134., 135., 134., 125., 135., 125., 129., 136., 129., 126., 124., 127., 125., 128., 135., 129., 133.)

basialiveolar.longitud.BL<-c(89., 92., 99., 96., 100., 89., 108., 93., 102., 99., 95., 95., 109., 100., 100., 97., 103., 93., 96., 101., 102., 103., 93., 103., 104., 100., 93., 106.,

114., 101., 101., 97., 98., 104., 95., 98., 100., 102., 96., 94., 103., 98., 99., 98., 104., 98., 107., 101., 105., 93., 106., 100., 97., 91., 101., 90., 104., 93., 98., 101., 96., 93., 87., 106., 96., 98., 95., 99., 92., 95., 100., 97., 101., 90., 104., 102., 92., 90., 96., 94., 91., 100., 94., 99., 91., 95., 101., 96., 100., 91., 107., 95., 87., 99., 91., 90., 94., 90., 90., 100., 90., 97., 99., 95., 99., 93., 99., 95., 93., 88., 94., 86., 97., 98., 92., 97., 95., 94., 92., 100., 91., 95., 91., 92., 86., 101., 97., 92., 99., 92., 95., 101., 95., 93., 96., 95., 99., 96., 92., 89., 92., 97., 88., 91., 97., 85., 81., 103., 87., 97.)

altura.nariz.NH<-c(49., 48., 50., 44., 54., 56., 48., 48., 51., 51., 50., 53., 51., 50., 51., 54., 50., 53., 50., 49., 51., 47., 53., 50., 49., 55., 53., 48., 54., 46., 48., 48.,

45., 51., 45., 52., 54., 48., 50., 46., 53., 51., 56., 49., 53., 45., 53., 51., 47., 54., 49., 48., 52., 50., 49., 53., 50., 52., 54., 51., 52., 47., 48., 50., 45., 50., 47., 55., 46., 56., 53., 50., 50., 49., 47., 55., 50., 60., 51., 53., 52., 50., 51., 45., 49., 52., 54., 49., 55., 46., 54., 53., 49., 51., 46., 50., 60., 48., 51., 52., 53., 54., 50., 52., 55., 52., 55., 47., 54., 48., 53., 50., 53., 53., 51., 54., 53., 55., 52., 51., 50., 49., 57., 52., 47., 52., 58., 45., 55., 54., 51., 54., 56., 53., 52., 47., 51., 54., 50., 47., 46., 44., 54., 55., 52., 57., 52., 48., 48., 51.)

craneos.manova <-manova(cbind(MB, BH, basialiveolar.longitud.BL, altura.nariz.NH)~epocas) summary(craneos.manova, test = "pillai") summary(craneos.manova, test = "wilks") summary(craneos.manova, test = "hotelling-lawley") summary(craneos.manova, test = "roy largest") > summary(craneos.manova, test = "pillai") Df Pillai Trace approx. F num df den df P-value epocas 4 0.3533 3.512 16 580 0 Residuals 145 > summary(craneos.manova, test = "wilks") Df Wilks Lambda approx. F num df den df P-value epocas 4 0.6636 3.9009 16 434.4548 0 Residuals 145 > summary(craneos.manova, test = "hotelling-lawley") Df Hotelling-Lawley approx. F num df den df P-value epocas 4 0.4818 4.231 16 562 0 Residuals 145 > summary(craneos.manova, test = "roy largest") Df Roy Largest approx. F num df den df P-value epocas 4 0.4251 15.4097 4 145 0 Residuals 145

Page 6: μ= H0 : 1 2 3 5 =μ + 20, 3 · 2009. 10. 28. · Los datos mostrados en la tabla fueron obtenidos originalmente por el coronel La Waddell al sudeste del Tíbet. Según Morant (1923),

> names(summary(craneos.manova)) [1] "row.names" "SS" "Df" "Eigen.values" "Stats" "test" > summary(craneos.manova)$Stats , , Statistic pillai wilks lambda hotelling-lawley roy largest epocas 0.3533056 0.6635858 0.4818191 0.4250954 , , approx. F pillai wilks lambda hotelling-lawley roy largest epocas 3.512037 3.900928 4.230974 15.40971 , , num df pillai wilks lambda hotelling-lawley roy largest epocas 16 16 16 4 , , den df pillai wilks lambda hotelling-lawley roy largest epocas 580 434.4548 562 145 , , P-value pillai wilks lambda hotelling-lawley roy largest epocas 4.6753e-006 7.010193e-007 8.278211e-008 1.58828e-010

el único cambio en R: nombre de los tests summary(craneos.manova, test = "Pillai") summary(craneos.manova, test = "Wilks") summary(craneos.manova, test = "Hotelling-Lawley") summary(craneos.manova, test = "Roy") > summary(craneos.manova, test = "Pillai") Df Pillai approx F num Df den Df Pr(>F) epocas 4 0.3533 3.5120 16 580 4.675e-06 Residuals 145 > summary(craneos.manova, test = "Wilks") Df Wilks approx F num Df den Df Pr(>F) epocas 4.00 0.6636 3.9009 16.00 434.45 7.01e-07 Residuals 145.00 > summary(craneos.manova, test = "Hotelling-Lawley") Df Hotelling-Lawley approx F num Df den Df Pr(>F) epocas 4 0.4818 4.2310 16 562 8.278e-08 Residuals 145 > summary(craneos.manova, test = "Roy") Df Roy approx F num Df den Df Pr(>F) epocas 4 0.4251 15.4097 4 145 1.588e-10 Residuals 145

Obs: Hay fuerte evidencia que los vectores de medias difieren en las cinco épocas. Supusimos que las observaciones tienen distribución normal multivariada e igual matriz de covarianza.