Post on 04-Nov-2018
Bioestadística II
Bioestadística II
En clases anteriores hemos estudiado diseños aleatorizados a un factor (con
y sin bloqueo), introduciendo el modelo de Análisis de la Varianza
Bioestadística II
Modelo lineal de Anova a un factor
ɛij es un término que representa al error aleatorio asociado a la observación Yij
Yij es la j-ésima observación del i-ésimo tratamiento, realizada sobre cada unidad experimental
μ es la media general de las observaciones
τi es el efecto del i-ésimo tratamiento
Variable respuesta: conjunto de observaciones que se obtienen de las unidades experimentales Tratamiento: conjunto de acciones que se aplican a las unidades experimentales con el fin de observar cómo responden
Bioestadística II
ɛij es un término que representa al error aleatorio asociado a la observación Yij
Yij es la observación en
el i-ésimo tratamiento del
j-ésimo bloque
μ es la media general de las observaciones
τi es el efecto del i-ésimo tratamiento, con i=1,…,a
Modelo lineal de Anova a un factor con bloques
βj es el efecto del j-ésimo bloque, con j=1,…,b
Bioestadística II
Ahora introduciremos los
, donde se evalúan
-o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad entre los factores estudiados
Bioestadística II
El modelo para un diseño a dos factores es el siguiente
ɛij es un término
que representa al error aleatorio asociado a la observación Yij
Yij es la
respuesta al i-ésimo nivel del factor A y j-ésimo nivel de factor B
μ es la media
general de las observaciones
αi es el efecto del
i-ésimo nivel del factor A, con i=1,…,a
βj es el efecto del
j-ésimo nivel del factor B, con j=1,…,b
Bioestadística II
H0: α1 = α2 = … = αa
H1: al menos un αi es diferente a los demás
H0: β1 = β2 = … = βb
H1: al menos un βj es diferente a los demás
Hipótesis Estadísticas
Bioestadística II
Fuente de Variación
Suma de Cuadrados Grados de Libertad
Cuadrado Medio
F
Factor A SCA=
𝑎
𝑖=1
(y𝑖·)2
𝑎 -
(y··)2
𝑎𝑏 gla= a-1 CMA=
SCA
gla 𝐂𝐌𝐀
𝐂𝐌𝐄
Factor B SCB=
𝑏
𝑗=1
(y·𝑗)
2
𝑏 -
(y··)2
𝑎𝑏 glb= b-1 CMB=
SCB
glb 𝐂𝐌𝐁
𝐂𝐌𝐄
Error SCE= SCT-SCA-SCB gle= (gla)-
(glb) CME=
SCE
gld
Total SCT=
𝑎
𝑖=1
y𝑖𝑗2
𝑏
𝑘=1
- (y··)2
𝑎𝑏 glt= ab - 1
Bioestadística II
Todos los análisis de la varianza presentan los mismos supuestos para
el término correspondiente al error aleatorio:
• La varianza de los errores es constante (homogeneidad de varianzas)
• Los errores son variables aleatorias normales con esperanza cero
• Los errores (y por ende los datos) son independientes unos de otros
Supuestos del modelo
) ,0 ( I N~ 2
ij
Mediante interpretaciones gráficas y test estadísticos
pueden evaluarse los supuestos de normalidad y
homogeneidad de varianzas. Bioestadística II
Verificar la distribución normal de los errores:
• gráficamente: Q-Q plot
• Test de Shapiro-Wilk
Las hipótesis que se someten a prueba son:
H0: los residuos tienen distribución normal
H1: los residuos no tienen distribución normal
Verificar la homogeneidad de varianzas
• gráficamente: residuos vs. predichos
• Test de Levene
Las hipótesis que se someten a prueba son:
H0: σ12 = σ2
2 = … = σa2
H1: al menos dos varianzas son distintas
Supuestos del modelo
Bioestadística II
Bioestadística II
En este caso, si el investigador supone que la respuesta a dos factores no se puede explicar como la suma de sus efectos individuales, el modelo debe incluir términos que incorporen estas hipótesis
Bioestadística II
Se incorpora entonces un al modelo. Permite la partición de la variabilidad considerando los efectos de cada factor y la interacción entre ellos. El modelo correspondiente es el siguiente:
αi es el efecto del
i-ésimo nivel del factor A, con i=1,…,a
βj es el efecto del
j-ésimo nivel del factor B, con j=1,…,b
δij representa los efectos
para cada combinación de
los niveles de los factores, es
decir, la interacción entre factores
ɛijk es un término que
representa al error
aleatorio asociado a la
observación Yijk
Yijk es la respuesta de
la k-ésima repetición
de cada uno de los
tratamientos
(definidos como
todas las posibles
combinaciones de los
a niveles del factor A
con los b niveles del
factor B)
μ es la media
general de las
observaciones
Bioestadística II
H0: α1 = α2 = … = αa
H1: al menos un αi es diferente a los demás
H0: β1 = β2 = … = βb
H1: al menos un βj es diferente a los demás
Hipótesis Estadísticas
Bioestadística II
H0: δ11 = … = δa1 = δ12 =… = δ1b = … = δab
H1: al menos un δij es diferente a los demás
Bioestadística II
Todos los análisis de la varianza presentan los mismos supuestos para
el término correspondiente al error aleatorio:
• La varianza de los errores es constante (homogeneidad de varianzas)
• Los errores son variables aleatorias normales con esperanza cero
• Los errores (y por ende los datos) son independientes unos de otros
Supuestos del modelo
) ,0 ( I N~ 2
ij
Mediante interpretaciones gráficas y test estadísticos
pueden evaluarse los supuestos de normalidad y
homogeneidad de varianzas. Bioestadística II
Ejemplo de aplicación
En un estudio sobre la potencialidad forrajera de Atriplex cordobensis, un
arbusto que crece en depresiones del chaco árido argentino, se evaluó la
concentración de proteínas en hojas cosechadas en invierno y verano sobre
plantas masculinas y femeninas. Para cada combinación de sexo y estación, se
obtuvieron tres determinaciones del contenido proteico medido como
porcentaje del peso seco. Los resultados se presentan en la siguiente tabla.
Estación
Invierno Verano
Sexo
Femenino
24 17
28 18
26 16
Masculino
17 24
18 25
16 23
Análisis de la varianza
Variable N R² R² Aj CV
Conc.Prot. 12 0,93 0,91 6,30
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 198,00 3 66,00 37,71 <0,0001
Factor A 3,00 1 3,00 1,71 0,2268
Factor B 3,00 1 3,00 1,71 0,2268
Factor A*Factor B 192,00 1 192,00 109,71 <0,0001
Error 14,00 8 1,75
Total 212,00 11
Ejemplo de aplicación
A continuación se presenta la tabla correspondiente
al Análisis de la Varianza (salida de Infostat).
Ejemplo de aplicación
Se grafica aquí la media ± el
error estándar asociado de la
concentración de proteínas en
hojas de Atriplex cordobensis,
por efecto del sexo y la época
de cosecha. Se observa que los
perfiles de respuesta se cruzan
en este caso donde la
interacción resultó
significativa.
Para poner a prueba los supuestos del modelo, se solicitó al programa que guarde
los residuos. En primer lugar, esta información fue utilizada para evaluar los
supuestos mediante interpretaciones gráficas. Finalmente, se llevaron a cabo los
test estadísticos correspondientes.
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
RDUO_Conc.Prot. 12 0,00 1,13 0,94 0,6672
Ejemplo de aplicación
A continuación se detallan las
pruebas referidas a la
normalidad de los residuos
• Q-Q plot (normal)
• Test de Shapiro-Wilks
Ejemplo de aplicación
Se incluyen aquí las pruebas para
evaluar la homogeneidad de varianzas
• Gráfico de dispersión de Residuos
(RDUO_Conc.Prot.) vs. Predichos
(PRED_Conc.Prot.)
Análisis de la varianza
Variable N R² R² Aj CV
RABS_Conc.Prot. 12 0,06 0,00 87,64
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 0,33 1 0,33 0,62 0,4475
Factor A 0,33 1 0,33 0,62 0,4475
Error 5,33 10 0,53
Total 5,67 11
• Test de Levene (Anova
tomando como
variable respuesta el
valor absoluto de los
residuos,
RABS_Conc.Prot.)
Ejercicio integrador: Se desea estudiar cómo afecta la aplicación de distintas dosis de
droga sobre la concentración de cierta hormona en ratas. Dado que se trata de hormonas
esteroides, en el diseño del experimento se consideró también el sexo de las ratas
tratadas. Los resultados se encuentran en la siguiente tabla, expresados como
concentración plasmática de hormona en pg/ml . A continuación explique:
1. Cuál es la variable respuesta y cuál la unidad de observación,
cuáles son los factores y tratamientos resultantes, y cuántas
repeticiones hay por tratamiento.
2.El modelo estadístico correspondiente al diseño utilizado,
explicitando, en términos estadísticos y prácticos, cada uno
de los componentes.
3.Dócimas de hipótesis en términos estadísticos y prácticos.
4.Finalmente, ¿qué conclusiones pueden obtenerse
a partir de esta experiencia?
Actividad de cierre
Sexo
Femenino Masculino
Droga
Control
2,3 1,8
2,1 2
1,9 2,1
Dosis
mínima
2,5 2,1
3 2,6
2,3 1,9
Dosis
máxima
3,2 2,5
2,9 2,9
3,3 2,7