Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados...

Bioestadística II

En clases anteriores hemos estudiado diseños aleatorizados a un factor (con

y sin bloqueo), introduciendo el modelo de Análisis de la Varianza

Bioestadística II

Modelo lineal de Anova a un factor

ɛij es un término que representa al error aleatorio asociado a la observación Yij

Yij es la j-ésima observación del i-ésimo tratamiento, realizada sobre cada unidad experimental

μ es la media general de las observaciones

τi es el efecto del i-ésimo tratamiento

Variable respuesta: conjunto de observaciones que se obtienen de las unidades experimentales Tratamiento: conjunto de acciones que se aplican a las unidades experimentales con el fin de observar cómo responden

Bioestadística II

ɛij es un término que representa al error aleatorio asociado a la observación Yij

Yij es la observación en

el i-ésimo tratamiento del

j-ésimo bloque

μ es la media general de las observaciones

τi es el efecto del i-ésimo tratamiento, con i=1,…,a

Modelo lineal de Anova a un factor con bloques

βj es el efecto del j-ésimo bloque, con j=1,…,b

Bioestadística II

Ahora introduciremos los

, donde se evalúan

-o más- aplicados a las mismas unidades de observación. En este caso, se asume el supuesto de aditividad entre los factores estudiados

Bioestadística II

El modelo para un diseño a dos factores es el siguiente

ɛij es un término

que representa al error aleatorio asociado a la observación Yij

Yij es la

respuesta al i-ésimo nivel del factor A y j-ésimo nivel de factor B

μ es la media

general de las observaciones

αi es el efecto del

i-ésimo nivel del factor A, con i=1,…,a

βj es el efecto del

j-ésimo nivel del factor B, con j=1,…,b

Bioestadística II

H0: α1 = α2 = … = αa

H1: al menos un αi es diferente a los demás

H0: β1 = β2 = … = βb

H1: al menos un βj es diferente a los demás

Hipótesis Estadísticas

Bioestadística II

Fuente de Variación

Suma de Cuadrados Grados de Libertad

Cuadrado Medio

Factor A SCA=

𝑖=1

(y𝑖·)2

𝑎 -

(y··)2

𝑎𝑏 gla= a-1 CMA=

gla 𝐂𝐌𝐀

𝐂𝐌𝐄

Factor B SCB=

𝑗=1

(y·𝑗)

𝑏 -

(y··)2

𝑎𝑏 glb= b-1 CMB=

glb 𝐂𝐌𝐁

𝐂𝐌𝐄

Error SCE= SCT-SCA-SCB gle= (gla)-

(glb) CME=

Total SCT=

𝑖=1

y𝑖𝑗2

𝑘=1

- (y··)2

𝑎𝑏 glt= ab - 1

Bioestadística II

Todos los análisis de la varianza presentan los mismos supuestos para

el término correspondiente al error aleatorio:

• La varianza de los errores es constante (homogeneidad de varianzas)

• Los errores son variables aleatorias normales con esperanza cero

• Los errores (y por ende los datos) son independientes unos de otros

Supuestos del modelo

) ,0 ( I N~ 2

Mediante interpretaciones gráficas y test estadísticos

pueden evaluarse los supuestos de normalidad y

homogeneidad de varianzas. Bioestadística II

Verificar la distribución normal de los errores:

• gráficamente: Q-Q plot

• Test de Shapiro-Wilk

Las hipótesis que se someten a prueba son:

H0: los residuos tienen distribución normal

H1: los residuos no tienen distribución normal

Verificar la homogeneidad de varianzas

• gráficamente: residuos vs. predichos

• Test de Levene

Las hipótesis que se someten a prueba son:

H0: σ12 = σ2

2 = … = σa2

H1: al menos dos varianzas son distintas

Bioestadística II

En este caso, si el investigador supone que la respuesta a dos factores no se puede explicar como la suma de sus efectos individuales, el modelo debe incluir términos que incorporen estas hipótesis

Bioestadística II

Se incorpora entonces un al modelo. Permite la partición de la variabilidad considerando los efectos de cada factor y la interacción entre ellos. El modelo correspondiente es el siguiente:

αi es el efecto del

i-ésimo nivel del factor A, con i=1,…,a

βj es el efecto del

j-ésimo nivel del factor B, con j=1,…,b

δij representa los efectos

para cada combinación de

los niveles de los factores, es

decir, la interacción entre factores

ɛijk es un término que

representa al error

aleatorio asociado a la

observación Yijk

Yijk es la respuesta de

la k-ésima repetición

de cada uno de los

tratamientos

(definidos como

todas las posibles

combinaciones de los

a niveles del factor A

con los b niveles del

factor B)

μ es la media

general de las

observaciones

Bioestadística II

H0: α1 = α2 = … = αa

H1: al menos un αi es diferente a los demás

H0: β1 = β2 = … = βb

H1: al menos un βj es diferente a los demás

Hipótesis Estadísticas

Bioestadística II

H0: δ11 = … = δa1 = δ12 =… = δ1b = … = δab

H1: al menos un δij es diferente a los demás

Bioestadística II

Todos los análisis de la varianza presentan los mismos supuestos para

el término correspondiente al error aleatorio:

• La varianza de los errores es constante (homogeneidad de varianzas)

• Los errores son variables aleatorias normales con esperanza cero

• Los errores (y por ende los datos) son independientes unos de otros

) ,0 ( I N~ 2

Mediante interpretaciones gráficas y test estadísticos

pueden evaluarse los supuestos de normalidad y

homogeneidad de varianzas. Bioestadística II

Ejemplo de aplicación

En un estudio sobre la potencialidad forrajera de Atriplex cordobensis, un

arbusto que crece en depresiones del chaco árido argentino, se evaluó la

concentración de proteínas en hojas cosechadas en invierno y verano sobre

plantas masculinas y femeninas. Para cada combinación de sexo y estación, se

obtuvieron tres determinaciones del contenido proteico medido como

porcentaje del peso seco. Los resultados se presentan en la siguiente tabla.

Estación

Invierno Verano

Femenino

Masculino

Análisis de la varianza

Variable N R² R² Aj CV

Conc.Prot. 12 0,93 0,91 6,30

Cuadro de Análisis de la Varianza (SC tipo III)

F.V. SC gl CM F p-valor

Modelo 198,00 3 66,00 37,71 <0,0001

Factor A 3,00 1 3,00 1,71 0,2268

Factor B 3,00 1 3,00 1,71 0,2268

Factor A*Factor B 192,00 1 192,00 109,71 <0,0001

Error 14,00 8 1,75

Total 212,00 11

A continuación se presenta la tabla correspondiente

al Análisis de la Varianza (salida de Infostat).

Se grafica aquí la media ± el

error estándar asociado de la

concentración de proteínas en

hojas de Atriplex cordobensis,

por efecto del sexo y la época

de cosecha. Se observa que los

perfiles de respuesta se cruzan

en este caso donde la

interacción resultó

significativa.

Para poner a prueba los supuestos del modelo, se solicitó al programa que guarde

los residuos. En primer lugar, esta información fue utilizada para evaluar los

supuestos mediante interpretaciones gráficas. Finalmente, se llevaron a cabo los

test estadísticos correspondientes.

Shapiro-Wilks (modificado)

Variable n Media D.E. W* p (una cola)

RDUO_Conc.Prot. 12 0,00 1,13 0,94 0,6672

A continuación se detallan las

pruebas referidas a la

normalidad de los residuos

• Q-Q plot (normal)

• Test de Shapiro-Wilks

Se incluyen aquí las pruebas para

evaluar la homogeneidad de varianzas

• Gráfico de dispersión de Residuos

(RDUO_Conc.Prot.) vs. Predichos

(PRED_Conc.Prot.)

Análisis de la varianza

Variable N R² R² Aj CV

RABS_Conc.Prot. 12 0,06 0,00 87,64

Cuadro de Análisis de la Varianza (SC tipo III)

F.V. SC gl CM F p-valor

Modelo 0,33 1 0,33 0,62 0,4475

Factor A 0,33 1 0,33 0,62 0,4475

Error 5,33 10 0,53

Total 5,67 11

• Test de Levene (Anova

tomando como

variable respuesta el

valor absoluto de los

residuos,

RABS_Conc.Prot.)

Ejercicio integrador: Se desea estudiar cómo afecta la aplicación de distintas dosis de

droga sobre la concentración de cierta hormona en ratas. Dado que se trata de hormonas

esteroides, en el diseño del experimento se consideró también el sexo de las ratas

tratadas. Los resultados se encuentran en la siguiente tabla, expresados como

concentración plasmática de hormona en pg/ml . A continuación explique:

1. Cuál es la variable respuesta y cuál la unidad de observación,

cuáles son los factores y tratamientos resultantes, y cuántas

repeticiones hay por tratamiento.

2.El modelo estadístico correspondiente al diseño utilizado,

explicitando, en términos estadísticos y prácticos, cada uno

de los componentes.

3.Dócimas de hipótesis en términos estadísticos y prácticos.

4.Finalmente, ¿qué conclusiones pueden obtenerse

a partir de esta experiencia?

Actividad de cierre

Femenino Masculino

Control

2,3 1,8

1,9 2,1

mínima

2,5 2,1

2,3 1,9

máxima

3,2 2,5

2,9 2,9

3,3 2,7

Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados...

Documents

Transcript of Tema 5: Modelos probabilísticos · Ahora introduciremos los , donde se evalúan -o más- aplicados...

Capítulo 2 Magnitudes Logarítmicaspersonales.unican.es/perezvr/pdf/CH2ST_Web.pdf · En este capitulo introduciremos algunos conceptos muy utilizados en los sistemas ... 2 × 2 ×

CAPÍTULO 2 METODOS PROBABILÍSTICOS - …catarina.udlap.mx/u_dl_a/tales/documentos/msp/de_l_ea/capitulo2.pdf · METODOS PROBABILÍSTICOS ... espacio de trabajo. ... inicial s y una

Bioinformática: Fundamentos y aplicaciones de actualidad Curso de verano 2005 Revisión de algunos modelos probabilísticos de evolución genética (Procesos.

Modelos Probabilísticos: Aplicación al Reconocimiento Automático del Habla

Universidad Abierta Interamericana - imgbiblio.vaneduc.edu.arimgbiblio.vaneduc.edu.ar/fulltext/files/TC098751.pdf · Tutor: Oscar ... Compra de un put ... Introduciremos al trabajo

Análisis comparativo de métodos probabilísticos y ...

Métodos probabilísticos de pronóstico de la mortalidad y ...

RÚBRICA MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES … · problemas en contextos reales (numéricos, funcionales, estadísticos o probabilísticos), realizando los cálculos

Sobre la invarianza y coinvarianza de la T-aditividad de ...

Simulación de problemas probabilísticos

Modelos Probabilísticos para el Seguimiento de Objetos en ...

Los pronósticos probabilísticos: algunas cuestiones generales

RÚBRICA MATEMÁTICAS - 1.º BACHILLERATO · problemas en contextos reales (numéricos, geométricos, funcionales, estadísticos o probabilísticos), realizando los cálculos necesarios,

Métodos de Análisis Probabilísticos

análisis comparativo de métodos probabilísticos y determinísticos ...

Modelos de inventarios probabilísticos

Modulo actualizado Métodos probabilísticos-2012

Fiabilidad Humana en los Análisis Probabilísticos de ...

UNIDAD 4 Modelos Probabilísticos Variable Discreta

CAPÍTULO 2. MODELOS PROBABILÍSTICOS.