Download - Diseno Bloques Completo Randomizado

Diseo de Bloques Completos Randomizado

Un diseo de Bloques Completos Randomizado es aquel cumple con las siguientes

condiciones:

1) Las unidades experimentales se distribuyen en grupos o bloques, de manera tal que las unidades experimentales dentro de cada bloque sean relativamente homogneas

y que el nmero de unidades experimentales dentro de un bloque sea igual al

nmero de tratamientos por investigar; y

2) Los tratamientos se asignan al azar a las unidades experimentales dentro de cada bloque.

Ejemplo

En los experimentos agrcolas, los bloques puede estar constituido por grupos de parcelas

relativamente homogneas que puede ser agrupados de acuerdo a gradiente de fertilidad,

otro porque se encuentra en una pendiente.

Ventajas

Este diseo tiene muchas ventajas, tales como

1.- En general es posible agrupar las unidades experimentales de modo que se logre mayor

precisin con respecto a un Diseo completamente al azar

2.- La nica restriccin sobre el nmero de tratamiento por bloque y tratamiento es la

disponibilidad de unidades experimentales

3.- Si se pierde informacin de todo un bloque o por contratiempo los datos de un bloque

completo es inutilizable estos datos puede omitirse, porque el resto mantiene la misma

estructura de un diseo de bloques completos al azar.

4.- Si se pierde informacin de algunas de las unidades estas puede estimarse.

Modelo Aditivo Lineal

El modelo aditivo Lineal del Diseo de Bloques Completo al Azar con una observacin por

unidad experimental, La observacin ijY puede representarse por el modelo siguiente:

ij i j ijY ; 1, 2, ,i t y 1, 2, ,j b

donde:

ijY : es la respuesta obtenida de la unidad experimental del j -simo bloque sujeta al

tratamiento i .

: El efecto de la media comn.

i : El verdadero efecto del i -simo tratamiento.

j : El verdadero efecto del j -simo bloque.

ij : Es una variable aleatoria no observable llamado error

Para el proceso de inferencia se asume que ij es una variable aleatoria independiente que

se distribuye normalmente con media cero y variancia comn 2 .

Modelo I (efectos fijos)

Se asume que los niveles de los factores son fijados por el investigador y estos efectos son

desviaciones con respecto a la media. Entonces se cumple:

1

0t

i

i

, 1

0b

j

j

Modelo II (efectos aleatorios)

Los niveles de los factores son elegidos aleatoriamente de poblaciones grandes. Entonces

los i son variables aleatorias independientes distribuidas normalmente con media cero y

variancia 2 , los j son variables aleatorias independientes distribuidas normalmente con

media cero y variancia 2 ,

Modelo III (Modelo mixto)

Los niveles de los tratamientos son fijados por el investigador y los niveles de los bloques

son elegidos al azar en este caso se cumple que

1

0t

i

i

;

y los j son variables aleatorias independientes distribuidas normalmente con media cero y

variancia 2 ,

Cuadro de Datos

Bloques

tratamientos 1 2 b Total

1 11Y 12Y 1bY 1Y

2 21Y 22Y 2bY 2Y

t

1tY 2tY tbY tY

Total 1Y 2Y 2Y Y

Donde : 1

b

i ij

j

Y Y

, para 1, 2, ,i t ; 1

t

j ij

i

Y Y

, para 1, 2, ,j b ;

1 1

t b

ij

i j

Y Y

Estimacin de Parmetro para el Modelo I

Los estimadores de los parmetros pueden ser encontrados aplicando el mtodo de los

mnimos cuadrados. Con este mtodo se obtiene:

1 1

1

t b

ij

i j

YY Y

tb tb

; i iY Y , para 1, 2, ,i t ;

j jY Y , para 1, 2, ,j b

Siendo:

1

b

ij

jii

YY

Yb b

, 1

t

ijj i

j

YY

Yt t

Residual o residuo

ij ij i je Y Y Y Y

ANLISIS DE VARIANCIA

La variacin total puede ser descompuesta de la siguiente forma:

2 2 2 2

1 1 1 1 1 1 1 1

( ) ( ) ( ) ( )t b t b t b t b

ij i j ij i j

i j i j i j i j

Y Y Y Y Y Y Y Y Y Y

donde:

2

2 2

1 1 1 1

( )ij

t b t b

ij

i j i j

YSCTotal Y Y Y

bt

es la medida de la variacin total.

2 2

2

1 1 1

( )t b t

ii

i j i

Y YSCTrat Y Y

b bt

es una medida de la variacin entre

tratamientos.

2 22

1 1 1

( )t b b

j

j

i j j

Y YSCBloq Y Y

t tb

es una medida de la variacin existente

entre bloques

2

1 1

( )t b

ij i j

i j

SCE Y Y Y Y SCTotal SCTrat SCBloq

, es la variacin

debido a otros factores no considerados en el

modelo.

Cuadrados Medios

Los cuadrados Medios se definen como el cociente entre la suma de los cuadrados y sus

respectivos grados de libertad:

1

SCBloqCMBloq

b

,

1

SCTratCMTrat

t

,

1 1SCE

CMEb t

Luego, se tiene el siguiente cuadro de ANVA

Fuente de

Variacin

SC GL CM Cuadrados Medios Esperados

Modelo I Modelo II

Bloques SCBloq b-1 CMBloq 2 2

11

b

j

j

t

b

2 2t

Tratamientos SCTrat t-1 CMTrat 2 2

11

t

i

i

b

t

2 2b

Error SCE (b-1)(t-1) CME 2 2 Total SCTotal bt-1

Prueba de Hiptesis (Modelo I)

1 2: 0p tH El cual es equivalente 1 2:p tH

: 0a iH , para al menos un i : al menos dos a iH son diferentes

Nivel de Significacin

1, 1 1~ / si la Hp es ciertac t b t

CMTratF F

CME

Nota: Como los bloques son fijados y no cumple con el principio de aleatorizacin no se

puede realizar pruebas de hiptesis sobre los efectos de bloques. En lugar de esto se puede

encontrar eficiencia relativa respecto a un diseo completamente al azar, el cual se define:

( 1)

1

SCBloq b t CME

tbERCME

Si 1ER entonces el Diseo de Bloques Completos al Azar es ms eficiente que un Diseo Completamente al azar.

Ejemplo: Se llev a cabo un experimento para sealar los mritos de 5 gasolinas. Debido a

que es inevitable la variacin en eficiencia de vehculo a vehculo, la prueba se realiz un

experimento con 5 automviles, que de aqu en adelante llamaremos bloques. Se dispone de

las siguientes descripciones de las 5 gasolinas:

A: Control

B: Control + aditivo X elaborado por la compaa I

C: Control + aditivo Y elaborado por la compaa I

D: Control + aditivo U elaborado por la compaa II

E: Control + aditivo V elaborado por la compaa II

Los tipos de gasolinas fueron probadas en cada carro en orden aleatorio. Los datos, en

Km/litros, se dan continuacin:

Bloques (vehculo)

Tratamiento

Gasolina

1 2 3 4 5 Total

A 8 7 6 6 7 34

B 10 9 8 7 9 43

C 8 8 9 9 10 44

D 9 8 8 8 7 40

E 10 9 8 7 9 43

Total 45 41 39 37 42 204

Modelo Aditivo Lineal:

ij i j ijY ; 1, 2, 3, 4 y 5i y 1, 2, 3, 4 y 5j

Donde:

ijY : es rendimiento en Km/litro obtenido del j -simo vehculo con el

i -simo tipo de de gasolina.

: El efecto de la media comn.

i : El verdadero efecto del i -simo tipo de gaslina

j : El verdadero efecto del j -simo vehculo.

ij : Son los efectos no observado del j-simo vehculo con el i-simo tipo de

gasolina llamado error

Ejemplo de clculo de algunos efectos estimado y residual

1 1

34 204 1.36

5 25Y Y

2 2

41 204 0.045 25

Y Y

12 12 1 2 7 6.8 8.2 8.16 0.16e Y Y Y Y

Cuadro de ANVA

5 5

2 2 2 2

1 1

8 7 9 1696iji j

Y

, 5

2 2 2 2

1

34 43 43 8390ii

Y

,

52 2 2 2

1

45 41 42 8360jj

Y

22 2

1

20483607.36

5 25

bj

j

Y YSCBloq

t tb

22 2

1

204839013.36

5 25

ti

i

Y YSCTrat

b bt

22

2

1 1

2041696 31.36

25ij

t b

i j

YSCTotal Y

bt

31.36 7.36 13.36 10.64SCE SCTotal SCTrat SCBloq

Fuente de

Variacin

SC GL CM Fc

Carros 7.36 4 1.84

Gasolinas 13.36 4 3.34 5.0226

Error 10.64 16 0.665

Total 31.36 24

1 2 3 4 5:pH

: al menos dos a iH son diferentes

0.05

3.345.0226

0.665c

CMTratF

CME

0.95,4,4 3.01F , como 0.95,4,4cF F , se rechaza la pH .

gasolina

la variancia de i lY Y , para i l y , 1, 2, ,i l t , est dado por:

22

var i lY Yb

y su estimado est dado por

2 2i lY Y

CMES

b

Prueba de t

Hiptesis

Caso A Bilateral Caso B Unilateral a la Derecha Caso C Unilateral a La Izquierda

:

:

p i l

a i l

H k

H k

:

:

p i l

a i l

H k

H k

:

:

p i l

a i l

H k

H k

Para i l ; , 1, 2, ,i l t

Nivel de significacin

Estadstica de prueba:

~ /

i l

i lc pgle

Y Y

Y Y kt t H

S

es verdadera

Decisin Caso A Caso B Caso C

Se Acepta pH , 1 ,

2 2

cgle gle

t t t

1 ;c glet t ;c glet t

Se Rechaza pH , 1 ,

2 2

c cgle gle

t t t t

1 ;c glet t ;c glet t

Diferencia Mnima de Significacin (DMS), tambin se le conoce con el nombre de

diferencia lmite de significacin

:p i lH

:a i lH

Para i l , , 1, 2, ,i l t


Entonces si definimos

1 ,

2

,i lY YGLE

DMS i l t S

Luego, un criterio para examinar si existe diferencia significativa entre medias de

tratamiento se puede usar este criterio de la diferencia mnima significante ,DMS i l . Esto es, se rechaza 0H si

,i lY Y DMS i l

Para i l , , 1, 2, ,i l t

Ejemplo: Con los datos del ejemplo de gasolina, suponga que fue planeado realizar la

comparacin entre la gasolina D y E. Realice la prueba de t aun nivel de significacin

0.05 , para realizar esta comparacin

Las medias de los rendimientos est dado por:

6.8AY , 8.6BY , 8.8CY , 8.0DY , 8.6EY

: o : 0p D E p D EH H

: o : 0a D E a D EH H

0.05 0.975,16 2.22T , 2 2 0.6652 0.266

5D EY Y

CMES

b

8 8.6 0-1.16335

0.266D E

D Ec

Y Y

Y Y kt

S

. Se acepta pH

Con lenguaje R

> gasolina str(gasolina)

'data.frame': 25 obs. of 3 variables:

$ rendimiento: int 8 10 8 9 10 7 9 8 8 9 ...

$ bloques : int 1 1 1 1 1 2 2 2 2 2 ...

$ aditivo : Factor w/ 5 levels "a","b","c","d",..: 1 2 3 4 5 1 2 3 4

5 ...

> rendimiento vehiculo tipos mediaD

> mediaE esdmedia esdmedia

a

0.5157519

> tc tc

d

-1.16335

> pvalue pvalue

d

0.2617441

Se acepta Hp

Prueba de Tukey-Cramer (Tukey HSD)

Planteamiento de hiptesis

:p i lH

:a i lH Para i l , , 1, 2, ,i l t


Clculo del Valor Crtico:

1

,2 i l

Y Yw q t GLE S

donde:

,q t GLE =amplitud estudiantizada para la prueba de Tukey t = nmero de tratamiento a comparar

GLE = Grados de libertad del error

Se rechaza 0H aun nivel de significacin , si

i lY Y w

Ejemplo: Con los datos del ejemplo de gasolina, realice la prueba de Tukey a un nivel de

significacin 0.05 , para realizar esta comparacin

:p i iH

:a i iH para , , , , , , i i A B C D E i i

0.05 ,

0.95,5,16 4.33q 0.665CME

0.665

0.95,5,16 4.33 1.57915 5

CMEw q

Comparacin i iY Y i lY YS w Significancia

B-A 1.8 0.5157519 1.579115 significativo

C-A 2 0.5157519 1.579115 significativo

D-A 1.2 0.5157519 1.579115 No significativo

E-A 1.8 0.5157519 1.579115 significativo

C-B 0.2 0.5157519 1.579115 No significativo

D-B 0.6 0.5157519 1.579115 No significativo

E-B 0 0.5157519 1.579115 No significativo

D-C 0.8 0.5157519 1.579115 No significativo

E-C 0.2 0.5157519 1.579115 No significativo

E-D 0.6 0.5157519 1.579115 No significativo

> library(multcomp)

> amod comptipos confint(comptipos)

Simultaneous Confidence Intervals

Multiple Comparisons of Means: Tukey Contrasts

Fit: aov(formula = rendimiento ~ vehiculo + tipos)

Estimated Quantile = 3.0637

95% family-wise confidence level

Linear Hypotheses:

Estimate lwr upr

b - a == 0 1.8000 0.2199 3.3801

c - a == 0 2.0000 0.4199 3.5801

d - a == 0 1.2000 -0.3801 2.7801

e - a == 0 1.8000 0.2199 3.3801

c - b == 0 0.2000 -1.3801 1.7801

d - b == 0 -0.6000 -2.1801 0.9801

e - b == 0 0.0000 -1.5801 1.5801

d - c == 0 -0.8000 -2.3801 0.7801

e - c == 0 -0.2000 -1.7801 1.3801

e - d == 0 0.6000 -0.9801 2.1801

> summary(comptipos)

Simultaneous Tests for General Linear Hypotheses

Multiple Comparisons of Means: Tukey Contrasts


Linear Hypotheses:

Estimate Std. Error t value Pr(>|t|)

b - a == 0 1.8000 0.5158 3.490 0.0219 *

c - a == 0 2.0000 0.5158 3.878 0.0100 *

d - a == 0 1.2000 0.5158 2.327 0.1871

e - a == 0 1.8000 0.5158 3.490 0.0217 *

c - b == 0 0.2000 0.5158 0.388 0.9947

d - b == 0 -0.6000 0.5158 -1.163 0.7712

e - b == 0 0.0000 0.5158 0.000 1.0000

d - c == 0 -0.8000 0.5158 -1.551 0.5467

e - c == 0 -0.2000 0.5158 -0.388 0.9947

e - d == 0 0.6000 0.5158 1.163 0.7712

---

Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

(Adjusted p values reported -- single-step method)

Se ha encontrados diferencias significativas entre las siguientes comparaciones de medias

de rendimientos:

- Entre la media de los rendimientos obtenidos con la gasolina tipo B y A - Entre la media de los rendimientos obtenidos con la gasolina tipo C y A - Entre la media de los rendimientos obtenidos con la gasolina tipo E y A

Entre las otras comparaciones no se ha encontrados diferencias significativas a un nivel de

significacin del 10%

A D B E C

6.8 8.0 8.6 8.6 8.8

De acuerdo a estos resultados se puede recomendar las gasolina tipo B, E y C por tener los

mayores rendimientos

Prueba de Dunnett (comparaciones de todas las medias de tratamientos con un control o

testigo)

1:p iH

1:a iH , para 2, ,i t

Donde: 1 = es la media del tratamiento testigo o de control


Valor Crtico:

1

, ,i

Dunnet Y Yd t p GLE S

, para 2, ,i t

donde :

, ,Dunnett t GLE = t de Dunnett con un nivel de significacin . p = nmero de tratamiento a comparar con el control

GLE = Grados de libertad del error

Se rechaza 0H aun nivel de significacin , si

1iY Y d , para 2, ,i t

Ejemplo: En el ejemplo de la gasolina suponga que A es el tratamiento Control. Realice la

prueba de Dunnett a un nivel 0.05

:p i AH

:a i AH , para , , ,i B C D E

6.8AY , 8.6BY , 8.8CY , 8.0DY , 8.6EY ;

2 2 0.6652 0.2665i A

Y Y

CMES

b

0.5,4,16 (2.34)( 0.266) 1.206859i A

Dunnet Y Yd t S

Comparacin i AY Y 0.5,4,16 i ADunnet Y Yd t S

B-A 1.8 1.206859 significativo

C-A 2.0 1.206859 significativo

D-A 1.2 1.206859 No significativo

E-A 1.8 1.206859 significativo

> amod comptipos confint(comptipos)

Simultaneous Confidence Intervals

Multiple Comparisons of Means: Dunnett Contrasts


Estimated Quantile = 2.7086

95% family-wise confidence level

Linear Hypotheses:

Estimate lwr upr

b - a == 0 1.8000 0.4030 3.1970

c - a == 0 2.0000 0.6030 3.3970

d - a == 0 1.2000 -0.1970 2.5970

e - a == 0 1.8000 0.4030 3.1970

> summary(comptipos)

Simultaneous Tests for General Linear Hypotheses

Multiple Comparisons of Means: Dunnett Contrasts


Linear Hypotheses:

Estimate Std. Error t value Pr(>|t|)

b - a == 0 1.8000 0.5158 3.490 0.01017 *

c - a == 0 2.0000 0.5158 3.878 0.00465 **

d - a == 0 1.2000 0.5158 2.327 0.10292

e - a == 0 1.8000 0.5158 3.490 0.01026 *

---

Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

(Adjusted p values reported -- single-step method)

Prueba de t con contraste:

Suponga que se desea probar la Hiptesis

1

: 0t

p i i

i

H C

1

: 0t

a i i

i

H C

a un nivel de significacin

Estadstica de Prueba

02

1

~ /GLEt

i

i

Qt t H

bCME C

es verdadera, siendo . .1 1

t t

i i i i

i i

Q C Y bC Y

Luego se acepta 0H si , 1 ,

2 2

cGLE GLE

t t t

, caso contrario se rechaza.

Prueba de Scheff

0

1

: 0t

i i

i

H C

contra

1

: 0t

a i i

i

H C


Valor Crtico de la prueba

1 , ,GLTrat GLELVCS S GLTrat F

donde:

.

1

t

i i

i

L C Y

21

1 t

iLi

S CME Cb

Se acepta 0H , si

L VCS

Se rechaza 0H , si

L VCS

El Mtodo de Bonferroni

Hiptesis:

0 : i lH

:a i lH , para i l , y , 1, 2, .i l t

. .1 ,

2

,i lY YGLE

nc

VCB i l t S

donde:

. .

2i lY Y

CMES

b

Se rechaza 0H para i l , y , 1, 2, .i l t , si

. . ,i lY Y VCB i l

Ejemplo: Con los datos del ejemplo de gasolina, use la prueba de t para probar el siguiente

contraste a un nivel de significacin 0.05 : ( , , , )B C D E versus A.

: 4p B C D E AH

: 4a B C D E AH

0.05

0.975,16 2.11T , se acepta pH si: 2.12 2.12ct caso contrario se rechaza.

5

1

5 4 6.8 1 8.6 1 8.8 1 8.0 1 8.6 34i ii

Q b C Y

2 2 2 2 221

344.16934

5 0.665 4 1 1 1 1c

t

i

i

Qt

bCME C

Como 2.12ct , se rechaza pH .

Con lenguaje R

> vmedia ci q tc tc

[,1]

[1,] 4.169348

> pvalue pvalue

[,1]

[1,] 0.000723429

Ejemplo: Con los datos del ejemplo de gasolina, use la prueba de Scheff para probar el

siguiente contraste a un nivel de significacin 0.05 : ( , , , )B C D E versus A

: 4 0p B C D E AH

: 4 0a B C D E AH

0.05

0.95,4,16 3.01F

.1

4 6.8 1 8.6 1 8.8 1 8.0 1 8.6 6.8t

i i

i

L C Y

6.8L

22 2 2 2 21

1 10.665 4 1 1 1 1 1.630951

5

t

iLi

S CME Cb

1 , , 1.630951 4 3.01 5.659188GLTrat GLELVCS S GLTrat F

Como L VCS , se rechaza pH .

Con Lenguaje R

> absl absl

[,1]

[1,] 6.8

> sl sl

[1] 1.630951

> vcs vcs

[1] 5.656289

Anlisis de residuales gasolina

> library(car)

> ncvTest(modeg)

Non-constant Variance Score Test

Variance formula: ~ fitted.values

Chisquare = 3.160140 Df = 1 p = 0.07545673

De acuerdo al grfico de los valores predicho (o valores ajustado) versus los residuos, se

puede observar que conforme los valores predichos aumenta la variabilidad de los residuos

tambin aumenta (en forma de embudo), y tambin se puede observar que el lowes de la

raz cuadrada de valores absolutos de residuales estandarizados (estudentizados

internamente) en funcin de los valores predichos tiene una tendencia sistemtica creciente.

Por ltimo, en el cuarto grfico se puede observar que el nico residuo estandarizado que

sobrepasa los lmites 2 es el de la observacin 3, siendo este el nico valor extremo Todo esto indica que es probable que no se cumpla con el supuesto de homogeneidad de

variancia. Tambin, el grfico de probabilidad normal de los residuos estandarizado en da

evidencia de que posiblemente el supuesto de normalidad no se cumpla causado

posiblemente por los valor extremo o de las observaciones con residuos estandarizados

cercanos al lmite 2 , pero al realizar la prueba de Shapiro Wild esta se acepta para niveles de significacin menores a 0.1207. Tambin al realizar la prueba de Homogeneidad de

variancia esta resulta significativa a un nivel de significacin del 10%, esto es que se

encontrado suficiente evidencia para afirmar que no se cumple con este supuesto. Una

alternativa es realizar transformaciones para estabilizar la variancia y realizar el anlisis con

los datos transformados, ya que el incumplimiento de este supuesto hace que las pruebas de

hiptesis realizadas en el ANVA y pruebas de comparacin no tengan validez.