Diseo de Bloques Completos Randomizado
Un diseo de Bloques Completos Randomizado es aquel cumple con las siguientes
condiciones:
1) Las unidades experimentales se distribuyen en grupos o bloques, de manera tal que las unidades experimentales dentro de cada bloque sean relativamente homogneas
y que el nmero de unidades experimentales dentro de un bloque sea igual al
nmero de tratamientos por investigar; y
2) Los tratamientos se asignan al azar a las unidades experimentales dentro de cada bloque.
Ejemplo
En los experimentos agrcolas, los bloques puede estar constituido por grupos de parcelas
relativamente homogneas que puede ser agrupados de acuerdo a gradiente de fertilidad,
otro porque se encuentra en una pendiente.
Ventajas
Este diseo tiene muchas ventajas, tales como
1.- En general es posible agrupar las unidades experimentales de modo que se logre mayor
precisin con respecto a un Diseo completamente al azar
2.- La nica restriccin sobre el nmero de tratamiento por bloque y tratamiento es la
disponibilidad de unidades experimentales
3.- Si se pierde informacin de todo un bloque o por contratiempo los datos de un bloque
completo es inutilizable estos datos puede omitirse, porque el resto mantiene la misma
estructura de un diseo de bloques completos al azar.
4.- Si se pierde informacin de algunas de las unidades estas puede estimarse.
Modelo Aditivo Lineal
El modelo aditivo Lineal del Diseo de Bloques Completo al Azar con una observacin por
unidad experimental, La observacin ijY puede representarse por el modelo siguiente:
ij i j ijY ; 1, 2, ,i t y 1, 2, ,j b
donde:
ijY : es la respuesta obtenida de la unidad experimental del j -simo bloque sujeta al
tratamiento i .
: El efecto de la media comn.
i : El verdadero efecto del i -simo tratamiento.
j : El verdadero efecto del j -simo bloque.
ij : Es una variable aleatoria no observable llamado error
Para el proceso de inferencia se asume que ij es una variable aleatoria independiente que
se distribuye normalmente con media cero y variancia comn 2 .
Modelo I (efectos fijos)
Se asume que los niveles de los factores son fijados por el investigador y estos efectos son
desviaciones con respecto a la media. Entonces se cumple:
1
0t
i
i
, 1
0b
j
j
Modelo II (efectos aleatorios)
Los niveles de los factores son elegidos aleatoriamente de poblaciones grandes. Entonces
los i son variables aleatorias independientes distribuidas normalmente con media cero y
variancia 2 , los j son variables aleatorias independientes distribuidas normalmente con
media cero y variancia 2 ,
Modelo III (Modelo mixto)
Los niveles de los tratamientos son fijados por el investigador y los niveles de los bloques
son elegidos al azar en este caso se cumple que
1
0t
i
i
;
y los j son variables aleatorias independientes distribuidas normalmente con media cero y
variancia 2 ,
Cuadro de Datos
Bloques
tratamientos 1 2 b Total
1 11Y 12Y 1bY 1Y
2 21Y 22Y 2bY 2Y
t
1tY 2tY tbY tY
Total 1Y 2Y 2Y Y
Donde : 1
b
i ij
j
Y Y
, para 1, 2, ,i t ; 1
t
j ij
i
Y Y
, para 1, 2, ,j b ;
1 1
t b
ij
i j
Y Y
Estimacin de Parmetro para el Modelo I
Los estimadores de los parmetros pueden ser encontrados aplicando el mtodo de los
mnimos cuadrados. Con este mtodo se obtiene:
1 1
1
t b
ij
i j
YY Y
tb tb
; i iY Y , para 1, 2, ,i t ;
j jY Y , para 1, 2, ,j b
Siendo:
1
b
ij
jii
YY
Yb b
, 1
t
ijj i
j
YY
Yt t
Residual o residuo
ij ij i je Y Y Y Y
ANLISIS DE VARIANCIA
La variacin total puede ser descompuesta de la siguiente forma:
2 2 2 2
1 1 1 1 1 1 1 1
( ) ( ) ( ) ( )t b t b t b t b
ij i j ij i j
i j i j i j i j
Y Y Y Y Y Y Y Y Y Y
donde:
2
2 2
1 1 1 1
( )ij
t b t b
ij
i j i j
YSCTotal Y Y Y
bt
es la medida de la variacin total.
2 2
2
1 1 1
( )t b t
ii
i j i
Y YSCTrat Y Y
b bt
es una medida de la variacin entre
tratamientos.
2 22
1 1 1
( )t b b
j
j
i j j
Y YSCBloq Y Y
t tb
es una medida de la variacin existente
entre bloques
2
1 1
( )t b
ij i j
i j
SCE Y Y Y Y SCTotal SCTrat SCBloq
, es la variacin
debido a otros factores no considerados en el
modelo.
Cuadrados Medios
Los cuadrados Medios se definen como el cociente entre la suma de los cuadrados y sus
respectivos grados de libertad:
1
SCBloqCMBloq
b
,
1
SCTratCMTrat
t
,
1 1SCE
CMEb t
Luego, se tiene el siguiente cuadro de ANVA
Fuente de
Variacin
SC GL CM Cuadrados Medios Esperados
Modelo I Modelo II
Bloques SCBloq b-1 CMBloq 2 2
11
b
j
j
t
b
2 2t
Tratamientos SCTrat t-1 CMTrat 2 2
11
t
i
i
b
t
2 2b
Error SCE (b-1)(t-1) CME 2 2 Total SCTotal bt-1
Prueba de Hiptesis (Modelo I)
1 2: 0p tH El cual es equivalente 1 2:p tH
: 0a iH , para al menos un i : al menos dos a iH son diferentes
Nivel de Significacin
1, 1 1~ / si la Hp es ciertac t b t
CMTratF F
CME
Nota: Como los bloques son fijados y no cumple con el principio de aleatorizacin no se
puede realizar pruebas de hiptesis sobre los efectos de bloques. En lugar de esto se puede
encontrar eficiencia relativa respecto a un diseo completamente al azar, el cual se define:
( 1)
1
SCBloq b t CME
tbERCME
Si 1ER entonces el Diseo de Bloques Completos al Azar es ms eficiente que un Diseo Completamente al azar.
Ejemplo: Se llev a cabo un experimento para sealar los mritos de 5 gasolinas. Debido a
que es inevitable la variacin en eficiencia de vehculo a vehculo, la prueba se realiz un
experimento con 5 automviles, que de aqu en adelante llamaremos bloques. Se dispone de
las siguientes descripciones de las 5 gasolinas:
A: Control
B: Control + aditivo X elaborado por la compaa I
C: Control + aditivo Y elaborado por la compaa I
D: Control + aditivo U elaborado por la compaa II
E: Control + aditivo V elaborado por la compaa II
Los tipos de gasolinas fueron probadas en cada carro en orden aleatorio. Los datos, en
Km/litros, se dan continuacin:
Bloques (vehculo)
Tratamiento
Gasolina
1 2 3 4 5 Total
A 8 7 6 6 7 34
B 10 9 8 7 9 43
C 8 8 9 9 10 44
D 9 8 8 8 7 40
E 10 9 8 7 9 43
Total 45 41 39 37 42 204
Modelo Aditivo Lineal:
ij i j ijY ; 1, 2, 3, 4 y 5i y 1, 2, 3, 4 y 5j
Donde:
ijY : es rendimiento en Km/litro obtenido del j -simo vehculo con el
i -simo tipo de de gasolina.
: El efecto de la media comn.
i : El verdadero efecto del i -simo tipo de gaslina
j : El verdadero efecto del j -simo vehculo.
ij : Son los efectos no observado del j-simo vehculo con el i-simo tipo de
gasolina llamado error
Ejemplo de clculo de algunos efectos estimado y residual
1 1
34 204 1.36
5 25Y Y
2 2
41 204 0.045 25
Y Y
12 12 1 2 7 6.8 8.2 8.16 0.16e Y Y Y Y
Cuadro de ANVA
5 5
2 2 2 2
1 1
8 7 9 1696iji j
Y
, 5
2 2 2 2
1
34 43 43 8390ii
Y
,
52 2 2 2
1
45 41 42 8360jj
Y
22 2
1
20483607.36
5 25
bj
j
Y YSCBloq
t tb
22 2
1
204839013.36
5 25
ti
i
Y YSCTrat
b bt
22
2
1 1
2041696 31.36
25ij
t b
i j
YSCTotal Y
bt
31.36 7.36 13.36 10.64SCE SCTotal SCTrat SCBloq
Fuente de
Variacin
SC GL CM Fc
Carros 7.36 4 1.84
Gasolinas 13.36 4 3.34 5.0226
Error 10.64 16 0.665
Total 31.36 24
1 2 3 4 5:pH
: al menos dos a iH son diferentes
0.05
3.345.0226
0.665c
CMTratF
CME
0.95,4,4 3.01F , como 0.95,4,4cF F , se rechaza la pH .
gasolina
la variancia de i lY Y , para i l y , 1, 2, ,i l t , est dado por:
22
var i lY Yb
y su estimado est dado por
2 2i lY Y
CMES
b
Prueba de t
Hiptesis
Caso A Bilateral Caso B Unilateral a la Derecha Caso C Unilateral a La Izquierda
:
:
p i l
a i l
H k
H k
:
:
p i l
a i l
H k
H k
:
:
p i l
a i l
H k
H k
Para i l ; , 1, 2, ,i l t
Nivel de significacin
Estadstica de prueba:
~ /
i l
i lc pgle
Y Y
Y Y kt t H
S
es verdadera
Decisin Caso A Caso B Caso C
Se Acepta pH , 1 ,
2 2
cgle gle
t t t
1 ;c glet t ;c glet t
Se Rechaza pH , 1 ,
2 2
c cgle gle
t t t t
1 ;c glet t ;c glet t
Diferencia Mnima de Significacin (DMS), tambin se le conoce con el nombre de
diferencia lmite de significacin
:p i lH
:a i lH
Para i l , , 1, 2, ,i l t
Nivel de significacin
Entonces si definimos
1 ,
2
,i lY YGLE
DMS i l t S
Luego, un criterio para examinar si existe diferencia significativa entre medias de
tratamiento se puede usar este criterio de la diferencia mnima significante ,DMS i l . Esto es, se rechaza 0H si
,i lY Y DMS i l
Para i l , , 1, 2, ,i l t
Ejemplo: Con los datos del ejemplo de gasolina, suponga que fue planeado realizar la
comparacin entre la gasolina D y E. Realice la prueba de t aun nivel de significacin
0.05 , para realizar esta comparacin
Las medias de los rendimientos est dado por:
6.8AY , 8.6BY , 8.8CY , 8.0DY , 8.6EY
: o : 0p D E p D EH H
: o : 0a D E a D EH H
0.05 0.975,16 2.22T , 2 2 0.6652 0.266
5D EY Y
CMES
b
8 8.6 0-1.16335
0.266D E
D Ec
Y Y
Y Y kt
S
. Se acepta pH
Con lenguaje R
> gasolina str(gasolina)
'data.frame': 25 obs. of 3 variables:
$ rendimiento: int 8 10 8 9 10 7 9 8 8 9 ...
$ bloques : int 1 1 1 1 1 2 2 2 2 2 ...
$ aditivo : Factor w/ 5 levels "a","b","c","d",..: 1 2 3 4 5 1 2 3 4
5 ...
> rendimiento vehiculo tipos mediaD
> mediaE esdmedia esdmedia
a
0.5157519
> tc tc
d
-1.16335
> pvalue pvalue
d
0.2617441
Se acepta Hp
Prueba de Tukey-Cramer (Tukey HSD)
Planteamiento de hiptesis
:p i lH
:a i lH Para i l , , 1, 2, ,i l t
Nivel de significacin
Clculo del Valor Crtico:
1
,2 i l
Y Yw q t GLE S
donde:
,q t GLE =amplitud estudiantizada para la prueba de Tukey t = nmero de tratamiento a comparar
GLE = Grados de libertad del error
Se rechaza 0H aun nivel de significacin , si
i lY Y w
Ejemplo: Con los datos del ejemplo de gasolina, realice la prueba de Tukey a un nivel de
significacin 0.05 , para realizar esta comparacin
:p i iH
:a i iH para , , , , , , i i A B C D E i i
0.05 ,
0.95,5,16 4.33q 0.665CME
0.665
0.95,5,16 4.33 1.57915 5
CMEw q
Comparacin i iY Y i lY YS w Significancia
B-A 1.8 0.5157519 1.579115 significativo
C-A 2 0.5157519 1.579115 significativo
D-A 1.2 0.5157519 1.579115 No significativo
E-A 1.8 0.5157519 1.579115 significativo
C-B 0.2 0.5157519 1.579115 No significativo
D-B 0.6 0.5157519 1.579115 No significativo
E-B 0 0.5157519 1.579115 No significativo
D-C 0.8 0.5157519 1.579115 No significativo
E-C 0.2 0.5157519 1.579115 No significativo
E-D 0.6 0.5157519 1.579115 No significativo
> library(multcomp)
> amod comptipos confint(comptipos)
Simultaneous Confidence Intervals
Multiple Comparisons of Means: Tukey Contrasts
Fit: aov(formula = rendimiento ~ vehiculo + tipos)
Estimated Quantile = 3.0637
95% family-wise confidence level
Linear Hypotheses:
Estimate lwr upr
b - a == 0 1.8000 0.2199 3.3801
c - a == 0 2.0000 0.4199 3.5801
d - a == 0 1.2000 -0.3801 2.7801
e - a == 0 1.8000 0.2199 3.3801
c - b == 0 0.2000 -1.3801 1.7801
d - b == 0 -0.6000 -2.1801 0.9801
e - b == 0 0.0000 -1.5801 1.5801
d - c == 0 -0.8000 -2.3801 0.7801
e - c == 0 -0.2000 -1.7801 1.3801
e - d == 0 0.6000 -0.9801 2.1801
> summary(comptipos)
Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: Tukey Contrasts
Fit: aov(formula = rendimiento ~ vehiculo + tipos)
Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
b - a == 0 1.8000 0.5158 3.490 0.0219 *
c - a == 0 2.0000 0.5158 3.878 0.0100 *
d - a == 0 1.2000 0.5158 2.327 0.1871
e - a == 0 1.8000 0.5158 3.490 0.0217 *
c - b == 0 0.2000 0.5158 0.388 0.9947
d - b == 0 -0.6000 0.5158 -1.163 0.7712
e - b == 0 0.0000 0.5158 0.000 1.0000
d - c == 0 -0.8000 0.5158 -1.551 0.5467
e - c == 0 -0.2000 0.5158 -0.388 0.9947
e - d == 0 0.6000 0.5158 1.163 0.7712
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
(Adjusted p values reported -- single-step method)
Se ha encontrados diferencias significativas entre las siguientes comparaciones de medias
de rendimientos:
- Entre la media de los rendimientos obtenidos con la gasolina tipo B y A - Entre la media de los rendimientos obtenidos con la gasolina tipo C y A - Entre la media de los rendimientos obtenidos con la gasolina tipo E y A
Entre las otras comparaciones no se ha encontrados diferencias significativas a un nivel de
significacin del 10%
A D B E C
6.8 8.0 8.6 8.6 8.8
De acuerdo a estos resultados se puede recomendar las gasolina tipo B, E y C por tener los
mayores rendimientos
Prueba de Dunnett (comparaciones de todas las medias de tratamientos con un control o
testigo)
1:p iH
1:a iH , para 2, ,i t
Donde: 1 = es la media del tratamiento testigo o de control
Nivel de significacin
Valor Crtico:
1
, ,i
Dunnet Y Yd t p GLE S
, para 2, ,i t
donde :
, ,Dunnett t GLE = t de Dunnett con un nivel de significacin . p = nmero de tratamiento a comparar con el control
GLE = Grados de libertad del error
Se rechaza 0H aun nivel de significacin , si
1iY Y d , para 2, ,i t
Ejemplo: En el ejemplo de la gasolina suponga que A es el tratamiento Control. Realice la
prueba de Dunnett a un nivel 0.05
:p i AH
:a i AH , para , , ,i B C D E
6.8AY , 8.6BY , 8.8CY , 8.0DY , 8.6EY ;
2 2 0.6652 0.2665i A
Y Y
CMES
b
0.5,4,16 (2.34)( 0.266) 1.206859i A
Dunnet Y Yd t S
Comparacin i AY Y 0.5,4,16 i ADunnet Y Yd t S
B-A 1.8 1.206859 significativo
C-A 2.0 1.206859 significativo
D-A 1.2 1.206859 No significativo
E-A 1.8 1.206859 significativo
> amod comptipos confint(comptipos)
Simultaneous Confidence Intervals
Multiple Comparisons of Means: Dunnett Contrasts
Fit: aov(formula = rendimiento ~ vehiculo + tipos)
Estimated Quantile = 2.7086
95% family-wise confidence level
Linear Hypotheses:
Estimate lwr upr
b - a == 0 1.8000 0.4030 3.1970
c - a == 0 2.0000 0.6030 3.3970
d - a == 0 1.2000 -0.1970 2.5970
e - a == 0 1.8000 0.4030 3.1970
> summary(comptipos)
Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: Dunnett Contrasts
Fit: aov(formula = rendimiento ~ vehiculo + tipos)
Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
b - a == 0 1.8000 0.5158 3.490 0.01017 *
c - a == 0 2.0000 0.5158 3.878 0.00465 **
d - a == 0 1.2000 0.5158 2.327 0.10292
e - a == 0 1.8000 0.5158 3.490 0.01026 *
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
(Adjusted p values reported -- single-step method)
Prueba de t con contraste:
Suponga que se desea probar la Hiptesis
1
: 0t
p i i
i
H C
1
: 0t
a i i
i
H C
a un nivel de significacin
Estadstica de Prueba
02
1
~ /GLEt
i
i
Qt t H
bCME C
es verdadera, siendo . .1 1
t t
i i i i
i i
Q C Y bC Y
Luego se acepta 0H si , 1 ,
2 2
cGLE GLE
t t t
, caso contrario se rechaza.
Prueba de Scheff
0
1
: 0t
i i
i
H C
contra
1
: 0t
a i i
i
H C
Nivel de significacin
Valor Crtico de la prueba
1 , ,GLTrat GLELVCS S GLTrat F
donde:
.
1
t
i i
i
L C Y
21
1 t
iLi
S CME Cb
Se acepta 0H , si
L VCS
Se rechaza 0H , si
L VCS
El Mtodo de Bonferroni
Hiptesis:
0 : i lH
:a i lH , para i l , y , 1, 2, .i l t
. .1 ,
2
,i lY YGLE
nc
VCB i l t S
donde:
. .
2i lY Y
CMES
b
Se rechaza 0H para i l , y , 1, 2, .i l t , si
. . ,i lY Y VCB i l
Ejemplo: Con los datos del ejemplo de gasolina, use la prueba de t para probar el siguiente
contraste a un nivel de significacin 0.05 : ( , , , )B C D E versus A.
: 4p B C D E AH
: 4a B C D E AH
0.05
0.975,16 2.11T , se acepta pH si: 2.12 2.12ct caso contrario se rechaza.
5
1
5 4 6.8 1 8.6 1 8.8 1 8.0 1 8.6 34i ii
Q b C Y
2 2 2 2 221
344.16934
5 0.665 4 1 1 1 1c
t
i
i
Qt
bCME C
Como 2.12ct , se rechaza pH .
Con lenguaje R
> vmedia ci q tc tc
[,1]
[1,] 4.169348
> pvalue pvalue
[,1]
[1,] 0.000723429
Ejemplo: Con los datos del ejemplo de gasolina, use la prueba de Scheff para probar el
siguiente contraste a un nivel de significacin 0.05 : ( , , , )B C D E versus A
: 4 0p B C D E AH
: 4 0a B C D E AH
0.05
0.95,4,16 3.01F
.1
4 6.8 1 8.6 1 8.8 1 8.0 1 8.6 6.8t
i i
i
L C Y
6.8L
22 2 2 2 21
1 10.665 4 1 1 1 1 1.630951
5
t
iLi
S CME Cb
1 , , 1.630951 4 3.01 5.659188GLTrat GLELVCS S GLTrat F
Como L VCS , se rechaza pH .
Con Lenguaje R
> absl absl
[,1]
[1,] 6.8
> sl sl
[1] 1.630951
> vcs vcs
[1] 5.656289
Anlisis de residuales gasolina
> library(car)
> ncvTest(modeg)
Non-constant Variance Score Test
Variance formula: ~ fitted.values
Chisquare = 3.160140 Df = 1 p = 0.07545673
De acuerdo al grfico de los valores predicho (o valores ajustado) versus los residuos, se
puede observar que conforme los valores predichos aumenta la variabilidad de los residuos
tambin aumenta (en forma de embudo), y tambin se puede observar que el lowes de la
raz cuadrada de valores absolutos de residuales estandarizados (estudentizados
internamente) en funcin de los valores predichos tiene una tendencia sistemtica creciente.
Por ltimo, en el cuarto grfico se puede observar que el nico residuo estandarizado que
sobrepasa los lmites 2 es el de la observacin 3, siendo este el nico valor extremo Todo esto indica que es probable que no se cumpla con el supuesto de homogeneidad de
variancia. Tambin, el grfico de probabilidad normal de los residuos estandarizado en da
evidencia de que posiblemente el supuesto de normalidad no se cumpla causado
posiblemente por los valor extremo o de las observaciones con residuos estandarizados
cercanos al lmite 2 , pero al realizar la prueba de Shapiro Wild esta se acepta para niveles de significacin menores a 0.1207. Tambin al realizar la prueba de Homogeneidad de
variancia esta resulta significativa a un nivel de significacin del 10%, esto es que se
encontrado suficiente evidencia para afirmar que no se cumple con este supuesto. Una
alternativa es realizar transformaciones para estabilizar la variancia y realizar el anlisis con
los datos transformados, ya que el incumplimiento de este supuesto hace que las pruebas de
hiptesis realizadas en el ANVA y pruebas de comparacin no tengan validez.
Top Related