Taller Analisis de Varianza

28
ANÁLISIS DE VARIANZA – ANOVA DE UNA VÍA P. Reyes / Sept. 2007 ANÁLISIS DE VARIANZA ANOVA DE UNA VÍA Elaboró: Dr. Primitivo Reyes Aguilar Septiembre de 2007 Mail: [email protected] Tel. 58 83 41 67 / Cel. 044 55 52 17 49 12 Página 1 de 28

description

rgdfagdfgfg

Transcript of Taller Analisis de Varianza

Page 1: Taller Analisis de Varianza

ANÁLISIS DE VARIANZA – ANOVA DE UNA VÍA P. Reyes / Sept. 2007

ANÁLISIS DE VARIANZAANOVA DE UNA VÍA

Elaboró: Dr. Primitivo Reyes AguilarSeptiembre de 2007

Mail: [email protected]. 58 83 41 67 / Cel. 044 55 52 17 49 12

Página 1 de 22

Page 2: Taller Analisis de Varianza

ANÁLISIS DE VARIANZA – ANOVA DE UNA VÍA P. Reyes / Sept. 2007

CONTENIDO

1. ANOVA

2. Ejercicios

3. Teoría de experimentos de un solo factor

Página 2 de 22

Page 3: Taller Analisis de Varianza

ANÁLISIS DE VARIANZA – ANOVA DE UNA VÍA P. Reyes / Sept. 2007

ANALISIS DE VARIANZA DE UN FACTOR (ANOVA 1 VIA)El análisis de la varianza de un factor (ANOVA) es una metodología para analizar la variación

entre muestras y la variación al interior de las mismas mediante la determinación de varianzas.

Es llamado de una vía porque analiza un variable independiente o Factor ej: Velocidad. Como

tal, es un método estadístico útil para comparar dos o más medias poblacionales. El ANOVA

de un criterio nos permite poner a prueba hipótesis tales como:

Los supuestos en que se basa la prueba t de dos muestras que utiliza muestras

independientes son:

1. Ambas poblaciones son normales.

2. Las varianzas poblacionales son iguales, esto es,

El estadístico tiene una distribución muestral resultando:

El valor crítico para la prueba F es:

Donde el número de grados de libertad para el numerador es k-1 y para el denominador es k(n-

1), siendo el nivel de significancia.

k = número de muestras.

Por ejemplo:

Ejemplo: Se tienen 14 empleados seleccionados al azar que se someten a

3 diferentes cursos de entrenamiento: Programa 1, Programa 2 y Programa 3.

Como los empleados se seleccionan aleatoriamente para cada programa

el diseño se denomina DISEÑO COMPLETAMENTE ALEATORIZADO

Se observa el aprovechamiento de los empleados en los programas:

TRATAMIENTOS

I c=1 c=2 J

Página 3 de 22

Page 4: Taller Analisis de Varianza

ANÁLISIS DE VARIANZA – ANOVA DE UNA VÍA P. Reyes / Sept. 2007

c=3

  Programa 1 Programa 2 Programa 3

r=1 85 80 82

r=2 72 84 80

r=3 83 81 85

r=4 80 78 90

r=5 ** 82 88

Medias 80.00 81.00 85.00 Xj

Media de medias o media total 82.14

TIPOS DE VARIACIÓN Y SUMAS DE CUADRADOS

1. Variación total entre los 14 empleados, su puntuación no fue igual con todos

VARIACIÓN TOTAL RESPECTO A LA MEDIA GENERAL

SCT = (85-82.14)2 + (72-82.14)2+(83-82.14)2+.....+(88-82.14)2

SCT = 251.7

2. Variación entre los diferentes tratamientos o Variación entre muestras o variación

entre programa 1, programa 2 y programa 3

EFECTO DE LA MEDIA DE CADA TRATAMIENTO RESPECTO A LA MEDIA GENERAL

SCTR = 4(79.5 - 81.3333)2 + 5(81 - 81.3333)2 + 5(85 - 81.333)2

SCTR = 65.71

3. Variación dentro de un tratamiento o muestra o programa dado que no todos los

empleados dentro de un mismo programa obtuvieron los mismos puntajes. Se denomina

Variación dentro de los tratamientos.

VARIACIÓN DENTRO DEL TRATAMIENTO O VARIACIÓN DEL ERROR

CADA VALOR RESPECTO A LA MEDIA DE SU TRATAMIENTO

Página 4 de 22

Page 5: Taller Analisis de Varianza

ANÁLISIS DE VARIANZA – ANOVA DE UNA VÍA P. Reyes / Sept. 2007

SCE = SCT - SCTR = 186

4. GRADOS DE LIBERTAD

Grados de libertad totales = n - 1 = 14-1 = 13

Grados de libertad de los tratamientos = c - 1 = 3 - 1 = 2

Grados de libertad del error = gl. Totales - gl. Tratamientos = 13 - 2 = 11

gl SCT = gl SCTR + gl SCE

gl SCE = gl SCT - gl SCTR = (n -1) - (c - 1) = n -c

5. CUADRADOS MEDIOS (Suma Cuadrados/ Grados libertad)

CMT = Cuadrado medio total = SCT / (n-1) = 19.4

CMTR = Cuadrado medio del tratamiento = SCTR / (c -1) = 32.9

CME = Cuadrado medio del error = SCE/ gle.= 16.9

6. ESTADÍSTICO DE PRUEBA Fc Y ESTADÍSTICO F CRÍTICO DE ALFA

Fc = CMTR / CME= 1.946745562

Cálculo de F con Excel

=DISTR.F.INV(ALFA, GL. TR, GL. ERR) =DISTR.F.INV(0.05, 2, 11) = 3.982297957

NO RECHAZAR

ZONA DE

RECHAZO

Distr. F

Página 5 de 22

Page 6: Taller Analisis de Varianza

ANÁLISIS DE VARIANZA – ANOVA DE UNA VÍA P. Reyes / Sept. 2007

Como Fc es menor a Falfa no se rechaza Ho y las medias son iguales.

7. VALOR P DE Fc

P = distr.f(Fc, gl. SCTr, gl. SCE) = distr.f(1.946, 2, 11) = 0.18898099

Como P es mayor a alfa no se rechaza Ho

CONCLUSION: NO HAY SUFICIENTE EVIDENCIA PARA RECHAZAR HO, LAS MEDIAS DE

LOS TRATAMIENTOS SON IGUALES

Página 6 de 22

Page 7: Taller Analisis de Varianza

ANÁLISIS DE VARIANZA – ANOVA DE UNA VÍA P. Reyes / Sept. 2007

TABLA DE ANOVA

FUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO

CUADRADOS LIBERTAD MEDIO VALOR

F

Entre muestras (tratam.) SCTR c-1 CMTR CMTR/CME

Dentro de muestras (err.) SCE n-c CME

Variación total SCT n-1 CMT

Regla: No rechazar si la F de la muestra es menor que la F de Excel para una cierta alfa

USO DE EXCEL:

En el menú herramientas seleccione la opción Análisis de datos, en funciones para

análisis seleccione Análisis de varianza de un factor. En Rango de entrada seleccionar la matriz de datos (todas las columnas a la vez).

Alfa = 0.05

En Rango de salida indicar la celda donde se iniciará la presentación de resultados.

RESUMEN Análisis de varianza de un factor

Grupos Cuenta Suma Promedio Varianza

Programa 1 4 320 80 32.666667

Programa 2 5 405 81 5

Programa 3 5 425 85 17

ANÁLISIS DE VARIANZA

Grados

de Promedio de

Variaciones

Suma

cuadrados libertad Cuadrados Fc Probabilidad F crítica

Entre grupos 65.71428571 2 32.85714286 1.9431644 0.18937731 3.98229796

Dentro de

grupos 186 11 16.90909091      

Total 251.7142857 13        

Página 7 de 22

Page 8: Taller Analisis de Varianza

ANÁLISIS DE VARIANZA – ANOVA DE UNA VÍA P. Reyes / Sept. 2007

2. EJERCICIOS:

Cuatro catalizadores que pueden afectar la concentración de un componente en una mezcla

líquida de tres componentes están siendo investigado.

Se obtienen las siguientes concentraciones: Catalizador

A B C D

58.2 56.3 50.1 52.9

57.2 54.5 54.2 49.9

58.4 57 55.4 50

55.8 55.3  56 51.7

54.9 58  54.5  50.2 

2. Para determinar si existe diferencia significativa en el nivel de Matemáticas de 4 grupos de

estudiantes de Ingeniería se realizó un examen aleatorio a 6 individuos por grupo. Determine

cuales son los grupos en los cuales existen diferencias a un 95% de nivel de confianza.

3. Las calificaciones en el examen a 18 empleados de tres unidades de negocio

Se muestran a continuación:

Probar si no hay diferencia entre las unidades a un 5% de nivel de significancia.

A B C

85 71 59

75 75 64

82 73 62

76 74 69

71 69 75

85 82 67

4. Probar si hay diferencia en los tiempos de servicio de 4 unidades de negocio para el mismo

servicio a un nivel de significancia del 5%.

A B C D

Página 8 de 22

Page 9: Taller Analisis de Varianza

ANÁLISIS DE VARIANZA – ANOVA DE UNA VÍA P. Reyes / Sept. 2007

5.4 8.7 11.1 9.9

7.8 7.4 10.3 12.8

5.3 9.4 9.7 12.1

7.4 10.1 10.3 10.8

8.4 9.2 9.2 11.3

7.3 9.8 8.8 11.5

Página 9 de 22

Page 10: Taller Analisis de Varianza

ANÁLISIS DE VARIANZA – ANOVA DE UNA VÍA P. Reyes / Sept. 2007

3. TEORÍA DE EXPERIMENTOS DE UN SOLO FACTOR

n esta parte se analiza el caso en que se desea conocer el efecto de un solo factor o

variable independiente sobre la característica de calidad que sé esta analizando. Esto

implica que a fin de poder detectar su efecto, este factor se debe de variar manteniendo el resto

de los factores en un valor fijo.

E

Experimentos sin restricciones en la aleatoriedad.

uando se desea analizar el efecto de un factor sobre una variable dependiente o

característica de calidad es necesario el variar el "nivel” valor de ese factor. A cada

diferente nivel al cual se realiza el experimento se le conoce como tratamiento. Por ejemplo si

el factor es el proveedor los diferentes niveles o serian proveedor A, proveedor B, proveedor C,

etc. , si el factor es el tipo de proceso los tratamientos serian proceso 1, proceso 2. Si el factor

es temperatura los diferentes niveles serian por ejemplo 10, 20, 30 y 40 °C,etc.

C

Por otro lado en cada nivel del factor se efectúan una serie de pruebas, a cada una de estas

pruebas se les conoce como replicaciones. EL factor se considera fijo.

Ejemplo 1: Suponga que se desea saber si los ejes que surten cuatro proveedores tienen

diferente resistencia a la tracción. Para ello se decide llevar a cabo un experimento de un solo

factor donde la variable dependiente es la resistencia a la tracción del eje medida en Kgs/cm 2 y

el factor es el proveedor. El factor tiene cuatro niveles o tratamientos diferentes. Uno para cada

proveedor (llámelos I, II, III, IV) se decide probar 5 ejes de cada proveedor haciendo un total de

20 pruebas ejecutadas en la misma maquina de prueba y con él mismo operario (recuerde que

el resto de los factores se deben de mantener a un nivel fijo).

Para que el experimento sea aleatorio se numeran los ejes del 1 al 20 y se selecciona al azar

un número entre 1 y 20. Según él numero seleccionado es el siguiente eje que se prueba. De

esta manera, el siguiente eje a probar es seleccionado sin ninguna restricción. Suponga. que

los resultados de experimento se muestran en la tabla siguiente:

Proveedor

I II III IV

56 64 45 42

55 61 46 39

62 50 45 45

59 55 39 43

60 56 43 41

Página 10 de 22

Page 11: Taller Analisis de Varianza

ANÁLISIS DE VARIANZA – ANOVA DE UNA VÍA P. Reyes / Sept. 2007

El proveedor = factor

Tratamiento = I, II, III, IV

Con cinco replicaciones en cada tratamiento.

Observando la tabla se "ve" que existen evidentemente diferencias entre la resistencia de los

ejes de un proveedor a otro. Pero también existen entre los ejes de un mismo proveedor,

entonces, ¿la diferencia detectada entre, los ejes de un proveedor y otro existe realmente? O

¿la diferencia es debida al azar?, La herramienta estadística conocida como análisis de

varianza (ANOVA) puede ayudar a despejar esta duda.

Para esto suponga un caso general como sigue: Si define Yij como el valor correspondiente

de la variable dependiente o característica de calidad de la i-ésima observación o

replicación bajo el tratamiento j, los resultados de un experimento de un solo factor con k

tratamientos y n replicas u observaciones por tratamiento seria:

Tratamiento

(nivel)

Observaciones Totales Promedios

1 Y11 Y12 ... Y1n Y1.

2 Y21 Y22 ... Y2n Y2.

3 Y31 Y32 ... Y3n Y3.

... ... ... ... ... ... ...

K Yk1 Yk2 ... Ykn Yk.

Este caso se puede representar mediante el modelo estadístico lineal:

Donde representa la media general, j representa el efecto del tratamiento j, y ij es el error

aleatorio al hacer la observación ij.

Esto es, se supone que todos los datos en general pertenecen a una misma población con

media excepto que existan desviaciones para diferentes tratamientos del mismo factor.

Por su parte ij representa el error aleatorio o medida de la variabilidad natural dentro de

cada tratamiento.

Generalmente se supone que:

Página 11 de 22

Page 12: Taller Analisis de Varianza

ANÁLISIS DE VARIANZA – ANOVA DE UNA VÍA P. Reyes / Sept. 2007

Y que el error aleatorio sigue una distribución normal con media cero y varianza 2, esto

denota:

Sean Yi. El total de las observaciones bajo el i-esimo tratamiento, y el promedio de las

observaciones bajo el i-esimo tratamiento. Similarmente sean Y.. La suma de todas las

observaciones y la media general de todas las observaciones.

Expresado matemáticamente esto es:

N = kn es él numero total de observaciones

Las hipótesis en este caso son:

Ho: j = 0; para todo valor de j.

H1: j 0; para al menos un valor de j.

Ho significa que el factor (los niveles bajo estudio) no tiene efecto sobre la variable dependiente

y H1 que si lo tiene, esto es que existe diferencia, estadística. Recuerde también que la

hipótesis nula se asume como cierta a menos que los datos indiquen lo contrario.

Descomposición de la suma total de cuadrados

a denominación de análisis de varianza resulta de descomponer la variabilidad total de los

datos en sus partes componentes. La suma total de cuadrados corregida es:L

Donde:

Página 12 de 22

Page 13: Taller Analisis de Varianza

ANÁLISIS DE VARIANZA – ANOVA DE UNA VÍA P. Reyes / Sept. 2007

La ecuación anterior muestra la variabilidad total de los datos, medida por la suma total

corregida de los cuadrados. SStr se denomina suma de cuadrados debida a los tratamientos (es

decir, entre tratamientos), SSE es la suma de cuadrados debido al error (es decir, dentro de los

tratamientos)

SST = Suma de cuadrados total: con N -1 grados de libertad

SStr = Suma de cuadrados debido a los tratamientos, con k - 1 grados de libertad.

SSE = Suma de cuadrados debido al error aleatorio k grados de libertad.

Para simplificar los cálculos:

El análisis de varianza será:

FuenteDe error SS G.L. MS F0

Variación entre tratamientos SStr k – 1 MStr MStr/MSE

Variación dentro deTratamientos o error SSE N – k MSE

Total SST N – 1

Si F0 > F,k-1,N-k, H0 debe ser rechazada. Donde F, k-1,N-k es el valor de la variable F con

un nivel de significancia (error tipo I), k-1 grados de libertad en el numerador y N-k grados de

libertad en el denominador. Bajo la hipótesis nula la relación MS tr/MSE sigue una función de

densidad F, por lo tanto si F0 es mayor que F, k-1,N-k existirá una diferencia significativa y el

factor afecta la respuesta de la característica de calidad en los niveles bajo estudio.

Si Ho no puede ser rechazada la conclusión es por lo tanto que el factor bajo estudio no

afecta la respuesta. Sin embargo, si Ho es rechazada y existe diferencia significativa entre

los diferentes tratamientos de un solo factor el siguiente paso es el analizar en detalle cual

de los tratamientos es el mejor y cuales son iguales.

Aplicando el ANOVA a los datos del ejemplo 2.2 se tiene:

Página 13 de 22

Totales PromediosYi

I 56 55 62 59 60 292 58.4I I 64 61 50 55 56 286 57.2I I I 45 46 45 39 43 218 43.6I V 42 39 45 43 41 210 42

Y..= 1006 40.24 ..Y

.iY

Page 14: Taller Analisis de Varianza

ANÁLISIS DE VARIANZA – ANOVA DE UNA VÍA P. Reyes / Sept. 2007

Entonces, calculando las sumas de cuadrados tenemos que:

SST = 51,940 – (10062)/20 = 1338.2

SStr = 2922/5 + 2862/5 + 2182/5 + 2102/5 –10062/20 = 1,135.0

SSE = SST – SStr = 1338.2 – 1135.0 = 203.2

MStr = SStr/(k-1) = 1135.0/(3 - 1) = 378.2

MSE = SSE/(n-k) = 203.2/(20-4) = 12.70

Esto se resume en la siguiente tabla:

FuenteDe error SS G.L. MS F0

Factor o tratamientos SStr=1135 k – 1 = 3 MStr =378.3MStr/MSE

= 29.79

Error SSE=203.2 N – k = 16 MSE=12.7

Total SST=1338.2 N – 1 = 19

Donde F0= MStr/MSE = 378.3/12.70=29.79 con 3 grados de libertad en el numerador y 16

grados de libertad en el denominador.

Si el nivel de aceptación (error tipo I) lo fijamos en 5%, esto es, = 0.05, de la tabla de la

función F se tiene que:

F,3,16 = 3.24

Dado que F0 = 29.79 > 3.24= F0.05,3,16

Página 14 de 22

Page 15: Taller Analisis de Varianza

ANÁLISIS DE VARIANZA – ANOVA DE UNA VÍA P. Reyes / Sept. 2007

Se concluye que Ho se rechaza y el factor proveedor afecta la variable resistencia a la

tracción.

Experimentos con un solo factor y diferente número de lecturas por tratamiento (o caso desbalanceado)

uando por alguna razón él numero de lecturas que se tienen bajo cada tratamiento es

diferente, digamos Zi observaciones en el tratamiento j, el análisis se puede llevar a

cabo de una manera similar con las siguientes formulas para k tratamientos:

C

Es, sin embargo, deseable que él numero de muestras sea igual bajo cada tratamiento, puesto

que el poder de la prueba se maximiza cuando él numero de muestras es igual.

Ejemplo 2: El tiempo de respuesta en milisegundos fue determinado para tres tipos diferentes

de circuitos y los resultados son:

Con un nivel de significación de = 0.05. ¿Tiene los circuitos diferente tiempo de respuesta?

k = 3; n1 = 6; n2 = 3; n3 = 4; N = 6 + 3 + 4 = 13

Página 15 de 22

Totales Promediostr YiI 9 12 10 8 15 13 67 11.17II 20 23 30 73 24.33III 6 5 8 16 35 8.75

Y.. 175 14.75

Observaciones .Yi

. .Y

Page 16: Taller Analisis de Varianza

ANÁLISIS DE VARIANZA – ANOVA DE UNA VÍA P. Reyes / Sept. 2007

La tabla ANOVA es:

FuenteDe error

SS G.L. MSF0

Factor o tratamientos SStr=474.98 k – 1 = 2 MStr =237.49MStr/MSE

= 14.64

Error SSE=162.29 N – k = 10 MSE=16.22

Total SST=637.24 N – 1 = 12

Dado que F.05,2,10 = 4.10, se concluye que los circuitos muestran diferentes tiempos de

respuesta.

Estimación de parámetros del modelo

continuación, se desarrollan estimadores para los parámetros del modelo de clasificación

en un sentido:A

Usando el método de los mínimos cuadrados, las soluciones de las ecuaciones normales son:

Página 16 de 22

Page 17: Taller Analisis de Varianza

ANÁLISIS DE VARIANZA – ANOVA DE UNA VÍA P. Reyes / Sept. 2007

Y es posible determinar fácilmente un intervalo de confianza para estimar la media del i-ésimo

tratamiento. Dicha i-ésimo media es:

i = + i

Un estimador puntual para i podría ser ahora si se supone que los errores

están distribuidos normalmente, las son NID(0,2/n), entonces podría usarse la distribución

normal para definir el intervalo de confianza buscado si se conoce . Al usar MSE como

estimación de, 2, el intervalo de confianza se debe basar en la distribución t., por tanto, un

intervalo de confianza de (1-)100% para la media del i-ésimo tratamiento, es:

un intervalo de confianza del (1-)100% para la diferencia de las medias de dos tratamientos

cualesquiera, por ejemplo i-j, será:

Ejemplo 3: Al usar los datos del ejemplo 2.3, las estimaciones de la media general y de los

efectos de los tratamientos son

usando la formula para calcular el intervalo de confianza del 95% para la media del tratamiento

4 es:

por tanto, el intervalo deseado es 18.95 24.25

Estimación de la variable de respuesta

Página 17 de 22

Page 18: Taller Analisis de Varianza

ANÁLISIS DE VARIANZA – ANOVA DE UNA VÍA P. Reyes / Sept. 2007

a descomposición de la variabilidad en las observaciones por medio del análisis de

variancia, es una relación puramente algebraica. L

El residuo de la observación i del tratamiento j se define mediante:

en donde es una estimación de la observación Yij correspondiente calculada por:

La ecuación anterior muestra un resultado que se intuye fácilmente, ya que la estimación de

cualquier observación del i-ésimo tratamiento es igual al promedio del tratamiento

correspondiente. El examen de los residuos debe ser automático en el análisis de variancia. Si

el modelo es adecuado, los residuos no deben tener estructura.

Comparación de medias de tratamientos individuales

upongamos que al efectuar un análisis de variancia para un modelo de efectos fijos la:

hipótesis nula es rechazada. Se concluye que existe diferencia entre las medias, aunque

no se especifique exactamente cual de ellas es diferente . En esta situación puede ser útil

realizar comparaciones adicionales entre grupos de medias de los tratamientos. La media del i-

ésimo tratamiento se define mediante i = + i y su estimación es . Las comparaciones

entre medias de tratamientos se realizan en términos de los totales de tratamientos Yi. O de los

promedios de tratamientos . Los procedimientos para efectuar estas comparaciones se

conocen como métodos de comparación múltiple.

S

Método de la Mínima Diferencia Significativa (LSD, del inglés least significant difference)

Página 18 de 22

Page 19: Taller Analisis de Varianza

ANÁLISIS DE VARIANZA – ANOVA DE UNA VÍA P. Reyes / Sept. 2007

upongamos que después de haber rechazado la hipótesis nula, con base en una prueba

F de análisis de variancia, se desea probar Ho: i = j para toda i j. Esto puede hacerse

empleando la estadística t:

S

Suponiendo una hipótesis alterna bilateral, la pareja de medias i, j se consideran diferentes

Sí La cantidad:

Se denomina mínima diferencia significativa. Si el diseño es balanceado, entonces n1 = n2 = nk

= n.

Para usar el procedimiento de la LSD, simplemente se comparan las diferencias observadas

entre cada par de promedios con el valor correspondiente de la LSD. Si, se concluye que las

medias poblacionales i = j son diferentes.

Ejemplo 4: Para ilustrar este procedimiento, si se usan los datos del Ejemplo 2.3 el valor de la

LSD con = .05 es:

Por tanto, una pareja de medias difieren significativamente si el valor absoluto de la

diferencia de promedios en los tratamientos correspondientes es mayor que 3.75. Los cinco

promedios de tratamiento son:

Y las diferencias de los promedios son:

Página 19 de 22

Page 20: Taller Analisis de Varianza

ANÁLISIS DE VARIANZA – ANOVA DE UNA VÍA P. Reyes / Sept. 2007

Los valores marcados con asterisco indican parejas de medias que son significativamente

diferentes. Resulta útil graficar los datos como se muestra en la Fig. 4, subrayando las parejas

de medias que no difieren en forma significativa. Claramente los únicos pares que no difieren

significativamente son 1 y 5, y 2 y 3. El tratamiento 4 produce una resistencia a la tensión de

manera significativamente mayor que los otros tratamientos.

Comparación de Tratamientos con un Control

En muchos experimentos, uno de los tratamientos es un control, y al analista puede interesarle

su comparación con las k -1 medias de tratamiento con el control. Por tanto, sólo deben

realizarse k -1 comparaciones. Un procedimiento para hacerlas fue desarrollado por Dunnett

(1964). Supongamos que el tratamiento k es el control. Se desean probar las hipótesis:

Para i = 1, 2,..., k -1. El procedimiento de Dunnett es una modificación de la prueba t. Para

cada hipótesis se calculan las diferencias que se observan en las medias muéstrales:

La hipótesis nula Ho: i = k es rechazada con un nivel de error tipo I según alfa sí:

Página 20 de 22

21.6 17.6 15.4 10.8 8.9.Y .Y .Y .Y .Y 43251

Figura 4. Resultados del procedimineto LSD

21.6 17.6 15.4 10.8 8.9.Y .Y .Y .Y .Y 43251

Figura 4. Resultados del procedimineto LSDFig. 4

Page 21: Taller Analisis de Varianza

ANÁLISIS DE VARIANZA – ANOVA DE UNA VÍA P. Reyes / Sept. 2007

En donde la constante d (k -1, f) se encuentra en la Tabla IX del Apéndice del texto de Diseño

y Análisis de Experimentos de Douglas C. Montgomery (son posibles tanto pruebas unilaterales

como bilaterales). Hay que notar que alfa constituye el nivel de significación conjunto asociado

a las k -1 pruebas.

Ejemplo 5: Para ilustrar la prueba de Dunnett, considérense los datos del Ejemplo 3, y su

póngase que el tratamiento 5 es el control. En este ejemplo, k = 5, k -1 = 4, f = 20, ni = n = 5, y

con un nivel del 5% se encuentra en la Tabla IX del Apéndice que d0.05 (4,20) = 2.65. Por tanto,

la diferencia crítica es:

(Hay que notar que esta es una simplificación de la Ecuación anterior y que resulta de un

diseño balanceado.) En consecuencia, un tratamiento debe considerarse significativamente

diferente del control si la diferencia es mayor que 4.76. Las diferencias observadas son:

Sólo las diferencias indican una diferencia significativa al ser

comparadas con el control; por tanto, se concluye que 3 = 5 y 4 = 5. Es conveniente usar

más observaciones para el tratamiento de control (es decir, nk) que para los otros tratamientos

(o sea, n, suponiendo el mismo número de observaciones en los otros k -1 tratamientos)

cuando se comparan tratamientos con un control. Debe elegirse la razón nk / n

aproximadamente igual a la raíz cuadrada del número total de tratamientos. En otras palabras,

se elige nk/n =

Suposiciones del análisis de varianza

Al aplicar un análisis de varianza se hacen las siguientes suposiciones siguientes:

1. El proceso esta en control estadístico (estable). Esto es, se pueden repetir y las causas

de variación se han eliminado.

2. La distribución de la población que se muestra es normal.

3. La varianza de los errores dentro de los k niveles del factor es la misma: esto es, la

variabilidad natural dentro de cada tratamiento es la misma de un tratamiento a otro.

Página 21 de 22

Page 22: Taller Analisis de Varianza

ANÁLISIS DE VARIANZA – ANOVA DE UNA VÍA P. Reyes / Sept. 2007

Grafica de residuos contra el valor ajustado de

i el modelo es correcto y las suposiciones se satisfacen, los residuos no deben tener

algún patrón, ni deben estar relacionados con alguna variable, incluyendo la respuesta Y ij.

Una comprobación sencilla consiste en graficar los residuos contra los valores ajustados

(debe recordarse que para el modelo en un sentido , el promedio del tratamiento i-

ésimo). En esta grafica no debe revelarse ningún patrón obvio en la siguiente figura se grafican

los residuos contra los valores ajustados de los datos de la resistencia a la tensión del ejemplo

2.3 Ningún patrón inusual es evidente.

S

Grafica de residuos contra valores ajustados

Un efecto que en ocasiones revela la grafica es el de una varianza variable. Algunas veces la

varianza de las observaciones lo hace. Esto resulta cuando el error es proporcional a la

magnitud de la observación (comúnmente esto sucede en instrumentos de medición – el error

es proporcional a la escala de la lectura). Si este es el caso, los residuos aumenta a medida

que Yij lo hace, y la grafica de los residuos contra parecerá un embudo que se ensancha o

un altavoz. La varianza variable también ocurre en casos cuyos datos no tienen distribución

normal y están sesgados, porque en las distribuciones sesgadas la varianza tiende a ser

función de la media.

Página 22 de 22