F:\planteamiento de hipótesis en mas de dos poblaciones

20
ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher Mtra. A Elsa Retureta Álvarez Página 1 UNIVERSIDAD VERACRUZANA FACULTAD DE ADMINISTRACIÓN Estadística Inferencial TEMA Planteamiento de Hipótesis en más de dos Poblaciones EQUIPO: Restaurantes 2 Aguilar Hernández Leticia Avila Ortega Gabriela Barcelata Beltrán Ana María Domínguez Rivera Laura María Durán Fabián Luis Selin García Velázquez Anahí González Cabañas Lizeth Pacheco Betancourt Adriana Nohemi PROGRAMA EDUCATIVO: Lic. Admón. Turística Veracruz, Ver., a 10 de mayo del 2010

Transcript of F:\planteamiento de hipótesis en mas de dos poblaciones

ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher

Mtra. A Elsa Retureta Álvarez Página 1

UNIVERSIDAD VERACRUZANA

FACULTAD DE ADMINISTRACIÓN

Estadística Inferencial

TEMA

Planteamiento de Hipótesis en más de dos Poblaciones

EQUIPO: Restaurantes 2

Aguilar Hernández Leticia Avila Ortega Gabriela

Barcelata Beltrán Ana María Domínguez Rivera Laura María

Durán Fabián Luis Selin García Velázquez Anahí

González Cabañas Lizeth Pacheco Betancourt Adriana Nohemi

PROGRAMA EDUCATIVO: Lic. Admón. Turística

Veracruz, Ver., a 10 de mayo del 2010

ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher

Mtra. A Elsa Retureta Álvarez Página 2

PLANTEAMIENTO DE HIPÓTESIS EN MÁS DE DOS POBLACIONES

Algunas veces se consideran problemas en que debemos decidir si las diferencias

observadas entre más de dos medias se pueden atribuir al azar o si existen

diferencias reales entre las medias de las poblaciones de las que se obtuvieron las

muestras.

Y esto se estudia cuando por ejemplo lo que queremos conocer sobre la base de

datos muestrales, si en realidad existe alguna diferencia:

en la efectividad de 3 métodos de enseñanza de una lengua extranjera, o quizás

queremos comparar la producción promedio por caballería de distintas variedades de arroz.

Un investigador agrícola pudiera estar interesado en saber que tipo de fertilizante da mejores rendimientos,

ó sí en determinado laboratorio médico se desea evaluar el efecto de diferentes medicamentos en la presión sanguínea.

El método que utilizamos para este propósito es un instrumento estadístico

poderoso conocido como ANALISIS DE VARIANZA.

ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher

Mtra. A Elsa Retureta Álvarez Página 3

GLOSARIO

ANOVA.- análisis de varianza (instrumento estadístico)

HIPOTESIS ESTADISTICA.- es una asunción relativa a una o varias poblaciones,

que puede ser cierta o no.

IDENTIDAD FUNDAMENTAL.- descomposición de la varianza total

GAUSSIANA.- En estadística y probabilidad se llama distribución normal,

distribución de Gauss o distribución gaussiana, a una de las distribuciones de

probabilidad de variable continua que con más frecuencia aparece en fenómenos

reales.

INSESGADO.- Se denomina sesgo de un estimador a la diferencia entre la esperanza (o valor esperado) del estimador y el verdadero valor del parámetro a estimar. Es deseable que un estimador sea insesgado o centrado, es decir, que su sesgo sea nulo por ser su esperanza igual al parámetro que se desea estimar.

GRADOS DE LIBERTAD.- es un estimador del número de categorías

independientes en una prueba particular o experimento estadístico.

ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher

Mtra. A Elsa Retureta Álvarez Página 4

1:2

2

0

D

E

SE

SEH 1:

2

2

1

D

E

SE

SEH

k

i

k

i

iji

k

i

i

k

i

ni

j

ij nindondeyyTTTdonden

Ty

111

2

1 1

2

FORMULARIO

2

122

n

N i

k

i

i

T

22

T

22

T

insesgadoestimadorunesSEdondeyykn

S D

ni

j

iijD

22

2

1

2 1

22

2

2

1221

2

2

0

11

E

i

k

i

ii

E

k

i

ii

E

SElaentonces

yquecasoesteenesqueyaciertanulahipótesislabajoinsesgadoserásóloy

desesgadoestimadorunesquelopork

n

SEsudondek

yyn

S

2

11 1

2

1 1

2k

i

ii

k

i

ni

j

iij

k

i

ni

j

ij yynyyyy

1

22

k

SCCMS

kn

SCCMS E

EED

DD

FUENTE DE

VARIACIÓN

SUMA DE

CUADRADOS

GRADOS DE

LIBERTAD

CUADRADO

MEDIO

ESTADÍSTICO

ENTRE

GRUPO

2

1

K

I

ii yyn k – 1 1n

SCE F0 = 2

2

D

E

S

S

k

i

ni

j

iij yy1

2

1

n – k kn

SCD

DENTRO DE

GRUPO

TOTAL K

i

ni

j

ij yy1 1

2

N - 1

ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher

Mtra. A Elsa Retureta Álvarez Página 5

INTRODUCCION

Una hipótesis estadística es una asunción relativa a una o varias poblaciones, que

puede ser cierta o no. Las hipótesis estadísticas se pueden contrastar con la

información extraída de las muestras y tanto si se aceptan como si se rechazan se

puede cometer un error.

La hipótesis formulada con intención de rechazarla se llama hipótesis nula y se

representa por H0. Rechazar H0 implica aceptar una hipótesis alternativa (H1).

Fisher realizó muchos avances en la estadística, siendo una de sus más

importantes contribuciones, la inferencia estadística creada por él en 1920.

Student y Ronald Fisher iniciaron una nueva era en el estudio de las distribuciones

muestrales. Ronald Aylmer Fisher encontró en muestras procedentes de una

población normal, la distribución del coeficiente de correlación, los coeficientes de

regresión, los coeficientes de correlación múltiple y de proporción de variables

conocida por el nombre de F.

Esta distribución de probabilidad se usa como estadística prueba en varias situaciones. Se emplea para probar si dos muestras provienen de poblaciones que poseen varianzas iguales. Esta prueba es útil para determinar si una población normal tiene una mayor variación que la otra y también se aplica cuando se trata de comparar simultáneamente varias medias poblacionales. La comparación simultánea de varias medias poblacionales se conoce como análisis de varianza (ANOVA). En ambas situaciones, las poblaciones deben ser normales y los datos tener al menos la escala de intervalos. Características de la distribución F

Existe una "familia" de distribuciones F. Un miembro específico de la familia se determina por dos parámetros: los grados de libertad en el numerador y en el denominador . Existe una distribución F para la combinación de 29 grados de libertad en el numerador y 28 grados en el denominador. Existe otra distribución F para 19 grados en el numerador y 6 en el denominador.

La distribución F es una distribución continua.

F no puede ser negativa

La distribución F tiene un sesgo positivo

A medida que aumentan los valores, la curva se aproxima al eje x, pero nunca lo toca

ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher

Mtra. A Elsa Retureta Álvarez Página 6

En este trabajo se abordara el tema de F Fisher esperando así cumplir con las

expectativas requeridas.asi también se presentaran de manera simultánea las

formulas utilizadas, las tablas a utilizar, con el fin de hacer más fácil el

entendimiento del tema planteado.

ANÁLISIS DE VARIANZA

El análisis de varianza, como técnica de lo que trata es: si se está estudiando la

característica cuyos valores dependen de varias clases de efectos que operan

simultáneamente, poder decidir si tales efectos son debido al azar o si realmente

son diferentes.

Esta técnica de lo que trata es de expresar una medida de la variación total de un

conjunto de datos como una suma de términos, que se pueden atribuir a fuentes o

causas específicas de variación; pues bien esta descomposición de la varianza

total se denomina: Identidad fundamental. Ella junto a la formación del estadístico

de prueba, se refleja en una tabla llamada “Tabla de Análisis de Varianza”, que

resume los principales aspectos teóricos prácticos de la técnica.

Hay un corolario que plantea que:

Si “k” poblaciones se unen y las varianzas de las “k” poblaciones son iguales a 2

se tiene que:

2

122

n

N i

k

i

i

T Por lo tanto si todas las medias son iguales entonces:

22

T , mientras que si alguna es diferente, se puede concluir que 22

T

De modo que una comparación de varianza puede conducir a una conclusión

sobre la igualdad de medias poblacionales.

El método que se utiliza es a través de los estimadores de 2.

Hay un Teorema que plantea que:

ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher

Mtra. A Elsa Retureta Álvarez Página 7

Si dos o más muestras proceden de una misma población o de diferentes

poblaciones, pero con igual varianza, entonces un estimador insesgado de 2

podrá obtenerse a través de la siguiente expresión:

insesgadoestimadorunesSEdondeyykn

S D

ni

j

iijD

22

2

1

2 1

A esta varianza se le da el nombre de Varianza dentro del grupo.

Sería bueno comentar que esta varianza como es insesgada proporciona una

estimación válida de la varianza desconocida de la población sin importarle si se

acepta o rechaza H0.

Hay otro Teorema, bajo las mismas condiciones que el anterior que plantea que

otro estimador de 2 es:

22

2

2

1221

2

2

0

11

E

i

k

i

ii

E

k

i

ii

E

SElaentonces

yquecasoesteenesqueyaciertanulahipótesislabajoinsesgadoserásóloy

desesgadoestimadorunesquelopork

n

SEsudondek

yyn

S

Este estimador es conocido como varianza entre grupos.

Esta situación que expresan estos estimadores se pudiera representar

gráficamente de la siguiente forma:

Para H0 cierta: Para H0 falsa:

ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher

Mtra. A Elsa Retureta Álvarez Página 8

x 1 ________ x 1

x x

x3 x 2 x3

x 2

1 2 3 1 2 3

En este caso las xi no son iguales pero los elementos de las 3 poblaciones si casi

iguales sus valores están cercanos son muy diferentes y originan medias

muestrales muy diferentes.

Si estamos en caso de H0 falsa, y se nos presenta esta situación se diferencia en

la suma de cuadrado entre grupo esta diferencia, mientras que si estamos en el

caso de H0 cierta la diferencia entre los grupos es mínima.

En el caso de la SC, dentro de los grupos lo que hace es comparar cada elemento

de la muestra con la media de su propio grupo, para una u otra conclusión de la

hipótesis nula, su cálculo no se refleja, el valor es el mismo.

Como ya dijimos, el análisis de varianza consiste en dividir la suma de cuadrado

total en dos fuentes de variación y proceder al análisis de las mismas, estas son la

variación dentro del grupo y la variación entre grupos. Como son variaciones la

vamos a expresar como sumas de cuadrados, es decir:

SCT = SCD + SCE

__ __ __ __

(Yij - Y) = (Yij - Yi) + (Yi – Y)

ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher

Mtra. A Elsa Retureta Álvarez Página 9

Representando estas la variación total que es igual a la variación dentro del grupo

más la variación entre grupos, gráficamente se representa de la siguiente forma:

_ .

yij - yi .

. _

_ . yij -y

y1 .

_ _ .

yi - y . _

Y

.

_ .

y2 .

Si elevamos al cuadrado ambos miembros, y sumamos por “j” e “i”, llegamos a la

Identidad Fundamental, planteada anteriormente.

2

11 1

2

1 1

2k

i

ii

k

i

ni

j

iij

k

i

ni

j

ij yynyyyy donde se considera:

Suma de Suma de Suma de

Cuadrado Cuadrado Cuadrado

Total Dentro del Grupo Entre Grupo

De la misma forma resulta de gran importancia en el Análisis de varianza, la

relación entre los grados de libertad (que ya se habló de ellos en el Tema

anterior).

ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher

Mtra. A Elsa Retureta Álvarez Página 10

Si se aplica el valor esperado en ambos miembros se obtienen, bajo el supuesto

de H0 cierto de que, los grados de libertad asociados a estas sumas de cuadrados

serán:

(n – 1) = (n – k) + (k – 1) Esto es,

Para la SCT, = para la SCD y para la SCE

Si dividimos las Sumas de Cuadrados entre los grados de libertad, se obtendrán

los estimadores de 2 planteados, es decir la varianza total 2

TS la varianza dentro

del grupo 2

DS , y la varianza entre grupo 2

ES . También estos cocientes se

denominan Cuadrados Medios.

1

22

k

SCCMS

kn

SCCMS E

EED

DD

Debido a que el cálculo de varianzas entre y dentro de grupos hay varios pasos,

se acostumbra a dar al grupo completo de resultados en una tabla conocida como

tabla de análisis de varianza (ANOVA). Esta tabla incluye las fuentes de variación,

las sumas de los cuadrados(es decir las variaciones), los grados de libertad, las

varianzas(es decir los cuadrados medios) y el valor del estadístico de prueba que

veremos más adelante.

ANOVA

FUENTE DE

VARIACIÓN

SUMA DE

CUADRADOS

GRADOS DE

LIBERTAD

CUADRADO

MEDIO

ESTADÍSTICO

ENTRE

GRUPO

2

1

K

I

ii yyn k – 1 1n

SCE F0 = 2

2

D

E

S

S

k

i

ni

j

iij yy1

2

1

n – k kn

SCD

DENTRO DE

GRUPO

TOTAL K

i

ni

j

ij yy1 1

2

N - 1

ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher

Mtra. A Elsa Retureta Álvarez Página 11

Aquí en este caso se utiliza como estadístico de prueba F0, ¿Por qué la

Distribución F? . La distribución a utilizar es la F de Fisher, que se basa en la

razón de 2 varianzas.

Con el fin de determinar si las medias de los diversos grupos son todas iguales, se

pueden examinar dos estimadores diferentes de la varianza de la población. Uno

de los estimadores se basa en la suma de los cuadrados dentro de los grupos

(SCD); el otro se basa en la suma de los cuadrados entre los grupos (SCE). Si la

hipótesis nula es cierta, estos estimadores deben ser aproximadamente iguales; si

es falsa el estimador basado en la suma de los cuadrados entre grupos debe ser

mayor.

El estimado de la varianza entre los grupos no solo toma en cuenta las

fluctuaciones aleatorias de una observación a otra, sino también mide las

diferencias de un grupo con otro. Si no hay diferencia de un grupo a otro, cualquier

diferencia en la media muestral se explicará por la variación aleatoria, y la

varianza entre grupos, debe estar cerca de la varianza dentro de los grupos. Sin

embargo si en realidad hay una diferencia entre los grupos, la varianza entre

grupos será significativamente mayor que la varianza dentro de los grupos.

Por todo lo anterior, la prueba estadística se basa en la razón de estas dos

varianzas: CME/CMD. Si la hipótesis nula es cierta, esta razón debe estar cercana

a uno; si la hipótesis nula es falsa entonces el numerador debe ser mayor que el

denominador y la razón debe ser mayor que uno

Como se aprecia el problema se reduce a buscar un valor a partir del cuál el

estadístico de prueba resulte significativamente mayor que 1, y así se rechazará la

hipótesis de que no hay diferencias entre las medias de los grupos cuando la

razón entre las varianzas CME/CMD F k – 1;n – k)

De aquí se infiere que las hipótesis nula y alternativa que se plantearán serán las

siguientes:

H0: 1 = 2 = . . . = k

H1: alguna i diferente

Es bueno señalar que estas hipótesis son equivalentes a decir:

1:2

2

0

D

E

SE

SEH 1:

2

2

1

D

E

SE

SEH

ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher

Mtra. A Elsa Retureta Álvarez Página 12

Ya que como se vio anteriormente 2

ES es un estimador sesgado de la VARIANZA y

sólo será insesgado si se cumple que H0 es cierta, mientras que 2

DS es un

estimador insesgado.

Además es la razón por la cuál la distribución a utilizar es la F de Fisher, que no es

más que la relación entre 2 varianzas y siempre considerando, la región crítica

hacia la derecha, ya que nuestro problema se reduce a buscar un valor a partir del

cuál es estadístico de prueba resulte significativamente mayor que 1 y así

Rechazaremos H0 a un nivel de significación , si knk

D

E FS

S ;1

12

2

Antes de continuar queremos plantear que las fórmulas de cálculo de los

estimadores de las varianzas poblacionales conceptuales o por definición son muy

tediosas, sin embargo hay para estos estimadores unas fórmulas de cálculos

abreviadas que son más fáciles.

SCT =k

i

k

i

iji

k

i

i

k

i

ni

j

ij nindondeyyTTTdonden

Ty

111

2

1 1

2

SCE = n

T

n

Tk

i i

i

2

1

2

SCD = k

i i

ik

i

ni

j

ijn

Ty

1

2

1 1

2

Aunque se debe señalar que dado el carácter aditivo de estas varianzas, se

acostumbra a obtener la SCD por diferencia, es decir como:

SCT = SCE + SCD se obtendría despejando: SCD = SCT - SCE

Para aplicar esta técnica es necesario que se cumplan ciertas suposiciones sobre

los datos investigados.

1.- Las características medibles se distribuyen normalmente en cada población.

Esto es kidondeNY iii ,2,1; 2

2.- Las varianzas de las k poblaciones son iguales: 22

2

2

1 k

ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher

Mtra. A Elsa Retureta Álvarez Página 13

3.- Las características medibles son estadísticamente independientes, de una

población a otra: Y1, Y2, ... , Yk.

4.- Las muestras n1, n2, ... ,nk de los k grupos poblacionales deben seleccionarse a

través del M.A.S.

Vamos a ver un Ejemplo:

Los datos siguientes corresponden al Costo de Producción de un producto

fabricado bajo tecnologías diferentes. Realice una prueba estadística a un = 0.05

para decidir si existen diferencias entre las tecnologías, que puedan afectar los

Costos.

Tecnología Yi j ni Ti Ti2 Ti

2/ni Y2i j

A 7 4 6 4 9 5 30 900 180 49 16 36 16 81 198

B 2 4 5 6 3 5 20 400 80 4 16 25 36 9 90

C 7 8 7 11 7 5 40 1600 320 49 64 49 121 49 332

15 90 580 620

Hay que tener en cuenta que el subíndice i, representa las filas, y el j las

columnas.

Se prepara la tabla atendiendo a lo que se necesita a partir de las formulas

abreviadas planteadas, únicamente hay que tener en cuenta que los niveles se

deben planteara en el sentido de fila.

Resumiendo: n = 15; T = 90; k = 3; n1 = n2 = n3 = 5

Luego:

n

TYSC

k

i

ni

j

ijT

2

1 1

2 = 620 – 902/15 = 620 – 8100/15 = 620 – 540 = 80

SCE = n

T

n

Tk

i i

i

2

1

2

= 580 – 540 = 40

ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher

Mtra. A Elsa Retureta Álvarez Página 14

SCD = k

i i

ik

i

ni

j

ijn

Ty

1

2

1 1

2 = 620 – 580 = 40 o también utilizando la identidad

fundamental y en ella se despeja SCD, esto es:

SCT = SCD + SCE SCD = SCT – SCE = 80 – 40 = 40

Y ya estamos en condiciones de plantear la tabla de análisis de varianza, para el

cálculo del estadístico de Prueba.

ANOVA

Fuente de

Variación

Suma de

Cuadrado

Grados de

Libertad

Cuadrado

medio

Estadístico de

Prueba

Entre grupo

Dentro grupo

40

40

2

12

20

3.33

06.63.3

200F

Total 80 14

H0: 321

H1: alguna i diferente

= 0.05

2

2

D

E

S

S = 6.06

W: 2

2

D

E

S

S F1-

(k – 1; n – k) = 2

2

D

E

S

S Fo.95

(2, 12) = 2

2

D

E

S

S 3.89

ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher

Mtra. A Elsa Retureta Álvarez Página 15

RR

3.89

R:D:/ Rechazo H0 F0 3.89

No Rechazo H0 F0 3.89

D/ F0 = 6.06 3.89 Rechazo H0 que aceptamos H1 lo que nos indica que

existen diferencias significativas entre los costos de producción para por lo menos

una tecnología a un = 0.05

Si quisiéramos saber cual o cuales tecnologías son diferentes se pudiera

completar el análisis con una prueba T’Student de diferencia de media, probando

dos a dos dichas tecnologías.

Esta prueba de la homogeneidad de las varianzas fue desarrollada por Barttlet, y

se basa en el cálculo de un cociente, el cuál se denota por M/C.

se utiliza para comprobar uno de los supuestos del análisis de varianza, si se

quiere, el más importante, que es el de varianza constante(conocido por

Homocedasticidad)

Así las hipótesis a plantear serían:

H0: 22

2

2

1 k

H1: alguna 2

i diferente

Y el estadístico de prueba será el cociente M/C que es un estadístico que mide la

variabilidad entre las varianzas muestrales ya que:

2

1

2 ln1ln i

k

i

iD SnSknM Donde

ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher

Mtra. A Elsa Retureta Álvarez Página 16

kn

Sn

S

k

i

ii

D1

2

2

1

y

2

12

1i

k

i

iji

in

YY

S

Se puede observar que si las 2

iS difieren poco entre sí el valor de M, será pequeño

y si suponemos que la 2

iS son iguales, entonces M tomará el valor cero.

Demostración:

2

1

2 ln1ln i

k

i

iD SnSknM si 2

iS son iguales, entonces se trata como una

constante y se saca fuera de la sumatoria.

k

i

ii

k

i

ii

nSkn

nS

knM1

21

2

1ln

1

ln

Como knnk

i

i

01

1

M=(n – k) knSkn

knSi

i 22

lnln

M= (n- k) ln 2

iS - (ln 2

iS ) n- k

M = 0

Veamos el cálculo del estadístico de Prueba: M/C

M = 1 + k

i i knnk 1

1

1

1

13

1

Barttlet demostró que el estadístico M sigue aproximadamente una distribución 2,

con k-1 grados de libertad para (ni – 1) 4, y se divide entre una cantidad C, como

la planteada anteriormente; el cociente mejora la aproximación, y es más preciso

que si utilizáramos solamente M.

La expresión de M, puede transformarse para trabajar con logaritmos comunes.

M = 2.3026 2

10

1

2

10 log1log i

k

i

iD SnSkn se debe aclarar que se puede

aplicar tanto logaritmo comunes como naturales.

ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher

Mtra. A Elsa Retureta Álvarez Página 17

La región crítica estará dada por: 12

1/: kCMW que gráficamente quedará representada de la siguiente

forma:

R no R. RR

)1(2

1k

A continuación vamos a comprobar este supuesto de varianza constantes o

iguales en el ejemplo que se desarrollo en la conferencia anterior.

Comencemos calculando las varianzas: 2

iS , para ello es necesario primeramente

hallar las medias de cada grupo:

615

908

5

404

5

206

5

30

3

33

2

22

1

11

n

TY

n

TY

n

TY

n

TY

Ya que 1

2

12

i

k

ii

n

YijYi

S

5.44

18

4

94041

4

)69()64()66()64()67( 222222

1S

5.24

10

4

14104

4

)43()46()45()44()42( 222222

2S

34

12

4

19101

4

)87()811()87()88()87( 222222

3S

ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher

Mtra. A Elsa Retureta Álvarez Página 18

33.312

)10(4

12

)35.25.4(4)1(

1

2

2

kn

Sni

S

k

i

i

D

Ya estamos en condiciones de plantear los elementos que hacen falta para

determinar M

Población ni 2

iS ln 2

iS (ni – 1) ln 2

iS

1 5 4.5 1.50408 6.01632

2 5 2.5 0.91629 3.66516

3 5 3 1.09861 4.39444

14.07592

ln 2

DS = ln 3.33 = 1.20297

M = (n – k) ln 2

DS -k

i

iSni1

2ln)1(

M = 12(1.20297) – 14.07592

= 14.43564 – 14.07592

= 0.35972

C=

11.172

81

2

1

4

3

6

11

2

1

4

1

4

1

4

1

6

11

1

1

1

13

11

1 1

k

i knnk

M/C = 0.35972/1.11 = 0.323

Ya estamos en condiciones de plantear la prueba, ya que calculamos el

estadístico de prueba.

ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher

Mtra. A Elsa Retureta Álvarez Página 19

H0: 2

3

2

2

2

1

H1: alguna 2

i diferente

= 0.05

M/C 2(1- )

k-1

W: M/C 2(1- )

k-1 = M/C 5.99

R:D:/ Rechazo H0 M/C 5.99

No Rechazo H0 M/C 5.99

D/ . M/C = 0.323 5.99 No Rechazo H0 : 2

3

2

2

2

1 a un = 0.05

ESTADISTICA INFERENCIAL Planteamiento de Hipótesis en más de dos Poblaciones. Análisis de Varianzas. Fisher

Mtra. A Elsa Retureta Álvarez Página 20

UTILIDAD

Esta distribución de probabilidad se usa en estadística como prueba en varias

situaciones. Se emplea para probar si dos muestras provienen de poblaciones que

poseen varianzas iguales. Esta prueba es útil para determinar si una población

normal tiene una mayor variación que la otra y también se aplica cuando se trata

de comparar simultáneamente varias medias poblacionales. La comparación

simultánea de varias medias poblacionales se conoce como análisis de varianza

(ANOVA). En ambas situaciones, las poblaciones deben ser normales y los datos

tener al menos la escala de intervalos.