Prueba de chi cuadrado y pruebas no paraetricas

83
EQUIPO # 2 Miriam Álvarez Rosalba Monarrez Marlene Reséndiz Gerardo Gómez Iván Salinas

Transcript of Prueba de chi cuadrado y pruebas no paraetricas

Page 1: Prueba de chi cuadrado y pruebas no paraetricas

EQUIPO # 2

Miriam ÁlvarezRosalba MonarrezMarlene ReséndizGerardo GómezIván Salinas

Page 2: Prueba de chi cuadrado y pruebas no paraetricas

• Descripción• La prueba de bondad de ajuste se aplica

en diseños de investigación en los que se estudia a un único grupo.

• La prueba compara la distribución de frecuencias observada (Fo) de una variable usualmente cualitativa,

• pero que también puede ser cuantitativa, con la distribución de frecuencias de la misma variable medida en un grupo de referencia.

PRUEBA DE BONDAD DE AJUSTE

Page 3: Prueba de chi cuadrado y pruebas no paraetricas

• El procedimiento de la prueba implica el cálculo de una distribución esperada (Fe) en el grupo estudiado, usando como punto de partida a la distribución de la variable en el grupo de referencia.

• El propósito de la prueba es averiguar si existen diferencias estadísticamente significativas entre la distribución observada (Fo) y la distribución esperada (Fe).

• En la prueba se plantean las siguientes hipótesis estadísticas:

• Hipótesis estadística nula: Ho: Fo = Fe• Hipótesis estadística alterna: Ha: Fo ≠

Fe

Page 4: Prueba de chi cuadrado y pruebas no paraetricas

• El procedimiento de la prueba incluye el cálculo de la medida de resumen llamada Chi cuadrada.

• El rechazo de la Ho ocurre cuando el valor calculado con los datos resulta mayor que el valor crítico de dicha medida contenido en una tabla llamada Valores Críticos de Chi cuadrada.

• En el caso de que el valor de Chi cuadrada calculada sea igual o menor al de Chi cuadrada crítica se dice que no se rechaza a la Ho y, por tanto, se concluye que la Fo es semejante a la Fe.

• En otras palabras, se dice que ambas

distribuciones se ajustan bien; de ahí el nombre de la prueba: bondad de ajuste.

Page 5: Prueba de chi cuadrado y pruebas no paraetricas

• Consideraciones generales:

• La prueba o test chi-cuadrado es considerada como una prueba no paramétrica que mide la discrepancia entre una distribución observada y una observación teórica (bondad de ajuste)

• Indicando en que medida las diferencias existentes entre ambas, de haberlas, se deben al azar en el contraste de hipótesis. También se utiliza el test chi-cuadrado para probar la homogeneidad entre dos poblaciones o independencia de dos variables entre si, mediante la presentación de datos dados en tablas de contingencia.

TEST O PRUEBA CHI-CUADRADO

Page 6: Prueba de chi cuadrado y pruebas no paraetricas

• Es decir:

• a) Chi-cuadrado de bondad de ajuste o significancia: para comprobar si los datos se ajustan a una distribución concreta.

• b) Chi-cuadrado de homogeneidad: para ver si dos

muestras provienen de una misma población o una población con una misma familia de distribución (los datos vienen dado en una tabla de contingencia).

• c) Chi cuadrado de independencia: para comprobar si dos muestras son independientes ( los datos vienen en una tabla de contingencia).

Page 7: Prueba de chi cuadrado y pruebas no paraetricas

• Para resolver estos problemas utilizaremos la distribución χ²cuadrado.

• La aplicaremos básicamente:

Bondad de Ajuste

Pruebas con probabilidades de cada categoría completamente

especificada Bondad de ajuste a una variable discreta Bondad de ajuste a una variable continua

Tablas de contingencia

Pruebas de Homogeneidad Pruebas de Independencia

χ²- Cuadrado

Page 8: Prueba de chi cuadrado y pruebas no paraetricas

• La fórmula que da el estadístico de prueba (de la muestra) es el siguiente:

ESTADÍSTICO Y ESTIMADOR:

k

i i

ii

EEO

1

22

Page 9: Prueba de chi cuadrado y pruebas no paraetricas

• donde :• Σ : Letra griega sigma que indica sumar

todas las expresiones del siguiente tipo

• o : Cada frecuencia observada

• e : cada frecuencia esperada

• k: Número de categorías o clases

• k-m-1: grados de libertad donde m es el número de parámetros a estimar.

Page 10: Prueba de chi cuadrado y pruebas no paraetricas

• Juan Pérez, director de Mercadeo de Alden de Juárez, tiene la responsabilidad de controlar el nivel de existencias para cuatro tipos de automóvil vendidos por la firma. En el pasado, ha ordenado nuevos automóviles bajo la premisa de que los cuatro tipos son igualmente populares y la demanda de cada tipo es la misma. Sin embargo, recientemente las existencias se han vuelto más difíciles de controlar, y Juan considera que debería probar su hipótesis respecto a una demanda uniforme. Sus hipótesis son:

• H0: La demanda es uniforme para los cuatro tipos de autos.

• H1: La demanda no es uniforme para los cuatro tipos de autos.

• Juan desea probar un nivel de significancia 95% α = 0.05

1. PRUEBA DE BONDAD PARA UN AJUSTE UNIFORME

Page 11: Prueba de chi cuadrado y pruebas no paraetricas

• La Tabla 1.1 muestra la expectativa uniforme para una muestra de 48 autos vendidos durante el último mes

Tipo de auto Ventas observadas Ventas esperadas

Ka 15 12

Fiesta 11 12

Focus 10 12

Clio 12 12

Page 12: Prueba de chi cuadrado y pruebas no paraetricas

Ka Fiesta Focus Clío

o 15 11 10 12

e 12 12 12 12

(o −e) (15-12) (11-12) (10-12) (12-12) (𝑜−𝑒)2 (15−12)2 (11−12)2 (10−12)2 (12−12)2 (𝑜−𝑒)2𝑒 (15−12)212

(11−12)212 (10−12)212

(12−12)212

Page 13: Prueba de chi cuadrado y pruebas no paraetricas

• Debido a que no hay parámetros que estimarse el número de grados de libertad es k-1 = 4-1 = 3 grados de libertad en este caso.

815.72

3,05.0

Page 14: Prueba de chi cuadrado y pruebas no paraetricas
Page 15: Prueba de chi cuadrado y pruebas no paraetricas

REGLA DE DECISIÓN:

"815.72 siRechazar .815.72 sirechazar No"

• Como 1.17 < 7.815, la hipótesis Ho se acepta.

• En este caso se concluye que los 4 modelos de la agencia (Ka, Fiesta, Focus y Clío) tienen una demanda uniforme.

Page 16: Prueba de chi cuadrado y pruebas no paraetricas

• La distribución chi-cuadrada también permite la comparación de dos atributos para determinar si existe una relación entre ellas.

• Ejemplo:• Paty Alvarado es la directora de investigación de

Plaguicidas de Juárez. En su proyecto actual Paty debe determinar si existe alguna relación entre la clasificación de efectividad que los consumidores asignan a un nuevo insecticida y el sitio (urbano o rural) en el cual se utiliza dicho producto. De los 100 consumidores a quienes se le aplicó la encuesta, 75 vivían en zonas urbanas y 25 en zonas rurales.

TABLAS DE CONTINGENCIA. UNA PRUEBA DE INDEPENDENCIA

Page 17: Prueba de chi cuadrado y pruebas no paraetricas

HIPOTESIS:

• H0: La clasificación y la ubicación son independientes.

• H1: La clasificación y la ubicación no son independientes

• Mediante un intervalo de confianza 90% α = .10

• Analice el problema

Page 18: Prueba de chi cuadrado y pruebas no paraetricas

Clasificación Urbano Rural Total

Arriba del promedio

2023.25

117.75

31

Promedio 4036

812

48

Debajo del promedio

1515.75

65.25

21

Total 75 25 100

• La siguiente tabla resume las clasificaciones hechas por los consumidores.

Page 19: Prueba de chi cuadrado y pruebas no paraetricas

• En este caso para determinar la frecuencia esperada tenemos la siguiente formula:

• F. Esperada= Total de Fila x Total de Columna Total General

Page 20: Prueba de chi cuadrado y pruebas no paraetricas

73.3

25.5

225.56

75.15

275.1515

12

2128

36

23640

75.7

275.711

25.23

225.23202

Page 21: Prueba de chi cuadrado y pruebas no paraetricas

La prueba tiene (r – 1)(c – 1) = (3 -1)(2 – 1) = 2 grados de libertad

ESTADÍSTICO Y ESTIMADOR:

Page 22: Prueba de chi cuadrado y pruebas no paraetricas

605.42

2,10.0

Page 23: Prueba de chi cuadrado y pruebas no paraetricas

TABLA

Page 24: Prueba de chi cuadrado y pruebas no paraetricas
Page 25: Prueba de chi cuadrado y pruebas no paraetricas

CONCLUSIÓN

"605.42 siRechazar .605.42 sirechazar No"

la hipótesis nula no se rechaza ya que el estadístico de Chi cuadrada es menor al estimador proveniente de las tablas.

3.73 < 4.605En este caso tenemos que la clasificación y la ubicación son independientes. No dependen una de la otra.

Page 26: Prueba de chi cuadrado y pruebas no paraetricas
Page 27: Prueba de chi cuadrado y pruebas no paraetricas

• Ejemplo:

• Evaluar la efectividad de un antibiótico en tres enfermedades de transmisión sexual.

PRUEBA DE HOMOGENEIDAD

A B CSI 75 25 70 170

NO 15 45 10 70TOTAL 90 70 80 240

Curabilidad de la enfermedad

ETSTOTAL

Page 28: Prueba de chi cuadrado y pruebas no paraetricas

• Ho: Las muestras provienen de poblaciones homogéneas según la curabilidad de pacientes con ETS.

• H1: Las muestras no provienen de poblaciones homogéneas según la curabilidad de pacientes con ETS.

• Nivel de significación de: α=0.05

PLANTEAMIENTO DE HIPÓTESIS.

Page 29: Prueba de chi cuadrado y pruebas no paraetricas

CÁLCULO FRECUENCIAS ESPERADAS

Page 30: Prueba de chi cuadrado y pruebas no paraetricas

38.59

40.23

234.2310

42.20

242.2045

25.26

225.2615

67.56

267.5670

.58.49

258.4925

75.63

275.63752

Page 31: Prueba de chi cuadrado y pruebas no paraetricas

• K=(r – 1)(c – 1) = (2 -1)(3 – 1) = 2 grados de libertad

CÁLCULO DE GRADOS DE LIBERTAD

Page 32: Prueba de chi cuadrado y pruebas no paraetricas
Page 33: Prueba de chi cuadrado y pruebas no paraetricas

• DECISIÓN:

• Ho se rechaza ya que el nivel del estadístico

es mayor al estimador 59.38 > 5.99

• CONCLUSIÓN:

• Las muestras no provienen de poblaciones homogéneas según la curabilidad de pacientes

• con ETS.

Page 34: Prueba de chi cuadrado y pruebas no paraetricas

=INV.CHICUAD.CD(F13,F14)

=PRUEBA.CHICUAD(F6:F9,G6:G9)

=PRUEBA.CHI.INV(F17,F14)

=SI(J14, "Se acepta H0", "Se rechaza H0")

=CONTARA(E6:E9)-1

Page 35: Prueba de chi cuadrado y pruebas no paraetricas

=CONTARA((D7:D9))-1*CONTAR((E6:F6))-1=INV.CHICUAD.CD(K7,K8)=PRUEBA.CHICUAD(E7:F9,E14:F16)

=PRUEBA.CHI.INV(K10,K8)

=SI(L13, "Se acepta H0", "Se rechaza H0")

Page 36: Prueba de chi cuadrado y pruebas no paraetricas

=CONTARA((D16:D17)-1)*CONTARA(E15:G15)-1=PRUEBA.CHI.INV(L13,L14)

=PRUEBA.CHICUAD(E6:G7,E16:G17)

=PRUEBA.CHI.INV(L17,L14)

Page 37: Prueba de chi cuadrado y pruebas no paraetricas

• Las técnicas estadísticas estudiadas hasta ahora, en conjunto, denominadas ESTADÍSTICA PARAMÉTRICA, son aplicadas básicamente a variables continuas. Estas técnicas se basan en especificar una forma SUPUESTA O CONOCIDA de la distribución de la variable aleatoria y de los estadísticos derivados de los datos.

• Es común en la ESTADÍSTICA PARAMÉTRICA que se asuma que la población de la cual la muestra es extraída tiene una distribución NORMAL o aproximadamente normal . Esta propiedad es necesaria para que algunas pruebas de hipótesis sean válidas. Afortunadamente, la mayor parte de estas pruebas aún son confiables cuando se experimentan ligeras desviaciones de la normalidad, en particular cuando el tamaño de la muestra es grande.

METODOS ESTADISTICOS NO PARAMÉTRICOS

Page 38: Prueba de chi cuadrado y pruebas no paraetricas

• Sin embargo, en muchas ocasiones no se puede determinar la distribución original ni la distribución de los estadísticos por lo que en realidad no tenemos un parámetro a estimar, sólo tenemos distribuciones que comparar. En estos casos empleamos la ESTADESTADÍSTICA NO PARAMETRICA.

• Los métodos no paramétricos ó métodos de distribución libre, a menudo no suponen conocimiento de ninguna clase acerca de las distribuciones de las poblaciones fundamentales, excepto que éstas son continuas.

• Los procedimientos no paramétricos o de distribución libre se usan con mayor frecuencia por los analistas de datos. Existen muchas aplicaciones donde los datos se reportan no como valores de un continuo sino en una escala ordinal tal que es natural asignar rangos a los datos.

Page 39: Prueba de chi cuadrado y pruebas no paraetricas

• Se debe señalar que hay varias desventajas asociadas con las pruebas no paramétricas. En primer lugar, no utilizan toda la información que proporciona la muestra, y por ello una prueba no paramétrica será menos eficiente que el procedimiento paramétrico correspondiente, cuando se pueden aplicar ambos métodos.

• En consecuencia, para lograr la misma potencia, una prueba no paramétrica requerirá la correspondiente prueba paramétrica cuando sea posible.

• Como se indicó antes, ligeras divergencias de la normalidad tienen como resultado desviaciones menores del ideal para las pruebas paramétricas estándar. Esto es cierto en particular para la prueba t. En este caso, el valor P puede ser ligeramente erróneo si existe una violación moderada de la suposición de normalidad.

• En resumen, si se puede aplicar una prueba paramétrica y una no paramétrica al mismo conjunto de datos, debemos hacerlo. Sin embargo, se debe reconocer que las suposiciones de normalidad a menudo no se pueden justificar, y que no siempre se tienen mediciones cuantitativas por lo que las pruebas paramétricas estarían fuera de alcance.

Page 40: Prueba de chi cuadrado y pruebas no paraetricas

• Ventajas

• No se requieren requisitos previos.• Con n pequeña ( n< 30 ) puede no haber

alternativa.• No se requiere conocer la distribución de población. • Es sencilla de aplicar incluso de forma manual • La interpretación suele ser más directa.

• Desventajas• En varios casos se requiere transformar los datos

en rangos, perdiendo la información puntual.• Con n grande es menos potente que la paramétrica.• Con n muy pequeña (n<6) es inconsistente.

ESTADÍSTICA NO PARAMÉTRICA

Page 41: Prueba de chi cuadrado y pruebas no paraetricas

COMPARACIÓN DE LAS PRUEBAS PARAMÉTRICAS Y NO PARAMÉTRICAS

Page 42: Prueba de chi cuadrado y pruebas no paraetricas

• Una prueba no paramétrica utilizada comúnmente para tomar decisiones en relación a diferencias entre poblaciones como contraparte de la distribución t, la cual requiere el supuesto de normalidad de ambas poblaciones. La prueba de signos es útil cuando no se cumple este supuesto.

• • Se supone que se tienen datos antes y después para una muestra y se

desean comparar estos conjuntos de datos correspondientes. Se hace restando las observaciones por pares, y se anota el signo algebraico resultante. No es importante la magnitud de la diferencia, sino solo si resulta un signo más o un signo menos.

• La hipótesis nula establece que no existe diferencia en los conjuntos de datos. Si esto es cierto, entonces un signo más y un signo menos son igualmente probables. La probabilidad de que ocurra cualquiera es de 0.50. Una prueba de dos extremos es:

• H0: m = p

• H1: m ≠ p

PRUEBA DEL SIGNO 

Page 43: Prueba de chi cuadrado y pruebas no paraetricas

• en donde m y p son los números de signos menos y de signos más, respectivamente. Una prueba de un solo extremo es:

• H0: m = p

• H1: m > p

• O• • H0: m = p

H1: m < p

Page 44: Prueba de chi cuadrado y pruebas no paraetricas

• Ejemplo. Un analista de mercado desea medir la efectividad de una campaña promocional del producto de su empresa. Antes de la campaña, selecciona 12 tiendas minoristas y registra las ventas del mes. Durante el segundo mes se termina la campaña promocional y se registran de nuevo las ventas. La Tabla 1.3 muestra los niveles de ventas, junto con el signo algebraico que resulta cuando las ventas del segundo mes se restan de las del primer mes.

Page 45: Prueba de chi cuadrado y pruebas no paraetricas

• Ventas para doce tiendas minoristas

Page 46: Prueba de chi cuadrado y pruebas no paraetricas

• Se desea probar la hipótesis de que la promoción incrementó las ventas con un nivel de significancia del 5%. Esta es una prueba de extremo derecho, como se muestra enseguida:

• H0: m = p

• H1: m > p

• Pregunta: ¿Qué haría que se rechazara la hipótesis nula?• un número significativamente grande de signos menos• un número significativamente pequeño de signos más

• Número de signos menos = 6• Número de signos más = 4• Los valores que resultan en una diferencia de cero se eliminan.• La Tabla de Distribución Binomial establece que la probabilidad de seis

o más signos menos es:

3770.0

6230.01

)5X(P1)5.0,10n|6m(p

Page 47: Prueba de chi cuadrado y pruebas no paraetricas

• Este valor de 0.3770 es la probabilidad de obtener seis o más signos menos ( o cuatro o menos signos más) si la probabilidad de ocurrencia de cualquier signo es de p = 0.5. Se nota que si el número de signos menos fuera inusitadamente grande, se rechazaría la hipótesis nula. Sin embargo, 6 no es un número grande. La probabilidad de su ocurrencia es mayor que un a de 0.5%, el evento de 6 signos menos no se considera grande, y la hipótesis nula de que H0: m £ p no se rechaza, por lo tanto no se puede considerar que la promoción haya sido exitosa

Page 48: Prueba de chi cuadrado y pruebas no paraetricas

• Se entenderá por medición al proceso de asignar el valor a una variable de un elemento en observación. Este proceso utiliza diversas escalas: nominal, ordinal, de intervalo y de razón.

• Las variables de las escalas nominal y ordinal se denominan también categóricas, por otra parte las variables de escala de intervalo o de razón se denominan variables numéricas. Con los valores de las variables categóricas no tiene sentido o no se puede efectuar operaciones aritméticas. Con las variables numéricas sí.

• La escala nominal sólo permite asignar un nombre al elemento medido. Esto la convierte en la menos informativa de las escalas de medición.

• Los siguientes son ejemplos de variables con este tipo de escala:

•             Nacionalidad. •             Uso de anteojos. •             Número de camiseta en un equipo de fútbol. 

ESCALA DE MEDICIÓN.

Page 49: Prueba de chi cuadrado y pruebas no paraetricas

•             Número de Cédula Nacional de Identidad. • A pesar de que algunos valores son formalmente numéricos,

sólo están siendo usados para identificar a los individuos medidos.

• La escala ordinal, además de las propiedades de la escala nominal, permite establecer un orden entre los elementos medidos. 

• Ejemplos de variables con escala ordinal:•             Preferencia a productos de consumo. •             Etapa de desarrollo de un ser vivo. •             Clasificación de películas por una comisión

especializada. •             Madurez de una fruta al momento de comprarla. 

• La escala de intervalo, además de todas las propiedades de la escala ordinal, hace que tenga sentido calcular diferencias entre las mediciones.

Page 50: Prueba de chi cuadrado y pruebas no paraetricas

• Los siguientes son ejemplos de variables con esta escala:•             Temperatura de una persona. •             Ubicación en una carretera respecto de un punto de

referencia (Kilómetro 85 Ruta 5). •             Sobrepeso respecto de un patrón de comparación. •             Nivel de aceite en el motor de un automóvil medido con

una vara graduada.• Finalmente, la escala de razón permite, además de lo de las

otras escalas, comparar mediciones mediante un cuociente.• Algunos ejemplos de variables con la escala de razón son los

siguientes:•             Altura de personas. •             Cantidad de litros de agua consumido por una persona

en un día. •             Velocidad de un auto en la carretera. •             Número de goles marcados por un jugador de

básquetbol en un partido

Page 51: Prueba de chi cuadrado y pruebas no paraetricas

• La escala de intervalo tiene un cero que se establece por convención y puede tener variaciones. Es arbitrario. Por otra parte, la escala de razón tiene un cero real, fijo, no sujeto a variaciones; es propio de la medición hecha.

• Ejercicio• Para cada variable dada en los ejemplos anteriores, señale el

mecanismo de medición. Si es necesario usar algún instrumento, propóngalo.

• Si, por ejemplo, el objetivo es asignar valor a alturas; el alumno podría decidir que el procedimiento apropiado es hacer comparaciones con un estándar y que un instrumento adecuado es una regla calibrada en centímetros.

• Ejercicio: Estudio de textos.• Se desea comparar los textos de estudio de diferentes asignaturas.

Para esto, describa al menos tres variables numéricas que permitan efectuar dicha comparación. Sugiera, cuando corresponda, la respectiva unidad de medida que Ud. emplearía y un instrumento apropiado para efectuar la medición.

Page 52: Prueba de chi cuadrado y pruebas no paraetricas

• Este problema se ubica en un contexto familiar para los estudiantes y los introduce a un aspecto importante de un estudio estadístico: la selección de variables.

• Los alumnos deberían descubrir que las variables dependen del objetivo de la comparación. Por ejemplo, si se tratara de facilitar su transporte en una mochila de dimensiones determinadas, podrían considerar, entre otras, las siguientes variables:

• Peso y volumen de la mochila.• Flexibililidad de las tapas.• Uso de un marco de aluminio.

Page 53: Prueba de chi cuadrado y pruebas no paraetricas

• Prueba de los signos de Wilcoxon• Se usa para hacer pruebas de hipótesis acerca de la

mediana de una población

• Ho: La Mediana poblacional es igual a un valor dado.

• H1: La Mediana es menor, mayor : ó distinta del valor dado

• La prueba estadística está basada en la distribución Binomial con probabilidad de éxito p=½, puesto que la probabilidad de que un dato sea mayor o menor que la mediana es ½ ó 0.5.

• Para calcularla se determinan las diferencias de los datos con respecto al valor dado de la mediana y se cuentan los signos positivos y negativos.

PRUEBAS NO-PARAMÉTRICAS PARA UNA SOLA MUESTRA

Page 54: Prueba de chi cuadrado y pruebas no paraetricas

• Suponga que las hipótesis son (menor que o cola izquierda):

• Ho ; μ= μo • H1; μ< μo

• Supóngase que se toman datos X1, X2, . . . , Xn para conformar una muestra aleatoria tomada de la población de interés. Fórmense las diferencias

• Xi-μo , para i =1,2,...n • Ahora bien si la hipótesis nula o Ho ; μ= μo es verdadera,

cualquier diferencia Xi-μo tiene la misma probabilidad de ser negativa o positiva

• Un estadístico de prueba apropiado es el número de estas diferencias que son positivas, por ejemplo R+. Por consiguiente, la prueba de la hipótesis nula es en realidad una prueba de que el número de signos positivos es un valor de una variable aleatoria binomial con parámetro P = 0.5.

Page 55: Prueba de chi cuadrado y pruebas no paraetricas

• Puede calcularse un valor P para el número observado de signos positivos r+ directamente de la distribución binomial. Al probar la hipótesis se rechaza H0 en favor de H1sólo si la proporción de signos positivos es suficientemente menor que 0.5 ( o de manera equivalente, si el número observado de signos positivos r+ es muy pequeño).

• Por tanto, si el valor P calculado

• P = P(R+≤r+ cuando p = 0.5)

• es menor o igual que algún nivel de significancia seleccionado previamente, entonces se rechaza H0 y se concluye que H1 es verdadera.

Page 56: Prueba de chi cuadrado y pruebas no paraetricas

• Si n>20 se puede usar aproximación Normal a una Binomial con p = q = 0.5. Es decir,

• con este valor Z calculado se puede encontrar el valor P(probabilidad de que sea mayor o menor que Z), usando la curva normal.

• p es la probabilidad de éxito de la distribución binomial, que es 0.5 para la prueba de la mediana, pero P es el valor de la probabilidad de encontrar Z mayor o menor que el calculado.

Page 57: Prueba de chi cuadrado y pruebas no paraetricas

• Para probar la otra hipótesis unilateral de cola derecha (mayor que)

• Ho ; μ= μo• H1; μ> μo

• se rechaza H0en favor de H1sólo si el número observado de signos más, r+, es grande o, de manera equivalente, cada vez que la fracción observada de signos positivos es significativamente mayor que 0.5. En consecuencia, si el valor P calculado.

• P = P(R+≥r+ cuando p = 0.5)

• es menor que α, entonces H0s rechaza y se concluye que H1es verdadera.

Page 58: Prueba de chi cuadrado y pruebas no paraetricas

• También puede probarse la alternativa bilateral (igual o diferente, o dos colas). Si las hipótesis son:

• Ho ; μ= μo • H1; μ≠μo

• se rechaza Ho si la proporción de signos positivos difiere de manera significativa de 0.5 (ya sea por encima o por debajo). Esto es equivalente a que el número observado de signos r+ sea suficientemente grande o suficientemente pequeño. Por tanto, si r+ < n/2 el valor P es:

• P = 2P(R+≤r+ cuando p = 0.5)

• Y si r+ >n/2 el valor P es:• P = 2P (R+≥r+ cuando p = 0.5)

• Si el valor P es menor que algún nivel preseleccionado α, entonces se rechaza Ho y se concluye que H1es verdadera.

Page 59: Prueba de chi cuadrado y pruebas no paraetricas

• Los tiempos de sobrevivencia (en años) de 12 personas que se han sometido a un transplante de corazón son los siguientes:

• Probar con 95% de confianza si los datos del tiempo de vida después del transplante sugieren que la mediana sea distinta de 5 años.

EJEMPLO

Page 60: Prueba de chi cuadrado y pruebas no paraetricas

• Solución: Primero se calculan las diferencias contra el valor de prueba(Mediana) y se cuentan los signos positivos y negativos:

• TOTAL7 negativos (-) y• 5 positivos (+) este es r +

Page 61: Prueba de chi cuadrado y pruebas no paraetricas

• En este caso necesitamos la Probabilidad binomial para n= 12, p=0.5

• Como lo que queremos es probar si la mediana de la muestra es diferente a la mediana de prueba, esto implica que el valor de P sea menor al valor de al α.

• Por ejemplo si α= 0.05 requerimos una confianza de 95%.

Page 62: Prueba de chi cuadrado y pruebas no paraetricas

• Calculamos la suma de las probabilidades de los extremos(“colas”) hasta llegar lo más próximo a 0.05 y podemos ver que los valores que nos interesan son las probabilidades para 0,1,2 y para10,11 y 12 (sumando sus probabilidades, 0.0002+0.0029+0.016+0.016 +0.0029+0.0002=0.0382 nos acercamos a 0.05, notar que si usamos otro valor adicional nos pasamos) o sea que para que exista una diferencia significativa debe resultar un valor de 2 o menos, o bien de 10 o más.

• Como tenemos r+ = 5 (positivos+) concluimos que no hay diferencia con la con mediana(no podemos rechazarla hipótesis nula de que no hay diferencia con la mediana).

• Procedimiento en Minitab.

Page 63: Prueba de chi cuadrado y pruebas no paraetricas
Page 64: Prueba de chi cuadrado y pruebas no paraetricas
Page 65: Prueba de chi cuadrado y pruebas no paraetricas
Page 66: Prueba de chi cuadrado y pruebas no paraetricas
Page 67: Prueba de chi cuadrado y pruebas no paraetricas

• Cuando la muestra es como máximo de tamaño 50 se puede contrastar la normalidad con la prueba de shapiro Shapiro-Wilk. Para efectuarla se calcula la media y la varianza muestral, S2, y se ordenan las observaciones de menor a mayor. A continuación se calculan las diferencias entre: el primero y el último; el segundo y el penúltimo; el tercero y el antepenúltimo, etc. y se corrigen con unos coeficientes tabulados por Shapiro y Wilk. El estadístico de prueba es:

PRUEBA DE SHAPIRO-WILK

Page 68: Prueba de chi cuadrado y pruebas no paraetricas

• donde D es la suma de las diferencias corregidas.• Se rechazará la hipótesis nula de normalidad si el estadístico W

es menor que el valor crítico proporcionado por la tabla elaborada por los autores para el tamaño muestral y el nivel de significación dado.

Page 69: Prueba de chi cuadrado y pruebas no paraetricas

•  los encuestados que viven en Barcelona, se quiere comprobar si su distribución en cuanto al tipo de transporte utilizado se adapta a los resultados de un estudio realizado por el Ayuntamiento de Barcelona, que son los siguientes: el 40% de los desplazamientos al trabajo se realizan en metro; el 30% en autobús; el 20% en transporte privado y 10% otros medios.

• La distribución de frecuencias de la variable Trans es:

Page 70: Prueba de chi cuadrado y pruebas no paraetricas

• En este caso para realizar el contraste Chi-cuadrado es necesario definir las cuatro categorías contempladas en la hipótesis nula.

• Para ello, se crea una nueva variable, Trans2, a partir de Trans con las siguientes categorías: Metro, Bus, Privado (que resultará de agregar Coche y Moto) y Otros (que agrupará Tren y Otros).

• Una vez creada la nueva variable, con la secuencia Analizar > Pruebas no paramétricas > Chi-cuadrado se llega al cuadro de diálogo en donde se selecciona la variable Trans2 y se introduce en Valores esperados las frecuencias relativas de cada categoría según la hipótesis nula correctamente ordenadas: 0,4 para la categoría 1; 0,3 para la 2; 0,2 para la 3 y 0,10 para la 4. Al aceptar se obtienen los siguientes resultados:

Page 71: Prueba de chi cuadrado y pruebas no paraetricas

k

i i

ii

EEO

1

22

1.20080.79063.39643.8210=9.209

Page 72: Prueba de chi cuadrado y pruebas no paraetricas
Page 73: Prueba de chi cuadrado y pruebas no paraetricas

• Como todas las categorías presentan frecuencia esperada mayor que 5 se puede aplicar el contraste Chi-cuadrado sin modificar el número de categorías.

• El valor del estadístico Chi-cuadrado permite rechazar la hipótesis nula para niveles de significación superiores al 2,7%. Así pues, al 5% de significación

• Se llega a la conclusión de que la distribución del tipo de transporte que utilizan los alumnos no se adapta a la publicada por el ayuntamiento

Page 74: Prueba de chi cuadrado y pruebas no paraetricas

PRUEBA DE KOLMOGOROV-SMIRNOV PARA UNA MUESTRA

• La prueba de Kolmogorov-Smirnov para una muestra se considera un procedimiento de "bondad de ajuste", es decir, permite medir el grado de concordancia existente entre la distribución de un conjunto de datos y una distribución teórica específica. Su objetivo es señalar si los datos provienen de una población que tiene la distribución teórica especificada.

• Mediante la prueba se compara la distribución acumulada de las frecuencias teóricas (ft) con la distribución acumulada de las frecuencias observadas (f obs), se encuentra el punto de divergencia máxima y se determina qué probabilidad existe de que una diferencia de esa magnitud se deba al azar.

• En las tareas de investigación se pudo obtener un conjunto de observaciones, en las cuales se supone que tienen una distribución normal, binomial, de Poisson, etc. Para el caso, las frecuencias de las distribuciones teóricas deben contrastar con las frecuencias observadas, a fin de conocer cuál distribución se adecua mejor al modelo.

Page 75: Prueba de chi cuadrado y pruebas no paraetricas

• Cuando la prueba Kolmogorov-Smirnov kolmogorov se aplica para contrastar la hipótesis de normalidad de la población, el estadístico de prueba es la máxima diferencia:

• siendo Fn(x) la función de distribución muestral y Fo(x) la función teórica o correspondiente a la población normal especificada en la hipótesis nula.

• La distribución del estadístico de Kolmogorov-Smirnov es independiente de la distribución poblacional especificada en la hipótesis nula y los valores críticos de este estadístico están tabulados. Si la distribución postulada es la normal y se estiman sus parámetros, los valores críticos se obtienen aplicando la corrección de significación propuesta por Lilliefors.

Page 76: Prueba de chi cuadrado y pruebas no paraetricas

Datos

=PROMEDIO(A2:A101)

=DESVEST(A2:A101)=MIN(A2:A101)=MAX(A2:A101)=G6-G5

=CONTAR(A2:A101)=RAIZ(G8)

=G7/G9

Page 77: Prueba de chi cuadrado y pruebas no paraetricas

=G5=I16=I17

=I18=I19

=I20=I21

=I22=I23

=I24

=G16+G10

Cada celda de Lim.INF. menos el rango

Page 78: Prueba de chi cuadrado y pruebas no paraetricas

=FRECUENCIA(A2:A101,I16:I25) calculamos cada frecuencia para cada celda

=K16/$K$26 calculamos cada frecuencia observada relativa

Page 79: Prueba de chi cuadrado y pruebas no paraetricas

Sumamos cada celda de FOR y hacemos la sumatoria q nos debe de dar 1

=DISTR.NORM(I16,$G$3,$G$4,VERDADERO) mediante los datos de Lim. SUP. Calculamos con la formula para cada celda

Page 80: Prueba de chi cuadrado y pruebas no paraetricas

Así cada calculo para cada celda

Page 81: Prueba de chi cuadrado y pruebas no paraetricas
Page 82: Prueba de chi cuadrado y pruebas no paraetricas
Page 83: Prueba de chi cuadrado y pruebas no paraetricas