Seminario 8

Post on 07-Aug-2015

145 views 0 download

Transcript of Seminario 8

Seminario 8: Chi cuadrado de Pearson

• El estadístico Chi cuadrado de Pearson se puede utilizar para: – Estudiar la relación o independencia de una variable

con más de una categoría • Es una prueba de conformidad o bondad de ajuste

– Estudiar la relación entre dos o más muestras o poblaciones • Es una prueba de homogeneidad

– Entre dos o más variables de una población de la que hemos extraído una muestra • Es una prueba de independencia o relación

Recordemos que…

La prueba o estadístico Chi cuadrado se utiliza para comprobar si la diferencia en los datos que observamos:

– Está dentro de lo normal y probable, es decir, la diferencia que observamos en los datos es debida al azar • Recordemos que la Ho establece que no hay diferencia

o lo que es lo mismo hay igualdad. • Aceptamos la Ho

– La diferencia que observamos es debida a algo más • Rechazamos la Hipótesis Nula

Condiciones para aplicarla…

• Las observaciones deben ser independientes. – Es decir, al clasificar los sujetos en cada casilla debe haber sujetos

distintos; no puede haber sujetos repetidos en más de una casilla. Ni los sujetos se pueden clasificar en más de un lugar.

• Utilizar en variables cualitativas • Más de 50 casos • Las frecuencias teóricas o esperadas en cada casilla de

clasificación no deben ser inferiores a 5. – Es tolerable que un 20% de las casillas tengan una frecuencia teórica

inferior a 5, pero no deben ser muy inferiores.

• Si no se cumplen los requisitos – Utilizar el estadístico de Fisher – Corrección de continuidad de Yates

• Actualmente discutido por bastantes autores y se puede no tener en cuenta

• Conviene mencionarla porque responde a una práctica muy generalizada y figura en muchos textos.

Recordar …

• Frecuencia observada: la que recogen los datos

• Frecuencia esperada: la que observaríamos si no hubiera relación

• Grados de libertad…

Se trata de comparar las frecuencias observadas y las frecuencias esperadas

Grados de libertad

• Número de valores o datos que pueden variar libremente dado un determinado resultado

• Si un criterio de clasificación. Ejemplo: 300 sujetos están clasificados según elijan A, B o C (tres categorías de clasificación) – Grados de libertad = k -1 (número de categorías menos una) – Grados de libertad serán 3-1 = 2

• Si dos criterios de clasificación. - Grados de libertad = (f -1)(c -1)

(número de filas menos una) por (número de columnas menos una).

Si comparamos una variable…

• Si se da el caso que las frecuencias esperadas sean pequeñas o menores de 5… no se puede utilizar el estadístico Chi – ¿Qué hacemos?

• Reagrupar los valores de las categorías

• Utilizar

– la Prueba exacta de Fisher

– Corrección de Yates

La Chi… para comparar dos variables…

• Para comparar dos variables cualitativas: tabla de contingencia

• Poner las frecuencias observadas (datos) • Calcular las frecuencias teóricas o esperadas

– Es importante caer en la cuenta de que la suma de las frecuencias observadas debe ser igual a la suma de las frecuencias teóricas • Estas sumas (de todas las frecuencias observadas y de todas las

frecuencias teóricas) con frecuencia no son idénticas porque redondeamos los decimales, pero deben ser muy parecidas

• Calcular los grados de libertad

Calcular los grados de libertad

• Los grados de libertad son igual al número de valores o datos que pueden variar libremente dado un determinado resultado (o resultados). – Grados de libertad = k -1 (número de categorías menos una)

• Si un criterio de clasificación – Ejemplo si hay 300 sujetos están clasificados según elijan A, B o C (tres

categorías de clasificación) • Grados de libertad serán 3-1 = 2.

• Si dos criterios de clasificación – Grados de libertad = (f -1)(c -1)

(número de filas menos una) por (número de columnas menos una).

Los software informáticos… nos facilitan la vida

• Analizar------Estadísticos Descriptivos------

Tablas de contingencia

• Elegir las dos variables categóricas.

• Contrasta la hipótesis de que las dos variables a contrastar son independientes.

Chi en SPSS

Ejercicio casa blog

Una enfermera analiza las historias de enfermería de 292 mujeres y de 192 hombres que cuidan a familiares dependientes. De entre todas las historias revisadas, observa que 450 personas presentan cansancio en el rol de cuidador, de las cuales 168 son hombres y 282 mujeres. Trabaja con un nivel de confianza del 99%.

¿Existe relación entre tener cansancio en el rol del cuidador y el sexo?

¿Podemos aplicar chi cuadrado?

• Se trata de variables cualitativas, sexo y cansancio.

• Son excluyentes (dos observaciones independientes).

• En la tabla de frecuencias esperadas no puede haber valores menor que 5.

Procedimiento

1. Establecer la hipótesis nula.

2. Realizar una tabla con los datos observados o frecuencias observadas.

3. Calcular los grados de libertad.

4. Calcular las frecuencias esperadas o teóricas.

5. Utilizar el estadístico.

6. Compararlo con las tablas al nivel de significación fijado.

7. Aceptar o rechazar la H0.

2

2 ( )fo ft

ft

1. Formular las hipótesis.

– Ho: No existe relación entre tener cansancio en el rol del cuidador y el sexo (no hay diferencias).

– H1: Existe relación entre tener cansancio en el rol del cuidador y el sexo.

2. Tabla de frecuencias observadas

Sí presentan cansancio

No presentan cansancio

Total

Mujeres 282 10 292

Hombres 168 24 192

Total 450 34 484

Para calcular las frecuencias observadas…

3. Tabla de frecuencias esperadas (teóricas)

Sí presentan cansancio

No presentan cansancio

Total

Mujeres 271,5 20,5 292

Hombres 178,5 13,5 192

Total 450 34 484

4. Aplicar la fórmula 2

Celda a = (282 – 271,5)2 / 271,5 = 0,41

Celda b = (10 – 20,5)2 / 20,5 = 5,38

Celda c = (168 – 178,5)2 / 178,5 = 0,62

Celda d = (24 – 13,5)2 / 13,5 = 8,17

X2 = = 0,41 + 5,38 + 0,62 + 8,17 = 14,58

2

2 ( )fo ft

ft

5. Calcular los grados de libertad: (2-1)(2-1) = 1

6. Buscar en la tabla de la a un nivel de significación del 0,01 y con un grado de libertad el valor es = 6,64

2

7. Conclusiones …

X2 real= 14,58 (chi observada en los datos o que obtenemos mediante la fórmula)

X2 0,01; 1 (teórica) = 6,64 (la que habría esperar si no hubiera

diferencia)

Puesto que la X2real > X2teórica, se rechaza la Hipótesis nula. Lo que quiere decir que si existe relación entre tener cansancio del rol de cuidador y el sexo. Al rechazar la hipótesis nula estamos diciendo que las diferencias encontradas son estadísticamente significativas, lo que es lo mismo, no es debido al azar.