Medidas de Correlacion

24
Medidas de Correlación “todo el mundo parece hoy coincidir en que la estadística puede ser útil para comprender, evaluar y controlar el funcionamiento de la sociedad” Solomon Fabricant Cuando tratamos de buscar relaciones entre diversas variables, nos encontramos dentro del área de la correlación. Para expresar cuantitativamente el grado en que dos variables están relacionadas, es necesario calcular un coeficiente de correlación. Existen muchos tipos de coeficiente de correlación. La decisión de cuál se ha de emplear para un conjunto específico de datos depende de factores tales como: (1) el tipo de escala de medida en que cada variable está expresada (nominal, ordinal, intervalo o razones); (2) la naturaleza de la distribución (continua o discreta); (3) la característica de la correlación (lineal o no lineal). Aunque el análisis de correlación es interesante, las conclusiones pueden ser muy precipitadas. Primero que nada, el hecho de encontrar una fuerte asociación entre dos variables, no implica que necesariamente dicha relación sea de carácter causal. Dado que el análisis de correlación se utiliza mayormente en estudios donde no es posible manipular libremente la variable independiente, puede introducirse el efecto de terceras variables, siendo éstas responsables de la correlación observada. En segundo lugar, si no se examina la naturaleza de la relación entre dos variables, podría aplicarse una técnica propia para tendencias lineales a una de índole curvilíneo (no lineal) o viceversa. En ambos casos es posible que no se encuentre correlación cuando realmente existe. Sea cual sea la técnica de correlación que se use, lo fundamental es que todas tienen ciertas características comunes: 7

Transcript of Medidas de Correlacion

Page 1: Medidas de Correlacion

Medidas de

Correlación

“todo el mundo parece hoy coincidir en que la

estadística puede ser útil para comprender,

evaluar y controlar el funcionamiento

de la sociedad” Solomon Fabricant

Cuando tratamos de buscar relaciones entre diversas variables, nos

encontramos dentro del área de la correlación. Para expresar cuantitativamente el

grado en que dos variables están relacionadas, es necesario calcular un coeficiente

de correlación. Existen muchos tipos de coeficiente de correlación. La decisión de

cuál se ha de emplear para un conjunto específico de datos depende de factores tales

como: (1) el tipo de escala de medida en que cada variable está expresada (nominal,

ordinal, intervalo o razones); (2) la naturaleza de la distribución (continua o discreta);

(3) la característica de la correlación (lineal o no lineal).

Aunque el análisis de correlación es interesante, las conclusiones pueden ser

muy precipitadas. Primero que nada, el hecho de encontrar una fuerte asociación

entre dos variables, no implica que necesariamente dicha relación sea de carácter

causal. Dado que el análisis de correlación se utiliza mayormente en estudios donde

no es posible manipular libremente la variable independiente, puede introducirse el

efecto de terceras variables, siendo éstas responsables de la correlación observada.

En segundo lugar, si no se examina la naturaleza de la relación entre dos variables,

podría aplicarse una técnica propia para tendencias lineales a una de índole curvilíneo

(no lineal) o viceversa. En ambos casos es posible que no se encuentre correlación

cuando realmente existe. Sea cual sea la técnica de correlación que se use, lo

fundamental es que todas tienen ciertas características comunes:

7

Page 2: Medidas de Correlacion

Arnaldo Torres Degró y Evelyn Afanador Mejías

198

1. Los valores de los coeficientes de correlación varían entre negativo uno (-1.00) y positivo uno (+1.00). Ambos extremos representan relaciones perfectas entre las variables, y 0.00 representa la ausencia de asociación.

2. Una relación positiva o directa significa que los individuos que obtienen

calificaciones altas en una variable tienden a obtener calificaciones altas en la otra, es decir, cuando X aumente, Y aumenta. La aseveración contraria también es válida; es decir, los individuos que obtienen calificación baja en una variable tienden a obtener calificación baja en la otra, es decir, cuando disminuye X, Y disminuye

. 3. Una relación negativa o inversa significa que los individuos que obtienen

calificación baja en una variable tienden a obtener calificación alta en la segunda variable y viceversa. Es inversa cuando las variables se mueven en direcciones opuesta; esto es, cuando X aumente, Y se reduce o viceversa.

La relación directa o inversa sólo es posible en situaciones donde las escalas

son ordinales, de intervalos o de razones y cuando la naturaleza de la relación es

lineal. Si las escalas son nominales, no hay gradación numérica; por lo tanto, el

coeficiente a obtenerse no puede interpretarse como indicando relación directa o

inversa. Más aún, los coeficientes que se obtienen para estas variables suelen ser

siempre positivos (cero “0" hasta uno positivo “+1"). Con miras a operacionalizar la

interpretación de los índices de correlación (Champion, 1981) se sugiere la siguiente

clasificación:

Con el propósito de introducir el tema sobre la correlación y a tenor con el

interés de seguir desarrollando todas aquellas técnicas que estén asociadas a las

variables cualitativas, introduciremos los siguientes coeficientes de correlación: el

coeficiente PHI Φ y el coeficiente de V de Cramer.

±0.00 a .25 baja o ninguna correlación

±0.26 a .50 correlación moderada baja

±0.51 a .75 correlación moderada alta

±0.76 a 1.00 alta a perfecta correlación

Page 3: Medidas de Correlacion

Medidas de Correlación

199

[7.1] Coeficiente de Correlación PHI

Los coeficientes de correlación aplicados a las variables cualitativas no deben

interpretarse como si estos indicaran dirección de la relación puesto que los mismos

únicamente señalan intensidad de la asociación. Para poder correlacionar es

necesario observar las tabulaciones cruzadas. Una tabulación 2x2 implica dos (2)

variables dicotómicas, es decir, con dos (2) categorías por variable.

Figura 7.1

Estructura de una tabla de dos por dos

Variable A Variable B

Categoría 1 Categoría 2 TOTALES

Categoría 1 Celda A Celda B A + B

Categoría 2 Celda C Celda D C + D

TOTALES A + C B + D N

El coeficiente de correlación frecuentemente utilizado para determinar la intensidad de

la asociación es el coeficiente PHI. El coeficiente de correlación de PHI el símbolo

asignado es Φ. El coeficiente fluctúa entre cero (0) y uno (1). Según se acerca a cero

(0), más baja es la asociación entre las variables. Las variables no están afectadas o

relacionadas entre si, estableciendo que las variables serían independientes. Si el

coeficiente es igual a uno (1) lo que podemos sugerir es que las dos (2) variables

están relacionadas o asociadas, es decir, las variables son dependientes. La forma

operacional del coeficiente de PHI (Φ), puede desarrollarse bajo dos (2)

circunstancias:

1. Si los totales de las líneas y columnas son iguales, (Sánchez, 1992) el coeficiente se obtendría de la siguiente manera;

Page 4: Medidas de Correlacion

Arnaldo Torres Degró y Evelyn Afanador Mejías

200

2. Si los totales de las líneas y columnas no son iguales entonces será necesario ajustar el coeficiente obtenido, siendo la fórmula de la siguiente manera :

Φ = Coeficiente de correlación de PHI

AD = La multiplicación del valor o frecuencia observada en la celda A por el valor o frecuencia observada en la celda D

BC = La multiplicación del valor o frecuencia observada en la celda B por el valor o frecuencia observada en la celda C.

│AD - BC│ = Valor absoluto de AD menos BC. El valor absoluto implica que si el resultado de la resta diera negativo se debe cambiar a positivo.

A+B = La suma de los valores o frecuencias observadas de las celdas A y B.

C+D = La suma de los valores o frecuencias observadas de las celdas C y D.

A+C = La suma de los valores o frecuencias observadas de las celdas A y C.

B+D = La suma de los valores o frecuencias observadas de las celdas B y D.

n = Es el total de casos o frecuencias.

[ │ AD – BC │ ]

(A + C) (B + D) (C + D) (A + B) Φ =

[│ AD – BC │ ] – .5 (n) (A + C) (B + D) (C + D) (A + B)

donde:

Φobtenido =

Page 5: Medidas de Correlacion

Medidas de Correlación

201

La última situación será elaborada en el texto porque usualmente los totales de las

líneas y columnas de las variables dicotómicas organizadas en tablas de 2x2 son

diferentes. Para lograr un análisis completo de dicho coeficiente debemos completar

tres (3) pasos: el coeficiente de PHI obtenido, el coeficiente de PHI máximo y el

coeficiente de PHI corregido, siendo el último paso donde se realiza el análisis.

Para poder comprender el coeficiente de correlación de PHI analizaremos el

siguiente caso. En el 1998, bajo el auspicio de la Vicepresidencia de Asuntos

Estudiantiles de la Pontificia Universidad Católica de Puerto Rico, Recinto de Ponce,

se realizó un trabajo de campo titulado Estudio Descriptivo sobre las Características y

Percepciones de los Estudiantes Subgraduados, PUCPR, Recinto de Ponce, PR,

1998 (Vera, 1998). Una de las preguntas realizadas en el estudio fue sobre el

consumo de alcohol. La respuesta de la muestra de estudiantes subgraduado por

género fue la siguiente:

Alcohol Hombres Mujeres TOTAL

Consumo 47 (A) 182 (B) 229 (A + B)

No consumo 105 (C) 140 (D) 245 (C + D)

TOTAL 152 (A + C) 322 (B + D) 474 (n)

3 casos no informaron

Supongamos que usted quisiera conocer si el consumo de alcohol entre los

estudiantes universitarios subgraduado de la Pontificia Universidad Católica de Puerto

Rico, Recinto de Ponce, para el año 1998, varía en función del género. Para el primer

paso tendríamos que buscar el coeficiente de Φobtenido

Page 6: Medidas de Correlacion

Arnaldo Torres Degró y Evelyn Afanador Mejías

202

Luego de conseguir el coeficiente de Φobtenido, obtener el coeficiente de Φmáximo.

La fórmula de Φmáximo sería:

[│ AD – BC │ ] – .5 (n) (A + C) (B + D) (C + D) (A + B)

[│ (47) (140) – (182) (105) │– .5 (474) ] (229) (245) (152) (322)

[│(6,580) – (19,110) │– 237 ] 2,746,003,120

[│–12,530 │– 237 ] 2,746,003,120 [│+12,530 │– 237 ]

2,746,003,120 12,293 52,402.3197 .234588 .23

Φobtenido =

Φobtenido =

Φobtenido =

Φobtenido =

Φobtenido =

Φobtenido =

Φobtenido =

Φobtenido =

Page 7: Medidas de Correlacion

Medidas de Correlación

203

Es necesario reorganizar la tabla original con el propósito de obtener el valor máximo

que podría alcanzar PHI (Φ). El procedimiento para obtener el coeficiente de Φmáximo

sería de la siguiente forma:

Primer Paso: Eliminar los valores originales que se encuentran en las celdas A;

B; C y D. Se tiene que mantener los subtotales de las columnas y las líneas y no se debe alterar bajo ninguna circunstancia.

Alcohol Hombres Mujeres TOTAL

Consumo (A) (B) 229 (A + B)

No consumo (C) (D) 245 (C + D)

TOTAL 152 (A + C) 322 (B + D) 474 (n)

Segundo Paso: De las cuatros celdas hay que seleccionar una, utilizando las

siguientes estrategias.

a. Comenzaremos con las columnas que están representando las categorías de la variable género. La columna que representa la categoría hombre está compuesta de las celdas (A) y (C). La columna que representa la categoría mujer está compuesta de las celdas (B) y (D). En esta fase se eliminarán dos celdas. Las celdas que estén localizadas en la columna con el subtotal más alto serán seleccionadas, mientras las celdas que estén localizadas en la columna con el subtotal más bajo serán eliminadas. Observemos que la primera columna (hombres) tiene un total de 152 y la segunda columna (mujeres) tiene un total de 322. El subtotal mayor recae en la segunda columna (mujeres) con 322 casos. Esto significa que la celda (B) o la celda (D) han sido

[ │ AD – BC │ ] – .5 (n) (A + C) (B + D) (C + D) (A + B)

donde:

Φmáximo =

Page 8: Medidas de Correlacion

Arnaldo Torres Degró y Evelyn Afanador Mejías

204

seleccionadas, mientras que las celdas (A) y (C) serán eliminadas. No obstante, de las celdas seleccionadas ( B o D), una será escogida y la otra será eliminada.

Alcohol Hombres Mujeres TOTAL

Consumo (A) (B) 229 (A + B)

No consumo (C) (D) 245 (C + D)

TOTAL 152 (A + C) 322 (B + D) 474 (n)

b. Para proseguir con la eliminatoria comenzaremos con las líneas que están representando las categorías de la variable alcohol. La columna que representa la categoría consume está localizada una de las dos celdas seleccionas, celda (B). La columna que representa la categoría no-consume está localizada en una de las dos celdas seleccionadas, celdas (D). En esta fase se elimina una de las dos celdas (B o D). La celda que esté localizada en el subtotal más alto de las líneas será seleccionada, mientras la celda que esté localizada en la línea con el subtotal más bajo será eliminado. Observemos que la primera línea (consume) tiene un total de 229 y

en la segunda línea (no-consume) tiene un total de 245. El subtotal

mayor recae en la segunda línea (no-consume) con 245 casos. Esto significa que la celda (D) ha sido seleccionada, mientras que la celda (B) será eliminada.

Alcohol Hombres Mujeres TOTAL

Consumo (A) (B) 229 (A + B)

No consumo (C) (D) 245 (C + D)

TOTAL 152 (A + C) 322 (B + D) 474 (n)

Tercer Paso: Buscar que valor tendrá la celda seleccionada. En dicha celda

se colocará el valor menor entre el subtotal mayor de columna vs. el subtotal mayor de línea. Según en el paso anterior se pudo determinar que la celda seleccionada era la (D).El subtotal mayor de la columna que corresponde a la categoría mujeres fue de 322. El subtotal mayor de la línea que corresponde a

Page 9: Medidas de Correlacion

Medidas de Correlación

205

la categoría no-consume fue de 245. De esos dos subtotales seleccionados el menor corresponde a la categoría no-consume con 245. Esté valor será ubicado en la celda (D).

Alcohol Hombres Mujeres TOTAL

Consumo (A) (B) 229 (A + B)

No consumo (C) 245 (D) 245 (C + D)

TOTAL 152 (A + C) 322 (B + D) 474 (n)

Cuarto Paso: Una vez se tiene la primera cantidad en la celda seleccionada,

las demás cantidades se obtendrán por diferencias, es decir, usando la operación de recta. Las sumas de las celdas tienen que corresponder con los subtotales de las columnas y líneas. Ya obtenido el valor o cantidad en la celda (D) podemos señalar que para mantener el subtotal de la línea que corresponde a la categoría no-consume (245) la celda C tiene que ser cero (0). Por diferencia, si la celda C es igual a cero (0), la celda A tiene que ser 152, para mantener el subtotal de la columna inalterable (152). Para mantener el subtotal de la línea que corresponde a la categoría consume (229), la celda B tiene que ser 77.

Alcohol Hombres Mujeres TOTAL

Consumo 152 (A) 77 (B) 229 (A + B)

No consumo 0 (C) 245 (D) 245 (C + D)

TOTAL 152 (A + C) 322 (B + D) 474 (n)

Con la tabla reorganizada podemos buscar el coeficiente de Φmáximo de la siguiente

forma:

Page 10: Medidas de Correlacion

Arnaldo Torres Degró y Evelyn Afanador Mejías

206

Con el coeficiente de Φobtenido y el coeficiente de Φmáximo podemos buscar el

coeficiente corregido de Φ. Dicho coeficiente se obtiene dividiendo el coeficiente

obtenido con el coeficiente máximo, es decir:

[ │ AD – BC │ ] – .5 (n) (A + C) (B + D) (C + D) (A + B)

[│ (152) (245) – (77) (0) │– .5 (474) ] (229) (245) (152) (322)

[│37,240 – 0 │– 237 ] 2,746,003,120

[│37,240 │– 237 ] 2,746,003,120 37,003 52,402.3197 .70613 .71

Φmaximo =

Φmaximo =

Φmaximo =

Φmaximo =

Φmaximo =

Φmaximo =

Φmaximo =

Φobtenido

Φmáximo Φcorregido =

Page 11: Medidas de Correlacion

Medidas de Correlación

207

Teniendo los dos coeficientes necesarios para obtener el coeficiente corregido, el

cálculo sería de la siguiente forma y se sugiere que existe una correlación moderada

baja de .32 entre el consumo de alcohol y el género de los estudiantes universitarios

subgraduados de la PUCPR, Recinto de Ponce, PR, para el año 1998.

Φobtenido

Φmáximo

.23 .71

.32

Φcorregido =

Φcorregido =

Φcorregido =

Page 12: Medidas de Correlacion

Arnaldo Torres Degró y Evelyn Afanador Mejías

208

Page 13: Medidas de Correlacion

Medidas de Correlación

209

Ejercicios de Coeficiente de PHI Favor de identificar las hojas de ejercicios y elaborar todos los problemas según lo establecido en el texto.

Desprenda las hojas de ejercicios y entréguelas al profesor, SI FUESE NECESARIO.

NOMBRE: FECHA: _______________ NUMERO DE ESTUDIANTE: SECCION: ___________

Ejercicio 7.1.1 Frecuencia de la opinión de estudiantes universitarios subgraduados si el

alcohol debe estar disponible en las fiestas, Pontificia Universidad Católica de

Puerto Rico, Recinto de Ponce,1992

Alcohol

Hombre

Mujer

TOTAL

Disponible

71

79

150

No-disponible

61

202

263

TOTAL

132

281

413

[7.1.1.a] Favor de calcular el coeficiente de Phi obtenido.

Page 14: Medidas de Correlacion

Arnaldo Torres Degró y Evelyn Afanador Mejías

210

Alcohol

Hombre

Mujer

TOTAL

Disponible

150

No-disponible

263

TOTAL

132

281

413

[7.1.1.b] Favor de calcular el coeficiente de Phi máximo. Complete las celdas para poder elaborar el ejercicio.

[7.1.1.c] Favor de calcular y analizar el coeficiente de Phi corregido.

Page 15: Medidas de Correlacion

Medidas de Correlación

211

Ejercicio 7.1.2 Frecuencia sobre la percepción de la pena de muerte como reductor de la

criminalidad, estudiantes de criminología por zona residencial, Puerto Rico,

1995.

Pena de muerte como reductor de la criminalidad

Urbano

Rural

TOTAL

Si

90

7

97

No

10

113

123

TOTAL

100

120

220

Ejercicio hipotéticos

[7.1.2.a] Favor de calcular el coeficiente de Phi obtenido.

Page 16: Medidas de Correlacion

Arnaldo Torres Degró y Evelyn Afanador Mejías

212

Pena de muerte como reductor de la criminalidad

Urbano

Rural

TOTAL

Si

97

No

123

TOTAL

100

120

220

Ejercicio hipotéticos

[7.1.2.b] Favor de calcular el coeficiente de Phi máximo. Complete las celdas para poder elaborar el ejercicio.

[7.1.2.c] Favor de calcular y analizar el coeficiente de Phi corregido.

Page 17: Medidas de Correlacion

Medidas de Correlación

213

[7.2.] Coeficiente de Correlación de V de CRAMER

Si usted quisiera sacar una correlación y una de las variables tiene más de dos

(2) categorías, no sería posible desarrollar el coeficiente de correlación de PHI (Φ). Un

cruce de variable que genere una tabla mayor de 2 x 2, no podrá aplicarse la técnica

de coeficiente de correlación de PHI (Φ). No obstante, el coeficiente de correlación V

de Cramer puede sustituir el coeficiente de correlación de PHI (Φ), cuando tengamos un

cruce de variable que genere una tabla mayor de 2 x 2 y por lo menos una de las

variables esta bajo la escala nominal. La notación del coeficiente de V de Cramer es:

V = coeficiente de correlación de Cramer

χ² = Chi cuadrado

k = número de líneas o columnas; lo que sea menor

De todos los nacimientos ocurridos en Puerto Rico para el año 1993, unos 39,322

nacimientos ocurrieron en los hospitales públicos y 25,622 nacimientos ocurridos en

hospitales privados. Si usted como investigador quisiera saber si los nacimientos

ocurridos en diversos sectores de servicios (públicos o privados) de Puerto Rico para

el año 1993, está asociada a la escolaridad de la madre, podemos buscar el

coeficiente de correlación V de Cramer.

χ2

n(k – 1)

donde;

ν =

Page 18: Medidas de Correlacion

Arnaldo Torres Degró y Evelyn Afanador Mejías

214

Escolaridad

Público

Privado

TOTAL

0 - 11

a 19,260

d 1,837

21,097

12

b 12,385

e 5,516

17,901

+ 13

c 7,677

f 18,269

25,946

TOTAL

39,322

25,622

64,944 (N)

Para poder obtener el coeficiente de correlación V de Cramer debemos obtener el chi

cuadrado χ², siendo ésta la fórmula:

ƒo = Frecuencia observada es el valor, cantidad o casos en cada una

de las celdas. La ƒo es un dato suministrado por la tabla. Por

ejemplo, la ƒo de la celda de las madres de 0 a 11 años de escolaridad que tuvieron sus hijos en hospitales públicos fue de 19,260 casos.

ƒe = Frecuencia esperada es un valor que se calculará en cada celda

que tenga una ƒo. Para obtener la ƒe es meritorio reconocer que cada celda esta localizada en una columna que tiene un subtotal y en una línea que tiene un subtotal. Por consiguiente, se multiplica el subtotal de columna por el subtotal de línea que le corresponda a la celda de interés. Obtenido el resultada el mismo se divide por N. La fórmula puede ser presentada de la siguiente manera:

donde;

χ2 =

(Subtotal de columna) (Subtotal de línea)

N

ƒe =

(ƒo - ƒe)2

ƒe Σ

Page 19: Medidas de Correlacion

Medidas de Correlación

215

Notemos que sin contar las celdas de los subtotales, existen seis (6) celdas con sus

respectivas frecuencia observada (ƒo). Para cada ƒo se debe buscar la frecuencia

esperada (ƒe). Por ejemplo, en la celda (a) con una ƒo de 19,260 se puede obtener

la ƒe de la siguiente forma: multiplicando el subtotal de la columna que corresponde a

la celda a (39,322) por el subtotal de la línea que le corresponde a la celda a (21,097);

dividido por el total del universo (N= 64,944), es decir:

Para efectos prácticos se recomienda que al lado de la ƒo se coloque la ƒe:

Escolaridad

Público

Privado

TOTAL

0 - 11

a 19,260(12,773.72)

d 1,837(8,323.28)

21,097

12

b 12,385(10,838.62)

e 5,516(7,062.38)

17,901

+13

c 7,677(15,709.67)

f 18,269(10,236.33)

25,946

TOTAL

39,322

25,622

64,944 (N)

ƒe = (subtotal de columna) (subtotal de línea)

N

ƒƒƒƒe a = (39,322)(21,097)

64,944

ƒe a = 12,773.72

Las demás celdas se obtienen de la misma manera:

ƒƒƒƒe b (39,322) (17,901) ÷ 64,944 = 10,838.62

ƒƒƒƒe c (39,322) (25,946) ÷ 64,944 = 15,709.67

ƒƒƒƒe d (25,622) (21,097) ÷ 64,944 = 8,323.28

ƒƒƒƒe e (25,622) (17,901) ÷ 64,944 = 7,062.38

ƒƒƒƒe f (25,622) (25,946) ÷ 64,944 = 10,236.33

Page 20: Medidas de Correlacion

Arnaldo Torres Degró y Evelyn Afanador Mejías

216

χ²

n (k – 1)

19,318.25

64,944 (2-1)

19,318.25

64,944

.2974601 = .55

Luego de obtener la ƒe para cada celda podemos realizar el siguiente cálculo por

celda para obtener el Chi-cuadrado χ²:

Obtenido el χ² podemos buscar el

coeficiente de correlación de V de Cramer.

La correlación de V de Cramer fue .55 y

podemos sugerir que existe una correlación

moderada alta entre los nacimientos

ocurridos en diversos sectores de servicios

(público o privado) de Puerto Rico para el

año 1993 y la escolaridad de la madre.

V =

V =

V =

V =

(ƒo – ƒe)²

ƒe

celda a = ( 19,260 - 12,773.72 )²

12,773.72

= 3,293.62

celda d = ( 1,837 - 8,323.28 )²

8,323.28

= 5,054.72

celda b = ( 12,385 - 10,838.62 )²

10,838.62

= 220.63

celda e = ( 5,516 - 7,062.38 )²

7,062.38

= 338.60

celda c = ( 7,677 - 15,709.67 )²

15,709.67

= 4,107.27

celda f = ( 18,269 - 10,236.33 )²

10,236.33

= 6,303.41

Σ χ² = ( 3,293.62 + 220.63 + 4,107.27 + 5,054.72 + 338.60 + 6,303.41 ) = 19,318.25

χ² = Σ

Page 21: Medidas de Correlacion

Medidas de Correlación

217

Ejercicios de V de Cramer Favor de identificar las hojas de ejercicios y elaborar todos los problemas según lo establecido en el texto.

Desprenda las hojas de ejercicios y entréguelas al profesor, SI FUESE NECESARIO.

NOMBRE: FECHA: _______________ NUMERO DE ESTUDIANTE: SECCION: ___________

Ejercicio 7.2.1 Según la data del Departamento de Salud de Puerto Rico para el año 1990

podemos observar los nacimientos ocurridos por la escolaridad de la madre y

el tipo de hospital usado. Favor de calcular y analizar la correlación de V de

Cramer.

Escolaridad

Público

Privado

TOTAL

0 - 11

a 20,292

d 1,875

22,167

12

b 12,745

e 6,158

18,903

+ 13

c 7,733

f 17,458

25,191

TOTAL

40,770

25,491

66,261 (N)

Page 22: Medidas de Correlacion

Arnaldo Torres Degró y Evelyn Afanador Mejías

218

Ejercicio 7.2.2 Según la data del Departamento de Salud de Puerto Rico para el año 1987

podemos observar los nacimientos ocurridos por la escolaridad de la madre y

el tipo de hospital usado. Favor de calcular y analizar la correlación de V de

Cramer.

Escolaridad

Público

Privado

TOTAL

0 - 11

a 21,132

d 2,024

23,156

12

b 12,769

e 6,124

18,893

+ 13

c 7,802

f 14,221

22,023

TOTAL

41,703

22,369

64,072 (N)

Page 23: Medidas de Correlacion

Medidas de Correlación

219

[7.3] Fórmulas

Coeficiente de Phi

Coeficiente de Phi corregido

V de Cramer

Ji Cuadrado

Frecuencia esperada

[│ AD – BC │ ] – .5 (n)

(A + C)(B + D)(C + D)(A + B)

Φ =

Φobtenido

Φmáximo

Φcorregido =

χ2

n(k – 1) ν =

N

ƒe = (Subtotal de columna) (Subtotal de línea)

χ2 = (ƒo - ƒe)2

ƒe Σ

Page 24: Medidas de Correlacion

Arnaldo Torres Degró y Evelyn Afanador Mejías

220

[7.4] Ejercicios Adicionales [7.4.1] Se le preguntó a un grupo de estudiantes de la Universidad Pitirre para el año 2002 si era necesario que las

mujeres aparecieran en los "shopper" vestidas en ropa interior para promover dicho producto. Está pregunta fue

cruzado con las variables sexo, zona residencial, estado civil y religión. Para cada uno de los cruces favor de

desarrollar y analizar el PHI obtenido, máximo y corregido.

(a) Género

TOTAL

Preg.

Hombre

Mujer

Si

60

15

75

No

15

110

125

TOTAL

75

125

200

(b) Zona residencial

TOTAL

Preg.

Urbano

Rural

Si

70

8

78

No

42

80

122

TOTAL

112

88

200

[7.4.2] Se le preguntó a un grupo de estudiantes del área de ciencias sociales de la Universidad Pitirre para el año

2001 sobre la necesidad del estado benefactor. Favor de desarrollar y analizar el Coeficiente de correlación de V de

Cramer.

Pregunta

Crim.

Soc.

Adm. Púb.

C. Pol.

TOTAL

Si

50

10

40

10

110

No

100

10

10

20

140

TOTAL

150

20

50

30

250