Medidas de Correlacion
-
Upload
guillermo-chira-m -
Category
Documents
-
view
333 -
download
0
Transcript of Medidas de Correlacion
Medidas de
Correlación
“todo el mundo parece hoy coincidir en que la
estadística puede ser útil para comprender,
evaluar y controlar el funcionamiento
de la sociedad” Solomon Fabricant
Cuando tratamos de buscar relaciones entre diversas variables, nos
encontramos dentro del área de la correlación. Para expresar cuantitativamente el
grado en que dos variables están relacionadas, es necesario calcular un coeficiente
de correlación. Existen muchos tipos de coeficiente de correlación. La decisión de
cuál se ha de emplear para un conjunto específico de datos depende de factores tales
como: (1) el tipo de escala de medida en que cada variable está expresada (nominal,
ordinal, intervalo o razones); (2) la naturaleza de la distribución (continua o discreta);
(3) la característica de la correlación (lineal o no lineal).
Aunque el análisis de correlación es interesante, las conclusiones pueden ser
muy precipitadas. Primero que nada, el hecho de encontrar una fuerte asociación
entre dos variables, no implica que necesariamente dicha relación sea de carácter
causal. Dado que el análisis de correlación se utiliza mayormente en estudios donde
no es posible manipular libremente la variable independiente, puede introducirse el
efecto de terceras variables, siendo éstas responsables de la correlación observada.
En segundo lugar, si no se examina la naturaleza de la relación entre dos variables,
podría aplicarse una técnica propia para tendencias lineales a una de índole curvilíneo
(no lineal) o viceversa. En ambos casos es posible que no se encuentre correlación
cuando realmente existe. Sea cual sea la técnica de correlación que se use, lo
fundamental es que todas tienen ciertas características comunes:
7
Arnaldo Torres Degró y Evelyn Afanador Mejías
198
1. Los valores de los coeficientes de correlación varían entre negativo uno (-1.00) y positivo uno (+1.00). Ambos extremos representan relaciones perfectas entre las variables, y 0.00 representa la ausencia de asociación.
2. Una relación positiva o directa significa que los individuos que obtienen
calificaciones altas en una variable tienden a obtener calificaciones altas en la otra, es decir, cuando X aumente, Y aumenta. La aseveración contraria también es válida; es decir, los individuos que obtienen calificación baja en una variable tienden a obtener calificación baja en la otra, es decir, cuando disminuye X, Y disminuye
. 3. Una relación negativa o inversa significa que los individuos que obtienen
calificación baja en una variable tienden a obtener calificación alta en la segunda variable y viceversa. Es inversa cuando las variables se mueven en direcciones opuesta; esto es, cuando X aumente, Y se reduce o viceversa.
La relación directa o inversa sólo es posible en situaciones donde las escalas
son ordinales, de intervalos o de razones y cuando la naturaleza de la relación es
lineal. Si las escalas son nominales, no hay gradación numérica; por lo tanto, el
coeficiente a obtenerse no puede interpretarse como indicando relación directa o
inversa. Más aún, los coeficientes que se obtienen para estas variables suelen ser
siempre positivos (cero “0" hasta uno positivo “+1"). Con miras a operacionalizar la
interpretación de los índices de correlación (Champion, 1981) se sugiere la siguiente
clasificación:
Con el propósito de introducir el tema sobre la correlación y a tenor con el
interés de seguir desarrollando todas aquellas técnicas que estén asociadas a las
variables cualitativas, introduciremos los siguientes coeficientes de correlación: el
coeficiente PHI Φ y el coeficiente de V de Cramer.
±0.00 a .25 baja o ninguna correlación
±0.26 a .50 correlación moderada baja
±0.51 a .75 correlación moderada alta
±0.76 a 1.00 alta a perfecta correlación
Medidas de Correlación
199
[7.1] Coeficiente de Correlación PHI
Los coeficientes de correlación aplicados a las variables cualitativas no deben
interpretarse como si estos indicaran dirección de la relación puesto que los mismos
únicamente señalan intensidad de la asociación. Para poder correlacionar es
necesario observar las tabulaciones cruzadas. Una tabulación 2x2 implica dos (2)
variables dicotómicas, es decir, con dos (2) categorías por variable.
Figura 7.1
Estructura de una tabla de dos por dos
Variable A Variable B
Categoría 1 Categoría 2 TOTALES
Categoría 1 Celda A Celda B A + B
Categoría 2 Celda C Celda D C + D
TOTALES A + C B + D N
El coeficiente de correlación frecuentemente utilizado para determinar la intensidad de
la asociación es el coeficiente PHI. El coeficiente de correlación de PHI el símbolo
asignado es Φ. El coeficiente fluctúa entre cero (0) y uno (1). Según se acerca a cero
(0), más baja es la asociación entre las variables. Las variables no están afectadas o
relacionadas entre si, estableciendo que las variables serían independientes. Si el
coeficiente es igual a uno (1) lo que podemos sugerir es que las dos (2) variables
están relacionadas o asociadas, es decir, las variables son dependientes. La forma
operacional del coeficiente de PHI (Φ), puede desarrollarse bajo dos (2)
circunstancias:
1. Si los totales de las líneas y columnas son iguales, (Sánchez, 1992) el coeficiente se obtendría de la siguiente manera;
Arnaldo Torres Degró y Evelyn Afanador Mejías
200
2. Si los totales de las líneas y columnas no son iguales entonces será necesario ajustar el coeficiente obtenido, siendo la fórmula de la siguiente manera :
Φ = Coeficiente de correlación de PHI
AD = La multiplicación del valor o frecuencia observada en la celda A por el valor o frecuencia observada en la celda D
BC = La multiplicación del valor o frecuencia observada en la celda B por el valor o frecuencia observada en la celda C.
│AD - BC│ = Valor absoluto de AD menos BC. El valor absoluto implica que si el resultado de la resta diera negativo se debe cambiar a positivo.
A+B = La suma de los valores o frecuencias observadas de las celdas A y B.
C+D = La suma de los valores o frecuencias observadas de las celdas C y D.
A+C = La suma de los valores o frecuencias observadas de las celdas A y C.
B+D = La suma de los valores o frecuencias observadas de las celdas B y D.
n = Es el total de casos o frecuencias.
[ │ AD – BC │ ]
(A + C) (B + D) (C + D) (A + B) Φ =
[│ AD – BC │ ] – .5 (n) (A + C) (B + D) (C + D) (A + B)
donde:
Φobtenido =
Medidas de Correlación
201
La última situación será elaborada en el texto porque usualmente los totales de las
líneas y columnas de las variables dicotómicas organizadas en tablas de 2x2 son
diferentes. Para lograr un análisis completo de dicho coeficiente debemos completar
tres (3) pasos: el coeficiente de PHI obtenido, el coeficiente de PHI máximo y el
coeficiente de PHI corregido, siendo el último paso donde se realiza el análisis.
Para poder comprender el coeficiente de correlación de PHI analizaremos el
siguiente caso. En el 1998, bajo el auspicio de la Vicepresidencia de Asuntos
Estudiantiles de la Pontificia Universidad Católica de Puerto Rico, Recinto de Ponce,
se realizó un trabajo de campo titulado Estudio Descriptivo sobre las Características y
Percepciones de los Estudiantes Subgraduados, PUCPR, Recinto de Ponce, PR,
1998 (Vera, 1998). Una de las preguntas realizadas en el estudio fue sobre el
consumo de alcohol. La respuesta de la muestra de estudiantes subgraduado por
género fue la siguiente:
Alcohol Hombres Mujeres TOTAL
Consumo 47 (A) 182 (B) 229 (A + B)
No consumo 105 (C) 140 (D) 245 (C + D)
TOTAL 152 (A + C) 322 (B + D) 474 (n)
3 casos no informaron
Supongamos que usted quisiera conocer si el consumo de alcohol entre los
estudiantes universitarios subgraduado de la Pontificia Universidad Católica de Puerto
Rico, Recinto de Ponce, para el año 1998, varía en función del género. Para el primer
paso tendríamos que buscar el coeficiente de Φobtenido
Arnaldo Torres Degró y Evelyn Afanador Mejías
202
Luego de conseguir el coeficiente de Φobtenido, obtener el coeficiente de Φmáximo.
La fórmula de Φmáximo sería:
[│ AD – BC │ ] – .5 (n) (A + C) (B + D) (C + D) (A + B)
[│ (47) (140) – (182) (105) │– .5 (474) ] (229) (245) (152) (322)
[│(6,580) – (19,110) │– 237 ] 2,746,003,120
[│–12,530 │– 237 ] 2,746,003,120 [│+12,530 │– 237 ]
2,746,003,120 12,293 52,402.3197 .234588 .23
Φobtenido =
Φobtenido =
Φobtenido =
Φobtenido =
Φobtenido =
Φobtenido =
Φobtenido =
Φobtenido =
Medidas de Correlación
203
Es necesario reorganizar la tabla original con el propósito de obtener el valor máximo
que podría alcanzar PHI (Φ). El procedimiento para obtener el coeficiente de Φmáximo
sería de la siguiente forma:
Primer Paso: Eliminar los valores originales que se encuentran en las celdas A;
B; C y D. Se tiene que mantener los subtotales de las columnas y las líneas y no se debe alterar bajo ninguna circunstancia.
Alcohol Hombres Mujeres TOTAL
Consumo (A) (B) 229 (A + B)
No consumo (C) (D) 245 (C + D)
TOTAL 152 (A + C) 322 (B + D) 474 (n)
Segundo Paso: De las cuatros celdas hay que seleccionar una, utilizando las
siguientes estrategias.
a. Comenzaremos con las columnas que están representando las categorías de la variable género. La columna que representa la categoría hombre está compuesta de las celdas (A) y (C). La columna que representa la categoría mujer está compuesta de las celdas (B) y (D). En esta fase se eliminarán dos celdas. Las celdas que estén localizadas en la columna con el subtotal más alto serán seleccionadas, mientras las celdas que estén localizadas en la columna con el subtotal más bajo serán eliminadas. Observemos que la primera columna (hombres) tiene un total de 152 y la segunda columna (mujeres) tiene un total de 322. El subtotal mayor recae en la segunda columna (mujeres) con 322 casos. Esto significa que la celda (B) o la celda (D) han sido
[ │ AD – BC │ ] – .5 (n) (A + C) (B + D) (C + D) (A + B)
donde:
Φmáximo =
Arnaldo Torres Degró y Evelyn Afanador Mejías
204
seleccionadas, mientras que las celdas (A) y (C) serán eliminadas. No obstante, de las celdas seleccionadas ( B o D), una será escogida y la otra será eliminada.
Alcohol Hombres Mujeres TOTAL
Consumo (A) (B) 229 (A + B)
No consumo (C) (D) 245 (C + D)
TOTAL 152 (A + C) 322 (B + D) 474 (n)
b. Para proseguir con la eliminatoria comenzaremos con las líneas que están representando las categorías de la variable alcohol. La columna que representa la categoría consume está localizada una de las dos celdas seleccionas, celda (B). La columna que representa la categoría no-consume está localizada en una de las dos celdas seleccionadas, celdas (D). En esta fase se elimina una de las dos celdas (B o D). La celda que esté localizada en el subtotal más alto de las líneas será seleccionada, mientras la celda que esté localizada en la línea con el subtotal más bajo será eliminado. Observemos que la primera línea (consume) tiene un total de 229 y
en la segunda línea (no-consume) tiene un total de 245. El subtotal
mayor recae en la segunda línea (no-consume) con 245 casos. Esto significa que la celda (D) ha sido seleccionada, mientras que la celda (B) será eliminada.
Alcohol Hombres Mujeres TOTAL
Consumo (A) (B) 229 (A + B)
No consumo (C) (D) 245 (C + D)
TOTAL 152 (A + C) 322 (B + D) 474 (n)
Tercer Paso: Buscar que valor tendrá la celda seleccionada. En dicha celda
se colocará el valor menor entre el subtotal mayor de columna vs. el subtotal mayor de línea. Según en el paso anterior se pudo determinar que la celda seleccionada era la (D).El subtotal mayor de la columna que corresponde a la categoría mujeres fue de 322. El subtotal mayor de la línea que corresponde a
Medidas de Correlación
205
la categoría no-consume fue de 245. De esos dos subtotales seleccionados el menor corresponde a la categoría no-consume con 245. Esté valor será ubicado en la celda (D).
Alcohol Hombres Mujeres TOTAL
Consumo (A) (B) 229 (A + B)
No consumo (C) 245 (D) 245 (C + D)
TOTAL 152 (A + C) 322 (B + D) 474 (n)
Cuarto Paso: Una vez se tiene la primera cantidad en la celda seleccionada,
las demás cantidades se obtendrán por diferencias, es decir, usando la operación de recta. Las sumas de las celdas tienen que corresponder con los subtotales de las columnas y líneas. Ya obtenido el valor o cantidad en la celda (D) podemos señalar que para mantener el subtotal de la línea que corresponde a la categoría no-consume (245) la celda C tiene que ser cero (0). Por diferencia, si la celda C es igual a cero (0), la celda A tiene que ser 152, para mantener el subtotal de la columna inalterable (152). Para mantener el subtotal de la línea que corresponde a la categoría consume (229), la celda B tiene que ser 77.
Alcohol Hombres Mujeres TOTAL
Consumo 152 (A) 77 (B) 229 (A + B)
No consumo 0 (C) 245 (D) 245 (C + D)
TOTAL 152 (A + C) 322 (B + D) 474 (n)
Con la tabla reorganizada podemos buscar el coeficiente de Φmáximo de la siguiente
forma:
Arnaldo Torres Degró y Evelyn Afanador Mejías
206
Con el coeficiente de Φobtenido y el coeficiente de Φmáximo podemos buscar el
coeficiente corregido de Φ. Dicho coeficiente se obtiene dividiendo el coeficiente
obtenido con el coeficiente máximo, es decir:
[ │ AD – BC │ ] – .5 (n) (A + C) (B + D) (C + D) (A + B)
[│ (152) (245) – (77) (0) │– .5 (474) ] (229) (245) (152) (322)
[│37,240 – 0 │– 237 ] 2,746,003,120
[│37,240 │– 237 ] 2,746,003,120 37,003 52,402.3197 .70613 .71
Φmaximo =
Φmaximo =
Φmaximo =
Φmaximo =
Φmaximo =
Φmaximo =
Φmaximo =
Φobtenido
Φmáximo Φcorregido =
Medidas de Correlación
207
Teniendo los dos coeficientes necesarios para obtener el coeficiente corregido, el
cálculo sería de la siguiente forma y se sugiere que existe una correlación moderada
baja de .32 entre el consumo de alcohol y el género de los estudiantes universitarios
subgraduados de la PUCPR, Recinto de Ponce, PR, para el año 1998.
Φobtenido
Φmáximo
.23 .71
.32
Φcorregido =
Φcorregido =
Φcorregido =
Arnaldo Torres Degró y Evelyn Afanador Mejías
208
Medidas de Correlación
209
Ejercicios de Coeficiente de PHI Favor de identificar las hojas de ejercicios y elaborar todos los problemas según lo establecido en el texto.
Desprenda las hojas de ejercicios y entréguelas al profesor, SI FUESE NECESARIO.
NOMBRE: FECHA: _______________ NUMERO DE ESTUDIANTE: SECCION: ___________
Ejercicio 7.1.1 Frecuencia de la opinión de estudiantes universitarios subgraduados si el
alcohol debe estar disponible en las fiestas, Pontificia Universidad Católica de
Puerto Rico, Recinto de Ponce,1992
Alcohol
Hombre
Mujer
TOTAL
Disponible
71
79
150
No-disponible
61
202
263
TOTAL
132
281
413
[7.1.1.a] Favor de calcular el coeficiente de Phi obtenido.
Arnaldo Torres Degró y Evelyn Afanador Mejías
210
Alcohol
Hombre
Mujer
TOTAL
Disponible
150
No-disponible
263
TOTAL
132
281
413
[7.1.1.b] Favor de calcular el coeficiente de Phi máximo. Complete las celdas para poder elaborar el ejercicio.
[7.1.1.c] Favor de calcular y analizar el coeficiente de Phi corregido.
Medidas de Correlación
211
Ejercicio 7.1.2 Frecuencia sobre la percepción de la pena de muerte como reductor de la
criminalidad, estudiantes de criminología por zona residencial, Puerto Rico,
1995.
Pena de muerte como reductor de la criminalidad
Urbano
Rural
TOTAL
Si
90
7
97
No
10
113
123
TOTAL
100
120
220
Ejercicio hipotéticos
[7.1.2.a] Favor de calcular el coeficiente de Phi obtenido.
Arnaldo Torres Degró y Evelyn Afanador Mejías
212
Pena de muerte como reductor de la criminalidad
Urbano
Rural
TOTAL
Si
97
No
123
TOTAL
100
120
220
Ejercicio hipotéticos
[7.1.2.b] Favor de calcular el coeficiente de Phi máximo. Complete las celdas para poder elaborar el ejercicio.
[7.1.2.c] Favor de calcular y analizar el coeficiente de Phi corregido.
Medidas de Correlación
213
[7.2.] Coeficiente de Correlación de V de CRAMER
Si usted quisiera sacar una correlación y una de las variables tiene más de dos
(2) categorías, no sería posible desarrollar el coeficiente de correlación de PHI (Φ). Un
cruce de variable que genere una tabla mayor de 2 x 2, no podrá aplicarse la técnica
de coeficiente de correlación de PHI (Φ). No obstante, el coeficiente de correlación V
de Cramer puede sustituir el coeficiente de correlación de PHI (Φ), cuando tengamos un
cruce de variable que genere una tabla mayor de 2 x 2 y por lo menos una de las
variables esta bajo la escala nominal. La notación del coeficiente de V de Cramer es:
V = coeficiente de correlación de Cramer
χ² = Chi cuadrado
k = número de líneas o columnas; lo que sea menor
De todos los nacimientos ocurridos en Puerto Rico para el año 1993, unos 39,322
nacimientos ocurrieron en los hospitales públicos y 25,622 nacimientos ocurridos en
hospitales privados. Si usted como investigador quisiera saber si los nacimientos
ocurridos en diversos sectores de servicios (públicos o privados) de Puerto Rico para
el año 1993, está asociada a la escolaridad de la madre, podemos buscar el
coeficiente de correlación V de Cramer.
χ2
n(k – 1)
donde;
ν =
Arnaldo Torres Degró y Evelyn Afanador Mejías
214
Escolaridad
Público
Privado
TOTAL
0 - 11
a 19,260
d 1,837
21,097
12
b 12,385
e 5,516
17,901
+ 13
c 7,677
f 18,269
25,946
TOTAL
39,322
25,622
64,944 (N)
Para poder obtener el coeficiente de correlación V de Cramer debemos obtener el chi
cuadrado χ², siendo ésta la fórmula:
ƒo = Frecuencia observada es el valor, cantidad o casos en cada una
de las celdas. La ƒo es un dato suministrado por la tabla. Por
ejemplo, la ƒo de la celda de las madres de 0 a 11 años de escolaridad que tuvieron sus hijos en hospitales públicos fue de 19,260 casos.
ƒe = Frecuencia esperada es un valor que se calculará en cada celda
que tenga una ƒo. Para obtener la ƒe es meritorio reconocer que cada celda esta localizada en una columna que tiene un subtotal y en una línea que tiene un subtotal. Por consiguiente, se multiplica el subtotal de columna por el subtotal de línea que le corresponda a la celda de interés. Obtenido el resultada el mismo se divide por N. La fórmula puede ser presentada de la siguiente manera:
donde;
χ2 =
(Subtotal de columna) (Subtotal de línea)
N
ƒe =
(ƒo - ƒe)2
ƒe Σ
Medidas de Correlación
215
Notemos que sin contar las celdas de los subtotales, existen seis (6) celdas con sus
respectivas frecuencia observada (ƒo). Para cada ƒo se debe buscar la frecuencia
esperada (ƒe). Por ejemplo, en la celda (a) con una ƒo de 19,260 se puede obtener
la ƒe de la siguiente forma: multiplicando el subtotal de la columna que corresponde a
la celda a (39,322) por el subtotal de la línea que le corresponde a la celda a (21,097);
dividido por el total del universo (N= 64,944), es decir:
Para efectos prácticos se recomienda que al lado de la ƒo se coloque la ƒe:
Escolaridad
Público
Privado
TOTAL
0 - 11
a 19,260(12,773.72)
d 1,837(8,323.28)
21,097
12
b 12,385(10,838.62)
e 5,516(7,062.38)
17,901
+13
c 7,677(15,709.67)
f 18,269(10,236.33)
25,946
TOTAL
39,322
25,622
64,944 (N)
ƒe = (subtotal de columna) (subtotal de línea)
N
ƒƒƒƒe a = (39,322)(21,097)
64,944
ƒe a = 12,773.72
Las demás celdas se obtienen de la misma manera:
ƒƒƒƒe b (39,322) (17,901) ÷ 64,944 = 10,838.62
ƒƒƒƒe c (39,322) (25,946) ÷ 64,944 = 15,709.67
ƒƒƒƒe d (25,622) (21,097) ÷ 64,944 = 8,323.28
ƒƒƒƒe e (25,622) (17,901) ÷ 64,944 = 7,062.38
ƒƒƒƒe f (25,622) (25,946) ÷ 64,944 = 10,236.33
Arnaldo Torres Degró y Evelyn Afanador Mejías
216
χ²
n (k – 1)
19,318.25
64,944 (2-1)
19,318.25
64,944
.2974601 = .55
Luego de obtener la ƒe para cada celda podemos realizar el siguiente cálculo por
celda para obtener el Chi-cuadrado χ²:
Obtenido el χ² podemos buscar el
coeficiente de correlación de V de Cramer.
La correlación de V de Cramer fue .55 y
podemos sugerir que existe una correlación
moderada alta entre los nacimientos
ocurridos en diversos sectores de servicios
(público o privado) de Puerto Rico para el
año 1993 y la escolaridad de la madre.
V =
V =
V =
V =
(ƒo – ƒe)²
ƒe
celda a = ( 19,260 - 12,773.72 )²
12,773.72
= 3,293.62
celda d = ( 1,837 - 8,323.28 )²
8,323.28
= 5,054.72
celda b = ( 12,385 - 10,838.62 )²
10,838.62
= 220.63
celda e = ( 5,516 - 7,062.38 )²
7,062.38
= 338.60
celda c = ( 7,677 - 15,709.67 )²
15,709.67
= 4,107.27
celda f = ( 18,269 - 10,236.33 )²
10,236.33
= 6,303.41
Σ χ² = ( 3,293.62 + 220.63 + 4,107.27 + 5,054.72 + 338.60 + 6,303.41 ) = 19,318.25
χ² = Σ
Medidas de Correlación
217
Ejercicios de V de Cramer Favor de identificar las hojas de ejercicios y elaborar todos los problemas según lo establecido en el texto.
Desprenda las hojas de ejercicios y entréguelas al profesor, SI FUESE NECESARIO.
NOMBRE: FECHA: _______________ NUMERO DE ESTUDIANTE: SECCION: ___________
Ejercicio 7.2.1 Según la data del Departamento de Salud de Puerto Rico para el año 1990
podemos observar los nacimientos ocurridos por la escolaridad de la madre y
el tipo de hospital usado. Favor de calcular y analizar la correlación de V de
Cramer.
Escolaridad
Público
Privado
TOTAL
0 - 11
a 20,292
d 1,875
22,167
12
b 12,745
e 6,158
18,903
+ 13
c 7,733
f 17,458
25,191
TOTAL
40,770
25,491
66,261 (N)
Arnaldo Torres Degró y Evelyn Afanador Mejías
218
Ejercicio 7.2.2 Según la data del Departamento de Salud de Puerto Rico para el año 1987
podemos observar los nacimientos ocurridos por la escolaridad de la madre y
el tipo de hospital usado. Favor de calcular y analizar la correlación de V de
Cramer.
Escolaridad
Público
Privado
TOTAL
0 - 11
a 21,132
d 2,024
23,156
12
b 12,769
e 6,124
18,893
+ 13
c 7,802
f 14,221
22,023
TOTAL
41,703
22,369
64,072 (N)
Medidas de Correlación
219
[7.3] Fórmulas
Coeficiente de Phi
Coeficiente de Phi corregido
V de Cramer
Ji Cuadrado
Frecuencia esperada
[│ AD – BC │ ] – .5 (n)
(A + C)(B + D)(C + D)(A + B)
Φ =
Φobtenido
Φmáximo
Φcorregido =
χ2
n(k – 1) ν =
N
ƒe = (Subtotal de columna) (Subtotal de línea)
χ2 = (ƒo - ƒe)2
ƒe Σ
Arnaldo Torres Degró y Evelyn Afanador Mejías
220
[7.4] Ejercicios Adicionales [7.4.1] Se le preguntó a un grupo de estudiantes de la Universidad Pitirre para el año 2002 si era necesario que las
mujeres aparecieran en los "shopper" vestidas en ropa interior para promover dicho producto. Está pregunta fue
cruzado con las variables sexo, zona residencial, estado civil y religión. Para cada uno de los cruces favor de
desarrollar y analizar el PHI obtenido, máximo y corregido.
(a) Género
TOTAL
Preg.
Hombre
Mujer
Si
60
15
75
No
15
110
125
TOTAL
75
125
200
(b) Zona residencial
TOTAL
Preg.
Urbano
Rural
Si
70
8
78
No
42
80
122
TOTAL
112
88
200
[7.4.2] Se le preguntó a un grupo de estudiantes del área de ciencias sociales de la Universidad Pitirre para el año
2001 sobre la necesidad del estado benefactor. Favor de desarrollar y analizar el Coeficiente de correlación de V de
Cramer.
Pregunta
Crim.
Soc.
Adm. Púb.
C. Pol.
TOTAL
Si
50
10
40
10
110
No
100
10
10
20
140
TOTAL
150
20
50
30
250