1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular:...

33
1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia y Coeficientes de Asociación SEMINARIO DE INVESTIGACION

Transcript of 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular:...

Page 1: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

1

TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS

NIVEL II AVANZADO

Titular: Agustín Salvia

MÓDULO 2 A

Análisis de Tablas de Contingencia y Coeficientes de Asociación

SEMINARIO DE INVESTIGACION

Page 2: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

2

DE LAS TABLAS DE CONTINGENCIA AL ANÁLISIS DE

ASOCIACIÓN

SEMINARIO DE INVESTIGACION

Page 3: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

3

ANÁLISIS DE TABLAS DE CONTINGENCIA

TEST DE SIGNIFICANCIA NO PARAMÉTRICOS

MEDIDAS DE ASOCIACIÓN

SEMINARIO DE INVESTIGACION

¿CÓMO ANALIZAR Y EVALUAR HIPÓTESIS CAUSALES O DE COVARIACIÓN ENTRE VARIABLES CUANDO LAS MISMAS ESTÁN MEDIDAS EN ESCALA ORDINAL O NOMINAL?

Page 4: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

4

ANÁLISIS DE RELACIONES ENTRE VARIABLES

UNA TABLA DE CONTINGENCIA ES UNA DISTRIBUCIÓN EN FILAS Y COLUMNAS EN LA QUE LOS INDIVIDUOS DE UNA POBLACIÓN SE CLASIFICAN EN FUNCIÓN DE OTRA VARIABLE.

La tabla de contingencia es un método de representar simultáneamente dos caracteres observados en una misma población, si son discretos o continuos reagrupados en clases. Los dos caracteres son x e y, el tamaño de la muestra es n. Las modalidades o clases de x se escribirán c1.. cr, y las de y, d1... ds. Estos valores en una tabla de doble entrada:

Page 5: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

5

TIPO DE ANÁLISIS QUE PERMITE UNA TABLA DE CONTINGENCIA

ANÁLISIS DE PERFILES O CARACTERÍSTICAS POBLACIONALES

ANÁLISIS DESCRIPTIVO DE GRUPOS O SEGMENTOS DE POBLACIÓN

ANÁLISIS DE ASOCIACIÓN EN TÉRMINOS PROBABILÍSTICO / DEPENDENCIA VERSUS INDEPENDENCIA DE PROBABILIDADES

ANÁLISIS DE TABLAS DE CONTINGENCIA

COMPONENTES DE UNA TABLA DE CONTINGENCIA

DISTRIBUCIONES MARGINALES

DISTRIBUCIONES CONDICIONALES

UN TOTAL POBLACIONAL O MUESTRAL

Page 6: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

6

La idea de asociación / relación entre variables se define por lo general en oposición al de independencia estadística y se evalúa examinando el sentido y la fuerza de las regularidades empíricas

“Las variables X e Y (sexo y condición de actividad) son estadísticamente independientes si el porcentaje de observaciones que poseen el atributo Y1 (activo) es el mismo entre X1 (hombres) que entre X2 (mujeres)”.

ASOCIACIÓN ESTADÍSTICA

Page 7: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

7

UN PROBLEMA DE ASOCIACIÓN ESTADÍSTICA

A MODO DE EJEMPLO

“La participación en el mercado de trabajo está condicionada por diversos factores económicos, sociales y culturales. […] La definición de los roles masculinos y femeninos ubica a los varones como principales responsables del sostén económico de los hogares y […] directamente asociados al mundo laboral […] Las mujeres […] como principales responsables de las tareas de reproducción social en el ámbito doméstico”1.

1.- Drake, I y Philipp, E. (1997)

Page 8: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

8

Hipótesis de Trabajo:

“Dentro de la población de 25 a 45 años los varones tendrán una tasa de actividad significativamente más alta que las mujeres”

Sexo: Varón (V) – Mujer (M)Condición de Actividad: Activo (A) – Inactivo (I)

V A

M I o A

UN PROBLEMA DE ASOCIACIÓN ESTADÍSTICA

A MODO DE EJEMPLO

Page 9: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

9

Hipótesis Nula de Independencia Estadística

“Dentro de la población de 25 a 45 años la tasa de actividad no presentará diferencias

por sexo”

Sexo: Varón (V) – Mujer (M)Condición de Actividad: Activo (A) – Inactivo (I)

V I o A

M I o A

UN PROBLEMA DE ASOCIACIÓN ESTADÍSTICA

A MODO DE EJEMPLO

Page 10: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

10

Sintaxis:TEMPORARY .SELECT IF (h12>25 AND h12<45) .CROSSTABS /TABLES=cdea BY h13 /FORMAT= AVALUE TABLES /CELLS= COUNT COLUMN ROW TOTAL .

PEA * Sexo Crosstabulation

2656323 2043538 4699861

56,5% 43,5% 100,0%

95,2% 65,6% 79,6%

45,0% 34,6% 79,6%

133973 1073401 1207374

11,1% 88,9% 100,0%

4,8% 34,4% 20,4%

2,3% 18,2% 20,4%

2790296 3116939 5907235

47,2% 52,8% 100,0%

100,0% 100,0% 100,0%

47,2% 52,8% 100,0%

abs.

% fila

% Col

% Total

abs.

% fila

% Col

% Total

abs.

% fila

% Col

% Total

Activo

Inactivo

PEA

Total

Varón Mujer

Sexo

Total

Valores absolutos

Porcentaje fila

Porcentaje columna

Porcentaje total

ESTADÍSTICOS DE UNA TABLA DE CONTINGENCIA

A MODO DE EJEMPLO

ESTANDARIZACIÓN POR MEDIO DE PORCENTAJES

Page 11: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

11

PEA * Sexo Crosstabulation

2656323 2043538 4699861

95,2% 65,6% 79,6%

133973 1073401 1207374

4,8% 34,4% 20,4%

2790296 3116939 5907235

100,0% 100,0% 100,0%

Count

% within Sexo

Count

% within Sexo

Count

% within Sexo

Activo

Inactivo

PEA

Total

Varón Mujer

Sexo

Total Diferencia porcentual:29,6 p.p.

Intervalo:máximo asociación positiva de

100 independencia estadística 0

máxima asociación negativa -100Pero sólo se llega a

los máximos en las hipótesis diagonales

ESTADÍSTICOS DE UNA TABLA DE CONTINGENCIA

A MODO DE EJEMPLO

ANÁLISIS COMPARATIVO DE DEPORCENTAJES

Page 12: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

12

Frecuencias esperadas bajo el supuesto de independencia estadística: PROBABILIDAD CONJUNTA DE QUE OCURRA a y b

PEA * Sexo Crosstabulation

Expected Count

2.219.990 2.479.871 4.699.861

570.306 637.068 1.207.374

2.790.296 3.116.939 5.907.235

Activo

Inactivo

PEA

Total

Varón Mujer

Sexo

TotalN

aNvNavE

)(*)(),(

Sintaxis:CROSSTABS /TABLES=cdea BY h13 /FORMAT= AVALUE TABLES /CELLS= EXPECTED .

ESTADÍSTICOS DE UNA TABLA DE CONTINGENCIA

A MODO DE EJEMPLO

ANÁLISIS DE FRECUENCIAS ESPERADAS VERSUS FRECUENCIAS OBSERVADAS

Page 13: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

13

LAS PRUEBAS JI-CUADRADO PARA TABLAS DE CONTINGENCIA DE DOBLE ENTRADA EVALÚA SI EXISTE ALGÚN TIPO DE DEPENDENCIA ENTRE LOS VALORES DE DOS O MÁS VARIABLES OBSERVADAS: SI LOS VALORES DE UNA CUALQUIERA DE LAS VARIABLES APORTAN INFORMACIÓN SOBRE LOS VALORES DE LA/S OTRA/S. SUPUESTO QUE ASÍ FUERA RESULTARÁ DE INTERÉS MEDIR EL GRADO Y TIPO DE DEPENDENCIA O ASOCIACIÓN.

PRUEBA NO PARAMÉTRICA DE INDEPENDENCIA ESTADÍSTICA

Prueba Descripción

J i-cuadrado de Pearson

Determinar si las diferencias entre las frecuencias observadas en la tabla de contingencia corresponde al cruce de los valores de las dos variables y las frecuencias esperadas, supuesto que las variables son independientes, son estadísticamente significativas.

Page 14: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

14

k

ii

ii

E

EOx

1

22 )(

PRUEBA DE HIPÓTESIS JI-CUADRADA

Page 15: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

15

PRUEBA DE HIPÓTESIS JI-CUADRADA

A MODO DE EJEMPLO

Chi-Square Tests

2029,509b 1 ,000

15109

Pearson Chi-Square

N of Valid Cases

Value dfAsymp. Sig.

(2-sided)

0 cells (,0%) have expected count less than 5. The minimum expected countis 1538,23.

b.

Page 16: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

16

ANALISIS MULTIVARIADO DE ASOCIACIÓN PARA VARIABLES

CATEGÓRICAS

SEMINARIO DE INVESTIGACION

Page 17: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

17

Medida deasociación

TablaEscala deMedida

Observaciones

Phi

V de Cramer

2 x 2

f x c

Nominales

Nominales

Medidas basadas en chi cuadrado.Toman valores comprendidos entre 0 y 1.Evalúa hipótesis lineales (diagonal principal). Son útiles para estimar grados de asociaciónentre pares de variables, sobre un mismoconjunto de individuos para n filas y columnas.

Lambda f x c Nominales Toma valores entre 0 y 1. Disponen versión asimétrica.Es fácil de interpretar en términos de laproporción que se reduce le error depredicción del valor de una variable a partirde los valores de la otra (pero puede tomarvalores muy bajos en tablas con asociación).

Gamma

Tau b / c de Kendall

f x c

f x c

Ordinales

Ordinales

Toma valores entre -1 y 1, pasando por 0. Gamma es más fácil de interpretar. Asumerelaciones curvilineales. Tau b sólo alcanza valores extremos cuandohay asociación total y f y c son iguales.Tau c tiende a subestimar la relación.

MEDIDAS DE ASOCIACIÓN

Page 18: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

18

PEA * Sexo Crosstabulation

6726 5122 11848

5588,8 6259,2 11848,0

1137,2 -1137,2

15,2 -14,4

401 2860 3261

1538,2 1722,8 3261,0

-1137,2 1137,2

-29,0 27,4

7127 7982 15109

7127,0 7982,0 15109,0

Count

Expected Count

Residual

Std. Residual

Count

Expected Count

Residual

Std. Residual

Count

Expected Count

Activo

Inactivo

PEA

Total

Varón Mujer

Sexo

Total

Chi-Square Tests

2029,509b 1 ,000

2258,729 1 ,000

2029,375 1 ,000

15109

Pearson Chi-Square

Likelihood Ratio

Linear-by-LinearAssociation

N of Valid Cases

Value dfAsymp. Sig.

(2-sided)

Computed only for a 2x2 tablea.

0 cells (,0%) have expected count less than 5. Theminimum expected count is 1538,23.

b.

PEA * Sexo Crosstabulation

56,5% 43,5% 100,0%

95,2% 65,6% 79,6%

45,0% 34,6% 79,6%

11,1% 88,9% 100,0%

4,8% 34,4% 20,4%

2,3% 18,2% 20,4%

47,2% 52,8% 100,0%

100,0% 100,0% 100,0%

47,2% 52,8% 100,0%

% within PEA

% within Sexo

% of Total

% within PEA

% within Sexo

% of Total

% within PEA

% within Sexo

% of Total

Activo

Inactivo

PEA

Total

Varón Mujer

Sexo

Total

Distribuciones para Tablas de Contingencia y Prueba de Hipótesis Ji

cuadrado

ESTADÍSTICOS DE ANÁLISIS BIVARIADO

A MODO DE EJEMPLO

Page 19: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

19

Risk Estimate

9,366 8,385 10,462

4,617 4,207 5,066

,493 ,481 ,505

15109

Odds Ratio for PEA(Activo / Inactivo)

For cohort Sexo = Varón

For cohort Sexo = Mujer

N of Valid Cases

Value Lower Upper

95% ConfidenceInterval

Coeficientes de Asociación

Tablas 2 X 2

Symmetric Measures

,367 ,000

,367 ,000

,344 ,000

,807 ,010 50,109 ,000

,292 ,006 45,050 ,000

15109

Phi

Cramer's V

ContingencyCoefficient

Nominal byNominal

GammaOrdinal byOrdinal KappaMeasure ofAgreementN of Valid Cases

ValueAsymp.

Std. Errora

Approx.T

bApprox.

Sig.

Not assuming the null hypothesis.a.

Using the asymptotic standard error assuming the null hypothesis.b.

Directional Measures

,154 ,010 14,843

,000 ,000 .

,225 ,013 14,843

,134 ,005

,134 ,004

,123 ,005 26,532

,143 ,005 26,532

,108 ,004 26,532

Symmetric

PEADependent

SexoDependent

PEADependent

SexoDependent

Symmetric

PEADependent

SexoDependent

Lambda

GoodmanandKruskal tau

UncertaintyCoefficient

NominalbyNominal

ValueAsymp.

Std. ErrorApprox.

T

ESTADÍSTICOS DE ANÁLISIS BIVARIADO

A MODO DE EJEMPLO

Page 20: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

20

ASOCIACIÓN ESTADÍSTICA MULTIVARIADAA MODO DE EJEMPLO

Coeficientes para Variables Ordinales

o Combinadas

Menores en el hogar * PEA Crosstabulation

75,8% 24,2% 100,0%

36,7% 42,5% 37,9%

77,9% 22,1% 100,0%

29,9% 30,7% 30,0%

81,9% 18,1% 100,0%

33,4% 26,8% 32,0%

78,4% 21,6% 100,0%

100,0% 100,0% 100,0%

% within Menoresen el hogar

% within PEA

% within Menoresen el hogar

% within PEA

% within Menoresen el hogar

% within PEA

% within Menoresen el hogar

% within PEA

Un menor de5 años omenos

Un menor deentre 6 y 12años

Sin menoresde 12 años omenos

Menoresen elhogar

Total

Activo Inactivo

PEA

Total

Directional Measures

-,054 ,007 -7,569 ,000

-,080 ,011 -7,569 ,000

-,041 ,005 -7,569 ,000

,061

,062

Symmetric

Menores en elhogar Dependent

PEA Dependent

Menores en elhogar Dependent

PEA Dependent

Somers' dOrdinalbyOrdinal

EtaNominal byInterval

ValueAsymp.

Std. Errora

Approx. Tb

Approx.Sig.

Not assuming the null hypothesis.a.

Using the asymptotic standard error assuming the null hypothesis.b.

Symmetric Measures

-,057 ,008 -7,569 ,000

-,054 ,007 -7,569 ,000

15109

Kendall'stau-b

Kendall'stau-c

Ordinal byOrdinal

N of Valid Cases

ValueAsymp. Std.

Errora

Approx.T

bApprox. Sig.

Not assuming the null hypothesis.a.

Using the asymptotic standard error assuming the null hypothesis.b.

Page 21: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

21

EL PAPEL MÁS IMPORTANTE DEL ANÁLISIS MULTIVARIABLE ES PROPORCIONAR LOS SUSTITUTOS LÓGICOS DEL CONTROL EXPERIMENTAL Y PONER A PRUEBA HIPÓTESIS MÁS COMPLEJAS SOBRE EL ORDEN O EL CAMBIO SOCIAL.

ASOCIACIÓN ESTADÍSTICA MULTIVARIADA

DOS TIPOS DE PROBLEMAS ENFRENTA EL ANÁLISIS MULTIVARIADO

• Análisis de los datos: ¿cómo manipular la información, resumirla, identificar y evaluar las diferentes relaciones?

• Interpretación de los datos: ¿cómo diferenciar los efectos particulares de los de interacción y cómo evaluar de manera racional el sentido de las regularidades empíricas?

Page 22: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

22

ASOCIACIÓN ESTADÍSTICA MULTIVARIADA

NECESIDAD DE UN MÉTODO QUE PERMITA

• Explicar una relación descubriendo las conexiones causales existente entre las variables.

• Identificar condiciones bajo las cuales una relación tiene lugar.

• Identificar factores o condiciones independientes que operan sobre una misma variable.

• Evaluar la existencia de relaciones espurias entre variables.

Page 23: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

23

Hipótesis Multivariada “Entre las personas en edad de alta

participación económica (de 25 a 45 años), la tasa de actividad significativamente más elevada entre los varones que entre las mujeres, se explica por la intervención de condiciones familiares”

ASOCIACIÓN ESTADÍSTICA MULTIVARIADAA MANERA DE EJEMPLO

Page 24: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

24

Forma estadística Por parciales Por marginales

Temporalidad Antecedente Interviniente

  Antecedente Interviniente

Parcial PA PI

Marginal MA MI

Parcial anterior:

(condición / especificación)

X YT

Parcial interviniente:

(contingencia)

X Y

T

Marginal anterior:

(Espuriedad)

X YT

Marginal interviniente:

(interpretación)

X YT

ASOCIACIÓN ESTADÍSTICA MULTIVARIADAEL MODELO LAZARSFELD

Page 25: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

25

Ecuación de Covarianzas de Lazarsfeld

(XY) = (XY,t1) (XY,t⊕ 2) (XT) (YT)⊕ ⊗

RelaciónOriginal

RelacionesParciales

RelacionesMarginales

Siempre debe usarse el mismo coeficiente

“Existe relación causal entre dos variables si, para cualquier factor de prueba antecedente, la relación

entre esas variables no desaparece”

ASOCIACIÓN ESTADÍSTICA MULTIVARIADAEL MODELO LAZARSFELD

Page 26: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

26

Presencia de menores en el hogarPEA * Sexo * Presencia de menores en el hogar Crosstabulation

1671878 1265488 2937366

97,3% 59,8% 76,6%

47161 850325 897486

2,7% 40,2% 23,4%

1719039 2115813 3834852

100,0% 100,0% 100,0%

984445 778050 1762495

91,9% 77,7% 85,0%

86812 223076 309888

8,1% 22,3% 15,0%

1071257 1001126 2072383

100,0% 100,0% 100,0%

abs.

% col

abs.

% col

abs.

% col

abs.

% col

abs.

% col

abs.

% col

Activo

Inactivo

PEA

Total

Activo

Inactivo

PEA

Total

Presencia de menoresen el hogarAl menos un niño de 12años o menos

Sin menores de 12 años

Varón Mujer

Sexo

Total Diferencia porcentual37,5 p.p.

Diferencia porcentual14,2 p.p.

Doble Diferencia23,3 p.p.

ASOCIACIÓN ESTADÍSTICA MULTIVARIADAA MODO DE EJEMPLO

INCORPORACIÓN DE UNA VARIABLE TEST O DE CONTROL

Page 27: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

27

ASOCIACIÓN ESTADÍSTICA MULTIVARIADAA MODO DE EJEMPLO

Explicación por Parciales

PEA * Sexo * Presencia de menores en el hogar Crosstabulation

4427 3459 7886

3515,8 4370,2 7886,0

911,2 -911,2

15,4 -13,8

153 2234 2387

1064,2 1322,8 2387,0

-911,2 911,2

-27,9 25,1

4580 5693 10273

4580,0 5693,0 10273,0

2299 1663 3962

2086,7 1875,3 3962,0

212,3 -212,3

4,6 -4,9

248 626 874

460,3 413,7 874,0

-212,3 212,3

-9,9 10,4

2547 2289 4836

2547,0 2289,0 4836,0

Count

Expected Count

Residual

Std. Residual

Count

Expected Count

Residual

Std. Residual

Count

Expected Count

Count

Expected Count

Residual

Std. Residual

Count

Expected Count

Residual

Std. Residual

Count

Expected Count

Activo

Inactivo

PEA

Total

Activo

Inactivo

PEA

Total

Presenciademenoresen el hogarAl menosun niño de12 años omenos

Sinmenoresde 12 años

Varón Mujer

Sexo

Total

Page 28: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

28

Chi-Square Tests

741869,1b

1 ,000

3834852

81808,083c 1 ,000

2072383

Pearson Chi-Square

N of Valid Cases

Pearson Chi-Square

N of Valid Cases

Presencia demenores en elhogarAl menos unniño de 12años o menos

Sin menoresde 12 años

Value df

Asymp.Sig.

(2-sided)

Computed only for a 2x2 tablea.

0 cells (,0%) have expected count less than 5. The minimum expectedcount is 402313,7.

b.

0 cells (,0%) have expected count less than 5. The minimum expectedcount is 149700,6.

c.

ASOCIACIÓN ESTADÍSTICA MULTIVARIADAA MODO DE EJEMPLO

Explicación por Parciales

Risk Estimate

18,687 15,770 22,144

8,758 7,504 10,222

,469 ,456 ,482

10273

3,490 2,974 4,095

2,045 1,834 2,280

,586 ,554 ,619

4836

Odds Ratio for PEA(Activo / Inactivo)

For cohort Sexo = Varón

For cohort Sexo = Mujer

N of Valid Cases

Odds Ratio for PEA(Activo / Inactivo)

For cohort Sexo = Varón

For cohort Sexo = Mujer

N of Valid Cases

Presenciade menoresen el hogarAl menosun niño de12 años omenos

Sinmenores de12 años

Value Lower Upper

95% ConfidenceInterval

Symmetric Measures

,423

,423

,389

,898 ,008 51,013

,335 ,007 42,825

10273

,229

,229

,223

,555 ,028 15,985

,182 ,011 15,891

4836

Phi

Cramer's V

ContingencyCoefficient

GammaOrdinalbyOrdinal

KappaMeasure ofAgreement

N of Valid Cases

Phi

Cramer's V

ContingencyCoefficient

GammaOrdinalbyOrdinal

KappaMeasure ofAgreement

N of Valid Cases

Presencia demenoresen elhogarAl menosun niñode 12años omenos

Sinmenoresde 12años

Value

Asymp.Std.Error

aApprox.

Tb

Not assuming the null hypothesis.a.

Using the asymptotic standard error assuming the nullhypothesis.

b.

Page 29: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

29

ASOCIACIÓN ESTADÍSTICA MULTIVARIADAA MODO DE EJEMPLO

Explicación por Marginales

PEA * Presencia de menores en el hogar Crosstabulation

2937366 1762495 4699861

76,6% 85,0% 79,6%

897486 309888 1207374

23,4% 15,0% 20,4%

3834852 2072383 5907235

100,0% 100,0% 100,0%

Activo

Inactivo

PEA

Total

Al menos unniño de 12

años omenos

Sin menoresde 12 años

Presencia de menores en elhogar

Total

Chi-Square Tests

51,785b 1 ,000

53,012 1 ,000

51,782 1 ,000

15109

Pearson Chi-Square

Likelihood Ratio

Linear-by-LinearAssociation

N of Valid Cases

Value dfAsymp. Sig.

(2-sided)

Computed only for a 2x2 tablea.

0 cells (,0%) have expected count less than 5. Theminimum expected count is 1043,76.

b.

Población Activa por Presencia de menores en el hogar

Page 30: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

30

ASOCIACIÓN ESTADÍSTICA MULTIVARIADAA MODO DE EJEMPLO

Explicación por Marginales

Symmetric Measures

-,059

,059

,058

-,157 ,021 -7,445

-,056 ,008 -7,196

15109

Phi

Cramer's V

ContingencyCoefficient

Nominal byNominal

GammaOrdinal byOrdinal KappaMeasure ofAgreementN of Valid Cases

ValueAsymp.

Std. Errora

Approx. Tb

Not assuming the null hypothesis.a.

Using the asymptotic standard error assuming the null hypothesis.b.

Risk Estimate

,729 ,668 ,795

,909 ,887 ,932

1,248 1,173 1,328

15109

Odds Ratio for PEA (Activo /Inactivo)

For cohort Al menos unniño de 12 años o menos

For cohort Sin menores de12 años

N of Valid Cases

Value Lower Upper

95% ConfidenceInterval

Población Activa por Presencia de menores en el hogar

Page 31: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

31

ASOCIACIÓN ESTADÍSTICA MULTIVARIADAA MODO DE EJEMPLO

Explicación por Marginales

Presencia de menores en el hogar * Sexo Crosstabulation

1719039 2115813 3834852

61,6% 67,9% 64,9%

1071257 1001126 2072383

38,4% 32,1% 35,1%

2790296 3116939 5907235

100,0% 100,0% 100,0%

Al menosun niño de12 años omenos

Sinmenoresde 12 años

Presenciademenoresen elhogar

Total

Varón Mujer

Sexo

Total

Chi-Square Tests

86,242b 1 ,000

86,183 1 ,000

86,236 1 ,000

15109

Pearson Chi-Square

Likelihood Ratio

Linear-by-LinearAssociation

N of Valid Cases

Value dfAsymp. Sig.

(2-sided)

Computed only for a 2x2 tablea.

0 cells (,0%) have expected count less than 5. Theminimum expected count is 2281,17.

b.

Presencia de menores en el hogar por Sexo

Page 32: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

32

ASOCIACIÓN ESTADÍSTICA MULTIVARIADAA MODO DE EJEMPLO

Explicación por Marginales

Symmetric Measures

-,076

,076

,075

-,161 ,017 -9,282

-,069 ,007 -9,287

15109

Phi

Cramer's V

ContingencyCoefficient

Nominal byNominal

GammaOrdinal byOrdinal KappaMeasure ofAgreementN of Valid Cases

ValueAsymp.

Std. Errora

Approx.T

b

Not assuming the null hypothesis.a.

Using the asymptotic standard error assuming the nullhypothesis.

b.

Risk Estimate

,723 ,675 ,774

,846 ,818 ,876

1,171 1,131 1,212

15109

Odds Ratio for Al menosun niño de 12 años / Sinmenores de 12 años

For cohort Sexo = Varón

For cohort Sexo = Mujer

N of Valid Cases

Value Lower Upper

95% ConfidenceInterval

Presencia de menores en el hogar por Sexo

Page 33: 1 TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS NIVEL II AVANZADO Titular: Agustín Salvia MÓDULO 2 A Análisis de Tablas de Contingencia.

33

ECUACIÓN DE COVARIANZAS DE LAZARSFELD

(XY) = (XYt1) (XYt⊕ 2) (XT) (YT)⊕ ⊗

Hipótesis diagonal (PHI):

(XY) = (XYt1) (XYt⊕ 2) (XT) (YT)⊕ ⊗0,367 = 0,423 0,299 -0,086 -0,059⊕ ⊕ ⊗

Hipótesis rinconal (Gamma):

(XY) = (XY,t1) (XY,t⊕ 2) (XT) (YT)⊕ ⊗0,807 = 0,896 0,555 -0,161 -0,157⊕ ⊕ ⊗

ASOCIACIÓN ESTADÍSTICA MULTIVARIADAA MODO DE EJEMPLO