Capitulo6

15
Tabla de Correlación o Contingencia (atributos) (al (al final del capítulo) final del capítulo)

description

Capitulo6

Transcript of Capitulo6

  • Tabla de Correlacin o Contingencia (atributos) (al final del captulo)

  • Tabla de Correlacin o Contingencia

    Permite ayudarnos a determinar si existe relacin de interdependencia entre 2 variables, es decir, si se influyen mutuamente.

    As, una tabla de contingencia es una una tabla de doble entrada, donde en cada casilla figurar el nmero de casos o individuos que poseen un nivel de una de las caractersticas analizadas y otro nivel de la otra caracterstica.

    donde nij es el nmero de observaciones que presentan simultneamente las caractersticas i, j de las variables A y B, respectivamente.

  • Al analizar una distribucin bidimensional, uno puede centrar su estudio en el comportamiento de una de las variables, con independencia de como se comporta la otra. Estaramos as en el anlisis de una distribucin marginal.Distribucin marginal de ADistribucin marginal de B

    Aini.A1n1.A2n2.An-1nn-1.Annn.

    Bjn.jB1n.1B2n.2Bm-1n.m-1Bmn.m

  • son las frecuencias absolutas marginales de las variables A y B, respectivamente.Definimos:son las frecuencias relativas marginales de las variables A y B, respectivamente.Distribuciones marginales

  • Estadstica Econmica 2007-2008. Sara Mateo.En las tablas de contingencia:Distribuciones marginales Distribuciones de frecuencias relativas

  • Perfiles fila Perfiles columna Del total de individuos con la caracterstica A1 que porcentaje comparte a su vez la B1Cmo es lgico, el porcentaje de individuos con A1 que, o bien comparten B1 o B2 y hasta Bj ser el 100% = 1

  • Distribucin de una de las variables siempre que la otra cumpla una condicin especfica.

    X: Gasto en material escolarY: Nmero de hijosDistrib. Condicionada: Por ejemplo, gasto en material escolar cuando el nmero de hijos es

  • Estadstica Econmica 2007-2008. Sara Mateo.Representacin grfica: Nube de puntos o diagrama de dispersin

    Posicin

    00

    20302551255100.50021.889109.444250.50000

    30403530105035103.00011.889356.667353.00000

    40605045225080202.2503.111140.000502.25000

    607567.51067590150.66720.611206.11167.50.66667

    759082.5866098150.53335.611284.88982.50.53333

    9015023001001200.017103.111206.2221500.01667

    10050601303.333

    Media=50.6

    Moda=38.182Asimetra Pearson=0.54750.611

    Mediana=46.8888888889

    Asimetra de Bowley=0.05072

    Cuartil3=58.111Cuartil1=36.75

    Asimetra Absoluto=0.05327

    Decil1=31.70Centil15=33.383Dispersin respecto mediana=0.27796

    Desviacin tpica=20.3351

    Posicin

    0

    0

    0

    0

    0

    0

    0

    Momentos

    00

    2030255125-25.6-128.03276.80-83886.082147483.65-54975581.3888255

    304035301050-15.6-468.07300.80-113892.481776722.69-27716873.93283530

    406050452250-0.6-27.016.20-9.725.83-3.49925045

    607567.51067516.9169.02856.1048268.09815730.7213785849.184967.510

    759082.5866031.9255.28140.88259694.078284240.90264267284.6079282.58

    90150230099.4198.819760.721964215.57195243027.4619407156929.44451502

    1005060041351.52074389.45208267211.24519602517604.4

    50.60413.51520743.89452082672.11245196025176.04

    Varianza=413.515Momento 5 respecto la media=196025176

    Desviacin tpica=20.3351

    Coeficiente variacin Pearson=0.401879

    Asimetria Fisher g1=2.4669104979

    Curtosis Fisher g2=9.1797497688

    Momentos

    0

    0

    0

    0

    0

    0

    0

    Bidimensionales

    Graves Y

    Averias0123Marginal de leves

    Leves X03051036

    12283134

    21052219

    31281223

    4840113

    541005

    Marginal de Graves863176130

    XY

    03600860

    1343413131

    219382714

    323693618

    4135213063

    5525

    130218Media(Y)=0.48

    Media(X)=1.68

    Independencia

    Graves Y

    Averias0123Marginal de leves

    Leves X03051036

    12283134

    21052219

    31281223

    4840113

    541005

    Marginal de Graves863176130

    Graves Y

    Averias0123Marginal de leves

    Leves X00.23080.03850.00770.00000.2769

    10.16920.06150.02310.00770.2615

    20.07690.03850.01540.01540.1462

    30.09230.06150.00770.01540.1769

    40.06150.03080.00000.00770.1000

    50.03080.00770.00000.00000.0385

    Marginal de Graves0.66150.23850.05380.04621

    0.18320.06600.01490.0128

    0.17300.06240.01410.0121

    0.09670.03490.00790.0067

    0.11700.04220.00950.0082

    0.06620.02380.00540.0046

    0.02540.00920.00210.0018

    1

    Condicionadas

    0300050010000

    12222188133111

    210202510224224

    312363824313326

    48324416400414

    5420515500500

    861303163710615

    1.5116279072.03225806451.42857142862.5

    0300022001000120080040

    155188155188144111

    212236224212200200

    300313326326313300

    36734171915231613751

    0.19444444440.50.78947368420.69565217390.53846153850.2

    MBD0001AD02.unknown

    MBD00026BCB.unknown

    MBD00064132.unknown

    MBD00064136.unknown

    MBD0006413A.unknown

    MBD00126616.unknown

    MBD00127AD8.unknown

    MBD0012E8F3.unknown

    MBD00126D0A.unknown

    MBD001250FE.unknown

    MBD00064138.unknown

    MBD00064139.unknown

    MBD00064137.unknown

    MBD00064134.unknown

    MBD00064135.unknown

    MBD00064133.unknown

    MBD00045BB3.unknown

    MBD00052548.unknown

    MBD00064131.unknown

    MBD0004EC0E.unknown

    MBD0002A7E8.unknown

    MBD00045206.unknown

    MBD000285FA.unknown

    MBD00020044.unknown

    MBD00023A0D.unknown

    MBD00024EFB.unknown

    MBD00022ED6.unknown

    MBD0001CF41.unknown

    MBD0001D558.unknown

    MBD0001BEB3.unknown

    MBD00015ABA.unknown

    MBD00017EB5.unknown

    MBD00018FB3.unknown

    MBD0001A01E.unknown

    MBD00018A67.unknown

    MBD00016E04.unknown

    MBD00017744.unknown

    MBD000167B0.unknown

    MBD00014BE5.unknown

    MBD0001579D.unknown

    MBD000147CB.unknown

  • Estadstica Econmica 2007-2008. Sara Mateo.Varianza de XVarianza de YCovarianza entre X e YMide si existe asociacin lineal entre X e Y. Positiva o negativa pero no la intensidad

  • Estadstica Econmica 2007-2008. Sara Mateo.Momento rs con respecto origen:Momento rs con respecto a las medias:

  • Estadstica Econmica 2007-2008. Sara Mateo.Se efecta la transformacin:Resultado de las Medias de las nuevas variablesDe las nuevas varianzas:De la nueva covarianza:

  • Coeficiente de correlacin linealEl valor de la covarianza depender de los valores de las variables, por tanto de sus unidades. Para poder eliminar las unidades y tener una medida adimensional utilizamos el COEFICIENTE DE CORRELACIN LINEAL siendo invariante frente a transformaciones lineales (cambio de origen y escala) de las variable. Es un coeficiente adimensional -1 r 1Si hay relacin lineal positiva r > 0 y prximo a 1Si hay relacin lineal negativa r < 0 y prximo a -1Si no hay relacin lineal r se aproxima a 0Si X e Y son independientes Sxy = 0 y por tanto r = 0

    Si las dos variables son independientes, su covarianza vale cero. No podemos asegurar lo mismo en sentido contrario. Si dos variables tienen covarianza cero, no significa que sean independientes. Linealmente NO tienen relacin. Pero pueden pueden ser dependientes. Importante:Propiedades:

  • Coeficiente de Asociacin Chi-Cuadrado (2): Frecuencia observadaFrecuencia esperadaSi 0 no habr asociacin inexistencia de asociacin

    Problema: no tiene lmite superior por lo que no permite conocer el grado de asociacin.Como solucin:VARIABLES CUALITATIVAS

  • Estadstica Econmica 2007-2008. Sara Mateo.Coeficiente C de contingencia de Karl Pearson: Si C 0 inexistencia de asociacin Si C 1 perfecta asociacin entre las variables Nunca superior a uno

  • Estadstica Econmica 2007-2008. Sara Mateo.Coeficiente de Correlacin por Rangos de Spearman: El Coeficiente de Correlacin por Rangos de Spearman permite determinar la correlacin de datos de carcter ordinal midiendo la concordancia o discordancia entre las clasificaciones.

    Formulacin: Si no hay empates Interpretacin:

    Si = 1: Correlacin por rangos perfecta y positiva. La concordancia entre los rangos es perfectaSi = -1: Correlacin por rangos perfecta y negativa. La concordancia entre los rangos es perfectaSi = 0: Correlacin por rangos nula. No hay concordancia entre los rangosSi 0 < < 1: Correlacin por rangos positiva y si -1 <