ESTD Cortada de Kohan Unidad 7

17
Diseño estadístico (Para investigadores de las ciencias sociales y de la conducta) Nuria Cortada de Kohan Editorial Eudeba 1ª ed., Buenos Aires, 1994 Colección: Manuales ISBN 9502305698 Este material se utiliza con fines exclusivamente didácticos

description

El diseño estadístico - Cortada de de Kohan

Transcript of ESTD Cortada de Kohan Unidad 7

  • Diseo estadstico (Para investigadores de las ciencias

    sociales y de la conducta)

    Nuria Cortada de Kohan

    Editorial Eudeba

    1 ed., Buenos Aires, 1994

    Coleccin: Manuales

    ISBN 9502305698

    Este material se utiliza con fines exclusivamente didcticos

  • CAPTULO XI

    Correlacin entre dos variables X.1. Estadstica bivariada

    Hasta ahora hemos considerado, en general, el estudio de una variable. Pero para la ciencia resulta a veces muy importante apreciar las variaciones de los valores de una variable en relacin con la variacin de los valores de otra variable.

    La estadstica que estudia las relaciones entre dos variables cualesquiera, X e Y, se llama estadstica bivariada. La inquietud por este tipo de estudios fue iniciada en 1885 cuando Galton public un trabajo en el que se interesaba por la prediccin de las caractersticas fsicas de los hijos, conociendo las caractersticas fsicas de sus padres. Galton demostraba que si en una poblacin la media de altura era de 1,60 y se casaban dos personas muy altas, digamos de 1,80m., los hijos medan tallas inferiores a los padres, es decir, se acercaban o regresaban a la media de la poblacin, y si se casaban dos personas muy bajas, por ejemplo 1,40, los hijos tenan tallas algo ms altas, es decir, tambin regresaban a la talla media de la poblacin.

    180 180 140 140 \ / \ / 170 150

    Talla poblacin: X = 1,60

    XI.2 Coeficiente de correlacin de Pearson

    Carl Pearson se interes en los problemas de comparar la variacin concomitante de dos variables y as cre el ndice de correlacin de Pearson, que se llama coeficiente de correlacin por el producto de los momentos. Este ndice slo se puede usar cuando las variables se miden a nivel de intervalos iguales o de cocientes.

    Para entender el concepto de correlacin supongamos que tenemos dos variables cualesquiera X e Y Para cada sujeto Al, A2, A3, A4, etc., tenemos, pues, dos observaciones. Supongamos que stas son las del siguiente cuadro:

    Sujetos

    Variable X

    Variable Y A1 5 8 A2 1 2 A3 4 4 A4 6 7 A5 3 3 A6 5 6

    Esto lo podemos graficar en un cuadro en donde la abscisa representa la variable X y la ordenada la

    variable Y, y los puntos corresponden a cada uno de los sujetos Al, A2, ...A6, como se ve en la Figura XI.1

    2

  • Figura XI.1

    Vemos que los puntos tienen una orientacin en la que estn casi todos dentro de una elipse. Si hubiera muchos ms puntos, la gran mayora estara cerca de la lnea indicada, y vemos que a mayores valores de X corresponden valores ms altos de Y, lo que indica una fuerte correlacin positiva.

    La frmula para hallar la correlacin para datos sin agrupar, como en el ejemplo dado, es:

    r = yxN

    XYXX

    )()(

    Ordenamos otra vez los datos anteriores en una tabla como la siguiente:

    X Y X - X Y - Y (X - X )2 (Y Y)2 (X - )X (Y - )Y 5 8 1 3 1 9 3 1 2 -3 -3 9 9 9 4 4 0 -1 0 1 0 6 7 2 +2 4 4 4 3 3 -1 -2 1 4 2 5 6 +1 1 1 1 1

    24 30 0 0 16 28 19

    X = 46

    24 = Medida variable X = 4

    Y = 6

    30 = 5 Medida variable Y = 5

    Volvamos a escribir la frmula con detalle para poder usar nuestros datos:

    r =

    NYY

    NXXN

    XYXX22

    )()(

    )()(

    r = =628

    6166

    19

    r = = 66,466,2619

    3

  • r = 90,002,21

    1915,263,16

    19 ==

    Este valor, 0,90, indica que la correlacin es muy alta y positiva entre las dos variables X e Y, tal como se poda predecir del grfico. Si los puntos del grfico hubieran sido como los que se indican en la Figura XI.2,

    Figura XI.2

    la correlacin tambin hubiera sido muy alta, pero negativa porque con valores altos en la X se dan valores bajos en la Y, y viceversa. Cuando los puntos del grfico se esparcen por todo el espacio sin demostrar una tendencia, como en el siguiente grfico de la Figura XI.3, la correlacin es muy baja o nula = 0.

    Figura. XI.3

    Es decir, que una correlacin puede ir desde un valor mximo positivo de +1 a un valor mximo

    negativo de -1 pasando por 0. (+1 0 -1). Los grficos presentados se suelen llamar diagramas de dispersin (scatter diagrams).

    La frmula r =

    NYY

    NXXN

    XYXX22

    )()(

    )()(

    se puede

    convertir fcilmente en la siguiente, si no necesitamos calcular las desviaciones estndar:

    r = 22

    )()(

    ))((

    XYXX

    XYXX

    y

    si llamamos a las diferencias (X - X ) y (Y - Y ) desvos de X y de Y y los escribimos con x e y minsculas, tenemos que es:

    4

  • r = 22 yx

    xy

    Una de las frmulas ms usuales en los libros.

    XI.3. Clculo de la correlacin para datos agrupados

    Tabla XI2

    La Tabla XI.2 ilustra sobre el procedimiento para calcular el coeficiente de correlacin con los datos

    agrupados por frecuencias. Se usa un procedimiento similar al usado previamente para los clculos de la media y desviacin estandard agrupados en intervalos de clase y con el uso de la variable de clculo x e y. Para calcular el coeficiente de correlacin se requiere la sumatoria de xy. Para esto se multiplican las frecuencias de cada columna por el valor de la variable de cmputo. Los valores se colocan en el ngulo superior derecho de cada celda (entre parntesis). Estos productos se suman teniendo en cuenta los signos, lo que se ve en la columna xy a la derecha y finalmente estos valores de la columna x se multiplican por la variable y y se obtiene la columna final y x, cuya sumatoria representa la suma de los productos (137). La frmula que aplicamos para la Tabla XI.2 es la siguiente:

    r = [ ][ ]2222 )'(')'(' ''.''. fyfyNfxfxN fyfxyxN En nuestro caso segn los resultados del cuadro adjunto:

    r = =

    )22 2714580)(2321780(272313780

    = =

    )72911600)(52917360(62110960

    = ==182969801

    10339)10871)(16831(

    10339

    = 764,06,13526

    10339 =

    5

  • Actualmente, estas frmulas raramente se usan, pues las computadoras las hacen innecesarias; pero es bueno conocerlas para comprender el mecanismo de lo que es una correlacin entre dos variables.

    Otra cosa que es conveniente que conozcamos: la frmula clsica de correlacin con la sumatoria del producto de los desvos a la media de las dos variables, es decir:

    r = yxN

    XYXX

    )((pero

    qu es (X - X ) / x? Naturalmente son los puntajes z para la variable x y (Y - Y ) / y son los puntajes z para la variable y, de modo que una forma de presentar la frmula ms abreviada es:

    r = Nzz yx

    XI.4. Interpretacin y usos del coeficiente de correlacin

    Un ndice de correlacin nos indica tres cosas fundamentales:

    1) La existencia o no de una relacin entre las variables estudiadas. 2) La direccin de esta relacin, si es que existe (es decir positiva, ms, o negativa, menos) y 3) El grado de esta relacin (cuyo valor mximo 1 y cuyo valor mnimo es la no correlacin = 0).

    Sin embargo, hay que tener muy bien en cuenta que covariacin de las dos variables, es decir

    concomitancia en la variacin entre dos variables, que es lo que nos indica el coeficiente de correlacin, no significa que entre las dos variables exista una relacin de causa a efecto. Por ejemplo, entre la variable peso y la variable talla de las personas existe una correlacin alta y positiva; pero esto no significa que una variable sea causa de la otra, probablemente la causa sea gentica, o debido a las condiciones de alimentacin, etc. A veces, naturalmente, que la correlacin entre variables puede identificar relaciones causales cuando se une esto a otros enfoques metodolgicos, pero resulta muy peligroso, especialmente en educacin y psicologa, atribuir la correlacin entre dos variables a que una es causa de la otra. Por ejemplo, es evidente que casi siempre existe elevada correlacin entre el rendimiento escolar de los nios y su cociente intelectual, pero es evidente que en el rendimiento escolar bueno o malo de los alumnos intervienen muchas otras variables adems de la inteligencia, como dedicacin de los padres a la educacin de los nios, estmulos recibidos por ellos, nivel socioeconmico, esfuerzo, atencin, capacidad perceptiva, etctera.

    El coeficiente de correlacin es una medicin estadstica muy usada en investigacin psicolgica y especialmente en psicometra. Por ejemplo, los ndices de confiabilidad y de validez de los tests suelen usar el coeficiente de correlacin. No podemos entrar en los detalles de estas medidas, pero digamos que, en cierto sentido, la confiabilidad de un instrumento de medicin se refiere a la consistencia o estabilidad con que un test mide una aptitud, y esto se suele calcular con la correlacin de un test en dos formas separadas pero paralelas, A y B, o en la estimacin de la consistencia interna de un test, como la frmula 20 de Spearman-Brown, que en realidad miden, con un coeficiente de correlacin, si todos los tems en un test evalan la misma aptitud. Para la validez, es decir para saber si un test mide lo que pretende medir, es decir, por ejemplo, si un test de inteligencia mide inteligencia y no cualquier otra aptitud, se suele usar tambin el coeficiente de correlacin tanto para la validez predictiva como para la validez de contenido o para la validez de construccin y la validez factorial al tipo de la de Guilford.

    XI.5 Prediccin. Rectas de regresin Si tenemos los siguientes valores en dos variables X e Y, podemos construir un diagrama de puntos

    como el siguiente de la Figura XI.4

    6

  • X Y A 1 1 B 3 2 C 4 4 D 6 4 E 8 5 F 9 7 G 7 8 H 10 9

    Figura XI.4

    Podemos buscar una recta que se ajuste a estos datos. Esta lnea ser la recta de los cuadrados

    mnimos, lo que significa que la suma de las distancias de cada punto a la recta terica, elevados al cuadrado, ser un valor mnimo, o sea:

    D12 + D22 + D32 + Dn2 = min. DX2 = mnimos

    La ecuacin de una recta que establezca una funcin lineal entre dos variables X e Y se suele

    expresar (considerando X la variable independiente e Y la variable dependiente), que es Y = a + b X en donde a es el valor de Y cuando X = 0, es decir la intercepcin, y b es la pendiente de la recta, es decir, la relacin de la variacin de Y respecto de X (o sea la tangente del ngulo entre la recta y la abscisa).

    Si se tienen 2 puntos cualesquiera de X y de Y, se pueden determinar los valores de a y b y se puede dibujar la recta. Supongamos, en el ejemplo anterior, que:

    X1 = 3 X2 = 8 Y1 = 2 Y2 = 5

    La ecuacin de la recta la podemos escribir as:

    Y Y1 = )( 112

    12 XXXXYY

    En nuestro caso:

    Y 2 = )3(3825

    X

    Y 2 = )3(53 X

    o sea, Y 2 = 0,6 (X 3)

    Y 2 = 0,6X 1,

    Y = 0,6X 1,8 + 2

    7

  • Y = 0,6X + 0,2

    Es decir, que en la ecuacin general de Y = b X + a -> a = 0,2 y b = 0,6.

    Ahora podemos graficar la recta (como en la Figura XI.5). Por ejemplo si X = 5: Y = 0,6 x 5 + 0,2 = 3,2 Si X = 7 Y = 0,6 x 7 + 0,2 = 4,4, es decir, tenemos:

    X

    Y

    5

    3,2

    7

    4,4

    Figura XI.5 La recta de los cuadrados mnimos que relacionan los puntos (X1 Y1), (X2 Y2), ... (Xn Yn) tiene, como

    vimos, la ecuacin:

    Y = a + bX en donde las constantes a y b se determinan resolviendo simultneamente las ecuaciones siguientes:

    1) Y = aN + bX 2) XY = a X + bX2

    que se llaman las ecuaciones normales de la recta de los cuadrados mnimos. La 1) es el resultado de sumar en Y = a + bX ambos miembros:

    Y = (a + bX) de donde

    1) Y = aN + b X mientras que 2) se obtiene de Y = a + b X, multiplicando primero ambos trminos por X y luego sumando.

    XY = X (a + bX)

    2) XY = a X + b X2

    8

  • De estas frmulas 1) y 2) podemos encontrar los valores de a y de b. As, el mtodo generalmente

    usado se llama de Doolittle y supone la solucin de ecuaciones simultneas por medio de un sistema de matrices.

    1) Y = aN + b X 2) XY = a X + b X2

    As de 1) y 2) hallamos que

    b = 2)(

    )()(

    XXXYXX

    E (X - X) (Y - X)

    y a = Y - b X Si hacemos las operaciones correspondientes tenemos:

    (X - X ) (Y - Y ) = (XY - Y X - XY - Y X )

    = XY - X Y - Y X + X Y

    = XY - N X Y - N X Y + N X Y

    = XY - N X Y

    XY - N X Y = XY -N

    YX ))((

    y por otro lado,

    (X - X )2 = (X2 - 2X X + X 2)

    = X2 - 2N X 2 + N X = X2

    NX 2)(

    y entonces llegamos a las frmulas:

    =

    NXX

    NYXYX

    byx 22 )(

    axy = NXbY y

    Para la regresin de la lnea que considera Y variable independiente y X variable dependiente, la

    frmula es: X = a + bY

    y los valores de a y b correspondientes sern:

    9

  • axy = NYbX xy

    bxy = [ ]NYY NYXXY /)( /( 22

    Supongamos que tenemos los datos de la Tabla XI.3:

    Tabla XI.3

    Alumno Matemtica X Fsica Y X2 XY Y2

    A 8 7 64 56 49 B 10 10 100 100 100 C 5 3 25 15 9 D 4 4 16 16 16 E 8 9 64 72 81 F 10 8 100 80 64 G 7 6 49 42 36 H 6 5 36 30 25 58 52 454 411 380

    Y = a + bX

    bxy = [ ])/)( )/( 22 NXX NYXXY

    byx = 5,4204548

    3016411

    83364454

    85258411

    =

    = 01,15,33

    345,33377411 ==

    ayzN

    Xby yx

    0 82,0858,6

    858,5852

    85801,152 ===

    Y = -0,82 + 1,01X Si X = 5 Y = -0,82 + 1,01 x 5

    = -0,82 + 5,05 =4,23

    Si X = 8 Y = 0,82 + 1,01 x 8

    = -0,82 + 8,08 = 7,26

    10

  • X Y A 5 4,23 B 8 7,26

    Para la otra recta de regresin: X = a + by

    axy = == 85280,058

    NybX xy

    = 05,28

    4,168

    6,4158 ==

    bxy [ ] [ ][ ]8/2704380 8/)5258(411/)( )/( 22 = NYY NYXXY

    = 80,04234

    33838034 ==

    Si Y = 2

    X = 2,05 + 0,80 x 2

    = 2,05 + 1,6 = 3,65

    Si Y = 6

    X = 2,05 + 0,80 x 6

    = 2,05 + 4,8 = 6,85

    Y X

    C 2 3,65 D 6 6,85

    Graficando estos valores tenemos la otra recta de regresin. Siempre hay dos rectas de regresin. La correlacin entre las dos variables est dada por el ngulo entre las dos rectas, si este ngulo vale 0 la correlacin es 1 (Vase Figura XI.6).

    Figura XI.6

    11

  • XI.6. Relacin entre regresin y correlacin

    Si todos los puntos de un diagrama de dispersin caen sobre una recta, las dos rectas de regresin coinciden y tenemos el caso en que la prediccin es perfecta. En este caso el coeficiente de correlacin ser +l o -1. (Ver Figura XI.7)

    Figura XI.7

    Figura XI.8

    Figura XI.9

    Figura XI.10

    La proyeccin de X y Y es un punto llamado centroide, en donde se cruzan las rectas de regresin.

    12

  • Existe una evidente relacin entre la correlacin y las rectas de regresin, de modo que la ecuacin de la recta:

    Y = a + bX puede demostrarse fcilmente (aunque es tedioso, y por esto no lo hacemos) que puede escribirse as:

    Yc = r . YXXSS

    x

    y + )( e igualmente, para predecir X tenemos X = a + b Y puede escribirse

    Yc = r . XYYSS

    x

    y + )(

    Hemos puesto Yc y Xc que significan las predicciones, o sea Y calculando y X calculado, por la ecuacin de regresin. La b de la frmula original Y = a + b X cuando toma la forma r

    x

    y

    SS se llama

    coeficiente de regresin. XI.7. Estimacin predictiva

    Cuando tenemos un problema y pensamos que 2 variables estn de algn modo relacionadas, tomamos una muestra de la poblacin que nos interesa y establecemos la correlacin de Pearson para las dos variables, y podemos obtener las rectas de regresin y establecer las predicciones del caso. Pero las predicciones que deseamos hacer no son para los sujetos de nuestra muestra que ya conocemos, sino para cualquier sujeto de la misma poblacin. La ciencia siempre busca generalizar. As, si nosotros sabemos que la correlacin de una muestra de 1.000 casos para los puntajes de una prueba de matemticas y una de fsica nos ha dado una correlacin positiva de +0,80, pero queremos poder pronosticar para cualquier nio de nuestras escuelas, si ha tenido un determinado puntaje en Matemtica, cul es el puntaje ms probable que tenga en Fsica, ya pueden imaginarse que hemos estado haciendo varias suposiciones:

    1) Que la muestra ha sido tomada al azar de la poblacin, 2) Que las dos variables se distribuyen normalmente. Y por lo tanto nosotros podemos saber el error que podemos cometer en nuestra prediccin. As, si

    un chico tiene un 7 en Matemtica es probable que tenga un 7 u 8 en fsica, pero no es seguro, nosotros tenemos que saber cul es el error estandard de nuestra estimacin predictiva. Este valor (para estimar Y a partir de X) es

    (est y) = y 21 r As, si sabemos que el puntaje ms probable en Fsica de un joven que en Matemtica obtuvo 7 es 7,

    esta prediccin debe ir acompaada del conocimiento de y y de r. Entonces si y = 1,3 y r = 0,80

    (est y) = 1,3 280,01 = 1,3 = 64,01 = 1,3 36,0 = 1,3 x 0,6 = 0,78

    Es decir, que el valor de y calculado, 7, estar en un 68% de los casos entre 7 0,78, es decir, entre

    6,22 y 7,78.

    13

  • Con este error estandard conocido podemos dibujar alrededor de la recta de regresin dos lneas de puntos que son lo que se llama el camino crtico. (Ver Figura XI.11)

    Figura XI.11

    XI.8. Variancia total, explicada y no explicada Cuando tenemos un diagrama de dispersin en el que r es distinto de 1 los puntos no coinciden con

    la recta de regresin, sino que se distribuyen alrededor de sta. Para un punto cualquiera Y0 (Y observado) podemos ver que hay una distancia que va de los Y observados y los Y0 (calculados segn la recta de regresin) y una distancia que va al valor correspondiente de la X. Si hacemos la diferencia de estos valores, los elevamos al cuadrado, los sumamos y dividimos por N puntos, tenemos la variancia y por lo tanto una variancia total de Y que es:

    2yt = NYY

    2)0(

    ,

    una variancia explicada por la recta de regresin que es:

    2yt = NYYc

    2)(

    y una variancia no explicada o complexiva que es:

    S2y = NYY c

    20 )(

    Por lo tanto, la desviacin total de los puntajes observados puede descomponerse como indica la

    Figura XI.12 en la suma de estas dos variancias, la explicada y la no explicada.

    2yt = 2yx + S2y

    14

  • Figura XI.12

    Comparando estas desviaciones con la variancia total tenemos:

    122

    2

    2

    2

    2

    =+=T

    yx

    T

    y

    T

    T S

    o sea que tenemos un valor S2y / 2T que se llama k2, que es el coeficiente de no determinacin, o sea la parte de la variancia que no est predicha por la recta de regresin y el trmino 2yx / 2T que es el coeficiente de determinacin, tambin llamado r2, que es la proporcin de la variancia total de Y que se puede predecir conociendo X, es decir, tenemos:

    1 = k2 + r2De todo esto surgen tres ndices que nos permiten interpretar el coeficiente de correlacin. As

    tenemos:

    1) El coeficiente de alienacin que es:

    k = 21 r Por ejemplo si r = 0,50

    k = 86,075,025,01 ==

    Es decir, ah vemos que cuando r = 0,50 el grado de no correlacin es mucho mayor: 0,86.

    2) El ndice de eficiencia predictiva:

    E = 100 (1 - K)

    E = 100 (1 - 21 r en nuestro caso:

    E = 100 (1 - = )50,01 2

    E = 100 (1- )75,0 = 100 x (1- 0,86) = o sea, 14 % Es decir,

    el ndice de eficiencia predictiva nos indica el porcentaje de reduccin del error de prediccin por el hecho de conocer la correlacin entre dos variables.

    3) El coeficiente de determinacin que es r2. Para nuestro caso 0,502 = 0,25. Si lo multiplicamos por cien nos da el porcentaje de la variancia de Y que est determinada por la variacin de X.

    15

  • XI.9. Otras formas de interpretacin

    Aparte de esta manera de interpretar los coeficientes de correlacin estn las clsicas, que no son muy recomendables. Por ejemplo, stas dicen que r puede ser

    r < 30, pequea 30 < r < 50, mediana baja 50 < r < 80, mediana alta

    r > 80, alta

    Estos son valores arbitrarios y relativos, pues si en una investigacin siempre se ha encontrado, entre dos variables, una correlacin de 0,20 y ahora encontramos que es 0,30, sta puede ser significativa.

    En Psicologa, para la validez y confiabilidad de las pruebas no se suelen tener en cuenta coeficientes menores de 0,65 y raramente alcanzan un r > 0,85.

    Otra advertencia es que la escala de r no es como las proporciones; entre 30 y 40% hay la misma diferencia que entre 80% y 90%. En cambio, para las correlaciones tenemos:

    r = 0,30 r2 = 0,09 dif. 6%

    r = 0,40 r2 = 0,16

    r = 0,80 r2 = 0,64 dif. 17%

    r = 0,90 r2 = 0,81 Adems, hay que cuidarse de interpretar r como una relacin de causa-efecto entre las dos variables,

    X e Y. Muchas veces la causa de la covariacin est muy lejos. Para obtener el r de Pearson hay ciertas condiciones:

    1) Debemos contar con variables medidas en escalas de intervalos iguales o de cocientes.

    2) Las variables que se correlacionan deben distribuirse normalmente o, por lo menos, de manera

    simtrica respecto de la media. A esto se refiere el conocido concepto de la homocedasticidad. Cuando las variables no son normales, las lneas de regresin no son rectas y se deben usar otros

    ndices de correlacin. Otra cosa importante es el n de la muestra. Cuanto mayor es el n de la muestra mayor es la

    correlacin para los mismos fenmenos.

    XI.10 Significacin de r mediante la prueba de la hiptesis nula de t

    Suponiendo la hiptesis de que una correlacin entre dos variables en la poblacin es 0, comparando el valor de t obtenido (segn la frmula que damos) con la t que debera esperarse con un azar al lmite de 1% o 5%. La t para una r dada es:

    t = 212

    rNr

    As, supongamos que hemos hallado r = 0,50 y nuestro N = 120, entonces:

    r = == 86,086,1050,0

    25,0111850,0

    16

  • = 31,686,043,5 =

    Buscando en la Tabla de t para 118 g. de 1. t al 5% = 1,98 y al 1% = 2,62. Por lo tanto, nuestra t es mucho mayor que estos valores y concluimos que la r hallada es

    significativa; se rechaza la H0. Ejercicios

    1) Qu valor aproximado tendr el ngulo de correlacin, es decir el que forman las dos rectas de

    regresin, cuando r = 0,50?

    2) Si tenemos los siguientes valores para X e Y

    X Y

    3

    300 6 360

    10 400 17 470 19 500

    Cunto vale la correlacin y qu signo tiene? 3) Dados los siguientes pares de observaciones

    X 4 5 6 8 9 7 10 12

    Y

    14

    12

    9

    10

    9

    9

    6

    3 a) Construya el diagrama de dispersin. b) Halle la correlacin entre X e Y c) Construya la recta de regresin de Y sobre X y de X sobre Y, segn el criterio de los cuadrados

    mnimos. d) Interprete el coeficiente de correlacin r de Pearson en funcin del coeficiente de determinacin. e) Calcule el coeficiente de no determinacin, k2. f) Calcule el coeficiente de alienacin, k. g) Calcule el ndice de eficiencia predictiva. 4) Dada la siguiente distribucin bivariada halle el coeficiente de correlacin y el coeficiente de

    regresin de Y en X.

    17