Correlacion e Independencia

download Correlacion e Independencia

of 7

Transcript of Correlacion e Independencia

  • 8/19/2019 Correlacion e Independencia

    1/7

    Pagina 1

    Av. de los Gobernadores # 43-1, Col. Vista Azul, Querétaro, Qro., C.P. 76087, Tel.: (442)2543500, 2543501,

    E-mail: [email protected] 

    Fecha: 2007-03-02

    Nota técnica:

    Correlación eindependencia

    Autor: Dr. Roberto Salas Zúñiga

  • 8/19/2019 Correlacion e Independencia

    2/7

    Pagina 2

    Av. de los Gobernadores # 43-1, Col. Vista Azul, Querétaro, Qro., C.P. 76087, Tel.: (442)2543500, 2543501,

    E-mail: [email protected] 

    Correlación e independencia

    Correlación e Independencia

    En la mayoría de las aplicaciones de

    metrología se trabaja con modelos,estos se construyen para representar ycuantificar la influencia de las variablesque rodean el sistema de medición. Entérminos generales se califica a losmodelos de acuerdo a su complejidadesto es con el número de operacionesnecesarias para calcularlos.

    Algunos ejemplos de modelos,ordenados en términos de complejidad

    son:

    • Modelos constantes• Modelos lineales• Modelos cuadráticos

    Modelos constantes

    En estos modelos se considera que lavariable de interés se mantieneconstante dentro de del intervalo deoperación.

    Aunque en apariencia este modelo no esmuy efectivo, existe una gran variedadde aplicaciones donde han resultado serexcelentes, como ejemplo bastaconsiderar la resistencia R de unresistor, la constante de rigidez K de unresorte etc.

    En ambos casos las constantes R y K seconsideran constantes, en la realidadestas “constantes” R y K son funcionesde la temperatura, humedad etc. Cabeaclarar que el número de operaciones

    necesarias para utilizar el modelo unavez calculado es cero. Además estosmodelos sirven de base para la siguienteclase de modelos.

    Modelos lineales

    Los modelos lineales consideran que:

    En estos casos el número deoperac iones se reduce a unamultiplicación, ejemplos Ley de Ohm

    para resistores , Ley de

    Hooke para resortes etc.

    Estos modelos son la base de muchos delos problemas asociados con lametrología, debido al modelo básico demedición que se utiliza, cabe mencionarque este tipo de modelos, se denominanestáticos pues no conservan ninguna

    memoria de lo sucedido con el sistema,también es importante notar que enmuchas aplicaciones el modelo es linealcuando se consideran los incrementos esdecir

    Esto da lugar a los modelos linealesafines:

    que resultan cuando se fija una

    condición de operación y se

    C Y =

     XaY 1=

    ( ) ( )tRitv =

    ( ) ( )tkx-tf  =

     XaY Δ=Δ

     aX aY 0 +=

    ( )00 Y,X

  • 8/19/2019 Correlacion e Independencia

    3/7

    Pagina 3

    Av. de los Gobernadores # 43-1, Col. Vista Azul, Querétaro, Qro., C.P. 76087, Tel.: (442)2543500, 2543501,

    E-mail: [email protected] 

    Correlación e independencia

    trabaja “cerca” de ella ;

    .

    Modelos cuadráticos

    Los modelos cuadráticos tienen laforma:

    En base a estos ejemplos es posibledefinir una gran variedad de modelos,sin embargo desde el punto de vistareal las relaciones que existen no sontan sencillas de describir y entérminos generales se dice que hayuna dependencia de la variable Y con

    respecto a la variable X si ,note que en términos generalescuando se habla de una dependenciano se especifica que tipo derelación existe, en contraste,

    cuando se habla de una correlaciónimplícitamente se habla de unarelación lineal o lineal afín, esdecir que necesar iamente ladependencia es de la siguiente forma

    análogamente se dice queY   e s t a co r r e l a c i onada con

    si:

    NotasSi Y  esta correlacionada con X  (adiferente de cero), Y  si depende deX.

    Si Y no este correlacionada con X nogarantiza que Y no dependa de X, loúnico que implica es que Y  nodepende linealmente de X. 

    S i c o n

    , ,en este tipo de situaciones puede serque Y  y X  tengan una correlaciónbaja (aunque Y depende fuertementede X), lo que conduce al error típicode decidir que X no influye sobre Y.

    Cuantificación de la dependencialineal

    Una vez aclarada la diferencia entredependencia en general y lacorrelación o dependencia lineal , elsiguiente paso es determinar unaforma de medir la dependencia lineal.En metrología siempre estamos enambientes con ruido. Los modelosmás sencillos que existen paramodelar este tipo de situaciones sonlos modelos probabilísticos, ad i f e r en c i a de l o s m ode l o sdetermin ís t i cos los modelosprobabilísticos no intentan dar unarelación explicita de las relacionesentre variables, lo que intentancaracterizar es la probabilidad deque un suceso ocurra, el ejemploclásico es el del lanzamiento de una

    moneda, este proceso se puedemodelar utilizando las leyes denewton considerando la fuerza con laque se lanza la moneda comoexcitación, modelo determinístico,esto aunque lógicamente es correcto,resulta demasiado complicado. o

    0XX −=Δ   X 

    0YY −=Δ   Y 

    2

    210 Xa Xa aY ++=

     F(X)Y =

     baXY +=

    n21 X,...,X,X

    nn22110 Xa...Xa Xa aY ++++=

    2

    210 Xa Xa aY ++=

    2

    2

    12 X X

    a

    a Zy0a +=≠

     Z 10 a aY +=

  • 8/19/2019 Correlacion e Independencia

    4/7

    Pagina 4

    Av. de los Gobernadores # 43-1, Col. Vista Azul, Querétaro, Qro., C.P. 76087, Tel.: (442)2543500, 2543501,

    E-mail: [email protected] 

    Correlación e independencia

    simplemente asociarle una posibilidadde ocurrencia al águila y otra a laposibilidad de ocurrencia de sol, lascuales se pueden obtener a partir de

    un conjunto de lanzamientos, esdecir en términos de un proceso deexperimentación y el resultado finalson dos números p(sol) y p(águila),esto gracias a la ley de los grandesnúmeros.

    Regresando a la cuantificación de ladependencia lineal, la medida de estadependencia se hace considerando el

    factor de correlación, denominado

    , este número es una medida no linealde la dependencia lineal de unavariable con respecto a otra,geométricamente significa el cosenodel ángulo entre las dos variables. Sí

    el ángulo es , se dice que lasvariables son ortogonales o des-correlacionadas y si el ángulo es 0 o ðse dice que las variables están

    completamente correlacionadas, sinembargo cuando “la mitad” de unaseñal esta en una dirección y la otramitad en la dirección perpendicular elf a c t o r d e c o r r e l a c i ó n e s

    = 0.707,esto genera confusión por lo que se

    ha convenido utilizar , en lugar de

    . Otro punto que genera confusiónes que solo se menciona una variable,cuando en realidad implícitamente sehace referencia a dos. Para aclarartodo esto supongamos que se tiene elproblema típico:

     “¿Está Y esta correlacionada con X?”El primer punto es traducir lo quesignifica esto a “¿ Y   dependelinealmente de  X  ? ”

    Esto significa que en el modelo

    , donde es unavariable en la dirección de X  de

    tamaño 1 y es una variableortogonal a X, también de tamaño 1que representa el complementoortogonal a X  (o sea el resto de X)que parte de Y esta en la dirección deX, para resolver esto se hacereferencia al siguiente diagrama

    Una vez visualizado de esta formaclaramente y de acuerdo al teoremade Pitágoras la solución es

    por lo que el grado de correlación

    estará dado por , es decir porel factor de correlación o como semenciono anteriormente por su

    cuadrado.

    Una nota importante es que si Y  no

    esta correlacionada con X no significaque Y no dependa de X, solo significaque Y  no depende linealmente de X,ejemplo:

     ρ 

    2

    π ±

    ( )2

    145cos

    4cos =°±=⎟

     ⎠ ⎞

    ⎜⎝ ⎛ ±

      π 

    2 ρ 

     ρ 

     Z b X aY  ˆˆ +=   X ˆ

     Z ̂

    ( ) ( ) Z senY  X Y Y  ˆˆcos   θ θ  +=

    ( )θ cos

    Y

    XZ

    aX^

  • 8/19/2019 Correlacion e Independencia

    5/7

    Pagina 5

    Av. de los Gobernadores # 43-1, Col. Vista Azul, Querétaro, Qro., C.P. 76087, Tel.: (442)2543500, 2543501,

    E-mail: [email protected] 

    Correlación e independencia

    Si y X  tiene una distribuciónuniforme sobre [-1,1], la correlaciónes cero.

    Por último y de acuerdo con elteorema de los grandes números un

    estimador de es

    .Aquí, el tamaño de X o mejor

    conocido como la norma de X se

    calcula como ,

    análogamente

    Ejemplo numérico, calculado enEXCEL.

    Utilizando las herramientas de EXCELes posible de manera simple realizartodos los cálculos asociados connuestro problema, basta poner losdatos en dos columnas y graficar enel modo XY, después incluir la líneade tendencia tipo lineal, la pestaña deopciones, seleccionar presentarecuación en el gráfico y presentar el

    valor de R cuadrado en el gráfico

    En este caso se puede considerar que

    , es decir se puede

    considerar que y por

    2 X Y  =

    2 ρ 

    ⎥⎦

    ⎤⎢⎣

    ⎡⎥⎦

    ⎤⎢⎣

    ⎥⎦

    ⎤⎢⎣

    =

    ∑∑

    ==

    = L

     L

     L

    k k 

     x y

     x y

    1

    2

    1

    2

    2

    12ˆ ρ 

    2

    1

    1

    2

    ⎥⎦

    ⎤⎢⎣

    ⎡= ∑

    =

     L

    k  x X 

    2

    1

    1

    2

    ⎥⎦

    ⎤⎢⎣

    ⎡= ∑

    =

     L

    k  yY  X Y

    0.1 0.3

    0.15 0.45

    0.28 0.7

    0.42 0.9

    Y v s Xy = 1.8383x +0.1509

    R2 = 0.9837

    0

    0.1

    0.2

    0.3

    0.4

    0.5

    0.6

    0.7

    0.8

    0.9

    1

    0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45

    X

    0.9918= ρ 

    ( ) 9918.0cos =θ 

  • 8/19/2019 Correlacion e Independencia

    6/7

    Pagina 6

    Av. de los Gobernadores # 43-1, Col. Vista Azul, Querétaro, Qro., C.P. 76087, Tel.: (442)2543500, 2543501,

    E-mail: [email protected] 

    Correlación e independencia

    lo tanto es decir que

    hay un ángulo de .

    Para terminar mostraremos unasgráficas que muestran algunos casosextremos del significado geométricode la correlación entre Y y X.

    En la siguiente figura se presentanotros casos de grado de correlaciónde Y  con X, en esta figura se veporque el factor ρ 2  resulta ser más

    representativo como medida dedependencia lineal que el factor ρ.

    ( )9918.0cosa=θ 

    °34.7

    X

    Y

    Y descorrelaciona de X

    ρ =   , o cos  θ   = 90°

    X

    Y descorrelaciona de X

    ρ = 0, o cos  θ   = -90°

    Y

    XY

    Y correlacionada con X

    ρ =   , o cos  θ = 180°

    X Y

    Y correlacionada con X

    ρ = , o cos  θ = 0°

    a)

     b)

    c)

    d)

    X

    Y

    Y correlacionada con X

    ρ = 0.866 , o θ = 30°ρ2= 0.75 

    a)

    X

    Y

    Y correlacionada con X

    ρ =0.707 , o θ = 45°ρ2 = 0.5 

     b)

  • 8/19/2019 Correlacion e Independencia

    7/7

    Pagina 7

    Av. de los Gobernadores # 43-1, Col. Vista Azul, Querétaro, Qro., C.P. 76087, Tel.: (442)2543500, 2543501,

    E-mail: [email protected] 

    Correlación e independencia

    La flecha inferior a X, indica la partede Y que esta sobre la dirección de X.

    X

    Y

    Y correlacionada con X

    ρ = 0.5, o θ = 60°ρ 2= 0.25 

    X

    Y

    Y correlacionada con X

    ρ = 0.2588, o θ = 70°

    ρ 2=0.067 

    c)

    d)