Correlacion e Independencia
-
Upload
alvarinsky -
Category
Documents
-
view
215 -
download
0
Transcript of Correlacion e Independencia
-
8/19/2019 Correlacion e Independencia
1/7
Pagina 1
Av. de los Gobernadores # 43-1, Col. Vista Azul, Querétaro, Qro., C.P. 76087, Tel.: (442)2543500, 2543501,
E-mail: [email protected]
Fecha: 2007-03-02
Nota técnica:
Correlación eindependencia
Autor: Dr. Roberto Salas Zúñiga
-
8/19/2019 Correlacion e Independencia
2/7
Pagina 2
Av. de los Gobernadores # 43-1, Col. Vista Azul, Querétaro, Qro., C.P. 76087, Tel.: (442)2543500, 2543501,
E-mail: [email protected]
Correlación e independencia
Correlación e Independencia
En la mayoría de las aplicaciones de
metrología se trabaja con modelos,estos se construyen para representar ycuantificar la influencia de las variablesque rodean el sistema de medición. Entérminos generales se califica a losmodelos de acuerdo a su complejidadesto es con el número de operacionesnecesarias para calcularlos.
Algunos ejemplos de modelos,ordenados en términos de complejidad
son:
• Modelos constantes• Modelos lineales• Modelos cuadráticos
Modelos constantes
En estos modelos se considera que lavariable de interés se mantieneconstante dentro de del intervalo deoperación.
Aunque en apariencia este modelo no esmuy efectivo, existe una gran variedadde aplicaciones donde han resultado serexcelentes, como ejemplo bastaconsiderar la resistencia R de unresistor, la constante de rigidez K de unresorte etc.
En ambos casos las constantes R y K seconsideran constantes, en la realidadestas “constantes” R y K son funcionesde la temperatura, humedad etc. Cabeaclarar que el número de operaciones
necesarias para utilizar el modelo unavez calculado es cero. Además estosmodelos sirven de base para la siguienteclase de modelos.
Modelos lineales
Los modelos lineales consideran que:
En estos casos el número deoperac iones se reduce a unamultiplicación, ejemplos Ley de Ohm
para resistores , Ley de
Hooke para resortes etc.
Estos modelos son la base de muchos delos problemas asociados con lametrología, debido al modelo básico demedición que se utiliza, cabe mencionarque este tipo de modelos, se denominanestáticos pues no conservan ninguna
memoria de lo sucedido con el sistema,también es importante notar que enmuchas aplicaciones el modelo es linealcuando se consideran los incrementos esdecir
Esto da lugar a los modelos linealesafines:
que resultan cuando se fija una
condición de operación y se
C Y =
XaY 1=
( ) ( )tRitv =
( ) ( )tkx-tf =
XaY Δ=Δ
aX aY 0 +=
( )00 Y,X
-
8/19/2019 Correlacion e Independencia
3/7
Pagina 3
Av. de los Gobernadores # 43-1, Col. Vista Azul, Querétaro, Qro., C.P. 76087, Tel.: (442)2543500, 2543501,
E-mail: [email protected]
Correlación e independencia
trabaja “cerca” de ella ;
.
Modelos cuadráticos
Los modelos cuadráticos tienen laforma:
En base a estos ejemplos es posibledefinir una gran variedad de modelos,sin embargo desde el punto de vistareal las relaciones que existen no sontan sencillas de describir y entérminos generales se dice que hayuna dependencia de la variable Y con
respecto a la variable X si ,note que en términos generalescuando se habla de una dependenciano se especifica que tipo derelación existe, en contraste,
cuando se habla de una correlaciónimplícitamente se habla de unarelación lineal o lineal afín, esdecir que necesar iamente ladependencia es de la siguiente forma
análogamente se dice queY e s t a co r r e l a c i onada con
si:
NotasSi Y esta correlacionada con X (adiferente de cero), Y si depende deX.
Si Y no este correlacionada con X nogarantiza que Y no dependa de X, loúnico que implica es que Y nodepende linealmente de X.
S i c o n
, ,en este tipo de situaciones puede serque Y y X tengan una correlaciónbaja (aunque Y depende fuertementede X), lo que conduce al error típicode decidir que X no influye sobre Y.
Cuantificación de la dependencialineal
Una vez aclarada la diferencia entredependencia en general y lacorrelación o dependencia lineal , elsiguiente paso es determinar unaforma de medir la dependencia lineal.En metrología siempre estamos enambientes con ruido. Los modelosmás sencillos que existen paramodelar este tipo de situaciones sonlos modelos probabilísticos, ad i f e r en c i a de l o s m ode l o sdetermin ís t i cos los modelosprobabilísticos no intentan dar unarelación explicita de las relacionesentre variables, lo que intentancaracterizar es la probabilidad deque un suceso ocurra, el ejemploclásico es el del lanzamiento de una
moneda, este proceso se puedemodelar utilizando las leyes denewton considerando la fuerza con laque se lanza la moneda comoexcitación, modelo determinístico,esto aunque lógicamente es correcto,resulta demasiado complicado. o
0XX −=Δ X
0YY −=Δ Y
2
210 Xa Xa aY ++=
F(X)Y =
baXY +=
n21 X,...,X,X
nn22110 Xa...Xa Xa aY ++++=
2
210 Xa Xa aY ++=
2
2
12 X X
a
a Zy0a +=≠
Z 10 a aY +=
-
8/19/2019 Correlacion e Independencia
4/7
Pagina 4
Av. de los Gobernadores # 43-1, Col. Vista Azul, Querétaro, Qro., C.P. 76087, Tel.: (442)2543500, 2543501,
E-mail: [email protected]
Correlación e independencia
simplemente asociarle una posibilidadde ocurrencia al águila y otra a laposibilidad de ocurrencia de sol, lascuales se pueden obtener a partir de
un conjunto de lanzamientos, esdecir en términos de un proceso deexperimentación y el resultado finalson dos números p(sol) y p(águila),esto gracias a la ley de los grandesnúmeros.
Regresando a la cuantificación de ladependencia lineal, la medida de estadependencia se hace considerando el
factor de correlación, denominado
, este número es una medida no linealde la dependencia lineal de unavariable con respecto a otra,geométricamente significa el cosenodel ángulo entre las dos variables. Sí
el ángulo es , se dice que lasvariables son ortogonales o des-correlacionadas y si el ángulo es 0 o ðse dice que las variables están
completamente correlacionadas, sinembargo cuando “la mitad” de unaseñal esta en una dirección y la otramitad en la dirección perpendicular elf a c t o r d e c o r r e l a c i ó n e s
= 0.707,esto genera confusión por lo que se
ha convenido utilizar , en lugar de
. Otro punto que genera confusiónes que solo se menciona una variable,cuando en realidad implícitamente sehace referencia a dos. Para aclarartodo esto supongamos que se tiene elproblema típico:
“¿Está Y esta correlacionada con X?”El primer punto es traducir lo quesignifica esto a “¿ Y dependelinealmente de X ? ”
Esto significa que en el modelo
, donde es unavariable en la dirección de X de
tamaño 1 y es una variableortogonal a X, también de tamaño 1que representa el complementoortogonal a X (o sea el resto de X)que parte de Y esta en la dirección deX, para resolver esto se hacereferencia al siguiente diagrama
Una vez visualizado de esta formaclaramente y de acuerdo al teoremade Pitágoras la solución es
por lo que el grado de correlación
estará dado por , es decir porel factor de correlación o como semenciono anteriormente por su
cuadrado.
Una nota importante es que si Y no
esta correlacionada con X no significaque Y no dependa de X, solo significaque Y no depende linealmente de X,ejemplo:
ρ
2
π ±
( )2
145cos
4cos =°±=⎟
⎠ ⎞
⎜⎝ ⎛ ±
π
2 ρ
ρ
Z b X aY ˆˆ += X ˆ
Z ̂
( ) ( ) Z senY X Y Y ˆˆcos θ θ +=
( )θ cos
Y
XZ
aX^
-
8/19/2019 Correlacion e Independencia
5/7
Pagina 5
Av. de los Gobernadores # 43-1, Col. Vista Azul, Querétaro, Qro., C.P. 76087, Tel.: (442)2543500, 2543501,
E-mail: [email protected]
Correlación e independencia
Si y X tiene una distribuciónuniforme sobre [-1,1], la correlaciónes cero.
Por último y de acuerdo con elteorema de los grandes números un
estimador de es
.Aquí, el tamaño de X o mejor
conocido como la norma de X se
calcula como ,
análogamente
Ejemplo numérico, calculado enEXCEL.
Utilizando las herramientas de EXCELes posible de manera simple realizartodos los cálculos asociados connuestro problema, basta poner losdatos en dos columnas y graficar enel modo XY, después incluir la líneade tendencia tipo lineal, la pestaña deopciones, seleccionar presentarecuación en el gráfico y presentar el
valor de R cuadrado en el gráfico
En este caso se puede considerar que
, es decir se puede
considerar que y por
2 X Y =
2 ρ
⎥⎦
⎤⎢⎣
⎡⎥⎦
⎤⎢⎣
⎡
⎥⎦
⎤⎢⎣
⎡
=
∑∑
∑
==
= L
k
k
L
k
k
L
k
k k
x y
x y
1
2
1
2
2
12ˆ ρ
2
1
1
2
⎥⎦
⎤⎢⎣
⎡= ∑
=
L
k
k x X
2
1
1
2
⎥⎦
⎤⎢⎣
⎡= ∑
=
L
k
k yY X Y
0.1 0.3
0.15 0.45
0.28 0.7
0.42 0.9
Y v s Xy = 1.8383x +0.1509
R2 = 0.9837
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45
X
0.9918= ρ
( ) 9918.0cos =θ
-
8/19/2019 Correlacion e Independencia
6/7
Pagina 6
Av. de los Gobernadores # 43-1, Col. Vista Azul, Querétaro, Qro., C.P. 76087, Tel.: (442)2543500, 2543501,
E-mail: [email protected]
Correlación e independencia
lo tanto es decir que
hay un ángulo de .
Para terminar mostraremos unasgráficas que muestran algunos casosextremos del significado geométricode la correlación entre Y y X.
En la siguiente figura se presentanotros casos de grado de correlaciónde Y con X, en esta figura se veporque el factor ρ 2 resulta ser más
representativo como medida dedependencia lineal que el factor ρ.
( )9918.0cosa=θ
°34.7
X
Y
Y descorrelaciona de X
ρ = , o cos θ = 90°
X
Y descorrelaciona de X
ρ = 0, o cos θ = -90°
Y
XY
Y correlacionada con X
ρ = , o cos θ = 180°
X Y
Y correlacionada con X
ρ = , o cos θ = 0°
a)
b)
c)
d)
X
Y
Y correlacionada con X
ρ = 0.866 , o θ = 30°ρ2= 0.75
a)
X
Y
Y correlacionada con X
ρ =0.707 , o θ = 45°ρ2 = 0.5
b)
-
8/19/2019 Correlacion e Independencia
7/7
Pagina 7
Av. de los Gobernadores # 43-1, Col. Vista Azul, Querétaro, Qro., C.P. 76087, Tel.: (442)2543500, 2543501,
E-mail: [email protected]
Correlación e independencia
La flecha inferior a X, indica la partede Y que esta sobre la dirección de X.
X
Y
Y correlacionada con X
ρ = 0.5, o θ = 60°ρ 2= 0.25
X
Y
Y correlacionada con X
ρ = 0.2588, o θ = 70°
ρ 2=0.067
c)
d)