Análisis Estadístico de Datos...

Post on 02-Jun-2020

5 views 0 download

Transcript of Análisis Estadístico de Datos...

Análisis Estadístico de

Datos Climáticos

Análisis Estadístico de

Datos Climáticos

2015

Análisis exploratorio de datos univariados

DATOS UNIVARIADOSRobustez y ResistenciaMedidas numéricas de localización, dispersión, asimetría ….Técnicas gráficasDistribucionesTransformaciones

DATOS APAREADOS (DESFASADOS)

DATOS MULTI-DIMENSIONALESMatriz de correlaciónMapas de CorrelaciónMapas de Teleconectividad….

✔ una estación con medidas de varias variables diferentes (temperatura, precipitación, presión, humedad, etc...)

✔ una variable medida en varias estaciones

✔ salida de un modelo con la variable en una grilla (lat. x lon. x altura).

La cantidad de variables físicas de un modelo atmosférico es como “mínimo” 6 y puede ser bastante mayor

Rápidamente crecemos en el número de variables simultáneas:10 variables físicas * 100 lat * 100 long * 10 alt = 10^6 variables !!!

¿Por qué DATOS MULTIVARIADOS?

0

5

10

15

-4

-2

0

2

4-10

-5

0

5

10

XY

Z

-4

-20

2

4

-4

-2

0

2

4-10

-5

0

5

10

waterfall

ribbon

-1

-0.5

0

0.5

1

-1

-0.5

0

0.5

1

-1

0

1

scatter3

Matriz de Correlación

Matriz de datos diarios enLas Brujas (INIA)

5 variables

Quiero hallar las correlaciones de cada variable con cada otra:

4+3+2+1 = 10

Matriz de Correlación = R | Propiedades

R=corrcoef(matriz_datos) …. Pearson

Diagonal de 1s

Simétrica respecto a la diagonal

5*(5-1)/2 valores

Corr(TMED,TMAX)

Matriz de Diagramas de Dispersión

rij=r ji

Volviendo a Matriz de Correlación, en general

N*(N-1)/2 elementos no idénticosSi N=10^6 => 10^12 !!!!

Y mayor aún si queremos considerar correlaciones desfasadas

Mapas de Correlación(one-point correlation maps)

Las matrices de correlación son útiles para mostrar la relación entre diferentes variables en una estación (número relativamente manejable).

Cuando se quiere explorar la variabilidad espacio-temporal (cómo varían en el tiempo una variable –eventualmente más de una- dentro de una región –por ejemplo el globo-) se requieren otras herramientas porque el número de variables/puntos explota.

En este caso es útil presentar las correlaciones gráficamente/espacialmente.

MAPA DE CORRELACIÓNNo se usa toda la información de la matriz,

solamente la de una fila que contiene la correlación de todos los puntos contra uno

en particular

200 puntos (correlaciones)Uno podría hacer 199 de estos mapas

Mapa de Correlación

¿Da igual la

elección del

punto?

Correlación de TS (56W,35S) con TS global en c/punto.Período: meses Ene1949-Ago2007

Ejemplo

Ejemplo

Correlación de Precip (56W,35S) con Precip global en c/punto.Período: meses Ene1979-Dic2006

Correlación de la TSM en la zona ecuatorial con el resto de los océanos

Mapas de CorrelaciónPosibles generalizaciones

Correlacionar con una variable distinta (que no pertenece al mapa).

Incluir desfasajes, de la misma variable o de otras.

En definitiva, cualquier mapa que muestre la variación espacial de la correlación de un campo con otra variable (que puede o no pertenecer al

campo, puede o no ser simultánea) es un mapa de correlación.

Ejemplo mapa de Correlación de Spearman

Mapas de Teleconección

Vimos que los mapas de correlación (que usan una fila de la matriz de correlación)

pueden mostrar patrones de teleconección.

En particular es de interés la aparición de correlaciones negativas “grandes y lejanas”.

Entonces definimos Mapa de Teleconección tal que:

A cada punto i se le adjudica un valor Ti que es el valor absoluto de la mínima correlación con dicho punto.

Mapas de Teleconección

Cita

Análisis multi-variado para intentar capturarpatrones de la variabilidad espacio-temporal

Análisis de Componentes Principales

Análisis de Máxima Covarianza

Análisis de Espectro Singular Multicanal

…………