2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión...

28
Análisis GeoEspacial de Factores que Influyen en Atropellos de Escolares en Santiago-Chile, utilizando ArcGIS Christian Grob Hernández, MSc. Carola Blázquez Lavín, PhD.

Transcript of 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión...

Page 1: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

Análisis GeoEspacial de Factores que Influyen en Atropellos de Escolares en Santiago-Chile, utilizando ArcGIS

Christian Grob Hernández, MSc.Carola Blázquez Lavín, PhD.

Page 2: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

2

Introducción

• Organización Mundial de la Salud (WHO)– Global Burden of Desease• 5° causa de muerte al 2030

• CONASET– Promedio anual de 47.683 siniestros (2000-2009)

– 17,5% (8.353) atropellos– 24,6% corresponde al grupo de 5 a 18 años

Page 3: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

3

Objetivo

Analizar espacial y estadísticamente los factores que influyen en los atropellos de escolares en el

Gran Santiago durante el periodo 2007-2012.

Page 4: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

4

Metodología

Análisis de los Datos

Regresión Lineal Múltiple

Regresión Geográficamente

Ponderada

Estadística Descriptiva

Page 5: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

5

Análisis de Regresión

• Regresión Lineal Múltiple– Amplio uso: Fotheringham et al. (1996), Brown et al.

(2012), entre muchos

– Limitantes: • Supuestos de Gauss-Markov• Análisis macro

Datos no estocásticos

Linealidad

No auto-correlación

Media cero de los errores

Dispersión de los errores

Homocedasticidad

Page 6: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

6

Regresión Geográficamente Ponderada

• Geographically Weighted Regression (GWR)– Su mayor ventaja• Variación de los coeficientes según ubicación• Análisis local en un contexto macro

– Mejor comprensión del comportamiento espacial

– Trabaja con unidades espaciales

𝑌 (𝑢 )=𝛽0 (𝑢)+𝛽1 (𝑢) 𝑋 1 (𝑢)+…… …+𝛽𝑛 (𝑢) 𝑋𝑛 (𝑢)+𝜀

Unidad de área

Page 7: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

7

Variable Dependiente

La variable dependiente es un promedio de densidad de escolares atropellados para cada

unidad espacial

Page 8: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

8

Variables Independientes

• 28 Variables Tipificadas– 4 Categorías

• Kernel y Distancia

Kernel DistanciasRelativo a Colegios

Colegios ColegiosMatricula

Usos de Suelo Área VerdeComercioHabitacionalIndustrialOficinasSaludTransporteEstacionamientosDiversidad de Uso de Suelo

Kernel DistanciasCondiciones

Poblacionales por edad y grupo

socio económico

Población de 0 a 18 añosPoblación TotalABC1C2C3DE

Medios de Transporte y Relacionados

Paraderos ParaderosSemáforos Semáforoscruces peatonales Vías más CongestionadasEstaciones de Metro Estaciones de Metro

Avenidas y Carreteras

Page 9: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

9

Análisis Estadístico

Análisis de los Datos

Estadística Descriptiva

Page 10: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

10

Temporal

• Anual– 26,8% de reducción 2007 (635) y el año 2012 (465)

• Mensual• Semanal• Horario– 16:00 a 19:00 -> 29,72%– 13:00 a 21:00 -> 62,92% – 07:00 a 09:00 -> 12,70% – 75,61% -> 10 horas

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 230

50

100

150

200

250

300

350

Horas

Núm

ero

de A

trop

ello

s

2007 2008 2009 2010 2011 20120

100

200

300

400

500

600

700

Núm

ero

de a

trop

ello

s

Enero

FebreroMarzo Abril

MayoJunio

Julio

Agosto

Septiembre

Octubre

Noviembre

Diciembre

0

50

100

150

200

250

300

350

mes

Núm

ero

de a

trop

ello

s

lunes martes miércoles jueves viernes sábado domingo0

100

200

300

400

500

600

DÍA

NÚM

ERO

DE

ATRO

PELL

OS

Page 11: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

11

Nivel de Lesión

• Tipo de Lesión– KSI: 33,7% -> 1051– Leves: 66,3% -> 2066

• Género– 56,37% (1757) varones – 43,63% (1360) mujeres

• Edad– Segmento 15 a 18 años

1,8 veces el de 5 a 8 años.

FEMENINO MASCULINO0

200400600800

10001200140016001800

69,78% 63,57%

30,22%

36,43%

género

Núm

ero

de A

trop

ello

s y

sus

porc

enta

-je

s re

lativ

os

5 6 7 8 9 10 11 12 13 14 15 16 17 180

50

100

150

200

250

Suma de Leves

Suma de KSI

Edades

Núm

ero

de A

trop

ello

s

Page 12: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

12

Otros

• Responsabilidad– Peatón 63%

• Espacial– El 33,1% de los incidentes • Puente Alto -> 156• Maipú -> 153• Santiago -> 36 • La Florida -> 105

CONDUCTOR PEATON0

50

100

150

200

250

300

350

400

200720082009201020112012

Núm

ero

de A

TRO

PELL

OS

PUENTE

ALTO

SANTIA

GO

NUNOA

PUDAHUEL

LA PINTA

NA

LA CIST

ERNA

LAS C

ONDES

LA GRANJA

SAN BER

NARDO

EL BOSQ

UE

SAN JO

AQUIN

SAN RAMON

LA REIN

A

VITACURA

LO ES

PEJO

HUECHURABA

LO BARNEC

HEA0

50

100

150

200

250

300

350

Comunas

Núm

ero

de A

trop

ello

s

Page 13: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

Análisis GeoEspacial

13

Page 14: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

14

Radio de Búsqueda de Kernel

• Suavización de los datos– Mayor cobertura– Diminución de datos atípicos y saltos

• 1000 y 3500 metros– Sugerencia software– Máxima mínima distancia

AtropellosAtropellos

Page 15: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

15

Eliminación de datos

• Supuestos Gauss-Markov– Linealidad, heterocedasticidad, estacionariedad

• Coeficiente de Correlación de Pearson– 80% de correlación“Todo está relacionado con todo lo demás, pero las cosas

cercanas están más relacionadas que las distantes”Tobler (1970)

VariablesOriginales

Tras Eliminación por Linealidad

Tras Eliminación por Correlación de Pearson

Dep1000 28 8 6

Dep3500 28 14 10

Orig1000 28 13 10

Orig3500 28 15 13

Page 16: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

16

Regresión Lineal Múltiple

• Proceso Iterativo– Variable Inflation Factor (VIF)

• Comprobación Transformación– Eliminación de Modelos– Punto de corte 0,05

AIC R2 Ajustado Jarque Bera Koenker

Orig3500 654 0,82 0,603 0,000026Dep3500 47 0,86 0,0045 0Dep1000 223 0,63 0,408 0,149Orig1000 1080 0,48 0,000001 0,0202

Modelo Dep3500

Modelo Orig1000

Page 17: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

17

• Resultados de ambos modelos– Dep1000: R2 -> 62,7%– Orig3500: R2 -> 82,3%

• Orig3500– Heterocedasticidad y estacionariedad espacial– GWR

Selección Final Previo a GWR

AIC R2 Jarque Bera KoenkerOrig3500 654 0,82 0,603 0,000026Dep1000 223 0,63 0,408 0,149

Dep1000

Variable Influencia Coeficiente

INTERCEPTO -------- -0,183601

kMATRICULA 25,7% 0,362608

kPOB. TOTAL 18,8% 0,264288

kGRUPO D 12,9% 0,181203

kPARADERO 24,1% 0,339112

dMETRO** 18,0% 0,253951

dCOLEGIO** 0,5% 0,007545

Orig 3500Variable Influencia Coeficiente

INTERCEPTO -0,059619

kMATRICULA 21,40% 0,29815

kPOBL. 0-18 17,60% 0,245147

kGRUPO ABC1 9,36% -0,130457

kPARADERO 24,11% 0,335873

dMETRO 14,04% -0,195558

dAVDA y CARRETERA 13,49% 0,187902

Page 18: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

18

GWR

• Dep1000– Cumple los indicadores

• Orig3500– R2 Locales: 77,8% a 93,8%

Orig3500

GWR RLM

AIC 138,056 654

R2 0,91096 0,82

Dep1000

GWR RLMAIC 434,892 223R2 0,68711 0,63

Page 19: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

19

Resultados

Orig3500 GWR Dep1000 RLM

Relativo a ColegioskMATRICULA (+) kMATRICULA (+)

- dCOLEGIO (+)*

Condiciones Poblacionales por edad y grupo socio económico

kPOBL. 0-18 (+) kPOB. TOTAL (+)

kGRUPO ABC1 (-) kGRUPO D (+)

Medios de Transporte y Relacionados

kPARADERO (+) kPARADERO (+)

dMETRO (+) dMETRO (+)

dAVDA y CARRETERA (-) -

Page 20: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

Discusión y Conclusiones

Page 21: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

21

Estadística Descriptiva

• La educación es vital:– Varones– Independencia móvil– Horarios en torno y posterior a sus actividades– Al final de la semana– Durante el año escolar – Comunas más populares y de alto tráfico.

Page 22: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

22

Estadística Espacial

• Modelo Lineal– Pre-selección– Limitantes

• Radios de Kernel– Importancia Variación

• RLM-Espacial– Tobler (1970)– Estacionariedad Espacial

Page 23: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

23

Estadística Espacial

• GWR– Diferencia 1000 versus 3500• Mejor Distribuidas (RLM)

– Estabilidad General, desajuste local

• Clusterizadas (GWR)– Tendencia General

– Caso Avenidas

3500

1000

Page 24: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

24

Comentarios Finales

• Importancia ambos análisis– Espacial– Datos descriptivos • No agrupables

• Complementariedad– Caso Avenidas• Cantidad de Avenidas• Jordan (1998), Atención del Peatón

Page 25: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

25

Trabajos Futuros

• Filtros y segmentación• Sub-sectores• Temporal• Metodología– Kernel– No lineal

• Comparación con otras ciudades

Page 26: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

26

Bibliografía• Brown, S., Versace, V. L., Laurenson L., Ierodiaconou, D., Fawcett, J. & Salzman, S. (2012),

Assessment of Spatiotemporal Varying Relationships Between Rainfall, Land Cover and Surface Water Area Using Geographically Weighted Regression, Environ Model Assess, Springer Science & Business Media.

• Calzadilla, J., Guerra, W. & Torres, V. (2002), El uso y abuso de transformaciones matemáticas. Aplicaciones en modelos de análisis de varianza, Revista Cubana de Ciencia Agrícola, Cuba.

• Comisión Nacional de Seguridad de Tránsito, CONASET (2010), Diagnóstico de la Seguridad de Tránsito en Chile (Período 2000 2009)‐ , Área de Estudios y Estadística, CONASET, Ministerio de Transportes y Telecomunicaciones, Santiago, Chile.

• Clifton, K. & Kreamer-Fults, K. (2007) An examination of the environmental attributes associated with pedestrian-vehicular crashes near public schools, Accident Analysis and Prevention.

• Fotheringham, A. S.; Brunsdon, C. & Charlton, M. E. (1996), Geographically Weighted Regression: A Method for Exploring Spatial Nonstationarity, Geographical Analysis, Vol. 28, pp. 281-298. Fotheringham, A S.; Charlton, M. (2009); Geographically Weighted Regression White Paper; National Centre for Geocomputation, National University of Ireland Maynooth, Maynooth, Co Kildare, Ireland

• Graham D., Glaister, S., Anderson, R. (2005) The effects of área deprivation on the incidence of child and adult pedestrian casualties in England, Accident Analysis and Prevention,, Department of Civil and Environmental Engineering, Centre for Transport Studies, Imperial College London, London, UK

Page 27: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

27

Bibliografía• Jordan, G. (1998) Child Pedestrian–Car Crashes Near Schools Are a Small Percentage

of Total Child Pedestrian Crashes in Philadelphia, Transportation Research Record, Paper No. 98 Vol. 1058

• Jarque, C. M.; Bera, A. K. (1987). A test for normality of observations and regression residuals. International Statistical Review, Vol. 55 (2), pp. 163-172.

• Koenker, R. (1981), A Note On Studentizing A Test For Heteroscedasticity, Journal of Econometrics, Vol. 17, pp.107-l 12. North-Holland Publishing Company.

• LaScala, E. A., Gerber, D. & Gruenewald, P. J. (2000) Demographic and environmental correlates of pedestrian injury collisions: a spatial analysis, Accident Analysis and Prevention Vol. 32, pp. 651-658, Prevention Research Center, Berkeley, CA, USA

• LaScala, E. A.; Gruenewald, P. J. & Johnson, F. W. (2004); An ecological study of the locations of schools and child pedestrian injury collisions, Accident Analysis and Prevention Vol. 36, pp. 569-576.

• Tobler, W.R. (1970), A computer movie simulating urban growth in the Detroit region , Economic Geography, Vol. 46 (2), pp. 234-240.

• World Health Organization (2004) The Global Burden of Disease, Geneva, Switzerland.

Page 28: 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión de los errores Homocedasticidad 5.

Análisis GeoEspacial de Factores que Influyen en Atropellos de Escolares en Santiago-Chile, utilizando ArcGIS

Christian Grob Hernández, MSc.Carola Blázquez Lavín, PhD.