Manual Rapido de CrimeStrat

5/10/2018 Manual Rapido de CrimeStrat - slidepdf.com

http://slidepdf.com/reader/full/manual-rapido-de-crimestrat 1/65

1. Descripción del programa CrimeStat

1.1. Introducción

CrimeStat es un programa de estadísticas espaciales diseñado específica-mente para el análisis de la ocurrencia de incidentes criminales, desarrolladopor Ned Levine bajo el auspicio del Instituto Nacional de Justicia de Esta-dos Unidos de América. Su propósito es brindar un conjunto de herramientasestadísticas complementarias para ayudar a investigadores y agencias encar-gadas de hacer cumplir la ley.

El programa utiliza la ubicación de incidentes criminales como datos deentrada en formato de archivo dBase (’.dbf’, III, IV, o V), que es un formatode archivo común para programas de Sistema de información geografico deescritorio (SIG), como ArcView (shp), MapInfo (dat), y archivos compatiblescon el estándar ODBC, como Excel, Lotus 1-2-3, Microsoft Access, y Paradox(Borland.Com, 1998; ESRI, 1998a; Microsoft, 1999). Además, para muchosotros SIG, como Maptitude, y puede leer archivos como ‘dbf´, ‘shp´, ‘bna´or ‘mif´.A partir de estos datos, permite aplicar los métodos de estadística espa-cial, produciendo resultados en archivos formato cartográfico que pueden serutilizados directamente por diferentes programas de SIG como ArcView R,

MapInfo R, Atlas*GIS, y Spatial Analyst c.

Los métodos de estadística espacial instrumentados en CrimeStat son:

Distribución Espacial: conjunto de métodos para la descripción de ladistribución espacial de incidentes, tales como el media central, centrode mínima distancia, la elipse de desviación estandarizada, y el índicede autocorrelación espacial I de Moran.

Análisis de Distancia: conjunto de técnicas estadísticas para describirlas propiedades de las distancias entre los incidentes, incluyendo análisisde vecinos más cercanos, análisis lineal del vecino más cercano, y elestadístico K de Ripley.

Análisis de Zona o Puntos Calientes: ("Hot Spot") incluye las ruti-nas para realizar el análisis de Punto Calientes, incluyendo la moda,la moda difusa, detección de conglomerados de vecinos más cercanos

1



jerárquicos y de vecinos más cercanos jerárquicos ajustados por niveles

de riesgo, así como otras rutinas para el Análisis Espacial y Temporalde Crímenes (STAC por sus siglas en inglés), que incluyen el métodode detección de conglomerados K-means y los Índices Locales de Au-tocorrelación Espacial (LISA por sus siglas en inglés) propuestos porAnselin.

Modelación Espacial: incluye métodos de interpolación, utilizando elmétodo de estimación de densidad de kernel de una variable simple,para producir un estimado de superficie o contorno de la densidad de in-cidentes, también incluye el método de estimación de densidad de kerneldual, utilizando dos variables en la estimación, para comparar la densi-dad de incidentes con la densidad de un segundo archivo DDDDDDD,además de otras técnicas de análisis espacio-temporal, como los índicesde Knox y Mantel, que permiten detectar la asociación de incidentesen tiempo y espacio (estos indices son los que desarrollaremos en estetrabajo), entre otros métodos con mayor aplicación en el análisis decriminalidad.

CrimeStat utiliza varios tipos de archivos de datos de entrada, un archi-vo primario y uno secundario, ambos contienen la ubicación de incidentes enforma de pares de coordenadas, así como la fecha de ocurrencia del incidente.

El archivo secundario contiene datos asociados con el primario y puede serutilizados con fines de comparación en los métodos de detección de conglo-merados o cluster. Utiliza además un archivo que define una rejilla (grid) depolígonos regular ó irregular que se superpone sobre el área de estudio. Dicharejilla puede ser creada por CrimeStat ó por un SIG.

CrimeStat no tiene capacidad para la visualización de mapas ni funcionesde SIG, su diseño se ha centrado en los métodos de análisis de datos es-paciales; sin embargo, una característica importante desde el punto de vistaprogramático, es la disponibilidad de una Interfase de Programación de Apli-

cación (API) que permite que otros programas invoquen sus procedimientosy funciones, permitiendo el uso de SIG gratuitos o de bajo costo. Esta esuna ventaja relativa para su uso respecto a aquellos que requieren de SIGcomerciales.

2



1.2. Manual de corto de CrimeStat o guía rápida

En esta sección se presenta una introducción a las funciones del programaCrimeStat que se utilizan en este trabajo; las mismas se exponen en formade manual, de tal manera que pueda servir de guia a los usuarios del mismo.

Descripción breve de la organización de las rutinas del programa

CrimeStat cuenta con diecisiete pestañas (rutinas) organizados en cincogrupos base, presentados en ventanas, y una ficha opción, como se describeacontinuacion:

Configuración de los datos

1. Archivo primario

2. Archivo secundario

3. Archivo de referencia

4. Medición de parámetros

Descripción espacial

5. Distribución espacial

6. Análisis de distancia I

7. Análisis de distancia análisis II

8. Análisis Zonas calientes I (Hot Spot)

9. Análisis Zonas calientes II (Hot Spot)

Modelado espacial10. Interpolación

11. Análisis Espacio-tiempo

3



12. Estimación del viaje a la delincuencia

Demanda del recorrido del crimen

13. Generación de viaje

14. Distribución de viaje

15. Modelo Split

16. Asignación de Red

17. Archivo de hojas de calculo

Opciones

18. Guardando parámetros, colores y opciones.

En la Figura tal 1.1-2.18 se presenta la ventana principal de Crimestat,donde se muestra las cinco pestaña correspondientes a los cinco grupos base.

1.2.1. Configuración de datos

Archivo Primario

CrimeStas requiere de un archivo primario. Sin embargo, se pueden se-leccionar más de un archivo si es necesario. Este es un archivo de puntos concoordendas X e Y. Por ejemplo; un archivo primario puede ser la ubicaciónde los robos callejero con algún tipo de arma, cada uno referenciado con susrespectivas coordenadas X e Y. Además, en este archivo los incidentes puedenestar asociados con alguna ponderación o intensidad de las variables, aunqueestos son opcionales. Por ejemplo, si los puntos corresponden a los puestos oestaciones de policía, la variable intensidad podría ser el número de llamadas

solicitando el servicio en cada estación de policía, mientras que la variablede ponderación puede ser zonas de servicio. En este archivo se referencia eltiempo en que sucede el evento criminal, y las unidades para el mismo son:horas, días, semanas, meses o años. Esta variable es necesaria por las rutinasdel análisis espacio-tiempo.

4



Selección del tipo de archivo primario

CrimeStat puede leer archivos ASCII, dBase ’dbf’( III / IV / V) , Arc-View ’shp’, MapInfo ’dat’, Microsoft Access ’bdb’, y formatos de archivosque corresponden a la interfaz estándar ODBC.Para seleccione el tipo de archivo a ser usado, utilice el botón Browse parabuscar el nombre del archivo. Si el tipo de archivo es ASCII, seleccione eltipo de datos separador (coma, punto y coma, espacio, ficha) y el númerode columnas. Los archivos ODBC deben que ser definidos para el particularequipo en el que se ejecuta.

Variables

Debe definir el archivo que contiene las coordenadas X e Y. CrimeStatacepta valores asociados a las coordenadas X e Y; estos valores son los lla-mados pesos o intensidades. Si estas ponderaciones var a ser usadas, debedefinirse el archivo que las contiene. En esencia, se trata de dos tipos de pon-deraciones diferentes, que son requeridas por algunas rutinas, (por ejemplo,el indice local de Moran, la autocorrelación espacial). Es posible usar las dosponderaciones (intensidad y un peso), aunque debe ser prudente en ello, pa-ra evitar la ‘doble ponderación’. CrimeStat utiliza la variable tiempo comoun número entero o número real (por ejemplo, 1, 36892); no usa el formatofechas (por ejemplo, 01/01/2001, 1 de octubre de 2001). Debe convertir elformato fechas a números reales antes de utilizar cualquier rutina de análisisde espacio-tiempo.

Columna

Seleccione las variables para las coordenadas X e Y, respectivamente (porejemplo, Longitud, Latitud, Xcoord, Ycoord). Si los pesos o intensidades se-rán utilizados, debe seleccionarse nombres apropiada para estas variables; deigual manera si la variable tiempo se utiliza, debe seleccionase un nombre

apropiado.

Valores faltantes

CrimeStat por defecto ignora los registros con valores en blanco en cual-quiera de los campos elegibles o no con valores no numéricos (por ejemplo,

5



caracteres alfanuméricos, #, ). Los registros con valores en blanco siempre

será excluido a menos que el usuario seleccione en la casilla <none>, algunaotra opción. Hay 8 opciones posibles:

1. <blank>los campos son automáticamente excluidos. Este valor es porpor defecto

2. <none>indica que los registros no serán excluidas. Si hay un campo enblanco, CrimeStat tratará como un 0

3. 0 Está excluido

4. -1 Está excluido5. 0 y -1 indica que ambos 0 y -1 se excluirán

6. 0, -1 y 9999 indica que los tres valores (0, -1, 9999) serán excluidas

7. Cualquier otro valor numérico puede ser tratado como un valor faltantetipiando este (por ejemplo, 99)

8. Valores numéricos múltiples pueden ser tratados como valores que fal-tan por tipear, separando cada uno por comas (por ejemplo, 0, -1, 99,9999, -99)

Direccional

Si el archivo contiene coordenadas direccionales (ángulos), debe definir-se el nombre del archivo y el nombre de la variable (columna) que contienela medida direccional. Si coordenadas direccionales son usadas, puede haberuna variable de distancia opcional para la medida. Defina el nombre del archi-vo y el nombre de la variable (columna) que contiene la variable de distancia.

Tipo de sistema de coordenadas y unidades de datos

Seleccione el tipo de sistema de coordenadas. Si las coordenadas estánen longitudes y latitudes, un sistema esférico es usado, y las unidades de losdatos automáticamente son grados decimales. Si el sistema de coordenadas esproyección (por ejemplo, Sistema de Coordenadas Planas o Universal Trans-versal de Mercator-UTM), las unidades de los datos puede ser en pies, metros

6



(por ejemplo, UTM), millas, kilómetros o millas náuticas. Si el sistema de

coordenadas es direccional, las coordenadas debe estar en ángulos y la casillade unidad de datos queda en blanco. Para el sistemas de direccional, hay unavariable additional distancia, que puede ser usado. Esta mide la distancia delincidente desde la posición origen (ubicación); observe que en este caso lasunidades son indefinidas.

Unidades de tiempo

Definir las unidades de la variable tiempo. El tiempo es definido en tér-minos de horas, días, semanas, meses o años. El valor por defecto es días.

CrimeStat utiliza la variable tiempo como un número entero o número real(por ejemplo, 1, 36892); no usa el formato fechas (por ejemplo, 01/01/2001, 1de octubre de 2001). Debe convertir el formato fechas a números reales antesde utilizar cualquier rutina de análisis de espacio-tiempo.

Archivo Secundario

CrimeStat usa un segundo archivo de datos que puede ser opcional, lla-mado Archivo Secundario. Este archivo también es un archivo de puntos concoordenadas X e Y. Generalmente se usa para comparar con el archivo pri-mario. El archivo secundario puede usar las variables ponderadas (pesos ointensidades) asociadas a las coordenadas X e Y, aunque estas son opcionales.Por ejemplo, si el archivo principal corresponde a la ubicación de robos deautomóviles, en el archivo secundario la variable como la intensidad (o peso)podría ser el centroide de los bloques de los grupos que tienen la poblacióncensada. En este caso, se podría comparar la distribución de robos de auto-móvil con la distribución de población; por ejemplo, en la rutina de Ripley‘s‘K´ o la estimación de densidad dual. La variable tiempo no es utilizada eneste archivo. Puede seleccionarse más de un archivo a usar.

Selección del tipo de Archivo Secundario

Procedimiento semejante al archivo primario. Ver archivo primario.

Variables

Definir el archivo que contiene las coordenadas X e Y. Si los pesos o

7



intensidades van a ser usados, debe definirse el archivo que contiene estas

variables. Algunos estadísticos requieren valores de intensidad (por ejemplo,autocorrelación espacial, Moran local). La mayoría de los demás estadísti-cos pueden utilizar ponderaciones. Es posible tener ambas variables (pesose intensidad ), aunque el usuario debe ser prudente en ello para evitar la‘doble ponderación´. Las Unidades de tiempo no se utilizan en este archivosecundario.

Columna

Seleccione las variables para las coordenadas X e Y, respectivamente (por

ejemplo, Longitud, Latitud, Xcoord, Ycoord). Si hay pesos o intensidades quese esté usando, debe seleccionarse nombres apropiadas para estas variables.Unidades de tiempo no se utilizan en el archivo de secundaria.

Valores faltantes

Procedimiento semejante al archivo primario. Ver archivo primario.

Tipo de sistema de coordenadas y unidades

La data del archivo secundario debe tener el mismo sistema de coordena-das y las mismas unidades del archivo principal. Esta selección será bloquea-da o neutralizada, indicando que el archivo secundario debe lleva la mismadefinición que el archivo primario. El archivo secundario no se permite coor-denadas direccional (ángulos).

Archivo de referencia

Para referenciar el área de estudio, existe una grilla o cuadrícula de refe-rencia y un origen de referencia. El archivo de referencia es utilizado por lasrutinas: cluster jerárquicos del vecinos más cercanos (agrupación), viaje de

la delincuencia y por estimación de densidad o kernel, simple o doble. Es porlo general, aunque no siempre, una cuadrícula es sobrepuesto en la zona deestudio. El origen de referencia es utilizado en la ruptina media direcciónal.Este archivo puede ser externo como archivo de entrada, o puede ser creadospor CrimeStat.

8



Crear una grilla o cuadrícula de referencia

CrimeStat permite generar una verdadera cuadrícula, haciendo clic ençreate Grid ’y luego ingresando en la parte inferior izquierda y superior dere-cha las coordenadas X e Y de un rectángulo, colocado sobre el área de estudio.Las celdas se pueden definir por tamaño de celda, en las mismas coordena-das y los datos de unidades como el principal archivo, o por el número decolumnas en la red (por defecto). Además, un origen de referencia puede serdefinido por la rutina media direccional. La grilla de referencia puede serguardardo para volver a utilizar. Haciendo clic en la casilla Guardar (Save)y dando un nombre al archivo. Para utilizar un archivo guardado, haga clic

en la casilla cargar (Load) y colocar directorio y nombre del archivo. Lascoordenadas se guardan en el registro, pero pueden guardarse en cualquierdirectorio. Para guardar en un directorio particular, con la ventana abiertade la pestaña Cargar (Load), haga clic en Guardar en archivo (Save to file),a continuación, introduzca el directorio y nombre del archivo. La extensiónde archivo por defecto es ref.

Entrada de un archivo externo de referencia

Para usar un archivo externo que almacena las coordenadas de rejilla ocuadrícula, debe seleccionar el nombre del archivo de referencia. CrimeStatpuede leer archivo ASCII, dBase ’dbf’, ArcView ’shp’, MapInfo ’dat’, Mi-crosoft Access ’mdb’, y formatos de archivos que corresponden a la interfazestándar ODBC. Seleccione el tipo de archivo a usar. Use el botón buscar(browse) para ubicar el archivo. Si el tipo de archivo es el ASCII, seleccioneel tipo de separador de datos (la coma, el punto y coma, el espacio, pestaña)y el número de columnas. Los archivos ODBC tienen que ser definido para elcomputador sobre el cual se ejecutara. Use el botón de wrouse para buscarel nombre del archivo.

Un archivo de referencia leído en Crimestat no tiene que ser necesaria-

mente una rejilla verdadera (matriz con k columnas y l filas). Sin embargo,un achivo exernal de referncia que es leído en Crimestat, sólo puede ser salidaSurfer para Windows ya que otros formatos de salida - ArcView, MapInfo,Atlas*GIS, Spatial Analyst, y rejilla ASCII requieren que el archivo de refe-rencia sea una rejilla verdadera.

9



Origen de referencia

Un origen de referencia puede ser definido por la rutina de media direc-cional. El origen de referencia pueden ser asignados a:

1. Uso de la esquina inferior izquierda, definida por el mínimo de los va-lores X e Y. Este valor es por defecto.

2. Uso de la esquina superior derecha, define por los valores máximos Xe Y.

3. Un punto de origen diferente. Con este último, el usuario debe definir

el origen.Medida de parámetros

En la pestaña medida de parámetros (Measurement Parameters), se de-fine las unidades y el la cobertura del área en estudio, y el tipo de distanciaa utilizar. En esta ventana hay tres componentes que se definen:

Area

En primer lugar, debe definirse el área geográfica de la zona de estudio, y

la unidades de superficie en kilómetros cuadrados, millas náuticas cuadradas,pies cuadrados o metros cuadrados. Independientemente de las unidades enque se han definido los datos en el archivo principal, CrimeStat puede con-vertir diversas unidades de área. Estas unidades se utilizan en la rutinas delvecino más cercano, Ripley’s ‘K´, cluster jerárquica, STAC, y clustering deK-means. En caso de que las unidades de superficie no esten definidas, Cri-meStat define un rectángulo por el mínimo y el máximo de las coordenadasX e Y.

Longitud de la red de calle

En segundo lugar, se define la Longitud total de la red de calle (Lengthof street network) del área de estudio o una comparación adecuada de red,como por ejemplo, un sistema de autopista; y se define tambien las unidadesde distancia (kilómetros, millas náuticas, pies, kilómetros, metros). La longi-tud de la red de calle es utilizada por la rutina análisis lineal del vecino más

10



cercano. Independientemente de las unidades que se ha utizado en la data

del archivo principal, CrimeStat puede convertir las unidades de medición adistancia. La distancia deberá estar en la misma métrica como la unidadesde superficie (por ejemplo, millas y millas cuadradas, metros y metros cua-drados.)

Tipo de distancia

En tercer lugar, se define las distancias a usar en los calculos (Type of distance measurement). Hay tres opciones:

1. Distancia directa2. Distancia indirecta (Manhattan)

3. Distancia de Red

Gráfico 2,11

Distancia directa

Si se usa distancia directa, cada distancia es calcula como la distancia máscorta entre dos puntos. Si se las coordenadas son esféricas (es decir, latitud,longitud), entonces la distancia directa más corta es un arco de circulo sobreuna esfera. Si las coordenadas son proyecciones, entonces, la distancia máscorta directa es una línea recta en un plano euclidiano.

Distancia Indirecta

Si se usa la distancia indirecto, cada distancia se calcula como la distan-cia más corta entre dos puntos en una cuadrícula, esto es, la distancia estálimitada a la direcciones horizontal o vertical (es decir, no en diagonal). Estadistancia es llamada métrica de ’Manhattan’. Si son coordenadas esféricas

(es decir, latitud, longitud),entonces la distancia indirecta más corta es unángulo recto modificado sobre un triángulo rectángulo esférico; escribir másdetalles. Si las coordenadas son proyecciones, entonces la distancia indirectamás corta es el ángulo recto de un triángulo rectangulo sobre un plano dedos dimensiones.

11



Distancia en Red

Si se utiliza distancias en red, cada distancia es calculada como el caminomás corto entre dos puntos en la red. Alternativamente la distancia puedeutilizarse incluyendo velocidad, tiempo de viaje o recorrido, o costo de viaje.Haciendo clic en la casilla parámetros de la red (Network parameters), apa-rece una ventana con los parámetros de red, donde debe identificar el archivode red, Tipo de red, Entrada del Archivo de red, Ponderación sobre la Red,From one-way flag and To one-way flag, Identificando nodo partida (FromNo-de ID) y terminal (ToNode ID Sistema de coordenadas Unidades de mediday Límite gráfico de Red:

Tipo de red

Los archivos de Red pueden ser bi-direccional (por ejemplo, un archi-vo TIGER) o uni-direccional (por ejemplo, un archivo para modelación deltránsito). En un archivo bi-direccional, se puede viajar en cualquier direc-ción; mientras que en un archivo uni-direccional, sólo se puede viajar en unadirección. Debe especificar el tipo de Red que se utilizará.

Tipo de Archivo de entrada

Los archivos de red pueden ser archivo tipo shape (.shp) o archivo tipodBase IV ’dbf’, Microsoft Access’ mdb ’, Ascii’ dat ’, o un archivo compati-ble con ODBC. Por defecto el archivo es tipo shape. Si el archivo es de tiposhape, la rutina debe conocer la localización de los nodos.Para un archivo dBase IV u otro tipo, las coordenadas X e Y de los nodosdeben ser definidas; estos son Llamados "Partida"(From) del nodo y "Termi-nal"(End) del nodo. Una variable peso opcional es permitida para los archivostipos file0073. La rutina identifica nodos, segmentos, y calcula la trayectoriamás corta. Si hay un camino uni-direccional en un archivo bidireccional, loscampos para nodos de "Partidaτ terminal deben ser definidos.

Ponderación sobre la Red

Normalmente, cada segmento en de la red no es ponderado. En este caso,la rutina calcula la distancia más corta entre dos puntos, utilizando la dis-tancia de cada segmento. Sin embargo, cada segmento puede ser ponderado

12



por el tiempo de viaje, velocidad o costo de viaje. Si el tiempo de viaje es

utilizado para ponderar el segmento, la rutina calcula el menor tiempo paracualquier ruta entre dos puntos. Si la velocidad se utiliza como ponderacióndel segmento, la rutina convierte esto en el tiempo de viajes, dividiendo ladistancia por la velocidad. Por último, si los costos de viaje se utiliza comoponderación, la rutina calcula la ruta con el menor costo total de viaje.

Especifique la ponderación que utilizará (weight column) y asegúrese deindicar las unidades de medida (distancia, velocidad, tiempo de viaje, costode viaje) en la parte inferior de la ventana. Si no se asigna ponderación, en-tonces la rutina se ejecuta utilizando la distancia.

From one-way flag y To one-way flag

Un segmento uni-direccional pueden ser identificado en un archivo bi-direccional por el campo (from one-way flag), es decir, no es necesario unarchivo uni-direccional. El ’flag’ es un campo para los nodos finales del seg-mento con valores ’0’ y ’1’. Un ’0 ’indica que los viajes pueden pasar a travésde ese nodo en cualquier dirección, mientras que un ’1’ indica que el viajesólo puede pasar del nodo del mismo segmento (por ejemplo, los viajes nopuede ocurrir de otro segmento que está conectada al nodo). Por defecto seasume que los viajes pueden pasar través de cada nodo,(es decir, se suponeun’0 ’para cada nodo). Para cada calle de dirección única, debe especificar lasflags para cada nodo terminal. Un ’0’ permite viajar desde cualquier conexiónde segmentos, mientras que un ’1’ sólo permite viajar desde el otro nodo delmismo segmento. Flag Marcar los campos que están en blanco se supone quepermiten viajar a pasar en cualquier dirección.

Identificando nodo partida (FromNode ID) y nodo terminal (ToNode ID)

Si la red es uni-direccional, hay un segmento individual para cada direc-ción. Normalmente, dos calles tienen dos segmentos, uno para cada dirección.

Por otra parte, calles con un solo sentido, tienen sólo un segmento. Las casi-llas FromNode ID y ToNode ID, identifican el inicio y el final del segmento delos viajes debería ocurrir, respectivamente. Si no se definen los FromNode IDy ToNode ID, la rutina elige el primer segmento de un par que encuentre, endirección equivocada o correcta. Para determinar correctamente la direcciónde viaje, debe definirse los campos FromNode ID y ToNode ID.

13



Sistema de coordenadas

El archivo de red usa el mismo sistema de coordenadas que que el archivoprimario.

Unidades de medida

Por defecto, la trayectoria más corta es en términos de distancia. Sin em-bargo, cada segmento puede ser ponderado por el tiempo de viaje, velocidadde viaje, o costo de viaje.

1. Para el tiempo de viaje, las unidades son minutos, horas o unidades decosto sin especificar.

2. Para la velocidad, las unidades son millas por hora y kilómetros por ho-ra. En el caso de velocidad como una variable de ponderación, automá-ticamente es convertido el tiempo de viajes, por dividiendo la distanciadel segmento por la velocidad, manteniendo las unidades constantes.

3. Para costo de viaje las unidades no están definidas, la rutina identificaaquellas rutas con el menor costo total.

Límite gráfico de Red

Finalmente, el número de segmentos gráficos a ser calculados es definidocomo el límite de red. Por defecto, el valor es 50.000 segmentos. Debe asegu-rarse que este número es ligeramente mayor que el número de segmentos en sured. Observacion: Usando la distancia red (network distance), los cálculos dedistancia puede ser un proceso lento, por ejemplo, puede tomar varias horaspara cálcular toda una matriz. Utilice mayor precisión sólo si es necesario, opara la rutina de asignación de red en el módulo de demanda recorrido delcrimen.

Salvar parámetros

Hay un botón o pestaña Guardar parámetros (Save parameters) en lasección Opciones. donde todos los parámetros de entrada pueden ser guar-dados. Un archivo de parámetros guardados tiene una extensión ’param’. Un

14



archivo de parámetros guardados puede ser recargado con el botón cargar

parámetros (Load parameters).

1.2.2. Descripción espacial

En esta sección se estudia las estadísticas descriptivas de la distribuciónespacial; haciendo clip en la pestaña ‘spatial description´, se abre la ventanaque muestra las pestañas para la descripción espacial (spatial description),análisis de distancia I y II (distance analysis), y análisis de puntos calientes Iy II (’Hot Spot’). A continuación describimos brebemente cada una de estasrutinas:

Descripción espacial

Esta pestaña descripción espacial (spatial description) nos proporcionalas estadística que describe la distribución espacial total. Los estadísticosque estudiamos en esta sección a veces son llamados estadísticos espacialesde primer-orden, globales. Hay cuatro rutinas que describen la distribuciónespacial, y dos rutinas para describir autocorrelación espacial. Las variableintensidad y ponderación puede ser utilizada por las primeras tres rutinas.La variable intensidad es necesaria para las rutinas de autocorrelación es-pacial; la variable ponderación también puede ser usada por las rutiunas de

índice autocorrelación espacial. Todo los resultados pueden guardarse comoarchivos de texto. Algunos salidas o resultados se pueden guardar como obje-tos gráficos, para ser importardos por programas de Sistemas de informacióngeografica SIG.

Media Central y Distancia Estándar (Mcsd)

La media central y la distancia estándar definen la ubicación de la mediaaritmética y el grado de dispersión de la distribución. La rutina Mcsd calcula9 estadísticos:

1. El tamaño de la muestra.

2. Los valores mínimos de X e Y.

3. Los valores máximo de X e Y.

15



4. Las coordenadas de la media central (X e Y).

5. La desviación estándar de las coordenadas X e Y.

6. Las coordenadas X e Y de la media geométrica.

7. Las coordenadas X e Y de la media armónica.

8. La desviación de la distancia estándar, en metros, pies y millas. Esta esla desviación de la distancia estándar de media central a cada punto.

9. El círculo de área (area circular) definida por la desviación de distanciaestándar, en metros cuadrados, pies cuadrados y millas cuadradas.

La salida tabular y la media central (media de X, media de Y) pueden im-primirse. La media geométrica, la media armónica, las desviaciones estándarde las coordenadas X e Y, y la desviación de la distancia estándar se puedenobtener en archivo u objetos gráficos en formatos para ArcView ’Shp’, Ma-pInfo ’mif’, Atlas*GIS ‘bna´; pero debe darle un nombre de raíz a cada uno.La media central, la media geométrica y la media armónica salen como unpunto con nombre del archivo (MC <root name>), (GM <root name>) y(HM <root name>) respectivamente. La desviación estándar de las coorde-nadas X e Y salen como un rectángulo (XYD <root name>). La desviación

de distancia estándar sale como un círculo (SDD<root name>).

Elipses de desvío estándar (Standard Deviational Ellipse) (Sde)

El Elipse de desvío estándar define la dispersión y la dirección (orienta-ción) de la distribución. Esta rutina calcula 9 estadísticos:


2. El ángulo de rotación del Y-eje, medido en grado en sentido de lasagujas del reloj.

3. La proporción de largo a corto después de los ejes, después de rotación.

4. La desviación estándar a lo largo de los nuevos ejes X e Y.

5. La longitud de los ejes X e Y.

16



6. El área de la elipse definida por los ejes X e Y.

7. La desviación estándar a lo largo de los ejes X e Y.

8. La longitud de los ejes X e Y, para dos desviación estándar elipsoidal2X.

9. El área para dos desviación estándar elipsoidal (2X) definido por estosejes

Las salida tabular se puede ser impresa, y los resultados de 1X y 2X des-viaciones estándar elipsoidal o Elipse de desvío estándar, se puede obtener

como como archivos u objetos gráficos en formatos para ArcView ‘Shp´, Ma-pInfo ‘mif´, Atlas*GIS ‘bna´; proporcionandole un nombre de raíz (origen).La desviación estándar eclipse de 1X es una salida como un elipse (SDE <rootname>). La desviación estándar elipse de 2X es una salida como un elipsecon ejes dos veces mas grande que la desviación estándar elipse 1X (2SDE<root name>). Si la data está distribuida normalmente, entonces una des-viación estándar elipse (1X) captura aproximadamente el 68 % de los casos,y dos desviación estándar elipse (2X) captura aproximadamente el 95 % delos casos, sin embargo, cualquier distribución puede desviarse de considera-blemente de la forma normal y los porcentajes reales pueden variar.

La mediana Central (MdnCntr)

La mediana central es la intersección de las medianas de las coordenadasX e Y, esta aproximadamente en el medio de la distribución. Sin embargo,la mediana central depende de la orientación de los ejes, por lo que debeutilizarse con precaución. Esta rutina (MdnCntr) proporciona 3 estadísticos:


2. La mediana de X.

3. La mediana de Y.

Los resultados tabulares pueden imprimirse, y la mediana central pue-de salir como objeto gráfico o archivo para ArcView ‘shp´, MapInfo ’mif’ oAtlas*GIS ‘bna´, proporcionandole un nombre de raíz (origen). La mediana

17



central sale como un punto con nombre del archivo (MdnCntr <root name>).

Centro de mínima distancia (Mcmd)

El centro de mínima distancia define el punto para el cual la distanciaa todos los demás puntos es mínima. Esta rutina (Mcmd) proporciona 5estadísticos:


2. Las medias de las coordenadas X e Y.

3. El número de iteraciones requeridas para identificar el centro.

4. El grado de error (tolerancia) para detener las iteraciones.

5. Las coordenadas X e Y que definen el centro de mínima distancia.

La salida tabular puede imprimirse, y el centro de mínima distancia pue-de salir como objeto gráfico o archivo para ArcView ‘.shp´, MapInfo ’.mif’o Atlas*GIS ‘.bna´, proporcionándole un nombre de raíz (origen). El centrode mínima distancia sale como un punto y con nombre (Mdn<root name>).

Media Direccional y Varianza (Mcmd)

La media direccional o angular y la varianza, son propiedades de la me-dida angular. La media angular es un ángulo definido a partir del Norte: 0grados. La varianza direccional es un indicador relativo, que varía de 0 (sinvariación) a 1 (máxima variación). Tanto la media angular como la varianzadireccional pueden calcularse a través de las coordenadas direccionales (an-gulares) o a través de coordenadas X e Y.

Si el archivo principal presenta coordenadas direccionales (ángulos de 0 a

360 grados),la media angular se calcula directamente a partir de los ángulos.Una variable distancia opcional puede ser incluida. En este caso, la rutinamedia direccional proporciona la salida de cinco estadísticos:


2. La media angular sin ponderacion.

18



3. La media angular ponderada.

4. La varianza circular sin ponderación.

5. La varianza circular ponderada.

Por otro lado, si en el archivo primario los incidentes se definen en coor-denadas X e Y, los ángulos son definen en relación con el origen de referencia(ver archivo referencia), y ángulo medio se convierte en una ecuación. Eneste caso, la rutina media direccional ofrece nueve estadísticos:

1. El tamaño de la muestra;

2. La media angular no ponderada

3. La media angular ponderada

4. La variancia circular no ponderada

5. La variancia circular ponderada

6. la distancia media

7. La intersección de la media angular y la distancia media (media direc-cional).

8. Las coordenadas X e Y de la media triangular.

9. Las coordenadas X e Y de la media triangulados ponderada.

La media direccional y media triangulada se pueden guardar como archi-vos ArcView ’.shp’, MapInfo ’.mif’, o Atlas*GIS ’.bna’. La media direccionalno ponderada, la intersección de media angular y la distancia media sale conel prefijo ‘Dm´, mientras que la posición (ubicación) de la media triangularno ponderada sale con el prefijo ‘Tm´. La media triangulada ponderada salecon prefijo ‘TmWt´. Los resultados tabulares se pueden imprimir.

Capsula Convexa (Chull)

La Capsula Convexa dibuja un polígono en torno a los puntos exterioresde la distribución. Es útil para ver la forma de la distribución. Esta rutinaproporciona tres estadísticos:

19




2. El número de puntos en la capsula convexa.

3. Las coordenadas X e Y para cada uno de los puntos en la capsulaconvexa.

La capsula convexa se pueden guardar como archivo para ArcView ’shp’,MapInfo ’mif’, o Atlas*GIS ’bna’ con el prefijo ’Chull’.

Autocorrelación espacial

En esta sección de Autocorrelación espacial (Spatial autocorrelation) sepresentan dos indices de autocorrelación espacial, índice de Moran y el ín-dice de Geary’s; además se presenta también el correlograma de Moran. Losíndices de autocorrelación espacial permiten identificar si los puntos de locali-zacion estan o no relacionados espacialmente (es decir, en cluster o dispersos).Ambos rutinas requieren la variable intensidad en el archivo principal.

Estadístico I de Moran (MoranI)

El índice o estadístico I de Moran, es el indicador clásico de autocorrela-

ción espacial. Se trata de un índice de covarianza entre los diferentes puntosde localización, similar al coeficiente de correlación (producto momento), suvalor se encuentra entre -1 y 1. Esta rutina calcula seis estadísticos:


2. El índice de Moran’s "I".

3. El valor esperado del índice "I" (valor aleatorizado espacialmente).

4. La desviación estándar del índice "I".

5. Una prueba de significación para "I", bajo el supuesto de normalidad(Z-test)

6. Una prueba de significación para "I", bajo el supuesto de la aleatoriza-ción (Z-test).

20



Los valores del índice superiores al valor esperado "I", indican cluster,

mientras que los valores inferiores al valor esperado, indican dispersión. Lasignificancia de la prueba indica si esas diferencias son mayores a las espera-das por azar. Los resultados se pueden imprimir.

Ajuste para las pequeñas distancias

Si se selecciona esta pestaña (Adjust for small distances), las pequeñasdistancias son ajustados de manera que la distancia máxima ponderada es1. De esta forma se garantiza que el índice "I", no sea excesivamente grandepara puntos que se encuentran muy próximos entre sí. Por defecto la confi-

guración no es ajustada.

El C de Geary

El estadístico C Geary, es un indicador alternativo de autocorrelaciónespacial. Se trata de un índice de comparación entre los diferentes pares delocalizaciones. Varía de 0 a 2, cero para valores similares y dos para valoresdisímiles. La rutina Geary calcula 5 las estadísticos:


2. El índice C de Geary.3. El valor esperado C (valor espacialmente aleatorizado).

4. La desviación estándar de C.

5. Una prueba de significación para C, bajo el supuesto de normalidad(Z-test).

Los valores de C inferior al valor esperado indicar cluster, mientras quelos valores de C mayor al valor esperado indican la dispersión. La significan-cia de la prueba indica si esas diferencias son mayores al valor esperado por

azar. Los resultado se pueden imprimir.


Si se selecciona esta pestaña (Adjust for small distances), las pequeñasdistancias son ajustados de manera que la distancia máxima ponderada es 1.

21



Esto asegura que el índice C, no sea excesivamente grande para puntos que

se encuentran muy próximos. Por defecto la configuración es no ajustada.

Correlograma de Moran

El Correlogram de Moran calcula el índice de Moran’s "I"(no ajusta-do para las pequeñas distancias), para diferentes intervalos de distancia. Elusuario puede seleccionar cualquier número de intervalos de distancia. Pordefecto son 10 intervalos de distancia.


Si se selecciona esta pestaña (Adjust for small distances), las pequeñasdistancias son ajustados de manera que la distancia máxima ponderada seaigual a 1. Esto asegura el índice de Moran’s "I" no, sea excesivamente gran-de o demasiado pequeño para puntos que se encuentran muy próximos. Pordefecto la configuración es no ajustada.

Simulación de intervalos de confianza

Mediante una simulación de Monte Carlo se puede obtener una estimaciónaproximada de intervalos de confianza alrededor del indice "I". Seleccionan-do un número específico de simulaciones a ejecutar (por ejemplo, 100, 1000,10000).

La salida incluye:


2. La distancia máxima.

3. El número de intervalos (bins).

4. El punto medio de la distancia bin.

5. El valor "I"de la distancia bin (I[B]).

Si la simulación es ejecuta, la salida incluye:

22



6. El valor mínimo de "I" para la distancia bin.

7. El valor máxima "I"para la distancia bin.

8. El percentil 0,5 para la distancia bin.




Los dos pares de percentiles (2.5 y 97.5; 0.5 y 99.5) crean un intervalo

de confianza aproximadamente de 5 % y 1 %, respectivamente. Los valoresmínimo y máximo de "Içrean un intervalo.

Los resultados tabulares se pueden imprimir, salvar como archivo de tex-to o salvados como archivo ’.dbf’. Para Salvar los resultados haga clic en lacasilla ‘Save result to´, y especifique el nombre del archivo.

Representación gráfica del índice "I": valores por distancia

Un gráfico que muestra los valores "I" sobre el eje Y, y por distancia binsobre el eje X; haciendo clic en el botón "Graph", se muestra el gráfico. Elgráfico muestra la reducción de la autocorrelación espacial con la distancia.El gráfico es útil para seleccionar el tipo rutina de interpolación de kernelsimple o Dual, cuando la variable principal es ponderada (ver interpolación).

Análisis Distancia

El análisis de distancia proporciona estadísticos acerca de las distanciasentre los puntos o localizaciones. Esta técnica es útil para identificar el gradode cluster de puntos. Algunas veces es llamado análisis de segundo orden.El análisis de distancia se presenta en dos pestañas o ventanas diferentes,

análisis de distancia I y análisis de distancia II. En la primera ventana haydos rutinas para describir las propiedades de las distancias. Y la segunda haycuatro rutinas para calcular distancia de matrices.

Análisis de distancia I

23



En esta sección se calculan las rutinas de análisis de vecinos más cercanos

(Nearest Neighbor Analysis) y el estadístico K de Ripley "K" (Ripley’s "K"Statistic).

Análisis de vecinos más cercanos (Nna)

El índice del vecino más cercano ofrece una aproximación acerca de si lospuntos están más agrupados o dispersos de acuerdo a lo que puede esperarsebasado en la aleatoriedad. Se compara la distancia promedio de otros puntosmás cercanos (vecino más cercano), con la distancia esperada espacialmentealeatorizada dividiendo el promedio empírico de la distancia del vecino más

cercano por la distancia esperada (índice de vecino mas cercano).La rutina del vecino más cercano requiere que el área geográfica y la distanciadirecta ingresen o se indiquen en la ventana "Measurement Parameters". Larutina Nna calcula 10 estadísticos:


2. La distancia media del vecino más cercano.

3. La desviación estándar de la distancia del vecinos más cercanos.

4. La distancia mínima.


6. La distancia media aleatorizada (tanto el rectángulo acotado, comopara el área introducida por el usuario, si es proporcionada).

7. La distancia media dispersa (tanto el rectángulo acotado, como para elárea introducida por el usuario, si es proporcionada).

8. El Índice del vecinos más cercanos (tanto el rectángulo acotado, comopara el área introducida por el usuario, si es proporcionada).

9. El error estándar del índice del vecino más cercanos (tanto el rectánguloacotado, como para el área introducida por el usuario, si es proporcio-nada).

10. Una prueba de significación para el índice de los vecinos más cercanos(Z-test).

24



Los resultados pueden imprimirse, salvarse como archivo de texto o ar-

chivo ’dbf’.

Número de vecinos más cercanos

El K-ésimo índice del vecino mas cercano compara la distancia promediodel K-ésimo punto más cercano con la distancia esperada espacialmente alea-torizada. Si más de una vecindad cercana sera calculada, el usuario puedeindicar el número K de vecindades cercanas a calcular. CrimeStat calculará3 estadísticos para cada orden especificado:

1. La distancia media del vecinos más cercano en metros para el orden.2. La distancia esperada del vecino más cercano en metros para el orden.

3. El Índice del vecinos más cercanos para orden.

La rutina Nna usará el área definida por usuario, a menos que esta nose proporcione, en cuyo caso se usará el rectángulo acotado. Los resultadostabulares se pueden imprimir, salvarlo como un archivo de texto o como ar-chivo ’.dbf’.

Análisis del vecino lineal más cercano

El índice lineal del vecino más cercano proporciona una aproximación encuanto a si los puntos están mas cercanos o dispersado a lo largo caminos desegmentos, de lo que se esperaría en condiciones aleatorias. Seleccionando ladistancia indirecta (Manhattan) e introduciendo la longitud total de la red decamino, en la ventana parámetros de medida (Measurement Parameters), larutina Nna calculará el vecino lineal más cercano calculará (cuando la casillaesté marcada). El índice del vecino lineal más cercano es la relación empíricadel promedio de distancia del vecino lineal más cercanos con la distancialineal esperada al azar. La rutina Nna calcula 9 estadísticos para los índicedel vecinos lineales más cercanos:


2. La distancia media lineal del vecinos más cercanos en metros, pies ymillas.

25



3. La distancia mínima entre los puntos a lo largo de una red grill (red de

rejilla).

4. La distancia máxima entre los puntos a lo largo de una red grill (redde rejilla).

5. La distancia media lineal aleatoria.

6. El Índice del vecino lineal más cercano.

7. La desviación estándar de la distancia del vecino lineal más cercanosen metros, pies y millas.

8. El error estándar del Índice del vecinos lineal más cercano.

9. Una prueba "t" de la diferencia entre la distancia empírica y la esperadadel vecino lineal más cercanos.

Número de vecino lineal más cercano

La rutina Nna puede calcular el K-ésimo vecino lineal más cercanos, ycomparar esta distancia con el promedio de la distancia lineal del K-ésimopunto más cercano con la distancia esperada espacialmente aleatorizada.

Si es necesario más de un vecino lineal más cercano a calcular, el usuariopuede indicar el número de K de vecinos lineal más cercanos. CrimeStatcalculará 3 de estadísticas para cada orden especifico:

1. La distancia media del vecinos lineal más cercano en metros para elorden.

2. La esperanza del vecinos lineal más cercano en metros para el orden.

3. El índice del vecino lineal más cercano para el orden.

Corrección de borde del vecino más cercano

La rutina del análisis del vecino más cercano (área o lineal) no se ajustapara subestimar incidentes cerca de la frontera en la zona de estudio. Esposible que haya vecinos cercanos fuera de los límites que estén más cercaque la medida o valor del vecino cercano. El análisis del vecino más cercanotiene tres opciones para corrección borde:

26



1. No ajustado - Por defecto.

2. Ajuste por área de estudio como rectángulo.

3. Ajuste por área de estudio como círculo.

La correccion de borde rectangular o circular ajustan la distancia del ve-cino más cercano a puntos cerca de la frontera. Si un punto está más cercadel borde (en rectángulo o círculo) que a la distancia medida del vecino máscercano, entonces la distancia de borde es tomada como la distancia ajustadadel vecina más cercano.

Estadístico K de Ripley

El estadístico de Ripley’s compara el número de puntos en cualquier dis-tancia con número esperado espacialmente aleatorio. La cuenta empírica estransformada en función de raíz cuadrada, llamada L, y es ajustada a la orien-tación. Los valores L mayores al límite superior de las simulaciones indicanconcentración, mientras que valores menores al límite inferior de las simula-ciones indican dispersión. El valor L es calculado para cada 100 intervalos dedistancia (bins). Esta rutina calcula es 6 estadísticos:



3. 100 distancia bins.

4. La distancia para cada bin.

5. El estadístico transformado, L(t), para cada distancia bin.

6. La esperanza aleatorizada L, bajo completa aleatoriedad espacial, L(csr).

Además, CrimeStat puede estimar la distribución de muestreo ejecutandosimulaciones de Monte Carlo espacialmente aleatoriazada sobre el área en

estudio. Si se específica una o más simulaciones, la rutina calcula seis

estadísticos adicionales:

7. El valor mínimo de L para las simulaciones espacialmente aleatoria.

27



8. El máximo valor de L para las simulaciones espacialmente aleatoria.

9. El percentil 0.5 para el valor L de las simulaciones espacialmente alea-toria.

10. El percentil 2,5 para el valor L de las simulaciones espacialmente alea-toria.

11. El percentil 97,5 para el valor L de las simulaciones espacialmente alea-toria.

12. El percentil 99,5 para el valor L de las simulaciones espacialmente alea-

toria.Los resultados tabulares pueden imprimirse, salvarse como archivo texto

o como archivo ’.dbf’.

Corrección borde del estadístico Ripley’s K

La configuración predeterminada (por defecto) para el estadístico Ripley’sK es no ajusta a casos cerca de la frontera en zona de estudio. Sin embargo,es posible que haya puntos fuera del área de estudio que están más cercaque el radio de búsqueda que se utiliza para enumerar el K estadístico. El

estadístico K Ripley tiene tres opciones de corrección borde:

1. Sin ajuste - Por defecto

2. Un ajuste que asume el área de estudio como un rectángulo.

3. Un ajuste que asume el área de estudio como un círculo.

La correccion de borde rectangular o circular, para ajustar del estadísticoK Ripley en puntos cerca de la frontera. Si la distancia de un punto a la fron-tera (de un rectángulo o un círculo) es más pequeña que el radio del círculo

usado para enumerar los K estadísticos, entonces el punto es ponderado in-versamente proporcional al área del radio de búsqueda que está dentro de lafrontera.

Salida de resultados intermedios

28



Hay una casilla denominada salida de resultados intermedios (Output

intermediate results). Al seleccionada esta casilla, la salida muestra como unarchivo ".dbf"que enlista los cálculos intermedios. El archivo recibe el nombrede RipleyTempOutput.dbf"; y la salida ofrece cinco resultados:

1. El número de puntos (POINT), comenzando en 0 (para el primer punto)y hasta a el N-1 (para el N-ésima punto).

2. El radio de búsqueda en metros (SEARCHRADI)

3. La cuenta o número de otros puntos que se encuentran dentro del radiode búsqueda (COUNT)

4. El peso asignado, calculando las ecuaciones 5,24 ó 5,28 (WEIGHT).

5. The count times the weight (CTIMESW)

Asignar puntos primarios a puntos secundarios

Esta rutina asigna a cada punto primario un punto secundario, luego su-ma el número de puntos primarios asignados a cada punto secundario. Es útilpara añadir el número de los puntos primarios que están cerca de cada puntosecundario. For example, in the crime travel demand module, this routinecan assign incidents to zones as the module uses zonal totals. El resultado esuna cuenta de puntos primarios asociado con cada punto secundario. Tam-bién es posible sumar diferentes variables secuencialmente. Por ejemplo, en elmódulo demanda viajes de crimen, tanto el número de delitos originarios encada zona, como el número de crímenes que ocurren, son necesarios. Esto sepuede lograr de dos maneras. Primero, sumando los incidentes por coordena-das de origen en cada zona (secundaria archivo), y en segundo lugar, sumarde los incidentes por coordenadas de destino de cada zona (también archivode secundaria). El resultado serán dos columnas, una muestra el número deorígenes en cada zona del archivo secundaria y el segundo muestra el númerode destinos en cada zona del archivo secundaria.

Métodos de asignación: Hay dos métodos para asignar puntos primariosa los puntos secundarios.

Asignación del vecino más cercano

29



Esta rutina asigna a cada punto primarios los puntos secundarios que

están más cerca. Si hay dos o más puntos secundarios que son exactamenteiguales, la asignación va al primero en la lista.

Asignación de Puntos - en - polígono

Esta rutina asigna a cada punto primario el punto secundario que caedentro de su polígono (zona). Deben proporcionarse un archivo shape (po-lígono) de la zona y la rutina comprueba dentro qué zona secundaria caedentro cada punto primario.

Archivo de zona

Un archivo de zona debe ser proporcionado. Esto es un archivo polígonoque define la zona en que los puntos primarios son asignados. El archivo dezona debe ser como el archivo de secundaria (ver en archivo de secundaria).Para cada punto en el archivo primario, la rutina identifica a cual polígonopertenece y luego suma el número de puntos por polígono.

Nombre asignado a la variable

Debe especificar el nombre de la variable suma. Por defecto el nombre esFREQ.

Uso de un archivo de ponderación

Los registros del archivo primario pueden ser ponderados por otro archi-vo. Esto será útil para corregir los totales del archivo primario. Por ejemplo,si suponemos que en el archivo primario los incidentes de robo correspondena un registro de detención o arresto, la suma de esta variable (por ejemplo, elnúmero total de robos) puede producir un sesgo en la distribución sobre laszonas del archivo secundario, debido a que el archivo principal no proviene

de una muestra tomada al azar de todos los incidentes (por ejemplo, si estainformación proviene de un registro de detención donde la distribución dedetenciones de robo, no es igual a la distribución de todos los incidentes derobo).

El segundo archivo o cualquier otro archivo puede ser usado para ajustar

30



la suma total. La variable ponderación debe tener un campo que identifique

la proporción o cociente de la verdadera cuenta medida para cada zona. Unvalor de 1 indica que el valor suma para cada zona es igual al valor real, por loque no es necesario un ajuste. Un valor superior a 1 indica que el valor sumadebe ser ajustado hacia arriba igualar el verdadero valor. Un valor inferior a1 indica que el valor suma necesita ser ajustardo hacia abajo para igualar elverdadero valor.

Si se utiliza otro archivo para ponderación, debe indicar el nombre delarchivo, ya sea el secundario cualquier otro archivo.

Nombre asignado a la variable ponderada

Para una suma ponderada, especifique el nombre de la variable. Por de-fecto será FREQADJ.

Almacenar el resultado

Para ambas rutinas, la salida es un archivo ’.dbf’. Debe definir el nom-bre del archivo. Nota: Debe tener cuidado con el uso del mismo nombre delarchivo secundario, como el archivo salvado ya que tendrá la nueva variable.Lo mejor es darle un nuevo nombre.

Una nueva variable será añadida a este archivo que da el número depuntos primarios en cada zona de archivo secundario y, si la ponderación seutiliza, una segunda variable será añadida la cual tiene la frecuencia ajustada.

Distancia Análisis II

La pestaña del Análisis de Distancia II (Distance Analysis II), abre unaventana que presenta cuatro rutinas para calcular la matrices distancia:

1. De cada punto primario a cualquier otro punto primario.

2. de cada punto primario a cada punto secundario.

3. De cada punto primario al centroide de cada célula de rejilla del archivode referencia. Esta requiere definir un archivo de referencia.

31



4. De cada punto secundario al centroide de cada célula de rejilla del

archivo de referencia. Esta requiere definir un archivo de referencia.

CrimeStat puede calcular las distancias entre los puntos de un solo archi-vo o las distancias entre los puntos de dos archivos diferentes. Estas matricespueden ser útiles para examinar la frecuencia de diferentes distancias o paraproveer la matriz distancia a otro programa.

Matriz distancia: Dentro de un mismo archivo, punto a punto (Matrix)

Esta rutina da como resultado la matriz distancia entre los puntos del ar-

chivo primario, en unidades de distancia especificas (kilómetros, millas náu-ticas, pies, kilómetros o metros). La Matiz salida puede guardarse como unarchivo distancia de CrimeStat, que puede ser usado para acelerar los cálculosen bruto. La matriz de salida también puede ser guardado como archivo texto.

Matriz distancia: De los puntos del archivo primario a los puntos del ar-chivo secundaria (IMatrix)

Esta rutina muestra la distancia entre cada punto del archivo primario acada uno de los puntos del archivo secundario, con unidad de distancia espe-cificas (kilómetros, millas náuticas, los pies,kilómetros o metros). La salidaIMatrix se puede guardar como un archivo distancia de CrimeStat, que puedeser usado para acelerar los cálculos en bruto. La salida IMatrix también sepueden guardar como archivo texto.

Matriz distancia: De los puntos del archivo primarios a la rejilla (PGMa-trix)

Esta rutina muestra la distancia entre cada punto del archivo principal alcentroide de cada celda de rejilla o cuadrícula del archivo referencia. El archi-vo de referencia debe proporcionarse como externo o definirse en la ventana

correspondiente al archivo referencia en CrimeStat. Las unidades de distan-cia debe ser e especificadas (kilómetros, millas náuticas, pies, kilómetros ometros). La salida puede guardarse como un archivo distancia de CrimeStat;puede ser usado para acelerar el cálculo en bruto. La salida también se pue-den guardar como un archivo texto.

32



Matriz distancia: De los puntos del archivo secundarios a la rejilla (SG-

Matrix)

Esta rutina muestra la distancia entre cada punto del archivo secundariaal centroide de cada celda de la cuadrícula del archivo referencia. El archi-vo de referencia debe proporcionarse como externo o definirse en la ventanacorrespondiente al archivo referencia en CrimeStat. Igualmente las unidadesde distancia deben ser especificadas (kilómetros, millas náuticas, pies, kiló-metros o metros). La salida también se pueden guardar como un archivotexto.

Análisis de puntos o zonas calientes I (Hot Spot)

El análisis de puntos o zonas calientes (Hot Spot o clusters) identifica losgrupos con incidentes semejantes. Este es un método de análisis de segundoorden que identifica el grupo a que pertenecen los puntos. Hay una serie derutinas diferentes para analizar zonas calientes en CrimeStat, organizadas endos pestañas diferentes: Análisis de zonas calientes I (Hot Spot I) y Análisisde zonas calientes II (Hot Spot análisis II)

Análisis de zonas calientes I (Hot Spot I)

El análisis de zonas calientes I incluye cuatro rutinas diferentes:

1. El modo (modo).

2. El modo difuso (Fmode).

3. Cluster jerárquica del vecino más cercano (Nnd).

4. Ajuste del riesgo del cluster jerárquica del vecino más cercano (Rnnh),

El Modo

La rutina del Modo (Mode) calcula la frecuencia de incidentes para cadalocalización, definida por las coordenadas X e Y. La salida será una lista delas localizaciones con sus coordenadas X e Y, y el número de incidentes ocu-rridos en cada una de ellas, clasificadas en orden decreciente, de la frecuenciamas alta a la frecuencia mas baja. También enlista su orden de rango de 1

33



hasta la última localización. La data puede salir como un archivo ’dbf’.

Modo Fuzzy

El modo difuso (Fuzzy Mode) calcula la frecuencia de incidentes para ca-da localización dentro de la distancia especificada por el usuario. El usuariodebe especificar el radio de búsqueda y las unidades del mismo (kilómetros,millas náuticas, pies, kilómetros, metros). La rutina identifica la unicidad decada localización, definida por sus coordenadas X e Y, y calcular el númerode incidentes que caen dentro del radio de búsqueda. La salida es una listade las localizaciones con sus coordenadas X e Y, y el número de incidentes

ocurridos a dentro de cada radio de búsqueda, además las clasifica en ordendecreciente desde le más frecuente a menos frecuente. Asimismo, enlista surango ordenado de 1 a la última localización. Los resultados pueden salircomo un archivo ’.dbf’.

Cluster jerárquico espacial del vecino más cercanos (Nnh)

El clustering jerárquico espacial del vecino más cercanos (neighbor hierar-chical spatial clustering) es una rutina que usa una distancia constante paraformar los clusters de puntos, basado en la proximidad espacial. El usuariodebe definir la distancia y el número mínimo de puntos que se requieren paracada grupo, y una salida para mostrar el tamaño de los grupos con elipses.La rutina identifica las agrupaciones de primer orden, que representan gru-pos de puntos que están mas cerca, y en el que hay por lo menos el númeromínimo de puntos especificados por el usuario. El clustering es jerárquica ensentido de que las agrupaciones de primer orden son tratados como puntosseparados, para ser agrupados en un segundo orden de clusters, y el segundoorden de agrupaciones son tratadas igualmente como puntos separados, quese agrupan en un tercer orden de clusters, y así sucesivamente. Los clustersde orden superior serán identificados sólo si la distancia entre sus centros estamás cerca que la nueva de distancia.

Los resultados tabulares pueden imprimirse, salvarse como archivo texto,o como archivo dbf. Además, los resultados pueden salir como objetos gráfi-cos tipo elipses o cápsulas convexas (o ambos) para ArcView ‘.shp’, MapInfo‘.mif’ o Atlas*GIS ‘.bna’. Debe seleccionar los nombres por separado paralos archivos de elipse y casco convexo.

34



Esta rutina ofrece seis resultados para cada clusters que se calcula:

1. El orden jerárquico y el número de clusters.

2. La media central del clusters (media X, media Y).

3. El elipse de desviación estándar del cluster (la rotación y longitud delos ejes X e Y).

4. El número de puntos en el cluster.

5. El área del cluster.

6. La densidad del cluster (puntos divididos por área).

Distancia umbral del Nnh

La distancia umbral es el radio de búsqueda alrededor de un par de pun-tos. Para cada par de puntos, la rutina determina si ellos están más cercanosque el radio de búsqueda. Hay dos formas para determinar el radio de bús-queda o distancia (Nnh threshold distance):

La distancia aleatoria del vecino más cercana

En primer lugar, la distancia de búsqueda es elegida al azar de la dis-tancia del vecinos más cercano. Por defecto el valor es igual a 0,1 (es decir,menos del 10% de los pares se puede esperar que se encuentren más cerca porcasualidad). Los Pares de puntos que están más cerca que la distancia umbralse agrupan, mientras que los pares de puntos que están a mayor distanciaque la distancia umbral se ignoran. Cuanto menor sea el nivel de significaciónque se ha seleccionado, menor es el umbral de la distancia y, por lo general, elmenor es número de pares que serán seleccionados. Por otra parte, la elecciónde un nivel mayor de significación, más grande es distancia umbral y, por lo

general, más parejas de puntos serán seleccionados. Sin embargo, cuanto másalto es el nivel de significación elegido, mayor será la probabilidad de que losclusters sean agrupados al azar.

La barra deslizante se utiliza para ajustar el nivel de significación. Mo-viendo la barra deslizante hacia la izquierda se elige una distancia umbral

35



menor, y hacia la derecha para elegir una distancia umbral mayor.

Distancia fija

En segundo lugar, se puede usar una distancia fija. Por defecto es de unamilla. En este caso, el radio de búsqueda utiliza la distancia fija y la barradeslizante es inoperante.

Número mínimo de puntos Nnh

Esta pestaña permite al usuario especificar el número mínimo de puntos

para cada grupo. El valor por defecto es 10 puntos. Las restricciones sobre elnúmero de clusters puede ser colocado mediante la definición de un númeromínimo de puntos que son requeridos. Si hay muy pocos puntos permitidos,entonces habrá muchos grupos pequeños, y al aumentar el número de puntosrequeridos, el número de clusters se reduce.

Salida de Elipse

Los resultados pueden salir como objetos gráficos en forma de elipse, enformato de archivos para ArcView ‘.Shp’, MapInfo ‘.mif’ o Atlas*GIS ‘.bna´.El prefijo será ’NNH1’ para la elipse de primer orden, ’NNH2’ para las elipsesde segundo orden elipses, y "NNH3 ’para la elipse tercer orden. Para elipsesde orden mayor incluirán sólo el número índice.

El tamaño de elipse Nnh

El tamaño del cluster puede ser ajustado con la barra deslizante en la par-te inferior de la ventana, especificando el número de desviaciones estándar delelipse: una desviación estándard (1X), desviación estándar y media (1.5xy), odos desviaciones estándar (2X). Por defecto el valor es igual a una desviaciónestándar. Generalmente, una desviación estándar cubrirá más de la mitad

de los casos, mientras que dos desviaciones estándar cubrirá más del 99%de los casos, aunque el porcentaje exacto dependerá de la distribución. Paraseleccionar el número de desviaciones estándar para las elipses, use la barradeslizadora. Los archivo de salida se guarda como NND<número><root na-me>; el número es el orden del clustering (es decir, 1, 2), el nombre debe serproporcionado por el usuario.

36



Las restricciones sobre el número de clusters puede ser definidos por elnúmero de puntos requeridos. El valor por defecto es 10. Si se elige un númeromuy pequeño de puntos, entonces habrá muchos grupos pequeños; si embar-go, al aumentar el número de puntos por requeridos, el número de clustersse reducirá.

Salida de cluster como capsula convexa

También los clusters pueden mostrarse como objeto grafico en forma decapsula convexa en archivos para ArcView ‘.Shp´, MapInfo ‘.mif´ o Atlas*GIS

‘.bna´. El nombre del archivo de salida debe especificarse, este saldrá con unprefijo ’CNNH1’ para el primer orden de agrupación, un ‘CNNH2´ para elsegundo orden, ‘CNNH3’ para la agrupación de tercer orden. Para clusters demayor orden sólo incluirán el número índice. Debe especificarse un nombrepara el archivo.

Ejecutando la simulación Nnh

Mediante una simulación de Monte Carlo se puede estimar una aproxi-mación por intervalo de confianza alrededor del clusters de primer orden deNnh; para el cluster de segundo orden y los orden superior no son simuladas,ya que su estructura depende del cluster de primer orden. El usuario debeespecifica el número de corridas para simulación y Cluster Nnh es calculadopara datos asignados en forma aleatoriamente. La salida aleatoria es ordena-da y se calculan los percentiles. La salida incluye los clusters de primer orden,el área, el número de puntos, y la densidad. Doce percentiles son identificadospara estas estadísticas:

1. El Mínimo para las simulaciones espacialmente aleatorias

2. El máximo para las simulaciones espacialmente aleatorias

3. El percentil 0.5 para las simulaciones espacialmente aleatorias

4. El percentil 1 para las simulaciones espacialmente aleatorias

5. El percentil 2.5 para las simulaciones espacialmente aleatorias


37






10. El percentil 97,5 para las simulaciones espacialmente aleatorias


12. El percentil 99,5 para las simulaciones espacialmente aleatorias

Estos percentiles permiten una prueba de significancia de una cola o dos

colas. Por ejemplo, para un 5 % la prueba de una cola utiliza el percentil 95,mientras que para el 5 % una prueba de dos colas utiliza los percentiles 2.5y 97.5. La data simulada utilizada pueden ser vista marcando en ventanaOpciones, la casilla ’Dump simulation data’.

Ajuste del Riesgo de clusters espacial jerárquico del vecino más cercano(Rnnh)

El ajuste del Riesgo del clusters espacial jerárquico del vecino más cer-cano (Rnnh) es una rutina que agrupas los puntos muy cercanos basandose

en la proximidad espacial, pero la agrupación es ajusta de acuerdo a la dis-tribución de una variable de referencia. La rutina requiere los dos archivosprimario y secundario,(por ejemplo, robos a mano y el segundo archivo,lapoblación). En el segundo archivo en caso de usar la variable intensidad opeso debe ser especificada.

El usuario selecciona una probabilidad umbral para agrupar al azar, unpar de puntos muy cercanos, el mínimo número de puntos que se requierenpara cada grupo, y el tamaño de salida para mostrar los clusters con elipses.Además, un modelo de densidad de kernel para la variable secundaria de-

be ser especificado. La distancia umbral es determinada por la probabilidadumbral, y la densidad de celda en la grilla es producida por la estimaciónde densidad del núcleo de la variable secundaria. Así, en zonas o áreas conalta densidad de la variable secundaria, la distancia umbral es menor que enáreas con baja densidad en la variable secundaria.

38



La rutina identifica clusters de primer orden, que representa grupos de

puntos que están muy cercanos con la distancia umbral y en el que se encuen-tra por lo menos el mínimo número de puntos especificados por el usuario. Elclustering es jerárquica en sentido en que las agrupaciones de primer ordenson tratados como puntos separados, para ser agrupados en un segundo or-den de clusters, y el segundo orden de agrupaciones son tratadas igualmentecomo puntos separados, que se agrupan en un tercer orden de clusters, y asísucesivamente. El clusters de orden superior es identificado sólo si la distan-cia entre sus centros es menor que la nueva distancia umbral.

Los resultados se pueden imprimir, salvar como archivo texto, o como un

archivo .dbf. Los resultados gráficos como elipses o cascos convexo (o ambos)pueden salir como archivos para ArcView .shp, MapInfo .mif o Atlas*GIS.bna. Los archivos de salida tanto para elipse como para casco convexo de-ben tener nombres diferentes.

La rutina muestra seis resultados para cada cluster que calcula:

1. El orden jerárquico y el número de agrupación.

2. La media central del clusters (media X y media Y).

3. El elipse de desviación estándar del cluster (la rotación y longitud delos ejes X e Y).


5. El área del cluster

6. La densidad del cluster (puntos dividido por área).

Distancia umbral Nnh

La distancia umbral es el intervalo de confianza alrededor de la distancia

esperada (aleatoria) para un par de puntos. Sin embargo, a diferencia de larutina Nnh dónde la distancia umbral es constante a lo largo del área en estu-dio, en rutina Rnnh la distancia umbral se ajusta inversamente proporcionala la distribución de la secunda variable. En las zonas con una alta densidaden la variable secundaria, la distancia umbral será pequeña, mientras que enáreas con baja densidad en la variable secundaria, la distancia umbral será

39



mayor. El probabilidad umbral por defecto es de 0,1 (es decir, menos del

10% de los pares que se espera se encuentren muy cerca bajo). Los Paresde puntos que están más cerca que la distancia umbral se agrupan, mientrasque los pares de puntos que están a mayor distancia que la distancia umbralse ignoran. Cuanto menor sea el nivel de significación que se ha seleccionado,menor será la distancia umbral y, por lo general, menor número de paresserán seleccionados. Por otra parte, la elección de un nivel mayor de signi-ficación, mayor será la distancia umbral y, por en general, más pares seránseleccionados. Sin embargo, cuanto más alto sea el nivel significación elegido,mayor sera la probabilidad que los clusters sean agrupaciones alzar.

La barra deslizante se utiliza para ajustar el nivel de significación. Paraelegir una menor distancia umbral mueva la barra deslizante hacia la izquier-da y hacia la derecho para escoger una mayor distancia umbral.

Parámetros de riesgo Rnnh

Una estimación de densidad de la variable secundaria debe ser calculadapara ajustar la distancia de umbral de la variable primaria. Esto se hace através de la estimación de densidad del kernel. En la pestaña parámetros deriesgo (risk parameters) se define este modelo. La segunda variable automá-ticamente se asume que debe ser la variable riesgo variable . Si se debe usarla variable ponderada o intensidad en el archivo secundario, esta debe se-leccionarse. El usuario debe especificar el método de interpolation de kernel(normal, uniforme, quartic, triangular o exponencial negativo), y seleccionarel ancho de banda (intervalo fijo o adaptable). Si el intervalo de adapta-ción es utilizado, el tamaño muestra mínimo para el ancho de banda (radiode búsqueda) debe ser especificado. Si se usa un intervalo fijo, el tamañodel intervalo (radio) debe ser especificado junto con las unidades de medida(kilómetros, millas náuticas, pies, kilómetros, metros). Por último, las unida-des de la densidad para la salida debe ser especificado (millas al cuadrado,cuadrado millas náuticas, pies cuadrados, kilómetro cuadrado, metros cua-

drados).

La rutina superpone una rejilla de 50 x 50 grillas en el área de estudio ycalcula una estimación de densidad de kernel de la variable secundaria. Ladensidad es entonces re-escalada para igualar el tamaño de muestra de la va-riable primaria. Para cada celda, una distancia umbral específica es calculada

40



para agrupar en pares de puntos al azar. La probabilidad umbral seleccionada

por el usuario se aplica a esta distancia umbral específica de cada celda paraproducir una distancia umbral que corresponde al intervalo de confianza. Lospares de puntos que están más cercanos que la distancia umbral específicade cada celda son seleccionados para el cluster de primer orden.

Número mínimo de puntos Rnnh

La casilla mínimo de puntos por clusters (minimum points for clusters)permite al usuario especificar un número mínimo de puntos para cada grupo.El valor por defecto es 10 puntos. El tamaño de salida para los clusters puede

ser ajustado por la segunda barra deslizante, mediante número de desviacio-nes estándar definidas para los elipse; de una desviación estándar (el valorpredeterminado) a tres desviaciones estándar. Generalmente, una desviaciónestándar cubre aproximadamente el 65 % de los casos, mientras tres desvia-ciones estándar cubrirá más del 99 % de los casos.

Salida como Elipse

Los resultados se pueden salir como objeto gráfico tipo elipse como ar-chivos para ArcView .Shp, MapInfo .mif o Atlas*GIS .bna. El prefijo seráRNNH1 para la elipse de primer orden, RNNH2 para la elipses de segundoorden, y RNNH3 para la elipse de tercer orden. Para elipse de orden superiorsólo cambia el número índice.

Tamaño de salida de elipse para Rnnh

La salida del tamaño del cluster se puede ajustar en la parte inferiorde la ventana con la barra deslizante. Con la barra deslizadora (number of standard deviations for the ellipses) se especifica el número de desviacionesestándar del elipse que se calcula para cada cluster: una desviación estándar,una desviaciones estándar y media (1.5xy), o dos desviaciones estándar (2X).

Por defecto es una desviación estándar. Generalmente, una desviación están-dar servirán para cubrir los más de la mitad de los casos, mientras que dosdesviaciones estándar se cubrirá más del 99% de los casos, aunque el por-centaje exacto dependerá de la distribución. El archivo de salida se guardacomo Rnnh <número><root name>. El número es el orden del cluster (esdecir, 1, 2), mientras que el nombre raíz es proporcionado por el usuario.

41



La restricciones sobre el número de clusters puede ser colocado mediantela definición del número mínimo de puntos necesarios. Por defecto el valor es10. Si se permiten muy pocos puntos, entonces habrá muchos grupos peque-ños, y al aumentar el número de puntos necesarios, el número de clusters sereducirá.

Cluster de salida como capsula convexo

Los cluster también pueden salir como objeto gráfico tipo cápsula con-vexa en archivos para ArcView .Shp, MapInfo .mif o Atlas*GIS .bna. Debe

especificarse el nombre del archivo, este sale con un prefijo CRNNH1, parael cluster de primer orden, con CRNNH2 para el cluster de segundo orden, yCRNNH3 para el cluster de tercer orden; y para clusters de orden superiorsólo se cambia el número índice.

Ejecutar una simulación Rnnh

Una simulación de Monte Carlo puede ser ejecutar para obtener una es-timación del confianza intervalos de alrededor del cluster de primer orden;para el cluster de segundo orden y de orden superior no se puede simularse,ya que su estructura depende del cluster de primer orden. El usuario especi-fica el número de simulaciones a ejecutar y el cluster Rnnh es calculado paradatos asignados al azar. La salida aleatoria es ordenada y los percentiles soncalculaddos. La salida incluye el número de cluster de primer orden, el área,el número de puntos, y la densidad.

Doce percentiles se identifican para estas estadísticas:

1. El mínimo para la simulación Rnnh

2. El máximo para la simulación Rnnh

3. El percentil 0,5 para la simulación Rnnh4. El percentil 1 para la simulación Rnnh

5. El percentil 2,5 para la simulación Rnnh

6. El percentil 5 para la simulación Rnnh

42





9. El percentil 95 ppara la simulación Rnnh

10. El 97,5 percentil para la simulación Rnnh


12. El 99,5 percentil para la simulación Rnnh

La data simulada que se usa se puede ver marcando la casilla Salida de

la Data simulada ’Dump Simulation Data’ en la ventana Optiones.

Análisis de puntos o zonas calientes II (Hot Spot II)

La pestaña Análisis puntos calientes II (Hot Spot Analysis II) incluye tresrutinas diferentes:

1. Análisis espacio temporal del Crimen (STAC)

2. Cluster de K-Medias

3. Estadístico local de Moran como el de Anselin.

Análisis espacio temporal del Crimen (STAC)

El análisis espacio y tiempo del Crimen (Spatial and Temporal Analysis of Crime) es una rutina de cluster de distancia-variable. Inicialmente los gruposde puntos cercanos son agrupados sobre la base de un radio de búsquedaconstante, pero luego se combina grupos que se superponen. En la pestaña"STAC Parameters", se define un radio de búsqueda, el número mínimo depuntos que se requieren para cada grupo, y el tamaño de los clusters paramostrar con elipses. Los resultados pueden ser impresos, guardado en archivode texto, como un archivo .dbf, o como objeto gráfico tipo elipses o capsulaconvexa en formato de archivo para Review .Shp, MapInfo .mif o Atlas*GIS.bna.

La rutina de seis productos los resultados de cada grupo se calcula que:

1. El orden jerárquico y el número de cluster.

43



2. La media central del grupo (media de X y Media de Y).

3. La deviational estándard de elipse del cluster (la rotación y la longitudde las X e Y ejes).


5. El área de la elipse.

6. La densidad de la elipse (puntos en elipse dividido por área).

Parámetros STAC

La pestaña parámetros de STAC (STAC parameters) permite seleccionarun radio de búsqueda, el número mínimo de puntos por clusters, el tipo debúsqueda, definición de la frontera, el número simulaciones ha ejecutar, y eltamaño de elipses de STAC.

Radio de búsqueda de STAC

El radio de búsqueda es la distancia dentro de la rutina de búsquedas deSTAC. El valor por defecto es de 0,5 millas. Una rejilla de 20x20 cubre elárea de estudio. En cada intersección entre fila y columna, la rutina cuentatodos los puntos que se encuentra a menor distancia que el radio de búsque-da. La superposición de círculos se combinan para formar cluster de tamañovariables. En Cuanto más pequeño sea radio de búsqueda seleccionado, me-nos puntos por clusters serán seleccionados. Por otra parte, la elección deun radio mayor de búsqueda, más puntos serán seleccionados. Sin embargo,cuanto mayor sea el radio de búsqueda, mayor será la probabilidad de quelos cluster puedan ser agrupados al azar. En la pestaña parámetros de STAC(STAC Parameters), introduzca el radio de búsqueda en la casilla e indiquelas unidades de medida (millas, millas, pies, kilómetros, metros).

Tipo de busqueda del STAC

El tipo de busqueda (scan type) es un tipo de rejilla que cubre el área enestudio. Hay dos opciones: rectangular (por defecto) y triangular.

Límite de área en STAC

44



Los límites del área de estudio pueden ser definidas a partir del conjunto

de datos o de la red de referencia.

El número mínimo de puntos en STAC

El usuario debe especificar el número mínimo de puntos necesarios paracada cluster (minimum points for clusters). Por defecto son 5 puntos. Si seelige muy pocos puntos, habrá muchos clusters pequeños; sin embargo, au-mentar el número de puntos requeridos, el número de clusters se reducirá. Enla pestaña STAC Parámetros, escriba el número mínimo de puntos requeri-dos para cada cluster.

Tamaño de salida de elipses para el STAC

El tamaño de salida del cluster como elipse puede ser ajustado por labarra deslizante. La rutina de salida del elipses puede ser una desviación es-tándar (1X), desviación estándar y media (1.5X), y dos deviational estándar(2X). Generalmente, si los datos tienen distribucion normal, una desviaciónestándar cubrirá aproximadamente el 50% de los casos, mientras que dosdesviaciones estándar cubrirá más de un 99 % de los casos, sin embargo, elporcentaje real puede diferin.

En la parte inferior de la ventana STAC Parámetros, deslice la barra paraseleccionar el número de desviaciones estándar del elipse. El archivo de salidaes guardado como ST<nombre raíz>. El nombre raíz debe ser proporcionadopor el usuario.

Salida de cluster como Convexo casco

Los cluster también pueden salir como objetos gráficos tipo cápsulas con-vexas en formato de archivo para ArcView .shp, MapInfo .mif o Atlas*GIS.bna. Debe especificar un nombre para el archivo, que saldrá con un prefijo

CST.

Ejecutar una simulación STAC

Una simulación de Monte Carlo se puede correr para estimar un intervalode confianza alrededor del cluster del STAC. El usuario especifica el número

45



de simulaciones ha ejecutar y el clustering del STAC es calculado para datos

asignados al azar. La salida es ordenada y los percentiles son calculados. Elresultado incluye el número de clusters, el área, el número de puntos, y ladensidad. Doce estadísticos muestra esta rutina:

1. El mínimo de simulaciones.(The minimum for the spatially random simulations)

2. El máximo de simulaciones.

3. El percentil 0.5 para la simulación.

4. El percentil 1 para la simulación.5. El percentil 2.5 para la simulación.

6. El percentil 5 para la simulación.







Los diez estadísticos permiten una prueba de una o dos colas. Por ejem-plo, para un 5 % una prueba de una cola usa el percentil 95, mientras el 5 %que para una prueba de dos cola, usa los percentiles 2.5 y 97.5. Los datos si-mulados que se usan pueden ser vistos en la ventana Opciones seleccionandola casilla ’Dump simulation data’.

Clusters de K-means (KMeans)

La rutina clusters de K-means es un procedimiento para agrupar los pun-tos en K grupos, donde K es un número asignado por el usuario. La rutinaencuentra K lugares, en los que asignan los puntos al lugar más cercano. Pordefecto el valor es igual a 5. Si K es pequeño, los grupos se suelen cubrir

46



areas muy grandes.

El los resultados tabutares pueden ser impresos, guardados en un archivode texto, o salir como archivo dbf. Los resultados gráficos puede salir comoelipses o casuplas convexas (o ambos) en formatos de archivos para ArcView.Shp, MapInfo .mif, Atlas*GIS bna. Los nombres para la elipse y la capsulaconvexa deben ser proporcionados por el usuario, de manera separada.

Localizaciones de clusters inicial

La rutina comienza con un supuesto inicial (la semilla) para los K lugares,

y luego lleva a cabo la optimización local. El usuario puede modificar laubicación de los clusters iniciales de dos maneras:

1. La separación entre los clusters iniciales pueden disminución o incre-mentarse. Hay una escala de separación con valores predefinidos de 1a 10; por defecto el valor es 4; sin embargo, el usuario puede seleccio-nar cualquier número; no obstante, al aumentar el número, aumentala separación entre las posiciones de los cluster iniciales, mientras quedisminuyendo el número, disminuye la separación.

2. El usuario también puede definir las localizaciones iniciales y el número

k de clusters, con el archivo de secundario. La rutina toma el númerode puntos del archivo secundario y las coordenadas X/Y de los puntoscomo las posiciones iniciales de los k clusters iniciales.

Tamaño de salida de los clusters de K-means como elipses

Para ambos métodos, el tamaño de salida del cluster como elipses puedeser ajustado por la barra deslizante. El resultado de la rutina puede salir comoelipses con una desviación estándar (1X), con desviación y media (1.5X), ycon dos deviational estándar (2X). Generalmente, si los datos están distri-

buidos aleatoriamente, una desviación estándar cubrirá aproximadamente el50% de los casos, mientras que dos desviaciones estándar cubrirá del 99%de los casos, sin embargo, los porcentajes reales pueden variar.

Deslice la barra para seleccionar el número de desviaciones estándar de laelipse. El archivo de salida es guardado como KM<root name>. El nombre

47



raíz debe ser proporcionado por el usuario.

Salida de los clusters como casco Convexo

Los clusters también pueden salir como casco convexo en archivo paraArcView shp, MapInfo mif o ATLAs*SIG bna. Debe especifique el nombredel archivo, el cual saldrá con un prefijo CKM.

Estadístico Local de Anselin

El estadístico local de Moran Anselin (Anselin’s local Moran) aplica el

estadístico I de Moran a puntos individuales (o zonas), para evaluar si puntos(o zonas) están espacialmente relacionados con puntos cercanos (o zonas veci-nas). El estadístico requiere de una variable intensidad en el archivo principal.A diferencia del estadístico global de Moran I, el estadístico local Moran esaplicado a cada punto en forma individual (o zona). El índice indica cluste-ring o dispersión en relación con la vecindad local. Los puntos (o zonas) convalores altos del índice I, tienen intensidad más alto que sus vecinos, mientrasque los puntos con valores bajos tienen intensidad más abajo que sus vecinos.La salida puede se impresa o salir como archivo .dbf.

Ajuste para pequeñas distancias

Las pequeñas distancias se ajustan de manera que la máxima ponde-ración no sea superior a 1. Esto asegura que el índice local I, no se hagaexcesivamente grande para los puntos muy cercanos. Esta es la configuraciónpredeterminada.

1.2.3. Modelado Espacial III

Crimestat en la ventana modelado espacial presenta cuatro pestañas, de

las cuales dos exponemos: estimación de densidad de kernel y análisis deespacio-tiempo, las demás no se trataran en este trabajo, pero puede obtenerinformación en, si desea investigar puede revisar la la notas (se tratara muyelemental de manera simple, en la calibración y la estimación del viaje a ladelincuencia).

48



Interpolación

La pestaña interpolación (interpolation) permite estimar la densidad depunto usando el método suavizado densidad kernel. Hay dos tipos de suavi-zado de densidad del kernel: el simple, aplicado a una sola distribución de lospuntos; y el dual, aplicado a dos distribuciones diferentes. Cada tipo tienevariaciones sobre el método que se pueden seleccionar. Ambos tipos requie-ren de un archivo de referencia, que es superpuesto sobre la zona de estudio(ver archivo de referencia). Las variables intensidad y ponderación puedenser usadas en la estimación de kernel. Las densidades pueden convertirse enprobabilidades.

La interpolación es una técnica para generalizar localizaciones del inci-dente en todo el área de estudio. Mientras las técnicas de distribución espacialy puntos caliente proporciona los resúmenes estadísticos para los incidentesde los datos en sí mismos, la técnica de la interpolación generalizan esosincidentes de los datos a toda la región. Particularmente, proporcionan lasestimaciones de densidad para todas las zonas de la región (es decir, en cual-quier localización).

La estimación de la densidad es una variable de la intensidad, un valorZ(·), que se estima una localización particular. Por lo tanto, puede ser visua-lizada en los mapas de la superficie o en mapas de contorno que demuestranla intensidad en todos los lugares o localizaciones.

Estimación de densidad de kernel simple (KernelDensity)

La rutina densidad de kernel simple (kernel density estimates single) es-tima la densidad de punto para una distribución simple, colocando una su-perficie simétrica sobre cada punto (superposición), evaluando la distanciadel punto a cada celda de referencia por la función kernel, y sumando lasevaluaciones en cada celda de referencia.

Archivo ha interpolar

La estimación puede aplicarse a cualquier archivo tanto al principal comoal secundario. Debe seleccione el archivo a ser interpolado. Por defecto es elarchivo primario

49



Método de interpolación

Hay cinco tipos de kernels que pueden ser utilizados para estimar la dis-tribución de densidad de los puntos. Cuatro de las cinco distribuciones super-ponen un círculo alrededor de cada celda o cuadrícula y asigna ponderacionesa los puntos dentro de las celdas o cuadrícula. Los cinco tipos varían en lasponderaciones que asignan a los puntos cercanos:

Kernel que asigna ponderaciones a todo el área en estudio

1. El kernel normal superpone una distribución normal en cada punto, queluego se extiende sobre toda el área en estudio definida por el archivode referencia. Esta es la función kernel por defecto. La distribución seextiende en todas direcciones y es limitado únicamente por el área enestudio.

Kernels que asignar ponderaciones en un círculo específico

2. El kernel uniforme asigna igual ponderación a todos los puntos dentrodel círculo.

3. El kernel quartic superpone una superficie en forma de campana inver-

tida que se extiende sólo para una distancia limitada en cada punto;las ponderaciones para los puntos dentro del círculo disminuyen con ladistancia gradualmente (poco a poco).

4. El kernel triangulado (o cónico) superpone un cono en cada celda de lacuadrícula; Los pesos para puntos dentro del círculo disminuyen cons-tantemente con la distancia (coherentemente).

5. El kernel exponencial negativo superpone una función disminuyendodrásticamente sobre cada celda de la cuadrícula; las ponderaciones delos puntos dentro del círculo disminución muy rápidamente con la dis-

tancia.Los cinco métodos producen resultados similares, aunque el kernel normal

es generalmente más suave para cualquier ancho de banda.

Elección del ancho de banda

50



Los kernels son aplicados a una distancia de búsqueda limitada, deno-

minado ancho de banda. Para el kernel normal, el ancho de banda es ladesviación estándar de la distribución normal. Para el kernel uniforme, quar-tic, triangular y exponencial negativo, la amplitud o ancho de banda es elradio de un círculo para la distancia de búsqueda. Para todos los tipos dekernels, un ancho de banda grande produce estimaciones de densidad mássuave. Tanto el ancho de banda adaptable como el fijo pueden ser seleccio-nados.

Ancho de banda Adaptable

La distancia ancho de banda adaptable es identificada por el número mí-nimo de puntos encontrados dentro del círculo dibujado alrededor de un sólopunto. Un círculo es colocado alrededor del punto, a su vez, y el radio seaumenta hasta que se alcanza el tamaño de muestra mínimo; de esta formacada punto tiene un intervalo de ancho de banda diferente.El ancho de banda es la configuración por defecto. El usuario puede modificarel tamaño de muestra mínimo, que por defecto es igual a 100 puntos.

Ancho de banda fijo

La distancia ancho de banda fija es un intervalo fijo para cada uno de lospuntos. El usuario puede definir el intervalo y las unidades distancia en quese calcula (millas, millas, pies, kilómetros, metros).

Unidades de área

Debe especificar las unidades de densidad como puntos por milla cua-drada, por millas náuticas cuadradas, por pies cuadrados, por kilómetroscuadrados, o por metros cuadrados. Las unidades por defecto son puntos pormilla cuadrada.

Uso de una variable intensidadDebe marcarse la variable intensidad, si ha de ser interpolada.

Uso una variable ponderaciónDebe marcarse la variable ponderación, si ha de ser interpolada.

51



Cálculo de densidad de probabilidades o densidad

La densidad estimada para cada celda se puede calcular de tres maneras:

1. Densidad absoluta. Este es el número de puntos por celda de la cuadrí-cula y se escala de tal forma que la suma de todas las celdas sea igualal tamaño de la muestra.

2. Densidad relativa. La densidad absoluta de cada celda en la cuadrículaes dividida por el área de la celda; y la salida se expresa en unidadescuadradas (por ejemplo, puntos por millas cuadradas).

3. Probabilidades. Esta es la proporción de todos los incidentes que ocu-rren en la celda. La suma de todas las cedas es igual a 1, equivale a laprobabilidad.

Debe seleccione el tipo de estimación de la densidad: densidad absoluta,densidad relativa, o probabilidades, la salida es para cada celda. Por defectoes densidad absoluta.

Salida

Si el archivo de referencia es externo o creado por Crimestat, los resul-tados pueden salir como archivo para Surfer for Windows o como archivopara ArcView ’.Shp’, MapInfo .mif, Atlas*Gis ’.bna’; y para ArcView Spa-tial Analyst sólo si el archivo de referencia es creado por CrimeStat.

Estimación de la densidad de kernel dual (DuelKernel)

La rutina de estimación de densidad de kernel dual (Dual kernel densityestimate) compara dos distribuciones diferentes que involucran los archivosprimario y secundario. Así, es necesario definir los archivos primario y secun-dario.

La comparación permite la relación entre el primer archivo dividido porel segundo archivo, el logaritmo de la relación (cociente) entre el primer ar-chivo dividido por el segundo archivo, la diferencia entre el primer archivo ysegundo (es decir, el primer archivo - segundo archivo), o la suma del primer

52



archivo y el segundo.

Archivo ha interpolar

Debe identificarse los archivos que ocupan la categoría de principal y se-cundario en la interpolación. Por defecto el principal es el archivo primarioy secundario es el archivo secundario.

Método de interpolación

Hay cinco tipos de distribuciones de kernels que pueden ser utilizados pa-

ra estimar la densidad de puntos. Cuatro de los cinco superponen un círculoalrededor de cada celda y asigna ponderaciones a los puntos dentro de la cel-da. Los cinco tipos varían en las ponderaciones que asignan puntos cercanos:

Kernel que asigna ponderaciones a todo el área en estudio

1. El kernel normal superpone una distribución normal en cada punto, queluego se extiende sobre toda el área en estudio definida por el archivode referencia. Esta es la función kernel por defecto. La distribución seextiende en todas direcciones y es limitado únicamente por el área enestudio.

Kernels que asignar ponderaciones en un círculo específico

2. El kernel uniforme asigna igual ponderación a todos los puntos dentrodel círculo.

3. El kernel quartic superpone una superficie en forma de campana inver-tida que se extiende sólo para una distancia limitada en cada punto;las ponderaciones para los puntos dentro del círculo disminuyen con ladistancia gradualmente (poco a poco).

4. El kernel triangulado (o cónico) superpone un cono en cada celda de la

cuadrícula; Los pesos para puntos dentro del círculo disminuyen cons-tantemente con la distancia (coherentemente).

5. El kernel exponencial negativo superpone una función disminuyendodrásticamente sobre cada celda de la cuadrícula; las ponderaciones delos puntos dentro del círculo disminución muy rápidamente con la dis-tancia.

53



Los cinco métodos producen resultados similares, aunque el kernel normal

es generalmente más

Elección del ancho de banda

Los kernels son aplicados a una distancia de búsqueda limitada, deno-minado ancho de banda. Para el kernel normal, el ancho de banda es ladesviación estándar de la distribución normal. Para el kernel uniforme, quar-tic, triangular y exponencial negativo, la amplitud o ancho de banda es elradio de un círculo para la distancia de búsqueda. Para todos los tipos dekernels, un ancho de banda grande produce estimaciones de densidad más

suave. Tanto el ancho de banda adaptable como el fijo pueden ser seleccio-nados.

Ancho de banda Adaptable

La distancia ancho de banda adaptable es identificada por el número mí-nimo de puntos encontrados dentro del círculo dibujado alrededor de un sólopunto. Un círculo es colocado alrededor del punto, a su vez, y el radio seaumenta hasta que se alcanza el tamaño de muestra mínimo; de esta formacada punto tiene un intervalo de ancho de banda diferente.El ancho de banda es la configuración por defecto. El usuario puede modificarel tamaño de muestra mínimo, que por defecto es igual a 100 puntos.

Ancho de banda fijo

La distancia ancho de banda fija es un intervalo fijo para cada uno de lospuntos. El usuario puede definir el intervalo y las unidades distancia en quese calcula la misma (millas, millas, pies, kilómetros, metros).

Ancho de banda variable

El ancho de banda variable permite separar intervalos fijos para el pri-mero y el segundo archivo. El usuario debe definir el intervalo y las unidades(millas, millas, pies, kilómetros, metros), para cada uno de los archivos. Pordefecto la unidad es una milla para ambos (primero y segundo archivo).

Para cada uno, el usuario debe definir el intervalo y las unidades de ladistancia por los cuales es calculada (las millas, las millas náuticas, los pies,

54



los kilometers, los metros). Por defecto es una milla para los primeros y se-

gundos archivos.

Unidades de área

Debe especificar las unidades de densidad como puntos por milla cua-drada, por millas cuadriculadas náuticas, por pies cuadrados, por kilómetroscuadrados, o por metros cuadrados. Por defecto es puntos por milla cuadrada.

Uso de la variable intensidad

Los archivos (primario y secundario) se tratan por separado, y se marcarla casilla correspondiente a la variable intensidad, en caso de que esta seutilice en interpolación.

Uso de la variable ponderación

Los archivos (primario y secundario) se tratan por separado, y se marcala casilla correspondiente a la variable ponderación, en caso de que esta seutilice en interpolación.

Cálculo de densidad de probabilidades o densidad

La estimación de densidad para cada celda se puede calcular de seis ma-neras:

1. Rata de densidades. Es el cociente (rata) de la densidad para el primerarchivo dividido por la densidad del segundo archivo.

2. Logaritmo de rata de densidad. Es el logaritmo natural del cociente(rata) de la densidad del primer archivo dividido por la densidad delsegundo archivo.

3. Diferencia en densidad absoluta. Es la diferencia entre la densidad ab-soluta del primer archivo y el segundo, diferencia neta. La densidad decada archivo es escalada de modo que la suma de las celdas iguale eltamaño de la muestra.

4. Diferencia en densidad relativa. Esta es la diferencia entre la densidadrelativa del primer archivo y la densidad relativa del segundo archivo. Es

55



la diferencia relativa neta. La densidad celda de cada archivo es dividen

por el área de celda para producir una medida de densidad relativa enunidades específicas (por ejemplo, puntos por milla cuadrada). A ladensidad relativa del primer archivo se le resta la densidad relativa delsegundo archivo.

5. Suma de densidad absoluta. Es la suma de la densidad absoluta delprimero y el segundo archivo. La densidad de cada archivo es escaladade modo que la suma de las celdas sea igual al tamaño de la muestra.

6. Suma de densidad relativa. Es la suma de la densidad relativa de laprimer archivo y del segundo. Es la suma relativa de la densidad celda

de cada uno de los archivos dividida por el área de cada celda paraproducir una medida de densidad relativa en unidades específicas,(porejemplo, puntos por milla cuadrada). La densidad relativa del segundoarchivo se suma a la densidad relativa del primer archivo.

Debe seleccionar el tipo de estimación de densidad de probabilidad quecalculara la rutina: la rata de densidades (o proporción de densidades), el lo-garitmo de rata de densidad, la diferencia en densidad absoluta, la diferenciade densidad relativa, la suma de densidades absoluta, o la suma de densidadrelativa. Por defecto es la rata de densidad.

Salida

Si el archivo de referencia es externo o creado por Crimestat, los resul-tados pueden salir como archivo para Surfer for Windows o como archivopara ArcView .Shp, MapInfo .mif, Atlas*Gis .bna; y para ArcView SpatialAnalyst sólo si el archivo de referencia es creado por CrimeStat.

Salida

Los resultados pueden salir como archivo para Surfer for Windows (para

ambos un archivo de referencia externo o creado) o como archivo para Arc-View .Shp, MapInfo .mif, Atlas*Gis .bna, or ArcView Spatial Analyst (sólosi el archivo de referencia es creado por CrimeStat).

56



1.2.4. Análisis de espacio tiempo

La pestaña análisis espacio tiempo (space-time analysis) abre una ven-tanea que permite analizar la interacción entre el espacio y tiempo. En estaventana, se muestran cuatro rutinas. En primer lugar, el índice Knox quemuestra relación binomial simple entre los eventos ocurridos en el espacio yen el tiempo. En segundo lugar, el índice Mantel que muestra la correlaciónentre la proximidad en el espacio y la proximidad en el tiempo. En tercerlugar, la media móvil espacio-temporales (spatial-temporal moving average)que calcula la media central para un span temporal. En cuarto lugar, el Aná-lisis de caminos correlacionado (Correlated Walk Analysis ) que diagnosticala secuencia espacial y temporal de los incidentes cometidos por un delin-cuente en serie.

Para cada una de estas rutinas, el tiempo debe ser definido como unnúmero entero o real, y no en formato de fecha; por ejemplo son valores ele-gibles: 3 días, 2.1 semanas, 4.3 meses, o el número de días desde 1 de enerode 1900, (por ejemplo, 37.174); mientras que en formato de fecha no sonelegibles, por ejemplo, 1 de noviembre de 2001 ó 07/30/01. Debe convertirselos formato de fechas en número real. Las unidades de tiempo debe ser cohe-rente en todas las observaciones, (es decir, deben tener una única unidad,como horas, días, semanas, meses o años). Si una de estas condiciones es vio-

la, CrimeStat ejecuta los calcular y da los resultados, pero no serán correctos.

Índice de Knox

El estadístico de Knox es un índice que muestra la relación entre la «cer-canía el tiempo» y «cercanía la distancia». Se comparan los pares de eventosen distancia y tiempo, y luego son representados en una tabla de 2x2. Existentres métodos que definen cercanía en tiempo o distancia:

1. Media. Esto es; eventos que están más cercanos (en tiempo) que el

intervalo de tiempo medio, o que están más cerca (en distancia) que ladistancia media, se definen como «cercano», mientras que los eventosque están más lejos en tiempo, que el intervalo de tiempo medio, oestán más lejos en distancia que la distancia media, se define como «nocercano».

2. Mediana. Esto es; eventos que están más cercanos (en tiempo) que la

57



mediana del intervalo de tiempo, o más cerca (distancia) que la mediana

de la distancia, se definen como «cercano»; mientras que los eventos queestán mas lejos que la mediana del (intervalo) tiempo, o mas lejos quemediana de la distancia se definen como «no cercano».

3. Definida por el usuario. El usuario puede especificar cualquier valorpara distinguir «cercano» y «no cercano», para cualquier tiempo o dis-tancia.

La salida incluye una tabla de 2x2 de la distribución de los pares en cate-goría «cercano» o «no cercano» en tiempo y en distancia. Como se comparanpares de eventos, resulta N ∗ (N − 1)/2 pares en el conjunto de datos, dondeN es el número de eventos. La salida también incluye una tabla con esperanzade la distribución de pares en el supuesto de que eventos en el tiempo y enel espacio son independientes uno de otro. La salida incluye un estadísticoChi-cuadrado. Sin embargo, como las observaciones no son independientes,el p-valor asociado con la prueba Chi-cuadrado no en aplicado en este caso.

Corrida de simulación de Knox

Una simulación de MonteCarlo puede ser ejecutada para estimar aproxi-madamente los niveles de probabilidad del error tipo I, del Índice de Knox.

El usuario debe especificar el número de simulacines ha ejecutar. La dataes asignada al azar y el valor de la chi-cuadrado para el índice de Knox escalculado en cada corrida. La salida aleatoria es ordenada y se calculan lospercentiles. Doce resultados presenta esta rutina:

1. El mínimo de simulaciones espaciales

2. El máximo de simulaciones espaciales

3. El percentil 0.5 para la simulación espacial

4. El percentil 1 para la simulación espacial5. El percentil 2.5 para la simulación espacial

6. El percentil 5 para la simulación espacial


58








Los percentiles permiten una prueba de significancia de una o dos colas.Por ejemplo, para un 5 %, una prueba de una cola usa el percentil 95, mien-tras que para una prueba de dos cola, usa los percentiles 2.5 y 97.5. Los

datos simulados que se usan pueden ser visualizados en la ventana Opcionesmarcando la casilla «Dump simulation data».

Índice de Mantel

El índice de Mantel es la correlación entre la cercanía en tiempo y la cer-canía en distancia a través de pares. Cada par de eventos es comparado porintervalo de tiempo y distancia entre ellos. Si hay una relación positiva en-tre la cercanía en tiempo y la cercanía en espacio (distancia), entonces debehaber una importante correlación positiva entre las dos medidas. Observe,

como se comparan pares de eventos, hay N ∗ (N − 1)/2 pares en el conjuntode datos, donde N es el número de eventos.

Corrida de simulación para Mantel

Una simulación de MonteCarlo puede ser ejecutada para estimar aproxi-madamente los intervalos de confianza alrededor de la correlación de Mantel.El usuario debe especificar el número de simulación ha ejecutar, y usando ladata asignada (al azar) el índice es calculado. La salida aleatoria es ordenada,y los percentiles son calculados. La salida ofrece dose resultados:

1. El mínimo de simulaciones espaciales

2. El máximo de simulaciones espaciales



59











Los percentiles permiten pruebas de significancia de una o dos colas. Porejemplo, para un 5 %, una prueba de una cola usa el percentil 95, mientrasque para una prueba de dos cola, usa los percentiles 2.5 y 97.5. La data si-mulada que se usan pueden ser vistos usando la ventana de Opciones en lacasilla «Dump simulation data».

Promedio móvil de Espacio-tiempo

Esta rutina calcula la media central como un cambio en la secuencia de loseventos. La rutina ordena los incidentes en el orden en que ocurren. El usariodefine un span de incidentes secuencial. Por defecto el span de incidentessecuencial es igual a cinco observaciones. La rutina coloca una ventanaque cubre el span sobre los incidentes y calcula la media central (lacoordenada X de la media, coordenada Y de la media). Entoncesmueve la ventana una observación. Las aproximaciones se hacen alprincipio y al final de la observaciones secuencial. El resultado es unconjunto de medias centrales ordenadas a partir de la primera hasta la últimaobservación. Este estadístico útil para determinar la localización central de

un conjunto de incidentes (tal vez cometido por un delincuente en serie) quese ha desplazado en el tiempo.Esta rutina presenta cuatro de salidas:


2. El número de observaciones que componen el span.

60



3. El número span.

4. Las coordenadas X e Y para cada span de ventana.

Los resultados tabulares salen como un archivo dBase .dbf, MicrosoftAccess .mdb, Ascii .dat o ODBC-compatible. Un resultado gráfico que mues-tra una línea secuencia en archivo para ArcView .shp, para Mapifo .mif oAtlas*gis .bna.

Análisis de caminos correlacionado (CWA)

El Análisis de caminos correlacionados (Correlated Walk Analysis, CWA)analiza la secuencia de movimientos de un delincuente en serie y hace pre-dicciones acerca del tiempo y la localización de un próximo evento. Los mo-vimientos secuenciales son analizados en términos de tres parámetros: dife-rencia de tiempo entre eventos (por ejemplo, el número de días entre doseventos consecutivos); distancia entre eventos (por ejemplo, la distancia en-tre dos eventos consecutivos); y ángulo entre eventos, dirección angular entredos eventos consecutivos medidos en grados (de 0 a 360). Hay tres rutinaspara analizar la secuencia de eventos:

1. Correlograma.

2. Diagnóstico de Regresión.

3. Predicción.

Correlograma de CWA

El correlogram presenta las correlaciones rezagadas entre eventos por di-ferencia de tiempo, distancia, y ángulo (dirección). Los retardos son compa-raciones de secuencias. Un retardo de cero es la secuencia comparada con ellamisma; por definición, la correlación es igual a 1. Un retardo de 1 es la

comparación de la secuencia con la anterior secuencia. Un retardode 2, es la secuencia en comparación con dos secuencias anteriores.Un retardo de 3 es la secuencia en comparación con tres secuenciasanteriores, y así sucesivamente. En total, las comparaciones se hacenhasta siete secuencias anteriores (un retardo de 7).

61



Generalmente, tratando por separado la diferencia de tiempo, distancia

y localización, un retardo con la más alta correlación es el más fuerte. Sinembargo, con cada retardo consecutivo, el tamaño de la muestra disminuyeen uno. Si el tamaño de la muestra es pequeño, una correlación alta asociadocon un retardo alto puede ser poco fiable. Por consiguiente, correlogramaajustado (adjusted correlogram) descuenta las correlaciones por el númerode retrasos.

Diagnóstico de regresión del CWA

El diagnóstico de regresión (regression diagnostics) presenta la regresión

estadística para los diferentes modelos de retados. El retardo debe especifi-carse. Por defecto el retardo es igual a 1 (secuencia de eventos comparadoscon el anterior). Tres modelos de regresión pueden ser ejecutados para ladiferencia de tiempo, dirección y ángulo. La salida muestra los siguientesestadísticos:


2. Las unidades de distancia y tiempo.

3. El retardo del modelo (de 1 a 7).

4. El R multiple (correlación) entre los retardos.

5. El R cuadrado multiple (es decir, R-cuadrado).

6. El error estándar de estimación para la regresión.

7. El coeficiente, el error estándar, el t-valor, el valor del probabilidadpara la constante (dos colas).

8. El coeficiente, el error estándar, el t-valor, el valor del probabilidadpara la para el coeficiente (dos colas).

9. El análisis de varianza para el modelo de regresión, incluyendo la sumade los cuadrados y la media cuadrática de error para el modelo deregresión y el residual (error), el valor del F-test de regresión de errormedia cuadrática de dividido por el residual cuadrado del error medio,y el nivel de probabilidad para la F-test.

62



En general, el modelo con el menor error estándar de estimación es el

mejor, y por consiguiente, con mayor índice de correlación multiple R. Sinembargo, con un tamaño de muestra pequeño, el modelo puede ser pocofiables. Además, con cada retardo consecutivo, el tamaño de la muestra dis-minuye en uno; si el tamaño de la muestra es pequeño, un R múltiple altoasociado con un retardo alto de comparación puede ser poco fiable.

Predicción del CWA

La rutina de predicción (prediction) permite predecir un próximo eventoen tiempo, distancia y dirección. Para cada parámetro (diferencia de tiempo,

distancia, y ángulo) hay tres modelos que pueden ser usados:

1. La diferencia de media (es decir, diferencia en tiempo medio, en dis-tancia media y en ángulo medio)

2. La diferencia de medianas (es decir, diferencia en medianas de tiempo,en distancias medianas y ángulo mediano)

3. El modelo de regresión (es decir, el coeficiente de regresión estimado eintercepto)

Cada uno de ellos puede utilizar retardos de 1 a 7 para comparar. Se debedefinir el retardo de la secuencia para el cual se hace la predicción. Así, paraun retardo de 1, el intervalo del penúltimo al último evento se utiliza comoreferencia (es decir, entre el evento N-1 y N); para un retardo de 2, el interva-lo del antepenúltimo al penúltimo evento se utiliza como referencia (es decir,entre los eventos N -2 y N-1), y así sucesivamente. Nota: Si el modelo de re-gresión es utilizado, el retardo para la distancia y el ángulo debe ser el mismo.

Ejemplo 1: con un retardo de 1 y usando la diferencia de medias, la dife-rencia de tiempo medio se añadirá al tiempo del último evento, la distanciamedia se agrega a la localización del último evento, y el ángulo medio seañade a la localización del último evento.

Ejemplo 2: con un retardo de 2 y el uso del modelo de regresión, la dife-rencia del tiempo de predicción es añadida al tiempo del penúltimo evento,la predicción de la distancia se añade la localización del penúltimo evento y

63



predicción angular se añade a la localización último evento.

Ejemplo 3: con un retardo de 1 para el tiempo y el uso del modelo deregresión, con un retardo de 2 para la distancia y el uso de la distancia me-dia, y con un retardo de 3 para el ángulo y el uso de la mediana angular, ladiferencia del tiempo de predicción es añadida al ultimo evento, la distanciamedia es agregada al penúltimo evento, y la mediana angular es añadida ala localización del antepenúltimo evento.

La salida incluye:

1. El método utilizado para el tiempo, distancia, y ángulo2. El retardo usado para el tiempo, distancia, y ángulo

3. La predicción de la diferencia de tiempo.

4. La predicción de la distancia.

5. La predicción ángular.

6. La predicción del tiempo final.

7. La predicción de la coordenada X de la ubicación final.

8. La predicción de la coordenada Y de la ubicación final.

1.2.5. Opciones

En esta ventana de opciones, CrimeStat permite salvar parámetros, cam-biar los colores de las pestañas en las cuatro secciones, y ver la data simuladapor la rutina de Monte Carlo.

Salvando Parámetros

Todos los parámetros de entrada pueden ser salvados. En la ventana Op-ciones, hay un botón para Salvar parámetros (Save parameters). Los archi-vos de parámetros salen con la extensión ’param’. Un archivo de parámetrossalvado puede ser recargado con el botón parámetros de Carga (Load para-meters).

64



Colores

Los colores de cada las cuatro pestañas o secciones de CrimeStat pue-den ser cambiados seleccionando la pestaña correspondiente y escogiendo uncolor del espectro.

Salida de la Data simulada

Cuando se corre una simulación de Monte Carlo con la rutina de Ri-pleys K, Cluster Jerárquico del vecino más cercano, Cluster Jerárquico delvecino más cercano de ajuste de riesgo, el STAC, Mantel o Knox, la da-

ta pueden salida como archivo .dbf. Cada corrida de simulación sale con elnombre de Sim_data<I>.dbf, donde <I>es el número de corridas, por ejem-plo, Sim_data4.dbf.

VI Intercambio dinámico de datos (DDE)

CrimeStat apoya el Intercambio de datos Dinámico (DDE). Ver en Apén-dice A, en documentación, o en ayuda online para mayor formación.

65

Manual Rapido de CrimeStrat

Documents

Transcript of Manual Rapido de CrimeStrat