Comparación de modelos de distribución de especies

6
UNA COMPARACIÓN DE DOS ENFOQUES DE MODELACIÓN DE NICHO ECOLÓGICO: MÁXIMA ENTROPÍA (MAXENT) Y PESOS DE EVIDENCIA (DINAMICA EGO) Jean-François MAS 1 , Michelle FARFAN 1 , Carolina GUILEN-LIMA 2 , Thiago CARVALHO-LIMA 2 y Britaldo SOARES-FILHO 2 1 Centro de Investigaciones en Geografía Ambiental, Universidad Nacional Autónoma de México, Antigua Carretera a Pátzcuaro 8701, Col. Ex-Hacienda de San José de La Huerta C.P. 58190 Morelia Michoacán México, email: [email protected] 2 Centro de Sensoriamento Remoto, Universidade Federal de Minas Gerais, Av. Antônio Carlos 6627, Belo Horizonte, MG 31270-901, Brasil RESUMEN Los modelos de nicho ecológico y/o de distribución geográfica de las especies, se han convertido en una herramienta importante en estudios ecológicos y geográficos. Su elaboración ha estado dominada por programas como GARP y MaxEnt. Ambos se sustentan en un enfoque basado en los datos, donde es difícil integrar el conocimiento experto de la especie. El objetivo del presente estudio es comparar el método de los pesos de evidencia, un enfoque abierto implementado en el programa Dinamica EGO, con MaxEnt para modelar la distribución potencial de Bradypus variegatus. Para MaxEnt se siguió el método propuesto por Phillips et al. (2006) y en Dinamica EGO se optó por un enfoque automatizado basado sólo en los datos. En este, se calculan estadísticamente los pesos de evidencia y el mapa de probabilidad de presencia sin integración de conocimiento experto. Los modelos se evaluaron mediante análisis ROC y el cálculo de la tasa de omisión. Los resultados indican que aunque MaxEnt permite una mejor coincidencia con las altas probabilidades de presencia que los pesos de evidencia, los mapas umbralizados de presencia/ausencia poseen una fiabilidad similar. Una ventaja de Dinamica EGO, aun no evaluada, es la posibilidad de integrar conocimiento experto durante el proceso de modelación. Palabras clave: Modelación de nicho, MaxEnt, Dinamica EGO, pesos de evidencia, análisis ROC. 1 INTRODUCCIÓN La modelación de nicho ecológico permite elaborar mapas de distribución potencial y/o de distribución geográfica de las especies. En términos generales se emplean registros georeferenciados de ocurrencia y mapas digitales de los factores ambientales (clima y topografía) que condicionan la presencia de la especie. Con estos insumos se construye una representación del nicho ecológico que se puede definir como un hipervolumen de n dimensiones, donde cada una corresponde a uno de los factores ambientales. La caracterización de este nicho, permite expresar espacialmente la probabilidad de encontrar la especie. Con base en estos mapas de probabilidad, es posible elaborar mapas de distribución potencial umbralizando los valores de probabilidad para determinar un área de presencia y otra de ausencia. Los enfoques más comunes utilizados para modelar el nicho (algoritmos genéticos de GARP y máxima entropía de MaxEnt) se sustentan en un enfoque basado en los datos. Por tanto, es difícil utilizar conocimiento experto sobre la especie, si no es modificando el mapa de distribución a posteriori; es decir, una vez que la modelación ha sido terminada. No obstante, con Dinamica EGO, que utiliza el método de los pesos de evidencia basado en el cálculo de la probabilidad condicional, es posible su visualización y edición permitiendo la integración del conocimiento experto. El presente trabajo presenta la implementación del método de los pesos de evidencia para la modelación del nicho ecológico.

description

Distribución potencial empleando Garp, Domain y Bioclim

Transcript of Comparación de modelos de distribución de especies

Page 1: Comparación de modelos de distribución de especies

UNA COMPARACIÓN DE DOS ENFOQUES DE MODELACIÓN DE NICHO ECOLÓGICO: MÁXIMA ENTROPÍA (MAXENT) Y PESOS

DE EVIDENCIA (DINAMICA EGO)

Jean-François MAS1, Michelle FARFAN1, Carolina GUILEN-LIMA2, Thiago CARVALHO-LIMA2 y Britaldo SOARES-FILHO2

1 Centro de Investigaciones en Geografía Ambiental, Universidad Nacional Autónoma de México, Antigua Carretera a Pátzcuaro 8701, Col. Ex-Hacienda de San José de La Huerta C.P. 58190 Morelia Michoacán México, email:

[email protected] 2Centro de Sensoriamento Remoto, Universidade Federal de Minas Gerais, Av. Antônio Carlos 6627, Belo

Horizonte, MG 31270-901, Brasil

RESUMEN Los modelos de nicho ecológico y/o de distribución geográfica de las especies, se han convertido en una herramienta importante en estudios ecológicos y geográficos. Su elaboración ha estado dominada por programas como GARP y MaxEnt. Ambos se sustentan en un enfoque basado en los datos, donde es difícil integrar el conocimiento experto de la especie. El objetivo del presente estudio es comparar el método de los pesos de evidencia, un enfoque abierto implementado en el programa Dinamica EGO, con MaxEnt para modelar la distribución potencial de Bradypus variegatus. Para MaxEnt se siguió el método propuesto por Phillips et al. (2006) y en Dinamica EGO se optó por un enfoque automatizado basado sólo en los datos. En este, se calculan estadísticamente los pesos de evidencia y el mapa de probabilidad de presencia sin integración de conocimiento experto. Los modelos se evaluaron mediante análisis ROC y el cálculo de la tasa de omisión. Los resultados indican que aunque MaxEnt permite una mejor coincidencia con las altas probabilidades de presencia que los pesos de evidencia, los mapas umbralizados de presencia/ausencia poseen una fiabilidad similar. Una ventaja de Dinamica EGO, aun no evaluada, es la posibilidad de integrar conocimiento experto durante el proceso de modelación. Palabras clave: Modelación de nicho, MaxEnt, Dinamica EGO, pesos de evidencia, análisis ROC.

1 INTRODUCCIÓN La modelación de nicho ecológico permite elaborar mapas de distribución potencial y/o de distribución geográfica de las especies. En términos generales se emplean registros georeferenciados de ocurrencia y mapas digitales de los factores ambientales (clima y topografía) que condicionan la presencia de la especie. Con estos insumos se construye una representación del nicho ecológico que se puede definir como un hipervolumen de n dimensiones, donde cada una corresponde a uno de los factores ambientales. La caracterización de este nicho, permite expresar espacialmente la probabilidad de encontrar la especie. Con base en estos mapas de probabilidad, es posible elaborar mapas de distribución potencial

umbralizando los valores de probabilidad para determinar un área de presencia y otra de ausencia.

Los enfoques más comunes utilizados para modelar el nicho (algoritmos genéticos de GARP y máxima entropía de MaxEnt) se sustentan en un enfoque basado en los datos. Por tanto, es difícil utilizar conocimiento experto sobre la especie, si no es modificando el mapa de distribución a posteriori; es decir, una vez que la modelación ha sido terminada. No obstante, con Dinamica EGO, que utiliza el método de los pesos de evidencia basado en el cálculo de la probabilidad condicional, es posible su visualización y edición permitiendo la integración del conocimiento experto. El presente trabajo presenta la implementación del método de los pesos de evidencia para la modelación del nicho ecológico.

Page 2: Comparación de modelos de distribución de especies

2 MATERIAL Y MÉTODO 2.1 MATERIAL Se emplearon 116 registros de ocurrencia (Anderson y Handley, 2001) del perezoso (Bradypus variegatus) para modelar su nicho. Además se utilizó un modelo digital de elevación (USGS, 2001) y datos bioclimáticos (IPCC; New et al., 1999) que incluyen la nubosidad anual, el rango de temperatura diurna anual, la frecuencia de heladas anual, la presión de vapor anual, la precipitación anual, el máximo, mínimo y promedio anual de la temperatura. Se siguió el método de partición de los datos de Philips et al. (2006), por lo que fueron divididos los datos de ocurrencia aleatoriamente en dos subconjuntos: 81 registros de entrenamiento y 35 de prueba para evaluar el modelo, repitiendo este muestreo aleatorio diez veces para elaborar diez réplicas de datos de entrenamiento y de evaluación.

Para la modelación, se utilizaron dos programas: MaxEnt (versión 3.3.3a) y Dinamica EGO (versión 2.0.10). El primero, es un programa diseñado para la modelación del nicho ecológico basado en un algoritmo de máxima entropía ampliamente utilizado en la modelación de la distribución de las especies. El segundo es una plataforma de modelación que ha sido principalmente utilizada para modelar cambios de cobertura/uso del suelo e incluye herramientas como el método de los pesos de evidencia basados en la probabilidad condicional y los algoritmos genéticos para entrenar los modelos (Soares-Filho et al., 2002 y 2009). La evaluación de los modelos se hizo con la herramienta para el análisis ROC elaborada por Mas et al. (2013). 2.1 MÉTODO 2.1 Elaboración de los mapas de distribución de Bradypus variegatus Se elaboraron diez modelos y diez mapas de probabilidad de presencia de B. variegatus utilizando el método de máxima entropía (MaxEnt) y los pesos de evidencia (Dinamica) utilizando las diez réplicas de datos de entrenamiento. MaxEnt es un programa que implementa un algoritmo de máxima entropía que genera la distribución de probabilidad sobre los pixeles

presentes en el área de estudio. El principio de máxima entropía considera que en la estimación de una distribución de probabilidad desconocida, la solución menos sesgada es aquella que maximiza su entropía, sujeto a algunas limitantes (la asociación entre las localidades de presencia y las variables ambientales). Para más detalles sobre los fundamentos teóricos de Maxent referimos al lector a los trabajos de Phillips et al. (2006) y Phillips y Dudík (2008). La configuración de MaxEnt se hizo de acuerdo con Phillips et al. (2006): convergence threshold = 10−5, maximum iterations = 1000, regularization value β =10−4. Por otra parte, el método de los pesos de evidencia se basa en las probabilidades condicionales, que son probabilidades de que un evento ocurra habiéndose cumplido ya otro. El peso positivo de evidencia w+ asociado al evento O y a la presencia de la condición C se calcula según la ecuación (1).

w!  

= ln! ! !! ! Ō

(1)

donde P(CǀO) es la probabilidad que un sitio presente cierta condición (por ejemplo un tipo de clima) sabiendo que se reportó la presencia de la especie. En términos prácticos es la proporción de los pixeles de ocurrencia que se encuentran en las áreas que presentan la condición y, P(C|Ō) es la probabilidad que un sitio presente cierta condición sabiendo que no se reportó la presencia de la especie, lo cual se calcula como la proporción de los pixeles de pseudo-ausencia que se encuentran en las áreas que presentan la condición. Cuando el cumplimiento de la condición tiende a aumentar la probabilidad de ocurrencia de la especie, el valor del peso w+ es positivo. Al contrario, cuando la condición tiende a disminuir la probabilidad del evento, el peso w+ es negativo. El cálculo de la probabilidad condicional tomando en cuenta varias condiciones se basa en la suma de los pesos de evidencia asociados a estas condiciones con el supuesto que los factores ambientales no presentan correlación entre ellos. Una descripción más detallada del método de los pesos de evidencia

Page 3: Comparación de modelos de distribución de especies

y su implementación en Dinamica se encuentra en Soares Filho et al. (2010).

Para modelar el nicho en DINAMICA EGO, se construyó un modelo usando una secuencia de operadores de geoprocesamiento llamados functores ver Figura 1.

Figura 1. Flujo de operaciones organizado en cuatro etapas para la modelación del nicho ecológico en Dinamica EGO.

Este flujo de operaciones puede dividirse en cuatro etapas. En la primera etapa se incorporan los insumos del modelo que son las variables espaciales: los mapas de ocurrencia y pseudo-ausencia de la especie B. variegatus y los mapas correspondientes a cada factor ambiental (variables explicativas) todo en formato raster. En la segunda etapa, se llevó a cabo el cálculo de los rangos para la transformación de las variables continuas en categóricas debido a que los pesos de evidencia se calculan para categorías. En esta etapa el modelo selecciona, para cada variable, los intervalos más idóneos para la transformación de las variables. En la tercera etapa, se determinan los pesos de evidencia. En esta etapa, es posible visualizar la relación entre las variables explicativas y los pesos de evidencia y eventualmente editar (modificar) sus valores. De esta manera es posible ajustar el nivel de integración del conocimiento experto desde un enfoque totalmente estadístico basado en los datos (sin modificar los valores de los pesos calculados de forma automática) a un enfoque completamente basado en conocimiento experto de la especie en cuestión (modificación importante o total de los pesos por los expertos). En el presente estudio, para fines comparativos con MaxEnt, se utilizó el enfoque basado en los datos únicamente, es decir el valor de los pesos se determinó estadísticamente de forma automática sin incorporar conocimiento ecológico sobre las preferencias de la especie. Finalmente en la cuarta

etapa, se elabora un mapa de probabilidad de ocurrencia de la especie. 2.1 Evaluación de los mapas de distribución Los mapas de probabilidad fueron evaluados utilizando el análisis ROC con los 35 registros de ocurrencia que no fueron considerados en la etapa de entrenamiento de los modelos. Este análisis permite evaluar la coincidencia entre los datos de presencia y pseudo-ausencia de la especie y las probabilidades de presencia elaboradas por el modelo. Para ello, se grafican la tasa de falsos positivos (eje horizontal) y de verdaderos positivos (eje vertical) que son respectivamente, para diferentes niveles de umbralización en el valor de probabilidad, la proporción de celdas de ausencia identificas como presencia y de celdas de presencia identificadas como tal. Con base en la gráfica, llamada curva ROC, se puede calcular el Área Bajo la Curva (ABC, área debajo de la línea negra en la figura a continuación) (Figura 2).

Figura 2. Curva ROC, ABC y ABC parcial. Un modelo con un alto poder predictivo tendrá un valor de ABC de uno o cercano a uno, un modelo sin poder predictivo (modelo con un valor constante o con valores aleatorio) tendrá un valor de ABC de 0.5. Un valor inferior a 0.5 indica un modelo sistemáticamente erróneo en el cual los valores de probabilidad altos tienden a asociarse con la ausencia y los bajos con la presencia de la especie.

El ABC puede calcularse para porciones específicas de la curva ROC (ABC parcial). Se

Page 4: Comparación de modelos de distribución de especies

calculó el AUC parcial para el rango 0.95-1 en el eje de la tasa de falsos positivos, es decir para las bajas probabilidades de acuerdo a las recomendaciones de Peterson et al. (2008). El ABC parcial se normalizó para poder interpretarse de la misma forma que el ABC. En la comparación de dos modelos se pueden emplear pruebas basadas en un método de remuestreo o bootstrap en inglés para evaluar si la diferencia de los valores de ABC es estadísticamente significativa.

Por otra parte se evalúo también la tasa de omisión para ambos enfoques de modelación usando los mapas de probabilidad umbralizados en el valor de probabilidad más bajo que corresponde a un sitio de ocurrencia de los puntos de entrenamiento. Para ellos se determinó, con base en un primer modelo, el área mínima de presencia que permite incluir todos los sitios de ocurrencia con los cuales fue entrenado el modelo (ajuste de la superficie de presencia para “cero omisión”). Después se ajustó esta área al segundo modelo y se midió la tasa de omisión. Por ejemplo, se determinó el área mínima de distribución para obtener cero omisión con base en el mapa de probabilidad de MaxEnt. Posteriormente, se umbralizó el mapa de probabilidad de DINAMICA EGO para obtener la misma superficie y se evaluó la proporción de los puntos de ocurrencia dentro del área mapaeada con de presencia. Este proceso fue repetido invirtiendo el papel de los mapas obtenidos por ambos métodos.

3 RESULTADOS La figura 3 representa el mapa de probabilidad de la presencia de Bradypus variegatus para la primera réplica y ambos modelos. Los resultados indican que las predicciones de ambos modelos fueron significativamente mejores que el azar, con valores promedios de AUC de 0.8251 y AUC parcial de 0.9779 y para MaxEnt de 0.8882 y 0.9527 respectivamente. Como se puede observar en las Tablas 1 y 2, los valores de ABC obtenidos por MaxEnt son significamente superiores a los de los pesos de evidencia (p < 0.05) en nueve de las diez réplicas. En cambio, hay una diferencia significativa para el ABC parcial solo para una réplica.

Figura 3. Mapas de probabilidad de B. variegatus para la primera réplica en ambos modelos.

Tabla 1. Valores de ABC y ABC parcial de los modelos obtenidos con el método de los pesos de evidencia (Dinamica) y máxima entropía (MaxEnt)

Partición

datos

Pesos de evidencia (Dinamica)

Maxima Entropía (MaxEnt)

ABC PARCIAL

ABC ABC PARCIAL

ABC

1 0.9837 0.8428 0.9332 0.8905 2 0.9651 0.8286 0.9727 0.8982 3 0.9848 0.8218 0.9286 0.8771 4 0.9609 0.8216 0.9758 0.8926 5 0.9722 0.8049 0.9254 0.8768 6 0.9820 0.8329 0.9342 0.8770 7 0.9804 0.8173 0.9439 0.8883 8 0.9835 0.8167 0.9722 0.8908 9 0.9836 0.8490 0.9568 0.8815

Promedio 0.9779 0.8159 0.9851 0.9100 Tabla 2. Nivel de significancia de p en la prueba

estadística sobre la diferencia de los valores de ABC y ABC parcial de los dos modelos comparados.

Partición datos ABC p-value

ABC PARCIAL p-value

1 0.0032 0.1208 2 0.0035 0.7445 3 0.0000 0.0137 4 0.0000 0.3424 5 0.0064 0.0593 6 0.0942 0.0702 7 0.0000 0.3701 8 0.0032 0.1587 9 0.0323 0.0609

10 0.0001 0.9523

Page 5: Comparación de modelos de distribución de especies

En general, MaxEnt presenta tasas de omisión menores. Sin embargo, las altas tasas de omisión de Dinamica EGO se deben a un mal ajuste de la superficie (área inferior a la de MaxEnt) (Tablas 3 y 4). Esto es debido a que Dinamica EGO no tiene valores de probabilidad continuos ya que estas de obtienen a partir de mapas categóricos.

Tabla 3. Tasa de omisión del mapa obtenido con el programa MaxEnt ajustado a la superficie del mapa obtenido con los pesos de evidencia (esto va al re.

Partición

datos

MaxEnt Ajustado a Dinamica en cero omisión

Área (pixeles) Dinamica MaxEnt Diferencia %

Omisión 1 378369 331131 -0.12 1.23 2 479902 436315 -0.09 0 3 427395 382287 -0.11 0 4 449416 402928 -0.10 1.23 5 458764 416409 -0.09 1.23 6 389468 342364 -0.12 0 7 463836 419730 -0.10 0 8 462688 422558 -0.09 0 9 370741 375999 0.01 0 10 480501 437888 -0.09 0

Tabla 4. Tasa de omisión del mapa obtenido con los

pesos de evidencia y ajustado a la superficie del mapa obtenido con MaxEnt.

Partición

datos

Dinamica EGO AJUSTADO A MaxEnt CERO OMISION

Área (pixeles) Dinamica MaxEnt Diferencia %

Omisión 1 485813 427751 0.14 1.23 2 463911 415161 0.12 1.23 3 439186 382619 0.15 0 4 271237 443573 -0.39 9.87 5 218342 487442 -0.55 13.58 6 407041 352578 0.15 0 7 214473 499835 -0.57 14.81 8 475721 420936 0.13 9.87 9 345764 338291 0.02 1.23 10 358733 309127 0.16 1.23

4 DISCUSIÓN Y CONCLUSIÓN Los resultados de este estudio muestran que los modelos de MaxEnt presentan un ABC más alta que los obtenidos por el método de los pesos de evidencia, sin embargo no se encontró diferencia significativa en las ABC parciales de ambos modelos.

Si bien MaxEnt permite elaborar mapas donde las altas probabilidades coinciden más con los puntos de ocurrencia, cuando se umbraliza el mapa en función de las probabilidades más bajas para generar los mapas de presencia, existe poca diferencia entre ambos modelos.

Una práctica común en la modelación del nicho ecológico es la elaboración de los mapas de probabilidad con un enfoque totalmente basado en los datos (GARP o MaxEnt). Posteriormente el método implica su umbralizacion para generar un mapa de presencia y finalmente la edición (recorte) de estos mapas con base en conocimiento experto. Por lo que la integración del conocimiento experto interviene hasta el final del proceso ya que es difícil, sino imposible, integrarla durante la proceso de modelación. En el método de los pesos de evidencia, se puede visualizar la relación entre los factores ambientes y los valores de los pesos de evidencia y eventualmente editar (modificar) sus valores. De esta manera es posible integrar conocimiento experto de forma explícita durante el proceso de modelación y en el espacio de los factores ambientales y no en la edición del mapa. Este enfoque es más cercano a los conceptos de nicho ecológico y será el objeto de futuras investigaciones. En este estudio de caso, los pesos de evidencia permitieron la obtención de mapas de probabilidad comparables con los obtenidos a través de herramientas muy reconocidas en la modelación del nicho ecológico (MaxEnt). Presenta la ventaja adicional de poder integrar conocimiento experto de forma sencilla, por lo cual podría ser un método de modelación complementario a un enfoque como MaxEnt. Aún queda por evaluar el desempeño de Dinamica EGO en diferentes situaciones (umbrales de corte,

Page 6: Comparación de modelos de distribución de especies

uso de vegetación potencial, con pocos de registros de ocurrencia y registros sesgados) así como el aporte del conocimiento experto.

AGRADECIMIENTOS Este estudio se llevó a cabo en el ámbito del proyecto Elaboración y Aplicación de modelos prospectivos de cambio de cobertura/uso del suelo (Programa de Apoyo a Proyectos de Investigación e Innovación Tecnológica – PAPIIT-UNAM clave RR113511).

REFERENCIAS Anderson, R.P., Handley Jr., C.O., 2001. A new species

of threetoed sloth (Mammalia: Xenarthra) from Panama, with a review of the genus Bradypus. Proc. Acad. Biol. Soc. Wash. 114: 1-33.

New, M., Hulme, M., Jones, P., 1999. Representing twentiethcentury space-time climate variability. Part 1.Development of a 1961–90 mean monthly terrestrial climatology. J. Clim. 12: 829-856.

Phillips, S.J., Anderson, R.P., Schapire, R.E., 2006 Maximum entropy modeling of species geographic distributions. Ecol. Model. 190: 231-259.

Peterson, A.T., Papeş, M., Soberón, J. 2008. Rethinking receiver operating characteristic analysis applications in ecological niche modelling. Ecol. Model.213:63-72.

Mas, JF, B. Soares Filho, R.G. Pontius Jr, M. Farfán y H. Rodrigues, 2013, A suite of tools for ROC analysis of spatial models ISPRS Int. J. Geo-Inf., disponible en www.mdpi.com/journal/ijgi/

Soares-Filho, B.S.; Pennachin, C.L; Cerqueira, G. 2002. Dinamica–a stochastic cellular automata model designed to simulate the landscape dynamics in an Amazonian colonization frontier. Ecol. Model. 154: 217–235.

Soares-Filho, B.S.; Moutinho, P.; Nepstad, D.; Anderson, A.; Rodrigues, H.; Garcia, R.; Dietzsch, L.; Merry, F.; Bowman, M.; Hissa, L.; Silvestrini, R.; Maretti, C. 2010. Role of Brazilian Amazon protected areas in climate change mitigation. Proc. Natl. Acad. Sci. U. S. A. (PNAS). 107: 10821-10826.

Soares-Filho, B.S.; Rodrigues, H.O.; Costa, W.L.S. 2009. Modelamiento de Dinámica Ambiental con Dinamica EGO, Centro de Sensoriamento Remoto/Universidade Federal de Minas Gerais. Belo Horizonte, Brazil. 4 de octubre 2010. Online: http://www.csr.ufmg.br/dinamica/