GUÍA RÁPIDA DEL PROGRAMA SPAGeDI v.1

13
1 GUÍA RÁPIDA DEL PROGRAMA SPAGeDI v.1.5 Análisis de la distribución espacial de la diversidad genética Este programa tiene la peculiaridad de aceptar datos de individuos con diferente nivel de ploidía. El programa sirve para analizar si la diversidad genética existente en el germoplasma analizado responde a un determinado patrón, que suele ser de tipo geográfico. Por esta razón en general se suelen definir una serie de grupos, generados a priori, que suelen ser grupos geográficos, en los que se distribuye el germoplasma, y con el programa se prueba si la distribución de la diversidad genética se ajusta a este patrón geográfico. Curso Intensivo de Postgrado. UACH. México 2018. Fernando González Andrés.

Transcript of GUÍA RÁPIDA DEL PROGRAMA SPAGeDI v.1

Page 1: GUÍA RÁPIDA DEL PROGRAMA SPAGeDI v.1

1

GUÍA RÁPIDA DEL PROGRAMA SPAGeDI v.1.5

Análisis de la distribución espacial de la diversidad genética

Este programa tiene la peculiaridad de aceptar datos de individuos con diferente nivel de ploidía.

El programa sirve para analizar si la diversidad genética existente en el germoplasma analizado responde a un determinado patrón, que suele ser de tipo geográfico. Por esta razón en general se

suelen definir una serie de grupos, generados a priori, que suelen ser grupos geográficos, en los que se distribuye el germoplasma, y con el programa se prueba si la distribución de la diversidad genética se

ajusta a este patrón geográfico.

Curso Intensivo de Postgrado. UACH. México 2018. Fernando González Andrés.

Page 2: GUÍA RÁPIDA DEL PROGRAMA SPAGeDI v.1

2

Curso Intensivo de Postgrado. UACH. México 2018. Fernando González Andrés.

Page 3: GUÍA RÁPIDA DEL PROGRAMA SPAGeDI v.1

3

1. DEFINICIÓN DEL TIPO DE ANÁLISIS A REALIZAR Pg. 5

2. PREPARACIÓN DEL ARCHIVO DE DATOS Pg. 6

3. PROCESO SECUENCIAL DEL ANÁLISIS Pg. 83.1. Entrada en el programa y carga de la matriz de datos Pg. 83.2. Elección del nivel al que se realizará el análisis Pg. 93.3. Elección de los estadísticos a analizar Pg. 103.4. Otras opciones para hacer el cálculo Pg. 103.5. Tipo y características de las permutaciones a realizar Pg. 113.6. Opciones del archivo de salida Pg. 12

Curso Intensivo de Postgrado. UACH. México 2018. Fernando González Andrés.

Page 4: GUÍA RÁPIDA DEL PROGRAMA SPAGeDI v.1

4

Curso Intensivo de Postgrado. UACH. México 2018. Fernando González Andrés.

Page 5: GUÍA RÁPIDA DEL PROGRAMA SPAGeDI v.1

5

1. DEFINICIÓN DEL TIPO DE ANÁLISIS A REALIZAR

El programa SPAGeDI tiene muchas posibilidades en cuanto al tipo de análisis que se pueden realizar.

Sin embargo, la presente guía rápida se va a restringir al análisis genético con microsatélites, en una especie que presenta diferentes grados de ploidía para las diferentes UBC. El germoplasma pertenece a varios grupos geográficos que han sido identificados a priori, y el objetivo es detectar si existe un patrón filogeográfico de variabilidad genética, es decir si dicha variabilidad presenta un patrón de tipo geográfico, siguiendo los criterios de Hardy (2003)*.

En primer lugar se calcularán con el programa índices genéticos para el conjunto de los grupos geográficos indentificados a priori, y para cada uno de ellos en particular. En concreto los siguientes índices:• Genotipos observados (Go)• Número de alelos por locus (A)• Número efectivo de alelos por locus (Ae)• Heterocigosidad observada (Ho)• Heterocigosidad esperada (He)• Coeficiente de consnguinidad (inbreeding coeffcient)

La estrategia de Hardy (2003)* para detectar la presencia de un patrón filogeográficoconsiste en permutar los tamaños alélicos entre los diferentes alelos de cada locus (el número aconsejado de permutaciones es de 10.000), y posteriormente determinar los P-valores obtenidos para el estadístico Rst antes y después de la permutación (que informa sobre el patrón filogeográfico dentro de las poblaciones, que serían los grupos geográficos identificados a priori), así como los P-valores para la pendiente de los valores de b-lin y b-log (que informa sobre el patrón filogeográfico entre las poblaciones). La hipótesis nula es que no existe patrón filogeográfico, Por tanto se procederá a realizar las pruebas de permutaciones, y a continuación se calcularán:• P-valores del estadístico Rst. La hipótesis nula es que no existe patrón filogeográfico

dentro de las poblaciones.• P- valores de b-lin (pendiente correspondiente a la distancia lineal)• P-valores de b-log (pendiente correspondiente a la distancia logarítmica). Para ambas

pendientes la hipótesis nula es que no existe patrón filogeográfico entre las poblaciones.

Lógicamente si se rechaza la hipótesis nula se puede afirmar que existe un patrón filogeográfico.

Por último se construirá un dendrograma basado en las distancias genéticas de Nei’sentre las poblaciones.

Curso Intensivo de Postgrado. UACH. México 2018. Fernando González Andrés.

*Hardy OJ (2003) Estimation of pairwise relatedness between individuals and characterisation of isolation by distance processes using dominant genetic markers. Mol Ecol 12:1577–1588

Page 6: GUÍA RÁPIDA DEL PROGRAMA SPAGeDI v.1

6

2. PREPARACIÓN DEL ARCHIVO DE DATOS

Se puede crear en Excel, y posteriormente guardarlo como texto plano con la opción siguiente “archivo de texto delimitado por tabulaciones”. Otra opción es guardarlo como texto de DOS.La estructura del archivo de datos es la que se presenta a continuación.

Curso Intensivo de Postgrado. UACH. México 2018. Fernando González Andrés.

Línea 1 con comentarios. Debe iniciar con //

Línea 2 (números separados por tabuladores):• Nº de individuos• Nº de grupos geográficos

identificados a priori• Numero de coordenadas

espaciales utilizadas• Número de loci• Número de dígitos

utilizados para denominar cada alelo

• Nivel de ploida (si hay varios niveles de ploidía se pone el mayor

Línea 3 (números separados por tabuladores):• Primer número:

corresponde al número de intervalos de distancia considerados

• Segundo y siguientes: son los intervalos considerados, en el ejemplo son todos del mismo tamaño

Línea 4: Etiquetas de las columnas

Denominación de las UBC Grupo geográfico, de los definidos a priori, al que pertenece cada una de las UBC

Coordenadas UTM de cada una de las UBC

Tamaños de los alelos para cada locus y para cada UBC. Los alelos de un mismo locus y una misma UBC se escriben sin separación. Los de diferentes locus se separan por tabuladores

Page 7: GUÍA RÁPIDA DEL PROGRAMA SPAGeDI v.1

7

El archivo de datos debe terminar con el vocablo:END

Curso Intensivo de Postgrado. UACH. México 2018. Fernando González Andrés.

Al final del archivo es necesario incluir la matriz de distancias espaciales entre los grupos geográficos identificados a priori.La matriz debe ser diagonal, con 0 en la diagonal principal. También debe finalizar con el vocablo END. El resto de características se señalan en la figura.

Letra M seguida del número de filas que debe ser igual al número de columnas

Línea 1 con comentarios. Debe iniciar con //

Denominación de los grupos realizados a priori

Page 8: GUÍA RÁPIDA DEL PROGRAMA SPAGeDI v.1

8

3. PROCESO SECUENCIAL DEL ANÁLISIS3.1. Entrada en el programa y carga de la matriz de datos

Curso Intensivo de Postgrado. UACH. México 2018. Fernando González Andrés.

En primer lugar se crea una carpeta en un directorio para alojar el programa y los archivos de datos, que necesariamente deben estar en la misma carpeta. También en esta carpeta se irán añadiendo los resultados.

Una vez realizada esta operación se lanza el programa mediante doble click en el icono y se obtiene la siguiente pantalla

El siguiente paso es escribir el nombre de la matriz básica de datos con su extensión, y el del archivo de salida en el que se guardarán los datos.

Page 9: GUÍA RÁPIDA DEL PROGRAMA SPAGeDI v.1

9

3.2. Elección del nivel al que se realizará el análisis

Curso Intensivo de Postgrado. UACH. México 2018. Fernando González Andrés.

A continuación se muestra un resumen de la lectura que el programa ha hecho de la matriz de datos y que se debe aceptar si es correcta, o interrumpir la ejecución del programa si no lo es.

En el ejemplo concreto que se está llevando a cabo, se trabajará a nivel poblacional

Page 10: GUÍA RÁPIDA DEL PROGRAMA SPAGeDI v.1

10

Curso Intensivo de Postgrado. UACH. México 2018. Fernando González Andrés.

3.3. Elección de los estadísticos a analizar

En este ejemplo particular se han elegido:• Estadísticos basados en la identidad alélica: estadísticos F basados en la distancia

genética de Nei´s entre poblaciones.• Estadísticos específicos para microsatétiles basados en el tamaño alélico: R y Rst,

basados en un ANOVA

3.4. Otras opciones para hacer el cálculo

• En este apartado hay que señalar cómo se va a indicar el programa la distancia entre los grupos geográficos identificados a priori. Para ello en este ejemplo se va a utilizar una matriz de distancia física, que se habrá incluido en el archivo que contiene la matriz básica de datos.

• Además también en este apartado se va a solicitar al programa que realice pruebas de permutaciones

Page 11: GUÍA RÁPIDA DEL PROGRAMA SPAGeDI v.1

11

Curso Intensivo de Postgrado. UACH. México 2018. Fernando González Andrés.

A continuación se indica al programa que la matriz de distancias espaciales en los grupos realizados a priori está en el archivo que contiene la matriz básica de datos, o si no lo estuviera, habría que introducir el nombre de dicho archivo, que debe ubicarse en la misma carpeta que el programa.

3.5. Tipo y características de las permutaciones a realizar

• En este ejemplo el tipo de permutaciones a realizar serán alélicas • Además también se indicarán al programa otras dos instrucciones:

Que solamente presenten los P-valores, ya que si se incluye el informe completo, la cantidad de información de escasa utilidad sería excesiva.

Además se solicitará que el programa calcule las distancias genéticas entre cada par de poblaciones, para de este modo poder construir el dendrograma basado en las distancias genéticas de Nei’s

• Por último se introducirá el número de permutaciones a realizar (el recomendado es 10,000)

Page 12: GUÍA RÁPIDA DEL PROGRAMA SPAGeDI v.1

12

Curso Intensivo de Postgrado. UACH. México 2018. Fernando González Andrés.

3.6. Opciones del archivo de salida

Para el ejemplo que se está llevando a cabo, es importante solicitar:• Que se desglosen los resultados para cada población• Que se presenten las matrices con distancias espaciales y genéticas entre poblaciones

Finalmente es necesario indicar el formato que el programa dará al archivo de salida con las distancias genéticas y espaciales, recomendándose utilizar formato de matriz, tanto para los datos de cada locus por separado, como para el conjunto de los loci

Page 13: GUÍA RÁPIDA DEL PROGRAMA SPAGeDI v.1

13

Curso Intensivo de Postgrado. UACH. México 2018. Fernando González Andrés.

3.6. Ejecución del programa y obtención de resultados

El archivo de resultados se escribe en la mima carpeta electrónica en la que se e¡instaló el programa y en la que se dispuso la matriz básica de datos