de datos biológicos (Desarrollo de sistemas). la …...II Bases de datos Primarias (Biológicas/...

6
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERIA ESCUELA DE ESTUDIOS DE POSTGRADOS 2 0 1 9 B I M E S T R E 1 1 Nombre del Cuso: FUNDAMENTOS DE BIOINFORMÁTICA Y BIOCOMPUTACIÓN MOLECULAR Código: BBMB101 Créditos: 2.5 Escuela: ESTUDIOS DE POSTGRADO Especialidad a la que pertenece: Bioinformática y Biocomputación molecular médica. Docentes: ERWIN CALGUA Edificio: T-3 Sección: A Salón del curso: AULA VIRTUAL Horario del curso: 08:00 am a 2:00 pm Horas por semana del curso: 6 horas presenciales por sección Bimestre: 1 Período: 23 de febrero al 27 de abril de 2019 1. DESCRIPCIÓN DEL CURSO El curso de bioinformática pretende brindar a los alumnos los conceptos fundamentales en las herramientas bioinformáticas básicas para utilizar bases de datos biológicas/biomédicas y el empleo de distintos paquetes de software para procesar y analizar secuencias de nucleótidos (ADN, ARN) y estructuras de proteínas. Así como brindar una introducción a la programación aplicada a las Ciencias Biológicas en RStudio y VStudio para el análisis de datos biológicos (Desarrollo de sistemas). 2. OBJETIVOS GENERAL Que el alumno: Obtenga los conocimientos necesarios para emplear las herramientas fundamentales para el análisis de datos ómicos y biología computacional. ESPECÍFICOS Que el estudiante: • Conozca las bases de datos y programas ya existentes, para el análisis de distintas secuencias biológicas. • Aplique los conocimientos en bioinformática adquiridos en distintos proyectos de investigación de perfil ómico. • Obtenga las herramientas básicas para la programación en bioinformática en Rstudio y Visual Studio.

Transcript of de datos biológicos (Desarrollo de sistemas). la …...II Bases de datos Primarias (Biológicas/...

Page 1: de datos biológicos (Desarrollo de sistemas). la …...II Bases de datos Primarias (Biológicas/ Biomédicas) Ingeniería de Software y BD (SQL). Flujos de información biológica.

UNIVERSIDAD DE SAN CARLOS DE GUATEMALAFACULTAD DE INGENIERIAESCUELA DE ESTUDIOS DE POSTGRADOS

2019

BIMESTRE

11

Nombre del Cuso: FUNDAMENTOS DE BIOINFORMÁTICA Y BIOCOMPUTACIÓN MOLECULAR Código: BBMB101 Créditos: 2.5

Escuela: ESTUDIOS DE POSTGRADO Especialidad a la que pertenece:

Bioinformática y Biocomputación molecular

médica.Docentes: ERWIN CALGUA

Edificio: T-3 Sección: A Salón del curso: AULA VIRTUAL Horario del

curso:08:00 am a 2:00 pm

Horas por semana del curso: 6 horas presenciales por sección

Bimestre: 1 Período: 23 de febrero al 27 de abril de 2019

1. DESCRIPCIÓN DEL CURSO

El curso de bioinformática pretende brindar a los alumnos los conceptos fundamentales en las herramientas bioinformáticas básicas para utilizar bases de datos biológicas/biomédicas y el empleo de distintos paquetes de software para procesar y analizar secuencias de nucleótidos (ADN, ARN) y estructuras de proteínas. Así como brindar una introducción a la programación aplicada a las Ciencias Biológicas en RStudio y VStudio para el análisis de datos biológicos (Desarrollo de sistemas).

2. OBJETIVOS

GENERAL

Que el alumno:

Obtenga los conocimientos necesarios para emplear las herramientas fundamentales para el análisis de datos ómicos y biología computacional.

ESPECÍFICOSQue el estudiante:

• Conozca las bases de datos y programas ya existentes, para el análisis de distintas secuencias biológicas.

• Aplique los conocimientos en bioinformática adquiridos en distintos proyectos de investigación de perfil ómico.

• Obtenga las herramientas básicas para la programación en bioinformática en Rstudio y Visual Studio.

Page 2: de datos biológicos (Desarrollo de sistemas). la …...II Bases de datos Primarias (Biológicas/ Biomédicas) Ingeniería de Software y BD (SQL). Flujos de información biológica.

UNIVERSIDAD DE SAN CARLOS DE GUATEMALAFACULTAD DE INGENIERIAESCUELA DE ESTUDIOS DE POSTGRADOS

2019

BIMESTRE

12

3. COMPETENCIAS TERMINALES

Al finalizar el curso el estudiante desarrolla las siguientes competencias: Comprender, conocer y dominar los fundamentos de la Bioinformática y Bases de datos

biológicas. Demostrar una actitud de respeto y tolerancia en la propuesta de una nueva mentalidad,

abierta, democrática y eminentemente participativa, hacia el trabajo multidisciplinario para las tecnologías convertentes como la Bioinformática.

4. CONTENIDO TEMÁTICO DEL CURSO

Unidad Tema

IIntroducción a la Bioinformática yBiocomputación, BiologíaComputacional.

II Bases de datos Primarias (Biológicas/Biomédicas)

III Bases de datos Secundarias y mixtas.IV Análisis de secuencias biológicas.

V Análisis Bioinformático de formatos yGenomas (Bacteriales y Humanos)

VIAnálisis Bioinformático de datos High-Throughput de NGS y microarreglos(MicroArrays).

VII Bionformática estructural de proteínas

VIII Introducción al R y RStudio.VIX RStudio IX RStudio IIXI RStudio IIIXII RStudio IVXIII RStudio VXIV RStudio VIXV RStudio VIIXVI Galaxy IXVII Galaxy IIXVIII VStudio

Page 3: de datos biológicos (Desarrollo de sistemas). la …...II Bases de datos Primarias (Biológicas/ Biomédicas) Ingeniería de Software y BD (SQL). Flujos de información biológica.

UNIVERSIDAD DE SAN CARLOS DE GUATEMALAFACULTAD DE INGENIERIAESCUELA DE ESTUDIOS DE POSTGRADOS

2019

BIMESTRE

13

5. CRONOGRAMA DE ACTIVIDADES

Sesi

ón

Fech

a

Objetivo de la sesión Contenidos a desarrollar Actividad Evaluación

Sesi

ón N

o.1

Fech

a: m

arzo

23

de 2

019

Abordar el tema: I al VII

I Introducción a la Bioinformática yBiocomputación, BiologíaComputacional. Definición, conceptos,variables, tipos de datos, tecnologías NGS,secuenciación de genomas y exomas,microarrays, espectrometría de masas,aplicaciones en la clínica. Elementos desecuencias genéticas y proteínas.

II Bases de datos Primarias (Biológicas/Biomédicas)Ingeniería de Software y BD (SQL). Flujos deinformación biológica. Definición de bases dedatos primarias. Visión histórica de lacreación de las mismas. Protocolos y gestiónBDB. Funcionamiento de las Bases dedatos: índices, campos, métodos debúsqueda. Bases de datos de proteínas.Bases de datos de ADN. Bases de datos devariantes genómicas. Ejemplos de bases dedatos primarias: Genebank, EMBL, Swiss-Prot, TrEMBL, PDB.

III Bases de datos Secundarias y mixtas.Definición de bases de datos secundarias.Construcción de bases de secundarias. Elproblema de los falsos positivos/negativos.Modelos ocultos de Markov. Ejemplos debases de Datos secundarias: Pfam, Gene-Ontology, UniProt, PRINTS, GO, ProSIte.Algoritmos, complejidad y heurísticas.Diseño y mantenimiento de bases de Datossecundarias. Bases de rutas metabólicas,Bases de datos de Biología de Sistemas. ej:Reactome, HGMD, SNPs-Nota: Se realizará una práctica general delas principales bases de datosbioinformáticas (primarias, secundarias yterciarias).

IV Análisis de secuencias biológicas.Análisis de secuencias en ADN yARN.Introducción de probabilidad yestadística. Alineamiento global por pares.Alineamiento Local y Múltiple. Generación deMatrices de score (BLOSUM, PAM). Dot-Plot. Programación dinámica. Programas dealineamiento: BLAST. FASTA/ FASTQ.Búsquedas en bases de datos por similitud yhomología de secuencia. Patrones desecuencias y perfiles. Dendogramas yFilogenia molecular. PSI-BLAST, PHIBLAST,Mega-Blast.

V Análisis Bioinformático de formatos y

Conferencia/Clase Magistral

Page 4: de datos biológicos (Desarrollo de sistemas). la …...II Bases de datos Primarias (Biológicas/ Biomédicas) Ingeniería de Software y BD (SQL). Flujos de información biológica.

UNIVERSIDAD DE SAN CARLOS DE GUATEMALAFACULTAD DE INGENIERIAESCUELA DE ESTUDIOS DE POSTGRADOS

2019

BIMESTRE

14

Genomas (Bacteriales y Humanos)Análisis de los formatos de informaciónbiológica. Ensamblado y anotación defuncional, molecular y estructural degenomas, predicción de genes, Bidireccionalbest Hits y Iterative predictive Blast. Base dedatos de Genomas. Mapeo físico yreferencial de genes. Uso de GenomeBrowsers (NCBI), Ensembl y Galaxy (webservers). Comparación de Genomas(Genómica comparativa y evolutiva).

VI Análisis Bioinformático de datos High-Troughput de NGS y microarreglos(MicroArrays).Introducción al NGS. Computación biológica.Sistemas de Secuenciación masiva (NGS oMPS). Elementos y funcionamiento de unNGS: Reads, converturas y ensamblaje.Introducción a los MicroArrays, Análisisestadístico de significancia de los datos,Análisis de expresión y diferencial porMicroArrays, definición de estado metabólico(expresoma, proteoma y metaboloma),MicroArrays específicos sobre splicingalternativo (exon arrays, splicing sensitivearrays), MicroArrays de Glicómica. Eje:BABELOMICS (Sistemas Web).

VII Bionformática estructural de proteínasRepaso de Estructura de Proteínas.Predicción de estructura secundaria, DSSP.Métodos de resolución de proteínas, Análisisbioinformático de estructuras, alineamientoestructural. Predicción de estructuraterciaria. Threading. Modelado comparativo.Métodos ab-initio. Búsqueda de motivosestructurales.

Sesi

ón N

o.2

Fech

a: 3

0 m

arzo

30

de 2

019

Abordar el tema: VII al XVIII

VIII Introducción al R y RStudio. Entorno UNIX.Programación en RStudio y VStudio.

IX RStudio I: Comandos, Variables,Operadores, vectores y tipos de datos enbioinformática.

X Rstudio II: Librerías, módulos y funciones.

XI Rstudio III: Matrices, tipos de archivos,exportación de datos biológicos a Rstudio.

XII Rstudio IV: Generación de gráficos:HEATMAP de datos de expresión génicos.

XIII Rstudio V: Análisis de datos genéticos.Frecuencias, estructuras, ciclados.

XIV Rstudio VI: Análisis de datos ensecuenciación masiva. Extracción de datosde NGS y análisis de calidad.

XV RStudio VII: Preparación de archivos paraensamblaje genómico. Filtros y cortesmediante umbrales.

XVI GALAXY I: Transformación de formatosNGS.

XVII GALAXY II: Calidad y filtrado NGS.

XVIII Fundamentos de V Studio en genética

Conferencia/Clase magistral

Page 5: de datos biológicos (Desarrollo de sistemas). la …...II Bases de datos Primarias (Biológicas/ Biomédicas) Ingeniería de Software y BD (SQL). Flujos de información biológica.

UNIVERSIDAD DE SAN CARLOS DE GUATEMALAFACULTAD DE INGENIERIAESCUELA DE ESTUDIOS DE POSTGRADOS

2019

BIMESTRE

15

(prácticas diversas).Ejemplo de Nano- biotecnología molecular.

XIX PROYECTO FINAL

6. NOTA DE PROMOCIÓN Y EVALUACIÓN DEL RENDIMIENTO ACADÉMICO

La nota de promoción es de 70 puntos en una escala de 0 a 100 puntos, de acuerdo con el Reglamento del sistema de Estudios de Postgrado de la USAC. La asistencia debe ser de al menosel 85%. La zona es de 70 puntos y la evaluación final es de 30 puntos, no hay exámenes de recuperación.

Clases magistrales: Proyecto final. 100%.

Page 6: de datos biológicos (Desarrollo de sistemas). la …...II Bases de datos Primarias (Biológicas/ Biomédicas) Ingeniería de Software y BD (SQL). Flujos de información biológica.

UNIVERSIDAD DE SAN CARLOS DE GUATEMALAFACULTAD DE INGENIERIAESCUELA DE ESTUDIOS DE POSTGRADOS

2019

BIMESTRE

16

7. BIBLIOGRAFÍA

Orozco A. Informática Biomédica en Costa Rica. 2015. Programa de la Sociedad de la Información y el Conocimiento (PROSIC). Editorial Lil, pp. 333-367.

Orozco A. Nanotecnología y Tic en Costa Rica. 2014. Programa de la Sociedad de la Información y el Conocimiento (PROSIC). Editorial Lil, pp. 235-279.

Orozco A. Bioinformática en Costa Rica. 2013. Programa de la Sociedad de la Información y el Conocimiento (PROSIC). Editorial Lil, pp. 229-253.

Solano A, Alfaro V, Cruz C & Orozco A. 2018. Visualization Portal of Genetic Variation (VizGVar): A Tool for Interactive Visualization of SNPs and Somatic Mutations in Exons, Genes and Protein domains. Bioinformatics 34(6), pp. 1048-1049.

Orozco A & Valverde C, J. 2015. Diseño de sistemas bioinformáticos y nanotecnología molecular médica, Revista Digital Universitaria UNAM 16(9), pp. 10.