Dinámica Molecular de Proteínas Modelado y Simulación Computacional · 2018-08-28 · Modelado y...

18
Dinámica Molecular de Proteínas Dinámica Molecular de Proteínas Modelado y Simulación Computacional Modelado y Simulación Computacional Profesores: Eliana K. Asciutto & Ignacio J. General 2 do cuatrimestre 2017 Escuela de Ciencia y Tecnología UNSAM

Transcript of Dinámica Molecular de Proteínas Modelado y Simulación Computacional · 2018-08-28 · Modelado y...

Page 1: Dinámica Molecular de Proteínas Modelado y Simulación Computacional · 2018-08-28 · Modelado y Simulación Computacional Profesores: Eliana K. Asciutto & Ignacio J. General 2do

Dinámica Molecular de ProteínasDinámica Molecular de ProteínasModelado y Simulación ComputacionalModelado y Simulación Computacional

Profesores: Eliana K. Asciutto & Ignacio J. General2do cuatrimestre 2017

Escuela de Ciencia y TecnologíaUNSAM

Page 2: Dinámica Molecular de Proteínas Modelado y Simulación Computacional · 2018-08-28 · Modelado y Simulación Computacional Profesores: Eliana K. Asciutto & Ignacio J. General 2do

Dinámica Molecular de ProteínasDinámica Molecular de ProteínasModelado y Simulación ComputacionalModelado y Simulación Computacional

Modelado homólogoModelado homólogo

Page 3: Dinámica Molecular de Proteínas Modelado y Simulación Computacional · 2018-08-28 · Modelado y Simulación Computacional Profesores: Eliana K. Asciutto & Ignacio J. General 2do

3

Modelado Homólogo

Dinámica Molecular – UNSAM – 2017

Proteínas con secuencias similares tienen estructuras similares

LT G

DE

SA

L T C G D D

Secuencia objetivo: LTCGDDSecuencia molde: ALTG─DES

● Secuencia sin estructura conocida (objetivo o source):

● Busco una secuencia similar, con estructura conocida (molde o template):

Secuencia molde: ALTGDES

● Alineo las dos secuencias (usando indels):

● Copio la estructura:

● Refino la estructura:

LT C G

D D

Secuencia modelada

LT C

DD

GLT G

DEL

T GD

ESA

Page 4: Dinámica Molecular de Proteínas Modelado y Simulación Computacional · 2018-08-28 · Modelado y Simulación Computacional Profesores: Eliana K. Asciutto & Ignacio J. General 2do

4

Modelado Homólogo

Dinámica Molecular – UNSAM – 2017

Proteínas con secuencias similares tienen estructuras similares

Figura de Sander and Schneider (1991) Proteins 9:56-68:

La región segura región segura para modelado homólogo es la de arriba a la derecha.

Como regla general, no usar secuencias con identidad < 40%.

Page 5: Dinámica Molecular de Proteínas Modelado y Simulación Computacional · 2018-08-28 · Modelado y Simulación Computacional Profesores: Eliana K. Asciutto & Ignacio J. General 2do

5

Modelado Homólogo

Dinámica Molecular – UNSAM – 2017

Pero...¡puede fallar!¡puede fallar!

Región amarilla: longitud de 80 aa, identidad > 40%Estructuras muy diferentesEstructuras muy diferentes

Cápside viral (1PIV) Glicosiltransferasa (1HMP)

Page 6: Dinámica Molecular de Proteínas Modelado y Simulación Computacional · 2018-08-28 · Modelado y Simulación Computacional Profesores: Eliana K. Asciutto & Ignacio J. General 2do

6

Modelado Homólogo

Dinámica Molecular – UNSAM – 2017

¿Por qué usar modelado homólogo?

● Hay > 100,000 estructuras en el PDB. Pero existen millones de secuencias. No siempre se tiene la estructura de interés.

● Es mucho más fácil que medir la estructura experimentalmente.

● Sirve para estudiar algunas secuencias, a veces cualitativamente, a veces cuantitativamente.

● Se puede usar para predecir efectos de mutación, regiones de ligamiento, estabilidad, etc.

Page 7: Dinámica Molecular de Proteínas Modelado y Simulación Computacional · 2018-08-28 · Modelado y Simulación Computacional Profesores: Eliana K. Asciutto & Ignacio J. General 2do

7

Rodopsina Humana

Dinámica Molecular – UNSAM – 2017

Es una proteína transmembrana, foto-sensible, importante en la foto-transducción que inicia la visión humana.

¿Cómo hacer un modelo de Rodopsina?

By Dpryan at English Wikipedia (Transferred from en.wikipedia to Commons.) [Public domain], via Wikimedia Commons

Bicapa lipídicaRodopsina (GPCR)

Proteína G

Page 8: Dinámica Molecular de Proteínas Modelado y Simulación Computacional · 2018-08-28 · Modelado y Simulación Computacional Profesores: Eliana K. Asciutto & Ignacio J. General 2do

8

1- Secuencia de la Rodopsina (objetivo)

Dinámica Molecular – UNSAM – 2017

● Obtener la secuencia de la Rodopsina Humana, por ejemplo, en la base de datos http://www.uniprot.org/

● Elegir la opción P08100. Allí se describen las características conocidas de Rodopsina humana.

● Buscar la secuencia (o cliquear a la izquierda “secuencia”)● Bajar la secuencia en formato FASTA:>sp|P08100|OPSD_HUMAN Rhodopsin OS=Homo sapiens GN=RHO PE=1 SV=1MNGTEGPNFYVPFSNATGVVRSPFEYPQYYLAEPWQFSMLAAYMFLLIVLGFPINFLTLYVTVQHKKLRTPLNYILLNLAVADLFMVLGGFTSTLYTSLHGYFVFGPTGCNLEGFFATLGGEIALWSLVVLAIERYVVVCKPMSNFRFGENHAIMGVAFTWVMALACAAPPLAGWSRYIPEGLQCSCGIDYYTLKPEVNNESFVIYMFVVHFTIPMIIIFFCYGQLVFTVKEAAAQQQESATTQKAEKEVTRMVIIMVIAFLICWVPYASVAFYIFTHQGSNFGPIFMTIPAFFAKSAAIYNPVIYIMMNKQFRNCMLTTICCGKNPLGDDEASATVSKTETSQVAPA

Page 9: Dinámica Molecular de Proteínas Modelado y Simulación Computacional · 2018-08-28 · Modelado y Simulación Computacional Profesores: Eliana K. Asciutto & Ignacio J. General 2do

9

2- Selección del molde

Dinámica Molecular – UNSAM – 2017

● La herramienta BLAST (Basic Local Alignment Search Tool), permite comparar una secuencia objetivo contra una base de datos.

● Hay muchas opciones:http://uniprot.org (website anterior)https://toolkit.tuebingen.mpg.de/#/tools/hhpred https://blast.ncbi.nlm.nih.gov/Blast.cgi Usemos https://blast.ncbi.nlm.nih.gov/Blast.cgi, seleccionando comparación contra el contra el Protein Data Bank Protein Data Bank

● El sistema devuelve una lista de varias secuencias con ‘puntajes’: E-value (cuanto menor, mejor, <<1), porcentaje de similaridad, etc.

● Los puntajes son peores si hay indels (insertions/deletions), inserciones o vacíos en una de las dos secuencias comparadas.

Page 10: Dinámica Molecular de Proteínas Modelado y Simulación Computacional · 2018-08-28 · Modelado y Simulación Computacional Profesores: Eliana K. Asciutto & Ignacio J. General 2do

10

2- Selección del molde

Dinámica Molecular – UNSAM – 2017

● Usar secuencias solo con E < 1 y/o identidad > 40%.● Cualquiera de ellas? No, examinar las estructuras 3D, y

verificar que tengan buena resolución (1 o 2 Å), y pocos átomos faltantes.

● Una vez seleccionado el “mejor”, anotar el campo en la columna “Accession” (usar 1JFP_A, aunque no es el mejor); ese es el código PDB de la estructura. Cliquear ahí, y vamos a poder ver la secuencia en formato FASTA.

>1JFP:A|PDBID|CHAIN|SEQUENCEMNGTEGPNFYVPFSNKTGVVRSPFEAPQYYLAEPWQFSMLAAYMFLLIMLGFPINFLTLYVTVQHKKLRTPLNYILLNLAVADLFMVFGGFTTTLYTSLHGYFVFGPTGCNLEGFFATLGGEIALWSLVVLAIERYVVVCKPMSNFRFGENHAIMGVAFTWVMALACAAPPLVGWSRYIPEGMQCSCGIDYYTPHEETNNESFVIYMFVVHFIIPLIVIFFCYGQLVFTVKEAAAQQQESATTQKAEKEVTRMVIIMVIAFLICWLPYAGVAFYIFTHQGSDFGPIFMTIPAFFAKTSAVYNPVIYIMMNKQFRNCMVTTLCCGKNPLGDDEASTTVSKTETSQVAPA

Page 11: Dinámica Molecular de Proteínas Modelado y Simulación Computacional · 2018-08-28 · Modelado y Simulación Computacional Profesores: Eliana K. Asciutto & Ignacio J. General 2do

11

3- Alineación de secuencia

Dinámica Molecular – UNSAM – 2017

● Necesitamos ahora generar una alineación de las secuencias objetivo y molde.

● http://www.ebi.ac.uk/Tools/msa/clustalo/ ● Entrar las secuencias en formato FASTA de las secuencias

objetivo y molde, una abajo de la otra. Correr el programa.● Observar la alineación de secuencias. Significado de los

códigos: los residuos en esa columna- son idénticos (*)- se conservan en cuanto a su tipo (:)- tienen características más o menos parecidas (.)

● Descargar el archivo con la alineación (.aln o .clustal_num)

Page 12: Dinámica Molecular de Proteínas Modelado y Simulación Computacional · 2018-08-28 · Modelado y Simulación Computacional Profesores: Eliana K. Asciutto & Ignacio J. General 2do

12

3- Alineación de secuencia

Dinámica Molecular – UNSAM – 2017

Alineación de secuencias:

NOTA:NOTA: Para usar Swiss-Model (próximo paso), puede ser necesario tener que cambiar la identificacion de la secuencia molde en el archivo con la alineación a:1JFP.1.A (<pdb>.<biological assembly>.<cadena>)

Page 13: Dinámica Molecular de Proteínas Modelado y Simulación Computacional · 2018-08-28 · Modelado y Simulación Computacional Profesores: Eliana K. Asciutto & Ignacio J. General 2do

13

4- Construcción del modelo

Dinámica Molecular – UNSAM – 2017

● Finalmente hay que unir la secuencia objetivo con las coordenadas de la secuencia molde

● Para ello usar https://swissmodel.expasy.org/ opción “Modelling”, “Alignement Mode”

Copiar o subir acá el archivo con la alineación

Page 14: Dinámica Molecular de Proteínas Modelado y Simulación Computacional · 2018-08-28 · Modelado y Simulación Computacional Profesores: Eliana K. Asciutto & Ignacio J. General 2do

14

4- Construcción del modelo

Dinámica Molecular – UNSAM – 2017

● El sistema básicamente copia las coordenadas atómicas del molde, y estima las de los átomos faltantes.

● Presenta el modelo (estructura de nuestra secuencia objetivo), y algunas medidas de su calidad.

Bajar el pdb, logs, etc

Imágen interactiva

En color lo que fue modeladoOpciones de color (est. secundaria, calidad, etc)

Page 15: Dinámica Molecular de Proteínas Modelado y Simulación Computacional · 2018-08-28 · Modelado y Simulación Computacional Profesores: Eliana K. Asciutto & Ignacio J. General 2do

15

Opción automática

Dinámica Molecular – UNSAM – 2017

● Swiss-Model puede hacer todo lo anterior automáticamente, y proveernos de varios modelos.

● Usar la opción “Modelling”, “myWorkspace” e ingresar la secuencia objetivo.

● Elegir “Search For Templates” (semi-automático) o “Build Model” (completamente automático).

Page 16: Dinámica Molecular de Proteínas Modelado y Simulación Computacional · 2018-08-28 · Modelado y Simulación Computacional Profesores: Eliana K. Asciutto & Ignacio J. General 2do

16

5- Evaluación del modelo

Dinámica Molecular – UNSAM – 2017

● Swiss-Model evalúa el modelo, pero se puede hacer un chequeo más exhaustivo. Por ejemplo, cargando la estructura pdb del modelo en http://molprobity.biochem.duke.edu/

● Agregando hidrógenos y usando “Analyze all-atom contacts and geometry”:

Modelo manual

Modelo automático(próxima pagina)

MolProbity score (puntaje efectivo)

Page 17: Dinámica Molecular de Proteínas Modelado y Simulación Computacional · 2018-08-28 · Modelado y Simulación Computacional Profesores: Eliana K. Asciutto & Ignacio J. General 2do

17

5- Evaluación del modelo

Dinámica Molecular – UNSAM – 2017

Algunos puntos importantes en molprobity:

● Clashscore: indica el número de choques estéricos serios (puntaje ideal = 0, percentil 100)

● Ramachandran outliers: es el número de puntos en el gráfico de Ramachandran que caen fuera de la zona “ideal” de cada residuo. Ejemplo (ver single criterion visualizations):

● MolProbity score: combina varios indicadores en un score total (puntaje ideal = 0, percentil 100)

- una P trans cae fuera de su zona ideal- no hay P cis

Page 18: Dinámica Molecular de Proteínas Modelado y Simulación Computacional · 2018-08-28 · Modelado y Simulación Computacional Profesores: Eliana K. Asciutto & Ignacio J. General 2do

18

Refinamiento

Dinámica Molecular – UNSAM – 2017

● Si la evaluación del modelo es mala, se puede repetir el proceso usando otro molde (en este caso, 4ZWJ, que es el que se usa en el proceso automático)

● Los modelos, aún con buenos puntajes, no son perfectos, generalmente van a tener varios problemas, impedimentos estéricos, rotámeros no óptimos, etc.

● Aun si el puntaje es perfecto, el modelo puede no serloAun si el puntaje es perfecto, el modelo puede no serlo. La energía libre (la magnitud física que es mínima para un sistema en equilibrio) no depende solo de los criterios empíricos aquí usados.

● RefinamientoRefinamiento: estados de protonación, solvatación, minimización de la energía, equilibración.

● Tampoco es perfecto, ya que la energía (force force fieldfield) es una función empírica (a menos que se haga cuántico).