Download - Tutorial Prosite.pdf

Transcript
  • 2014

    PROSITE

    UNIVERSIDAD NACIONAL

    AUTNOMA DE MXICO

    FACULTAD DE ESTUDIOS

    SUPERIORES CUAUTITLN

    BIOINFORMTICA

    GRUPO: 2001

    BIOQUMICA DIAGNSTICA

    ALUMNAS:

    CASILLAS SILVA KARINA ITZEL

    PEDRAZA MELNDEZ ANGLICA ITZEL

    PROFESORAS:

    M en C MARITERE DOMNGUEZ

    ROJAS

    pBQD LARISA ANDREA

    GONZLEZ SALCEDO

  • Prosite es una base de datos que proporciona diversa informacin acerca de las

    protenas. Puesto puesto que los datos que maneja resultan un tanto

    complejos, es necesario antes abordar conceptos que sean de utilidad para su

    comprensin e interpretacin.

    Protenas: Conformacin estructural, dominios

    Las protenas son polmeros lineales de aminocidos. Desempean una gran

    cantidad de funciones: estructurales, como el colgeno; transportadoras, como

    la hemoglobina o los citocromos; adems de aquellas funciones catalticas que

    ejecutan las enzimas y que resultan esenciales en la homeostasis del

    metabolismo. En una protena podemos distinguir varios niveles de organizacin.

    Una estructura primaria, que hace referencia a la secuencia de aminocidos

    en la cadena polipeptdica y en la que se incluyen todos los enlaces covalente

    entre diversos residuos; los enlaces peptdicos y los puentes disulfuro.

  • Una estructura secundaria, que se refiere a las disposiciones regulares en el

    espacio de residuos covalentes en la cadena poli peptdica. Ciertas secuencias

    de aminocidos favorecen las hlices o las cadenas , as como giros que

    conectan unas estructuras regulares con otras. Algunos elementos con

    estructura secundaria forman agregados regulares consecutivos que determina

    un nivel de organizacin superior, que denominamos estructura supersecundaria

    o motivos. Algunos de estos se combinan, generalmente, para formar

    compactas estructuras globulares que llamamos dominios.

    Un dominio se define, como una parte de una cadena polipeptdica que puede

    plegarse independientemente en una estructura terciaria estable. Los dominios

    pueden ser tambin unidades de funcin independientes dentro de la

    estructura de las protenas.

    Los motivos de las protenas se pueden clasificar en 3 grupos principales segn

    la manera de conectarse los motivos estructurales.

    Dominios alfa: la parte central est constituida exclusivamente por alfa

    hlice.

    Dominios beta: la parte central est formada por hojas beta

    antiparalelas.

    Dominios alfa/beta formados por combinaciones que constituyen una

    hoja beta paralela rodeada de hlice alfa.

    Los dominios tienen una funcin especfica, como la de unirse a una molcula o

    llevar a cabo reacciones enzimticas. Pueden presentarse claramente

    separados formando zonas lobulares o interaccionar fuertemente con otros

    dominios. La relacin entre la estructura de un dominio y la funcin es

    compleja, a veces una determinada funcin es realizada por un dominio

    individual, mientras que en otras ocasiones la uncin requiere la existencia de

    ms de un dominio.

    Un ejemplo de un dominio son los dedos de zinc. Son un conjunto de pequeos

    motivos estructurales de protenas que pueden coordinar uno o ms iones de

    zinc para ayudar a estabilizar sus pliegues.

  • Un nivel de estructuracin superior a stos es la estructura terciaria, o

    disposicin espacial de todos y cada uno de los tomos que componen la

    molcula. Una protena con una determinada estructura terciaria puede estar

    constituida por uno o varios dominios, que pueden llegar a tener funciones

    especficas y separadas. La estructura terciaria constituye el ltimo nivel de

    organizacin estructural de una protena monomrica.

  • Sin embargo, existen macromolculas oligomricas, formadas por la asociacin

    no covalente de varias cadenas polipeptdicas. Este nivel de jerarquizacin

    superior se llama estructura cuaternaria. Representa, por tanto, la disposicin

    espacial de las diversas subunidades de una protena oligomrica.

  • PROSITE

    Prosite es una base de datos que se compone de una gran coleccin de firmas

    biolgicamente significativas que son descritas como patrones o perfiles. Cada

    firma es vinculada a una documentacin que proporciona informacin biolgica

    til sobre la familia de protenas, o del dominio, sitio funcional identificado por

    la firma.

    La ltima versin de Prosite contiene 1329 patrones y 552 perfiles.

    La informacin que se obtiene de Prosite puede ser origen de su nombre,

    ocurrencia taxonmica, arquitectura del dominio, funcin, estructura en 3D,

    principales caractersticas de la secuencia, tamao del dominio y algunas

    referencias.

    Los patrones o expresiones regulares son herramientas tiles para identificar

    regiones cortas y bien conservadas, tales como los sitios catalticos, sitios de

    unin, modificaciones post-transcripcionales (PTMs) o dedos de zinc.

    Los perfiles son matrices de puntuacin que se encargan de detectar motivos

    similares, es decir, son tablas con scores para cada posicin del motivo y

    penalizaciones por apertura de gaps.

    Prosite tiene una larga experiencia en la documentacin y anotacin detallada

    de los dominios, las familias y los sitios funcionales. Esta informacin se

    almacena principalmente en texto y es usada por los bilogos que leen los

    diversos documentos y toman sus propias decisiones sobre la funcin de su

    protena de inters de acuerdo con las sugerencias de Prosite.

    Prosite coincide en UniProt (UniProtKB) o entradas de PDB que estn ya

    precalculadas y almacenadas en una base de datos relacionada (PostgreSQL)

    que se mantiene en colaboracin con Swiss- Prot.

    Actualmente existen varias herramientas para construir perfiles eficientes

    sobre la base de MSA. Todas estas herramientas se han diseado para

    recuperar protenas muy divergentes.

  • El link de acceso para el sitio de Prosite es:

    http://prosite.expasy.org/

    Al acceder a la pgina se observa de la siguiente forma:

    Prosite ofrece diversos servicios a los cuales se tiene acceso mediante

    pestaas que se encuentran resaltadas en el cuadro de color verde, las cuales

    son: ScanProsite, ProRule, Documents, Downloads, Links Y Funding, estos se

    explican a detalle ms adelante.

    Para realizar una bsqueda se puede utilizar la opcin de Search. En este

    cuadro de bsqueda, representado por el cuadro color rojo, se puede

  • introducir el cdigo de acceso de UniProt, nombre de la protena, dominio, etc.

    As mismo tambin se pueden colocar parmetros de bsqueda como son los que

    se encuentran en el cuadro azul, esto para facilitar la bsqueda de la

    informacin.

    Otra forma de realizar una bsqueda puede ser mediante el ingreso de la

    secuencia proteica en formato FASTA. sta se coloca en el cuadro de

    bsqueda marcado con color morado.

    Prosite en su pgina principal permite el acceso a herramientas como lo son:

    PRATT: permite generar de forma interactiva los patrones conservados a

    partir de una serie de protenas no alineados.

    My domains- Imagine creator: permite personalizar la imagen de los dominios.

    SCAN PROSITE

    Es una herramienta de bsqueda dentro de ProSite que permite buscar por

    formato FASTA o por identificador UniProt, adems tambin permite

    seleccionar el tipo de bsqueda que se desea hacer. Esta consta de 3 opciones:

    Opcin 1 Permite presentar las secuencias de protenas para escanear contra

    la coleccin de motivos de PROSITE.

    Opcin 2 Permite presentar MOTIVOS y escanearlos contra los almacenados

    en esta base de datos.

    Opcin 3 - Presentar las secuencias de protenas y motivos para escanear uno

    contra el otro.

    Para poder llevar a cabo mejor esta bsqueda Prosite gua al usuario por una

    serie de pasos, estos son 3:

  • En el paso 1 es donde se introduce la secuencia de la protena, para esto se

    puede realizar de dos formas: Se puede introducir un mximo de 10 secuencias

    diferentes a comparar o elegir una base de datos con la informacin de las

    secuencias y dada.

    Para facilitar y agilizar este paso se proporciona una serie de ejemplos en la

    forma en que se tienen que introducir estas secuencias, estos ejemplos esta n

    resaltados en color rojo.

    En el paso 2 se seleccionan los parmetros de exclusin para el alineamiento,

    estos son:

    Excluir motivos con una alta probabilidad de ocurrencia

    Excluir a los perfiles del escaneo

    Correr el escaneo con una alta sensibilidad: Ejecuta la exploracin a

    un nivel bajo (muestra coincidencias dbiles).

    Cuadro de bsqueda

    para introducir en

    formato FASTA

  • Por ltimo el paso 3, aqu se seleccionan las opciones de la forma en que se

    presentan los resultados.

    Estos pueden ser: En formato grfico, vista simple, texto, FASTA, tabla.

    PRORULE

    Es una herramienta en la cual se introduce la secuencia en el cuadro de

    bsqueda y se permite elegir la opcin de bsqueda deseada. Existen 6

    opciones de bsqueda proporcionadas por ProRule.

    Las opciones de bsqueda son las que estn resaltadas en un cuadro de color

    verde y son las siguientes:

    by ProRule description: En esta se encuentran enlistadas de forma alfabtica el conjunto de datos que contiene esta base de datos.

    Cuadro

    de

    bsqueda

  • Tambin proporciona el ID (Cdigo de identificacin) y AC (Cdigo de

    acceso), as como una breve descripcin de cada entrada. Se observa de

    la siguiente forma:

    by enzyme class: Clasificacin enzimtica de acuerdo a la establecida en el ao de 1964 por la Comisin de Enzimas de la Unin Internacional de

    Bioqumica. Dividiendo a las enzimas en 6 grandes grupos:

    Al seleccionar uno de los grupos da el acceso a las enzimas que forman

    parte de cada grupo.

    Descripcin ID AC

  • by UniProtKB feature key: Entradas de UniProt que tienen informacin en PROSITE, se muestra el nmero de identificacin de UniProt as

    como su nombre. Se muestra de la siguiente forma:

    by GO term: Permite buscar protenas a partir del componente celular, funcin molecular o por el proceso biolgico en el que participa. Se

    observa de la siguiente forma:

    Al darle click a una de las 3 opciones se despliegan de manera ms detallada

    cada uno de sus componentes.

    Nombre Nmero de identificacin

  • by taxonomic scope: En esta se filtran los resultados de acuerdo a la clasificacin taxonmica.

    by PROSITE entry name: Muestra el nombre de la protena en PROSITE contra la descripcin y numero de acceso que ProRule le asigna. Se

    muestra de la siguiente forma:

    DOCUMENTS

    Son una coleccin de documentos que sirven de gua para el usuario dentro de

    ProSite tal como el manual para el usuario tanto de Prosite como ProRule y

    algunos links a otras pginas.

  • DOWNLOADS

    Se muestran las modificaciones que se han hecho en los ltimos meses a la

    pgina y a los manuales que est ofrece. La forma en que se despliega esta

    opcin es la siguiente:

  • LINKS

    Presenta links a las pginas de las cuales se obtienen recursos e informacin.

    Se muestra de la siguiente forma:

    FUNDING

    Se muestran los principales colaboradores tanto financieros como de recursos

    que ayudaron a la creacin y sustentabilidad de ProSite.

  • BSQUEDA

    Para realizar la bsqueda de una protena se puede realizar mediante el ingreso

    de la secuencia de aminocidos de la protena, o el cdigo de UniProt.

    Posteriormente Prosite te muestra la secuencia completa de aminocidos de la

    protena, en este caso se realiz la bsqueda de la protena BRCA 1:

    Tambin se muestra el nombre de la protena completo Breast cancer type 1

    susceptibility protein, su nombre alternativo RING finger protein 53, as como

    el organismo del que proviene, en este caso Homo sapiens.

  • En esta seccin se muestran los perfiles de los dominios, en qu lugar se

    encuentran y la cantidad de aminocidos, as como un link que permiten acceder

    a otras ventanas para poder encontrar ms informacin acerca de estos

    dominios. En el caso de esta protena contiene 3 dominios:

    2 BRCT: Se encuentra del aminocido 1642-1736y el otro de 1756-1855.

    ZF_RING_2: Zinc finger RING-type: Se encuentra del aminocido 24-

    65.

    En esta parte se muestran los patrones que contiene la protena, en este caso

    solo se encuentra 1:

    ZF_RING_1: Zinc finger RING-type: Se encuentra del aminocido 39-48.

    Su secuencia es: CdHiFCkfCM.

  • Los patrones son secuencias cortas de residuos que se encuentran conservadas

    entre las protenas de diferentes especies.

    Prosite permite obtener informacin ms especfica de los dominios y

    patrones. A continuacin se muestran los datos obtenidos de cada uno de los

    patrones y dominios.

    Zinc finger RING-type (ZN_RING_2)

    Muchas protenas contienen un RING finger el cual tiene un rol muy importante

    en la va de ubiquitinacin. Esta va generalmente involucra 3 tipos de enzimas

    E1, E2, E3. En el caso de la protena BRCA 1, contiene a la enzima E3, la cual es

    responsable del reconocimiento del sustrato.

    Esta es la seccin tcnica del perfil del dominio ZN_RING_2, del cual se puede

    obtener la informacin siguiente:

    Domain architecture view of Swiss-Prot proteins matching PS50089:

    Muestra todas las protenas dentro de Swiss-Prot que poseen el mismo

    perfil del dominio o motivo, de manera grfica. En este caso este dominio

    se encuentra en 1501 protenas diferentes, entre las cuales estn las

    siguientes:

  • Clustal format, color, condensed view: Se muestra el alineamiento de

    secuencias entre especies en la que los aminocidos ms conservados se

    muestran ms oscuros en relacin a los menos conservados que son

    claros.

    Clustal format, color: Se presentan solamente parte de la secuencia del

    domino o motivo de estudio que se encuentra ms conservada. Al igual que

    en el caso anterior los aminocidos ms conservados se muestran ms

    oscuros en relacin a los menos conservados que son claros.

  • Clustal format, plain text: Se presenta solamente parte de la secuencia

    del domino o motivo de estudio que se encuentra ms conservada.

    Fasta format: Presenta cada uno de los alineamientos en formato

    FASTA.

  • En los formatos anteriores los - identifican sitios de ausencia de uno o varios

    aminocidos, los . Identifican los puntos de semiconservacin entre dos

    aminocidos diferentes, y los * identifican a los aminocidos idnticos o

    identidad.

    Retrieve the sequence logo from the alignment: Muestra grficamente

    el grado de conservacin de los aminocidos en un alineamiento entre

    secuencias. Dependiendo el grado de conservacin es el tamao de la

    letra que representa a cada aminocido.

    De acuerdo a los formatos anteriores se puede resumir que los aminocidos que

    se encuentran ms conservados de la protena BRCA 1 son Histidina y Cistena.

    Matching PDB structures: Nos muestra todas las entradas que coinciden

    con la bsqueda y as como informacin del mtodo de obtencin de la

    protena y su estructura en 3D.

  • BRCT domain profile

    El gen de susceptibilidad al cncer de mama contiene en su extremo C-terminal

    dos copias de un dominio conservado que fue nombrado BRCT de BRCA1 C-

    terminal. Este dominio de aproximadamente 95 aminocidos se encuentra en

    una gran variedad de protenas implicadas en la reparacin de ADN,

    recombinacin y control del ciclo celular. El dominio BRCT no se limita a la C-

    terminal de las secuencias de protenas y se puede encontrar en mltiples

    copias o en un solo ejemplar como en RAP1 y TdT. Los datos recientes indican

    que las funciones de dominio BRCT como un mdulo de interaccin protena-

    protena.

  • Esta es la seccin tcnica del perfil del dominio BRCT, del cual se puede

    obtener la informacin siguiente:

    Domain architecture view of Swiss-Prot proteins matching PS50172:

    Este dominio se encuentra en 1005 protenas diferentes, entre las cuales

    estn las siguientes:

  • Clustal format, color, condensed view:

    Clustal format, color:

    Clustal format, plain text:

  • Fasta format:

    Retrieve the sequence logo from the alignment:

    De acuerdo a los formatos anteriores se puede resumir que los aminocidos que

    se encuentran ms conservados de la protena BRCA 1 son Glicina y Arginina.

    Matching PDB structures:

  • Zinc finger RING-type (ZN_RING_1)

    Una serie de protenas eucariticas y virales contienen un dominio rico en

    cistena conservada de 40 a 60 residuos (llamados C3HC4 dedo de Zinc o dedo

    "anillo" ) que se une dos tomos de Zinc. Hay dos variantes diferentes, el tipo

    C3HC4 y el tipo C3H2C3 , que est claramente relacionado a pesar del

    diferente patrn de cistena / histidina. El ltimo tipo se denomina a veces

    como " de tipo dedo RING - H2 " .

  • Esta es la seccin tcnica del perfil del patrn ZF_RING_1 Zinc finger

    RING-type, del cual se puede obtener la informacin siguiente:

    El patrn es: C-x-H-x-[LIVMFY]-C-x(2)-C-[LIVMYA]

    _ Aminocidos conservados.

    _ Cualquier aminocido puede ocupar esta posicin.

    _ Aminocidos que pueden ocupar esta posicin.

    _ Cualquier aminocido puede ocupar las dos posiciones siguientes.

    _ Aminocidos que no pueden ocupar esta posicin.