Cap 2_Bases Moleculares de La Herencia_Castillo
-
Upload
dany-agarcia -
Category
Documents
-
view
187 -
download
5
Transcript of Cap 2_Bases Moleculares de La Herencia_Castillo
Bases moleculares de la herencia
INTRODUCCIÓN
La vida como se conoce está especificada por los geno-mas. Cada organismo posee un genoma que contiene lainformación biológica necesaria para construir y mante-ner un ejemplo viviente de ese organismo. La mayoría delos genomas están constituidos de ácido desoxiribonu-cleico (DNA), a excepción de algunos genomas viralesen los que la información genética está contenida enmoléculas de ácido ribonucleico (RNA). Este capítulo seenfocará al genoma de los organismos eucariontes y enparticular al humano.
En las células eucariontes las moléculas individualesde DNA se encuentran en los cromosomas del núcleo yde manera adicional cada mitocondria posee variascopias de una pequeña molécula de DNA, al igual quelos cloroplastos de las células vegetales. Las principalesfunciones de un genoma son almacenar la informacióngenética, duplicarla para transmitirla de una generacióna otra (replicación), permitir su expresión (transcripcióny traducción), y su capacidad para sufrir cambios (muta-ción) que lleven a evolución. Una mutación es un cam-bio en la secuencia de nucleótidos del genoma que espermanente y heredable.
La información biológica contenida en un genomaestá codificada en la secuencias de nucleótidos de susmoléculas de DNA o RNA y está dividida en unidadesdiscretas denominadas genes. La información contenidaen un gen es leída en posiciones adecuadas que inicianuna serie de reacciones bioquímicas que se conocencomo expresión génica. Este proceso comprende dos eta-pas: transcripción y traducción. En la primera se produ-ce una copia de RNA del gen y la segunda resulta en lasíntesis de una cadena polipeptídica cuya secuencia deaminoácidos está determinada, vía código genético, porla secuencia de nucleótidos del RNA mensajero(mRNA). El dogma central, propuesto en 1956 por F.Crick, establece el flujo de la información genética deDNA a DNA, de DNA a RNA, y de RNA a proteínas.En los retrovirus, virus con genomas de RNA, la informa-
ción genética fluye de RNA a DNA durante la conver-sión de los genomas virales a sus progenomas celularesde DNA. Este proceso, conocido como transcripcióninversa (reversa), es catalizado por la enzima transcrip-tasa inversa. Otro flujo posible de la información genéti-ca es de RNA a RNA, proceso que permite replicar losgenomas presentes en la mayoría de los virus de RNA(figura 2-1).
La transcripción genera diferentes tipos de moléculasde RNA, clasificadas en dos grupos principales: RNAcodificantes y RNA no codificantes (ncRNA). LosmRNA son los únicos que contienen una secuencia quepuede ser decodificada para generar una molécula poli-peptídica. Los ncRNA no sirven como molde para sinte-tizar polipéptidos y están implicados tanto en el procesode la expresión génica como en su regulación.
En todos los seres vivos los genomas están constitui-dos por moléculas de DNA de doble cadena. La cadenade DNA que tiene la misma secuencia que la moléculade RNA se nombra como cadena sentido, mientras quela que sirve como molde o templado para la transcrip-ción es la antisentido. Para que una secuencia de DNApueda ser transcrita requiere de una secuencia específicade nucleótidos, llamada promotor. Cuando se transcribenambas cadenas de una molécula de DNA, al transcritoresultante de la cadena sentido se le llama RNA antisen-tido. Para que una molécula de RNA pueda ser traduci-da debe tener un marco de lectura abierto (ORF, openreading frame), esto es contener un codón de inicio parala síntesis proteica y continuar con codones para almenos 100 aminoácidos, antes de la presencia de uncodón de paro. Dado que no existe puntuación en elcódigo genético toda molécula de DNA puede tenerpotencialmente 6 diferentes marcos de lectura, tres paracada molécula de RNA, sentido y antisentido. LosmRNA incluyen en su parte central un ORF y en susextremos se encuentran secuencias que no se traducen yse conocen como UTR 5’ y 3’ (untranslated regions), yque son importantes en la estabilidad y unión de losmensajeros a los ribosomas para su traducción.
Alicia B. Cervantes Peredo, Marisol López López, Diego J. Arenas Aranda, Rosenda I. Peñaloza Espinosa
© E
dito
rial E
l man
ual m
oder
noFo
toco
piar
sin
aut
oriz
ació
n es
un
delit
o.
1
2
En la mayoría de los eucariontes las regiones codi-ficantes, tanto para polipéptidos como para moléculasde ncRNA, están interrumpidas en segmentos deno-minados exones separados por secuencias de interven-ción no codificantes llamadas intrones. Ambos tiposde secuencias son transcritas a partir de la secuenciadel gen y, a continuación, los transcritos primarios sonprocesados para obtener las moléculas de RNA madu-ras o funcionales. Durante la transcripción de losgenes que codifican para polipéptidos, se sintetizantranscritos primarios o RNA premensajeros, tambiénllamados RNA heteronucleares (hnRNA). A conti-nuación los transcritos primarios son procesados en elnúcleo para remover los intrones y empalmar a losexones, generando RNA maduros que son transporta-dos al citoplasma en donde los mRNA son traducidosa polipéptidos.
De forma clásica un gen había sido visualizadocomo una unidad hereditaria constituida por unasecuencia nucleotídica de DNA o RNA que contienela información biológica que codifica para un produc-to de RNA o para un polipéptido, e incluye las regio-nes que están implicadas en regular su transcripción ytraducción. Sin embargo, en una región genómica,pueden ser transcritas ambas cadenas de la moléculadel DNA, lo que implica que haya genes traslapadoscon direcciones opuestas de transcripción. Por otraparte, debido a que en una misma cadena puedenemplearse varios ORF generando diferentes productosy al uso alternativo de exones, entre otros mecanis-mos, los genes humanos por lo común codifican paravarios productos funcionales, que pueden ser ncRNA,polipéptidos o ambos. Por ello, la definición de gendebe permanecer como un término flexible y adaptar-se a los nuevos datos científicos.
ESTRUCTURA DE LOS ÁCIDOS NUCLEICOS: DNA Y RNA
Las moléculas de DNA y RNA están formadas por cadenasde polinucleótidos unidos por enlaces fosfodiéster y cadanucleótido consta de una base nitrogenada, un azúcar y ungrupo fosfato. Las bases nitrogenadas son derivadas de lapurina, adenina (A) y guanina (G) o de la pirimidina, cito-sina (C), timina (T) y uracilo (U). Las cuatro primeras seencuentran en el DNA, y la timina es reemplazada por eluracilo en el RNA. Las bases nitrogenadas se unen con unapentosa formando un nucleósido. En el RNA, el azúcar esla ribosa y en el DNA es la 2’-desoxiribosa. Los átomos delos anillos de las pentosas se designan con números primospara distinguirlos de los de las bases. La unión entre la basey el azúcar es un enlace N - glucosídico, que se estableceentre el N1 de las pirimidinas o el N9 de las purinas y laposición 1’ de la pentosa. Los nucleótidos se forman por launión de un grupo fosfato a cada nucleósido en el carbono5 del azúcar. Para formar una cadena de polinucleótidos, elgrupo 5’- fosfato de un nucleótido se une de manera cova-lente formando un enlace fosfodiéster con el grupo 3’-hidroxilo de la pentosa de otro nucleótido. Por lo tanto, unacadena de polinucleótidos tendrá un grupo 5’ -fosfato libreen un extremo y un grupo 3’- hidroxilo libre en el otro. Estopermite determinar la polaridad de cada cadena que puedeir de 5’ ! 3’ ó de 3’ ! 5’ (figura 2-2).
En una célula, por lo general las moléculas de RNAexisten como moléculas de una sola cadena, mientrasque la estructura del DNA es una doble hélice compues-ta por dos cadenas antiparalelas de polinucleótidos. Laestructura tridimensional de la doble hélice del DNA fuepropuesta en 1953 por J. Watson y F. Crick. Para ello, sebasaron en tres evidencias fundamentales:
DNA
RNA
Proteína
Ribosomas
DNA
Núcleo
Citoplasma
Exón Intrón5´CAP-
5´CAP-
hnRNA
AAAAAA-3
AAAAAA-3
ProteínaPéptido naciente
5´- -3´
5´CAP- AAAAAA-3mRNA
Recopilación
TranscripciónTranscripción inversa
Replicación
Traducción
Figura. 2-1. Dogma Central de Biología Molecular. Flujo de la información genética en una célula eucarionte.
2 Genetica clínica
© E
dito
rial E
l man
ual m
oder
noFo
toco
piar
sin
aut
oriz
ació
n es
un
delit
o.
Bases nitrogenadasPurinas
Adenina (A)
Piremidinas
Citosina (C) Timina (T) Uracilo (U)
Doble hélice de DNA
2 desoxirribosa RibosaNucleósido
Nucleoótido
N
N N
NH
O
NH2
NH2
N
N N
NH
H
HN
NO
OCH3
H
NH2
N
H
H
NO O
O
H
H
H N
N
OHOCH2
H
H H
H
H
OH
OH
OHOCH2
H
H H
OH
H
OH
OH
OHOCH2
H
H H
H
H
N
OH
N
H
H
O
NH2
O
H
H H
H
H
N
OH
N
H
H
O
NH2
CH2
R O P OO
O
Complementariedad entre las bases del DNA
N
N
N
N
N
NN
N
H
H
H
H
H
O
O
Guanina Citosina
N
N
N N
NN H
H
O
ON
H
Timina Adenina
5´ 3´
T A
C G
T A
C G
C G
T A
T A
C G
T A
C G
T A
C G
T A
Esqueletoazúcar-fosfato
Paresde bases
0.34 nm
Surco menor
Surco mayor
2.0 nm
3.4 nm
Figura 2-2. Componentes estructurales de los ácidos nuclei-cos y estructura de la doble hélice del DNA.
Bases moleculares de la herencia 3©
Edi
toria
l El m
anua
l mod
erno
Foto
copi
ar s
in a
utor
izac
ión
es u
n de
lito.
1. El conocimiento de que la molécula de DNA estabacompuesta de bases nitrogenadas, azúcares y grupos fos-fatos unidos en una cadena de polinucleótidos.
2. Los resultados de los experimentos de E. Chargaff, quedemostraron que en moléculas de DNA de diferentesorganismos, la cantidad de adenina siempre era igual a lade timina y la cantidad de guanina a la de citosina; por loque en una molécula de DNA la cantidad de purinassiempre es igual a la de pirimidinas (reglas de Chargaff).
3. Las fotografías de difracción de rayos X de fibras deDNA, realizadas por R. Franklin y M.Wilkins, que mos-traban que la molécula de DNA estaba organizada enuna estructura helicoidal dextrógira altamente ordenadacon dos periodicidades, una de 0.34 nm y otra de 3.4 nma lo largo de toda la hélice, la cual tenía un diámetroconstante de 2 nm.
En la doble hélice de DNA los azúcares y grupos fos-fatos quedan en el exterior de la molécula, formandoun polianión debido a las cargas negativas de los gru-pos fosfato, mientras que las bases nitrogenadas, denaturaleza hidrofóbica quedan en el interior de lahélice, orientadas paralelas entre sí y perpendicularescon respecto a un eje central de la molécula del DNA.Las cadenas se mantienen unidas por puentes dehidrógeno entre las bases nitrogenadas complementa-rias: A con T mediante dos puentes de hidrógeno y Ccon G formando tres (figura 2-2).
La estructura descrita antes corresponde a la formaB (DNA B), que se encuentra más en las condicionesfisiológicas en las células procariontes y eucariontes.Sin embargo, el DNA puede adoptar diferentes tiposde estructuras dextrógiras dependiendo del grado dehidratación (DNA A, C, D y E). Una forma más, elDNA Z, es la única con giro hacia la izquierda cada 12pares de bases y sólo se forma con una secuencia alter-nada de purina y pirimidina, por lo general GC. ElDNA Z existe en las células en ciertas regiones ricas
en GC. Se han reconocido proteínas que interaccio-nan con estructuras de DNA-Z por lo que éste pare-cería ser un mecanismo más de regulación de laexpresión génica.
Las moléculas de RNA forman estructuras de doblehélice intracadena por apareamiento entre adenina yuracilo, y entre guanina y citosina, generando estructurastallo-asa; estas estructuras se observan en todos los RNA,y son necesarias para que realicen sus funciones. Tambiénel RNA puede aparearse con el DNA (como ocurredurante la transcripción) o con una segunda molécula deRNA (p. ej., durante la remoción de intrones). En algu-nas regiones del genoma, como en una pequeña regióndel DNA mitocondrial (mtDNA) humano o en los teló-meros de los cromosomas humanos, las moléculas deDNA pueden formar estructuras de triple hélice, forma-das por tres cadenas de polinucleótidos. De manera adi-cional pueden encontrarse apareamientos no usualesentre las bases nitrogenadas como los cuartetos de gua-nina o apareamiento de Hoogsteen presentes en los teló-meros humanos.
ESTRUCTURA Y ORGANIZACIÓN DELGENOMA HUMANO
De todos los genomas existentes, el nuestro es el quereviste una mayor relevancia e interés en el área de lagenética médica. El genoma humano está compuestopor dos genomas: un genoma nuclear complejo queconstituye 99.9995% de la información genética totaly un genoma mitocondrial simple que aporta el0.0005% restante. El genoma nuclear haploide estáconstituido por 3200 Mb (mega bases) y cada una delos 13 millones de células que componen el cuerpohumano contiene básicamente la misma secuencia denucleótidos (cuadro 2-1).
Cuadro 2-1. Características principales del genoma nuclear y mitocondrial humanoCaracterística
TamañoN° de moléculas de DNA diferentesN° total de moléculas por célulaProteínas asociadas
N° de genes que codifican para proteínasN° de genes para ncRNADensidad génicaDNA repetitivoTranscripción
IntronesPorcentaje de DNA que codifica paraproteínas
Uso de codones
Recombinación
Herencia
Genoma mitocondrial16.6 kbUna molécula DNA circularVarios miles (varía por tipo celular)Casi libre de proteínas
13241/0.45 kbMuy pocoTranscritos multigénicos se producen deambas cadenas, pesada y ligeraAusentes~ 66%
60 codones para aminoácidos y 4 codonesde alto UAG, UAA, AGA y AGGNo evidente
Exclusivamente materna
Genoma nuclear3.1 Gb23 (células XX) o 24 (células XY)46 en células diploide, 23 en gametosVarias clases de proteínas histonas y nohistonas~ 21,000Desconocido, actualmente ~ 6,000~ 1/120 kb, no conocido> 50 % del genoma Transcripción individual de la mayoría de los genesPresentes en la mayoría de los genes~ 1.1%
61 codones para aminoácidos y 3 codonesde alto UAG, UAA, y UGA Al menos un evento para cada par dehomólogos durante la meiosisMendeliana para los genes en el X yautosomas, paterna para los genes del Y
Gb = 109 pares de bases. kb = 103 pares de bases.
4 Genetica clínica
© E
dito
rial E
l man
ual m
oder
noFo
toco
piar
sin
aut
oriz
ació
n es
un
delit
o.
Bases moleculares de la herencia 5©
Edi
toria
l El m
anua
l mod
erno
Foto
copi
ar s
in a
utor
izac
ión
es u
n de
lito.
Genoma nuclearEl genoma nuclear humano se encuentra dividido en 24moléculas lineales de DNA de doble cadena, la más cortade 50 Mb y la más larga de 263 Mb, cada una contenidaen un cromosoma diferente. La cromatina es la estructu-ra macromolecular compleja formada por DNA, RNA yproteínas que forma los cromosomas de las células euca-riontes. La eucromatina tiene una estructura relativa-mente descondensada y en ella se encuentran las secuen-cias transcripcionalmente activas, a diferencia de la hete-rocromatina que está altamente condensada y puede serconstitutiva o facultativa. El contenido de pares G-C(G+C) promedio del componente eucromático delgenoma nuclear humano es 41%, sin embargo, existe unavariación considerable entre los cromosomas, desde 38%(G+C) en los cromosomas 4 y 13 hasta 49% (G+C) enel cromosoma 19. La composición de nucleótidos tam-bién varía a lo largo de cada cromosoma, lo que se mani-fiesta con propiedades de tinción diferentes (bandas).Interesantemente, la proporción del dinucleótido CpG,es decir una citosina adyacente a una guanina en lamisma cadena en dirección 5’!3’, se encuentra en elgenoma con una frecuencia cinco veces menor a la espe-rada de acuerdo al contenido de G+C. En el DNA demamíferos, las citosinas de los dinucleótidos CpG estánmetiladas en el carbono 5, produciendo 5-metil citosina(5mC) en ambas cadenas del DNA. A través de la evo-lución la desaminación gradual de los residuos de 5mCllevó al cambio de CpG por TpG, lo que explica su bajafrecuencia. Estos dinucleótidos metilados constituyenpuntos calientes para mutaciones en el genoma humano.En contraste, ciertas regiones del genoma contienen unadensidad mayor de secuencias CpG y reciben el nombrede islas CpG. Éstas por lo general se encuentran en losextremos 5’ (promotor o primer exón) de la mayoría delos genes de mantenimiento celular, tienen un contenidode GC mayor de 50%, abarcan 1 a 2 kb y se encuentrandesmetiladas para permitir la transcripción de los genesadyacentes.
En el genoma humano nuclear la densidad génicavaría considerablemente en las regiones cromosómicas.Esto fue inferido a partir de los patrones de bandas de loscromosomas metafásicos. A continuación, la hibridaciónde fracciones purificadas de islas CpG sobre los cromo-somas corroboró que la densidad génica mayor seencuentra en las regiones subteloméricas, existiendo cro-mosomas ricos en genes como el 19 y el 22, y otrospobres como el 4. 18, X y Y. Estos datos fueron a conti-nuación confirmados por el análisis de la secuencia delgenoma humano.
En la actualidad se asume que el genoma humanonuclear contiene alrededor de 20 000 genes codifican-tes para proteínas (1.1% del genoma nuclear) y almenos 6 000 genes codificantes para moléculas fun-cionales de ncRNA, dando un total de 26 000 genes.Sin embargo, este número debe ser tomado de mane-ra provisional. Es interesante señalar que aunque laporción traducida del genoma es muy pequeña, unaparte importante de él se transcribe, ésta incluye a losintrones de los genes que codifican para proteínas,(alrededor de 26% del genoma) y muchas otrassecuencias cuya función aún se desconoce.
Los genomas eucariontes contienen DNA con secuen-cias de bases que se repiten en grado variable y que vandesde secuencias de copia única, hasta secuencias alta-mente repetitivas. Las secuencias de copia única o debajo número de copias comprenden cerca de 40% delgenoma humano. El resto, corresponde a secuencias deDNA moderada o altamente repetitivas. Éstas puedenencontrarse repetidas en tándem, agrupadas en unaregión particular o dispersas por todo el genoma.
Genes que codifican para polipéptidosLa mayoría de los genes que codifican para cadenas polipep-tídicas se encuentran en las secuencias de copia única. Pocospolipéptidos humanos están codificados por dos o máscopias de un gen. Cuando esto ocurre, con frecuencia estáncodificados por genes que se han duplicado y tienen estruc-turas y funciones similares por la subsecuente divergenciaevolutiva. Algunos se agrupan en regiones cromosómicasespecíficas (clusters), mientras que otros están dispersos en elgenoma constituyendo las familias multigénicas. Éstas pue-den ser de dos tipos: las familias génicas clásicas que mues-tran un alto grado de homología en sus secuencias y funcio-nes, y las superfamilias génicas que tienen una limitadahomología en sus secuencias, pero que están de manera fun-cional relacionadas. Los genes de familias génicas clásicas queproducen proteínas tanto con similitud funcional comoestructural tienden a estar agrupados. Algunos ejemplos sonlos agrupamientos génicos de "-globina en el cromosoma16p y de #-globina en 11p, o la familia génica HOX (home-obox) que consiste en agrupamientos de cerca de 10 genes encuatro cromosomas. Las superfamilias de los genes, que estánrelacionados de manera distante en la evolución, tienden asituarse de manera dispersa en diferentes localizaciones cro-mosómicas. Por ejemplo, los genes que codifican para la insu-lina (cromosoma 11p) y su receptor (19p).
Genes que codifican para moléculas dencRNAAlgunos genes nucleares codifican para moléculas madu-ras de ncRNA con diversas funciones. Entre ellas estánlos que participan en el proceso de la expresión génicaque incluye a los RNA ribosomales (rRNA) y a los RNAde transferencia (tRNA), implicados en la traducción delmRNA. Existen múltiples genes para rRNA, las molécu-las 28S, 18S y 5.8S de los rRNA citoplásmicos estáncodificados en una sola unidad transcripcional que serepite en tándem 250 veces, comprendiendo cinco gru-pos de aproximadamente 50 repetidos localizados en losbrazos cortos (p) de todos los cromosomas acrocéntricoshumanos 13, 14, 15, 21 y 22. El rRNA 5S citoplásmicoestá codificado por varios cientos de copias génicas en 3regiones del brazo largo (q) del cromosoma 1. Los genespara los tRNA pertenecen a una gran familia génica dis-persa que comprende más de 49 subfamilias diferentes,cada una con varios miembros que codifican para lasdiferentes especies de tRNA (cuadro 2-2).
Los ncRNA incluyen a los RNA pequeños nucleares(snRNA) (small nuclear) implicados en especial en elproceso de remoción de intrones, así como a un grannúmero de microRNA (miRNA) y RNA pequeños
nucleolares (snoRNA) (muchos, sino la mayoría de loscuales aún no han sido identificados), así como tambiénotras clases de RNA pequeños reguladores (< 200 nt), ydecenas de miles de trascritos largos (> 200nt), incluyen-do patrones complejos de transcritos sentido y antisenti-do sobrelapados, de los cuales se ignora su función en lamayoría de los casos y a los que se les conoce como TUF(transcript unknown function). Otros genes codificanncRNA con funciones diferentes, como el RNA 7SL quees un componente de la partícula de reconocimiento delpéptido señal requerido para la exportación de proteínasy TERC que codifica para el componente de RNA de la
telomerasa, la enzima necesaria para la síntesis de DNAen los telómeros. Los ncRNA, incluyendo muchos deri-vados de intrones, parece que componen una plataformaoculta de señales internas que controlan en varios nive-les la expresión génica desde la arquitectura de la croma-tina a la memoria epigenética (Anexo regulación epige-nética y por RNAi).
Seudogenes y genes procesadosExisten secuencias en el genoma que tienen una gransimilitud con genes conocidos, pero que no son funcio-
Cuadro 2-2. Tipos de RNA no codificante (ncRNA) humano y sus funciones
ClaseRNA ribosomal (rRNA)~120 a 5 000 nt
RNA transferencia (tRNA)~70 a 80 nt
RNA pequeño nuclear (snRNA)~60 a 360 nt
RNA pequeño nucleolar (snoRNA) ~60 a 300 nt
ClaseMicroRNA (miRNA) ~22 ntPiwi RNA (piRNA) ~ 24 a 31 nt
RNA pequeños de cuerpos de cajal (scaRNA)RNA pequeño interferente (siRNA)~ 21 a 22 nt
RNA antisentido
FuncionesComponentes en ribosomas de mitocondriasComponentes en ribosomas del citoplasmaUnión a los codones del mRNA mitocondrialUnión a los codones del mRNA citoplásmico
Componentes principales del complejo removedor deintrones y empalmador de exonesComponentes menores del complejo removedor deintrones y empalmador de exonesTerminación transcripción mRNA histonas.
Metilación sitio específica de 2’ OH de rRNAModificación específica de rRNA por formación depseudouridinaProcesamiento de rRNAImplicados en regulación de expresión, incluyendo RNAi
FuncionesRegulación expresión, RNAiDefensa contra transposones en línea germinalprincipalmenteMaduración de ciertas clases de snRNA en cuerpos decajal del núcleoDerivados de pseudogenes y repetidos invertidos,regulación de la expresión génica
Inicio inactivación cromosoma XTranscrito antisentido, apagado de XIST en X activo
Apagado alelo materno de IGF2Apagado de varios alelos paternos
Apagado de genes HOXRegulación de MSX1
Componente de la telomerasa, templado para la síntesisde DNA teloméricoRegulador negativo de la elongación por RNA polimerasa IIComponente de la partícula de reconocimiento (SRP)para el transporte de proteínas de secreción en retículoendoplásmico
Procesamiento de los tRNA nuclearesCo-activador de algunos receptores de esteroidesFamilia transcritos específica de testículo
Ejemplos12S y 16S rRNA28S, 5.8S, 18S y 5S rRNA22 tipos tRNA mitocondriales49 tipos tRNA citoplásmicosMuchos, incluyendoU1, U2, U4, U5 y U6 snRNA
U5, U4atac, U6atac,U11 y U12 snRNA
U7 snRNAMás de 100 tipos diferentes80 snoRNA con caja C/D15 snoRNA con caja H/ACA
U3 y U8 snoRNAMuchos más
Ejemplos~ 1 000 tipos> 15 000
~ 25 tipos
Endógenos >10 000
XIST RNA (19.3 kb)TSIX RNA (37.0 kb)
H19 RNA (2.3 kb)KCNQOT1 (59.5 kb)desconocido > 1500HOTAIR (2.2 kb)Antisentido MSX1
RNA telomerasa (TERC)
7SK RNA7SL RNA
RNasa P SRA1 RNATTY2 RNA
Principales tipos implicados en la expresión génica
Otras clases de ncRNANo codificantes pequeños < 200nt
No codificantes pequeños < 200ntRelacionados con inactivación del cromosoma X
Relacionados con el establecimiento de impronta
Misceláneos ~ 80 a 500 nt
nt= nucleótido.
6 Genetica clínica
© E
dito
rial E
l man
ual m
oder
noFo
toco
piar
sin
aut
oriz
ació
n es
un
delit
o.
Bases moleculares de la herencia 7©
Edi
toria
l El m
anua
l mod
erno
Foto
copi
ar s
in a
utor
izac
ión
es u
n de
lito.
nales y que se denominan seudogenes. Estas secuenciasson producto de eventos de duplicación génica, las cua-les adquieren mutaciones en regiones codificantes oregulatorias que las vuelven defectuosas, lo cual resultaen un pseudogén convencional o no procesado. Porejemplo, existe un pseudogén para "-globina y tres de #-globina en sus respectivos agrupamientos. En otros casosexisten varios seudogenes localizados en cromosomasdiferentes, como para el gen NF1 (neurofibromatosistipo 1) del que hay al menos 11 seudogenes distribuidosen cromosomas diferentes, incluso algunos de ellos loca-lizados en regiones pericentroméricas. Otras copias géni-cas defectuosas pueden tener sólo algunas porciones delas secuencias génicas, algunas veces un solo exón, y sedescriben como fragmentos génicos. De manera alterna-tiva, existen seudogenes procesados, los cuales quizá seoriginaron por la inserción en el genoma de secuenciasde DNA complementario o copia (cDNA) producidaspor la acción de la transcriptasa inversa sobre un mRNAtranscrito a partir de un gen funcional (retrotransposi-ción). Al provenir de moléculas de cDNA los seudogenesprocesados carecen de intrones. Debido a que la reinser-ción de los seudogenes procesados ocurre en posicionesal azar, rara vez se encuentran dentro de agrupamientosde familias multigénicas por lo que por lo general estándispersos en el genoma. Es interesante señalar que enalgunos casos este proceso ha generado genes procesa-dos o retrogenes que mantienen un ORF funcional y quepueden expresarse por poseer promotores internos oquedar bajo el control de secuencias en la zona de inser-ción. Un ejemplo de retrogén es el gen SRY del cromo-soma Y responsable de la diferenciación testicular enmamíferos, cuyo homólogo en el cromosoma X, SOX3,si presenta intrones. Es importante señalar que aunquelos seudogenes y los seudogenes procesados no tengan unproducto proteico funcional, una proporción significati-va de ellos se transcribe, y aun cuando esto no es sufi-ciente para indicar si tienen una función biológica signi-ficativa, los datos actuales muestran que esta transcrip-ción se realiza en un nivel bajo y con un patrón específi-co de tejido o línea celular, lo cual podría generar ncRNAfuncionales.
DNA no codificante altamente repetidoEl genoma humano nuclear contiene una gran cantidadde familias de secuencias altamente repetidas. Al igualque las familias multigénicas, el DNA repetitivo no codi-ficante muestra dos tipos principales de organización:repetido en tándem y repetido disperso (cuadro 2-3).
DNA no codificante repetido en tándem. Las secuen-cias de DNA repetidas en tándem consisten en bloquesde DNA no codificante que tienen una localización pre-cisa en el genoma. Este tipo de secuencias se puedensubdividir en tres clases de acuerdo a su extensión y altamaño de la unidad de repetición: DNA satélite, mini-satélite y microsatélite (cuadro 2-3).
Cuando se fracciona el DNA por sedimentación en ungradiente de densidad, las secuencias altamente repetidasen tándem forman bandas satélites con respecto a lospicos principales del DNA genómico. Este DNA seconoce como DNA satélite y está formado por series lar-gas de cientos de kilobases (kb) de repetidos en tándem
de 5 a 171 pb. La mayor parte del DNA satélite se loca-liza en los centrómeros de todos los cromosomas (hete-rocromatina constitutiva pericentromérica), por lo quese ha sugerido que tenga una función estructural. Otrostipos de secuencias de DNA satélite no pueden ser iden-tificados mediante centrifugación en gradientes de den-sidad. Se identificaron al inicio por la digestión de DNAgenómico con una endonucleasa de restricción que típi-camente tiene un sitio de reconocimiento en la unidadde repetición básica de 171pb presente en todos los cen-trómeros humanos. Estas secuencias alfa satélite o DNAalfoide constituyen la mayor parte de la heterocromati-na centromérica, existiendo por divergencia evolutivasecuencias específicas de cada cromosoma.
El DNA minisatélite comprende dos familias desecuencias cortas de DNA: la telomérica y la hipervaria-ble. Las secuencias repetidas teloméricas son necesariaspara mantener la integridad de los cromosomas durantela replicación y son añadidas por una enzima especializa-da denominada telomerasa. Además actúan protegiendode degradación y pérdida de material genético a losextremos de los cromosomas y son responsables de lafunción de los telómeros (Anexo Telómero). El DNAminisatélite hipervariable se localiza por lo común enregiones subteloméricas, aunque también se halla enotras regiones del genoma incluidos intrones, y es alta-mente polimórfico por lo que utiliza para la identifica-ción de individuos (huellas de DNA) (Anexo Variacióngenética humana). Las secuencias de DNA microsatélitese localizan a lo largo de todo el genoma, también sonaltamente polimórficas y se utilizan como marcadoresgenéticos en estudios de evolución, ligamiento génico yhuellas de DNA (anexo variabilidad humana). Algunosse encuentran en regiones intragénicas y sus variacionesse asocian con la etiopatogenia de un grupo de padeci-mientos conocidos como enfermedades por amplifica-ción de microsatélites (Anexo Mutación y enfermedad).
DNA no codificante repetido disperso. En el genomahumano también se encuentran secuencias de DNA nocodificante altamente repetido que se encuentran dispersasen todo el genoma y que se denominan repetidos dispersoso interespaciados. La mayor parte de este tipo de repetidoshan derivado de transposones (secuencias de DNA móvilesque pueden migrar a diferentes regiones del genoma) y seha reconocido que más de 40% del genoma humano perte-nece a esta clase. Con base en la forma de transposición sepueden clasificar en dos grupos: retrotransposones y trans-posones de DNA (cuadro 2-3).
El mecanismo de transposición en los retrotransposo-nes o retroposones es similar al que genera seudogenesprocesados y retrogenes: una trasncriptasa inversa con-vierte al transcrito de RNA del retrotransposón en uncDNA que se integra en diferentes posiciones del DNAgenómico, generando nuevas copias del mismo. Tres cla-ses de transposones de humanos utilizan este mecanismode copia y pegado: los elementos nucleares interespacia-dos largos, LINE (Long Interspersed Nuclear Elements),los elementos nucleares interespaciados cortos, SINE(Short Interspersed Nuclear Elements), y los elementostipo retrovirus que contienen repetidos terminales lar-gos, retrotransposones LTR (Long Terminal Repeats). Losretrotransposones pueden ser autónomos o no autóno-mos. Por otro lado, los transposones de DNA migran de
manera directa sin necesidad de copiar la secuencia: lasecuencia se escinde y se reinserta en otro sitio del geno-ma (mecanismo de corte y pegado o conservativo).
El tipo más común de la familia LINE son las secuen-cias LINE1 o L1. En humanos, esta familia es la únicaque continúa teniendo miembros activos que contienendos ORF. El ORF1 (1kb) codifica para una proteína deunión a RNA (P40) y el ORF2 (4kb) codifica para unaproteína con un dominio de endonucleasa y otro domi-nio de transcriptasa inversa; ambos transcritos provienende un promotor interno en el UTR 5’. La familia ALU esla más prominente de las SINE, el nombre de esta fami-lia se debe a que fue originalmente identificada median-te la enzima de restricción AluI. Estas secuencias se ori-ginaron por un evento de retrotransposición del gen quecodifica para el RNA 7SL y que retuvo el promotorinterno para la RNA polimerasa III. Estas secuencias setranscriben activamente aun cuando carecen de unmarco de lectura abierto. Los miembros de la familia Aluestán flanqueados por secuencias repetidas directas de 6a 18 pb, por lo que se asemejan a los transposones clási-cos de DNA. Tanto los repetidos Alu como los LINE1
pueden promover eventos de recombinación homólogano alélica, lo cual lleva a duplicaciones, deleciones oinversiones que conducen a mutaciones patogénicas, oque proveen una ventaja selectiva en la evolución. Estoseventos de recombinación anormales pueden ocurrirtanto intra como intercromosomas (Anexo Mutación yenfermedad).
Genoma mitocondrialEl genoma mitocondrial humano está definido por unsolo tipo de molécula de DNA circular cerrada cuyasecuencia completa de nucleótidos fue establecida en1981. Tiene 16, 569 bp y 44% de G + C. Las dos cade-nas tienen una composición de bases diferente: la cade-na pesada (H) es rica en guaninas y la cadena ligera (L)en citosinas. A pesar de que el genoma mitocondrial esbásicamente de doble cadena existe una pequeña regiónen la cual es de triple hélice. Esto es debido a que un seg-mento corto de la cadena pesada es replicado en unsegundo tiempo, dando una estructura conocida comoDNA 7S o asa de desplazamiento (asa D). Las células
Cuadro 2-3. Principales clases de DNA humano altamente repetidoSecuencias repetidas en tándem (~7% del genoma nuclear humano)
Clase
DNA satélite" (DNA alfoide)# (familia Sau3A)Satélite 1
Satélite 2
Satélite 3DYZ19DYZ2DNA minisatéliteTeloméricoHipervariable
DNA microsatélite
Clase
LINE
Familia L1Familia L2Familia L3SINE
Familia AluMIRMIR3Transposones LTRFamilias HERVMaLRTransposones DNAMER1 (Charlie)MER2 (Tigre)Otros (ej. marino)
Tamaño de la unidad repetida
5 a 171 bp171 bp68 bp25 a 48 bp (rico A a T)
Formas divergentes de ATTCC/GGAATATTCC/GGAAT125 pbRico en A a T
TTAGGG9 a 64 bp
1 a 4 bp
N° de copias en elgenoma (%)
~ 1 000 000 (20%)
~ 600 000 (17%)~ 370 000~ 44 000~ 1 750 000 (13%)
~ 1 200 000 (12%)~ 450 000~ 85 000~ 600 000 (9%)~ 240 000 (4.6%)~ 285 000 (4%)~ 330 000 (3%)~ 213 000~ 68 000~ 60 000
Localización cromosómica
Asociado con heterocromatina constitutivaHeterocromatina centromérica de todos los cromosomasHeterocromatina centromérica del 1, 9, 13, 14, 15, 21, 22, YHeterocromatina centromérica de la mayoría de los cromosomas y otras regiones heterocromáticasLa mayoría, posiblemente todos los cromosomas
Brazos p acrocéntricos y heterocromatina en 1q, 9q y Yq12~ 400 kb en Yq11Yq12, periodicidad mayor de ~ 2470 bpEn o cerca de todos los telómerosTodos los telómerosTodos los cromosomas, regiones eucromáticas, ynotablemente en regiones subteloméricasAmpliamente distribuido a lo largo de todos los cromosomas
Localización cromosómica
Preferencialmente en bandas G oscuras, regiones ricas en A a T
Preferencialmente en bandas G claras, regiones ricas enG a C
Dispersas en todos los cromosomas
Dispersas en todos los cromosomas
Tamaño (% del genoma)
Cientos de kb (6.5%)
0.1 a 20 kb
< 100 bp
Tamaño
6 a 8 kb
100 a 400 bp
1.5 a 11kb6 a 11 kb1.5 a 3 kb80 bp a 3 kb
bp= pares de bases. kb= kilo pares de bases.
Secuencias repetidas dispersas (~45% del genoma nuclear humano)
8 Genetica clínica
© E
dito
rial E
l man
ual m
oder
noFo
toco
piar
sin
aut
oriz
ació
n es
un
delit
o.
Bases moleculares de la herencia 9©
Edi
toria
l El m
anua
l mod
erno
Foto
copi
ar s
in a
utor
izac
ión
es u
n de
lito.
humanas por lo regular contienen miles de copias de lamolécula de DNA mitocondrial, mtDNA. A pesar deque la molécula de mtDNA es sólo 1/8 000 de un cro-mosoma, en una célula nucleada humana el genomamitocondrial constituye 0.5% del DNA total. En ovoci-tos maduros existen más de 100 000 copias del DNAmitocondrial, por lo que en este caso comprende la ter-cera parte del contenido del DNA celular total.
Al contrario de lo que ocurre con el genoma nuclearhumano, 93% del mtDNA corresponde a secuencias conproductos funcionales. Contiene 37 genes, de ellos, 24codifican para ncRNA: 22 moléculas de tRNA y dosmoléculas de rRNA, uno 16S (componente de la subu-nidad grande del ribosoma mitocondrial) y otro 12S(componente de la subunidad pequeña del ribosomamitocondrial). Los 13 genes restantes codifican para 13polipéptidos que forman parte de los complejos mul-tienzimáticos de la fosforilación oxidativa (sistemaOXPHOS): 7 subunidades del complejo I (NADH des-hidrogenasa), 1 subunidad del complejo III (citocromob), 3 subunidades del complejo IV (citocromo oxidasa)y 2 subunidades del complejo V (ATP sintasa) que sonsintetizadas en los ribosomas mitocondriales. El resto delas proteínas mitocondriales, incluyendo la DNA pol[[$]], RNA pol, proteínas ribosomales y de los comple-jos de fosforilación oxidativa, están codificadas en elgenoma nuclear y son traducidas en los ribosomas cito-plasmáticos para a continuación ser importadas por lamitocondria. En la cadena H del mtDNA se encuentran28 genes (2 rRNA, 14 tRNA y 12 polipéptidos) y losnueve restantes en la L. En ambas cadenas, los genes delos tRNA están distribuidos entre los genes rRNA o codi-ficantes de proteínas, lo cual es de gran importancia parael procesamiento del RNA mitocondrial. El código gené-tico mitocondrial es usado para descifrar sólo 13 mRNAy difiere ligeramente del código genético nuclear; esdecir, se pierde su universalidad en algunos tripletes, porejemplo, UGA codifica para triptofano, en lugar de serseñal de paro, como lo es en el código nuclear.
La única región del genoma mitocondrial que real-mente carece de una secuencia codificante es la regióndel asa D. La replicación de las cadenas pesada y ligera esunidireccional y comienza en orígenes específicos. En elprimer caso, el origen es el asa D y hasta que se han sin-tetizado alrededor de dos terceras partes de esta cadena,queda expuesto el origen de la cadena ligera y puedecomenzar su síntesis. La transcripción de los genes mito-condriales, a diferencia de los nucleares, se inicia en pro-motores presentes en el asa D y continúa en direccionesopuestas para las dos cadenas, recorriendo el círculo ygenerando transcritos multigénicos. Los RNA madurosson generados subsecuentemente por el corte de lostranscritos policistrónicos, aprovechando las secuenciasde los tRNA.
El mtDNA tiene una tasa de mutación mucho másalta que el genoma nuclear. Es más susceptible de sufrircambios en su secuencia de nucleótidos y además existenmecanismos que permiten su fijación rápida. Esto últimoparecería ocurrir por un mecanismo en cuello de botelladebido a la reducción en el número de mitocondrias enla célula germinal femenina, 100 a 500 y su posteriorproliferación en el ovocito maduro. Este mecanismoparecería ser el responsable de que fije mutaciones 10
veces más rápido que el genoma nuclear, aun cuando norealice recombinación homóloga como un mecanismoobligatorio.
Se ha postulado que la alta inestabilidad del mtDNAes resultado de varios factores, entre los que destacan: elalto índice de producción de intermediarios de oxígenoreactivo, a partir de la cadena respiratoria, capaces deproducir daño oxidativo al genoma mitocondrial despro-visto de histonas; el hecho de que el genoma mitocon-drial se replique más que el nuclear. La mitocondriacuenta con mecanismos análogos a los que operan en elnúcleo para la reparación de las lesiones producidas porexposición a oxidantes o a diversos fármacos. Estos inclu-yen a todos los sistemas de reparación, incluyendo lamaquinaría para la recombinación homóloga, sin embar-go carece de los componentes del sistema de reparaciónpor escisión de nucleótidos. La capacidad del genomamitocondrial para fijar mutaciones rápidamente, aunadaa su mecanismo de herencia permitió realizar estudiosevolutivos. El trabajo de Wilson et al., estudiando lasvariaciones en la secuencia del genoma mitocondrial endiversos grupos humanos, sugiere fuertemente que elDNA mitocondrial de todos los grupos humanos moder-nos desciende de una secuencia ancestral única prove-niente de una mujer que vivió hace alrededor de 200000 años en el centro de África. Aplicando una metáfo-ra bíblica, la prensa bautizó a esta teoría como la “EvaAfricana” (Anexo Variabilidad mtDNA).
REPLICACIÓN
La molécula de DNA debe duplicarse para que al divi-dirse la célula cada descendiente reciba la misma infor-mación genética; a este mecanismo se le conoce comoautoduplicación o replicación. Para el inicio de la síntesisde DNA, las dos cadenas de una molécula deben serseparadas. Cada cadena sirve como molde o templadopara que las DNA polimerasas (DNA pol) sinteticennuevas cadenas de DNA complementarias, utilizando loscuatro deoxinucleósidos trifosfatados (dATP, dCTP,dGTP y dTTP) y a partir de la liberación de pirofosfatoobtienen la energía necesaria para formar los enlaces fos-fodiéster de la molécula en crecimiento. Las moléculashijas se forman por una cadena de la molécula original yuna recién sintetizada. Este mecanismo se denominasemiconservativo y fue demostrado de forma experi-mental por Meselson y Stahl en 1958.
La replicación del DNA se inicia en una secuenciaespecífica llamada origen de replicación (oriC en E. coli),a partir de la cual procede en forma bidireccional y cons-tituye un replicón. Debido a la enorme cantidad deDNA, en el genoma humano existen múltiples replico-nes. A partir de cada uno se forma una horquilla en lacual la replicación prosigue en forma bidireccional y ter-mina donde se encuentra con la horquilla del siguientereplicón. La replicación se realiza durante la fase S delciclo celular, los replicones en la eucromatina inicianantes que los replicones en la heterocromatina; los repli-cones en o cerca de genes activos inician antes que losreplicones en regiones inactivas. Las secuencias de losorígenes de replicación en eucariontes no están bien
definidas a excepción de los de levaduras denominadosARS (por su nombre en inglés autonomously replicatingsequences in S. cerevisiae). La distribución en el genomahumano de los orígenes de replicación está asociada a lociespecíficos localizados por lo general en genes que desdeel punto de vista transcripcional activos, codificantescomo los de #-globina, MYC o DNMT1 (DNA methyl-transferase 1) o no codificantes como los de rRNA. Laexpresión génica permite establecer dominios en la cro-matina para que se establezcan las condiciones epigené-ticas necesarias para determinar su empleo como oríge-nes de replicación.
En general, todas las células eucariontes hacen sólouna copia precisa de cada uno de sus cromosomas encada vuelta del ciclo celular. Esto significa que cada ori-gen de replicación debe activarse sólo una vez por cicloy para ello se ensamblan complejos pre-replicativos enlos orígenes de replicación, los cuales sólo podrán seractivados in situ en la fase S. Estos complejos incluyen unheterohexámero formado por las proteínas ORC1-6(origin replication complex 1-6) que se ensambla al finalde la fase M y al que detrás se unen las DNA helicasasreplicativas al final de la fase G1. Este complejo de heli-casa es un hetero-hexámero formado por seis proteínasrelacionadas MCM2-7 (minichromosome maintenance 2-7), el cual para poder unirse requiere de otras proteínascomo CDT1 (chromatin licensing and DNA replicationfactor 1) y CDC6 (cell division cycle 6) que forman partede los complejos prerreplicativos de G1. La activación deMCM2-7 en los orígenes de replicación requiere, entreotras, de la cinasa CDC7 (cell division cycle 7) e implicael reclutamiento de muchos otros factores a los orígenesde replicación. Recién se describieron mutaciones encomponentes de los complejos prerreplicativos (ORC1,ORC4, ORC6, CDT1 y CDC6) asociadas con el síndro-me de Meier-Gorlin (MIM 224690), un tipo de enanis-mo autosómico recesivo, con rótula ausente o hipoplási-ca y orejas muy pequeñas. La apertura inicial de la doblehélice del DNA permite el establecimiento de dos hor-
quillas de replicación con direcciones opuestas en dondepodrán actuar las DNA polimerasas (figura 2-3).
Los DNA pol catalizan la adición de nuevos nucleóti-dos al extremo 3’ OH de la cadena en crecimiento, porlo que en ambas cadenas la síntesis siempre procede endirección 5’!3’. La síntesis es continua en la cadena deDNA que utiliza como molde a la orientada en la direc-ción 3’!5’ y se le denomina cadena líder; mientras quela síntesis es discontinua en la cadena que usa como tem-plado a la cadena complementaria 5’!3’ y se conocecomo cadena rezagada. Como resultado de esto la repli-cación es un proceso semidiscontinuo. Los segmentos deDNA sintetizados de forma progresiva durante la sínte-sis de la cadena rezagada son llamados fragmentos deOkazaki, en E. coli éstos abarcan de 2 000 a 3 000 nucle-ótidos y en los eucariontes de 100 a 200 nucleótidos(figura 2-3).
Existen cerca de 20 tipos diferentes de DNA pol enlas células de mamíferos, la mayoría utilizan DNA comomolde para sintetizar DNA y pertenecen a 4 familias. Lareplicación del DNA nuclear requiere de las DNA pol ",% y &, mientras que el mtDNA es replicado por la DNApol $, el resto de estas enzimas participa en especial enprocesos de reparación del DNA (cuadro 2-4). La DNApol " es la única que posee la habilidad de iniciar unanueva cadena de DNA, tanto en la cadena líder como enla rezagada; el resto requiere de una región de doblecadena con un extremo 3’ OH libre. La DNA pol "forma parte del complejo DNA pol "/primasa que con-siste de la subunidad catalítica (DNA polimerasa) y otras3 subunidades: la subunidad B, necesaria para el ensam-blado y dos subunidades pequeñas que confieren la acti-vidad de primasa (RNA polimerasa). La cadena pequeñade RNA-DNA (10 nt y 20 a 30 nt, respectivamente)producida por el complejo primasa/DNA pol " se deno-mina cebador y es necesaria para iniciar la replicación dela cadena líder y de cada uno de los fragmentos deOkazaki de la cadena rezagada. El complejo DNA pol"/primasa es precedido por el complejo MCM, y las pro-
Dirección de crecimiento
3´
5´Topoosomerasas I y II
MCM2-7
DNA pol !/ primasa
RPA
RFC/PCNA
Síntesis discontinua RPA
FEN1
DNA ligasa I 5´3´
Cadena rezagada
ComplejoDNA pol "
Complejo DNA pol #Cebador
RPA RPASíntesis continua
PCNA/RFC
Cadena líder5´3´
Figura 2-3. Avance de una horquilla de replicación. Se muestran los complejos proteícos y actividades enzimáticas que actúan en las célulashumanas. El origen de replicación de este replicón se encuentra a la derecha de la figura y a partir de ese punto, cuando el complejo MCM2-7 es reclutado por los complejos pre-replicativos ORC1-6 y activado, la replicación procede en forma bidireccional, con cada horquilla avan-zando en dirección opuesta.
10 Genetica clínica
© E
dito
rial E
l man
ual m
oder
noFo
toco
piar
sin
aut
oriz
ació
n es
un
delit
o.
teínas de unión a cadena sencilla (RPA, replicating prote-ína A) que mantienen las cadenas separadas; formando elprimosoma.
De manera adicional, el desenrollamiento de la doblehélice es facilitado por la acción de las topoisomerasas.Estas enzimas pueden cortar una sola cadena del DNA(topoisomerasas I) o doble cadena (toposisomerasas II)para liberar la tensión generada y evitar el superenrolla-miento. Asimismo las toposisomerasas pueden aumentarlos giros de la doble hélice para generar superenrolla-miento. Una vez formados los cebadores, el primosomaes reemplazado por las enzimas que alargan la cadena, enla cadena líder actúa la DNA pol & y en la rezagada laDNA pol %. Las DNA pol de la familia B, excepto la " y', pueden remover nucleótidos del extremo 3’ por lo queademás tienen actividad de exonucleasas 3’ !5’, lo queles confiere capacidad de edición para quitar bases malapareadas y aumentar la fidelidad de la replicación.
La DNA pol & es una enzima con una alta eficiencia enel proceso de incorporación de nucleótidos, que requierepara ello de la interacción con otras dos proteína, PCNA(proliferating cell nuclear antigen, por razones históricas) yRFC (replication factor C) que forman una abrazadera des-lizante para la polimerasa y la anclan a la horquilla de repli-cación. De manera similar, la DNA pol % forma también uncomplejo de elongación con PCNA y RFC para continuarla síntesis en la cadena rezagada. Cuando el complejo deelongación encuentra el extremo 5’ de fragmento deOkazaki (RNA) la síntesis de la cadena lo desplaza crean-
do una estructura tipo alerón (flap) en 5’, sobre la cualactúa la endonucleasa FEN1 (flap endonuclease-1) liberan-do el cebador. La DNA ligasa I forma el enlace fosfodiésterentre el extremo 3’- OH recién sintetizado y el 5’-P gene-rado por el corte (cuadro 2-5).
Existen otras helicasas, que pertenecen a la familiaRECQ, que permiten abrir estructuras complejas que segeneran durante la replicación, en especial en la cadenarezagada, como la helicasa BLM (mutada en el síndromede Bloom) (MIM 210900) y la helicasa WRN (mutadaen el síndrome de Werner) (MIM 277700), entre otras.Ésta última también participa en la apertura de los cuar-tetos de guanina presentes en los telómeros. Las horqui-llas de replicación avanzan a lo largo de los genomas line-ales, por lo general sin ningún impedimento y de mane-ra eventual la replicación alcanza el extremo de la molé-cula o se encuentra una segunda horquilla de replicaciónmoviéndose en dirección opuesta. En eucariontes, tam-poco existen secuencias terminadoras homólogas a las delas bacterias. Es posible al alcanzar la horquilla en posi-ciones al azar, en que se encuentra con la siguiente, la ter-minación simplemente implica el ligamiento de losextremos.
Una consecuencia de que las DNA polimerasas sólopuedan extender los cebadores en dirección 5’! 3’ esque son incapaces de copiar los extremos 5’ de los cro-mosomas lineales. Este problema es resuelto por la enzi-ma telomerasa quien extiende la síntesis de la cadenalíder. Esta enzima tiene actividad de transcriptasa rever-
Cuadro 2-4. Características de las DNA polimerasas humanasDNA polimerasa dirigidas por DNADNA polimerasa" (alfa)
# (beta)$ (gamma)% (delta)
& (épsilon)
' (zeta)( (eta)) (teta)
* (iota)
+ (kappa), (lambda)µ (mu)- (nu)
REV 1TDT
CaracterísticasForma parte del primosoma
Alta fidelidad en la reparaciónActividad exonucleasa 3’ 5’Actividad exonucleasa 3’ 5’
Actividad exonucleasa 3’ 5’
Propensa a errorLibre de error en dímeros TTHipermutación somática
Propensa a errorSe requiere en meiosisPropensa a errorPropensa a error
Propensa a error
Propensa a errorTransferasa terminal dedeoxinucleótidos
Función en replicación y/o reparaciónInicia la síntesis en los orígenes de replicación y de los fragmentosde Okasaky en la cadena retrasadaSíntesis en reparación por escisión de basesSíntesis y reparación del DNA mitocondrialPrincipal polimerasa en la síntesis de la cadena rezagada, múltiplesfunciones en reparación, incluyendo por escisión de nucleótidos
Síntesis de la cadena líder, múltiples funciones en reparación,incluyendo por escisión de nucleótidosSíntesis sobre lesiónSíntesis sobre lesiónProbable en reparación de enlaces cruzados entre las cadenas del DNA, reparación por escisión de bases, síntesis sobre lesiónSíntesis sobre lesión, probable en reparación por escisión debases y de bases mal apareadasSíntesis sobre lesión, reparación por escisión de nucleótidosReparación por escisión de base, rupturas de doble cadena y recombinación VDJProbable en reparación de enlaces cruzados entre las cadenasdel DNASíntesis sobre lesiónRecombinación VDJ
FamiliaB
XAB
B
BYA
Y
YXXA
YX
DNA polimerasas dirigidas por RNA (Transcriptasas Reversas)Retrotranscriptasas de elementos LINE-1 o de elementos retrovirales endógenos
Telomerasa (TERT)
La mayoría se encuentran silenciadas
Utiliza un templado interno de RNA (TERTC)
Ocasionalmente convierten mRNA y otrosRNA en cDNA, los cuales pueden integrarseen cualquier sitio del genomaReplica el DNA de los extremos de loscromosomas lineales para evitar suacortamiento
*Recombinación VDJ: rearreglos en genes de inmunoglobulinas.
Bases moleculares de la herencia 11©
Edi
toria
l El m
anua
l mod
erno
Foto
copi
ar s
in a
utor
izac
ión
es u
n de
lito.
sa y está formada por dos componentes: uno de natura-leza proteica llamado TERT que presenta la actividad detranscriptasa reversa y otro de RNA denominado TERC,que sirve como plantilla para la síntesis de novo del hexa-nucleótido repetido en la secuencia telomérica. Enausencia de actividad de telomerasa los telómeros seacortan después de cada ciclo de replicación (AnexoTelómero y telomerasa).
Es importante recordar que en las células eucariontes elDNA se encuentra en forma de cromatina, por lo que real-mente la replicación implica la duplicación de esta estruc-tura durante la fase S del ciclo celular. Los nucleosomas sondesplazados hacia una u otra cadena durante el avance dela horquilla de replicación y rápidamente se incorporanhistonas recién sintetizadas, las cuales llegan a la cadena deDNA por la acción de chaperonas como CAF1 (chromati-ne assembly 1) y ASF1 (antisilencing function 1) las cualesinteractúan con PCNA y permiten la incorporación de losdímeros de H3 y H4 para el ensamblado de los nuevosnucleosomas. El ensamblaje de los nuevos nucleosomastermina con la asociación de dos dímeros de H2A y H2B,mediada por NAP1 (nucleosome assembly protein 1), con-servándose las modificaciones presentes en los nucleoso-mas de la molécula progenitora por acción de las enzimasque generan las modificaciones postraduccionales de lashistonas y manteniendo el estado epigenético (AnexoRegulación epigenética).
MUTACIÓN Y REPARACIÓNEl DNA es una molécula estable que tiene la capacidadde mantener la información genética. Los trastornos quese producen por lo general son corregidos a través dediferentes mecanismos de reparación; no obstante, pue-den generarse cambios estables en la secuencia de nucle-ótidos, proceso conocido como mutación. Las mutacio-nes se producen por dos mecanismo principales: trastor-nos químicos de las bases que llevan a la incorporaciónde nucleótidos erróneos, o por errores en la replicación yreparación del DNA que se traducen en la incorporaciónincorrecta de un nucleótido o en pérdida o adición denucleótidos. Cuando se presenta el cambio de un nucle-ótido por otro, mutación puntual, si una purina es reem-plazada por otra purina o una pirimidina por otra pirimi-dina, este cambio se conoce como transición, mientras
que si una purina es reemplazada por una pirimidina oviscevera se genera una transversión.
Los agentes físicos (rayos ultravioleta, X, gamma,entre otros), químicos (agentes alquilantes, oxidantes,entre otros) y biológicos (virus, transposones, entreotros) son capaces de producir mutaciones. Contra ellos,las células tienen diversos sistemas de protección: lasmembranas celular y nuclear, la agrupación de genes encromosomas y sistemas enzimáticos donde los mutáge-nos son destruidos antes de que lesionen al DNA. Encaso de que éste resulte dañado todavía existen procesoscapaces de repararlo de una manera exacta, permitiendorecuperar su estructura original. De forma contraria, si eltipo y la cantidad de alteraciones fueran tan graves quelos mecanismos protectores resulten insuficientes se pro-duce muerte celular. Los trastornos en el DNA, que noson reparados ni provocan muerte celular, originan unamutación directa. Por otra parte, el DNA puede ser repa-rado en forma inexacta, con lo que se establece unamutación indirecta. Es importante señalar que mientrasalgunas mutaciones son deletéreas, otras por el contrarioresultan benéficas y permiten que haya variabilidad yselección natural, lo que conduce a cambios evolutivos.
Los cambios en la secuencia de nucleótidos puedenproducirse en regiones codificantes y no codificantes delos genes y en las regiones intergénicas del genoma. Lasconsecuencias de los cambios en la secuencia de nucleó-tidos serán diferentes dependiendo de dónde ocurran y siafectan o no la función de los genes. En genética médicapor lo general se utiliza el término mutación para definirlos cambios que afectan la función de los genes y alteranel fenotipo o producen enfermedad (Anexo Mutación yenfermedad), mientras que se utiliza el término polimor-fismo para hacer referencia a los cambios heredables enla secuencia de nucleótidos que no producen enferme-dad y constituyen parte de la variación normal entre losindividuos (Anexo Variación genética humana). Dadoque los polimorfismos constituyen cambios estables en elgenoma, su frecuencia debe ser de al menos 1% en lapoblación, esto para confirmar que es parte de la varia-ción normal y que no se trate de una mutación de novo.
En la figura 2-4 se muestra el efecto de una mutaciónpuntual y de la inserción de un nucleótido en un ORF. Siel cambio generado por una transición cae dentro de laredundancia del código genético, este cambio se denomi-na mutación silenciosa o sinónima y por lo general se
Cuadro 2-5. Funciones requeridas en las horquillas de replicación de E. coli y mamíferosFunción
Complejos pre-replicativosAnclaje de la helicasa/ primasaDNA HelicasaMantenimiento cadena sencillaSíntesis del cebadorAbrazadera deslizante de la polimerasaAncla de la abrazadera (ATPasa)Síntesis DNADimerización de la holoenzimaRemoción del cebador Unión de fragmentos
MamíferosORC1-6
CDT1/CDC6Complejo MCM2-7
RPADNA Pol "/ primasa
PCNARFC
DNA Pol % + DNA Pol &?
FEN1DNA Ligasa 1
E. coli-
DnaCDnaBSSBPDnaG#
Complejo $%Núcleo de la DNA Pol III
.DNA pol I
DNA Ligasa
12 Genetica clínica
© E
dito
rial E
l man
ual m
oder
noFo
toco
piar
sin
aut
oriz
ació
n es
un
delit
o.
considera un polimorfismo de un solo nucleótido o SNPsinónimo; sin embargo, este cambio puede afectar laestructura del DNA o el mRNA y tener consecuenciasen su función. Cuando una transición o transversiónresulta en un codón que determina otro aminoácido se lellama mutación de sentido erróneo y puede ser conser-vativa o neutra; si un aminoácido es reemplazado porotro del mismo tipo, este cambio puede corresponder aun SNP no sinónimo. Si el cambio de aminoácido es poruno completamente diferente que se produjo una muta-ción de sentido equivocado no conservativa y es muchomás probable que tenga consecuencias en la función dela proteína. Se produce una mutación sin sentido, cuan-do el cambio origina que un codón codificante se vuelvade paro, lo cual generará una proteína truncada o ladegradación del mRNA. También puede ocurrir lo con-trario, que un codón de alto se vuelva codificante, lo quegenerará que la síntesis continué hasta el siguiente codónde paro, lo que producirá proteínas de mayor tamaño,que por lo general se pliegan mal y se acumulan en lascélulas. La inserción o deleción de nucleótidos en unORF puede llevar a la adición o pérdida de aminoácidosen la proteína si es un número múltiplo de tres (inser-ción o deleción en fase) o a que se produzca un cambioo corrimiento en el marco de lectura generando proteí-nas diferentes y por lo general truncas o ausentes por lageneración de codones de alto prematuros (AnexoMutación y enfermedad).
Los sistemas de reparación son tan complejos como lamaquinaría misma de replicación y tienen una participa-ción importante en la sobrevivencia celular. Los sistemasde reparación son capaces de reconocer diferentes distor-siones en la molécula de DNA como señales para activarsu acción y cada célula cuenta con varios sistemas capa-
ces de lidiar con el daño. En el genoma humano se hanidentificado > 130 genes cuyos productos participan enlos diferentes mecanismos de reparación. Éstos puedendividirse en varios tipos de acuerdo al tipo de daño quereconocen y a la forma en que éste es reparado. Laimportancia de los mecanismos de reparación se observaen los graves padecimientos ocasionados por defectos enellos. En el cuadro 2-6 se muestran los principales siste-mas de reparación del genoma humano, el tipo de dañoque reparan y las proteínas que participan en cada unode ellos, así como los padecimientos que se producencuando se alteran sus funciones.
Los sistemas de reparación pueden actuar de formadirecta, es decir corrigiendo la alteración en las basesnitrogenadas o por escisión del fragmento dañado yresíntesis de DNA, reparación por escisión de base(BER) o reparación por escición de nucleótidos (NER).De manera adicional las roturas de doble cadena (DSB)en la molécula del DNA pueden ser reparadas porrecombinación homóloga (HR) o unión de extremos nohomólogos (NHEJ). Cuando la replicación se realiza condaño en la molécula de DNA o durante la recombina-ción, pueden quedar bases mal apareadas que pueden sercorregidas por la capacidad de edición de las DNA pol opor un mecanismo de escición específico para bases malapareadas (MMR) (figura 2-5). Por otra parte, algunaslesiones como los dímeros de pirimidina cuando no sonreparados antes de la replicación, hacen que las DNA polreplicativas detengan la síntesis dejando huecos en lamolécula que son completados por DNA polimerasas desíntesis sobre lesión (TLS), por lo general propensas aerror (cuadro 2-4).
Reparación directa. Este sistema revierte el daño alDNA, en humanos una enzima específica es capaz de
Secuencia normalA
5´...
3´...
...3´
...5´
ARG TCT CAA AAG TTT ACG CGT
TAC AGA GTT TTC AAA TGC GCA
met ser gln lys phe thr arg
5´...
3´...
...3´
...5´
ARG TCT CAA GAG TTT ACG CGT
TAC AGA GTT CTC AAA TGC GCA
met ser gln glu phe thr arg
Mutación de sentido equivocado no conservativaD
5´...
3´...
...3´
...5´
ATG TCT CAA AAA TTT ACG CGT
TAC AGA GTT TTT AAA TGC GCA
met ser gln lys phe thr arg
Mutación silencioso o sinónimaB
5´...
3´...
...3´
...5´
ATG TCT CAA TAG TTT ACG CGT
TAC AGA GTT ATC AAA TGC GCA
met ser gln alto
Mutación sin sentidoE
5´...
3´...
...3´
...5´
ATG TCT CAA AGG TTT ACG CGT
TAC AGA GTT TCT AAA TGC GCA
met ser gln arg phe thr arg
Mutación de sentido equivocado conservativa o neutral
5´...
3´...
...3´
...5´
ATG TCT CAA CAA ATT TAC GCG
TAC AGA GTT GTT TAA ATG CGC
met ser gln gln ile tyr ala
Mutación por cambio en el marco de lecturaC F
Figura 2-4. Efecto de las mutaciones puntuales, transiciones y transversiones y de la inserción de un par de nucleótidos en un ORF.
Bases moleculares de la herencia 13©
Edi
toria
l El m
anua
l mod
erno
Foto
copi
ar s
in a
utor
izac
ión
es u
n de
lito.
Cuadro 2-6. Principales sistemas de reparación del DNA en el humano y sus componentesSistema de reparación
Directo
Escisión de base(BER)
Escisión denucleótidos (NER)
Bases malapareadas (MMR)
Recombinación homóloga (HR)
Unión de extremos no homólogos (NHEJ)
Reparación deenlaces cruzados
Síntesis sobrelesión
Padecimientospor alteración en
reparaciónCáncer
Glucosidasa MYHcáncer colon
Xeroderma pigmentoso,
Síndrome de Cockaine,
Tricotiodistrofia
Carcinoma de colon hereditario no polipósico HNPC o síndrome de Lynch
Ataxia telangiectasiaSíndrome Nijmegen
Cáncer mama, ovario,próstata
Anemia de Fanconi
Cáncer mama
DNA pol (Variante de Xerodermapigmentoso
Funciones
Eliminación del grupo metilo
Rompimiento del enlace N-glucosídico y liberación de basedañadaCorte enlace fosfodiéster,generación de sitios apurínicos yapirimídicosLlenado hueco, maquinaria dereplicaciónForma enlace fosfodiésterReconocimiento daño enreparación global genomaReconocimiento daño en reparaciónglobal,ligasa E3 de ubicuitina
Reparación acoplada atranscripción, ligasa E3 de ubicuitinaReparación acoplada atranscripción, ATPasadependiente de DNAVerificación de daño, localizaciónmaquinaria reparaciónHelicasa TFIID 3’-5’Helicasa TFIID 5’-3’Endonucleasa 5’Endonucleasa 3’Llenado del hueco, maquinaria dereplicaciónForma enlace fosfodiésterReconocimiento bases malapareadas y pequeñasinserciones-delecionesReconocimiento y corte
Llenado del huecoSeñalización de dañoProducción cadena con extremo3’ libreSeñalización Dirige RAD51 a la lesiónHomólogo a RecA, invasiónLlenado de huecosReconocimiento dañoApareamientoSíntesisLigaciónReconocimiento daño, complejo demúltiples subunidades, ligasa E3de ubicuitinaEfectores reparación. Llevar RAD51recombinación homóloga
Señalización HRLlenado de huecos
Incorporación de núcleotidoscometiendo errores, mecanismoaltamente mutagénico
Componentes
Metil-O-6- guanosinametil transferasa8 DNA glucosidadas Cada una identifica untipo de base alteradaAP endonucleasa
DNA pol #
DNA ligasaXPC/HR23
Complejo UVDDBXPE (DDB2)DDB1CSA
CSB
XPA
XPBXPDXPF/ERCC1XPGDNA pol %/&
DNA ligasa IIIMSH2/MSH6
MSH2/MSH3MLH1/ PMS2MLH3Maquinaria replicaciónATMMRE11/RAD50/NBS1
BRCA1BRCA2RAD51Maquinaria replicaciónKU70/KU80Artemisa/DNA-PKDNA pol ?DNA ligasa IVFANC A-M
FANCD2/BRCA2FANCIRAD51BRCA1Maquinaria dereplicaciónDNA polimerasas desíntesis sobre lesión ymaquinaria de replicación
Tipo de daño que repara
Metilación de O6G
Bases alquiladas, oxidadas,incorporación deuracilo
Dímeros de pirimidina, lesionesmonoaductasgrandes
Generadas porerrores dereplicación yrecombinación
Rupturas de doblecadena (DSB)
Rupturas de doblecadena (DSB)
Lesiones diaductascon enlacescruzados
Relleno huecosdejados por DNApol de replicaciónante una lesión
14 Genetica clínica
© E
dito
rial E
l man
ual m
oder
noFo
toco
piar
sin
aut
oriz
ació
n es
un
delit
o.
alquilar la O6-metil-guanosina de manera directa (cua-dro 2-6). En las bacterias y muchos otros organismos, losdímeros de timina pueden ser removidos en una reacciónde fotorreactivación que depende de la luz de onda visi-ble y de una enzima, la fotoliasa. En mamíferos se hanencontrado enzimas relacionadas con la fotoliasa, aun-que su función es diferente, ya que participan en el con-trol del reloj circadiano.
Reparación por escisión de base (BER). Este es el meca-nismo de reparación predominante contra las lesiones abases producidas por hidrólisis, desaminación, radiacionesionizantes, especies reactivas de oxígeno (ROS), agentesalquilantes y análogos de bases. La eficiencia y especificidadde este mecanismo está determinado por la existencia dediferentes formas de DNA glucosidasas que remueven dife-rentes tipos de bases modificadas por corte del enlace N-glu-cosídico creando un sitio abásico (AP) o una ruptura decadena sencilla (SSB). Los sitios AP son eliminados poracción de la endonucleasa AP (AP1), quien junto con unafosfodiesterasa rompen el DNA 5’ o 3’ del sitio AP respecti-vamente. El hueco generado puede ser de un solo nucleóti-do (SP-BER, short patch) o de dos o más (LP-BER, longpatch). A continuación el hueco es llenado por una DNA polde reparación, la DNA pol #, y por último una DNA ligasaIII o I sella de acuerdo al tamaño, SP o LP respectivamente.
Reparación por escisión de nucleótidos (NER). Estemecanismo es muy importante en la reparación del dañoproducido por la radiación ultravioleta, así como tam-bién en la generación de aductos grandes y enlaces cru-zados entre las bases. La NER puede dividirse en dos cla-ses, la reparación global del genoma (GGR) y la repara-ción acoplada a transcripción (TCR). Ambos sistemasremueven de manera eficiente el daño y utilizan algunoselementos comunes; sin embargo, las moléculas que
detectan el daño son diferentes. La GGR es un procesoal azar que ocurre de forma gradual, mientras que laTCR está intimamente ligada a la RNA pol II y es alta-mente específica y eficiente. Cuando la maquinaria detranscripción de la RNA pol II encuentra una lesión sedetiene y la polimerasa es desplazada lo cual lleva a launión de dos proteínas CSA (Cockayne syndrome A,MIM 216400) y CSB (Cockayne syndrome B, MIM133540) a la lesión, esta última perteneciente a la fami-lia de remodeladores de cromatina SWI/SNF y con acti-vidad de ATPasa estimulada por DNA. Esta actividadparece ser indispensable para el reclutamiento de lamaquinaria de reparación. En la GGR el daño es recono-cido por XPC (xeroderma pigmentosum C) y la proteínaHR23B, con la unión posterior del complejo D formadopor DDB1 y DDB2 (XPE). A continuación ambas víascomparten la maquinaria de reparación, las actividadesde helicasas XPB y XPD que forman parte del TFIIH yla unión de XPA y RPA que reclutan las actividades deendonucleasas, XPG y XPF/ERCC1, lo cual remueve elfragmento dañado, alrededor de 30 nt, el hueco serállenado por las DNA pol %/& acompañadas de PCNA yRFC y sellado por la DNA ligasa III.
Reparación de bases mal apareadas (MMR). Loserrores en la replicación pueden generar apareamientosde bases erróneos y pequeñas asas por inserciones o dele-ciones de nucleótidos. Éstos son reconocidos porHMUTS", un dímero formado por las proteínas MSH2y MSH6, o en ocasiones por hMUTS# formado porMSH2 y MSH3. Las proteinas localizadas en el DNAunen a hMUTL", dímero formado por MLH1 y PMS2con lo que se ensambla el complejo de reparación, queescinde la base mal apareada de la cadena recién sinteti-zada y permite la resíntesis por una DNA pol.
Actividadmetabólica
Radiación ionizante
Radiación u.v.
Ros Agentesquímicos
Errores enreplicación
Mutación
Tolerancia al dañoSíntesis sobre-lesión
Grancantidad de daño
Adoptosis
Falla en reparación
Mutación
DSB Dímerospirimidina
Aductos SSB Sitio AP Desaminación Bases malapareadas
NHEJ HR NE Directa BER
GGR TCR
R MMR
SP-BER LP-BER
Activación puntos de revisión
Trasducción de señales
Arresto ciclo celular
Apoptosis
Agentes que lesionan al DNA
Mecanismos de reparación
Enfermedades hereditarias y cáncer
Variabilidadselección natural evolución
Figura 2-5. Agentes que lesionan al DNA, daño que producen y mecanismos de reparación en las células humanas. Si el daño no es repara-do adecuadamente puede llevar a la muerte celular o a producir mutaciones, las cuales puden resultar en enfernedad o en variabilidad , lo quepermite la selección natural y la evolución.
Bases moleculares de la herencia 15©
Edi
toria
l El m
anua
l mod
erno
Foto
copi
ar s
in a
utor
izac
ión
es u
n de
lito.
16 Genetica clínica
© E
dito
rial E
l man
ual m
oder
noFo
toco
piar
sin
aut
oriz
ació
n es
un
delit
o.
Reparación por recombinación homóloga (HR). Éstees un mecanismo eficiente para reparar las DSB genera-das por reacciones bioquímicas complejas, radiacionesionizantes o ROS. Muchas proteínas participan en él y esun sistema libre de error que requiere de una región rela-tivamente grande con secuencia homóloga. El primerpaso para reparar las DSB por HR es la resección delextremo 5’ para producir un extremo 3’ libre de cadenasencilla. En humanos esto se realiza por el complejoMRN, formado por MRE11/RAD50/NBS. La proteínacentral para realizar la recombinación es RAD51 (homó-loga a RecA de E. coli), quien forma un nucleofilamentocapaz de invadir a la otra molécula, posterior a esto haysíntesis de DNA y formación de uniones de Holliday quedeben ser resueltas por resolvasas y ligasas.
Unión de extremos no homólogos (NHEJ). Éste es unmecanismo alternativo a la HR para reparar las DSB, el cuales propenso a error, por lo que por lo general sólo se empleacuando no es posible usar HR, ambos mecanismos compar-ten proteínas de señalización y localización como BRCA1 yBRCA2. La mayoría de las DSB no generan extremos liga-bles, por lo que estos tienen que ser generados. El procesose inicia por la unión de proteínas específicas a los extremosrotos, el complejo Ku, un heretodímero formado porKU70/KU80, que tiene propiedades para formar un puen-te proteico. Además se requiere la actividad catalítica de laDNA protein cinasa (DNA PK) para acercar los extremosdel DNA a través de su interacción con las proteínas, a con-tinuación es reclutado otro grupo de proteínas que incluyea la DNA ligasa IV/XRCC4, artemisa, PINK y polimerasasde la familia X como pol , y pol µ. También parecen nece-sitarse las proteínas ATM y el complejo MNR así como elrecambio de la histona H2A por su variante H2AX, todasellas participantes también en el proceso de HR, para que launión de los extremos no homólogos se realice en formaadecuada.
Síntesis sobre lesión (TLS). Éste es un mecanismo detolerancia de daño y altamente mutagénico. La síntesissobre lesión implica el paso sobre la lesión incorporandonucleótidos en la cadena opuesta. Las DNA polimerasasde síntesis sobre lesión son propensas a error y actúancuando las polimerasas replicativas se detienen ante dañogenerado por radiación UV o ionizante y por diferentesagentes químicos. Una excepción tal vez la constituye laDNA pol ( quien inserta adeninas en posiciones opues-tas a dímeros de timidina generados por luz UV Estapolimerasa también puede replicar sobre sitios AP ylesiones generadas por cisplatino. Las DNA pol de sínte-sis sobrelesión pertenecen en especial a la familia Y, aun-que también hay miembros de las familias A y X con estacapacidad. En el cuadro 2-4 se muestran las DNA poli-merasas de síntesis sobre lesión.
Muchas enfermedades humanas que implican unahipersensibilidad a agentes que lesionan al DNA, o conniveles elevados de daño al DNA celular, no son produc-to de defectos en los sistemas de reparación al DNA, sinode la respuesta celular al DNA dañado. Las células nor-males reaccionan ante el daño al DNA por detención delciclo celular, por diferentes procesos en los puntos dechequeo, hasta que el daño es reparado, o llevando a lamuerte celular si es irreparable. Parte de esta maquinariaestá controlada por la proteína ATM (ataxia telangiecta-sia mutated). Esta proteína es sensora del daño al DNA y
tiene actividad de cinasa activando a otras proteínascomo BRCA1 y TP53. Asimismo, las helicasas de la fami-lia RECQ también son importantes en la reparación. Untipo de daño especial, la presencia de enlaces cruzadosrequiere de un grupo de 12 proteínas denominadasFANC A-M, que se encuentran mutadas en la anemia deFanconi (MIM 227650), además para su reparación serequiere la maquinaria de NER y de HR.
EXPRESIÓN GÉNICA Y SU REGULACIÓN
La información contenida en el DNA de las células seexpresa en dos pasos: transcripción y traducción. Cadacélula de un organismo contiene la misma informacióngenética y la forma en que se expresa, determina suscaracterísticas y funciones. La regulación de la expresióngénica ocurre en diferentes niveles, desde la estructurade la cromatina hasta la vida media de los productos fun-cionales. En general se consideran tres niveles principalesde control o regulación de la expresión génica:
• Control del inicio de la transcripción. Está determinadopor las secuencias del promotor localizadas corrientearriba (5’) a una distancia fija del inicio del primer exóndel gen (nt +1). Requiere de modificaciones en la estruc-tura de la cromatina para la entrada de la maquinariatranscripcional a la secuencia promotora y de la unión deproteínas específicas llamadas factores de transcripción(TF) a sus secuencias blanco en el DNA.
• Control postranscripcional. Implica el procesamiento delas moléculas de RNA, su transporte y localización, latraducción del mRNA, estabilidad y degradación de losRNA, procesamiento y localización de proteínas, estabi-lidad y degradación de estas últimas.
• Control epigenético. Se refiere a los cambios heredablesen la expresión génica, que no dependen de alteracionesen la secuencia del genoma y que están determinadospor la estructura de la cromatina. Este tipo de regulaciónpuede actuar sobre un gen en particular o en regionesespecíficas del genoma, incluso en cromosomas comple-tos y ser transitoria o tener una larga duración y transmi-tirse de una generación a otra (anexo Regulación epige-nética y por ncRNA).
Transcripción y su regulaciónEl RNA es sintetizado por las RNA polimerasas (RNApol) utilizando DNA como molde o templado y ribonu-cleótidos trifosfatados como precursores (ATP, CTP,GTP y UTP). El transcrito primario surge como unacadena sencilla en dirección 5’!3’, que se va elongandopor adición de residuos de nucleósido monofosfato alextremo 3’-OH libre, en forma complementaria a lacadena molde de DNA, lo que elimina un grupo pirofos-fato de los ribonucleótidos trifosfatados. El extremo 5’de la molécula recién sintetizada siempre conserva ungrupo trifosfato. Los transcritos recién sintetizados sonprocesados en el núcleo para formar las moléculas deRNA maduras.
Existen tres tipos diferentes de RNA pol en eucarion-tes, con 12 subunidades proteícas en promedio. Para ini-
ciar la transcripción se unen a sus promotores mediantela formación de un complejo basal con TF específicos. Enel cuadro 2-7 se muestran las características de las tresRNA pol, sus TF basales, así como los tipos de genes quetranscribe cada una. Los promotores de los genes quetranscriben las RNA pol I y II se ubican corriente arribadel inicio del gen, mientras que los que transcribe laRNA pol III pueden estar corriente-arriba o corriente-abajo, dentro del gen mismo. Pero todos ellos a una dis-tancia fija del nt +1. Los promotores contienen diferen-tes tipos de secuencias conservadas evolutivamente queinfluyen en la eficiencia de la transcripción. En los geneshumanos, unas de las más frecuentes son las “cajas” TATA(TATAAA o sus variantes), localizadas a 25 nt corrientearriba (-25) del inicio de la transcripción y las ricas enGC (GGGCGGG), ambas características de los genes demantenimiento celular. Algunos genes transcritos por laRNA pol II, tienen además cajas CAAT localizadas a -80nt, que incrementan la eficiencia del promotor y otroselementos corriente abajo conocidos como DPE (downstream promoter element) en +28 a +32 nt. Los TF queforman los complejos basales de transcripción por logeneral son ubicuos, un ejemplo es la proteína de unióna la caja TATA (TBP) (TATA binding protein) que formaparte del TFIID y se une a la región principal de los pro-motores con dicha caja, para permitir la unión de la RNApol II. El control del inicio de la transcripción incluyemecanismos que regulan la incorporación del primernucleótido por las RNA polimerasas. Por ejemplo, laRNA pol II necesita la fosforilación del extremo carboxi-lo de su subunidad catalítica por el factor TFII H, unavez que se ha unido a su promotor para poder iniciar lasíntesis, en lo que se conoce como limpieza o abandonodel promotor (figura 2-6).
Los niveles de expresión pueden modificarse por laparticipación de TF específicos que regulan en trans(codificados por secuencias de DNA que están en molé-culas diferentes del gen) al interaccionar con elementosreguladores o secuencias específicas en el DNA. Cuandolos TF se unen a elementos potenciadores aumentan elnivel de transcripción y ésta se evita cuando se unen asilenciadores. Existen otro tipo de secuencias de DNAque funcionan como aislantes o límites para impedir quelos genes adyacentes sean transcritos o por el contrariosilenciados. Potenciadores, silenciadores, elementos derespuesta y aislantes regulan en cis la expresión génica(es decir sobre la misma molécula de DNA donde seencuentran) y pueden localizarse incluso a miles depares de nucleótidos de los promotores basales, tantocorriente arriba (5’), como corriente abajo (3’) o enintrones. Las secuencias de nucleótidos de los elementosreguladores están conservadas evolutivamente, repetidasa lo largo del genoma y son reconocidas por TF condominios específicos (figura 2-6).
Los TF tienen dominios conservados para unirse alDNA y dominios de activación. Estos últimos sondiversos y se activan por diferentes mecanismos queincluyen adición y eliminación de grupos que modifi-can su estructura como fosforilación, metilación, aceti-lación, entre otros, interacción con otros factores for-mando homodímeros, heterodímeros o tetrámeros,unión a ligandos, localización celular, entre otros. Laación de los TF modifica la expresión génica en losdiferentes tejidos y en las diferentes etapas de la vida(cuadro 2-8).
En los diferentes tejidos la regulación de la trans-cripción de un gen incluye mecanismos de control porproteínas y ncRNA que seleccionan transcritos alter-nativos de un mismo gen. El uso de promotores dife-rentes puede resultar en isoformas con distintas pro-piedades. Con frecuencia se generan transcritos con unprimer exón diferente que pueden traducirse en unmismo péptido si se unen a los mismos exones subse-cuentes; sin embargo, los mRNA tendrán estabilidad,unión a ribosomas y vidas medias diferentes. Por otraparte, se pueden generar proteínas diferentes si cambiael marco de lectura. En otros casos, la presencia de pro-motores internos originará productos proteicos máspequeños con el mismo o difente ORF.
Durante la elongación y terminación de la transcrip-ción existen también mecanismos de control, en especialpor interacción de proteínas específicas y ncRNA conestructuras secundarias en el transcrito, en el DNAmolde o ambos. En el control de la elongación participancomplejos remodeladores de cromatina que facilitan eldesplazamiento de las RNApol por los nucleosomas yproteínas chaperonas de histonas como SSRP1 (structu-re specific recognition protein), también llamada FACT,Ésta interactúa especificamente con las histonesH2A/H2B para permitir el desensamblado de los nucle-osomas y la elongación de los transcritos.
Procesamiento del RNA y su regulaciónLas modificaciones postranscripcionales a los transcritosprimarios de la RNA pol II, incluyen modificaciones ensus extremos, la remoción de los intrones y empalme deexones, edición, transporte y degradación. En cuantosurge el transcrito primario, se adiciona al extremo 5’ unnucleótido, 7-metil-guanosina trifosfato (7’mG), llama-do Cap o caperuza que le sirve de protección contra ladegradación por exonucleasas 5’! 3’, facilita la subse-cuente eliminación de intrones y el transporte del núcleoal citoplasma (figura 2-7).
Cuadro 2-7. RNA polimerasas de eucariontes, genes que transcriben, características y sus factores basalesde transcripción
ClaseRNA Pol IRNA Pol II
RNA Pol III
Factores basales TIF-IATIF-IB (TBP)UBF TFII A-HTFIID (TBP)TFIII A-CTFIII B (TBP)
CaracterísticasUn sólo transcrito 45S en nucleoloTranscripción de todos los genes quecodifican proteínas, sus transcritoscontienen Cap y cola poli(A)Algunos promotores son internos y otrosse localizan corriente arriba. Transcribe unnúmero importante de retrotransposones
Genes que transcriberRNA 28S, rRNA 18S, rRNA 5.8SmRNA, snRNA, miRNA, RNA antisentido
5SrRNA, tRNA, U6snRNA, 7SLRNA,7SKRNA, 7SM RNA, siRNA,retrotransposones Alu
Bases moleculares de la herencia 17©
Edi
toria
l El m
anua
l mod
erno
Foto
copi
ar s
in a
utor
izac
ión
es u
n de
lito.
DPE
Potenciador
RF
Elementosproximales promotor
Núcleopromotor
Adistal
Pote
ncia
dor 5
´
Silenciador RF RF+1
TATA Potenciador 3´INR
Aislante
Elementos reguladores 5’ Núcleo del promotor
Unión de TBP a núcleo promotor
Reclutamiento o TF basales RNA pol II
Complejo basal transcripción inactivo
Activación RNApol II, liberaciónpromotor e inicio transcripción
TATA +1 DPE
TATA
P P
PP
PP
Cap
TBP TAFs
TFIID
TFIID TAFs
TATA
TFIIB
TFIIF TFIIHTFIIE
RNA pol II
TFIID
TFIIHTFIIETFIIB
TFIIF RNA pol II
TATA
RNA pol II
TATATFIIE
TFIIH
TFIIF
TFIIB
RNA pol II
Figura 2-6. A. Elementos reguladores de la transcripción en eucariontes. Contiene distintos elementos potenciadores intercalados consilenciadores y elementos aislantes, localizados a 25 kb en promedio, corriente arriba o abajo del núcleo del promotor que incluye la caja TATA,secuencias de inicio de la transcripción (INR) y elementos corriente abajo del promotor (DPE). B.Inicio de la transcripción de genes porRNA polimerasa II. Se inicia por la unión de sus factores basales a la región promotora: TFII A-H, la proteína TBP que forma parte de TFIID,y por último la RNA pol II, la cual es activada por fosforilación de su extremo carboxilo por TFIIH, lo que hace que se libere del promotor e ini-cie la transcripción.
18 Genetica clínica
© E
dito
rial E
l man
ual m
oder
noFo
toco
piar
sin
aut
oriz
ació
n es
un
delit
o.
Como parte del mecanismo de terminación de latranscripción, en el extremo 3’ del transcrito primario lasecuencia AAUAAA es reconocida por un complejo pro-teico que corta 15-20 nt corriente abajo para liberarlodel heterodúplex DNA-RNA. Inmediatamente despuéses poliadenilado (unión de 200 adeninas aproximada-mente) por la proteína unidora de poliadenilato (polyAbinding protein). Esta modificación es necesaria para per-mitir el transporte del mRNA al citoplasma, evitar sudegradación y aumentar el reconocimiento por los ribo-somas para su traducción. Una excepción a esta modifi-cación la constituyen los genes de histonas cuyos mRNAno son poliadenilados y la terminación implica un corteen el extremo 3’ del transcrito primario dependiente deuna estructura secundaria formada al interactuar con elextremo 5’ del snRNA U7.
El mecanismo de eliminacion de intrones y unión deexones es dependiente de secuencias conservadas en loslímites exón-intrón. Por lo general el intrón inicia con eldinucléotido GT (GU a nivel de RNA) y termina conAG. Además se requiere de una tercera secuencia intró-nica, el sitio ramificador, localizada a aproximadamente40 nt del extremo 3’ del intrón (figura 2-7).
El mecanismo de eliminación de intrones y reuniónde exones sigue la siguiente secuencia:a) Rotura en el extremo 5’ del intrón, ataque nucleofílico
por el nucleótido G terminal del sitio donador a la ade-
nina (A) del sitio ramificador para formar una estructu-ra en asa.
b) Corte en el extremo 3’ de la unión intrón-exón, liberan-do el RNA intrónico como un asa.
c) Reunión de los exones (figura 2-8).
Estas reacciones son mediadas por el complejo removedorde intrones y empalmador de exones, de naturaleza ribonu-cleoproteíca, compuesto de cinco tipos de snRNA y más de100 proteínas. Los snRNA participantes en la mayoría delos intrones de genes que codifican para polipéptidos son:U1, U2, U4, U5 y U6. Este proceso está mediado por lacomplementaridad de bases tanto entre las secuencias con-servadas en la unión exón-intrón y los snRNA, como entreellos. Un segundo tipo de complejo participa para eliminaruna clase de intrones poco frecuentes donde los dinucleóti-dos conservados GT y AG son reemplazados por las secuen-cias AT y AC respectivamente. En este caso los snRNA U11y U12 reemplazan las funciones de los snRNA U1 y U2(figura 2-8 y cuadro 2-9).
A partir de alrededor de 21 000 genes en el humanose generan más de 200 000 proteínas diferentes. Lamayoría de nuestros genes presenta uso alternativo deexones que produce diferentes RNA maduros y un grannúmero de proteínas con propiedades y funciones dife-rentes, de acuerdo al tejido y etapa del desarrollo; esteproceso está regulado por ncRNA y proteínas.
Cuadro 2-8. Factores de transcripción, dominios de unión a DNA, mecanismos de activación y funcionesFactor transcripción
Superfamilia de receptoresnucleares. Receptores ahormonas esteroides SP1
Proteínas genes HOX, conhomeodominiosOCT-1, OCT-2, PIT-1
NF-KB
MYODFOS/JUN
CRE/ATF1 (Elemento derespuesta a cAMP)
FuncionesMorfogénesis, expresión einhibición múltiples genes entejidos blancoActivación de genes deldesarrollo tempranoEncendido y apagado de genesdurante desarrollo embrionarioActivación de genes durante eldesarrollo embrionarioRespuesta inmune, control deapoptosis
Diferenciación tejido muscularUnión a sitios AP1, regulaciónciclo celular, punto de restricciónActiva genes de sistemanervioso y esqueleto
Mecanismo activaciónUnión a ligando y dimerización
Unión a caja GC (GGGCGG)ubicuoSíntesis
Unión a ligando y dimerización
Transducción de señales,fosforilación del inhibidor IKBy su degradación, dimerizaciónCambio de pareja, heterodímerosTransducción de señales yheterodimerizaciónTransducción de señales
Dominio unión a DNADedos de zinc (ZF)
Dedos de Zinc
Hélice-vuelta hélice, (HTH)
Un homeodominio y undominio POUDominio homólogo a REL, RHD,estructuras ß plegadas ydominios inmunoglobulinasHélice-asa-hélice, HLHCierre de leucina, LZ
Cierre de leucina
nt + 1 iniciotranscripción
Sitiodonador
Sitio de ramificación cura Sitio
aceptorAU ORF
Exones codificantes e intronesUGA
Señal depoliadenilación
AAUAAA
Último exón
UTR 3´UTR 5´
Exón 1 Exón 2
30 a 50 pb
AC
AG GU AGUA YYYYYYYYYG G AG
Figura 2-7. Estructura del transcrito primario de un gen codificante. Se muestran las secuencias necesarias para la remoción de los intronesy empalme de exones, conservadas evolutivamente, y la señal de poliadenilación en el último exón.
Bases moleculares de la herencia 19©
Edi
toria
l El m
anua
l mod
erno
Foto
copi
ar s
in a
utor
izac
ión
es u
n de
lito.
Los ncRNA recién sintetizados también son procesa-dos de manera postranscripcional. Por ejemplo, los rRNAson transcritos en el nucleolo por la RNA pol I como unamolécula 45S que es procesada para generar los rRNA18S, 5.8S y 28S. El procesamiento lo inicia el snRNA U3con una serie de acciones de endo y exonucleasas paragenerar las moléculas individuales. En el nucleolo, nume-rosos ncRNA que forman dos grupos de snoRNA sonresponsables de aparear con los rRNA en los sitios enque serán modificados. El grupo C/D identifica sitiosblanco para metilación y el grupo H/ACA especificasitios donde la uridina es convertida a seudouridina, estasmodificaciones son necesarias para que los rRNA inte-ractuen con las proteínas ribosomales y formen riboso-mas funcionales. Asi mismo los tRNA requieren de unprocesamiento que implica la acción de reacciones sepa-radas de endonucleasa y ligasa. La endonucleasa recono-ce la estructura secundaria/terciaria del precursor y cortaa ambos lados del intrón. Las dos mitades del tRNA
generadas al eliminar el intrón pueden ser unidas por laligasa de tRNA en presencia de ATP. La maduración delos tRNA es regulada por la vía de respuesta a las prote-ínas no plegadas generada en el retículo endoplásmico.
Edición del mRNA. Es una forma de procesamientopostranscripcional que consiste en la inserción, elimina-ción o cambio de nucleótidos mediante enzimas. Lasinserciones o eliminaciones en el RNA parecen serexclusivas de las mitocondrias de protozoarios como lostripanosomas. En mamíferos no se han encontrado evi-dencias de inserciones o eliminaciones, aunque sí se hanobservado algunas sustituciones en un número limitadode genes. Éstas se producen por desaminasas dependien-tes de RNA que actúan sobre residuos de C y A. Porejemplo, la edición C-U ocurre en el mRNA humano delgen APOB (apolipoproteína B). En el hígado se produceuna proteína de 4536 aminoácidos, APOB100, mientrasque en el intestino, la desaminasa de citosina APO-BEC1, convierte la citosina 6666 en uridina, generandoun codón de paro y una proteína de 2152 aminoácidos,APOB48, que es indispensable para convertir en quilo-micrones los lípidos de la dieta.
Transporte y degradación del mRNA. La estructurade un mRNA es modificada por elementos actuando encis y proteínas de unión a RNA actuando en trans parapermitir su interacción con otras proteínas, poniendo encontacto secuencias remotas. Esto genera señales de loca-lización o tráfico para transportar a los mRNA como par-tículas ribonucleoproteicas (RNP) a lugares celularesespecíficos. Por ejemplo, la proteína FMRP participa enla localización de algunos mensajeros en los axones, endonde son traducidos. Este mecanismo permite que lasproteínas lleguen en menos tiempo, que el generado porsu transporte, al sitio en que ejercerán su función en unacélula. La mayor parte de los elementos que regulan estemecanismo se localizan en los UTR 3’ de los mRNA.
Núcleo5´ 3´
3´Transcripción
Transcrito primario5´m7Gppp
Poliadenilación
5´m7Gppp
RNAsn
AAAA 3´
Asa del intrón
5´m7Gppp
5´m7GpppExón 1 Exón 2
AAAA 3´
AAAA 3´
Complejo removedor de intronesy empalmador de exones
RNA maduro
Citoplasma
GU
A G
Figura 2-8. Procesamiento post-transcripcional del transcrito primario de la RNA pol IIen una célula eucarionte. Adición de CAP (m7G) en elextremo 5´, poliadenilación en el extremo 3´, remoción de intrones y empalme de exones para generar el mRNA
Cuadro 2-9. Funciones de los snRNA en la remoción de intrones
ComplejoSnRNPU1
U2U4, U5, U6U5U5, U6U11
U12
Función
Unión al sitio donador, extremo 5’ del intrónGU-AG (>98%)Unión al sitio de ramificación del intrón GU a AGInteracción entre los dos sitios de corteInteracción entre los dos exonesCentro catalíticoUnión al sitio donador en intrones AU a AC(<2%)Unión al sitio de ramificación en intrones AUa AC
SnRNP complejo de ribonucleoprotína parte del complejo removedor de intro-nes y empalmador de exones.
20 Genetica clínica
© E
dito
rial E
l man
ual m
oder
noFo
toco
piar
sin
aut
oriz
ació
n es
un
delit
o.
Bases moleculares de la herencia 21©
Edi
toria
l El m
anua
l mod
erno
Foto
copi
ar s
in a
utor
izac
ión
es u
n de
lito.
Las modificaciones en ambos extremos del mRNA loprotejen de degradación por exonucleasas. La mayoría delos mRNA eucariontes son degradados por cualquiera dedos vías dependientes de deadenilación catalizada por poli(A) nucleasas En una de estas vías, cuando la cola de poli(A) alcanza un tamaño crítico (aprox 10 nucleótidos) queya no es capaz de mantener la interacción con la proteína deunión a poli (A), se desestabiliza el complejo de unión alCap que incluye a los factores de traducción eIF4G, eIF4E,y eIF4A, lo que conduce a rearreglos posteriores para expo-ner el extremo 5‘P Cap a la enzima decapitadora y a conti-nuación a la digestión por exonucleasas en dirección 5’-3’.La enzima decapitadora compite por el Cap con el comple-jo de factores de inicio de la traducción de unión al Cap. Enla otra vía, el exosoma, un complejo evolutivamente conser-vado, cataliza la digestión en dirección 3’-5’. La degradaciónde los mRNA por lo general ocurre dentro de partículascitoplásmicas discretas, llamadas cuerpos de procesamiento(PB, processing bodies). De manera adicional existe una granvariedad de partículas citoplásmicas que contienen mRNAreprimidos para que no se traduzcan. Este mecanismo derepresión y también otro mecanismo de degradación demRNA específicos es regulado por miRNA (AnexoRegulación epigenética y por ncRNA). En general la vidamedia de un mRNA eucarionte depende de secuencias yestructuras específicas en él y de la presencia de factoresestabilizantes y desestabilizantes.
Diversas vías de regulación son necesarias para mantenerla fidelidad y precisión de la expresión individual de losgenes. Uno de estos mecanismos de supervivencia detecta alos mensajeros con defectos en el procesamiento en elnúcleo y a aquéllos que contienen mutaciones que determi-nan codones de paro prematuro o su ausencia. Los transcri-tos con codones de alto prematuros son decapitados en elcitoplasma, antes de que se dé el acortamiento de la cola depoli (A). En células de mamíferos, el mecanismo de detec-ción de codones de paro prematuros parece depender de loscomplejos de ribonucleoproteína que se ensamblan en lasuniones de los exones del mRNA. Los complejos EJC (exonjunction complex) participan en la regulación del transportenúcleo-citoplasma y evitan que los transcritos primarios enlos que no se han eliminado los intrones lleguen al citoplas-ma. Una de las señales para la degradación de estos mensa-jeros es la presencia de los EJC después de un codón de alto.A este mecanismo se le conoce como decaimiento demRNA por codones de paro prematuros (NMD). Este es elmecanismo de supervivencia mejor estudiado en humanos,se calcula que aproximadamente 60 a 70% de los premRNA tienen uso alternativo de exones y que 45% de éstostienen al menos una forma que debe degradarse por NMD.La presencia de codones de alto prematuro también es con-secuencia de mutaciones patogénicas en exones e intronesde muchos genes. La presencia de proteínas truncadas conefectos dominantes negativos puede tener consecuenciasmás graves para una célula que la falta de un producto, porlo que estos mRNA también son regulados de forma pos-transcripcional por NMD.
Síntesis de proteínas y su regulaciónLa traducción del mRNA se lleva a cabo en los riboso-mas con la participación de los aminoacil-tRNA, energíay factores proteicos específicos. Los tRNA son moléculas
de 74 a 95 nucleótidos donde algunos de ellos son modi-ficados de forma postranscripcional para convertirlos en:seudouridina, inosina, dihidrouridina, 1-metilguanosinay ribotimidina. Estas modificaciones participan en elreconocimiento por las aminoacil-tRNA sintetasas, enzi-mas que unen el aminoácido a su correspondiente tRNAformando, mediante hidrolisis de ATP, los aminoacil-tRNA.
Los mRNA maduros en el citoplasma se acoplan a losribosomas en presencia de factores de traducción. Lainformación del mRNA se lee en dirección 5’®3’ y elpolipéptido crece del extremo amino al carboxilo, deacuerdo al código genético. Éste relaciona la combi-nación de tres nucleótidos o codón, con los aminoácidostransportados por los tRNA que poseen una región com-plementaria o anticodón que se adapta al codón demanera específica. El código genético es el mismo paratodos los organismos (universal) con algunas excepcio-nes, en especial en los genomas mitocondriales. De los 64tripletes, 61 especifican los 20 aminoácidos, por lo por loque cada aminoácido tiene más de un codón, lo que seconoce como redundancia o degeneración del código,excepto triptófano y metionina que tienen un solocodón; los tres codones restantes son señales de paro oalto de la traducción. En la lectura del código no existepuntuación entre los codones, simplemente se van leyen-do de tres en tres durante la traducción y es importanteseñalar que cada codón es específico para un aminoácidoparticular (figura 2-9).
Los ribosomas eucariontes están formados por dossubunidades compuestas por RNA y proteínas: unapequeña (40S) constituida por el rRNA 18S y más de 30proteínas y otra mayor (60S) que incluye los rRNA 28S,5.8S y 5S, y más de 50 proteínas. Cada ribosoma tienetres sitios activos, el sitio A aceptor o aminoacil, dondese une el aminoacil - tRNA entrante; el sitio P portadorde la cadena polipeptídica o peptidil y el sitio E de sali-da (exit) a donde se desplaza el tRNA descargado parasalir del ribosoma. Un mensajero puede ser leído porvarios ribosomas activos (polisoma o polirribosoma) for-mando cada uno, una cadena polipeptídica (figura 2-10).
La síntesis de proteínas se divide en tres etapas: inicio,elongación y terminación. El inicio requiere del comple-jo que se forma por la unión del tRNAi
met al extremo 5’del mRNA, en presencia del factor eIF4, un multímeroproteico que incluye al complejo de unión al Cap (CBP,cap binding protein) y del factor de inicio eIF-3 para unir-se a la subunidad 40S del ribosoma con ayuda del factorde inicio eIF-2 y GTP, que forman un complejo ternariocon el tRNAi
met . Este tRNA es diferente del tRNAmet
que reconoce los codones AUG internos y es el únicoque se entra de manera directa al sitio P del ribosoma.Además, la cola de poli A y la distancia al extremo 3 delmRNA también influyen en la unión del complejo depre-iniciación al mRNA. Esta interacción está mediadapor la proteína de unión a la cola de poli A o PADP (pol-yadenylate-binding protein), que se asocia con el comple-jo eIF-4 y ocasiona el plegamiento sobre sí mismo delmRNA. Así, el tamaño de la cola de poli A interviene enla regulación del inicio de traducción de un mRNA par-ticular. A continuación el complejo avanza sobre elmRNA hasta encontrar el codón de inicio, casi siempreAUG, que está contenido en la secuencia consenso 5 -
UCAG
Segundo nucleótido
Prim
er n
ucle
ótid
oTercer nucleótido
U C A C
C
U
A
G
UCAG
UCAG
UCAG
UUUUUCUUAUUC
phepheleuleu
FFLL
UCUUCCUCAUCG
serserserser
SSSS
UAUUACUAAUAG
tyr tyrparoparo
YY
UGUUGCUGAUGG
cys cysparo trp
CC
W
CUUCUCCUACUG
leuleuleuleu
LLLL
CCUCCCCCACCG
propropropro
PPPP
CAUCACCAACAG
hishisglngln
HHQQ
CGUCGCCGACGG
argargargarg
RRRR
AUUAUAAUCAUG
ileileilemet
IIIM
ACUACCACAACG
thrthrthrthr
TTTT
AAUAACAAAAAG
asnasnlyslys
NNNN
AGUAGCAGAAGG
serserargarg
SSRR
GUUGUAGUCGUG
valvalvalval
VVVV
GCUGCCGCAGCG
alaalaalaala
AAAA
GAUGACGAAGAG
aspaspgluglu
DDEE
GGUGGCGGAGGG
glyglyglygly
GGGG
Figura 2-9. Código genético. La secuencia nucleotídica de cada triplete o codón de mRNA especifica la incorporación del aminoácido indica-do (en nomenclatura de tres y una letra) o la terminación de la cadena polipeptídica (paro).
G
Extremo amino
Cadena polipeptídica
Aminoácidos libres
Glutamil-tRNA
tRNA
Anticodón
tRNA
mRNARibosoma
Dirección del ribosoma
MCWI
Q H G C B NA
F
G
UCCACC
W
G
CCA
AGG AUG GGU UGG5-´ -3´
Codón
G
CG
CCA
AGG AUGU GGU U
EA
P
UAC
M
R
G
NH2
Q
CUU
GC M
QE
Figura 2-10. Esquema general de traducción y síntesis de proteínas.
22 Genetica clínica
© E
dito
rial E
l man
ual m
oder
noFo
toco
piar
sin
aut
oriz
ació
n es
un
delit
o.
GCCPuCCAUGG-3 denominada secuencia Kozak.Tanto la unión del complejo de pre-iniciación al mRNA,como su migración hasta el codón de inicio son procesosdependientes de energía que requieren la hidrólisis deATP. A continuación se une la subunidad ribosómica 60Spor hidrólisis de GTP mediada por el factor eIF-5 quelibera a otros factores como el eIF-6 que se encontrabaasociado con la subunidad ribosómica grande libre, pre-viniendo la unión de las subunidades 40S en el citoplas-ma. Esto último resulta en la formación del complejo deinicio 80S, donde el tRNAi
met ocupa el sitio P del riboso-ma. Subsecuentemente, el sitio A es ocupado por el ami-noacil-tRNA especificado por el segundo codón delmRNA, comenzando la etapa de elongación. La entradade los diferentes aminoacil-tRNA al sitio A es mediadapor el factor de elongación eEF-1, un complejo de 4subunidades con actividad de proteína G, e implica lahidrólisis de GTP. La formación del enlace peptídicoentre la metionina del RNAti
met en el sitio P y el amino-ácido del segundo tRNA en el sitio A, es catalizada porla actividad de peptidiltransferasa de la subunidad ribo-sómica grande, cuya actividad incluye la deacilación deltRNA. Esta acción requiere de la hidrólisis de GTPunido al factor eEF-1. Una vez que se forma el dipépti-do correspondiente a los dos primeros codones del ORF,el siguiente paso es la translocación, que ocurre en tresetapas: 1) el ribosoma se mueve en dirección 5 !3 , a lolargo de tres nucleótidos de manera que el siguientecodón ocupa el sitio A, 2) el tRNA-dipéptido en el sitioA se desplaza al sitio P y 3) el tRNA deacilado en el sitioP se mueve a la tercera posición o sitio E, siendo a con-tinuación expulsado del ribosoma. La translocaciónrequiere de hidrólisis de GTP, mediada por el factor eEF-2, dejando el sitio A libre para permitir la entrada delsiguiente aminoacil-tRNA. El ciclo de elongación serepite continuamente hasta llegar al codón de termina-ción donde se une alguno de los factores de liberación,eRF, que reconoce cualquiera de los tres codones de ter-minación. La hidrólisis de GTP es necesaria para la libe-ración del polipéptido recién sintetizado, del tRNA y
para la disociación del complejo de traducción. Las subu-nidades ribosómicas regresan a la poza citoplasmáticapara ser utilizadas nuevamente, mientras que los mRNAse degradan una vez traducidos. En la figura 2-10 semuestra un esquema general de la síntesis proteica y enel cuadro 2-10 un resumen de los factores proteicos queintervienen en ella.
Los mecanismos de control de la traducción son, des-pués del control transcripcional y la estabilidad delmRNA, los principales determinantes de los niveles fina-les de proteína. Tanto el UTR 5’ como el UTR 3’ delmRNA pueden tener elementos que modulen la eficien-cia de la traducción Un punto importante de la regula-ción del inicio de la traducción se establece entre lassecuencias en el UTR 3’ y su interacción con la proteínade unión a la cola de poli A y el factor de inicio de la tra-ducción eIF4F, llevando a circularizar al mRNA y facili-tar el inicio de la traducción o por el contrario, por launión proteínas que impiden esta interacción. El controlde la traducción dependiente del Cap ocurre en especialdurante su inicio, implicando a los eIF y proteínas acce-sorias. El inicio es afectado por diversos estímulos quemodifican el estado de fosforilación de los factores eIF4Ey eIF2 y a través de la unión de las proteínas de unión aeIF4E, lo cual por último inhibe el inicio de la traduccióndependiente del Cap. Bajo condiciones donde la traduc-ción dependiente del Cap es abolida, la traducción detranscritos con sitios de unión internos para ribosomas(IRS) puede realizarse en forma independiente del Cap.Por ejemplo durante el ciclo celular, en la transición G1-S, la traducción se realiza predominantemente en formadependiente del Cap, mientras que durante el paso deG2 a M, la traducción dependiente del Cap es inhibida ylos transcritos se traducen preferentemente en formaindependiente. Otro ejemplo interesante de control de latraducción se realiza en los ovocitos, donde los mRNApresentan colas de poli (A) cortas y una vez ocurrida lafertilización, éstas son alargadas en el citoplasma paraactivar su traducción. Otros mecanismos de regulaciónde la traducción incluyen la interacción de proteínas con
Cuadro 2-10. Factores proteícos que participan en la síntesis de proteínas
ProcardiontesIF-1
IF-2
IF-3
EF-Tu, EF-GEF-TsEF-G
RF1RF2RF3
Función generalBloquea sitio AeIF1 asiste a eIF2 en promover unión de tRNAiMet a subunidad 40S, promueve su disociación
Entrada del tRNA iniciadoreIF2 es una GTPasaeIF3 estimula formación complejo ternario, su unión a 40S y el escaneo del mRNAeIF5B implicado en la entrada del tRNA iniciador, es una GTPasa
Unión de subunidad pequeña al mRNAComplejo eIF4 funciona en la unión al Cap
Unión a GTPIntercambio-GDPTranslocación del ribosoma
Reconocimiento UAA/UAGReconocimiento UAA/UGAEstimulación de otros RF
EucarionteseIF1A
eIF2eIF3eIF5B
eIF1complejo eIF4eIF3
eEF1"eEF1#, eEF1$eEF2
eRF1eRF2eRF3
Factores de inicio
Factores de elongación
Factores de liberación
Bases moleculares de la herencia 23©
Edi
toria
l El m
anua
l mod
erno
Foto
copi
ar s
in a
utor
izac
ión
es u
n de
lito.
24 Genetica clínica
© E
dito
rial E
l man
ual m
oder
noFo
toco
piar
sin
aut
oriz
ació
n es
un
delit
o.
estructuras clave del mRNA y la formación de RNA dedoble cadena por la complementaridad de bases demoléculas antisentido y por último los mecanismos porRNA interferente, mediada en especial por miRNA, quereprimen la traducción, llevan a la degradación del men-sajero o ambos (Anexo Regulación epigenética y porncRNA).
Modificaciones postraduccionales, localización y degradación de proteínasEl polipéptido que emerge del ribosoma por lo generalno es activo por lo que sufre modificaciones postraduc-cionales que incluyen su plegamiento, ruptura proteolíti-ca, modificaciones químicas tales como unión a carbohi-dratos, a lípidos, a grupos fosfato, hidroxilo, acetilo, entreotras, o eliminación de aminoácidos e interacción conotras moléculas para formar la proteína activa.
La función de una proteína depende de su estructurafinal, la cual está determinada por cuatro niveles: La pri-maria o secuencia lineal de aminoácidos; la secundaria oconformación que adopta el polipéptido por la interac-ción entre sus aminoácidos, por lo general como "-héliceo #-plegada, estabilizada por puentes de hidrógeno entrelos grupos carboxilo y amino de sus aminoácidos. La ter-ciaria que resulta del plegamiento de diferentessecciones de "-hélice, #-plegada y otras estructurassecundarias menores, estabilizado por puentes de hidró-geno, fuerzas hidrofóbicas que determinan que aminoá-cidos con grupos no polares queden en la región internade la proteína, o enlaces covalentes como puentes disul-furo entre residuos de cisteína. Por último la estructuracuaternaria donde se asocian dos o más polipéptidos,cada uno plegado en su estructura terciaria, en una pro-teína multimérica. Cada proteína adquiere su propiaestructura por lo general terciaria o cuaternaria, depen-diendo de su función, para el plegamiento participanproteínas chaperonas, como por ejemplo las proteínas dechoque térmico (Hsp70) que promueven el plegamien-to cotraduccional.
Las proteasas eliminan segmentos de uno o ambosextremos del polipéptido, mediante la actividad deamino o carboxipeptidasas, resultando en una forma máscorta de la proteína. Si las ruptura proteolíticas ocurreninternamente se generan diferentes segmentos proteicosa partir del polipéptido recién sintetizado, y cada uno deellos puede constituir una proteína activa. Por otra parte,es frecuente la eliminación de la metionina inicial delproducto primario de traducción, por ejemplo durante lasíntesis de la #-globina. Algunas proteínas son sintetiza-das desde el inicio como poliproteínas con copias múlti-ples unidas extremo a extremo; por ejemplo la ubicuiti-na, es sintetizada como poliproteína. Las proteínas desecreción y las de exportación requieren de una señal delocalización intracelular específica, la cual es una secuen-cia peptídica corta o secuencia señal o líder, que es eli-minada por una peptidasa una vez alcanzado su objetivo.Por ejemplo, las hormonas sintetizadas en un tejido(hipófisis) son cortadas para generar moléculas indivi-duales que son exportadas y actúan en otros, o las prote-ínas enviadas a compartimentos intracelulares como elnúcleo (histonas, polimerasas, factores de transcripción,entre otras), la mitocondria (proteínas ribosomales, com-
ponentes de la cadena respiratoria, entre otras), los pero-xisomas, lisosomas, entre otras. En el caso de las proteí-nas de secreción, el péptido señal contiene 20 aminoáci-dos en especial hidrofóbicos en el extremo amino. Lasecuencia señal se transporta al retículo endoplásmicopor una partícula de reconocimiento de la señal SRP(signal recognition particle), un complejo que contienencRNA (citoplásmicos pequeños), RNA 7SL y seis pro-teínas específicas. El complejo SRP se une tanto al extre-mo creciente de la proteína como al ribosoma y los diri-ge a una proteína receptora de SRP en la superficie dellado citosólico de la membrana del retículo endoplásmi-co rugoso. De allí, el polipéptido puede pasar al lumendel retículo si su destino es exportarse de la célula, o esdetenido si tiene segmentos hidrofóbicos adicionales,como en el caso de las proteínas transmembranales. Lasproteínas mitocondriales, codificadas en núcleo, requie-ren de un péptido señal mitocondrial con aminoácidoshidrofóbicos y con carga positiva, que forman una "-hélice anfipática. Las señales de localización nuclearpueden estar localizadas casi en cualquier sitio de lasecuencia polipeptídica y consisten en segmentos de 4 a8 aminoácidos con carga positiva, junto con residuos deprolina; la señal es bipartita y los aminoácidos positivosse encuentran en dos bloques de 2 a 4 residuos, separa-dos por alrededor de 10 aminoácidos. Algunas proteínasnucleares carecen de señales de localización propias,pero son transportadas al núcleo con la asistencia deotras proteínas nucleares. Así mismo, para salir delnúcleo las proteínas requieren de una señal de exporta-ción nuclear propia o la adquieren por unión a otra pro-teína que la posea. En cuanto a las proteínas lisosomales,la secuencia señal es un residuo de manosa 6-fosfato quese adiciona en el lado cis del aparato de Golgi y es reco-nocida por una proteína en el lado trans del Golgi. Unejemplo de modificaciones postraduccionales que regu-lan la actividad de una proteína es el procesamiento dela insulina en la que se eliminan los primeros 24 amino-ácidos de la preinsulina-proinsulina para dar proinsulina,seguida por dos cortes adicionales que eliminan un seg-mento central dando las dos partes activas de la proteí-na, las cadenas A y B, que son unidas por dos puentesdisulfuro para formar la insulina madura.
Una vez que las proteínas han cumplido su función,son degradadas o modificadas para tener nuevas funcio-nes en respuesta a los requerimientos de la célula. Elconcepto de recambio proteico en una célula no sólorequiere de la síntesis de proteínas de novo, si no de eli-minación de proteínas cuya función ya no se requiera, demanera selectiva y rápida para contender con los cam-bios abruptos que ocurren bajo ciertas condiciones, porejemplo en las transiciones claves del ciclo celular. Asícada proteína tiene una vida media particular. En euca-riontes se ha observado que los aminoácidos del extre-mo-N tienen un papel crítico en la estabilidad inherentede la proteína, por ejemplo, la presencia de ocho amino-ácidos (Ala, Cys, Gly, Met, Pro, Ser, Thr, Val) se correla-ciona con estabilidad (t 1/2 > 20 h), otros ocho (Arg, His,Ile, Leu, Lys, Phe, Trp, Tyr) con una vida media corta (t1/2 2 a 3 min) y la de cuatro (Asn, Asp, Gln, Glu) con unadesestabilización posterior a la modificación química.Una proteína dañada, modificada o con residuo N-termi-nal desestabilizante es ubicuitinada por una enzima con-
Bases moleculares de la herencia 25©
Edi
toria
l El m
anua
l mod
erno
Foto
copi
ar s
in a
utor
izac
ión
es u
n de
lito.
jugante de ubicuitina, UBCE (Ubiquitin-ConjugatingEnzyme). La unión covalente de la ubicuitina, se realizaentre la glicina en el C-terminal de ésta y en los residuosde lisina de la proteína a degradar; de manera subsecuen-te son adicionados más residuos formando una cadena depoliubicuitina. La proteína poliubicuitinada es reconoci-da por un complejo múltiple de proteasas, el proteasoma26S. La proteína es digerida en una reacción que requie-re ATP y libera péptidos cortos de 4 a 10 aminoácidos yubicuitinas intactas para su reutilización. Los proteaso-mas se localizan tanto en el citoplasma como en elnúcleo de todas las células, pero no en el lumen de losorganelos celulares de secreción. Las células cuentanademás con otro mecanismo de degradación de proteí-nas, que actúa sobre todo en proteínas de membrana,receptores y sus ligandos, la endocitosis y unión a lisoso-mas. La degradación de proteínas constituye el últimoeslabón en la cadena de eventos que regulan la expresiónde un gen y determinan las características de una célula.
BIBLIOGRAFÍA
Referencias generalesAlberts B, Bray D, Hopkin K, Johnson A, Lewis J, Raff M,
Roberts K, Walter P: Essential cell biology, 2nd ed. GarlandScience. New York 2004:740.
http://www.ncbi.nlm.nih.gov/omimKrebs JE, Goldstein ES, Kilpatrick ST: Lewin’s Genes X. Jones
and Bartlett Publishers. Boston, Mass., EUA 2010:930.Strachan T, Read AP: Human Molecular Genetics 4th ed.
Garland Sciences. New York 2010:790.www.els.net
Estructura del genomaBhuvanagiri M, Schlitter AM, Hentze MW, Kulozik AE: NMD:
RNA biology meets human genetic medicine. Biochem J2010;430:365–377. doi:10.1042/bj20100699 365
Gerstein MB, Bruce C, Rozowsky JS, Zheng D et al.: What isa gene, post-ENCODE? History and updated definition.Genome Res 2007;17(6):669-681.
Kehrer SH, Cooper DN: Sequencing the Human Genome: NovelInsights into its Structure and Function. In: Encyclopedia ofLife Sciences (ELS). John Wiley & Sons, Ltd: Chichester.(July 2008) DOI: 10.1002/9780470015902.a0001899.pub2
Mattick JS, Makunin IV: Non-coding RNA. 2006. Hum MolGenet 2006, 15, Rev Issue 1, R17 –R29 doi:10.1093/hmg/ddl046
Pesole G: What is a gene? An updated operational definition.Gene 2008;417(1-2):1-4.
Rowen L: Gene Structure and Organization. Encyclopedia ofLife Sciences 2005. John Wiley & Sons, Ltd. www.els.net.doi: 10.1038/npg.els.0005008
Szymanski M, Barciszewski J: Noncoding RNAs in Biology andDisease. In: Encyclopedia of Life Sciences (ELS). JohnWiley & Sons, Ltd: Chichester. (2009) DOI:10.1002/9780470015902.a0021437
Wright MW, Bruford EA: Naming ‘junk’: Human non-proteincoding RNA (ncRNA) gene nomenclature HumGenomics 2011;5(2):90–98.
Zheng D, Frankish A, Baertsch R, Kapranov P et al.:Seudogenes in the ENCODE regions: consensus annota-
tion, analysis of transcription, and evolution. Genome Res2007;17(6):839-851.
Zheng D, Gerstein MB: The ambiguous boundary betweengenes and seudogenes: the dead rise up, or do they? TrendsGenet 2007;23(5):219-224.
ReplicaciónBalakrishnan L, Gloor JW, Bambara RA: Reconstitution of
eukaryotic lagging strand DNA replication. Methods2010;51:347–357.
Bicknell LS, Bongers EM, Leitch A, Brown S et al.: Mutationsin the pre-replication complex cause Meier-Gorlin syn-drome. Nat Genet 2011;43(4):356-359.
Borlado LR, Méndez J: CDC6: from DNA replication to cellcycle checkpoints and oncogenesis Carcinogenesis2008;29(2):237–243. doi:10.1093/carcin/bgm268
Duncker BP, Chesnokov IN, McConkey BJ: The origin recog-nition complex protein family. Genome Biol2009;1100:214. (doi:10.1186/gb-2009-10-3-214)
Ghosh S, Vassilev AP, Zhang J, Zhao Y, Depamphilis ML:Assembly of the human origin recognition complex occursthrough independent nuclear localization of its compo-nents. J Biol Chem 2011;9. [Epub ahead of print]
Guernsey DL, Matsuoka M, Jiang H, Evans S et al.: Mutationsin origin recognition complex gene ORC4 cause Meier-Gorlin syndrome. Nat Genet 2011;43(4):360-364.
Johansson E, Macneill SA: The eukaryotic replicative DNApolymerases take shape. Trends Biochem Sci2010;35(6):339-347.
Labib K: How do Cdc7 and cyclin-dependent kinases triggerthe initiation of chromosome replication in eukaryoticcells? Genes Dev 2010;24(12):1208-1219.
Stallons LJ, McGregor WG: Translesion synthesis polymerasesin the prevention and promotion of carcinogenesis. JNucleic Acids (2010). Article ID 643857, doi:10.4061/2010/643857 pii: 643857.
Zheng L, Jia J, Finger LD, Guo Z, Zer C, Shen B: Functional regu-lation of of FEN1 nuclease and its link to cancer. Nuclei AcidRes 2011;39(3):781–794. doi:10.1093/nar/ gkq884.
Mutación y reparaciónArana ME, Kunkel TA: Mutator phenotypes due to DNA replica-
tion infidelity. Semin Cancer Biol 2010;20(5):304–311.doi:10.1016/j.semcancer.2010.10.003.
Hanawalt PC, Spivak G: Transcription-coupled DNA repair:two decades of progress and surprises. Nat Rev Mol CellBio 2008;9:958-970.
Moldovan GL, D’Andrea AD: How the Fanconi anemia path-way guards the genome. Annu Rev Genet2009;43:223–249.
Rastogi RP, Richa, Kumar A, Tyagi MB, Sinha RP: Molecularmechanisms of ultraviolet radiation-induced DNA dama-ge and repair. J Nucleic Acids 2010:592980. Article ID592980, 32 pages doi:10.4061/2010/592980
Sugasawa K: Xeroderma pigmentosum genes: functions insideand outside DNA repair. Carcinogenesis 2008;29(3):455–465. doi:10.1093/carcin/bgm282
Thoms KM, Kuschal C, Emmert S: Lessons learned from DNArepair defective syndromes. Exp Dermatol 2007;16(6):532-544.
Waters LS, Minesinger BK, Wiltrout ME, D’Souza S, WoodruffRV, Walker GC: Eukaryotic translesion polymerases andtheir roles and regulation in DNA damage tolerance.Microbiol Mol Biol Rev 2009;73(1):134-154. doi:10.1128/MMBR.00034-08
PREGUNTAS DE AUTOEVALUACIÓN1. ¿Cuáles de las siguientes bases nitrogenadas son derivadas
de la pirimidina y se encuentran en el ácido ribonucleico?A. Adenina y guanina. B. Citosina y guanina. C. Adenina y timina.D. Citosina y uracilo.
( )
2. El tamaño del genoma humano haploide es de:A. 6 000 000 pb. B. 3 x 106 pb. C. 3 000 Mb.D. 3 000 kb.
( )
3. Los genes que codifican para tRNA son un ejemplo de:A. Genes codificantes para polipéptidos.B. Genes para RNA no codificante. C. Heterocromatina facultativa.E. Seudogenes.
( )
4. Durante la replicación del DNA humano la actividadde helicasa la ejercen:A. RFC y PCNA. B. Complejo ORC1-6.C. Complejo MCM2-7.D. CDC6, CTD1 y RPA.
( )
5. Debido a una mutación puntual en la región codificante deun gen que tiene 500 nucleótidos en su ORF, el codónTGG correspondiente al residuo del aa 108 es sustituidopor el triplete TGA en la cadena sentido del gen (5’ 3’)¿cómo será la proteína codificada por el DNA que tieneesa mutación?A. Una proteína de 107 aminoácidos. B. Una proteína de 108 aminoácidos.C. Una proteína de 500 aminoácidos con la secuencia
normal.D. Una proteína de 500 aminoácidos pero con cambio
de un aa.( )
6. Los dímeros de pirimidina producidos por la luz ultra-violeta son reparados en especial por:
A. Escisión de base.B. Escisión de nucleótidos.C. Unión de extremos no homólogos.D. Reparación de bases mal apareadas.
( )
7. Un promotor puede ser definido como:A. El sitio al cual se unen proteínas específicas para
reprimir la transcripción.B. El complejo proteico que ayuda a la RNA polimera-
sa a iniciar la expresión de un gen.C. La secuencia de DNA con la cual interacciona la
RNA polimerasa para iniciar la síntesis de RNA.D. Las secuencias del DNA con las que interaccionan
proteínas para incrementar la tasa de expresión.( )
8. La región del Cap o caperuza:A. Es adicionada a las moléculas de rRNA. B. Se adiciona en el extremo 5’ de los mRNAm.C. Está presente en los transcritos de las RNA pol I yII.
D. Se adiciona durante la terminación de la transcrip-ción del RNAm .
( ) 9. En los organismos eucariontes, los intrones de un gen
corresponden a las secuencias:A. CodificantesB. Traducidas pero no transcritas C. Altamente repetitivas del genomaD. Removidas para formar los mRNA maduros
10. Durante el proceso de traducción de la informacióngenética:A. Se sintetizan los RNAm.B. Participan las RNA polimerasas polimerasas. C. Se procesan los rRNA 45S y proteínas ribosomales.D. Los ribosomas catalizan las formación del enlace
peptídico.( )
Expresión y su regulaciónFischer PM: Cap in hand. Targeting eIF4E. Cell Cycle
2009;(8:16):2535-2541.Lejeune F, Maquat LE: RNA Processing and Human Disorders.
Encyclopedia of Life Sciences 2007. John Wiley & Sons, Ltd.www.els.net. doi: 10.1002/9780470015902. a0005495.
McGlincy NJ, Smith CWJ: Alternative splicing resulting innonsense-mediated mRNA decay: what is the meaning ofnonsense? Trend Biochem Sci 2008;33(8): 385-393.doi:10.1016/j.tibs.2008.06.001
Mendell JT, Dietz HC: Nonsense-mediated mRNA Decay.Encyclopedia of Life Sciences 2005. John Wiley & Sons,
Ltd. www.els.net. doi: 10.1038/npg.els.0005501Millevoi S, Vagner S: Molecular mechanisms of eukaryotic pre-
mRNA 3’ end processing regulation. Nuc Acid Res2010;38(9):2757–2774. doi:10.1093/nar/gkp1176
Scheper GC, van der Knaap MS, Proud CG: Translation mat-ters: protein synthesis defects in inherited disease. Nat RevGenet 2007;8:711-723.
Van Der Kelen K, Beyaert R, Inzé D, De Veylder L:Translational control of eukaryotic gene expression. CritRev Biochem Mol Biol 2009;44(4):143-168.
Wisdom GB: Postranslational modification and human disor-ders. Encyclopedia of Life Sciences 2005. John Wiley &Sons, Ltd. www.els.net doi: 10.1038/npg.els.0005498
© E
dito
rial E
l man
ual m
oder
noFo
toco
piar
sin
aut
oriz
ació
n es
un
delit
o.
26 Genetica clínica
27
© E
dito
rial E
l man
ual m
oder
noFo
toco
piar
sin
aut
oriz
ació
n es
un
delit
o.
ANEXO I VARIACIÓN GENÉTICA HUMANA
INTRODUCCIÓN
La diversidad genética es una fuerza importante en laevolución y es un proceso natural que modifica el feno-tipo de los organismos. La alteración en la secuencia denucleótidos del DNA puede ser inducida por factoresambientales (como exposición a luz UV, radiacionesionizantes o a ciertas sustancias químicas) o puede ocu-rrir de manera espontánea por errores en la replicacióndel DNA. En el último decenio ha habido un avancecientífico muy importante en el conocimiento de lavariación genética humana, y se ha asociado con la sus-ceptibilidad, resistencia a diferentes enfermedades oambas, así como con la respuesta individual a la terapiafarmacológica.
El conocimiento de cómo está constituido el genomahumano nuclear fue una de las metas del Proyecto delGenoma Humano (PGH). Iniciado a principios de 1990,el PGH publicó en 2001 un borrador de la secuencia delgenoma humano y en 2004 una secuencia quecomprendía 99.7% de la región eucromática,interrumpida por sólo 300 huecos y con un error de unnucleótido por cada 100 000 bases. La región eucromá-tica abarca 3 Gb y corresponde a la región transcripcio-nal activa del genoma nuclear. Las 200 Mb restantesestán formadas por heterocromatina constitutiva queestá de forma permanente condensada. La heterocroma-tina constitutiva está compuesta de grandes tramos deDNA repetido que son muy difíciles de secuenciar demanera precisa. Por una razón similar, las unidades trans-cripcionales repetidas en tándem que codifican para losrRNA 28S, 18S y 5.8S tampoco fueron secuenciadas.
El estudio de las variaciones del DNA ha contribuidode manera importante a las áreas biomédica y forense, enespecial en el estudio de genes responsables y genes desusceptibilidad para varias enfermedades. Los tipos devariaciones genéticas empleadas en estos estudios hancambiado en los últimos 25 años y pueden clasificarse encinco clases principales: polimorfismos de restricción delongitud variable o RFLP (restriction fragment length poly-morphism), minisatélites o VNTR (variable number oftandem repeat), microsatélites o STR (short tandem repe-at), polimorfismos de nucleótido sencillo o SNP (single-nucleotide polymorphism) y variaciones en el númerode copias o CNV (copy-number variation).
En particular, la secuencia del genoma humano pro-porcionó una mayor comprensión para catalogar e inter-
pretar la variación genética entre los individuos.Alrededor de 99.9% de la secuencia del DNA es idénti-ca entre los diferentes individuos. El restante 0.1% esvariable y aun cuando representa una pequeña propor-ción del genoma total, es responsable de una variaciónsignificativa en el fenotipo. La escala de diversidad en elgenoma humano es muy amplia, desde variacionesmicroscópicas a nivel de cromosomas individuales hastavariaciones a nivel de la secuencia del DNA. Estas últi-mas incluyen más de 10 millones de polimorfismos denucleótido sencillo o SNP. Los polimorfismos genéticosson cambios en la secuencia del DNA que están presen-tes con una frecuencia > 1% de manera natural en unapoblación. La variación estructural visible al microscopioincluye heteromorfismos y rearreglos cromosómicosbalanceados (translocaciones, inversiones, entre otros)que pueden tener tamaños mayores a 3 Mb. Sin embar-go, también existen variaciones submicroscópicas quevan de menos de 3Mb hasta 1 kb en longitud. Recién sehan descrito variaciones estructurales submicroscópicasque comprenden inserciones/deleciones (indel) de esca-sos nucleótidos y variaciones en el número de copias oCNV (figura A1-1). Los minisatélites, microsatélites(figura A1-2) y las inserciones de transposones tambiénhan sido identificadas dentro de esta clase de variantessubmicroscópicas y, en general, requieren de métodosgenómicos para su identificación.
Los minisatélites y microsatélites son secuencias repe-tidas en tándem (una tras otra) compuestas de unidadescortas repetidas. Aunque el tamaño de la unidad de repe-tición determina su clasificación en uno u otro grupo, ala fecha no existe un consenso acerca de la definiciónprecisa de ambos tipos de repetidos. En este capítuloconsideraremos a los STR desde repetidos mononucleó-tido [tractos de poli (A)] hasta los de clase pentanucleó-tida. El tamaño de la unidad de repetición de los VNTRcomprenderá de seis a varias centenas de nucleótidos. Lalongitud completa del tracto de repetidos también varía,siendo de 102 a 103 pb y < 10 a 102 pb para los minisa-télites y microsatélites, respectivamente.
MINISATÉLITES O VNTR
La secuencias minisatélites son altamente polimórficas yal parecer la alta variabilidad es resultado de errores
durante la replicación del DNA, en donde la polimerasaaumenta o disminuye el número de unidades de repeti-ción; también errores en la recombinación pueden modi-ficar el número de unidades de repetición presentes enun alelo. La variación de estas secuencias es tal que se hacalculado que no existen dos individuos con exactamen-te la misma combinación de alelos minisatélites. En 1985Jeffreys et al., desarrollaron sondas de DNA capaces dedetectar de manera simultánea un gran número de locide minisatélites hipervariables. La hibridación de estassondas con DNA digerido y separado por electroforesis,en condiciones de bajo rigor, detecta un patrón de frag-mentos que es único para individuos no relacionados.Estas propiedades de los minisatélites son la base de losanálisis de huellas génicas o de DNA, por lo que si seanaliza un número suficiente de minisatélites se puedeestablecer un perfil de DNA único para cada persona.De manera adicional, los VNTR contribuyeron de mane-ra importante al estudio de los genes supresores detumor. En la mayoría de estos genes se inactivan ambosalelos en el tejido tumoral (teoría del doble evento, o ini-ciación-promoción). Los VNTR fueron útiles para detec-tar, mediante hibridación tipo Southern, la pérdida deuna porción cromosómica o de un cromosoma completo(pérdida de heterocigosidad); esto es, la desaparición delalelo materno o paterno. El primer análisis sistemático dela pérdida de regiones cromosómicas (análisis de aleloti-pos) fue informado por Vogelstein et al., (1988) en cán-cer colorrectal y a partir de estos resultados se establecióel modelo de carcinogénesis de etapas múltiples en estaneoplasia. Un análisis detallado subsecuente de 17p llevóa la identificación de mutaciones en el gen TP53 y secomprobó que era un gen supresor de tumor.
MICROSATÉLITES O STR
Como en el caso del DNA minisatélite, la variación enel número de repetidos STR se debe a errores cometi-dos por la DNA polimerasa durante la replicación o aeventos de recombinación desigual entre cromosomashomólogos o entre cromátidas hermanas. Los microsa-télites pueden ser: polimorfismos de riesgo en enfer-medades complejas (diabetes, depresión, entre otras),mutaciones patogénicas (en el grupo de enfermedadesconocidas como enfermedades por amplificación demicrosatélites, p. ej., ataxias espinocerebelosas yenfermedad de Huntington) y emplearse en mapas deasociación, ligamiento y genética forense. Los STRpueden participar en forma tan variada como: a) ele-mentos funcionales de unión a factores de transcrip-ción y a otras proteínas que inhiben o promueven laexpresión; b) elementos motivo que afectan la eficien-cia del procesamiento del mRNA; y c) elementos quetienen efectos físicos, tales como variar el espacioentre motivos funcionales o alterar la estructura y laspropiedades de fusión del DNA en sus proximidades.Por estas razones, los STR son a priori muy buenoscandidatos funcionales (figura A1-2).
A partir de la comparación de la secuencias de losgenomas personales de Craig Venter y James Watsonse hizo evidente la gran variabilidad genética interin-dividual. A la fecha, las nuevas técnicas de re-secuen-ciación de genomas han permitido la formación dediversos consorcios internacionales para secuenciar almenos 1000 genomas de individuos de todo el mundo(The 1000 Genomes Project, http://www.1000geno-mes.org/). La motivación principal de estos estudios
© E
dito
rial E
l man
ual m
oder
noFo
toco
piar
sin
aut
oriz
ació
n es
un
delit
o.
28 Genetica clínica
Figura A-1. Tipo de variaciones genéticas observadas en lasecuencia y estructura del genoma humano.
ATTGGCCTTAACCCCCGATTATCAGGATATTGGCCTTAACCTCCGATTATCAGGAT
ATTGGCCTTAACCCCCGATTATCAGGATATTGGCCTTAACCCCC TTATCAGGAT
ATTGGCCTTAGGCCTTAA CCCCCGATTATCAGGATATTGGCCTTAA - - - - - CCCCCGATTATCAGGAT
Polimorfismo denucleótido sencillo(SNP)
Interción-deleción(INDEL)
Variación en númerode copias (CNV)
Figura A-2. Tipo de variaciones genéticas observadas en lasecuencia y estructura del genoma humano.
1217
7
4
AMinisaltélite(VNTR)
Microsatélite(STR)
B
5-
3- -3
-3ACAGGGTGTGGG
TGTCCCACACCC
CACACACACACACACGTGTGTGTGTGTGTG
5´-
3´-
-3´-5´
es mejorar la salud humana y el objetivo a largo plazoes descifrar el código de la variación genética naturalpara entender cómo los cambios en nuestros patronesgenéticos influyen en las características humanas,incluyendo modificación de los estados de salud-enfermedad y respuesta a los tratamientos médicos.
SNP
El polimorfismo más común en el genoma humano esla diferencia de una sola base conocido como o SNP, elcual ocurre aproximadamente cada 300 a 1 000 pb. Seestima que existen > 10 millones de SNP y los cientí-ficos creen que estos cambios constituyen la base de lamayoría de las enfermedades humanas. La mayoría delos SNP tiene dos alelos posibles, por lo que hay unaalta probabilidad de que todos los miembros de unafamilia sean homocigotos para un SNP particular; sólouna minoría son trialélicos. Aunque su bajo polimorfis-mo podría descartarlos como marcadores para estudiosde ligamiento y mapeo génico, las ventajas de los SNPen estudios de asociación son su gran abundancia y elhecho de que pueden ser tipificados por métodos queno requieren electroforesis en gel. La detección delSNP está basada en análisis de hibridación de oligonu-cleótidos, lo que permite el uso de tecnologías automa-tizadas como los chips de DNA.
Dependiendo de la localización del SNP será elefecto que tendrá en la regulación del gen o en el pro-ducto para el cual codifica. Existen polimorfismospoco considerados en los estudios de asociación que selocalizan en las regiones transcritas de los genes, afec-tan las funciones del RNA y en conjunto se denomi-nan SNP estructurales del RNA (rSNP). A partir delas investigaciones de SNP relacionados conrasgos/enfermedades en estudios de asociación delgenoma completo o GWAS (Genome Wide AssociationStudies) se sabe que 9% del total de los SNP están enregiones codificantes y son no sinónimos; 43% de losSNP se localizan en regiones intergénicas; 49% sonrSNP (incluyendo 2% de SNP sinónimos, 2% ubicadosen regiones no traducidas 5 y 3 , y 45% de SNP intró-nicos). Los grupos de SNP vecinos en un mismo cro-mosoma se heredan en bloques y este patrón de SNPen un bloque se conoce como haplotipo. Para caracte-rizar este tipo de variación en las poblaciones se desa-rrolló el proyecto HapMap, el cual será mencionadoen la parte final de este apartado.
INDEL
Los polimorfismos de indel se encuentran en promediocada 7.2 kb de DNA en el genoma humano y su tamañopuede ser de 1 a 10 000 nucleótidos que están elimina-dos o insertados en la secuencia de tipo silvestre. Su con-tribución en la divergencia de la secuencia entre losgenomas humano y de chimpancé es mayor que la de loscambios nucleotídicos (3% vs 1.2%). Se han identificadomás de 840 000 indel que afectan poco más de 7 000genes humanos (> 11 000 transcritos). Los análisis fun-
cionales de zonas exónicas ricas en indel revelan produc-tos génicos con actividades de regulación a nivel detranscripción y traducción. De esta manera se sugiereque las indel contribuyeron a rasgos únicos de la especieal causar cambios a nivel de RNA o proteína.
Existen cinco clases principales de indel, incluyendo1) inserciones y deleciones de un solo par de bases, 2)expansiones monoméricas de un par de bases, 3) expan-siones de multipares de bases de 2 a 15 pb de unidadesde repetición, 4) inserciones de transposones y 5) indelque contienen secuencias de DNA aleatorias.
Al igual que los SNP y las CNV, las variaciones en losindel son de gran interés porque pueden alterar caracte-rísticas y ocasionar enfermedades. Las nuevas tecnologí-as de secuenciación genómica de “la siguiente genera-ción” (next generation) junto con los proyectos de secuen-ciación del exoma han permitido identificar un grannúmero de indel en regiones codificantes sugiriendo quela mayoría de los humanos porta una carga genéticasubstancial de estas variaciones. Los indel han sidomenos estudiados que los SNP; sin embargo, aquelloslocalizados en regiones codificantes de seguro tendránun impacto importante en la biología y en las enferme-dades humanas. Una de las enfermedades genéticashumanas más estudiada, la fibrosis quística, por locomún es causada por un indel dentro del gen CFTR. Ladeleción en fase de tres pares de bases elimina un amino-ácido (fenilalanina) que abole la función del gen y pro-duce la fibrosis quística. Por otro lado, los indel que ocu-rren en regiones promotoras alteran la expresión del gencorrespondiente.
En general, el DNA del genoma humano tiene unacopia de las regiones autosómicas (heredada de cada pro-genitor) en cada cromosoma. Como resultado de lasecuenciación sistemática de genomas humanos median-te el uso de microarreglos de hibridación genómica com-parativa (CGH) se descubrió que muchas regiones gené-ticas presentan variación en el número de copias o CNV(más o menos de dos copias) y se amplió el espectro delas variantes estructurales y de las CNV para incluir aeventos más pequeños (mayores de 50 pb).
CNV
Las CNV corresponden a segmentos de DNA, repetidosen un número de copias bajo, de 1kb a varias megabasesde longitud que contienen secuencias codificantes y nocodificantes. Las CNV constituyen al menos 12% delgenoma humano y contribuyen más a la diversidad genó-mica entre los individuos que los SNP, si se considera elnúmero de nucleótidos implicado (figura A1-1). LasCNV pueden ser heredadas o pueden haber ocurrido denovo en la persona cuyo genoma está siendo examinado.Algunas pueden no causar problemas médicos, peroaquéllas que incluyen regiones codificantes pueden aso-ciarse con enfermedades monogénicas o dando suscepti-bilidad o resistencia a enfermedades complejas y modifi-cando la respuesta a fármacos. Cuando las CNV alteranel número de copias de un gen presente también se lesconoce como cambios en la dosis génica. La alteración enla dosis génica puede ser de ganancia de función como©
Edi
toria
l El m
anua
l mod
erno
Foto
copi
ar s
in a
utor
izac
ión
es u
n de
lito.
Bases moleculares de la herencia 29
consecuencia de la duplicación o multiplicación de unoo varios exones e incluso de gen (es) completo (s) en laregión que abarca la CNV; en contraste, los eventos dedeleción producen una pérdida de función. En resumen,el cambio en la secuencia nucleotídica de un gen (SNP)o en su número de copias (CNV) puede conducir a cam-bios en la secuencia de sus aminoácidos o en la cantidadde una proteína y alterar su acción enzimática, su estabi-lidad o su capacidad de unión a otras moléculas. El cua-dro A1-1 contiene algunos ejemplos de variaciones desecuencia y estructurales del genoma humano.
PRINCIPALES BASES DE DATOS PÚBLICAS PARA EL MANEJO DE DATOSDE VARIABILIDAD GENÉTICA
A un decenio del PGH una gran cantidad de SNP, indely CNV comunes en el genoma humano están disponi-bles en las bases de datos públicas. En la página electró-nica de NCBI (National Center for BiotechnologyInformation www.ncbi.nlm.nih.gov) se encuentra la basede datos de SNP denominada dbSNP. Además de datos
© E
dito
rial E
l man
ual m
oder
noFo
toco
piar
sin
aut
oriz
ació
n es
un
delit
o.
30 Genetica clínica
Cuadro A1-1. Ejemplos de variaciones genéticas de secuencia y estructurales (SNP, indel y CNV) con variación feno-típica normal y algunas asociadas con fenotipo clínico
GEN/producto
CCR5 (Receptor 5de quimiocina conmotivo C-C)
DARC(Antígeno Duffy)
HBG2 (Globina ")
TFR2(Receptor de latransferrina)APOE (Apolipoproteína Ealelo épsilon 4)HFE (Gen de lahemocrormatosis)
CYP17A1 (gen quecodifica para elpolipéptido 1 delcitocromo P450,familia 17,subfamilia A)DRD2(Receptor 2 de ladopamina)CAPN10 (Calpaína)D. Ejemplos de CNV
RHD(Grupo sanguíneoRh)
CCL3L1/CCL4L1(ligando 3/4 dequimiocina conmotivo C-C, similaral 1)FCGR3 (fragmentoFc de IgG, receptorIII o CD16)
Enfermedad asociada
Progresión aceleradaa SIDA en linfocitos ThumanosResistencia a lamalaria por P. vivaxen individuos deraza negraTalasemia alfa enmelanesios
Hemocromatosis Tipo III
Es un factor de riesgopara enfermedad deAlzheimerHemocromatosis
Hipertensión
Anorexia nerviosa
Diabetes mellitus tipo II
Sensibilidad al gruposanguíneo Rhesus p.ej.anemia hemolítica delrecién nacido cuando elfeto es Rh (+) y la madrees Rh (-)Susceptibilidad disminuidapara desarrollar SIDA
Lupus eritematososistémico y otrasenfermedades autoinmunes
Fenotipo
Sobreproducción deCCR5
Pérdida de laexpresión de DARCen eritrocitos
Ganancia de funciónde un sitio GATA-1 ypérdida de laexpresión de laglobina "
Patogénico
Probablementepatogénico
Probablementedañina
Deficiencia de17-alfa-hidroxilasa/17, 20-liasa
Afecta eficiencia dela transcripción delgenND
0 CNV produceausencia delantígeno D
Riesgo reducido deinfección por virusde HIV
Glomerulonefritis
Elemento derespuesta afectadoNF B
GATA-1
GATA-1
NA
NA
NA
NA
NA
NA
Tamaño
6 kb
ND
>5 kb
Posición/variante
-208G/T
-46C
149C/T
2110A/C [Q690P]
388T/C [C112R]
187C/G [H63D]
157_159delTTC[Phe53del]
-/C Indel -141
Indel 19
Variación en el número de
copias0 a 2
0 a 14
0 a 14
rs (dbSNP)/locus
rs2734225en 3p21.31
rs1800846 en1q21 a q22
SNP195 en11p15.5
rs80338889 en7q22
rs429358 en19q13.2
rs1799945 en6p21.3
-TTC en 10q24.3
rs1799732 en11q23
En 2q37.3
Tipo
Deleción en1p36
VNTR en17q21.1 y q12,respectivamente
Del/dupl en1q23.3
A. Ejemplos de rSNP
B. Ejemplos de SNP
C. Ejemplos de indel
NA.- no aplica; ND.- no determinado. (Wain LV et al 2009, Eichler EE et al 2007, Hernández-Romano JH et al 2009).
sobre SNP, contiene información de polimorfismos tipomicrosatélite e indel de pequeña escala. La dbSNP pro-vee información de frecuencias específicas por pobla-ción, datos de genotipos, condiciones experimentales yligas a mapas [http://www.ncbi.nlm.nih.gov/snp]. Otrabase de datos que sirve para el almacenamiento centralde datos de variación genética humana es la HGV(Human Genome Variation database). Esta base de datosprovee datos de estudios de asociación, resume todas lasvariaciones de secuencia conocidas en el genoma huma-no y facilita la investigación de cómo los genotipos afec-tan en enfermedades comunes, en la respuesta a fárma-cos y en otros fenotipos complejos [http://www.gwas-central.org].
El proyecto internacional del HapMap es un mapa dehaplotipos del genoma humano y fue posible gracias a laelucidación de nuestro genoma completo. Los bloques dehaplotipos pueden contener una gran cantidad de SNP,aunque sólo algunos pueden ser suficientes para identificarde manera inequívoca los haplotipos de un bloque. ElHapMap es un mapa de estos bloques de haplotipos y los
SNP específicos que identifican los haplotipos se conocencomo SNP etiqueta (tag SNP). Éstos SNP etiqueta reducenel número requerido de 10 millones SNP existentes a solo 500 000 SNP en un GWAS para investigar un fenotipo.Por ello, el HapMap es una herramienta que permite a losinvestigadores encontrar genes y variaciones genéticas queafectan los estados de salud y enfermedad en el humano[www.hapmap.org].
El Proyecto de los 1 000 Genomas es una colabora-ción internacional que está en desarrollo y cuyo objetivoprincipal es producir un catálogo público de la variacióngenética humana (2 500 genomas de 25 poblaciones),incluyendo SNP y variantes estructurales, junto con sushaplotipos. Este recurso apoyará los GWAS y otros estu-dios de investigación médica. Los investigadores tambiénpodrán estudiar recombinación, selección natural, asícomo estructura y mezclas de poblaciones en este catá-logo [http://www.1000genomes.org/]. El cuadro A1-2resume los principales navegadores y bases de datospúblicas que proporcionan información relevante de lasdistintas clases de variaciones genéticas.
Bases moleculares de la herencia 31Cuadro A1-2. Principales navegadores y bases de datos (BD) públicas que contienen información relevante
de las distintas clases de variaciones genéticasBase da datos
Navegador de genomasde la UCSC (Universityof California, SantaCruz)Navegador de losInstitutos Nacionales deSalud de los EUA, NCBI(The National Center forBiotechnologyInformation) Instituto Europeo deBioinformática, partede los Laboratorios deBiología MolecularEuropeos (EMBL-EBI)Navegador ENSEMBL
BD de desbalancescromosómicos y fenotipo en humanos, empleando recursos de ENSEMBL,DECIPHERProyecto de la variaciónen el número de copias
Base de datos devariantes genómicasConsorcio WellcomeTrust de casoscontroles
NIEHS SNP
DescripciónEste sitio contiene secuencias de referencia y ensambladosen borrador para una gran colección de genomas. Tambiénprovee portales para la Enciclopedia de los Elementos deDNA (ENCODE) y Proyectos del NeandertalEs una de las BD biomédica más completa para una grancolección de genomas. Contiene sistemas dealmacenamiento y herramientas de análisis para biologíamolecular, bioquímica y genética
Consorcio internacional que provee datos genómicos dediversos organismos, junto con una batería de herramientasde bioinformática
ENSEMBL es un proyecto de unión entre EMBL - EBI y elInstituto Wellcome Trust Sanger para desarrollar un sistemaque produce y mantiene anotaciones de genomas deeucariontes seleccionadosEsta BD contiene información de desbalances cromosómicossubmicroscópicos, reúne toda la información clínicarelacionada con microdeleciones/duplicaciones/inserciones,translocaciones e inversiones y la despliega en el mapa delgenoma humanoProyecto dirigido por el Instituto Sanger que incluye datos de CNV en humano, obtenidos mediante nuevas tecnologíasde secuenciación, análisis de microarreglos, citogenética,genética de poblaciones, genómica comparativa ybioinformáticaCatálogo curado de variación estructural (CNV, indel) en elgenoma humanoIdentifica variaciones de secuencia que tienen influenciasobre las causas principales de morbi-mortalidad en elhumano a través de GWAS (Genome Wide AssociationStudies)BD de SNP que se enfoca a relaciones entre exposicionesambientales, variaciones de secuencia inter-individuales engenes humanos y riesgo a enfermedades en poblaciones delos EUA
Dirección electrónica de la páginahttp://genome.ucsc.edu/
http://www.ncbi.nlm.nih.gov/
http://www.ebi.ac.uk/
http://www.ensembl.org/
http://www.sanger.ac.uk/PostGenomics/decipher/
http://www.sanger.ac.uk/humgen/cnv/
http://projects.tcag.ca/variation/
http://www.wtccc.org.uk
http://egp.gs.washington.edu
BIBLIOGRAFÍA
Chen FC, Chen CJ, Li WH, Chuang TJ: Human-specific inser-tions and deletions inferred from mammalian genomesequences. Genome Research 2007;17:16-22.
Henrichsen CN, Chaignat E, Raymond A: Copy numbervariants, diseases and gene expression Human MolecularGenetics 2009;18:R1–R8.
Lander ES, Linton LM, Birren B, Nusbaum C et al.: Initialsequencing and analysis of the human genome. Nature2001;409:861-921.
Mills RE, Pittard WS, Mullaney JM, Farooq U, Creasyet TH etal.: Natural genetic variation caused by small insertions
and deletions in the human genome. Genome Research2011. doi/10.1101/gr.115907.110.
Mullaney JM, Mills RE, Pittard WS, Devine SE: Small inser-tions and deletions (INDELs) in human genomes. HumanMolecular Genetics 2010;19;R2:131-136.
Ng PC, Samuel Levy, Jiaqi Huang, Timothy B. Stockwell, BrianP. Walenz et al.: Genetic Variation in an IndividualHuman Exome. PLOS Genetics 2008;4:8:1-15.
Venter JC, Adams MD, Myers EW, Li PW, Richard J et al.: Thesequence of the human genome. Science 2001;291:1304-1351.
Wheeler DA, Srinivasan M, Egholm M, Shen Y, Chen L et al.:The complete genome of an individual by massively para-llel DNA sequencing. Nature 2008;452:872-877.
© E
dito
rial E
l man
ual m
oder
noFo
toco
piar
sin
aut
oriz
ació
n es
un
delit
o.
32 Genetica clínica
ANEXO II DNA mitocondrial humano: polimorfismo y
variabilidad en las poblaciones
Rosenda I. Peñaloza Espinosa, Ricardo M. Cerda Flores
El genoma mitocondrial (mtDNA) fue descrito por pri-mera vez por Nass y Nass en 1963, secuenciado porAnderson et al., en 1981 y revisado por Andrews et al.,(1999). El mtDNA presenta polimorfismos de un solonucleótido en la secuencia codificante y dos regionesaltamente polimórficas (HV1 y HV2 que correspondena nucleótidos -nt- 16090-16362 y 76-340, respectiva-mente), ubicadas en la región control, (asa D o “D-loop”). De acuerdo con Ford (1940) un polimorfismo esla presencia de dos o más formas alélicas de un gendonde la más rara tiene una frecuencia mayor a 1% en lapoblación general y no alteran la función génica.
Utilizando la técnica de RFLP, diferentes investigado-res mostraron diferencias en patrones de sitios polimór-ficos a los que se denominó haplogrupos e informaronque son específicos de las poblaciones en todos los con-tinentes. En África, de 70 a 100% de las poblaciones delsubsahara están representadas por el haplogrupo L y sub-tipos. En Asia y la Siberia los mtDNA pertenecen a loshaplogrupos C, D, G y E, que son miembros de loshaplogrupos M, mientras que para el resto de Asia loshaplogrupos son A, B, F, X6 y X7. En Europa, 99% delmtDNA pertenece a los 10 haplogrupos (H, I, J, K, M, T,U, V, W y T) y en nativos de América sólo cinco haplo-grupos de Asia son observados (A, B, C, D y X). La des-cripción detallada de todos estos haplogrupos se observaen el cuadro A2-1.
En México se han realizado estudios tanto en pobla-ciones indígenas (Peñaloza-Espinosa et al., 2007;Sandoval et al., 2009; Kemp et al., 2010; Moran et al.,2011) como mestizas mexicanas (Green 2000;Guardado-Estrada 2009) encontrando una amplia varia-ción entre ellas que va de 30 a 87.5% para el haplogru-po A, de 14 a 53% para el B, de 0 a 31% para C y de 0 a12% para el D. El haplogrupo X se informó en dospoblaciones (Peñaloza-Espinosa et al., 2007) y al hacer lasecuenciación sólo se corroboró uno de ellos(Tarahumara). En cuanto a haplogrupos europeos y afri-canos, éstos se observaron en baja proporción en pobla-ciones indígenas y mayor en mestizas (cuadro A2-2).
Estudios recientes de secuenciación completa delmtDNA demostraron que en América sólo se encuen-tran los haplogrupos A2, B2, C1 y D1 (Achili et al.,2009; Sandoval et al., 2009; Kemp et al., 2010).
Los datos obtenidos permitieron realizar filogeniasmoleculares donde se compararan segmentos homólo-gos, dentro de una misma población, o entre poblacionesde una misma especie. Las relaciones filogenéticas entrepoblaciones se representan por árboles filogenéticos queconsisten en nodos conectados por ramas.
Existen diferentes procedimientos para la reconstruc-ción filogenética, y uno de los más utilizados es el de“máxima parsimonia” o de “evolución mínima” que signi-fica que la evolución ocurre de manera que los cambios
en los nucleótidos son igualmente probables en todas lasposiciones, lo que significa que el árbol elegido es el querequiere el mínimo número de mutaciones para explicarla distribución de los caracteres entre los individuos aestudiar.
Uno de los primeros estudios de análisis de variabili-dad mitocondrial en poblaciones humanas fue el deCann et al., (1987), quienes analizaron individuos deAsia, Australia, Nueva Guinea, Europa y África encon-trando resultados que les permitieron formular la hipó-tesis de la “Eva mitocondrial” donde resaltaron tresaspectos principales:
1. Que todos los tipos de mtDNA actuales se remontan aun ancestro único.
2. Que este ancestro es de origen africano.3. Que surgió hace alrededor de 200 000 años.
Esta interpretación está basada en el principio de coales-cencia que asume la existencia de un solo origen paratodos los organismos vivos, por lo que la variación encualquier segmento del DNA mitocondrial (o nuclear)en las generaciones presentes deben proceder en ultimainstancia de un único ancestro que existió en generacio-nes previas. Tal ancestro femenino fue miembro de lapoblación donde el resto de los linajes mitocondriales sefueron perdiendo con el paso de las generaciones, y sólorepresenta el punto donde los linajes convergen. Talhipótesis ha sido muy controvertida debido a los méto-
dos de reconstrucción filogenética; sin embargo, ha servi-do de apoyo a otros estudios tanto de análisis de mtDNAcomo de otros marcadores nucleares. Más tarde esta teo-ría fue apoyada por otros autores, y se realizaron otrosestudios en diferentes poblaciones de los cinco continen-tes incluyendo las amerindias. Por ejemplo, en África seencuentran distintos haplogrupos donde el L es el más©
Edi
toria
l El m
anua
l mod
erno
Foto
copi
ar s
in a
utor
izac
ión
es u
n de
lito.
Bases moleculares de la herencia 33
Figura A2-1. Representación esquemática del mtDNA. En la regióncontrol están las regiones más polimórficas, además del origen dereplicación de la cadena pesada (OH), el origen de la transcripciónde la cadena pesada (HSP) y de la ligera (LSP). El origen de replica-ción de la cadena ligera (OL) se encuentra entre la secuencia de lostRNAa N y C. Las proteinas ND-1 a ND6 incluyendo ND4L son delcomplejo I, Cyp-b del complejo III, COI, COII del complejo IV y dossubunidades de la ATPasa6y8 del Complejo V. Los tRNA están repre-sentados por las letras P, T, E, L, S, H, R, G, B, K, D, A, N, C, Y, W, I,Q, M, L, V y F.
0h
Región controlF T
Cyt b
cadena H
ND5
LS
H
ND4
ND4LR
ND3GCOIII
ATPasa6
ATPasa8
KCOIID
COI0L
B
cadena LA
NCY
Q
RNA16S
L
ND1I
M
ND2
W
P
E
V RNa12S
Cuadro A2-1. Haplogrupos del DNAmt humanoHaplotipo
A
B
C
D
X
E
F
G
H
I
J
K
L
M*
T
U
V
W
X
Oligonucleótidos(sentido,
antisentido)534 a 553, 725 a 7068 150 a 8 166, 8 366 a 8 34513 197 a 13 213, 13 403 a 13 3845 151 a 5 170, 5 481 a 5 464534 a 553, 725 a 70613 197 a 13 213,13 403 a 13 3845 151 a 5 170,5 481 a 5 46410 270 a 10 290, 10 579 a 10 5577 367 a 7 384,9 172 a 9 15416 453 a 16 472,1 696 a 1 6773 108 a 3127,5 917 a 5 8986 890 a 6 999,7 131 a 7 1151 615 a 1 643,1 894 a 1 8748 188 a 8 207,8 366 a 8 3459 911 a 9 932,10 107 a 10 08813 583 a 13 605,13 843 a 13 8248 829 a 8 845,9 184 a 9 163
12104-12124, 12338-12309
3 388 a 3 408,3 717 a 3 70110 270 a 10 290,10 579 a 10 55713 172 a13 190,13 403 a 13 38415 409 a 15 428,15 701 a 15 68212 104 a 12 124,12 338 a 12 3094 308 a 4 325,4 739 a 4 7208 188 a 8 207,8 366 a 8 3458 829 a 8 845,9 184 a 9 1631 615 a 1 643,1 894 a 1 897
Población
América, Asia
América, Asia
América, Asia
América, Asia
Asia, América
Asia
Asia
Asia
Europa
Europa
Europa
Europa
Africa
América, Asia
Europa
Europa
Europa
Europa
Europa
SitioPolimórfico
+663 HaeIII
9pb-deleción
+13 262 AluI
-5 176 AluI
-663 HaeIII
+13 262 AluI
+5 176 AluI
+10 397 AluI
-7 596 HhaI
-1 206 HincII
+4 830 HaeIII
-7 025 AluI
-1 715 DdeI
+8 249 AvaII
+10 028 AluI
-13 704 BstOI
-9 052 HaeII
+12 308 HinfI
+3 592 HpaI
+10 397 AluI
+13 366BamHI+15 606 AluI
+12 308 HinfI
-4 577 NlaIII
+8 249 AvaII
-8 994 HaeIII
-1 715 DdeI
*Mestizos = C + D + E + G.
frecuente con subgrupos L1, L2 y L3. En Europa y Asiason frecuentes los haplogrupos M y N que se originaronen el este de África y a continuación se dispersaron a losdiferentes continentes sobre todo a Asia, Europa. Eneuropeos en general (caucásicos), también son frecuen-tes los haplogrupos H, I, J, N1b, T, U, V y W, mientras enla región siberiana predominan los haplogrupos G, Y y Zy en América los más frecuentes son los haplogrupos A2,B2, C1, D1 y X originados en Asia.
El análisis de componentes principales (PCA) asícomo la construcción de redes son herramientas parahacer estudios poblacionales (figura A2-2).
Por otra parte, se ha informado de una correlaciónentre los haplotipos mitocondriales con el lenguaje enalgunas poblaciones como las europeas, pero no en otrascomo las amerindias donde sólo correlaciona con laregión ya que la llegada de españoles y africanos en laépoca de la colonia cambió la historia (Sandoval et al.2009; Kemp et al., 2010), datos que correlacionan conotros marcadores autosómicos y del cromosoma Y(Cerda-Flores et al., 2002 a y 2002b; Buentello et al.,2005 y 2008; Guardado-Estrada et al., 2010; Gorostiza yGonzález-Martin 2010).
Las secuencias fundadoras han divergido a medidaque los grupos humanos se establecieron en las distintasregiones geográficas del mundo como lo demuestran loshaplogrupos mitocondriales específicos de cada conti-nente (figura A2-2). De esta manera ha sido posible ras-trear la historia de las poblaciones humanas a través delas mutaciones acumuladas en los linajes de mtDNA(Alvarez-Iglesias 2005).
De acuerdo a los resultados informados, podemosconcluir que el Homo sapiens tiene un origen de alrede-dor de 200 000 años donde las poblaciones más antiguasson subsaharianas caracterizadas por variantes delmacro-haplogrupo L. De ahí salieron a Eurasia hacecerca de 80 000 años por el estrecho de Omán hasta lle-gar a Australia y Nueva Guinea en migraciones indepen-dientes. Otro grupo pobló Asia hace 50 000 años aproxi-madamente, quienes llegaron a través de los grandes ríos(modelo centrípeto de expansión). Más tarde (45 000años) se establecieron en Europa occidental donde esfrecuente el haplogrupo U5 y otras variantes que hacensuponer un segundo doblamiento hace 31 000 años. ElContinente Americano se pobló con grupos humanosprocedentes de Asia hace cerca de 18 000 años y por
© E
dito
rial E
l man
ual m
oder
noFo
toco
piar
sin
aut
oriz
ació
n es
un
delit
o.
34 Genetica clínica
Cuadro A2-2. Porcentaje promedio de haplotipos de mtDNA en poblaciones mexicanasHaplogrupo
ABCDAfricanoEuropeoDesconocidoN ind./n pob
Guardado et al. 201051.117.818.55.90.76.00270/17
Green et al. 2000
33.626.523.35.84.55.40.9223/2
Moran et al. 2011
42.723.620.44.5--8.8110/2
Kemp et al. 2010*
49.028.017.15.60.20.10597/11*
Sandoval et al. 2009
50.517.628.52.7
000.6477/11
Peñaloza et al. 2007
51.228.811.15.30.600513/11
N ind./n pob = número de individuos en numero de poblaciones; *Sólo se tomó en cuenta a las poblaciones mexicanas.
Figura A2-2. Representación de las migraciones humanas a través del mtDNA (adaptado de Mitomap).
50 000
150 000200 000
60 00080 000 80 000
31 000
C+D AG
BF
12 000-15 000
15 000
B
A.C.D
A.C.DB
TEXTO ILEGIBLE
último llegaron las islas del pacífico hace cerca de 8 000años (Gorostiza y González-Martin, 2010). Estos estu-dios han sido utilizados también en medicina forense yrelacionados con diversas patologías humanas.
BIBLIOFRAFÍA
Achilli A, Perego UA, Bravi CM et al.: The phylogeny of thefour pan-American MtDNA haplogroups: implications forevolutionary and disease studies. PLoS ONE 2008;3(3):e1764.
Álvarez IV, Mosquera MA, Cerezo M et al.: New Populationand Phylogenetic Features of the Internal Variation withinMitochondrial DNA Macro-Haplogroup R0. PLoS ONE2009;4(4):e5112. doi:10.1371/journal.pone
Andrews RM, Kubacka I, Chinnery PF, Lightowlers RN,Turnbull DM, Howell N: Reanalysis and revision of theCambridge reference sequence for human mitochondrialDNA. Nat Genet 1999;23:147.
Buentello ML, Peñaloza ERI, Salamanca GF, Cerda FRM:Genetic admixture of eight Mexican indigenous popula-tions: based on five polymarkers, HLA-DQA1, ABO, andRH loci. Am J Hum Biol 2008;20:647-650.
Cerda FRM, Budowle B, Jin L, Barton SA, Deka R,Chakraborty R: Maximum likelihood estimates of admix-
ture in Northeastern Mexico using 13 short tandem repe-at loci. Am J Hum Biol 2002b;14:429-443.
Cerda FRM, Villalobos TMC, Barrera SHA et al.: Geneticadmixture in three mexican mestizo populations based onD1S80 and HLA-DQA1 loci. Am J Hum Biol2002a;14:257-263.
Gorostiza A, González MA: Historia Natural del ADN mito-condrial humano. En: Fósiles y moléculas. Aproximacionesa la historia evolutiva de Homo sapiens. AntonioGonzález-Martín (Editor). Memorias de la Real Sociedadespañola de Historia Natural, Segunda época, Tomo VIII,año 2010. ISSN: 1132-0869. ISBN: 978-84-936677-5.
Kemp BM, González OA, Malhi RS, Monroe C et al.:Evaluating the Farming/Language Dispersal Hypothesiswith genetic variation exhibited by populations in theSouthwest and Mesoamerica. Proc Natl Acad Sci USA2010;107:6759-6764.
Morán BV, Peñaloza ERI, Castro SE et al.: Genetic structureof three Native Mexican communities based on mtDNAhaplogroups, and ABO and Rh blood group systems. RIC2011 (En prensa).
Peñaloza ERI, Arenas AD, Cerda FRM et al.: Characterizationof mtDNA haplogroups in 14 Mexican indigenous popu-lations. Hum Biol 2007;79:313-320.
Sandoval K, Buentello ML, Peñaloza ER et al.: Linguistic andmaternal genetic diversity are not correlated in NativeMexicans. Hum Genet 2009;126:521-531.
© E
dito
rial E
l man
ual m
oder
noFo
toco
piar
sin
aut
oriz
ació
n es
un
delit
o.Bases moleculares de la herencia 35
ANEXO III Fundamentos y aplicaciones de las principales
técnicas de diagnóstico molecular en enfermedades mendelianas
Miguel Ángel Alcántara Ortigoza, Ariadna Estela González del Ángel, José Velázquez Aragón
La biología molecular, rama de la biología que se encarga delestudio de las moléculas que contienen información bioló-gica, ha revolucionado en los últimos tres decenios el diag-nóstico de enfermedades mendelianas. El desarrollo y sim-plificación de las técnicas para la identificación de mutacio-nes en genes causantes de estas patologías, ha llevado a quecada vez sea mayor el número de laboratorios en los que serealiza el diagnóstico molecular como un proceso sistemáti-co y a un costo cada vez más accesible. El estudio por bio-logía molecular de un paciente con una entidad mendelia-na permite en muchos de los casos:
a) Establecer un diagnóstico certero en entidades donde sedificulta el diagnóstico clínico y de laboratorio/gabinete
por ejemplo en la enfermedad de Alzheimer de iniciotemprano, el síndrome de Rett y el grupo extenso de lasataxias espinocerebelosas.
b) La identificación inequívoca de individuos portadores,en especial en trastornos autosómico recesivos comofibrosis quística o recesivos ligados al cromosoma Xcomo la hemofilia A.
c) Proporcionar diagnóstico prenatal a parejas con un altoriesgo de recurrencia para una entidad mortal o limitan-te de la supervivencia como en atrofia músculo espinaltipo I, el síndrome de Hunter o en la distrofia muscularde Duchenne.
d) Establecer un diagnóstico presintomático en sujetos quepresentan el genotipo de riesgo, pero que aún no mues-
tran manifestaciones clínicas y en los cuales se puedeestablecer un manejo preventivo, tal y como ocurre enlos síndromes de cáncer familiar como la neoplasia endó-crina múltiple tipo 2, el carcinoma de mama y ovariofamiliar o el síndrome de Lynch.
e) Correlacionar el genotipo presente en el paciente con elfenotipo esperado, como ocurre en la glucogenosis tipo IIo enfermedad de Pompe, en la cual los afectados con ungenotipo heterocigoto compuesto del gen GAA con unamutación grave y una leve como la mutación intrónicac.-32-13T > G, presentan un fenotipo atenuado o tardíode la enfermedad debido a la presencia de la mutaciónleve. Más aún, el genotipo podría predecir la respuestaterapéutica a nuevos fármacos como la sapropterina, uncofactor enzimático que actúa también como moléculachaperona de la enzima fenilalanina-hidroxilasa (PAH),y cuya administración a pacientes con fenilcetonuria conal menos un alelo PAH con la mutación p.Arg261Glu,les predice un mejor control de las concentraciones san-guíneas de la fenilalanina o incluso hasta una dietamenos restringida. Por último, el genotipo puede en oca-siones predecir o explicar el modo de herencia esperadopara una misma enfermedad, como en las #-talasemiasdonde mutaciones amorfas ubicadas en el promotor o losprimeros dos exones del gen de #-globina se heredan deforma autosómica recesiva, mientras que las mutacionesantimorfas o con efecto dominante negativo ubicadas enel exón 3, se manifiestan y heredan de forma autosómi-ca dominante.
La gama de aplicaciones y utilidades del estudio molecu-lar en este tipo de pacientes es muy vasta, por lo que acontinuación se describirán de forma breve los funda-mentos de las técnicas moleculares más empleadas y seejemplificará su aplicación con un trastorno monogénicoen particular.
OBTENCIÓN DE LA MUESTRA
Para la realización de las pruebas moleculares es necesa-ria la purificación de los ácidos nucleicos a analizar. Porlo general la molécula de elección es el DNA, ya que enella se pueden identificar en la mayoría de los casos loscambios o mutaciones responsables de una patología.Cualquier célula nucleada como leucocitos totales desangre periférica con anticoagulante EDTA o ACD, célu-las de descamación de mucosa oral, tejidos embebidos enparafina, gotas de sangre seca depositadas en papel filtro,amniocitos o biopsias de vellosidades coriales son fuen-tes de DNA genómico para la realización de análisismoleculares.
En algunos casos, cuando se requiere analizar el efec-to de una mutación que altera el procesamiento delRNA o la expresión del gen, se requiere analizar el trans-crito maduro o mRNA. Para la obtención del mRNA deinterés se requiere una muestra de tejido idealmente nofijado y fresco en donde el gen mutado se exprese, siem-pre y cuando la toma de muestras sea lo menos invasivay riesgosa posible y evaluando el costo-beneficio de larealización de la prueba molecular. Una vez purificado elmRNA es convertido a DNA complementario o cDNApor un procedimiento conocido como retrotranscrip-
ción. El cDNA generado es idéntico a la secuencia delgen presente en el mRNA maduro (sólo exones). EstecDNA es más estable que el RNA y puede ser analizadomediante las mismas técnicas que el DNA genómico.
Reacción en cadena de la polimerasa(PCR)La reacción en cadena de la polimerasa o PCR (polyme-rase chain reaction) es una técnica que conlleva la ampli-ficación de una secuencia especifica de DNA in vitro.Esta técnica fue desarrollada por Kary Mullis en 1983 ysu impacto en la investigación genética fue inmediatodado que permite amplificar millones de veces y demanera dirigida una secuencia específica del genoma. LaPCR es uno de los pasos iniciales en muchas técnicas queen la actualidad se emplean de forma sistemática en laidentificación de mutaciones génicas, como son lasecuenciación automatizada tipo Sanger y la amplifica-ción múltiple de sondas ligadas o MLPA, las cuales sedescriben más adelante.
La técnica de PCR requiere una mezcla de reacciónque contiene una solución amortiguadora, un cofactorenzimático como el cloruro de magnesio, una DNA poli-merasa DNA-dependiente termoestable (Taq polimera-sa), una mezcla equimolar de desoxinucleósidos trifosfa-to de adenina, guanina, citosina y timina, así como dosmoléculas de oligonucleótidos de cadena sencilla de 16 a24 nucleótidos de longitud o cebadores, los cuales deli-mitan el fragmento que se desea amplificar, ya que con-tienen la secuencia complementaria a los extremos de lasecuencia génica de interés. La reacción de PCR se llevaa cabo por medio de una serie de cambios de temperatu-ra programados de forma automática en un equipo deno-minado termociclador, los cuales permiten los pasosrequeridos para la amplificación del fragmento de inte-rés (figura A3-1). El ciclo de temperaturas se repite entre25 a 35 veces y dado que en cada ciclo se produce eldoble de la cantidad de copias de DNA que existían ori-ginalmente, al final de la reacción se obtienen billones demoléculas de la región de DNA de interés a partir decada molécula de DNA original (235 = 3.4 x 1 010copias al final de la PCR). El hecho de que la DNA poli-merasa sintetice sólo la región flanqueada por los ceba-dores permite obtener fragmentos muy específicos y ais-lados del resto del genoma y que son de interés para eldiagnóstico molecular.
La técnica de PCR es sencilla y requiere poco tiempopara su realización. Para llevarla al cabo es necesarioconocer la secuencia del fragmento de DNA que se pla-nea amplificar, situación que ya no es una limitante gra-cias a la finalización del Proyecto del Genoma Humano;así, de acuerdo a ello, se pueden diseñar los cebadoresmás idóneos a través de diversos programas de cómputodisponibles en línea (GeneFisher: http://bibiserv.tech-fak.uni-bielefeld.de/genefisher2/ o PrimerBLAST:http://bibiserv.techfak.uni-bielefeld.de/genefisher2/). Acontinuación se describen los fundamentos de tres técni-cas basadas en PCR para identificación de mutacionesresponsables de enfermedad y un ejemplo de su aplica-ción en el abordaje diagnóstico de una entidad monogé-nica. ©
Edi
toria
l El m
anua
l mod
erno
Foto
copi
ar s
in a
utor
izac
ión
es u
n de
lito.
36 Genetica clínica
Determinación de polimorfismos en lalongitud de los fragmentos de restricción(RFLP) por PCR y ensayo de restricción(PCR-RFLP)La determinación de polimorfismos en la longitud de losfragmentos de restricción, RFLP (restriction fragmentlenght polymorphism) por PCR y ensayo de restricción, esuna de las técnicas más sencillas para el reconocimientode mutaciones puntuales, deleciones o insercionespequeñas previamente identificadas en una secuencia deDNA. Esta técnica utiliza a las endonucleasas de restric-ción de origen bacteriano, las cuales tienen la capacidadde escindir un enlace fosfodiéster en cada cadena de unamolécula de DNA de doble cadena al reconocer unasecuencia palindrómica específica de entre 6 a 8 nucleó-tidos de longitud. Existe una gran variedad de enzimasde restricción y cada una reconoce una secuencia blancoespecífica para generar el corte, el sitio de restricciónpuede estar presente o ausente en la secuencia de DNAnormal o bien generarse o perderse por la presencia deuna mutación, lo que determina la presencia de losRFLP. Para la implementación de esta técnica es necesa-ria la selección de la enzima a utilizar y para lo cual, lamutación conocida debe caer en un sitio de restricción oel ensayo puede generar o eliminar uno en el alelo muta-do usando cebadores específicos. Es importante conocerel patrón de restricción o corte presente en la secuenciao alelo normal de DNA, así como en la secuencia o alelomutado a estudiar para la interpretación de los RFLPresultantes al digerir los productos de PCR con la endo-nucleasa seleccionada. El ejemplo de enfermedad quepodría diagnosticarse certeramente a través de la técnicade PCR-RFLP, sería una forma sindromática de craneosi-nostosis coronal autosómica dominante o síndrome deMuenke (MIM #602849) condicionada en 100% de loscasos por un estado heterocigoto para la mutación pun-
tual c.749C > G de sentido erróneo (p.Pro250Arg) queocurre en el gen FGFR3 (4p16.3) (figura A3-2).
SecuenciaciónLa secuenciación de DNA es el método que permiteconocer el orden preciso que guardan los nucleótidos enuna secuencia específica de DNA. Para la detección demutaciones es importante identificar cambios en lasecuencia de estos nucleótidos con respecto a unasecuencia de referencia de esa región o gen específico ypoder determinar si esos cambios son responsables deuna alteración en la proteína que explique la patología.Han existido diferentes métodos para obtener la secuen-cia nucleotídica de una región genómica y en la actuali-dad existen metodologías con capacidad para obtenersecuencias de millones de nucleótidos en una sola reac-ción. Sin embargo, la técnica desarrollada por Sanger ensu versión automatizada es considerada como el estándarde referencia para definir un cambio a nivel de DNA ypor ende para el diagnóstico certero de múltiples trastor-nos mendelianos que se caracterizan por una heteroge-neidad alélica amplia donde predominan las mutacionespuntuales, o pequeñas inserciones/deleciones, tal y comoocurre en los síndromes de cáncer de mama y ovariofamiliar ligados a los genes BRCA1 y BRCA2, la esclero-sis tuberosa, la poliquistosis renal del adulto, la hiperco-lesterolemia familiar, neurofibromatosis tipo I, hemofi-lias tipos A y B, los síndromes de Marfan, Wiskott-Aldrich, CHARGE, Fabry, Hunter, entre otros.
El método de secuenciación tipo Sanger se basa en lainterrupción de la síntesis de una nueva cadena de DNApor métodos químicos utilizando como molde una cade-na sencilla de la región de la cual se desea obtener lasecuencia. En un principio está técnica era laboriosa,empleaba isótopos radioactivos y su resolución era limi-tada a secuencias cortas de DNA, aunque en la actuali-©
Edi
toria
l El m
anua
l mod
erno
Foto
copi
ar s
in a
utor
izac
ión
es u
n de
lito.
Bases moleculares de la herencia 37
Figura A3-1. Etapas de la PCR. Cada ciclo está compuesto por tres temperaturas llamadas de desnaturalización, alineación y extensión. Latemperatura de desnaturalización (95°C) permite que el DNA de doble cadena se separe en dos cadenas sencillas de DNA (desnaturalización).La temperatura de alineación permite la unión de los cebadores a sus cadenas complementarias, formando así regiones de DNA de doble cade-na con un extremo 3’ libre. La temperatura de alineación es variable y está determinada por la secuencia de los cebadores. La temperatura deextensión (72°C) es en donde se lleva a cabo la síntesis de las nuevas cadenas de DNA por una DNA polimerasa. En la actualidad se utilizanDNA polimerasas termoestables, como la Taq DNA polimerasa que es obtenida del microorganismo termofílico Thermus aquaticus, las cualessoportan varios ciclos con temperaturas >90º C sin perder ostensiblemente su actividad catalítica.
5´
3´
5´
5´
5´
5´
5´
5´ 5´
3´
3´ 3´
3´
3´
3´ 3´
Desnaturalización 94° C
Alineación 52-63° C
Primer cicloSegundo ciclo
Extensión 72°C
dad la técnica se ha podido automatizar gracias al uso deequipos conocidos como secuenciadores capilares y a laincorporación de cuatro distintos fluorocromos en losdideoxinucleótidos A, C, G, T para la identificación ine-quívoca de las bases nitrogenadas que conforman lasecuencia de un fragmento de DNA. El principio de lareacción de secuenciación automatizada tipo Sanger seilustra en la figura A3-3.
La secuenciación automatizada se considera el estudiodiagnóstico de primera línea en el síndrome de Rett(MIM #312750), un trastorno del neurodesarrollo domi-nante ligado al cromosoma X que se considera la segun-da causa genética más frecuente de retraso mental enmujeres y cuya prevalencia se estima en uno afectada en8 a 10 mil mujeres de 15 años de edad. Las pacientescursan con una pérdida progresiva de las habilidadesmotoras y del lenguaje, presencia de conductas estereoti-padas como movimientos anormales y repetitivos enmanos, crisis convulsivas, detención del crecimiento y delperímetro cefálico. La supervivencia de las pacientes seve comprometida (< 40 a 30 años) por trastornos cardio-rrespiratorios, nutricionales, entre otros. Aunque existencriterios diagnósticos de tipo clínico y delaboratorio/gabinete para el síndrome de Rett, la identi-ficación de una mutación en el gen MECP2 por estudiomolecular, es la única manera de establecer de forma ine-quívoca el diagnóstico de esta entidad, en especial enpacientes con las formas atípicas, en donde sólo ~ 40%
presenta mutaciones patogénicas en el gen MECP2. El80% de las mutaciones responsables de los casos con laforma clásica del síndrome se logran identificar a travésdel estudio de secuenciación automatizada de los exones2, 3 y 4 del gen MECP2 (Xq28) (figura A3-4), aunqueen realidad en el exón 3 y 4 es donde ocurren > 95% delas mutaciones responsables de las formas clásicas y atí-picas.
El estudio por secuenciación automatizada de variospacientes, de genes grandes multiexónicos o ambos,genera una gran cantidad de datos, que requieren anali-zarse a través de programas bioinformáticos (p. ej.,BLAST, http://blast.ncbi.nlm.nih.gov/Blast.cgi) quecomparen las secuencias obtenidas del paciente con lassecuencias génicas de referencia, aunque otros progra-mas de cómputo más sofisticados pueden identificar deinmediato todas las variantes patológicas y no patológi-cas (polimorfismos) identificadas en un estudio desecuenciación a gran escala, a través de conectarse auto-máticamente a las bases de datos disponibles en líneacomo dbSNP (http://www.ncbi.nlm.nih.gov/projects/SNP/index.html) o de mutaciones (The Human GeneMutation Database, http://www.hgmd.cf.ac.uk/ac/index.php), con ello se facilita y se optimiza la obtencióny certeza de los resultados.
Por otro lado, la automatización del procedimiento desecuenciación de DNA ha permitido que un genotipopatogénico pueda ser identificado en pocas horas, en ©
Edi
toria
l El m
anua
l mod
erno
Foto
copi
ar s
in a
utor
izac
ión
es u
n de
lito.
38 Genetica clínica
Figura A3-2. Identificación del genotipo heterocigoto para la muta-ción c.749C>G (p.Pro250Arg) del gen FGFR3 mediante PCR-RFLPen un caso familiar de síndrome de Muenke con expresividad varia-ble y falta de penetrancia. El caso índice (II-2) acudió por craneosi-nostosis bicoronal; su hermano (II-1) es tratado por hidrocefalia, perono presenta craneosinostosis y II-3 se refería sana. Ambos padres notenían antecedentes de craneosinostosis en ellos, ni en otros familia-res. Así, ante la ausencia de antecedentes familiares de craneosinos-tosis, se indico el estudio molecular para distinguir entre una formaesporádica de craneosinostosis coronal (~85% de los casos) o laforma autosómica dominante del síndrome de Muenke. El diagnósti-co molecular de este último, puede establecerse mediante la amplifi-cación por PCR de un fragmento de 337 pares de bases (pb), queincluye al exón 7 (191 pb) y 196 pb del intrón adyacente del genFGFR3. El producto de la PCR se restringe con la endonucleasa NciIpara su posterior análisis por electroforesis en un gel de agarosa. Losalelos normales presentan un único sitio de corte, lo cual da lugar aun fragmento de 214 pb y otro de 123 pb (carril NL), mientras que lapresencia en estado heterocigoto de la mutación p.Pro250Arg(c.749C>G) crea un segundo sitio de restricción, dando lugar a unfragmento adicional de 151 pb presente en el control positivo para lamutación en estado heterocigoto [carril (+)]. Nótese que I-2 es hete-rocigota para la mutación y ésta la heredó a sus tres hijos, sin embar-go en II-3 no se lograron documentar dismorfias u otras alteracionesneurológicas, esqueléticas o auditivas compatibles con el síndrome,excepto por braquidactilia a expensas de falanges medias cortas. Entanto, en I-2, II-1 y II-2 sí se aprecian dismorfias descritas en este sín-drome, tales como hipertelorismo, fisuras palpebrales dirigidas haciaabajo, ptosis palpebral y asimetría facial. Las dismorfias faciales enI-2, II-1 y II-2, la hidrocefalia (poco frecuente en este síndrome) yausencia de craneosinostosis en II-1 y I-2, se explican por la expre-sividad variable descrita en esta entidad. El resultado es de sumaimportancia para el asesoramiento genético de esta familia, ya que adiferencia de la mayoría de los casos con craneosinostosis corona-les esporádicas, los afectados de esta forma autosómica dominante,tienen un riesgo del 50% de transmitir el padecimiento a su descen-dencia, independiente del sexo. Carril MPM: Marcador de pesosmoleculares, escalera de 100 pares de bases (pb).
I
II
1
1 2
2
3
MPM 1-2 II-1 II-2 II-3 I-1 (+) NL
300 pb
200 pb
100 pb
214 pb151 pb123 pb
© E
dito
rial E
l man
ual m
oder
noFo
toco
piar
sin
aut
oriz
ació
n es
un
delit
o.Bases moleculares de la herencia 39
Figura A3-3. A) Secuenciación de DNA por el método de Sanger automatizado. Generalmente el fragmento a secuenciar es un producto dePCR de hasta 1 kilobase (1,000 pares de bases) de la región de interés. Este producto de PCR es desnaturalizado y en la presencia de uncebador comienza la síntesis de una nueva cadena de DNA por acción de una DNA polimerasa. En la reacción de secuenciación se incluyendesoxinucleósidos trifosfato (dNTP) de cada una de las bases nitrogenadas (adenina, citosina, guanina y timina) así como una proporciónmenor de didesoxinucleósidos trifosfato (ddNTP) de cada una de las bases nitrogenadas, cada uno de ellos marcados con un fluoróforo dis-tinto para cada bases nitrogenadas A, C, T y G. La adición aleatoria de un didesoxinucleótido en las cadenas en crecimiento interrumpe la sín-tesis, dado que esta molécula no cuenta con el grupo hidroxilo en el carbono 3’ de la pentosa, ello hace imposible la generación de un nuevoenlace fosfodiéster con otro dNTP o ddNTP. Lo anterior condiciona en cada reacción la generación de varias cadenas nucleotídicas de dife-rentes longitudes las cuales van marcadas en su extremo 3’ con ddNTP que porta sólo un fluorocromo distintivo para la última base de la cade-na. B) Las cadenas sintetizadas, al tener diferentes tamaños, pueden ser separadas por electroforesis capilar de alta resolución y detectadascon un equipo óptico que determina el fluoróforo presente al final de cada una de las cadenas interrumpidas. Dado que la cadena de tamañomás pequeño viaja más rápido por el capilar, será la primera en ser detectada y al reconocerse el fluoróforo presente al final de esta cadenase puede establecer el nucleótido en el cual se interrumpió su síntesis, la siguiente cadena que pase por el detector será aquella que tiene untamaño en longitud mayor por un nucleótido más y nuevamente al detectar el fluoróforo presente al final, se puede determinar el nucleótido enel que fue interrumpida y así sucesivamente, al establecer en cada cadena sintetizada el nucleótido en el cual fue interrumpida su síntesis sepuede obtener la secuencia de nucleótidos del fragmento original de DNA. Un programa en una computadora acoplada al secuenciador repor-ta el orden de las bases en un electroferograma.
DNA molde de cadena sencilla
Se realizan 4 reacciones diferentes. En cada reacción de sintesis se incluye en bajaproporción sólo uno de los didesoxinucleótidostrifosfato de A, G, C y T marcados con fluoróforos diferentes.
5´GACCATTGGCAG5´
5´3´
+12 +1
Síntesis de DNA Cebador
TGCA
ddTTPddGTP
ddCTPddATP
Aleatoriamente las hebras soninterrumpidas por la incorporación de un ddNTP.
C
C
C
A
A
G
T C
TC
GTC
CGTC
CCGTC
ACCGTC
Tamaño del DNA sintetizado
Cebador+1
Cebador+2
Cebador+3
Cebador+4
Cebador+5
Cebador+6
Cebador+7
Muestra y Buffer
Laser
Buffer
+
Detector defluorescencia
-
Computadora
C CC CCC CCCCT T T TTG GG G GGAA A
especial cuando la mutación se ha caracterizado antes enuna familia, individuo afectado o portador, lo cual per-mite su aplicación al diagnóstico prenatal molecular deentidades mendelianas, tal y como se ilustra con un casofamiliar de la mucopolisacaridosis tipo II o síndrome deHunter (figura A3-5).
Es importante mencionar que la secuenciación auto-matizada tipo Sanger no es capaz de identificar estadosheterocigotos para deleciones y duplicaciones muy gran-des (del orden de kilobases o megabases), como ocurreen ~ 8% de los casos con síndrome de Rett clásico quetienen deleción completa del gen MECP2 y en > 95% de ©
Edi
toria
l El m
anua
l mod
erno
Foto
copi
ar s
in a
utor
izac
ión
es u
n de
lito.
40 Genetica clínica
Figura A3-4. Diagnóstico del síndrome de Rett por secuenciación automatizada del gen MECP2. Se ilustra el hábito exterior de una pacientecon síndrome de Rett clásico en fase pseudoestacionaria, donde destaca la presencia de movimientos estereotipados de manos. El electrofe-rograma muestra una porción de las hebras sentido (5´- 3´) de la secuencia codificante del exón 4 del gen MECP2 y la flecha señala un esta-do heterocigoto para la mutación sin sentido c.502C>T, dado que a nivel de proteína cambia al codon 168 de arginina (CGA) por un codon deparo prematuro (TGA). La “N” significa que en esa posición existe una base mixta o empalmada, donde el pico azul representa la citosina delalelo normal y el pico rojo, la timina del alelo mutante. Esta mutación se corrobora en las hebras complementarias o antisentido (estado hete-rocigoto “N” A/G). Más del 99.5% de los casos con síndrome de Rett se originan por mutaciones de novo en la espermatogénesis y la mayo-ría de éstas consisten en transiciones C>T atribuibles a desaminación espontánea de citosinas metiladas en dinucleótidos CpG; en este caso,nótese que la base siguiente a la mutación en la hebra sentido es precisamente una guanina.
5´ Hebra sentido
A A A A A A AG G G G G G G
180 190
C C C C C C C C C CNT
170
5´ Hebra complementaria
G G G G G G G G G G220 230 240
T T T T T T TC C C C C CAN
}CGA: ARG (alelo normal)TGA: Stop (alelo mutado)
3´
3´
los casos con neuropatía periférica Charcot-Marie Toothtipo 1A que presentan una duplicación de todo el genPMP22. Por ello es importante conocer el espectro demutaciones descritas en el trastorno mendeliano a diag-nosticar en el paciente y reconocer esta limitante de latécnica cuando se interpretan los resultados y así evitarla asignación de un genotipo erróneo y un asesoramien-to genético inadecuado. En enfermedades monogénicasen donde predominan deleciones o duplicaciones gran-des se deben utilizar otras metodologías molecularescomo la MLPA, misma que a continuación se describe.
Amplificación múltiple dependiente de lahibridación de sondas (MLPA, multiplexligation-dependent probe amplification)La amplificación múltiple dependiente de la ligación desondas o MLPA es una variante de la PCR en la cual sepueden amplificar diferentes fragmentos de DNA enuna misma reacción utilizando un solo par de cebadoresy bajo las mismas condiciones de ciclos de temperatura.Por esta técnica se pueden amplificar regiones génicascercanas o adyacentes con la finalidad de determinar concerteza la dosis génica en muestras de DNA de pacientesafectados de deleciones o duplicaciones grandes en esta-
do heterocigoto, homocigoto o hemicigoto. En el ensayose pueden utilizar como controles muestras de DNA condeleciones o duplicaciones génicas grandes previamentecaracterizadas y las cuales pueden involucrar desde unexón a varios de ellos o incluso loci aledaños. La capaci-dad de amplificar varias sondas en la misma reacción,permite delimitar con mayor precisión los puntos derotura y reunión de las deleciones o duplicaciones, asícomo la extensión de dichos rearreglos.
La MLPA permite el análisis mediante electroforesiscapilar de hasta 45 sondas diferentes amplificadas en unasola reacción. Cada secuencia del DNA blanco (p. ej., unexón) es reconocida por una sonda conformada por dosmitades, denominadas sonda 5’ y sonda 3’. Si existe unacomplementaridad de las dos sondas con la muestra deDNA templado, se forma un enlace fosfodiéster entreambas mediante la acción de una ligasa. Los extremos deambas sondas poseen una secuencia artificialmente dise-ñada que es complementaria a un solo par de oligonucle-ótidos o cebadores universales que permiten su amplifi-cación por PCR, siempre y cuando las sondas 5’ y 3’ sehayan ligado. Los cebadores universales permitirán laamplificación de todas las sondas bajo las mismas condi-ciones; los ensayos más recientes, incluyen un cebadoruniversal marcado con una molécula fluorescente en el©
Edi
toria
l El m
anua
l mod
erno
Foto
copi
ar s
in a
utor
izac
ión
es u
n de
lito.
Bases moleculares de la herencia 41
Figura A3-5. Diagnóstico prenatal molecular del síndrome de Hunter a través de secuenciación automatizada dirigida del exón 7 del gen IDS(Xq28). Esta entidad se hereda con u patrón recesivo ligado al cromosoma X, donde se estima que el 80% de las madres de casos únicoscomo es el presente caso, son portadoras o heterocigotas asintomáticas para el rasgo. El caso índice cuenta con el diagnóstico clínico, enzi-mático y molecular del síndrome de Hunter. La identificación de la mutación responsable del padecimiento en II-1 se llevo al cabo mediante laamplificación por PCR y subsecuente secuenciación de los 9 exones que comprenden la secuencia codificante del gen IDS. La comparacióndel electroferograma parcial del exón 7 de II-1 con la secuencia normal revela un genotipo hemicigoto para la mutación c.1003C>T del gen IDS(flechas). Posteriormente se hizo la búsqueda dirigida de esta mutación en I-1 mediante PCR y secuenciación de sólo el exón 7, ya que esaquí donde se ubica la mutación responsable. El electroferograma del exón 7 en I-1 reveló un estado heterocigoto (portador) para la mutaciónpresente en su hijo. La madre posterior a asesoramiento genético solicita diagnóstico prenatal. El cariotipo obtenido a partir de cultivo de amnio-citos se reportó con una fórmula 46,XY y debido a ello se procedió inmediatamente a la secuenciación directa del exón 7 a partir de una mues-tra de DNA obtenido de los amniocitos en cultivo. El electroferograma del producto de la gestación revela que éste heredó el mismo genotipoIDS que su hermano afectado. Adicionalmente el genotipo alterado se corroboró en la hebra antisentido del mismo exón (dato no mostrado).Cabe mencionar que el tiempo requerido para el estudio prenatal molecular requirió de sólo dos días. El mismo procedimiento puede hacerseen células amnióticas o muestras de vellosidades coriales sin cultivo, aunque con este material biológico se reporta un riesgo ligeramente incre-mentado para que el ensayo molecular se contamine con DNA genómico de origen materno.
Secuencia normal
Hemicigoto c.1003C>T(p.His335Tyr)
Heterocigota c.1003C>T(p.His335Tyr)
Hemicigoto c.1003C>T(p.His335Tyr)
II-1
I-1
II-2
I
II
1
21
20 SDG
C C C C C CA A A A A AT T T T T T TG G G G G170 180
His335
c.1003
}Tyr
C C C C CA A A A A AT T T T T T TG G G G GT170 180
170 180
170 180
A T T T A C C T C G G A T A T G G T A A G CN
A T T T A C C T C G G A T A T G G T A A G CT
}
extremo 5’ el cual permite la detección de los amplico-nes de las sondas a través de análisis de fragmentos porelectroforesis capilar en un equipo de secuenciaciónautomatizada. La distinción entre las diferentes sondasligadas y amplificadas correspondientes a cada una de lasregiones blanco del DNA templado, se basa en el tama-ño en pares de bases de cada sonda ligada y amplificada.Lo anterior, se logra al añadir, en el extremo 3’, unasecuencia artificial o stuffer cuya longitud varía para cadasonda. Así, cada sonda específica de un exón o regióngénica tendrá un tamaño específico y será fácilmente
identificable mediante análisis electroforético. En la figu-ra A3-6 se esquematiza el fundamento del MLPA.
La técnica de MLPA puede ser complementaria alestudio de secuenciación para incrementar la certezadiagnóstica en algunas entidades mendelianas, como porejemplo el síndrome de Rett, ya que la secuenciaciónautomatizada y el estudio de MLPA identifican el geno-tipo responsable en casi 90% de las pacientes con las for-mas clásicas. En poblaciones distintas a las de origenAskenazi o del norte de Europa, la secuenciación auto-matizada del gen CFTR identifica cerca de 99% de las ©
Edi
toria
l El m
anua
l mod
erno
Foto
copi
ar s
in a
utor
izac
ión
es u
n de
lito.
42 Genetica clínica
Figura A3-6. Fundamento MLPA. A) Las dos mitades de una sonda 5’ y 3’, contiene una secuencia nucleotídica para hibridar o unirse con elDNA en estudio del paciente y una secuencia específica para un par de cebadores universales (primers X y Y). B) Las sondas 5´y 3´en pre-sencia del DNA desnaturalizado del paciente, se unen a éste por complementariedad. C) Si la secuencia de reconocimiento está presente enel DNA del paciente las sondas 5´y 3´ quedan adyacentes y pueden ser unidas por la acción de una enzima ligasa, formando una sonda única.Esto sucede con cada par de sondas que están incluidas en el ensayo. D) Las sondas ligadas son amplificadas por PCR con el uso de un parde cebadores universales. La distinción entre las diferentes sondas ligadas y amplificadas se establece a partir de las diferencias en el tama-ño de la secuencia “stuffer” de cada sonda. E) Los productos obtenidos por PCR son analizados por electroforesis capilar y se comparan conun control normal para determinar si existen deleciones o duplicaciones en estado heterocigoto en el DNA del paciente.
Secuencia de unión para primer X Mitad 5´sonda A
Sonda 1Mitad 3´sonda A
secuencia dereconocimiento izquierda
Secuencia dereconocimiento derecha
Secuencia de unión para primer Y
Alineación de mitad 5´y 3´de la sonda A Alineación de mitad 5´y 3´de la sonda B
DNA paciente
UniónUnión
DNA pacienteAmplificación por PCR múltiple con un solo juego de cebadores
Primer X Primer Y
Análisis de fragmentos en electroforésis capilar
3 300-2 200-1 100- 0-Locus
Inte
sity
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Sondas MLPA
Secuencia “Stuffer” (60 a 450 pb)
1
2
3
n
DNA genómicodesnaturalizado
Secuencias que brindan a las partes adyacentes del gen
Secuencias complementarias a los primeros universales
Secuencia tipo “Stuffer”
Hibrida-ción Ligación PCR
Análisis por electroforesis capilar
Duplicación
Dosis normal
mutaciones responsables, pero quizá < 1% de alelosmutados CFTR corresponden a deleciones grandes quepueden ser identificadas por MLPA. Las deleciones deuno o más exones en el gen BRCA1 se encuentran pre-sentes hasta en 20 a 30% de los casos de síndrome decáncer de mama y ovario familiar de origen holandés.Este tipo de mutación pasa inadvertido en el estudio deprimera línea, que es la secuenciación automatizada, porlo que en pacientes con un resultado negativo, con datosclínicos y genealógicos altamente sugestivos de este sín-drome de cáncer familiar, está indicado el estudio deMLPA. Por último, la identificación de mujeres portado-ras o heterocigotas para deleciones de uno o más exonesen el gen DMD responsables de 40 a 60% de los casoscon distrofinopatías, pueden llegar a documentarse demanera certera con MLPA, y de igual forma, las duplica-ciones de uno o más exones de este gen y responsablesde 6 a 8% de los casos con distrofinopatía, pueden iden-tificarse por la misma técnica tanto en casos masculinosafectados como en mujeres portadoras.
BIBLIOGRAFÍA
Alcántara OMA, González AA, Barrientos RR et al.: Screeningof late-onset Pompe disease in a sample of Mexicanpatients with myopathies of unknown etiology: identifica-tion of a novel mutation in the acid alpha-glucosidasegene. J Child Neurol 2010;25:1034-1037.
Boyadjiev SA: International Craniosynostosis Consortium.Genetic analysis of non-syndromic craniosynostosis.Orthod Craniofac Res 2007;10:129-137.
Innis M, Gelfand D: Optimization of PCR’s. En: Innis M,Gelfand D, Snitsky J, White T. eds. PCR Protocols: a guideto methods and applications, 1st ed. Academic Press, SanDiego, USA 1990:3-12.
Jorde L, Carey J, Bamshad M, White R: Genetic variation: itsorigin and detection. En: Jorde L, Carey J, Bamshad M,White R. eds. Medical Genetics, 3rd ed. Mosby, St. Louis,USA 2003:29-106.
Kozlowski P, Jasinska AJ, Kwiatkowski DJ: New applicationsand developments in the use of multiplex ligation-depen-dent probe amplification. Electrophoresis 2008;29:4627-4636.
Rodríguez Sánchez I; Barrera SH: La reacción en cadena de lapolimerasa a dos décadas de su invención. Ciencia UANL2004;7(3):323-335.
Rose EA: Applications of PCR to Genome Analysis. FASEB J1991;5:46-54.
Strachan T, Read A: Amplifying DNA: PCR and cell based clo-ning En: Strachan T, Read A. eds. Human MolecularGenetics 3. Garland Science, New York, USA 2004:122-154, 182-203.
Watson J, Caudy A, Myers R, Witkowski J: Basic tools ofrecombinant DNA. En: Watson J, Caudy A, Myers R,Witkowski J. eds. Recombinant DNA Genes andGenomes- A short course 3rd ed. Cold Spring HarborPress, New York, USA 2007:75-106.
Zurflüh MR, Zschocke J, Lindner M, Feillet F et al.: Moleculargenetics of tetrahydrobiopterin-responsive phenylalaninehydroxylase deficiency. Hum Mutat 2008;29:167-175.
RECURSOS EN LA RED
OMIM ® - Online Mendelian Inheritance in Man ®http://www.ncbi.nlm.nih.gov/omim
Gene Reviewshttp://www.ncbi.nlm.nih.gov/books/NBK1116/
Molecular Genetics and Metabolism Laboratory (2011)http://metabolic-genetic-disease.gmxhome.de/
© E
dito
rial E
l man
ual m
oder
noFo
toco
piar
sin
aut
oriz
ació
n es
un
delit
o.Bases moleculares de la herencia 43