Download - Anàlisi de microarrays de DNA

Anàlisi de microarrays de DNA

Curs de BioinformàticaUniversitat Pompeu Fabra

4t curs de Llicenciatura en Ciències Experimentals i de la Salut

27/02/06

Lauro SumoyLaboratori de Microarrays

Centre de Regulació Genò[email protected]

Continguts– Introducció als microarrays– Aplicacions dels microarrays– Comparació de dues mostres – Comparació entre múltiples mostres– Comparació de classes i predicció de classes– Us de bioinformàtica aplicats als microarrays

• Adquisició i anàlisi de imatges• Processat de dades

– Filtrat de intensitat i qualitat– Normalització intraxip– Anàlisi estadístic emprant rèpliques

• Agrupament i clustering

– Eines bioinformàtiques

Introducció: Què són els microarrays?

• Microarray (micromatriu, bioxip): col.lecció de biomolècules ordenades ortogonalment sobre un suport sòlid miniaturitzat

•Alta densitat•Permeten estudis a escala genomica•Apliquen noves eines per a anàlisi massiu de dades:

•bioinformàtica•estadística

• DNA depositat per impressió sobre vidre– Tipus de tecnologia: agulles, plumilles o ink jet– Producte imprès:

• Producte de PCR– primers de vector (cDNA, clons de genòmic)– RAPD primers (RAPD-PCR, differential display)– primers específics de seqüència (genòmic)– linker-primers (ligation mediated-PCR de BACs)

• Clons directament (cDNA, cosmidi, BAC)• Oligonucleòtids (25 a 80nt)• Altres possibilitats de impressió:

– Cèl.lules transfectades– Proteïnes (anticòs, receptors, lisats de llibreries

déxpressió, etc)

Microarrays impresosmRNA 3’5’

One cDNA probe per geneDerived by PCR amplification Size: 500-2000 bp (double stranded)

Vector PCR primers

cDNA clone

Single cDNA probe

cDNA microarrays

mRNA 3’5’

One oligo probe per geneDerived by chemical synthesisSize: 35-70 nt (single stranded)

Longoligonucleotide microarrays

Single oligonucleotide probeDirect spotting

(no need for amplification)

PCR amplificationpurification

Microarrays sintetitzats in situ: Affymetrix DNA chip

Arrays d’alta densitat

Necessiten escaner de més alta resolució

mRNA 3’5’

DNA probe sequence

ATGAGCTGTACCAATGCCAACCTGG PM ATGAGCTGTACCTATGCCAACCTGG MM

PM MM

Perfect Match – MisMatch11-20 parells d’oligonucleòtids per trànscrit gènicMida de sonda: 25 nt (cadena senzilla)

2 colors 1 color(cDNA) (Affymetrix)

mRNA

cDNA-Cy3 cDNA-Cy5

RNAextraction

ReversetranscriptionCy3-dCTP Cy5-dCTP

Competitivenucleic acid

co-hybridization

Referencesample

Testsample

mRNA

cDNA-Cy3 cDNA-Cy5

RNAextraction

ReversetranscriptionCy3- Cy5-

cDNA or long oligo microarray


co-hybridization

Referencesample

Testsample

Fluorescentdetection

cDNA-T7

Biotin-cRNA

In vitrotranscription

Biotin-UTP

mRNA

RNAextraction

Reversetranscription

High density oligonucleotide array

Non-competitivenucleic acid

hybridization

sample


Phycoetrythrin-streptavidin

Aplicacions descrites per a microarrays:

• cDNA: Determinació de perfils d’expressió d’mRNA– Transcriptoma codificant (mRNA)– Transcriptoma total (RNA total)– Proteoma (RNA en polisomes)– Taxa de transcripció in vivo (Run-on)– Splicing alternatiu (mRNA sobre sondes d’exons)– Localització cel.lular (mRNA de fraccions cel.lulars)– Fase cicle cel.lular (mRNA de c’el.lules sincronitzades)

• Genòmic: Determinació de canvis al DNA– Canvis de dosi gènica / reordenaments (≈CGH)– Regions reguladores (precipitació de cromatina, factors de

transcripció, etc.)• Oligonucleòtids: Determinació de canvis a nivell nucleotidic

– Detecció de mutacions, polimorfismes (SNPs), -també expressió, etc

Necessitat d’eines bioinformàtiques

– Selecció de sondes: anàlisi de seqüències– Dades digitalitzades

• Quantificables• Computables

– Alt nombre de punts:• Automatització • Miniaturització

– Gran quantitat de informació acumulada• Seqüències• Publicacions• Sofisticació dels clínics i experimentals

Aplicacions específiques per al processament dels

microarrays

• Anàlisi i quantificació de imatges– Definició d’àrees de senyal– Subtracció de background– Normalització del senyal d’un experiment

• Anàlisi de significació• Normalització entre experiments• Agrupació de gens i d’experiments• Extracció de dades (data mining)

Microarraysde 2 colorsper a estudisd’expressió

mRNA

cDNA-Cy3 cDNA-Cy5

RNAextraction

ReversetranscriptionCy3-dCTP Cy5-dCTP

cDNA microarray


co-hybridization

Referencesample

Testsample

mRNA

cDNA-Cy3 cDNA-Cy5

RNAextraction

ReversetranscriptionCy3- Cy5-

cDNA microarray


co-hybridization

Referencesample

Testsample


Principi del mètode de hibridació sobre microarrays (≈Northern)

• Deposició o síntesi localitzada de biomolècules no marcades (sondes fredes o dianes) en ‘spots’ o taques homogènies

• Hibridació / reconeixement específic amb mostres marcades amb fluorescència o radioactivitat

• Rentat de producte que no s’ha unit específicament

• Detecció quantitativa de producte unit

• Mostra del procés de hibridació de microarrays...

To movie

http://www.bio.davidson.edu/courses/genomics/chip/chip.html



Factors a considerar en el disseny d’experiments

amb microarrays

• Seguiment dels punts: anotació de mostres

• Eficiència de marcatge de mostres• Orientació de la matriu• Controls de normalització• Nº de rèpliques• Estandardització per a bases de dades

de resultats d’experiments de microarrays

Generació d’imatges

• Col.lecció d’emissió fluorescent per fotomultiplicador genera corrent electric

• Conversor analògic a digital dona valor numèric - el nombre de comptes analògic digitals (A/D)

• Resultat: assigna valors de 0 a 65535 per a cada pixel (1 pixel = 5-10 um de imatge .tif 16 bits)

• Generació de imatge (256 colors o tons de l’escala de grisos)

Com s’analitzen les imatges de fluorescència?

Cy5 > Cy3 Cy5 = Cy3Cy5 < Cy3

Senyal de hibridacióImatges de cada canal:

intensitats representades en

color fals

Cy5Cy3

Solapament de les imatges: ratio

representat com a color fals

Mesures derivades de microarrays

• Intensitat total• Intensitat per pixel• Mitjana• Mediana• Desviació standard de intensitats• Desviació standard de background• Desviació standard de intensitats

(en rèpliques)• etc.

Taula

Quantificació del senyal

Ratio representat en color fals

Block Column Row ID F649 Median B649 Mean F550 Median B550 Mean ...1 1 1 gen 1 5356 240 11532 256 ...1 2 1 gen 1 5472 298 12293 221 ...1 3 1 gen 2 8986 279 12788 295 ...1 4 1 gen 2 6729 300 10520 364 ...1 5 1 gen 3 8981 318 18099 276 ...1 6 1 gen 3 9287 391 20459 308 ...1 7 1 gen 4 5138 358 11082 434 ...1 8 1 gen 4 5438 332 9594 257 ...1 9 1 gen 5 7634 356 13316 363 ...1 10 1 gen 5 9056 405 14402 291 ...1 11 1 gen 6 12181 701 16383 433 ...1 12 1 gen 6 15159 552 18793 263 ...1 13 1 gen 7 6805 243 14445 298 ...1 14 1 gen 7 6715 261 13874 199 ...1 15 1 gen 8 6073 319 12385 439 ...1 16 1 gen 8 5041 355 9371 335 ...

... ... ... ... ... ... ... ... ...

Dades quantificades en forma de taula

Representació gràfica de dades crues

Algoritmes de software d’anàlisi d’imatges: Cerca

de taques• Cerca de pixel central• Creació de caixa delimitant de la

taca– Suma de intensitat de tots els pixels– Iteracions per trobar valor màxim– Taca centrada al centre de la caixa

òptima (de intensitat màxima)

Distribució de senyal i background

Algoritmes de software d’anàlisi d’imatges:

background

• Determinació dels pixels corresponents al background (senyal de fons)– Centra-se en pixels de intensitat inferior a

5100 comptes analògic-digitals– Càlcul de la intensitat més frequent– Estimació de la desviació estandard (SD) de

les intensitats de background (assumeix distribució Gaussiana)

Algoritmes de software d’anàlisi d’imatges: senyal• Determinació dels pixels

corresponents al senyal real– Centrar-se en pixels de intensitat

superiors al llindar de comptes analògic-digitals:

– Senyal llindar = background + 3 * SD• Dona intensitat com el valor al

percentil 75 de intensitats en els pixels de la taca

Pas 1: Substracció de background

– Cal fer una substracció a nivell local– La manera de definir el background

pot afectar ls valors per a dades de baixa intensitat de senyal

Exemple: comparació dues condicions

• Nº de mesures:– Per cada element (o ‘spot’):

• Cercle of ~15 pixels de diàmetre (200 pixels)

• Mesures a cada spot:– Mitja del senyal real

-‘foreground’ (FG)

– Mediana del senyal de fons - ‘background’ (BG)

– (6 arrays) X (2 spots/array)

• = 12 punts de dades

A

B

11

22A’

B’

3344

B’’

55

66A’’

Rèplica biològica 1



FG

BG

Spots duplicats

Pas 2: Normalització interna (entre spots d’un microarray)

• Correcció de diferències entre les intensitats de senyal dels dos canals degudes a:

• Quantitat inicial de mostra • Aspectes qualitatius (classes d’RNA)• Degradació parcial• Eficiència de marcatge fluorescent• Eficiència a la detecció de fluorescència• Variació de incroporació deguda a seqüència

gènica• Variació entre pins d’impressió• No uniformitat del vidre o substrat

Mètodes de normalització• Mètodes de regressió

– Regressió linial (sobre simplificació)– Mètodes de regressió lineal robusta local (lowess)– Mètodes de regressió no linial

• Estimació estadística dels valors no canviants (ratio statistics), i de llindars d’expressió significativament diferencial– Ranking– Bayesians

• Es essencial tenir rèpliques per poder fer tractaments estadístics!!!

Opcions de normalització

• Valor relatiu respecte a intensitat total• Ajust per regressió

– Del senyal global (Si hi ha més de 103 punts)• Asumeix: majoria de gens no canvia, nombre similar de gens

puja i baixa – Tots els spots– Només spots filtrats de bona qualitat (preferible)

– De senyal de gens de referència (amb menys de 103 punts)

• Si a l’experiment no es pot assumir que la majoria de gens no varia o si hi ha activació o repressió general de la transcripció (molts gens pujen o molts gens baixen)

– Controls interns: gens housekeeping– Controls externs: spiked-in controls (gens artificials)

Data analysis pipeline Check linearity

Median centralization Lowess centralization

2Replicates

Gene lists

Expression change

List of significant co-regulated genes

Further analysis (data mining)

Promoter analysis

Function prediction

Gene regulatory networks

Literature searches

Annotation searches

Reporting results

Gene lists

T-test

Replicates

>2

Calculate logratios

Non-linearLinear

yes yesnono

Filter bad data

Data from image analysis

Calculate average within genes

ANOVAClassificationClusteringPCA

Number of conditions compared

‘NORMALIZATION’

‘MICROARRAY DATA’

‘DATA MINING’

La millor manera de mesurar ‘soroll’ experimental: experiments de hibridació self-self

HeLa vs HeLa

Hibridació control self-self

HEK293 vs HeLa

Hibridació test

Valors d’expressió relativa

• Quocient d’expressió:ratio=NormInt1/NormInt2

• Logaritme del quocient d’expressióLog ratio=log2(NormInt1/NormInt2)

– Transformació logaritmica converteix en una distribució normal (Gaussian) de quocients centrats en el valor 0 (zero).

– Logaritme en base 2 emprat sovint perque una inducció del doble (2X) o repressió a la meitat és la diferència mínima considerada mesurable

– Hi ha maneres alternatives de mirar les dades (intensitats, log intensitats, etc)

0-1 +1

1 20.5

12

__

=

Log2(0.5)=-1

Log2(2)=1Log2(1)=0

Ratio(R/G)

log2ratio(R/G)

Transfromació logarítimica

half

doub

le

equa

l

mei

tat

dobl

e

igua

l

11

__

=

21

__=

-1-2-2(-1) = -2

Quan log2ratio > 0: FC = 2 Log2(R/G)

(= ratio)

Quan log2ratio < 0: FC = -2 -Log2(R/G)

Foldchange(R/G)

Escala simètrica càlcul de taxa de

canvi – ‘fold change’ (FC)

half

doub

le

equa

l

0-1 +1Log2(0.5)=-1

Log2(2)=1Log2(1)=0

M

half

doub

le

equa

l

+1 +221 = 2

1 20.5

12

__

=

Ratio(R/G)

Transfromació simètrica

half

doub

le

equa

l

11

__

=

21

__=

-1-2-1/0.5 = -2

Quan ratio > 1: FC = ratio

Quanratio < 1: FC = -1/ratio

Foldchange(R/G)

half

doub

le

equa

l

+1 +2

La relació entre intensitat NO és linial

• Per això s’estilen mètodes de regressió locals:– Lowess (locally weighted robust linear regression)– Regressió no linial

Valors d’expressió normalitzada

• Quocient d’expressió (expression ratio):ratio=NormInt1/NormInt2

• Logaritme del quocient d’expressió (expression log ratio)

Log ratio=log2(NormInt1/NormInt2)– La transformació logarítmica permet establir una

distribució normal (Gaussiana) dels ratios amb valors centrats en 0.

– Log base 2 emprat perque es considera sovint 2X com el nivell mínim de diferència acceptable com a significativa

– Els ratios suposen pèrdua de informació (intensitat)

Histogrames de ratios i scatterplots (gràfiques de dispersió)

Gràfiques de intensitat MA plots

Gràfiques de intensitat Gràfiques MA

Normalització per lowess (locally weighted linear regression)

• Centra a valor logratio igual a 0• Compensa comportament no linial

Avantatges dels gràfics MA / RI i aplicació de lowess

– Mostren estructura de les dades que permet avaluar la qualitat de les dades d’expressió

– Mesures log2(ratio) mostren una major variació en

rangs de baixa intensitat

– Molts dels estudis publicats empren un únic valor limit determinat (per exemple 2X o 0.5X).

– Emprar lowess permet fixar límits de significació variables dependents de intensitat (basats en desviació estándar local)

Pas 3: Filtratge de dades previ a l’anàlisi

• Eliminació de dades no tractables:– Amb intensitats baixes– Amb intensitat per sota de

background (càlcul de ratio impossible; poden fer-se conversions)

– Amb coeficient de variació excedint un llindar entre rèpliques

Pas 4: Tests de significació estadística

– t-test– Two component error model (Rocke-

Lorenzato)– Z-scores (Chen)– SAM (significance analysis of microarrays;

Tusher et. al)• SAM score (T-statistics value), valor ‘d’ de

significació• q value, mesura de la taxa de falsos positius

– IMPORTANT: Iniciativa CAMDA (Critical Assessment of Microarray Data Analysis)

Tests de significació estadística

• t-test (amb ajust per a nombre alt de sondes)– Compara els valors de les rèpliques de

dues condicions diferents– Estableix si la diferencia pot haver estat

per atzar (amb una probabilitat d’acceptar un fals positiu de p=0.05)

Tests de significació estadística

• Hipòtesi a tots els tests:– No hi ha cap diferència entre les

mitjanes de intensitat d’expressió gènica per al gen X entre els grups (condicions) testats.

– En altres paraules, tots els grups tenen mitjanes equivalents per al gen X.

Correcció per a tests múltiples

• Si es testen 10.000 gens amb un valor de tall de significació de (p-value) de 0.05 voldrà dir que el nombre de gens que es trobi amb expressió diferencial per atzar –encara que no hi hagi expressió diferencial veritablement- seria de:

10,000 x 0.05 = 500 gens• La correcció per atests múltiples fa un ajust del

p-value individual de cada gen per fer l’error menor o igual que un valor de tall especificat per l’usuari

Step 4: Test de significació estadística

• IMPORTANT: Iniciativa CAMDA (Critical Assessment of Microarray Data Analysis)

Replicació– Replicació d’elements o spots (al mateix xip)

• Controlen l’homogeneitat de la hibridació (dins d’un mateix xip)

– Rèpliques tècniques (emprant xips diferents)• Hibridacions repetides a partir dels mateixos extractes

– Controlen la robustesa del protocol de hibridació (de xip a xip, entre diferents dies, entre diferents mans)

• Repliques de reversió de fluorocrom (Dye reversal) – Corregeixen diferències de senyal degudes a fluorocrom

– Rèpliques biològiques (xip diferent / mostra diferent)• Hibridacions repetides a partir d’extractes diferents però

equivalents (d’experiments o mostres diferents)• Es poden considerar mostres de la mateixa classe com a una

variació de rèpliques biològiques quan hi ha un nombre elevat de mostres

Validació sempre necessària!

• Replicar! Replicar!! Replicar!!! –el poder dels grans nombres

• Validació experimental:– Plataforma de microarrays alternativa– rt-PCR a temps real– Northern– Protecció d’RNAses– Hibridació in situ

• Altres dades– Literatura– Digital differential display– Bases de dades de microarrays

Altres formes de validació

• Validació creuada amb altres tipus de informació– Dades no d’RNA: expressió de proteïnes– Expressió de molècules interactuants (RNA

o proteïna) – Informació de coexpressió:

dianes/reguladors/co-regulats gens/vies de senyalització/rutes metabòliques, etc

...té sentit tot plegat?

Pistes

• És possible àcceptar valors per sota de 2X com a indicadors fiables de diferències d’expressió sempre que es faci servir el següent model per a l’analisi:– Normalització per lowess – Filtrat i anàlisi estadístic emprant rèpliques– Estimació de valors de Z (desviació estándar)

locals per determinar expressió diferencial estadísticament significativa

Múltiples experiments:

cDNA-Cy3 cDNA-Cy5 cDNA-Cy3 cDNA-Cy5 cDNA-Cy3 cDNA-Cy5cDNA-Cy3 cDNA-Cy5cDNA-Cy3 cDNA-Cy5

A B A A A AC D E F

A

B

C

D

E

F

PoolA, B, C, D, E, F

B

C

D

E

F

A

B

C

D

E

F

A

Valor afegit d’analitzar múltiples experiments

– Assumint: que gens participants en processos similars es regulen de manera semblant

– Podem extreure informació sobre:• Funció gènica (vies senyalització, metabolisme,

etc.)• Classificar condicions experimentals d’acord amb

patrons d’expressió (prognosi de tumors, resposta a fàrmacs, relació amb stress metabòlic, cicle cel.lular, localització subcel.lular, etc.)

• Correlacionar amb altres paràmetres (localització cromosòmica, background genètic, factors ambientals)

Dos tipus de pregunta:– 1. Quins gens estan expressats diferencialment en un grup de

condicions?• Cerca de gens co-regulats

– Predicció de funció gènica per associació a altres gens– Emprar ontologies gèniques (GO) per cercar enriquiment en una determinada

» Funció molecular» Component cel.lular» Procés

– Estudi de regions promotores– Modelatge de rutes metabòliques / vies de transducció de senyals / xarxes de

regulació transcripcional...

– 2. Quines condicions s’agrupen per compartir patrons d’expressió similars?

– Classificació de condicions– Predicció de condicions– Assignació d’una mostra a una classe: diagnosi basat en patrons d’expressió

gènica

Pas 1: Escalat• Centra totes

distribucions a mitjana de logratio = 0

• Fer la desviació estándar de la distribució = 1

Pas 2: Normalització entre xips

• Establir valors relatius a referència comuna

• Valor a l’estat basal (tipus salvatge, temps zero, no tractat, etc)

• Línia cel.lular d’us comú• Pool de línies cel.lulars• RNAs de referència

– En el cas d’arrays de vidre hibridats per fluorescència normalment els valors de logratios ja són relatius a una condició de referència.

Estratègies d’agrupació• Comparació:

– Comparem expresió gènica mesurada en log ratios

– Construïm distàncies entre punts (elements o gens) per resta de vectors (coordenades del vector de cada punt corresponen a valors d’expressió gènica en cada condició)

• Agrupació de dades:– Agrupem gens o experiments en base a

proximitat de distàncies– Distàncies calculables fent servir mètriques

diverses (euclidiana, etc)

Tipus de clustering

– Jeràrquic (clustering jeràrquic per mètodes filogenètics) o no jeràrquic (K-means, SOMs)

– Supervisat (emprant informació biològica prèviament coneguda) o no supervisat

– Divisiu (K-means, SOMs) o aglomeratiu (clustering jeràrquic)

– IMPORTANT: Els resultats poden ser molt variables de mètode a mètode (i dependent del tipus de normalització, mètrica de la distància, etc)

Clustering jeràrquic

• Aglomeratiu• Genera arbre jeràrquic• Simple• Representació fàcil de visualitzar• Variacions:

• Single-linkage (minimum, nearest neighbor)• Complete-linkage (maximum, farthest neighbor)• Average-linkage (o bé centroid-linkage, o median-

linkage)• Altres (Weighted pair-group average -per clusters

amb nombres molt diferents d’elements, etc)

Clustering K-means

• Divisiu• Parteix d’un nombre predeterminat

de grups de gens o condicions• Calcula un vector d’expressió

promig que es va refinant per càlcul reiteratiu.

• No produeix arbres

SOMs(Self Organizing Maps)

• Divisiu• Basat en xarxes neuronals (mètodes de

computació auto-entrenants)• Optimitza la separació de grups en base

a geometria predefinida sobre la qual s’entrenen vectors de referencia.

• Maximitza la convergència entre vectors i punts de cada cluster

PCA(Principal Component

Analysis)• Divisiu• Assumeix que hi ha redundància en les

dades d’expressió gènica• Projecta conjunts de dades complexes

en espais fàcils de visualitzar (redueix la dimensió de l’espai)

• Cerca les vistes que aporten una millor separació de dades

Extracció d’informació(data mining)

– Aprofita accés a bases de dades biològiques per:• Obtenir dades relacionades (gens homòlegs, dades

bibliogràfiques, dades estructurals, interacció de proteïna, etc)

• S’extrapolen dades tot fent cerques damunt de cerques

– Pot generar-se sistema automatitzat de recerca:• Entrenar un sistema intel.ligent amb col.lecció de dades.

– IMPORTANT: És extremadament útil generar un repositori de dades d’experiments amb microarrays a partir de formats estandaritzats (Iniciativa MIAME)

Formes de visualització de múltiples experiments

• Matrius de color fals• Arbres o dendrogrames (clustering

jeràrquic)• Gràfiques de patrons d’expressió i

centroids (K means o SOMs)• Visió en 3D (PCA)• Matrius d’expressió

Matrius d’expressi

ó:

taules de logratios

d’expressió

condicions

tumor 1 tumor 2 ... tumor n

gen 1 a1 b1 ... z1

gens gen 2 a2 b2 ... z2

... ... ... ... ...

gen n an bn ... zn

vectors de perfils d'expressió de cada gengen 1 (a1, b1, ..., z1)gen 2 (a2, b2, ..., z2)

... ...gen n (an, bn, ..., zn)

vectors de perfils d'expressió a cada condiciótumor 1 (a1, a2, ..., an)tumor 2 (b1, b2, ..., bn)

... ...tumor 3 (z1, z2, ..., zn)

Arbres

Gràfiques de patrons d’expressió

Plots 3D

Diferències

– Segons mètodeveiem diferentsagrupaments:

Paquets de software d’accés públic

• Anàlisi i quantificació d’imatges– Scanalyze, SpotFinder-ArrayViewer,

ChipSkipper

• Estudi de significació estadística– R, BRB-Tools, GP-QA-processor, SAM

• Comparació i agrupació de resultats– Cluster/Treeview, Expression profiler,

Multiple expression Viewer (MeV)

• Bases de dades de microarrays– Nomad, Madam

Paquets de software comercials

• Anàlisi i quantificació d’imatges– GenePix, Scanarray, Jaguar, Pathways,

ImaGene, Quantarray, Spot

• Estudi de significació I estadística– MatLab, SSPS

• Comparació i agrupació de resultats– GeneSight, Acuity, GeneSpring, GenePlus

• Bases de dades de microarrays– GeneSight, Acuity, GeneSpring, GenePlus

Referències - WWWInfobiochip - Instituto de Salud Carlos III

(http://infobiochip.isciii.es/)Literature on Microarray Data Analysis - Max Planck Institute

(http://www.molgen.mpg.de/~heydebre/explit.html)Papers on Microarray Data Analysis - Rockefeller University

(http://linkage.rockefeller.edu/wli/microarray/index.html)Statistics for Microarray Data Analysis - Terry Speeds UC Berkeley

(http://www.stat.berkeley.edu/users/terry/zarray/Html/index.html)Critical Assessment of Microarray Data Analysis - CAMDA

(http://bioinformatics.duke.edu/CAMDA/CAMDA01/papers.asp)Expression Analysis Seminars – Heydebreck/Vingron DKFZ

(http://www.dkfz-heidelberg.de/tbi/people/heyde/expsem.html)Seminar on Clustering Algorithms - Enrique Blanco GRIB-IMIM

(http://www1.imim.es/~eblanco/seminars/docs/clustering/index_clustering.html)

http://www.molgen.mpg.de/~heydebre/explit.html

http://www.molgen.mpg.de/~heydebre/explit.html

http://www.stat.berkeley.edu/users/terry/zarray/Html/index.html

http://www.stat.berkeley.edu/users/terry/zarray/Html/index.html

http://bioinformatics.duke.edu/CAMDA/CAMDA01/papers.asp

http://www.dkfz-heidelberg.de/tbi/people/heyde/expsem.html

http://www1.imim.es/~eblanco/seminars/docs/clustering/index_clustering.html

Referències – bibliografia –anàlisi de dadesQuackenbush J.

Computational analysis of microarray data.Nat Rev Genet. 2001 Jun;2(6):418-27. Review.

Beissbarth T, Fellenberg K, Brors B, Arribas-Prat R, Boer J, Hauser NC, Scheideler M, Hoheisel JD, Schutz G, Poustka A, Vingron M.Processing and quality control of DNA array hybridization data.

Bioinformatics. 2000 Nov;16(11):1014-22.Schuchhardt J, Beule D, Malik A, Wolski E, Eickhoff H, Lehrach H, Herzel H.

Normalization strategies for cDNA microarrays.Nucleic Acids Res. 2000 May 15;28(10):E47.

Tseng GC, Oh MK, Rohlin L, Liao JC, Wong WH.Issues in cDNA microarray analysis: quality filtering, channel normalization, models of variations and assessment of gene effects.

Nucleic Acids Res. 2001 Jun 15;29(12):2549-57.Smyth GK, Yang YH, Speed T

Statistical issues in cDNA Micorarray data analysis. In Functional Genomics: Methods and Protocols, Brownstein MJ, Khodursky AB Eds. Methods in

Molecular Biology Series, Humana Press, Totowa, NJ USA 2003. In press.Brazma A, Hingamp P, Quackenbush J, Sherlock G, Spellman P, Stoeckert C, Aach J, Ansorge W, Ball CA, Causton HC,

Gaasterland T, Glenisson P, Holstege FC, Kim IF, Markowitz V, Matese JC, Parkinson H, Robinson A, Sarkans U, Schulze-Kremer S, Stewart J, Taylor R, Vilo J, Vingron M.Minimum information about a microarray experiment (MIAME)-toward standards for microarray data.

Nat Genet. 2001 Dec;29(4):365-71.

http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=PubMed&list_uids=11389458&dopt=Abstract











































http://www.statsci.org/smyth/pubs/mareview.pdf




















































Bioinformàtica i GenòmicaMicroarrays

Laboratori de Microarrays Centre de Regulació Genòmica

http://www.crg.esLauro Sumoy

Cy3 dCTP- Cy5-dCTP

cDNA-Cy3 cDNA-Cy5

BA

http://www.crg.es/

http://www.crg.es/

http://www.crg.es/