Post on 04-Jan-2016
description
transcript
Metodi per lo studio dell’espressione genica su larga scala:
ESTs SAGE Microarray
MICROARRAYSAGEEST
Computational analysis of data by statistical methods
ESPRESSIONE DEL GENOMA UMANO NELLE CELLULE DIFFERENZIATE
• Tutte le cellule di un organismo hanno lo stesso corredo genomico
• L’espressione genica tessuto specifica determina il fenotipo morfo-funzionale dei tipi cellulari e tissutali
• In ogni cellula differenziata ed in ogni particolare momento dello sviluppo e’ attivo solo un sottoinsieme di geni
REGOLAZIONE DELL’ESPRESSIONE GENICA
• Puo’ agire su ciascuno dei livelli che caratterizzano il passare dell’informazione genica dal DNA alle proteine
• Negli Eucarioti superiori la regolazione dell’espressione genica si svolge principalmente come controllo della trascrizione
• Principali tipi di regolazione:Controllo epigeneticoControllo trascrizionaleControllo post-trascrizionale
“One-gene approach”Il gene di interesse e’ espresso in un tessuto o in un dato momento dello sviluppo ? Quanto e’ attivo dal punto di vista trascrizionale ?
Profilo d’espressione del genoma(TRASCRITTOMA)
Quali geni sono espressi in un tessuto ed in un dato momento dello sviluppo ?Quanto ciascuno di essi e’ attivo dal punto di vista trascrizionale ?
“Large-scale approach”
Real Time PCRPCR semiquantitativaIbridazione DNA genico o cDNA con RNA
totale o poly(A)+RNA (Northern blot)Ibridazione in situ
METODI PER LO STUDIO SU LARGA SCALA DELL’ESPRESSIONE GENICA
Sequenziamento sistematico di ESTs da librerie di cDNA
SAGE (Serial Analysis of Gene Expression)
cDNA microarrays
mRNA of different genes
cDNA LIBRARY
EST SEQUENCING EST
ESTIMATE OF THE LEVEL OF EXPRESSION OF A GIVEN GENE
Sample of 12919 ESTs corresponding to 4460 genes/trascripts
eg. Rhodopsin:
65 retina ESTs 65 / 12919 = 0.503%
UniGene Human Release Statistics
Total sequences in clusters: 3115711
Total number of clusters sets: 95928
22094 sets contain at least one known gene
94710 sets contain at least one EST
20876 sets contain both genes and ESTs
EST
EST
EST
SAGE Serial Analysis of Gene Expression
SAGE è un metodo sperimentale ideato per utilizzare i vantaggi del sequenziamento su larga scala per avere informazioni quantitative di espressione genica (Velculescu et al. 1995, Zhang et al, 1997)
Con questa tecnica e’ possibile stimare il livello d’espressione di ciascun gene, attraverso la misura del numero di volte in cui la TAG che lo rappresenta compare in un campione abbastanza grande di TAGs sequenziate a partire dal messaggero del tessuto in analisi
Tag to Gene mapping Gene to Tag mapping
Consiste nel sequenziamento da messaggeri cellulari di brevi oligonucleotidi, che fungono da etichette di sequenza (TAG)
SAGE
Iso lam ento de lle “ tag”
L igaz ione
Sequenziam ento
Q u an tificazione d i c iascuna“tag” e determ inazione del pattern d i esp ressione
Liv
ello
di
esp
ress
ione
Liv
ello
di
esp
ress
ione
G E N E
A lte r a toG E N E
N orm ale
Iso lam ento de lle “ tag”
L igaz ione
Sequenziam ento
Q u an tificazione d i c iascuna“tag” e determ inazione del pattern d i esp ressione
Liv
ello
di
esp
ress
ione
Liv
ello
di
esp
ress
ione
G E N E
A lte r a toG E N E
N orm aleG E N EN o rm a le
G E N EA lter ato
una sequenza di 9 paia di basi permette di identificare 49 (262144) diversi trascritti (una "tag" viene ottenuta da una posizione specifica di ogni trascritto).
le "tag" possono essere unite insieme in serie, a costituire lunghe molecole di DNA, che vengono clonate e sequenziate.
il numero di volte in cui una singola "tag" viene osservata permette di quantificare l'abbondanza del messaggero identificato nella popolazione dei messaggeri e, indirettamente, il livello di espressione del gene corrispondente.
SAGE
Esperimenti di Microarray
Permettono l’analisi dell’espressione di migliaia di geni simultaneamente
MICROARRAY
MICROARRAY
GeneChip Affymetrix
Ibridizzazione della sonda marcata Scansione del GeneChip con scanner laser
Analisi dell’immagine
• Identificazione della posizione degli spot
• Costruzione di un’area locale intorno ad ogni spot
• Calcolo dell’intensità di ogni singolo spot
• Calcolo del background locale
MICROARRAY
Elaborazione dei datiMICROARRAY
MICROARRAYSAGEEST
Matrice dei risultati con più condizioni sperimentali
Cond. 1 Cond. 2 … Cond. m
Gene 1 x11 x12 … x1m
Gene 2 x21 x22 … x2m
… … … … …
Gene n xn1 xn2 … xnm
• Quali geni sono differenzialmente espressi ? • Quali e quanti geni sono coespressi?
Obiettivi dell’analisi saranno…
Identificazione geni differenzialmente espressi
Identificazione pattern di espressione comuni
Identificazione di geni coespressi con geni di funzione nota
CLUSTER ANALISI
Identificazione di gruppi di geni con profili di espressione similisimili
Simili rispetto a cosa ?
Definizione di distanzadistanza
I geni sono punti nello spazio:
punti vicini nello spazio sono raggruppati insieme
DUE STEPS:
Misura di similarita’• Diverse misure• Standardizzazione dei dati
Linking method• criterio per stabilire i gruppi• Metodi gerarchici e non gerarchici
CLUSTER ANALISI