Fisica Computazionale applicata alle Macromolecole

Post on 03-Jan-2016

37 views 0 download

description

Fisica Computazionale applicata alle Macromolecole. Pier Luigi Martelli Università di Bologna www.biocomp.unibo.it/gigi/TRENTO gigi@biocomp.unibo.it 051 2094005 338 3991609. Presentazione del corso. Calendario del corso. Martedì, 8 Novembre15.00-18.00 (?) - PowerPoint PPT Presentation

transcript

Fisica Computazionale applicata alle Macromolecole

Pier Luigi Martelli

Università di Bolognawww.biocomp.unibo.it/gigi/TRENTO

gigi@biocomp.unibo.it051 2094005338 3991609

Presentazione del corso

Calendario del corso

•Martedì, 8 Novembre 15.00-18.00 (?)•Mercoledì, 9 Dicembre 8.30-11.30 (?)

•Martedì, 15 Novembre 15.00-18.00 •Mercoledi, 16 Novembre 8.30-11.30

•Martedì, 29 Novembre 15.00-18.00•Mercoledì, 30 Novembre 8.30-11.30

•Martedì, 6 Dicembre 15.00-18.00•Mercoledì, 7 Dicembre 8.30-11.30

•ESAMI….?

ERA “OMICA”

The analysis of the components of a living organism in its entirety

GA EVANS, Nature Biotechnology 2000, 18, 127

Genoma: Patrimonio genetico di un organismo (o individuo)

Insieme di tutti i geni (proteine) da esso codificate

Tecniche di Sequenziamento veloce (shot gun)

•1995 Primo genoma completo del batterio Haemophilus influenzae (Fleischman et al., Science 269, 496)•2001 Prime bozze del genoma umano assemblato da Celera e da l’ International Human Genome Sequencing Consortium•2004 Stesura della parte eucromatica del genoma•2005 Mappa degli aplotipi umani (variabilità, SNPs, linkage)

From Genotype to Phenotype

…code for

proteins...

>protein kinase

acctgttgatggcgacagggactgtatgctgatctatgctgatgcatgcatgctgactactgatgtgggggctattgacttgatgtctatc....

Genes in DNA...

(about 30,000 in the human genome)

Proteins interact

…proteins correspond to

functions...

…when they are expressed

From 5000 to 10000 proteins per tissue

…with different effects depending on

variabilityOver 9.8 millions of single mutations are

known

….in methabolic pathways

SEQUENZIAMENTO

Top-Down Shotgun

ERA “OMICA”

Trascrittoma: Insieme degli mRNA presenti in una cellula in un dato tempo e in una data condizione.

Livelli di espressione genica

Tecniche di cDNA array, GeneChips...

Gasch et al. (2000) Mol. Biol. Cell. 11(12) 4241-4257

Figure 4. Characterized genes induced in the Environmental Stress Response (ESR). Characterized genes that are induced in the ESR are displayed according to their involvement in (A) carbohydrate metabolism, (B) cellular redox reactions and defense against reactive oxygen species, (C) protein folding.

ERA “OMICA”

Proteomica: Insieme delle proteine presenti in una cellula in un dato tempo e in una data condizione.

Tecniche di 2D-elettroforesi, Spettrometria di massa

ERA “OMICA”

Variabilità: Ogni individuo in una popolazione è portatore di una variabilità genetica che lo differenzia.

-) SNPs: Single Nucleotide PolymorphismsIn un gene codificante un enzima

glicosilante Es: Gruppi sanguigni

A .ctggtgacccctt. N-acetilgalattosamina

B .ctcgtcaccgcta. Galattoso0 .ctggt-acccctt. Enzima inattivo

-) Aplotipi: poliformismi coeredidati: Markers di biodiversità per studi di popolazione e forensi

-) Geni differenti in popolazioni della stessa specie: PANGENOMI batterici (80% in

comune)

ERA “OMICA”

Interattoma: Insieme delle interazioni tra proteine (e tra proteine e DNA)

Tecniche di doppio ibrido

Oliver S, Nature 2000, 403 , 601

Alcuni problemi aperti

Gene finding. Data una sequenza di DNA, dove sono i geni? E le regioni promotrici?….. Struttura. Data una sequenza proteica, che conformazione strutturale assume?Interazione. Con quali meccanismi le macromolecole biologiche interagiscono?Sistema. Si possono modellizzare reti metaboliche? livelli di espressione genica in particolari condizioni ambientali?….....

Fisica Computazionale e Macromolecole Biologiche

Approccio “Molecolare” : •si descrivono le molecole in termini di potenziali di interazione tra atomi•si ricavano informazioni riguardo la stabilità energetica di molecole e complessi e riguardo ai loro moti •approccio adatto allo studio delle singole molecole o a sistemi vicini alla conformazione di equilibrio Meccanica e Dinamica Molecolare, Docking,

Quantomeccanica molecolare•si simulano solo piccoli sistemi e brevi tempi•si utilizzano forzatamente potenziali approssimati•approccio inadatto ad analisi genomica, al problema del folding (se non accoppiato a altri strumenti)

Fisica Computazionale e Macromolecole Biologiche

Approccio “Analisi di sequenza” :•DNA, RNA e proteine sono eteropolimeri complessi lineari•Presupposti teorici:

•Dogma centrale della biologia molecolare

DNA RNA Proteina

Il DNA contiene anche le zone di regolazione dell’espressione genica

Dato il DNA è teoricamente possibile risalire a tutte le proteine da esso espresse e alla loro regolazione nelle differenti condizioni

Fisica Computazionale e Macromolecole Biologiche

Approccio “Analisi di sequenza” :•DNA, RNA e proteine sono eteropolimeri complessi lineari•Presupposti teorici:

•Dogma centrale della biologia molecolare•Ipotesi termodinamica di Anfinsen e relazione struttura-funzione

La struttura tridimensionale di una proteina dipende dalla sua sequenza (e dall’ambiente fisiologico)

La funzione di una proteina dipende dalla struttura tridmensionale

Fisica Computazionale e Macromolecole Biologiche

Approccio “Analisi di sequenza” :•DNA, RNA e proteine sono eteropolimeri complessi lineari•Presupposti teorici:

•Dogma centrale della biologia molecolare•Ipotesi termodinamica di Anfinsen e relazione struttura-funzione Le sequenze contengono tutta (o quasi) l’informazione necessaria

Fisica Computazionale e Macromolecole Biologiche

Approccio “Analisi di sequenza” :•DNA, RNA e proteine sono eteropolimeri complessi lineari•Presupposti teorici:

•Dogma centrale della biologia molecolare•Ipotesi termodinamica di Anfinsen e relazione struttura-funzione Le sequenze contengono tutta (o quasi) l’informazione necessaria

•Si utilizzano strumenti derivati dalla teoria dell’analisi del segnale•Forniscono predittori per il gene finding e per la struttura delle proteine

Fisica Computazionale e Macromolecole Biologiche

Approccio “Sistemico” : •Descrizione delle molecole in interazione (cicli metabolici, reti geniche, livelli di espressione)•Si utilizzano strumenti della teoria dei sistemi•Dati via via disponibili tramite microarray, sistema a due ibridi, …..

Focus del corso

Approccio “Analisi di sequenze” Modelli e approcci utili in tutti i contesti di analisi di segnaliStrumenti matematici principali: Allineamento di sequenze, reti neurali, Hidden Markov Model Applicato al problema della predizione della struttura e della funzione di una proteine a partire dalla sua sequenza

Programma del corso

•Richiami sulla struttura proteica (strutture secondarie, terziarie, domini, forze stabilizzanti)•Banche dati di sequenze e strutture note•Problema della predizione della struttura 3D•Analisi di sequenze: Pattern e metodi di allineamento•Reti Neurali•Modelli probabilistici per sequenze (Hidden Markov Model)•Predittori di caratteristiche morfo-funzionali a partire dalla sequenza amminoacidica•Ricostruzione della struttura terziaria delle proteine (building per omologia,threading, metodi ab inizio)