Lezione 8
Selezione positiva o darwiniana
• Graur and Li: Capitolo 4 (+Cap 2 p63-65)
• Graur: lecture 20
• Ziheng Yang: computational molecular evolution
In generale il tasso di sostituzione in geni e regioni non geniche si spiega con
• La mutazione che aggiunge varianti
• La deriva genetica che governa la sorte di alleli neutrali o quasi neutrali
• Il ruolo rispettivo di selezione/deriva che dipende dalla dimensione della popolazione
• Le selezione purificante che elimina gli alleli deleteri
E la selezione positiva (adattativa, darwiniana)?
Come identificare la selezione positiva
• I cambiamenti non sinonimi più probabilmente avranno significato adattativo
• Le mutazioni vantaggiose si fissano più velocemente delle neutrali quindi il tasso di sostituzione
Nonsyn > Syn
se la selezione positiva sta agendo sulla proteina
Alcune considerazioni
KA > KS Selezione positiva o darwiniana
La teoria neutrale fornisce un modello nullo per i test di selezione
• Se qualunque tipo di sostituzione (anche quelle Nonsyn) è effettivamente neutrale, allora il tasso di sostituzioni Nonsyn dovrebbe eguagliare quello delle Syn.
• Sequenziare lo stesso gene (gene omologo) in due diverse specie.
• Confrontare il tasso di sostituzioni Syn con quello delle Nonsyn.
Un altro modo di affrontare il problema:
Come identificare la selezione positiva: test di McDonald Kreitman (1991)
Come identificare la selezione positiva: test di McDonald Kreitman (1991)
2 specie Confronto fra mutazioni -sinonime fisse -sinonime polimorfiche -nonsinonime fisse -nonsinonime polimorfiche
Il test si basa sulle seguenti assunzioni: 1. Solo le mutazioni nonsinonime possono essere adattative. 2. Le mutazioni sinonime sono sempre neutrali 3. Una mutazione selettivamente vantaggiosa si fisserà nella popolazione molto più rapidamente di una neutrale e, quindi, meno facilmente sarà in uno stato polimorfico.
Come identificare la selezione positiva: test di Mc Donald Kreitman (1991)
Mutazione neutrale Mutazione vantaggiosa
Prima classificazione dei siti nucleotidici Un sito è POLIMORFICO se mostra variabilità INTRASPECIFICA in una o entrambe le specie Un sito è FISSATO se è diverso TRA SPECIE, ma non mostra variabilità intraspecifica Tutti gli altri siti sono MONOMORFICI e non vengono usati nelle analisi
Come identificare la selezione positiva: test di Mc Donald Kreitman (1991)
Queste mutazioni si
manifestano come caratteri
condivisi TRA le specie
Presente
Passato
tempo
Antenato comune
specie1 e specie2
Queste mutazioni si
manifestano come differenze
FISSATE TRA le specie
Presente
Passato
tempo
Antenato comune
specie1 e specie2
div
erg
enza
Queste mutazioni si
manifestano come
POLIMORFISMI entro specie
Polimorfismi
Differenze fissate
Seconda classificazione dei siti nucleotidici I siti POLIMORFICI e FISSATI vengono divisi in SINONIMI e NONSINONIMI
Come identificare la selezione positiva: test di Mc Donald Kreitman (1991)
Secondo il modello neutrale (ipotesi nulla!) ci si attende che: Il destino delle mutazioni sia governato principalmente dalla deriva genetica, trascorso un certo tempo t le mutazioni sinonime e le non sinonime hanno lo stessa probabilità di essere fissate hanno la stessa probabilità di essere in stato polimorfico Hanno la stessa probabilità di essere eliminate
Come identificare la selezione positiva: test di Mc Donald Kreitman (1991)
Secondo il modello neutrale (ipotesi nulla!) ci si attende che: Il rapporto tra mutazioni FISSATE sinonime e nonsinonime sia uguale al rapporto tra mutazioni POLIMORFICHE sinonime e nonsinonime Una deviazione significativa da questa attesa permetterà di rigettare l’ipotesi nulla di evoluzione neutrale
Come identificare la selezione positiva: test di Mc Donald Kreitman (1991)
Fissate sinonime Polimorfiche sinonime
---------------------------- = ------------------------------------
Fissate nonsinonime Polimorfiche non sinonime
Selezione positiva
Mutazioni adattative (quindi selezionate positivamente) non sinonime saranno
soprattutto in stato fissato (differenze tra specie) > X aumenta
<
Selezione negativa
I cambiamenti non sinonimi non si fissano: selezionate purificante < X
>
SELEZIONE POSITIVA
Numero di differenze fissate sinonime e nonsinonime e di polimorfismi in sequenze di glucoso-6-fosfato deidrogenasi tra Drosophila melanogaster e D. simulans _____________________________________________________ Differences ________________________ Type of change Fixed Polymorphic _____________________________________________________ Synonymous 26 36 Nonsynonymous 21 2 _____________________________________________________ Data da Eanes et al. (1993). Comparazioni basate su 32 sequenze di D. melanogaster e 12 sequenze di D. simulans, lunghezza dell’allineamento: 1705 bp.
Mc Donald Kreitman (1991)
SELEZIONE POSITIVA
polymorphic fixed
synonymous X Y
nonsynonymous Z W
Problema: Il risultato dipende dalla grandezza del campione studiato
Aumentando il campione è possibile solo aumentare il
numero dei polimorfismi, non quello delle differenze fissate
Come identificare la selezione positiva: Ka/Ks (o dN / dS..stessa cosa!!)
NB: non stiamo più parlando di MK test!!!!!!
• Ka/Ks fra due o più sequenze • Metodi approssimati (disponibili ad esempio in MEGA) • Metodi di maximum likelihood (PAML)
• Ka/Ks per una particolare linea evolutiva in un albero filogenetico • Ka/Ks per specifiche regioni di un gene (e specifici aminoacidi)
Come identificare la selezione positiva: Ka/Ks
Test basato sul rapporto tra sostituzioni nonsinonime e sinonime Assunzioni: 1. Solo mutazioni nonsinonime possono migliorare le
funzioni di una proteina 2. Le mutazioni sinonime non contribuiscono alla fitness
dN/dS: è la stessa cosa!!
ω = 1 ω > 1 ω < 1 Neutral positive sel purifying sel
= ω
Come identificare la selezione positiva: Ka/Ks
Distanze fra sequenze:coding sites
Seq1
Seq2
Ser Thr Glu Met Cys Leu
TCA ACT GAG ATG TGT TTA
↕ ↕ ↕ ↕
TCG ACA GAG ATA TGT CTA
Ser Thr Glu Ile Cys Leu
Basta contare?
NO!
Non Sin
Sin Sin Sin
KS
KA
Metodo di Nei & Gojobori (1986)
Distanze fra sequenze:coding sites
1. Conto i siti sin e nonsin nelle 2 sequenze
2. Conto le differenze sin e nonsin tra le sequenze
3. Correggo per sostituzioni multiple
Testo se ω differisce significativamente da 1 3a: test Z 3b: confronto modelli con un likelihood ratio test (modello zero: ω =1)
3a: approximate methods Miyata and Yasunaga Nei and Gojobori MEGA
3b: metodo di maximum likelihood (ML) basato su un modello esplicito di sostituzione dei codoni (Box 2) PAML (Yang)
Distanze fra due o più sequenze
Spazio dei parametri Superficie espolarata MCMC
in modo esaustivo
ω = 1 ω > 1 ω < 1 Neutral positive sel purifying sel
Esempi di KA/KS estremi (>>1):
(1)Glycophorin C = proteina della membrana dei globuli rossi che serve come recettore per la proteina del Plasmodium falciparum che lega l’eritrocita, quindi media una delle vie di invasione di P. falciparum’s invasion nell’uomo).
(2)Granulysin = proteina secreta dalle T cells citotossiche quando queste attaccano cellule infette. Crea fori nei patogeni come Mycobacterium tuberculosis e li distrugge. Indice apoptosi nelle cellule infette.
Elevati KA/KS sono frequenti in geni che hanno a che fare con la riproduzione sessuale come geni coinvolti nel comportamento legato all’accoppiamento, nella fertilizzazione, spermatogenesi, eiaculazione, o determinazione del sesso.
Selezione positiva in una particolare linea evolutiva
H
C
Hominoids
Colobines
Ka/Ks per specifiche regioni di un gene (e specifici aminoacidi)
42
Sperm lysin
Red: Nonsynonymous/Synonymous >> 1
Green: Nonsynonymous/Synonymous ~ 1
Gray: Nonsynonymous/Synonymous << 1
43
One of the highest KA/KS ratios (= 5.15) for a full-length protein was found in the 18-kilodalton protein in the acrosomal vesicle at the anterior of the sperm cell of several abalone species.
It is thought that sex-related
genes are subject to positive
selection for short periods of
time during speciation as a
means of erecting reproductive
barriers that restrict gene flow
between the speciating
populations.