Diversità genetica a livello di sequenza Trovare gli SNP Genotipizzare gli SNP Principali applicazioni
Sommario
SNP: definizioni Polimorfismo al singolo nucleotide, in genere si intende la sostituzione di
una base – alcuni autori includono anche i polimorfismi di inserzione/delezione di una base.
Più frequente tipo di variazione genetica Per lo più bi-allelici, a causa della loro dipendenza dal tasso di mutazione
spontanea nella specie (nel range di 1 x 10-6 per generazione). Parametri che quantificano la frequenza e l’informatività degli SNP:
S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile nelle altre specie e nelle colture agrarie)
MAF (minor allele frequency = frequenza dell’allele minore): l’informatività di uno SNP è funzione di quanto siano bilanciate le frequenze dei due alleli nella popolazione, idealmente, con p
(frequenza di un allele) + q (frequenza dell’altro allele) = 1, p = q = 0.5.
SNP
Da: Wikipedia
Frequenza degli SNP nelle piante Specie Frequenza (S) References
Orzo 1 / 108-200 Rolstocks et al., 2005; Kota et al., 2008 Mais 1 / 43-61 Ching et al., 2002; Jones et al., 2009 Riso (indica) 1 / 270 Han and Xue, 2003 Riso (japonica) 1 / 5,700 Yamamoto et al., 2010 Frumento 1 / 335-540 Somers et al. 2003; Ravel et al. 2006 Melo 1 / 52 Micheletti et al. submitted
Arabidopsis 1 / 336 Schmid et al 2003 Uomo 1 / 100-500 Sachidanandam et al 2001
Mappaggio per associazione
Basi del mappaggio per associazione Ricerca di una correlazione statistica tra
marcatori e fenotipo utilizzando una collezione di individui non strettamente collegati da pedigree (es. collezioni di germoplasma)
Utilizzo il residuo linkage disequilibrium (LD) tra marcatore e gene che controlla il fenotipo
L’effettivo livello di LD deve essere verificato empiricamente
Linkage disequilibrium (disequilibrio di associazione) Due alleli a loci diversi in una popolazione sono in linkage disequilibrium (LD) quando sono presenti in un inividuo piu’ frequentamente di quanto atteso su base casuale
Associazione non bilanciata e non independente tra varianti alleliche a due loci nell’ambito di una popolazione.
Meiosis 3
2 1 3 4
1 2 1 2 3 4 3 4
Meiosis 1
Meiosis 2
LD
1 2 3 4
Parentale A Aplotipo A
Parentale B Aplotipo B
alto
basso
Aplotipo: la combinazione di alleli a loci limitrofi (associati) presenti su un singolo cromosoma
Nuovi aplotipi
Approcci di mappaggio per associazione
Figura 20.61 Basi teoriche del mappaggio genetico per associazione: (A) l’approccio basato sulla scansione di un genoma consiste nel genotipizzare ad un certo numero di loci gli individui di una popolazione al fine di correlare i polimorfismi o gli aplotipi di specifici geni con i fenotipi; (B) Organizzazione dei blocchi aplotipici nei cromosomi in relazione alla ubicazione dei geni e delle regioni ad elevata ricombinazione (hot spots) (modificata da: Rafalski e Morgante, 2003).
- Il disequilibrio da associazione (LD) tra marcatori, geni e caratteri
viene utilizzato per mappare i fattori genetici che controllano:
- Caratteri mendeliani
- Caratteri quantitativi
Linkage disequilibrium e risoluzione genetica
• Richiede meno marcatori
• Scarsa risoluzione di mappa
• Ideale per una ricerca sull’intero genoma
• Richiede molti marcatori
• Elevata risoluzione di mappa
• Ideale per l’approccio del “gene candiato”
LD elevato
Mod. from Rafalski A., 2002, Curr Opin Plant
LD basso
LD nelle piante LD varia molto tra specie, entro specie ed
a seconda della regione cromosomica
• Mais: da 2 kb (collezione di vecchie razze locali) fino a 600
LD (r2) decay over bp in six maize genes
(Wilson et al. 2004 Plant Cell) kb (collezioni di linee elite moderne)
• Arabidopsis: da 100 kb fino ad alcuni cM
• Riso: fino a100 kb nel riso coltivato
• Orzo: >200 kb nel materiale elite
Livelli di LD in specie diverse
Tabella 20.17 Linkage disequilibrium (LD) in alcuni organismi in relazione a distanza genetica (cM) o fisica (kb). Barcaccia e Falcinelli, vol III, pag 1016.
Buckler and Thornsberry, 2002, Current Opinion in Plant Biology
QTL mapping and cloning strategies
genome-wide (high LD panel)
Linkage mapping (biparental)
Association mapping (set of accessions)
candidate gene (low LD panel)
QTL coarse mapping
Near isogenic lines (NILs)
Candidate gene validation
Positional cloning
Resolution
10-20 cM
1-100 kb
Linkage disequillibrium across the maize 10 chromosomes measured with 914 SNPs on 632 inbred lines. Only SNPs with a minor allele frequency greater than 0.05 are shown (Yan et al 2009 PLoS ONE 4(12): e8451).
Gli SNP sono ampiamente utilizzati nello studio del linkage disequilibrium a livello genomico
Genotipizzazione ad alta densità del genoma per analisi di associazione (Genome-Wide Association Mapping)
Belò et al, MGG 2008
• 8,590 SNPs
• 553 linee pure di mais
• Fenotipo: contenuto di acido oleico nell’embrione
Massima associazione tra SNP e fenotipo in corrispondenza del gene candidato Fad2 (Fatty acid desature)