Sommario - DistaGenomics 2014.pdf · S: frequenza con cui si trovano nucleotidi segreganti (cioè...

Post on 18-Feb-2019

219 views 0 download

transcript

  Diversità genetica a livello di sequenza   Trovare gli SNP   Genotipizzare gli SNP   Principali applicazioni

Sommario

SNP: definizioni   Polimorfismo al singolo nucleotide, in genere si intende la sostituzione di

una base – alcuni autori includono anche i polimorfismi di inserzione/delezione di una base.

  Più frequente tipo di variazione genetica   Per lo più bi-allelici, a causa della loro dipendenza dal tasso di mutazione

spontanea nella specie (nel range di 1 x 10-6 per generazione).   Parametri che quantificano la frequenza e l’informatività degli SNP:

  S: frequenza con cui si trovano nucleotidi segreganti (cioè polimorfici) lungo il genoma. (1 /100-500 bp nella specie umana, molto variabile nelle altre specie e nelle colture agrarie)

  MAF (minor allele frequency = frequenza dell’allele minore): l’informatività di uno SNP è funzione di quanto siano bilanciate le frequenze dei due alleli nella popolazione, idealmente, con p

  (frequenza di un allele) + q (frequenza dell’altro allele) = 1, p = q = 0.5.

SNP

Da: Wikipedia

Frequenza degli SNP nelle piante Specie Frequenza (S) References

Orzo 1 / 108-200 Rolstocks et al., 2005; Kota et al., 2008 Mais 1 / 43-61 Ching et al., 2002; Jones et al., 2009 Riso (indica) 1 / 270 Han and Xue, 2003 Riso (japonica) 1 / 5,700 Yamamoto et al., 2010 Frumento 1 / 335-540 Somers et al. 2003; Ravel et al. 2006 Melo 1 / 52 Micheletti et al. submitted

Arabidopsis 1 / 336 Schmid et al 2003 Uomo 1 / 100-500 Sachidanandam et al 2001

Mappaggio per associazione

Basi del mappaggio per associazione   Ricerca di una correlazione statistica tra

marcatori e fenotipo utilizzando una collezione di individui non strettamente collegati da pedigree (es. collezioni di germoplasma)

  Utilizzo il residuo linkage disequilibrium (LD) tra marcatore e gene che controlla il fenotipo

  L’effettivo livello di LD deve essere verificato empiricamente

Linkage disequilibrium (disequilibrio di associazione) Due alleli a loci diversi in una popolazione sono in linkage disequilibrium (LD) quando sono presenti in un inividuo piu’ frequentamente di quanto atteso su base casuale

Associazione non bilanciata e non independente tra varianti alleliche a due loci nell’ambito di una popolazione.

Meiosis 3

2 1 3 4

1 2 1 2 3 4 3 4

Meiosis 1

Meiosis 2

LD

1 2 3 4

Parentale A Aplotipo A

Parentale B Aplotipo B

alto

basso

Aplotipo: la combinazione di alleli a loci limitrofi (associati) presenti su un singolo cromosoma

Nuovi aplotipi

Approcci di mappaggio per associazione

Figura 20.61 Basi teoriche del mappaggio genetico per associazione: (A) l’approccio basato sulla scansione di un genoma consiste nel genotipizzare ad un certo numero di loci gli individui di una popolazione al fine di correlare i polimorfismi o gli aplotipi di specifici geni con i fenotipi; (B) Organizzazione dei blocchi aplotipici nei cromosomi in relazione alla ubicazione dei geni e delle regioni ad elevata ricombinazione (hot spots) (modificata da: Rafalski e Morgante, 2003).

-  Il disequilibrio da associazione (LD) tra marcatori, geni e caratteri

viene utilizzato per mappare i fattori genetici che controllano:

- Caratteri mendeliani

- Caratteri quantitativi

Linkage disequilibrium e risoluzione genetica

• Richiede meno marcatori

• Scarsa risoluzione di mappa

• Ideale per una ricerca sull’intero genoma

• Richiede molti marcatori

• Elevata risoluzione di mappa

• Ideale per l’approccio del “gene candiato”

LD elevato

Mod. from Rafalski A., 2002, Curr Opin Plant

LD basso

LD nelle piante   LD varia molto tra specie, entro specie ed

a seconda della regione cromosomica

• Mais: da 2 kb (collezione di vecchie razze locali) fino a 600

LD (r2) decay over bp in six maize genes

(Wilson et al. 2004 Plant Cell) kb (collezioni di linee elite moderne)

• Arabidopsis: da 100 kb fino ad alcuni cM

• Riso: fino a100 kb nel riso coltivato

• Orzo: >200 kb nel materiale elite

Livelli di LD in specie diverse

Tabella 20.17 Linkage disequilibrium (LD) in alcuni organismi in relazione a distanza genetica (cM) o fisica (kb). Barcaccia e Falcinelli, vol III, pag 1016.

Buckler and Thornsberry, 2002, Current Opinion in Plant Biology

QTL mapping and cloning strategies

genome-wide (high LD panel)

Linkage mapping (biparental)

Association mapping (set of accessions)

candidate gene (low LD panel)

QTL coarse mapping

Near isogenic lines (NILs)

Candidate gene validation

Positional cloning

Resolution

10-20 cM

1-100 kb

Linkage disequillibrium across the maize 10 chromosomes measured with 914 SNPs on 632 inbred lines. Only SNPs with a minor allele frequency greater than 0.05 are shown (Yan et al 2009 PLoS ONE 4(12): e8451).

Gli SNP sono ampiamente utilizzati nello studio del linkage disequilibrium a livello genomico

Genotipizzazione ad alta densità del genoma per analisi di associazione (Genome-Wide Association Mapping)

Belò et al, MGG 2008

•  8,590 SNPs

•  553 linee pure di mais

•  Fenotipo: contenuto di acido oleico nell’embrione

Massima associazione tra SNP e fenotipo in corrispondenza del gene candidato Fad2 (Fatty acid desature)