Una rappresentazione dell’evoluzione
Un’altra rappresentazione dell’evoluzione
Un’altra rappresentazione dell’evoluzione
Orangutan Gorilla Chimpanzee Human
La rappresentazione ad albero delle somiglianze
Classificazione della diversità
Ernst Haeckel “Tree of life”
Charles Darwin – Origin of Species (1859)Illustration of ‘descent with modification’
Theory of Evolution: Life is monophyletic
• All organisms on Earth had a common ancestor.
• Any two organisms share a common ancestor in their past.
Ancestor
Descendant 1 Descendant 2
Theory of Evolution:• Speciation events lead to creation of different species (two species ).
• Speciation caused by physical separation into groups where different genetic variants become dominant.
Ancestor
Descendant 1 Descendant 2
Ancestor
Ancestor
Ancestor
extinct
extant 1 extant 2
The genetic distance between any two extantorganisms is computable.
The differences The differences between 1 and 2 between 1 and 2 are the result of are the result of changes on the changes on the lineage leading to lineage leading to descendant 1 + descendant 1 + those on the those on the lineage leading to lineage leading to descendant 2.descendant 2.
descendant 1 descendant 2
ancestor
Thus, any set of species are related: the relation is Phylogeny
The relationships can be represented by Phylogenetic Tree (or dendrogram)
5 MYA
120 MYA
1,500 MYAMYA = Million Years Ago
Phylogeny is
The study of relationships between biological entities.
The inference of evolutionary relationships
The inference of putative common ancestors
Trees
Relazioni filogenetiche• Due linee evolutive si assomigliano di più tra di loro
rispetto ad una terza linea evolutiva se condividonoPRIMA (in tempi più recenti) un antenato comune
• Le ipotesi filogenetiche sono ipotesi che riguardano gliantenati comuni
Frog
Toad
Oak
(Frog,Toad)OakHypothetical ancestral lineage
Un albero molto vecchio !
Alberi filogenetici
Example 1: Example 1: Which species are closest to Which species are closest to
Human?Human?Human
Chimpanzee
Gorilla
Orangutan
Gorilla
Chimpanzee
Orangutan
Human
Molecular analysis:Chimpanzee is related more closely
to human than the gorilla
Pre-Molecular analysis:The great apes
(chimpanzee, Gorilla & orangutan)Separate from the human
Species phylogeny
Orangutan Gorilla Chimpanzee Human
Alberi filogenetici
Alberi filogenetici
Gli alberi di popolazioni
Un albero di singoli individui
Gli alberi di popolazioni e gli alberi delle lingue
Il suo albero filogenetico
La famiglia delle globine
Ricostruzione filogenetica
Classificazione tradizionale
Classificazione filogenetica
Il panda gigante non fa parte della famiglia dei procioni ma di quella degli orsi!
L’albero filogenetico
A B C D E F G H I J
ROOT
polytomy
terminal branches
interior branches
node 1 node 2
LEAVES
- text based representation of relationships.
NewickNewick formatformat
A
B
C
D
E
((A,B),(C,(D,E)));
Levels of Resolution on a Phylogenetic Tree
Alberi con e senza radice
ROOTA
B
C
D E
F
GH
I
J
A B C D E F GH I J
ROOT
A B C D E F G H I J
ROOT
TIME
ROOTING: TROVARE LA RADICE DI UN ALBERO
• Outgroup: utilizzo un gruppo “esterno” alla filogenesi che sto analizzando
- Assumo che l’outgroup si sia separato prima di tutti gli altri - La divergenza dell’outgroup non deve essere né troppo piccola né troppo grande
•Mid-point: a metà del ramo più lungo che unisce due OTU- Assumo tassi approssimativamente costanti
Rooted vs. Rooted vs. unrootedunrooted treestrees
1
2
3
3 1
2
Alberi senza radice (unrooted) e con radice (rooted)
Number of bifurcating rooted trees(NR) for n OTUs
)!2(2
)!32(2 −
−=
− n
nN
nR2≥n
Number of bifurcating unrooted trees(NU) for n OTUs
)!3(2
)!52(3 −
−=
− n
nN
nU3≥n
NR=(2n-3)NU
How do we know which of the
8,200,794,532,637,891,559,375 trees is true?
We don’t, we infer by using decision criteria.
Questioni di estetica...
Same thingSame thing
s4 s5s1 s3s2s4 s5s1 s3s2
=
Monophyletic taxon: A group composed of a collection of organisms, including the most recent common ancestor of all those organisms and all the descendants of that most recent common ancestor. A monophyletic taxon is also called a clade.
Examples :Mammalia, Aves (birds), angiosperms, insects, etc.
Paraphyletic taxon: A group composed of a collection of organisms, including the most recent common ancestor of all those organisms. Unlike a monophyletic group, a paraphyletic taxon does not include allthe descendants of the most recent common ancestor.
Examples : Fish (include agnatae), invertebrates (exclude vertebrates), etc.
I rettili sono parafiletici
Ricostruzione filogenetica
Classificazione tradizionale
Classificazione filogenetica
Polyphyletic taxon: A group composed of a collection of organisms in which the most recent common ancestor of all the included organisms isnot included, usually because the common ancestor lacksthe characteristics of the group (and this characteristicsevolved independentlyin the different lineages). Polyphyletic taxa are considered "unnatural", and usually are reclassified once they are discovered to be polyphyletic.
Examples :marine mammals, bipedal mammals, flying vertebrates, warmblooded animals, etc.
L’omologia
• Un carattere che si è evoluto una volta e non ha subito reversioni ha un valore filogenetico.
• La somiglianza è detta omologia
Lizard
Frog
Human
Dog
HAIR
absentpresentchange
or step
“The natural system is based upon descent withmodification .. the characters that naturalistsconsider as showing true affinity (i.e. homologies) are those which have been inherited from a common parent, and, in so far as all trueclassification is genealogical; that community of descent is the common bond that naturalists havebeen seeking”
(Charles Darwin, Origin of species 1859 p. 413)
Darwin and homology
L’omologia nella struttura dell’arto anteriore dei vertebrati
Before Darwin, homology was defined morphologically.
Similarity between properties in various species.
Example:• Bats and butterflies fly, but the structures are different.• Bats fly and whales swim, yet the bones in a bat's wing
and a whale's flipper are strikingly alike.
Conclusions: 1. Bats and butterflies wings are not homologous.2. Bat wings and whales flippers are homologous.
What is Homology ?What is Homology ?
• L’omoplasia (analogia) è una somiglianzaNON dovuta alla condivisione di un antenato comune
• E’ il risultato di evoluzione indipendente(convergenza, parallelismo, reversione)
• Omoplasia può produrre false filogenesi
Omoplasia (analogia): evoluzione indipendente
Omoplasia (evoluzioneindipendente)
HumanLizard
Frog Dog
TAIL
absentpresent
Ci sono due eventi indipendenti nella storia diqueste specie e di questo carattere
Omoplasia: ricostruzione filogeneticaERRATA
• Se interpretata come una omologia, le analogieportano a ricostruzioni errate: uomini e raneinsieme, e lucertole e cani
Human
Frog
Lizard
Dog
TAIL
absentpresent
L’analogia nell’ala degli uccelli e dei pipistrelli
Fig. 1. Evidence for a 1, 2, 3 identity of wing digits (A–L). Phylogenetic homology of the digits of the wing to digits 1, 2, and 3.Successive taxa share a more recent common ancestor with modern birds. (A) Alligator, (B) the ornithischian dinosaurHeterodontosaurs, (C) the early theropod Herrerasaurus, (D) the neotheropod Coelophysis, (E) the tetanuran Allosaurus, (F) theearly maniraptoran Ornitholestes, (G) the early bird Archaeopteryx, (H) the enanthiornithine bird Sinornis, (I) hatchling of theliving bird Opisthocomus, (J) 12.5 day embryo of the duck Anas, (K) the adult chicken Gallus, (L) adult Opisthocomus. (M–O)Expression of Hoxd12 (left) and Hoxd13 (right) in developing wild-type limbs. (M) Mouse hand at 12.5 dpc, (N) chicken foot atday 8 (stage 34), (O) chicken wing at day 8 (stage 34). Expression of Hoxd13 in the absence of Hoxd12 expression in the wing isconsistent with a digit 1 identity of the anterior digit as expected for a theropod dinosaur with digits 1, 2, and 3.
La convergenza evolutiva nella morfologia(funzioni simili con strutture diverse)(per proteine, simile funzione con sequenze molto diverse)(in genere tra taxa molto distanti)
La convergenza evolutiva nella morfologia
Evoluzione parallela(una forma di evoluzione indipendente simile alla convergenza ma: funzione
simile con struttura simile; per proteine: simile funzione con simile sequenza)(in genere tra taxa filogeneticamente
vicini)
Omoplasia per reversione(per esempio, l’assenza di ali negli insetti può essere una condizione
primitiva (Tisanuri, chiamati anche pesciolino d’argento)o derivata (pulci)
Omoplasia: evoluzioneconvergente
Vera filogenesi Errata ricostruzione
23 4 5 6 9 107 8 11 2 3 4 5 6 7 8 9 10
Omoplasia: reversione(per esempio, l’assenza di ali negli insetti può essere una
condizione primitiva (
Vera filogenesi Errata ricostruzione
101 2 3 4 5 67 8 91 2 3 4 5 6 7 8 9 10
L’omoplasia è uno tra i problemi principali nelle
ricostruzioni filogenetiche
• E’ necessario distinguere le omologie dalleanalogie
Distinguishing homology and homoplasy
• Morphologists use a variety of techniques to distinguish homoplasy and homology
• Homologous features are expected to display detailed similarity (in position, structure, development) whereas homoplastic similarities are more likely to be superficial
• As recognised by Charles Darwin congruence with other characters provides the most compelling evidence for homology
Analogia
Omologia
Omoplasia e inconguenze• Assumendo che esiste una sola filogenesi corretta:
• ricostruzioni filogenetiche sulla base di caratteridiversi possono produrre alberi diversi
• l’omoplasia produce incongruenze tra caratteri
Incongruenze
• I due alberi sono diversi, ma esiste solo un albero “vero” ==> i due caratteri sono incongruenti, almeno uno deveessere omoplasico
Lizard
Frog
Human
Dog
HAIR
absentpresent
Human
Frog
Lizard
Dog
TAIL
absentpresent
The importance of congruence
• “The importance, for classification, of trifling characters, mainly depends on their being correlated with several other characters of more or less importance. The value indeed of an aggregate of characters is very evident ........ a classification founded on any single character, however important that may be, has always failed.”
• Charles Darwin, Origin of Species
Congruence
• We prefer the ‘true’ tree because it is supported by multiple congruent characters
Lizard
Frog
Human
Dog
MAMMALIAHairSingle bone in lower jawLactation
Le filogenesi basate sul DNA
Nucleotide character data
Characters: position in the nucleotide sequence.(i.e. position 352)
Character states: nucleotide at the positionin the nucleotide sequence.(G, A, T, or C)
Homoplasy in molecular data
• Homoplasy can be common in molecular sequence data
– Character states are chemically identical
– There are a limited number of alternative character states ( e.g. Only A, G, C and T in DNA)
– Rates of evolution are sometimes high
• Homology and homoplasy cannot be distinguished by detailed study of similarity and differences
Omoplasia a livello molecolare
ACTGAACGTAACGC
AATGAAAGAATCGCT
ACTGGAGGAATCGC
CT
C
Single substitution
Sequential substitution
Coincidental substitution
Parallel substitution
Convergent substitution
Back substitution
homology - descent from a common ancestor
orthology - descent from a speciation event
paralogy - descent from a duplication event
xenology - descent from a horizontal transfer event
Subsets of homology
• any characters are homologous if they have descended from a common ancestor
Implications of horizontal transferFacts:Horizontal transfer is far more common than previously imaginedMany genomes are in fact chimeras with genes from diff sources
Open questions:Can relationships between species accurately be
represented as strictly bifurcating trees?Or is the pattern of evolution more reticulate
(i.e. more like a network)?Is there some core of genes that retains the signal of
speciation events (i.e. is resistant to horizontal transfer)?
ReticulateEvolution
(due to HT) W Martin (1999) Bioessays 21: 99
Paralogous genes�derived from a duplication event
Orthologous genes�derived from a speciation event
Homologous genes
OrthologsOrthologs & & ParalogsParalogs
α
βα
βαβα
Duplication
Speciation
Species a Species b
Paralogs
Orthologs
Orthologs
Reconstruction of species phylogeny: artefacts due to paralogy
!! Gene loss can occur during evolution : even with complete gen!! Gene loss can occur during evolution : even with complete genome sequences it may be ome sequences it may be difficult to detect difficult to detect paralogyparalogy !!!!
Rat Mouse Rat Mouse
GNS1 GNS1
GNS1 GNS2
GNS2 GNS2GNS1 GNS2
Hamster Hamster
speciation duplication
Mouse Rat
GNS GNSGNS
Hamster
true tree tree obtained with a partial sampling of homologous genes
• Se sono fortunato, dall’analisi di tanti siti riesco a ricostruire la corretta topologia. Ma comunque tendo a sottostimare i tempi di divergenza!
• Models of evolution attempt to infer the missinginformation through correcting for “multiple hits”
• In severe cases the data becomes essentially random and all information about relationships can be lost
Omologia a livello molecolare: dai siti incongruenti alla saturazione
Non sottostimo le divergenze solamente nel caso (a) !!
Il numero di differenze non aumenta linearmente con il tempo di divergenza
QUINDI
0
100
200
300
0 100 200 300 400 500 600 700 800
4001 changeper site
Estimated changes from the ML tree
Obs
erve
dch
ange
sSaturation curve for EF-1 alpha among eukaryotes
2 changesper site
3 changesper site
Devo convertire il numero di differenze nel numero di sostituzioni, che sono proporzionali
linearmente con il tempo (se il tasso di evoluzione molecolare è approssimativamente
costante…)
Svariati metodi per effettuare questa correzione basati su svariati modelli di evoluzione
molecolare che tengono conto delle diverse frequenze delle basi, dei diversi tassi di
transversione/transizione, dei diversi tassi di mutazione a siti diversi, etc.
Se sequenzio 500bp, e A e B differiscono di 50bp, D=0.1, quindi ut = numero di sostituzioni effettive per sito = 0.1073, ossia mi aspetto che siano avvenute 0.1073*500 = 53.66 sostituzioni in quella sequenza
Oppure scelgo i marcatori!
Marcatori diversi per alberi più o meno “profondi”
Quando si analizzano genotipi invece di fenotipi
• Descrizione dei caratteri non ambigua
• Somiglianza dovuta a effetti ambientali non genetici non interferisce
• Evoluzione convergente implica spesso fenotipi simili ma genotipi differenti
• Posso analizzare tanti caratteri ==> tanta variabilità e maggiore possibilità che i siti congruenti prevalgano su quelli incongruenti
• Maggiore facilità di stimare tempi di divergenza (cioè la lunghezza dei rami)
• Modelli statistici rigorosi
• Posso analizzare DNA non codificante
• Tutti gli individui hanno DNA!
La ricostruzione filogenetica basata su genotipi ha però ulteriori problemi (presenti ma non espliciti quando si analizzano dati fenotipici per la crudezza di questi dati)
1. La divergenza (o la coalescenza) è un processo casuale:- alberi di sequenze e di specie possono essere diversi- la lunghezza dei rami è una variabile casuale
2. La mutazione è un processo casuale molto complesso- il numero di mutazioni è una variabile casuale- multiple hits- siti diversi mutano a velocità (tassi) diversi- diverse mutazioni hanno diverse probabilità di avvenire
Popolazione
Genealogia del gene
Species tree / Gene tree
Species tree / Gene tree