19
1 Evolução molecular: Reconstruções Filogenéticas Prof. Fabrício R Santos Sistemática e Taxonomia Sistemática é o estudo dos relacionamentos entre grupos de organismos e a classificação hierárquica em diferentes táxons é um antigo ramo da biologia clássica. A Taxonomia é parte da Sistemática e se refere à nomenclatura e identificação de espécies. Seus princípios foram inicialmente estabelecidos por Carolus Linnaeus (1707-1778). Taxonomia e Classificação Hierárquica O sistema taxonômico desenvolvido inicialmente por Linnaeus tem duas características principais: i) a designação de um nome duplo (binômio) a cada espécie, e ii) um sistema de agrupamento destas espécies. Um binômio (nome latino de 2 partes) é designado unicamente para cada espécie, no qual o primeiro é o nome genérico, e os dois nomes são ditos específicos. Trichechus inunguis Homo sapiens Arabidopsis thaliana Escherichia coli Chromobacterium violaceum O sistema de classificação das espécies segue uma hierarquia de categorias crescentes que formalizam o agrupamento de organismos, o qual deve ser feito a partir do reconhecimento da história de ancestralidade comum das espécies. A nomenclatura binomial da espécie é a primeira etapa no agrupamento: espécies derivadas do mesmo ancestral comum imediato são geralmente agrupadas no mesmo gênero. As demais categorias são mais amplas, isto é, agrupam táxons de acordo com ancestrais comuns mais e mais antigos: Gêneros são agrupados em uma Família, pois compartilham um ancestral comum recente. Famílias são agrupadas em Ordens, que se agrupam em Classes, que são agrupadas em Filos, que se agrupam em Reinos e um dos 3 Domínios. A Sistemática Filogenética conecta a diversidade biológica à história evolutiva Filogenia = A história evolutiva de uma espécie ou grupo de espécies relacionadas. Filogenia é geralmente representada como árvores filogenéticas que traçam relacionamentos evolutivos inferidos, revelando a história de ancestralidade comum entre espécies. Sistemática = O estudo e classificação da diversidade biológica em um contexto evolutivo. A diversidade biológica reflete episódios passados de especiação e macroevolução. Taxonomia = Identificação , nomeação e classificação de espécies; é um componente da sistemática.

Evolução molecular: Reconstruções Filogenéticaslabs.icb.ufmg.br/lbem/aulas/grad/evol/reconstfilog2009.pdf · Evolução molecular: Reconstruções Filogenéticas Prof. Fabrício

  • Upload
    ngominh

  • View
    220

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Evolução molecular: Reconstruções Filogenéticaslabs.icb.ufmg.br/lbem/aulas/grad/evol/reconstfilog2009.pdf · Evolução molecular: Reconstruções Filogenéticas Prof. Fabrício

1

Evolução molecular:

Reconstruções Filogenéticas

Prof. Fabrício R Santos

Sistemática e Taxonomia

• Sistemática é o estudo dos relacionamentos entre grupos de organismos e a classificação hierárquica em diferentes táxons – é um antigo ramo da biologia clássica.

A Taxonomia é parte da Sistemática e se refere à nomenclatura e identificação de espécies. Seus princípios foram inicialmente estabelecidos por Carolus Linnaeus(1707-1778).

Taxonomia e Classificação Hierárquica

O sistema taxonômico desenvolvido inicialmente por Linnaeus tem duas características principais: i) a designação de um nome duplo (binômio) a cada espécie, e ii) um sistema de agrupamento destas espécies.

Um binômio (nome latino de 2 partes) é designado unicamente para cada espécie, no qual o primeiro é o nome genérico, e os dois nomes são ditos específicos.

Trichechus inunguisHomo sapiensArabidopsis thalianaEscherichia coliChromobacterium violaceum

O sistema de classificação das espécies segue uma hierarquia de categorias crescentes que formalizam o agrupamento de organismos, o qual deve ser feito a partir do reconhecimento da história de ancestralidade comum das espécies.

A nomenclatura binomial da espécie é a primeira

etapa no agrupamento: espécies derivadas do

mesmo ancestral comum imediato são geralmente

agrupadas no mesmo gênero.

As demais categorias são mais amplas, isto é,

agrupam táxons de acordo com ancestrais comuns

mais e mais antigos:

• Gêneros são agrupados em uma Família, pois

compartilham um ancestral comum recente.

• Famílias são agrupadas em Ordens, que se

agrupam em Classes, que são agrupadas em Filos,

que se agrupam em Reinos e um dos 3 Domínios.

A Sistemática Filogenética conecta a

diversidade biológica à história evolutiva

Filogenia = A história evolutiva de uma espécie ou grupo de espécies

relacionadas.

Filogenia é geralmente representada como árvores filogenéticas

que traçam relacionamentos evolutivos inferidos, revelando a

história de ancestralidade comum entre espécies.

Sistemática = O estudo e classificação da diversidade biológica em um

contexto evolutivo.

A diversidade biológica reflete episódios passados de especiação

e macroevolução.

Taxonomia = Identificação , nomeação e classificação de espécies; é um

componente da sistemática.

Page 2: Evolução molecular: Reconstruções Filogenéticaslabs.icb.ufmg.br/lbem/aulas/grad/evol/reconstfilog2009.pdf · Evolução molecular: Reconstruções Filogenéticas Prof. Fabrício

2

Organismos podem ser representados em um diagrama (árvore) que ilustra seus relacionamentos evolutivos. Usando dados morfológicos e moleculares, podemos estimar os ancestrais comuns inferidos pelos pontos de divergência nas árvores filogenéticas.

Que são árvores?

Charles Darwin (1837) Anotações sobre padrões de especiação nos Tentilhões de Galápagos

OTU 1

OTU 2

OTU 3

OTU 4

OTU 5

OTU 6

Árvore Filogenética

15 4 3 2678No de diferenças

n1

n2

n3

n4

n5

n

OTU unidade taxonômica operacional - populações, espécies ou grupos

nó interno - ~ ancestral comum do passado

tempoantiga recente

raiz

Topologias equivalentes

Por quê árvores?

Por quê representamos evolução como árvore e não outro tipo de gráfico?

CA DBA B C D

Ciclo, reticulação

A

BC

D

• Evolução é divergência – espécies se modificam

com o tempo - Transformacionismo

Darwin: “Descendência com modificação”

• Por várias razões, reticulação torna-se um

fenômeno raro com o tempo – provavelmente no

Pré-Cambriano as reticulações devido a

transferências gênicas horizontais, fusões de

células, etc, eram muito comuns.

• Reticulações são difíceis de se representar.

Page 3: Evolução molecular: Reconstruções Filogenéticaslabs.icb.ufmg.br/lbem/aulas/grad/evol/reconstfilog2009.pdf · Evolução molecular: Reconstruções Filogenéticas Prof. Fabrício

3

Sang et al., 1997

Árvores reticuladas

Ex: espécies híbridasde Paeonia sp.

Grou

japonensis

americana

grus

nigrocollis

monachus

canadensis

bugeranus

virgo

paradisea

leucogeranus

antigone

rubicanda

vipio

Filogenia do grou

japonensis

americana

grus

nigrocollis

monachus

canadensis

bugeranus

virgo

paradisea

leucogeranus

antigone

rubicanda

vipio

Cladograma Árvore UPGMA

Citocromo b (Mooers et al., 1999)

Grus sp

leucogeranus antigone

rubicanda

vipio

japonensis

americana

grus

nigricollis

monachus

canadensis

Bugeranus

virgo

paradisea

japonensis

americana

grus

nigrocollis

monachus

canadensis

bugeranus

virgo

paradisea

leucogeranus

antigone

rubicanda

vipio

Filogenia do grou

Árvore UPGMA

Citocromo b (Mooers et al., 1999)

Árvore sem raiz

Árvore filogenética para os tentilhõesde Galápagos.

Estas 13 espécieshabitam as Ilhas Galápagos. Esta árvore é baseadaem estudos comparativos deestruturas do corpo, especialmente forma e tamanho dos bicos, e nos estudos de campo sobre isolamento reprodutivo e comportamento alimentar.

Conexão entre classificação e filogeniaA natureza da ramificação de uma árvore evolutiva reflete o arranjo hierárquico de táxons (taxa). Esta árvore sugere as afinidades genealógicas entre táxons subordinados à ordem Carnivora, ou seja, o padrão de especiação para este grupo.

Page 4: Evolução molecular: Reconstruções Filogenéticaslabs.icb.ufmg.br/lbem/aulas/grad/evol/reconstfilog2009.pdf · Evolução molecular: Reconstruções Filogenéticas Prof. Fabrício

4

Árvores filogenéticas baseadas em sistemáticaDois métodos, comparação de proteínas do sangue e hibridização DNA-DNA, foram usados para construir esta árvore de espécies de ursos e procionídeos.

Antiga controvérsia sobre afinidades entre focas, leões marinhos e morsas

A relação filogenética entre Phoecidae, Odobaenidae e

Otaridae já foi extremamente discutida. Hoje é considerada

um grupo monofilético, a família Pinnipedia, mas focas já foram consideradas grupo

irmão de Lontras (Mustelidae)

Qual relação entre procariotos e eucariotos?

Qual a origem das mitocôndrias e dos cloroplastos?

Árvores filogenéticas podem nos dar informações sobre o

passado remoto

Classificação: Reinos e Domínios

Atualmente a sistemática filogenética reconhece 3 domínios

Origem dos 3 domínios da vida no Pré-Cambriano

Page 5: Evolução molecular: Reconstruções Filogenéticaslabs.icb.ufmg.br/lbem/aulas/grad/evol/reconstfilog2009.pdf · Evolução molecular: Reconstruções Filogenéticas Prof. Fabrício

5

Riq

uét

sias

Mit

ocô

nd

rias

outras bactérias

ArchaeaEucariotos

Nature, 1998

Grupos irmãos de ciclídeos doLago Tanganika na África oriental

Árvores nos informam sobre processos recentes de diversificação de populações e espécies

Árvore MP C0I (E. Michel, 1999)

Árvores filogenéticas e epidemiologia

Dentista com HIV deu origem a um surtoregional nos EUA

Freeman e Herron, 1998

pacie

nte

B-x

pacie

nte

B-y

pacie

nte

A-x

pacie

nte

E-y

pacie

nte

E-x

pacie

nte

C-x

pacie

nte

C-y

Dentista

-y

pacie

nte

A-y

pacie

nte

G-x

pacie

nte

G-y

Den

tista

X

LC02-x

LC03-x

LC02-y

LC09

LC35

pacie

nte

D-x

pacie

nte

D-y

LC03-y

pacie

nte

F-x

pacie

nte

F-y

HIV

LI

Filogenias de agentes infecciosos permitem traçar surtos e pandemias, assim como auxiliam nas estratégias de controle de epidemias como da gripe H1N1 ou para o desenvolvimento de vacinas da gripe comum.

Reconstruções filogenéticas e Conservação da Biodiversidade

• Filogenética pode ser extremamente útil para estudos de biodiversidade (inventariamento e classificação) e estabelecimento de prioridades conservacionistas.

• Medidas de diversidade que utilizam filogenias de sequências de DNA estão agora sendo usadas para implementar planos de conservação de espécies, priorizar unidades de conservação, definir unidades de manejo etc.

• Ex: filogenias (e filogeografia) são usadas para identificar ESUs (unidades evolutivamente significantes), as quais representam populações importantes para manter a dinâmica evolutiva de uma espécie.

10-20 milhões de anos

marinho

africano

amazônico

Filogenias dos peixes-bois (Trichechus sp)

Vianna et al 2006 Mol Ecol

marinho

africano

amazônico

Populações do clado III do peixe-boi marinho (Trichechus manatus) possuem uma distribuição restrita às Guianas e ao Brasil, portanto são unidades evolutivas independentes (ESU) das demais nesta espécie.

Árvore sem raiz (rede MJ) da região controle do DNAmt

Vianna et al 2006 Mol Ecol

Page 6: Evolução molecular: Reconstruções Filogenéticaslabs.icb.ufmg.br/lbem/aulas/grad/evol/reconstfilog2009.pdf · Evolução molecular: Reconstruções Filogenéticas Prof. Fabrício

6

B0665

B0663

B0655

B0653

B0654

B0656

B0369

B0367

B0368

B0609

B0647

B0317

B0329

B0326

B0658

B0644

B0657

B0677

B0678

B0646

B0291

B0292

B0290

B0680

B0643

B0660

B0281

B0285

B1189

B1301

B1188

B1296

B1186

B1303

B0525

B0524

B0515

B0511

B0513

B0528

B0535

B0562

B1148

B1147

B1150

99

99

99

99

90

99

99

99

99

99

99

99

99

99

99

91

99

99

99

82

90

D. ochropyga

D. ferruginea

R. ardesiaca

D. squamata

B0335

P. leucoptera

M. loricata

T. major

D. plumbeus

F. serrana

D. mentalis

H. atricapillus

S. cristatus

T. doliatus

T. caerulescens

T. ambiguus

T. pelzelni

Árvore NJ COI em Thamnophilidae

Vilaça et al. 2006

Termos filogenéticos

• Homologia

• Analogia

• Convergência, Reversão

• Plesiomorfia – estado ancestral – “0” (Simplesiomorfia)

• Apomorfia – estado derivado – “1” (Autapomorfia - Sinapomorfia)

Homologia: um caráter (ancestral ou derivado) compartilhado entre duas ou mais espécies, o qual estava presente no ancestral comum destas.

Analogia: caráter “compartilhado”, geralmente não-presenteno ancestral comum (i.e., o caráter evolui duas vezes, independentemente): evolução convergente (ou paralela) e reversão ao estado ancestral. A estecaráter recorrente damos o nome de Homoplasia.

Analogia

1 32 4Espécies:

Estado do caráter:

estado ancestral

Nas spp. 1 e 3 há uma analogia (caráter análogo) ou homoplasia;

Origem independente – evolução paralela ou convergente .

Homologia Ancestral (0)

1 32 4Espécies:

Estado do caráter:

estado ancestral

Nas spp. 1, 3 e 4 há uma homologia ancestral (simplesiomorfia);é ancestral porque está presente na base da árvore, no ancestral comum de todas 4 spp atuais.

Homologia Derivada (1)

1 32 4Espécies:

Estado do caráter:

estado ancestral

Nas spp. 1 e 2 aparece um caráter homólogo derivado(sinapomorfia). Aconteceu uma transição do estado “basal” ou primitivo no ancestral imediato destas duas spp ou OTUs.

Page 7: Evolução molecular: Reconstruções Filogenéticaslabs.icb.ufmg.br/lbem/aulas/grad/evol/reconstfilog2009.pdf · Evolução molecular: Reconstruções Filogenéticas Prof. Fabrício

7

Convergência: origem independente do caráter (i.e., duas linhagens fixam paralelamente um “fenótipo” similar).

Reversão: origem e subseqüente perda, ou mutação “de volta” ao caráter ancestral (i.e., reversão ao estado plesiomórfico).

Origem das Homoplasias Evolução Convergente = Aquisição de características

similares em espécies de diferentes linhas evolutivas,

devido ao compartilhamento de nichos ecológicos

similares, sendo a seleção natural responsável por

moldar adaptações análogas.

Exemplos: asas de pássaros e morcegos

bicos de aves e monotremados

Evolução convergente também se dá no nível molecular: sequências de DNA e proteínas podem sofrer mudanças paralelas, reversões, etc

EvoluçãoConvergente eSeleção Natural

Similaridades aparentes entre marsupiais australianos e mamíferos placentários em outros continentes.Estas espécies ocupam nichos parecidos nos diferentes continentes.

Um grupo monofilético:

é um grupo de táxons que inclui o ancestral comum e todos seus

descendentes

Exemplo de gruponão-monofilético: Répteis

Peixes TartarugasAnfíbios Cobras Crocodilos AvesMamíferos Lagartos

O ancestral comum mais recentedos répteis também deu origem aos mamíferos e aves

Filogenia dos grandes símios sem cauda

Famílias monofiléticas

HominidaePongidaeHyllobatidae

Page 8: Evolução molecular: Reconstruções Filogenéticaslabs.icb.ufmg.br/lbem/aulas/grad/evol/reconstfilog2009.pdf · Evolução molecular: Reconstruções Filogenéticas Prof. Fabrício

8

Filogenia dos grandes símios sem cauda

Famílias parafiléticas

HominidaePongidaeHyllobatidae

Esta classificação equivocada não representa a história evolutiva das espécies

Abordagens filogenéticas

Fenética (Taxonomia numérica)

Cladística (Sistemática Filogenética)

Fenética

• Abordagem Clássica (desde Linnaeus).

• Agrupa espécies baseada na similaridadefenotípica (ou genotípica).

• Usa todas características distinguíveis.

• Ex: métodos baseados em distâncias (UPGMA)

Análise de vários caracteres

(fenótipos, sítios polimórficos de DNA, freq. alélicas, etc.)

Matriz de dissimilaridade

em base ao número de diferenças

Construção

de árvore

filogenética

FenogramaA B C

A

B

C

3

7 6

0

0

0

A B CA B

A

B

C

Relações de similaridade

MÉTODOS FENÉTICOS

Cladística• A Teoria Evolutiva postula que grupos de

organismos relacionados descendem de um ancestral comum.

• Sistemática Filogenética (Cladística) é um método de classificação taxonômica baseado na história evolutiva.

Foi desenvolvido em 1950 por Willi Hennig, um entomologista alemão.

Cladística • Baseia-se no padrão de ancestralidade comum e

modificação das espécies e não em mera similaridade.

• Deve usar apenas caracteres derivados (apomórficos) compartilhados (sinapomórficos ou homólogos derivados).

• Portanto, objetiva traçar a história evolutiva real, o padrão de descendência com modificação.

• Ex: métodos baseados em caracteres (parcimônia).

Page 9: Evolução molecular: Reconstruções Filogenéticaslabs.icb.ufmg.br/lbem/aulas/grad/evol/reconstfilog2009.pdf · Evolução molecular: Reconstruções Filogenéticas Prof. Fabrício

9

Análise de vários caracteres com estados ancestrais (0) e

derivados (1)

Construção

de árvore filogenética

Cladograma

A B C

A

B

C

Relações de ancestralidade comum

MÉTODOS CLADÍSTICOS

D E1

2

3

4

5

6

7

8

E

D

1

2 3

4

5 6

7 8

Caracteres utilizados

SimNãoNãoCladística

SimSimSimFenética

HomologiasDerivadas

HomologiasAncestrais

Analogias

Besouro BorboletaCavalo

“Eventos Reais”

Besouro BorboletaCavalo

Fenética Cladística

Besouro BorboletaCavalo

Jacaré AveLagarto

“Eventos reais”

JacaréAve Lagarto

Fenética Cladística

Jacaré AveLagarto

Page 10: Evolução molecular: Reconstruções Filogenéticaslabs.icb.ufmg.br/lbem/aulas/grad/evol/reconstfilog2009.pdf · Evolução molecular: Reconstruções Filogenéticas Prof. Fabrício

10

Análise Filogenética

• Dado um conjunto de dados (caracteres morfológicos, alinhamento de múltiplassequências de DNA e proteína, etc), pode-se determinar (ou inferir) o relacionamento ancestral dentre asespécies.

Esp.1 Esp.2 Esp.3 Esp.4

Temp

o

Não-resolvidaou filogenia tipo “estrela”

Filogenia parcialmente resolvida

Completamente resolvida,filogenia bifurcada

A A A

B

B B

C

C

C

E

E

E

D

D D

Politomia ou multifurcação uma bifurcação

O objetivo da inferência filogenética é resolver a ordem deramificação das linhagens nas árvores evolutivas:

Há 3 possíveis árvores sem raiz para 4 táxons (A, B, C, D)

A C

B D

árvore 1

A B

C D

árvore 2

A B

D C

árvore 3

Métodos de reconstrução (ou inferência) filogenética objetivam

descobrir qual das árvores é a “mais provável".

Espera-se que esta seja a “verdadeira” árvore biológica — aquela que

seguramente represente a história evolutiva dos táxons analisados –

mas esta é formalmente chamada de árvore inferida a partir dos

dados, cuja confiança pode ser testada por diferentes métodos.

O número de árvores sem raiz aumenta exponencialmente com o número de táxons

# táxons

3456789

10....

30

# árvores sem raiz

13

15105945

10,935135,135

2,027,025....

­3,58 x 1036

CA

B D

A B

C

A D

B E

C

A D

B E

C

F

Inferir relacionamentos evolutivos entre ostáxons requer enraizar a árvore:

Note que nesta árvore

enraizada, o táxon A não

está mais estreitamente

relacionado ao táxon B

em relação a C ou D

como sugerido acima.

A

BC

Raiz D

A B C D

Raiz

árvore enraizada

árvore sem raiz

O enraizamento em outra posição:

A

BC

raiz

D

árvore sem raiz

Note que nesta árvoreenraizada, táxon A é maisestreitamente relacionado aotáxon B, enquanto o C é mais relacionado ao D.

C D

raiz

árvore enraizada

A

B

Page 11: Evolução molecular: Reconstruções Filogenéticaslabs.icb.ufmg.br/lbem/aulas/grad/evol/reconstfilog2009.pdf · Evolução molecular: Reconstruções Filogenéticas Prof. Fabrício

11

Uma árvore sem raiz de 4 táxons pode ser enraizada em cinco lugares distintos para produzir cinco árvores enraizadas diferentes

árvore sem raiz:

A C

B D

árvore c/raiz 4 C

D

A

B

4

árvore c/raiz 3 A

B

C

D

3

árvore c/raiz 5 D

C

A

B

5

árvore c/raiz 2 A

B

C

D

2

árvore c/raiz 1 B

A

C

D

1

Estas árvores representam cinco histórias evolutivas diferentesentre os táxons, dependendo de onde se coloca a raiz !

# táxons

3456789....

30

# árvores sem raiz

13

15105945

10.395135.135....~3,58x10

36

# raízes

3579

111315....

57

# árvores com raiz

315

105945

10.395135.135

2.027.025....

~2,04x1038

x =

CA

B D

A D

B E

C

A D

B E

C

F

Cada árvore sem raiz pode teoricamente ser enraizada em qualquer lugar ao longo de qualquer de seus ramos

H C G G C H C G H

Árvores alternativas sobre relações evolutivas entre os três “grandes símios”

A árvore do meio é considerada a árvore científica “verdadeira” para a história evolutiva destas três espécies

Há dois modos principais de enraizar árvores:

Pelo grupo externo (outgroup ):Usa táxons de referência (o “outgroup”) que sabidamente se situam fora do grupo de interesse (o “ingroup”). Requer conhecimento a priori sobre relacionamentos entre os táxons. O outgroup pode ser uma espécie (ex: aves para enraizar uma árvore de mamíferos) ou cópias de genes duplicados (ex: -globina para enraizar -globinas).

outgroup

A

B

C

D

10

2

3

5

2

Pelo ponto-médio ou distância:enraiza a árvore no ponto médio entre os dois táxons mais distantes na árvore, tal como determinado pelo tamanho dos ramos. Pressupõe que os táxons evoluem coordenadamente (evolução constante entre linhagens). Esta suposição está embutida em alguns métodos fenéticos de construção de árvores tal como o UPGMA.

d (A,D) = 10 + 3 + 5 = 18Ponto-médio = 18 / 2 = 9

Todos estes rearranjos mostram o mesmo relacionamento evolutivo entre táxons

B

A

C

D

A

B

D

C

B

C

A

D

B

D

A

C

B

AC

Dárvore enraizada 1

B

A

C

D

A

B

C

D

Todas estas árvores são idênticas

Reconstruções

filogenéticas com dados

moleculares

Page 12: Evolução molecular: Reconstruções Filogenéticaslabs.icb.ufmg.br/lbem/aulas/grad/evol/reconstfilog2009.pdf · Evolução molecular: Reconstruções Filogenéticas Prof. Fabrício

12

Variabilidade genéticaFenotípica

Morfológica

Funcional

Protéica

DNA

Macromutações

SNP’s – mutações de ponto

Inserções de retroposons

Microssatélites

POP1

A - 0,4

B - 0,2

C - 0,9

D - 0,1

E - 0,2

POP2

A - 0,6

B - 0,5

C - 0,8

D - 0,3

E - 0,1

POP3

A - 0,3

B - 0,2

C - 0,9

D - 0,2

E - 0,4

Freqüências alélicas

Freqüência de um dos alelos em cinco locos bialélicos (A-E) em 3 populações (pop1, 2, 3)

Frequências alélicas servem apenas para comparações fenéticasintra-específicas.

MicrossatélitesAT

ATAT

AT

AT

CCGCCG

CCGCCG

CA CA CA CA

CA CA

CA

CA CA CA CA CA

CA CA CA CA CA CA

CAAlelo 3

Alelo 5

Alelo 7

são multi-alélicos

µ = 10-4 a 10-3 / loco / geração

Microssatélites servem geralmente apenas para comparações fenéticas intra-específicas.

SNPs ou mutações de ponto

Single Nucleotide Polymorphisms

são geralmente bialélicos

alelo 0 ...AAGCGTTATAGC...

alelo 1 ...AAGTGTTATAGC...

µ = 10-7 a 10-8 / locus / geração

SNPs podem ser utilizados para comparações cladísticas interespecíficas.

* * * ** * * * * * *

A aat tcg ctt cta gga atc tgc cta atc ctg

B ... ..a ..g ... .a. ... ... t.. ... ..a

C ... ..a ..c ..g ... ..t ... ... ... t.a

D ... ..a ..a ..g ..g ..t ... t.g ..t t..

Cada diferença de nucleotídio é um SNP e considerado

como um caráter na reconstrução filogenética

Obs:Pontos (.) se referem a posições de caracteres inalterados em relação

à primeira sequência (A)

* Posições com caracteres variáveis entre estas sequências

SNPs em sequências de DNAAnalogia

T C T C

C

1 32 4Espécies:

Estado do caráter:

estado ancestral

TNas spp. 1 e 3 há uma analogia (caráter análogo ou homoplasia);

Origem independente – evolução paralela ou convergente

Page 13: Evolução molecular: Reconstruções Filogenéticaslabs.icb.ufmg.br/lbem/aulas/grad/evol/reconstfilog2009.pdf · Evolução molecular: Reconstruções Filogenéticas Prof. Fabrício

13

Homologia Ancestral (0)

T C C

C

1 32 4Espécies:

Estado do caráter:

estado ancestral

CNas spp. 1, 3 e 4 há uma homologia ancestral (simplesiomorfia);é ancestral porque está presente na raiz da árvore (ancestral comum) como uma plesiomorfia.

C

Homologia Derivada (1)

T T C C

C

1 32 4Espécies:

Estado do caráter:

estado ancestral

TNas spp. 1 e 2 possuem homólogos derivados (sinapomorfia) (i.e., aconteceu uma transição do estado “basal” ou primitivo, no ancestral comum imediato destas duas spp ou OTUs).

Tipos de abordagensfilogenéticas utilizando

moléculas

Fenética

Similaridade geral

Cladística

Sistemática filogenética

Similaridade vs. relacionamento evolutivo

Similaridade e relacionamento evolutivo não são a mesma coisa, mesmo que relacionamento evolutivo seja inferido de certos tipos de similaridade.

Similar: ser semelhante (uma observação)

Relacionado: geneticamente conectado (um fato histórico)

Dois táxons podem ser mais similares sem ser mais relacionados:

Táxon A

Táxon B

Táxon C

Táxon D

1

1

1

6

3

5

O táxon C é mais similar ao A (d = 3)

do que ao B (d = 7), mas C e B são

mais estreitamente relacionados: C e

B compartilham um ancestral comum

mais recente do que os dois com A.

Métodos baseados em caracteres podem teoricamente discriminar os tipos de similaridade e encontrar a “verdadeira” árvore evolutiva .

Tipos de SimilaridadeSimilaridade observada entre duas OTUs pode ser por:

relacionamento evolutivo :caracteres ancestrais compartilhados (‘simplesiomorfias’)caracteres derivados compartilhados (‘’sinapomorfias’)

Homoplasia (evolução independente do mesmo caráter):Eventos Convergentes (em OTUs relacionadas ou não), Eventos Paralelos (em OTUs relacionadas), Reversões (em OTUs relacionadas ou não)

C

C

G

G

C

C

G

G

C

C

G

G

C

G

G

T

Convergentes Paralelos Reversões

Seleciona a árvore que melhor representa as distâncias observadas entre os pares.

Seleciona a árvore que tem a maior probabilidade de reproduzir os dados observados.

Seleciona a árvore que explica os dados com o menor número de substituições (eventos mutacionais fixados).

Distância

Verossimilhança

Parcimônia

Métodos gerais de reconstrução filogenética

CARÁTER

Page 14: Evolução molecular: Reconstruções Filogenéticaslabs.icb.ufmg.br/lbem/aulas/grad/evol/reconstfilog2009.pdf · Evolução molecular: Reconstruções Filogenéticas Prof. Fabrício

14

Tipos de dados usados em inferência filogenética

Métodos baseados em caracteres : Usam diretamente os caracteres alinhados, tais como sequências de DNA ou proteína

táxons caracteresespécie A ATGGCTATTCTTATAGTACG

espécie B ATCGCTAGTCTTATATTACA

espécie C TTCACTAGACCTGTGGTCCA

espécie D TTGACCAGACCTGTGGTCCG

espécie E TTGACCAGTTCTCTAGTTCG

Métodos baseados em distâncias: Transformam os dados em distâncias

(dissimilaridades) par-a-par, e usam a matriz durante inferência da árvore.

A B C D E

espécie A ---- 0,20 0,50 0,45 0,40

espécie B 0,23 ---- 0,40 0,55 0,50

espécie C 0,87 0,59 ---- 0,15 0,40

espécie D 0,73 1,12 0,17 ---- 0,25

espécie E 0,59 0,89 0,61 0,31 ----

Exemplo 1: Distância “p” (= percentagem observada de sequências diferentes)

Exemplo 2: distância Kimura 2-parâmetros(estimativa do número real de substituições entre táxons)

MATRIZ

Estima-se primeiro qual árvore sem raiz seria a mais “correta”A

B

C

D

Alguns métodos produzem a árvore já com a raiz (UPGMA), outros podem fornecer árvores com raiz se os dados

possuem informação suficiente (Parcimônia, Verossimilhança) e todos podem se utilizar ou necessitam obrigatoriamente de um grupo externo para produzir uma

árvore com raiz (Neighbor Joining - NJ)

Algoritmos baseados em distâncias(agrupamento)

Usam distâncias para calcular árvores filogenéticas. Estas são baseadas somente no número relativo de similaridades e diferenças entre um grupo de seqüências.

– Começa com uma matriz de distâncias par-a-par

– Estes métodos constróem uma árvore ligando os pares de

táxons menos distantes, sucessivamente ligando táxons

mais distantes.

– Ex: UPGMA (típico método fenético) e

Neighbor joining (NJ) que considera diferentes taxas

evolutivas entre linhagens.

Distâncias entre DNA• distâncias entre pares de seqüências de DNA são relativamente

simples de computar como a soma de diferenças de bases entre as

duas seqüências.

– Este tipo de algoritmo somente funciona para pares de

sequências similares o bastante para serem alinhadas

• Geralmente todas alterações de bases são consideradas iguais

• Inserções/deleções geralmente possuem um peso maior do que

substituições nucleotídicas (gap penalties).

• É também possível corrigir múltiplas substituições em um único sítio,

que é comum em relacionamentos filogenéticos distantes e para

sítios de rápida evolução.

UPGMA• O mais simples dos métodos de distância é o UPGMA (Unweighted

Pair Group Method using Arithmetic averages) e apenas reconstrói

fenogramas que representam meras relações de similaridade geral.

• Assume taxas evolutivas idênticas para todas as OTUs.

• Agrupa as distâncias menores e recalcula novas distâncias através

de médias aritméticas para novo agrupamento.

• Os programas do pacote PHYLIP DNADIST and PROTDIST calculam

distâncias genéticas entre grupos de seqüências criando uma

matriz de dissimilaridades (distâncias).

• Então o programa NEIGHBOR (que também constrói árvores NJ) do

PHYLIP constrói a árvore UPGMA a partir da matriz.

• Esta árvore é visualizada em um programa apropriado (Ex:

TREEVIEW ou PTP).

Métodos de Distância

a ACGA

b ATGC

c GTGC

d GCAA

a b c d

a 0

b 0,5 0

c 0,75 0,25 0

d 0,5 1,0 0,75 0

dij

Page 15: Evolução molecular: Reconstruções Filogenéticaslabs.icb.ufmg.br/lbem/aulas/grad/evol/reconstfilog2009.pdf · Evolução molecular: Reconstruções Filogenéticas Prof. Fabrício

15

a b cda b c d

a 0

b 0,5 0

c 0,75 0,25 0

d 0,5 1,0 0,75 0

dij

Métodos de Distância

Matriz Árvore UPGMA(mera similaridade)

a b c d

a 0

b 0,5 0

c 0,75 0,25 0

d 0,5 1,0 0,75 0

dij

Métodos de Distância

Matriz Árvore Neighbor-Joining(similaridade e

taxas evolutivas diferenciais)

bd

a

c

Máxima parcimônia

• Parcimônia é o método mais popular de reconstrução cladística dos relacionamentos por ancestralidade comum.

• Parcimônia permite o uso de toda informação evolutiva conhecida para a construção da árvore.

– em contraste, métodos de distância resumem todas diferenças entre pares de seqüências em um único número, a percentagem de diferença ou distância genética.

Exemplo de Parcimônia

• Considere 4 táxons com as seqüências: a (ACGA),

b (ATGC), c (GTGC), d (GCAA).

• A parcimônia deve decidir qual das 3 possíveis árvores

sem raiz (4 táxons), é a mais “correta” (parcimoniosa).

• Posteriormente, se houver informações suficientes, deve-

se colocar a raiz, a qual polariza o padrão de ramificações

sequenciais na árvore filogenética.

Exemplo de Parcimônia

a

b

c

d

a

c

b

d

a

d

b

c

a A C G A

b A T G C

c G T G C

d G C A A

árvore 1

árvore 2

árvore 3

1 2 3 4

Exemplo de Parcimônia

a

b

c

d

a A C G A

b A T G C

c G T G C

d G C A A

árvore 1

Tot

árvore 1 1

árvore 2

árvore 3

A

A

G

G

*

* = 1 etapa de mutação

1 2 3 4

Page 16: Evolução molecular: Reconstruções Filogenéticaslabs.icb.ufmg.br/lbem/aulas/grad/evol/reconstfilog2009.pdf · Evolução molecular: Reconstruções Filogenéticas Prof. Fabrício

16

Exemplo de Parcimônia

a

b

c

d

a A C G A

b A T G C

c G T G C

d G C A A

árvore 1

Tot

árvore 1 1 2

árvore 2

árvore 3

1 2 3 4 C

T C

T*

* = 2 etapas de mutação

*

Exemplo de Parcimônia

a

b

c

d

a A C G A

b A T G C

c G T G C

d G C A A

árvore 1

Tot

árvore 1 1 2 1

árvore 2

árvore 3

A

GG 1 2 3 4

* = 1 etapa de mutação

*

G

Exemplo de Parcimônia

a

b

c

d

a A C G A

b A T G C

c G T G C

d G C A A

árvore 1

Tot

árvore 1 1 2 1 2 6

árvore 2

árvore 3

A

A

1 2 3 4

C

C*

* = 2 etapas de mutação

*

Exemplo de Parcimônia

a

b

c

d

a

c

b

d

a

d

b

c

a A C G A

b A T G C

c G T G C

d G C A A

árvore 1

árvore 2

árvore 3

Tot

árvore 1 1 2 1 2 6

árvore 2 2 2 1 2 7

árvore 3 2 1 1 1 5

1 2 3 4

Exemplo de Parcimônia

a

d

b

cárvore 3

Árvore sem raiz escolhida pela análise de parcimônia

Neste caso temos informações adicionais de que táxon com a sequência d possa funcionar como um grupo externo (outgroup), portanto a raiz estará entre d e os outros ( ).

a b cdÁrvore com raiz escolhida usando d como outgroup

Exemplo de Parcimônia

a b cda A C G A

b A T G C

c G T G C

d G C A A

1

1 (A)1 (A)

A evolução dos caracteres apomórficos pode ser inferida a partir do Cladograma. Assim, eventos paralelos (recorrentes) de mutação podem ser identificados, os quais geram homoplasias

3 (G)

3

2 (T)

2

4 (C)

4

Page 17: Evolução molecular: Reconstruções Filogenéticaslabs.icb.ufmg.br/lbem/aulas/grad/evol/reconstfilog2009.pdf · Evolução molecular: Reconstruções Filogenéticas Prof. Fabrício

17

A análise de parcimônia pode discriminar alguns tipos de eventos paralelos.Na figura ao lado, 4 seqüências alinhadas homólogas (a) de distintos organismos foram utilizadas para construir uma árvore de parcimônia (b).Na árvore estão dispostas os eventos de mutações (apomorfias), numerados de 1 a 8. No evento 2, o estado alélico derivado (nucleotídio A) demonstrou ser um evento paralelo, aparecendo independentemente na seqüência do homem e do milho

Verossimilhança (L) é a probabilidade dos dados, dado o modelo de substituições nucleotídicos e uma hipótese de

topologia filogenética

Modelo evolutivo de substituições

Diferentes padrões de substituição nucleotídica específicos de cada conjunto homólogo de sequências de DNA.

A

C T

GTransição

Transversão

L = P (dados/árvore)

Máxima verossimilhança

Jukes-Cantor(1 parâmetro)

A frequência dos nucleotídios não é consideradaTodas substituições têm a mesma taxa

Kimura 2P(2 parâmetros)

A frequência dos nucleotídios não é consideradaTransições e transversões têm diferentes taxas

GTR (General Time Reversible)(6 parâmetros)

a

b

cd e

f

A frequência dos nucleotídios é consideradaTransições e transversões têm diferentes taxas, assim como os tipos de mudanças nucleotídicas

O modelo inapropriado desubstituições nucleotídicaspode levar a uma reconstrução filogenética incorreta.

Page 18: Evolução molecular: Reconstruções Filogenéticaslabs.icb.ufmg.br/lbem/aulas/grad/evol/reconstfilog2009.pdf · Evolução molecular: Reconstruções Filogenéticas Prof. Fabrício

18

Modeltest

Posada e Krandal

O software permite selecionar o modelo de substituição mais plausível para determinado conjunto de sequências, assim como outros parâmetros necessários para a reconstrução filogenética.

Dados reais: mudanças observadas e esperadas

• Comparação de sequências de chimpanzé e homem no DNAmt (307/1333 sítios são diferentes)

• Modelos com mais parâmetros se aproximam mais do padrão observado

LT = L (1) x L (2) x L (3) x L (4) x..x L (N) = L (i)

d

c

b

a

C

C

T

T

7654321

TGGAGA

TATAGA

TCCCGA

TCAGAA

Táxon

Táxon

Táxon

Táxon

aa

cc

bb

dd

aa

bb

cc

dd

aa

dd

cc

bb

Método baseado na avaliação probabilística de modelos evolutivos que melhor explicam um conjunto de dados de forma que este reflita a história evolutiva mais próxima da realidade

C A

L(5) = Prob +C G

A A

Prob +C

C

A

G

A C

C

C

A

G

C TProb +

Prob ... +

Prob +C

C

A

G

N N

Máxima verossimilhança Problemas na reconstruçãofilogenética

As taxas evolutivas são diferentes para cada gene ou segmento anônimo de DNA.

Árvores filogenéticas contam a história do caráter, mas não necessariamente da espécie.

Taxas de mutação/evolução Árvores de genes e de espécies

• A história evolutiva de genes reflete aquela das espécies que os carregam, exceto quando:– Transferência horizontal = transferência gênica entre

espécies (ex. entre bactérias, mitocôndrias em híbridos)

– Duplicação gênica : ortologia/ paralogia

Incongruência entre árvores de genes e espécies

Page 19: Evolução molecular: Reconstruções Filogenéticaslabs.icb.ufmg.br/lbem/aulas/grad/evol/reconstfilog2009.pdf · Evolução molecular: Reconstruções Filogenéticas Prof. Fabrício

19

Associações históricas

Page e Charleston, 1998

Eventos entre gene (associado) e a espécie (host)

Page e Charleston, 1998

Reconstrução da filogenia de espécies: artefatos devido à paralogia

Perda de genes pode acontecer durante a Evolução: mesmo sequências com Perda de genes pode acontecer durante a Evolução: mesmo sequências com genomas completos pode ser difícil detectar paralogiagenomas completos pode ser difícil detectar paralogia

Rat Mouse Rat Mouse

GNS1 GNS1

GNS1 GNS2

GNS2 GNS2GNS1 GNS2

Hamster Hamster

especiação

duplicação

Mouse Rat

GNS GNSGNS

Hamster

Árvore verdadeiraÁrvore obtida com amostragem parcial

de genes homólogos, mas parálogos