15
1 Reconstruções Filogenéticas Taxonomia Estudo dos relacionamentos entre grupos de organismos – é um antigo ramo da biologia clássica. Estabelecida por Carolus Linnaeus (1707-1778). Taxonomia e Classificação Hierárquica O sistema taxonômico usado hoje foi desenvolvido por Linnaeus no século XVIII. Este tinha 2 características principais: o assinalamento de um nome duplo (binômio) a cada espécie e um sistema de agrupamento destas espécies. Um binômio (nome Latino de 2 partes) é designado unicamente para cada espécie, onde o primeiro é o nome genérico, e os dois nomes são ditos específicos. Homo sapiens Arabdopsis thaliana Escherichia coli Chromobacterium violaceum Canis lupus O sistema de agrupamento das espécies numa hierarquia de crescentes categorias formaliza o agrupamento de organismos. A nomenclatura Binomial é a primeira etapa no agrupamento: espécies similares são agrupadas no mesmo gênero. O sistema então progride para categorias mais amplas: Gêneros similares são agrupados na mesma família. Famílias são agrupadas em Ordens. Ordens são agrupadas em Classes. Classes são agrupadas em Filos. Filos são agrupados em Reinos. A sistemática conecta a diversidade biológica à filogenia Filogenia = A história evolutiva de uma espécie ou grupo de espécies relacionadas. Filogenia é geralmente representada como árvores filogenéticas que traçam relacionamentos evolutivos inferidos. Sistemática = O estudo da diversidade biológica em um contexto evolutivo. Diversidade Biológica reflete episódios passados de especiação e macroevolução. Compreende a taxonomia na sua procura por relacionamentos evolutivos. Taxonomia = Identificação e classificação de espécies; é um componente da sistemática.

Trabalhos do LBEM - labs.icb.ufmg.brlabs.icb.ufmg.br/lbem/aulas/grad/evol/evolmol/reconstfilog2003.pdfcomparativos de estruturas do corpo, especialmente forma e tamanho dos bicos,

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Trabalhos do LBEM - labs.icb.ufmg.brlabs.icb.ufmg.br/lbem/aulas/grad/evol/evolmol/reconstfilog2003.pdfcomparativos de estruturas do corpo, especialmente forma e tamanho dos bicos,

1

Reconstruções

Filogenéticas

Taxonomia

ØEstudo dos relacionamentos entregrupos de organismos – é umantigo ramo da biologia clássica.

Ø Estabelecida por CarolusLinnaeus (1707-1778).

Taxonomia e Classificação Hierárquica

O sistema taxonômico usado hoje foi desenvolvidopor Linnaeus no século XVIII. Este tinha 2características principais: o assinalamento de umnome duplo (binômio) a cada espécie e umsistema de agrupamento destas espécies.

Um binômio (nome Latino de 2 partes) é designadounicamente para cada espécie, onde o primeiro é o nomegenérico, e os dois nomes são ditos específicos.

Homo sapiensArabdopsis thalianaEscherichia coliChromobacterium violaceumCanis lupus

O sistema de agrupamento das espécies numa hierarquiade crescentes categorias formaliza o agrupamento deorganismos.

A nomenclatura Binomial é a primeira etapa no agrupamento:espécies similares são agrupadas no mesmo gênero.

O sistema então progride paracategorias mais amplas:

• Gêneros similares são agrupados namesma família.

• Famílias são agrupadas em Ordens.• Ordens são agrupadas em Classes.• Classes são agrupadas em Filos.• Filos são agrupados em Reinos.

A sistemática conecta a diversidade biológica à filogenia

Filogenia = A história evolutiva de uma espécie ou grupo deespécies relacionadas.

Filogenia é geralmente representada como árvoresfilogenéticas que traçam relacionamentos evolutivosinferidos.

Sistemática = O estudo da diversidade biológica em umcontexto evolutivo.

Diversidade Biológica reflete episódios passados deespeciação e macroevolução.

Compreende a taxonomia na sua procura porrelacionamentos evolutivos.

Taxonomia = Identificação e classificação de espécies; é umcomponente da sistemática.

Page 2: Trabalhos do LBEM - labs.icb.ufmg.brlabs.icb.ufmg.br/lbem/aulas/grad/evol/evolmol/reconstfilog2003.pdfcomparativos de estruturas do corpo, especialmente forma e tamanho dos bicos,

2

Baseado nassimilaridades ediferenças, osprincipais gruposde organismospodem sercolocados em umdiagrama queilustra seusrelacionamentosevolutivos.Usando dadosfósseis emoleculares,podemos estimaros pontos dedivergência nasárvoresfilogenéticas.

Que são árvores?

Charles Darwin. Anotações 1836-1844

OTU 1

OTU 2

OTU 3

OTU 4

OTU 5

OTU 6

Árvore Filogenética

15 4 3 2678No de diferenças

tempoantiga recente

n1

n2

n3

n4

n5

n

OTU unidade taxonômica operacional - populações, espécies ou grupos

nó interno - ~ ancestral comum - extinto

raiz

Árvores Equivalentes

Por quê árvores?Por quê representamos evolução como árvore e

não outro tipo de gráfico?

CA DBA B C D

Ciclo, reticulação

A

BC

D

• Evolução é divergência – espécies se modificam

com o tempo - Transformacionismo

Darwin: “Descendência com modificação”

• Por várias razões, reticulação torna-se difícil com o

tempo – provavelmente no pré-cambriano as

reticulações devido a transferências gênicas

horizontais, fusões de células, etc, eram comuns.

• Reticulações são difíceis de se representar

Page 3: Trabalhos do LBEM - labs.icb.ufmg.brlabs.icb.ufmg.br/lbem/aulas/grad/evol/evolmol/reconstfilog2003.pdfcomparativos de estruturas do corpo, especialmente forma e tamanho dos bicos,

3

Sang et al., 1997

Árvores reticuladas

Ex: espécies híbridas de Paeonia sp.

japonensis

americana

grus

nigrocollis

monachus

canadensis

bugeranus

virgo

paradisea

leucogeranus

antigone

rubicanda

vipio

Filogenia do grou

japonensis

americana

grus

nigrocollis

monachus

canadensis

bugeranus

virgo

paradisea

leucogeranus

antigone

rubicanda

vipio

Cladograma Árvore UPGMACyt. b (Mooers et al., 1999)

Árvore sem raiz

leucogeranus antigonerubicanda

vipio

japonensis

americana

grusnigricollis

monachuscanadensis

Bugeranus

virgo

paradisea

japonensis

americana

grus

nigrocollis

monachus

canadensis

bugeranus

virgo

paradisea

leucogeranus

antigone

rubicanda

vipio

Árvore UPGMA

Árvorefilogenéticapara ostentilhões deGalápagos.Estas 13espécieshabitam as IlhasGalápagos. Aárvore ébaseada emestudoscomparativos deestruturas docorpo,especialmenteforma e tamanhodos bicos, e nosestudos decampo sobreisolamentoreprodutivo ecomportamentoalimentar.

Conexão entre classificação e filogeniaA natureza da ramificação de uma árvore evolutiva reflete oarranjo hierárquico de táxons (taxa).Esta árvore sugere as possíveis afinidades genealógicas dentretáxons subordinados à ordem Carnivora.

Page 4: Trabalhos do LBEM - labs.icb.ufmg.brlabs.icb.ufmg.br/lbem/aulas/grad/evol/evolmol/reconstfilog2003.pdfcomparativos de estruturas do corpo, especialmente forma e tamanho dos bicos,

4

Árvores filogenéticas baseadas em sistemáticaDois métodos, comparação de proteínas do sangue e hibridização DNA-DNA,foram usados para construir esta árvore de espécies de ursos e guaximins. Uma revisão moderna sobre focas,

leões marinhos e morsas

Dados molecularesrecentes indicam que defato as famílias dosPinípedes (morsas, otáriase leões marinhos, e focas),são monofiléticas.

Qual relação entre procariotos e eucariotos?

De onde vêm as mitocôndrias e cloroplastos?

Árvores filogenéticas podem nosdar informações sobre o

passado remoto

A classificação dos 5 reinos

Atualmente a sistemática filogenética favorece os 3-domínos

Page 5: Trabalhos do LBEM - labs.icb.ufmg.brlabs.icb.ufmg.br/lbem/aulas/grad/evol/evolmol/reconstfilog2003.pdfcomparativos de estruturas do corpo, especialmente forma e tamanho dos bicos,

5

Riq

uét

sias

Mitocô

ndrias

outras bactérias

ArchaeaEucariotos

Nature, 1998

Árvores filogenéticas eepidemiologia

Dentista com HIV

Freeman and Herron, 1998

pac

iente

B-x

pac

iente

B-y

pac

iente

A-x

pac

iente

E-y

pac

iente

E-x

pac

iente

C-x

pac

iente

C-y

Den

tist

a-y

pac

iente

A-y

pac

iente

G-x

pac

iente

G-y

Den

tist

a X

LC02-x

LC03-x

LC02-y

LC09

LC35

pac

iente

D-x

pac

iente

D-y

LC03-y

pac

iente

F-x

pac

iente

F-y

HIV

LI

Biodiversidade eConservação

Ø Filogenética pode ser extremamente útil paraestudos de biodiversidade (inventariamento eclassificação) e estabelecimento de prioridadesconservacionistas.

Ø Medidas de diversidade utilizando-se desequências de DNA estão agora sendo usadaspara implementar planos de conservação derecursos genéticos.

Ø Aplicações: determinar ESUs (unidadesevolutivamente significantes), agrupamentos deespécies, espécies, subesp., populações isoladas ediferenciadas, etc...

Termos filogenéticos• Homologia

• Analogia

• Convergência, Reversão

• Plesiomorfia – estado ancestral – “0”(Simplesiomorfia)

• Apomorfia – estado derivado – “1”(Sinapomorfia - Autapomorfia)

Homologia:um caráter compartilhado entreduas ou mais espécies que estavapresente em seu ancestral comum.

Analogia:caráter “compartilhado” , nãopresente no ancestral comum (i.e.,o caráter evolui duas vezes,independentemente): evoluçãoconvergente, reversão.

Analogia

1 32 4Espécies:

Estado do caráter:

estado ancestral

Na Sp. 1 e 3 há uma analogia (caráter análogo);

Origem independente – evolução paralela ou convergente

Page 6: Trabalhos do LBEM - labs.icb.ufmg.brlabs.icb.ufmg.br/lbem/aulas/grad/evol/evolmol/reconstfilog2003.pdfcomparativos de estruturas do corpo, especialmente forma e tamanho dos bicos,

6

Homologia Ancestral (0)

1 32 4Espécies:

Estado do caráter:

estado ancestral

em Sp. 1, 3 e 4 há uma homologia ancestral(simplesiomorfia); é ancestral porque está presente nabase da árvore

Homologia Derivada (1)

1 32 4Espécies:

Estado do caráter:

estado ancestral

nas Sp. 1 e 2 é homólogo derivado – sinapomorfia (i.e.,aconteceu uma transição do estado “basal” ou primitivono ancestral destas duas OTUs).

Separando Homologia de Analogia

Sistematas classificavam espécies em táxonssuperiores baseados na extensão de similaridade emmorfologia e outras características.

Homologia = Semelhança atribuída à ancestralidadecompartilhada. Os membros anteriores de mamíferossão homólogos, e compartilham uma similaridade nosuporte esquelético que tem uma base genealógica.

Homologia deve ser distinguida de analogia nasárvores evolutivas.

Analogia = Similaridades que podem ser devido aconvergência evolutiva (ou reversão):. não éancestralidade comum.

Convergência: origemindependente do caráter (i.e., duaslinhagens evoluem paralelamenteem um “fenótipo” similar).

Reversão: origem e subseqüenteperda ou mutação de volta aocaráter ancestral (i.e., reversão aoestado ancestral).

Evolução Convergente = Aquisição de

características similares em espécies de diferentes

linhas evolutivas, devido ao compartilhamento de

nichos ecológicos similares, sendo a seleção natural

responsável por moldar adaptações análogas.

Exemplo:

asas de insetos e pássaros

asas de pássaros e morcegos

Evolução convergente também se dá no nívelmolecular: sequências de DNA e proteínaspodem ter evoluções paralelas, reversões, etc

EvoluçãoConvergente

gerou similaridadesentre marsupiaisaustralianos emamíferosplacentários emoutros continentes

Page 7: Trabalhos do LBEM - labs.icb.ufmg.brlabs.icb.ufmg.br/lbem/aulas/grad/evol/evolmol/reconstfilog2003.pdfcomparativos de estruturas do corpo, especialmente forma e tamanho dos bicos,

7

Um grupo monofilético:

é um grupo de táxons queinclui um ancestral comum e

todos seus descendentes

Exemplo de gruponão-monofilético: Répteis

Peixes TartarugasAnfíbios Cobras Crocodilos AvesMamíferos Lagartos

O ancestral comum mais recentedos répteis também deu origemaos mamíferos e aves

Classificação daBiodiversidade

Fenética(Taxonomia numérica)

Cladística(Sistemática Filogenética)

Fenética• Abordagem Clássica (Linnaeus).

• Agrupa espécies baseada nasimilaridade fenotípica (ougenotípica).

• Usa todas característicasdistinguíveis.

• Ex: métodos baseados emdistâncias (UPGMA)

Análise de várioscaracteres

(fenótipos, sítiospolimórficos, freq.

alélicas, etc.)

Matriz dedissimilaridade

em base ao númerode diferenças

Construçãode árvore

filogenética

FenogramaA B C

A

B

C

3

7 6

0

0

0

A B CA B

A

B

C

Relações de similaridade

MÉTODOS FENÉTICOS CladísticaØ Teoria Evolutiva que postula que grupos

de organismos similares descendem deum ancestral comum.

Ø Sistemática Filogenética (cladística)é um método de classificação taxonômicabaseado na história evolutiva.

Ø Foi desenvolvido por WilliHennig, um entomologistaalemão, em 1950.

Page 8: Trabalhos do LBEM - labs.icb.ufmg.brlabs.icb.ufmg.br/lbem/aulas/grad/evol/evolmol/reconstfilog2003.pdfcomparativos de estruturas do corpo, especialmente forma e tamanho dos bicos,

8

Cladística• Nova abordagem (Hennig, 1950)

• Baseada nos padrões de ancestralidadecomum das espécies

• Usa apenas caracteres derivados(apomórficos) compartilhados(sinapomórficos / homólogos derivados)

• Portanto, objetiva traçar a históriaevolutiva real

• Ex: métodos baseados em caracteres(parcimônia)

Análise de várioscaracteres com

estados ancestrais(0) e derivados (1)

Construçãode árvore

filogenética

Cladograma

A B C

A

B

C

Relações de ancestralidade comum

MÉTODOS CLADÍSTICOS

D E123

45678

E

D

1

2 3

4

5 6

7 8

Caracteres utilizados

SimNãoNãoCladística

SimSimSimFenética

HomologiaDerivada

HomologiaAncestral

AnalogiaLagartoAve Dinossauro

Fenética Cladística

Lagarto AveDinossauro

Análise Filogenética

Ø Dado um conjunto de dados(caracteres morfológicos,alinhamento de múltiplassequências de DNA eproteína, etc), determinar(ou inferir) orelacionamento ancestraldentre as espécies.

Esp.1 Esp.2 Esp.3 Esp.4

Tempo

Não-resolvidaou filogenia tipo “estrela”

Filogenia parcialmente resolvida

Completamente resolvida,filogenia bifurcada

A A A

B

B B

C

C

C

E

E

E

D

D D

Politomia ou multifurcação uma bifurcação

O objetivo da inferência filogenética é resolver a ordem deramificação das linhagens nas árvores evolutivas:

Page 9: Trabalhos do LBEM - labs.icb.ufmg.brlabs.icb.ufmg.br/lbem/aulas/grad/evol/evolmol/reconstfilog2003.pdfcomparativos de estruturas do corpo, especialmente forma e tamanho dos bicos,

9

Há 3 possíveis árvores sem raizpara 4 táxons (A, B, C, D)

A C

B D

árvore 1A B

C D

árvore 2A B

D C

árvore 3

Métodos de construção (ou inferência) de árvores filogenéticasobjetivam descobrir qual das possíveis árvores sem raiz é a"correta".Seria desejável que esta fosse a “verdadeira” árvore biológica— aquela que seguramente represente a história evolutiva dostáxons analisados – mas esta é normalmente chamada deárvore inferida a partir dos dados.

O número de árvores sem raiz aumentaexponencialmente com o número de táxons

# táxons 3 4 5 6 7 8 910 . . . .30

# árvores sem raiz 1 3 15 105 945 10,935 135,135 2,027,025 . . . . -3.58 x 1036

(2N - 5)!! = # árvores sem raiz para N táxons

CA

B D

A B

C

A D

B E

C

A D

B E

C

F

Inferir relacionamentos evolutivos entre ostáxons requer enraizar a árvore:

Note que nesta árvore

enraizada, o táxon A não

está mais estreitamente

relacionado ao táxon B em

relação a C ou D como

sugerido acima.

A

BC

Raiz D

A B C D

Raiz

árvore enraizada

árvore sem raiz

O enraizamento em outra posição:

A

BC

raiz

D

árvore sem raiz

Note que nesta árvore enraizada,táxon A é mais estreitamenterelacionado ao táxon B, enquantoo C é mais relacionado ao D.

C D

raiz

árvore enraizada

A

B

Uma árvore sem raiz, de 4-táxons, pode teoricamente serenraizada em cinco lugares diferentes para produzir cinco tipos

distintos de árvores enraizadas

árvore sem raiz:

A C

B D

árvore c/raiz 4 C

D

A

B

4

árvore c/raiz 3 A

B

C

D

3

árvore c/raiz 5 D

C

A

B

5

árvore c/raiz 2 A

B

C

D

2

árvore c/raiz 1 B

A

C

D

1

Estas árvores mostram cinco histórias evolutivas diferentes entre ostáxons, dependendo de onde se coloca a raiz !

Todos estes rearranjos mostram o mesmorelacionamento evolutivo entre táxons

B

A

C

D

A

B

D

C

B

C

AD

B

D

AC

B

ACD

árvoreenraizada 1 B

A

C

D

A

B

C

D

Todas estas árvores são idênticas

Page 10: Trabalhos do LBEM - labs.icb.ufmg.brlabs.icb.ufmg.br/lbem/aulas/grad/evol/evolmol/reconstfilog2003.pdfcomparativos de estruturas do corpo, especialmente forma e tamanho dos bicos,

10

Há dois modos principais de enraizar árvores:Pelo outgroup (grupo externo):Usa táxons de referência (o “outgroup”)que sabidamente se situam fora do grupode interesse (o “ingroup”). Requerconhecimento a priori sobrerelacionamentos entre os táxons. Ooutgroup pode ser uma espécie (ex: avespara enraizar uma árvore de mamíferos)ou cópias de genes duplicados (ex: α-globina para enraizar β-globinas). outgroup

A

B

C

D

10

2

3

5

2

Pelo ponto-médio ou distância:enraiza a árvore no ponto médio entre osdois táxons mais distantes na árvore, talcomo determinado pelo tamanho dosramos. Pressupõe que os táxons evoluemcoordenadamente (clock-like). Estasuposição está embutida em algunsmétodos de construção de árvores talcomo o UPGMA

d (A,D) = 10 + 3 + 5 = 18Ponto-médio = 18 / 2 = 9

# táxons

3456789....30

# árvores sem raiz 1 3 15 105 945 10,935135,135....~3.58 x 1036

# raízes 3 5 7 9111315....57

# árvores com raiz 3

15 105 945 10,395 135,1352,027,025

.

.

.

.~2.04 x 1038

x =

CA

B D

A D

B E

C

A D

B E

C

F

Cada árvore sem raiz pode teoricamente ser enraizadaem qualquer lugar ao longo de qualquer de seus ramos

Reconstruções

filogenéticas com

dados moleculares

Variabilidade genéticaFenotípica

Morfológica

Funcional

Protéica

Genotípica

Macromutações

SNP’s – mutações de ponto

Inserções de retroposons

Microssatélites

POP1

A - 0,4B - 0,2C - 0,9D - 0,1E - 0,2

POP2

A - 0,6B - 0,5C - 0,8D - 0,3E - 0,1

POP3

A - 0,3B - 0,2C - 0,9D - 0,2E - 0,4

Freqüências alélicasFreqüência de um dos alelos em cinco locosbialélicos (A-E) em 3 populações (pop1, 2, 3)

MicrossatélitesAT

ATAT

AT

AT

CCG CCGCCG

CCG

CA CA CA CA

CA CA

CA

CA CA CA CA CA

CA CA CA CA CA CA

CAAlelo 3

Alelo 5

Alelo 7

são multi-alélicos

µ = 10-3 / locus / geração

Page 11: Trabalhos do LBEM - labs.icb.ufmg.brlabs.icb.ufmg.br/lbem/aulas/grad/evol/evolmol/reconstfilog2003.pdfcomparativos de estruturas do corpo, especialmente forma e tamanho dos bicos,

11

Inserções de retroposons

Elementos Alu, L1, Retrovírus endógenos

são bialélicos

alelo 0

alelo 1

µ = 10-8 a 10-9 / locus / geração

SNPs ou mutações de ponto

Single Nucleotide Polymorphisms

são geralmente bialélicos

alelo 0 ...AAGCGTTATAGC...

alelo 1 ...AAGTGTTATAGC...

µ = 10-7 a 10-8 / locus / geração

* * * ** * * * * * *A aat tcg ctt cta gga atc tgc cta atc ctgB ... ..a ..g ... .a. ... ... t.. ... ..aC ... ..a ..c ..g ... ..t ... ... ... t.aD ... ..a ..a ..g ..g ..t ... t.g ..t t..

Cada diferença de nucleotídio é um SNP econsiderado como um caráter nareconstrução filogenética

* Caracteres variáveis entre estas sequências

Analogia

T A T C

C

1 32 4Espécies:

Estado do caráter:

estado ancestral

T Na Sp. 1 e 3 há uma analogia (caráter análogo);

Origem independente – evolução paralela ou convergente

Homologia Ancestral (0)

T C C

C

1 32 4Espécies:

Estado do caráter:

estado ancestral

C em Sp. 1, 3 e 4 há uma homologia ancestral(simplesiomorfia); é ancestral porque está presente nabase da árvore

C

Homologia Derivada (1)

T T C C

C

1 32 4Espécies:

Estado do caráter:

estado ancestral

T nas Sp. 1 e 2 é homólogo derivado – sinapomorfia (i.e.,aconteceu uma transição do estado “basal” ou primitivo,no ancestral destas duas OTUs).

Page 12: Trabalhos do LBEM - labs.icb.ufmg.brlabs.icb.ufmg.br/lbem/aulas/grad/evol/evolmol/reconstfilog2003.pdfcomparativos de estruturas do corpo, especialmente forma e tamanho dos bicos,

12

Tipos de MétodosFilogenéticos

Øbaseados no caráterl Parcimônial Verossimilhança –ML

Øbaseados na distâncial Neighbor joining (NJ)l UPGMA

Envolvem um critériode otimização baseadona adequação doscaracteres na árvore.

Envolvem um critériode otimização baseadona adequação damatriz de distânciaspareadas à árvore

Seleciona a árvore que melhorrepresenta as distânciasobservadas entre os pares.

Seleciona a árvore que tem amaior probabilidade dereproduzir os dados observados.

Seleciona a árvore que explicaos dados com o menor númerode substituições (eventos mutacionais).

Distância

Verossimilhança

Parcimônia

Estima-se primeiro qual árvoresem raiz seria a mais “correta”

A

B

C

D

Alguns métodos produzem a árvore já com a raiz(UPGMA), outros podem fornecer árvores comraiz se os dados possuem informação suficiente

(parcimônia, verossimilhança) e outrosnecessitam obrigatoriamente de um grupo

externo para produzir uma árvore com raiz (NJ)

Tipos de dados usados em inferência filogenéticaMétodos baseados em caracteres : Usam diretamente os caracteresalinhados, tais como sequências de DNA ou proteína

táxons caracteresespécie A ATGGCTATTCTTATAGTACGespécie B ATCGCTAGTCTTATATTACAespécie C TTCACTAGACCTGTGGTCCAespécie D TTGACCAGACCTGTGGTCCGespécie E TTGACCAGTTCTCTAGTTCG

Métodos baseados em distâncias: Transformam os dados em distâncias(dissimilaridades) par-a-par, e usam a matriz durante inferência da árvore. A B C D E espécie A ---- 0.20 0.50 0.45 0.40 espécie B 0.23 ---- 0.40 0.55 0.50 espécie C 0.87 0.59 ---- 0.15 0.40 espécie D 0.73 1.12 0.17 ---- 0.25 espécie E 0.59 0.89 0.61 0.31 ----

Exemplo 1:Distância “p”(= percentagemobservada desequênciasdiferentes)

Exemplo 2: distância Kimura 2-parâmetros(estimativa do número real de substituições entre táxons)

MATRIZ

Similaridade vs. relacionamento evolutivoSimilaridade e relacionamento evolutivo não são a mesma coisa,mesmo que relacionamento evolutivo seja inferido de certos tiposde similaridade.

Similar: ser semelhante (uma observação)

Relacionado: geneticamente conectado (um fato histórico)

Dois táxons podem ser mais similares sem ser mais relacionados:

Táxon A

Táxon B

Táxon C

Táxon D

11

1

6

3

5

C é mais similar ao A (d = 3) doque ao B (d = 7), mas C e B sãomais estreitamente relacionados:C e B compartilham um ancestralcomum mais recente do que osdois com A.

métodos baseados em caracteres podem discriminar os tipos desimilaridade e teoricamente encontrar a verdadeira árvore evolutiva

Tipos de Similaridade

Similaridade observada entre duas OTUs pode ser por:

relacionamento evolutivo :caracteres ancestrais compartilhados (‘simplesiomorfias’)caracteres derivados compartilhados (‘’sinapomorfias’)

Homoplasia (evolução independente do mesmo caráter):Eventos Convergentes (em OTUs relacionadas ou não), Eventos Paralelos(em OTUs relacionadas), Reversões (em OTUs relacionadas ou não)

CCGG

C

CGG

C

CGG

CG

GT

Convergentes Paralelos Reversões

Page 13: Trabalhos do LBEM - labs.icb.ufmg.brlabs.icb.ufmg.br/lbem/aulas/grad/evol/evolmol/reconstfilog2003.pdfcomparativos de estruturas do corpo, especialmente forma e tamanho dos bicos,

13

Métodos FenéticosØ Algoritmos de computador baseados nos modelos fenéticos

se valem dos Métodos de Distância para construção de

árvores.

Ø Métodos Fenéticos geralmente contam cada diferença na

seqüência de bases igualmente.

Ø Os algoritmos são mais rápidos e produzem propriedades

estatísticas “robustas” com dados moleculares.

Ø A abordagem fenética é popular com alguns pesquisadores

que “confiam” demasiado nos dados moleculares (tal como

seqüências) e requer relativamente poucos pressupostos.

Fenética molecularØ A sistemática faz o uso freqüente de dados numéricos,

(taxonomia numérica) os quais podem ser valores para

vários dos “estados de caráter” tal como o tamanho ou

forma de uma estrutura visível ou estas podem ser

seqüências de DNA ou proteína.

Ø Similaridades e diferenças entre organismos podem ser

codificadas como um grupo de caracteres, cada um com

dois ou mais estados alternativos de caráter.

Ø Os dados obtidos com análise molecular podem ser

freqüências alélicas, perfil ou impressão digital de DNA

(produzidos por enzimas de restrição, RAPD, etc) e

seqüências de DNA ou proteína.

Medidas de DistânciasØ É uma medida da diferença genética entre duas espécies,

populações, ou mesmo entre dois indivíduos.

Ø O conceito de taxonomia numérica está baseado em

computar filogenias a partir de uma matriz de distâncias.

Ø No caso de dados de seqüências, distâncias

par-a-par devem ser calculadas entre todas seqüências

que serão usadas para construir a árvore - criando uma

matriz de distâncias.

Ø Métodos de distâncias geram uma única medida da

quantidade de mudanças evolutivas entre duas seqüências

desde a divergência de um ancestral comum.

Distâncias entre DNAØ distâncias entre pares de seqüências de DNA são

relativamente simples de computar como a soma de

diferenças de bases entre as duas seqüências.

l Este tipo de algoritmo somente funciona para pares de

sequências similares o bastante para serem alinhadas

Ø Geralmente todas alterações de bases são consideradas iguais

Ø Inserções/deleções geralmente possuem um peso maior do

que substituições nucleotídicas (gap penalties).

Ø É também possível corrigir múltiplas substituições em um

único sítio, que é comum em relacionamentos filogenéticos

distantes e para sítios de rápida evolução.

Algoritmos baseados em distâncias(agrupamento)

Usam distâncias para calcular árvoresfilogenéticas. Estas são baseadas somente nonúmero relativo de similaridades e diferençasentre um grupo de seqüências.

l Começa com uma matriz de distâncias par-a-par

l Estes métodos constróem uma árvore ligandoos pares de táxons menos distantes,sucessivamente ligando táxons mais distantes.

l Ex: UPGMA, Neighbor joining

UPGMAØ O mais simples dos métodos de distância é o UPGMA

(Unweighted Pair Group Method using Arithmeticaverages).

Ø Assume taxas evolutivas idênticas para todas OTUs.

Ø Agrupa as distâncias menores e recalcula novas distânciasatravés de médias aritméticas para novo agrupamento.

Ø Os programas do PHYLIP DNADIST and PROTDISTcalculam distâncias genéticas entre grupos de seqüênciascriando uma matriz.

Ø Então o programa NEIGHBOR (que também constróiárvores NJ) do PHYLIP constrói a árvore UPGMA apartir da matriz.

Ø Esta árvore é visualizada em um programa apropriado(TREEVIEW ou PTP).

Page 14: Trabalhos do LBEM - labs.icb.ufmg.brlabs.icb.ufmg.br/lbem/aulas/grad/evol/evolmol/reconstfilog2003.pdfcomparativos de estruturas do corpo, especialmente forma e tamanho dos bicos,

14

Neighbor JoiningØ O método Neighbor Joining (NJ) é o mais

popular na construção de árvores a partir demedidas de distâncias genéticas

(Saitou and Nei 1987, Mol. Biol. Evol. 4:406)

l NJ corrige o método UPGMA para seu pressuposto(freqüentemente inválido) de que uma mesma taxa deevolução se aplica a todos ramos de uma filogenia.

l A matriz de distância é ajustada para diferenças nastaxas de evolução de cada táxon (ramo).

l NJ apresentou melhores resultados em simulações e écomputacionalmente o mais eficiente algoritmo dedistâncias (N. Saitou and T. Imanishi, Mol. Biol. Evol. 6:514 (1989)

Métodos de Distância

A ACGA

B ATGC

C GTGC

D GCAA

A B C D

A 0

B 0,5 0

C 0,75 0,25 0

D 0,5 1,0 0,75 0

dij

A

B

C

D

a

b

c

d

e

e a be a e ce a e de b e ce b e de c d

AB

AC

AD

BC

BD

CD

= += + += + += + += + += +

Muitos métodosde distâncias (talcomo NJ) buscarencontrar umaárvore queminimize umvalor tal como:

( )d e

e

ij ij

ij

i< j∑

2

Métodos CladísticosØ São baseados na hipótese de que um grupo de

seqüências evolui de um ancestral comum por umprocesso de mutação, deriva e seleção, semtransferência horizontal de genes (hibridização,transdução de DNA por vírus, etc).

Ø Estes métodos funcionam melhor em construçõesde árvores, se pelo menos uma seqüência ancestraljá é conhecida, de modo que comparações podemser feitas entre um número finito de árvoresalternativas ao invés de se calcular todas possíveisárvores para um dado grupo de seqüências.

Parcimônia

Ø Parcimônia é o método mais popular dereconstrução de relacionamentos porancestralidade comum.

Ø Parcimônia permite o uso de todainformação evolutiva conhecida para aconstrução da árvore.

l em contraste, métodos de distância resumemtodas diferenças entre pares de seqüênciasem um único número, a percentagem dediferença ou distância genética.

Construindo árvorescom Parcimônia

Ø Parcimônia envolve a avaliação de todas árvores

possíveis considerando o número de mudanças

evolutivas necessárias par explicar os dados observados.

Ø A melhor árvore é aquela que requer o menor número

de alterações de bases (ou aminoácidos) para que todas

seqüências derivem de uma ancestral comum.

Page 15: Trabalhos do LBEM - labs.icb.ufmg.brlabs.icb.ufmg.br/lbem/aulas/grad/evol/evolmol/reconstfilog2003.pdfcomparativos de estruturas do corpo, especialmente forma e tamanho dos bicos,

15

Ø Considere 4 seqüências a (ACGA), b (ATGC),

c (GTGC), d (GCAA).

Ø A parcimônia deve decidir qual das 3 possíveis

árvores sem raiz (4 táxons), é a mais “correta”

(parcimoniosa).

Ø Posteriormente, se houver informações

suficientes, deve-se colocar a raiz.

Exemplo de Parcimônia Exemplo de Parcimôniaa

b

c

d

a

c

b

da

d

b

c

a A C G A

b A T G C

c G T G C

d G C A A

árvore 1

árvore 2

árvore 3

1 2 3 4 Tot

árvore 1 1 2 1 2 6

árvore 2 2 2 1 2 7

árvore 3 2 1 1 1 5

Exemplo de Parcimôniaa

d

b

cárvore 3

Árvore sem raiz escolhida pela análise de parcimônia

Neste caso temos informações adicionais deque a sequência d , possui mais estadosalélicos plesiomórficos (ancestrais, ou “0”)

a b cdÁrvore com raizescolhida usandod como outgroup

A análise de parcimôniapode discriminar algunstipos de eventos paralelos.Na figura ao lado, 4seqüências alinhadashomólogas (a) de distintosorganismos foramutilizadas para construiruma árvore de parcimônia(b).Na árvore estão dispostasos eventos de mutações(apomorfias), numeradosde 1 a 8. No evento 2, oestado alélico derivado(nucleotídio A)demonstrou ser um eventoparalelo, aparecendoindependentemente naseqüência do homem e domilho