Upload
ngominh
View
220
Download
0
Embed Size (px)
Citation preview
1
Evolução molecular:
Reconstruções Filogenéticas
Prof. Fabrício R Santos
Sistemática e Taxonomia
• Sistemática é o estudo dos relacionamentos entre grupos de organismos e a classificação hierárquica em diferentes táxons – é um antigo ramo da biologia clássica.
A Taxonomia é parte da Sistemática e se refere à nomenclatura e identificação de espécies. Seus princípios foram inicialmente estabelecidos por Carolus Linnaeus(1707-1778).
Taxonomia e Classificação Hierárquica
O sistema taxonômico desenvolvido inicialmente por Linnaeus tem duas características principais: i) a designação de um nome duplo (binômio) a cada espécie, e ii) um sistema de agrupamento destas espécies.
Um binômio (nome latino de 2 partes) é designado unicamente para cada espécie, no qual o primeiro é o nome genérico, e os dois nomes são ditos específicos.
Trichechus inunguisHomo sapiensArabidopsis thalianaEscherichia coliChromobacterium violaceum
O sistema de classificação das espécies segue uma hierarquia de categorias crescentes que formalizam o agrupamento de organismos, o qual deve ser feito a partir do reconhecimento da história de ancestralidade comum das espécies.
A nomenclatura binomial da espécie é a primeira
etapa no agrupamento: espécies derivadas do
mesmo ancestral comum imediato são geralmente
agrupadas no mesmo gênero.
As demais categorias são mais amplas, isto é,
agrupam táxons de acordo com ancestrais comuns
mais e mais antigos:
• Gêneros são agrupados em uma Família, pois
compartilham um ancestral comum recente.
• Famílias são agrupadas em Ordens, que se
agrupam em Classes, que são agrupadas em Filos,
que se agrupam em Reinos e um dos 3 Domínios.
A Sistemática Filogenética conecta a
diversidade biológica à história evolutiva
Filogenia = A história evolutiva de uma espécie ou grupo de espécies
relacionadas.
Filogenia é geralmente representada como árvores filogenéticas
que traçam relacionamentos evolutivos inferidos, revelando a
história de ancestralidade comum entre espécies.
Sistemática = O estudo e classificação da diversidade biológica em um
contexto evolutivo.
A diversidade biológica reflete episódios passados de especiação
e macroevolução.
Taxonomia = Identificação , nomeação e classificação de espécies; é um
componente da sistemática.
2
Organismos podem ser representados em um diagrama (árvore) que ilustra seus relacionamentos evolutivos. Usando dados morfológicos e moleculares, podemos estimar os ancestrais comuns inferidos pelos pontos de divergência nas árvores filogenéticas.
Que são árvores?
Charles Darwin (1837) Anotações sobre padrões de especiação nos Tentilhões de Galápagos
OTU 1
OTU 2
OTU 3
OTU 4
OTU 5
OTU 6
Árvore Filogenética
15 4 3 2678No de diferenças
n1
n2
n3
n4
n5
n
OTU unidade taxonômica operacional - populações, espécies ou grupos
nó interno - ~ ancestral comum do passado
tempoantiga recente
raiz
Topologias equivalentes
Por quê árvores?
Por quê representamos evolução como árvore e não outro tipo de gráfico?
CA DBA B C D
Ciclo, reticulação
A
BC
D
• Evolução é divergência – espécies se modificam
com o tempo - Transformacionismo
Darwin: “Descendência com modificação”
• Por várias razões, reticulação torna-se um
fenômeno raro com o tempo – provavelmente no
Pré-Cambriano as reticulações devido a
transferências gênicas horizontais, fusões de
células, etc, eram muito comuns.
• Reticulações são difíceis de se representar.
3
Sang et al., 1997
Árvores reticuladas
Ex: espécies híbridasde Paeonia sp.
Grou
japonensis
americana
grus
nigrocollis
monachus
canadensis
bugeranus
virgo
paradisea
leucogeranus
antigone
rubicanda
vipio
Filogenia do grou
japonensis
americana
grus
nigrocollis
monachus
canadensis
bugeranus
virgo
paradisea
leucogeranus
antigone
rubicanda
vipio
Cladograma Árvore UPGMA
Citocromo b (Mooers et al., 1999)
Grus sp
leucogeranus antigone
rubicanda
vipio
japonensis
americana
grus
nigricollis
monachus
canadensis
Bugeranus
virgo
paradisea
japonensis
americana
grus
nigrocollis
monachus
canadensis
bugeranus
virgo
paradisea
leucogeranus
antigone
rubicanda
vipio
Filogenia do grou
Árvore UPGMA
Citocromo b (Mooers et al., 1999)
Árvore sem raiz
Árvore filogenética para os tentilhõesde Galápagos.
Estas 13 espécieshabitam as Ilhas Galápagos. Esta árvore é baseadaem estudos comparativos deestruturas do corpo, especialmente forma e tamanho dos bicos, e nos estudos de campo sobre isolamento reprodutivo e comportamento alimentar.
Conexão entre classificação e filogeniaA natureza da ramificação de uma árvore evolutiva reflete o arranjo hierárquico de táxons (taxa). Esta árvore sugere as afinidades genealógicas entre táxons subordinados à ordem Carnivora, ou seja, o padrão de especiação para este grupo.
4
Árvores filogenéticas baseadas em sistemáticaDois métodos, comparação de proteínas do sangue e hibridização DNA-DNA, foram usados para construir esta árvore de espécies de ursos e procionídeos.
Antiga controvérsia sobre afinidades entre focas, leões marinhos e morsas
A relação filogenética entre Phoecidae, Odobaenidae e
Otaridae já foi extremamente discutida. Hoje é considerada
um grupo monofilético, a família Pinnipedia, mas focas já foram consideradas grupo
irmão de Lontras (Mustelidae)
Qual relação entre procariotos e eucariotos?
Qual a origem das mitocôndrias e dos cloroplastos?
Árvores filogenéticas podem nos dar informações sobre o
passado remoto
Classificação: Reinos e Domínios
Atualmente a sistemática filogenética reconhece 3 domínios
Origem dos 3 domínios da vida no Pré-Cambriano
5
Riq
uét
sias
Mit
ocô
nd
rias
outras bactérias
ArchaeaEucariotos
Nature, 1998
Grupos irmãos de ciclídeos doLago Tanganika na África oriental
Árvores nos informam sobre processos recentes de diversificação de populações e espécies
Árvore MP C0I (E. Michel, 1999)
Árvores filogenéticas e epidemiologia
Dentista com HIV deu origem a um surtoregional nos EUA
Freeman e Herron, 1998
pacie
nte
B-x
pacie
nte
B-y
pacie
nte
A-x
pacie
nte
E-y
pacie
nte
E-x
pacie
nte
C-x
pacie
nte
C-y
Dentista
-y
pacie
nte
A-y
pacie
nte
G-x
pacie
nte
G-y
Den
tista
X
LC02-x
LC03-x
LC02-y
LC09
LC35
pacie
nte
D-x
pacie
nte
D-y
LC03-y
pacie
nte
F-x
pacie
nte
F-y
HIV
LI
Filogenias de agentes infecciosos permitem traçar surtos e pandemias, assim como auxiliam nas estratégias de controle de epidemias como da gripe H1N1 ou para o desenvolvimento de vacinas da gripe comum.
Reconstruções filogenéticas e Conservação da Biodiversidade
• Filogenética pode ser extremamente útil para estudos de biodiversidade (inventariamento e classificação) e estabelecimento de prioridades conservacionistas.
• Medidas de diversidade que utilizam filogenias de sequências de DNA estão agora sendo usadas para implementar planos de conservação de espécies, priorizar unidades de conservação, definir unidades de manejo etc.
• Ex: filogenias (e filogeografia) são usadas para identificar ESUs (unidades evolutivamente significantes), as quais representam populações importantes para manter a dinâmica evolutiva de uma espécie.
10-20 milhões de anos
marinho
africano
amazônico
Filogenias dos peixes-bois (Trichechus sp)
Vianna et al 2006 Mol Ecol
marinho
africano
amazônico
Populações do clado III do peixe-boi marinho (Trichechus manatus) possuem uma distribuição restrita às Guianas e ao Brasil, portanto são unidades evolutivas independentes (ESU) das demais nesta espécie.
Árvore sem raiz (rede MJ) da região controle do DNAmt
Vianna et al 2006 Mol Ecol
6
B0665
B0663
B0655
B0653
B0654
B0656
B0369
B0367
B0368
B0609
B0647
B0317
B0329
B0326
B0658
B0644
B0657
B0677
B0678
B0646
B0291
B0292
B0290
B0680
B0643
B0660
B0281
B0285
B1189
B1301
B1188
B1296
B1186
B1303
B0525
B0524
B0515
B0511
B0513
B0528
B0535
B0562
B1148
B1147
B1150
99
99
99
99
90
99
99
99
99
99
99
99
99
99
99
91
99
99
99
82
90
D. ochropyga
D. ferruginea
R. ardesiaca
D. squamata
B0335
P. leucoptera
M. loricata
T. major
D. plumbeus
F. serrana
D. mentalis
H. atricapillus
S. cristatus
T. doliatus
T. caerulescens
T. ambiguus
T. pelzelni
Árvore NJ COI em Thamnophilidae
Vilaça et al. 2006
Termos filogenéticos
• Homologia
• Analogia
• Convergência, Reversão
• Plesiomorfia – estado ancestral – “0” (Simplesiomorfia)
• Apomorfia – estado derivado – “1” (Autapomorfia - Sinapomorfia)
Homologia: um caráter (ancestral ou derivado) compartilhado entre duas ou mais espécies, o qual estava presente no ancestral comum destas.
Analogia: caráter “compartilhado”, geralmente não-presenteno ancestral comum (i.e., o caráter evolui duas vezes, independentemente): evolução convergente (ou paralela) e reversão ao estado ancestral. A estecaráter recorrente damos o nome de Homoplasia.
Analogia
1 32 4Espécies:
Estado do caráter:
estado ancestral
Nas spp. 1 e 3 há uma analogia (caráter análogo) ou homoplasia;
Origem independente – evolução paralela ou convergente .
Homologia Ancestral (0)
1 32 4Espécies:
Estado do caráter:
estado ancestral
Nas spp. 1, 3 e 4 há uma homologia ancestral (simplesiomorfia);é ancestral porque está presente na base da árvore, no ancestral comum de todas 4 spp atuais.
Homologia Derivada (1)
1 32 4Espécies:
Estado do caráter:
estado ancestral
Nas spp. 1 e 2 aparece um caráter homólogo derivado(sinapomorfia). Aconteceu uma transição do estado “basal” ou primitivo no ancestral imediato destas duas spp ou OTUs.
7
Convergência: origem independente do caráter (i.e., duas linhagens fixam paralelamente um “fenótipo” similar).
Reversão: origem e subseqüente perda, ou mutação “de volta” ao caráter ancestral (i.e., reversão ao estado plesiomórfico).
Origem das Homoplasias Evolução Convergente = Aquisição de características
similares em espécies de diferentes linhas evolutivas,
devido ao compartilhamento de nichos ecológicos
similares, sendo a seleção natural responsável por
moldar adaptações análogas.
Exemplos: asas de pássaros e morcegos
bicos de aves e monotremados
Evolução convergente também se dá no nível molecular: sequências de DNA e proteínas podem sofrer mudanças paralelas, reversões, etc
EvoluçãoConvergente eSeleção Natural
Similaridades aparentes entre marsupiais australianos e mamíferos placentários em outros continentes.Estas espécies ocupam nichos parecidos nos diferentes continentes.
Um grupo monofilético:
é um grupo de táxons que inclui o ancestral comum e todos seus
descendentes
Exemplo de gruponão-monofilético: Répteis
Peixes TartarugasAnfíbios Cobras Crocodilos AvesMamíferos Lagartos
O ancestral comum mais recentedos répteis também deu origem aos mamíferos e aves
Filogenia dos grandes símios sem cauda
Famílias monofiléticas
HominidaePongidaeHyllobatidae
8
Filogenia dos grandes símios sem cauda
Famílias parafiléticas
HominidaePongidaeHyllobatidae
Esta classificação equivocada não representa a história evolutiva das espécies
Abordagens filogenéticas
Fenética (Taxonomia numérica)
Cladística (Sistemática Filogenética)
Fenética
• Abordagem Clássica (desde Linnaeus).
• Agrupa espécies baseada na similaridadefenotípica (ou genotípica).
• Usa todas características distinguíveis.
• Ex: métodos baseados em distâncias (UPGMA)
Análise de vários caracteres
(fenótipos, sítios polimórficos de DNA, freq. alélicas, etc.)
Matriz de dissimilaridade
em base ao número de diferenças
Construção
de árvore
filogenética
FenogramaA B C
A
B
C
3
7 6
0
0
0
A B CA B
A
B
C
Relações de similaridade
MÉTODOS FENÉTICOS
Cladística• A Teoria Evolutiva postula que grupos de
organismos relacionados descendem de um ancestral comum.
• Sistemática Filogenética (Cladística) é um método de classificação taxonômica baseado na história evolutiva.
Foi desenvolvido em 1950 por Willi Hennig, um entomologista alemão.
Cladística • Baseia-se no padrão de ancestralidade comum e
modificação das espécies e não em mera similaridade.
• Deve usar apenas caracteres derivados (apomórficos) compartilhados (sinapomórficos ou homólogos derivados).
• Portanto, objetiva traçar a história evolutiva real, o padrão de descendência com modificação.
• Ex: métodos baseados em caracteres (parcimônia).
9
Análise de vários caracteres com estados ancestrais (0) e
derivados (1)
Construção
de árvore filogenética
Cladograma
A B C
A
B
C
Relações de ancestralidade comum
MÉTODOS CLADÍSTICOS
D E1
2
3
4
5
6
7
8
E
D
1
2 3
4
5 6
7 8
Caracteres utilizados
SimNãoNãoCladística
SimSimSimFenética
HomologiasDerivadas
HomologiasAncestrais
Analogias
Besouro BorboletaCavalo
“Eventos Reais”
Besouro BorboletaCavalo
Fenética Cladística
Besouro BorboletaCavalo
Jacaré AveLagarto
“Eventos reais”
JacaréAve Lagarto
Fenética Cladística
Jacaré AveLagarto
10
Análise Filogenética
• Dado um conjunto de dados (caracteres morfológicos, alinhamento de múltiplassequências de DNA e proteína, etc), pode-se determinar (ou inferir) o relacionamento ancestral dentre asespécies.
Esp.1 Esp.2 Esp.3 Esp.4
Temp
o
Não-resolvidaou filogenia tipo “estrela”
Filogenia parcialmente resolvida
Completamente resolvida,filogenia bifurcada
A A A
B
B B
C
C
C
E
E
E
D
D D
Politomia ou multifurcação uma bifurcação
O objetivo da inferência filogenética é resolver a ordem deramificação das linhagens nas árvores evolutivas:
Há 3 possíveis árvores sem raiz para 4 táxons (A, B, C, D)
A C
B D
árvore 1
A B
C D
árvore 2
A B
D C
árvore 3
Métodos de reconstrução (ou inferência) filogenética objetivam
descobrir qual das árvores é a “mais provável".
Espera-se que esta seja a “verdadeira” árvore biológica — aquela que
seguramente represente a história evolutiva dos táxons analisados –
mas esta é formalmente chamada de árvore inferida a partir dos
dados, cuja confiança pode ser testada por diferentes métodos.
O número de árvores sem raiz aumenta exponencialmente com o número de táxons
# táxons
3456789
10....
30
# árvores sem raiz
13
15105945
10,935135,135
2,027,025....
3,58 x 1036
CA
B D
A B
C
A D
B E
C
A D
B E
C
F
Inferir relacionamentos evolutivos entre ostáxons requer enraizar a árvore:
Note que nesta árvore
enraizada, o táxon A não
está mais estreitamente
relacionado ao táxon B
em relação a C ou D
como sugerido acima.
A
BC
Raiz D
A B C D
Raiz
árvore enraizada
árvore sem raiz
O enraizamento em outra posição:
A
BC
raiz
D
árvore sem raiz
Note que nesta árvoreenraizada, táxon A é maisestreitamente relacionado aotáxon B, enquanto o C é mais relacionado ao D.
C D
raiz
árvore enraizada
A
B
11
Uma árvore sem raiz de 4 táxons pode ser enraizada em cinco lugares distintos para produzir cinco árvores enraizadas diferentes
árvore sem raiz:
A C
B D
árvore c/raiz 4 C
D
A
B
4
árvore c/raiz 3 A
B
C
D
3
árvore c/raiz 5 D
C
A
B
5
árvore c/raiz 2 A
B
C
D
2
árvore c/raiz 1 B
A
C
D
1
Estas árvores representam cinco histórias evolutivas diferentesentre os táxons, dependendo de onde se coloca a raiz !
# táxons
3456789....
30
# árvores sem raiz
13
15105945
10.395135.135....~3,58x10
36
# raízes
3579
111315....
57
# árvores com raiz
315
105945
10.395135.135
2.027.025....
~2,04x1038
x =
CA
B D
A D
B E
C
A D
B E
C
F
Cada árvore sem raiz pode teoricamente ser enraizada em qualquer lugar ao longo de qualquer de seus ramos
H C G G C H C G H
Árvores alternativas sobre relações evolutivas entre os três “grandes símios”
A árvore do meio é considerada a árvore científica “verdadeira” para a história evolutiva destas três espécies
Há dois modos principais de enraizar árvores:
Pelo grupo externo (outgroup ):Usa táxons de referência (o “outgroup”) que sabidamente se situam fora do grupo de interesse (o “ingroup”). Requer conhecimento a priori sobre relacionamentos entre os táxons. O outgroup pode ser uma espécie (ex: aves para enraizar uma árvore de mamíferos) ou cópias de genes duplicados (ex: -globina para enraizar -globinas).
outgroup
A
B
C
D
10
2
3
5
2
Pelo ponto-médio ou distância:enraiza a árvore no ponto médio entre os dois táxons mais distantes na árvore, tal como determinado pelo tamanho dos ramos. Pressupõe que os táxons evoluem coordenadamente (evolução constante entre linhagens). Esta suposição está embutida em alguns métodos fenéticos de construção de árvores tal como o UPGMA.
d (A,D) = 10 + 3 + 5 = 18Ponto-médio = 18 / 2 = 9
Todos estes rearranjos mostram o mesmo relacionamento evolutivo entre táxons
B
A
C
D
A
B
D
C
B
C
A
D
B
D
A
C
B
AC
Dárvore enraizada 1
B
A
C
D
A
B
C
D
Todas estas árvores são idênticas
Reconstruções
filogenéticas com dados
moleculares
12
Variabilidade genéticaFenotípica
Morfológica
Funcional
Protéica
DNA
Macromutações
SNP’s – mutações de ponto
Inserções de retroposons
Microssatélites
POP1
A - 0,4
B - 0,2
C - 0,9
D - 0,1
E - 0,2
POP2
A - 0,6
B - 0,5
C - 0,8
D - 0,3
E - 0,1
POP3
A - 0,3
B - 0,2
C - 0,9
D - 0,2
E - 0,4
Freqüências alélicas
Freqüência de um dos alelos em cinco locos bialélicos (A-E) em 3 populações (pop1, 2, 3)
Frequências alélicas servem apenas para comparações fenéticasintra-específicas.
MicrossatélitesAT
ATAT
AT
AT
CCGCCG
CCGCCG
CA CA CA CA
CA CA
CA
CA CA CA CA CA
CA CA CA CA CA CA
CAAlelo 3
Alelo 5
Alelo 7
são multi-alélicos
µ = 10-4 a 10-3 / loco / geração
Microssatélites servem geralmente apenas para comparações fenéticas intra-específicas.
SNPs ou mutações de ponto
Single Nucleotide Polymorphisms
são geralmente bialélicos
alelo 0 ...AAGCGTTATAGC...
alelo 1 ...AAGTGTTATAGC...
µ = 10-7 a 10-8 / locus / geração
SNPs podem ser utilizados para comparações cladísticas interespecíficas.
* * * ** * * * * * *
A aat tcg ctt cta gga atc tgc cta atc ctg
B ... ..a ..g ... .a. ... ... t.. ... ..a
C ... ..a ..c ..g ... ..t ... ... ... t.a
D ... ..a ..a ..g ..g ..t ... t.g ..t t..
Cada diferença de nucleotídio é um SNP e considerado
como um caráter na reconstrução filogenética
Obs:Pontos (.) se referem a posições de caracteres inalterados em relação
à primeira sequência (A)
* Posições com caracteres variáveis entre estas sequências
SNPs em sequências de DNAAnalogia
T C T C
C
1 32 4Espécies:
Estado do caráter:
estado ancestral
TNas spp. 1 e 3 há uma analogia (caráter análogo ou homoplasia);
Origem independente – evolução paralela ou convergente
13
Homologia Ancestral (0)
T C C
C
1 32 4Espécies:
Estado do caráter:
estado ancestral
CNas spp. 1, 3 e 4 há uma homologia ancestral (simplesiomorfia);é ancestral porque está presente na raiz da árvore (ancestral comum) como uma plesiomorfia.
C
Homologia Derivada (1)
T T C C
C
1 32 4Espécies:
Estado do caráter:
estado ancestral
TNas spp. 1 e 2 possuem homólogos derivados (sinapomorfia) (i.e., aconteceu uma transição do estado “basal” ou primitivo, no ancestral comum imediato destas duas spp ou OTUs).
Tipos de abordagensfilogenéticas utilizando
moléculas
Fenética
Similaridade geral
Cladística
Sistemática filogenética
Similaridade vs. relacionamento evolutivo
Similaridade e relacionamento evolutivo não são a mesma coisa, mesmo que relacionamento evolutivo seja inferido de certos tipos de similaridade.
Similar: ser semelhante (uma observação)
Relacionado: geneticamente conectado (um fato histórico)
Dois táxons podem ser mais similares sem ser mais relacionados:
Táxon A
Táxon B
Táxon C
Táxon D
1
1
1
6
3
5
O táxon C é mais similar ao A (d = 3)
do que ao B (d = 7), mas C e B são
mais estreitamente relacionados: C e
B compartilham um ancestral comum
mais recente do que os dois com A.
Métodos baseados em caracteres podem teoricamente discriminar os tipos de similaridade e encontrar a “verdadeira” árvore evolutiva .
Tipos de SimilaridadeSimilaridade observada entre duas OTUs pode ser por:
relacionamento evolutivo :caracteres ancestrais compartilhados (‘simplesiomorfias’)caracteres derivados compartilhados (‘’sinapomorfias’)
Homoplasia (evolução independente do mesmo caráter):Eventos Convergentes (em OTUs relacionadas ou não), Eventos Paralelos (em OTUs relacionadas), Reversões (em OTUs relacionadas ou não)
C
C
G
G
C
C
G
G
C
C
G
G
C
G
G
T
Convergentes Paralelos Reversões
Seleciona a árvore que melhor representa as distâncias observadas entre os pares.
Seleciona a árvore que tem a maior probabilidade de reproduzir os dados observados.
Seleciona a árvore que explica os dados com o menor número de substituições (eventos mutacionais fixados).
Distância
Verossimilhança
Parcimônia
Métodos gerais de reconstrução filogenética
CARÁTER
14
Tipos de dados usados em inferência filogenética
Métodos baseados em caracteres : Usam diretamente os caracteres alinhados, tais como sequências de DNA ou proteína
táxons caracteresespécie A ATGGCTATTCTTATAGTACG
espécie B ATCGCTAGTCTTATATTACA
espécie C TTCACTAGACCTGTGGTCCA
espécie D TTGACCAGACCTGTGGTCCG
espécie E TTGACCAGTTCTCTAGTTCG
Métodos baseados em distâncias: Transformam os dados em distâncias
(dissimilaridades) par-a-par, e usam a matriz durante inferência da árvore.
A B C D E
espécie A ---- 0,20 0,50 0,45 0,40
espécie B 0,23 ---- 0,40 0,55 0,50
espécie C 0,87 0,59 ---- 0,15 0,40
espécie D 0,73 1,12 0,17 ---- 0,25
espécie E 0,59 0,89 0,61 0,31 ----
Exemplo 1: Distância “p” (= percentagem observada de sequências diferentes)
Exemplo 2: distância Kimura 2-parâmetros(estimativa do número real de substituições entre táxons)
MATRIZ
Estima-se primeiro qual árvore sem raiz seria a mais “correta”A
B
C
D
Alguns métodos produzem a árvore já com a raiz (UPGMA), outros podem fornecer árvores com raiz se os dados
possuem informação suficiente (Parcimônia, Verossimilhança) e todos podem se utilizar ou necessitam obrigatoriamente de um grupo externo para produzir uma
árvore com raiz (Neighbor Joining - NJ)
Algoritmos baseados em distâncias(agrupamento)
Usam distâncias para calcular árvores filogenéticas. Estas são baseadas somente no número relativo de similaridades e diferenças entre um grupo de seqüências.
– Começa com uma matriz de distâncias par-a-par
– Estes métodos constróem uma árvore ligando os pares de
táxons menos distantes, sucessivamente ligando táxons
mais distantes.
– Ex: UPGMA (típico método fenético) e
Neighbor joining (NJ) que considera diferentes taxas
evolutivas entre linhagens.
Distâncias entre DNA• distâncias entre pares de seqüências de DNA são relativamente
simples de computar como a soma de diferenças de bases entre as
duas seqüências.
– Este tipo de algoritmo somente funciona para pares de
sequências similares o bastante para serem alinhadas
• Geralmente todas alterações de bases são consideradas iguais
• Inserções/deleções geralmente possuem um peso maior do que
substituições nucleotídicas (gap penalties).
• É também possível corrigir múltiplas substituições em um único sítio,
que é comum em relacionamentos filogenéticos distantes e para
sítios de rápida evolução.
UPGMA• O mais simples dos métodos de distância é o UPGMA (Unweighted
Pair Group Method using Arithmetic averages) e apenas reconstrói
fenogramas que representam meras relações de similaridade geral.
• Assume taxas evolutivas idênticas para todas as OTUs.
• Agrupa as distâncias menores e recalcula novas distâncias através
de médias aritméticas para novo agrupamento.
• Os programas do pacote PHYLIP DNADIST and PROTDIST calculam
distâncias genéticas entre grupos de seqüências criando uma
matriz de dissimilaridades (distâncias).
• Então o programa NEIGHBOR (que também constrói árvores NJ) do
PHYLIP constrói a árvore UPGMA a partir da matriz.
• Esta árvore é visualizada em um programa apropriado (Ex:
TREEVIEW ou PTP).
Métodos de Distância
a ACGA
b ATGC
c GTGC
d GCAA
a b c d
a 0
b 0,5 0
c 0,75 0,25 0
d 0,5 1,0 0,75 0
dij
15
a b cda b c d
a 0
b 0,5 0
c 0,75 0,25 0
d 0,5 1,0 0,75 0
dij
Métodos de Distância
Matriz Árvore UPGMA(mera similaridade)
a b c d
a 0
b 0,5 0
c 0,75 0,25 0
d 0,5 1,0 0,75 0
dij
Métodos de Distância
Matriz Árvore Neighbor-Joining(similaridade e
taxas evolutivas diferenciais)
bd
a
c
Máxima parcimônia
• Parcimônia é o método mais popular de reconstrução cladística dos relacionamentos por ancestralidade comum.
• Parcimônia permite o uso de toda informação evolutiva conhecida para a construção da árvore.
– em contraste, métodos de distância resumem todas diferenças entre pares de seqüências em um único número, a percentagem de diferença ou distância genética.
Exemplo de Parcimônia
• Considere 4 táxons com as seqüências: a (ACGA),
b (ATGC), c (GTGC), d (GCAA).
• A parcimônia deve decidir qual das 3 possíveis árvores
sem raiz (4 táxons), é a mais “correta” (parcimoniosa).
• Posteriormente, se houver informações suficientes, deve-
se colocar a raiz, a qual polariza o padrão de ramificações
sequenciais na árvore filogenética.
Exemplo de Parcimônia
a
b
c
d
a
c
b
d
a
d
b
c
a A C G A
b A T G C
c G T G C
d G C A A
árvore 1
árvore 2
árvore 3
1 2 3 4
Exemplo de Parcimônia
a
b
c
d
a A C G A
b A T G C
c G T G C
d G C A A
árvore 1
Tot
árvore 1 1
árvore 2
árvore 3
A
A
G
G
*
* = 1 etapa de mutação
1 2 3 4
16
Exemplo de Parcimônia
a
b
c
d
a A C G A
b A T G C
c G T G C
d G C A A
árvore 1
Tot
árvore 1 1 2
árvore 2
árvore 3
1 2 3 4 C
T C
T*
* = 2 etapas de mutação
*
Exemplo de Parcimônia
a
b
c
d
a A C G A
b A T G C
c G T G C
d G C A A
árvore 1
Tot
árvore 1 1 2 1
árvore 2
árvore 3
A
GG 1 2 3 4
* = 1 etapa de mutação
*
G
Exemplo de Parcimônia
a
b
c
d
a A C G A
b A T G C
c G T G C
d G C A A
árvore 1
Tot
árvore 1 1 2 1 2 6
árvore 2
árvore 3
A
A
1 2 3 4
C
C*
* = 2 etapas de mutação
*
Exemplo de Parcimônia
a
b
c
d
a
c
b
d
a
d
b
c
a A C G A
b A T G C
c G T G C
d G C A A
árvore 1
árvore 2
árvore 3
Tot
árvore 1 1 2 1 2 6
árvore 2 2 2 1 2 7
árvore 3 2 1 1 1 5
1 2 3 4
Exemplo de Parcimônia
a
d
b
cárvore 3
Árvore sem raiz escolhida pela análise de parcimônia
Neste caso temos informações adicionais de que táxon com a sequência d possa funcionar como um grupo externo (outgroup), portanto a raiz estará entre d e os outros ( ).
a b cdÁrvore com raiz escolhida usando d como outgroup
Exemplo de Parcimônia
a b cda A C G A
b A T G C
c G T G C
d G C A A
1
1 (A)1 (A)
A evolução dos caracteres apomórficos pode ser inferida a partir do Cladograma. Assim, eventos paralelos (recorrentes) de mutação podem ser identificados, os quais geram homoplasias
3 (G)
3
2 (T)
2
4 (C)
4
17
A análise de parcimônia pode discriminar alguns tipos de eventos paralelos.Na figura ao lado, 4 seqüências alinhadas homólogas (a) de distintos organismos foram utilizadas para construir uma árvore de parcimônia (b).Na árvore estão dispostas os eventos de mutações (apomorfias), numerados de 1 a 8. No evento 2, o estado alélico derivado (nucleotídio A) demonstrou ser um evento paralelo, aparecendo independentemente na seqüência do homem e do milho
Verossimilhança (L) é a probabilidade dos dados, dado o modelo de substituições nucleotídicos e uma hipótese de
topologia filogenética
Modelo evolutivo de substituições
Diferentes padrões de substituição nucleotídica específicos de cada conjunto homólogo de sequências de DNA.
A
C T
GTransição
Transversão
L = P (dados/árvore)
Máxima verossimilhança
Jukes-Cantor(1 parâmetro)
A frequência dos nucleotídios não é consideradaTodas substituições têm a mesma taxa
Kimura 2P(2 parâmetros)
A frequência dos nucleotídios não é consideradaTransições e transversões têm diferentes taxas
GTR (General Time Reversible)(6 parâmetros)
a
b
cd e
f
A frequência dos nucleotídios é consideradaTransições e transversões têm diferentes taxas, assim como os tipos de mudanças nucleotídicas
O modelo inapropriado desubstituições nucleotídicaspode levar a uma reconstrução filogenética incorreta.
18
Modeltest
Posada e Krandal
O software permite selecionar o modelo de substituição mais plausível para determinado conjunto de sequências, assim como outros parâmetros necessários para a reconstrução filogenética.
Dados reais: mudanças observadas e esperadas
• Comparação de sequências de chimpanzé e homem no DNAmt (307/1333 sítios são diferentes)
• Modelos com mais parâmetros se aproximam mais do padrão observado
LT = L (1) x L (2) x L (3) x L (4) x..x L (N) = L (i)
d
c
b
a
C
C
T
T
7654321
TGGAGA
TATAGA
TCCCGA
TCAGAA
Táxon
Táxon
Táxon
Táxon
aa
cc
bb
dd
aa
bb
cc
dd
aa
dd
cc
bb
Método baseado na avaliação probabilística de modelos evolutivos que melhor explicam um conjunto de dados de forma que este reflita a história evolutiva mais próxima da realidade
C A
L(5) = Prob +C G
A A
Prob +C
C
A
G
A C
C
C
A
G
C TProb +
Prob ... +
Prob +C
C
A
G
N N
Máxima verossimilhança Problemas na reconstruçãofilogenética
As taxas evolutivas são diferentes para cada gene ou segmento anônimo de DNA.
Árvores filogenéticas contam a história do caráter, mas não necessariamente da espécie.
Taxas de mutação/evolução Árvores de genes e de espécies
• A história evolutiva de genes reflete aquela das espécies que os carregam, exceto quando:– Transferência horizontal = transferência gênica entre
espécies (ex. entre bactérias, mitocôndrias em híbridos)
– Duplicação gênica : ortologia/ paralogia
Incongruência entre árvores de genes e espécies
19
Associações históricas
Page e Charleston, 1998
Eventos entre gene (associado) e a espécie (host)
Page e Charleston, 1998
Reconstrução da filogenia de espécies: artefatos devido à paralogia
Perda de genes pode acontecer durante a Evolução: mesmo sequências com Perda de genes pode acontecer durante a Evolução: mesmo sequências com genomas completos pode ser difícil detectar paralogiagenomas completos pode ser difícil detectar paralogia
Rat Mouse Rat Mouse
GNS1 GNS1
GNS1 GNS2
GNS2 GNS2GNS1 GNS2
Hamster Hamster
especiação
duplicação
Mouse Rat
GNS GNSGNS
Hamster
Árvore verdadeiraÁrvore obtida com amostragem parcial
de genes homólogos, mas parálogos