27
Parcimônia e medidas de suporte Almir R. Pepato

Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

Embed Size (px)

Citation preview

Page 1: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

Parcimônia e medidas de suporte

Almir R. Pepato

Page 2: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

O problemaPara cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas por árvores não-enraizadas, definido pela fórmula:

Os métodos de inferência filogenéticas são os que permitem a escolha, dentre todas essas hipóteses, daquela que consideramos a que melhor representa as relações de ancestralidade dentre os terminais em consideração.

Page 3: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

Número de clados

Enraizada(2n-3)!/(2n-2(n-2)!)

Não-enraizada(2n-5)!/(2n-3(n-3)!)

2 1 1

3 3 1

4 15 3

5 105 15

6 954 105

7 10,395 954

8 135,135 10,395

9 2,027,025 135,135

10 34,459,425 2,027,025

O problema

Page 4: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

Métodos de inferência

A- Algoritmos- Uma série de passos que conduzem à árvore filogenética.

A1-Análises de agrupamento (UPGMA)A2- Neighbour Joining

B- Critérios de Otimização – Emprega uma função objetiva para comparar as hipóteses filogenéticas.

B1- Máxima ParcimôniaB2- Máxima VerossimilhançaB3- Evolução MínimaB4- Mínimos Quadrados

C- Inferência Bayesiana - Avalia a probabilidade posterior dos clados formados pelos terminais sob consideração.

Page 5: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

Parcimônia

De forma independente, Luca Cavalli-Sforza e Anthony Edwards em 1963 e Camin e Sokal em 1965 chegaram a parcimônia como critério para otimização de cladogramas em caso de conflito entre caracteres (homoplasia)

William de Ockham (1288-1347 ou 1348)“entia non sunt multiplicanda praeter necessitatem”

Page 6: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

Parcimônia

Função objetiva da parcimônia:

Page 7: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

Parcimônia

Page 8: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

Parcimônia de Fitch

Premissas: Caracteres não polarizados e não ordenados. Todas as mudanças de caráter com o mesmo custo.

1- Para cada terminal atribua um estado de caráter conforme a matriz à sua disposição. Estabeleça arbitrariamente uma raiz (ela não muda o comprimento da árvore).

C

A

GC

A

Page 9: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

Parcimônia de Fitch

C

A

G

C

A

Visite um nó interno para o qual se conhece o conjunto de caracteres Sk para os dois descendentes (Si, Sj) imediatos. Assinale a ele um conjunto de valores Sk conforme as regras:

A- Se então , nesse caso deve-se acrescentar 1 ao comprimento da árvore;

B- Se então nesse caso não se acrescenta nada ao comprimento da árvore.

Comprimento: 3

X

Y

Z

1

1

0W 1

Page 10: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

Generalizando... Parcimônia de Sankoff

A C G T

A 0 1 1 1

C 1 0 1 1

G 1 1 0 1

T 1 1 1 0

Parcimônia de Fitch

A B C D

A 0 1 2 3

B 1 0 1 2

C 2 1 0 1

D 3 2 1 0

Parcimônia de Wagner, caracteres ordenados:A-B-C-D

A B C D

A 0

B 1 0

C 2 1 0

D 3 2 1 0

Parcimônia de Dollo, caracteres ordenados:A-B-C-D

As matrizes de Sankoff permitem que o procedimento apresentado para a parcimônia de Fitch seja generalizado para outras situações.

Page 11: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

Generalizando... Parcimônia de Sankoff

Page 12: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

Algoritmos de busca

A

B C

1

2a

Árvore inicial, três espécies ao acaso.

A

B D

C

A

BD C

A

B C

D2b 2c

E

E

EE

E

Adiciona-se o próximo táxon (D) (três árvores):

Adiciona-se o quinto táxon(E) (15 árvores)....

Impraticável para um número maior de terminais!!!!!

Page 13: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

Nearest-neighbor interchanges (NNI)

Page 14: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

Subtree pruning and regrafting (SPR)

Page 15: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

Tree bisection and reconnection (TBR)

Page 16: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

Algoritmos de Busca

Page 17: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

Novas TecnologiasRatchet:

Desenhado para maximizar o número de pontos iniciais e reduzir o tempo gasto na procura a partir de cada ponto inicial e assim examinar mais ilhas de árvores. Perturba os dados mudando o peso a eles atribuído.

Tree fusing (TF):

Troca de sub-grupos idênticos entre árvores diferentes.

Sectorial Seaches (SS):Tipo especial de avaliação de rearranjo, que necessita de uma árvore como ponto inicial. Seleciona diferentes setores da árvore e os re-analisa separadamente. Se uma configuração melhor é encontrada, ela é substituída na árvore inicial.

Page 18: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

Novas Tecnologias

Tree Drifting (DFT): Soluções sub-ótimas são aceitas durante o rearranjo, com uma certa probabilidade. A probabilidade de aceitar uma solução sub-ótima depende da Relative Fit Difference (RFD) e a diferença de comprimento entre a nova e a velha solução.

RFDAB = (F–C)/F

F = Soma das diferenças de passosnas duas árvores (A e B) quemelhor ajusta (fit) a árvore A

C = Soma dos caracteres quemelhor ajustam (fit) a árvore B

Page 19: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

ÍndicesÍndice de consistência (CI)- É a medida de quão bem um caráter ajusta-se a uma topologia. É calculado dividindo-se o menor número possível de passos do caráter pelo número de passos observados ao longo da topologia. Ou então é uma medida de homoplasia de uma árvore, sendo dado por:

CI = Número total de mudanças de estado esperado dada a matriz de dados X 100/ Número de passos na árvore

CI= 6*100/7 = 85,7

Page 20: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

Índices

Page 21: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

ÍndicesÍndice de retenção (RI):

RI = Número máximo de passos na árvore – número de mudanças de estado na árvore X 100/número máximo de passos na árvore – número de mudanças de estado nos dados

Page 22: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

SuporteBootstrap

Page 23: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

SuporteBootstrap

Page 24: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

Suporte

Suporte de Bremer:

Quanta homoplasia é necessária para derrubar um clado?

Ex: A menor árvore que NÃO tem o clado (A C) é dois passos mais longa que a árvore apresentada.

Page 25: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

Problemas com a Parcimônia

Page 26: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

Qual método empregar?

Huelsenbeck et al., 1996

Page 27: Parcimônia e medidas de suporte Almir R. Pepato. O problema Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas

Qual método empregar?

Huelsenbeck et al., 1996