Seleção de modelos de substituição de nucleotídeos II

Preview:

Citation preview

1

Seleção de modelos de substituição de nucleotídeos − II

1. Testes (hierárquicos) da razão das verossimilhanças [hLRT]

2. Critério de informação

3. Enfoque Bayesiano

Objetivos: Compreender como escolher entre diferentes modelos de substituição que competem entre si para explicar os dados de sequências alinhadas.

2

Seleção de modelos de substituição II

1. Teste da razão das verossimilhanças

345

3

10.1 Modelos de evolução e reconstrução filogenética

Inferência estatística: processo pelo qual conclusões são tiradas de dados que estão sujeitos a variação aleatória, por exemplo, erros de observação ou erros de amostragem. 345

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

4

tij etp α4

41

41)( −−=t

ii etp α4

43

41)( −+=

Probabilidades de substituição no modelo de Jukes−Cantor

A G

TC

α

α

αα αα

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

5

A G

TC

α

α

ββ ββ

TGCA ππππ ===

A G

TC

α

α

αα αα

TGCA ππππ ===1 2 3 4

3451. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

6

10.2 Ajuste de modelos

3471. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

7

• Testes (hierárquicos) da razão das verossimilhanças [hLRT]

• Critério de informação

• Bayesiano

Enfoques para a seleção de modelos de evolução

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

),,,( ντθMDPL ∝347

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

Sequência 1 — A A T C G A G C C A T A G C G

Sequência 2 — A A C A G A C A C A G T C C G

Sequência n — A A C A G A C A C A G T C C G

M

Dados, amostra − alinhamento

L ∝ P(D⏐M,θ,τ,ν)

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

A G

TC

Modelo de evolução

L ∝ P(D⏐M,θ,τ,ν)

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

11

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

=

ãosubstituiç de taxas nas variaçãoosnucleotíde entre ãosubstituiç de taxas

osnucleotíde de sfrequênciaotransversã:transiçãorazão

θ

Vetor de parâmetros do modelo de evolução

L ∝ P(D⏐M,θ,τ,ν)

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

12

1 2 3 4

Topologia da árvore

L ∝ P(D⏐M,θ,τ,ν)

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

13

Vetor de comprimento dos ramos

1 2 3 4

ν1 ν2

ν3 ν4 ν5 ν6

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

=

νν

νM2

1

L ∝ P(D⏐M,θ,τ,ν)

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

14

10.3 Testes (hierárquicos) da razão das verossimilhanças [hLRT ]

3481. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

15

( ) ( )⎥⎥⎥⎥

⎢⎢⎢⎢

−+⎥⎥⎥

⎢⎢⎢

+= −−

434214434421ijii p

t

p

t eeL αα 44 1161ln731

161ln8ln

Função de verossimilhança

αt — número esperado de substituições por sítio

ln L

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

16

Estatística do teste da razão

das verossimilhanças

Λ− log201 loglog2 LL −

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

17

86,7675log 0 −=L

Peixe

Rã Humano

Pássaro

Rato

A G

TC

α

α

αα αα

TGCA ππππ ===

Peixe

Rã Humano

Pássaro

Rato

α

α

αα αα

A G

TC

TGCA ππππ ≠≠≠

08,7667log 1 −=L

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

18348

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

19348

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

20

• Estatística do teste da razão das

verossimilhanças, −2 log Λ, pode ser

comparada à distribuição χ2 com 3

graus de liberdade

−2 log Λ = 17,56 > valor crítico = 7,18

Hipótese alternativa explica os dados

significativamente melhor que a

hipótese nula

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

21

• Testes (hierárquicos) da razão das verossimilhanças [hLRT]

– Comparação de dois modelos

– Modelos hierárquicos

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

22

1. Testes (hierárquicos) da razão das verossimilhanças [hLRT]

2. Critério de informação

3. Enfoque Bayesiano

Seleção de modelos de substituição de nucleotídeos − II

23

10.4 Critério de informação

3492. Critério de informação

Seleção de modelos de substituição II

24

• Critério de informação de

Akaike

– Medida da distância entre o

modelo verdadeiro e o modelo

estimado

KlAIC 22 +−=2. Critério de informação

Seleção de modelos de substituição II

25351

2. Critério de informação

Seleção de modelos de substituição II

26

1)1(2

−−+

+=KnKKAICAICc

3512. Critério de informação

Seleção de modelos de substituição II

27

• Critério de informação

– Comparação simultânea de todos os modelos

– Comparação de modelos hierárquicos e não-hierárquicos

2. Critério de informação

Seleção de modelos de substituição II

28

1. Testes (hierárquicos) da razão das verossimilhanças [hLRT]

2. Critério de informação

3. Enfoque Bayesiano

Seleção de modelos de substituição de nucleotídeos − II

29

10.5 Enfoque Bayesiano

)(

)(

j

iij MDP

MDPB =

3. Enfoque Bayesiano

351

Seleção de modelos de substituição II

30

αt — número esperado de substituições por sítio

ln L

)(

)(

j

iij MDP

MDPB =

3. Enfoque Bayesiano

351

Seleção de modelos de substituição II

313. Enfoque Bayesiano

351

Seleção de modelos de substituição II

323. Enfoque Bayesiano

351

Seleção de modelos de substituição II

333. Enfoque Bayesiano

351

Seleção de modelos de substituição II

34

1. Testes (hierárquicos) da razão das verossimilhanças [hLRT]

2. Critério de informação

3. Enfoque Bayesiano

Seleção de modelos de substituição de nucleotídeos − II

Recommended