34
1 Seleção de modelos de substituição de nucleotídeos II 1. Testes (hierárquicos) da razão das verossimilhanças [hLRT] 2. Critério de informação 3. Enfoque Bayesiano Objetivos: Compreender como escolher entre diferentes modelos de substituição que competem entre si para explicar os dados de sequências alinhadas.

Seleção de modelos de substituição de nucleotídeos II

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Seleção de modelos de substituição de nucleotídeos II

1

Seleção de modelos de substituição de nucleotídeos − II

1. Testes (hierárquicos) da razão das verossimilhanças [hLRT]

2. Critério de informação

3. Enfoque Bayesiano

Objetivos: Compreender como escolher entre diferentes modelos de substituição que competem entre si para explicar os dados de sequências alinhadas.

Page 2: Seleção de modelos de substituição de nucleotídeos II

2

Seleção de modelos de substituição II

1. Teste da razão das verossimilhanças

345

Page 3: Seleção de modelos de substituição de nucleotídeos II

3

10.1 Modelos de evolução e reconstrução filogenética

Inferência estatística: processo pelo qual conclusões são tiradas de dados que estão sujeitos a variação aleatória, por exemplo, erros de observação ou erros de amostragem. 345

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

Page 4: Seleção de modelos de substituição de nucleotídeos II

4

tij etp α4

41

41)( −−=t

ii etp α4

43

41)( −+=

Probabilidades de substituição no modelo de Jukes−Cantor

A G

TC

α

α

αα αα

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

Page 5: Seleção de modelos de substituição de nucleotídeos II

5

A G

TC

α

α

ββ ββ

TGCA ππππ ===

A G

TC

α

α

αα αα

TGCA ππππ ===1 2 3 4

3451. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

Page 6: Seleção de modelos de substituição de nucleotídeos II

6

10.2 Ajuste de modelos

3471. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

Page 7: Seleção de modelos de substituição de nucleotídeos II

7

• Testes (hierárquicos) da razão das verossimilhanças [hLRT]

• Critério de informação

• Bayesiano

Enfoques para a seleção de modelos de evolução

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

Page 8: Seleção de modelos de substituição de nucleotídeos II

),,,( ντθMDPL ∝347

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

Page 9: Seleção de modelos de substituição de nucleotídeos II

Sequência 1 — A A T C G A G C C A T A G C G

Sequência 2 — A A C A G A C A C A G T C C G

Sequência n — A A C A G A C A C A G T C C G

M

Dados, amostra − alinhamento

L ∝ P(D⏐M,θ,τ,ν)

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

Page 10: Seleção de modelos de substituição de nucleotídeos II

A G

TC

Modelo de evolução

L ∝ P(D⏐M,θ,τ,ν)

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

Page 11: Seleção de modelos de substituição de nucleotídeos II

11

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

=

ãosubstituiç de taxas nas variaçãoosnucleotíde entre ãosubstituiç de taxas

osnucleotíde de sfrequênciaotransversã:transiçãorazão

θ

Vetor de parâmetros do modelo de evolução

L ∝ P(D⏐M,θ,τ,ν)

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

Page 12: Seleção de modelos de substituição de nucleotídeos II

12

1 2 3 4

Topologia da árvore

L ∝ P(D⏐M,θ,τ,ν)

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

Page 13: Seleção de modelos de substituição de nucleotídeos II

13

Vetor de comprimento dos ramos

1 2 3 4

ν1 ν2

ν3 ν4 ν5 ν6

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

=

νν

νM2

1

L ∝ P(D⏐M,θ,τ,ν)

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

Page 14: Seleção de modelos de substituição de nucleotídeos II

14

10.3 Testes (hierárquicos) da razão das verossimilhanças [hLRT ]

3481. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

Page 15: Seleção de modelos de substituição de nucleotídeos II

15

( ) ( )⎥⎥⎥⎥

⎢⎢⎢⎢

−+⎥⎥⎥

⎢⎢⎢

+= −−

434214434421ijii p

t

p

t eeL αα 44 1161ln731

161ln8ln

Função de verossimilhança

αt — número esperado de substituições por sítio

ln L

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

Page 16: Seleção de modelos de substituição de nucleotídeos II

16

Estatística do teste da razão

das verossimilhanças

Λ− log201 loglog2 LL −

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

Page 17: Seleção de modelos de substituição de nucleotídeos II

17

86,7675log 0 −=L

Peixe

Rã Humano

Pássaro

Rato

A G

TC

α

α

αα αα

TGCA ππππ ===

Peixe

Rã Humano

Pássaro

Rato

α

α

αα αα

A G

TC

TGCA ππππ ≠≠≠

08,7667log 1 −=L

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

Page 18: Seleção de modelos de substituição de nucleotídeos II

18348

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

Page 19: Seleção de modelos de substituição de nucleotídeos II

19348

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

Page 20: Seleção de modelos de substituição de nucleotídeos II

20

• Estatística do teste da razão das

verossimilhanças, −2 log Λ, pode ser

comparada à distribuição χ2 com 3

graus de liberdade

−2 log Λ = 17,56 > valor crítico = 7,18

Hipótese alternativa explica os dados

significativamente melhor que a

hipótese nula

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

Page 21: Seleção de modelos de substituição de nucleotídeos II

21

• Testes (hierárquicos) da razão das verossimilhanças [hLRT]

– Comparação de dois modelos

– Modelos hierárquicos

1. Teste da razão das verossimilhanças

Seleção de modelos de substituição II

Page 22: Seleção de modelos de substituição de nucleotídeos II

22

1. Testes (hierárquicos) da razão das verossimilhanças [hLRT]

2. Critério de informação

3. Enfoque Bayesiano

Seleção de modelos de substituição de nucleotídeos − II

Page 23: Seleção de modelos de substituição de nucleotídeos II

23

10.4 Critério de informação

3492. Critério de informação

Seleção de modelos de substituição II

Page 24: Seleção de modelos de substituição de nucleotídeos II

24

• Critério de informação de

Akaike

– Medida da distância entre o

modelo verdadeiro e o modelo

estimado

KlAIC 22 +−=2. Critério de informação

Seleção de modelos de substituição II

Page 25: Seleção de modelos de substituição de nucleotídeos II

25351

2. Critério de informação

Seleção de modelos de substituição II

Page 26: Seleção de modelos de substituição de nucleotídeos II

26

1)1(2

−−+

+=KnKKAICAICc

3512. Critério de informação

Seleção de modelos de substituição II

Page 27: Seleção de modelos de substituição de nucleotídeos II

27

• Critério de informação

– Comparação simultânea de todos os modelos

– Comparação de modelos hierárquicos e não-hierárquicos

2. Critério de informação

Seleção de modelos de substituição II

Page 28: Seleção de modelos de substituição de nucleotídeos II

28

1. Testes (hierárquicos) da razão das verossimilhanças [hLRT]

2. Critério de informação

3. Enfoque Bayesiano

Seleção de modelos de substituição de nucleotídeos − II

Page 29: Seleção de modelos de substituição de nucleotídeos II

29

10.5 Enfoque Bayesiano

)(

)(

j

iij MDP

MDPB =

3. Enfoque Bayesiano

351

Seleção de modelos de substituição II

Page 30: Seleção de modelos de substituição de nucleotídeos II

30

αt — número esperado de substituições por sítio

ln L

)(

)(

j

iij MDP

MDPB =

3. Enfoque Bayesiano

351

Seleção de modelos de substituição II

Page 31: Seleção de modelos de substituição de nucleotídeos II

313. Enfoque Bayesiano

351

Seleção de modelos de substituição II

Page 32: Seleção de modelos de substituição de nucleotídeos II

323. Enfoque Bayesiano

351

Seleção de modelos de substituição II

Page 33: Seleção de modelos de substituição de nucleotídeos II

333. Enfoque Bayesiano

351

Seleção de modelos de substituição II

Page 34: Seleção de modelos de substituição de nucleotídeos II

34

1. Testes (hierárquicos) da razão das verossimilhanças [hLRT]

2. Critério de informação

3. Enfoque Bayesiano

Seleção de modelos de substituição de nucleotídeos − II