Comparação entre sequências de DNA - ib.unicamp.br · Comparação entre sequências de DNA 1....

Preview:

Citation preview

Comparação entre sequências de DNA

1. Processo evolutivo de divergência e mutação em

sequências de DNA

2. Implicações metodológicas do processo de mutação

3. Princípios metodológicos de comparação de

sequências de DNA

Objetivo: Compreender a natureza dos processos

de divergência e mutação e suas implicações para a

comparação entre sequências de DNA.

EspaEspaççooTem

po

Tem

po

Descendência com modificação

Histórica Comparativa Inferencial

A sistemática biológica éuma ciência

Matriz de caracteres alinhadosEvolução (não-observável)

CGACTTG

CCACATG

DADOS DE SEQUÊNCIAS

GC TAA

Análise filogenética

População descendente População descendente

Sequências descendentes

AA

CCTT

População ancestral

Sequência ancestral

Comparação de sequências

1. Divergência e mutação

ACTGAACGTAACGC

ACTAAACGTAATGC

Mutação de ponto

ACTGAATGTAACGC

Comparação de sequências

1. Divergência e mutação

ACTGAACGTAACGC

ACTAAACGTAATGC

Deleção

A∗TGAATGTAACGC

Comparação de sequências

1. Divergência e mutação

ACTGAACGTAACGC

ACTAAACGTCAATGC

Inserção

A∗TGAATGTAACGC

Comparação de sequências

1. Divergência e mutação

ACTGAACGTAACGC

ACTAAACGTCAATGC

Mutação de pontoDeleçãoInserção

A∗TGAATGTAACGC

Comparação de sequências

1. Divergência e mutação

Comparação entre sequências de DNA

1. Processo evolutivo de divergência e

mutação em sequências de DNA

2. Implicações metodológicas do processo de

mutação

3. Princípios metodológicos de comparação de

sequências de DNA

ACTGAACGTAACGC

ACTAAACGTAATGC

Mutação de ponto

ACTGAATGTAACGC

Comparação de sequências

2. Implicações metodológicas

• Mutações de ponto não mudam as posições

relativas das bases nas sequências

descendentes em relação à sequência ancestral

ACTGAACGTAACGC

Inserção

ACTAAACGTCAATGC A∗TGAATGTAACGC

ACTGAACGTAACGC

Deleção

ACTAAACGTAATGC A∗TGAATGTAACGC

Comparação de sequências

2. Implicações metodológicas

• Mutações de deleção e inserção mudam as

posições relativas das bases nas sequências

descendentes em relação à sequência ancestral

ACTAAACGTCAATGC ATGAATGTAACGC

ACTGAACGTAACGC

Processo evolutivo

Comparação de sequências

2. Implicações metodológicas

• Mutações de deleção e inserção alteram as posições relativas

dos sítios de nucleotídeos entre as sequências descendentes e a

sequência ancestral.

• Mutações de deleção e inserção alteram o comprimento das

sequências descendentes.

Comparação de sequências

2. Implicações metodológicas

Preservação − destruição

da informação

ACTGAACGTAACGC

ACTAAACGTCAATGC ATGAATGTAACGC

ACTGAACGTAACGC

ACTAAACGTAATGC ACTGAATGTAACGC

Mutação de ponto Deleção/Inserção

ACTAAACGTCAATGC ATGAATGTAACGC

ACTGAACGTAACGC

Processo evolutivo

Comparação de sequências

2. Implicações metodológicas

Dados experimentaisACTAAACGTCAATGCATGAATGTAACGC

Comparação de sequências

2. Implicações metodológicas

Dados experimentais

ACTAAACGTCAATGCATGAATGTAACGC

• Comparações de sequências obtidas experimentalmente devem ser feitas entre bases cujas posições (sítios) coincidem no ancestral comum (homólogas).

• Problema consiste em restabelecer (estimar) a homologia ancestral nos sítios, perturbada pelas mutações de ponto, deleções e inserções.

• Solução consiste em introduzir espaçamentos para que as sequências obtidas experimentalmente tenham o mesmo comprimento.

• Esse procedimento é conhecido como ALINHAMENTO.

Comparação entre sequências de DNA

1. Processo evolutivo de divergência e

mutação em sequências de DNA

2. Implicações metodológicas do processo de

mutação

3. Princípios metodológicos de comparação de

sequências de DNA

• Número de possíveis alinhamentos entre

duas sequências de comprimento n,

Comparação de sequências

3. Princípios metodológicos

.2)!()!2( 2

2 nnn n

π≅

Durbin et al. 2007. Biological Sequence Analysis. :18.

• Alinhamento consiste em introduzir

espaçamentos (gaps) para que as sequências

tenham o mesmo comprimento.

• Espaçamentos são hipóteses sobre a

homologia dos sítios.

• Para duas ou mais sequências são possíveis

diversos alinhamentos diferentes, sendo

necessária uma pontuação (score) para cada

um dos alinhamentos.

Comparação de sequências

3. Princípios metodológicos

Comparação de sequências

3. Princípios metodológicos

• Pontuação é uma função do número de posições

com bases idênticas, bases diferentes e

espaçamentos.

• Espaçamentos são penalizados de uma forma geral

como,

g → penalidade pela abertura de cada espaçamento.

e → penalidade pela extensão do espaçamento.

l → comprimento do espaçamento.

)1( −+ leg

ACTAAACGTCAATGC ATGAATGTAACGC

ACTGAACGTAACGC

Processo evolutivo

ACTAAACGTCAATGCA−TGAATGT−AACGC

Alinhamento verdadeiro

Exemplo: Cálculo do alinhamento de duas sequências de DNA

Comparação de sequências

3. Princípios metodológicos

• Cálculo da pontuação do alinhamento

Cada coluna no alinhamento receberá um certo

valor dependendo do conteúdo.

Colunas iguais = 1; colunas diferentes = ‒1;

espaçamentos = ‒2.

A pontuação total do alinhamento será a soma

dos valores dados a cada uma das colunas.

Comparação de sequências

3. Princípios metodológicos

ACTAAACGTCAATGCA−TGAATGT−AACGC

Alinhamento verdadeiro

• Pontuação do alinhamento verdadeiro

10 × 1 + 3 × (‒1) + 2 × (‒2) = 3.

Comparação de sequências

3. Princípios metodológicos

ACTAAACGTCAATGCA−TGAATGT−AACGC

Alinhamento verdadeiro

• Pontuação do alinhamento alternativo 1

9 × 1 + 4 × (‒1) + 2 × (‒2) = 1.

Comparação de sequências

3. Princípios metodológicos

ACTAAACGTCAATGCAT−GAATGT−AACGC

Alinhamento alternativo 1

ACTAAACGTCAATGCA−TGAATGT−AACGC

Alinhamento verdadeiro

• Pontuação do alinhamento alternativo 2

8 × 1 + 5 × (‒1) + 2 × (‒2) = ‒1.

Comparação de sequências

3. Princípios metodológicos

ACTAAACGTCAATGCATGA−ATGTA−ACGC

Alinhamento alternativo 2

Comparação de sequências

3. Princípios metodológicos

ACTAAACGTCAATGCA−TGAATGT−AACGC

Alinhamento verdadeiro

ACTAAACGTCAATGCATGA−ATGTA−ACGC

Alinhamento alternativo 2

ACTAAACGTCAATGCAT−GAATGT−AACGC

Alinhamento alternativo 1

Pontuação = 3

Pontuação = 1

Pontuação = −1

Comparação de sequências

3. Princípios metodológicos

ACTAAACGTCAATGCA−TGAATGT−AACGC

Alinhamento verdadeiro Pontuação = 3

Alinhamento ótimo

• Alinhamento de múltiplas sequências

Método de alinhamento progressivo

1. Alinhar cada par de sequências e usar a pontuação

ótima para calcular distâncias (ou semelhanças) entre

pares de sequências.

2. Construir uma árvore-guia usando as distâncias (ou

semelhanças) entre os pares de sequências.

3. Gerar um alinhamento múltiplo baseado no grau de

semelhança entre as sequências definido pela árvore-

guia.

Comparação de sequências

3. Princípios metodológicos

• Alinhamento de múltiplas sequências

Método de alinhamento progressivo

1. Alinhamento de sequências par a par. Alinhar

todos os possíveis pares de sequências e usar a

pontuação ótima para cada par para calcular distâncias

(ou semelhanças) entre pares de sequências.

Comparação de sequências

3. Princípios metodológicos

A

B

C

A B C

0,87

0,59 0,69

2. Geração da árvore-guia. Usar as distâncias

(semelhanças) entre pares de sequências para gerar

uma árvore-guia.

Comparação de sequências

3. Princípios metodológicos

A

B

C

A B C

0,87

0,59 0,69

A

B

C

0,87

0,69Árvore-guia

3. Alinhamento múltiplo baseado na árvore-guia.

Alinhar as sequências progressivamente baseado na

ordem definida pela árvore-guia.

Comparação de sequências

3. Princípios metodológicos

A

B

CÁrvore-guia

• Alinhar sequências A e B primeiro.

• Alinhar sequência C ao alinhamento

das sequências A e B.

Comparação de sequências

3. Princípios metodológicos

Pássaro

Lemur

Chimpanzé

Humano

Cão

Gato

Vaca

Porco

Alinhamento de sequências de DNA

Mutações de deleção e inserção alteram o comprimento das sequências de DNA e perturbam as posições

relativas dos nucleotídeos (homologia)

Problema consiste em restabelecer as posições relativas das sequências de DNA

Solução consiste em introduzir espaçamentos para que as sequências tenham o mesmo comprimento

ALINHAMENTO

Comparação entre sequências de DNA

1. Processo evolutivo de divergência e

mutação em sequências de DNA

2. Implicações metodológicas do processo de

mutação

3. Princípios metodológicos de comparação de

sequências de DNA

Recommended