Sequenciamento de DNA em
MegaBACE DNA Analysis SystemsMegaBACE DNA Analysis Systems
• Prof. Dr. Luciano da Silva Pinto
TGTGAACACACGTGTGGATTGG...
Sequenciamento do DNASequenciamento do DNA
Definição Identificação da ordem exata dos pares de bases (A, T, G e C)Identificação da ordem exata dos pares de bases (A, T, G e C)
em um segmento de DNA.
ImportânciaO conhecimento da seqüência de bases de um gene fornece importantesO conhecimento da seqüência de bases de um gene fornece importantes informações sobre sua estrutura, função e relação evolutiva com outros
genes (de um mesmo organismo ou de organismos diferentes).
O i d õOs organismos possuem padrões
As moléculas tambémAs moléculas também.
Histórico – O sequenciamento de DNA no tempo
Watson & CrickNobel 1962
Histórico – O sequenciamento de DNA no tempo
Frederick SangerPrêmio Nobel de medicina e fisiologia em 1980Prêmio Nobel de medicina e fisiologia em 1980J. Mol. Biol. v.94, p. 441-448, 1975
Walter GilbertPrêmio Nobel de medicina e fisiologia em 1980PNAS, vol. 74 No. 2 p. 560-564, 1977
Tecnologias de sequenciamento
- Maxam & Gilbert, método químicoMaxam & Gilbert, método químico-- 19721972
- Sanger sequencing
PNAS 74 (1977) n 12 5463 5467- PNAS 74 (1977), n. 12, 5463-5467
- Sequenciador MegaBACE (1Mpb/24 horas)
- Pirosequenciamento
- Science 281 (1998) n 5375 363-365- Science 281 (1998), n. 5375, 363-365
- Nature 437 (2005), 362-7
- Sequenciador 454 (150Mpb/24 horas)
Métodos de Seqüênciamentoq
Método “dideoxi” de F. SangerMétodo dideoxi de F. Sanger
• Dezembro de 1977:– Também chamado de Método de Terminação da ç
Cadeia;– Baseado na utilização de um análogo ao dNTPs, oBaseado na utilização de um análogo ao dNTPs, o
ddNTP:
Reação de polimerizaçãoReação de polimerização
OH
H
Reação de sequenciamento com radioisótoposradioisótopos
Reação de sequenciamento e marcação do DNAdo DNA
Leitura das sequências - Leitura das sequências -A á i
Radioisótopos
Manual Automática
FluoresceínasRadioisótopos Fluoresceínas
EletroforeseEletroforese
l• em placa• capilarp
Reação de sequenciamento e leitura automatizada anelamento dos primersp
desnaturação
Exemplo de gel utilizado nos seqüenciadores de placa (ex.: 377). A diferença p g q p ( ) çde tamanho permite a separação dos grupos de fragmentos, e esta
“distribuição normal” da passagem dos fragmentos é representada pelo eletroferograma (ou cromatograma) de cada seqüência (read).g ( g ) q ( )
Generic Sequencing Instrument
Electrical Field
-
Laser
+
Laser
GCTATAGTTGATTCCT+
DYEnamic ET Terminators – Pré Mix
Energy Transfer DyesEnergy Transfer Dyes
•Fluorescein Donor Dye•Fluorescein Donor Dye
•Standard Rhodamine Acceptor Dyes•Standard Rhodamine Acceptor Dyes
Fluorescein-R110-ddGTPFluorescein R110 ddGTPFluorescein-R6G-ddTTPFluorescein-TAMRA-ddATPFluorescein-ROX-ddCTP
O
CO2-
N+N
Transferência de energia t fl ê iddNTP aumenta a fluorescência
Ar+Laser
O
CO2-
N+NO
CO-
OH ORadiationless
Energy Transfer CO2CO2-
ddNTP
Energy Transfer
ddNTP
DYEnamic ET terminator - espectro deDYEnamic ET terminator espectro de emissão
%Em
issi
on
m) 80%
90%
100%or
esce
nce
En
at 4
88 n
m
50%
60%
70%
mal
ized
Flu
o(E
xcita
tion
20%
30%
40%
Nor
m
0%
10%
500 550 600 650 700
Wavelength (nm)
Organizando as Seqüências de DNA5’ 3’
Organizando as Seqüências de DNA
ATGCTTCATGCTTCTGGCAGATCTGAACAGTGTTACTGATGGCAGATCTGAACAGTGTTACTGATT5 3
ATGCTTCATGCTTCTGGCAGATCTGAACAGTGTGGCAGATCTGAACAGTGTTATGCTTCATGCTTCTGGCAGATCTGAACAGTGTTACTGATATTGCTTGGCAGATCTGAACAGTGTTACTGATATTGCTTTATGCTTCATGCTTCTGGCAGATCTGAACAGTGTTACTGATATTGCTTGGCAGATCTGAACAGTGTTACTGATATTGCTTTATGCTTCATGCTTCTGGCAGATCTGAACAGTGTTACTGATATGGCAGATCTGAACAGTGTTACTGATATTATGCTTCATGCTTCTGGCAGATCTGAACAGTGTTACTGGCAGATCTGAACAGTGTTACTTATGCTTCATGCTTCTGGCAGATCTGAACAGTGGCAGATCTGAACAGTTATGCTTCATGCTTCTGGCAGATCTGAACAGTGTTACTGATATTGCTGGCAGATCTGAACAGTGTTACTGATATTGCTTATGCTTCATGCTTCTGGCAGATCTGAACAGTGTTACTGATATTGGCAGATCTGAACAGTGTTACTGATATTT
ATGCTTCATGCTTCTGGCAGATCTGAACAGTGTTACTGATATTGCTTTGGCAGATCTGAACAGTGTTACTGATATTGCTT
ATGCTTCATGCTTCTTATGCTTCATGCTTCTGGCAGATCTGGCAGATCTT
||||||||||||||||||||||||||||||||||||||||ATGCTTCATGCTTCTGGCAGATGGCAGATTATGCTTCATGCTTCTGGCAGATCTGAACAGTGTTGGCAGATCTGAACAGTGTTT
TACGAAGACCGTCTAGACTTGTCACAATGACTATAACGAATACGAAGACCGTCTAGACTTGTCACAATGACTATAACGAA||||||||||||||||||||||||||||||||||||||||
Leitura da seqüência de DNALeitura da seqüência de DNA
PirosequenciamentoqScience 281 (1998), n. 5375, 363-365
Pirosequenciamento• Ronaghi et al., 1996, 1998.• Monitoramento em tempo real da síntese de DNA:
q
Monitoramento em tempo real da síntese de DNA:– Síntese com primers pela DNA polimerase;– A incorporação é monitorada pela detecção luminosa da liberação do PPi,
em uma reação envolvendo a enzima Luciferase;– Complexo com 4 Enzimas incluídas:
• Fragmento Klenow da DNA Polimerase I;Fragmento Klenow da DNA Polimerase I;• ATP Sulfurilase;• Luciferase;• ApyraseApyrase.
– Os Substratos:• Fosfosulfato de adenosina (APS);
D L if i• D-Luciferina;• O DNA molde de seqüenciamento com um primer anelado.
– Os 4 nucleotídeos são adicionados, um de cada vez, iterativamente, em uma maneira cíclica.
Seqüenciamento 454qLigação dos fragmentos apequenas esferas (beads), erealização de uma PCR ememulsão, resultando em ≅ 10milhões de cópias de DNA moldeem cada bead.
DNA genômico é isolado,g ,fragmentado, ligado a adaptadorese separado em ssDNA
Quebra da emulsão, desnaturaçãodas fitas de DNA e deposição dasbeads em slide de fibra ótica
Pequenas Beads com as enzimasPequenas Beads, com as enzimasnecessárias ao piroseqüenciamentoimobilizadas, são depositadas em cada poço.
O sequenciador 454 Câmara de fluxo contendo as amostras e as fibras ópticas
â d Bombeamento
e as fibras ópticas(1,6 milhões/slide)
Câmera de CCD
Bombeamento de fluídos
Computador
Um pmol de DNA numa reação deUm pmol de DNA numa reação depirosequenciamento produz 1011 moléculasde ATP gerando mais de 109 fótons, comcomprimento de onda de 560 nm em umcomprimento de onda de 560 nm, em umperíodo de 3-4 segundos. Facilmentedetectado por uma câmera de CCD.
Pirosequenciamentoq
http://www.roche-applied-science.com/publications/multimedia/genome_sequencer/flx_multimedia/wbt.htm
PirogramaPirograma
Ill i /S l G A lIllumina/Solexa Genome AnalyzerSequenciamento por síntese + clustering PCR
O d d i DNA li l- O adaptador permite que o DNA se ligue a uma placa nasuperfície dos canais de fluxo;
-PCR em fase sólida permite que as moléculas resultantes de uma PCR fiquem próximas. Ciclo é repetido várias vezes;q p p
-Adição de polimerase, primers e de nucleotídeos, marcados por fl óf 3’OH i ti d di ã d l tídfluoróforos, com o 3’OH inativado - adição de um nucleotídeo por vez. Após incorporação, há a detecção do fluoróforo, reverte-se a inativação do 3’OH e e retira-se o fluoróforo Ciclo se repeteinativação do 3 OH e e retira se o fluoróforo. Ciclo se repete.
Sequenciamento por síntese com q pIllumina Solexa
http://www.youtube.com/watch?v=77r5p8IBwJk&feature=related
http://www.youtube.com/watch?v=HtuUFUnYB9Y&feature=related
Sequenciamento por síntese comSequenciamento por síntese com Illumina Solexa
Sequenciamento por síntese com Illumina Solexa
Sequenciamento usando nanotecnologiaq g
Sequenciamento usando nanotecnologiaq g
http://www.youtube.com/watch?v=pKi30ai35mU
Sequenciamento usando nanotecnologiaq g
http://www.nanoporetech.com./
http://www.youtube.com/watch?v=HbjAMJehSlg
Applied Biosystems SOLiDTMApplied Biosystems SOLiDTM
Sequencerq
http://www.appliedbiosystems.com.br/site/abhome.jsp
Applied Biosystems SOLiDTMApplied Biosystems SOLiDTMSequencer
- O adaptador ligado ao DNA e a grânulos magnéticos. Ocorre PCR l ã fi d DNA ã d i d l
q
PCR em emulsão e as fitas de DNA são depositadas numa placa,- Ligação de primer universal n ao adaptador e de óligos degenerados (7 bases) marcados contendo duas primeiras basesdegenerados (7 bases) marcados contendo duas primeiras bases fixas,- Ocorre detecção do sinal, clivagem das duas últimas bases e ç gadição de novos óligos,- Ao fim de n rounds, a fita resultante é liberada e há a ligação de
i i l ( 1) Ci l i êum novo primer universal, (agora n-1). Ciclo se repete mais três vezes (até n-4).
http://www.appliedbiosystems.com.br/site/abhome.jsp
Applied Biosystems SOLiDTM
Sequencer
SANGER Outros tipos
Sanger vs PirosequenciamentoSANGER Outros tipos
• Depende de clonagem em bactéria (2 semanas de • Não há clonagemtrabalho)
• 25 milhões de bp em 4 horas (100x mais rápido)
• 1 milhão de pb em 24 horas
• Reads de ~700 bp • Reads de ~100 bp
• Clones de fita dupla
(100x mais rápido)
• Clones de fita dupla permitem seqüenciamento em ambas direções (facilita
i t ã t )
• Fragmentos fita simples não permitem seqüenciamento em ambas direçõesorientação e montagem) ambas direções
• 6 meses de sequenciamento, 24 horas por dia, para • 24 horas para sequenciar o p , psequenciar o genoma de um fungo
genoma de um fungo
Conclusão : a união faz a força PNAS 103 (2006), 11240
Análise dos resultadosAnálise dos resultadospor Bioinformática
Montagemg
Limpeza das seqüências:• remoção de seqüências ribossômicas• remoção de seqüências ribossômicas,• remoção de seqüências de vetor,• remoção da região de poliA,remoção da região de poliA,• corte por qualidade, • eliminação das derrapagens
O programa PHRED lê o chromatograma identificando e dando ma
0 0 5 6 7 10 10 9 12 15 20 20 30 30 35 40 41 45 50 56 56 50 40
O programa PHRED lê o chromatograma identificando e dando uma nota para cada base que forma a sequência :0 0 5 6 7 10 10 9 12 15 20 20 30 30 35 40 41 45 50 56 56 50 40 ...
Genome Research 8 (3) (1998), 175-185
background
id ifi d i f i d f d d- A identificação dos picos é feita através de uma transformada de fourier do sinal
- A nota é ligada com a resolução entre os picos vizinhos e a altura do background
Analisando o cromatograma
Região de qualidade alta
• Picos bem definidos e grandes.• Linha de base boa.• Distância entre picos anterior e posterior constante• Distância entre picos anterior e posterior constante.
Região de qualidade média – poucas ambigüidadesRegião de qualidade média poucas ambigüidades
• Picos razoavelmente bem definidos e de tamanho médio.• Linha de base boa a razoável.• Distância entre picos anterior e posterior razoável• Distância entre picos anterior e posterior razoável.
Região de qualidade baixa – baixa confiabilidadeRegião de qualidade baixa – baixa confiabilidade
• Picos mal definidos e de tamanho pequeno.Li h d b f• Linha de base confusa.
• Distância entre picos anterior e posterior inconstante.
- Sequenciamento produz seqüências da ordem de 500 pb
Onde q é a nota phred e P é a probabilidade encontrar uma base errada :
- Nota phred = 20 => 1 base errada a cada 100 (99%)
- Nota phred = 30 => 1 base errada a cada 1000 (99.9%)Nota phred 30 1 base errada a cada 1000 (99.9%)
Qualidade DNA – Fundamental para o sequenciamento Sequenciador Capilar
Minipreps Plasmídeos
Sequenciador Capilar
Minipreps - Plasmídeos
100 200 ng DNA / reação100 - 200 ng DNA / reação
PCR sequenciamento
100 - 400 ng DNA / reaçãoL 1 2
L – 1Kb plus1 – PCR purificada em coluna (conc. d d M BACE)adequada para MegaBACE)
2 – PCR purificada em coluna (pouco DNA para sequenciar no MegaBACE)DNA para sequenciar no MegaBACE)
G l d 1% 3 l d PCRGel de agarose 1%, 3ul de PCR
1859: Charles Darwin A Origem das Espécies
1831-1836: Viagem do Beagle83 836: V age do eag e
2004-2006: Viagem do Sorcerer II
AnimaçõesAnimações
• http://www.dnalc.org/ddnalc/resources/sangerseq.html• http://www dnalc org/ddnalc/resources/cycseq html• http://www.dnalc.org/ddnalc/resources/cycseq.html• http://www.biomolweb.kit.net/pages_html/sequencing.html