99
SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS Gabriel Dequigiovanni Departamento de Genética [email protected]

SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS

Gabriel Dequigiovanni Departamento de Gené[email protected]

Page 2: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 3: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

1866 Gregor Mendel – Leis da Hereditariedade

1903 Walter Sutton – Cromossomos, unidades hereditárias

1913 Thomas Morgan – Cromossomos, arranjos lineares

1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s

1945 Um gene codifica uma proteína, Beadle, Tatum

1953 Dupla hélice do DNA (Watson & Crick)

1960s Elucidação do código genético

1977 Sequenciamento do DNA (Fred Sanger)

1983 PCR – Kary Mullis

1995 Primeiro genoma de bactéria sequenciado (Haemophilus

influenza)

1998

1999 Primeiro cromossomo humano sequenciado

(cromossomo 22)

2000 Genomas Drosophia / Arabidopsis / Xylella

2001 Genomas humano e camundongo

2003 99% genoma humano

2004 Metagenômica (Environmental genomics)

2005 Sequenciar um genoma de procarioto por US$1 000.

2007 DNA de James Watson sequenciado

2009 Sequenciar seu próprio genoma por US$ 50 000.

Page 4: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 5: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 6: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

LOUSA

Page 7: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 8: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 9: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 10: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 11: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 12: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 13: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 14: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 15: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 16: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

Animação!

http:/www.dnalc.org/ddnalc/resources/sangerseq.html

Page 17: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 18: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 19: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

LASER

Page 20: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 21: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 22: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

Detecção

a laser

Page 23: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 24: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 25: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

Animação!

http:/www.dnalc.org/ddnalc/resources/cycseq.html

Page 26: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

ABI 3700 Applied Biosystems - ~150.000 bases/dia

3730 – Applied Biosystems – ~1.000.000 bases/dia

Page 27: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

454 – Roche – ~100 M bases/7,5 h

SOLiD – Applied Biosystems –~3 000 M bases/corrida/ 6 dias (3 bilhões)

Solexa – Illumina – ~2 000 M bases/corrida /6,5 dia (2 bilhões)

Page 28: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

Plataformas modernas para sequenciamento

HiSeq 2500 Illumina

454 Roche

Ion Torrent Life Technologies

NGS (Next-Generation Sequencing)

Page 29: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

• Transição para NGS

De uma pequena quantidade de sequências maiores para muitas sequências

pequenas “massively parallel sequencing”

Maior capacidade geral de sequenciamento

Aumento da complexidade computacional

Sequências curtas

Resulta em bilhões de bases sequenciadas em centenas de milhões de

fragmentos

NGS (Next-Generation Sequencing)

Page 30: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 31: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

Um único equipamento de nova geração faz o mesmo trabalho que 30 mil

sequenciadores do modelo usado em 2000!

Por outro lado, essas milhões de bases lidas estão em fragmentos muito pequenos

que, para a montagem de um genoma completo, têm de ser concatenados como em

um quebra-cabeça gigantesco.

Page 32: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

Preparação do DNA

Reação de sequenciamento

Eletroforese capilar

Análise computacional

ETAPAS DO SEQUENCIAMENTO DE DNA

Page 33: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

FRAGMENTOS DE DNA SEQUENCIADOS

FRAGMENTOS COMPLETOS

Page 34: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

Biblioteca de insertos pequenos

Montagem dos fragmentos

Fechamento dos gaps

Análise

Page 35: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 36: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

E porque não usamos só o PAC BIO?

Page 37: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

BIOINFORMÁTICA

- Bancos de Dados Biológicos

A bioinformática consiste no desenvolvimento demétodos computacionais, matemáticos e estatísticospara organizar e analisar informações biológicas emgrande escala e de maneira integrada.

Organizaçãoe Armazenamento

Visualização e Análise

- Ferramentas computacionais- Compreensão do significado biológico

Page 38: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 39: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 40: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 41: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 42: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 43: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 44: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

Você toparia?

Page 45: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 46: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

Craig Venter

James WatsonNeanthertal

Desmond Mpilo Tutu (1931-) arcebispo e

ativista dos direitos humanos. Nobel da paz em

1994.

Page 47: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 48: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

430.000 anos

Page 49: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

2019

Page 50: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

Arroz

Arabdopsis

Milho

Soja

Tomate

Poplar Genome Sequenced and Published; Model Crop for Biofuels

Page 51: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

BANCO DE DADOS BIOLÓGICOS

Nucleotídeos :

– International Collaboration• NCBI(EUA), EMBL(Europa), DDBJ (Japão)

– Organismo-específico • http://flybase.org/

• http://poultry.mph.msu.edu/

• http://www.maizegdb.org/

• http://rice.plantbiology.msu.edu/

• http://www.yeastgenome.org/

• http://soybeangenome.siu.edu/

• http://www.ornl.gov/sci/techresources/Human_Genome/home.shtml

Page 52: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

JapanCIB/NIG

USANCBI/NLM

EuropeEBI/EMBL

INSDChttp://www.insdc.org/

Public Collections of DNA and RNA Sequences: Alcançou 100 Gigabases!!!! (August, 2005)

> 300,000 species;whole genome of over 1,500 organisms.

Public Collections of DNA and RNA Sequences: Alcançou 300 Gigabases!!!! (August, 2011) -199,575,971 entries

Sequenciamento de genomas:

BANCOS DE DADOS MUNDIAIS

Page 53: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 54: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

Atualizações diárias

Troca de informações

BANCOS DE DADOS MUNDIAIS

Page 55: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

National Center for Biotechnology Information (NCBI)

http://www.ncbi.nlm.nih.gov/

Page 56: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

ENTREZ: ferramentade busca do banco de dados do NCBI

PubMed: artigoscientíficos

Taxonomy Browser: classificação taxonômica de organismos

FERRAMENTAS

Page 57: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

http://www.ncbi.nlm.nih.gov/Database/index.html

ESTRUTURA DO GENBANK

Page 58: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

Só o NCBI não seria suficiente?

Porque existe outros bancos?

Page 59: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

Homo sapiens BRCA1

http://www.ncbi.nlm.nih.gov/Database/index.html

Page 60: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 61: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 62: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 63: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 64: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

https://www.ncbi.nlm.nih.gov/nuccore/AH003701.2

Page 65: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

>gi|226347322|gb|FJ830553.1| Anabaena planctonica CENA210 ribulose-1,5-

bisphosphate carboxylase/oxygenase large subunit (rbcL) gene, partial cds

CCGGCGAAATTAAAGGTCACTACCTCAACGTTACCGCTCCTACCTGCGAAGAAATGTTGAAACGGGCTGA

GTACGCTAAAGAACTCAAAATGCCCATCATCATGCACGACTACCTAACCGCAGGTTTCACCGCTAACACC

ACATTGGCTCGTTGGTGTCGTGATAACGGTATTTTATTGCACATTCACCGTGCTATGCACGCTGTAATTG

ACCGTCAAAAAAATCACGGTATCCACTTCCGCGTATTAGCTAAAGCCCTCCGCTTGTCCGGTGGTGATCA

CATCCACACTGGTACAGTTGTTGGTAAGTTAGAAGGTGAACGCGGTATTACCATGGGCTTCGTTGACTTA

TTACGTGAAAACTACGTTGAGCAAGACAAGTCTCGCGGTATTTACTTTACCCAAGATTGGGCGTCTCTAC

CTGGTGTAATGGCCGTTGCTTCTGGTGGTATCCACGTATGGCATATGCCCGCGTTGGTTGAGATCTTCGG

TGATGACTCCGTATTACAATTCGGTGGTGGTACACTCGGACATCCTTGGGGTAACGCTCCTGGTGCTACA

GCTAACCGCGTAGCTCTAAAAGCAGTTGTTCAAGCTCGTAACGAAGGCCGTAACTTAGCTCGTGAAGGTA

ACGATATTATCCGCGAAGCTGCTAAGTGGTCTCCTGAGTTGGCTGTTGCTTGCGAACTG

>gi|226347323|gb|ACO50079.1| ribulose-1,5-bisphosphate

carboxylase/oxygenase large subunit [Anabaena planctonica CENA210]

GEIKGHYLNVTAPTCEEMLKRAEYAKELKMPIIMHDYLTAGFTANTTLARWCRDNGILLHIHRAMHAVID

RQKNHGIHFRVLAKALRLSGGDHIHTGTVVGKLEGERGITMGFVDLLRENYVEQDKSRGIYFTQDWASLP

GVMAVASGGIHVWHMPALVEIFGDDSVLQFGGGTLGHPWGNAPGATANRVALKAVVQARNEGRNLAREGN

DIIREAAKWSPELAVACEL

Formato FASTA: formato universalmente aceito para ser processado

Identificador

Page 66: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

• Por sequência de nucleotídeos ou de aminoácidos (proteínas)

• Comparação de sequências a fim de identificar similaridade deDNA ou proteína para inferir origem, função, filogenia

• Realiza comparações entre pares de sequências, buscandoregiões com similaridade local

• Alinhamento local (segmentos) é a base da busca por BLAST

• Usa algoritmos para gerar alinhamento de sequências

BUSCA EM BLAST

BLAST: Basic Local Alignment Search Tool

Page 67: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

BUSCA EM BLAST

Page 68: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

BUSCA EM BLAST

Mais utilizados blastn e blastp!!

Page 69: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

Algoritmos em Blast:

• Não avaliam homologia

• Medem similaridade e identidade de seqüências

A análise de sequências objetivaencontrar similaridades importantesque permitam inferir sobre homologia

Exemplos:Órgãos homólogos – asas de morcego e mãos de humanos (mesma origem)Órgãos similares – asas de morcego e asas de borboleta (mesma função)

BUSCA EM BLAST

Page 70: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

Identidade x Similaridade x Homologia

• Identidade = ocorrência do mesmo nucleotídeo ouaminoácido na mesma posição nas seqüências alinhadas

• Similaridade = considera combinações próximas e avaliada pormedidas de diferença/igualdade

• Homologia = dividem mesma ancestralidade, com significadoevolutivo

Homologia => conceito central de Evolução

BUSCA EM BLAST

Page 71: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

• Nossa sequência – query (consulta),

• O resultado da busca em BLAST pode ser um ou mais hits emsequências-sujeito (subject)

• Os melhores resultados de escores são relatados,

• usar valor E

– valor E <0.01 Quanto menor o e-value, maissignificativo o alinhamento!!!

BUSCA EM BLAST

Page 72: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

GGCTCTTTAGCTTCTTAGGACAGCACTTCCTGATT

TTGTTTTCAACTTCTAATCCTTTGAGTGTTTTTCA

TTCTGCAGATGCTGAGTTTGTGTGTGAACGGACAC

TGAAATATTTTCTAGGTGCGGGAGGAAAATGGGTA

GTTAGCTATTTCTGTAAGTATAATACTATTTCTCC

CCTCCTCCCTTTAACACCTCAGAATTGCATTTTTA

CACCTAACGTTTAACACCTAAGGTTTTTGCTGATG

CTGAGTCTGAGTTACCAAAAGGTCTTTAATTGTAA

TACTAAACTACTTTTATCTTTAATATCACTTTGTT

CAGATAAGCTGGTGATGCTGGGAAAATGGGTCTC

Z96068.1

Nucleotídeos

Page 73: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

EAX11622.1

Proteína>EAX11622.1 lactase [Homo sapiens]

MELSWHVVFIALLSFSCWGSDWESDRNFISTAGPLTNDLLHNLSGLLGDQSSNFVAGDKDMYVCHQPLPT

FLPEYFSSLHASQITHYKVFLSWAQLLPAGSTQNPDEKTVQCYRRLLKALKTARLQPMVILHHQTLPAST

LRRTEAFADLFADYATFAFHSFGDLVGIWFTFSDLEEVIKELPHQESRASQLQTLSDAHRKAYEIYHESY

AFQGGKLSVVLRAEDIPELLLEPPISALAQDTVDFLSLDLSYECQNEASLRQKLSKLQTIEPKVKVFIFN

LKLPDCPSTMKNPASLLFSLFEAINKDQVLTIGFDINEFLSCSSSSKKSMSCSLTGSLALQPDQQQDHET

TDSSPASAYQRVWEAFANQSRAERDAFLQDTFPEGFLWGASTGAFNVEGGWAEGGRGVSIWDPRRPLNTT

EGQATLEVASDSYHKVASDVALLCGLRAQVYKFSISWSRIFPMGHGSSPSLPGVAYYNKLIDRLQDAGIE

PMATLFHWDLPQALQDHGGWQNESVVDAFLDYAAFCFSTFGDRVKLWVTFHEPWVMSYAGYGTGQHPPGI

SDPGVASFKVAHLVLKAHARTWHHYNSHHRPQQQGHVGIVLNSDWAEPLSPERPEDLRASERFLHFMLGW

FAHPVFVDGDYPATLRTQIQQMNRQCSHPVAQLPEFTEAEKQLLKGSADFLGLSHYTSRLISNAPQNTCI

PSYDTIGGFSQHVNHVWPQTSSSWIRVVPWGIRRLLQFVSLEYTRGKVPIYLAGNGMPIGESENLFDDSL

RVDYFNQYINEVLKAIKEDSVDVRSYIARSLIDGFEGPSGYSQRFGLHHVNFSDSSKSRTPRKSAYFFTS

IIEKNGFLTKGAKRLLPPNTVNLPSKVRAFTFPSEVPSKAKVVWEKFSSQPKFERDLFYHGTFRDDFLWG

VSSSAYQIEGAWDADGKGPSIWDNFTHTPGSNVKDNATGDIACDSYHQLDADLNMLRALKVKAYRFSISW

SRIFPTGRNSSINSHGVDYYNRLINGLVASNIFPMVTLFHWDLPQALQDIGGWENPALIDLFDSYADFCF

QTFGDRVKFWMTFNEPMYLAWLGYGSGEFPPGVKDPGWAPYRIAHAVIKAHARVYHTYDEKYRQEQKGVI

SLSLSTHWAEPKSPGVPRDVEAADRMLQFSLGWFAHPIFRNGDYPDTMKWKVGNRSELQHLATSRLPSFT

EEEKRFIRATADVFCLNTYYSRIVQHKTPRLNPPSYEDDQEMAEEEDPSWPSTAMNRAAPWGTRRLLNWI

KEEYGDIPIYITENGVGLTNPNTEDTDRIFYHKTYINEALKAYRLDGIDLRGYVAWSLMDNFEWLNGYTV

KFGLYHVDFNNTNRPRTARASARYYTEVITNNGMPLAREDEFLYGRFPEGFIWSAASAAYQIEGAWRADG

KGLSIWDTFSHTPLRVENDAIGDVACDSYHKIAEDLVTLQNLGVSHYRFSISWSRILPDGTTRYINEAGL

NYYVRLIDTLLAASIQPQVTIYHWDLPQTLQDVGGWENETIVQRFKEYADVLFQRLGDKVKFWITLNEPF

VIAYQGYGYGTAAPGVSNRPGTAPYIVGHNLIKAHAEAWHLYNDVYRASQGGVISITISSDWAEPRDPSN

QEDVEAARRYVQFMGGWFAHPIFKNGDYNEVMKTRIRDRSLAAGLNKSRLPEFTESEKRRINGTYDFFGF

NHYTTVLAYNLNYATAISSFDADRGVASIADRSWPDSGSFWLKMTPFGFRRILNWLKEEYNDPPIYVTEN

GVSQREETDLNDTARIYYLRTYINEALKAVQDKVDLRGYTVWSAMDNFEWATGFSERFGLHFVNYSDPSL

PRIPKASAKFYASVVRCNGFPDPATGPHACLHQPDAGPTISPVRQEEVQFLGLMLGTTEAQTALYVLFSL

VLLGVCGLAFLSYKYCKRSKQGKTQRSQQELSPVSSF

Page 74: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

BLASTn

Page 75: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

BLASTp

Page 76: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 77: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 78: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 79: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

Colar a sequência que deseja analisar

Page 80: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 81: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 82: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 83: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 84: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

Barra = Identidade

Page 85: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 86: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 87: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 88: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 89: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 90: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 91: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 92: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

PROTEÍNAS

>gi|47933334|gb|AAQ63935.1| cellulose synthase [Pinus radiata]

MEARTNTAAGSNKRNVRVSVRDDGELGPKPPQHINSHICQICGEDV

GLAADGEFFVACNECAFPVCRPCYEYEWKDGNQSCPQCKTRYKWH

KGSPQVDGDKEDECADDLDHDFNSTQGNRNEKQQIAEAMLHWQM

AYGRGEDVGPSRSESQELPQLQVPLITNGQAISGELPAGSSEYRRIA

APPTGGGSGKRVHPLPFPDSTQTGQVRA

>LINHA DO NOME

MÁXIMA DE 80 CARACTERES POR LINHA

FORMATO FASTA

BUSCA EM BLAST

Page 93: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 94: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 95: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 96: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 97: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 98: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,
Page 99: SEQUENCIAMENTO E BANCO DE DADOS BIOLÓGICOS · 1944 DNA material genético em todos os seres vivos - Avery, McCarty, McLeaod, Griffith’s 1945 Um gene codifica uma proteína, Beadle,

AY751548.1L03637.1

AJ005984.1NM_001246552.1

G24983.1BK000460

NM_001045493.1NM_001114949.1

BC037526.1AB081072.1AY136463.1BC009121.1AB052957.1