32
Curso Intensivo de Anotação Curso Intensivo de Anotação de ESTs de de ESTs de Crinipellis perniciosa Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

Embed Size (px)

Citation preview

Page 1: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

Curso Intensivo de Anotação de Curso Intensivo de Anotação de ESTs de ESTs de Crinipellis perniciosaCrinipellis perniciosa

Eduardo Fernandes FormighieriLaboratório de Genômica e Expressão / UNICAMP

Fevereiro - 2006

Page 2: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

ProgramaPrograma1. Introdução2. Revisão de genômica3. Introdução à anotação4. BLAST5. Interface de anotação

Page 3: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

2. Revisão de Genômica2. Revisão de Genômica

Eduardo Fernandes FormighieriLaboratório de Genômica e Expressão / UNICAMP

Fevereiro - 2006

Page 4: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

IntroduçãoIntrodução

Seqüenciamento de DNA

Determinação da sua seqüência nucleotídica (ACGTs).

A tecnologia de seqüenciamento atual exige que se quebre o DNA em pequenos

fragmentos de cerca de 2.000 pares de bases (shotgun), exigindo a montagem dos

fragmentos.(a montagem será detalhada posteriormente)

Page 5: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

IntroduçãoIntrodução

Exemplo de gel de eletroforese utilizado nos seqüenciadores de gel (ex.: 377). A diferença de tamanho permite a separação dos

grupos de fragmentos, e esta “distribuição normal” da passagem dos fragmentos é representada pelo eletroferograma (ou

cromatograma) de cada seqüência (read).

Page 6: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

Projetos GenomaProjetos Genoma

Tipos de projeto

DNA – seqüenciamento de estruturas do genoma ou de trechos destas. Ex.: X.

fastidiosa

ESTs – seqüenciamento de cDNA, feitos a partir de bibliotecas de mRNA. Bibliotecas feitas para diferentes situações. Ex.: ESTs

de café

Page 7: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

Projetos GenomaProjetos Genoma

Esquema muito resumido para projetos genoma.O seqüenciamento pode ser total ou parcial. A montagem feita por

diferentes programas. O objetivo final pode ser um produto, publicações ou respostas.

Page 8: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

Projetos GenomaProjetos Genoma

Estratégias de seqüenciamento

• DNA– Shotgun de genoma inteiro– Shotgun de pedaços do genoma (cosmídeos)– Primer walking

• ESTs– Tradicional– Orestes

Page 9: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

Bancos de dadosBancos de dados

Alguns dos principais BDs biológicos

• NCBI (link) – National Center for Biotechnology Information

• EBI (link) – European Bioinformatics Institute

• KEGG (link) – Kyoto Encyclopedia of Genes and Genomes

• GO (link) – Gene Ontology Consortium

• COG (link) – Clusters of Orthologous Groups of proteins

Page 10: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

3. Geral de anotação3. Geral de anotação

Eduardo Fernandes FormighieriLaboratório de Genômica e Expressão / UNICAMP

Fevereiro - 2006

Page 11: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

Introdução Introdução – base– base

Anotação de genes

Anotar um gene é postular função ao produto deste gene. Para DNA, inicialmente são

localizados os ORFs. Para cDNA, busca-se a identificação do trecho seqüenciado.

Utilizam-se diversos programas de comparação com dados genéticos conhecidos e buscas de padrões.

Page 12: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

Introdução Introdução – base– base

ORFS

Os ORFs (Open Reading Frames) a partir de determinado tamanho são genes em

potencial.

ATG AAT GCT TGC ACC CCG TCA GGC CTG TAA ini fim

Códon iniciador, região codificadorae códon terminador.

Page 13: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

Introdução Introdução – base– base

Código genético

(Fonte das figuras: http://www.accessexcellence.org/AB/GG/genetic.html)

Page 14: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

Introdução Introdução – metabolismo virtual– metabolismo virtual

Page 15: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

Anotação Anotação – inicial– inicial

Page 16: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

Anotação Anotação – metabólica– metabólica

Page 17: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

4. BLAST4. BLAST

Eduardo Fernandes FormighieriLaboratório de Genômica e Expressão / UNICAMP

Fevereiro - 2006

Page 18: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

BLAST BLAST – base– base

• Basic Local Alignment Search Tool• Algoritmo BLAST (Alstchul et al.; 1990 – J.

Biol., 215, 403-410)• Implementações: NCBI BLAST e WU-BLAST• Acesso via web / local• Consulta de seqüências em BDs biológicos• Alinhamento – sobreposição de trechos semelhante de

duas seqüências (seqs). BLASt traz pontuação e mostra alinhamentos.

• Similaridade – grau de semelhança de seqs num alinhamento.

• Homologia – genes com ancestral comum (vide slide).

Page 19: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

BLAST BLAST – conceitos– conceitos1

2

3

4 3´

“Genes nariz” Homólogos

Ortólogos: 2 e 3; ancestral comum = 1

Ortólogos: 2 e 4; ancestral comum = 1

Parálogos: 3´ e 4; ancestral comum = 3

Duplicação

Especiação

Page 20: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

BLAST BLAST – programas– programas

• BDs – nucleotídeos, proteínas, domínios, genomas específicos, dados particulares

• Blastp – prot / prot (distantes)• Blastn – nt / nt (próximos)• Blastx – nt trad / prot (novas seqs)• Tblastn – prot / nt trad (regiões não

anotadas)• Tblastx – nt trad / nt trad (ESTs)

Page 21: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

BLAST BLAST – programas– programas

Query BD Compara Programant nt nt blastn

nt (trad) aa aa blastxaa aa aa blastpaa nt (trad) aa tblastn

nt (trad) nt (trad) aa tblastx

Query = formato da seq de entrada.BD = formato das seqs do BD.nt (trad) = seq em nt traduzida pelo programa.Compara = o que é comparado, nucleotídeos (nt) ou aminoácidos (aa).Programa = um dos cinco principais tipos de blast.

Page 22: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

BLAST BLAST – query = nts– query = nts

• Vs. Nt– MEGABLAST – identificar a seq– Blastn – identificar a seq ou encontrar similares– Tblastx – comparação por proteínas (nts trad)

• Vs. Prot– Blastx – comparação com proteínas (nts trad)

• Pequenas seqs de nt– “Search for short, nearly exact matches” –

busca para primers ou motivos

Page 23: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

BLAST BLAST – query = aas– query = aas

• Vs. Prot– Blastp - identificar a seq ou encontrar similares– PSI-Blast – encontrar membros da família da

proteína ou genes muito distantes– PHI-Blast – busca similaridade de seq + padrão

• Domínios conservados– CD-search – encontra no query– CDART – encontra no query e busca outras

Page 24: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

BLAST BLAST – query = aas– query = aas

• Vs. Nt– Tblastn – busca proteínas similares

• Pequenas seqs de proteínas– “Search for short, nearly exact matches” –

busca para motivos

• Especializadas (nt ou prot)– Blast 2 sequences– BDs específicos (genomas etc.)

Page 25: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

BLAST BLAST – resultado– resultado

• Query / Subject• “Low score filter”• Gráfico• Lista de alinhamentos

– “Score” e “E value”

• Alinhamentos– Identidades (matchs)– Positivos – Posições de início e fim

Page 26: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

BLAST BLAST – resultado– resultado

Escolher BD

Page 27: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

BLAST BLAST – resultado– resultado

Domínio encontrado

ID facilita busca

ERRO!!

Page 28: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

BLAST BLAST – resultado– resultado

Page 29: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

BLAST BLAST – resultado– resultado

Link

Page 30: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

1

subject

query

BLAST BLAST – resultado– resultado

71

1 64

134

Page 31: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

5. Interface de anotação5. Interface de anotação

Eduardo Fernandes FormighieriLaboratório de Genômica e Expressão / UNICAMP

Fevereiro - 2006

Page 32: Curso Intensivo de Anotação de ESTs de Crinipellis perniciosa Eduardo Fernandes Formighieri Laboratório de Genômica e Expressão / UNICAMP Fevereiro - 2006

Interface de anotaçãoInterface de anotação

http://www.lge.ibi.unicamp.br/vassoura

http://www.lge.ibi.unicamp.br/cgi-bin/proj_anot/Vassoura_ESTs_Mic3/contigs_usuarios.cgi