Upload
internet
View
106
Download
1
Embed Size (px)
Citation preview
Curso Intensivo de Anotação de Curso Intensivo de Anotação de ESTs de ESTs de Crinipellis perniciosaCrinipellis perniciosa
Eduardo Fernandes FormighieriLaboratório de Genômica e Expressão / UNICAMP
Fevereiro - 2006
ProgramaPrograma1. Introdução2. Revisão de genômica3. Introdução à anotação4. BLAST5. Interface de anotação
2. Revisão de Genômica2. Revisão de Genômica
Eduardo Fernandes FormighieriLaboratório de Genômica e Expressão / UNICAMP
Fevereiro - 2006
IntroduçãoIntrodução
Seqüenciamento de DNA
Determinação da sua seqüência nucleotídica (ACGTs).
A tecnologia de seqüenciamento atual exige que se quebre o DNA em pequenos
fragmentos de cerca de 2.000 pares de bases (shotgun), exigindo a montagem dos
fragmentos.(a montagem será detalhada posteriormente)
IntroduçãoIntrodução
Exemplo de gel de eletroforese utilizado nos seqüenciadores de gel (ex.: 377). A diferença de tamanho permite a separação dos
grupos de fragmentos, e esta “distribuição normal” da passagem dos fragmentos é representada pelo eletroferograma (ou
cromatograma) de cada seqüência (read).
Projetos GenomaProjetos Genoma
Tipos de projeto
DNA – seqüenciamento de estruturas do genoma ou de trechos destas. Ex.: X.
fastidiosa
ESTs – seqüenciamento de cDNA, feitos a partir de bibliotecas de mRNA. Bibliotecas feitas para diferentes situações. Ex.: ESTs
de café
Projetos GenomaProjetos Genoma
Esquema muito resumido para projetos genoma.O seqüenciamento pode ser total ou parcial. A montagem feita por
diferentes programas. O objetivo final pode ser um produto, publicações ou respostas.
Projetos GenomaProjetos Genoma
Estratégias de seqüenciamento
• DNA– Shotgun de genoma inteiro– Shotgun de pedaços do genoma (cosmídeos)– Primer walking
• ESTs– Tradicional– Orestes
Bancos de dadosBancos de dados
Alguns dos principais BDs biológicos
• NCBI (link) – National Center for Biotechnology Information
• EBI (link) – European Bioinformatics Institute
• KEGG (link) – Kyoto Encyclopedia of Genes and Genomes
• GO (link) – Gene Ontology Consortium
• COG (link) – Clusters of Orthologous Groups of proteins
3. Geral de anotação3. Geral de anotação
Eduardo Fernandes FormighieriLaboratório de Genômica e Expressão / UNICAMP
Fevereiro - 2006
Introdução Introdução – base– base
Anotação de genes
Anotar um gene é postular função ao produto deste gene. Para DNA, inicialmente são
localizados os ORFs. Para cDNA, busca-se a identificação do trecho seqüenciado.
Utilizam-se diversos programas de comparação com dados genéticos conhecidos e buscas de padrões.
Introdução Introdução – base– base
ORFS
Os ORFs (Open Reading Frames) a partir de determinado tamanho são genes em
potencial.
ATG AAT GCT TGC ACC CCG TCA GGC CTG TAA ini fim
Códon iniciador, região codificadorae códon terminador.
Introdução Introdução – base– base
Código genético
(Fonte das figuras: http://www.accessexcellence.org/AB/GG/genetic.html)
Introdução Introdução – metabolismo virtual– metabolismo virtual
Anotação Anotação – inicial– inicial
Anotação Anotação – metabólica– metabólica
4. BLAST4. BLAST
Eduardo Fernandes FormighieriLaboratório de Genômica e Expressão / UNICAMP
Fevereiro - 2006
BLAST BLAST – base– base
• Basic Local Alignment Search Tool• Algoritmo BLAST (Alstchul et al.; 1990 – J.
Biol., 215, 403-410)• Implementações: NCBI BLAST e WU-BLAST• Acesso via web / local• Consulta de seqüências em BDs biológicos• Alinhamento – sobreposição de trechos semelhante de
duas seqüências (seqs). BLASt traz pontuação e mostra alinhamentos.
• Similaridade – grau de semelhança de seqs num alinhamento.
• Homologia – genes com ancestral comum (vide slide).
BLAST BLAST – conceitos– conceitos1
2
3
4 3´
“Genes nariz” Homólogos
Ortólogos: 2 e 3; ancestral comum = 1
Ortólogos: 2 e 4; ancestral comum = 1
Parálogos: 3´ e 4; ancestral comum = 3
Duplicação
Especiação
BLAST BLAST – programas– programas
• BDs – nucleotídeos, proteínas, domínios, genomas específicos, dados particulares
• Blastp – prot / prot (distantes)• Blastn – nt / nt (próximos)• Blastx – nt trad / prot (novas seqs)• Tblastn – prot / nt trad (regiões não
anotadas)• Tblastx – nt trad / nt trad (ESTs)
BLAST BLAST – programas– programas
Query BD Compara Programant nt nt blastn
nt (trad) aa aa blastxaa aa aa blastpaa nt (trad) aa tblastn
nt (trad) nt (trad) aa tblastx
Query = formato da seq de entrada.BD = formato das seqs do BD.nt (trad) = seq em nt traduzida pelo programa.Compara = o que é comparado, nucleotídeos (nt) ou aminoácidos (aa).Programa = um dos cinco principais tipos de blast.
BLAST BLAST – query = nts– query = nts
• Vs. Nt– MEGABLAST – identificar a seq– Blastn – identificar a seq ou encontrar similares– Tblastx – comparação por proteínas (nts trad)
• Vs. Prot– Blastx – comparação com proteínas (nts trad)
• Pequenas seqs de nt– “Search for short, nearly exact matches” –
busca para primers ou motivos
BLAST BLAST – query = aas– query = aas
• Vs. Prot– Blastp - identificar a seq ou encontrar similares– PSI-Blast – encontrar membros da família da
proteína ou genes muito distantes– PHI-Blast – busca similaridade de seq + padrão
• Domínios conservados– CD-search – encontra no query– CDART – encontra no query e busca outras
BLAST BLAST – query = aas– query = aas
• Vs. Nt– Tblastn – busca proteínas similares
• Pequenas seqs de proteínas– “Search for short, nearly exact matches” –
busca para motivos
• Especializadas (nt ou prot)– Blast 2 sequences– BDs específicos (genomas etc.)
BLAST BLAST – resultado– resultado
• Query / Subject• “Low score filter”• Gráfico• Lista de alinhamentos
– “Score” e “E value”
• Alinhamentos– Identidades (matchs)– Positivos – Posições de início e fim
BLAST BLAST – resultado– resultado
Escolher BD
BLAST BLAST – resultado– resultado
Domínio encontrado
ID facilita busca
ERRO!!
BLAST BLAST – resultado– resultado
BLAST BLAST – resultado– resultado
Link
1
subject
query
BLAST BLAST – resultado– resultado
71
1 64
134
5. Interface de anotação5. Interface de anotação
Eduardo Fernandes FormighieriLaboratório de Genômica e Expressão / UNICAMP
Fevereiro - 2006
Interface de anotaçãoInterface de anotação
http://www.lge.ibi.unicamp.br/vassoura
http://www.lge.ibi.unicamp.br/cgi-bin/proj_anot/Vassoura_ESTs_Mic3/contigs_usuarios.cgi