Anotação de Genomas e Metabolismo Secundáriogenomics.fcav.unesp.br/Aulas2017/Aula_05.pdf ·...

Preview:

Citation preview

Anotação de Genomas e Metabolismo Secundário

Danillo Oliveira de Alvarenga

Departamento de TecnologiaUniversidade Estadual Paulista

Jaboticabal-SP

Metabolismo

● Reações químicas que ocorrem em organismos vivos

– anabolismo: síntese de biomoléculas

– catabolismo: quebra de biomoléculas

● Vias metabólicas

– série de reações em cadeia

– substrato(s) que sofre(m) modifcações

– enzimas que promovem modifcações

Metabolismo Primário

● Metabolismo fundamental

– essencial para o organismo

– função fsiológica

– moléculas estruturais ou regulatórias

Metabólitos Primários

● Biomoléculas mais abundantes

– nucleotídeos e ácidos nucleicos

– aminoácidos e proteínas

– carboidratos

– lipídeos

– outras

● Encontrados em todos os organismos

Metabolismo Secundário

● Metabolismo especializado

– não é essencial para o organismo

– função ecológica

– moléculas bioativas

Metabólitos Secundários

● Estruturas mais simples

– alcaloides: cafeína, nicotina

– terpenoides: limoneno, mentol, caroteno

● Estruturas mais complexas

– peptídeos ribossômicos modifcados pós-traducionalmente: bacteriocinas

– peptídeos não ribossômicos: gramicidina, ciclosporina

– policetídeos: afatoxina, antramicina

● Maior diversidade em bactérias, fungos e plantas

Alcaloides

● Derivados de moléculas nitrogenadas

– aminoácidos

– bases nitrogenadas

– outras

nicotina cafeína

ciclopamina

Terpenoides

● Derivados de isopreno

– hemiterpenos

– monoterpenos

– sesquiterpenos

– diterpenosmentol

isopreno

beta-caroteno geosmina

Peptídeos Ribossômicos Modifcados

● Precursor ribossômico

– um ou mais peptídeos

microviridina

● Enzimas modifcadoras pós-tradução

– ciclização

– desidratação

– alteração da cadeia lateral

Peptídeos Não Ribossômicos

● Peptídeo sintetases não ribossômicas (NRPS)– gastam ATP– aminoácidos proteinogênicos– aminoácidos não proteinogênicos

● Domínios mínimos– adenilação– condensação– carreador de peptidil

● Domínios complementares– metiltransferase– cetorredutase– epimerase

gramicidina

Policetídeos

● Policetídeo sintases– não usam ATP– ácidos carboxilícos

● Domínios mínimos– cetossintase– aciltransferase– carreador de acila

● Domínios complementares– cetorredutase– desidratase– enoil redutase

afatoxina

doxiciclina

Produtos Naturais

● Molécula sintetizada por um organismo vivo

– substância encontrada na natureza

– pode ser obtida por síntese química

● Bioprospecção

– processos industriais

– medicamentos

– cosméticos

– recuperação ecológica

Integração de Muitas Disciplinas

PRODUTOSNATURAIS

BIOQUÍMICA

QUÍMICA ORGÂNICA

QUÍMICAANALÍTICA

ECOLOGIA

FARMACOLOGIA

BIOINFORMÁTICA

GENÔMICA

BIOLOGIAMOLECULAR

● Ecologia

– interações

– ecofsiologia

– ecotoxicologia

● Biossegurança

– toxicologia

– bioterrorismo

Outros Interesses

● Bioquímica

– metabolismo completo

– evolução de vias

– comunicação química

● Genômica

– informação

– caracterização

Vias Metabólicas Codifcadas no Genoma

● Operons– genes controlados pela mesma região promotora– RNA mensageiro policistrônico em procariotos

● Agrupamentos gênicos– genes funcionalmente relacionados em proximidade– envolvidos no mesmo processo– interação entre agrupamentos

● Conservação de agrupamentos– pressão evolutiva– transferência vertical ou horizontal

Motivação de Projetos de Genômica

Penicilina

● Alexander Fleming (1928)

– descoberta e isolamento

● Microbiologia

– Staphylococcus sp.

– Penicillium notatum

– halo de inibição

● Nobel de Medicina (1945)

Penicilina

● Dorothy Hodgkin (1945)

– confrmação da estrutura

● Bioquímica

– cristalografa de raios-X

– contráriou algumas hipóteses

– insulina, vitamina B12

● Nobel de Química (1964)

Penicilina

● Bruno Díez & Juan Martín (1990)

– descrição do agrupamento gênico

● Biologia Molecular

– ligação a cosmídeo

– clonagem em E. coli

– sequenciamento

– expressão heteróloga

PenicilinaO

OHO

OH

NH2

ácido α-aminoadípico cisteína valina

isopenicilina N

penicilina G

+ +

δ (L-α-aminoadipil)-L-cisteinil-D-valina

2

ACV sintetase

isopenicilina N sintase

isopenicilina N N-aciltransferase

Penicilina

pcbAB: δ (L-α-aminoadipil)-L-cisteinil-D-valina sintetase

pcbC: isopenicilina N sintase

penDE: isopenicilina N N-aciltransferase

pcbAB pcbC penDE

peptídeo sintetase não ribossômica

oxidorredutase

aciltransferase

Actinobactérias

● Bactérias gram-positivas de alto GC

– metabólitos secundários

– geosmina

● Modos de vida

– livre

– simbiose

● Distribuição

– solos

– rizosfera

– ambientes marinhos

– ambientes áridos

● Metabólitos secundários

– ≃42% dos 30.000 conhecidos

● Principal fonte de antibióticos

– 45-55% dos 10.000 conhecidos

– Streptomyces spp.

● Bioatividade

– antibiótica

– antitumoral

– imunomodulatória

Metabólitos Secundários Actinobacterianos

● Genômica

– 17 anos depois do primeiro genoma

– 12.670 genomas actinobacterianos

– 800 completos

● Streptomyces spp.

– 985 genomas

– 78 completos

Genomas Actinobacterianos

● Processo praticamente aleatório

– isolamento

– cultivo e fermentação

– geração de extrato bruto

– testes de bioatividade

– caracterização química

Bioprospecção Tradicional

Bachmann et al,, 2014

● Limites para descoberta

– alvos específcos

– ensaios pré-determinados

– atividades conhecidas

– expressão e regulação

– alta concentração

Mineração Genômica

● Descoberta de metabolitos secundários a partir de genomas

– detecção de genes e agrupamentos

– predição e caracterização de candidatos

– orientação de análises químicas posteriores

● Função biológica

– papel fsiológico

– papel em interações

● Bentley et al. (2000)

– Streptomyces coelicolor A3(2)

– mais que o esperado

Bioprospecção Baseada em Genômica

Bachmann et al,, 2014

● Processo direcionado

– isolamento opcional

– caracterização genômica

– busca in silico

– expressão homóloga/heteróloga

– caracterização química

Outras Vantagens

● Evolução– herança

– variação

● Monitoramento

– detecção

– controle

● Síntese

– química– clonagem

● Biossíntese desconhecida para muitas moléculas

● Das moléculas para os genes

– hipóteses biossintéticas a partir da estrutura

– genética da biossíntese

● Biologia da molécula

– evolução

– distribuição

– regulação

Indo na Direção Oposta

Limitações da Genômica

● Grande número de agrupamentos órfãos

– sequências desconhecidas em bancos de dados

– biossíntese desconhecida

– moléculas desconhecidas

● Bancos de dados precisam ser aprimorados

– mais dados de alta qualidade

– melhor anotação e curadoria

● Espécimes cultivados

– linhagens isoladas axenicamente

● Bancos de dados parciais

– viés taxonômico

– viés ecológico

– viés geográfco

Conhecimento Limitado para Vários Grupos

● Quadro incompleto

– alta sub-representação

– maior grau de homogeneidade

– baixa diversidade metabólica

Metagenômica

● Genômica

– um organismo

– linhagem cultivada

– ambiente estranho

– mineração com expressão homóloga ou heteróloga

● Metagenômica

– vários organismos

– não cultivados ou em cocultivo

– genômica ambiental / genômica de comunidades

– mineração com expressão heteróloga

Metagenômica

● Caracterização e comparação de comunidades

– perfl taxonômico

– perfl funcional

● Acessar organismos inacessíveis por métodos tradicionais

– micro-organismos atualmente não cultiváveis

– ≃ 99 % de toda a diversidade bacteriana

– enorme número de genes desconhecidos

– enorme número de vias e metabólitos desconhecidos

Hug et al., 2016

Metagenômica

Metagenômica

Parks et al., 2017

● Alvo

– domínio/reino/flo

– espécies-tipo

– linhagens consagradas

– ambientes e regiões subexplorados

– táxons subexplorados e/ou novos

– tamanho do genoma

● Método

– tradicional ou pós-genômico

– isolados ou amostras mistas

– equipe interdisciplinar

Encontrando Novos Metabólitos Secundários

Anotação

● Identifcação de características biológicas

– regiões codifcantes e não codifcantes

– prováveis produtos

– regiões de repetição

● Métodos

– automático– manual

● Comparações entre sequências

– referências conhecidas

– algoritmos de predição

Anotação

Anotação

● Gene

– região que codifca proteína ou RNA– gene/rRNA/tRNA

– intron/exon– pseudo

● Sequência codifcante

– coding sequence (CDS)– éxons em eucariotos

● Quadro aberto de leitura

– open reading frame (ORF)– ATG → TAA/TAG/TGA

● Detecção de metabólitos secundários

– bancos de dados em expansão

– mais algoritmos

● Predição de agrupamentos– http://www.secondarymetabolites.org/mining/

Avanço nas ferramentas bioinformáticas

BLAST

● Alinhamentos locais

– encontra regiões com similaridade signifcativa

● Qualquer banco de dados que quiser

– NCBI GenBank/WGS

– banco local

● BLAST contra referências de produtos naturais

– agrupamentos de metabólitos já conhecidos

– inspecionar predições automáticas

BLAST

RAST

● Anotação genômica automática

– subsistemas

– SEED: função em um processo ou estrutura biológica

● Predições funcionais

– possibilidades metabólicas do organismo

● Curadoria

– melhor para micro-organismos populares

– pouca informação sobre metabólitos secundários

RAST

RAST

RAST

KEGG

KEGG

NaPDoS

antiSMASH

● Agrupamentos gênicos de metabólitos secundários

– banco de dados curado

– mais de 40 tipos detectados

● Predição algorítmica ou comparativa

– agrupamentos similares a sequências conhecidas

– agrupamentos hipotéticos

● Alguns agrupamentos não são preditos

– nenhum modelo implementado

antiSMASH

MIBiG

● Anotações padronizadas

– agrupamentos gênicos de metabólitos secundários

– produtos desses agrupamentos

● Vias conhecidas

– genética

– bioquímica

● Diversos organismos

– bactérias

– fungos

– plantas

MIBiG

MIBiG

Artemis

● Navegador de anotações genômicas

– visualizar e adicionar informações a arquivos GenBank/EMBL

– rodar BLAST sobre sequências codifcantes

● Curadoria manual

– inspecionar predições automáticas

– predizer agrupamentos gênicos

Artemis

Prática

I. Baixando um genoma

1) Abra a página do NCBI Genome em https://www.ncbi.nlm.nih.gov/genome.

I. Baixando um genoma

2) Visualize os genomas disponíveis por organismo.

I. Baixando um genoma

3) Navegue pelas opções e escolha um genoma.

I. Baixando um genoma

I. Baixando um genoma

4) Visualize o relatório de montagem e anotação dos genomas do táxon.

I. Baixando um genoma

5) Escolha o genoma de uma linhagem do táxon.

I. Baixando um genoma

6) Baixe o arquivo GenBank com o genoma-alvo anotado.

I. Baixando um genoma

7) Descomprima o genoma baixado.

I. Baixando um genoma

8) Renomeie o arquivo com a extensão .gb ou .gbk.

I. Baixando um genoma

II. Predizendo agrupamentos gênicos

1) Abra a página do antiSMASH em http://antismash.secondarymetabolites.org/.

II. Predizendo agrupamentos gênicos

2) Indique o tipo de organismo a ser analisado.

II. Predizendo agrupamentos gênicos

3) Entre o endereço para envio dos resultados.

II. Predizendo agrupamentos gênicos

4) Clique na opção de enviar arquivo.

II. Predizendo agrupamentos gênicos

5) Busque pelo arquivo do genoma no seu computador.

II. Predizendo agrupamentos gênicos

6) Submeta o arquivo à análise e espere pelos resultados.

II. Predizendo agrupamentos gênicos

7) Vá para http://genomics.fcav.unesp.br/Anabaena90/ e encontre os resultados para a análise do genoma da cianobactéria Anabaena sp. 90.

II. Predizendo agrupamentos gênicos

8) Verifque os resultados e diferencie agrupamentos com produtos potencialmente conhecidos e agrupamentos órfãos.

II. Predizendo agrupamentos gênicos

9) Baixe os arquivos GenBank para o agrupamento de interesse.

III. Analisando agrupamentos gênicos

1) Abra o Artemis.

III. Analisando agrupamentos gênicos

2) Selecione a tabela de código genético para bactérias e cloroplastos.

III. Analisando agrupamentos gênicos

3) Abra o arquivo GenBank baixado.

III. Analisando agrupamentos gênicos

4) Olhe a anotação e rode o BLAST em uma CDS.

III. Analisando agrupamentos gênicos

5) Adicione a informação do gene à CDS com base nos resultados de BLAST.

III. Analisando agrupamentos gênicos

6) Salve a anotação.

Recommended