Upload
buitruc
View
217
Download
0
Embed Size (px)
Citation preview
UNIVERSIDADE FEDERAL DO PARÁ
PRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO
DIRETORIA DE PESQUISA
PROGRAMA INSTITUCIONAL DE BOLSAS DE INICIAÇÃO CIENTÍFICA
RELATÓRIO TÉCNICO-CIENTÍFICO
Período: Março de 2015 a Agosto de 2015
( ) Parcial
(X) Final
Identificação do Projeto
Título do Projeto de Pesquisa: Análise da genômica funcional de Corynebacterium
pseudotuberculosis biotipos ovis e equi sob diferentes condições de estresse
biologicamente relevantes
Orientador: Artur Luiz da Costa da Silva
Titulação do Orientador: Doutor
Faculdade: Faculdade de Biotecnologia
Unidade: Instituto de Ciências Biológicas
Laboratório: Laboratório de Polimorfismo de DNA
Título do Plano de Trabalho: Identificação e descrição do genoma central do gênero
Corynebacterium e caracterização filogenômica de suas espécies
Bolsista: David Batista Maués
Tipo de Bolsa: PIBIC/CNPq
1. Introdução
A família Corynebacteriaceae pertence ao filo Actinobacteria, classe
Actinobacteria e ordem Corynebacteriales, e inclui o gênero Corynebacterium, com
mais de 90 espécies (TAUCH & SANDBOTE, 2014). O gênero Corynebacterium
pertence ao grupo CMRN, que inclui grupos de microrganismos de grande importância
médica, veterinária e biotecnológica, sendo estes Mycobacterium, Nocardia e
Rhodococcus (SOARES et al, 2013).
A bactéria Corynebacterium diphtheriae é uma espécie patogênica que acomete
principalmente humano e causa a difteria, doença contagiosa que atinge o trato
respiratório superior, podendo ocasionar dificuldades ou bloqueio total da respiração. C.
ulcerans causa uma doença semelhante a difteria e os sintomas variam de úlceras de
pele a faringite, sinusite, amigdalite e nódulos pulmonares, sendo comum em países
industrializados como Reino Unido e Alemanha (SOARES et al, 2013).
Nos últimos anos, a espécie Corynebacterium pseudotuberculosis tem sido alvo
de diversos estudos. É uma bactéria gram-positiva, parasita intracelular anaeróbio
facultativo e pleomórfico (DORELLA et al, 2006). É o agente etiológico de diversas
doenças de cunho veterinário, afetando a produção de leite, carne, lã e couro,
ocasionando assim diversas perdas econômicas (SOARES et al, 2013). Em caprinos e
ovinos (biovar ovis) causa a linfadenite caseosa (CLA), doença que ocasiona necrose
nas glândulas linfáticas (DORELLA et al, 2006). Em equinos, bubalinos e bovinos
(biovar equi) causa a linfagite ulcerativa, caracterizada por abcessos externos no
abdômen peitoral ou ventral (SPIER, 2008).
A bactéria Corynebacterium glutamicum é uma espécie não-patogênica, muito
importante para a indústria biotecnológica. Esta é um produtor natural de L-glutamato,
L-lisina e outros aminoácidos essenciais, que são gerados por seleção e mutação
clássica (WENDISCH, 2003).
Dorella et al (2006) apontou uma relação estreita entre C. pseudotuberculosis e
C. ulcerans, pois ambas são as únicas corinebactérias que produzem a toxina fosfolipase
D, um importante fator de virulência. Groman et al (1984) realizou testes experimentais
e observou que algumas cepas de C. ulcerans e C. pseudotuberculosis produziam a
toxina difteria, característica da C. diphtheriae. Esses fatores de virulência
compartilhados por estas três espécies desempenham papel importante na
patogenicidade das mesmas.
Atualmente, foram sequenciados, montados, anotados e depositados no banco de
dados do NCBI (National Center for Biotechnology Information) mais de 20 genomas
de C. pseudotuberculosis. Estes dados possibilitaram diversos estudos de genômica
comparativa, como o pan-genoma realizado por Soares et al (2013), que buscam
caracterizar as diferenças associadas à virulência dessa bactéria, e, assim, pensar uma
forma de desenvolver terapias, drogas e kits de diagnóstico.
2. Justificativa
A importância dos micro-organismos pertencentes ao grupo Corynebacterium é
notória, e sua aplicação varia desde estudos biotecnológicos, como na produção
industrial de aminoácidos pelas espécies C. glutamicum e C. efficiens, até aplicações
médicas, como na elucidação dos aspectos biológicos da interação patógeno-hospedeiro
nas espécies C. pseudotuberculosis, C. diphtheriae e C. ulcerans. No Brasil, os estudos
genômicos da espécie C. pseudotuberculosis utilizando as plataformas NGS foram
desenvolvidos através da cooperação entre a Universidade Federal do Pará e
Universidade Federal de Minas Gerais. A quantidade de dados gerados, portanto,
permite avaliar a similaridade entre as espécies deste gênero utilizando uma abordagem
filogenômica. Além disso, a detecção do genoma central destas espécies foi realizada a
fim de identificar os genes que são essenciais entre este gênero.
3. Objetivos
3.1.Objetivo Geral
Identificar o genoma central de quatro espécies que compõem o gênero
Corynebacterium: C. pseudotuberculosis, C. ulcerans, C. diphtheriae e C. glutamicum.
3.2.Objetivos Específicos
• Comparar a similaridade e identificar proteínas hipotéticas que possam fazer
parte do genoma central destas espécies;
• Analisar o agrupamento entre as diferentes espécies através de análise
filogenômica.
4. Materiais e Métodos
4.1.Genomas sequenciados
Os genomas completos sequenciados das linhagens das quatro espécies de
Corynebacterium foram obtidos do banco de dados do National Center for
Biotechnology Information – NCBI (http://www.ncbi.nlm.nih.gov/). Dessa forma,
totalizando 45 genomas, sendo: 18 de C. pseudotuberculosis, 12 de C. diphtheriae, 8 de
C. glutamicum e 7 de C. ulcerans.
Tabela 1 – Classificação quanto ao biovar das linhagens de C. pseudotuberculosis.
Linhagens de C. pseudotuberculosis Classificação quanto ao biovar 1002
Ovis
267 3/99-5
42/02-A C231
FRC41 I19
P54B96 PAT10 1/06-A
Equi
258 31 316
CIP 52.97 Cp162
A tabela 1 lista as linhagens de C. pseudotuberculosis classificadas quanto ao
biovar, que podem ser diferenciado devido suas propriedades bioquímicas: o biovar
equi é redução de nitrato positiva, enquanto o biovar ovis é redução negativa de nitrato à
nitrito (DORELLA et al, 2006). As linhagens 48252, Ft_2193 e CS_10, isoladas de
humano, cabra e uma linhagem de laboratório, respectivamente, não foram analisadas
quanto ao classificação de biovar (HAVELSRUD, 2014).
4.2.Análise filogenômica
Para análise filogenômica foi utilizado o software Gegenees (versão 2.2.1)
(AGREN et al, 2012). Inicialmente todos os genomas foram divididos em pequenos
fragmentos, e uma busca por similaridade através dos genomas foi realizada para
caracterizar o conteúdo mínimo compartilhado entre todos eles. Este foi subtraído de
todos os genomas, gerando o conteúdo variável entre estes genomas representados por
percentuais de similaridade em uma matriz (heatmap) (SOARES et al, 2013; AGREN et
al, 2012).
Posteriormente, uma matriz de distância foi gerada para ser utilizada na
construção da árvore filogenômica no software SplisTree (versão.4.13.1) através do
método UPGMA (Unweighted Pair Group Method with Arithmetic Mean). Neste
método, são agrupadas as sequências com maior semelhança entre si (menores
distâncias genéticas), e o ponto de ramificação é dado pela média da distância entre o
par de sequências agrupadas, gerando a árvore filogenômica (BRINKMAN & LEIPE,
2001; SOKAL & MICHENER, 1958).
4.3.Predição do genoma central
Para identificação dos genes ortólogos foi utilizado o software PGAP – Pan-
genome analysis pipeline (versão 1.12) (ZHAO et al, 2011). Para execução do
programa, foram fornecidos os arquivos .pep, .nuc e .function de cada um dos genomas.
Estes arquivos foram gerados a partir do arquivo embl, utilizando o software Artemis
(RUTHERFORD et al, 2000). Para a execução do programa PGAP foram adotados os
parâmetros de e-value 0.00001, identidade de 80% e cobertura de 90%.
Para inferir informações biológicas aos produtos codificados por esses genes, como
processos biológicos e funções moleculares (transportador, enzima, regulador etc) utilizou-
se o programa Blast2Go (CONESA et al, 2005), onde adotou-se o nível 3 de classificação
de gene ontology.
5. Resultados e discussão
5.1.Análise filogenômica
Os resultados mostraram que as espécies comparadas apresentam genomas
muito diferentes entre si (Figura 1), com uma similaridade muito baixa, variando entre
1% e 4%, exceto entre C. pseudotuberculosis e C. ulcerans, cuja similaridade é de
aproximadamente 34% entre essas espécies. Infere-se que C. glutamicum deve possuir
maior similaridade com espécies de Corynebacterium não-patogênicas, como a C.
efficiens (SOARES et al, 2013).
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45
Figura 1 – Heatplot com as matrizes de similaridade entre os genomas de quatro espécies do gênero Corynebacterium gerado pelo software Gegenees. Os
números de 1 a 45 localizados na parte superior da figura representam as linhagens das espécies comparadas, da C. diphtheriae 241 à C. ulcerans FRC11,
listadas na parte esquerda da figura, também enumeradas de 1 a 45. A cor vermelha indica baixa similaridade e a cor verde significa alta similaridade.
A figura 2 mostra o heatplot entre as duas espécies que apresentaram maior
similaridade: C. pseudotuberculosis e C. ulcerans. Estudos demonstraram que estas espécies
possuem uma relação muito próxima, seja por características bioquímicas e metabólicas, tais
como serem positivas à urease e algumas cepas de C. pseudotuberculosis não conseguem
reduzir nitrato, quanto à patogenicidade, pois são as únicas corinebactérias que produzem
fosfolipase D (SOARES etl al, 2013;GROMAN et al, 1984).
Figura 2 – Heatplot com as porcentagens de similaridade entre as linhagens de C. pseudotuberculosis e
C. ulcerans.
A figura 3 refere-se ao heatplot entre as linhagens de C. pseudotuberculosis. As cepas
analisadas mostraram alta similaridade entre si, mesmo as que são de diferente biovares (equi e
ovis). As cepas classificadas como ovis apresentaram mais de 99% de similaridade enquanto as
cepas do biovar equi apresentaram uma similaridade variável: entre 95% e 100%. As linhagens
de C. pseudotuberculosis que mais diferenciam entre si pertencem a diferentes biovares,
apresentando diferenças no metabolismo, bioquímica, patogenicidade e interação patógeno-
hospedeiro (DORELLA et al, 2006; SOARES et al, 2013).
Figura 3 – Heatplot com a similaridade entre as linhagens de diferentes biovares de C.
pseudotuberculosis.
A partir dos resultados do software Gegenees, construiu-se a árvore filogenética pelo
software SplitsTree, através do método UPGMA (Figura 4). Assim como a análise
filogenômica, a árvore filogenética mostrou que as espécies patogênicas de Corynebacterium
são mais próximas, enquanto a espécie não-patogênica C. glutamicum não apresentou
similaridade significativa. Estudos filogenéticos realizados por Pascual et al (1995) utilizando o
gene 16S também mostrou que C. diphtheriae, C. pseudotuberculosis e C. ulcerans apresentam
similaridades e pertencem a um grupo filogenético próximo. Também foram realizadas análises
baseadas no gene rpoB, que codifica a subunidade β da RNA polimerase. Os resultados
revelaram que o gene em C. diphtheriae apresentou uma similaridade em torno de 85% em
relação ao gene C. pseudotuberculosis e C. ulcerans, enquanto entre estas duas últimas, ele
apresenta uma similaridade de 93,6% (KHAMIS et al, 2004).
A árvore filogenética gerada também agrupou entre si as linhagens de cada biovar de C.
pseudotuberculosis. Assim, podemos inferir que os biovares possuem algumas diferenças entre
si, que podem estar relacionadas ao metabolismo, resistência ao ambiente e interação patógeno-
hospedeiro.
Figura 4 – Árvore filogenética gerada pelo software SplitsTree.
5.2.Predição do genoma central
Os 45 genomas estudados foram submetidos ao software PGAP para identificar o
conteúdo gênico compartilhado entre eles. Os resultados mostraram que as linhagens estudadas
compartilham entre si 8.124 genes, que foram submetidos ao programa Blast2Go, que os
classificou em diversos processos e funções biológicas baseando-se no terceiro nível de
classificação do banco de dados de ontologia gênica Gene Ontology (GO).
Destes 8.124 genes, 315 estão relacionados à resposta a estresses (Figura 5), sendo que
estes podem estar associados à permanência da bactéria no ambiente hostil do organismo
hospedeiro durante o processo de infecção. Há também 5.013 genes relacionados a processos
biossintéticos, os quais necessitam de uma investigação mais profunda para se compreender
melhor estas vias de biossíntese e explorá-las para a obtenção de um produto que possa ser
utilizado na indústria biotecnológica ou alimentícia, como ocorre com os aminoácidos
produzidos por C. glutamicum.
Figura 5 – Classificação dos processos biológicos dos genes ortólogos das linhagens estudadas
utilizando o nível 3 de classificação baseado no Gene Ontology (GO).
Quanto às funções dos genes, a maioria está relacionada à ligação de compostos
variados, atividade enzimática e função estrutural, como mostrado na figura 6. Adotando-se o
nível 2 de classificação, foram reportados 45 genes associados à atividade antioxidante, cujo
potencial pode ser estudado.
0 1000 2000 3000 4000 5000 6000 7000
Estabelecimento da localização
Processo metabólico de substância orgânica
Processo metabólico primário
Organização dos componentes celulares
Processo metabólico de compostos de nitrogênio
Resposta a estímulos externos
Processo catabólico
Processo celular de organismo único
Resposta a estresse
Metilação
405 3176
6328 180
6185 773
270 6455
3519 45 180
5013 450
45 1035
180 315
45 180 135
Proc
esso
s bi
ológ
icos
Número de genes
Figura 6 – Classificação dos processos biológicos dos genes ortólogos das linhagens estudadas
utilizando o nível 3 de classificação baseado no Gene Ontology (GO).
6. Conclusão
A análise filogenômica mostrou que as espécies comparadas não apresentam grande
similaridade entre si, entretanto, C. pseudotuberculosis e C. ulcerans se apresentaram como as
espécies mais semelhantes, no qual compartilham um pouco de seu material genético, incluindo
fatores de virulência, como o gene pld.
As análises também mostraram que as linhagens do biovar ovis de C.
pseudotuberculosis são mais próximas entre si que as linhagens do biovar equi. A árvore
filogenética, ao reunir as linhagens do biovar equi em um grupo e as do biovar ovis em outro,
indica que esses biovares possuem diferenças em seus genomas.
As análises realizadas através do Blast2Go mostraram que os genes compartilhados
pelas linhagens estudados estão envolvidos em processos básicos e essenciais às células e há
genes que codificam produtos que apresentam potencial para as indústrias farmacêutica,
biotecnológica, cosmética e afins. Porém ainda há a necessidade de realizar diversos estudos
experimentais para elucidar esse potencial.
7. Referências
AGREM, J.; SUNDSTRO, A.; HASTRO, T.; SEGERMAN, B. Gegenees: Fragmented
Alignment of Multiple Genomes for Determining Phylogenomic Distances and Genetic
Signatures Unique for Specified Target Groups. Plos One, vol 7, pág. 1-11. 2012
BOLT, F. The population structure of the Corynebacterium diphtheria group. Tese de
doutorado em Microbiologia Molecular (Departamento de Biologia – Universidade de
Warwick). 2009
BRINKMAN, F.S.L. & LEIPE, D.D. Phylogenetics analysis. In: Bioinformatics: A Practical
Guide to the Analysis of Genes and Proteins. Baxevanis, A.D.; Ouellette, B.F.F. Pág. 323-358.
2001
CONESA, A.; GOTZ, S.; GARCIA-GOMEZ, J.M.; TEROL, J.; TALON, M.; ROBLES, M.
Blast2Go: a universal tool for annotation, visualization and analysis in functional genomics
research. Bioinformatics, Vol. 21, nº. 18, pág. 3674-3676. 2005.
DORELLA, F. A.; PACHECO, L. G. C.; OLIVEIRA, S. C; MIYOSHI, A.; AZEVEDO, V.
Corynebacterium pseudotuberculosis: microbiology, biochemical properties, pathogenesis and
molecular studies of virulence. Vet. Res., Vol 37 pág. 201-218. 2006.
GROMAN, N.; SCHILLER, J.; RUSSELL, J. Corynebacterium ulcerans and Corynebacterium
pseudotuberculosis responses to DNA probes derived from corynephage and Corynebacterium
diphtheriae. Infect. Immun., Vol. 45, pág. 511-517. 1984.
HAVELSRUD, O.E.; SORUM, H.; GAUSTAD, P. Genome Sequences of Corynebacterium
pseudotuberculosis strains 48252 (Human, Pneumonia), CS_10 (Lab Strain), Ft_2193/67
(Goat, Pus) and CCUG 27541. Genome Announcements, vol 2, pág. 1-2. 2014
KHAMIS, A.; RAOULT, D.; SCOLA, B.L. rpoB Gene Sequencing for Identification of
Corynebacterium Species. Journal of Clinical Microbiology, Vol. 42, nº 9, pág. 3925-3931.
2004.
PASCUAL, C.; LAWSON, P.A.; FARROW, J.A.E.; GIMENEZ, M.N.; COLLINS, M.D.
Phylogenetic Analysis of the Genus Corynebacterium based on 16S rRNA Gene Sequences.
International Journal of Systematic Bacteriology, Vol. 45 nº 4, pág. 724-728. 1995.
SOARES, S.C.; SILVA, A.; SILVA, W.M.; OLIVEIRA, L.C.; RAMOS, R.; MIYOSH, A.;
AZEVEDO, V.; AMORIM, L.G. ; HIRATA JR, R.; MATTOS-GUARALDI, A.L.
Corynebacterium pathogenic species in next-generation genomic era: the use of EDGAR and
PIPS software and the importance of pathogenicity islands identification in pan-genomic
analyses of pathogenic species. In: Microbial pathogens and strategies for combating them:
science, technology and education. A. Mendez-Vilaz. Pág. 1584-1599. 2013
SOARES, S.C.; SILVA, A.; TROST, E.; BLOM, J.; RAMOS, R.; CARNEIRO, A.; ALI, A.;
SANTOS, A.R.; PINTO, A.C.; DINIZ, C.; BARBOSA, E.G.V.; DORELLA, F.A.;
ABURJAILE, F.; ROCHA, F.S.; NASCIMENTO, K.K.F.; GUIMARÃES, L.C.; ALMEIDA,
S.; HASSAN, S.S.; BAKHTIAR, S.M.; PEREIRA, U.P.; ABREU, V.A.C.; SCHNEIDER,
M.P.C.; MIYOSH, A.; TAUCH, A.; AZEVEDO, V. The Pan-Genome of the Animal Pathogen
Corynebacterium pseudotuberculosis Reveals Differences in Genome Plasticity between the
Biovar ovis and equi Strains. Plos One, Vol 8, pág. 1-14. 2013
SOKAL, R.R. & MICHENER, C.D. A statistical method for evaluating systematic
relationships. Science Bulletin, vol 38, pág. 1409-1438. 1958
SPIER, S. J. Corynebacterium pseudotuberculosis infection in horses: An emerging disease
associated with climate change? Equine vet. Educ., Volume 20, nº 1, pág. 37-39. 2008.
TAUCH, A. & SANDBOTE, J. The Family Corynebacteriaceae. In: The Prokaryotes.
Rosenberg, E.; DeLong, E.F.; Lory, S.; Stackebrandt, E.; Thompson, F. (eds.). Germany, 2014.
p. 239-264.
WENDISCH, V.K. Genome-wide expression analysis in Corynebacterium glutamicum using
DNA microarrays. Journal of Biotechnology, vol 104, pág. 273-285. 2003
ZHAO, Y.; WU, J.; YANG, J.; SUN, S.; XIAO, J. PGAP: Pan-genome analysis pipeline.
Bioinformatics, vol. 28, pág. 416-418. 2011
Dificuldades
As constantes quedas de energia elétrica e de conexão com a internet dificultaram
consideravelmente o trabalho
Parecer do orientador
_________________________________________ ASSINATURA DO ORIENTADOR
____________________________________________ ASSINATURA DO ALUNO