137
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE CIÊNCIAS BIOLÓGICAS DEPARTAMENTO DE BIOQUÍMICA MÁRCIA DANIELLE DE ARAÚJO DANTAS ESTUDO DO GENOMA DO VÍRUS CAUSADOR DA MIONECROSE INFECCIOSA EM CAMARÕES E DESENVOLVIMENTO DE MÉTODOS PARA DETECÇÃO DE POLIMORFISMOS NATAL 2014

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE CIÊNCIAS BIOLÓGICAS DEPARTAMENTO DE BIOQUÍMICA

MÁRCIA DANIELLE DE ARAÚJO DANTAS

ESTUDO DO GENOMA DO VÍRUS CAUSADOR DA MIONECROSE INFECCIOSA EM CAMARÕES E

DESENVOLVIMENTO DE MÉTODOS PARA DETECÇÃO DE POLIMORFISMOS

NATAL 2014

Page 2: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

MÁRCIA DANIELLE DE ARAÚJO DANTAS

ESTUDO DO GENOMA DO VÍRUS CAUSADOR DA MIONECROSE INFECCIOSA EM CAMARÕES E

DESENVOLVIMENTO DE MÉTODOS PARA DETECÇÃO DE POLIMORFISMOS

NATAL 2014

Dissertação apresentada ao Programa de Pós-Graduação em Bioquímica da Universidade Federal do Rio Grande do Norte como requisito parcial para obtenção do título de Mestre em Bioquímica. Orientador: Professor Dr. Daniel Carlos Ferreira Lanza

Page 3: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos
Page 4: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

MÁRCIA DANIELLE DE ARAÚJO DANTAS

ESTUDO DO GENOMA DO VÍRUS CAUSADOR DA MIONECROSE INFECCIOSA EM CAMARÕES E DESENVOLVIMENTO DE MÉTODOS PARA DETECÇÃO DE

POLIMORFISMOS Dissertação apresentada ao Programa de Pós-Graduação em Bioquímica da Universidade Federal do Rio Grande do Norte como requisito parcial para obtenção do título de Mestre em Bioquímica.

Aprovado em: 01/08/2014

BANCA EXAMINADORA

___________________________________________________ Prof. Dr. Daniel Carlos Ferreira Lanza Departamento de Bioquímica - UFRN

Orientador

____________________________________________________ Prof. Dr. Leonardo Lima Pepino de Macedo

Pesquisador da EMBRAPA - Recursos Genéticos e Biotecnologia Examinador externo

____________________________________________________ Prof. Dr. João Paulo Matos Santos Lima Departamento de Bioquímica – UFRN

Examinador interno

Page 5: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

Dedico esta obra

À minha querida avó Maria da Luz Santos, que agora está descansando ao lado do Senhor, mas que, com certeza, continua olhando por mim. Obrigado por toda

dedicação, amor e carinho. Guardarei a senhora para sempre em meu coração.

Page 6: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

AGRADECIMENTOS

Agradeço a todos que direta ou indiretamente participaram da realização deste trabalho, em especial agradeço:

A Deus, pai de infinito amor e bondade, pela sua presença constante em minha vida, me abençoando e iluminando meus caminhos.

Aos meus pais, Maria do Socorro de Araújo Dantas e Luis de Vasconcelos Dantas, por todo amor, carinho e dedicação. Vocês são os principais responsáveis pela

pessoa que sou hoje e por todas as minhas conquistas.

Ao meu namorado, Pedro Henrique Sales da Costa, por todo amor, amizade e companheirismo e por sempre estar ao meu lado me apoiando em todos os

momentos.

Ao Programa de Pós-Graduação em Bioquímica, Departamento de Bioquímica da Universidade Federal do Rio Grande do Norte (UFRN) pelos conhecimentos

adquiridos na área.

Aos amigos do Laboratório de Biologia Molecular Aplicada – Laplic, Raffael, Allan,

Douglas, Jéssica e Natália, pela amizade e pelos momentos de descontração durante os trabalhos. Em especial agradeço a Raffael por toda ajuda com as

análises de Bioinformática.

Ao professor Dr. João Paulo Matos Santos Lima e seus alunos Diego e Ricardo pela

ajuda durante o desenvolvimento deste trabalho.

Ao pessoal do Laboratório de Imunogenética pela disponibilidade de equipamentos extremamente necessários para a realização deste trabalho.

À professora Drª Suely Ferreira Chavante pelo incentivo e apoio em ingressar na pós-graduação.

Às empresas Camanor, Concepto Azul e Genearch pela doação das amostras de camarão sem as quais não seria possível a realização deste trabalho.

Page 7: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

Aos colegas da minha turma de pós-graduação por compartilhar comigo tantos

momentos de alegria e desespero durante esses anos de estudo.

Aos meus grandes amigos da Biologia pelos quatros anos de companheirismo e amizade. Em especial às amigas Sinara Carla, Larissa Maria e Larissa Bahia. Vocês

tornaram os meus momentos mais felizes durante a graduação.

À CAPES pelo fornecimento da bolsa de pesquisa e à FAPERN pelo auxílio financeiro ao projeto de pesquisa.

E claro, o meu muito obrigada ao meu querido orientador Professor Dr. Daniel Carlos Ferreira Lanza pela sua orientação, paciência, profissionalismo e

compromisso com seus orientandos. Obrigada pela sua atuação direta na ampliação dos meus conhecimentos. O senhor, com certeza, é um exemplo de pessoa e de

profissional.

Page 8: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

O cientista não é o homem que fornece as verdadeiras respostas, é quem faz as verdadeiras perguntas.

Claude Lévi-Strauss

Page 9: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

RESUMO

A carcinicultura é uma das atividades que mais contribui para o crescimento da aquicultura mundial. Entretanto, esta atividade vem sofrendo perdas econômicas significativas devido ao surgimento de doenças virais como a Mionecrose Infecciosa (IMN). A IMN já está disseminada em toda região Nordeste do Brasil e vem causando sérios danos à carcinicultura na Indonésia. O principal sintoma da doença é a mionecrose, que consiste na necrose dos músculos estriados do abdômen e do cefalotórax do camarão. A IMN é causada pelo vírus da mionecrose infecciosa (IMNV), um vírus não envelopado que apresenta protrusões ao longo de seu capsídeo. O genoma viral é formado por uma única molécula de RNA dupla fita e possui duas Open Reading Frames (ORFs). A ORF1 codifica a proteína principal do capsídeo (MCP) e uma possível proteína de ligação a RNA (RBP). A ORF2 codifica uma provável RNA polimerase dependente de RNA (RdRp) e classifica o IMNV dentro da família Totiviridae. Assim, o objetivo desse estudo foi estudar o genoma completo do IMNV e as proteínas codificadas no intuito de desenvolver um sistema que identificasse diferentes isolados do vírus com base na presença de polimorfismos. A relação filogenética entre alguns totivírus foi investigada e mostrou um novo grupo para o IMNV dentro da família Totiviridae. Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos genomas foram mais semelhantes entre si do que com aqueles já descritos. Regiões variáveis e conservadas do genoma foram identificadas através de gráficos de similaridade e alinhamentos utilizando as quatro sequências do IMNV. Esta análise possibilitou o mapeamento de sítios polimórficos e revelou que a região mais variável do genoma se encontra na primeira metade da ORF1 e coincide com as regiões que possivelmente codificam a protrusão viral, enquanto que as regiões mais estáveis se encontraram em domínios conservados de proteínas que interagem com o RNA. Além disso, estruturas secundárias foram preditas para todas as proteínas empregando diversos softwares e modelos estruturais proteicos foram calculados usando modelagens por threading e simulações ab initio. A partir dessas análises foi possível observar que as proteínas do IMNV possuem motivos e formas similares às proteínas de outros totivírus, e novas possíveis funções proteicas foram propostas. O estudo do genoma e das proteínas foi essencial para o desenvolvimento de um sistema de detecção baseado em PCR capaz de discriminar os quatro isolados do IMNV com base na presença de sítios polimórficos. Palavras-chave: IMNV Brasil. Sítios polimórficos. Região variável. Domínios conservados. Modelagem proteica. RNA.

Page 10: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

ABSTRACT Shrimp farming is one of the activities that contribute most to the growth of global aquaculture. However, this business has undergone significant economic losses due to the onset of viral diseases such as Infectious Myonecrosis (IMN). The IMN is already widespread throughout Northeastern Brazil and has caused serious damage to shrimp farming in Indonesia. The main symptom of disease is myonecrosis, which consists of necrosis of striated muscles of the abdomen and cephalothorax of shrimp. The IMN is caused by infectious myonecrosis virus (IMNV), a non-enveloped virus which has protrusions along its capsid. The viral genome consists of a single molecule of double-stranded RNA and has two Open Reading Frames (ORFs). The ORF1 encodes the major capsid protein (MCP) and a potential RNA binding protein (RBP). ORF2 encodes a probable RNA-dependent RNA polymerase (RdRp) and classifies IMNV in Totiviridae family. Thus, the objective of this research was study the IMNV complete genome and encoded proteins in order to develop a system differentiate virus isolates based on polymorphisms presence. The phylogenetic relationship among some totivirus was investigated and showed a new group to IMNV within Totiviridae family. Two new genomes were sequenced, analyzed and compared to two other genomes already deposited in GenBank. The new genomes were more similar to each other than those already described. Conserved and variable regions of the genome were identified through similarity graphs and alignments using the four IMNV sequences. This analyze allowed mapping of polymorphic sites and revealed that the most variable region of the genome is in the first half of ORF1, which coincides with the regions that possibly encode the viral protrusion, while the most stable regions of the genome were found in conserved domains of proteins that interact with RNA. Moreover, secondary structures were predicted for all proteins using various softwares and protein structural models were calculated using threading and ab initio modeling approaches. From these analyses was possible to observe that the IMNV proteins have motifs and shapes similar to proteins of other totiviruses and new possible protein functions have been proposed. The genome and proteins study was essential for development of a PCR-based detection system able to discriminate the four IMNV isolates based on the presence of polymorphic sites. Keywords: IMNV Brazil. Polymorphic sites. Variable region. Conserved domains. Protein modeling. RNA.

Page 11: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

LISTA DE FIGURAS

Figura 1 - Camarões Litopenaeus vannamei infectados com o vírus da mionecrose

infecciosa....................................................................................................................22

Figura 2 - Organização do genoma do IMNV mostrando 5’ e 3’UTR e as duas ORFs

não sobrepostas.........................................................................................................25

Figura 3 - Reconstrução em imagem 3D do IMNV a uma resolução de 8.0 Å...........28

Figura 4 - Modelo em 3D da subunidade A do capsídeo de Saccharomyces

cerevisae L-A (ScV-L-A).............................................................................................29

Figura 5 - Estrutura tridimensional prevista para o vírus da mionecrose

infecciosa....................................................................................................................30

Figura 6 - Estrutura da RNA polimerase dependente de RNA do poliovírus.............33

Figura 7 - Estratégia empregada para amplificar o genoma completo do IMNV.......46

Figura 8 - Análise filogenética de membros representativos da família

Totiviridae...................................................................................................................54

Figura 9 - Análise Neighbor joining do grupo IMNV-like incluindo os quatro genomas

completos do IMNV....................................................................................................57

Figura 10 - Representação esquemática do genoma do IMNV e análise de

variabilidade...............................................................................................................59

Figura 11 - Sítios polimórficos identificados no genoma do IMNV.............................60

Figura 12 - Análise de composição de aminoácidos e predição de estrutura

secundária para RBP.................................................................................................62

Figura 13 - Análise de composição de aminoácidos e predição de estrutura

secundária para SP1 e SP2.......................................................................................63

Page 12: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

Figura 14 - Análise de composição de aminoácidos e predição de estrutura

secundária para MCP.................................................................................................65

Figura 15 - Análise de composição de aminoácidos e predição de estrutura

secundária para RdRp................................................................................................67

Figura 16 - Modelo estrutural para a proteína RBP do IMNV gerado pelo I-

TASSER.....................................................................................................................69

Figura 17 - Modelo estrutural para a MCP do IMNV gerado pelo I-TASSER.............70

Figura 18 - Modelo estrutural para a RdRp do IMNV gerado pelo I-TASSER...........71

Figura 19 - Alinhamentos de nucleotídeos dos fragmentos de 456 pb e 200 pb

referentes às regiões variável e conservada, respectivamente.................................73

Figura 20 - Sistema de detecção do IMNV.................................................................74

Figura 21 - Análises de predição de estrutura secundária e curva de melting de fita

simples e dupla para a região R2...............................................................................76

Figura 22 - Análises de predição de estrutura secundária e curva de melting de fita

simples e dupla para a região R3...............................................................................77

Figura 23 - Predição de estrutura secundária de RNA e curva de melting de fita

simples realizada in silico para o fragmento de 456 pb..............................................78

Figura 24 - Esquema proposto para a formação da protrusão do IMNV...................86

Figura Suplementar 1 - Análise filogenética de membros representativos dos grupos

TVV-like, LRV-like e GLV-like...................................................................................111

Figura Suplementar 2 - Sequência genômica completa (7.561 pb) e regiões

codificantes do IMNVgen1........................................................................................112

Figura Suplementar 3 - Sequência genômica completa (7.561 pb) e regiões

codificantes do IMNVgen2........................................................................................118

Page 13: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

Figura Suplementar 4 - Predição de regiões estruturadas e desestruturadas para as

proteínas do IMNV....................................................................................................132

Figura Suplementar 5 - Predição de estrutura terciária para a Proteína Principal do

Capsídeo do IMNV...................................................................................................134

Figura Suplementar 6 - Predição de estrutura terciária para a RNA Polimerase

Dependente de RNA do IMNV.................................................................................135

Figura Suplementar 7 - Predição de estrutura terciária usando modelagem por

threading no programa Phyre2 para as proteínas do isolado da Indonésia.............136

Page 14: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

LISTA DE TABELAS

Tabela 1 - Lista dos primers usados em cada análise para identificar o IMNV nas

amostras de camarões Litopenaeus vannamei..........................................................42

Tabela 2 - Lista de primers usados para amplificar o genoma completo do IMNV....46

Tabela 3 - Comparação das sequências de nucleotídeos e aminoácidos do

IMNVgen1 com outras sequências disponíveis no GenBank e IMNVgen2...............56

Tabela 4 - Comparação das sequências de nucleotídeos e aminoácidos do

IMNVgen2 com outras sequências disponíveis no GenBank e IMNVgen1...............56

Tabela 5 - Lista de primers empregados no sistema de identificação do IMNV........72

Tabela 6 - Regiões selecionadas para o teste de detecção baseado na análise da

curva de melting de fita simples.................................................................................75

Tabela Suplementar 1 - Nome e números de acesso das sequências dos totivírus

usados neste estudo agrupados de acordo com a análise

filogenética...............................................................................................................106

Tabela Suplementar 2 - Nome e números de acesso das sequências dos

Trichomonasvirus, Leishmaniavirus e Giardiavirus usados neste estudo agrupados

de acordo com a análise filogenética.......................................................................107

Tabela Suplementar 3 - Identificação do IMNV em amostras de camarão marinho

Litopenaeus vannamei.............................................................................................108

Tabela Suplementar 4 - Identificação dos sítios polimórficos (SP) no genoma do

IMNV.........................................................................................................................124

Tabela Suplementar 5 - Avaliação dos modelos tridimensionais das proteínas RBP,

MCP e RdRp............................................................................................................133

Page 15: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

LISTA DE ABREVIATURAS / SIGLAS

Aa Aminoácidos

ABCC Associação Brasileira dos Criadores de Camarão

BLAST Basic Local Alignment Search Tool

CDD Conserved Domains Database

cDNA DNA complementar

DNA Ácido desoxirribonucleico

dNTP Deoxinucleotídeos trifosfatados

DSRM Double-strand RNA binding motif

dsRNA RNA dupla fita

EMPARN Empresa Brasileira de Pesquisa Agropecuária do RN

ExPASy Expert Protein Analysis System

ha hectare

HIV Human immunodeficiency virus

HRMA High-Resolution Melting Analysis

IBDV Vírus da doença infecciosa da Bursa

ICTV Comitê Internacional de Taxonomia de Vírus

IHHNV Infectious hypodermal and haematopoietic virus

IMN Infectious Myonecrosis

IMNV Infectious myonecrosis virus

kDa Kilodaltons

Kg Quilogramas

LOS Limphoid organ spheroids

MCP Proteína Principal do Capsídeo

Page 16: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

ml mililitros

mM milimolar

µg microgramas

µl microlitros

µM micromolar

NCBI National Center for Biotechnology Information

nt Nucleotídeo

OIE World Organization for Animal Health

ORF Open Reading Frame

PCR Polymerase Chain Reaction

PDB Protein Data Bank

PMCV Piscine myocarditis virus

pmol Picomole

RBP Proteína de ligação a RNA

RdRp RNA polimerase dependente de RNA

RMSD Root-mean-square deviation

RNA Ácido Ribonucleico

RNAi RNA de interferência

RNAP RNA polimerase

RT Transcriptase reversa

RT-LAMP Reverse Transcription Loop Mediated Isothermal Amplification

RT-PCR Reverse Transcription Polymerase Chain Reaction

SP Sítio polimórfico

SP1 Small Protein 1

SP2 Small Protein 2

Page 17: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

TLR3 receptor Toll-like 3

TM Temperatura de melting

TSV Taura syndrome virus

U Unidade

UniProt Universal Protein Resource

WEEV Western equine encephalitis virus

WSSV White spot syndrome virus

YHV Yellow head virus

Page 18: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

SUMÁRIO

1 INTRODUÇÃO 19

1.1 MIONECROSE INFECCIOSA 20

1.2 VÍRUS DA MIONECROSE INFECCIOSA 23

1.2.1 Proteína de ligação a RNA (RBP) 26

1.2.2 Proteína Principal do Capsídeo (MCP) 27

1.2.3 Protrusões virais 30

1.2.4 RNA Polimerase Dependente de RNA (RdRp) 32

1.3 VARIABILIDADE GENÉTICA EM VÍRUS 34

1.4 SISTEMAS DE DETECÇÃO PARA O IMNV 36

2 OBJETIVOS 39

3 MATERIAIS E MÉTODOS 40

3.1 ANÁLISE FILOGENÉTICA 40

3.2 OBTENÇÃO DAS AMOSTRAS DE CAMARÃO 41

3.3 SCREENING INICIAL PARA DETECÇÃO DO IMNV EM DIFERENTES

AMOSTRAS DE CAMARÃO 42

3.3.1 Extração de RNA total 43

3.3.2 RT-PCR 43

3.3.2.1 Síntese de cDNA 43

3.3.2.2 Reação em Cadeia da Polimerase (PCR) 44

3.4 AMPLIFICAÇÃO E SEQUENCIAMENTO DO GENOMA VIRAL 45

3.5 ANÁLISE DAS SEQUÊNCIAS 47

3.6 ANÁLISE ESTRUTURAL DE PROTEÍNAS 48

3.7 MODELAGEM PROTEICA 49

3.8 SISTEMAS DE DETECÇÃO DE POLIMORFISMOS 50

Page 19: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

3.8.1 Teste de detecção baseado nas regiões variáveis e conservadas 50

3.8.2 Teste de detecção baseado na análise da curva de melting de fita simples 51

4 RESULTADOS 53

4.1 ANÁLISE FILOGENÉTICA DA FAMÍLIA TOTIVIRIDAE 53

4.2 SCREENING INICIAL PARA DETECÇÃO DO IMNV EM DIFERENTES

AMOSTRAS DE CAMARÃO 54

4.3 AMPLIFICAÇÃO E MONTAGEM DOS NOVOS GENOMAS 55

4.4 CARACTERIZAÇÃO DOS NOVOS GENOMAS 55

4.5 IDENTIFICAÇÃO DE REGIÕES CONSERVADAS E VARIÁVEIS 58

4.6 ANÁLISE DE COMPOSIÇÃO DE AMINOÁCIDOS E PREDIÇÃO DE

ESTRUTURA SECUNDÁRIA 61

4.7 MODELAGEM DE PROTEÍNAS 68

4.8 SISTEMAS DE DETECÇÃO DE POLIMORFISMOS 71

4.8.1 Teste de detecção baseado nas regiões variáveis e conservadas 71

4.8.2 Teste de detecção baseado na análise da curva de melting de fita simples 74

5 DISCUSSÃO 79

6 CONCLUSÃO 91

REFERÊNCIAS 93

APÊNDICE 105

Page 20: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

19

1 INTRODUÇÃO

Durante a década de 80, os avanços na produção de camarão

proporcionaram um rápido crescimento na carcinicultura (LOTZ, 1997). A produção

de crustáceos foi a atividade que mais cresceu na aquicultura mundial nos últimos

anos, atingindo 4,5 milhões de toneladas e US$ 17,95 bilhões de dólares em 2006.

No mesmo ano a produção de camarão cultivado correspondeu a 17% do valor total

dos produtos pesqueiros internacionalmente negociados (FAO, 2008).

No Brasil, as pesquisas com camarão começaram na década de 70 com o

Projeto Camarão da Empresa Brasileira de Pesquisa Agropecuária do Rio Grande

do Norte S/A EMPARN (BRASIL, 2001). Várias espécies de camarão nativas

(Farfantepenaeus subtilis, F. brasiliensis, F. paulensis e Litopenaeus schmitti) foram

consideradas como opções de cultivo, porém vários fatores relacionados à produção

tornaram estas espécies inviáveis comercialmente (MADRID, 1999). Apenas em

meados da década de 80, com a introdução do camarão branco do Pacífico,

Litopenaeus vannamei, a carcinicultura brasileira se consolidou (BRASIL, 2001).

Entre os anos de 1996 e 2002, a produção de camarão passou de 2.880

toneladas para mais de 60 mil toneladas e a produtividade, de 900 kg/ha/ano para

5.458 kg/ha/ano (ORMOND, 2004), tonando o Brasil o país líder do hemisfério

ocidental, com 90.190 toneladas, e líder mundial em produtividade, com 6.084

kg/ha/ano, no ano de 2003 (ROCHA, 2005a).

Segundo dados da Associação Brasileira dos Criadores de Camarão (ABCC),

a produção brasileira de camarão deve ser da ordem de 100.000 toneladas em

2014. Em 2013, a produção alcançou 85.000 toneladas e foi destinada basicamente

ao mercado interno, com algumas exportações para países como Vietnã e França.

Page 21: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

20

Os principais produtores são os estados do Ceará e do Rio Grande do Norte.

Existem quase 2.000 produtores no Brasil, a maioria com pequenos cultivos.

Atualmente os maiores produtores mundiais de camarão são China, Vietnã,

Tailândia, Indonésia, Índia e Equador. O Equador produziu 300.000 toneladas de

camarão em 2013 e obteve US$ 1,67 bilhão com a exportação de 215.000 toneladas

do produto (Disponível em MPA - Ministério da Pesca e Aquicultura).

Apesar desse crescimento na produtividade, os carcinicultores têm sofrido

perdas econômicas significativas nas últimas décadas devido a problemas

ambientais relacionados às práticas de cultivo e às doenças virais (MOSS, 2002).

Dentre as doenças virais que acometem a carcinicultura mundial, destacam-se

aquelas causadas pelo vírus da Mancha Branca (WSSV – White spot syndrome

virus), vírus da Cabeça Amarela (YHV – Yellow head virus), vírus da Taura (TSV –

Taura syndrome virus), vírus da Necrose Hipodermal e Hematopoiética Infecciosa

(IHHNV – Infectious hypodermal and haematopoietic virus) e o vírus da Mionecrose

Infecciosa (IMNV – Infectious myonecrosis virus) (LOTZ, 1997; LIU et al., 2009).

1.1 MIONECROSE INFECCIOSA

A Mionecrose Infecciosa (Infectious Myonecrosis - IMN) é uma das doenças

de maior impacto na carcinicultura da região Nordeste do Brasil. A IMN foi

identificada pela primeira vez em 2002 em cultivos de camarão da espécie

Litopenaeus vannamei no estado do Piauí e no ano seguinte foi detectada nos

estados do Ceará e Rio Grande do Norte (LIGHTNER et al., 2004; LIGHTNER &

PANTOJA, 2004). Hoje a doença já está disseminada em toda região Nordeste do

Brasil e vem causando sérios danos à carcinicultura na Indonésia (NUNES,

Page 22: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

21

MARTINS & GESTEIRA, 2004; ANDRADE et al., 2007; SENAPIN et al., 2007;

LIGHTNER, 2011). Devido à importância econômica cada vez maior do L. vannamei

na região Ásia-Pacífico e ao consequente aumento do transporte dessa espécie

entre fronteiras, em janeiro de 2006 a IMN foi adicionada à lista Quartely Aquatic

Animal Disease Report com o propósito de aumentar a vigilância e sua detecção

(QAAD, 2006).

De acordo com a Associação Brasileira dos Produtores de Camarão, a

produção de camarão, no período em que a doença surgiu no Brasil (2002-2005), foi

de 150.000 toneladas a menos que o total esperado. Embora essa redução também

seja atribuída a variações no cambio e à ação antidumping dos Estados Unidos,

estima-se que 60 a 70% das perdas foram causadas por ação da IMN, causando

prejuízos próximos a 400 milhões de dólares naquele período (MADRID, 2005a, b;

ROCHA, 2005a, b; ANDRADE et al., 2007).

O principal sintoma da IMN é a mionecrose, que consiste na necrose dos

músculos estriados do abdômen e do cefalotórax do camarão. Os segmentos

abdominais podem apresentar opacidade focal ou multifocal (Figura 1A) que

progride do último segmento para o restante do corpo do animal e, em estágios mais

avançados, músculos e apêndices podem exibir coloração avermelhada (Figura 1B)

(LIGHTNER et al., 2004; NUNES, MARTINS & GESTEIRA, 2004; POULOS et al.,

2006). Além desses sintomas, os camarões também podem apresentar redução no

consumo de alimentos, nado desorientado e amolecimento do exoesqueleto

(NUNES, MARTINS & GESTEIRA, 2004). Análises histológicas dos músculos

esqueléticos de camarões infectados revelam necrose muscular coagulativa,

infiltração hemocítica, fibrose e aparecimento de esferoides do órgão linfoide

(Limphoid organ spheroids - LOS). Os locais comuns para LOS incluem o

Page 23: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

22

hemoceloma nas brânquias, coração próximo à glândula antenal e cordão nervoso

ventral (TANG et al., 2005).

Figura 1: Camarões Litopenaeus vannamei infectados com o vírus da mionecrose infecciosa. (A) O camarão acima mostra sinais de necrose, evidenciada pela opacidade do sexto segmento abdominal (fase aguda); abaixo se encontra o camarão sadio, sem sinais de infecção (adaptado de POULOS et al., 2006). (B) O camarão apresenta pigmentação avermelhada nos últimos segmentos abdominais – seta (fase crônica) (adaptado de NUNES, MARTINS & GESTEIRA, 2004).

Nos últimos anos, as características de infecção da doença parecem ter

mudado nos camarões cultivados na região nordeste do Brasil. Os camarões

cultivados nas estações de baixa precipitação podem ser positivos para a doença

em testes de detecção e não exibir os sintomas histopatológicos da infecção ou

apresentarem sintomas brandos e baixas taxas de mortalidade (FEIJÓ et al., 2013;

LANZA D. C. F, dados não publicados). Variações nas características da doença

podem ocorrer por várias razões, incluindo condições ambientais, técnicas de

cultivo, contagem viral, co-infecção ou por variações interespecíficas no genoma do

agente etiológico (BACHERE, 2000). O agente etiológico da IMN foi purificado e

caracterizado pela primeira vez no ano de 2006 por Poulos e colaboradores e é

denominado de vírus da mionecrose infecciosa (IMNV).

Page 24: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

23

1.2 VÍRUS DA MIONECROSE INFECCIOSA

Quando comparado a outros vírus que infectam camarão o IMNV apresenta

sintomas mais brandos que os vírus da Taura (Taura syndrome virus - TSV), e que

os vírus causadores da Mancha Branca (White spot syndrome virus - WSSV) e da

Cabeça Amarela (Yellow head virus - YHV). Animais desafiados pelos vírus TSV,

WSSV e YHV, em condições de laboratório, apresentam 100% de mortalidade

acumulada 10 dias após desafio enquanto os animais desafiados com IMNV só

atingem taxas semelhantes 52 dias após o desafio (LU et al., 1994; OVERSTREET

et al., 1997; TANG & LIGHTNER, 2000; TANG et al., 2005). A maioria dos vírus

patogênicos que acometem camarões pode causar infecções persistentes, mas em

baixo nível. Em decorrência disso, geralmente, o cultivo dos camarões infectados

por IMNV não é interrompido, permitindo o estabelecimento do vírus em animais

saudáveis e gerando grandes prejuízos advindos de gastos com alimentação e

manejo.

Geralmente as doenças virais surgem como resultado de um aumento na

contagem viral em decorrência de várias formas de estresse ambiental ou fisiológico

(PENG et al., 1998; COWLEY et al., 2002; LOTZ, ANTON & SOTO, 2005;

SANCHEZ-MARTINEZ et al., 2007). Um camarão pode ser infectado

simultaneamente ou sequencialmente por múltiplos vírus e/ou por diferentes

linhagens de um mesmo vírus (FLEGEL et al., 2004; HOA et al., 2005). Um

levantamento epidemiológico para monitoramento de TSV e IMNV em fazendas do

estado de Pernambuco mostrou que a incidência de TSV é baixa, mas nove das

onze propriedades analisadas apresentaram camarões infectados com IMNV

(PINHEIRO et al., 2007). Quatro espécies de camarão já foram identificadas como

Page 25: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

24

susceptíveis ao IMNV: L. vannamei, de maior interesse comercial no Brasil, e as

espécies L. stylirostris, Farfantepenaeus subtilis e Penaeus monodon (LIGHTNER et

al., 2004; TANG et al., 2005).

O IMNV é um vírus não envelopado, com simetria icosaédrica e 40 nm de

diâmetro. A partícula também possui protrusões em seu capsídeo que

provavelmente estão envolvidas na transmissão extracelular e patogenicidade viral

(POULOS et al., 2006; TANG et al., 2008). O genoma viral é formado por uma única

molécula de RNA dupla fita contendo 7.561 pares de bases e apresenta duas ORFs

(Open Reading Frames) em diferentes frames: A ORF1 no frame 1 (nucleotídeos

136 a 4.953) e a ORF2 no frame 3 (nucleotídeos 5.241 a 7.490). A ORF1 codifica

uma proteína de 1.605 aa (179 kDa) que provavelmente é clivada, gerando a

proteína principal do capsídeo (MCP) e uma proteína que compartilha motivos de

uma proteína de ligação a dsRNA (RBP). Além disso, duas outras proteínas

menores (Small Proteins), de 32 kDa e 38 kDa, foram visualizadas em gel

desnaturante e parecem corresponder às protrusões que estariam envolvidas na

entrada do vírus na célula, incluindo a ligação ao receptor e/ou penetração na

membrana. A ORF2 (nucleotídeos 5241 a 7490) codifica uma proteína de 749 aa (85

kDa) que contém domínios característicos de uma RNA polimerase dependente de

RNA (RdRp) e classificam o IMNV como sendo um membro da família Totiviridae.

Estas ORFs aparentemente não se sobrepõem, existindo um espaço de 287

nucleotídeos entre elas (Figura 2) (POULOS et al., 2006; TANG et al., 2008).

Page 26: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

25

Figura 2: Organização do genoma do IMNV mostrando 5’ e 3’UTR e as duas ORFs não sobrepostas. 1 – Proteína de ligação ao dsRNA (10 kDa); 2 – Protrusão? (31 kDa); 3 – Protrusão? (36 kDa); 4 – Proteína principal do capsídeo (99 kDa); 5 – RNA polimerase dependente de RNA (85 kDa) (adaptado de POULOS et al., 2006; NIBERT, 2007).

Posteriores análises na sequência genômica revelaram a presença de dois

motivos 2A-like (GDVESNPGP e GDVEENPGP) na ORF1 do IMNV precedendo a

proteína do capsídeo. Os nonapeptídeos GDVESNPGP e GDVEENPGP abrangem

os aminoácidos 86-94 e 370-378, respectivamente. A presença desses dois motivos

reforça o pressuposto de que a ORF1 é uma poliproteína que posteriormente é

clivada gerando fragmentos consecutivos de 93, 284 e 1.228 aa. Esse último

fragmento provavelmente também é clivado gerando a MCP (901 aa) e outro

fragmento de 327 aa. O fragmento de 93 aa possivelmente corresponde à proteína

de ligação a dsRNA (RBP) e os fragmentos de 284 e 327 aa corresponderiam às

proteínas de 32kDa e 38 kDa, respectivamente, vistas em gel desnaturante

(NIBERT, 2007).

É provável que, em alguns vírus, as duas ORFs estejam sobrepostas em

199 nucleotídeos, sendo traduzidas conjuntamente e gerando uma proteína de 1.734

aminoácidos (196 kDa) que seria, posteriormente, clivada. Isso é possível se ocorrer

frameshift ribossomal -1 na região de sobreposição das ORFs (NIBERT, 2007). O

Page 27: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

26

frameshifti ribossomal -1 é frequentemente associado a um motivo “shifty heptamer”,

XXXYYYZ, onde X é A, C, G ou U, Y é A ou U, e Z é A, C ou U (BEKAERT et al.,

2003; JACKS et al., 1988). A sequência GGGUUUU, que se qualifica como um

“shifty heptamer” foi encontrada na região de sobreposição das ORFs do IMNV

(NIBERT, 2007). Além disso, imediatamente antes dessa sequência se encontra o

dinucleotídeo UC que pode favorecer o frameshifting ribossomal -1 (BEKAERT &

ROUSSET, 2005). Esta estratégia de codificação é semelhante aos vírus que

infectam Giardia lamblia (WANG et al., 1993; LI, WANG & WANG, 2001) e

Saccharomyces cerevisae (DINMAN, ICHO & WICKNER, 1991).

1.2.1 Proteína de ligação a RNA (RBP)

O primeiro produto codificado pela ORF1 (93 aa) apresenta uma região de 60

aminoácidos na extremidade N-terminal que compartilha um domínio conservado de

ligação a dsRNA (DSRM) (POULOS et al., 2006). Esses domínios são encontrados

em uma variedade de proteínas de ligação a RNA, apresentando diferentes

estruturas e funções (BURD & DREYFUSS, 1994).

Devido à natureza de seu genoma, os vírus de RNA precisam utilizar muitas

RBPs (LI & NAGY, 2011). O vírus da influenza possui uma nucleoproteína de ligação

a RNA (NP) cuja função primária é a encapsidação do genoma viral para fins de

transcrição, replicação e empacotamento. Essa proteína pode interagir com uma

grande variedade de moléculas virais ou da célula do hospedeiro, incluindo o próprio

RNA, RNA polimerases dependentes de RNA e a proteína da matriz viral (PORTELA

& DIGARD, 2002). Também foi visto que as proteínas NS1-BP e hnRNP K do vírus

da Influenza A podem estar envolvidas no processo de splicing do RNA. No vírus da

Page 28: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

27

Hepatite C, a RBP NS5A pode desempenhar um papel significante na regulação da

passagem do processo de tradução para replicação do genoma, recrutamento das

polimerases e helicases para o RNA viral e aumento nas processividades das

mesmas (HUANG et al., 2005). Além do seu papel nos processos de replicação e

transcrição, as RBPs virais também parecem aumentar a resposta imune inata

iniciada pelo receptor Toll-like 3 (TLR3) (LAI et al., 2011).

1.2.2 Proteína Principal do Capsídeo (MCP)

A MCP do IMNV compreende os aminoácidos 705-1.605 (901 aa), possuindo

uma massa predita de 99 kDa e sequência N terminal IVSMENQSEID (POULOS et

al., 2006). A estrutura tridimensional do capsídeo do IMNV foi elucidada em 2008 por

Tang e colaboradores (Figura 3). Análises de crio-microscopia eletrônica de

transmissão (cryo-TEM) e reconstrução de imagem 3D revelam que o IMNV tem um

capsídeo formado por 120 subunidades organizado como um arranjo T=2 e

apresenta-se como uma estrutura dobrada em forma pentamérica na qual possui um

complexo de fibras de natureza proteica (Figura 3A). Assim como observado para o

capsídeo de outros totivirus, existem 60 cópias quimicamente idênticas de cada

subunidade, denominadas A e B. As subunidades A formam clusters pentaméricos

em torno de cada um dos 12 eixos quíntuplos, e as subunidades B formam clusters

triméricos em torno dos 20 eixos triplos. Além disso, cinco subunidades B se

encontram em torno de cada pentâmero A formando um decâmero compacto

centrado em cada eixo quíntuplo. As interações entre os decâmeros podem ocorrer,

principalmente, de duas formas: (i) duas subunidades A de decâmeros adjacentes

participam de contatos assimétricos através de cada eixo icosaédrico duplo, e (ii)

Page 29: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

28

três subunidades B de decâmeros adjacentes participam de interações assimétricas

em torno de cada eixo triplo (Figura 3B). Todos os contatos entre as subunidades A

e B são assimétricos. Essas unidades assimétricas são formadas pelo dímero MCP-

A/B, totalizando 60 unidades diméricas formando o capsídeo. Com relação ao RNA

dupla fita encontrado dentro do capsídeo, este parece se organizar de forma

helicoidal, de maneira bastante simétrica (Figura 3A) (TANG et al., 2008).

Figura 3: Reconstrução em imagem 3D do IMNV a uma resolução de 8.0 Å. (A) Secção central com valores de densidade codificados em escala de cinza (quanto mais escuro, mais denso). Os eixos de simetria estão indicados no quadrante superior direito. (B) Visão da superfície do IMNV mostrando a simetria icosaédrica do capsídeo e as subunidades A (azul e ciano) e B (vermelho, rosa e laranja) (adaptado de TANG et al., 2008).

Dados estruturais de alta resolução sobre as proteínas do capsídeo de vírus

da família Totiviridae são escassos. Somente uma estrutura em cristal disponível foi

resolvida, para a MCP do vírus que infecta Saccharomyces cerevisae L-A (ScV-L-A)

(Figura 4) (NAITOW et al., 2002). Como observado no capsídeo do IMNV e de

outros totivírus, o capsídeo do ScV-L-A é formado a partir de 60 cópias de pseudo

capsômeros, cada um composto de duas moléculas de MCP que possuem

sequências de aminoácidos idênticas mas suas estruturas terciárias são diferentes,

principalmente nos resíduos localizados na superfície da proteína. Cada molécula de

A B

Page 30: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

29

MCP é formada por duas α-hélices localizadas próximas aos eixos icosaédricos

quíntuplos e várias folhas β próximas aos eixos duplos e triplos (NAITOW et al.,

2002).

Figura 4: Modelo em 3D da subunidade A do capsídeo de Saccharomyces cerevisae L-A (ScV-L-A). A figura mostra o “trench” acessível a partir da superfície da partícula (outside) e o resíduo de His 154. As extremidades N- e C-terminais estão voltadas para o interior do capsídeo (inside) (adaptado de NAITOW et al., 2002).

As subunidades do capsídeo de ScV-L-A geram mRNAs sem o cap5’ pela

remoção enzimática dessa estrutura na presença do resíduo de His 154 presente na

MCP (BLANC, GOYER & SONENBERG, 1992). A estrutura para a MCP de ScV-L-A

revela uma “vala” (“trench”) estreita e profunda no sítio ativo e um resíduo de His

154 necessário para a reação de remoção do cap5’ (Figura 4). O “trench” é formado

por vários loops que abrem e fecham a estrutura por se encontrarem na superfície

da partícula. O mRNA celular pode, então, ser capturado por esses loops e

posicionados no “trench” para a reação ocorrer (NAITOW et al., 2002).

Page 31: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

30

1.2.3 Protrusões virais

Análises de reconstrução de imagem em 3D mostraram que o capsídeo do

IMNV possui fibras complexas que se estendem a aproximadamente 80 Å dos eixos

quíntuplos do capsídeo (Figuras 3 e 5). Esses elementos mostraram menos

densidade e resolução do que o capsídeo, o que pode ser explicado pela sua

flexibilidade lateral e compreendem pelo menos três domínios morfológicos: knob,

mais externo; stalk, no meio e; foot mais interno e ancorado ao capsídeo. O

comprimento total de cada protrusão, incluindo o domínio foot, é de

aproximadamente 100 Å (Figura 5) (TANG et al., 2008).

Figura 5: Estrutura tridimensional prevista para o vírus da mionecrose infecciosa. À direita, um detalhamento da estrutura da protrusão do capsídeo viral (adaptado de TANG et al., 2008).

Até o momento, a presença de protrusões ao longo do capsídeo viral é uma

característica exclusiva do IMNV quando comparado a outros membros da família

Totiviridae e, possivelmente, contribuem para os padrões de virulência e

patogenicidade específicos do IMNV uma vez que ele é considerado como único

membro da sua família a ser transmitido extracelularmente entre os organismos

Page 32: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

31

hospedeiros. Outros membros da família Totiviridae estão associados com infecções

avirulentas, enquanto que o IMNV causa uma doença geralmente fatal em camarões

peneídos (LIGHTNER et al., 2004; POULOS et al., 2006; GHABRIAL, 2008; TANG

et al., 2008). Entretanto, é possível que o totivírus que infecta o salmão do Atlântico,

Piscine myocarditis virus (PMCV), também possua essas estruturas. O PMCV causa

uma doença fatal em seu hospedeiro e, assim como o IMNV, presume-se que sua

transmissão seja extracelular. Além disso, esse vírus possui sequências codificantes

extras em seu genoma que podem estar envolvidas nos mecanismos de entrada

celular (NIBERT & TAKAGI 2013). O IMNV foi o primeiro vírus da família Totiviridae

descoberto como sendo capaz de infectar um hospedeiro diferente de protozoários

ou fungos e, até o momento, ele é o único membro dessa família capaz de infectar

crustáceos.

Alguns estudos têm mostrado que as regiões que codificam protrusões

apresentam grande variabilidade genética em diferentes vírus, permitindo que eles

se adaptem a diferentes situações (CAVANAGH, DAVIS & MOCKETT, 1988; LEE et

al., 2010; PROMKUNTOD et al., 2014). Já se sabe que proteínas semelhantes a

protrusões estão envolvidas na entrada de certos vírus, como os coronavírus, na

célula hospedeira, além de desempenhar um papel importante na determinação da

gama de hospedeiros (ENJUANES et al., 2006; PERLMAN & NETLAND 2009;

BELOUZARD et al., 2012).

O capsídeo adornado com protrusões do IMNV sugere um mecanismo

evolucionário simples que fornece um novo conjunto de funções capazes de

expandir os padrões de infectividade do vírus. A evolução do IMNV a partir de

totivírus mais simples pode ter incluído a aquisição de sequências codificantes para

as protrusões, o que permite a transmissão extracelular (TANG et al., 2008).

Page 33: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

32

1.2.4 RNA Polimerase Dependente de RNA (RdRp)

A ORF2 do genoma do IMNV apresenta um domínio conservado

característico de RNA polimerases dependente de RNA. As RdRps desempenham

um papel central na replicação dos vírus de dsRNA. Apesar das altas taxas de

mutações que ocorrem em vírus de RNA, as RdRps são geralmente bastante

conservadas nas famílias virais, especialmente dentro de motivos funcionais, e são

bons alvos para estudos filogenéticos (O’REILLY & KAO, 1998). Análises

comparativas utilizando a região da RdRp do IMNV o caracterizam como um

membro da família Totiviridae, similar ao vírus que infecta o protozoário Giardia

lamblia (POULOS et al., 2006; NIBERT, 2007). Estudos sobre estrutura e função de

RdRps tem sido relatados para vários vírus como Rhinovírus (LOVE et al., 2004),

Picornavírus (KOK & MCMINN, 2009) e o vírus da Hepatite C (WAHEED, BHATTI &

ASHRAF, 2013). A primeira estrutura em cristal da RdRp foi resolvida para o

poliovírus podendo ser comparada com outras polimerases (Figura 6) (HANSEN,

LONG & SCHULTZ, 1997).

As estruturas das RNA polimerases (RNAPs) geralmente apresentam uma

arquitetura comum descrita como uma “right hand”, contendo os domínios “thumb”,

“fingers” e “palm” (Figura 6). O domínio “palm” parece catalisar a reação de

transferência do grupo fosforila durante o processo de replicação enquanto que o

domínio “fingers” está envolvido nas interações envolvendo os trifosfatos de

nucleosídeos e pareamento do template. O domínio “thumb” provavelmente

desempenha um papel na processividade e translocação da RNAP (STEITZ, 1999).

Em RdRps, o domínio “palm” apresenta quatro sequências-motivo encontradas em

todas as classes de RNAPs, denominadas A, B, C e D, e uma sequência-motivo

Page 34: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

33

adicional E que é única de RdRps e transcriptases reversas (RTs) (Figura 6) (POCH

et al., 1989). Outras três sequências-motivo (F1, F2 e F3) também encontradas em

RdRps, parecem estar envolvidas na separação da dupla fita do RNA para a

transcrição (BRUENN, 2003). Os motivos A e C estão envolvidos na coordenação do

magnésio; o motivo A também pode desempenhar um papel na discriminação entre

ribose e desoxirribose, assim como o motivo B; o motivo D completa a estrutura do

domínio “palm”; e o motivo E está envolvido em interações hidrofóbicas com o

domínio “thumb” (O’REILLY & KAO, 1998).

Figura 6: Estrutura da RNA polimerase dependente de RNA do poliovírus. Os domínios “thumb”, “fingers” e “palm” estão indicados. As sequências-motivo encontradas no domínio “palm” estão destacadas nas seguintes cores: A em vermelho, B em verde, C em amarelo, D em roxo claro e E em roxo escuro (adaptado de HANSEN, LONG & SCHULTZ, 1997).

Page 35: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

34

1.3 VARIABILIDADE GENÉTICA EM VÍRUS

O estudo da variabilidade genética é uma abordagem interessante quando se

deseja compreender mais profundamente a biologia dos seres vivos. Os vírus de

RNA sofrem grande taxa de mutação principalmente devido a falta de atividade de

correção de erros da RNA polimerase. O conhecimento de que alterações em

regiões específicas do genoma de diferentes vírus influenciam em sua capacidade

de infecção e mecanismos de patogenicidade já é amplamente difundido. As

primeiras evidências surgiram do estudo de viróides, que tinham sua capacidade de

infecção, replicação e patogenicidade afetadas por alterações induzidas em seu

genoma de RNA (TABLER & SFINGER, 1985; SANO et al., 1992). Hoje existem

inúmeros trabalhos que associam a variabilidade genética de diferentes vírus a sua

patogenicidade. Alguns exemplos clássicos em doenças humanas são a correlação

da variabilidade observada no gene NS5A do vírus causador da hepatite C e a

resistência do vírus ao interferon, a correlação entre polimorfismos no gene que

codifica a transcriptase reversa do HIV (Human Immunodeficiency Virus) e

alterações na propagação e resistência do vírus, e a presença de polimorfismos

associados à infectividade na ORF26 do herpesvírus causador do Sarcoma de

Kaposi (ENOMOTO et al., 1996., CHAYAMA et al., 1997; KUROSAKI et al., 1997;

ZONG et al., 2007; KEARNEY et al., 2008; BITTAR et al., 2010; PINHO et al., 2010).

Polimorfismos no genoma também podem afetar as propriedades dos vírus

por alterarem a estrutura secundária do RNA. Acredita-se que a estrutura secundária

de genomas virais, particularmente em regiões não traduzidas desempenha um

papel central no ciclo de vida viral, em particular nos processos de replicação e

tradução (CLYDE, BARRERA & HARRIS, 2008; KORAKA et al., 2009). Em um

Page 36: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

35

estudo desenvolvido por McBridge & Panganiban (1996) relatou-se que estruturas

hairpin estão envolvidas no encapsulamento do vírus HIV-1. Foi visto que

perturbações em um único hairpin, seja por deleção ou substituição de bases, pode

ter um efeito parcial sobre o encapsulamento. Porém, quando dois hairpins são

afetados, os efeitos são mais significativos.

O estudo de variabilidade genética em vírus que acometem animais de

criação é fundamental para caracterização de cepas virulentas e desenvolvimento

de vacinas. Análises de variabilidade genética de proteínas estruturais de diferentes

linhagens do vírus causador da encefalite equina (Western equine encephalitis virus

- WEEV), uma doença que é problema de saúde pública nos Estados Unidos,

possibilitaram definir os principais aminoácidos responsáveis pelos mecanismos de

virulência deste vírus (NAGATA et al., 2006). O vírus da doença infecciosa da bursa

(IBDV), causador da doença de gumboro, uma das principais doenças para a

avicultura brasileira, pode ser classificado de acordo com sua antigenicidade e

patogenicidade pela região hipervariável do gene VP2, que codifica uma proteína do

capsídeo viral (LANA, BEISEL & SILVA, 1992). A diversidade genética de sete

isolados no vírus Sacbrood na China foi estudada e regiões hipervariáveis no gene

VP1 já foram sequenciadas e caracterizadas a fim de se obter informações sobre

epidemiologia e imunologia do vírus (MINGXIAO et al., 2013).

O estudo da variabilidade genética também é de suma importância para o

desenvolvimento de sistemas diagnósticos. Em vírus que acometem a carcinicultura,

foi demonstrado que os polimorfismos identificados na ORF94 do WSSV podem

afetar o resultado de alguns testes diagnósticos baseados na amplificação via PCR

(Polymerase Chain Reaction) ou na detecção de proteínas do vírus via anticorpos

(MUSTHAQ et al., 2006). Análises de sequências da ORF1 de YHV da região do

Page 37: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

36

Indo-Pacífico permitem a diferenciação de pelo menos seis diferentes linhagens do

vírus, sendo que, apenas duas dessas linhagens provocam a doença

(WIJEGOONAWARDANE et al., 2008).

Existe apenas um trabalho voltado para o estudo da variabilidade genética do

IMNV (NAIM, BROWN & NIBERT, 2014), publicado recentemente. Entretanto, até o

momento, não foram observados estudos que levem em consideração a

variabilidade genética do IMNV no desenvolvimento de métodos diagnósticos

capazes de identificar diferentes isolados do vírus.

1.4 SISTEMAS DE DETECÇÃO PARA O IMNV

Os crustáceos parecem não possuir imunidade adaptativa nem memória

imunológica e não existem drogas ou vacinas contra as doenças virais que

acometem camarões. O sistema de defesa dos camarões depende principalmente

da imunidade inata a qual é formada por defesas humorais e celulares (KURTZ,

2004; JIRAVANICHPAISAL, LEE & SÖDERHÄLL, 2006). O monitoramento e o

controle da disseminação de doenças na carcinicultura dependem do

desenvolvimento de ferramentas rápidas e específicas para detecção e

caracterização dos patógenos.

A Organização Mundial de Saúde Animal indica o diagnóstico do IMNV

através de técnicas moleculares. Já foram desenvolvidos sistemas de detecção do

IMNV por RT-PCR (Reverse Transcription Polymerase Chain Reaction) analisado

tanto da forma tradicional quanto em tempo real, que atingem o limite de detecção

mínimo de 10 cópias do vírus por microlitro de RNA total extraído (TANG et al.,

2005; POULOS et al., 2006; POULOS & LIGHTNER, 2006; ANDRADE et al., 2007;

Page 38: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

37

LIU et al., 2013). Recentemente foram desenvolvidas outras ferramentas

promissoras para detecção do IMNV, como anticorpos monoclonais para detecção

de proteínas virais (KUNANOPPARAT et al., 2011; MELLO et al., 2011;

CHAIVISUTHANGKURA et al., 2013) e sistemas de detecção baseados em RT-

LAMP (Reverse Transcription Loop Mediated Isothermal Amplification) (ANDRADE &

LIGHTNER, 2009; PUTHAWIBOOL et al., 2009; ARUNRUT, SUEBSING &

KIATPATHOMCHAI, 2013). Além dessas ferramentas, métodos de imunização

baseados em RNA de interferência (RNAi) estão sendo desenvolvidos para o

monitoramento e controle do IMNV (LOY et al., 2012; LOY et al., 2013).

Apesar dos avanços recentes nos sistemas de detecção do patógeno, ainda

não existem métodos direcionados à identificação da variabilidade genética do

IMNV. O monitoramento em campo revela que em algumas amostras dadas como

positivas não se observa sintomas nos animais, e geralmente existem diferenças na

gradação dos sintomas e evolução da doença em diferentes regiões. Essas

diferenças podem estar associadas a variações ambientais e/ou a diferentes

variantes do vírus. O monitoramento e o controle de doenças virais que acometem a

carcinicultura dependem de ferramentas rápidas e precisas para detecção e

caracterização do patógeno.

O estudo do genoma de determinada espécie de vírus e a sua variabilidade

genética, implica em conhecer e comparar os genomas existentes na natureza e

suas principais proteínas, seja no nível de sequência nucleotídica ou aminoacídica,

seja no nível estrutural. Esse conhecimento permite identificar, em um primeiro

momento, quais são as regiões mais variáveis no genoma e quais são as

consequências dessas variações nas proteínas codificadas pelo vírus. A partir

Page 39: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

38

desses dados é possível inferir como essas variações poderiam afetar a biologia do

vírus e desenvolver novos sistemas de detecção mais eficientes.

No presente trabalho, a variabilidade genética do IMNV foi estudada a partir

da sequência de quatro genomas completos. Com base nesses dados foi elaborado

um mapa com os sítios polimórficos existentes no genoma e possíveis influências

das regiões variáveis sob a estrutura das proteínas codificadas foram propostas.

Além disso, foram realizadas predições de estruturas secundárias e terciárias para

as proteínas. A partir desses resultados foi desenvolvido um sistema de detecção

baseado em PCR, capaz de diferenciar os isolados do IMNV estudados aqui a partir

da identificação de polimorfismos no genoma.

Page 40: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

39

2 OBJETIVOS

Geral:

Estudar o genoma completo do IMNV e os possíveis produtos gênicos

codificados e desenvolver um sistema de detecção baseado em PCR que

permita diferenciar isolados do vírus com base na presença de polimorfismos.

Específicos:

Verificar as relações de parentesco entre membros da família Totiviridae

utilizando sequências já disponíveis no GenBank;

Identificar a incidência do IMNV em camarões coletados no Nordeste;

Sequenciar e montar o genoma completo de pelo menos dois isolados

diferentes do IMNV;

Comparar os genomas obtidos entre si e com genomas completos do

IMNV já depositados no GenBank;

Analisar a localização de sítios polimórficos e verificar se esses sítios

causam alterações em aminoácidos e/ou em suas características;

Identificar regiões variáveis e conservadas presentes no genoma do vírus;

Estudar in silico a composição de aminoácidos e as estruturas

secundárias das proteínas que compõem o genoma do IMNV;

Modelar in silico a estrutura terciária das proteínas RBP, MCP e RdRp;

Desenhar primers específicos com base nas regiões variáveis e

conservadas identificadas no genoma;

Desenvolver métodos de diagnósticos para diferenciar os isolados

utilizando a técnica de PCR.

Page 41: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

40

3 MATERIAIS E MÉTODOS

3.1 ANÁLISE FILOGENÉTICA

As sequências de nucleotídeos e aminoácidos de representantes da família

Totiviridae foram obtidas a partir do GenBank (www.ncbi.nlm.nih.gov) e UniProt –

Universal Protein Resource (www.uniprot.org). As sequências foram alinhadas com o

auxílio das ferramentas TCOFFEE e MCOFFEE (NOTREDAME, HIGGINS &

HERINGA, 2000) usando parâmetros default, e manualmente editadas usando

Jalview versão 2.8 (WATERHOUSE et al., 2009). As Open Reading Frames (ORFs)

e domínios conservados de proteínas foram identificados através do ORF finder

(http://www.ncbi.nlm.nih.gov/projects/gorf/) e do Conserved Domains Database –

CDD (http://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml), respectivamente. As

sequências de aminoácidos da RdRp foram então alinhadas no programa MAFFT

versão 6.85 (KATOH & TOH, 2010; KATOH & FRITH, 2012) com parâmetro L-INS-I

que avalia a consistência do alinhamento, gap opening penalty 1.53 e offset value

0.1, guiado por alinhamento estrutural da família de proteínas pfam02123, presente

no CDD (MARCHLER-BAUER et al., 2011). A sequência da RdRp de Micromonas

pusilla virus (família Reoviridae; número de acesso YP654545) foi usada como

outgroup devido sua alta proximidade e similaridade com a família Totiviridae. O

melhor modelo de substituição de aminoácidos foi estimado por análise de

verossimilhança usando o programa ProtTest versão 3.2 (ABASCAL, ZARDOYA &

POSADA, 2005). O cálculo dos dendogramas foi baseado em análise Bayesiana,

usando os programas MrBayes versão 3.2.1 (RONQUIST & HUELSENBECK, 2003;

RONQUIST et al., 2012), e BEAST versão 1.8 (DRUMMOND et al., 2012). Todos os

Page 42: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

41

indels e sítios não informativos (missing data) no alinhamento foram tratados como

deleções parciais, com um corte de 75%, para permitir potenciais regiões ambíguas

nas topologias, resultado em 530 sítios de parcimônia informativos no dataset. A

inferência Bayesiana foi conduzida em três corridas (runs) independentes, com

modelos fixos LG ou WAG, taxas de distribuição gama entre os sítios e frequências

de aminoácidos fixas. Cada Cadeia de Markov foi iniciada com uma árvore aleatória

e rodada por 106 gerações, com dados amostrados a cada 100 gerações, e a árvore

consenso foi estimada usando um “burn in” de 1.000.000 árvores. A convergência

das corridas foi avaliada usando a ferramenta Tracer versão 1.5 (DRUMMOND &

RAMBAUT, 2007), a fim de avaliar estatisticamente a robustez da análise

Bayesiana. As árvores geradas pelos programas foram editadas no programa

FigTree versão 1.4.1 (DRUMMOND & RAMBAUT, 2007).

3.2 OBTENÇÃO DAS AMOSTRAS DE CAMARÃO

Amostras de camarão da espécie Litopenaeus vannamei possivelmente

infectadas com IMNV foram gentilmente cedidas por empresas do Nordeste do

Brasil. As amostras eram oriundas de diferentes regiões do litoral do Nordeste

brasileiro e foram coletadas em anos diferentes. A maioria das amostras

correspondia ao camarão intacto, apresentando ou não sintomas da doença. Outras

duas amostras correspondiam a um lisado de células de camarão, um conservado

de forma congelada e outro em etanol 70%. Essas duas últimas amostras foram

coletadas em 2009 no estado do Pernambuco/BR e em 2013 no estado do Rio

Grande do Norte/BR, respectivamente.

Page 43: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

42

3.3 SCREENING INICIAL PARA DETECÇÃO DO IMNV EM DIFERENTES

AMOSTRAS DE CAMARÃO

Inicialmente, para a detecção dos vírus nas amostras de camarão, foram

utilizadas duas estratégias: (i) PCR-Nested, utilizando primers desenvolvidos por

Senapin et al. (2007), especificamente os pares de primers F13/R13 e F13N/R13N

e; (ii) o método de identificação tradicional que utiliza os primers desenvolvidos pela

World Organization for Animal Health (OIE). Após as análises iniciais, a identificação

dos vírus foi realizada empregando o par de primers F14/R14. As sequências dos

primers usados em cada análise estão listadas na Tabela 1.

As amostras de camarões, possivelmente infectadas foram analisadas como

descrito a seguir.

Tabela 1: Lista dos primers usados em cada análise para identificar o IMNV nas amostras de camarões Litopenaeus vannamei.

Primer Sequência (5’ → 3’) Referência

F13 TTTATACACCGCAAGAATTGGCCAA

Senapin et al., 2007 R13 AGATTTGGGAGATTGGGTCGTATCC

F13N TGTTTATGCTTGGGATGGAA

R13N TCGAAAGTTGTTGGCTGATG

4587F CGACGCTGCTAACCATACAA

OIE 4914R ACTCGGCTGTTCGATCAAGT

4725NF GGCACATGCTCAGAGACA

4863NR AGCGCTGAGTCCAGTCTTG

F14 GAGTACCATCAGGAGTGAGAATAAC Senapin et al., 2007

R14 GATGTATGTCCTCTACGTTAACCAA

Page 44: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

43

3.3.1 Extração de RNA total

A extração de RNA total foi realizada utilizando o KIT NUCLEOSPIN®RNA II,

seguindo as instruções do fabricante. Aproximadamente, 50 µg de tecido foram

retirados do sexto segmento abdominal do camarão. Em seguida, o tecido foi

macerado, vortexado e submetido às etapas de centrifugação descritas no manual

do kit de extração. Para as amostras de lisados de células de camarão conservadas

congeladas ou em etanol 70%, foram utilizados 30 µl e 60 µl de amostra,

respectivamente.

3.3.2 RT-PCR

3.3.2.1 Síntese de cDNA

A síntese de cDNA foi realizada seguindo o protocolo da enzima

Transcriptase Reversa ImPromII™ (Promega®) para um volume final de 20 µl, com

algumas modificações. Em tubos de 1,5 ml, foram adicionados 6,6 µl de RNA total e

4 µl de primers (5 µM cada). Essa mistura foi incubada a 85 ºC em banho Maria por

5 minutos e, imediatamente em seguida, colocada em gelo por 5 minutos.

Posteriormente foram adicionados aos tubos 4 µl de Reaction Buffer 5X, 2,4 µl de

MgCl2 25 mM, 2 µl de dNTP mix 5 mM cada e 1 µl da enzima Transcriptase Reversa.

Em seguida, os tubos foram submetidos às seguintes etapas: (1) temperatura

ambiente (± 25 ºC) por 5 minutos, para anelar os primers; e (2) 50 ºC por 60 minutos

em banho Maria, para extensão das fitas de cDNA.

Page 45: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

44

3.3.2.2 Reação em Cadeia da Polimerase (PCR)

A reação em cadeia da polimerase foi realizada de acordo com o protocolo da

Taq Biotools, com algumas modificações. As amplificações foram conduzidas em

volume final de 20 µl contendo 10,8 µl de água Milliq, 2 µl de Reaction Buffer 10X, 1

µl de MgCl2 50 mM, 0,8 µl de dNTP mix 5 mM cada, 0,4 µl de Taq polimerase (5

U/µl), 4 µl de cDNA e 1 µl de primer. Para a amostra conservada em etanol 70%, as

quantidades de água e cDNA foram 7,8 µl e 7 µl, respectivamente.

Os ciclos térmicos empregados nas análises variaram conforme os primers

usados:

(i) Desnaturação inicial a 94 ºC por 2 minutos, seguido por 30 ciclos de

desnaturação a 94 ºC por 40 segundos, anelamento a 45 ºC por 40 segundos,

extensão a 72 ºC por 40 segundos, e extensão final a 72 ºC por cinco minutos. Na

reação nested, o ciclo correspondia a uma desnaturação inicial a 94 ºC por 5

minutos, seguido por 25 ciclos de desnaturação a 94 ºC por 45 segundos,

anelamento a 50 ºC por 45 segundos, extensão a 72 ºC por 30 segundos, e

extensão final a 72 ºC por cinco minutos (primers F13/R13 e F13N/R13N

desenvolvidos por Senapin et al., 2007).

(ii) Desnaturação inicial a 95 ºC por 2 minutos, seguido por 39 ciclos de

desnaturação a 95 ºC por 45 segundos, anelamento a 60 ºC por 45 segundos, e

extensão final a 60 ºC por sete minutos. Na reação nested, o ciclo correspondia a

uma desnaturação inicial a 95 ºC por 2 minutos, seguido por 39 ciclos de

desnaturação a 95 ºC por 30 segundos, anelamento a 65 ºC por 30 segundos,

extensão a 72 ºC por 30 segundos, e extensão final a 72 ºC por dois minutos

(primers desenvolvidos pela OIE).

Page 46: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

45

(iii) Desnaturação inicial a 94 ºC por 2 minutos, seguido por 30 ciclos de

desnaturação a 94 ºC por 30 segundos, anelamento a 55 ºC por 45 segundos,

extensão a 72 ºC por 45 segundos, e extensão final a 72 ºC por cinco minutos

(primers F14/R14 desenvolvidos por Senapin et al., 2007).

Os produtos da amplificação foram visualizados em gel de agarose 1%, na

presença de brometo de etídio. Os tamanhos dos fragmentos foram determinados

através de um marcador de peso molecular DNA Marker Hae III (Sigma) e

visualizados em transluminador UV.

3.4 AMPLIFICAÇÃO E SEQUENCIAMENTO DO GENOMA VIRAL

Para a amplificação do genoma viral completo, as etapas de extração de RNA

total, síntese de cDNA e técnica de PCR procederam conforme descrito

anteriormente. O ciclo térmico empregado foi o mesmo daquele utilizado para os

primers F14/R14.

A estratégia de amplificação e os primers usados para amplificar o genoma

completo do vírus foram aqueles descritos no trabalho de Senapin et al. (2007). No

total, 15 regiões do genoma foram amplificadas por RT-PCR para produzir 13

fragmentos de 600 pb cada, 1 fragmento de 840 bp e 1 fragmento de 572 pb. Cada

fragmento amplificado tinha sua extremidade 3’ sobreposta com a extremidade 5’ do

fragmento adjacente. A estratégia de amplificação está mostrada na Figura 7 e a

lista das sequências de primers esta descrita na Tabela 2.

Page 47: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

46

Figura 7: Estratégia empregada para amplificar o genoma completo do IMNV (adaptado de SENAPIN et al., 2007).

Tabela 2: Lista de primers usados para amplificar o genoma completo do IMNV (SENAPIN et al.,

2007).

Região Nome do primer foward /Sequência Nome do primer reverse/Sequência

1 F1/GGCAATTTCAACCTAATTCTAAAAC R1/TGAAAAATAAGCTGTGCCCCATGTT

2 F2/AATACTACATCATCCCCGGGTAGAC R2/GACTTTCTTCCCAAGATGGAGTCTC

3 F3/GAAGTTAAAGATGTAACACTTGCCT R3/ATACTCCTTCTCCAAAGGGTGTACG

4 F4/GATCCAGTTCTAACTAGAGAAGATA R4/TCCAGATACAATTACCATGCTGGTT

5 F5/GCAGCTTGGCTAAACAACAGACCAT R5/ATTCAATCCACGAATTTGTCTTGGT

6 F6/CTTCGTGATAATGACTCTATTAGGG R6/CTGTGGAACAGATTGTAAAGTAAGA

7 F7/ATAAATAATGGTGTTAATATATTTG R7/ACTAATTGGCAGTGTTGTTTTCATT

8 F8/GTTGGTGTGGCCCTGCCAACTGTAA R8/ACTACCTTGCATTGAACTCCACGAA

9 F9/GTTTGGTATTCAACAAGACGTATTT R9/AACATTAATACAACTCTCATCATGA

10 F10/GAGACAGGCAATGTATTCAGACCAT R10/CTCTTGCTGACTCGGCTGTTCGATC

11 F11/TCGGGTTTTATGAATGCCCGTTCCA R11/TTGATAACTGTTTTGCAATTTCAAT

12 F12/TTGTACAAAACATTTGTATCTATAT R12/CTTCGATGTTAGATGCCACAGCAAG

13 F13/TTTATACACCGCAAGAATTGGCCAA R13/AGATTTGGGAGATTGGGTCGTATCC

14 F14/GAGTACCATCAGGAGTGAGAATAAC R14/GATGTATGTCCTCTACGTTAACCAA

15 F15/AATATCTAGAATTGCCAAAACGACT R15/CATGGCTGGCCACAAAACCCAACTG

Nested F13N/TGTTTATGCTTGGGATGGAA R13N/TCGAAAGTTGTTGGCTGATG

Page 48: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

47

Os produtos de PCR foram enviados à empresa Hellixa para serem

purificados e submetidos ao sequenciamento usando a plataforma da Applied

Biosystems® 3500 Genetic Analyzer, de acordo com as especificações do

fabricante. As concentrações dos produtos da amplificação foram mensuradas

previamente a fim de se verificar se os mesmos estavam na concentração adequada

para o sequenciamento. Os fragmentos foram sequenciados através do método de

sequenciamento Sanger, utilizando os primers descritos na Tabela 2 na

concentração de 5 µM cada primer. A reação de sequenciamento ocorreu em ambas

às direções, foward e reverse, para cada região. As regiões do genoma foram

sequenciadas no mínimo duas vezes (forward + reverse) e no máximo seis vezes

até a obtenção de uma sequência confiável. As análises dos eletroferogramas e a

montagem dos genomas foram realizadas usando parâmetros pré-definidos no

programa Geneious versão 6.1.6 (Disponível em Biomatters) e inspeção visual

cuidadosa.

3.5 ANÁLISE DAS SEQUÊNCIAS

As sequências genômicas completas obtidas foram analisadas no Basic Local

Alignment Search Tool – BLAST (ALTSCHUL et al., 1997) para confirmar suas

identidades e encontrar outras sequências similares. As sequências de aminoácidos

foram obtidas através do servidor Expert Protein Analysis System – ExPASy

(http://ca.expasy.org/). Uma análise comparativa entre os genomas obtidos neste

estudo com outros 2 genomas completos do IMNV disponíveis no GenBank

(números de acesso AY570982.2 e EF061744.1) foi realizada usando o programa

Geneious. Posteriormente, as quatro sequências foram alinhadas no ClustalW

Page 49: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

48

(LARKIN et al., 2007), com parâmetros default, usando o software Jalview versão

2.8 (WATERHOUSE et al., 2009) para identificação dos sítios polimórficos e regiões

conservadas. Diferenças no nível de similaridade entre as regiões genômicas foram

plotadas pelo programa SimPlot versão 3.5.1 (LOLE et al., 1999), com os seguintes

parâmetros: modelo de árvore Neighbor joining, bootstrap igual a 1000 e modelo de

distância Kimura (2-parameter). Adicionalmente, a fim de investigar a similaridade

entre os genomas, uma análise de agrupamento, utilizando o método de Neighbor

joining foi feita no software MEGA versão 6.06 (TAMURA et al., 2013), usando o

modelo de substituição nucleotídica de Tamura-Nei e 1000 repetições de bootstrap,

como teste de confiança na topologia. Para esta análise, além das sequências

completas obtidas no presente estudo, foram usadas as seguintes sequências

disponíveis no GenBank: números de acesso JN391187.1, AB555544.1,

NC_013499.1, NC_014609.1, AY570982, EF061744.1.

3.6 ANÁLISE ESTRUTURAL DE PROTEÍNAS

A predição de regiões estruturadas e não estruturadas foi realizada através do

software Foldindex© que prediz se uma sequência de proteínas é intrinsecamente

desdobrada implementando o algorítimo de Uversky e colaboradores, o qual é

baseado na hidrofobicidade média dos resíduos e carga líquida das sequências

(PRILUSKY et al., 2005). Para a predição de coiled coils foi usado o programa Coils

(LUPAS, VAN DYKE & STOCK, 1991) com windows 14, 21 e 28. O programa

TMpred (HOFMANN & STOFFEL, 1993) foi empregado para avaliar a

hidrofobicidade e hidrofilicidade da proteína ao longo da sequência de aminoácidos,

e o software PredictProtein (ROST, YACHDAV & LIU, 2004) foi utilizado para

Page 50: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

49

predizer estruturas em α-hélices e folhas β, assim como regiões da proteína

expostas ou não a solvente.

3.7 MODELAGEM PROTEICA

A predição de modelos estruturais foi realizada com auxílio dos programas I-

TASSER (servidor online) (ZHANG, 2008; ROY et al,. 2010) e Phyre2 (KELLEY &

STERNBERG, 2009). A metodologia do I-TASSER é baseada na predição por

homologia de estrutura e alinhamento por threading das sequências alvo com base

nas estruturas disponíveis na biblioteca do Protein Data Bank – PDB

(http://www.rcsb.org/pdb/home/home.do), complementando com simulações ab initio

para as cadeias laterais (ZHANG, 2007). O programa I-TASSER gera modelos

classificados pelo Z-Score, RMSD, densidade do cluster e, principalmente pelo C-

score. O C-score corresponde ao escore de confiança que estima a qualidade do

modelo gerado pelo I-TASSER cujo valor pode ser de -5 a 2 (quanto maior o valor

do C-score, maior será a confiança do modelo). Com relação ao programa Phyre2,

este realiza modelagem basicamente por homologia (KELLEY & STERNBERG,

2009).

Os modelos foram avaliados usando os softwares MOLPROBITY (CHEN et

al., 2010) e SWISS-MODEL (ARNOLD et al., 2006). Para a visualização dos

modelos, foram usados os softwares UFSC Chimera (PETTERSEN et al., 2004) e

PyMOL versão 1.5.0.4 (http://www.pymol.org/).

Page 51: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

50

3.8 SISTEMAS DE DETECÇÃO DE POLIMORFISMOS

3.8.1 Teste de detecção baseado nas regiões variáveis e conservadas

Pares de primers foram desenhados com base em uma região conservada e

uma região variável do genoma. Todos os primers foram analisados nos programas

PrimerBlast (http://www.ncbi.nlm.nih.gov/tools/primer-blast/) para verificar o TM

(temperatura de melting) e anelamento inespecífico, e AutoDimer (VALLONE &

BUTLER, 2004) para verificar a formação de hairpins e dímeros de primers.

Um método de PCR convencional foi desenvolvido para identificar as duas

regiões escolhidas. Após a síntese de cDNA, foi realizada a PCR como descrito a

seguir: os primers (5 µM cada) foram usados em 20 µl de reação contendo 10,8 µl

de água Milliq, 2 µl de Reaction buffer 10X, 1 µl de MgCl2 50 mM, 0,8 µl de dNTP

mix 5 mM cada, 0,4 µl de Taq polimerase 5 U/µl e 4 µl de cDNA. A reação foi

submetida à desnaturação inicial a 94 ºC por 2 minutos, seguido por 30 ciclos de 94

ºC por 30 segundos, 58 ºC por 45 segundos, 72 ºC por 45 segundos, e extensão

final a 72 ºC por 5 minutos. Os amplicons gerados foram de 200 pb para a região

conservada e 456 pb para a região variável. Os produtos da PCR foram analisados

em gel de agarose 1,5% na presença de brometo de etídio, e visualizados em

transluminador.

Uma análise de agrupamento utilizando o método de Neighbor joining foi

realizada usando a sequência de nucleotídeos do fragmento de 456 pb. O

dendograma foi calculado no programa MEGA 6.06, usando o modelo Tamura-Nei e

1000 replicações de Bootstrap.

Page 52: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

51

3.8.2 Teste de detecção baseado na análise da curva de melting de fita simples

Seis regiões no genoma (cada uma com 200 pb) foram selecionadas como

candidatas para o sistema de identificação de polimorfismos através da análise da

curva de melting de fita simples. Essas regiões foram submetidas à análise in silico

no programa RNAfold (http://rna.tbi.univie.ac.at) para predição da estruturas

secundárias de RNA e DNA, e nos softwares MELTSIM (BLAKE et al., 1999) e

RNAheat (HOFACKER et al., 1994) para a geração de curvas de melting de DNA fita

dupla e RNA fita simples, respectivamente. Os seis pares de primers (sequências

não mostradas) foram desenhados e analisados usando os programas PrimerBlast e

AutoDimer.

As análises in vitro procederam da seguinte maneira, em duas etapas:

(I) Em um volume final de 20 µl foram adicionados 10,8 µl de água Milliq, 2 µl

de Reaction Buffer 10X, 1 µl de MgCl2 50 mM, 0,8 µl de dNTP mix 5 mM

cada, 0,4 µl de Taq polimerase (5 U/µl), 4 µl de cDNA e 1 µl de primer (5

µM cada). O protocolo de termociclagem compreendia um passo inicial a

94 ºC por 2 minutos, seguido por 30 ciclos de desnaturação a 94 ºC por 30

segundos, anelamento a 55 ºC por 45 segundos, extensão a 72 ºC por 45

segundos, e extensão final a 72 ºC por cinco minutos.

(II) 4 µl do produto da primeira reação foi utilizado como template em um

volume final de 20 µl contendo 10 µl de mix SYBR green, 1 µl de primer

foward (5 µM) e 5 µl de água Milliq. Essa reação foi submetida a uma

desnaturação inicial a 94 ºC por 2 minutos, seguido por 30 ciclos de

desnaturação a 94 ºC por 30 segundos, anelamento a 55 ºC por 45

segundos, extensão a 72 ºC por 45 segundos, 30 ºC por 2 minutos, e

Page 53: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

52

extensão final a 72 ºC por cinco minutos. Os parâmetros da curva de

dissociação foram padrões.

As curvas de melting in vitro foram visualizadas no software 7500 Fast Real-Time

PCR System versão 2.1.0 (Applied Biosystems®).

Page 54: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

53

4 RESULTADOS

4.1 ANÁLISE FILOGENÉTICA DA FAMÍLIA TOTIVIRIDAE

Proteínas RdRp foram analisadas a fim de estimar a relação filogenética do

IMNV dentro da família Totiviridae. Trinta sequências de aminoácidos da RdRp de

membros representativos da família Totiviridae (Tabelas Suplementares 1 e 2) foram

alinhadas, e as relações entre elas está descrito no dendograma da Figura 8. Oito

clados monofiléticos distintos podem ser observados no dendograma e esses grupos

foram nomeados seguindo a classificação de Liu et al. (2012). O grupo IMNV-like, o

qual compreende vírus que infectam artrópodes, GLV-like e ScV-like coincide com

os descritos previamente (LIU et al., 2012). Quatro novos grupos foram

estabelecidos: MoV-like, compreendendo vírus que infectam plantas e fungos, TVV-

like e LRV-like, que abragem vírus que infectam protozoários parasitas humanos, e

GaRV-like, que compreende vírus de fungos. Para assegurar a eficiência da análise,

as relações entre os membros dos grupos TVV-like, LRV-like e GLV-like (Tabela

Suplementar 2) foram determinadas numa segunda análise filogenética (Figura

Suplementar 1). O vírus Zygosaccharomyces bailii (ZbV-Z) e dois outros vírus

relacionados isolados de plantas e fungos formaram o grupo ZbV-Z-like. Todos os

grupos observados estão de acordo com a classificação propostas pelo Comitê

Internacional de Taxonomia de Vírus (ICVT) (KING et al., 2012).

Page 55: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

54

Figura 8: Análise filogenética de membros representativos da família Totiviridae. A árvore foi calculada a partir do alinhamento da sequência de aminoácidos da RdRp de 30 membros representativos da família Totiviridae, usando Inferência Bayesiana. As IDs das sequências estão indicadas nas Tabelas Suplementares 1 e 2. Os números indicam a consistência topológica e a confiança de cada ramo. As chaves indicam os grupos identificados neste estudo e nomeados de acordo com Liu et al. (2012) e as cores representam os gêneros de acordo com a ICTV.

4.2 SCREENING INICIAL PARA DETECÇÃO DO IMNV EM DIFERENTES

AMOSTRAS DE CAMARÃO

Foram analisadas 31 amostras diferentes de camarão utilizando os métodos

descritos anteriormente. Algumas apresentavam sinais da doença, como opacidade

ou coloração avermelhada nos segmentos abdominais distais. Das 31 amostras

analisadas, apenas duas foram identificadas como positivas para o IMNV: o lisado

de células congelado e o conservado em etanol 70% (Tabela Suplementar 3).

Page 56: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

55

4.3 AMPLIFICAÇÃO E MONTAGEM DOS NOVOS GENOMAS

Dois novos genomas de isolados diferentes do IMNV foram amplificados e

sequenciados no presente estudo. Os isolados foram nomeados IMNVgen1

(coletado em 2009 no estado de Pernambuco/BR) e IMNVgen2 (coletado em 2013

no estado do Rio Grande do Norte/BR). As sequências dos genomas completos

estão mostradas nas Figuras Suplementares 2 e 3.

A estratégia empregada para obtenção da sequência nucleotídica completa

de IMNVgen1 e IMNVgen2 foi aquela desenvolvida para o genoma proveniente da

Indonésia descrita por Senapin et al. (2007). Exceto pelos últimos 43 nucleotídeos

em um dos genomas, a qualidade das bases foi alta, em torno de 50 (> 20),

equivalente ao escore Phred (EWING & GREEN, 1998), indicando que a sequência

genômica foi confiável para os dois isolados.

4.4 CARACTERIZAÇÃO DOS NOVOS GENOMAS

A análise comparativa realizada com o auxílio da ferramenta BLAST mostrou

que as novas sequências obtidas no presente estudo correspondem ao vírus da

mionecrose infecciosa (99% de identidade). Os dois isolados apresentaram um

genoma de 7561 pb, consistente com o tamanho dos genomas do IMNV publicados

anteriormente para os isolados do Brasil (GenBank Nº de acesso AY570982.2) e

Indonésia (GenBank Nº de acesso EF061744.1). IMNVgen1 apresentou uma

composição de bases de 37,0% de A, 25,2% de T, 20,0% de G e 17,8% de C. O

conteúdo G/C e A/T do genoma foi calculado para ser 1,12% e 1,47%,

respectivamente. Já IMNVgen2 apresentou uma composição de bases de 36,8% de

Page 57: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

56

A, 25,3% de T, 20,0% de G e 17,9% de C. O conteúdo G/C e A/T do genoma foi

calculado para ser 1,12% e 1,45%, respectivamente. Como mostrado na Tabela 3,

IMNVgen1 é muito similar a IMNVgen2 (99,42% de identidade), assim como é muito

parecido com os isolados do Brasil e Indonésia. Valores de identidade semelhantes

foram observados quando IMNVgen2 foi comparado com esses mesmos isolados

(Tabela 4).

Tabela 3: Comparação das sequências de nucleotídeos e aminoácidos do IMNVgen1 com outras sequências disponíveis no GenBank e IMNVgen2.

GenBank No/ novo genoma

Local do isolado (ano)

Identidade genômica

(%)

Identidade de nucleotídeos (%)

Identidade de aminoácidos (%)

ORF1 ORF2 ORF1 ORF2

AY570982.2 Brasil (2003) 98,90 98,75 99,11 98,82 99,34

EF061744.1 Indonésia (2006) 98,66 98,48 98,99 98,45 99,34

IMNVgen2 Brasil (2013) 99,42 99,36 99,56 99,57 99,21

Tabela 4: Comparação das sequências de nucleotídeos e aminoácidos do IMNVgen2 com outras sequências disponíveis no GenBank e IMNVgen1.

GenBank No/ novo genoma

Local do isolado (ano)

Identidade genômica

(%)

Identidade de nucleotídeos (%)

Identidade de aminoácidos (%)

ORF1 ORF2 ORF1 ORF2

AY570982.2 Brasil (2003) 98,90 98,75 99,11 98,82 99,21

EF061744.1 Indonésia (2006) 98,67 98,48 98,99 98,38 99,21

IMNVgen1 Brasil (2009) 99,42 99,36 99,56 99,57 99,21

Page 58: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

57

As sequências codificantes de IMNVgen1 e IMNVgen2 estão organizadas

em duas ORFs, como esperado para um típico totivírus e de acordo com os

genomas já publicados (POULOS et al., 2006; SENAPIN et al., 2007). Em ambos, a

ORF1 apresentou 4.818 nucleotídeos, começando no nucleotídeo 136, e a ORF2

apresentou 2.250 nucleotídeos, começando no nucleotídeo 5.241, estando as ORFs

em diferentes frames. A sequência aminoacídica da ORF1 dos novos genomas foi

pelo menos 98,38% similar as sequências dos isolados do Brasil e Indonésia

(Tabela 4). Com relação à sequência aminoacídica da ORF2, IMNVgen1 mostrou

99,34% de similaridade com os genomas já publicados, enquanto que IMNVgen2

mostrou 99,21% de similaridade.

A análise de agrupamento por Neighbor joining usando os quatro genomas

completos dentro do grupo IMNV-like gerou um dendograma com dois grupos bem

definidos para o IMNV: um grupo composto pelos vírus sequenciados neste estudo e

outro compreendendo os genomas previamente descritos (Figura 9).

Figura 9: Análise Neighbor joining do grupo IMNV-like incluindo os quatro genomas completos do IMNV. O dendograma foi calculado baseado no alinhamento da sequência de nucleotídeos, usando o modelo Tamura-Nei e 1000 replicações de Bootstrap. As análises foram realizadas no programa MEGA 6.06. IMNV - Penaeid shrimp infectious myonecrosis virus; AsV - Armigeres subalbatus virus; DmV - Drosophila melanogaster totivirus; TianV - Tianjin totivirus; ORV - Omono river virus.

Page 59: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

58

4.5 IDENTIFICAÇÃO DE REGIÕES CONSERVADAS E VARIÁVEIS

A análise realizada no programa Simplot gerou um gráfico que proporcionou

uma visão geral da distribuição de sítios polimórficos (SPs) ao longo do genoma. Os

SPs foram verificados nas oito regiões previamente descritas para o genoma do

IMNV (POULOS et al., 2006; NIBERT, 2007): (1) 5’UTR, que compreende os

primeiros 135 nucleotídeos do genoma, (2) RBP, correspondente a região que

codifica uma provável proteína de ligação a RNA (nt 136 a 414), (3) Small Protein 1

(SP1) e (4) Small Protein 2 (SP2) (nt 415 a 1266 e nt 1267 a 2247,

respectivamente), regiões candidatas a codificarem as protrusões do IMNV, (5) MCP

(nt 2248 a 4953), que corresponde a região que codifica a proteína do capsídeo, (6)

região entre as ORFs (nt 4954 a 5240), (7) região que codifica a RdRp (nt 5241 a

7490) e (8) 3’UTR que compreende os últimos 71 nucleotídeos do genoma. Estas

regiões estão esquematizadas no topo da Figura 10. Observando as comparações

ilustradas na Figura 10 é possível identificar três regiões com baixo escore de

similaridade localizadas na primeira metade da ORF1, em todas as comparações. A

análise no Simplot também revelou que a região que codifica a ORF2 apresenta alta

similaridade quando comparada à ORF1. Os resultados também indicam que os

isolados descritos para o Brasil e Indonésia são mais similares entre si, assim como

IMNVgen1 e IMNVgen2, o que corrobora com o dendograma mostrado na Figura 9.

Page 60: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

59

Figura 10: Representação esquemática do genoma do IMNV e análise de variabilidade. Os plots de similaridade gerados no Simplot comparam IMNVgen1 e IMNVgen2 com os genomas disponíveis no banco de dados. O eixo X representa a posição dos nucleotídeos e o eixo Y representa o escore de similaridade. A região mais variável e o domínio conservado da RdRp estão destacados.

Page 61: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

60

Os resultados obtidos no alinhamento das sequências nucleotídicas e

aminoacídicas mostrou a presença de 126 sítios polimórficos, dos quais 5 estão na

proteína de ligação a dsRNA (RBP), 40 nas regiões das Small Proteins (SP1 e SP2),

47 na proteína do capsídeo e 28 na RdRp. Desses 126 sítios polimórficos, 37

causam alteração em aminoácidos, estando 13 nas regiões de SP1 e SP2, 15 na

proteína do capsídeo e 7 na RdRp (Figura 11 e Tabela Suplementar 4). Levando em

consideração a região codificante do genoma, verificamos que, proporcionalmente, a

maior densidade de sítios polimórficos, inclusive aqueles que alteram aminoácidos,

se encontram nas regiões da SP1 e SP2 (~1 polimorfismo a cada 46 nt), seguido

pela proteína do capsídeo (~1 polimorfismo a cada 57 nt) e pela RdRp (~1

polimorfismo a cada 80 nt). Os polimorfismos encontrados na região da proteína de

ligação da dsRNA não alteram o quadro de leitura dos aminoácidos, constituindo

mutações silenciosas.

Figura 11: Sítios polimórficos identificados no genoma do IMNV. O número total de sítios polimórficos compreende os sítios polimórficos sinônimos e não sinônimos mostrados proporcionalmente em cada região do genoma.

132 274

1806 2674

286

2229

69

3 5

27 32

1

21

2

13 15 7

96%

96%

97%

97%

98%

98%

99%

99%

100%

100%

5'UTR RBP Small Proteins

MCP Entre ORFs RdRp 3'UTR

Sítios não polimórficos

Sítios polimórficos (total menos sítios não sinônimos)

Sítios polimórficos não sinônimos

Page 62: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

61

Com base nos resultados obtidos no Simplot e no alinhamento das quatro

sequências, foi possível mapear os sítios polimórficos ao longo do genoma e, assim

identificar quais regiões eram mais conservadas e quais eram mais variáveis. Os

dados indicam que as regiões previstas para codificarem a protrusão do vírus (SP1 e

SP2) variaram mais em relação às outras regiões, enquanto que a região da RdRp

apresentou-se mais conservada. Nesse sentido, podemos dizer que as proteínas

que são candidatas a formarem a protrusão do vírus são mais susceptíveis a

sofrerem mudanças do que as outras proteínas do IMNV e, provavelmente

apresentam uma região hipervariável.

4.6 ANÁLISE DE COMPOSIÇÃO DE AMINOÁCIDOS E PREDIÇÃO DE

ESTRUTURA SECUNDÁRIA

Os primeiros 93 aminoácidos da ORF1 codificam uma proteína que

apresenta um domínio DSRM (double-strand RNA binding motif) conservado

envolvido na ligação a RNA. Para simplificar, toda a proteína foi chamada RBP (RNA

binding protein). As predições de estrutura secundária revelam que a RBP é

totalmente estruturada e possui alto conteúdo de α-hélices, mas nenhum coiled coil

(Figura 12 e Figura Suplementar 4A). Diferente das outras proteínas do IMNV, a

RBP não apresentou nenhum sítio polimórfico que causasse alteração na sequência

de aminoácidos.

Page 63: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

62

Figura 12: Análise de composição de aminoácidos e predição de estrutura secundária para RBP. A predição de regiões estruturadas (verde) e desestruturadas (vermelho), coiled coils e hélices transmembrana foram realizadas usando os programas Foldindex, Coils e TMPred, respectivamente. O software PredictProtein foi usado para predizer a presença de α-hélices (caixas rosas) e folhas β (caixas azuis) (primeira e segunda linha), e exposição a solvente (caixas azuis indicam exposição a solvente e caixas amarelas indicam não exposição a solvente). Abaixo, uma representação esquemática mostrando o domínio conservado DSRM (em cinza claro). O eixo X representa a posição dos aminoácidos.

Proporcionalmente, as proteínas SP1 e SP2, candidatas a codificarem a

protrusão, apresentaram o maior número de sítios polimórficos, dos quais 13 podem

provocar mudança de aminoácidos. As análises de composição de aminoácidos e

predição de estrutura secundária indicam que SP1 possui características de uma

proteína estruturada apresentando uma região N-terminal hidrofóbica não exposta a

solvente e grande quantidade de folhas-β (Figura 13 e Fig. Suplementar 4B). Já SP2

Page 64: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

63

mostrou-se uma proteína quase totalmente desestruturada, com alta quantidade de

aminoácidos carregados, alta hidrofilicidade e uma pequena região estruturada na

porção C-terminal. Além disso, a região desestruturada que apresentou o maior pico

coincidiu com uma região não exposta a solvente. SP2 também mostrou uma região

de coiled coil com um escore significante na porção N-terminal, que foi predito em

diferentes reading windows (Figura 13 e Figura Suplementar 4C).

Figura 13: Análise de composição de aminoácidos e predição de estrutura secundária para SP1 e SP2. A predição de regiões estruturadas (verde) e desestruturadas (vermelho), coiled coils e hélices transmembrana foram realizadas usando os programas Foldindex, Coils e TMPred, respectivamente. O software PredictProtein foi usado para predizer a presença de α-hélices (caixas rosas) e folhas β (caixas azuis) (primeira e segunda linha), e exposição a solvente (caixas azuis indicam exposição a solvente e caixas amarelas indicam não exposição a solvente). Abaixo, uma representação esquemática mostrando os sítios polimórficos não sinônimos (traços pretos) identificados nas proteínas. O eixo X representa a posição dos aminoácidos.

Page 65: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

64

A proteína principal do capsídeo (MCP) apresentou um número considerável

de sítios polimórficos, sendo superada apenas pela região das proteínas SP. De

acordo com o esperado para uma proteína globular, ela contém uma alta proporção

de aminoácidos neutros (31%) e hidrofóbicos (50,5%). Esta proteína, formada por

901 aminoácidos, apresentou alto grau de regiões estruturadas e duas regiões

desestruturadas mais evidentes na sua segunda metade. A região desestruturada

entre os aminoácidos 804 a 846 contém alto conteúdo de α-hélices predito pelos

programas Coils e PredictProtein (Figura 14 e Fig. Suplementar 4D). As análises in

silico também revelaram cinco picos hidrofóbicos preditos pelo TMPred. A

comparação entre os quatro genomas do IMNV mostrou que a região

correspondente a MCP possui 15 sítios onde ocorrem mudanças de aminoácidos.

Esses sítios estão distribuídos ao longo da proteína e alguns coincidem com os

picos hidrofóbicos.

Um mapa contendo todos os sítios polimórficos, bem como os aminoácidos

codificados, está mostrado na Tabela Suplementar 4. As mudanças de aminoácidos

nos sítios 2440, 3160, 3293, 3570, 3653, 3929, 4091 e 4504, localizados na MCP,

devem ser destacadas, pois ocorrem mudanças entre aminoácidos com diferentes

cargas, indicando que estes sítios poderiam afetar a estrutura secundária da

proteína em diferentes isolados virais.

Page 66: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

65

Figura 14: Análise de composição de aminoácidos e predição de estrutura secundária para MCP. A predição de regiões estruturadas (verde) e desestruturadas (vermelho), coiled coils e hélices transmembrana foram realizadas usando os programas Foldindex, Coils e TMPred, respectivamente. O software PredictProtein foi usado para predizer a presença de α-hélices (caixas rosas) e folhas β (caixas azuis) (primeira e segunda linha), e exposição a solvente (caixas azuis indicam exposição a solvente e caixas amarelas indicam não exposição a solvente). Abaixo, uma representação esquemática mostrando o core conservado da MCP (em cinza claro) e os sítios não sinônimos identificados na proteína (traços pretos). O eixo X representa a posição dos aminoácidos.

Page 67: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

66

A RNA polimerase dependente de RNA mostrou-se uma proteína muito

conservada entre os quatro isolados apresentando apenas sete sítios polimórficos

não-sinônimos. As análises in silico revelaram que a RdRp possui características de

uma proteína estruturada com pequenas regiões desestruturadas interpassadas,

lembrando uma proteína com domínios conectados por pontes móveis (Figura 15 e

Figura Suplementar 4E). Duas hélices hidrofóbicas preditas pelo TMPred estão

localizadas em domínios estruturados e provavelmente estão escondidas na

estrutura globular. A predição de estruturas secundárias revelou a existência de um

alto conteúdo de α-hélices e dois motivos coiled coil com alta probabilidade de

ocorrência compreendendo os aminoácidos 243 a 256 e 636 a 649. Em ambos os

motivos não foram detectadas mudanças de aminoácidos (Figura 15). A Figura 15

mostra que as sequências-motivo conservadas em RNA polimerases estão

localizadas em regiões estruturadas e, exceto pela sequência-motivo F1, todas

coincidem com a região do domínio conservado da RdRp.

Como mostrado na Tabela Suplementar 4, a mudança de aminoácidos nos

sítios 5299, 5520, 5784 e 6981, localizados na RdRp, devem ser destacados pois

ocorre mudança de aminoácidos com diferentes cargas, indicando que estes sítios

tem potencial para alterar a estrutura secundária da proteína.

Page 68: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

67

Figura 15: Análise de composição de aminoácidos e predição de estrutura secundária para RdRp. A predição de regiões estruturadas (verde) e desestruturadas (vermelho), coiled coils e hélices transmembrana foram realizadas usando os programas Foldindex, Coils e TMPred, respectivamente. O software PredictProtein foi usado para predizer a presença de α-hélices (caixas rosas) e folhas β (caixas azuis) (primeira e segunda linha), e exposição a solvente (caixas azuis indicam exposição a solvente e caixas amarelas indicam não exposição a solvente). Abaixo, uma representação esquemática mostrando o domínio conservado da RdRp (em cinza claro), os sítios não sinônimos identificados na proteína (traços pretos) e as sequências-motivo conservadas em RdRps (traços azuis). O eixo X representa a posição dos aminoácidos.

Page 69: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

68

4.7 MODELAGEM DE PROTEÍNAS

As estruturas terciárias das proteínas RBP, MCP e RdRp potencialmente

codificadas pelo isolado da Indonésia foram preditas utilizando os programas I-

TASSER e Phyre2. Os valores para o escores e parâmetros de avaliação dos

modelos são mostrados na Tabela Suplementar 5. Não foi possível obter modelos

com escores de confiabilidade significantes para as proteínas SP1 e SP2. Os

modelos da MCP e RdRp também foram preditos para os três isolados do Brasil

(Figuras Suplementares 5 e 6). Não foram gerados modelos da RBP para os

isolados do Brasil devido à sequência de aminoácidos da proteína ser idêntica para

os quatro isolados.

O melhor modelo 3D da RBP apresentou um C-Score igual a -2,26 e uma

estrutura comum presente em estruturas já resolvidas para o domínio conservado

DSRM disponíveis no Protein Data Bank (PDB), as quais possuem duas α-hélices e

três folhas β (destacado em cinza claro na Figura 16 e na Figura Suplementar 7A).

Essas estruturas também correspondem parcialmente às estruturas secundárias

preditas pelo PredictProtein (Figura 12).

Page 70: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

69

Figura 16: Modelo estrutural para a proteína RBP do IMNV gerado pelo I-TASSER. O domínio conservado DSRM está destacado em cinza claro. (MolProbity score 4,03, Z-Score 0,627, C-score -2,26).

O modelo gerado no I-TASSER para o monômero da MCP apresentou um

C-Score igual a -2,27 e um formato semelhante ao dos monômeros de

Saccharomyces cerevisiae virus L-A (ScV-L-A) e Helminthosporium victoriae virus

190S (HvV190s), mas diferenças significativas em relação às estruturas secundárias

devido o alto conteúdo de α-hélices (Figura 17) (NAITOW et al., 2002; DUNN et al.,

2013). A Figura 17 mostra a localização do possível “trench” e um resíduo de His

107 identificado nesta estrutura. Um segundo modelo gerado no Phyre2 para a

MCP, baseado apenas em modelagem por threading, resultou em uma estrutura

composta por três α-hélices (Figura Suplementar 7B), compreendendo os

aminoácidos 518 a 590.

Page 71: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

70

Figura 17: Modelo estrutural para a MCP do IMNV gerado pelo I-TASSER. O core conservado da MCP está destacado em cinza claro. Os sítios polimórficos não sinônimos e suas posições estão indicados em vermelho. (MolProbity score 3,47, Z-Score -6,341, C-score -2,27).

A modelagem por threading associada com simulações ab initio para a RdRp

gerou o modelo com o melhor C-Score (0,23) em relação aos modelos da RBP e

MCP. Apesar da ausência de estruturas β na estrutura, o formato da proteína foi

semelhante a uma “right hand”, como esperado para uma RNA polimerase. Os

domínios “thumb”, “fingers” e “palm” estão indicados na Figura 18, assim como as

sequências-motivo A, B, C, D, E, F1, F2 e F3 estão destacadas em cores diferentes.

O domínio conservado da RdRp também está evidenciado em cinza claro (Figura

18).

Page 72: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

71

Figura 18: Modelo estrutural para a RdRp do IMNV gerado pelo I-TASSER. O domínio conservado da RdRp está destacado em cinza claro. Os sítios polimórficos não sinônimos e suas posições estão indicados em vermelho. Os domínios “thumb”, “fingers”, e “palm” estão mostrados, assim como as sequências-motivo conservadas em RdRps estão destacadas como segue: A – azul escuro; B – azul claro; C – rosa; D – verde; E – amarelo; F1, F2 e F3 – laranja. (MolProbity score 3,96, Z-Score -5,14, C-score 0,23).

4.8 SISTEMAS DE DETECÇÃO DE POLIMORFISMOS

4.8.1 Teste de detecção baseado nas regiões variáveis e conservadas

Primers flanqueando uma região variável e uma região conservada do

genoma do IMNV foram produzidos para detecção do vírus (Tabela 5). Os pares de

primers SP-F/SP-R e RdRp-F/RdRp-R foram desenhados para amplificar um

fragmento de 456 pb e 200 pb, respectivamente, e para possuírem temperaturas de

melting (TM) similares a fim de serem usados tanto em uma reação multiplex como

em reações separadas. Um par de primer (EF1α-F/ EF1α-R) também foi desenhado

Page 73: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

72

para ser usado como controle positivo da reação e amplifica um fragmento de 600

pb presente no gene do fator de elongação-1α do camarão.

Tabela 5: Lista de primers empregados no sistema de identificação do IMNV.

Nome do primer Sequência (5’→3’) TM (ºC)

SP-F CATCAAGTGTACTCGGAAG 52,85

SP-R CTTCTCTAGTTAGAACTGGATC 52,90

RdRp-F ACGTAGAGGACATACATCC 53,05

RdRp-R GATTGGTATTGTCTGATTTCTAC 53,02

EF1α-F GCGCAAGAGCGACAACTATG 59,97

EF1α-R ACATAGGCTTGCTGGGAACC 60,03

Um esquema mostrando o alinhamento de nucleotídeos referente aos

fragmentos de 456 pb e 200 pb, amplificados das regiões variável e conservada,

respectivamente, está mostrado na Figura 19. A figura também indica o número de

sítios polimórficos presente em cada região.

Page 74: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

73

Figura 19: Alinhamentos de nucleotídeos dos fragmentos de 456 pb e 200 pb referentes às regiões variável e conservada, respectivamente. Esses fragmentos foram empregados no sistema de detecção do IMNV. Os sítios polimórficos de cada região estão mostrados em caixas.

Usando os primers SP-F/SP-R e RdRp-F/RdRp-R em duas reações de PCR

separadas foi possível detectar a presença do IMNV em duas amostras diferentes

de camarão como mostrado na Figura 20A. Embora esta seja uma análise

qualitativa, considerando a mesma quantidade de template e a intensidade das

bandas, é possível notar que a amostra 1 apresentou uma maior quantidade de

partículas do IMNV do que a amostra 2. A análise de agrupamento por Neighbor

joining utilizando o fragmento de 456 pb a partir dos quatro genomas do IMNV

reconstitui os mesmos grupos mostrados na Figura 9 (Figura 20B).

Page 75: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

74

Figura 20: Sistema de detecção do IMNV. (A) Gel de agarose mostrando os resultados do sistema de identificação do IMNV utilizando os novos marcadores para as regiões variável e conservada do genoma. O sistema foi capaz de identificar a presença do IMNV em duas amostras diferentes do camarão coletadas em diferentes locais do Brasil. 1 – marcador de peso molecular; 2 e 6 – controle positivo (EF-1α); 3 e 7 – controle negativo; 4 e 8 – detecção usando os primers da região mais variável; 5 e 9 – detecção usando primers da região conservada. Os asteriscos indicam as bandas de 456 pb e 200 pb esperadas. (B) Análise Neighbor joining baseado no fragmento de 456 pb da região mais variável. O dendograma foi calculado baseado no alinhamento da sequência de nucleotídeos, usando o modelo Tamura-Nei e 1000 replicações de Bootstrap. As análises foram realizadas no programa MEGA 6.06.

4.8.2 Teste de detecção baseado na análise da curva de melting de fita simples

Na tentativa de desenvolvermos um sistema de identificação de ácidos

nucleicos a partir da curva de desnaturação dos amplicons, seis regiões de 200 pb

foram selecionadas ao longo de todo o genoma do IMNV além do fragmento de 456

pb (Reg.Frag456) já apresentado no tópico anterior. Todas essas regiões foram

submetidas a 2 análises in silico: (1) predição de estrutura secundária de RNA e

DNA e (2) geração de curvas de melting a partir da desnaturação do DNA de fita

Page 76: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

75

dupla e do RNA de fita simples. A abordagem de desnaturação de uma fita simples é

inédita, e possivelmente mais eficiente para determinar variações na sequência

primária que a desnaturação de uma fita dupla (OLIVEIRA et al., 2014). Após as

análises in silico algumas dessas regiões também foram utilizadas para testes

preliminares in vitro (Tabela 6).

Tabela 6: Regiões selecionadas para o teste de detecção baseado na análise da curva de melting de fita simples.

Região Localização no genoma Teste in silico Teste in vitro

R1 (nt 468-667) Small proteins Sim Não

R2 (nt 969-1168) Small proteins Sim Sim

R3 (nt 1119-1318) Small proteins Sim Sim

R4 (nt 1635-1834) Small proteins Sim Não

R5 (nt 2413-2612) MCP Sim Sim

R6 (nt 6823-7022)* RdRp Sim Sim

Reg.Frag456 Small proteins Sim Não

*A região R6 corresponde ao fragmento de 200 pb do par de primers RdRp-F/RdRp-R.

A partir da desnaturação das sequências apresentadas na Tabela 6,

esperávamos conseguir diferenciar os amplicons e discriminar os isolados

sequenciados neste estudo. As Figuras 21 e 22 mostram resultados preliminares

dos testes para as regiões R2 e R3, comparando os isolados IMNVgen1 e

IMNVgen2. Os resultados obtidos de predição de estrutura secundária de RNA e

DNA para a região R2 mostram estruturas bastante diferentes entre os isolados

(Figura 21A-D). Por outro lado, para a região R3, essas estruturas se apresentaram

mais semelhantes (Figura 22A-D). Para ambas as regiões, os resultados obtidos

para a curva de melting de fita simples in silico não corresponderam às curvas

geradas na análise in vitro, indicando que o método não foi eficiente na

diferenciação dos isolados e precisa ser melhorado (Figuras 21E-H e 22E-H).

Page 77: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

76

Figura 21: Análises de predição de estrutura secundária e curva de melting de fita simples e dupla para a região R2. A - estrutura secundária utilizando parâmetros de RNA para IMNVgen1; B - estrutura secundária utilizando parâmetros de RNA para IMNVgen2; C - estrutura secundária utilizando parâmetros de DNA para IMNVgen1; D - estrutura secundária utilizando parâmetros de DNA para IMNVgen2; E - curva de melting de fita dupla realizada in silico; F - curva de melting de fita simples realizada in silico; G - curva de melting de fita dupla realizada in vitro; H - curva de melting de fita simples realizada in vitro. IMNVgen1 – curva em vermelho; IMNVgen2 – curva em azul.

Page 78: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

77

Figura 22: Análises de predição de estrutura secundária e curva de melting de fita simples e dupla para a região R3. A - estrutura secundária utilizando parâmetros de RNA para IMNVgen1; B - estrutura secundária utilizando parâmetros de RNA para IMNVgen2; C - estrutura secundária utilizando parâmetros de DNA para IMNVgen1; D - estrutura secundária utilizando parâmetros de DNA para IMNVgen2; E - curva de melting de fita dupla realizada in silico; F - curva de melting de fita simples realizada in silico; G - curva de melting de fita dupla realizada in vitro; H - curva de melting de fita simples realizada in vitro. IMNVgen1 – curva em vermelho; IMNVgen2 – curva em azul.

Page 79: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

78

Como mostrado na Figura 19, o fragmento de 456 pb foi capaz de diferenciar

os quatro isolados do IMNV após a etapa de sequenciamento. Os resultados in silico

de predição de estrutura secundária de RNA e curva de melting de fita simples

indicam que este fragmento é capaz de diferenciar os vírus sequenciados no

presente estudo daqueles já descritos (Figura 23). De fato, as estruturas

secundárias de RNA dos vírus do Brasil e Indonésia são mais semelhantes entre si

(Figura 23A e B), assim como as estruturas secundárias de RNA para IMNVgen1 e

IMNVgen2 (Figura 23C e D). A curva de melting de RNA fita simples realizada in

silico foi capaz de refletir a diferença entre as estruturas de RNA (Figura 23E).

Figura 23: Predição de estrutura secundária de RNA e curva de melting de fita simples realizada in silico para o fragmento de 456 pb. A predição de estrutura secundária de RNA foi realizada no programa RNAfold e a curva de melting simples fita foi gerada no programa RNAheat. A – IMNV-BR; B – IMNV-Ind; C – IMNVGen1; D – IMNVGen2; E – curva de melting de fita simples in silico.

Page 80: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

79

5 DISCUSSÃO

O surgimento de doenças infecciosas que acometem animais de criação é um

dos principais problemas para a economia dos países produtores, causando

prejuízos financeiros significativos. Sendo assim, é necessário que esse problema

seja resolvido ou, pelo menos, minimizado empregando métodos de identificação e

controle eficientes para evitar e/ou combater essas doenças (LANA, BEISEL &

SILVA, 1992; NAGATA et al., 2006; MINGXIAO et al., 2013).

O desenvolvimento de métodos de identificação e controle eficazes requer

conhecimentos aprofundados em relação à biologia do patógeno. Em termos

moleculares, é necessário conhecer a sequência genômica do organismo, assim

como os produtos gênicos codificados pelo genoma (POULOS et al., 2006; SILVA et

al., 2014). Também é interessante estudar a filogenia e aspectos evolutivos do

organismo de interesse (POULOS et al., 2006; CORTEY et al., 2011; FRAGA et al.,

2012). A partir desses conhecimentos pode-se investigar a variabilidade genética

das diversas espécies, identificar regiões conservadas e variáveis nas sequências,

prever a estrutura tridimensional de proteínas importantes e, assim, inferir seus

mecanismos de infectividade, replicação, dentre outros mecanismos e

características (NIBERT, 2007; TANG et al., 2008; CORTEY et al., 2011; APTE-

SENGUPTA et al., 2012; NAIM, BROWN & NIBERT, 2014).

Um método molecular eficaz para detecção molecular é a Reação em Cadeia

da Polimerase (PCR). Esse sistema já é amplamente empregado na detecção de

agentes infecciosos e fornece um resultado confiável (POULOS & LIGHTNER, 2006;

SILVA et al., 2014). Além disso, quando realizada em tempo real, a PCR é capaz de

quantificar o DNA de maneira precisa e com maior reprodutibilidade (SILVA,

Page 81: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

80

PINHEIRO & COIMBRA, 2011; WEIRATHER et al., 2011; BOTELHO-SOUZA et al.,

2014). Estudar o genoma, tanto no nível de nucleotídeos quanto no nível de

aminoácidos, bem como as proteínas codificadas, é importante na seleção de

regiões alvo para o desenho de primers (SEIBERT et al., 2010; LOY et al., 2013). A

produção dos primers é o principal passo no desenvolvimento de um sistema de

PCR confiável.

No presente trabalho, foi estudado o genoma, bem como os possíveis

produtos de expressão gênica codificados por ele, de quatro isolados distintos do

vírus causador da mionecrose infecciosa em camarões peneídeos, oriundos do

Brasil e Indonésia, a fim de desenvolver um método de PCR eficiente na

identificação e distinção desses isolados.

As duas amostras positivas identificadas no screening inicial para detecção de

novos isolados do IMNV em camarões Litopenaeus vannamei foram suficientes para

alcançar os objetivos do presente estudo. O fato de não termos conseguido

encontrar o IMNV em muitas amostras, em especial aquelas cujos camarões

estavam intactos, pode ser devido aos seguintes fatores: (i) os camarões realmente

não estavam infectados, já que as amostras foram obtidas de grandes fazendas que

tomam as devidas medidas profiláticas; (ii) a coleta das amostras pode ter sido

realizada em um período no qual as condições ambientais não favoreciam a

incidência do vírus ou; (iii) os métodos aplicados na identificação não foram

eficientes, pois encontramos que o primer F13 (Tabela 1) não funcionou devido

anelar em uma região onde existia um sítio polimórfico (nt 5.784).

A análise filogenética mostra que o grupo GLV-like compreende vírus do

gênero Giardiavirus e ScV-like compreende vírus do gênero Totivirus. O gênero

Victorivirus inclui dois grupos, MoV-like e GaRV-like. Os gêneros Leishmaniavirus e

Page 82: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

81

Trichomonasvirus incluem os grupos LRV-like e TVV-like, respectivamente. O grupo

ZbV-Z-like foi anteriormente designado como um grupo primitivo, menos derivado,

parente distante dos totivírus e inclui partículas virais com organização genômica

distinta desta família. Uma nova família Amalgamaviridae foi proposta para

acomodar estes três vírus (LIU et al., 2012). O grupo IMNV-like aparece como o

grupo menos derivado próximo a GLV-like. De fato, no estudo filogenético realizado

por Poulos e colaboradores (2006), o IMNV foi agrupado com GLV, mas essa

análise não levou em consideração as sequências dos vírus do grupo IMNV-like. O

grupo IMNV-like não é classificado pela ICTV (KING et al., 2012). Assim, é

interessante notar que o IMNV provavelmente pertence a um táxon ainda não

descrito. Devido suas características peculiares, Tang e colaboradores (2008)

propuseram a criação de um novo gênero na família Totiviridae para acomodar o

IMNV. Nossos resultados indicam que o grupo IMNV-like poderia corresponder a

esse novo gênero.

As comparações entre os quatro isolados em nível de sequência genômica

completa, bem como sequências nucleotídicas e aminoacídicas das ORFs

mostradas nas Tabelas 3 e 4, indicam que IMNVgen1 e IMNVgen2 são mais

parecidos entre si do que com os genomas do Brasil e Indonésia, e que ambos são

mais semelhantes à sequência descrita para o Brasil. É esperado que a similaridade

entre os isolados coletados no Brasil seja alta, considerando que o IMNV foi

primeiramente identificado no Brasil e, posteriormente, atingiu outros locais do

mundo. Entretanto, a análise de agrupamento por Neighbor joining revelou a

formação de dois grupos distintos: IMNVgen1/IMNVgen2 e IMNV-BR/IMNV-IND

(Figura 9). É curioso e inesperado observar que o isolado do Brasil seja mais

relacionado ao isolado da Indonésia. Provavelmente, o genoma está sendo afetado

Page 83: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

82

mais pela variação ao longo do tempo do que pela variação devido ao isolamento

geográfico, uma vez que os vírus sequenciados no presente estudo foram coletados

nos anos de 2009 e 2013, enquanto que os isolados do Brasil e da Indonésia foram

coletados em 2003 e 2006, respectivamente (POULOS et al., 2006; SENAPIN et al.,

2007). No entanto, mudanças decorrentes de isolamento geográfico são recorrentes

entre os vírus que acometem camarões, como ocorreu com o IMNV na dispersão do

Brasil para a Indonésia (SENAPIN et al., 2007). Isolados de WSSV, que é um vírus

de DNA, originários da China, Taiwan e Indonésia apresentaram até 13.000 pares

de bases divergentes (MARKS et al., 2004). Além disso, isolados diferentes de

WSSV da mesma região geográfica foram repostados na China (TAN et al., 2009).

Esta observação requer uma análise mais detalhada do genoma a fim de identificar

os sítios polimórficos e determinar as regiões que vem sofrendo mudanças e sua

correlação com motivos estruturais proteicos.

Mutações gênicas em vírus são bastante comuns, principalmente em vírus

que apresentam genoma de RNA, como o IMNV. A falta de atividade de correção de

erros da RNA polimerase contribui significativamente para o grande número de

mutações encontradas em vírus de RNA. Já é amplamente conhecido que a

capacidade de infecção e mecanismos de patogenicidade são influenciados pelas

alterações em regiões específicas do genoma de diferentes vírus. As primeiras

evidências surgiram do estudo de viróides, que tinham sua capacidade de infecção,

replicação e patogenicidade afetadas por alterações induzidas em seu genoma de

RNA (TABLER & SFINGER, 1985; SANO et al., 1992). Pudupakam et al. (2011),

viram que deleções em uma região hipervariável da ORF1 reduziam a eficiência da

replicação do vírus da hepatite E.

Page 84: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

83

A proteína RBP apresentou uma estrutura semelhante àquelas já resolvidas e

disponíveis para o domínio conservado DSRM (Figura 16), o que reforça o

pressuposto de que os primeiros 93 aminoácidos da ORF1 codificam uma proteína

de ligação a dsRNA. Não foi identificado nesta proteína nenhum polimorfismo que

alterasse o quadro de leitura de aminoácidos. A função exata da RBP ainda não está

bem elucidada. Ela provavelmente desempenha um papel importante no

encapsulamento do vírus e modulação da imunidade inata após expressão em

células infectadas (TANG, et al., 2008). Sendo assim, podemos supor que sua

função requer que a proteína não sofra nenhuma variação na sequência

aminoacídica e/ou na sua estrutura proteica. A alta conservação intraespecífica

observada tanto na sequência de aminoácidos quanto na estrutura da proteína,

indica que as características da RBP estão sendo mantidas durante a evolução.

Devido à baixa variação na sequência de nucleotídeos, essa região se caracteriza

como uma boa região para estudos filogenéticos e desenhos de primers, assim

como pode ser considerada como um bom alvo para agentes terapêuticos. De fato,

foi observado que moléculas de RNA de interferência (RNAi) destinadas à RBP

fornecem uma proteção eficiente para os camarões desafiados com IMNV (LOY et

al., 2013).

O gráfico gerado no Simplot ilustrou a variabilidade em toda a sequência

genômica do IMNV e indicou a presença de três picos de menor escore de

similaridade na primeira metade da ORF1, região que coincide com aquela que

codifica as Small Proteins. Além disso, levando em consideração a região

codificante, a maior densidade de sítios polimórficos, inclusive aqueles que alteram a

sequência de aminoácidos, se encontra nesta região. Provavelmente a região que

codifica as Small proteins é uma região hipervariável presente no genoma do IMNV

Page 85: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

84

que só pôde ser detectada quando as novas sequências, IMNVgen1 e IMNVgen2,

foram incluídas na comparação. Regiões hipervariáveis são definidas por

comparações intragenômicas uma vez que não existe um valor absoluto que

classifique uma região como hipervariável (GONZÁLEZ-CANDELAS & LÓPEZ-

LABRADOR, 2013). Em alguns casos, regiões hipervariáveis podem ser

identificadas usando o alinhamento de um pequeno número de sequências, como

observado na região hipervariável da proteína VP2 do vírus da Doença Infecciosa de

Gumboro (BAYLISS et al.,1990) ou na proteína VP1 do vírus Sacbrood (MINGXIAO

et al., 2013) que foram identificadas usando três e sete sequências,

respectivamente. Essas regiões geralmente são encontradas em proteínas

estruturais (TSAREV et al., 1992). Em alguns vírus, regiões hipervariáveis estão

associadas com infectividade viral e adaptação aos mecanismos do sistema imune

do hospedeiro (BAYLISS et al., 1990; CARPENTER et al., 1991; ANJUM et al.,

2013). Um ponto importante é que as Small Proteins codificadas por esta região são

candidatas a codificarem as protrusões do IMNV (TANG et al., 2008). Alguns

estudos tem mostrado que regiões hipervariáveis de diferentes vírus coincidem com

as regiões que codificam as protrusões virais e que essas sequências estão

envolvidas em vários mecanismos como a entrada do vírus na célula e neutralização

de anticorpos (CAVANAGH, DAVIS & MOCKETT, 1988; LEE et al., 2010;

PROMKUNTOD et al., 2014).

Tang e colaboradores (2008) identificaram a uma resolução a 8-0 Å, que o

capsídeo do IMNV possui protrusões com características de um complexo de fibras

e densidade e resolução menor do que a proteína do capsídeo, o que pode ser

explicado por sua flexibilidade lateral. A protrusão do IMNV compreende pelo menos

três domínios morfológicos: knob, stalk e foot. Esses mesmos autores propuseram

Page 86: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

85

que a protrusão do IMNV pode ser formada por um trímero composto por três

moléculas de SP1 ou SP2. Nossos resultados de composição de aminoácidos e

predição de estrutura secundária indicam que SP1 é uma proteína dobrada

apresentando uma região N-terminal hidrofóbica não exposta a solvente (Figura 13).

SP1 provavelmente é uma proteína globular e seu sítio hidrofóbico deve se

encontrar no interior da estrutura. Sendo assim, ela possui características de um

domínio knob, consistente com sua forma globular e alto conteúdo de folhas-β. Por

outro lado, SP2 possui características de uma proteína fibrosa ou nativamente

desdobrada, que apresenta alta mobilidade e motivos ricos em coiled coil, que

possibilita sua interação com outras proteínas (MITRAKI et al., 1999; LANZA et al.,

2008). A forma desdobrada móvel, alto conteúdo de aminoácidos carregados e a

presença de coiled coil observados em SP2 (Figura 13) são características que se

enquadram no domínio stalk, como observado nas protrusões de adenovírus

(CHAPPELL et al., 2002). Nesse contexto, nossos dados apontam para uma nova

visão na qual a protrusão do IMNV pode ser formada por um heteromultímero

composto pelas proteínas SP1 e SP2 (Figura 24). Protrusões compostas por

diferentes proteínas já foram observadas em outros vírus como o bacteriófago PRD,

no qual a protrusão é formada pelas subunidades proteicas P5 e P2 (MERCKEL et

al., 2005), e o bunyavirus, no qual as glicoproteínas G1 e G2 formam a protrusão

viral (PERSSON & PETTEERSSON, 1991). A região estruturada localizada na

porção C-terminal da proteína SP2 pode ser o domínio foot que está ancorado ao

capsídeo (Figura 24).

Page 87: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

86

Figura 24: Esquema proposto para a formação da protrusão do IMNV. A proteína SP1, que apresenta uma forma dobrada, corresponderia ao domínio knob da protrusão; enquanto que a proteína SP2, a qual se apresenta quase totalmente desestruturada, corresponderia ao domínio stalk. A região estruturada presente na porção C-terminal de SP2 representaria do domínio foot que está ancorado ao capsídeo.

O capsídeo é responsável por proteger o material genético e também está

envolvido no empacotamento viral e na especificidade para a adsorção, ou seja, o

capsídeo está diretamente relacionado com a interação vírus-hospedeiro. Além da

semelhança observada com outros monômeros (NAITOW et al., 2002; DUNN et al.,

2013), o modelo gerado para a MCP do IMNV também mostrou uma possível região

candidata a representar o “trench” como observado na MCP de ScV-L-A (NAITOW et

al., 2002). Neste “trench” também foi possível identificar um resíduo de His 107

(destacado em azul na Figura 17), sugerindo uma possível atividade enzimática de

remoção do cap5’ do mRNA para a MCP do IMNV. Existem poucos trabalhos

direcionados ao estudo da estrutura de proteínas de totivírus. Entretanto,

comparações de predição de estrutura secundária da MCP indicam a existência de

Page 88: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

87

um core rico em α-hélice que é altamente conservado entre os totivírus e em

micovírus de RNA dupla fita (DUNN et al., 2013). O segundo modelo para a MCP

gerado no Phyre2 resultou em uma estrutura composta por três α-hélices (Figura

Suplementar 6B), compreendendo os aminoácidos 518 a 590, que pode

corresponder ao core rico em α-hélice conservado entre os totivírus.

A ORF2 que provavelmente codifica a RdRp, apresentou-se mais conservada

quando comparada a ORF1. O papel que a RdRp desempenha na replicação viral

exige que sua sequência nucleotídica não sofra muita variação. O modelo

tridimensional predito para a RdRp do IMNV foi semelhante a outros modelos já

resolvidos para RNA polimerases virais como a RdRp do poliovírus e a RNA

polimerase do bacteriófago T7 (Figura 18) (SOUSA et al., 1993; HANSEN, LONG &

SCHULTZ, 1997), que se caracteriza por um formato semelhante a uma “right hand”

e possui os domínios “thumb”, “fingers” e “palm”. É inesperado a ausência de

estruturas β no modelo da RdRp do IMNV, uma vez que essas estruturas são

comuns em outros modelos de RdRps já resolvidos (HANSEN, LONG & SCHULTZ,

1997; LOVE et al., 2004). No entanto, a ausência de folhas-β e alto conteúdo de α-

hélices corroboram com a predição feita pelo PredictProtein (Figura 15). Um

segundo modelo gerado no software Phyre2 mostrou a presença de algumas

estruturas β na RdRp do IMNV (Figura Suplementar 6C), mas somente 51% dos

resíduos modelados apresentaram confiança maior que 50%. Portanto, nossos

dados reforçam a hipótese de que a proteína codificada pela ORF2 trata-se

realmente de uma RNA polimerase dependente de RNA.

Em resumo, as proteínas envolvidas em interações com o RNA (RBP e RdRp)

são mais conservadas do que as proteínas estruturais, possivelmente devido à

função que cada tipo de proteína desempenha.

Page 89: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

88

O estudo do genoma e dos possíveis produtos gênicos do IMNV possibilitou

compreender um pouco mais sobre a biologia do vírus e definir quais seriam as

principais proteínas alvo para o desenvolvimento de métodos de identificação e

controle eficazes. Tsarev et al., (1992) sugere que regiões hipervariáveis podem ser

utilizadas para caracterizar diferentes cepas virais mesmo que proximamente

relacionadas através de métodos moleculares e imunológicos, enquanto que as

sequências mais conservadas podem ser usadas no desenho de primers para

detecção do patógeno.

Levando em consideração a possível região hipervariável presente nas Small

Proteins e a região mais conservada da RdRp, foi desenvolvido um novo método

para o diagnóstico de diferentes isolados do IMNV. O sistema se mostrou eficiente

na identificação de duas amostras diferentes contaminadas pelo vírus. Uma das

principais vantagens deste novo sistema de detecção é que usando os primers SP-

F/SP-R, um fragmento de 456 pb que apresenta sítios polimórficos informativos é

amplificado, podendo ser sequenciado. Este fragmento corresponde a uma parte da

região que codifica as Small proteins e apresenta nove sítios polimórficos dos quais

três causam alteração na sequência de aminoácidos. Comparando essa região foi

possível diferenciar os quatro isolados do IMNV. A análise Neighbor joining usando o

fragmento de 456 pb foi capaz de reconstituir os mesmos dois grupos mostrados na

Figura 9. Esses resultados sugerem que esta pequena sequência possui

informações que podem representar o genoma completo do IMNV, sendo suficiente

para discriminar os quatro isolados estudados aqui. Todavia, a discriminação entre

os quatro isolados só é possível após o sequenciamento do fragmento de 456 pb. O

ideal seria um sistema que identificasse polimorfismos sem a necessidade de

sequenciar.

Page 90: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

89

Métodos que utilizam esse princípio são aqueles baseados em HRMA (High-

Resolution Melting Analysis) (REED & WITTWER, 2004; ARVIA, CORCIOLI & AZZI,

2013). A HRMA é capaz de discriminar isolados de uma mesma espécie pela

identificação de polimorfismos de sítio único. Contudo, esses métodos requerem

equipamentos e reagentes mais sofisticados o que os torna mais onerosos. Nesse

contexto, uma tentativa de desenvolver um sistema de identificação de

polimorfismos baseado na análise da curva de melting utilizando equipamentos e

reagentes mais acessíveis foi realizada.

Geralmente, as PCRs em tempo real geram curvas de melting a partir da

desnaturação do DNA dupla fita. No presente estudo foi proposto um método de

identificação de diferentes isolados do IMNV através da análise de curva de melting

a partir da desnaturação do DNA simples fita. O objetivo do método é distinguir

cepas diferentes com base na estrutura secundária do ácido nucleico que é refletida

em curvas de melting características para cada isolado. De fato, as diferentes

estruturas secundárias de RNA preditas refletiram em curvas de melting de fita

simples distintas, como observado na Figura 23, indicando que o princípio do

método é válido. Um estudo in silico recentemente desenvolvido em nosso

laboratório aborda o uso da curva de melting de fita simples na identificação de

diferentes variantes do totivírus que infecta Trichomonas vaginalis (OLIVEIRA et al.,

2014). Nossos resultados preliminares não foram os esperados, provavelmente

devido a uma falha na metodologia. Focamos as análises in vitro na desnaturação

do DNA e o IMNV é um vírus de RNA. As estruturas secundárias preditas para os

dois ácidos nucleicos (DNA e RNA) são diferentes e as curvas de melting de fita

simples geradas in silico e in vitro representam a desnaturação do RNA e DNA,

Page 91: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

90

respectivamente (Figuras 21 e 22). Sendo assim, é necessário direcionar os

protocolos experimentais para a desnaturação do RNA de fita simples.

Page 92: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

91

6 CONCLUSÃO

Dois novos genomas completos do IMNV foram sequenciados, caracterizados e

apresentaram 99% de identidade com outros dois genomas já descritos.

O estudo filogenético mostrou um novo grupo taxonômico, denominado IMNV-like,

que está mais próximo ao grupo GLV-like, mas ainda não é classificado pela ICVT.

O grupo IMNV-like possivelmente poderá abranger um gênero ainda não descrito

dentro da família Totiviridae.

A partir da comparação entre os quatro genomas foi possível gerar um mapa de

sítios polimórficos que abrange todo o genoma do IMNV. Este mapa possibilitou

identificar as regiões mais conservadas e mais variáveis do genoma.

O mapa de sítios polimórficos será essencial para posteriores estudos sobre a

biologia do IMNV, assim como para a concepção de novos marcadores moleculares

e desenvolvimento de terapias como aquelas baseadas em RNAi.

A proteína que compreende os primeiros 93 aminoácidos da ORF1 não apresentou

mutações que alterassem a sequência de aminoácidos. O modelo tridimensional

obtido para esta proteína foi semelhante a estruturas já resolvidas para o domínio

DSRM, o que reforça o pressuposto de que este produto gênico corresponde a uma

proteína de ligação a dsRNA.

Page 93: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

92

A região que possivelmente codifica as protrusões do IMNV é a mais variável do

genoma, como observado em outros vírus de RNA. Esta região possivelmente

direciona a evolução do vírus e, provavelmente, é um fator determinante de sua

virulência.

A estrutura tridimensional da MCP do IMNV mostrou uma forma semelhante a outros

modelos de MCP já descritos e possibilitou inferir uma provável função enzimática

de remoção do cap5’ do mRNA para esta proteína.

A região que possivelmente codifica a RdRp do IMNV mostrou-se bastante

conservada e o modelo estrutural gerado para esta proteína correspondeu à

arquitetura típica de outras RNA polimerases, corroborando com o pressuposto de

que a ORF2 realmente codifica uma RdRp.

As regiões mais variáveis podem ser empregadas na caracterização de diferentes

cepas virais, enquanto que as regiões mais conservadas podem ser utilizadas no

desenho de primers para detectar o patógeno. A partir dos dados obtidos foi criado o

primeiro sistema capaz de diferenciar isolados do IMNV com base a presença de

polimorfismos.

Este sistema e os resultados mostrados aqui serão o ponto de partida para elucidar

a função das proteínas virais e sua correlação com a evolução do vírus, assim como

para a identificação de marcadores de virulência no IMNV.

Page 94: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

93

REFERÊNCIAS ABASCAL, F.; ZARDOYA, R.; POSADA, D. ProtTest: selection of best-fit models of protein evolution. Bioinformatics, [S.l.], v. 21, p. 2104-5, 2005. ALTSCHUL, S. F. et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Research, [S.l.], v. 25, p. 3389-3402, 1997. ANDRADE, T. P. D. et al. Real-time reverse transcription polymerase chain reaction assay using TaqMan probe for detection and quantification of Infection Myonecrosis Virus (IMNV). Aquaculture, Arizona – USA, v.264, p.9-15, 2007. ANDRADE, T. P.; LIGHTNER, D. V. Development of a method for the mediated isothermal amplification and nucleic acid lateral flow hybrid assay. Journal of Fish Diseases, [S.l.], v. 32, p. 911-24, 2009. ANJUM, S. et al. Additional Glycosylation Within a Specific Hypervariable Region of Subtype 3a of Hepatitis C Virus Protects Against Virus Neutralization. The Journal of Infectious Diseases, [S.l.], v. 208, p.1888-97, 2013. APTE-SENGUPTA, S. et al. Base of the Measles Virus Fusion Trimer Head Receives the Signal That Triggers Membrane Fusion. The Journal of Biological Chemistry, [S.l.], v. 287, p. 33026-33035, 2012. ARNOLD K. et al. The SWISS-MODEL Workspace: A web-based environment for protein structure homology modelling. Bioinformatics, [S.l.], v. 22, p.195-201, 2006. ARUNRUT, N.; SUEBSING, R.; KIATPATHOMCHAI, W. Rapid and sensitive detection of shrimp infectious myonecrosis virus using a reverse transcription loop-mediated isothermal amplification and visual colorogenic nanogold hybridization probe assay. Journal of Virological Methods, [S.l.], v.193, p. 542-547, 2013. BACHÉRE, E. Shrimp immunity and diseases control. Aquaculture, [S.l.], v.191, p. 3-11, 2000. BAYLISS, C. D. et al. A comparison of the sequences of segment A of four infectious bursal disease virus strains and identification of a variable region in VP2. Journal of General Virology, [S.l.], v. 71, p. 1303-1312, 1990. BEKAERT, M.; ROUSSET, J. P. An extended signal involved in eukaryotic -1 frameshifting operates through modification of the E site tRNA. Molecular Cell, [S.l.], v.17, p. 61-68, 2005. BEKAERT, M. et al. Towards a computational model for21 eukaryotic frameshifting sites. Bioinformatics, [S.l.], v.19, p. 327-335, 2003. BELOUZARD, S. et al. Mechanisms of Coronavirus Cell Entry Mediated by the Viral Spike Protein. Viruses, [S.l.], v. 4, p. 1011-1033, 2012.

Page 95: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

94

BIOMATTERS. Geneious. Copyright © 2005-2014 Biomatters Limited. Disponível em: <http://www.geneious.com/>. Acesso em: 13 mar. 2014. BITTAR, C. et al. Genetic diversity of NS5A protein from hepatitis C virus genotype 3a and its relationship to therapy response. BMC Infectious Diseases, [S.l.], v. 23, p.10-36, 2010. BLAKE, R. D. et al. Statistical mechanical simulation of polymeric DNA melting with MELTSIM. Bioinformatics, [S.l.], v. 15, p. 370-375, 1999. BLANC, A.; GOYER, C.; SONENBERG, N. The coat protein of the yeast double-stranded RNA virus L-A attaches covalently to the cap structure of eukaryotic mRNA. Molecular Cell, [S.l.], v. 12, p. 3390-3398, 1992. CORTEY, M. et al. Genetic variability and phylogeny of Torque teno sus virus 1(TTSuV1) and 2 (TTSuV2) based on complete genomes. Veterinary Microbiology, [s.l.], v.148, p.125-131, 2011. BOTELHO-SOUZA, L. F. et al. Development of a reverse transcription quantitative real-time PCR-based system for rapid detection and quantitation of hepatitis delta virus in the western Amazon region of Brazil. Journal of Virological Methods, [S.l.], v.197, p.19-24, 2014. BRASIL. Ministério da Agricultura, Agropecuária e Abastecimento. Plataforma tecnológica do camarão marinho cultivado. Brasília: MAPA, 2001. BRUENN, J. A. A structural and primary sequence comparison of the viral RNA-dependent RNA polymerases. Nucleic Acids Research, [S.l.], v. 31, p.1821-1829, 2003. BURD, C. G.; DREYFUSS, G. Conserved structures and diversity of functions of RNA-binding proteins. Science, [S.l.], v. 265, p. 615-21, 1994.

CARPENTER, S. et al. Identification of a Hypervariable Region in the Long Terminal Repeat of Equine Infectious Anemia Virus. Journal of Virology, [S.l.], p.1605-1610, 1991. CAVANAGH, D.; DAVIS, P. J.; MOCKETT, A. P. A. Amino acids within hypervariable region 1 of avian coronavirus IBV (Massachusetts serotype) spike glycoprotein are associated with neutralization epitopes. Virus Research, [S.l.], v.11, p.141-150, 1988. CHAIVISUTHANGKURA, P. et al. Simple and rapid detection of infectious myonecrosis virus using an immunochromatographic strip test. Archives of Virology, [S.l.], p. 1925-1930, 2013. CHAPPELL, J. D. et al. Crystal structure of reovirus attachment protein sigma1 reveals evolutionary relationship to adenovirus fiber. EMBO Journal, [S.l.], v. 21, p. 1-11, 2002.

Page 96: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

95

CHAYAMA, K. et al. Pretreatment virus load and multiple amino acid substitutions in the interferon sensitivity determining region predict the outcome of interferon treatment in patients with chronic genotype 1b hepatitis C virus infection. Hepatology, [S.l.], v. 25, p. 745-749, 1997. CHEN, V. B. et al. C. MolProbity: all-atom structure validation for macromolecular crystallography. Acta Crystallographica, [S.l.], v. 66, p.12-21, 2010. CLYDE, K.; BARRERA, J.; HARRIS, E. The capsid-coding region hairpin element (cHP) is a critical determinant of dengue virus and West Nile virus RNA synthesis. Virology, [S.l.], v. 379, p.314-323, 2008. COWLEY, J. A. et al. Vertical transmission of gill-associated virus (GAV) in the black tiger prawn Penaeus monodon. Diseases of Aquatic Organisms, [S.l.], v. 50, p.95-104, 2002. DINMAN, J. D.; ICHO, T.; WICKNER, R. B. A21 ribosomal frameshift in a double-stranded RNA virus of yeast forms a gag–pol fusion protein. Proceedings of the National Academy of Sciences U S A, v. 88, p.174-178,1991. DRUMMOND, A. J.; RAMBAUT, A. BEAST: Bayesian evolutionary analysis by sampling trees. BMC evolutionary biology, [S.l.], v. 7, p. 214, 2007. DRUMMOND, A. J. et al. Bayesian phylogenetics with BEAUti and the BEAST 1.7. Molecular Biology and Evolution, [S.l.], v. 29, p. 1969-73, 2012. DUNN, S. E. et al. Three-dimensional Structure of Victorivirus HvV190S Suggests Coat Proteins in Most Totiviruses Share a Conserved Core. PLOS Pathogens, [S.l.], v. 9, e1003225, 2013. ENJUANES, L. et al. Biochemical aspects of coronavirus replication and virus-host interaction. Annual Review Microbiology, [S.l.], v. 60, p.2 11-230, 2006. ENOMOTO, N. et al. Mutations in the nonstructural protein 5A gene and response to interferon in patients with chronic hepatitis C virus 1b infection. New England Journal of Medicine, [S.l.], v. 334, p. 77-81, 1996. EWING, B.; GREEN, P. Base-calling of automated sequencer traces using phred. II. Error probabilities. Genome Research, [S.l.], v. 8, p.186-194, 1998. FAO. The State of World Fisheries and Aquaculture 2008. Roma, 2008. FEIJÓ, R. G. et al. Infectious myonecrosis vírus and White spot syndrome vírus co-infection in Pacific White shrimp (Litopenaeus vannamei) farmed in Brazil. Aquaculture, [S.l.], v. 380-383, p.1-5, 2013. FLEGEL, T. W. et al. Presence of multiple viruses in non-diseased, cultivated shrimp at harvest. Aquaculture, [S.l.], v. 240, p.55-68, 2004.

Page 97: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

96

FRAGA, J. et al. Genetic characterization of three Cuban Trichomonas vaginalis virus. Phylogeny of Totiviridae family. Infection, Genetics and Evolution, [S.l.], v.12, p.113-120, 2012. GHABRIAL, S. Totiviruses. In: MAHY, B. W. J.; VAN REGENMORTEL M. H. V. Encyclopedia of Virology. 3. ed. San Diego: Academic Press/Elsevier, 2008. GONZÁLEZ-CANDELAS, F.; LÓPEZ-LABRADOR, F. X. Brenner's Encyclopedia of Genetics. 2. ed. [S.l.: s.n], 2013. HANSEN, J. L.; LONG, A. M.; SCHULTZ, S. C. Structure of the RNA-dependent RNA polymerase of poliovirus. Structure, [S.l.], v. 5, p.1109-1122, 1997. HOA, T. et al. Genotypic variations in tandem repeat DNA segments between ribonucleotide reductase subunit genes of white spot syndrome virus (WSSV) isolates from Vietnam, In: WALKER, P., LESTER, R., REANTASO, M. (Ed.). Diseases in Asian Aquaculture V, Manila: 2005, p.395-403. HOFACKER, I. L. et al. Fast Folding and Comparison of RNA Secondary Structures. Monatshefte für Chemie, [S.l.], v. 125, p.167-188, 1994. HOFMANN, K.; STOFFEL, W. TMbase - A database of membrane spanning proteins segments. Biological Chemistry Hoppe-Seyler, [S.l.], v. 374, p.166, 1993. HUANG, L. et al. Hepatitis C Virus Nonstructural Protein 5A (NS5A) Is an RNA-binding Protein. The Journal of Biological Chemistry, [S.l.], v. 280, p. 36417-36428, 2005. JACKS, T. et al. Characterization of ribosomal frameshifting in HIV-1 gag–pol expression. Nature, [S.l.], v. 331, p. 280-283, 1988. JIRAVANICHPAISAL, P.; LEE, B. L.; SÖDERHÄLL, K. Cell-mediated immunity in arthropods: hematopoiesis, coagulation, melanization and opsonization. Immunobiology, [S.l.], v. 211, p. 213-236, 2006. KATOH, K.; TOH, H. Parallelization of the MAFFT multiple sequence alignment program. Bioinformatics, [S.l.], v. 26, p.1899-900, 2010. KATOH, K.; FRITH, M. C. Adding unaligned sequences into an existing alignment using MAFFT and LAST. Bioinformatics, [S.l.], v. 28, p. 3144-3146, 2012. KEARNEY, M. et al. Frequent polymorphism at drug resistance sites in HIV-1 protease and reverse transcriptase. AIDS, [S.l.], v. 22, p. 497-501, 2008. KELLEY, L. A.; STERNBERG, M. J. E. Protein structure prediction on the Web: a case study using the Phyre server. Nature Protocols, [S.l.], v. 4, p. 363-371, 2009. KING, A. M. Q. et al. The most recent report of the ICTV: Virus taxonomy: classification and nomenclature of viruses: Ninth Report of the International Committee on Taxonomy of Viruses. San Diego: Elsevier Academic Press, 2012.

Page 98: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

97

KOK, C. C.; MCMINN, P. C. Picornavirus RNA-dependent RNA polymerase. The International Journal of Biochemistry & Cell Biology, [S.l.], v. 41, p. 498–502, 2009. KORAKA, P. et al. RNA secondary structures in the proximal 3’UTR of Indonesian Dengue 1 virus strains. Virus Research, [S.l.], v.142, p. 213-216, 2009. KUNANOPPARAT, A. et al. Detection of infectious myonecrosis virus using monoclonal antibody specific to N and C fragments of the capsid protein expressed heterologously. Journal of Virological Methods, [S.l.], v.171, p.141-148, 2011. KUROSAKI, M. et al. Analysis of genotypes and amino acid residues 2209 to 2248 of the NS5A region of hepatitis C virus in relation to the response to interferon-beta therapy. Hepatology, [S.l.], v. 25, p. 750-753, 1997. KURTZ, J. Memory in the innate and adaptive immune systems. Microbes and Infection, [S.l.], v. 6, p. 1410-7, 2004. LAI, Y. et al. Viral Double-Strand RNA-Binding Proteins Can Enhance Innate Immune Signaling by Toll-Like Receptor 3. PLoS ONE, [S.l.], v. 6, p.e25837, 2011. LANA, D. P.; BEISEL, C. E.; SILVA, R. F. Genetic mechanisms of antigenic variation in infectious bursal disease virus: analysis of a naturally occurring variant virus. Virus Genes, [S.l.], v. 6, p. 247-59, 1992. LANZA, D. C. F. et al. Human FEZ1 has characteristics of a natively unfolded protein and dimerizes in solution. Proteins, [S.l.], v. 74, p. 104-121, 2008. LARKIN, M. A. et al. Clustal W and Clustal X version 2.0. Bioinformatics, [S.l.], v. 23, p. 2947-2948, 2007. LEE, D-K. et al. Heterogeneity in spike protein genes of porcine epidemic diarrhea viruses isolated in Korea. Virus Research, [S.l.], v. 149, p.175-182, 2010. LI, L.; WANG, A. L.; WANG, C. C. Structural analysis of the -1 ribosomal frameshift elements in giardiavirus mRNA. Journal of Virology, [S.l.], v. 75, p. 10612-10622, 2001. LIGHTNER, D. V. Virus diseases of farmed shrimp in the Western Hemisphere (the Americas): A review. Journal of Invertebrate Pathology, [S.l.], v.106, p.110-130, 2011. LIGHTNER, D. V.; PANTOJA, C. R. Infectious Myonecrosis (IMV): current status report on the biology of etiological agent and development of diagnostic methods. In: FEIRA NACIONAL DO CAMARÃO (FENACAM). Natal, Rio Grande do Norte, Anais p. 22, 2004. LIGHTNER, D. V. et al. Infectious myonecrosis: a new disease in Pacific White shrimp. Global Aquaculture Advocate, [S.l.], v. 7, p. 85, 2004.

Page 99: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

98

LIU, H. et al. Evolutionary genomics of mycovirus-related dsRNA viruses reveals cross-family horizontal gene transfer and evolution of diverse viral lineages. BMC Evolutionary Biology, [S.l.], v.12, p.91, 2012. LIU, H.; SÖDERHÄLL, K.; JIRAVANICHPAISAL, P. Antiviral immunity in crustaceans. Fish and Shellfish Immunology, [S.l.], v. 27, p. 79-88, 2009. LIU, H-L. et al. A real-time PCR for the detection of infectious myonecrosis virus in penaeid shrimp. Journal of Invertebrate Pathology, [S.l.], v. 113, p. 237-239, 2013. LOLE, K. S. et al. Full-length human immunodeficiency virus type 1 genomes from subtype C-infected seroconverters in India, with evidence of intersubtype recombination. Journal of Virology, [S.l.], v. 73, p. 152-60, 1999. LOTZ, J. M. Special topic review: Viruses, biosecurity and specific pathogen-free stocks in shrimp aquaculture. Journal of Microbiology & Biotechnology, [S.l.], v.13, p. 405-413, 1997. LOTZ, J. M.; ANTON, L. S.; SOTO, M. A. Effect of chronic Taura syndrome virus infection on salinity tolerance of Litopenaeus vannamei. Diseases of Aquatic Organisms, [S.l.], v. 65, p. 75-78, 2005. LOVE, R. A. et al. The Crystal Structure of the RNA-Dependent RNA Polymerase from Human Rhinovirus: A Dual Function Target for Common Cold Antiviral Therapy. Structure, v.12, p.1533–1544, 2004. LOY, J. D. et al. Sequence-optimized and targeted double-stranded RNA as a therapeutic antiviral treatment against infectious myonecrosis virus in Litopenaeus vannamei. Diseases of Aquatic Organisms, [S.l], v.105, p. 57-64, 2013. LOY, J. D. et al. dsRNA provides sequence-dependent protection against infectious myonecrosis virus in Litopenaeus vannamei. Journal of General Virology, [S.l.], v.93, p. 880–888, 2012. LU, Y. et al. Infection of the yellow head baculo-like virus (YBV) in two species of penaeid shrimp Penaeus stylirostris (Stimpson) and Penaeus vannamei (Boone). Journal of Fish Diseases, [S.l.], v. 17, p. 649–656, 1994. LUPAS, A.; VAN DYKE, M.; STOCK, J. Predicting Coiled Coils from Protein Sequences. Science, [S.l.], v. 252, p.1162-1164, 1991. MADRID, R. M. A crise econômica da carcinicultura. Panorama da Aquicultura, [S.l.], v. 90, p. 22–29, 2005b. MADRID, R. M. A Dança dos Preços na Carcinicultura Brasileira e Desafios de Competitividade. Revista da ABCC, [S.l.], n. 7, p. 52-61, 2005a. MADRID, R. M. Programa de apoio ao desenvolvimento do cultivo de camarão marinho (Versão preliminar). Brasília: MAA, 1999.

Page 100: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

99

MARCHLER-BAUER, A. et al. CDD: a Conserved Domain Database for the functional annotation of proteins. Nucleic acids research, [S.l.], v. 39, p. D225-9, 2011. MARKS, H. et al. Genetic variation among isolates of white spot syndrome virus. Archives of Virology, [S.l.], v. 149, p. 673–697, 2004. McBRIDGE, M. S.; PANGANIBAN, A.T. The Human Immunodeficiency Virus Type 1 Encapsidation Site Is a Multipartite RNA Element Composed of Functional Hairpin Structures. Journal of Virology, [S.l.], v. 70, p. 2963-2973, 1996. MELLO, M. V. et al. Purification of infectious myonecrosis virus (IMNV) in species of marine shrimp Litopenaeus vannamei in the State of Ceará. Journal of Virological Methods, [S.l.], v.177, p.10-14, 2011. MERCKEL, M. C. et al. The Structure of the Bacteriophage PRD1 Spike Sheds Light on the Evolution of Viral Capsid Architecture. Molecular Cell, [S.l.], v.18, p.161-170, 2005. MINGXIAOA, M. et al. Genetic characterization of VP1 gene of seven Sacbrood virus isolated from three provinces in northern China during the years 2008–2012. Virus Research, [S.l.], v.176, p. 78-82, 2013. MITRAKI, A. et al. Unfolding studies of human adenovirus type 2 fibre trimmers: Evidence for a stable domain. European Journal of Biochemistry, [S.l.], v. 264, p. 599-606, 1999. MOSS, S. M. Marine shrimp farming in the western hemisphere: past problems, present solutions, and future visions. Reviews in Fisheries Science, [S.l.], v.10, p. 601-620, 2002. MINISTÉRIO DA PESCA E AQUICULTURA. Produtores de camarão e MPA criam agenda positiva para o desenvolvimento da carcinicultura nacional. Disponível em: <http://www.mpa.gov.br/index.php/imprensa/noticias/2963-produtores-de-camarao-e-mpa-criam-agenda-positiva-para-o-desenvolvimento-da-carcinicultura-nacional>. Acesso em: 18 jun. 2014. MUSTHAQ, S. S. et al. Variability in the tandem repetitive DNA sequences of white spot syndrome virus (WSSV) genome and suitability of VP28 gene to detect different isolates of WSSV from India. Aquaculture, [S.l.], v. 256, p. 34-41, 2006. NAGATA, L. P. et al. Infectivity variation and genetic diversity among strains of Western equine encephalitis virus. Journal of General Virology, [S.l.], v. 87, p. 2353-61, 2006. NAIM, S.; BROWN, J. K.; NIBERT, M. L. Genetic diversification of penaeid shrimp infectious myonecrosis virus between Indonesia and Brazil. Virus Research, [S.l.], v.189, p. 97-105, 2014.

Page 101: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

100

NAITOW, H. et al. L-A virus at 3.4 Å resolution reveals particle architecture and mRNA decapping mechanism. Nature Structural Biology, [S.l.], v. 9, p. 725-728, 2002. NIBERT, M. L.; TAKAGI, Y. Fibers come and go: differences in cell-entry components among related dsRNA viruses. Current Opinion in Virology, [S.l.],v.3, p. 20-26, 2013. NIBERT, M. L. ‘2A-like’ and ‘shifty heptamer’ motifs in penaeid shrimp infectious myonecrosis virus, a monosegmented double-stranded RNA virus. Journal of General Virology, [S.l.], v. 88, p.1315- 318, 2007. NOTREDAME, C.; HIGGINS, D. G.; HERINGA, J. T-Coffee: A Novel Method for Fast and Accurate Multiple Sequence Alignment. Journal of Molecular Biology, [S.l.], v. 302, p. 205-217, 2000. NUNES, A. J. P.; MARTINS, P. C. C.; GESTEIRA, T. C. V. Carcinicultura ameaçada. Revista Panorama da Aquicultura, [S.l.], v. 83, p. 37-51, 2004. O’REILLY, E. K.; KAO, C. C. Analysis of RNA-Dependent RNA Polymerase Structure and Function as Guided by Known Polymerase Structures and Computer Predictions of Secondary Structure. Virology, [S.l.], v. 252, p. 287-303, 1998. OFFICE INTERNATIONAL ESPIZOTICS. Infectious myonecrosis virus. In: Manual of Diagnostic Tests for Aquatic Animals. Paris, France: Office International des Epizooties, 2009. p. 96-104. OLIVEIRA, R. A. C. et al. In silico single strand melting curve: A new approach to identify nucleic acid polymorphisms in Totiviridae. BMC Bioinformatics, [S.I.], v.15, p. 243, 2014. ORMOND, J. G. P. A carcinicultura brasileira. Rio de Janeiro: BNDES, n.19, p.91-118, 2004. OVERSTREET, R. M. et al. Susceptibility to TSV of some penaeid shrimp native to the Gulf of Mexico and southeast Atlantic Ocean. Journal of Invertebrate Pathology, [S.l.], v. 69, p.165-176, 1997. PENG, S. E. et al. The transition from pre-patent to patent infection of white spot syndrome virus (WSSV) in Penaeus monodon triggered by pereiopod excision. Fish Pathology, [S.l.], v.33, p.395-400, 1998. PERLMAN, S.; NETLAND, J. Coronaviruses post-SARS: Update on replication and pathogenesis. Nature Reviews Microbiology, [S.l.], v. 7, p. 439-450, 2009. PERSSON, R.; PETTEERSSON, R. F. Formation and intracellular transport of a heterodimeric viral spike protein complex. The Journal of Cell Biology, [S.l.], v.112, p. 257-266, 1991.

Page 102: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

101

PETTERSEN, E. F. et al. UCSF Chimera - a visualization system for exploratory research and analysis. Journal of Computational Chemistry, [S.l.], v. 25, p.1605-1612, 2004. PINHEIRO, A. C. A. S. et al. Epidemiological status of Taura syndrome and Infectious myonecrosis viruses in Penaeus vannamei reared in Pernambuco (Brazil). Aquaculture, [S.l], v. 262, p.17-22, 2007. PINHO, J. R. R. et al. Genetic diversity of NS5A protein from hepatitis C virus genotype 3a and its relationship to therapy response. BMC Infectious Diseases, [S.l], v.10, p. 36, 2010. POCH, O. et al. Identification of four conserved motifs among the RNA-dependent polymerase encoding elements. The EMBO Journal, [S.l.], v. 8, p. 3867-3874, 1989. PORTELA, A.; DIGARD, P. The influenza virus nucleoprotein: a multifunctional RNA-binding protein pivotal to virus replication. Journal of General Virology, [S.l.], v.83, p.723-734, 2002. POULOS, B. T.; LIGHTNER, D. V. Detection of infectious myonecrosis virus (IMNV) of penaeid shrimp by reverse-transcriptase polymerase chain reaction (RT-PCR). Diseases of Aquatic Organisms, [S.l.], v. 73, p. 69-72, 2006. POULOS, B. T. et al. Purification and characterization of infectious myonecrosis virus of penaeid shrimp. Journal of General Virology, [S.l], v. 87, p.987-996, 2006. PRILUSKY, J. et al. FoldIndex©: a simple tool to predict whether a given protein sequence is intrinsically unfolded. Bioinformatics, v. 21, p. 3435–3438, 2005. PROMKUNTOD, N. et al. Mapping of the receptor-binding domain and amino acids critical for attachment in the spike protein of avian coronavirus infectious bronchitis virus. Virology, [S.l.], v. 448, p. 26-32, 2014. PUDUPAKAM, R. S. et al. Mutational Analysis of the Hypervariable Region of Hepatitis E Virus Reveals Its Involvement in the Efficiency of Viral RNA Replication. Journal of Virology, [S.l.], v. 85, p.10031-10040, 2011. PUTHAWIBOOL, T. et al. Detection of shrimp infectious myonecrosis virus by reverse transcription loop-mediated isothermal amplification combined with a lateral flow dipstick. Journal of Virological Methods, [S.l.], v.156, p. 27-31, 2009. QAAD 2006 - Quarterly Aquatic Animal Disease Report (Asia and Pacific Region), NACA: Bangkok, Thailand. 2006/2, April-June 2006. Não entendi REED, G. H.; WITTWER, C. T. Sensitivity and Specificity of Single-Nucleotide Polymorphism Scanning by High-Resolution Melting Analysis. Clinical Chemistry, [S.l.], v.50, p.1748-1754, 2004. ROCHA, I. P. Mensagem da Diretoria da ABCC. Revista da ABCC, [S.l.], v. 7, n.3, p. 6, 2005a.

Page 103: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

102

ROCHA, I. P. Mensagem da Diretoria da ABCC. Revista da ABCC, [S.l.], v. 7, n. 4, p. 4, 2005b. RONQUIST, F.; HUELSENBECK, J. P. MrBayes 3: Bayesian phylogenetic inference under mixed models. Bioinformatics, [S.l.], v.19, p.1572-4, 2003. RONQUIST, F. et al MrBayes 3.2: efficient Bayesian phylogenetic inference and model choice across a large model space. Systematic biology, [S.l.], v. 61, p.539-42, 2012. ROST, B.; YACHDAV, G.; LIU, J. The PredictProtein server. Nucleic Acids Research, [S.l.], v. 32, p. 321-326, 2004. ROY, A.; KUCUKURAL, A.; ZHANG, Y. I-TASSER: a unified platform for automated protein structure and function prediction. Nature Protocols, [S.l.], v.5, p.725-738, 2010. SANCHEZ-MARTINEZ, J. G. et al. White spot syndrome virus in cultured shrimp: a review. Journal of Aquaculture Research, [S.l.], v. 38, p.1339-1354, 2007. SANO, T. et al. Identification of multiple structural domains regulating viroid pathogenicity Proceedings of the National Academy of Sciences USA, [S.l.], v.89, p.10104-10108, 1992. SEIBERT, C. H. et al. Detection of major capsid protein of infectious myonecrosis virus in shrimps using monoclonal antibodies. Journal of Virological Methods, [S.l.], v. 169, p.169-175, 2010. SENAPIN, S. et al. Outbreaks of infectious myonecrosis virus (IMNV) in Indonesia confirmed by genome sequencing and use of an alternative RT-PCR detection method. Aquaculture, [S.l.], v. 266, p. 32-38, 2007. SILVA, D. C. D. et al. Infectious hypodermal and hematopoietic necrosis virus from Brazil: Sequencing, comparative analysis and PCR detection. Virus Research, [S.l.], v. 189, p.136-146, 2014. SILVA, S. M. B. C.; PINHEIRO, A. C. A. S.; COIMBRA, M. R. M. Quantitation of infectious myonecrosis virus in different tissues of naturally infected Pacific white shrimp, Litopenaeus vannamei, using real time PCR with SYBR Green chemistry. Journal of Virological Methods, [S.l.], v.177, p.197-201, 2011. SOUSA, R. et al. Crystal structure of bacteriophage T7 RNA polymerase at 3.3 Å resolution. Nature, [S.l.], v. 364, p. 593-599, 1993. STEITZ, T. A. DNA Polymerases: Structural Diversity and Common Mechanisms. The Journal of Biological Chemistry, [S.l.], v. 274, p. 17395-17398, 1999.

Page 104: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

103

TABLER, M.; SFINGER, H. L. Infectivity studies on different potato spindle tuber viroid (PSTV) RNAs synthesized in vitro with the SP6 transcription system. The EMBO Journal, [S.l.], v. 4, p. 2191-2199, 1985. TAMURA, K. et al. MEGA6: Molecular Evolutionary Genetics Analysis Version 6.0. Molecular Biology and Evolution, [S.l.], v. 30, p. 2725-2729, 2013. TAN, Y. et al. Molecular detection of three shrimp viruses and genetic variation of white spot syndrome virus in Hainan Province, China, in 2007. Journal of Fish Diseases, [S.l.], v. 32, p. 777-784, 2009. TANG, J. et al. Infectious myonecrosis virus has a totivirus-like, 120-subunit capsid, but with fiber complexes at the fivefold axes. PNAS, [S.l.], v.105, n.4 5, p.17.526-17.531, 2008. TANG, K. F. J.; LIGHTNER, D. V. Quantification of white spot syndrome virus DNA through a competitive polymerase chain reaction. Aquaculture, [S.l.], v.189, p.11-21, 2000. TANG, K. F. J. et al. V. In situ hybridization demonstrates that Litopenaeus vannamei, L. stylirostris and Penaeus monodon are susceptible to experimental infection with infectious myonecrosis virus (IMNV). Diseases Aquatic Organisms, [S.l.], v. 63, p. 261-265, 2005. TSAREV, S. A. et al. Characterization of a prototype strain of hepatitis E virus. Proceedings of the National Academy of Sciences, [S.l.], v. 89, p. 559-563, 1992. TSAI, P-L. et al. Cellular RNA Binding Proteins NS1-BP and hnRNP K Regulate Influenza A Virus RNA Splicing. PLOS Pathogens, [S.l.], v. 9, p.1003460, 2013. VALLONE, P. M.; BUTLER, J. M. AutoDimer: a screening tool for primer-dimer and hairpin structures. BioTechniques, [S.l.], v. 37, p. 226-231, 2004. WAHEED, Y.; BHATTI, A.; ASHRAF, M. RNA dependent RNA polymerase of HCV: A potential target for the development of antiviral drugs. Infection, Genetics and Evolution, [S.l.], v.14, p. 247–257, 2013. WANG, A. L. et al. Giardiavirus double-stranded RNA genome encodes a capsid polypeptide and a gag–pol-like fusion protein by a translational frameshift. Proceedings of the National Academy of Sciences USA, [S.l.], v. 90, p. 8595–8599, 1993. WATERHOUSE, A. M. et al. Jalview Version 2 - a multiple sequence alignment editor and analysis workbench. Bioinformatics, [S.l.], v. 25, p. 1189-1191, 2009. WEIRATHER, J. L. et al. Serial Quantitative PCR Assay for Detection, Species Discrimination, and Quantification of Leishmania spp. in Human Samples. Journal of Clinical Microbiology, [S.l.], v. 49, p. 3892-3904, 2011.

Page 105: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

104

WIJEGOONAWARDANE, P. K. et al. Genetic diversity in the yellow head nidovirus complex. Virology, [S.l.], v. 380, p. 213-25, 2008. ZHANG, Y. I-TASSER server for protein 3D structure prediction. BMC Bioinformatics, [S.l.], v. 9, p. 40, 2008. ZHANG, Y. Template-based modeling and free modeling by I-TASSER in CASP7. Proteins, [S.l.], v. 69, p.108-117, 2007. ZONG, J. C. et al. Evaluation of global clustering patterns and Strain variation over and extended ORF26 gene locus from Kaposi’ Sarcoma herpesvirus. J Clin Virol., [S.l.], v. 40, p.19-25, 2007.

Page 106: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

105

APÊNDICE

Page 107: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

106

Tabela Suplementar 1: Nome e números de acesso das sequências dos totivírus usados neste estudo agrupados de acordo com a análise filogenética.

Nome do vírus Nº de acesso Abreviação

MoV-like

Beauveria bassiana RNA virus 1 CCC42235.1 BeauV

Tolypocladium cylindrosporum virus 1 YP_004089630.1 TcV-1

Botryotinia fuckeliana totivirus 1 YP_001109580.1 BotryV

Helminthosporium victoriae virus 190S NP_619670.2 HvV-190S

Chalara elegans RNA virus 1 YP_024728.1 ChalElV

Helicobasidium mompa totivirus 1-17 NP_898833 HmV1-17

Thielaviopsis basicola dsRNA virus 1 AAS68036.1 ThielaV

Magnaporthe orzyae virus 1 YP_122352.1 MoV-1

IMNV-like

Penaeid shrimp infectious myonecrosis virus AAT67231.2 IMNV

Tianjin totivirus AFE02920.1 TianV

Omono river virus BAJ21511.1 ORV

Drosophila melanogaster totivirus SW-2009a YP_003289293.1 DmV-SW-2009ª

Armigeres subalbatus virus SaX06-AK20 YP_003934934.1 AsV-SaX06-AK20

GLV-like

Piscine myocarditis virus AL V-708 YP_004581250.1 PMV-AL V-708

Giardia canis virus from China (2883-5981)* DQ238861.1 GCV

Giardia lamblia virus (2880-5978)* NC_003555.1 GLV2

ZbV-like

Blueberry latent virus isolate AR (936-3332)* HM029248.1 BLV

Southern tomato virus isolate Mexico-1(1039-3327)* EF442780.1 STV

Zygosaccharomyces bailii virus Z NP_624325.1 ZbV-Z

ScV-like

Ustilago maydis virus H1 (735-6002)* NC_003823.1 UmV-H1

Saccharomyces cerevisiae virus L-BC (La) NP_042581.1 ScV L-BC

Saccharomyces cerevisiae virus L-A NP_620495.1 ScV L-A

Black raspberry virus F YP_001497151.1 BRV-F

Tuber aestivum virus 1 ADQ54106.1 TaV-1

GaRV-like

Sphaeropsis sapinea RNA virus 2 AAD11603.1 SphaeroV

Coniothyrium minitans RNA virus YP_392467.1 CmRV

Epichloe festucae virus 1 CAK02788.1 EpiFesV

Gremmeniella abietina RNA virus L2 AAT48885.1 GaRV-L2

Outras sequências

Eimeria brunetti RNA virus 1 NP_108651.1 EbRV-1

*O número de acesso corresponde à sequência de nucleotídeos do genoma completo. Números entre

parênteses correspondem ao primeiro e último nucleotídeo da sequência que codifica a RdRp.

Page 108: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

107

Tabela Suplementar 2: Nome e números de acesso das sequências dos Trichomonasvirus, Leishmaniavirus e Giardiavirus usados neste estudo agrupados de acordo com a análise filogenética.

Nome do vírus Nº de acesso Abreviação

TVV4

Trichomonas vaginalis virus 4 strain TVV4-1 AED99796.1 TVV4-1

Trichomonas vaginalis virus 4 strain TVV4-OC3 AED99794.1 TVV4-OC3

Trichomonas vaginalis virus 4 strain TVV4-OC5 AED99798.1 TVV4-OC5 TVV3

Trichomonas vaginalis virus 3 strain TVV3-UR1 AED99800.1 TVV3-UR1

Trichomonas vaginalis virus 3 strain TVV3-OC5 AED99804.1 TVV3-OC5

Trichomonas vaginalis virus 3 strain TVV3-OC3 AED99802.1 TVV3-OC3

Trichomonas vaginalis virus 3 NP_659390.1 Trichomonasvirus_3 TVV2

Trichomonas vaginalis virus 2 strain TVV2-OC3 AED99808.1 TVV2-OC3

Trichomonas vaginalis virus 2 strain TVV2-UR1 AED99806.1 TVV2-UR1

Trichomonas vaginalis virus 2 strain TVV2-OC5 AED99810.1 TVV2-OC5

Trichomonas vaginalis virus II NP_624323.2 Trichomonasvirus_II

Trichomonas vaginalis virus 2 isolate C76 AET81014.1 TVV2-C76

Trichomonas vaginalis virus 2 isolate C351 AET81016.1 TVV2-C351 TVV1

Trichomonas vaginalis virus NP_620730.2 Trichomonasvirus_I

Trichomonas vaginalis virus 1 isolate C344 AET81012.1 TVV1-C344

Trichomonas vaginalis virus 1 strain TVV1-UH9 AED99814.1 TVV1-UH9

Trichomonas vaginalis virus 1 strain TVV1-OC4 AED99818.1 TVV1-OC4

Trichomonas vaginalis virus 1 strain TVV1-OC3 AED99816.1 TVV1-OC3

Trichomonas vaginalis virus 1 strain TVV1-UR1 AED99812.1 TVV1-UR1

Trichomonas vaginalis virus 1 strain TVV1-OC5 AED99820.1 TVV1-OC5

LRV-like

Leishmania RNA virus 2 - 1 NP_043465.1 LRV 2-1

Leishmania RNA virus 1 - 4 NP_619653.1 LRV 1-4

Leishmania RNA virus 1 - 1 NP_041191.1 LRV 1-1

GLV-like

Giardia canis virus from China ABB36743.1 GCV

Giardia lamblia virus AAM77694.1 GLV1

Giardia lamblia virus NP_620070.1 GLV2

Page 109: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

108

Tabela Suplementar 3: Identificação do IMNV em amostras de camarão marinho Litopenaeus vannamei.

Amostra Procedência Data da coleta Data PCR

Data eletroforese Resultado

Resultado nested Observações

V13/L1246 Camanor 02/09/2011 09/11/2012 14/11/2012 Negativo Negativo Primers F13/R13 e F13N/R13N / Camarão morto

CBV15/L1247 Camanor 04/09/2011 09/11/2012 14/11/2012 Negativo Negativo Primers F13/R13 e F13N/R13N

LOTE CB 1242-1 150UP Camanor 27/08/2011 09/11/2012 14/11/2012 Negativo Negativo Primers F13/R13 e F13N/R13N

V13/L1246 Camanor 02/09/2011 19/11/2013 20/11/2012 Negativo Negativo Primers OIE

CBV15/L1247 Camanor 04/09/2011 19/11/2013 20/11/2012 Negativo Negativo Primers OIE

LOTE CB 1242-1 19 150/UP Camanor 27/08/2011 19/11/2013 20/11/2012 Negativo Negativo Primers OIE

B6A/Lote: 06 Camanor 01/09/2011 20/11/2012 21/11/2012 Negativo Negativo Primers F13/R13 e F13N/R13N

CB V1/LOTE 1256 Camanor 13/10/2011 20/11/2012 21/11/2012 Negativo Negativo Primers F13/R13 e F13N/R13N

V06/L1235 Camanor 02/09/2011 20/11/2012 21/11/2012 Negativo Negativo Primers F13/R13 e F13N/R13N

V05/L1238 CB Camanor 02/09/2011 20/11/2012 21/11/2012 Negativo Negativo Primers F13/R13 e F13N/R13N

CBV16 - PLS (CBV11 R2-7 14353) Camanor 02/09/2011 20/11/2012 21/11/2012 Negativo Negativo Primers F13/R13 e F13N/R13N / Larvas

P/S Aquatec Lote CBV18 R2-1 14.383 Camanor SEM DATA 20/11/2012 21/11/2012 Negativo Negativo

Primers F13/R13 e F13N/R13N / Larvas

B6A/Lote: 06 Camanor 01/09/2011 04/12/2012 04/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou

V06/L1235 Camanor 02/09/2011 04/12/2012 04/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou

CB V1/LOTE 1256 Camanor 13/10/2011 04/12/2012 04/12/2012 - - Utilização do Primer 13 / PCR não funcionou

B6A/Lote: 06 Camanor 01/09/2011 06/12/2012 06/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou

V06/L1235 Camanor 02/09/2011 06/12/2012 06/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou

CB V1/LOTE 1256 Camanor 13/10/2011 06/12/2012 06/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou

CB V09/Lote: 1239 Camanor 12/09/2011 06/12/2012 06/12/2012 - - Primers F13/R13 e F13N / PCR

Page 110: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

109

não funcionou

V7-L1257 CB Camanor 07/11/2011 06/12/2012 06/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou

CB BV1/1250 Camanor 20/10/2011 06/12/2012 06/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou

B6A/Lote: 06 Camanor 01/09/2011 10/12/2012 10/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou

V06/L1235 Camanor 02/09/2011 10/12/2012 10/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou

CB V1/LOTE 1256 Camanor 13/10/2011 10/12/2012 10/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou

CB V09/Lote: 1239 Camanor 12/09/2011 10/12/2012 10/12/2012 - - Primers F13/R13 e F13N/ PCR não funcionou

V7-L1257 CB Camanor 07/11/2011 10/12/2012 10/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou

CB BV1/1250 Camanor 20/10/2011 10/12/2012 10/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou

B6A/Lote: 06 Camanor 01/09/2011 12/12/2012 12/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou

V06/L1235 Camanor 02/09/2011 12/12/2012 12/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou

CB V1/LOTE 1256 Camanor 13/10/2011 12/12/2012 12/12/2012 - - Primers F13/R13 e F13N / PCR não funcionou

B6A/Lote:06 Camanor 01/09/2011 05/03/2013 05/03/2013 Negativo - Primer F14/R14

V06/L1235 Camanor 02/09/2011 05/03/2013 05/03/2013 Negativo - Primer F14/R14

CBV1/Lote: 1256 Camanor 13/10/2011 07/03/2013 08/03/2013 Negativo - Primer F14/R14

Lote CB 1242-1 150/UP Camanor 27/08/2011 07/03/2013 08/03/2013 - - Primer F14/R14 / Controle + não funcionou

V05/L1238-CB Camanor 02/09/2011 07/03/2013 08/03/2013 Negativo - Primer F14/R14

CB V15/L1247 Camanor 04/09/2011 12/03/2013 12/03/2013 Negativo - Primer F14/R14

BV01/Lote 1250 Camanor 06/09/2011 12/03/2013 12/03/2013 Negativo - Primer F14/R14

B8 L1261 Camanor 07/11/2011 14/03/2013 15/03/2013 Negativo - Primer F14/R14

BV1 3 dias após ingerir camarão do Camanor 23/10/2011 14/03/2013 15/03/2013 Negativo - Primer F14/R14

Page 111: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

110

V1

V12 L1258 CB Camanor 16/11/2011 14/03/2013 15/03/2013 Negativo - Primer F14/R14

Camarões do Darlio - - 21/03/2013 21/03/2013 Negativo - Primer F14/R14

CB 1244-1 Camanor 26/08/2011 21/03/2013 21/03/2013 - - Primer F14/R14/ Controle + não funcionou

V5 Lote: 1265 CB Camanor 19/11/2011 21/03/2013 21/03/2013 Negativo - Primer F14/R14

B6A/Lote:06 Camanor 01/09/2011 26/03/2013 27/03/2013 Negativo Negativo Primers OIE

V06/L1235 Camanor 02/09/2011 26/03/2013 27/03/2013 Negativo Negativo Primers OIE

CBV1/Lote: 1256 Camanor 13/10/2011 26/03/2013 27/03/2013 Negativo Negativo Primers OIE

Camarões do Darlio - - 26/03/2013 27/03/2013 Negativo Negativo Primers OIE

V13/L1246 Camanor 02/09/2011 26/03/2013 27/03/2013 Negativo Negativo Primers OIE / Camarão morto

Siri Camanor - 26/03/2013 27/03/2013 Negativo Negativo Primers OIE / C+ não funcionou

Camarões V03 Camanor 09/11/2011 26/03/2013 03/04/2013 Negativo Negativo Primers OIE

CB V20/L1252 Camanor 12/09/2011 26/03/2013 03/04/2013 Negativo Negativo Primers OIE

BV1 após ingerir camarão do V1, 1º dia Camanor 21/10/2011 26/03/2013 03/04/2013 Negativo Negativo Primers OIE

Intensivo B6A Lote 06 Camanor 05/09/2011 26/03/2013 04/04/2013 Negativo Negativo Primers OIE

BV1 4 dias após ingerir camarão do V1 Camanor 24/10/2011 26/03/2013 04/04/2013 Negativo Negativo Primers OIE

Camarão de Allan Camanor - 26/03/2013 04/04/2013 Negativo Negativo Primers OIE

Aquário 2/ morreu 3º Prof. Fabiana - 10/04/2013 11/04/2013 Negativo Negativo Primers OIE e primer F14/R14

Aquário 1/ morreu 2º Prof. Fabiana - 10/04/2013 11/04/2013 Negativo Negativo Primers OIE e primer F14/R14

Amostra lisado de células congelado Genearch 2005 15/01/2013 15/01/2013 Positivo - Primer F14/R14

Amostra lisado de células etanol 70%

Concepto Azul 2011 13/06/2013 13/06/2013 Positivo - Primer F14/R14

Page 112: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

111

:

Figura Suplementar 1: Análise filogenética de membros representativos dos grupos TVV-like, LRV-like e GLV-like. A árvore foi calculada a partir do alinhamento da sequência de aminoácidos da RdRp de usando Inferência Bayesiana. As IDs das sequências estão indicadas na tabela suplementare 2. Os números indicam a consistência topológica e a confiança de cada ramo. As chaves indicam os grupos identificados neste estudo e nomeados de acordo com Liu et al. (2012) e as cores representam os gêneros de acordo com a ICTV.

Page 113: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

112

Genoma completo IMNVgen1

ggcaatttcaacctaattctaaaactgttaccaacaatttctgaactacagaagaggcat

attcttcatctacttcgagaagaagtagaaggaaagaaagtttgcttcgtagagcgagaa

aaacagaatccacttatggctataaacgaactagccgttaaagttggaaagaagcctaaa

M A I N E L A V K V G K K P K

tacacatcgacgaaaaccggagctgaccacattccaagttggactgtattggttgagttc

Y T S T K T G A D H I P S W T V L V E F

gcaggttttagcgaagcagcaacatgtgacacagttaaaaacgcaaaaatgattgctgct

A G F S E A A T C D T V K N A K M I A A

tacaaattggttaaaagattttgtaaatgggacccaacctacattgaaatttctgattgt

Y K L V K R F C K W D P T Y I E I S D C

atgctgccacctccagaccttacatcgtgcggggatgttgagagtaatcctggacctatc

M L P P P D L T S C G D V E S N P G P I

atacatagtgttgcatttgcaagaactggttcagtatggacacctgccacctttactttc

I H S V A F A R T G S V W T P A T F T F

aatactacatcatccccgggtagactgcaagtacaaatgtcatccagcgacaatagatat

N T T S S P G R L Q V Q M S S S D N R Y

gggttcaactctgttttacttgcagcaggcggtacaacatggggcacagcttatttttca

G F N S V L L A A G G T T W G T A Y F S

gaacgctggaacagtgattttggattacagccagatctaactataactgtaacaccacaa

E R W N S D F G L Q P D L T I T V T P Q

ctaactggagaagaacttggttcaatttattttgatgctgtcgaaactacaaatgcagag

L T G E E L G S I Y F D A V E T T N A E

gaagctatagaagcaacaattataaatactactccaattgatgtaatggtagacacaaca

E A I E A T I I N T T P I D V M V D T T

gcaggccctgtaccaattgaaggtgatttcaaacccacaaatgaaactcccacgtgggta

A G P V P I E G D F K P T N E T P T W V

agtaacacaaagcccattgatgtagcaacacctaagactcgtgactacgcaaatcggtca

S N T K P I D V A T P K T R D Y A N R S

gtactgactccacaattgatcacaaaaatgaaagaccatgtctatgccttacaaaaggat

V L T P Q L I T K M K D H V Y A L Q K D

gaagttgaagatgtaacacttgcctcactcgattttggtttaaatccatcaagtgtactc

E V E D V T L A S L D F G L N P S S V L

ggaagatggttgaaatggctaactggcatagatatgagactccatcttgggaagaaagtt

G R W L K W L T G I D M R L H L G K K V

acaaaccataaagttagaatgtttgtgcaaaaaacaaggtttccactaaagacagcaatt

T N H K V R M F V Q K T R F P L K T A I

gaggaactaaacaatggtactgttccacttagattaaggagggatgttcgttacattgaa

E E L N N G T V P L R L R R D V R Y I E

aagccattcgataaagaggaacataccaacatactgttatctggtgatgttgaggaaaac

Page 114: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

113

K P F D K E E H T N I L L S G D V E E N

cctgggcctgaagggatggaacaggtatcaataacgccagaacaacttcaaatgattctg

P G P E G M E Q V S I T P E Q L Q M I L

gcaatgcaaaaatcaccaccaaagccaaagatcaaagaactaagtgaaagggaaattcag

A M Q K S P P K P K I K E L S E R E I Q

ttaaggctccaaggaaatgaagcaacccgcagacatcaaagatttaaaggtgagcccatt

L R L Q G N E A T R R H Q R F K G E P I

gatccagttctaactagagaagatataattagaaagcacaatcagcagaatggaatattg

D P V L T R E D I I R K H N Q Q N G I L

ccctatgaaaaagaacagccggtggtggtaaataacgtacaccctttggagaaggagtat

P Y E K E Q P V V V N N V H P L E K E Y

tccattgaaaaggaaggaatggtgtgggacgaggaacaatttctaacgtatatacatgac

S I E K E G M V W D E E Q F L T Y I H D

aaatcatcaagcaacgatcactatgcctgcatctataacgttgttacacataacagattc

K S S S N D H Y A C I Y N V V T H N R F

ggcgtaattgaaatgccagaagatccacttgaaatgattgatcattatgaaccagaggaa

G V I E M P E D P L E M I D H Y E P E E

gaaccaaaaacaaaacctaaaactaaaagtggtaacaaaagagaactaaatgatgaaacc

E P K T K P K T K S G N K R E L N D E T

ttttacagaaagaagaagacaaaaacaacaaaagagccaaaaacacaagagcaaaagaaa

F Y R K K K T K T T K E P K T Q E Q K K

attgaccacgataacatgttttcacgattgctgagaaggcttgacaaaccacaaattgta

I D H D N M F S R L L R R L D K P Q I V

gcagcttggctaaacaacagaccatcacgtaaattggtcgaaaaattagctgacagtaaa

A A W L N N R P S R K L V E K L A D S K

ttcggaattggatggcaagcaaaagaagagtacacaaccagcatggtaattgtatctgga

F G I G W Q A K E E Y T T S M V I V S G

tatatcaattgtgaaccgttacccctaatcgtagataagcttctctccgtcgataacaac

Y I N C E P L P L I V D K L L S V D N N

tatgacatgtggcaacagactgacaagtattttgacaatttgatcacactgtgtaaccgc

Y D M W Q Q T D K Y F D N L I T L C N R

gtcagtgacgttacctacactagcgctcagctgtgtagagatgcatctatcttgaataac

V S D V T Y T S A Q L C R D A S I L N N

aagaagatgcatgttgaaaatggaaacattgtttcaatggaaaatcagtctgaaattgat

K K M H V E N G N I V S M E N Q S E I D

agtcaaactaaattcttttcactgttagaagatgataacaaacttccaattgtagatgag

S Q T K F F S L L E D D N K L P I V D E

ctaagagtattagctgatatgacggcacaaagaagcaacgtaaacactgctggtaatcat

L R V L A D M T A Q R S N V N T A G N H

cttcgtgataatgactctattagggccgacgctgttctagctaacaatacagtacgtaac

L R D N D S I R A D A V L A N N T V R N

aattgtcaaattccaattcctgtaacaacactaataccaagacaaattcgtggattgaat

N C Q I P I P V T T L I P R Q I R G L N

ggtgcacttgtaaatcagcaattacggttacagggaattgaaacacacattacagacagt

Page 115: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

114

G A L V N Q Q L R L Q G I E T H I T D S

tatatttcaaaagctgagccatctgactattcgaaacaactgtctgaaatggttaatgct

Y I S K A E P S D Y S K Q L S E M V N A

caaaagacatcaacttggcgagcaaacaatatcgcatcacaggggtgggacatgtttgat

Q K T S T W R A N N I A S Q G W D M F D

actgtacagttaaatacaaacatatcacaaaaggatctttcaatggacactgctttgaca

T V Q L N T N I S Q K D L S M D T A L T

aagcttatgttgttgtaccagctaacaacacaaaatctgccagcaacacaattaccatca

K L M L L Y Q L T T Q N L P A T Q L P S

agcatttattctgcatttgattcaagaacacagcctactttacaggatggaatttggggt

S I Y S A F D S R T Q P T L Q D G I W G

ataaataatggtgttaatatatttggtgaacaatgcggtggattagctgcgccagtcttt

I N N G V N I F G E Q C G G L A A P V F

ccattcagtgggggcaccggagaaattactttccatcttactttacaatctgttccacag

P F S G G T G E I T F H L T L Q S V P Q

gaatttcaagaatcggcaattttcgtaccagcaactgcactacaagctgcaaaagagggt

E F Q E S A I F V P A T A L Q A A K E G

gctcgaacattggcaatgtatgttttaatgtttgcagaatggccatttggtatgtataca

A R T L A M Y V L M F A E W P F G M Y T

aaaactaaacaaacaacagacaatgctggtaataatcaagcagatcaaattttcattcac

K T K Q T T D N A G N N Q A D Q I F I H

tccgaatctactgtacatattccaggacaaaaacaaatgcatattgtgctgccaagaaaa

S E S T V H I P G Q K Q M H I V L P R K

gtgaacatggtgaaccccactacaattgcagaagcaaatgcacgtgtagtgactcaacca

V N M V N P T T I A E A N A R V V T Q P

acatacggtacagtggcagctggggcaggtgtcgcaaatggtaatattaacgtagctgct

T Y G T V A A G A G V A N G N I N V A A

attggtgtggccctgccaactgtaaatttgactgactatcttgtatcgtgggcaaccgat

I G V A L P T V N L T D Y L V S W A T D

ttcacacttggcgacataaaacaattggttgaaagaatgaaaacaacactgccaattagt

F T L G D I K Q L V E R M K T T L P I S

cgagacctgatggcagcacgtcaaaatgctatgttattgagtactctatttcctccacta

R D L M A A R Q N A M L L S T L F P P L

attcagagcaatgtggcttcagacacaaatgaagtcgcaggaacagctggagcatacact

I Q S N V A S D T N E V A G T A G A Y T

gcatgtcttgcaaacttaggtattcctgaaacactaacagttaactggggagcagatata

A C L A N L G I P E T L T V N W G A D I

aatgttcagccattatatcagctacttgaaacggacatcacagcccataatcggtacgta

N V Q P L Y Q L L E T D I T A H N R Y V

ttaaacctgttcaaaagagaagaagtggtagcaggtgcatatgaatttgggtggttggga

L N L F K R E E V V A G A Y E F G W L G

cacatggccagttatatgatgggactccttctaacaatgaatatatcatcagtgtttaac

H M A S Y M M G L L L T M N I S S V F N

gtttggtattcaacaagacgtatttcaacaaaggcgtgggacacagcatatgatagtaac

Page 116: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

115

V W Y S T R R I S T K A W D T A Y D S N

atccaagcatatcaggacatgcattatcaaatgttttcgtggagttcaatgcaaggtagt

I Q A Y Q D M H Y Q M F S W S S M Q G S

attgcgccagcaatggtggacgaaattcttcataacctttgtggccaaatgtttggcttc

I A P A M V D E I L H N L C G Q M F G F

agcttaccattgagacaagtcttatttaacgcattgccaatcactttttcatcgtttgga

S L P L R Q V L F N A L P I T F S S F G

agttggatgttgcctagagtttctgatggtttccaaactgtaaggtattatgatgcaggt

S W M L P R V S D G F Q T V R Y Y D A G

ccaccagccattaatgcaaaacgtgatggggaagtaccagtaagtatgattgacgcatgg

P P A I N A K R D G E V P V S M I D A W

acctataaatttacagaaaaattgccaaaaagttttttgccatggccaatgccagaagga

T Y K F T E K L P K S F L P W P M P E G

aaggacagtacaatgggatatgatccggaaaaagaaccagcactaattgataattcaaat

K D S T M G Y D P E K E P A L I D N S N

gagacaggcaatgtattcagaccattcatggcaagaaatggcaacaattccaattattta

E T G N V F R P F M A R N G N N S N Y L

ccaaccaactacacaattgacgtatcacagaatggtcatgatgagagttgtattaatgtt

P T N Y T I D V S Q N G H D E S C I N V

gacctttttaacaatgttgcaggagtaacactaacaaattatgatggaaccgcaacaaac

D L F N N V A G V T L T N Y D G T A T N

gcaaacgtcgtaccaacaggatcatacattaagcagagagcaatgcctattaatgcaaat

A N V V P T G S Y I K Q R A M P I N A N

gcggtacgaccaactgaaacactcgacgctgctaaccatacaaaaccttttgctattgaa

A V R P T E T L D A A N H T K P F A I E

ggaggaagactcgtatatttgggtggaacaattgcaaatacaaccaatgtggtaaacgcg

G G R L V Y L G G T I A N T T N V V N A

atgcagaggaaacaaaggctttcaaaaccggcattcaagtgggcacatgctcagagacaa

M Q R K Q R L S K P A F K W A H A Q R Q

cgtgtatatgacagcagtcgtccagggatggacgcaatcacaaagttgtgtgcacgaaag

R V Y D S S R P G M D A I T K L C A R K

tcgggttttatgaatgcccgttccacagcaatgatggcacccaagactggactcagcgct

S G F M N A R S T A M M A P K T G L S A

gttatagatcaagcaccaaatacatctcaagacttgatcgaacagccgagtcagcaagag

V I D Q A P N T S Q D L I E Q P S Q Q E

gttatggatatgcaagcgacagcaacagtataaatcagatatatcaaattgcattgcata

V M D M Q A T A T V -

gaaaggcaaaacttataacagcaaagaaatggcaagaattaacaaaaggtatttataatg

catctaccctgacaccgaagatagttgaccaaattataaaggatgaaggaagtgggaccg

ataagacaaaatatgtaaatgttcctaaaataattactgacaaagaattacaaacattct

atgtaccaagaagcaacgcagacctagttataagaagaatacgtttaatcgacctttggc

Page 117: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

116

gtaacctaaaaccagatcaaatggacgagattcgtaattacactcatctagattatatcttt

M D E I R N Y T H L D Y I F

gtacaaaacatttgtatctatatgttagtatttggaatagacacagttaaacactttaga

V Q N I C I Y M L V F G I D T V K H F R

caaataggtctattcaatgaaaggaatgaatttattgaaattgcaaaacaattatcaacc

Q I G L F N E R N E F I E I A K Q L S T

aaagggaaaagatttgttgatgatgttgataatatgaaacaaaaggtatgtgaaatagct

K G K R F V D D V D N M K Q K V C E I A

actattgttggttatatggacccaaacgttgataaaatagacgtaatggaagaagtggac

T I V G Y M D P N V D K I D V M E E V D

tcacttgcagctgaaggtaatgaacatggtatagatagagataattggaatgatttgttt

S L A A E G N E H G I D R D N W N D L F

acaaaaacatgcaaagaagtaatgacatggtacaaaggacatgaatttattagttttgat

T K T C K E V M T W Y K G H E F I S F D

gattacataaaggaaggaatgtggttaacaagtggaagttcaagtattgggaaagtgcat

D Y I K E G M W L T S G S S S I G K V H

tggacaaaagatggagaaaatgggaaatttaaagcaaggaaaaatatgctgttacaaatt

W T K D G E N G K F K A R K N M L L Q I

tatacaccgcaagaattggccgacattgtttatgcttgggatggaaagttacattcacgt

Y T P Q E L A D I V Y A W D G K L H S R

gtctttattaaaaacgaaatgagtaaattaagacttgctgtggcatctaacatcgaagca

V F I K N E M S K L R L A V A S N I E A

tatattcatgaatcttatatgcttttcctatatggtcatggttttaaagaatactttgga

Y I H E S Y M L F L Y G H G F K E Y F G

gtgacgcttgacgaaaaaccagatcaacagcatcagagagaaattgaaatgattgagaaa

V T L D E K P D Q Q H Q R E I E M I E K

ctacaagctggatactttggattaccatttgactatgcatcatttgatcatcagccaaca

L Q A G Y F G L P F D Y A S F D H Q P T

actttcgaagttaagacaatggtgagaagagttggagaaattgtagttagtcaagtacct

T F E V K T M V R R V G E I V V S Q V P

aagaattattactatcagacacaattgctagtcaataagattgttaatgcatatgataaa

K N Y Y Y Q T Q L L V N K I V N A Y D K

agttatttgtctggaaatattaaaaatactaaatttgaaaatataaaagtcaaaggtgga

S Y L S G N I K N T K F E N I K V K G G

gtaccatcaggagtgagaataacaagtttgttgggaaatatgtggaacgctataattaca

V P S G V R I T S L L G N M W N A I I T

aagatcgcaataaataatgttattggaattattggatacgacccaatctcccaaatctcg

K I A I N N V I G I I G Y D P I S Q I S

ttacgcggagacgacgttgctatattaagtaaagatccagcagctctttatttacttaga

L R G D D V A I L S K D P A A L Y L L R

ctatcatatgctgcaattaatgcaattggcaaagatagtaagttaggtatatctccaaaa

L S Y A A I N A I G K D S K L G I S P K

gtatgtgaatttttacggaatgagatatcagtgacaggagtacgcggttggacatgtaga

Page 118: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

117

V C E F L R N E I S V T G V R G W T C R

ggaataggtggtataagtcaacgaaaaccatggaatccacaaccttggagtccaaatgat

G I G G I S Q R K P W N P Q P W S P N D

gaagtcgaaacaaatgcaagcaacatttcattattagaaagacgagcaggaattgaactt

E V E T N A S N I S L L E R R A G I E L

caacaattacaccacataaacaaagttaaatggtcaagacacgtcagacaaagttataaa

Q Q L H H I N K V K W S R H V R Q S Y K

tatctagaattgccaaaacgacttggtggttttggaatctatcgattccaggggtggtta

Y L E L P K R L G G F G I Y R F Q G W L

cctaacggcaaattaccacttgccaaaaaacctttggttaacgtagaggacatacatcca

P N G K L P L A K K P L V N V E D I H P

agccaagagctgtttttgcctttaagtgaacaacagaaaaagatcttagcacaggttgaa

S Q E L F L P L S E Q Q K K I L A Q V E

atgacaaacaaaatgcaaacagatgatatacctgggacacaaaaattattttcaaaggaa

M T N K M Q T D D I P G T Q K L F S K E

tggatacagaaagtgcgtacaaaaaagatcatatggagtagaaatcagacaataccaatc

W I Q K V R T K K I I W S R N Q T I P I

catacggatcacacagtacgcataccaagatgggacgagaaaatcaaattcccaaggtat

H T D H T V R I P R W D E K I K F P R Y

aaatcagaatatatattaaataataaaatcaacttaacaatggagcaagtgctaagacag

K S E Y I L N N K I N L T M E Q V L R Q

tataacctcttaaaagaagtggaacggtacgataaagatctaaaagtgccaaagttatta

Y N L L K E V E R Y D K D L K V P K L L

gacattttggacaaatggttcccggtccaaagtagtaaaattaaaacatatgaaagtcaa

D I L D K W F P V Q S S K I K T Y E S Q

ggttttcatagaacagacgcaattaaccttgctgttggtgaaattccaactgaaccagca

G F H R T D A I N L A V G E I P T E P A

gttaaaataaatcctatactaataaactttgttaagctacatcttgaaagacaaggtatt

V K I N P I L I N F V K L H L E R Q G I

agacatcagagaggtagaaataggatcgccaaatttatttaccaaaaaacaaaacaagca

R H Q R G R N R I A K F I Y Q K T K Q A

gagaacatgatactgcaaagtagtttacaacaaatgtataggtactaaattaagggacca

E N M I L Q S S L Q Q M Y R Y -

ataaagaaacttcgagtttcctataacacattcccagttgggtttgggggccagccatg

Figura Suplementar 2: Sequência genômica completa (7.561 pb) e regiões codificantes do IMNVgen1. Os aminoácidos codificados estão mostrados abaixo da sequêcia de nucleotídeos.

Page 119: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

118

IMNVgen2 complete genome

ggcaatttcaacctaattctaaaactgttaccaacaatttcagaactacagaagaggcat

attcttcatctacttcgagaagaagtagaaggaaagaaagtttgcttcgtagagcgagaa

aaacagaatccacttatggctataaacgaactagccgttaaagttggaaagaaacctaaa

M A I N E L A V K V G K K P K

tacacatcgacgaaaaccggagctgaccacattccaagttggactgtattggttgagttc

Y T S T K T G A D H I P S W T V L V E F

gcaggttttagcgaagcagcaacatgtgacacagttaaaaacgcaaaaatgattgctgct

A G F S E A A T C D T V K N A K M I A A

tacaaattggttaaaagattttgtaaatgggacccaacctacattgaaatttctgattgt

Y K L V K R F C K W D P T Y I E I S D C

atgctgccacctccagatcttacatcgtgcggggatgttgagagtaatcctggacctatc

M L P P P D L T S C G D V E S N P G P I

atacatagtgttgcatttgcaagaactggttcagtatggacacctgccacctttactttc

I H S V A F A R T G S V W T P A T F T F

aatactacatcatccccaggtagactgcaagtacaaatgtcatccagcgacaatagatat

N T T S S P G R L Q V Q M S S S D N R Y

gggttcaactctgttttacttgcagcaggcggtacaacatggggcacagcttatttttca

G F N S V L L A A G G T T W G T A Y F S

gaacgctggaacagtgactttggattacagccagatctaactataactgtaacaccacaa

E R W N S D F G L Q P D L T I T V T P Q

ctaactggagaagaacttggttcaatttattttgatgctgtcgaaactacaaatgcagag

L T G E E L G S I Y F D A V E T T N A E

gaagctatagaggcaacaattataaatactactccaattgatgtaatggtagacacaaca

E A I E A T I I N T T P I D V M V D T T

gcaggccctgtaccaattgaaggtgatttcaaacccacaaatgaaactcccacgtgggta

A G P V P I E G D F K P T N E T P T W V

agtaacacaaagcccattgatgtagcaacacctaagactcgtgactacgcaaatcggtca

S N T K P I D V A T P K T R D Y A N R S

gtactgactccacaattgatcacaaaaatgaaagaccatgtctatgccttacaaaaggat

V L T P Q L I T K M K D H V Y A L Q K D

gaagttgaagatgtaacacttgcctcactcgattttggcttaaatccatcaagtgtactc

E V E D V T L A S L D F G L N P S S V L

ggaagatggttgaaatggttaactggcatagacatgagactccatcttgggaagaaagtt

G R W L K W L T G I D M R L H L G K K V

acaaaccataaagttagaatgtttgtgcaaaaaacaaggtttccactaaagacagcaatt

T N H K V R M F V Q K T R F P L K T A I

gaggaactaaacaatggtactgttccacttagattaaggagggatgttcgttacattgaa

E E L N N G T V P L R L R R D V R Y I E

aagccattcgataaagaggaacataccgacatactgttatctggtgacgttgaggaaaac

Page 120: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

119

K P F D K E E H T D I L L S G D V E E N

cctgggcctgaagggatggaacaggtatcaataacgccagaacaacttcaaatgattctg

P G P E G M E Q V S I T P E Q L Q M I L

gcaatgcaaaaatcaccaccaaagccaaagatcaaagaactaagtgaaagggaaattcag

A M Q K S P P K P K I K E L S E R E I Q

ttaaggctccaaggaaatgaagcaacccgcagacatcaaagatttaaaggtgagcccatt

L R L Q G N E A T R R H Q R F K G E P I

gatccagttctaactagagaagatataattagaaagcacaatcagcagaatggaatattg

D P V L T R E D I I R K H N Q Q N G I L

ccttatgaaaaagaacagccggtagtggtaaataacgtacaccctttggagaaggagtat

P Y E K E Q P V V V N N V H P L E K E Y

tccattgaaaaggaaggaatggtgtgggacgaggaacaatttctgacgtatatacatgac

S I E K E G M V W D E E Q F L T Y I H D

aaatcatcaagcaacgatcactatgcctgcatctataacgttgttacacataacagattc

K S S S N D H Y A C I Y N V V T H N R F

ggcgtaattgaaatgccagaagatccacttgaaatgattgatcattatgaaacaggggaa

G V I E M P E D P L E M I D H Y E T G E

gaatcaaaaacaaaacccaaaactaaaagtggtaacaaaagagaactaaatgatgaaacc

E S K T K P K T K S G N K R E L N D E T

ttttacagaaagaagaagacaaaaacaacaaaagagccaaaaacacaagagcaaaagaaa

F Y R K K K T K T T K E P K T Q E Q K K

attgaccacgataacatgttttcacgattgctgagaaggcttgacaaaccacaaattgta

I D H D N M F S R L L R R L D K P Q I V

gcagcttggctaaacaacagaccatcacgtaaattggtcgaaaaattagctgacagtaaa

A A W L N N R P S R K L V E K L A D S K

ttcggaattggatggcaagcaaaagaagagtacacaaccagcatggtaattgtatctgga

F G I G W Q A K E E Y T T S M V I V S G

tatatcaattgtgaaccgttacccctaatcgtagataagcttctctccgtcgataacaac

Y I N C E P L P L I V D K L L S V D N N

tatgacatgtggcaacagaccgacaagtattttgacaatttgatcacactgtgtaaccgc

Y D M W Q Q T D K Y F D N L I T L C N R

gtcagtgacgttacctacactagcgctcagctgtgtagagatgcatctatcttgaataac

V S D V T Y T S A Q L C R D A S I L N N

aagaagatgcatgttgaaaatggaaacattgtttcaatggaaaatcagtctgaaattgat

K K M H V E N G N I V S M E N Q S E I D

agtcaaactaaattcttttcactattagaagatgataacaaacttccaattgtagatgag

S Q T K F F S L L E D D N K L P I V D E

ctaagagtattagctgatatgacggcacaaagaagcaacgtaaacactgctggtaatcat

L R V L A D M T A Q R S N V N T A G N H

cttcgtgataatgactctattagggccgacgctgttctatctaacaatacagtacgtaat

L R D N D S I R A D A V L S N N T V R N

aattgtcaaattccaattcctgtaacaacactaataccaagacaaattcgtggattgaat

N C Q I P I P V T T L I P R Q I R G L N

ggtgcacttgtaaatcagcaattacggttacagggaattgaaacacacattacagacagt

Page 121: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

120

G A L V N Q Q L R L Q G I E T H I T D S

tatatttcaaaagctgagccatctgactattcgaaacaactgtctgaaatggttaatgct

Y I S K A E P S D Y S K Q L S E M V N A

caaaagacatcaacttggcgagcaaacaatatcgcatcacaggggtgggacatgtttgat

Q K T S T W R A N N I A S Q G W D M F D

actgtacagttaaatacaaacatatcacaaaaggatctttcaatggacactgctttgaca

T V Q L N T N I S Q K D L S M D T A L T

aagcttatgttgttgtaccagctaacaacacaaaatctgccagcaacacaattaccatca

K L M L L Y Q L T T Q N L P A T Q L P S

agcatttattctgcatttgattcaagaacacagcctactttacaggatggaatttggggt

S I Y S A F D S R T Q P T L Q D G I W G

ataaataatggtgttaatatatttggtgaacaatgcggtggattagctgcgccagtcttt

I N N G V N I F G E Q C G G L A A P V F

ccattcagtgggggcaccggagaaattactttccatcttactttacaatctgttccacag

P F S G G T G E I T F H L T L Q S V P Q

gaatttcaagaatcagcaattttcgtaccagcaactgcactacaagctgcaaaagagggc

E F Q E S A I F V P A T A L Q A A K E G

gctcgaacattggcaatgtatgttttaatgtttgcagaatggccatttggtatgtataca

A R T L A M Y V L M F A E W P F G M Y T

aaaactaaacaaacaacagacaatgctggtaataatcaagcagatcaaattttcattcac

K T K Q T T D N A G N N Q A D Q I F I H

tccgaatctactgtacatattccaggacaaaaacaaatgcatattgtgctgccaagaaaa

S E S T V H I P G Q K Q M H I V L P R K

gtgaacatggtgaaccccactacaattgcagaagcaaatgcacgtgtagtaactcaacca

V N M V N P T T I A E A N A R V V T Q P

acatacggtacagtggcagctggggcaggtgtcgcaaatggtaatattaacgtagctgct

T Y G T V A A G A G V A N G N I N V A A

attggtgtggccctgccaactgtaaatttgactgactaccttgtatcgtgggcaaccgat

I G V A L P T V N L T D Y L V S W A T D

ttcacacttggcgacataaaacaattggttgaaagaatgaaaacaacactgccaattagt

F T L G D I K Q L V E R M K T T L P I S

cgagacctgatggcagcacgtcaaaatgctatgttattgagtactctatttcctccacta

R D L M A A R Q N A M L L S T L F P P L

attcagagcaatgtggcttcagacacaaatgaagtcgcaggaacagctggagcatacact

I Q S N V A S D T N E V A G T A G A Y T

gcatgtcttgcaaacttaggtattcctgaaacactaacagttaactggggagtagatata

A C L A N L G I P E T L T V N W G V D I

aatgttcagccattgtatcagctacttgaaacggatatcacagcccataatcggtacgta

N V Q P L Y Q L L E T D I T A H N R Y V

ttaaacctgttcaaaagagaagaagtggtagcaggtgcatatgaatttgggtggttggga

L N L F K R E E V V A G A Y E F G W L G

cacatggccagttatatgatgggacttcttctaacaatgaatatatcatcagtgtttaac

H M A S Y M M G L L L T M N I S S V F N

gtttggtattcaacaagacgtatttcaacaaaggcgtgggacacagcatatgatagtaac

Page 122: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

121

V W Y S T R R I S T K A W D T A Y D S N

atccaagcatatcaggacatgcattatcaaatgttttcgtggagttcaatgcaaggtagt

I Q A Y Q D M H Y Q M F S W S S M Q G S

attgcgccagcaatggtggacgaaattcttcataacctttgtggccaaatgtttggcttc

I A P A M V D E I L H N L C G Q M F G F

agcttaccattgagacaagtcttatttaacgcattgccaatcactttttcatcgtttgga

S L P L R Q V L F N A L P I T F S S F G

agttggatgttgcctagagtttctgatggtttccaaactgtaaggtattatgatgcaggt

S W M L P R V S D G F Q T V R Y Y D A G

ccaccagccattaatgcaaaacgtgatggggaagtaccagtaagtatgattgacgcatgg

P P A I N A K R D G E V P V S M I D A W

acctataaatttacagaaaaattgccaaaaagttttttgccatggccaatgccagaagga

T Y K F T E K L P K S F L P W P M P E G

aaggacagtacaatgggatatgatccggaaaaagaaccagcactaattgataattcaaat

K D S T M G Y D P E K E P A L I D N S N

gagacaggcaatgtattcagaccattcatggcaagaaatggcaacaattccaattattta

E T G N V F R P F M A R N G N N S N Y L

ccaaccaactacacaattgacgtatcacagaatggtcatgatgagagttgtattaatgtt

P T N Y T I D V S Q N G H D E S C I N V

gacctttttaacaatgttgcaggagtaacactaacaaattatgatggaaccgcaacaaac

D L F N N V A G V T L T N Y D G T A T N

gcaaacgtcgtaccaacaggatcatacattaagcagagagcaatgcctatcaatgcaaat

A N V V P T G S Y I K Q R A M P I N A N

gcggtacgaccaactgaaacactcgacgctgcaaaccatacaaaaccttttgctattgaa

A V R P T E T L D A A N H T K P F A I E

ggaggaagactcgtatatttgggtggaacaattgcaaatacaaccaatgtggtaaacgcg

G G R L V Y L G G T I A N T T N V V N A

atgcagaggaaacaaaggctttcaaaaccggcattcaagtgggcacatgctcagagacaa

M Q R K Q R L S K P A F K W A H A Q R Q

cgtgtatatgacagcagtcgtccagggatggacgcaatcacaaagttgtgtgcacgaaag

R V Y D S S R P G M D A I T K L C A R K

tcgggttttatgaatgcccgttccacagcaatgatggcacccaagactggactcagcgct

S G F M N A R S T A M M A P K T G L S A

gttatagatcaagcaccaaatacatctcaagacttgatcgaacagccgagtcagcaagag

V I D Q A P N T S Q D L I E Q P S Q Q E

gttatggatatgcaagcgacagcaacagtataaatcagatatatcaaattgcattgcata

V M D M Q A T A T V -

gaaaggcaaaacttataacagcaaagaaatggcaagaattaacaaaaggtatttataatg

catctaccctgacaccgaagatagttgaccaaattataaaggatgaaggaagtgggaccg

ataagacaaaatatgtaaatgttcctaaaataattactgacaaagaattacaaacattct

atgtaccaagaagcaacgcagacctagttataagaagaatacgtttaatcgacctttggc

Page 123: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

122

gtaacctaaaaccagatcaaatggacgagattcgtaattacactcatctagattatatcttt

M D E I R N Y T H L D Y I F

gtacaaaacatttgtacctatatgttagtatttggaatagacacagttaaacactttaga

V Q N I C T Y M L V F G I D T V K H F R

caaataggtctattcaatgaaaggaatgaatttattgaaattgcaaaacaattatcaacc

Q I G L F N E R N E F I E I A K Q L S T

aaagggaaaagatttgttgatgatgttgataatatgaaacaaaaggtatgtgaaatagct

K G K R F V D D V D N M K Q K V C E I A

actattgttggttatatggacccaaacgttgataaaatagacgtaatggaagaagtcaac

T I V G Y M D P N V D K I D V M E E V N

tcacttgcagctgaaggtaatgaacatggtatagatagagataattggaatgatttgttt

S L A A E G N E H G I D R D N W N D L F

acaaaaacatgcaaagaagtaatgacatggtacaaaggacatgaatttattagttttgat

T K T C K E V M T W Y K G H E F I S F D

gattacataaaggaaggaatgtggttaacaagtggaagttcaagtattgggaaagtgcat

D Y I K E G M W L T S G S S S I G K V H

tggacaaaagatggagaaaatgggaaatttaaagcaaggaaaaatatgctgttacaaatt

W T K D G E N G K F K A R K N M L L Q I

tatacaccgcaagaattggccgacattgtttatgcttgggatggaaagttacattcacgt

Y T P Q E L A D I V Y A W D G K L H S R

gtctttattaaaaacgaaatgagtaaattaagacttgctgtggcatctaacatcgaagca

V F I K N E M S K L R L A V A S N I E A

tatattcatgaatcttatatgcttttcctatatggtcatggttttaaagaatactttgga

Y I H E S Y M L F L Y G H G F K E Y F G

gtgacgcttgacgaaaaaccagatcaacagcatcagagagaaattgaaatgattgagaaa

V T L D E K P D Q Q H Q R E I E M I E K

ctacaagctggatactttggattaccatttgactatgcatcatttgatcatcagccaaca

L Q A G Y F G L P F D Y A S F D H Q P T

actttcgaagttaagacaatggtgagaagagttggagaaattgtagttagtcaagtacct

T F E V K T M V R R V G E I V V S Q V P

aagaattattactatcagacacaattgctagtcaataagattgttaatgcatatgataaa

K N Y Y Y Q T Q L L V N K I V N A Y D K

agttatttgtctggaaatattaaaaatactaaatttgaaaatataaaagtcaaaggtgga

S Y L S G N I K N T K F E N I K V K G G

gtaccatcaggagtgagaataacaagtttgttgggaaatatgtggaacgctataattaca

V P S G V R I T S L L G N M W N A I I T

aagatcgcaataaataatgttattggaattattggatacgacccaatctcccaaatctcg

K I A I N N V I G I I G Y D P I S Q I S

ttacgcggagacgacgttgctatattaagtaaagatccagcagctctttatttacttaga

L R G D D V A I L S K D P A A L Y L L R

ctatcatatgctgcaattaatgcaattggcaaagatagtaagttaggtatatctccaaaa

L S Y A A I N A I G K D S K L G I S P K

gtatgtgaatttttacggaatgagatatcagtgacaggagtacgcggttggacatgtaga

Page 124: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

123

V C E F L R N E I S V T G V R G W T C R

ggaataggtggcataagtcaacgaaaaccatggaatccacaaccttggagtccaaatgat

G I G G I S Q R K P W N P Q P W S P N D

gaagtcgaaacaaatgcaagcaacatttcattattagaaagacgagcaggaattgaactt

E V E T N A S N I S L L E R R A G I E L

caacaattacaccacataaacaaagttaaatggtcaagacacgtcagacaaagttataaa

Q Q L H H I N K V K W S R H V R Q S Y K

tacctagaattgccaaaacgacttggtggttttggaatctatcgattccaggggtggtta

Y L E L P K R L G G F G I Y R F Q G W L

cctaacggcaaattaccacttgccaaaaaacctttggttaacgtagaggacatacatcca

P N G K L P L A K K P L V N V E D I H P

agccaagagctgtttttgcctttaagtgaacaacagagaaagatcttagcacaggtcgaa

S Q E L F L P L S E Q Q R K I L A Q V E

atgacaaacaaaatgcaaacagatgatatacctgggacacaaaaattattttcaaaggaa

M T N K M Q T D D I P G T Q K L F S K E

tggatacagaaagtgcgtgcaaaaaagatcatatggagtagaaatcagacaataccaatc

W I Q K V R A K K I I W S R N Q T I P I

catactgatcacacagcacgcataccaagatgggacgagaaaatcaaattcccaaggtat

H T D H T A R I P R W D E K I K F P R Y

aaatcagaatatatattaaataataaaatcaacttaacaatggagcaagtgctaagacag

K S E Y I L N N K I N L T M E Q V L R Q

tataacctcttaaaagaagtggaacggtacgataaagatctaaaagtgccaaagttatta

Y N L L K E V E R Y D K D L K V P K L L

gacattttggacaaatggttcccggtccaaagtagtaaaattaaaacatatgaaagtcaa

D I L D K W F P V Q S S K I K T Y E S Q

ggttttcatagaacagacgcaattaaccttgctgttggtgaaattccaactgaaccagca

G F H R T D A I N L A V G E I P T E P A

gttaaaataaatcctatactaataaactttgttaagctacatcttgaaagacaaggtatt

V K I N P I L I N F V K L H L E R Q G I

agacatcagagaggtagaaataggatcgccaaatttatttaccaaaaaacaaaacaagca

R H Q R G R N R I A K F I Y Q K T K Q A

gagaacatgatactgcaaagtagtttacaacaaatgtataggtactaaattaagggacca

E N M I L Q S S L Q Q M Y R Y -

Ataaagaaacttcgagtttcctataacacattcccagttgggttttggggccagccatg

Figura Suplementar 3: Sequência genômica completa (7.561 pb) e regiões codificantes do IMNVgen2. Os aminoácidos codificados estão mostrados abaixo da sequência de nucleotídeos.

Page 125: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

124

Tabela suplementar 4: Identificação dos sítios polimórficos (SP) no genoma do IMNV. A tabela indica a posição do SP e se esse SP causa alteração na sequência de aminoácidos. Em destaque (cinza) os SP que causam alteração na sequência de aminoácidos.

Posição NT

Brasil Indonésia IMNVgen1 IMNVgen2 Mudança de AA

Característica do AA

5’UTR

1 42 T T T A - -

2 105 C T C C - -

3 112 A G G G - -

RBP

4 174 G AAG Lys

G AAG Lys

G AAG Lys

A AAA Lys

Não Lys – polar básico

5 219 C AGC Ser

C AGC Ser

T AGT Ser

T AGT Ser

Não Ser – polar neutro

6 309 A TTA Leu

A TTA Leu

G TTG Leu

G TTG Leu

Não Leu – apolar

7 378 C GAC Asp

C GAC Asp

C GAC Asp

T GAT Asp

Não Asp – polar ácido

8 396 C GAC Asp

C GAC Asp

T GAT Asp

T GAT Asp

Não Asp – polar ácido

Small Protein 1 (SP1)

9 429 C AGC Ser

C AGC Ser

T AGT Ser

T AGT Ser

Não Ser – polar neutro

10 498 G CCG Pro

G CCG Pro

G CCG Pro

A CCA Pro

Não Pro – apolar

11 544 T TTC Phe

C CTC Leu

T TTC Phe

T TTC Phe

Sim Phe – apolar Leu – apolar

12 549 T AAT Asn

T AAT Asn

C AAC Asn

C AAC Asn

Não Asn – polar neutro

13 570 T GGT Gly

T GGT Gly

C GGC Gly

C GGC Gly

Não Gly – apolar

14 601 C CAA Gln

C CAA Gln

G GAA Glu

G GAA Glu

Sim Gln – polar neutro Glu – polar ácido

15 606 T CGT Arg

T CGT Arg

C CGC Arg

C CGC Arg

Não Arg – polar básico

16 618 C CAC

C CAC

T CAT

C CAC

Não His – polar básico

Page 126: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

125

His His His His

17 702 T GTT Val

T GTT Val

C GTC Val

C GTC Val

Não Val – apolar

18 732 G GAG Glu

G GAG Glu

A GAA Glu

G GAG Glu

Não Glu – polar ácido

19 890 T GTA Val

C GCA Ala

C GCA Ala

C GCA Ala

Sim Val – apolar Ala – apolar

20 916 C CTG Leu

T TTG Leu

T TTG Leu

T TTG Leu

Não Leu – apolar

21 967 A AAA Lys

A AAA Lys

G GAA Glu

G GAA Glu

Sim Lys – polar básico

Glu – polar ácido

22 996 C TTC Phe

C TTC Phe

T TTT Phe

T TTT Phe

Não Phe – apolar

23 999 C GGC Gly

C GGC Gly

T GGT Gly

C GGC Gly

Não Gly – apolar

24 1039 T TTA Leu

T TTA Leu

C CTA Leu

T TTA Leu

Não Leu – apolar

25 1053 C GAC Asp

C GAC Asp

T GAT Asp

C GAC Asp

Não Asp – polar ácido

26 1080 C GTC Val

C GTC Val

T GTT Val

T GTT Val

Não Val – apolar

27 1169 G CGT Arg

A CAT His

T CTT Leu

T CTT Leu

Sim Arg – polar básico

His – polar básico

Leu – apolar

28 1206 G CCG Pro

G CCG Pro

A CCA Pro

A CCA Pro

Não Pro – apolar

29 1228 G GAT Asp

G GAT Asp

A AAC Asn

G GAC Asp

Sim Asp – polar ácido

Asn – polar neutro

30 1230 T GAT Asp

T GAT Asp

C AAC Asn

C GAC Asp

Sim

31 1248 T GAT Asp

C GAC Asp

T GAT Asp

C GAC Asp

Não Asp – polar ácido

32 1263 C CCC

T CCT

T CCT

T CCT

Não Pro – apolar

Page 127: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

126

Pro Pro Pro Pro

Small Protein 2 (SP2)

33 1503 T CCT Pro

T CCT Pro

C CCC Pro

T CCT Pro

Não Pro – apolar

34 1504 G GAT Asp

G GAT Asp

T TAT Tyr

T TAT Tyr

Sim Asp – polar ácido Tyr – polar neutro

35 1524 A GTA Val

A GTA Val

G GTG Val

A GTA Val

Não Val – apolar

36 1603 T TTG Leu

T TTG Leu

C CTA Leu

C CTA Leu

Não

Leu – apolar

37 1605 G TTG Leu

G TTG Leu

A CTA Leu

G TTG Leu

38 1683 T GGT Gly

T GGT Gly

C GGC Gly

C GGC Gly

Não Gly – apolar

39 1687 C CTT Leu

C CTT Leu

A ATT Ile

A ATT Ile

Sim Leu – apolar Ile – apolar

40 1715 T ATG Met

C ACG Thr

T ATG Met

T ATG Met

Sim Met – apolar Thr – polar neutro

41 1732 C CCA Pro

C CCA Pro

C CCA Pro

A ACA Thr

Sim Pro – apolar Thr – polar neutro

42 1736 G GGG Gly

G GGG Gly

A GAG Glu

G GGG Gly

Sim Gly – apolar Glu – polar ácido

43 1744 C CCA Pro

C CCA Pro

C CCA Pro

T TCA Ser

Sim Pro – apolar Ser – polar neutro

44 1758 T CCT Pro

T CCT Pro

T CCT Pro

C CCC Pro

Não Pro – apolar

45 1779 A AAA Lys

G AAG Lys

A AAA Lys

A AAA Lys

Não Lys – polar básico

46 2058 A CCA Pro

A CCA Pro

G CCG Pro

G CCG Pro

Não Pro – apolar

47 2121 T ACT Thr

T ACT Thr

T ACT Thr

C ACC Thr

Não Thr – polar neutro

48 2134 G GAC Asp

A AAC Asn

G GAC Asp

G GAC Asp

Sim Asp – polar ácido Asn – polar neutro

Proteína Principal do Capsídeo (MCP)

Page 128: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

127

49 2304 G CTG Leu

G CTG Leu

G CTG Leu

A CTA Leu

Não Leu - apolar

50 2440 G GCT Ala

G GCT Ala

G GCT Ala

T TCT Ser

Sim Ala – apolar Ser – polar polar

51 2460 C AAC Asn

C AAC Asn

C AAC Asn

T AAT Asn

Não Asn – polar neutro

52 2525 T GTA Val

T GTA Val

C GCA Ala

C GCA Ala

Sim Val – apolar Ala – apolar

53 2727 A TCA Ser

G TCG Ser

A TCA Ser

A TCA Ser

Não Ser – polar neutro

54 2733 A AAA Lys

A AAA Lys

G AAG Lys

G AAG Lys

Não Lys – polar básico

55 2856 T CCT Pro

C CCC Pro

T CCT Pro

T CCT Pro

Não Pro – apolar

56 2894 T GTT Val

C GCT Ala

T GTT Val

T GTT Val

Sim Val – apolar Ala – apolar

57 2928 C GCC Ala

C GCC Ala

T GCT Ala

T GCT Ala

Não Ala – apolar

58 3015 A TCA Ser

A TCA Ser

G TCG Ser

A TCA Ser

Não Ser – polar neutro

59 3060 T GGT Gly

T GGT Gly

T GGT Gly

C GGC Gly

Não

Gly – apolar

60 3160 T TCA Ser

T TCA Ser

G GCA Ala

G GCA Ala

Sim Ser – polar neutro Ala – apolar

61 3291 A GTA Val

A GTA Val

G GTG Val

A GTA Val

Não Val – apolar

62 3293 T ATT Ile

T ATT Ile

C ACT Thr

C ACT Thr

Sim Ile – apolar Thr – polar neutro

63 3361 G GTT Val

G GTT Val

A ATT Ile

A ATT Ile

Sim Val – apolar Ile - apolar

64 3373 C CTG Leu

T TTG Leu

C CTG Leu

C CTG Leu

Não Leu – apolar

65 3399 T TAT Tyr

T TAT Tyr

T TAT Tyr

C TAC Tyr

Não Tyr – polar neutro

Page 129: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

128

66 3408 C TCC Ser

C TCC Ser

G TCG Ser

G TCG Ser

Não Ser – polar neutro

67 3487 T TTG Leu

T TTG Leu

C CTG Leu

C CTG Leu

Não Leu – apolar

68 3570 G AAG Lys

G AAG Lys

T AAT Asn

T AAT Asn

Sim Lys – polar básico Asn – polar neutro

69 3577 C CCA Pro

C CCA Pro

G GCA Ala

G GCA Ala

Sim Pro – apolar Ala – apolar

70 3653 T GTA Val

A GAA Glu

C GCA Ala

T GTA Val

Sim Val – apolar Glu – polar ácido

Ala – apolar

71 3675 G TTG Leu

G TTG Leu

A TTA Leu

G TTG Leu

Não Leu – apolar

72 3696 C GAC Asp

C GAC Asp

C GAC Asp

T GAT Asp

Não Asp – polar ácido

73 3708 C CAC His

C CAC His

T CAT His

T CAT His

Não His – polar básico

74 3732 C TTC Phe

T TTT Phe

C TTC Phe

C TTC Phe

Não Phe – apolar

75 3748 G GTA Val

A ATA Ile

G GTA Val

G GTA Val

Sim Val – apolar Ile – apolar

76 3807 C CTC Leu

C CTC Leu

C CTC Leu

T CTT Leu

Não Leu – apolar

77 3929 A CAA Gln

G CGA Arg

A CAA Gln

A CAA Gln

Sim Gln – polar neutro Arg – polar básico

78 3966 A GCA Ala

A GCA Ala

G GCG Ala

G GCG Ala

Não Ala – apolar

79 4017 G GGG Gly

G GGG Gly

C GGC Gly

C GGC Gly

Não Gly – apolar

80 4091 T TTG Leu

C TCG Ser

T TTG Leu

T TTG Leu

Sim Leu – apolar Ser – polar neutro

71 4135 G GTA Val

A ATA Ile

G GCA Ala

G GCA Ala

Sim

Val – apolar Ile – apolar Ala – apolar

82 4136 T GTA Val

T ATA Ile

C GCA Ala

C GCA Ala

Page 130: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

129

83 4148 T GTC Val

T GTC Val

C GCC Ala

C GCC Ala

Sim Val – apolar Ala – apolar

84 4347 T TTT Phe

T TTT Phe

C TTC Phe

C TTC Phe

Não Phe – apolar

85 4371 T TCT Ser

T TCT Ser

C TCC Ser

C TCC Ser

Não Ser – polar neutro

86 4380 G TTG Leu

G TTG Leu

A TTA Leu

A TTA Leu

Não Leu – apolar

87 4422 T GAT Asp

C GAC Asp

T GAT Asp

T GAT Asp

Não Asp – polar ácido

88 4504 G GAC Asp

G GAC Asp

A AAC Asn

A AAC Asn

Sim Asp – polar ácido Asn – polar neutro

89 4527 T TAT Tyr

C TAC Tyr

C TAC Tyr

C TAC Tyr

Não Tyr – polar neutro

90 4551 C ATC Ile

C ATC Ile

T ATT Ile

C ATC Ile

Não Ile – apolar

91 4593 T GCT Ala

T GCT Ala

T GCT Ala

A GCA Ala

Não Ala – apolar

92 4680 A GCA Ala

A GCA Ala

G GCG Ala

G GCG Ala

Não Ala – apolar

93 4686 G CAG Gln

A CAA Gln

G CAG Gln

G CAG Gln

Não Gln – polar neutro

94 4710 G CCG Pro

A CCA Pro

G CCG Pro

G CCG Pro

Não Pro – apolar

95 4905 G CAG Gln

A CAA Gln

G CAG Gln

G CAG Gln

Não Gln – polar neutro

Região entre as ORFs

96 5093 T C T T - -

RNA Polimerase Dependente de RNA (RdRp)

97 5299 T ATC Ile

T ATC Ile

T ATC Ile

C ACT Thr

Sim Ile – apolar Thr – polar neutro

98 5393 G CAG Gln

G CAG Gln

A CAA Gln

A CAA Gln

Não Gln – polar neutro

99 5489 T AAT Asn

T AAT Asn

C AAC Asn

C AAC Asn

Não Asn – polar neutro

Page 131: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

130

100 5519 C GTC Val

C GTC Val

G GTG Val

C GTC Val

Não Val – apolar

101 5520 A AAC Asn

A AAC Asn

G GAC Asp

A AAC Asn

Sim Asn – polar neutro Asp – polar ácido

102 5528 C CTC Leu

C CTC Leu

T CTT Leu

T CTT Leu

Não Leu – apolar

103 5784 A AAC Asn

A AAC Asn

G GAC Asp

G GAC Asp

Sim Asn – polar neutro Asp – polar ácido

104 5825 C GTC Val

A GTA Val

C GTC Val

C GTC Val

Não Val – apolar

105 6212 A ACA Thr

A ACA Thr

T ACT Thr

T ACT Thr

Não Thr – polar neutro

106 6266 G ACG Thr

G ACG Thr

A ACA Thr

A ACA Thr

Não Thr – polar neutro

107 6278 T GGT Gly

T GGT Gly

A GGA Gly

A GGA Gly

Não Gly – apolar

108 6554 C GGC Gly

C GGC Gly

T GGT Gly

C GGC Gly

Não Gly – apolar

109 6698 G TCG Ser

G TCG Ser

A TCA Ser

A TCA Ser

Não Ser – polar neutro

110 6725 T TAT Tyr

T TAT Tyr

T TAT Tyr

C TAC Tyr

Não Tyr – polar neutro

111 6770 C TTC Phe

T TTT Phe

C TTC Phe

C TTC Phe

Não Phe – apolar

112 6812 G AAG Lys

G AAG Lys

A AAA Lys

A AAA Lys

Não Lys – polar básico

113 6815 C CCC Pro

C CCC Pro

T CCT Pro

T CCT Pro

Não Pro – apolar

114 6880 A AAA Lys

A AAA Lys

A AAA Lys

G AGA Arg

Sim Lys – polar básico Arg – polar básico

115 6899 T GTT Val

T GTT Val

T GTT Val

C GTG Val

Não Val – apolar

116 6981 G GCA Ala

G GCA Ala

A ACA Thr

G GCA Ala

Sim Ala – apolar Thr – polar neutro

Page 132: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

131

117 7028 T ACT Thr

T ACT Thr

G ACG Thr

T ACT Thr

Não Thr – polar neutro

118 7039 T GTA Val

T GTA Val

T GTA Val

C GCA Ala

Sim Val – apolar Ala – apolar

119 7043 T CGT Arg

T CGT Arg

C CGC Arg

C CGC Arg

Não Arg – polar básico

120 7152 C CTA Leu

C CTA Leu

T TTA Leu

T TTA Leu

Não Leu – apolar

121 7289 C AAC Asn

T AAT Asn

C AAC Asn

C AAC Asn

Não Asn – polar neutro

122 7355 C GTC Val

C GTC Val

T GTT Val

T GTT Val

Não Val – apolar

123 7359 T TTA Leu

T TTA Leu

C CTA Leu

C CTA Leu

Não Leu – apolar

124 7405 A AAG Lys

A AAG Lys

G AGG Arg

G AGG Arg

Sim Lys – polar básico Arg – polar básico

3’UTR

125 7548 T

T G T - -

126 7550 T

T G G - -

Page 133: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

132

Figura Suplementar 4: Predição de regiões estruturadas e desestruturadas para as proteínas do IMNV. A

análise realizada no Foldindex mostra a sequência de aminoácidos estruturada (verde) e desestruturada

(vermelho) das proteínas do IMNV. A – RBP; B – SP1; C – SP2; D – MCP; E – RdRp.

B

D

C

E

A

Page 134: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

133

Tabela Suplementar 5: Avaliação dos modelos tridimensionais das proteínas RBP, MCP e RdRp.

Parâmetros Scores

RBP MCP RdRp

MOLPROBITY

Clashscore 180,73 83,5 178,98

Rotâmeros de cadeias laterais desfavoráveis 7,59% 2,09% 6,98%

Ramachandram desfavorável 4,40% 15,31% 4,15%

Ramachandram favorável 84,71% 70,17% 87,42%

Desvio do carbono β 9,09% 8,26% 11,51%

Ligações de comprimentos ruins 0% 1,40% 0,03%

Ligações de ângulos ruins 2,94% 6,33% 3,54%

MolProbity Score 4,03 3,47 3,96

SWISS-MODEL

Z-Score 0,627 -6,341 -5,14

QMEANscore6 -1,01 0,189 0,298

I-TASSER

C-score -2,26 -2,27 0,23

TM-score esperado 0,45 ± 0,14 0,45 ± 0,14 0,74 ± 0,11

RMSD esperado 8,6 ± 4,5 14,4 ± 3,7 7,7 ± 4,3

Números de decoys 5380 498 465

Densidade de cluster 0,0949 0,1220 0,3755

Page 135: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

134

Figura Suplementar 5: Predição de estrutura terciária para a Proteína Principal do Capsídeo do IMNV. Os modelos foram gerados para os quatro isolados do IMNV no programa I-TASSER. A – IMNV-BR (-1,25); B – IMNVgen1 (-1,22); C – IMNVgen2 (-1,13). Os C-scores estão indicados entre parênteses.

A

B

C

Page 136: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

135

Figura Suplementar 6: Predição de estrutura terciária para a RNA Polimerase Dependente de RNA do IMNV. Os modelos foram gerados para os quatro isolados do IMNV no programa I-TASSER. A – IMNV-BR (0,23); B – IMNVgen1 (-0,16); C – IMNVgen2 (-0,69). Os C-scores estão indicados entre parênteses.

B

C

A

Page 137: UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO … · Dois novos genomas foram sequenciados, analisados e comparados a outros dois genomas já depositados no GenBank. Os novos

136

Figura Suplementar 7: Predição de estrutura terciária usando modelagem por threading no programa Phyre2 para a proteínas do isolado da Indonésia. A – RBP; B – MCP; C – RdRp.

A B

C