10
UFRJ Universidade Federal do Rio de Janeiro Faculdade de Nanotecnologia Bioquímica de Macromoléculas Antonio Carlos Monteiro Miranda RIO DE JANEIRO 2016

Trabalho de Bio Qui Mica

Embed Size (px)

Citation preview

Page 1: Trabalho de Bio Qui Mica

UFRJ­ Universidade Federal do Rio de Janeiro

Faculdade de Nanotecnologia Bioquímica de Macromoléculas

Antonio Carlos Monteiro Miranda

RIO DE JANEIRO 2016

Page 2: Trabalho de Bio Qui Mica

Análise de sequenciamento proteico

De acordo com a análise do Blast, é possivel identificar que os aminoácidos de 1 até 498 é compatível com a sequência de 291 até 771 da poli proteína do Zika Virus. Portanto, podemos concluir, que esse grupo de aminoácidos propostos nesta ordem para este trabalho é parte da poli proteína do Zica vírus. Ou seja, ela é 100% idêntica com parte do Zika Virus.

É uma polyprotein do Zika Virus 100% de compatibilidade com sequencia do Envelope viral proteico que

protege o material genético. De acordo com a árvore filogenética sua sequência está relacionada a

muitas outras ramificações de proteínas de envoltório externo de vírus e um parentesco comum a outros virus como Dengue e outros flavo vírus

É da família do flavo vírus com gene de RNA de fita simples com sentido positivo.

4 principais domínios da sequência estudada: Flavi_E_C­> Domínio semelhante a imunoglobulina III (domínio do C­terminal) do Flavivirus e da glicoproteína do envelope. Além disso, possui baixas afinidades com Glicoaminoglicanos que possuem cargas negativas na superfície da célula vetor. Flavi_glycoprot­>Domínio relacionados a centralização e dimerização da glicoproteína. E também, compatível com o da glicoproteína. Flavi_E_stem­> Domínio que se relaciona a ancoragem. Este, relaciona­se ao C­Terminal, região a qual descreve a região da Haste, seguida por outros dois domínios transmembrânicos de ancoragem, que é clivada da poli proteína do Flavo Virus. Flavi_glycop_C­>Outro Domínio da imunoglobulina da poli proteina do Flavo Virus.

Examinando uma proteína Homologa da sequência proposta, com 100% de compatibilidade, da poli proteína do Zika Virus ID: gb|ABI54475.1| pode­se inferir alguns dados como estruturais, sobre a função e história evolutiva da proteína. Dessa maneira, é possível deduzir também a relação entre a estrutura e a função com base nesses dados.

Page 3: Trabalho de Bio Qui Mica

Organismo de Origem: Zika virus­> Viruses; ssRNA viruses; ssRNA positive­strand viruses, no DNA stage; Flaviviridae; Flavivirus; Spondweni virus group.

Função da Proteína Molecular e Biológica: Envelope proteico e parte da haste de ancoragem.

Zika Vírus:

O Zika vírus( que recebe este nome, pois, o primeiro caso reportado deste vírus aparentemente se deu na “Zika Forest” em Uganda, em que um macaco Rhesus foi contaminado por ele) é um vírus de RNA contendo 10794 nucleotídeos codificantes e 3419 aminoácidos, ele é muito semelhante ao vírus Spondweni( cuja semelhança será discutida mais à frente), e são os 2 únicos membros do seu clade dentro do cluster dos flavirus de doenças transmitidas por mosquitos. O Zika virus pode causar sintomas que incluem febre, dor nas articulações e músculos, além de conjuntivite e manchas vermelhas na pele. Muitos artigos e pesquisas referem­se ao mosquito Aedes aegypti como o vetor de transmissão deste vírus, sendo citadas pesquisas em que a transmissão do Zika virus foi feita através de mosquitos aedes aegypti alimentados artificialmente em macacos e em roedores em laboratório em 1956(Boorman JP, Porterfield JS A simple technique for infection of mosquitoes with viruses; transmission of Zika virus. Trans R Soc Trop Med Hyg 1956;50:238–42 10.1016/0035­9203(56)90029­3). Através destes artigos, pode­se também entender a função da proteína que, em suma, seria a sua importância para a replicação viral, ou seja, possui a função de entrar na célula e ajudar na replicação do vírus; isto é melhor explicado no trecho à seguir, só que mais relacionado aos flavírus em geral: “Assim como acontece com os virus da influenza e os alphavirus, os flavivirus entram na célula por endocitose mediada por receptor. O ambiente acidofilico do endossomo é responsavel por desencadear uma mudança conformacional nas glicoproteinas de fusão. Neste caso, a mudança ocorre na glicoproteina do envelope que é a responsável tanto pela ligação ao receptor quanto pelo processo de fusão com a membrana celular do endossomo e liberação dos componentes virais no citoplasma celular. “

Estrutura da proteína:

Primária: IRCIGVSNRDFVEGMSGGTWVDVVLEHGGCVTVMAQDKPTVDIELVTTTVSNMAEVRSYCYEASISDMASDSRCPTQGEAYLDKQSDTQYVCKRTLVDRGWGNGCGLFGKGSLVTCAKFTCSKKMTGKSIQPENLEYRIMLSVHGSQHSGMIVNDENRAKVEVTPNSPRAEATLGGFGSLGLDCEPRTGLDFSDLYYLTMNNKHWLVHKEWFHDIPLPWHAGADTGTPHWNNKEALVEFKDAHAKRQTVVVLGSQEGAVHTALAGALEAEMDGAKGRLFSGHLKCRLKMDKLRLKGVSYSLCTAAFTFTKVPAETLHGTVTVEVQYAGTDGPCKVPAQMAVDMQTLTPVGRLITANPVITESTENSKMMLELDPPFG

Page 4: Trabalho de Bio Qui Mica

DSYIVIGVGDKKITHHWHRSGSTIGKAFEATVRGAKRMAVLGDTAWDFGSVGGVFNSLGKGIHQIFGAAFKSLFGGMSWFSQILIGTLLVWLGLNTKNGSISLTCLALGGVMIFLSTAVSA

PI: 6,8 Grande Média de Hidrofobicidade: ­0,06 Proporção dos aminoácidos: Ala (A) 37 7.4% Arg (R) 18 3.6% Asn (N) 16 3.2% Asp (D) 25 5.0% Cys (C) 13 2.6% Gln (Q) 13 2.6% Glu (E) 24 4.8% Gly (G) 54 10.8% His (H) 16 3.2% Ile (I) 20 4.0% Leu (L) 43 8.6% Lys (K) 29 5.8% Met (M) 17 3.4% Phe (F) 19 3.8% Pro (P) 16 3.2% Ser (S) 36 7.2% Thr (T) 40 8.0% Trp (W) 10 2.0% Tyr (Y) 10 2.0% Val (V) 42 8.4% Pyl (O) 0 0.0% Sec (U) 0 0.0% Número total de resíduos negativos (Asp + Glu): 49 Número total de resíduos positivos (Arg + Lys): 47

Composição atômica: Carbon C 2377 Hydrogen H 3740 Nitrogen N 652 Oxygen O 712 Sulfur S 30 Fórmula: C2377H3740N652O712S30 Número total de átomos: 7511

Análise resumida da sequência compatível com o Zika Virus(291até788):

o 291..586: Flavi glycoprot o 595..687: Flavi E C o 600..601,603..604,611..612,659: Interface de Homodímero

Page 5: Trabalho de Bio Qui Mica

o 607,624,643..646,648: Interface de baixo Ph o 692..788: Flavi E stem

Pôde­se verificar que a poliproteína é levemente negativa, visto que existem somente dois resíduos negativamente carregados a mais do que os positivamente carregados, o que pode ser claramente verificado observando­se seu ponto isoelétrico(6,8); próximo do ph neutro, visto que ele tende bem pouco para o caráter ácido(abaixo de 7). Além disso, pode­se também, verificar a existência majoritária de aminoácidos não carregados na estrutura, visto que estes compõem 402 dos 498 aminoácidos presentes nesta proteína(aproximadamente 80,72% do total). Pode­se verificar, também, que os aminoácidos hidrofóbicos nesta proteína, somando­se Alanina(37 – 7,4%), Valina(42 – 8,4%), Isoleucina(20 – 4%), Leucina(43­ 8,6%),Fenilalanina( 19 ­ 3,8%) Metionina (17 – 3,4%), Tirosina( 10 – 2%) e Triptofano(10 – 2%), totalizam(aproximadamente) 39,6%. Enquanto que os hidrofílicos irão totalizar, aproximadamente, 60,4% dos aminoácidos presentes nesta poliproteína, ou seja, verifica­se 20% a mais de aminoácidos hidrofílicos nela. Além disso, pelo baixo índice de instabilidade, verifica­se uma proteína estável(de acordo com o ProtParam). No caso da analogia da proteína original com a polyprotein [Kedougou virus], é observado modificações significativas na cadeia primária.

Secundária: Possui folhas Beta Pregueada e Alfa Hélice. Possui uma maior proporção de folhas Betas do que Alfas Hélices. O que normalmente infere a uma proteina mais estrutural do que motora.

Comparando com proteínas homologas pode ser perceber grande quantidade de ligações de Hidrogênio e algumas ligações disulfeto na parte mais externa da proteína.

Page 6: Trabalho de Bio Qui Mica

Terciária e Quaternária: A partir dos dados sobre os dados de hidrofobicidade, solubilidade, afinidade e simetria da proteína relacionar a estrutura com a função de forma mais clara o que explica essa sequência ser de uma proteína de envelope.

Analise do gráfico de hidrofobicidade: Ao interpretar esse gráfico, pode­se perceber que esta mesma proteína possui aminoácidos com pouca afinidade à agua e outros com muita afinidade. Dessa forma, é possível inferir que quanto maior a hidrofobicidade mais o aminoácido em questão estará internalizado (uma vez que ele possui aversão a água), e o inverso também é válido, quanto menos hidrofóbico mais exposto ele estará a água. Portanto, com esses dados identificamos a interação primaria de uma sequência com seu rearranjo espacial no estado enovelado.

Os picos de menos hidrofóbicos correspondem ao ”GRKQN” e o de mais é por volta “VLIVF”. Os aminoácidos encontrados no pico mais hidrofóbicos são aminoácidos com características hidrofóbicas. (Valina, Fenilalanina, Isoleucina, Leucina). Já os mais hidrofílicos também são coerentes aparecer aminoácidos com características hidrofílicas (Glicina, Glutamina, Asparagina) conjugados entre a Arginina e Lisina que são neutros.

Page 7: Trabalho de Bio Qui Mica

Análise do alinhamento genético Utilizando o alinhamento genético de 10 proteínas com graus de similaridade diferentes, variando entre 30% e 100%, podemos concluir que a compatibilidade das mesmas com a sequência dada para o trabalho se refere à proximidade da sequência em comparação com a mesma sequência mais próxima de cada proteína (há aproximadamente 3400 aminoácidos totais nas proteínas). Portanto, há nas proteínas utilizadas uma sequência que possui certo grau de semelhança a sequência dada para o trabalho, dessa maneira quanto maior o grau de similaridade mais idêntica será a sequência da proteína escolhida para a dada. >gi|969945757|gb|ALU33341.1| polyprotein [Zika virus] >gi|146411781|gb|ABI54475.1| polyprotein [Zika virus] >gi|380036386|gb|AFD30972.1| polyprotein [Zika virus] >gi|345132143|gb|AEN75264.1| polyprotein [Zika virus] >gi|647734798|gb|AIC06934.1| E protein [Zika virus] >gi|937349379|gb|ALI16232.1| envelope protein [Dengue virus 3] >gi|378532009|gb|AFC17395.1| envelope protein, partial [Japanese encephalitis virus] >gi|378532011|gb|AFC17396.1| envelope protein, partial [Japanese encephalitis virus] >gi|378532019|gb|AFC17400.1| envelope protein [Japanese encephalitis virus] >gi|126010839|ref|YP_001040007.1| polyprotein [Kokobera virus] >gi|54399540|gb|AAV34157.1| polyprotein [Kokobera virus] >gi|156754271|gb|ABU94629.1| polyprotein [Japanese encephalitis virus] >gi|682235344|gb|AIN36632.1| envelope protein [Japanese encephalitis virus]

Page 8: Trabalho de Bio Qui Mica
Page 9: Trabalho de Bio Qui Mica

Análise da árvore filogenética: Através da análise da árvore, considerando a distância entre os ramos e folhas em que estão localizadas as proteínas, podemos tirar diversas conclusões(hipotéticas). Uma delas, por exemplo, pode ser tirada através da localização da proteína da dengue( envelope protein[Dengue Virus 3] na árvore), se comparada com a localização da proteína presente no Zika virus(polyprotein [Zika virus]) pode­se notar que a distância entre os ramos e suas respectivas folhas é demasiadamente grande, e, se considerarmos que a árvore filogenética construida pode, através da distância entre os ramos, ser usada para comparação de distâncias evolutivas, pode­se concluir, que a proteína da dengue está muito distantemente relacionado com a do zika virus, ou seja, está à uma distância evolutiva muito grande, à medida que ambos estão, praticamente, em lados opostos da árvore filogenética.

Pode­se ainda, concluir hipoteticamente, que há uma relação bem estreita da poliproteína presente no zika vírus com a poliproteína do Spondweni vírus. E que estes compartilham um ancestral comum entre si mais recente do que com a do virus da dengue. Este, por sua vez, possui relações mais estreitas com o virus Kendougou, Stratford e Torres, do que com os outros listados na árvore filogenética; porém, o ancestral comum entre ele e todos estes outros virus(incluindo o do zika virus) é bem mais “velho” do que, por exemplo, o ancestral comum entre as proteínas do West Nile Virus e do Japanese encephalitis virus. Resumindo, se compara­se o vírus da dengue com o do zika(filogeneticamente)(como as comparações feitas pela mídia de que o vírus da zika é uma mutação do vírus da dengue); pode­se concluir, através da árvore filogenética, que, as proteínas destes virus possuem um ancestral comum bem “velho” e que estão relacionados de forma bem distante evolutivamente.

Construção do Modelo por Homologia da Proteína de Interesse:

O melhor template encontrado foi o 4gsx.1.A correspondente a proteína E do envelope do vírus da Dengue tipo 1. Mesmo possuindo apenas 57,7% de identidade com a poli proteína em questão, é a

Page 10: Trabalho de Bio Qui Mica

melhor sequência, pois cobre a melhor proporção dos aminoácidos (1­498) do Zika vírus. O modelo do template em questão correspondente a essa posição é a de (2­406). A parte não coberta pelo template é a região da proteína que tem a função de ancoragem. (coverage: 0.8) GMQE: 0.7 QMEAN4: ­3.26 X­ray, 1.90 Å Seq Similarity: 0.48