Download pdf - Dissertação Carolina Correções Norberto

Transcript

8/17/2019 Dissertação Carolina Correções Norberto

1/103

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE

PROGRAMA DE PÓS GRADUAÇÃO EM CIÊNCIAS FARMACÊUTICAS

DESENVOLVIMENTO E AVALIAÇÃO DE MEDICAMENTOS

PROSPECÇÃO IN SILICO DE COMPOSTOS

BIOATIVOS CONTRA MALÁRIA UTILIZANDO

MODELOS DE PREVISÃO DE ATIVIDADE BIOLÓGICA

NATAL - RN

2016
8/17/2019 Dissertação Carolina Correções Norberto

2/103

CAROLINA ARRUDA BRAZ

PROSPECÇÃO IN SILICO DE COMPOSTOS

BIOATIVOS CONTRA MALÁRIA UTILIZANDO

MODELOS DE PREVISÃO DE ATIVIDADE BIOLÓGICA.

Dissertação apresentada ao Programa de

Pós Graduação em Ciências Farmacêuticas

da Universidade Federal do Rio Grande do

Norte, como requisito para obtenção do título

de mestre em Ciências Farmacêuticas.

Área de Concentração: Desenvolvimento e

avaliação de Medicamentos

Orientador: Prof. Dr. Euzébio Guimarães

Barbosa

NATAL – RN

2016
8/17/2019 Dissertação Carolina Correções Norberto

3/103

CAROLINA ARRUDA BRAZ

PROSPECÇÃO IN SILICO DE COMPOSTOS

BIOATIVOS CONTRA MALÁRIA UTILIZANDO

MODELOS DE PREVISÃO DE ATIVIDADE BIOLÓGICA

Dissertação apresentada ao Programa de

Pós Graduação em Ciências Farmacêuticas

da Universidade Federal do Rio Grande do

Norte, como requisito para obtenção do título

de mestre em Ciências Farmacêuticas, pela

Banca examinadora, formada por:

Data de aprovação:

___/___/___

Presidente – Prof. Dr. Euzébio Guimarães Barbosa.

Menbro: Prof. Dr. Norberto de Kassio Vieira Monteiro.

Menbro: Prof. Dr. Davi Serradella Vieira.
8/17/2019 Dissertação Carolina Correções Norberto

4/103

Agradecimentos

Primeiramente ao meu orientador, o professor Euzébio pelas oportunidades

oferecidas durante o mestrado. Pelos conselhos, parceria e exemplos de postura de

pesquisador. Por transferir tanta calma e segurança que o mestrado passou

tranquilo. Que essa parceria possa perdurar por projetos futuros. E pela indicação de

jogos.

Aos meus colegas de laboratório, em especial ao Edjan, pelas ajudas mútuas nos

nossos respectivos projetos.

A toda equipe do Programa de Pós Graduação em Ciências Farmacêuticas.

A Sarah e Izadora, minhas amigas, conterrâneas de estágio e Mestrado. Pelas

angústias e aperreios compartilhados nessa vida acadêmica.

À minha família, Cristina, in memoriam Alberto e Max, por me acompanhar e

acreditar nessa jornada. Ao meus primos, em especial a Laura, por tantas vezesnegar essa viagem para Jeriquaquara.

Ao meu querido companheiro Magnus, pela companhia, por se estressar junto

comigo durante o processo de escrituras e me convencer sempre que eu consigo

entregar os documentos nos prazos.

E aos meus amigos por me aguentarem usar o diploma de cientista pra ganhardiscussões.
8/17/2019 Dissertação Carolina Correções Norberto

5/103

ÉPIGRAFE

“The nitrogen in our DNA, the calcium in our teeth, the iron in our blood, the carbon in our

apple pies were made in the interiors of collapsing stars

. We are made of starstuff.”

― Carl Sagan.

https://www.goodreads.com/author/show/10538.Carl_Saganhttps://www.goodreads.com/author/show/10538.Carl_Sagan
8/17/2019 Dissertação Carolina Correções Norberto

6/103

LISTA DE FIGURAS

Figura 1 Número de casos confirmados de malária mundialmente em 2014.

Figura 2 Casos confirmados de malária no Brasil em 2014

Figura 3 Ciclo de vida do Plasmodium no homem e mosquito.

Figura 4 Rota geral do metabolismo da hemoglobina no P. falciparum

Figura 5 Principais fármacos utilizados no tratamento da malaria

Figura 6 Representação de uma caixa cúbica utilizada para calcular descritores

MIF. A sonda utilizada para calcular as energias de interação está no

canto superior esquerdo.

Figura 7 Funcionamento esquemático do OPS. Figura 8 Exemplo de exibição espacial de descritores para a metodologia LQTA

e CoMFA. a) Representação descritores LJ e QQ em esferas. b) Mapas

de contorno obtidos por CoMFA

Figura 9 Mecanismo da quebra da ligação peptídica feita pelas proteases

aspárticas.

Figura 10 Estrutura cristalográfica da Plasmepsina.II.

Figura 11 Inibidores peptidiomiméticos das plasmepsinas.Figura 12 Pepstatina A e alofenilnorstatina.

Figura 13 Estrutura cristalina da Plasmepsina II (4CKU).

Figura 14 Etapas dos filtros virtuais .

Figura 15 Farmacóforo característico da série de compostos utilizada na

construção do modelo LQTA-QSAR. Anel de cinco membros tiazolidina

e os locais de possíveis substituições (R1, R2, R3 e R4)

Figura 16 Dendograma referente à análise de grupamentos hierárquicos para oconjunto de dados (a numeração dos compostos não corresponde a

numeração referente a tabela).

Figura 17 Alinhamento das melhores conformações obtidas pelo processo de

docagem automatizado.

Figura 18 Sitio ativo da Plm II com o Composto 33 (roxo) e ligante natural do cristal

(azul).

Figura 19 Composto 33 após adaptação do sítio ativo.

Figura 20 Melhor alinhamento após a adaptação do sitio ativo.

Figura 21 Resultado do filtro virtual referente ao tratamento dos descritores de LJ.
8/17/2019 Dissertação Carolina Correções Norberto

7/103

Figura 22 Resultados dos testes de validação LNO e y-randomization e a qualidade

de previsão do modelo.

Figura 23 Visualização dos descritores no sitio ativo da proteína.

Figura 24 Representação gráfica dos descritores do modelo final. Visões com os

compostos 33 (a) e 25 (b).

Figura 25 Composto 39 (pKi: 9,6), mais potente, em cinza e 27 (pki: 4,89) em

laranja.

Figura 26 Orientação do anel tiazolidina. Composto 33 (pki: 7,69) e 30 (pki: 5,03).

Figura 27 Mapas de contorno obtidos por Muthas (MUTHAS et al., 2005). A região

S1’ está assinalada pelo mapa verde, que representa região estérica

favorável para presença de grupos volumosos. Figura 28 Composto 39 (azul) com pKi: 9,7 e 25 (verde), pK i: 4,02. Em roxo os

resíduos de aminoácidos próximos aos descritores.

Figura 29 Composto 30 (verde) e 7 (vermelho) representando o pior e melhor perfil

para descritor QQ7.

Figura 30 A) Descritor QQ4 relacionado com substituintes alifáticos e cíclicos.

Compostos mais potente, 33 (roxo) com pK i de 7,69 e menos potente,

25 (azul) com pki de 4,01 foram usados como exemplo. B) Contribuiçãode interações eletronegativas negativas. Composto 9 em azul de pK i:

9,31 e 18, marrom de pKi: 6,14.

Figura 31 Esquema de interação das alofenilnorstatinas de acordo com o modelo

LQTA. Em vermelho, as regiões do sitio ativo da Plm II que cada porção

do inibidor interage.
8/17/2019 Dissertação Carolina Correções Norberto

8/103

LISTA DE TABELAS

Tabela 1. Candidatos a fármacos em estudos clínicos durante o ano de 2014

Tabela 2. Parâmetros estatísticos básicos para modelos de regressão

Tabela 3. Lista dos principais resíduos de aminoácidos e suas regiões respectivas

no sitio ativo da Plm II

Tabela 4. Conjunto de dados retirados da literatura

Tabela 5 Números de descritores iniciais e após casa processo de filtragem

virtual.

Tabela 6. Figuras de mérito para o modelo final obtido.
8/17/2019 Dissertação Carolina Correções Norberto

9/103

RESUMO

Estratégias de planejamento de fármacos auxiliadas por computador utiliza-se

de técnicas computacionais para auxiliar o descobrimento de novos fármacos.

Economizando custos e agilizando o processo de pesquisa e desenvolvimento, além

de poder processar uma quantidade grande de dados. A utilização da técnica do

LQTA-QSAR permite a criação de modelos de previsão de atividade biológica capazes

de sugerir estruturas inéditas sem a real necessidade de execução de teste de

atividade biológica in vitro ou in vivo. A malária é uma doença causada pelo parasito

do gênero Plasmodium e afeta principalmente as regiões da África e América Latina.

Estima-se que em 2014 ocorreram 214 milhões de caso de malária e 438 mil demortes de acordo com a Organização Mundial de Saúde. A enzima Plasmepsina II é

responsável pela clivagem inicial da hemoglobina e é um alvo validado para o

planejamento de novos agentes antimaláricos. O objetivo geral desse trabalho foi

desenvolver um modelo de previsão de atividade biológica baseado na relação

estrutura atividade de compostos inibidores da Plasmepsina II que possuem um

núcleo derivado de alofenilnostatinas. Foi criado um modelo de previsão com 37

amostras. O modelo PLS apresentou um Q² = 0,92 e R² = 0,95 com 10 variáveis e 2variáveis latentes. O modelo apresentou bons parâmetros estatísticos e boa

capacidade preditiva (Q² ext = 0,79) Os descritores também estão corroboram com a

interação dos inibidores com sítio receptor da Plm II. Os dados obtidos servem como

guia para o planejamento de novos antimaláricos com maior potência.
8/17/2019 Dissertação Carolina Correções Norberto

10/103

ABSTRACT

Strategies for drug design aided by computer uses of computational techniques

for guidance on the discovery of new drugs. Saving costs and speeding the process of

research and development, besides it being able to process a big volume data. The

utilization of LQTA-QSAR allows the creation of predicting models of biological activity

able to propose novel compounds without the real necessity of in vitro biological activity

essays. Malaria is a disease caused by the parasite from genre Plasmodium and

affects mainly the Africa and Latin America regions. It is estimated that in 2014 it

happened 214 million cases of malaria and 438 thousand cases of death according to

World Health Organization. Plasmepsin II is responsible for the metabolism ofhemoglobin and it is a valid target for the development of new antimalarial agents. The

general objective of this work is to develop a predictive model of biological activity

based on the structure of Plasmepsin II inhibitors derivate from allophenylnorstatine.

A model was built with 37 samples, Q² = 0.92 and R² = 0.95 with 10 variables and 2

latent variables. The model present good statistical parameters and good predicting

ability (Q²ext=0.79). The descriptors could be well correlated to ligand-Plm II

interactions. The data obtained serves as guides to the design of new optimizedantimalarial agents.
8/17/2019 Dissertação Carolina Correções Norberto

11/103

SUMÁRIO

1. INTRODUÇÃO .........................................................................................................................................13

1.1 MALÁRIA................................................................................................................................................. 13

1.1.1 Aspectos Epidemiológicos. .............................................................. ................................................. 13

1.1.2 Ciclo evolutivo ............................................................ .............................................................. ........ 16

1.1.2.1 Degradação da hemoglobina. .................................................................................................................18

1.1.3 Tratamento / Quimioterapia e Resistência. .......................................................... ........................... 19

1.1.4 Resistência ....................................................................................................................................... 22

1.2 DESCOBERTA DE FÁRMACOS........................................................................................................................ 23

1.2.1 Ferramentas computacionais para o desenvolvimento de fármaco........................................ ........ 24

1.2.2 QSAR-4D .......................................................................................................................................... 25

1.2.3 Descritores moleculares de interação. ....................................................... ...................................... 28

1.2.4 Validação dos modelos de LQTA-QSAR ................................................................ ............................ 29

1.3 APLICAÇÃO DO LQTA-QSAR PARA ALVOS E INIBIDORES DE PROTEÍNA DE P. FALCIPARUM ....................................... 31

1.3.1 Plasmepsina II do Plasmodium falciparum. .......................................................... ........................... 31

1.3.2 Inibidores da Plasmepsina II : alofenilnorstatinas. .......................................................................... 34

2 OBJETIVOS ..............................................................................................................................................37

2.1 OBJETIVOS ESPECÍFICOS ........................................................ .............................................................. ........ 37

3 MATERIAL E MÉTODOS ...........................................................................................................................38

3.1 MATERIAL ............................................................................................................................................... 38

3.1.1 Computadores. ................................................................................................................................ 38

3.1.2 Conjunto de dados ........................................................................................................................... 38

3.1.3 Receptor .......................................................... ................................................................. ................ 38

3.2 METODOLOGIA ........................................................ ................................................................. ................ 39

3.2.1 Padronização do conjunto de dados e preparo das estruturas tridimensionais. ............................. 39

3.2.2 Adaptação do sítio ativo ................................................................. ................................................. 40

3.2.3 Dinâmica molecular .............................................................. ........................................................... 41

3.2.4 Geração do modelo 4D LQTA-QSAR ........................................................... ...................................... 41

3.2.4.1 Filtros virtuais ..........................................................................................................................................42

3.2.4.2 Seleção de variáveis ................................................................................................................................43

3.2.5 Validação do modelo ....................................................................................................................... 43

3.2.5.1 Leave-N-out e y-randomization ...............................................................................................................43

4 RESULTADOS E DISCUSSÕES. ..................................................................................................................45

4.1 CARACTERIZAÇÃO DO CONJUNTO DE DADOS. .......................................................................................... ........ 45 4.2 DIVISÃO DO CONJUNTO DE DADOS PARA A CONSTRUÇÃO DO MODELO LQTA-QSAR .............................................. 51

4.3 ADAPTAÇÃO DO SÍTIO ATIVO........................................................................................................................ 51
8/17/2019 Dissertação Carolina Correções Norberto

12/103

4.4 4D LQTA-QSAR ..................................................................................................................................... 55

4.5 INTERPRETAÇÃO DOS DESCRITORES. ............................................................. ................................................. 58

5 CONCLUSÕES E PERSPECTIVAS. ..............................................................................................................68

6 REFERÊNCIAS ..........................................................................................................................................69

7 ANEXOS ..................................................................................................................................................76

7.1 ANEXO 1. SCRIPT PARA TRATAR A MATRIZ DE DESCRITORES DO OPEN3DQSAR ..................................................... 76

7.2 ANEXO 2. SCRIPT REALIZADO PARA A REALIZAÇÃO DOS FILTROS VIRTUAIS NO MATLAB. ........................................... 76

7.3 ANEXO 3. TABELA COM A REGRESSÃO PLS PARA O MELHOR MODELO 4D LQTA-QSAR ......................................... 78

7.4 ANEXO 4. ARQUIVO PDB DAS COORDENADAS DOS DESCRITORES. ........................................................ ................ 80

7.5 ANEXO 5. ARTIGO ............................................................... ................................................................. ..... 81
8/17/2019 Dissertação Carolina Correções Norberto

13/103

13

1. INTRODUÇÃO

1.1 Malária.

Os agentes etiológicos da malária são protozoários eucariotos unicelulares

pertencentes ao filo Apicomplexa, da família Plasmodiidae e ao gênero Plasmodium,

onde as espécies P. falciparum, P. vivax , P. malariae, e P. ovale são conhecidas por

causarem a doença. A malária é transmitida pela picada da fêmea do mosquito

Anopheles, compartilhamento de agulhas e seringas infectadas, transfusão de

sangue, ou da gestante para o bebê antes ou durante o parto. Os principais sinais

clínicos são febre alta, calafrio, sudorese e cefaleia. (MINISTÉRIO DA SAÚDE, 2010).

Apesar de na maioria dos casos a malária não apresentar um risco à vida, sua

manifestação em mulheres grávidas e crianças é de extremo perigo. A espécie P.

falciparum é a mais virulenta das formas de malária humana e é o principal causador

de casos relatados de mortes em crianças, além de ser a única capaz de evoluir para

malária cerebral (SNOW; KORENROMP; GOUWS, 2004).

A resistência crescente à terapia atual (WHITE et al., 1999) e enquadramento

da malária como uma doença negligenciada (BRASIL, 2008) denota a importância na

pesquisa em inovação para o planejamento de novos candidatos as fármacos

antimaláricos. De fato, as técnicas de modelagem molecular vem demonstrando umpapel importante na descoberta de candidatos a fármacos antimaláricos (BARMADE

et al., 2015).

O custo de realização desse tipo de projeto é puramente computacional, e por

isso, bastante reduzido e seus resultados podem minimizar despesas desnecessárias

na síntese dos compostos ativos. O uso de altos níveis da teoria quântica molecular é

mínimo nesse tipo de estudo, barateando ainda mais o custo computacional por

molécula investigada nos estudos QSAR. Dessa forma, com estações de trabalho,embora modestas, gera-se em tempo hábil resultados empíricos que podem ser

utilizados diretamente na triagem de novos compostos bem como na proposição de

estruturas químicas com possível atividade in vitro e in vivo.

1.1.1 Aspectos Epidemiológicos.

De acordo com a OMS (Organização Mundial da Saúde) a malária é uma doença

que põe em risco cerca de 3,2 bilhões de pessoas – quase metade da populaçãomundial. Estima-se que em 2015 ocorreram 214 milhões de casos de malária e 438
8/17/2019 Dissertação Carolina Correções Norberto

14/103

14

mil mortes. Felizmente, este é um número decrescente, nos últimos 15 anos a

incidência de casos de malária diminuiu 37% mundialmente. Os casos de morte,

também no mesmo período, diminuíram 60% em todas as idades. A África continua

sendo a região de maior incidência, com 89% dos casos mundiais (Figura 1). Apesar

da maioria dos casos se concentrarem na África, também há grande incidência de

casos de malária na Ásia, América Latina e parte do Oriente Médio (DALRYMPLE;

MAPPIN; GETHING, 2015; WHO, 2015).

Figura 1. Número de casos confirmados de malária em 2014.

Fonte: Global Malaria Mapper (Disponível em: < http://www.worldmalariareport.org>).

Para região da América Latina a quantidade de casos confirmados de malária

diminuiu de 1,2 milhões de casos no ano de 2000 para 390 mil casos em 2014. Ainda

no ano de 2014, foi reportado somente 79 casos de morte por malária, uma diminuição

de 80% dos casos quando comparados com os últimos 14 anos. O Brasil contabiliza

quase metade dos casos de mortes na região (WHO, 2015).

A malária transmitida através da picada de fêmeas do mosquito Anopheles spp.

Existem cerca de 400 espécies de Anopheles no mundo, onde somente 60 sãopossíveis vetores da malária e destes, 30 de maior importância epidemiológica. Nas
8/17/2019 Dissertação Carolina Correções Norberto

15/103

15

Américas, ocorrem principalmente as espécies Anopheles darlingi , Anopheles

aquasalis, Anopheles albimanus e Anopheles pseudopunctipennis. No Brasil, o

principal vetor é o A. darlingi  (REY, 2011).

No Brasil, 99% dos casos de malária estão restritos à Amazônia Legal (Figura

2), totalizando cerca de 310 mil novos casos por ano, quase todos os casos s

causados pelo P. vivax (OLIVEIRA-FERREIRA et al., 2010). Apesar da baixa

incidência, quando comparada ao continente africano, o quadro endêmico nesta

região representa gastos substanciais para o Sistema Único de Saúde (SUS),

chegando a aproximadamente US$ 72 milhões apenas em 2014 (WHO, 2015).

Na Amazônia, a diminuição da incidência de casos por P. falciparum está

correlacionada a melhoras no diagnóstico. É provável também que a adição daassociação arterméter + lumefantrina à terapia no estado de Manaus e outros

municípios também contribuiu para a diminuição da incidência do P. falciparum. O

crescimento do número de casos de P.vivax  pode ser explicado pela compensação

de comorbidades aguda ou crônica da malária (SAMPAIO et al., 2015).

Figura 2. Casos confirmados de malária no Brasil em 2014.

Fonte: adaptado de (WHO,2015).

Na Amazônia, a diminuição da incidência de casos por P. falciparum está

correlacionada com melhorias na agilidade do diagnóstico. É provável também que a

adição do tratamento medicamentoso associação arterméter + lumefantrina no estado

de Manaus e outros municípios também contribuiu para a diminuição da incidência do

P. falciparum. O crescimento do número de casos de P.vivax  pode ser explicado pela

compensação de comorbidades agudas ou crônicas da malária (SAMPAIO et al.,

2015).
8/17/2019 Dissertação Carolina Correções Norberto

16/103

16

1.1.2 Ciclo evolutivo

O Plasmodium possui um ciclo biológico complexo, dividido em três etapas:

ciclo hepático, ciclo eritrocitário e ciclo esporocogônico. O seu desenvolvimento ocorre

envolvendo um hospedeiro invertebrado ( Anopheles) nas fases sexuadas e um

hospedeiro vertebrado no ciclo assexuado. O processo evolutivo do parasita requer a

expressão de proteínas, importantes para sua sobrevivência tanto no hospedeiro

invertebrado como vertebrado. (TUTEJA, 2007). A Figura 3 (próxima página)

apresenta as etapas envolvidas no ciclo de vida do Plasmodium spp.

Os esporozoítos (forma infectante), localizados nas glândulas salivares do

mosquito Anopheles, são inoculados no hospedeiro vertebrado durante a picada do

mosquito. Estas formas alcançam as células hepáticas em média de 30 a 60 minutos

após a picada (REY, 2013; TUTEJA, 2007). Antes que ocorra a infecção dos

hepatócitos, há a possibilidade dessas formas entrarem em diferentes células, sem

que ocorra o desenvolvimento. Os esporozoítos apresentam motilidade graças a

reorientação de proteínas de superfícies e de proteínas adesivas, que são essenciais

para invasão das células hospedeiras (BRAGA; FONTES, 2005; MOTA et al., 2001).

Os esporozoítos transformam-se em criptozoítos, que são estruturas

arredondadas que crescem e iniciam o ciclo de reprodução assexuada. Apósnumerosas divisões nucleares passa a constituir um esquizonte. No P. falciparum, a

fase esquizogonia pré-eritrocítica dura 6 dias, enquanto que em P. vivax dura 8 dias.

Essa é a primeira fase do ciclo, denominada exoeritrocítica, antecedendo o ciclo

sanguíneo (REY, 2013).

Em infecções causadas por P. falciparum e P. malariae, os esquizontes se

rompem todos ao mesmo tempo e não persistem no interior dos hepatócitos. Já no P.

ovale e no P. vivax , algumas formas exo eritrocı ́ticas, denominadas hipnozoı ́taspermanecem latentes no fígado, e parecem ser responsáveis pelas recidivas tardias

da doença (BRAGA; FONTES, 2005).

O ciclo eritrocítico se inicia quando os esquizontes localizados nas células

hepáticas dão origem aos merozoítos, que são liberados após o rompimento da célula

parasitada. Os merozoítos invadem as hemácias iniciando ciclo eritrocítico, onde se

desenvolvem e multiplicam por divisão binária até romperem a célula e serem

liberados na corrente sanguínea para infectar novamente outras hemácias (REY,

2013). Para o P. falciparum o ciclo sanguíneo se repete a cada 48 horas (NEVES,

2005).
8/17/2019 Dissertação Carolina Correções Norberto

17/103

17

Figura 3. Ciclo de vida do Plasmodium no homem e mosquito.

Fonte: adaptado de (ERSMARK; SAMUELSSON; HALLBERG, 2006)

Os merozoítos podem também se diferenciar em estágios sexuados,

gametócitos femininos (macrogametócitos) e masculinos (microgametócitos) que irão

dar início ao ciclo sexuado (esporogônico) no vetor. O inseto, após se alimentar de

sangue infectado pode ingerir esses gametócitos. Estes gametas se fundem e formam

um zigoto. O zigoto se diferencia em oocineto, que por sua vez migra até o intestinodo inseto e dá origem a um oocisto. O oocisto maduro libera estes esporozoítos que
8/17/2019 Dissertação Carolina Correções Norberto

18/103

18

migram para as glândulas salivares, podendo infectar outros seres humanos.

Retomando assim, o ciclo (DOUGLAS et al., 2015; TUTEJA, 2007).

O período de incubação da doença varia de 7 a 14 dias, podendo, contudo,

chegar a vários meses devido às formas latentes de P. vivax e P. malariae. A crise

aguda caracteriza-se por episódios de febre, calafrios, tosse, dificuldade respiratória,

dor nas articulações, dor de cabeça, diarreia, vômitos e convulsões. Os intervalos

entre as febres acompanham os ciclos repetidos de obstrução dos eritrócitos,

repetindo-se a cada 48 horas para infecções por P. vivax e P. falciparum e de 72 horas

para infecções causadas pelos demais parasitos (TUTEJA, 2007).

A gravidade do quadro clínico da malária depende da espécie do parasito, da

quantidade de parasitos circulantes, do tempo de doença e do nível de imunidadeadquirida pelo paciente. O P. falciparum está sempre associado a quadros graves,

acarretando em complicações clínicas como icterícia, insuficiência renal, anemia

grave e obstrução dos capilares que levam sangue ao cérebro (SNOW;

KORENROMP; GOUWS, 2004; TUTEJA, 2007).

1.1.2.1 Degradação da hemoglobina.

O parasita degrada a hemoglobina (Hb) nas células eritrocíticas do hospedeirodurante fases morfológicas distintas do seu ciclo evolutivo (esquizonte e trofozoíta). A

atividade metabólica varia muito entre as fases e é mais intensa durante o estágio

trofozoita (GOLDBERG, 1993). A hemoglobina, uma proteína tetramérica com ~64k

Da, é metabolizada pelas enzimas do parasito. Esses aminoácidos obtidos da

metabolização são utilizados para biossíntese de proteínas do próprio Plasmodium.

Ajudando a manter a osmolaridade intracelular durante esta fase de crescimento

intenso (MOURA; DAME; FIDOCK, 2009).O P.falciparum digere mais de 80% da hemoglobina do eritrócito, para nutrir o

parasito durante sua fase de crescimento e replicação assexuada na fase eritrocítica.

(LAZARUS; SCHNEIDER; TARASCHI, 2008). A degradação da hemoglobina ocorre

via proteases dentro do vacúolo digestivo do parasita e a sua internalização ocorre

por meio do citostoma, uma invaginação da membrana externa do vacúolo (MILANI;

SCHNEIDER; TARASCHI, 2015). A hematina livre é potencialmente tóxica tanto para

o parasito quanto seu hospedeiro, devido a sua atividade membranotropica. Para

bloquear essa toxicidade o Plasmodium sequestra a hematina na forma do pigmento

malárico cristalizado e insolúvel, hemozoina (AZOUZI; EL KIRAT; MORANDAT,
8/17/2019 Dissertação Carolina Correções Norberto

19/103

19

2015). Fármacos como cloroquina, se acumulam no vacúolo digestivo e interferem

neste processo (SCHOLL; TRIPATHI; SULLIVAN, 2005). As quinolinas agem

interferindo no processo de transformação da hematina (GOLDBERG, 1993).

O processo de degradação apresenta uma cascata ordenada de reações

(Figura 4). Várias enzimas são atribuídas ao processo de degradação, no P. falciparm

são as proteases aspárticas (Plasmepsinas (Plm) – I, II, IV e HAP), falcipainas,

metaloproteases (falcilisina) e dipeptil aminopeptidases (DPAP 1). A clivagem inicial

se dá nos resíduos Phe33 e Leu34 na cadeia A da hemoglobina, região do domínio

responsável por manter a estabilidade da estrutura quaternária. A clivagem

subsequente da Hb em peptídeos menores é realizada pelas proteases plasmepsinas

e falcipainas. Esses peptídeos menores são então clivados pela falcilisina, DPAP 1 eaminopeptidases formando os aminoácidos que são aproveitados pelo Plasmodium.

(ERSMARK; SAMUELSSON; HALLBERG, 2006).

Figura 4. Rota geral do metabolismo da hemoglobina no P. falciparum.

Fonte: adaptado de (ERSMARK, 2006).

1.1.3 Tratamento / Quimioterapia e Resistência.

O tratamento da malária deve tanto prevenir a ocorrência de casos graves

quanto eliminar fontes de infecção para os mosquitos. Tratamento e diagnósticoadequado tem grande contribuição para redução e erradicação da doença, mas
8/17/2019 Dissertação Carolina Correções Norberto

20/103

20

enfrentam grandes dificuldades frente a não existência de uma única terapia eficaz

contra as quatro espécies parasitárias que infectam o ser humano. Além da crescente

resistência do P. falciparum aos esquemas terapêuticos utilizados (BRASIL, 2010).

A conduta terapêutica na utilização dos fármacos antimaláricos deve levar em

consideração a tolerabilidade, segurança e tratamento com regimes de curta duração.

Atualmente se preconiza o uso de associações entre antimaláricos com mecanismos

de ação distintos, tornando o tratamento mais efetivo e evitando a expansão dos casos

de resistência (GINER ALMARAZ et al., 2010; PETERSEN; EASTMAN; LANZER,

2011).

Os fármacos antimaláricos são compostos naturais ou sintéticos. Os

antimaláricos eritrocíticos atuam nas formas presentes nas células sanguíneas dohomem enquanto que os antimaláricos gametocíticos atuam nas formas sexuadas do

parasita no individuo, com o intuito de evitar a disseminação da doença caso o

indivíduo seja picado (GRIMBERG; MEHLOTRA, 2011). Grande parte dos fármacos

utilizados na rotina como antimaláricos são denominados esquizonticidas sanguíneos,

porque apresentam ação sobre os estágios assexuados sanguíneos do parasita

responsáveis pelas manifestações clínicas (BIAMONTE; WANNER; LE ROCH, 2013;

PRAZERES et al., 2007).Os medicamentos antimaláricos podem ser classificados de acordo com seu

grupo químico (Figura 5) : 4-aminoquinolinas (cloroquina e amodiaquina), aril-

aminoálcoois (quinina, mefloquina, halofantrina e lumefantrina), 8-aminoquinolinas

(primaquina), peróxido de lactona sesquiterpênica (derivados da artemisinina),

naftoquinonas (atovaquona) e os antibióticos (tetraciclina, doxiciclina e

clindamicina)(BRASIL, 2010). A primeira terapia amplamente utilizada para as quatro

espécies do parasita que causam a malária foi a quinina e seus derivados sintéticos,desde o século XVII. Na segunda metade do século XX, a cloroquinolona foi utilizada

como medicamento de primeira linha para o tratamento das quatro espécies de

Plasmodium e uma combinação de sulfadoxina e pirimetamina como tratamento de

segunda escolha (WELLS; ALONSO; GUTTERIDGE, 2009).

No Brasil, o esquema terapêutico para casos não complicados de malária são

realizado com cloroquina e primaquina, para infecções pelo P. falciparum usa-se a

combinação de artemeter+lumefantrina e artesunato+mefloquina e o tratamento de

segunda escolha é realizado com quinina, doxiclina e primaquina (BRASIL, 2010).

Comumente, a terapia da malária é utilizada em associação com outros
8/17/2019 Dissertação Carolina Correções Norberto

21/103

21

quimioterápicos, como sulfonamidas (sulfadoxina), tetraciclinas (tetraciclina,

doxicilina) e lincosaminas (clindamicina e lincomicina), mas o seu uso apresenta

inconvenientes como administração de regimes complexos e rígidos e muitos efeitos

colaterais. O que contribui para interrupção do tratamento e o consequente

desenvolvimento de resistência do parasita (PIMENTEL et al., 2007).

Figura 5. Principais fármacos utilizados no tratamento da malária
8/17/2019 Dissertação Carolina Correções Norberto

22/103

22

Fonte: elaborado pelo autor

O aparecimento de cepas multirresistentes aos fármacos antimaláricos

disponíveis tem impulsionado a pesquisa de novos fármacos. A Tabela 1 ilustra osprincipais candidatos a fármacos em fase clínica de desenvolvimento no ano de 2014.

É possível observar que a maioria dos candidatos são novas associações de

medicamentos, ou mudança de formulação, ou adequação de doses para pacientes

pediátricos (MMV, 2014) ou reproposição de outras terapias (KUNDU et al., 2015).O

que não sana a real necessidade apontada pelo surgimento de cepas resistentes a

maioria das terapias atuais, que é o planejamento e desenvolvimento de novas

moléculas.

Tabela 1. Candidatos a fármacos em estudos clínicos durante o ano de 2014.Fase I Fase II Fase III Fase IV Registro

DSM 265

(Takeda)

OZ439/PQ

(Sanofi)

Tafenoquina

(GSK)

Artesunato

retal

Artesunato

injetável (Guilin)

MMV 048

(UCT/TIA)

Ferroquina

(Sanofi

Aventis )

co-

trimoxazol( in

stituto

Medicina

Tropical)

Pironaridina/Ar

tesunato

pediátrico

(Shin Poong)

ACT (Sigma –

Tau)

P218 (Novatis ) KAE609

( Novartis )

ASAQ (Sanofi

Aventis/DNDi)

GSK030

(GSK)

KAF156

( Novartis)

Pironaridina/Art

esunato

(Shin Poong)Fonte: adaptado de (MMV, 2014).

1.1.4 Resistência

A partir da década de 90 estudos já apontavam para a resistência global à

múltiplos fármacos pelo P.falciparum nos casos agudos de malária (WHITE et al.,

1999). Terapias combinadas a base de artemisinina são utilizadas atualmente nos

programas de controle globais em resposta a resistência do P .falciparum (MAZIER;RÉNIA; SNOUNOU, 2009). A descoberta de parasitas com diminuição da
8/17/2019 Dissertação Carolina Correções Norberto

23/103

23

sensibilidade a artemisinina (WELLS, 2010), os efeitos colaterais da atual terapia

medicamentosa e a ausência de vacinas efetivas (HOFFMAN et al., 2015; LONGLEY;

HILL; SPENCER, 2015; RICHIE; SAUL, 2002) denotam a necessidade da busca por

novos alvos terapêuticos e do desenvolvimento de uma nova geração de fármacos

para o tratamento, controle e erradicação da malária (WELLS; VAN HUIJSDUIJNEN;

VAN VOORHIS, 2015).

O principal mecanismo de resistência à cloroquina está relacionado com

mutações no gene Plasmodium falciparum cloroquine resistance transporter (PFCRT),

que permite alterações nos transportadores de membrana. Polimorfismo no gene

Plasmodium falciparum multidrug resistance I (PFMDRI) estão relacionados a

resistência a quinina e mefloquina. Mutações no gene Citocromo b conferemresistência a atovaquona, que acarretam em mutações no sitio ativo da enzima alvo,

diminuindo a afinidade de ligação do fármaco (ARAV-BOGER; SHAPIRO, 2005) .

Mutações nos genes das enzimas diidrofolato redutase (DHFR) e diidropteroato

sintetase (DHPS) estão associados a resistência a pirimetamina e sulfadoxina,

respectivamente, para o P.falciparum (BASCO; RINGWALD, 1998). A resistência a

artemisinina está relacionada a uma maior expressão do gene PFMDR I (AFONSO et

al., 2006) e a resistência ao artesunato está relacionada a uma mutação no gene daubiquitina (HUNT et al., 2007).

1.2 Descoberta de Fármacos.

A descoberta e o desenvolvimento de fármacos pode ser dividida em três fases.

A fase de descoberta, na qual ocorre a identificação e validação do alvo,

desenvolvimento de ensaios, identificação e otimização de compostos protótipos e

seleção de candidatos a fármacos. Fase de estudos pré-clínicos, onde sãoexecutados estudos extensos em animais. Fase de desenvolvimento clínico: durante

a qual o composto selecionado é testado quanto à eficácia, efeitos colaterais e riscos

potenciais em humanos (NWAKA; RIDLEY, 2003). O processo de pesquisa e

desenvolvimento de fármacos, então, consiste e uma etapa de descoberta (pesquisa)

e desenvolvimento (ensaios pré-clínicos e clínicos) (ELEBRING; GILL; PLOWRIGHT,

2012).
8/17/2019 Dissertação Carolina Correções Norberto

24/103

24

1.2.1 Ferramentas computacionais para o desenvolvimento de fármaco.

O planejamento de novos candidatos a agentes terapêuticos e otimização

destes pode ser obtido por diferentes estratégias da Química Medicinal. A escolha da

estratégia a ser adotada depende da elucidação da estrutura do alvo (BARREIRO,

2009). A utilização de métodos computacionais no processo de pesquisa e

desenvolvimento de novos fármacos é uma área de destaque nos últimos anos. O

conhecimento das estruturas de alvos macromoleculares ou de complexos ligante-

receptor permite a aplicação de estratégias de planejamento de fármacos baseado na

estrutura (SBDD - Structure-based Drug Design) (COHEN, 1996).

Pela exploração de bancos de dados que compilam informações sobre testes

biológicos em alvos proteicos podem ser construídos modelos de previsão da

atividade biológica a partir da relação quantitativa da atividade destes compostos com

a sua estrutura (QSAR – Quantitative Structure-Activity Relationship) (VERMA;

KHEDKAR; COUTINHO, 2010). A metodologia de QSAR foi inicialmente estabelecida

na década de 1960, pelos trabalhos de Hansch e Fujita (HANSCH; FUJITA, 1964). O

QSAR desempenha um papel vital no design de novos fármacos, já que se trata de

uma metodologia que permite um custo baixo, processamento rápido e diminuição daquantidade de amostras in vitro geralmente envolvidas (PATEL et al., 2014).

O objetivo do estudo QSAR é a criação de modelos capazes de prever a

atividade ou propriedade e explicar as relações entre características estruturais

específicas (descritores moleculares) e atividade biológica ou propriedade. Métodos

estes que já se tornaram uma parte essencial do desenvolvimento de novas moléculas

na atualidade. Atualmente, nenhum fármaco é criado sem a análise por QSAR

(ANDRADE et al., 2010).Métodos de QSAR são classificados de acordo com a dimensionalidade dos

descritores utilizados, estabelecendo quantitativamente a correlação entre

propriedades da estrutura química das moléculas e a atividade biológica. Assim, são

desenvolvidos modelos matemáticos capazes de prever a atividade biológica de

moléculas, através de um conjunto de dados (HANSCH; FUJITA, 1964).

Diferentes tipos de descritores químicos refletem diferentes níveis de

representação estrutural. Esses descritores podem ser classificados quanto à sua“dimensionalidade”: unidimensionais (1D), baseados em propriedades físico-químicas

e da fórmula molecular (ex., massa molecular, refratividade molar, logP, entre outros);
8/17/2019 Dissertação Carolina Correções Norberto

25/103

25

bidimensionais (2D), que descrevem propriedades que podem ser calculadas de uma

representação 2D (ex., número de átomos, número de ligações, índices de

conectividade, entre outros); e tridimensionais (3D), que dependem da conformação

das moléculas (ex., volume de Van der Waals, área de superfície acessível ao

solvente, entre outros) (XUE; BAJORATH, 2000).

1.2.2 QSAR-4D

A análise de QSAR-4D, proposta inicialmente por Hopfinger e colaboradores

(HOPFINGER et al., 1997) incorpora a liberdade conformacional com o alinhamento

para o desenvolvimento de modelos QSAR-3D levando em conta, então uma quarta

dimensão para os descritores moleculares. Nessa abordagem, os valores dos

descritores são as ocupações medidas para os átomos que compõe as moléculas do

conjunto investigado a partir da amostragem de conformação e do espaço de

alinhamento (ANDRADE et al., 2010).

Uma nova abordagem de QSAR-4D, desenvolvida pelo grupo Laboratório de

Quimiometria Teórica e Aplicada (LQTA – Unicamp) é baseado na geração de um

perfil de amostragem conformacional para cada composto. Ao invés de somente uma

conformação seguindo os princípios do QSAR-3D (KUBINYI, 1997). Esse perfilconformacional é seguido para os cálculos de descritores 3D (MIFF - Molecular

Interaction Fields ou descritores de interação molecular).

Essa metodologia contempla simultaneamente, as principais características do

método CoMFA (Comparative Molecular Field Analisys). Técnica desenvolvida por

Cramer que demonstra que a propriedade biológica dos compostos pode ser

correlacionada com as energias estéricas e eletrostática (descritores MIF)

provenientes das interações formadas com o ligante no sítio ativo do alvo biológico(CRAMER; PATTERSON; BUNCE, 1988) e o QSAR-4D (HOPFINGER et al., 1997).

Essas metodologias de QSAR-3D e 4D apresentam alguns problemas. No

QSAR-3D realizado pelo CoMFA, o fato da conformação bioativa não ser conhecida

acarreta ao usuário fazer a escolha de uma única conformação para cada molécula

(geralmente a conformação bioativa). Em QSAR-4D a ausência dos descritores de

interação dificultam a interpretação dos modelos obtidos (GHASEMI; SAFAVI-SOHI;

BARBOSA, 2012). Aliás, não existe programas livres que possibilite a geração dedescritores para essas duas metodologias. Existe uma versão gratuita do programa,

Open3DQSAR (TOSCO; BALLE, 2011), mas para utilizar o CoMFA é necessário
8/17/2019 Dissertação Carolina Correções Norberto

26/103

26

adquirir a versão do programa pago. Para usar o QSAR-4D, é necessário adquirir uma

licença colaborativa com o grupo do Hopfinger.

O LQTA-QSAR faz uso do pacote livre GROMACS (VAN DER SPOEL et al.,

2005) para calcular as simulações de dinâmicas moleculares (MD) e estimar o perfil

conformacional gerado. As simulações de MD podem ser desenvolvidas considerando

moléculas de solvente explicito, que gera aproximações biológicas mais precisas (mas

aumenta o custo computacional) ou com solvente implícito, menos dispendioso.

O programa open3DQSAR gera ao redor do alinhamento de todas as estruturas

uma caixa virtual cúbica (grid) (Figura 6). A energia de interação para cada tipo de

campo de interação molecular (descritores estéricos e eletrostáticos) para onde, onde

em casa canto do grid, as interações entre uma sonda e cada moléculas sãocalculadas (PATEL et al., 2014; TOSCO; BALLE, 2011).

A geração de descritores MIF pelas metodologias de QSAR 3D geram uma

quantidade exorbitante de descritores. O número total de variáveis disponíveis é muito

maior do que o número que será efetivamente incluído nos modelos, incluindo ruído e

informações redundantes ou irrelevantes (TEÓFILO; MARTINS; FERREIRA, 2009a).

O objetivo da seleção de variáveis é diminuir o volume de processamento de data e

melhorar a performance preditiva do modelo(ARAKAWA; HASEGAWA; FUNATSU,2007; GONZÁLEZ et al., 2008).

Figura 6. Representação de uma caixa cúbica utilizada para calcular descritores MIF. A sonda utilizada para calcular as energias de interação está no canto superioresquerdo.

Fonte: (RONCAGLIONI; BENFENATI, 2008).
8/17/2019 Dissertação Carolina Correções Norberto

27/103

27

O algoritmo de seleção de preditores ordenados (OPS) (TEÓFILO; MARTINS;

FERREIRA, 2009a) foi desenvolvido para realizar esta seleção das variáveis. A

seleção com algoritmo OPS é realizada através do programa QSARModelling(Disponível em: < http://lqta.iqm.unicamp.br/programasOPS.html>) (MARTINS et al.,

2009). A regressão multivariada para construir o modelo é feita com o método de PLS

( partial least squares).

O OPS visa melhorar a qualidade dos modelos de regressão, removendo

descritores que possuem baixa capacidade de prever a atividade biológica. Para isso

é feito um ordenamento dos descritores utilizando um vetor informativo. Esse vetor

informativo pode ser a correlação destes descritores com a atividade biológica, oumesmo os valores de regressão multivariada (vetor de regressão do PLS). Os modelos

são construídos com um determinado número de descritores (janela inicial) e

posteriormente tal janela é aumentada de um incremento fixo até que todas os

descritores ou uma porcentagem do total sejam adicionadas a esta. O conjunto de

variáveis que apresentarem os melhores parâmetros de qualidade contém as

variáveis que apresentam a melhor capacidade de previsão para o modelo construído

e, portanto, são estas as variáveis selecionadas (TEÓFILO; MARTINS; FERREIRA,

2009a). A Figura 7 mostra um esquema do algoritmo OPS.

Figura 7. Funcionamento esquemático do OPS.

Fonte : adaptado de (TEÓFILO; MARTINS; FERREIRA, 2009a).
8/17/2019 Dissertação Carolina Correções Norberto

28/103

28

1.2.3 Descritores moleculares de interação.

Na metodologia QSAR-3D a energia de interação de um átomo de prova ou

fragmento molecular (sonda) com cada molécula em uma conformação alinhada écalculada em ponto de uma grade e constitui os descritores chamados de campo de

interação molecular (MIF, molecular interacion fields) (CRUCIANI, 2006).

As energias de interação mais empregadas são as de van der Waals e

Coulomb, calculadas por funções comuns aos campos de força moleculares, como o

potencial de Lennard-Jones (LJ) (2) e o potencial de Coulomb (1), respectivamente.

∑ = (1) ∑ −6 = (2)

Onde E QQ e a E vdw  são as energias que irão compor os descritores eletrostáticos

(QQ) e de Van der Waals calculada pelo potencial de Lennard-Jones (VDW). qsonda

é a carga da sonda, qk  é a carga parcial do átomo k da molécula, D é a constante

dielétrica, e r sondak  é a distância da sonda dentro da grade virtual até o átomo k da

molécula. Os termos A e C são constantes dependentes do raio de van der Waals

parametrizados para o campo de força usado no cálculo da energia (MARTINS et al.,

2009).

Os descritores no modelo final com a metodologia LQTA QSAR são expressos

como esferas, coloridas de acordo com o sinal do vetor de regressão e a natureza dos

descritores (LJ ou QQ). Diferentemente do CoMFA que os descritores de interação

são demonstrados através de mapas de contorno (Figura 8).
8/17/2019 Dissertação Carolina Correções Norberto

29/103

29

Figura 8. Exemplo de exibição espacial de descritores para a metodologia LQTA eCoMFA. a) Representação descritores LJ e QQ em esferas. b) Mapas de contornoobtidos por CoMFA.

Fonte : adaptado de (a) (DE ARAÚJO SANTOS et al., 2014) e (b) (DOWEYKO, 2004).

1.2.4 Validação dos modelos de LQTA-QSAR

A validação do modelo QSAR é essencial para garantir a qualidade da

capacidade de previsão do modelo. Para tanto, a validação deve ocorrer tanto demaneira interna (do próprio modelo) quanto de maneira externa (do grupo de

previsão). A validação cruzada (leave-one-out - LOO) é utilizada para determinar o

número de variáveis latentes no modelo PLS (KIRALJ; FERREIRA, 2009). A validação

cruzada leave-one-out consiste em excluir uma amostra de cada vez do conjunto de

treinamento, construir um modelo sem essa amostra, e então realizar a previsão da

atividade para esta amostra deixada de fora. O procedimento é realizado quantas

vezes for o número das amostras do conjunto de treinamento. A diferença entre ovalor experimental e o estimado para as amostras retiradas são usados para calcular
8/17/2019 Dissertação Carolina Correções Norberto

30/103

30

o erro padrão da validação cruzada (SEV , standart error of validation) e o coeficiente

de correlação da validação LOO (Q2 ). O modelo com todas as amostras é expresso

em termos do coeficiente de correlação de determinação múltipla (R 2 ) e o erro padrão

de calibração (SEC , standart error of calibration).

Se a diferença entre os valores de Q2 LOO e R 2 for de 0,2 a 0,3 há indícios de

sobreajuste do modelo. É preconizado que os valores de Q² e R² devem ser maiores

que 0,6 para um modelo satisfatório (CHIRICO; GRAMATICA, 2011; GRAMATICA,

2007; KIRALJ; FERREIRA, 2009). A tabela 2 mostra os parâmetros estatísticos

básicos para os modelos de regressão.

Tabela 2. Parâmetros estatísticos básicos para modelos de regressão.Parâmetro Definição

Coeficiente de validação cruzada 1 ∑ ²=

∑ []²=

Coeficiente de correlação de

determinação múltipla 1 ∑ ²

∑ []²

Coeficiente de correlação de validação

externa 1

∑ ²∑ []²

A validação cruzada Leave-N-out (LNO) é recomendada para testar a robustez

do modelo. Diferente do LOO, são retiradas do conjunto de treinamento N amostras

em bloco. Um novo modelo é construído sem estas amostras, e os valores de

atividade biológica são previstos para o bloco de amostras separadas para validação.

O valor de N deve apresentar uma porção significativa das amostras, sendo

preconizado um número de 20% a 30% de amostras a serem retiradas (CHIRICO;

GRAMATICA, 2011). Os coeficientes de correlação da validação cruzada LNO

(Q2LNO) são calculados da mesma maneira que para Q2 LOO. É recomendado um

valor máximo de oscilação de 0,1. Os resultados do teste de LNO é expresso através

de um gráfico que mostra o desvio máximo entre Q2 LOO e Q2 LNO. Devem também

ser expressos dois desvios padrão ao redor do valor médio para a diferença entre o

Q2 LOO e Q2 LNO (KIRALJ; FERREIRA, 2009).
8/17/2019 Dissertação Carolina Correções Norberto

31/103

31

O último teste, de y-randomization detectar e quantifica as chances de

correlações ao acaso entre a variável dependente e os descritores. De modo que o

modelo não seja obtido ao acaso. O teste consiste em construir vários modelos com

as variáveis independentes, mas utilizando valores randomizados da matriz de

variáveis latentes (y). Nessas condições, os modelos obtidos não podem obter valores

bons de Q² e R² LOO. Valores ideais para os parâmetros obtidos com o teste y-

randomization, Q²yrand e R²yrand são preconizados como : Q²yrand e R²yrand < 0,2 para

um modelo obtido sem chance de correlação ao acaso (ERIKSSON et al., 2003).

Os resultados do teste ainda podem ser expressos levando em conta o

coeficiente de correlação absoluta de Pearson, |r|. São construídos dois gráficos, no

eixo y com os valores de Q2 yrand e outro R 2 yrand e no eixo x os valores de |r| para osdois gráficos. É feita então uma regressão linear com os valores e se o modelo foi

obtido com descritores que possuem correlação ao acaso, os interceptos desses

gráficos são aQ > 0,05 e aR > 0,3. Estes interceptos são medidas da correlação ao

acaso (KIRALJ; FERREIRA, 2009).

1.3 Aplicação do LQTA-QSAR para alvos e inibidores de proteína de P. falciparum

1.3.1 Plasmepsina II do Plasmodium falciparum. Presentes no P. falciparum, as plasmepsinas são um grupo de dez isoformas

de proteases aspárticas presentes no Plasmodium e estão envolvidas no processo de

degradação da hemoglobina. Quatro proteínas são ativas no vacúolo alimentar (I, II,

IV e HAP) e são expressas na fase eritrocítica. Proteases aspartáticas se constituem

de uma das maiores subclasses de proteínas e são encontradas em sua maioria,

somente em eucariotos (ERSMARK; SAMUELSSON; HALLBERG, 2006).

A utilização das Plm como alvos farmacológicos já é uma realidade no mercadode fármacos. O FDA (Food and Drug Administration) já aprovou fármacos tanto para

alvos em humanos quanto na terapia contra o HIV. A maioria desses esforços foi

guiado pelo projeto de protótipos baseados em estrutura. As descobertas feitas nos

últimos vinte anos quanto ao design de fármacos permitem uma orientação para o

descobrimento de possíveis novos compostos para a inibição das plasmepsinas.

Existe uma vasta coleção na literatura de compostos com atividade inibitória

comprovada contra a enzima, que podem se tratar de ponto de partida para a pesquisa
8/17/2019 Dissertação Carolina Correções Norberto

32/103

32

de um novo antimalárico (BJELIC et al., 2007; J. MEYERS; E. GOLDBERG, 2012;

WEGSCHEID-GERLACH; GERBER; DIEDERICH, 2010).

O desenvolvimento de fármacos baseado na estrutura dos receptores foca

primariamente na Plm II como alvo proteico, pois se trata da primeira estrutura

cristalográfica a ficar disponível para pesquisa. (HUIZING; MONDAL; HIRSCH, 2015;

SILVA et al., 1996). O sequenciamento da Plm II também permitiu o desenvolvimento

in silico de modelos para a Plm I, IV e HAP, considerando que o sitio ativo destas

proteínas são similares – 63% de similaridade (BHAUMIK; GUSTCHINA;

WLODAWER, 2012; ERSMARK; SAMUELSSON; HALLBERG, 2006).

A estrutura madura da Plm II tem 329 aminoácidos e consiste em dois domínios

(C- e N-terminal), apresentando a forma típica bilobal das proteases aspárticas, formaesta que define o sítio ativo. Cada domínio contribui com um resíduo de ácido

aspártico para compor o sítio catalítico da proteína, Asp214 e Asp34 (Figura 9). É

formada ainda por uma formação de grampo β (β-hairpin) e um uma aba ( flap) que

cobre o sitio ativo e interage com o substrato (ASOJO et al., 2003; ERSMARK;

SAMUELSSON; HALLBERG, 2006; SILVA et al., 1996).

Figura 9.Mecanismo da quebra da ligação peptídica feita pelas proteases aspárticas.

Fonte: adaptado de (J. MEYERS; E. GOLDBERG, 2012)

A Figura 10 mostra uma lista dos principais resíduos de aminoácidos e como

se organizam em bolsões hidrofóbicos de interação. Essas regiões de bolsões estão

denominados de acordo os dados de Schechter e colaboradores (SCHECHTER;

BERGER, 1967), seguindo a adaptação feita por Huizing (HUIZING; MONDAL;

HIRSCH, 2015). Em azul a região S2’; em laranja a região S1’; em amarelo a aba; em

vermelho a díade catalítica; em verde a região S1/S3 e em roxo a região S2.
8/17/2019 Dissertação Carolina Correções Norberto

33/103

33

Figura 10. Estrutura cristalográfica da Plasmepsina.II.

Fonte: elaborado pelo autor.

Tabela 3. Lista dos principais resíduos de aminoácidos e suas regiões respectivas nositio ativo da Plm II.

Díade

AspFlap S1/S3 S2 S1' S2'

Asp34,

Asp214.

Pro43,

Met75,

Val105,

Phe111,

Ile123,

Tyr77.

Tyr17, Ile32,

Ser215,

Ser218,

Phe120,

Met15,

Ile123,Ile14,

Thr114.

Pro243,

Leu271,

Phe244,

Met286,

Ile290,

Tyr273.

Tyr192,

Trp193,

Ile300,

Ile212,

Phe294.

Asn39,

Leu131,

Ser132,

Ile133.

Esse grupo de proteínas é capaz de clivar a cadeia A da hemoglobina entre os

resíduos Phe33 e Leu34 (BRINKWORTH et al., 2001). Acredita-se que tal processo

induza um desenrolamento da proteína e permita a exposição de mais sítios catalíticos

(ASOJO et al., 2003). Sendo assim, as plasmepsinas responsáveis pelo metabolismo

da hemoglobina, são também consequentemente responsáveis pelos sintomas

clínicos característicos da malária (febre); reforçando a proteína como alvo potencialpara terapia antimalárica.
8/17/2019 Dissertação Carolina Correções Norberto

34/103

34

1.3.2 Inibidores da Plasmepsina II : alofenilnorstatinas.

A principal estratégia do planejamento de inibidores das Plasmepsinas utiliza a

ação da díade catalítica formada pelos resíduos de ácido aspártico. O mecanismo de

ação consiste na clivagem da ligação peptídica, gerando um substrato intermediário

tetraédrico. Análogos desse substrato intermediário simulam a interação com as Plm

de maneira mais específica. Isósteros desse estado de transição são definidos por

possuir um grupamento funcional capaz de simular esse intermediário, mas é mais

resistente a clivagem da proteína. Os inibidores peptidiomiméticos (Figura 11)

resistentes a essa clivagem são amidas reduzidas, estatinas, estatinas reversas

hidroxietilaminas, hidroxipropilaminas, norstatinas e dihidroxietilenos (C e N

duplicados) (DAN; BHAKAT, 2015).

Figura 11. Inibidores peptidiomiméticos das plasmepsinas.

Fonte: adaptado de (PÉREZ et al., 2013).

As norstatinas foram previamente desenvolvidas como inibidores de HIV e

utilizadas pela primeira vez como inibidores de Plasmepsina II por Nezami e
8/17/2019 Dissertação Carolina Correções Norberto

35/103

35

colaboradores, com uma série de norstationas com um núcleo de alofenilnorstatinas

associado a tiazolidina (NEZAMI et al., 2002).

Em uma colaboração entre a Universidade Jonhs Hopkins e Universidade

Farmacêutica de Kyoto, a série chamada de KNI, com o intuito final de inibir as quatro

Plasmepsinas I, II, IV e HAP presentes no vacúolo digestivo, mas primariamente a

plasmepsina II com maior potência pelo design de inibidores adaptativos (HIDAKA et

al., 2007; KISO et al., 2004; MIURA et al., 2010; NEZAMI et al., 2002). Essa estratégia

tenta planejar inibidores mais potentes e específicos que interagem com as regiões

mais conservadas no sitio ativo (área catalítica) e mantendo a flexibilidade dos

compostos para que se adaptem as regiões menos conservadas (S2, S1’ e flap) da

proteína (NEZAMI et al., 2003).Compostos baseados nesse núcleo químico demonstraram grande

biodisponibilidade e baixa toxicidade. As alofenilnorstatinas apresentam uma estrutura

similar ao primeiro sitio de clivagem da hemoglobina, Phe33-Leu34 e a porção

tiazolidina simula uma leucina conformacionalmente restringida. Estudos de docking

realizados por Nezami (NEZAMI et al., 2002) demonstraram que as alofenilnortatinas

se ligam a Plasmepsna II da mesma forma que a Pepstatina A (Figura 12), um potente

inibidor natural da proteases aspárticas (ASOJO et al., 2003). Interações doscompostos com os resíduos da Plm II sugeriam que a otimização desta classe deveria

ser direcionada para interações com o flap e as bordas dos bolsões de interações.

(NEZAMI et al., 2003).

Figura 12. Pepstatina A e alofenilnorstatina.
8/17/2019 Dissertação Carolina Correções Norberto

36/103

36

Fonte: elaborado pelo autor
8/17/2019 Dissertação Carolina Correções Norberto

37/103

37

2 OBJETIVOS

O objetivo geral dessa dissertação consiste no desenvolvimento de um modelo de

previsão LQTA-QSAR para uma série de inibidores da Plasmepsina II.

2.1 Objetivos específicos

Padronização do conjunto de dados de compostos ativos contra o Plasmodium

falciparum para a geração d modelo.

Desenvolvimento do modelo de LQTA-QSAR-4D

Validar extensivamente o melhor modelo obtido.

Identificação de pontos estruturais relevantes para a atividade biológica por

meio da interpretação dos descritores.
8/17/2019 Dissertação Carolina Correções Norberto

38/103

38

3 MATERIAL E MÉTODOS

3.1 Material

3.1.1 Computadores.

Todos os estudos foram realizados no Laboratório de Química Farmacêutica

Computacional, em estações computacionais operando em Linux, com processadores

Intel® Xeon®E5-2690, 2.9 GHz, 20 MB cache, 16 GB RAM. Os softwares utilizados

estão disponíveis através de licenças acadêmicas ou são de uso livre.

3.1.2 Conjunto de dados

Para os estudos de modelagem molecular, foram selecionados um conjunto de

dados de 49 inibidores derivados da estrutura do ácido (2S,3S) -3-amina-2-hidroxi-4-

fenilbutirato ( ALOFENILNORSTATINAS) com Ácido (R)-1,3-tiazolidina 4-carboxilico

(BHAUMIK et al., 2011; HIDAKA et al., 2007; KISO et al., 2004; MIURA et al., 2010;

NEZAMI et al., 2002). Os valores da constante de inibição (Ki) foram obtidos sobre as

mesmas condições experimentais. Esses valores de K i foram transformados para a

escala logarítmica pki (-log Ki). A faixa de valores variou de 4,01 a 9,69.

3.1.3 Receptor

A estrutura cristalográfica da enzima Plasmepsina II presente no Plasmodium

falciparum foi obtida a partir do banco de dados online Protein Data Bank ( PDB)

(BERNSTEIN et al., 1977) sob o código 4CKU (JAUDZEMS et al., 2014), com

resolução de 1,85 Å e valor-R de 0,209 (Figura 13). As estruturas, que apresentavam

resíduos de aminoácidos incompletos foram reconstruídas utilizando modelos de

homologia com o Swiss Model (GUEX; PEITSCH, 1997).
8/17/2019 Dissertação Carolina Correções Norberto

39/103

39

Figura 13. Estrutura cristalina da Plasmepsina II (4CKU).

Fonte:

3.2 Metodologia

3.2.1 Padronização do conjunto de dados e preparo das estruturas tridimensionais. As estruturas 3D dos compostos foram desenhadas com o auxílio do programa

Marvin Scketch versão 15.9 (ChemAxon). O estado de protonação foi estimado para

pH = 7,40 e os átomos de hidrogênio foram adicionados com o programa Avogadro

(HANWELL et al., 2012). Foi realizada uma inspeção criteriosa do banco de dados

selecionado da literatura utilizando o protocolo descrito por Fourches & Tropsha

(FOURCHES, 2010).

Todos os modelos moleculares, nos devidos estados de protonação, passarampor uma minimização de energia com o campo de forma MMFFFG94 e tiveram suas

energias otimizadas ao nível semi-empírico PM6, com o programa Gaussian. Cargas

AM1-BCC (JAKALIAN; JACK; BAYLY, 2002) foram adicionadas com o UCSF Chimera

(PETTERSEN et al., 2004).

Para as simulações de dinâmica molecular, todo o conjunto de dados tiveram

suas ligações parametrizadas para o campo de força AMBER99SB-ILDN (LINDORFF-

LARSEN et al., 2010).
8/17/2019 Dissertação Carolina Correções Norberto

40/103

40

3.2.2 Adaptação do sítio ativo

A estrutura cristalográfica 3D do complexo Plasmpepsina II com um ligante

natural baseado na estrutura da hidroxietilamina (código PDB: 4CKU) (JAUDZEMS et

al., 2014) foi utilizado como receptor para a construção do modelo de previsão

dependente de receptor LQTA-QSAR. A estrutura química do ligante cristalizado se

interage com a proteína por um modo de interação distinto dos compostos do conjunto

de dados. O que não permite a inserção direta dos ligantes escolhidos na conformação

apresentada pelo sítio ativo cristalizado.

A adaptação do sítio ativo foi feita a partir do estudo de docking  do composto

mais potente da série (composto 33). Para tal, o ligante natural foi removido da

estrutura do cristal e foi realizada a docagem com o composto 33. As melhores poses

foram submetidas a simulações de dinâmica molecular e propiciaram a adaptação do

sítio ativo por meio de encaixe induzido. O processo automatizado de docking   foi

realizado com o programa AutoDock Vina (TROTT; OLSON, 2010) e as simulações

de dinâmica molecular com o pacote GROMACS 4 (VAN DER SPOEL et al., 2005). O

novo sítio ativo hipotético, adaptado e aperfeiçoado para o modo de interação do

composto 33 foi utilizado para orientar os processos de refinamento subsequentescom dinâmica molecular de todos os ligantes da série de derivados Alofenilnorstatinas

e obter os perfis conformacionais necessários para a construção do modelo LQTA-

QSAR-DR.

As conformações iniciais (input ) para a realização das simulações de todos os

ligantes dos conjuntos de dados foram obtidas a partir de um processo de docagem

manual, utilizando a estrutura da Plm II com o sítio ativo adaptado. O processo manual

foi realizado utilizando a ferramenta de ajuste de torções (adjust torsions) e omovimento do mouse (movement mouse), átomo por átomo, baseados no

conhecimento do modo de interação do ligante natural cocristalizado e interações

relatadas na literatura (DAN; BHAKAT, 2015; HUIZING; MONDAL; HIRSCH, 2015).

Otimizações da geometria dos compostos foram realizadas para eliminar possíveis

distorções nas posições dos átomos. As estruturas otimizadas foram submetidas ao

programa topobuild  para a criação dos arquivos de topologia GAFF (WANG et al.,

2004) para as subsequentes simulações de dinâmica molecular.
8/17/2019 Dissertação Carolina Correções Norberto

41/103

41

3.2.3 Dinâmica molecular

As simulações de dinâmica molecular ocorreram utilizando o pacote

GROMACS 4 (VAN DER SPOEL et al., 2005). Todas as simulações foram feitas em

solvente implícito empregando o formalismo generalizado de Born (FAN et al., 2005).

Como não foi construído uma caixa, não foi levado em consideração as condições

periódicas de limite. Todos os complexos tiveram sua energia otimizada usando o

algoritmo de descida mais inclinada (steepest descent algorithm - SDA). O critério de

convergência empregado nas otimizações foi que a força máxima que agisse sobre

os átomos não superasse 10 kJ mol-1 nm-1. Caso a convergência não fosse atingida

em 20 000 passos, foi empregado o algoritmo de Broydens-Fletcher-Goldfarb-Shanno

(BFGS). Foram aplicadas Correções de dispersão de longo alcance somente para

energia. Restrições de posições com penalidades de energia totais foram adicionadas

à cadeia principal (backbone) e parciais à cadeia lateral da proteína. Todas as ligações

foram vínculos pelo algoritmo LINCS, foi removido o centro de massa translacional e

rotacional ao redor do centro de massa e um algoritmo de leap-frog foi utilizado para

integrar as equações de Newton de movimento. As interações de Lennard-Jones e

Coulombic sofreram consideradas até 2 nm. As simulações duraram 2 000 ps para

cada composto, ou o suficiente para adaptação e estabilização da posição do liganteno sítio ativo.

3.2.4 Geração do modelo 4D LQTA-QSAR

Os descritores de interação foram calculados com o programa Open3DQSAR

(TOSCO; BALLE, 2011). Estes descritores foram criados com a utilização das

conformações alinhadas provenientes da dinâmica molecular. A seleção destas

conformações foi realizada a partir da ferramenta de análise de agrupamentos doChimera. Foi utilizada uma caixa cúbica com 1.0 Å de espaçamento e dimensões de

33x32x30 Å. Foram calculados no total 63360 descritores paras energias de interação

de Lennard-Jones (LJ) e Coulomb (QQ). Os descritores de LJ foram calculados com

uma sonda sp³, e os de QQ com uma sonda de carga +1.

A filtragem (Figura 14), seleção e construção dos modelos de QSAR seguiram

os protocolos já estabelecidos por Barbosa e colaboradores (BARBOSA; FERREIRA,

2012) para a metodologia do LQTA-QSAR. O script utilizado para retirar os descritores
8/17/2019 Dissertação Carolina Correções Norberto

42/103

42

do Open3DQSAR e o script feito para aplicar os filtros virtuais nas matrizes do Matlab

estão disponíveis no Anexo I.

Figura 14. Etapas dos filtros virtuais.

Fonte: elaborado pelo autor

3.2.4.1 Filtros virtuais

Os descritores moleculares excessivamente distantes (baixa variância) das

estruturas 3D alinhadas dentro da grade virtual foram eliminados. O corte da variância

foi de 0,02 para descritores abaixo desse valor, de acordo com o proposto por Kubiny

e colaboradores (KUBINYI, 1997). Os descritores de LJ são submetidos a um

tratamento devido a seus valores positivos serem de elevada magnitude nos postos

da grade próximos aos átomos. Um corte (cut-off ) de energia é realizado seguindo a

equação X. Se um descritor de LJ nas coordenadas x, y, z tiver valor de energia menor

ou igual que 30 kcal/mol não foi aplicado nenhum corte. Se não, o valor logaritmo

residual da energia foi adicionado a 30 kcal/mol.

,, ≤ 30 − ,ã ′,, ,, ,, > 30 − ,ã ′,, 30 +

,, 29 (3)
8/17/2019 Dissertação Carolina Correções Norberto

43/103

43

O segundo filtro virtual foi realizado por meio da eliminação dos descritores de

baixa correlação, ou seja, se comportam como um vetor aleatório. Para tal, são

eliminados os descritores que tem correlação de Pearson absoluta (|r|) com atividade

biológica (y) no mesmo nível de ruído aleatório.

A última etapa de filtros virtuais visa eliminar os descritores com perfil de

distribuição muito diferente em relação a atividade biológica (y), utilizando o

Comparative Distribution Detection Algorithm (CDDA) (BARBOSA; FERREIRA, 2012).

Tal algoritmo permite um modo de quantificar o quão similar y está distribuído para

um descritor especifico.

3.2.4.2 Seleção de variáveis Após o procedimento de filtragem virtual, foi realizado a seleção de descritores

com o algoritmo OPS (TEÓFILO; MARTINS; FERREIRA, 2009a). Foram removidos

descritores redundantes (com coeficiente de correlação inter descritor igual ou maior

que 0,9), que apresentaram discrepância entre o sinal do vetor de regressão e do

coeficiente de correlação com a atividade biológica (KIRALJ; FERREIRA, 2009).

3.2.5 Validação do modelo A validação interna do modelo foi obtida a partir dos parâmetros de méritos R²

e Q², e testes de validação y-randomization e Leave-N-out (LNO) (GRAMATICA,

2007; KIRALJ; FERREIRA, 2009). A validação externa foi realizada empregando um

conjunto teste de 12 compostos, a fim de se verificar a capacidade preditiva dos

melhores modelos obtidos. Tal capacidade foi avaliada utilizando o coeficiente de

correlação externo (Q²ext).

O modelo final que passou nas devidas etapas de validação teve seusdescritores visualizados no espaço 3D ao redor das moléculas alinhadas. As

coordenadas que definem os descritores são expressas em formato . pdb e exibidas

como esferas utilizando o programa USCF Chimera (PETTERSEN et al., 2004). A

interpretação dos descritores do modelo foi feita com base na disposição espacial,

natureza energética e pelo sinal do vetor de regressão.

3.2.5.1 Leave-N-out e y-randomizationPara o teste de LNO, os modelos foram considerados robustos se os desvios

máximos absolutos de Q²LNO e que o Q²LOO não fossem superiores que 0,1, para N
8/17/2019 Dissertação Carolina Correções Norberto

44/103

44

sendo cerca de 20-30% das amostras separadas para validação interna

(GRAMATICA, 2007; KIRALJ; FERREIRA, 2009). O resultado é mostrado

graficamente, exibindo o valor do desvio máximo e o valor médio de dois desvios

padrão.

No teste y-r andomization os modelos foram construídos com atividades

biológicas randomizadas para gerar modelos que apresentassem pouca qualidade

estatística (R² e Q² baixos). Os descritores obtidos para os modelos foram

considerados livres de correlação ao acaso quando os interceptos para as regressões

lineares dos valores de |r| x Q²yrand e |r| x R²yrand forem aQ < 0,05 e aR < 0,3

(ERIKSSON et al., 2003). Os resultados foram expressos em dois gráficos contendo

a linha para a regressão linear, seguindo as equações:

i) ² + || (4)ii) ² + ||

Onde Q²yrad e R²yrad são os parâmetros estatísticos do coeficiente de correlação

para os modelos randômicos, aQ e aR são os interceptos da reta e |r| é o coeficiente

de correlação de Pearson. Foram realizadas 100 randomizações de y.
8/17/2019 Dissertação Carolina Correções Norberto

45/103

45

4 RESULTADOS E DISCUSSÕES.

4.1 Caracterização do conjunto de dados.

Um conjunto de dados de 49 compostos foi utilizado para a construção de

modelos LQTA-QSAR dependente de receptor (JAUDZEMS et al., 2014). A figura 15

mostra o esqueleto principal dos inibidores da série escolhida. As moléculas do

conjunto de dados variam a partir de quatro pontos de modificação, R1, R2, R3, R4,

mantendo sempre o radical Alofenilnorstatinas com um anel tiazolidina.

Seguindo a convenção de Schechter (SCHECHTER; BERGER, 1967), as

regiões dos substratos, ou inibidores (P1-Pn/P1’-Pn’) são correspondentes a regiões

que interagem no sitio ativo (S1-Sn/S1’-Sn’) das plasmepsinas (BHAUMIK;

GUSTCHINA; WLODAWER, 2012).

Figura 15 – Farmacóforo característico da série de compostos utilizada na construçãodo modelo LQTA-QSAR. Anel de cinco membros tiazolidina e os locais de possíveissubstituições (R1, R2, R3 e R4)

Fonte: elaborado pelo autor

Tal conjunto de dados é inédito na criação de modelos de QSAR na literatura.

As estruturas químicas dos compostos e seus respectivos valores de atividade

biológicas, expresso em pki, estão apresentados na Tabela 4.
8/17/2019 Dissertação Carolina Correções Norberto

46/103

46

Tabela 4 – Conjunto de dados retirados da literatura (continua).

Composto¹ R1 R2 R3 pKi

1 H CH3 H 8.04

3 CH3 H H 8.07

4 CH3 CH3 H 7.92

5 H CH2 CH3 H 9.16

6 H CH2 CH3 CH2 CH3 8.29

7 CH2 CH3 CH2 CH3 H 8.37

8 CH2 CH3 CH2 CH3 CH2 CH3 8

Composto² R pKi Composto

R pKi

9 9.30 17 6.95

10 7.14 18 6.14

11 7.65 19 7.02
8/17/2019 Dissertação Carolina Correções Norberto

47/103

47

Tabela 4 – Continuação.

Composto² R pKi Composto

R pKi

12 6.27 20 7.38

13 7.95 21 6.25

15 7.82 23 7

16 7 24 6.56

Composto³ R1 R2 R3 R4 pKi

25 - - 4.02
8/17/2019 Dissertação Carolina Correções Norberto

48/103

48

Tabela 4 – Continuação. Composto³ R1 R2 R3 R4 pKi

26 CH3 CH3 5.06

27

- - 4.89

29 CH3 CH3 7.15

30 - - 5.03

31 - - 6.22
8/17/2019 Dissertação Carolina Correções Norberto

49/103

49

32 CH3 CH3 7.52

33

CH3 CH3 7.69

35 - - 5.09

Composto4 R pKi

36 8.52

37 7.82
8/17/2019 Dissertação Carolina Correções Norberto

50/103

50

Tabela 4 – Continuação

Composto4 R pKi

38 8.0k5

39 9.7

40 8.3

Composto4R1 R2 R3 pKi

41 H CH3 - 7.75

42 - - CH3 8.30

43 NH2 - - 8.40

44 - NH2 - 7.92

45 OH - - 7.95

46 - OH - 8.40

47 OCH3 - - 8.05

48 - OCH3 - 7.77

49 - - OCH3 8.40

1Miura et al., 2010; 2Kiso et al., 2004; 3Nezami et al., 2002; 4Hidaka et al., 2007.
8/17/2019 Dissertação Carolina Correções Norberto

51/103

51

4.2 Divisão do conjunto de dados para a construção do modelo LQTA-QSAR

O conjunto de dados foi dividido em grupo de treinamento e grupo teste, 85%

e 25% dos compostos, respectivamente. Para esta divisão, utilizou-se o método de

análise de grupamentos hierárquicos (HCA –Hierarchical Cluster Analyses) a partir de

um dendograma (Figura 16). Os grupos testes e de treinamento foram escolhidos de

modo que o menor e o maior valor de pKi (composto 25 e 39) não fossem selecionados

para o grupo externo (conjunto teste) e de modo que os dois conjuntos apresentassem

uma boa distribuição ao longo do intervalo de atividade. O grupo de treinamento ficou

constituído de 37 compostos e o grupo teste de 12 compostos. O grupo teste foi

constituídos dos compostos 17, 21, 29, 14, 40, 30, 32, 43, 5, 6, 3 e 27. O restante foi

utilizado como conjunto de treinamento para o modelo LQTA-QSAR.

Figura 16 – Dendograma referente à análise de grupamentos hierárquicos para o

conjunto de dados (a numeração dos compostos não corresponde a numeração

referente a tabela).

4.3 Adaptação do sítio ativo.

A adaptação do sitio ativo do cristal da Plasmepsina II se mostrou necessária,

porque o ligante cocristalizado tem uma estrutura química baseada em

hidroxietilaminas, diferente dos compostos que compõe a série utilizada para a
8/17/2019 Dissertação Carolina Correções Norberto

52/103

52

construção do modelo. A alta flexibilidade da estrutura da proteína (HUIZING;

MONDAL; HIRSCH, 2015) acrescentou à necessidade de realizar o processo de

docagem manualmente, e não, com o docking automatizado.

Inicialmente, todo o conjunto de dados passou pelo processo de docking

automatizado, utilizando o programa AutoDock Vina (TROTT; OLSON, 2010). As

conformações obtidas para todo o conjunto de dados, apesar de apresentarem uma

função de avaliação (score) alto, não apresentaram conformações que permitissem o

alinhamento das moléculas, ou que traduzissem um modo legítimo de interação

similar entre si. A figura 17 mostra o melhor alinhamento das conformações obtidas

com o docking automatizado. É perceptível que o alinhamento obtido impossibilita a

construção de um modelo QSAR-3D.

Figura 17. Alinhamento das melhores conformações obtidas pelo processo dedocagem automatizado.

Fonte: elaborado pelo autor

Enquanto é perceptível que o processo automatizado traduz em conformações

similares ao modo de interação desvendado pelo cristal, ela não condiz com modo de

interação encontrado na literatura para as estruturas baseadas nas alofenilnorstatinas

(BJELIC et al., 2007; BOSS et al., 2003; ERSMARK; SAMUELSSON; HALLBERG,

2006). As alofenilnorstatinas são desenhados para ocupar o espaço S1’ do sitio ativo

da proteína e explorar o bolso S2’ (WEGSCHEID-GERLACH; GERBER; DIEDERICH,
8/17/2019 Dissertação Carolina Correções Norberto

53/103

53

2010), diferentemente da natureza do composto hidroxietilaminas cocristalizadas

(JAUDZEMS et al., 2014).

Frente a essa problemática, a realização de um modelo de previsão 4D se

mostrou necessária. Utilizando-se das ferramentas de dinâmica molecular e

aproveitando as vantagens de um modelo QSAR-4D frente a um 3D clássico (PATEL

et al., 2014). Assim, foi possível adaptar o sitio ativo por encaixe induzido à série de

compostos do conjunto de dados e aferir um modo de interação mais consonante ao

modo de interação com a proteína.

Composto 33 (pKi = 7,69), uma das moléculas mais ativa da série, foi escolhida

para a adaptação do sitio ativo. A simulação de MD resultou em diversas

conformações, entre elas, uma mais frequente revelando um modo de interaçãodistinto para moléculas derivadas de alofenilnorstatinas. A figura 18 mostra um corte

transversal do sitio ativo.

Figura 18 – Sitio ativo da Plm II com o Composto 33 (roxo) e ligante natural do cristal(azul).

Fonte: elaborado pelo autor.

Foi observado que o anel tiazolidina do composto ocupava a região S1’ do bolso

hidrofóbico do sitio ativo, permitindo que o ligante alcance a região S2’. Atingindo

assim, uma conformação mais estável do que a apresentada pela forma cristalizada.

O benzil na região P1, comum para toda a série, interagiu com a região S1/S3 do sítio
8/17/2019 Dissertação Carolina Correções Norberto

54/103

54

ativo, fazendo interações de empilhamento-π com os resíduos de Phe120, Try77 e

Phe111 (flap). A Figura 19 mostra o composto 33 e os principais resíduos após a

adaptação do sitio ativo

Figura 19. Composto 33 após adaptação do sítio ativo.

Fonte: elaborado pelo autor.

A díade catalítica, formada pelos resíduos Asp34 e Asp214 fazem ligações de

hidrogênio com a carbonila e hidroxila da estrutura das alofenilnorstatinas. O anel

tiazolidina interage com a região S1’ do sitio ativo, principalmente com os resíduos de

Tyr192, Ile300 e Ile212.Sabe-se que o conjunto de dados foram planejados para simular um estado de

transição do substrato da proteína Plasmepsina II, estado esse em que o substrato se

estende pelos dois lados do centro catalítico e preenche a região hidrofóbica S1/S3 e

S1’ (SHIM; MACKERELL, JR., 2011). Tal característica peptidiométrica foi confirmada

pelos resultados da adaptação do sitio ativo e as simulações de dinâmica moleculares

puderam ser conduzidas para o restante do conjunto de dados.

Após a adaptação do sitio ativo para o composto 33, as moléculas restantes doconjunto de dados foi manualmente ancorado para a posição do modo de interação.
8/17/2019 Dissertação Carolina Correções Norberto

55/103

55

Translações e rotações das ligações permitiram produzir o input inicial para as

subsequentes simulações de dinâmica molecular de todo o conjunto. A Figura 20

mostra o alinhamento do conjunto de dados após o processo de adaptação do sitio

ativo e docagem manual, antes do processo de cálculo dos descritores. É possível

observar que o anel tiazolidina e o benzil de todos os conjuntos de dados estão

alinhados todos no mesmo modo de interação.

Figura 20. Melhor alinhamento após a adaptação do sitio ativo.

Fonte: elaborado pelo autor.

4.4 4D LQTA-QSAR

Os descritores calculados com o programa Open3DQSAR e submetidos ao

protocolo de filtragem virtual e seleção de variáveis descritos anteriormente. A tabela

5 mostra a eliminação de descritores subsequentes de cada etapa de filtragem virtual.

No Anexo 2 está disponível o script utilizado para automatizar as etapas de filtragem

através do programa Matlab (“Mathlab.”, 2000)..A matriz inicial, após o cálculo dos

descritores, com proporções de 49x63360 foi tratada como duas matrizes distintas,

com 49 amostras e 31680 descritores cada, para descritores de LJ e QQ. A matriz

final utilizada para a criação do modelo teve proporções de 37x443 (37 amostras

referente ao grupo de treinamento e 443 descritores). A figura 21 mostra a matriz

referentes aos descritores LJ no tocante ao corte. É possível observar, no primeiro

gráfico, os valores elevados na casa de 3*10¹¹ de energia. No segundo gráfico, após
8/17/2019 Dissertação Carolina Correções Norberto

56/103

56

o tratamento, os descritores apresentam distribuição