8/17/2019 Dissertação Carolina Correções Norberto
1/103
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE
PROGRAMA DE PÓS GRADUAÇÃO EM CIÊNCIAS FARMACÊUTICAS
DESENVOLVIMENTO E AVALIAÇÃO DE MEDICAMENTOS
PROSPECÇÃO IN SILICO DE COMPOSTOS
BIOATIVOS CONTRA MALÁRIA UTILIZANDO
MODELOS DE PREVISÃO DE ATIVIDADE BIOLÓGICA
NATAL - RN
2016
8/17/2019 Dissertação Carolina Correções Norberto
2/103
CAROLINA ARRUDA BRAZ
PROSPECÇÃO IN SILICO DE COMPOSTOS
BIOATIVOS CONTRA MALÁRIA UTILIZANDO
MODELOS DE PREVISÃO DE ATIVIDADE BIOLÓGICA.
Dissertação apresentada ao Programa de
Pós Graduação em Ciências Farmacêuticas
da Universidade Federal do Rio Grande do
Norte, como requisito para obtenção do título
de mestre em Ciências Farmacêuticas.
Área de Concentração: Desenvolvimento e
avaliação de Medicamentos
Orientador: Prof. Dr. Euzébio Guimarães
Barbosa
NATAL – RN
2016
8/17/2019 Dissertação Carolina Correções Norberto
3/103
CAROLINA ARRUDA BRAZ
PROSPECÇÃO IN SILICO DE COMPOSTOS
BIOATIVOS CONTRA MALÁRIA UTILIZANDO
MODELOS DE PREVISÃO DE ATIVIDADE BIOLÓGICA
Dissertação apresentada ao Programa de
Pós Graduação em Ciências Farmacêuticas
da Universidade Federal do Rio Grande do
Norte, como requisito para obtenção do título
de mestre em Ciências Farmacêuticas, pela
Banca examinadora, formada por:
Data de aprovação:
___/___/___
Presidente – Prof. Dr. Euzébio Guimarães Barbosa.
Menbro: Prof. Dr. Norberto de Kassio Vieira Monteiro.
Menbro: Prof. Dr. Davi Serradella Vieira.
8/17/2019 Dissertação Carolina Correções Norberto
4/103
Agradecimentos
Primeiramente ao meu orientador, o professor Euzébio pelas oportunidades
oferecidas durante o mestrado. Pelos conselhos, parceria e exemplos de postura de
pesquisador. Por transferir tanta calma e segurança que o mestrado passou
tranquilo. Que essa parceria possa perdurar por projetos futuros. E pela indicação de
jogos.
Aos meus colegas de laboratório, em especial ao Edjan, pelas ajudas mútuas nos
nossos respectivos projetos.
A toda equipe do Programa de Pós Graduação em Ciências Farmacêuticas.
A Sarah e Izadora, minhas amigas, conterrâneas de estágio e Mestrado. Pelas
angústias e aperreios compartilhados nessa vida acadêmica.
À minha família, Cristina, in memoriam Alberto e Max, por me acompanhar e
acreditar nessa jornada. Ao meus primos, em especial a Laura, por tantas vezesnegar essa viagem para Jeriquaquara.
Ao meu querido companheiro Magnus, pela companhia, por se estressar junto
comigo durante o processo de escrituras e me convencer sempre que eu consigo
entregar os documentos nos prazos.
E aos meus amigos por me aguentarem usar o diploma de cientista pra ganhardiscussões.
8/17/2019 Dissertação Carolina Correções Norberto
5/103
ÉPIGRAFE
“The nitrogen in our DNA, the calcium in our teeth, the iron in our blood, the carbon in our
apple pies were made in the interiors of collapsing stars
. We are made of starstuff.”
― Carl Sagan.
https://www.goodreads.com/author/show/10538.Carl_Saganhttps://www.goodreads.com/author/show/10538.Carl_Sagan
8/17/2019 Dissertação Carolina Correções Norberto
6/103
LISTA DE FIGURAS
Figura 1 Número de casos confirmados de malária mundialmente em 2014.
Figura 2 Casos confirmados de malária no Brasil em 2014
Figura 3 Ciclo de vida do Plasmodium no homem e mosquito.
Figura 4 Rota geral do metabolismo da hemoglobina no P. falciparum
Figura 5 Principais fármacos utilizados no tratamento da malaria
Figura 6 Representação de uma caixa cúbica utilizada para calcular descritores
MIF. A sonda utilizada para calcular as energias de interação está no
canto superior esquerdo.
Figura 7 Funcionamento esquemático do OPS. Figura 8 Exemplo de exibição espacial de descritores para a metodologia LQTA
e CoMFA. a) Representação descritores LJ e QQ em esferas. b) Mapas
de contorno obtidos por CoMFA
Figura 9 Mecanismo da quebra da ligação peptídica feita pelas proteases
aspárticas.
Figura 10 Estrutura cristalográfica da Plasmepsina.II.
Figura 11 Inibidores peptidiomiméticos das plasmepsinas.Figura 12 Pepstatina A e alofenilnorstatina.
Figura 13 Estrutura cristalina da Plasmepsina II (4CKU).
Figura 14 Etapas dos filtros virtuais .
Figura 15 Farmacóforo característico da série de compostos utilizada na
construção do modelo LQTA-QSAR. Anel de cinco membros tiazolidina
e os locais de possíveis substituições (R1, R2, R3 e R4)
Figura 16 Dendograma referente à análise de grupamentos hierárquicos para oconjunto de dados (a numeração dos compostos não corresponde a
numeração referente a tabela).
Figura 17 Alinhamento das melhores conformações obtidas pelo processo de
docagem automatizado.
Figura 18 Sitio ativo da Plm II com o Composto 33 (roxo) e ligante natural do cristal
(azul).
Figura 19 Composto 33 após adaptação do sítio ativo.
Figura 20 Melhor alinhamento após a adaptação do sitio ativo.
Figura 21 Resultado do filtro virtual referente ao tratamento dos descritores de LJ.
8/17/2019 Dissertação Carolina Correções Norberto
7/103
Figura 22 Resultados dos testes de validação LNO e y-randomization e a qualidade
de previsão do modelo.
Figura 23 Visualização dos descritores no sitio ativo da proteína.
Figura 24 Representação gráfica dos descritores do modelo final. Visões com os
compostos 33 (a) e 25 (b).
Figura 25 Composto 39 (pKi: 9,6), mais potente, em cinza e 27 (pki: 4,89) em
laranja.
Figura 26 Orientação do anel tiazolidina. Composto 33 (pki: 7,69) e 30 (pki: 5,03).
Figura 27 Mapas de contorno obtidos por Muthas (MUTHAS et al., 2005). A região
S1’ está assinalada pelo mapa verde, que representa região estérica
favorável para presença de grupos volumosos. Figura 28 Composto 39 (azul) com pKi: 9,7 e 25 (verde), pK i: 4,02. Em roxo os
resíduos de aminoácidos próximos aos descritores.
Figura 29 Composto 30 (verde) e 7 (vermelho) representando o pior e melhor perfil
para descritor QQ7.
Figura 30 A) Descritor QQ4 relacionado com substituintes alifáticos e cíclicos.
Compostos mais potente, 33 (roxo) com pK i de 7,69 e menos potente,
25 (azul) com pki de 4,01 foram usados como exemplo. B) Contribuiçãode interações eletronegativas negativas. Composto 9 em azul de pK i:
9,31 e 18, marrom de pKi: 6,14.
Figura 31 Esquema de interação das alofenilnorstatinas de acordo com o modelo
LQTA. Em vermelho, as regiões do sitio ativo da Plm II que cada porção
do inibidor interage.
8/17/2019 Dissertação Carolina Correções Norberto
8/103
LISTA DE TABELAS
Tabela 1. Candidatos a fármacos em estudos clínicos durante o ano de 2014
Tabela 2. Parâmetros estatísticos básicos para modelos de regressão
Tabela 3. Lista dos principais resíduos de aminoácidos e suas regiões respectivas
no sitio ativo da Plm II
Tabela 4. Conjunto de dados retirados da literatura
Tabela 5 Números de descritores iniciais e após casa processo de filtragem
virtual.
Tabela 6. Figuras de mérito para o modelo final obtido.
8/17/2019 Dissertação Carolina Correções Norberto
9/103
RESUMO
Estratégias de planejamento de fármacos auxiliadas por computador utiliza-se
de técnicas computacionais para auxiliar o descobrimento de novos fármacos.
Economizando custos e agilizando o processo de pesquisa e desenvolvimento, além
de poder processar uma quantidade grande de dados. A utilização da técnica do
LQTA-QSAR permite a criação de modelos de previsão de atividade biológica capazes
de sugerir estruturas inéditas sem a real necessidade de execução de teste de
atividade biológica in vitro ou in vivo. A malária é uma doença causada pelo parasito
do gênero Plasmodium e afeta principalmente as regiões da África e América Latina.
Estima-se que em 2014 ocorreram 214 milhões de caso de malária e 438 mil demortes de acordo com a Organização Mundial de Saúde. A enzima Plasmepsina II é
responsável pela clivagem inicial da hemoglobina e é um alvo validado para o
planejamento de novos agentes antimaláricos. O objetivo geral desse trabalho foi
desenvolver um modelo de previsão de atividade biológica baseado na relação
estrutura atividade de compostos inibidores da Plasmepsina II que possuem um
núcleo derivado de alofenilnostatinas. Foi criado um modelo de previsão com 37
amostras. O modelo PLS apresentou um Q² = 0,92 e R² = 0,95 com 10 variáveis e 2variáveis latentes. O modelo apresentou bons parâmetros estatísticos e boa
capacidade preditiva (Q² ext = 0,79) Os descritores também estão corroboram com a
interação dos inibidores com sítio receptor da Plm II. Os dados obtidos servem como
guia para o planejamento de novos antimaláricos com maior potência.
8/17/2019 Dissertação Carolina Correções Norberto
10/103
ABSTRACT
Strategies for drug design aided by computer uses of computational techniques
for guidance on the discovery of new drugs. Saving costs and speeding the process of
research and development, besides it being able to process a big volume data. The
utilization of LQTA-QSAR allows the creation of predicting models of biological activity
able to propose novel compounds without the real necessity of in vitro biological activity
essays. Malaria is a disease caused by the parasite from genre Plasmodium and
affects mainly the Africa and Latin America regions. It is estimated that in 2014 it
happened 214 million cases of malaria and 438 thousand cases of death according to
World Health Organization. Plasmepsin II is responsible for the metabolism ofhemoglobin and it is a valid target for the development of new antimalarial agents. The
general objective of this work is to develop a predictive model of biological activity
based on the structure of Plasmepsin II inhibitors derivate from allophenylnorstatine.
A model was built with 37 samples, Q² = 0.92 and R² = 0.95 with 10 variables and 2
latent variables. The model present good statistical parameters and good predicting
ability (Q²ext=0.79). The descriptors could be well correlated to ligand-Plm II
interactions. The data obtained serves as guides to the design of new optimizedantimalarial agents.
8/17/2019 Dissertação Carolina Correções Norberto
11/103
SUMÁRIO
1. INTRODUÇÃO .........................................................................................................................................13
1.1 MALÁRIA................................................................................................................................................. 13
1.1.1 Aspectos Epidemiológicos. .............................................................. ................................................. 13
1.1.2 Ciclo evolutivo ............................................................ .............................................................. ........ 16
1.1.2.1 Degradação da hemoglobina. .................................................................................................................18
1.1.3 Tratamento / Quimioterapia e Resistência. .......................................................... ........................... 19
1.1.4 Resistência ....................................................................................................................................... 22
1.2 DESCOBERTA DE FÁRMACOS........................................................................................................................ 23
1.2.1 Ferramentas computacionais para o desenvolvimento de fármaco........................................ ........ 24
1.2.2 QSAR-4D .......................................................................................................................................... 25
1.2.3 Descritores moleculares de interação. ....................................................... ...................................... 28
1.2.4 Validação dos modelos de LQTA-QSAR ................................................................ ............................ 29
1.3 APLICAÇÃO DO LQTA-QSAR PARA ALVOS E INIBIDORES DE PROTEÍNA DE P. FALCIPARUM ....................................... 31
1.3.1 Plasmepsina II do Plasmodium falciparum. .......................................................... ........................... 31
1.3.2 Inibidores da Plasmepsina II : alofenilnorstatinas. .......................................................................... 34
2 OBJETIVOS ..............................................................................................................................................37
2.1 OBJETIVOS ESPECÍFICOS ........................................................ .............................................................. ........ 37
3 MATERIAL E MÉTODOS ...........................................................................................................................38
3.1 MATERIAL ............................................................................................................................................... 38
3.1.1 Computadores. ................................................................................................................................ 38
3.1.2 Conjunto de dados ........................................................................................................................... 38
3.1.3 Receptor .......................................................... ................................................................. ................ 38
3.2 METODOLOGIA ........................................................ ................................................................. ................ 39
3.2.1 Padronização do conjunto de dados e preparo das estruturas tridimensionais. ............................. 39
3.2.2 Adaptação do sítio ativo ................................................................. ................................................. 40
3.2.3 Dinâmica molecular .............................................................. ........................................................... 41
3.2.4 Geração do modelo 4D LQTA-QSAR ........................................................... ...................................... 41
3.2.4.1 Filtros virtuais ..........................................................................................................................................42
3.2.4.2 Seleção de variáveis ................................................................................................................................43
3.2.5 Validação do modelo ....................................................................................................................... 43
3.2.5.1 Leave-N-out e y-randomization ...............................................................................................................43
4 RESULTADOS E DISCUSSÕES. ..................................................................................................................45
4.1 CARACTERIZAÇÃO DO CONJUNTO DE DADOS. .......................................................................................... ........ 45 4.2 DIVISÃO DO CONJUNTO DE DADOS PARA A CONSTRUÇÃO DO MODELO LQTA-QSAR .............................................. 51
4.3 ADAPTAÇÃO DO SÍTIO ATIVO........................................................................................................................ 51
8/17/2019 Dissertação Carolina Correções Norberto
12/103
4.4 4D LQTA-QSAR ..................................................................................................................................... 55
4.5 INTERPRETAÇÃO DOS DESCRITORES. ............................................................. ................................................. 58
5 CONCLUSÕES E PERSPECTIVAS. ..............................................................................................................68
6 REFERÊNCIAS ..........................................................................................................................................69
7 ANEXOS ..................................................................................................................................................76
7.1 ANEXO 1. SCRIPT PARA TRATAR A MATRIZ DE DESCRITORES DO OPEN3DQSAR ..................................................... 76
7.2 ANEXO 2. SCRIPT REALIZADO PARA A REALIZAÇÃO DOS FILTROS VIRTUAIS NO MATLAB. ........................................... 76
7.3 ANEXO 3. TABELA COM A REGRESSÃO PLS PARA O MELHOR MODELO 4D LQTA-QSAR ......................................... 78
7.4 ANEXO 4. ARQUIVO PDB DAS COORDENADAS DOS DESCRITORES. ........................................................ ................ 80
7.5 ANEXO 5. ARTIGO ............................................................... ................................................................. ..... 81
8/17/2019 Dissertação Carolina Correções Norberto
13/103
13
1. INTRODUÇÃO
1.1 Malária.
Os agentes etiológicos da malária são protozoários eucariotos unicelulares
pertencentes ao filo Apicomplexa, da família Plasmodiidae e ao gênero Plasmodium,
onde as espécies P. falciparum, P. vivax , P. malariae, e P. ovale são conhecidas por
causarem a doença. A malária é transmitida pela picada da fêmea do mosquito
Anopheles, compartilhamento de agulhas e seringas infectadas, transfusão de
sangue, ou da gestante para o bebê antes ou durante o parto. Os principais sinais
clínicos são febre alta, calafrio, sudorese e cefaleia. (MINISTÉRIO DA SAÚDE, 2010).
Apesar de na maioria dos casos a malária não apresentar um risco à vida, sua
manifestação em mulheres grávidas e crianças é de extremo perigo. A espécie P.
falciparum é a mais virulenta das formas de malária humana e é o principal causador
de casos relatados de mortes em crianças, além de ser a única capaz de evoluir para
malária cerebral (SNOW; KORENROMP; GOUWS, 2004).
A resistência crescente à terapia atual (WHITE et al., 1999) e enquadramento
da malária como uma doença negligenciada (BRASIL, 2008) denota a importância na
pesquisa em inovação para o planejamento de novos candidatos as fármacos
antimaláricos. De fato, as técnicas de modelagem molecular vem demonstrando umpapel importante na descoberta de candidatos a fármacos antimaláricos (BARMADE
et al., 2015).
O custo de realização desse tipo de projeto é puramente computacional, e por
isso, bastante reduzido e seus resultados podem minimizar despesas desnecessárias
na síntese dos compostos ativos. O uso de altos níveis da teoria quântica molecular é
mínimo nesse tipo de estudo, barateando ainda mais o custo computacional por
molécula investigada nos estudos QSAR. Dessa forma, com estações de trabalho,embora modestas, gera-se em tempo hábil resultados empíricos que podem ser
utilizados diretamente na triagem de novos compostos bem como na proposição de
estruturas químicas com possível atividade in vitro e in vivo.
1.1.1 Aspectos Epidemiológicos.
De acordo com a OMS (Organização Mundial da Saúde) a malária é uma doença
que põe em risco cerca de 3,2 bilhões de pessoas – quase metade da populaçãomundial. Estima-se que em 2015 ocorreram 214 milhões de casos de malária e 438
8/17/2019 Dissertação Carolina Correções Norberto
14/103
14
mil mortes. Felizmente, este é um número decrescente, nos últimos 15 anos a
incidência de casos de malária diminuiu 37% mundialmente. Os casos de morte,
também no mesmo período, diminuíram 60% em todas as idades. A África continua
sendo a região de maior incidência, com 89% dos casos mundiais (Figura 1). Apesar
da maioria dos casos se concentrarem na África, também há grande incidência de
casos de malária na Ásia, América Latina e parte do Oriente Médio (DALRYMPLE;
MAPPIN; GETHING, 2015; WHO, 2015).
Figura 1. Número de casos confirmados de malária em 2014.
Fonte: Global Malaria Mapper (Disponível em: < http://www.worldmalariareport.org>).
Para região da América Latina a quantidade de casos confirmados de malária
diminuiu de 1,2 milhões de casos no ano de 2000 para 390 mil casos em 2014. Ainda
no ano de 2014, foi reportado somente 79 casos de morte por malária, uma diminuição
de 80% dos casos quando comparados com os últimos 14 anos. O Brasil contabiliza
quase metade dos casos de mortes na região (WHO, 2015).
A malária transmitida através da picada de fêmeas do mosquito Anopheles spp.
Existem cerca de 400 espécies de Anopheles no mundo, onde somente 60 sãopossíveis vetores da malária e destes, 30 de maior importância epidemiológica. Nas
8/17/2019 Dissertação Carolina Correções Norberto
15/103
15
Américas, ocorrem principalmente as espécies Anopheles darlingi , Anopheles
aquasalis, Anopheles albimanus e Anopheles pseudopunctipennis. No Brasil, o
principal vetor é o A. darlingi (REY, 2011).
No Brasil, 99% dos casos de malária estão restritos à Amazônia Legal (Figura
2), totalizando cerca de 310 mil novos casos por ano, quase todos os casos s
causados pelo P. vivax (OLIVEIRA-FERREIRA et al., 2010). Apesar da baixa
incidência, quando comparada ao continente africano, o quadro endêmico nesta
região representa gastos substanciais para o Sistema Único de Saúde (SUS),
chegando a aproximadamente US$ 72 milhões apenas em 2014 (WHO, 2015).
Na Amazônia, a diminuição da incidência de casos por P. falciparum está
correlacionada a melhoras no diagnóstico. É provável também que a adição daassociação arterméter + lumefantrina à terapia no estado de Manaus e outros
municípios também contribuiu para a diminuição da incidência do P. falciparum. O
crescimento do número de casos de P.vivax pode ser explicado pela compensação
de comorbidades aguda ou crônica da malária (SAMPAIO et al., 2015).
Figura 2. Casos confirmados de malária no Brasil em 2014.
Fonte: adaptado de (WHO,2015).
Na Amazônia, a diminuição da incidência de casos por P. falciparum está
correlacionada com melhorias na agilidade do diagnóstico. É provável também que a
adição do tratamento medicamentoso associação arterméter + lumefantrina no estado
de Manaus e outros municípios também contribuiu para a diminuição da incidência do
P. falciparum. O crescimento do número de casos de P.vivax pode ser explicado pela
compensação de comorbidades agudas ou crônicas da malária (SAMPAIO et al.,
2015).
8/17/2019 Dissertação Carolina Correções Norberto
16/103
16
1.1.2 Ciclo evolutivo
O Plasmodium possui um ciclo biológico complexo, dividido em três etapas:
ciclo hepático, ciclo eritrocitário e ciclo esporocogônico. O seu desenvolvimento ocorre
envolvendo um hospedeiro invertebrado ( Anopheles) nas fases sexuadas e um
hospedeiro vertebrado no ciclo assexuado. O processo evolutivo do parasita requer a
expressão de proteínas, importantes para sua sobrevivência tanto no hospedeiro
invertebrado como vertebrado. (TUTEJA, 2007). A Figura 3 (próxima página)
apresenta as etapas envolvidas no ciclo de vida do Plasmodium spp.
Os esporozoítos (forma infectante), localizados nas glândulas salivares do
mosquito Anopheles, são inoculados no hospedeiro vertebrado durante a picada do
mosquito. Estas formas alcançam as células hepáticas em média de 30 a 60 minutos
após a picada (REY, 2013; TUTEJA, 2007). Antes que ocorra a infecção dos
hepatócitos, há a possibilidade dessas formas entrarem em diferentes células, sem
que ocorra o desenvolvimento. Os esporozoítos apresentam motilidade graças a
reorientação de proteínas de superfícies e de proteínas adesivas, que são essenciais
para invasão das células hospedeiras (BRAGA; FONTES, 2005; MOTA et al., 2001).
Os esporozoítos transformam-se em criptozoítos, que são estruturas
arredondadas que crescem e iniciam o ciclo de reprodução assexuada. Apósnumerosas divisões nucleares passa a constituir um esquizonte. No P. falciparum, a
fase esquizogonia pré-eritrocítica dura 6 dias, enquanto que em P. vivax dura 8 dias.
Essa é a primeira fase do ciclo, denominada exoeritrocítica, antecedendo o ciclo
sanguíneo (REY, 2013).
Em infecções causadas por P. falciparum e P. malariae, os esquizontes se
rompem todos ao mesmo tempo e não persistem no interior dos hepatócitos. Já no P.
ovale e no P. vivax , algumas formas exo eritrocı ́ticas, denominadas hipnozoı ́taspermanecem latentes no fígado, e parecem ser responsáveis pelas recidivas tardias
da doença (BRAGA; FONTES, 2005).
O ciclo eritrocítico se inicia quando os esquizontes localizados nas células
hepáticas dão origem aos merozoítos, que são liberados após o rompimento da célula
parasitada. Os merozoítos invadem as hemácias iniciando ciclo eritrocítico, onde se
desenvolvem e multiplicam por divisão binária até romperem a célula e serem
liberados na corrente sanguínea para infectar novamente outras hemácias (REY,
2013). Para o P. falciparum o ciclo sanguíneo se repete a cada 48 horas (NEVES,
2005).
8/17/2019 Dissertação Carolina Correções Norberto
17/103
17
Figura 3. Ciclo de vida do Plasmodium no homem e mosquito.
Fonte: adaptado de (ERSMARK; SAMUELSSON; HALLBERG, 2006)
Os merozoítos podem também se diferenciar em estágios sexuados,
gametócitos femininos (macrogametócitos) e masculinos (microgametócitos) que irão
dar início ao ciclo sexuado (esporogônico) no vetor. O inseto, após se alimentar de
sangue infectado pode ingerir esses gametócitos. Estes gametas se fundem e formam
um zigoto. O zigoto se diferencia em oocineto, que por sua vez migra até o intestinodo inseto e dá origem a um oocisto. O oocisto maduro libera estes esporozoítos que
8/17/2019 Dissertação Carolina Correções Norberto
18/103
18
migram para as glândulas salivares, podendo infectar outros seres humanos.
Retomando assim, o ciclo (DOUGLAS et al., 2015; TUTEJA, 2007).
O período de incubação da doença varia de 7 a 14 dias, podendo, contudo,
chegar a vários meses devido às formas latentes de P. vivax e P. malariae. A crise
aguda caracteriza-se por episódios de febre, calafrios, tosse, dificuldade respiratória,
dor nas articulações, dor de cabeça, diarreia, vômitos e convulsões. Os intervalos
entre as febres acompanham os ciclos repetidos de obstrução dos eritrócitos,
repetindo-se a cada 48 horas para infecções por P. vivax e P. falciparum e de 72 horas
para infecções causadas pelos demais parasitos (TUTEJA, 2007).
A gravidade do quadro clínico da malária depende da espécie do parasito, da
quantidade de parasitos circulantes, do tempo de doença e do nível de imunidadeadquirida pelo paciente. O P. falciparum está sempre associado a quadros graves,
acarretando em complicações clínicas como icterícia, insuficiência renal, anemia
grave e obstrução dos capilares que levam sangue ao cérebro (SNOW;
KORENROMP; GOUWS, 2004; TUTEJA, 2007).
1.1.2.1 Degradação da hemoglobina.
O parasita degrada a hemoglobina (Hb) nas células eritrocíticas do hospedeirodurante fases morfológicas distintas do seu ciclo evolutivo (esquizonte e trofozoíta). A
atividade metabólica varia muito entre as fases e é mais intensa durante o estágio
trofozoita (GOLDBERG, 1993). A hemoglobina, uma proteína tetramérica com ~64k
Da, é metabolizada pelas enzimas do parasito. Esses aminoácidos obtidos da
metabolização são utilizados para biossíntese de proteínas do próprio Plasmodium.
Ajudando a manter a osmolaridade intracelular durante esta fase de crescimento
intenso (MOURA; DAME; FIDOCK, 2009).O P.falciparum digere mais de 80% da hemoglobina do eritrócito, para nutrir o
parasito durante sua fase de crescimento e replicação assexuada na fase eritrocítica.
(LAZARUS; SCHNEIDER; TARASCHI, 2008). A degradação da hemoglobina ocorre
via proteases dentro do vacúolo digestivo do parasita e a sua internalização ocorre
por meio do citostoma, uma invaginação da membrana externa do vacúolo (MILANI;
SCHNEIDER; TARASCHI, 2015). A hematina livre é potencialmente tóxica tanto para
o parasito quanto seu hospedeiro, devido a sua atividade membranotropica. Para
bloquear essa toxicidade o Plasmodium sequestra a hematina na forma do pigmento
malárico cristalizado e insolúvel, hemozoina (AZOUZI; EL KIRAT; MORANDAT,
8/17/2019 Dissertação Carolina Correções Norberto
19/103
19
2015). Fármacos como cloroquina, se acumulam no vacúolo digestivo e interferem
neste processo (SCHOLL; TRIPATHI; SULLIVAN, 2005). As quinolinas agem
interferindo no processo de transformação da hematina (GOLDBERG, 1993).
O processo de degradação apresenta uma cascata ordenada de reações
(Figura 4). Várias enzimas são atribuídas ao processo de degradação, no P. falciparm
são as proteases aspárticas (Plasmepsinas (Plm) – I, II, IV e HAP), falcipainas,
metaloproteases (falcilisina) e dipeptil aminopeptidases (DPAP 1). A clivagem inicial
se dá nos resíduos Phe33 e Leu34 na cadeia A da hemoglobina, região do domínio
responsável por manter a estabilidade da estrutura quaternária. A clivagem
subsequente da Hb em peptídeos menores é realizada pelas proteases plasmepsinas
e falcipainas. Esses peptídeos menores são então clivados pela falcilisina, DPAP 1 eaminopeptidases formando os aminoácidos que são aproveitados pelo Plasmodium.
(ERSMARK; SAMUELSSON; HALLBERG, 2006).
Figura 4. Rota geral do metabolismo da hemoglobina no P. falciparum.
Fonte: adaptado de (ERSMARK, 2006).
1.1.3 Tratamento / Quimioterapia e Resistência.
O tratamento da malária deve tanto prevenir a ocorrência de casos graves
quanto eliminar fontes de infecção para os mosquitos. Tratamento e diagnósticoadequado tem grande contribuição para redução e erradicação da doença, mas
8/17/2019 Dissertação Carolina Correções Norberto
20/103
20
enfrentam grandes dificuldades frente a não existência de uma única terapia eficaz
contra as quatro espécies parasitárias que infectam o ser humano. Além da crescente
resistência do P. falciparum aos esquemas terapêuticos utilizados (BRASIL, 2010).
A conduta terapêutica na utilização dos fármacos antimaláricos deve levar em
consideração a tolerabilidade, segurança e tratamento com regimes de curta duração.
Atualmente se preconiza o uso de associações entre antimaláricos com mecanismos
de ação distintos, tornando o tratamento mais efetivo e evitando a expansão dos casos
de resistência (GINER ALMARAZ et al., 2010; PETERSEN; EASTMAN; LANZER,
2011).
Os fármacos antimaláricos são compostos naturais ou sintéticos. Os
antimaláricos eritrocíticos atuam nas formas presentes nas células sanguíneas dohomem enquanto que os antimaláricos gametocíticos atuam nas formas sexuadas do
parasita no individuo, com o intuito de evitar a disseminação da doença caso o
indivíduo seja picado (GRIMBERG; MEHLOTRA, 2011). Grande parte dos fármacos
utilizados na rotina como antimaláricos são denominados esquizonticidas sanguíneos,
porque apresentam ação sobre os estágios assexuados sanguíneos do parasita
responsáveis pelas manifestações clínicas (BIAMONTE; WANNER; LE ROCH, 2013;
PRAZERES et al., 2007).Os medicamentos antimaláricos podem ser classificados de acordo com seu
grupo químico (Figura 5) : 4-aminoquinolinas (cloroquina e amodiaquina), aril-
aminoálcoois (quinina, mefloquina, halofantrina e lumefantrina), 8-aminoquinolinas
(primaquina), peróxido de lactona sesquiterpênica (derivados da artemisinina),
naftoquinonas (atovaquona) e os antibióticos (tetraciclina, doxiciclina e
clindamicina)(BRASIL, 2010). A primeira terapia amplamente utilizada para as quatro
espécies do parasita que causam a malária foi a quinina e seus derivados sintéticos,desde o século XVII. Na segunda metade do século XX, a cloroquinolona foi utilizada
como medicamento de primeira linha para o tratamento das quatro espécies de
Plasmodium e uma combinação de sulfadoxina e pirimetamina como tratamento de
segunda escolha (WELLS; ALONSO; GUTTERIDGE, 2009).
No Brasil, o esquema terapêutico para casos não complicados de malária são
realizado com cloroquina e primaquina, para infecções pelo P. falciparum usa-se a
combinação de artemeter+lumefantrina e artesunato+mefloquina e o tratamento de
segunda escolha é realizado com quinina, doxiclina e primaquina (BRASIL, 2010).
Comumente, a terapia da malária é utilizada em associação com outros
8/17/2019 Dissertação Carolina Correções Norberto
21/103
21
quimioterápicos, como sulfonamidas (sulfadoxina), tetraciclinas (tetraciclina,
doxicilina) e lincosaminas (clindamicina e lincomicina), mas o seu uso apresenta
inconvenientes como administração de regimes complexos e rígidos e muitos efeitos
colaterais. O que contribui para interrupção do tratamento e o consequente
desenvolvimento de resistência do parasita (PIMENTEL et al., 2007).
Figura 5. Principais fármacos utilizados no tratamento da malária
8/17/2019 Dissertação Carolina Correções Norberto
22/103
22
Fonte: elaborado pelo autor
O aparecimento de cepas multirresistentes aos fármacos antimaláricos
disponíveis tem impulsionado a pesquisa de novos fármacos. A Tabela 1 ilustra osprincipais candidatos a fármacos em fase clínica de desenvolvimento no ano de 2014.
É possível observar que a maioria dos candidatos são novas associações de
medicamentos, ou mudança de formulação, ou adequação de doses para pacientes
pediátricos (MMV, 2014) ou reproposição de outras terapias (KUNDU et al., 2015).O
que não sana a real necessidade apontada pelo surgimento de cepas resistentes a
maioria das terapias atuais, que é o planejamento e desenvolvimento de novas
moléculas.
Tabela 1. Candidatos a fármacos em estudos clínicos durante o ano de 2014.Fase I Fase II Fase III Fase IV Registro
DSM 265
(Takeda)
OZ439/PQ
(Sanofi)
Tafenoquina
(GSK)
Artesunato
retal
Artesunato
injetável (Guilin)
MMV 048
(UCT/TIA)
Ferroquina
(Sanofi
Aventis )
co-
trimoxazol( in
stituto
Medicina
Tropical)
Pironaridina/Ar
tesunato
pediátrico
(Shin Poong)
ACT (Sigma –
Tau)
P218 (Novatis ) KAE609
( Novartis )
ASAQ (Sanofi
Aventis/DNDi)
GSK030
(GSK)
KAF156
( Novartis)
Pironaridina/Art
esunato
(Shin Poong)Fonte: adaptado de (MMV, 2014).
1.1.4 Resistência
A partir da década de 90 estudos já apontavam para a resistência global à
múltiplos fármacos pelo P.falciparum nos casos agudos de malária (WHITE et al.,
1999). Terapias combinadas a base de artemisinina são utilizadas atualmente nos
programas de controle globais em resposta a resistência do P .falciparum (MAZIER;RÉNIA; SNOUNOU, 2009). A descoberta de parasitas com diminuição da
8/17/2019 Dissertação Carolina Correções Norberto
23/103
23
sensibilidade a artemisinina (WELLS, 2010), os efeitos colaterais da atual terapia
medicamentosa e a ausência de vacinas efetivas (HOFFMAN et al., 2015; LONGLEY;
HILL; SPENCER, 2015; RICHIE; SAUL, 2002) denotam a necessidade da busca por
novos alvos terapêuticos e do desenvolvimento de uma nova geração de fármacos
para o tratamento, controle e erradicação da malária (WELLS; VAN HUIJSDUIJNEN;
VAN VOORHIS, 2015).
O principal mecanismo de resistência à cloroquina está relacionado com
mutações no gene Plasmodium falciparum cloroquine resistance transporter (PFCRT),
que permite alterações nos transportadores de membrana. Polimorfismo no gene
Plasmodium falciparum multidrug resistance I (PFMDRI) estão relacionados a
resistência a quinina e mefloquina. Mutações no gene Citocromo b conferemresistência a atovaquona, que acarretam em mutações no sitio ativo da enzima alvo,
diminuindo a afinidade de ligação do fármaco (ARAV-BOGER; SHAPIRO, 2005) .
Mutações nos genes das enzimas diidrofolato redutase (DHFR) e diidropteroato
sintetase (DHPS) estão associados a resistência a pirimetamina e sulfadoxina,
respectivamente, para o P.falciparum (BASCO; RINGWALD, 1998). A resistência a
artemisinina está relacionada a uma maior expressão do gene PFMDR I (AFONSO et
al., 2006) e a resistência ao artesunato está relacionada a uma mutação no gene daubiquitina (HUNT et al., 2007).
1.2 Descoberta de Fármacos.
A descoberta e o desenvolvimento de fármacos pode ser dividida em três fases.
A fase de descoberta, na qual ocorre a identificação e validação do alvo,
desenvolvimento de ensaios, identificação e otimização de compostos protótipos e
seleção de candidatos a fármacos. Fase de estudos pré-clínicos, onde sãoexecutados estudos extensos em animais. Fase de desenvolvimento clínico: durante
a qual o composto selecionado é testado quanto à eficácia, efeitos colaterais e riscos
potenciais em humanos (NWAKA; RIDLEY, 2003). O processo de pesquisa e
desenvolvimento de fármacos, então, consiste e uma etapa de descoberta (pesquisa)
e desenvolvimento (ensaios pré-clínicos e clínicos) (ELEBRING; GILL; PLOWRIGHT,
2012).
8/17/2019 Dissertação Carolina Correções Norberto
24/103
24
1.2.1 Ferramentas computacionais para o desenvolvimento de fármaco.
O planejamento de novos candidatos a agentes terapêuticos e otimização
destes pode ser obtido por diferentes estratégias da Química Medicinal. A escolha da
estratégia a ser adotada depende da elucidação da estrutura do alvo (BARREIRO,
2009). A utilização de métodos computacionais no processo de pesquisa e
desenvolvimento de novos fármacos é uma área de destaque nos últimos anos. O
conhecimento das estruturas de alvos macromoleculares ou de complexos ligante-
receptor permite a aplicação de estratégias de planejamento de fármacos baseado na
estrutura (SBDD - Structure-based Drug Design) (COHEN, 1996).
Pela exploração de bancos de dados que compilam informações sobre testes
biológicos em alvos proteicos podem ser construídos modelos de previsão da
atividade biológica a partir da relação quantitativa da atividade destes compostos com
a sua estrutura (QSAR – Quantitative Structure-Activity Relationship) (VERMA;
KHEDKAR; COUTINHO, 2010). A metodologia de QSAR foi inicialmente estabelecida
na década de 1960, pelos trabalhos de Hansch e Fujita (HANSCH; FUJITA, 1964). O
QSAR desempenha um papel vital no design de novos fármacos, já que se trata de
uma metodologia que permite um custo baixo, processamento rápido e diminuição daquantidade de amostras in vitro geralmente envolvidas (PATEL et al., 2014).
O objetivo do estudo QSAR é a criação de modelos capazes de prever a
atividade ou propriedade e explicar as relações entre características estruturais
específicas (descritores moleculares) e atividade biológica ou propriedade. Métodos
estes que já se tornaram uma parte essencial do desenvolvimento de novas moléculas
na atualidade. Atualmente, nenhum fármaco é criado sem a análise por QSAR
(ANDRADE et al., 2010).Métodos de QSAR são classificados de acordo com a dimensionalidade dos
descritores utilizados, estabelecendo quantitativamente a correlação entre
propriedades da estrutura química das moléculas e a atividade biológica. Assim, são
desenvolvidos modelos matemáticos capazes de prever a atividade biológica de
moléculas, através de um conjunto de dados (HANSCH; FUJITA, 1964).
Diferentes tipos de descritores químicos refletem diferentes níveis de
representação estrutural. Esses descritores podem ser classificados quanto à sua“dimensionalidade”: unidimensionais (1D), baseados em propriedades físico-químicas
e da fórmula molecular (ex., massa molecular, refratividade molar, logP, entre outros);
8/17/2019 Dissertação Carolina Correções Norberto
25/103
25
bidimensionais (2D), que descrevem propriedades que podem ser calculadas de uma
representação 2D (ex., número de átomos, número de ligações, índices de
conectividade, entre outros); e tridimensionais (3D), que dependem da conformação
das moléculas (ex., volume de Van der Waals, área de superfície acessível ao
solvente, entre outros) (XUE; BAJORATH, 2000).
1.2.2 QSAR-4D
A análise de QSAR-4D, proposta inicialmente por Hopfinger e colaboradores
(HOPFINGER et al., 1997) incorpora a liberdade conformacional com o alinhamento
para o desenvolvimento de modelos QSAR-3D levando em conta, então uma quarta
dimensão para os descritores moleculares. Nessa abordagem, os valores dos
descritores são as ocupações medidas para os átomos que compõe as moléculas do
conjunto investigado a partir da amostragem de conformação e do espaço de
alinhamento (ANDRADE et al., 2010).
Uma nova abordagem de QSAR-4D, desenvolvida pelo grupo Laboratório de
Quimiometria Teórica e Aplicada (LQTA – Unicamp) é baseado na geração de um
perfil de amostragem conformacional para cada composto. Ao invés de somente uma
conformação seguindo os princípios do QSAR-3D (KUBINYI, 1997). Esse perfilconformacional é seguido para os cálculos de descritores 3D (MIFF - Molecular
Interaction Fields ou descritores de interação molecular).
Essa metodologia contempla simultaneamente, as principais características do
método CoMFA (Comparative Molecular Field Analisys). Técnica desenvolvida por
Cramer que demonstra que a propriedade biológica dos compostos pode ser
correlacionada com as energias estéricas e eletrostática (descritores MIF)
provenientes das interações formadas com o ligante no sítio ativo do alvo biológico(CRAMER; PATTERSON; BUNCE, 1988) e o QSAR-4D (HOPFINGER et al., 1997).
Essas metodologias de QSAR-3D e 4D apresentam alguns problemas. No
QSAR-3D realizado pelo CoMFA, o fato da conformação bioativa não ser conhecida
acarreta ao usuário fazer a escolha de uma única conformação para cada molécula
(geralmente a conformação bioativa). Em QSAR-4D a ausência dos descritores de
interação dificultam a interpretação dos modelos obtidos (GHASEMI; SAFAVI-SOHI;
BARBOSA, 2012). Aliás, não existe programas livres que possibilite a geração dedescritores para essas duas metodologias. Existe uma versão gratuita do programa,
Open3DQSAR (TOSCO; BALLE, 2011), mas para utilizar o CoMFA é necessário
8/17/2019 Dissertação Carolina Correções Norberto
26/103
26
adquirir a versão do programa pago. Para usar o QSAR-4D, é necessário adquirir uma
licença colaborativa com o grupo do Hopfinger.
O LQTA-QSAR faz uso do pacote livre GROMACS (VAN DER SPOEL et al.,
2005) para calcular as simulações de dinâmicas moleculares (MD) e estimar o perfil
conformacional gerado. As simulações de MD podem ser desenvolvidas considerando
moléculas de solvente explicito, que gera aproximações biológicas mais precisas (mas
aumenta o custo computacional) ou com solvente implícito, menos dispendioso.
O programa open3DQSAR gera ao redor do alinhamento de todas as estruturas
uma caixa virtual cúbica (grid) (Figura 6). A energia de interação para cada tipo de
campo de interação molecular (descritores estéricos e eletrostáticos) para onde, onde
em casa canto do grid, as interações entre uma sonda e cada moléculas sãocalculadas (PATEL et al., 2014; TOSCO; BALLE, 2011).
A geração de descritores MIF pelas metodologias de QSAR 3D geram uma
quantidade exorbitante de descritores. O número total de variáveis disponíveis é muito
maior do que o número que será efetivamente incluído nos modelos, incluindo ruído e
informações redundantes ou irrelevantes (TEÓFILO; MARTINS; FERREIRA, 2009a).
O objetivo da seleção de variáveis é diminuir o volume de processamento de data e
melhorar a performance preditiva do modelo(ARAKAWA; HASEGAWA; FUNATSU,2007; GONZÁLEZ et al., 2008).
Figura 6. Representação de uma caixa cúbica utilizada para calcular descritores MIF. A sonda utilizada para calcular as energias de interação está no canto superioresquerdo.
Fonte: (RONCAGLIONI; BENFENATI, 2008).
8/17/2019 Dissertação Carolina Correções Norberto
27/103
27
O algoritmo de seleção de preditores ordenados (OPS) (TEÓFILO; MARTINS;
FERREIRA, 2009a) foi desenvolvido para realizar esta seleção das variáveis. A
seleção com algoritmo OPS é realizada através do programa QSARModelling(Disponível em: < http://lqta.iqm.unicamp.br/programasOPS.html>) (MARTINS et al.,
2009). A regressão multivariada para construir o modelo é feita com o método de PLS
( partial least squares).
O OPS visa melhorar a qualidade dos modelos de regressão, removendo
descritores que possuem baixa capacidade de prever a atividade biológica. Para isso
é feito um ordenamento dos descritores utilizando um vetor informativo. Esse vetor
informativo pode ser a correlação destes descritores com a atividade biológica, oumesmo os valores de regressão multivariada (vetor de regressão do PLS). Os modelos
são construídos com um determinado número de descritores (janela inicial) e
posteriormente tal janela é aumentada de um incremento fixo até que todas os
descritores ou uma porcentagem do total sejam adicionadas a esta. O conjunto de
variáveis que apresentarem os melhores parâmetros de qualidade contém as
variáveis que apresentam a melhor capacidade de previsão para o modelo construído
e, portanto, são estas as variáveis selecionadas (TEÓFILO; MARTINS; FERREIRA,
2009a). A Figura 7 mostra um esquema do algoritmo OPS.
Figura 7. Funcionamento esquemático do OPS.
Fonte : adaptado de (TEÓFILO; MARTINS; FERREIRA, 2009a).
8/17/2019 Dissertação Carolina Correções Norberto
28/103
28
1.2.3 Descritores moleculares de interação.
Na metodologia QSAR-3D a energia de interação de um átomo de prova ou
fragmento molecular (sonda) com cada molécula em uma conformação alinhada écalculada em ponto de uma grade e constitui os descritores chamados de campo de
interação molecular (MIF, molecular interacion fields) (CRUCIANI, 2006).
As energias de interação mais empregadas são as de van der Waals e
Coulomb, calculadas por funções comuns aos campos de força moleculares, como o
potencial de Lennard-Jones (LJ) (2) e o potencial de Coulomb (1), respectivamente.
∑ = (1) ∑ −6 = (2)
Onde E QQ e a E vdw são as energias que irão compor os descritores eletrostáticos
(QQ) e de Van der Waals calculada pelo potencial de Lennard-Jones (VDW). qsonda
é a carga da sonda, qk é a carga parcial do átomo k da molécula, D é a constante
dielétrica, e r sondak é a distância da sonda dentro da grade virtual até o átomo k da
molécula. Os termos A e C são constantes dependentes do raio de van der Waals
parametrizados para o campo de força usado no cálculo da energia (MARTINS et al.,
2009).
Os descritores no modelo final com a metodologia LQTA QSAR são expressos
como esferas, coloridas de acordo com o sinal do vetor de regressão e a natureza dos
descritores (LJ ou QQ). Diferentemente do CoMFA que os descritores de interação
são demonstrados através de mapas de contorno (Figura 8).
8/17/2019 Dissertação Carolina Correções Norberto
29/103
29
Figura 8. Exemplo de exibição espacial de descritores para a metodologia LQTA eCoMFA. a) Representação descritores LJ e QQ em esferas. b) Mapas de contornoobtidos por CoMFA.
Fonte : adaptado de (a) (DE ARAÚJO SANTOS et al., 2014) e (b) (DOWEYKO, 2004).
1.2.4 Validação dos modelos de LQTA-QSAR
A validação do modelo QSAR é essencial para garantir a qualidade da
capacidade de previsão do modelo. Para tanto, a validação deve ocorrer tanto demaneira interna (do próprio modelo) quanto de maneira externa (do grupo de
previsão). A validação cruzada (leave-one-out - LOO) é utilizada para determinar o
número de variáveis latentes no modelo PLS (KIRALJ; FERREIRA, 2009). A validação
cruzada leave-one-out consiste em excluir uma amostra de cada vez do conjunto de
treinamento, construir um modelo sem essa amostra, e então realizar a previsão da
atividade para esta amostra deixada de fora. O procedimento é realizado quantas
vezes for o número das amostras do conjunto de treinamento. A diferença entre ovalor experimental e o estimado para as amostras retiradas são usados para calcular
8/17/2019 Dissertação Carolina Correções Norberto
30/103
30
o erro padrão da validação cruzada (SEV , standart error of validation) e o coeficiente
de correlação da validação LOO (Q2 ). O modelo com todas as amostras é expresso
em termos do coeficiente de correlação de determinação múltipla (R 2 ) e o erro padrão
de calibração (SEC , standart error of calibration).
Se a diferença entre os valores de Q2 LOO e R 2 for de 0,2 a 0,3 há indícios de
sobreajuste do modelo. É preconizado que os valores de Q² e R² devem ser maiores
que 0,6 para um modelo satisfatório (CHIRICO; GRAMATICA, 2011; GRAMATICA,
2007; KIRALJ; FERREIRA, 2009). A tabela 2 mostra os parâmetros estatísticos
básicos para os modelos de regressão.
Tabela 2. Parâmetros estatísticos básicos para modelos de regressão.Parâmetro Definição
Coeficiente de validação cruzada 1 ∑ ²=
∑ []²=
Coeficiente de correlação de
determinação múltipla 1 ∑ ²
∑ []²
Coeficiente de correlação de validação
externa 1
∑ ²∑ []²
A validação cruzada Leave-N-out (LNO) é recomendada para testar a robustez
do modelo. Diferente do LOO, são retiradas do conjunto de treinamento N amostras
em bloco. Um novo modelo é construído sem estas amostras, e os valores de
atividade biológica são previstos para o bloco de amostras separadas para validação.
O valor de N deve apresentar uma porção significativa das amostras, sendo
preconizado um número de 20% a 30% de amostras a serem retiradas (CHIRICO;
GRAMATICA, 2011). Os coeficientes de correlação da validação cruzada LNO
(Q2LNO) são calculados da mesma maneira que para Q2 LOO. É recomendado um
valor máximo de oscilação de 0,1. Os resultados do teste de LNO é expresso através
de um gráfico que mostra o desvio máximo entre Q2 LOO e Q2 LNO. Devem também
ser expressos dois desvios padrão ao redor do valor médio para a diferença entre o
Q2 LOO e Q2 LNO (KIRALJ; FERREIRA, 2009).
8/17/2019 Dissertação Carolina Correções Norberto
31/103
31
O último teste, de y-randomization detectar e quantifica as chances de
correlações ao acaso entre a variável dependente e os descritores. De modo que o
modelo não seja obtido ao acaso. O teste consiste em construir vários modelos com
as variáveis independentes, mas utilizando valores randomizados da matriz de
variáveis latentes (y). Nessas condições, os modelos obtidos não podem obter valores
bons de Q² e R² LOO. Valores ideais para os parâmetros obtidos com o teste y-
randomization, Q²yrand e R²yrand são preconizados como : Q²yrand e R²yrand < 0,2 para
um modelo obtido sem chance de correlação ao acaso (ERIKSSON et al., 2003).
Os resultados do teste ainda podem ser expressos levando em conta o
coeficiente de correlação absoluta de Pearson, |r|. São construídos dois gráficos, no
eixo y com os valores de Q2 yrand e outro R 2 yrand e no eixo x os valores de |r| para osdois gráficos. É feita então uma regressão linear com os valores e se o modelo foi
obtido com descritores que possuem correlação ao acaso, os interceptos desses
gráficos são aQ > 0,05 e aR > 0,3. Estes interceptos são medidas da correlação ao
acaso (KIRALJ; FERREIRA, 2009).
1.3 Aplicação do LQTA-QSAR para alvos e inibidores de proteína de P. falciparum
1.3.1 Plasmepsina II do Plasmodium falciparum. Presentes no P. falciparum, as plasmepsinas são um grupo de dez isoformas
de proteases aspárticas presentes no Plasmodium e estão envolvidas no processo de
degradação da hemoglobina. Quatro proteínas são ativas no vacúolo alimentar (I, II,
IV e HAP) e são expressas na fase eritrocítica. Proteases aspartáticas se constituem
de uma das maiores subclasses de proteínas e são encontradas em sua maioria,
somente em eucariotos (ERSMARK; SAMUELSSON; HALLBERG, 2006).
A utilização das Plm como alvos farmacológicos já é uma realidade no mercadode fármacos. O FDA (Food and Drug Administration) já aprovou fármacos tanto para
alvos em humanos quanto na terapia contra o HIV. A maioria desses esforços foi
guiado pelo projeto de protótipos baseados em estrutura. As descobertas feitas nos
últimos vinte anos quanto ao design de fármacos permitem uma orientação para o
descobrimento de possíveis novos compostos para a inibição das plasmepsinas.
Existe uma vasta coleção na literatura de compostos com atividade inibitória
comprovada contra a enzima, que podem se tratar de ponto de partida para a pesquisa
8/17/2019 Dissertação Carolina Correções Norberto
32/103
32
de um novo antimalárico (BJELIC et al., 2007; J. MEYERS; E. GOLDBERG, 2012;
WEGSCHEID-GERLACH; GERBER; DIEDERICH, 2010).
O desenvolvimento de fármacos baseado na estrutura dos receptores foca
primariamente na Plm II como alvo proteico, pois se trata da primeira estrutura
cristalográfica a ficar disponível para pesquisa. (HUIZING; MONDAL; HIRSCH, 2015;
SILVA et al., 1996). O sequenciamento da Plm II também permitiu o desenvolvimento
in silico de modelos para a Plm I, IV e HAP, considerando que o sitio ativo destas
proteínas são similares – 63% de similaridade (BHAUMIK; GUSTCHINA;
WLODAWER, 2012; ERSMARK; SAMUELSSON; HALLBERG, 2006).
A estrutura madura da Plm II tem 329 aminoácidos e consiste em dois domínios
(C- e N-terminal), apresentando a forma típica bilobal das proteases aspárticas, formaesta que define o sítio ativo. Cada domínio contribui com um resíduo de ácido
aspártico para compor o sítio catalítico da proteína, Asp214 e Asp34 (Figura 9). É
formada ainda por uma formação de grampo β (β-hairpin) e um uma aba ( flap) que
cobre o sitio ativo e interage com o substrato (ASOJO et al., 2003; ERSMARK;
SAMUELSSON; HALLBERG, 2006; SILVA et al., 1996).
Figura 9.Mecanismo da quebra da ligação peptídica feita pelas proteases aspárticas.
Fonte: adaptado de (J. MEYERS; E. GOLDBERG, 2012)
A Figura 10 mostra uma lista dos principais resíduos de aminoácidos e como
se organizam em bolsões hidrofóbicos de interação. Essas regiões de bolsões estão
denominados de acordo os dados de Schechter e colaboradores (SCHECHTER;
BERGER, 1967), seguindo a adaptação feita por Huizing (HUIZING; MONDAL;
HIRSCH, 2015). Em azul a região S2’; em laranja a região S1’; em amarelo a aba; em
vermelho a díade catalítica; em verde a região S1/S3 e em roxo a região S2.
8/17/2019 Dissertação Carolina Correções Norberto
33/103
33
Figura 10. Estrutura cristalográfica da Plasmepsina.II.
Fonte: elaborado pelo autor.
Tabela 3. Lista dos principais resíduos de aminoácidos e suas regiões respectivas nositio ativo da Plm II.
Díade
AspFlap S1/S3 S2 S1' S2'
Asp34,
Asp214.
Pro43,
Met75,
Val105,
Phe111,
Ile123,
Tyr77.
Tyr17, Ile32,
Ser215,
Ser218,
Phe120,
Met15,
Ile123,Ile14,
Thr114.
Pro243,
Leu271,
Phe244,
Met286,
Ile290,
Tyr273.
Tyr192,
Trp193,
Ile300,
Ile212,
Phe294.
Asn39,
Leu131,
Ser132,
Ile133.
Esse grupo de proteínas é capaz de clivar a cadeia A da hemoglobina entre os
resíduos Phe33 e Leu34 (BRINKWORTH et al., 2001). Acredita-se que tal processo
induza um desenrolamento da proteína e permita a exposição de mais sítios catalíticos
(ASOJO et al., 2003). Sendo assim, as plasmepsinas responsáveis pelo metabolismo
da hemoglobina, são também consequentemente responsáveis pelos sintomas
clínicos característicos da malária (febre); reforçando a proteína como alvo potencialpara terapia antimalárica.
8/17/2019 Dissertação Carolina Correções Norberto
34/103
34
1.3.2 Inibidores da Plasmepsina II : alofenilnorstatinas.
A principal estratégia do planejamento de inibidores das Plasmepsinas utiliza a
ação da díade catalítica formada pelos resíduos de ácido aspártico. O mecanismo de
ação consiste na clivagem da ligação peptídica, gerando um substrato intermediário
tetraédrico. Análogos desse substrato intermediário simulam a interação com as Plm
de maneira mais específica. Isósteros desse estado de transição são definidos por
possuir um grupamento funcional capaz de simular esse intermediário, mas é mais
resistente a clivagem da proteína. Os inibidores peptidiomiméticos (Figura 11)
resistentes a essa clivagem são amidas reduzidas, estatinas, estatinas reversas
hidroxietilaminas, hidroxipropilaminas, norstatinas e dihidroxietilenos (C e N
duplicados) (DAN; BHAKAT, 2015).
Figura 11. Inibidores peptidiomiméticos das plasmepsinas.
Fonte: adaptado de (PÉREZ et al., 2013).
As norstatinas foram previamente desenvolvidas como inibidores de HIV e
utilizadas pela primeira vez como inibidores de Plasmepsina II por Nezami e
8/17/2019 Dissertação Carolina Correções Norberto
35/103
35
colaboradores, com uma série de norstationas com um núcleo de alofenilnorstatinas
associado a tiazolidina (NEZAMI et al., 2002).
Em uma colaboração entre a Universidade Jonhs Hopkins e Universidade
Farmacêutica de Kyoto, a série chamada de KNI, com o intuito final de inibir as quatro
Plasmepsinas I, II, IV e HAP presentes no vacúolo digestivo, mas primariamente a
plasmepsina II com maior potência pelo design de inibidores adaptativos (HIDAKA et
al., 2007; KISO et al., 2004; MIURA et al., 2010; NEZAMI et al., 2002). Essa estratégia
tenta planejar inibidores mais potentes e específicos que interagem com as regiões
mais conservadas no sitio ativo (área catalítica) e mantendo a flexibilidade dos
compostos para que se adaptem as regiões menos conservadas (S2, S1’ e flap) da
proteína (NEZAMI et al., 2003).Compostos baseados nesse núcleo químico demonstraram grande
biodisponibilidade e baixa toxicidade. As alofenilnorstatinas apresentam uma estrutura
similar ao primeiro sitio de clivagem da hemoglobina, Phe33-Leu34 e a porção
tiazolidina simula uma leucina conformacionalmente restringida. Estudos de docking
realizados por Nezami (NEZAMI et al., 2002) demonstraram que as alofenilnortatinas
se ligam a Plasmepsna II da mesma forma que a Pepstatina A (Figura 12), um potente
inibidor natural da proteases aspárticas (ASOJO et al., 2003). Interações doscompostos com os resíduos da Plm II sugeriam que a otimização desta classe deveria
ser direcionada para interações com o flap e as bordas dos bolsões de interações.
(NEZAMI et al., 2003).
Figura 12. Pepstatina A e alofenilnorstatina.
8/17/2019 Dissertação Carolina Correções Norberto
36/103
36
Fonte: elaborado pelo autor
8/17/2019 Dissertação Carolina Correções Norberto
37/103
37
2 OBJETIVOS
O objetivo geral dessa dissertação consiste no desenvolvimento de um modelo de
previsão LQTA-QSAR para uma série de inibidores da Plasmepsina II.
2.1 Objetivos específicos
Padronização do conjunto de dados de compostos ativos contra o Plasmodium
falciparum para a geração d modelo.
Desenvolvimento do modelo de LQTA-QSAR-4D
Validar extensivamente o melhor modelo obtido.
Identificação de pontos estruturais relevantes para a atividade biológica por
meio da interpretação dos descritores.
8/17/2019 Dissertação Carolina Correções Norberto
38/103
38
3 MATERIAL E MÉTODOS
3.1 Material
3.1.1 Computadores.
Todos os estudos foram realizados no Laboratório de Química Farmacêutica
Computacional, em estações computacionais operando em Linux, com processadores
Intel® Xeon®E5-2690, 2.9 GHz, 20 MB cache, 16 GB RAM. Os softwares utilizados
estão disponíveis através de licenças acadêmicas ou são de uso livre.
3.1.2 Conjunto de dados
Para os estudos de modelagem molecular, foram selecionados um conjunto de
dados de 49 inibidores derivados da estrutura do ácido (2S,3S) -3-amina-2-hidroxi-4-
fenilbutirato ( ALOFENILNORSTATINAS) com Ácido (R)-1,3-tiazolidina 4-carboxilico
(BHAUMIK et al., 2011; HIDAKA et al., 2007; KISO et al., 2004; MIURA et al., 2010;
NEZAMI et al., 2002). Os valores da constante de inibição (Ki) foram obtidos sobre as
mesmas condições experimentais. Esses valores de K i foram transformados para a
escala logarítmica pki (-log Ki). A faixa de valores variou de 4,01 a 9,69.
3.1.3 Receptor
A estrutura cristalográfica da enzima Plasmepsina II presente no Plasmodium
falciparum foi obtida a partir do banco de dados online Protein Data Bank ( PDB)
(BERNSTEIN et al., 1977) sob o código 4CKU (JAUDZEMS et al., 2014), com
resolução de 1,85 Å e valor-R de 0,209 (Figura 13). As estruturas, que apresentavam
resíduos de aminoácidos incompletos foram reconstruídas utilizando modelos de
homologia com o Swiss Model (GUEX; PEITSCH, 1997).
8/17/2019 Dissertação Carolina Correções Norberto
39/103
39
Figura 13. Estrutura cristalina da Plasmepsina II (4CKU).
Fonte:
3.2 Metodologia
3.2.1 Padronização do conjunto de dados e preparo das estruturas tridimensionais. As estruturas 3D dos compostos foram desenhadas com o auxílio do programa
Marvin Scketch versão 15.9 (ChemAxon). O estado de protonação foi estimado para
pH = 7,40 e os átomos de hidrogênio foram adicionados com o programa Avogadro
(HANWELL et al., 2012). Foi realizada uma inspeção criteriosa do banco de dados
selecionado da literatura utilizando o protocolo descrito por Fourches & Tropsha
(FOURCHES, 2010).
Todos os modelos moleculares, nos devidos estados de protonação, passarampor uma minimização de energia com o campo de forma MMFFFG94 e tiveram suas
energias otimizadas ao nível semi-empírico PM6, com o programa Gaussian. Cargas
AM1-BCC (JAKALIAN; JACK; BAYLY, 2002) foram adicionadas com o UCSF Chimera
(PETTERSEN et al., 2004).
Para as simulações de dinâmica molecular, todo o conjunto de dados tiveram
suas ligações parametrizadas para o campo de força AMBER99SB-ILDN (LINDORFF-
LARSEN et al., 2010).
8/17/2019 Dissertação Carolina Correções Norberto
40/103
40
3.2.2 Adaptação do sítio ativo
A estrutura cristalográfica 3D do complexo Plasmpepsina II com um ligante
natural baseado na estrutura da hidroxietilamina (código PDB: 4CKU) (JAUDZEMS et
al., 2014) foi utilizado como receptor para a construção do modelo de previsão
dependente de receptor LQTA-QSAR. A estrutura química do ligante cristalizado se
interage com a proteína por um modo de interação distinto dos compostos do conjunto
de dados. O que não permite a inserção direta dos ligantes escolhidos na conformação
apresentada pelo sítio ativo cristalizado.
A adaptação do sítio ativo foi feita a partir do estudo de docking do composto
mais potente da série (composto 33). Para tal, o ligante natural foi removido da
estrutura do cristal e foi realizada a docagem com o composto 33. As melhores poses
foram submetidas a simulações de dinâmica molecular e propiciaram a adaptação do
sítio ativo por meio de encaixe induzido. O processo automatizado de docking foi
realizado com o programa AutoDock Vina (TROTT; OLSON, 2010) e as simulações
de dinâmica molecular com o pacote GROMACS 4 (VAN DER SPOEL et al., 2005). O
novo sítio ativo hipotético, adaptado e aperfeiçoado para o modo de interação do
composto 33 foi utilizado para orientar os processos de refinamento subsequentescom dinâmica molecular de todos os ligantes da série de derivados Alofenilnorstatinas
e obter os perfis conformacionais necessários para a construção do modelo LQTA-
QSAR-DR.
As conformações iniciais (input ) para a realização das simulações de todos os
ligantes dos conjuntos de dados foram obtidas a partir de um processo de docagem
manual, utilizando a estrutura da Plm II com o sítio ativo adaptado. O processo manual
foi realizado utilizando a ferramenta de ajuste de torções (adjust torsions) e omovimento do mouse (movement mouse), átomo por átomo, baseados no
conhecimento do modo de interação do ligante natural cocristalizado e interações
relatadas na literatura (DAN; BHAKAT, 2015; HUIZING; MONDAL; HIRSCH, 2015).
Otimizações da geometria dos compostos foram realizadas para eliminar possíveis
distorções nas posições dos átomos. As estruturas otimizadas foram submetidas ao
programa topobuild para a criação dos arquivos de topologia GAFF (WANG et al.,
2004) para as subsequentes simulações de dinâmica molecular.
8/17/2019 Dissertação Carolina Correções Norberto
41/103
41
3.2.3 Dinâmica molecular
As simulações de dinâmica molecular ocorreram utilizando o pacote
GROMACS 4 (VAN DER SPOEL et al., 2005). Todas as simulações foram feitas em
solvente implícito empregando o formalismo generalizado de Born (FAN et al., 2005).
Como não foi construído uma caixa, não foi levado em consideração as condições
periódicas de limite. Todos os complexos tiveram sua energia otimizada usando o
algoritmo de descida mais inclinada (steepest descent algorithm - SDA). O critério de
convergência empregado nas otimizações foi que a força máxima que agisse sobre
os átomos não superasse 10 kJ mol-1 nm-1. Caso a convergência não fosse atingida
em 20 000 passos, foi empregado o algoritmo de Broydens-Fletcher-Goldfarb-Shanno
(BFGS). Foram aplicadas Correções de dispersão de longo alcance somente para
energia. Restrições de posições com penalidades de energia totais foram adicionadas
à cadeia principal (backbone) e parciais à cadeia lateral da proteína. Todas as ligações
foram vínculos pelo algoritmo LINCS, foi removido o centro de massa translacional e
rotacional ao redor do centro de massa e um algoritmo de leap-frog foi utilizado para
integrar as equações de Newton de movimento. As interações de Lennard-Jones e
Coulombic sofreram consideradas até 2 nm. As simulações duraram 2 000 ps para
cada composto, ou o suficiente para adaptação e estabilização da posição do liganteno sítio ativo.
3.2.4 Geração do modelo 4D LQTA-QSAR
Os descritores de interação foram calculados com o programa Open3DQSAR
(TOSCO; BALLE, 2011). Estes descritores foram criados com a utilização das
conformações alinhadas provenientes da dinâmica molecular. A seleção destas
conformações foi realizada a partir da ferramenta de análise de agrupamentos doChimera. Foi utilizada uma caixa cúbica com 1.0 Å de espaçamento e dimensões de
33x32x30 Å. Foram calculados no total 63360 descritores paras energias de interação
de Lennard-Jones (LJ) e Coulomb (QQ). Os descritores de LJ foram calculados com
uma sonda sp³, e os de QQ com uma sonda de carga +1.
A filtragem (Figura 14), seleção e construção dos modelos de QSAR seguiram
os protocolos já estabelecidos por Barbosa e colaboradores (BARBOSA; FERREIRA,
2012) para a metodologia do LQTA-QSAR. O script utilizado para retirar os descritores
8/17/2019 Dissertação Carolina Correções Norberto
42/103
42
do Open3DQSAR e o script feito para aplicar os filtros virtuais nas matrizes do Matlab
estão disponíveis no Anexo I.
Figura 14. Etapas dos filtros virtuais.
Fonte: elaborado pelo autor
3.2.4.1 Filtros virtuais
Os descritores moleculares excessivamente distantes (baixa variância) das
estruturas 3D alinhadas dentro da grade virtual foram eliminados. O corte da variância
foi de 0,02 para descritores abaixo desse valor, de acordo com o proposto por Kubiny
e colaboradores (KUBINYI, 1997). Os descritores de LJ são submetidos a um
tratamento devido a seus valores positivos serem de elevada magnitude nos postos
da grade próximos aos átomos. Um corte (cut-off ) de energia é realizado seguindo a
equação X. Se um descritor de LJ nas coordenadas x, y, z tiver valor de energia menor
ou igual que 30 kcal/mol não foi aplicado nenhum corte. Se não, o valor logaritmo
residual da energia foi adicionado a 30 kcal/mol.
,, ≤ 30 − ,ã ′,, ,, ,, > 30 − ,ã ′,, 30 +
,, 29 (3)
8/17/2019 Dissertação Carolina Correções Norberto
43/103
43
O segundo filtro virtual foi realizado por meio da eliminação dos descritores de
baixa correlação, ou seja, se comportam como um vetor aleatório. Para tal, são
eliminados os descritores que tem correlação de Pearson absoluta (|r|) com atividade
biológica (y) no mesmo nível de ruído aleatório.
A última etapa de filtros virtuais visa eliminar os descritores com perfil de
distribuição muito diferente em relação a atividade biológica (y), utilizando o
Comparative Distribution Detection Algorithm (CDDA) (BARBOSA; FERREIRA, 2012).
Tal algoritmo permite um modo de quantificar o quão similar y está distribuído para
um descritor especifico.
3.2.4.2 Seleção de variáveis Após o procedimento de filtragem virtual, foi realizado a seleção de descritores
com o algoritmo OPS (TEÓFILO; MARTINS; FERREIRA, 2009a). Foram removidos
descritores redundantes (com coeficiente de correlação inter descritor igual ou maior
que 0,9), que apresentaram discrepância entre o sinal do vetor de regressão e do
coeficiente de correlação com a atividade biológica (KIRALJ; FERREIRA, 2009).
3.2.5 Validação do modelo A validação interna do modelo foi obtida a partir dos parâmetros de méritos R²
e Q², e testes de validação y-randomization e Leave-N-out (LNO) (GRAMATICA,
2007; KIRALJ; FERREIRA, 2009). A validação externa foi realizada empregando um
conjunto teste de 12 compostos, a fim de se verificar a capacidade preditiva dos
melhores modelos obtidos. Tal capacidade foi avaliada utilizando o coeficiente de
correlação externo (Q²ext).
O modelo final que passou nas devidas etapas de validação teve seusdescritores visualizados no espaço 3D ao redor das moléculas alinhadas. As
coordenadas que definem os descritores são expressas em formato . pdb e exibidas
como esferas utilizando o programa USCF Chimera (PETTERSEN et al., 2004). A
interpretação dos descritores do modelo foi feita com base na disposição espacial,
natureza energética e pelo sinal do vetor de regressão.
3.2.5.1 Leave-N-out e y-randomizationPara o teste de LNO, os modelos foram considerados robustos se os desvios
máximos absolutos de Q²LNO e que o Q²LOO não fossem superiores que 0,1, para N
8/17/2019 Dissertação Carolina Correções Norberto
44/103
44
sendo cerca de 20-30% das amostras separadas para validação interna
(GRAMATICA, 2007; KIRALJ; FERREIRA, 2009). O resultado é mostrado
graficamente, exibindo o valor do desvio máximo e o valor médio de dois desvios
padrão.
No teste y-r andomization os modelos foram construídos com atividades
biológicas randomizadas para gerar modelos que apresentassem pouca qualidade
estatística (R² e Q² baixos). Os descritores obtidos para os modelos foram
considerados livres de correlação ao acaso quando os interceptos para as regressões
lineares dos valores de |r| x Q²yrand e |r| x R²yrand forem aQ < 0,05 e aR < 0,3
(ERIKSSON et al., 2003). Os resultados foram expressos em dois gráficos contendo
a linha para a regressão linear, seguindo as equações:
i) ² + || (4)ii) ² + ||
Onde Q²yrad e R²yrad são os parâmetros estatísticos do coeficiente de correlação
para os modelos randômicos, aQ e aR são os interceptos da reta e |r| é o coeficiente
de correlação de Pearson. Foram realizadas 100 randomizações de y.
8/17/2019 Dissertação Carolina Correções Norberto
45/103
45
4 RESULTADOS E DISCUSSÕES.
4.1 Caracterização do conjunto de dados.
Um conjunto de dados de 49 compostos foi utilizado para a construção de
modelos LQTA-QSAR dependente de receptor (JAUDZEMS et al., 2014). A figura 15
mostra o esqueleto principal dos inibidores da série escolhida. As moléculas do
conjunto de dados variam a partir de quatro pontos de modificação, R1, R2, R3, R4,
mantendo sempre o radical Alofenilnorstatinas com um anel tiazolidina.
Seguindo a convenção de Schechter (SCHECHTER; BERGER, 1967), as
regiões dos substratos, ou inibidores (P1-Pn/P1’-Pn’) são correspondentes a regiões
que interagem no sitio ativo (S1-Sn/S1’-Sn’) das plasmepsinas (BHAUMIK;
GUSTCHINA; WLODAWER, 2012).
Figura 15 – Farmacóforo característico da série de compostos utilizada na construçãodo modelo LQTA-QSAR. Anel de cinco membros tiazolidina e os locais de possíveissubstituições (R1, R2, R3 e R4)
Fonte: elaborado pelo autor
Tal conjunto de dados é inédito na criação de modelos de QSAR na literatura.
As estruturas químicas dos compostos e seus respectivos valores de atividade
biológicas, expresso em pki, estão apresentados na Tabela 4.
8/17/2019 Dissertação Carolina Correções Norberto
46/103
46
Tabela 4 – Conjunto de dados retirados da literatura (continua).
Composto¹ R1 R2 R3 pKi
1 H CH3 H 8.04
3 CH3 H H 8.07
4 CH3 CH3 H 7.92
5 H CH2 CH3 H 9.16
6 H CH2 CH3 CH2 CH3 8.29
7 CH2 CH3 CH2 CH3 H 8.37
8 CH2 CH3 CH2 CH3 CH2 CH3 8
Composto² R pKi Composto
R pKi
9 9.30 17 6.95
10 7.14 18 6.14
11 7.65 19 7.02
8/17/2019 Dissertação Carolina Correções Norberto
47/103
47
Tabela 4 – Continuação.
Composto² R pKi Composto
R pKi
12 6.27 20 7.38
13 7.95 21 6.25
15 7.82 23 7
16 7 24 6.56
Composto³ R1 R2 R3 R4 pKi
25 - - 4.02
8/17/2019 Dissertação Carolina Correções Norberto
48/103
48
Tabela 4 – Continuação. Composto³ R1 R2 R3 R4 pKi
26 CH3 CH3 5.06
27
- - 4.89
29 CH3 CH3 7.15
30 - - 5.03
31 - - 6.22
8/17/2019 Dissertação Carolina Correções Norberto
49/103
49
32 CH3 CH3 7.52
33
CH3 CH3 7.69
35 - - 5.09
Composto4 R pKi
36 8.52
37 7.82
8/17/2019 Dissertação Carolina Correções Norberto
50/103
50
Tabela 4 – Continuação
Composto4 R pKi
38 8.0k5
39 9.7
40 8.3
Composto4R1 R2 R3 pKi
41 H CH3 - 7.75
42 - - CH3 8.30
43 NH2 - - 8.40
44 - NH2 - 7.92
45 OH - - 7.95
46 - OH - 8.40
47 OCH3 - - 8.05
48 - OCH3 - 7.77
49 - - OCH3 8.40
1Miura et al., 2010; 2Kiso et al., 2004; 3Nezami et al., 2002; 4Hidaka et al., 2007.
8/17/2019 Dissertação Carolina Correções Norberto
51/103
51
4.2 Divisão do conjunto de dados para a construção do modelo LQTA-QSAR
O conjunto de dados foi dividido em grupo de treinamento e grupo teste, 85%
e 25% dos compostos, respectivamente. Para esta divisão, utilizou-se o método de
análise de grupamentos hierárquicos (HCA –Hierarchical Cluster Analyses) a partir de
um dendograma (Figura 16). Os grupos testes e de treinamento foram escolhidos de
modo que o menor e o maior valor de pKi (composto 25 e 39) não fossem selecionados
para o grupo externo (conjunto teste) e de modo que os dois conjuntos apresentassem
uma boa distribuição ao longo do intervalo de atividade. O grupo de treinamento ficou
constituído de 37 compostos e o grupo teste de 12 compostos. O grupo teste foi
constituídos dos compostos 17, 21, 29, 14, 40, 30, 32, 43, 5, 6, 3 e 27. O restante foi
utilizado como conjunto de treinamento para o modelo LQTA-QSAR.
Figura 16 – Dendograma referente à análise de grupamentos hierárquicos para o
conjunto de dados (a numeração dos compostos não corresponde a numeração
referente a tabela).
4.3 Adaptação do sítio ativo.
A adaptação do sitio ativo do cristal da Plasmepsina II se mostrou necessária,
porque o ligante cocristalizado tem uma estrutura química baseada em
hidroxietilaminas, diferente dos compostos que compõe a série utilizada para a
8/17/2019 Dissertação Carolina Correções Norberto
52/103
52
construção do modelo. A alta flexibilidade da estrutura da proteína (HUIZING;
MONDAL; HIRSCH, 2015) acrescentou à necessidade de realizar o processo de
docagem manualmente, e não, com o docking automatizado.
Inicialmente, todo o conjunto de dados passou pelo processo de docking
automatizado, utilizando o programa AutoDock Vina (TROTT; OLSON, 2010). As
conformações obtidas para todo o conjunto de dados, apesar de apresentarem uma
função de avaliação (score) alto, não apresentaram conformações que permitissem o
alinhamento das moléculas, ou que traduzissem um modo legítimo de interação
similar entre si. A figura 17 mostra o melhor alinhamento das conformações obtidas
com o docking automatizado. É perceptível que o alinhamento obtido impossibilita a
construção de um modelo QSAR-3D.
Figura 17. Alinhamento das melhores conformações obtidas pelo processo dedocagem automatizado.
Fonte: elaborado pelo autor
Enquanto é perceptível que o processo automatizado traduz em conformações
similares ao modo de interação desvendado pelo cristal, ela não condiz com modo de
interação encontrado na literatura para as estruturas baseadas nas alofenilnorstatinas
(BJELIC et al., 2007; BOSS et al., 2003; ERSMARK; SAMUELSSON; HALLBERG,
2006). As alofenilnorstatinas são desenhados para ocupar o espaço S1’ do sitio ativo
da proteína e explorar o bolso S2’ (WEGSCHEID-GERLACH; GERBER; DIEDERICH,
8/17/2019 Dissertação Carolina Correções Norberto
53/103
53
2010), diferentemente da natureza do composto hidroxietilaminas cocristalizadas
(JAUDZEMS et al., 2014).
Frente a essa problemática, a realização de um modelo de previsão 4D se
mostrou necessária. Utilizando-se das ferramentas de dinâmica molecular e
aproveitando as vantagens de um modelo QSAR-4D frente a um 3D clássico (PATEL
et al., 2014). Assim, foi possível adaptar o sitio ativo por encaixe induzido à série de
compostos do conjunto de dados e aferir um modo de interação mais consonante ao
modo de interação com a proteína.
Composto 33 (pKi = 7,69), uma das moléculas mais ativa da série, foi escolhida
para a adaptação do sitio ativo. A simulação de MD resultou em diversas
conformações, entre elas, uma mais frequente revelando um modo de interaçãodistinto para moléculas derivadas de alofenilnorstatinas. A figura 18 mostra um corte
transversal do sitio ativo.
Figura 18 – Sitio ativo da Plm II com o Composto 33 (roxo) e ligante natural do cristal(azul).
Fonte: elaborado pelo autor.
Foi observado que o anel tiazolidina do composto ocupava a região S1’ do bolso
hidrofóbico do sitio ativo, permitindo que o ligante alcance a região S2’. Atingindo
assim, uma conformação mais estável do que a apresentada pela forma cristalizada.
O benzil na região P1, comum para toda a série, interagiu com a região S1/S3 do sítio
8/17/2019 Dissertação Carolina Correções Norberto
54/103
54
ativo, fazendo interações de empilhamento-π com os resíduos de Phe120, Try77 e
Phe111 (flap). A Figura 19 mostra o composto 33 e os principais resíduos após a
adaptação do sitio ativo
Figura 19. Composto 33 após adaptação do sítio ativo.
Fonte: elaborado pelo autor.
A díade catalítica, formada pelos resíduos Asp34 e Asp214 fazem ligações de
hidrogênio com a carbonila e hidroxila da estrutura das alofenilnorstatinas. O anel
tiazolidina interage com a região S1’ do sitio ativo, principalmente com os resíduos de
Tyr192, Ile300 e Ile212.Sabe-se que o conjunto de dados foram planejados para simular um estado de
transição do substrato da proteína Plasmepsina II, estado esse em que o substrato se
estende pelos dois lados do centro catalítico e preenche a região hidrofóbica S1/S3 e
S1’ (SHIM; MACKERELL, JR., 2011). Tal característica peptidiométrica foi confirmada
pelos resultados da adaptação do sitio ativo e as simulações de dinâmica moleculares
puderam ser conduzidas para o restante do conjunto de dados.
Após a adaptação do sitio ativo para o composto 33, as moléculas restantes doconjunto de dados foi manualmente ancorado para a posição do modo de interação.
8/17/2019 Dissertação Carolina Correções Norberto
55/103
55
Translações e rotações das ligações permitiram produzir o input inicial para as
subsequentes simulações de dinâmica molecular de todo o conjunto. A Figura 20
mostra o alinhamento do conjunto de dados após o processo de adaptação do sitio
ativo e docagem manual, antes do processo de cálculo dos descritores. É possível
observar que o anel tiazolidina e o benzil de todos os conjuntos de dados estão
alinhados todos no mesmo modo de interação.
Figura 20. Melhor alinhamento após a adaptação do sitio ativo.
Fonte: elaborado pelo autor.
4.4 4D LQTA-QSAR
Os descritores calculados com o programa Open3DQSAR e submetidos ao
protocolo de filtragem virtual e seleção de variáveis descritos anteriormente. A tabela
5 mostra a eliminação de descritores subsequentes de cada etapa de filtragem virtual.
No Anexo 2 está disponível o script utilizado para automatizar as etapas de filtragem
através do programa Matlab (“Mathlab.”, 2000)..A matriz inicial, após o cálculo dos
descritores, com proporções de 49x63360 foi tratada como duas matrizes distintas,
com 49 amostras e 31680 descritores cada, para descritores de LJ e QQ. A matriz
final utilizada para a criação do modelo teve proporções de 37x443 (37 amostras
referente ao grupo de treinamento e 443 descritores). A figura 21 mostra a matriz
referentes aos descritores LJ no tocante ao corte. É possível observar, no primeiro
gráfico, os valores elevados na casa de 3*10¹¹ de energia. No segundo gráfico, após
8/17/2019 Dissertação Carolina Correções Norberto
56/103
56
o tratamento, os descritores apresentam distribuição