Upload
doandang
View
216
Download
0
Embed Size (px)
Citation preview
KAREN CACILDA WEBER
MODELAGEM MOLECULAR DE COMPOSTOS ARILPIPERAZÍNICOS E SUAS INTERAÇÕES
COM O RECEPTOR 5-HT1A
Tese apresentada ao Instituto de Química de São Carlos da Universidade de São Paulo para obtenção do título de Doutor em Ciências (Físico-Química). Orientador: Prof. Dr. Albérico B. F. da Silva
São Carlos 2008
Aos meus pais, Paulo e Noemi, com amor.
AGRADECIMENTOS Ao Prof. Albérico, pela orientação, amizade, incentivo e, principalmente, por seus valiosos ensinamentos ao longo de toda a minha pós-graduação. Ao Prof. Adriano D. Andricopulo, por ceder gentilmente os recursos para a realização de parte dos estudos de QSAR. Ao Prof. Sir Tom L. Blundell, por me receber em seu laboratório na Universidade de Cambridge para a realização do estágio no exterior. Ao Dr. Rinaldo W. Montalvão, pelo auxílio com a modelagem do receptor, por toda sua paciência e seus ensinamentos, e à sua esposa, Lis, por terem me acolhido tão amavelmente em Cambridge. À Profa. Káthia M. Honório e às queridas colegas Alícia P. Higueruelo e Lívia B. Sallum, pelo auxílio com os aspectos práticos dos métodos computacionais e pelas importantes discussões sobre o trabalho. Aos professores e funcionários do IQSC, especialmente ao pessoal da Química Estrutural (Vânia, Shirlei e Joel), ao pessoal da Seção Técnica de Informática (Ângelo, Flávio, Irineu e Talhati) e às meninas do Serviço de Pós-Graduação (Sílvia e Andréia). Aos meus familiares, especialmente ao meu irmão, Paulo Jr., pelo apoio e compreensão ao longo de todos esses anos. A todos os amigos que estiveram ao meu lado durante o doutorado, contribuindo com uma palavra de incentivo, um abraço ou um almoço no domingo: Agnaldo, Aline, André, Andressa, Carlise, Chicão, Corinne, Dai, Diógenes, Fábio, Ednilsom, Fernando, Gelita, Hugão, Ivanete, Janinha, Joelmir, Josmar, Kathy, Leo, Lia, Lu, Lucas-Bleicher, Manu, Marcello, Márcio, Marlise, Maurão, Melissa, Milena, Natália, Nathália, Nayara, Paulinha, Rachell, Rodrigo, Sandra, Sânia, Sherlan, Sid, Simon, Soninha, Talita, Tatá, Tiago, Titi e Zilda. À CAPES, pela bolsa de estágio no exterior. À FAPESP, pela bolsa de doutorado.
RESUMO
Os inibidores seletivos da recaptação de serotonina (ISRSs) representam a classe mais
importante de antidepressivos em uso clínico atualmente. Entretanto, esses medicamentos
costumam levar de duas a seis semanas para apresentar os efeitos de sua ação terapêutica.
Estudos clínicos mostram que quando um antagonista do receptor 5-HT1A é administrado
juntamente com um ISRS, um aumento da concentração extracelular de serotonina é
observado nas áreas terminais dos neurônios. Assim, a combinação de um antagonista do
receptor 5-HT1A com um ISRS pode acelerar o início da ação antidepressiva, aumentando a
eficácia do tratamento farmacológico da depressão. A classe mais importante de ligantes do
receptor 5-HT1A são os compostos arilpiperazínicos. O presente estudo teve como objetivo o
entendimento das características importantes para as interações entre uma série de compostos
arilpiperazínicos com o receptor 5-HT1A. Para tal, foram realizados estudos de Relação
Quantitativa entre Estrutura e Atividade (QSAR) bi- e tridimensionais, empregando as
seguintes abordagens: métodos quimiométricos baseados em descritores teóricos, QSAR por
hologramas (HQSAR) e o método de Análise Comparativa de Campos Moleculares
(CoMFA). Essas análises foram complementadas com a modelagem por homologia do
receptor 5-HT1A e com estudos de docking ligante-receptor realizados para alguns compostos
arilpiperazínicos. Modelos de QSAR com boa consistência interna, habilidade preditiva e
estabilidade foram obtidos em todos os casos. Os modos de interação observados
apresentaram consistência com dados experimentais disponíveis sobre os resíduos
importantes para as interações com ligantes arilpiperazínicos. Os principais resultados
indicaram algumas características dos ligantes que são importantes para a afinidade pelo
receptor 5-HT1A, tais como a presença de um anel benzotiofeno como substituinte Ar2,
substituintes pouco volumosos na posição Z e receptores de ligações de hidrogênio na posição
orto do anel Ar1. Esses resultados foram corroborados pelo estudo das interações com o
modelo do receptor 5-HT1A, que indicou uma importante interação hidrofóbica do grupo
benzotiofeno com o resíduo Trp6.48 do receptor, assim como uma ligação de hidrogênio entre
a hidroxila na posição Z e o resíduo Thr3.37 e, ainda, entre o oxigênio do anel Ar1 e o resíduo
Asn7.39. As informações obtidas neste estudo podem fornecer subsídios para o planejamento
de novos ligantes com afinidade pelo receptor 5-HT1A.
ABSTRACT
Selective serotonin reuptake inhibitors (SSRIs) are the most important class of
antidepressants in current clinical use. However, they present the serious drawback of a delay
of two to six weeks in the onset of therapeutic effect. Clinical studies have shown that when a
5-HT1A receptor antagonist is administrated along with a SSRI, an increase of extracellular
serotonin concentration in neuronal terminal areas is observed. Thus, the combination of a 5-
HT1A receptor antagonist and a SSRI could accelerate the onset of antidepressant action,
improving the pharmacological treatment of depression. The most important class of 5-HT1A
receptor ligands are arylpiperazine compounds. In the present study, our aim was to
understand the main features of the interaction between a series of arylpiperazines and the 5-
HT1A receptor. Bi- and Tridimensional Quantitative Structure-Activity Relationship (QSAR)
studies were conducted employing the following approaches: chemometric methods based on
theoretical descriptors, Hologram QSAR (HQSAR), and Comparative Molecular Field
Analysis (CoMFA). These analyses were complemented by 5-HT1A receptor homology
modeling and ligand-receptor docking studies. QSAR models presenting good internal
consistency, predictive power and stability were obtained in all cases. The observed binding
modes are consistent with available experimental data on residues considered crucial for
interactions with arylpiperazine compounds. The main results have indicated some important
features for optimal binding to the 5-HT1A receptor, such as the presence of a benzothiophene
ring as Ar2 substituent, small groups at position Z and hydrogen bond acceptors at the ortho
position of Ar1 ring. These results were corroborated by modeling the interactions with the 5-
HT1A receptor, which has indicated an important hydrophobic interaction between the
benzothiophene group and residue Trp6.48, a hydrogen bond between the OH group at
position Z and residue Thr3.37, as well as between the oxygen in Ar1 and residue Asn7.39.
The information gathered in these studies can be useful for the design of new ligands
displaying affinity to the 5-HT1A receptor.
LISTA DE FIGURAS Figura 1 - Exemplos de medicamentos antidepressivos das classes IMAO, ATC e ISRS......18 Figura 2 - Estrutura química do pindolol, o primeiro antagonista do receptor 5-HT1A
conhecido..................................................................................................................................19 Figura 3 - (a) estrutura geral das arilpiperazinas; (b) buspirona; (c) NAN-190; (d) WAY 100635; (e) flesinoxan..............................................................................................................35 Figura 4 - Estrutura geral dos compostos sintetizados inicialmente por Oficialdegui et al....37 Figura 5 - Estrutura geral dos compostos das séries I, II, III e IV de Martinez-Esparza et al...............................................................................................................................................38 Figura 6 - Compostos sintetizados por Martinez-Esparza et al. com afinidades mais altas....38 Figura 7 - Compostos com melhores resultados sintetizados por Pérez-Silanes et al.............39 Figura 8 - (a) Estrutura geral dos compostos indolbutilpiperazínicos sintetizados por Heinrich et al.; (b) estrutura da vilazodona.............................................................................................40 Figura 9 - Mapa de Ramachandran para a rodopsina bovina..................................................50 Figura 10 - Dendrograma para os compostos do conjunto de treinamento, obtido com a conexão incremental.................................................................................................................68 Figura 11 - Gráfico de escores de PC2 versus PC1 para os compostos do conjunto de treinamento...............................................................................................................................70 Figura 12 - Gráfico de escores para a predição feita pelo PCA para os compostos do conjunto de teste......................................................................................................................................72 Figura 13 - Distâncias dos compostos às classes obtidas para o conjunto de treinamento.....76 Figura 14 - Valores de pKi preditos versus experimentais para a regressão PLS obtida com 6 componentes principais, mostrando os compostos dos conjuntos de treinamento e teste........79 Figura 15 - Valores de pKi preditos versus experimentais para o conjunto de treinamento e para o conjunto de teste resultantes do modelo HQSAR..........................................................90 Figura 16 - Contribuições atômicas para a afinidade pelo receptor 5-HT1A do composto com maior afinidade do conjunto de dados (65).....................................................................92 Figura 17 - (a) Características farmacofóricas usadas para o alinhamento das estruturas do conjunto de dados e (b) alinhamento estrutural das moléculas do conjunto de treinamento..101 Figura 18 - Valores de pKi preditos versus experimentais para o conjunto de treinamento e para o conjunto de teste resultantes do modelo CoMFA........................................................103
Figura 19 - Mapas de contorno (a) estéricos e (b) eletrostáticos para o composto com maior afinidade pelo receptor 5-HT1A do conjunto de dados............................................................104 Figura 20 - Estrutura geral dos compostos em estudo e estruturas dos ligantes empregados no estudo de docking....................................................................................................................109 Figura 21 - Alinhamento das seqüências do receptor 5-HT1A e da rodopsina bovina (código 1u19 no PDB) obtido com o programa FUGUE, com a anotação da proteína-molde no formato JOY e a representação da estrutura secundária predita pelo PSIPRED para o receptor 5-HT1A.....................................................................................................................................111 Figura 22 - Representação das HTMs do modelo obtido......................................................113 Figura 23 - Mapa de Ramachandran do modelo obtido mostrando as regiões favoráveis (cores escuras), permitidas (cores claras) e desfavoráveis (branco)..................................................114 Figura 24 - (a) Localização dos resíduos cruciais para a interação com os ligantes nas HTMs e (b) Posicionamento dos ligantes nas HTMs.........................................................................116 Figura 25 - Interações específicas entre os ligantes 1 e 2 e o modelo do receptor 5-HT1A...117 Figura 26 - Interações específicas entre os ligantes 3 e 4 e o modelo do receptor 5-HT1A...118
LISTA DE TABELAS Tabela 1 - Estruturas químicas e valores de pKi dos compostos do conjunto de treinamento.61 Tabela 2 - Estruturas e valores de pKi dos compostos do conjunto de teste............................62 Tabela 3 - Descritores selecionados e suas definições.............................................................65 Tabela 4 - Loadings das variáveis em cada PC........................................................................71 Tabela 5 - Sumário da classificação KNN para os compostos do conjunto de treinamento....74 Tabela 6 - Porcentagem de variância, PRESS, q2 e r2.............................................................78 Tabela 7 - Resíduos de predição para o conjunto de teste.......................................................80 Tabela 8 - Estruturas químicas e valores de Ki para os compostos em estudo ........................84 Tabela 9 - Resultados da análise HQSAR utilizando vários tipos de fragmentos, com o tamanho de fragmento padrão 4 - 7 ..........................................................................................89 Tabela 10 - Resultados da análise HQSAR variando o tamanho de fragmento, com a combinação A/B/C/Ch/DA.......................................................................................................90 Tabela 11 - Resíduos de predição para os compostos do conjunto de teste.............................91 Tabela 12 - Estruturas químicas e valores de Ki para os compostos em estudo.......................95 Tabela 13 - Parâmetros estatísticos obtidos nas análises PLS para o modelo CoMFA…….101 Tabela 14 - Resíduos de predição para os compostos do conjunto de teste...........................102 Tabela 15 - Notação do formato JOY....................................................................................110
SUMÁRIO 1 INTRODUÇÃO 12 1.1 A Depressão e a Hipótese Monoaminérgica 13 1.2 A Serotonina e Seus Receptores 15 1.3 Os Antidepressivos 17
2 ESTUDOS DE QSAR 20 2.1 Requisitos do Conjunto de Dados 22 2.2 Cálculo de Descritores Moleculares 23 2.2.1 Descritores bidimensionais 25 2.2.2 Descritores tridimensionais 27 2.3 Seleção de Descritores Relevantes 30 2.4 Construção do Modelo de Relação Estrutura-Atividade 31 2.5 Validação dos Modelos de QSAR 32 2.6 Estudos de Relação Estrutura-Atividade dos Compostos Arilpiperazínicos 34
3 MODELAGEM MOLECULAR DE PROTEÍNAS 41 3.1 A Modelagem por Homologia 42 3.1.1 Identificação de moldes estruturais 43 3.1.2 Alinhamento da seqüência-alvo com a estrutura-molde 44 3.1.3 Construção do modelo 45 3.1.4 Validação do modelo 49 3.2 Docking ligante-receptor 51 3.3 Estudos de Modelagem do Receptor 5-HT1A e seus Ligantes 53
4 OBJETIVOS 58
5 METODOLOGIA 59
6 ESTUDO QUIMIOMÉTRICO DOS COMPOSTOS ARILPIPERAZÍNICO S 60 6.1 Procedimento Computacional 60 6.1.1 Otimização das geometrias e cálculo dos descritores moleculares 63 6.1.2 Seleção de descritores 63 6.1.3 Análises quimiométricas 65 6.2 Resultados e Discussão 66 6.2.1 Reconhecimento de padrões não-supervisionado 66 6.2.2 Reconhecimento de padrões supervisionado 73 6.2.3 Regressão PLS 77 6.3 Conclusões 81
7 HQSAR 83 7.1 Procedimento Computacional 83 7.2 Resultados e Discussão 88 7.3 Conclusões 93
8 QSAR 3D 94 8.1 Procedimento Computacional 94 8.2 Resultados e Discussão 100 8.3 Conclusões 105
9 MODELAGEM DO RECEPTOR 5-HT 1A 106 9.1 Procedimento Computacional 106 9.2 Resultados e Discussão 110 9.3 Conclusões 120 10 CONSIDERAÇÕES FINAIS 122 REFERÊNCIAS BIBLIOGRÁFICAS 124
1. Introdução 12
1. INTRODUÇÃO
Métodos de química computacional têm se tornado cada vez mais importantes para a
resolução de problemas da química medicinal. Desde as primeiras aplicações introduzidas nos
anos 60, quando computadores eram usados, por exemplo, para cálculos de orbitais
moleculares de Hückel, simulação de espectros de RMN e análises de Hansch de relação
estrutura-atividade, até os dias de hoje, as contribuições da química computacional para a
química medicinal vêm crescendo em importância e abrangência, especialmente graças ao
desenvolvimento da tecnologia computacional, em termos de velocidade e disponibilidade dos
computadores (BULTINCK et al., 2003).
A partir disso, as aplicações da química computacional evoluíram para o conceito de
quimioinformática, que pode ser definida como o conjunto de recursos computacionais e da
tecnologia de informação utilizado para transformar dados em informação e informação em
conhecimento, com o propósito de agilizar a tomada de decisões nos processos de
identificação e otimização de compostos protótipos (BROWN, 2005). As principais
contribuições da quimioinformática para o planejamento de fármacos incluem a criação de
bases de dados relacionados a compostos químicos, a triagem virtual de grandes coleções de
compostos com a finalidade de encontrar novas estruturas químicas com perfil farmacológico
único e a utilização de métodos modernos de QSAR que permitem o emprego de um número
maior de descritores da estrutura química das moléculas, combinados com a aplicação de
abordagens de otimização lineares e não-lineares e uma forte ênfase na validação rigorosa dos
modelos obtidos.
O presente trabalho consiste na aplicação de diversos métodos computacionais para o
estudo das afinidades pelo receptor 5-HT1A apresentadas por compostos arilpiperazínicos,
com vistas a sua utilização no tratamento da depressão, um transtorno de humor que afeta
1. Introdução 13
cerca de 120 milhões de pessoas em todo o mundo, segundo dados da Organização Mundial
da Saúde. Segue uma breve descrição deste transtorno e das hipóteses sugeridas como base
bioquímica desta doença, a fim de demonstrar o papel dos compostos em estudo na
farmacoterapia antidepressiva.
1.1. A Depressão e a Hipótese Monoaminérgica
A depressão é um distúrbio de humor cujos sintomas apresentam-se como alterações
nas funções vegetativas (sono, apetite, peso e libido), cognitivas (concentração, memória,
atenção, tomada de decisões), comportamentais (interesse, motivação, prazer), somáticas
(cefaléias, dores estomacais, tensão muscular) e de controle do impulso (suicídio, homicídio)
de um indivíduo. Outras manifestações deste distúrbio são a distimia, caracterizada por
sintomas mais leves, porém crônicos e o transtorno bipolar, também conhecido como
transtorno maníaco-depressivo, no qual o paciente alterna estados de extrema euforia e
depressão severa (NATIONAL INSTITUTE OF MENTAL HEALTH, 2002).
Medicação, aliada a psicoterapia, é efetiva em 60 a 80% dos casos; entretanto, menos de
25% das pessoas afetadas recebe tais tratamentos, devido principalmente à falta de recursos e
de uma política de saúde pública adequada, bem como ao estigma social associado a
transtornos mentais. Nos casos mais severos, ou naqueles em que o paciente não responde à
medicação, a terapia eletroconvulsiva (TEC) pode ser muito eficaz (WORLD HEALTH
ORGANIZATION, 2005).
Devido às dificuldades na modelagem da depressão em animais, a abordagem
empregada para entender os mecanismos da doença tem sido o estudo dos efeitos dos
medicamentos antidepressivos (WONG; LICINIO, 2001). Os primeiros antidepressivos foram
1. Introdução 14
descobertos por acaso acerca de 50 anos, quando percebeu-se que a Iproniazida (fármaco
utilizado no tratamento da tuberculose) e a Imipramina (que estava sendo testada como anti-
histamínico) eram capazes de melhorar o humor dos pacientes que os recebiam (CASTRÉN,
2005).
Logo após esta descoberta, observou-se que esses fármacos aumentavam as
concentrações extracelulares de dois importantes neurotransmissores, a serotonina (5-HT) e a
noradrenalina (NA), por meio de dois mecanismos distintos: (i) inibindo sua recaptação nas
terminações neuronais ou (ii) inibindo a ação da enzima monoaminoxidase, responsável pela
degradação desses neurotransmissores. Como esses medicamentos causavam um aumento na
concentração dessas aminas, supôs-se que a depressão fosse o resultado de uma deficiência
dessas substâncias em locais importantes no cérebro, uma proposição conhecida como
hipótese monoaminérgica (WONG; LICINIO, 2004). Outra evidência clínica que serviu para
sustentar esta hipótese foi a associação entre o uso crônico da Reserpina no tratamento de
hipertensão e esquizofrenia com o aumento do risco de aparecimento da depressão em ca.
25% dos indivíduos. Após a elucidação do principal mecanismo de ação da Reserpina, que
consiste na inibição do armazenamento de 5-HT e NA nas vesículas das terminações
nervosas, a hipótese de que o efeito depressivo resultava da depleção de uma ou mais aminas
biogênicas no cérebro ganhou ainda mais força (ROMEIRO; FRAGA; BARREIRO, 2003).
Contudo, outras hipóteses têm surgido recentemente. Sabe-se que o hipotálamo produz
a substância CRH (corticotropin-releasing hormone), que estimula a glândula pituitária que,
por sua vez, desencadeia a liberação de hormônios glucocorticóides, que são hormônios do
estresse, como o cortisol. Por isso, essa hipótese é conhecida como hipótese do estresse e é
sustentada por estudos com animais que mostram uma diminuição das substâncias que
mantêm os neurônios saudáveis, causada por esses hormônios. Por outro lado, sabe-se que
animais deprimidos apresentam um baixo crescimento de novos neurônios (neurogênese).
1. Introdução 15
Esses conhecimentos deram origem à teoria neurotrófica, que está de acordo com o que se
conhece sobre os efeitos do estresse no cérebro, bem como com os resultados de estudos que
indicam que o hipocampo e o córtex pré-frontal apresentam-se atrofiados em animais
cronicamente deprimidos (HOLDEN, 2003).
Uma posição conciliatória entre estas hipóteses vem da observação de que a depressão
pode resultar apenas em parte da atividade diminuída do sistema serotoninérgico. A
neurotransmissão de 5-HT desempenha um papel fundamental no controle do humor e do
comportamento. Sabendo-se que a síntese de 5-HT é regulada pelo nível do seu precursor, o
triptofano, e pela atividade da enzima triptofanohidroxilase (TPH) e que, após sua liberação, a
ação da serotonina é terminada pela recaptação via transportador 5-HT (5-HTT) e
subseqüente degradação pela enzima monoaminoxidase (MAO), considera-se que a ação
antidepressiva, inibindo a recaptação de 5-HT ou a degradação da mesma pela MAO, causa
mudanças adaptativas no sistema serotoninérgico. Entretanto, este seria apenas um efeito
primário que levaria a numerosos efeitos secundários em outros sistemas neurotransmissores,
que podem resultar em outras mudanças adaptativas tais como a neurogênese, conforme
indicado por estudos com diversos medicamentos antidepressivos, TEC e atividade física
(ALBERT; LEMONDE, 2004).
1.2. A Serotonina e Seus Receptores
O sistema serotoninérgico desempenha um papel fundamental na modulação de várias
funções cognitivas e comportamentais, tais como sono, humor, libido, dor, dependência
química, agressividade, memória e aprendizagem. Problemas no sistema serotoninérgico estão
implicados na etiologia de desordens como esquizofrenia, enxaqueca, depressão, tendências
1. Introdução 16
suicidas, autismo infantil, transtornos alimentares e transtorno obsessivo-compulsivo
(MURPHY, 1999).
A serotonina exerce sua ação de neurotransmissão interagindo com diversos receptores
que diferem quanto a suas respostas farmacológicas a ligantes específicos, características
seqüenciais ou mecanismos de acoplamento a segundos mensageiros. Diversos estudos
comprovaram a existência de 14 subtipos de receptores de serotonina. A maioria deles, exceto
o receptor 5-HT3, pertence à família dos receptores acoplados à proteína G (G-protein-
coupled receptors, GPCRs), constituídos de α-hélices em sete domínios transmembrânicos
(BARNES; SHARP, 1999; HOYER; HANNON; MARTIN, 2002).
Os GPCRs são ativados por um sinal externo na forma de um ligante ou de outro
estímulo (como a luz), que cria uma variação conformacional no receptor, causando a
ativação de uma proteína G heterotrimérica. A transdução de sinais através da membrana feita
por um receptor desse tipo não é completamente entendida. Sabe-se que a proteína G inativa
existe ligada ao receptor em seu estado inativo. Uma vez que um ligante seja reconhecido, o
receptor muda de conformação e ativa a proteína G, que irá dissociar a subunidade alfa
(Gα) do dímero Gβγ e do receptor, dando continuidade à cascata de sinais celulares (PIERCE;
PREMONT; LEFKOWITZ, 2002).
Acredita-se que os GPCRs existem num equilíbrio conformacional entre os estados
biofísicos ativo e inativo, e que a interação com um ligante pode deslocar este equilíbrio na
direção de um ou outro estado do receptor. Os ligantes conhecidos como agonistas deslocam o
equilíbrio na direção do estado ativo; os agonistas inversos favorecem o estado inativo e os
antagonistas são ligantes que não afetam este equilíbrio. Entretanto, ainda não se sabe como
os estados ativo e inativo diferem entre si (LEFKOWITZ et al., 1993; RUBENSTEIN;
LANZARA, 1998).
1. Introdução 17
1.3. Os Antidepressivos
Os principais medicamentos antidepressivos utilizados na prática médica atual podem
ser agrupados nas seguintes classes (ROMEIRO; FRAGA; BARREIRO, 2003):
- Inibidores de Monoaminoxidase (IMAO): estão entre os primeiros medicamentos
utilizados no tratamento de depressão. Atuam como inibidores da enzima
monoaminoxidase, responsável pela oxidação de aminas biogênicas (especialmente NE).
São pouco seletivos (o que acarreta diversos efeitos colaterais) e interferem no
metabolismo hepático de muitos fármacos (exemplos: fenelzina, clorgilina e
meclobemida).
- Antidepressivos Tricíclicos (ATC): inicialmente foram descobertos inibidores
relativamente não-seletivos da recaptação de 5-HT e NE por seus respectivos receptores
neuronais (exemplos: imipramina e amitriptilina). Uma segunda geração de compostos
estruturalmente análogos foi desenvolvida, dando origem a compostos mais seletivos
que apresentam neurofarmacologia menos definida, sendo considerados, portanto,
atípicos (exemplos: amoxapina e maprotilina).
- Inibidores Seletivos da Recaptação de Serotonina (ISRS): estão envolvidos no
aumento da neurotransmissão de 5-HT, como resultado da dessensibilização dos
autoreceptores 5-HT somatodendríticos e terminais (exemplos: fluoxetina e paroxetina).
1. Introdução 18
Figura 1 – Exemplos de medicamentos antidepressivos das classes IMAO, ATC e ISRS.
Os ISRS representam a classe mais prescrita pelos médicos, por apresentarem menor
incidência de efeitos colaterais. Entretanto, aproximadamente 30% dos pacientes não
respondem à medicação. Além disso, embora o bloqueio da recaptação de 5-HT ocorra em
poucas horas, o tempo de latência até que esses medicamentos comecem a apresentar efeito
terapêutico significativo é de 2 a 6 semanas, tempo considerado muito longo por haver
possibilidade de suicídio (MURPHY, 1999).
Presume-se que esse atraso seja devido à ativação dos receptores 5-HT1A, que inibem a
estimulação de neurônios serotoninérgicos. Sob tratamento com um ISRS, a ativação desses
receptores ocorre para reduzir a liberação de serotonina com o objetivo de compensar o
aumento da concentração de 5-HT produzida pelo tratamento com o ISRS. Assim, o tempo de
latência de 2 a 6 semanas necessário para a ação dos antidepressivos sugere que uma mudança
adaptativa no sistema serotoninérgico deve ocorrer antes que os sintomas depressivos
apresentem melhora significativa (ALBERT; LEMONDE, 2004).
Assim, postula-se que a chave para essa mudança adaptativa sejam os receptores 5-
HT1A, que devem ser dessensibilizados para permitir a ação antidepressiva. A
dessensibilização desses receptores é observada em ratos sob tratamento crônico com
N
O
NH
F
O
CH(CH2)2N(CH3)2
O NH
CH3
CF3
Meclobemida (IMAO) Amitriptilina (ATC) Fluoxetina (ISRS)
1. Introdução 19
antidepressivos ou TEC. Essa suposição é sustentada pelo aumento da concentração de 5-HT
extracelular após a administração de antagonistas do receptor 5-HT1A, tais como o pindolol
(cuja estrutura é mostrada na Figura 2), juntamente com ISRSs, que têm diminuído o tempo
de latência e melhorado a eficácia do tratamento com esses antidepressivos (SHARP;
UMBERS; GARTSIDE, 1997).
NH
O NH
CH3
CH3
OH
Figura 2 – Estrutura química do pindolol, o primeiro antagonista do receptor 5-HT1A conhecido.
Com o presente trabalho, espera-se contribuir para o entendimento das interações entre
o receptor 5-HT1A e compostos arilpiperazínicos, uma classe de ligantes que demonstrou ação
antagonista desse receptor, podendo, assim, ser usados para acelerar o efeito dos ISRSs. Para
tal, foram empregados métodos de QSAR e de modelagem molecular de proteínas, cujos
fundamentos serão apresentados a seguir.
2. Estudos de QSAR 20
2. ESTUDOS DE QSAR
Os estudos de Relação Quantitativa entre Estrutura e Atividade (QSAR) têm como
finalidade a geração de modelos capazes de correlacionar as propriedades estruturais e/ou
físico-químicas dos compostos e a resposta biológica de interesse. No processo de
planejamento de um fármaco, a otimização de um composto protótipo pode ser acompanhada
em cada passo por análises QSAR, que auxiliam a tomada de decisão quanto aos compostos
que devem ser sintetizados (GANELLIN; ROBERTS, 1994). Além disso, a estratégia e a
filosofia dos estudos de QSAR permitem que o químico medicinal possa olhar para as
estruturas em termos de propriedades físico-químicas e/ou estruturais, ao invés de considerar
apenas certos grupos farmacofóricos (KUBINYI, 1993).
Apesar de serem mais utilizados na etapa de otimização de compostos protótipos,
estudos dessa natureza podem ser empregados em cada fase do desenvolvimento de novos
fármacos, aplicando-se a diferentes desafios em química medicinal, como na investigação de
propriedades (QSPR), de toxidez (QSTR) e seletividade (QSSR) de ligantes, entre outros
(BROWN; LEWIS, 2006). No âmbito da química combinatória, podem ser utilizados como
filtros de bibliotecas combinatórias, ajudando a eliminar compostos com propriedades
farmacocinéticas ou de toxidez indesejáveis, ou compostos que se mostram não-específicos
em diferentes ensaios e raramente resultam em protótipos adequados. Incluir essas
considerações nas primeiras etapas da pesquisa resulta na chamada otimização
multidimensional, tomando-se atividades altas como um objetivo essencial, porém não único
(DUDEK; ARODZ; GÁLVEZ, 2006).
A principal premissa que fundamenta os estudos de QSAR é que as interações dos
fármacos com seus alvos biológicos são determinadas por forças intermoleculares, ou seja,
interações hidrofóbicas, polares, eletrostáticas e estéreas. Os fármacos que exercem seus
2. Estudos de QSAR 21
efeitos biológicos interagindo com um alvo específico (uma enzima, um receptor, um canal
iônico, um ácido nucléico ou qualquer outra macromolécula biológica) devem ter uma
estrutura tridimensional tal que os grupos funcionais e as propriedades de superfície sejam
mais ou menos complementares ao sítio de interação. Desde que o sistema biológico seja
mantido constante, a interação de dois fármacos diferentes com o sítio de interação bem como
suas distribuições no sistema dependem apenas das estruturas químicas dos compostos. Se
estas estruturas são intimamente relacionadas, as diferenças em suas propriedades físico-
químicas e assim as diferenças nas forças de interação podem ser facilmente descritas de uma
maneira quantitativa; a variação correspondente nas atividades biológicas deve ser
diretamente relacionada às variações nessas propriedades. Assim, todos os modelos
quantitativos de relação estrutura-atividade são baseados na suposição de uma aditividade das
contribuições de grupos aos valores da atividade biológica (KUBINYI, 1993).
Quanto aos aspectos práticos desses estudos, para que um modelo QSAR possa ser
desenvolvido com sucesso, vários aspectos devem ser considerados. Com relação ao conjunto
de dados empregados para a construção de um modelo, alguns requisitos relacionados ao tipo
de atividade biológica medida e às estruturas dos compostos devem ser preenchidos. A
seleção dos descritores que representam as moléculas deve ser eficiente para identificar
parâmetros que sejam de fato relevantes para a atividade em estudo. Além disso, a realização
cuidadosa da análise estatística, assim como a aplicação de testes de validação dos modelos,
são imprescindíveis para assegurar a confiabilidade e a utilidade do modelo. Os principais
aspectos práticos a serem considerados em um estudo QSAR serão comentados a seguir.
2. Estudos de QSAR 22
2.1. Requisitos do Conjunto de Dados
A condição mais importante em um estudo QSAR é a disponibilidade de uma série
congênere, incluindo apenas compostos que apresentem o mesmo mecanismo de ação. Em
outras palavras, as moléculas devem possuir um esqueleto comum com variação estrutural em
apenas uma ou mais posições (VAN DE WATERBEEMD; ROSE, 2003). Embora
normalmente o mecanismo de ação não seja provado para todos os membros de uma série,
pode-se avaliar o mecanismo de ação para alguns compostos e assumir que todos os outros
apresentem o mesmo comportamento frente a seu receptor biológico (KUBINYI, 1993).
Ao escolher o conjunto de dados, geralmente se quer tantos compostos quantos forem
possíveis. Quando se faz uma análise com a utilização de técnicas de regressão múltipla, o
objetivo deve ser incluir ao menos cinco compostos para cada descritor considerado
(ERIKSSON; JOHANSSON, 1996).
Quanto aos dados biológicos, os seguintes tipos de dados de atividade biológica
podem ser usados em estudos QSAR, desde que estejam na escala correta: valores de
atividade biológica in vitro (usando culturas de bactérias, fungos e outras, bem como órgãos
isolados) e in vivo (atividades farmacodinâmicas e tóxicas de fármacos); dados de afinidade,
como constantes de interação com um receptor ou substrato; constantes de velocidade, como
associação/dissociação e constantes de Michaelis-Menten; constantes de inibição,
especialmente valores de Ki e IC50 de diferentes enzimas; parâmetros farmacocinéticos, como
constantes de velocidade de absorção, parâmetros de distribuição, constantes de velocidade de
degradação metabólica e constantes de velocidade de eliminação (KUBINYI, 1993).
Uma vez que as constantes de equilíbrio ou de velocidade estão relacionadas aos
valores de energia livre ∆G por relações como a da Eq. (1):
2. Estudos de QSAR 23
∆G = -2,303 RT log K (1)
apenas constantes de equilíbrio (por exemplo, valores de Ki ou IC50 e não % de inibição a
determinada concentração) e constantes de velocidade (como valores de log k e não % de
absorção ou % de concentração) são apropriadas para estudos de QSAR, o que significa que
todos os dados biológicos devem ser transformados de uma maneira apropriada antes de
serem usados em análises quantitativas. Ainda de acordo com a Eq. (1), é preferível que todos
os valores sejam convertidos à escala logarítmica. Como convenção, os negativos dos
logaritmos, i.e., logaritmos dos recíprocos das concentrações molares (p.ex. log 1/C ou pC)
são usados para que se obtenham valores maiores para compostos mais ativos. Há ainda outra
razão para o uso da escala logarítmica. Uma condição para a aplicação das análises de
regressão é uma distribuição normal do erro experimental na variável dependente. Para dados
biológicos, isso é verdadeiro para a escala logarítmica e não para a linear. Além disso, os
dados de atividade biológica devem ser razoavelmente distribuídos sobre toda a faixa de
valores, sem agrupamentos de dados (KUBINYI, 1993).
2.2. Cálculo de Descritores Moleculares
As estruturas químicas não contêm a informação relacionada à atividade biológica de
maneira explícita. Esta informação deve ser extraída das estruturas na forma de descritores
moleculares que acentuem diferentes propriedades químicas implícitas na estrutura da
molécula. Tais propriedades, que vão desde parâmetros físico-químicos, eletrônicos ou
químico-quânticos a características geométricas e topológicas das moléculas, podem ser então
2. Estudos de QSAR 24
correlacionadas diretamente com a atividade (FOYE; LEMKE; WILLIAMS, 1995;
(GANELLIN; ROBERTS, 1994).
A maioria dos métodos usados para predizer a atividade requer como input vetores
numéricos de determinadas características, com escala uniforme para todas as moléculas.
Tecnicamente, os descritores moleculares convertem a estrutura à forma de conjuntos de
valores numéricos bem definidos para serem usados na análise estatística dos dados
representando várias propriedades moleculares que são consideradas importantes para
explicar a atividade biológica (DUDEK; ARODZ; GÁLVEZ, 2006).
Dois tipos de descritores distintos podem ser definidos com base na dependência da
informação sobre a orientação tridimensional e da conformação da molécula. Os modelos
QSAR obtidos com descritores bidimensionais são, em geral, estatisticamente robustos e
podem fornecer resíduos de predição baixos. Entretanto, estes modelos podem ser de difícil
interpretação e, assim, acabam sendo usados como guias na otimização de compostos
protótipos de maneira mais indireta do que os modelos tridimensionais. Apesar disto, para
aplicações em que a qualidade da predição é importante, como na triagem virtual de grandes
bancos de dados, estes modelos são preferíveis. Os modelos obtidos com descritores
tridimensionais são mais fáceis de interpretar, pois fornecem uma representação mais clara da
região de um composto protótipo que deve ser modificada para modular a atividade.
Entretanto, algumas suposições subjetivas têm que ser feitas durante o desenvolvimento
desses modelos, o que reduz, em geral, a confiabilidade dos mesmos (BROWN; LEWIS,
2006). Os principais descritores dessas duas categorias serão analisados a seguir.
2. Estudos de QSAR 25
2.2.1. Descritores bidimensionais
Os descritores bidimensionais (2D) possuem a propriedade comum de serem
independentes da orientação tridimensional da molécula. Estes descritores vão de simples
medidas das entidades constituintes da estrutura química, de suas propriedades geométricas e
topológicas, até descritores eletrônicos calculados por métodos químico-quânticos e, ainda,
com métodos de contagem de fragmentos (DUDEK; ARODZ; GÁLVEZ, 2006). Os
principais descritores 2D podem ser classificados como:
- Descritores Constitucionais: capturam propriedades da molécula que são relacionados aos
elementos constituintes de sua estrutura. São descritores que podem ser calculados rápida e
facilmente. Exemplos incluem massa molecular, número total de átomos na molécula e
número de átomos de identidades diferentes. Informações relacionadas a ligações são também
consideradas, como números totais de ligações simples, duplas, triplas ou aromáticas, assim
como número de anéis aromáticos.
- Descritores Geométricos: dependem do arranjo espacial dos átomos constituintes da
molécula. Representam, por exemplo, informações sobre a superfície molecular, obtida das
áreas de van der Waals dos átomos, assim como sobre o volume molecular (HIGO; GO, 1986;
LABUTE, 2000).
- Descritores Eletrônicos: Estimados a partir de cálculos químico-quânticos, esses parâmetros
descrevem as propriedades eletrônicas das moléculas, bem como a influência de certos grupos
ou substituintes na densidade de distribuição eletrônica. Como exemplo, temos: cargas
atômicas, energias dos orbitais de fronteira, potencial de ionização, energia eletrônica e calor
2. Estudos de QSAR 26
de formação. Além destes, incluem-se parâmetros de polarizabilidade, refratividade molar e
momento dipolar, que indicam o modo pelo qual eventuais alterações nos substituintes de
uma estrutura podem modificar a distribuição de cargas como um todo (FOYE; LEMKE;
WILLIAMS, 1995).
- Descritores Topológicos: tratam a estrutura da molécula como um objeto geométrico
(“graph”), tendo os átomos como vértices e as ligações covalentes como arestas. Com base
nesta abordagem, muitos índices quantificando a conectividade molecular são definidos,
como o índice de Wiener, que conta o número total de ligações em caminhos curtos entre
todos os pares de átomos não-hidrogênios. Outros descritores topológicos incluem índices de
Randic (RANDIC, 1975), de Balaban (BALABAN, 1982) e de Schultz (SCHULTZ, 1989).
Informações sobre elétrons de valência podem ser incluídas em descritores topológicos, como
índices de Kier e Hall (KIER; HALL, 1981) ou índices topológicos de carga de Gálvez
(GÁLVEZ et al., 1994). Os primeiros usam médias geométricas das conectividades de
valência ao longo dos caminhos. Os últimos medem valências topológicas de átomos e cargas
totais entre pares de átomos separados por um dado número de ligações.
- Descritor de Lipofilia: especificamente, o logaritmo do coeficiente de partição (log P),
definido como sendo o logaritmo da razão entre a solubilidade de uma substância em um
solvente orgânico e a solubilidade da mesma em água. Este parâmetro está relacionado
principalmente com a distribuição do fármaco no organismo (SILVERMAN, 1992).
- Descritores baseados em fragmentos: a família de descritores dependentes de motivos sub-
estruturais é frequentemente usada, especialmente para uma varredura rápida de bases de
dados com muitos compostos. Os BCI fingerprints (BARNARD; DOWNS, 1997) são
2. Estudos de QSAR 27
derivados como “bits” que descrevem a presença ou ausência na molécula de certos
fragmentos, incluindo átomos com seus vizinhos mais próximos, pares de átomos e
seqüências ou fragmentos de anéis. De maneira similar, a abordagem de QSAR por
Hologramas (HQSAR) é baseada na contagem de números de ocorrências de certas sub-
estruturas ou grupos funcionais. Uma molécula é descrita como uma única série de números
ou “bins”, que formam o holograma molecular. Os bins representam cada um dos fragmentos
presentes em uma molécula em particular e são atribuídos por um algoritmo conhecido como
CRC (cyclic redundancy check) (HERITAGE; LOWIS, 1999).
2.2.2. Descritores tridimensionais
A metodologia de QSAR tridimensional (3D) é computacionalmente mais complexa
do que a abordagem bidimensional. Em geral, envolve vários passos para a obtenção de
descritores numéricos da estrutura dos compostos. Primeiro, a conformação de um composto
tem de ser determinada com o auxílio de dados experimentais ou métodos de otimização de
energia (AKAMATSU, 2002; GÜNER, 2002). Em seguida, os confôrmeros do conjunto de
dados tem de ser alinhados uniformemente no espaço (embora existam alguns métodos
independentes de alinhamento). Finalmente, o espaço em torno dos confôrmeros é submetido
a uma sonda química (como uma carga de prova) para o cálculo de vários descritores.
Os métodos que requerem alinhamento molecular antes do cálculo de descritores são
fortemente dependentes de informação sobre o receptor que interage com os ligantes em
estudo. Quando estes dados estão disponíveis, o alinhamento pode ser guiado pelo estudo dos
complexos ligante-receptor. De outro modo, métodos puramente computacionais para
2. Estudos de QSAR 28
sobrepor as estruturas no espaço podem ser usados (DOVE; BUSCHAUER, 1999;
LEMMEN; LENGAUER, 2000).
O método mais utilizado em QSAR 3D é a Análise Comparativa de Campos
Moleculares (CoMFA), que utiliza campos de energia eletrostáticos (Coulomb) e estéricos
(van der Waals) definidos para os compostos em estudo (CRAMER III; PATTERSON;
BUNCE, 1988). As moléculas alinhadas são posicionadas em uma grade tridimensional. Em
pontos definidos desta grade, um átomo de prova com carga unitária é posicionado e os
potenciais (Coulomb e Lennard-Jones) dos campos de energia são computados, para servirem
como descritores em análises estatísticas, que tipicamente empregam a regressão por mínimos
quadrados parciais (PLS). Esta análise permite a identificação de regiões das estruturas que
são relacionadas positiva ou negativamente com a atividade em estudo (BLANKLEY, 1996).
Uma variação do método CoMFA surgida posteriormente é a Análise Comparativa de
Índices de Similaridade Molecular (CoMSIA). Neste método, são calculados campos de
similaridade na forma de potenciais gaussianos. O método CoMSIA permite a consideração
de várias propriedades físico-químicas (ocupação estérea, cargas atômicas parciais, hidrofobia
local e propriedades de doador ou receptor de ligações de hidrogênio). Além disso, os mapas
de contribuição resultantes podem ser interpretados intuitivamente. A principal vantagem do
método CoMSIA é que ele pode evitar algumas das deficiências inerentes à forma funcional
dos potenciais de Lennard-Jones e de Coulomb (KLEBE; ABRAHAM; MIETZNER, 1994).
Há ainda abordagens 3D em que nenhum alinhamento das estruturas é necessário, uma
vez que não variam com a rotação e a translação das moléculas no espaço. As principais
abordagens deste tipo são:
- WHIM, que emprega o método PCA no centro das coordenadas dos átomos constituintes da
molécula, capturando a máxima variância neste espaço em que diversos descritores são
2. Estudos de QSAR 29
calculados. A contribuição de cada átomo pode ser pesada por uma propriedade química,
levando a diferentes componentes principais que capturem variância contida na dada
propriedade. Os átomos podem ser pesados pela massa, volume de van der Waals,
eletronegatividade atômica, polarizabilidade atômica, índices eletrotopológicos de Kier e Hall
e potencial eletrostático molecular (TODESCHINI; GRAMATICA, 1998; TODESCHINI;
LASAGNI; MARENGO, 1994).
- VolSurf, que é baseada na sondagem de uma grade em torno das moléculas com sondas
específicas para avaliar, por exemplo, interações hidrofóbicas ou grupos receptores ou
doadores de ligações hidrogênio. As caixas da malha resultantes são usadas para computar
descritores dependentes dos volumes ou das superfícies de contorno 3D, definidas pelo
mesmo valor da energia de interação sonda-molécula. Usando várias sondas e valores de corte
para a energia, diferentes propriedades moleculares podem ser quantificadas, como volume e
superfície molecular e regiões hidrofóbicas ou hidrofílicas. Quantidades derivadas, como
globularidade molecular ou fatores relacionando a superfície de regiões hidrofóbicas ou
hidrofílicas à superfície da molécula inteira, podem ser também calculadas (CRIVORI et al.,
2000; CRUCIANI et al., 2000).
- GRIND, projetado para superar os problemas de interpretação comuns aos descritores
independentes do alinhamento. De maneira similar ao VolSurf, utiliza a sondagem de uma
grade em torno das moléculas. As regiões mostrando as energias mais favoráveis de interação
são selecionadas, desde que as distâncias entre as regiões sejam grandes. Depois, as energias
baseadas nas sondas são codificadas de maneira independente do arranjo das moléculas. Para
este fim, as distâncias entre os nós no grid são discretizadas em um conjunto de bins. Para
cada bin de distância, os nós com os mais altos produtos de energia servem como descritores
2. Estudos de QSAR 30
numéricos. Além disso, a informação armazenada na posição dos nós pode ser usada para
encontrar as regiões exatas da molécula relacionadas a uma dada propriedade (PASTOR et al.,
2000).
2.3. Seleção de Descritores Relevantes
Os métodos para a seleção dos melhores descritores a serem usados na construção de
um modelo QSAR podem ser divididos em duas categorias: (i) os descritores são
selecionados por um determinado critério, antes da construção de um modelo, reduzindo-se
assim o número de descritores e independentemente da técnica usada para a construção do
modelo. (ii) a qualidade de um subconjunto de descritores é obtida construindo e avaliando
modelos, até que o melhor entre eles, de acordo com determinado critério, seja obtido.
Exemplos da primeira categoria são:
- métodos baseados na correlação de descritores, como os coeficientes de Pearson
(MERKWIRTH et al., 2004), que servem para descartar descritores intercorrelacionados; ou
ainda, a escolha dos descritores que apresentam correlações mais altas com a atividade
biológica (GALLEGOS; GIRONES, 2005).
- critérios estatísticos, como o peso de Fisher, que avalia a variância inter- e intra-classes e
serve para identificar os descritores que apresentam o maior potencial discriminatório (LIN;
LI; TSAI, 2004).
2. Estudos de QSAR 31
Os métodos da segunda categoria operam necessariamente em conjunto com um
método de construção de modelos QSAR. A escolha do subconjunto de descritores é guiada
pelo erro do algoritmo de construção para um dado subconjunto, avaliado, por exemplo, com
validação cruzada. Iterativamente, várias configurações de descritores selecionados e
descartados são avaliadas pela criação de um modelo e avaliação da acurácia da predição. Os
descritores finais são aqueles que fornecem a acurácia mais alta dentro de uma família de
modelos. Exemplos são Algoritmos Genéticos (SIEDLECKI; SKLANSKY, 1988) e
Simulated Annealing (ITSKOWITZ; TROPSHA, 2005) baseados em uma abordagem
estocástica, ou os métodos determinísticos como a seleção ou eliminação seqüenciais
(Sequential Feature Forward Selection e Sequential Backward Feature Elimination)
(KOHAVI; JOHN, 1997).
2.4. Construção do Modelo de Relação Estrutura-Atividade
Tendo selecionado os descritores, o passo final dos estudos de QSAR é a construção
do modelo de relação estrutura-atividade. Diversos tipos de modelos podem ser obtidos,
dependendo da natureza dos dados biológicos. Se os dados disponíveis forem em termos de
categorias de atividade, como “compostos ativos” e “inativos”, pode-se lançar mão de
métodos de classificação para a criação de modelos de relação estrutura-atividade (SAR).
Neste caso, os modelos são de natureza qualitativa apenas, uma vez que não serão feitas
predições sobre o valor numérico da atividade biológica. Se os dados forem de natureza
contínua, podem ser usados métodos de regressão para a obtenção de modelos quantitativos
(QSAR) (VAN DE WATERBEEMD; ROSE, 2003).
2. Estudos de QSAR 32
Outra distinção entre os tipos de modelos depende da abordagem matemática utilizada.
A atividade pode ser modelada como uma função linear dos descritores, como nos métodos de
regressão MLR e PLS, ou por relações mais complexas, com o auxílio de métodos não-
lineares, como Redes Neurais Artificiais (ANN), Decision Trees, Support Vector Machines,
entre outros (DUDEK; ARODZ; GÁLVEZ, 2006).
Independente da técnica utilizada para a construção dos modelos, estes devem ser
submetidos a testes de validação para garantir sua confiabilidade e avaliar sua capacidade
preditiva.
2.5. Validação dos Modelos de QSAR
A etapa final do desenvolvimento de um modelo QSAR é a sua validação.
Inicialmente, deve-se avaliar a qualidade do coeficiente de correlação r2, que depende da
variância total da variável dependente (Syy), de acordo com a Eq. (2):
yy
calcobs
S
yyr ∑ −
−=2
2)(
1 (2)
onde yobs é o valor experimental da atividade biológica e ycalc é o valor calculado pelo modelo.
Considera-se que um modelo QSAR pode ser aceito se o coeficiente de correlação estiver
próximo ou for maior do que 0,90 (KUBINYI, 1993).
A maioria dos métodos de QSAR utiliza uma abordagem de validação interna,
conhecida como validação cruzada. Amostras do conjunto de treinamento são retiradas do
modelo inicial, enquanto um novo modelo é construído para as restantes. A partir desse
2. Estudos de QSAR 33
modelo, as atividades biológicas das amostras retiradas são preditas, calculando-se os resíduos
entre os valores obtidos e os valores reais. Esse procedimento é repetido até que todas as
amostras tenham sido excluídas ao menos uma vez. Como resultado deste procedimento,
obtém-se o coeficiente de correlação da validação cruzada, q2, calculado de acordo com a Eq.
(3):
∑
∑−−
−=2
22
)(
)(1
médioobs
calcobs
yy
yyq (3)
O valor de q2 é usado como um critério para avaliar a robustez e a habilidade preditiva
do modelo. Valores de q2 > 0,50 são geralmente considerados como bons e q2 > 0,90 como
excelentes. A diferença entre r2 e q2 não deve ser maior do que 0,30, pois uma diferença
substancialmente maior pode indicar um modelo com ajuste forçado ou a presença de
variáveis independentes irrelevantes ou de outliers nos dados (ERIKSSON et al., 2003).
A característica mais importante de um modelo QSAR é o seu poder preditivo, que
pode ser definido como a habilidade de um modelo em encontrar uma correlação significativa
entre a atividade biológica predita e a observada experimentalmente para compostos que não
foram usados na construção do modelo. Isso pode ser feito dividindo-se o conjunto de dados
em conjunto de treinamento e conjunto de teste, que serão usados para a construção do
modelo e para a validação do modelo, respectivamente (TROPSHA, 2005).
Outra abordagem que deve ser usada paralelamente a essas técnicas de validação é a
randomização das atividades biológicas (WOLD, ERIKSSON, 1995). Essa abordagem
consiste em repetir o procedimento de construção do modelo com as atividades randomizadas
e, em seguida, fazer uma avaliação estatística dos modelos assim produzidos. Se todos os
modelos obtidos com as atividades randomizadas apresentarem coeficientes de correlação r2 e
2. Estudos de QSAR 34
q2 altos, isso significa que a correlação foi obtida por acaso e não porque a atividade biológica
está definitivamente relacionada aos descritores empregados no modelo. Isso implica que não
será possível obter um modelo QSAR aceitável para este conjunto de dados utilizando o
método que foi empregado (GRAMATICA, 2007; TROPSHA, 2005).
2.6. Estudos de Relação Estrutura-Atividade dos Compostos Arilpiperazínicos
O receptor 5-HT1A tem sido objeto de diversos estudos que demonstram sua
participação em várias funções fisiológicas, tais como sono, apetite e libido, bem como em
condições patológicas como ansiedade e depressão (BARRETT; VANOVER, 1993;
PUCADYIL; KALIPATNAPU; CHATTOPADHYAY, 2005).
Os compostos arilpiperazínicos constituem a classe mais importante de ligantes do
receptor 5-HT1A (ver estrutura geral, Figura 3a). Exemplos são a buspirona (3b), NAN-190
(3c), WAY 100635 (3d) e flesinoxan (3e) (OH et al., 2001). Uma vez que a estrutura
cristalográfica do receptor não foi determinada, os estudos de relação estrutura-atividade com
diversas séries de ligantes arilpiperazínicos são de fundamental importância para o
entendimento das características estruturais necessárias para a interação ligante-receptor e,
conseqüentemente, para o desenvolvimento de ligantes capazes de suscitar a resposta
desejada.
2. Estudos de QSAR 35
NN Ar1(CH2)n
Ar2
N
N
NN
N
O
O
NN
N
O
O
MeO
N
NNN
MeOO
NNN
O O O
OH
3a
3b 3c
3d3e
Figura 3 - (a) estrutura geral das arilpiperazinas; (b) buspirona; (c) NAN-190; (d) WAY 100635; (e) flesinoxan.
Uma das mais extensas e importantes séries de arilpiperazinas já sintetizadas resultou
do trabalho de López-Rodríguez et al. (1996, 1997a, 1997b, 1999, 2001a, 2001b, 2004, 2005)
em que derivados arilpiperazínicos contendo diferentes grupos Ar1 e Ar2 foram estudados
quanto à relação entre a afinidade pelo receptor e a presença de diferentes grupos, como
hidantoína, imidazol, piridina, e seus substituintes, bem como diferentes comprimentos da
cadeia que liga o anel piperazínico e o grupo Ar2. Dentre esses estudos, dois utilizaram
metodologias de análise quantitativa da relação estrutura-atividade. Um deles empregou a
metodologia CoMFA na construção de um modelo QSAR 3D para um conjunto de 48
arilpiperazinas (LÓPEZ-RODRÍGUEZ et al., 1997a) e no outro, uma análise de Hansch foi
realizada, juntamente com um estudo utilizando o método ANN para um conjunto de 32
arilpiperazinas (LÓPEZ-RODRÍGUEZ et al., 2001b). Os resultados mais importantes (ver
Figura 1a) indicam que substituintes volumosos nas posições orto e meta do anel aromático
2. Estudos de QSAR 36
Ar1 são favoráveis para afinidades mais altas pelo receptor 5-HT1A. A posição meta é
importante, também, para a seletividade por este receptor em comparação com o receptor
adrenérgico α1, pois enquanto o primeiro é capaz de acomodar substituintes volumos nesta
região, o receptor adrenérgico apresenta maiores restrições estéreas. Além disso, a análise do
comprimento da cadeia que separa o anel piperazínico e o substituinte Ar2 indica que os
ligantes com as maiores afinidades apresentam n = 3 ou 4.
Outro estudo empregando a metodologia CoMFA foi realizado por Gaillard et al.
(1996), com base em uma série de 101 compostos. O melhor modelo empregando apenas
arilpiperazinas (q2 = 0,65) indicou (a) uma região estérica favorável próxima ao anel
aromático Ar1; (b) uma região proibida próxima ao nitrogênio básico; (c) uma carga negativa
favorável próxima à posição orto do anel aromático Ar1 e (d) efeitos lipofílicos e
eletrostáticos opostos no substituinte do nitrogênio (ver Figura 1a).
Utilizando uma série com substituintes Ar1 e Ar2 bastante variados e com o auxílio do
programa CODESSA (KATRITZKY; KARELSON; PETRUKHIN, 2001), Menziani e
colaboradores (MENZIANI; DE BENEDETTI; KARELSON, 1998) realizaram uma análise
MLR com 29 compostos arilpiperazínicos, na qual o melhor modelo (r2 = 0,83) foi
encontrado com descritores ad hoc de tamanho e forma, índices de orbitais moleculares e área
superficial carregada. Os autores interpretam os resultados apontando que a interação
eletrostática entre a função amina protonada e um sítio nucleofílico primário no receptor,
necessária para o reconhecimento molecular, é descrita pelos índices de orbitais moleculares
localizados no grupo N-H+, enquanto as interações atrativas e repulsivas de curto alcance
(forças polares e dispersivas) são descritas pelos índices computados para a molécula inteira e
pelos descritores ad hoc.
Uma importante linha de pesquisa existente atualmente é baseada em compostos que
possuem atividade simultânea em receptores serotoninérgicos e/ou adrenérgicos e/ou
2. Estudos de QSAR 37
transportadores (HEINRICH et al., 2004). Em particular, conforme dito anteriormente, a
combinação de compostos que sejam simultaneamente inibidores seletivos da recaptação de
serotonina e apresentem afinidade pelo receptor 5-HT1A tem sido objeto de pesquisa desde
que o pindolol, que é um antagonista deste receptor, demonstrou bons resultados para a
terapia antidepressiva quando administrado juntamente com um ISRS (DRESHFIELD et al.
1996; SHARP; UMBERS; GARTSIDE, 1997).
Com o objetivo de encontrar compostos que apresentassem afinidade pelo receptor 5-
HT1A e, simultaneamente, capacidade de inibir a recaptação de serotonina, várias séries de
compostos foram planejadas por Monge e colaboradores em diversos trabalhos, que
começaram com a síntese de derivados do 3-[(4-aril)piperazin-1-il]-1-arilpropano por
Oficialdegui et al. (2000) - ver Figura 4.
NAr2N Ar1
z
Figura 4 - Estrutura geral dos compostos sintetizados inicialmente por Oficialdegui et al. (2000).
Dando continuidade a esse projeto, Martínez-Esparza et al. (2001) sintetizaram
diferentes séries de derivados arilpiperazínicos com o objetivo de obter novos compostos com
afinidade pelo receptor 5-HT1A e pelo 5-HTT (transportador de serotonina). O estudo do
grupo funcional Z, do anel aromático acoplado à piperazina (Ar1) e do anel aromático Ar2 (ver
Figura 4) sugeriu as seguintes SARs: (i) a introdução de um éter aril em Z não foi necessária
para obter a atividade dual desejada, sendo que os melhores resultados foram obtidos com
hidroxilas nesta posição. (ii) entre todas as arilpiperazinas testadas, as afinidades mais altas
foram obtidas com derivados 2-metóxifenilpiperazínicos. (iii) Com relação ao anel Ar2, as
2. Estudos de QSAR 38
afinidades foram claramente aumentadas quando o anel benzênico foi substituído por tiofeno
(séries I e II) e também nas séries em que o naftaleno foi substituído pelo benzotiofeno (séries
III e IV) – ver Figura 5.
NN
R
zAr1
I
NNz
Ar1
III
R NNz
Ar1
II
NNz
Ar1
SIV
Figura 5 - Estrutura geral dos compostos das séries I, II, III e IV de Martinez-Esparza et al. (2001).
Partindo dos resultados de que os compostos 6a e 6b (Figura 6) apresentavam as
maiores afinidades, uma nova série de compostos foi sintetizada por Orús et al. (2002) com o
objetivo de obter bloqueadores de 5-HTT eficazes, apresentando ao mesmo tempo uma
atividade antagonista nos receptores 5-HT1A.
S
NN
OH
MeO
6a
S
NN
OH
MeO
F
6b
Figura 6 - Compostos sintetizados por Martinez-Esparza et al. com afinidades mais altas.
2. Estudos de QSAR 39
Considerando estes compostos, as seguintes SARs foram estabelecidas pelos autores:
− Variações conformacionais da molécula como conseqüência dos efeitos retiradores de
elétrons do flúor podem explicar a reduzida seletividade no receptor apresentada pelos
compostos que possuem um flúor no anel benzotiofeno;
− A presença de um heteroátomo e sua posição parecem ser críticas para a afinidade
pelos receptores 5-HT1A, com os compostos derivados do 8-quinolil mostrando os
melhores resultados. Heteroátomos podem levar a interações não-covalentes
cooperativas adicionais, finalmente aumentando a valência do ligante em termos de
pontos de contato no reconhecimento e no processo de interação, ou seja, estendendo a
capacidade farmacofórica;
− O grupo metil do anel quinaldínico não afeta significativamente as afinidades,
sugerindo que não existem restrições estéreas no processo de interação, que pode ser
governado principalmente por fatores eletrônicos.
Estes estudos resultaram na síntese de novos derivados, cujos melhores resultados
foram obtidos com os compostos 7a e 7b, mostrados na Figura 7 (PÉREZ-SILANES et al.,
2004).
S
NN
OHOH
O
O
7a
S
NN
OHO2N
O
O
7b
Figura 7 – Compostos com melhores resultados sintetizados por Pérez-Silanes et al. (2004).
2. Estudos de QSAR 40
Outro exemplo recente de síntese de compostos apresentando ação dual são os
trabalhos de Heinrich et al. com derivados indolbutilpiperazínicos (ver Figura 8a), que se
mostraram capazes de aumentar o nível de serotonina em importantes áreas do cérebro (córtex
frontal e hipocampo ventral) (HEINRICH et al., 2004a; 2004b). Nestes estudos, a vilazodona
(ver Figura 8b) foi identificada como um ligante altamente seletivo por receptores 5-HT1A
pré-sinápticos e apresentou atividade subnanomolar (0,5 nM) como inibidor de recaptação de
serotonina. Por causar um aumento significativo dos níveis de serotonina no córtex frontal de
ratos em uma quantidade jamais alcançada com ISRSs administrados isoladamente, este
composto é considerado de extremo interesse para o exame do impacto que o aumento dos
níveis de serotonina em importantes áreas do cérebro tem nas disfunções do humor.
8a 8b Figura 8 - (a) Estrutura geral dos compostos indolbutilpiperazínicos sintetizados por Heinrich et al.; (b) estrutura da vilazodona.
NH NN
R
R' NH NN
CN
O
NH2
O
3. Modelagem Molecular de Proteínas 41
3. MODELAGEM MOLECULAR DE PROTEÍNAS
No processo de planejamento de fármacos, informações estruturais sobre o alvo
biológico e o modo de interação de seus ligantes são fundamentais. Embora o banco de dados
estruturais de proteínas - PDB (Protein Data Bank) - (BERMAN et al., 2000) venha
crescendo substancialmente graças aos aperfeiçoamentos em técnicas de determinação
estrutural, ainda existem alguns alvos biológicos relevantes que não apresentam dados
disponíveis. Nesses casos, se faz necessária a utilização de métodos de predição da estrutura
terciária de proteínas (DEANE; BLUNDELL, 2003).
O objetivo destes métodos é a predição da estrutura tridimensional de uma proteína a
partir de sua seqüência de aminoácidos, geralmente incluindo informações adicionais, como
dados estruturais de proteínas relacionadas (JOHNSON et al., 1994). Entretanto, alguns
fatores tornam a predição da estrutura de proteínas uma tarefa difícil. Os dois principais
problemas são o grande número de conformações possíveis e o fato de que a base física para a
estabilidade estrutural das proteínas não é completamente entendida. Assim, qualquer método
de predição da estrutura de proteínas necessita de uma maneira eficiente de explorar o espaço
de possíveis estruturas (uma estratégia de busca conformacional) e uma maneira de identificar
a estrutura mais plausível energeticamente - uma função de energia (DEANE; BLUNDELL,
2003).
Nos métodos de modelagem por homologia, ou modelagem comparativa, o espaço de
busca é restringido assumindo-se que a proteína em questão adota uma estrutura que é
razoavelmente próxima da estrutura de ao menos uma proteína conhecida. Já na modelagem
ab initio ou de novo, nenhuma suposição quanto ao arranjo tridimensional é feita inicialmente
(MOULT, 1999).
3. Modelagem Molecular de Proteínas 42
Os modelos tridimensionais obtidos podem ser empregados em estudos de docking
ligante-receptor ou proteína-proteína, bem como para anotação funcional de genes
identificados no genoma de um organismo. Mesmo modelos apresentando baixa acurácia
podem ser úteis para esses propósitos, pois suas imprecisões tendem a serem localizadas nas
regiões dos loops, que são normalmente variáveis, mesmo em proteínas extremamente
relacionadas. As regiões funcionais das proteínas, especialmente os sítios ativos, costumam
ser altamente conservados e, assim, modelados com maior precisão (BAKER; SALI, 2001;
GOPAL et al., 2001).
Os fundamentos da modelagem de proteínas por homologia e dos estudos de docking
ligante-receptor serão brevemente revisados a seguir, juntamente com os estudos de
modelagem do receptor 5-HT1A relatados na literatura.
3.1. A Modelagem por Homologia
Os métodos de modelagem por homologia baseiam-se no princípio de que proteínas
pertencentes a uma mesma família ou superfamília são homólogas, ou seja, derivam de um
mesmo ancestral comum. Assumindo que a estrutura tridimensional de uma proteína seja
determinada apenas pela sua seqüência de aminoácidos e por seu meio, um modelo para uma
seqüência de estrutura desconhecida pode ser construído pela extrapolação de características
tridimensionais de estruturas homólogas conhecidas (STERNBERG, 1996).
Em geral, o procedimento adotado pode ser dividido nas seguintes etapas (DEANE;
BLUNDELL, 2003): (1) identificação de uma ou mais proteínas com estruturas determinadas
(“proteína-molde”) que sejam semelhantes à estrutura da proteína a ser modelada (“proteína-
3. Modelagem Molecular de Proteínas 43
alvo”); (2) produção de um alinhamento dos resíduos da proteína-alvo com o(s) molde(s); (3)
construção de um modelo tridimensional da proteína-alvo; (4) validação do modelo obtido.
3.1.1. Identificação de moldes estruturais
Esta etapa pode ser trivial se a identidade seqüencial entre o alvo e as estruturas
tridimensionais conhecidas for alta (> 30%), pois então métodos simples de comparação entre
pares de seqüências, tais como FASTA e SSEARCH (PEARSON; LIPMAN, 1988) serão
capazes de identificar uma relação facilmente (BRENNER; CHOTHIA; HUBBARD, 1998).
Quando a identidade seqüencial for mais baixa, o reconhecimento da similaridade
estrutural entre duas seqüências pode ser mais complicado. Métodos de busca baseados
apenas na seqüência, tais como PSI-BLAST (ALTSCHUL et al., 1997) e hidden Markov
models (EDDY, 1998; KARPLUS et al., 1997), podem usar informações de alinhamentos
múltiplos de seqüência para representar as características compartilhadas por seqüências
relacionadas (perfis seqüenciais) e, assim, encontrar estruturas conhecidas que possam ser
usadas como moldes (KORETKE et al., 1999).
Por outro lado, existem métodos que utilizam informações da estrutura tridimensional
para a busca por estruturas homólogas. Dentre estes, os métodos conhecidos como threading
exploram a diferença na distribuição de distâncias entre resíduos nas estruturas de proteínas
para diferentes pares de aminoácidos (JONES; TAYLOR; THORNTON, 1992;
PANCHENKO; MARCHLER-BAUER; BRYANT, 1999). Outros métodos baseiam-se em
perfis gerados por alinhamentos seqüenciais múltiplos, que são avaliados de acordo com
tabelas de substituição de aminoácidos (BOWIE; LUTHY; EISENBERG, 1991; FISCHER;
EISENBERG, 1996; SHI; BLUNDELL; MIZUGUCHI, 2001).
3. Modelagem Molecular de Proteínas 44
3.1.2. Alinhamento da seqüência-alvo com a estrutura-molde
Esta é uma etapa crucial na modelagem por homologia e a mais importante fonte de
erros (JONES; KLEYWEGT, 1999; SRINIVASAN; BLUNDELL, 1993). Seqüências muito
curtas ou muito semelhantes podem ser alinhadas manualmente; entretanto, problemas mais
complexos requerem a construção de algoritmos para a produção de alinhamentos seqüenciais
de boa qualidade. Nos casos em que a identidade seqüencial entre o alvo e o molde é baixa,
um alinhamento adequado só pode ser obtido com intervenção manual (DEANE;
BLUNDELL, 2003).
Em geral, os algoritmos avaliam alinhamentos de seqüências usando esquemas
contendo escores para os 210 pares de aminoácidos possíveis, armazenados em uma matriz de
similaridade, onde são atribuídos escores mais altos para o alinhamento de resíduos idênticos
e para aqueles de caráter similar, enquanto pares dissimilares recebem escores mais baixos. O
problema de gerar um alinhamento ótimo varia de acordo com o tipo de alinhamento que se
quer fazer: métodos para pares de seqüências, métodos para seqüências múltiplas e métodos
que incorporam informações adicionais (por exemplo, da estrutura terciária de uma proteína).
Algoritmos de programação dinâmica são os mais comuns e operam identificando o
alinhamento ótimo para duas seqüências de acordo com um determinado esquema de escores,
incluindo penalidades para lacunas e extensões de lacunas entre seqüências (SMITH;
WATERMAN, 1981). Estes alinhamentos são então usados como base para predizer a
conformação do alvo a partir das estruturas-molde.
3. Modelagem Molecular de Proteínas 45
3.1.3. Construção do modelo
Tendo obtido um alinhamento entre o alvo e o(s) molde(s), a informação contida no
arquivo de alinhamento é usada para gerar um modelo tridimensional do alvo, representado
como um conjunto de coordenadas Cartesianas para cada átomo na proteína. Existem duas
principais classes de métodos para a geração de modelos: métodos baseados em restrições
espaciais e métodos baseados em fragmentos (BAKER; SALI, 2001; STERNBERG, 1996).
Nos métodos baseados em restrições espaciais, o modelo tridimensional é obtido de
forma a satisfazer determinadas restrições derivadas do alinhamento com estruturas
relacionadas. Um ou mais alinhamentos são usados para estabelecer um conjunto de critérios
geométricos que são então convertidos em funções de densidade de probabilidade para cada
restrição. Restrições aplicadas às principais coordenadas internas da proteína - distâncias entre
átomos e ângulos diedros - servem como base para um procedimento de otimização global
usado para refinar as posições dos átomos. Este processo de modelagem pode ser refinado
também com dados experimentais e/ou conhecimento teórico sobre a estrutura das proteínas
(SALI; BLUNDELL, 1990). Restrições experimentais podem vir de dados de RMN,
espectroscopia de fluorescência, microscopia eletrônica ou mutagênese sítio-dirigida,
enquanto restrições teóricas incluem regras de empacotamento da estrutura secundária,
hidrofobia, mutações correlacionadas e potenciais empíricos. Programas baseados na
satisfação de restrições espaciais, como o programa MODELLER (SALI; BLUNDELL,
1993), que é o mais utilizado pela comunidade científica, normalmente produzem modelos
completos, mas com qualidade variável em diferentes regiões. Isto ocorre por causa das
dificuldades em lidar com deleções e inserções no alinhamento, para as quais não se consegue
derivar restrições facilmente a partir de proteínas de estrutura conhecida. Além disso, esses
3. Modelagem Molecular de Proteínas 46
programas geralmente necessitam de maior capacidade e tempo computacionais para a
geração de modelos (MONTALVÃO et al., 2005).
Nos métodos baseados em fragmentos, a proteína-alvo normalmente é modelada
construindo-se inicialmente as regiões estruturalmente conservadas (structural conserved
regions, SCRs) - que correspondem às regiões de máxima similaridade - e, em seguida, as
regiões estruturalmente variáveis (structural variable regions, SVRs) (GREER, 1980). Os
fragmentos identificados em estruturas homólogas são então avaliados de acordo com sua
similaridade com a seqüência alvo de modo que um modelo seja construído a partir dos
melhores fragmentos (JOHNSON et al., 1994). As diversas implementações destes métodos
diferem principalmente na maneira como são tratadas as SVRs, que podem ser construídas
usando-se fragmentos de proteínas conhecidas ou por meio de métodos ab initio ou de busca
conformacional (DEANE; BLUNDELL, 2000; ZHANG et al., 1997). Outro ponto importante
é a orientação correta das cadeias laterais dos aminoácidos, que é fortemente dependente da
conformação do esqueleto principal do modelo e de características do meio. De maneira geral,
o posicionamento mais confiável das cadeias laterais é obtido com o uso de coleções de
rotâmeros (DUNBRACK; KARPLUS, 1993; LOVELL, et al., 2000). Finalmente,
inconsistências estéricas devem ser removidas do modelo, o que pode ser feito com
algoritmos de minimização de energia.
No presente trabalho, foi empregada uma metodologia desenvolvida recentemente por
Montalvão e colaboradores (2005), implementada no programa CHORAL, que faz parte do
pacote ORCHESTRARTM (TRIPOS INC.). O programa CHORAL introduz o conceito de
clusters estruturalmente conservados (SCCs), que usa o máximo de informação disponível
para a família de proteínas e também introduz novos requisitos geométricos como condição
suficiente de conservação estrutural. Esta abordagem foi planejada para melhorar o
desempenho da modelagem de famílias com baixa identidade seqüencial.
3. Modelagem Molecular de Proteínas 47
No programa CHORAL, resíduos alinhados de estruturas superpostas são definidos
como agregados quando todas as separações entre carbonos α (Cα) no ensemble ficam abaixo
de 3.6Å. Uma região em duas ou mais proteínas, de no mínimo três resíduos de comprimento,
é considerada conservada quando todos os seus resíduos são agregados e as diferenças para
todas as suas características de geometria diferencial (curvatura e torção) estão abaixo de um
limite específico. Os parâmetros de curvatura e torção são calculados a partir de três funções
paramétricas spline que ajustam as coordenadas x, y e z dos Cα com o índice do resíduo usado
como parâmetro (MONTALVÃO, 2005). Usando estes valores é possível agrupar os resíduos
para uma posição alinhada criando conjuntos de resíduos que são classificados como
geometricamente conservados. Para fazer esses agrupamentos, aplica-se um esquema
modificado do algoritmo seqüencial básico (THEODORIDIS; KOUTROUMBAS, 1998)
usando distâncias Euclideanas entre os pontos no espaço de curvatura e torção como medida
de dissimilaridade.
O próximo passo é comparar cada posição com seus vizinhos para determinar os
SCCs. Um SCC é definido como uma região de três ou mais resíduos onde todos os sub-
conjuntos são iguais. A definição do SCC é obtida das análises de similaridade construídas
usando geometria diferencial com a adição de um limite de separação Cα-Cα e o critério de
comprimento mínimo. Para a modelagem do core da proteína, o limite de separação Cα-Cα é
uma condição necessária, assim qualquer equivalência entre resíduos usando qualquer medida
interna, tal como curvatura e torção, deve ser aplicada apenas para resíduos que obedeçam a
este critério. Se as posições alinhadas forem agrupadas inicialmente pelas separações Cα-Cα
e, assim, os agrupamentos forem sub-agrupados pela distância curvatura-torção, o resultado
deve conter apenas resíduos que são geometricamente equivalentes (MONTALVÃO et al.,
2005).
3. Modelagem Molecular de Proteínas 48
Em seguida, o programa utiliza tabelas de propensão de aminoácidos com restrições
dependentes do meio (DEANE; BLUNDELL, 2001) para atribuir escores a todos os resíduos
da família de proteínas do molde no alinhamento. Assim, o escore de um determinado SCC é
uma indicação de sua propensão a representar a estrutura da seqüência alvo para aquela região
(com comprimento mínimo de três resíduos).
O processo de agrupamento cria um ensemble de SCCs sobrepostos, cada um com
geometria única, que precisa ser reduzido a uma única solução. Para isso, o programa
CHORAL aplica uma abordagem de otimização combinatória baseada em simulated
annealing (KIRKPATRICK; GELATT; VECCHI, 1983).
A etapa final é a construção das coordenadas do esqueleto principal da proteína-alvo.
O programa cria um framework F multiplicando o vetor α das coordenadas dos Cα de cada
resíduo de cada estrutura i no SCC por seu escore normalizado Si:
rii
r S αF ⋅=∑ (4)
Aplicando a Eq. (4) para todos os resíduos em todos os SCCs cria-se o framework completo
no qual os resíduos da proteína-alvo serão construídos.
A definição do SCC foi planejada especificamente para acomodar a natureza
multimodal de ensembles de proteínas pertencentes a famílias homólogas, que é característica
particular das distribuições dos Cα em superfamílias de baixa similaridade e também de
regiões de loop. Sendo assim, em avaliações feitas com diferentes conjuntos de teste a fim de
comparar o desempenho do programa CHORAL com relação ao MODELLER, os modelos
obtidos apresentaram qualidades equivalentes, mas os melhores resultados foram obtidos com
famílias em que a PID (porcentagem de identidade) média é menor que 40%. Além disso, o
programa CHORAL emprega um algoritmo muito mais rápido; o tempo de cálculo típico para
3. Modelagem Molecular de Proteínas 49
produzir cinco modelos alternativos para um determinado alvo é de menos de cinco minutos,
enquanto o programa MODELLER leva cerca de duas horas, sob as mesmas condições
(MONTALVÃO et al., 2005).
3.1.4. Validação do modelo
Os modelos produzidos com o método de modelagem por homologia devem ser
examinados à luz de todos os dados experimentais disponíveis e de técnicas de validação.
Uma das ferramentas fundamentais para avaliar a qualidade de um modelo é o mapa de
Ramachandran, que mostra a distribuição dos ângulos de torção ϕ e ψ para cada aminoácido
em uma proteína. Nesse diagrama, cujo exemplo é apresentado na Figura 9, as áreas em
branco correspondem a conformações onde os átomos em um polipeptídeo estão mais
próximos do que a soma dos seus raios de van der Waals. Essas regiões são estericamente
proibidas para todos os aminoácidos, exceto para a glicina, que não possui cadeias laterais. As
regiões em azul-ciano escuro correspondem a conformações nas quais não há impedimentos
estéricos, ou seja, são as regiões favoráveis para conformações de alfa-hélices e folhas-beta.
As áreas em azul-ciano claro mostram as regiões permitidas se raios de van der Waals
ligeiramente menores forem usados nos cálculos, ou seja, permite-se que átomos fiquem mais
próximos. Em um modelo ideal, espera-se que aproximadamente 98% dos aminoácidos
estejam nas regiões favoráveis e cerca de 2% nas regiões permitidas (LOVELL et al., 2002).
3. Modelagem Molecular de Proteínas 50
Figura 9 - Mapa de Ramachandran para a rodopsina bovina.
Informações adicionais podem ser obtidas para que o modelo seja validado em
diferentes níveis de organização estrutural, avaliando-se a qualidade do empacotamento
global da proteína, os possíveis erros estruturais em regiões localizadas e outros parâmetros
3. Modelagem Molecular de Proteínas 51
estereoquímicos como ângulos e distâncias de ligação, choques entre átomos, posicionamento
de moléculas de água, ligações de hidrogênio, etc.
Existem, ainda, experimentos de benchmarking em larga-escala que são feitos para
avaliar a qualidade relativa dos vários métodos de modelagem por homologia, tais como:
CASP (Critical Assessment of Techniques for Protein Structure Prediction), no qual
pesquisadores submetem modelos estruturais de seqüências cujas estruturas tenham sido
resolvidas recentemente, mas que ainda não foram publicadas; e CAFASP (Critical
Assessment of Fully Automated Structure Prediction), que avalia apenas modelos produzidos
via servidores completamente automatizados.
3.2. Docking ligante-receptor
Os estudos de docking ligante-receptor são utilizados para encontrar a conformação e a
orientação de um ligante com relação a um determinado receptor quando a estrutura do
mesmo é conhecida ou pode ser modelada. A partir disto, é possível estimar a força de
associação entre ligante e receptor por meio de funções de escore. Assim, o procedimento dos
estudos de docking pode ser descrito como uma combinação entre um algoritmo de busca
conformacional e uma função de escore. A abordagem mais comum é tratar o receptor como
sendo rígido e considerar apenas o espaço conformacional do ligante, embora o ideal seja
considerar também a flexibilidade do receptor (KITCHEN et al., 2004).
Neste trabalho, os estudos de docking foram feitos utilizando o programa GOLD, que
emprega um algoritmo genético para explorar o espaço conformacional do ligante e uma
função de escore baseada em campos de força. O programa GOLD permite o tratamento da
flexibilidade completa dos ligantes, bem como flexibilidade parcial do receptor - cadeias
3. Modelagem Molecular de Proteínas 52
laterais e esqueleto principal de até 10 resíduos definidos pelo usuário (JONES et al., 1997).
Os algoritmos genéticos aplicam idéias derivadas da genética e da teoria da evolução
para a busca conformacional. Estes algoritmos partem de uma população inicial de diferentes
conformações do ligante. Cada conformação é definida por um conjunto de variáveis
estabelecidas (definidos como genes) que descrevem aspectos como translação, orientação e
conformação do ligante em relação ao receptor. O conjunto completo das variáveis dos
ligantes é definido como genótipo, enquanto as coordenadas atômicas são conhecidas como
fenótipo. Operadores genéticos (mutações, crossovers e migrações) são aplicados à população
para explorar o espaço conformacional, até que seja encontrada uma população final que
otimize uma função de ajuste pré-definida (JONES; WILLETT; GLEN, 1997).
Quanto às funções de escore, de modo geral, campos de força padrões quantificam a
soma de dois tipos de energia: a energia de interação entre o receptor e o ligante e a energia
interna do ligante. As energias são normalmente avaliadas por meio de uma combinação de
termos eletrostáticos e de van der Waals. Um potencial de Lennard-Jones é usado para
descrever o termo relacionado às interações de van der Waals, enquanto o termo eletrostático
é obtido com uma função Coulômbica dielétrica dependente da distância (KITCHEN et al.,
2004; BISSANTZ; FOLKERS; ROGNAN, 2000). A função de escore do programa GOLD é
baseada em campos de força e inclui três termos: um termo para as ligações de hidrogênio,
um potencial de dispersão intermolecular 4-8 e um potencial intramolecular 6-12 para a
energia interna do ligante.
3. Modelagem Molecular de Proteínas 53
3.3. Estudos de Modelagem do Receptor 5-HT1A e seus Ligantes
O receptor 5-HT1A é um dos mais estudados membros da família dos receptores
acoplados à proteína G (GPCRs), especialmente devido à disponibilidade do ligante seletivo
8-OH-DPAT [8-hidroxi-2-(di-N-propilamino)tetralina], que permitiu extensivas
caracterizações bioquímicas, fisiológicas e farmacológicas deste receptor (ARVIDSSON et
al., 1981; GOZLAN et al., 1983). Este foi o primeiro receptor serotoninérgico a ser
completamente seqüenciado (FARGIN et al., 1988; KOBILKA et al., 1987) e também o
primeiro para o qual anticorpos policlonais foram obtidos, permitindo sua visualização no
nível sub-celular em várias regiões do cérebro (EL MESTIKAWY et al., 1990).
Como o receptor 5-HT1A apresenta relação com o desenvolvimento neuronal (DEL
OLMO et al., 1998; GROSS et al., 2002) e com a proteção para neurônios submetidos a
degeneração e apoptose (SINGH et al., 1996), o tratamento usando agonistas desses
receptores tem sido empregado em crianças com disfunções de desenvolvimento (AZMITIA,
2001). Além disso, agonistas e antagonistas do receptor 5-HT1A representam a maior classe de
moléculas com potencial terapêutico contra disfunções relacionadas à ansiedade. Desse modo,
o receptor 5-HT1A representa um importante alvo no desenvolvimento de agentes terapêuticos
para tratar disfunções neuropsiquiátricas como a ansiedade e a depressão (BLIER; DE
MONTIGNY; CHAPUT, 1990; GRIEBEL, 1990; PUCADYIL; KALIPATNAPU;
CHATTOPADHYAY, 2005).
Até o presente momento, nenhuma estrutura de alta resolução deste receptor foi obtida
por técnicas como cristalografia de raios-X, espectroscopia de ressonância magnética ou
microscopia eletrônica. As informações estruturais obtidas por métodos complementares
indicam que o receptor é constituído por 422 aminoácidos, distribuídos em sete domínios
transmembrânicos, cada um com aproximadamente 25 resíduos (RAYMOND et al., 1999). As
3. Modelagem Molecular de Proteínas 54
α-hélices são conectadas por 6 loops, sendo três intracelulares e três extracelulares,
apresentando o resíduo N-terminal fora da célula e o resíduo C-terminal no lado
citoplasmático. Esta topologia faz com que o receptor 5-HT1A seja classificado como
pertencente à família A dos GPCRs (GETHER, 2000).
A determinação da estrutura cristalográfica do receptor 5-HT1A (e dos GPCRs em
geral) é dificultada por duas razões. Primeiro, porque é difícil expressar uma quantidade
suficiente desse receptor e, segundo, porque a conformação natural dos GPCRs – com sete
domínios transmembrânicos introduzidos dentro e fora da superfície celular – é difícil de ser
reproduzida nas condições de cristalização. Por isso, para obterem-se novos conhecimentos
sobre estes importantes alvos biológicos, a utilização de métodos computacionais torna-se
extremamente importante, com a construção de modelos preditivos e o estudo de suas
interações com ligantes conhecidos (THIEL, 2004).
Alguns modelos do receptor 5-HT1A foram construídos em trabalhos anteriores
utilizando diferentes abordagens. Entretanto, as conclusões destes trabalhos divergem quanto
ao posicionamento dos ligantes no sítio de interação. Embora sejam a maior e mais estudada
classe de ligantes do receptor 5-HT1A, os modos de interação das arilpiperazinas permanece
ambíguo.
Duas metodologias complementares foram usadas até agora na investigação da
interação desses ligantes com o receptor. Experimentos de mutagênese sítio-dirigida
sugeriram que os resíduos Asp3.32, Asn7.39, Ser5.42 e Thr5.43 podem estar envolvidos na
interação com ligantes (GUAN; PEROUTKA; KOBILKA, 1992; LIAPAKIS et al., 2000;
STRADER et al., 1989). A interação entre o nitrogênio protonado da arilpiperazina e o
3. Modelagem Molecular de Proteínas 55
resíduo Asp3.32 foi considerada crucial para todos os receptores de neurotransmissores
monoaminérgicos (STRADER et al., 1988).1
Por outro lado, métodos de modelagem molecular foram empregados para construir
modelos tridimensionais do receptor 5-HT1A. Os primeiros esforços para modelar este
receptor datam do começo dos anos 90, quando a bacteriorodopsina foi usada como molde
(HEDBERG et al., 1996; HOMAN; WIKSTROM; GROL, 1999; KUIPERS et al., 1995;
SYLTE; EDVARDSEN; DAHL, 1993; TRUMPP-KALLMEYER et al., 1992). Com a
publicação das coordenadas do mapa de projeção da rodopsina em 1997 (BALDWIN;
SCHERTLER; UNGER, 1997) e a resolução da estrutura cristalográfica da rodopsina bovina
em 2000 (PALCZEWSKI et al., 2000), esta tornou-se o molde preferencial na modelagem de
GPCRs. Recentemente, no final do ano de 2007, foi determinada a estrutura cristalográfica do
receptor adrenérgico-β2 complexado com o ligante carazolol, que deve tornar-se um
importante molde para os GPCRs (CHEREZOV et al., 2007; RASMUSSEN et al., 2007).
Desde 1997, Sylte e colaboradores têm apresentado uma série de modelos do receptor
5-HT1A construídos utilizando o mapa de projeção da rodopsina (SYLTE et al., 1997) e, mais
tarde, a estrutura cristalográfica da rodopsina (BRONOWSKA et al., 2001). Os modelos
foram obtidos por meio de modelagem por homologia e, posteriormente, equilibrados em uma
série de simulações de dinâmica molecular (DM). Dois modos de interação possíveis foram
propostos para análogos da buspirona, baseados nas simulações de DM dos complexos
ligante-receptor, ambos considerando Asp3.32 como ponto de ancoragem para o nitrogênio
protonado do ligante. No primeiro modo de interação, um ligante é posicionado dentro de
uma cavidade profunda entre as hélices transmembrânicas (HTMs) 2, 3 e 7. Esse modo
assume uma conformação estendida para os ligantes estudados. No segundo modo, a
1 A fim de facilitar a comparação entre todos os estudos, adotamos neste trabalho a nomenclatura de Ballesteros-Weinstein para os aminoácidos das hélices transmembrânicas (BALLESTEROS; WEINSTEIN, 1996). Nesta nomenclatura, cada resíduo é identificado pela hélice em que se encontra e pela posição com relação ao resíduo mais conservado na hélice (numerado arbitrariamente como 50).
3. Modelagem Molecular de Proteínas 56
conformação dos análogos da buspirona é dobrada devido às torções das ligações do
espaçador alquílico que liga o anel piperazínico ao grupo imida. O anel aril do ligante alcança
o resíduo Phe6.61 e outros aminoácidos nas HTMs 5, 6 e 7, enquanto o oxigênio carboxílico
da imida pode formar uma ligação de hidrogênio com Ser7.46.
No modelo apresentado por Lopez-Rodriguez e colaboradores (2001b), certas
modificações foram introduzidas na estrutura do feixe das 7 hélices transmembrânicas. Neste
modelo, HTM3 é significativamente curvada na direção de HTM5. Esta modificação reduz as
distâncias Asp3.32-Ser5.42 e Asp3.32-Thr5.43, possibilitando interações concorrentes do
grupo amina do ligante com Asp3.32 e do grupo amida com Ser5.42 e Thr5.43. Esta
conformação da HTM3 foi obtida agrupando a trajetória da DM e foi resultado da
modificação dos ângulos ϕ e ψ dos resíduos 3.35 e 3.46. O modo de interação proposto neste
estudo é diferente daqueles propostos por Sylte e colaboradores (1997) e assume que o grupo
arilpiperazínico é localizado entre as hélices HTM3 e HTM7. A porção aromática do ligante
pode interagir com Phe3.28, Trp7.40 e Tyr7.43, enquanto os substituintes no anel aril
interagem com Asn7.39. Os grupos carbonila do grupo hidantoína do ligante formam ligações
de hidrogênio com Ser5.42, Thr5.43, Thr3.37 e Trp6.48 e o substituinte imida é posicionado
dentro da cavidade entre TMH4 e TMH6.
Um modelo publicado por Seeber e colaboradores (SEEBER; DE BENEDETTI;
FANELLI, 2003) foi usado em estudos de simulação de DM das variações conformacionais
induzidas por agonistas e antagonistas. A posição dos ligantes no receptor, determinada pelo
derivado arilpiperazínico WAY100635 por meio de docking automático é similar ao proposto
por Lopez-Rodriguez e colaboradores (2001b), mas a orientação do ligante e,
conseqüentemente, as interações específicas, são opostas. O grupo 2-metoxifenilpiperazina do
ligante é posicionado na cavidade de interação formada pelas TMH4 e TMH6, enquanto o
3. Modelagem Molecular de Proteínas 57
nitrogênio do anel piridínico substituído no fragmento amida forma uma ligação de
hidrogênio com o nitrogênio da cadeia lateral do Asn7.39.
Posteriormente, Nowak e colaboradores (2006) empregaram uma metodologia
diferenciada para obter uma descrição detalhada dos modos de interação, que consistiu de três
passos básicos: (a) geração de uma extensa população de modelos para explorar o espaço
conformacional do receptor, (b) docking automático de ligantes rígidos em todos os modelos
gerados visando a seleção do melhor ajuste conformacional entre ligante e receptor e (c)
modificação do receptor para desenvolver modelos que descrevessem adequadamente a
interação com ligantes. Os resultados obtidos são consistentes com os propostos por Seeber e
colaboradores (2003); entretanto, um número maior de interações específicas foi descrito,
especialmente aquelas responsáveis pelo reconhecimento da porção aromática dos ligantes.
Outro modelo tridimensional do receptor 5-HT1A foi construído e validado por estudos
de docking e simulações de DM da interação com o agonista natural - a serotonina - e os
enantiômeros do 8-OH-DPAT (DABROWSKA; BRYLINSKI, 2006). Os resultados obtidos,
confirmados por ensaios bioquímicos, enfatizam os diferentes perfis farmacológicos desses
compostos. Diferentemente do enantiômero-S, o R-8-OH-DPAT atua como um potente
agonista total, enquanto a forma racêmica apresenta perfil similar ao do enantiômero-R. Os
autores apontam o papel fundamental dos resíduos Ser5.42 e Thr5.43 na interação com a
serotonina, em concordância com os estudos de mutagênese sítio-dirigida (GUAN;
PEROUTKA; KOBILKA, 1992; LIAPAKIS et al., 2000; STRADER et al., 1989), assim
como interações (do tipo aromatic stacking) entre os anéis aromáticos do ligante e os anéis
dos resíduos Phe6.51 e Phe6.52. Esta interação também foi observada no caso dos
enantiômeros do 8-OH-DPAT, o que indica uma importante contribuição de interações
hidrofóbicas para a afinidade, conforme observado em outro estudo sobre a porção
hidrofóbica do sitio de interação do receptor 5-HT1A (ZLATOVIC et al., 2006).
4. Objetivos 58
4. OBJETIVOS
4.1. Objetivo Geral
Investigar teoricamente as interações observadas experimentalmente entre compostos
derivados de arilpiperazinas com o receptor 5-HT1A, cujo antagonismo é relacionado a um
aumento de eficácia da farmacoterapia antidepressiva, a fim de possibilitar um maior
entendimento das características importantes para tais interações.
4.2. Objetivos Específicos
- Partindo das estruturas otimizadas dos compostos, calcular propriedades eletrônicas,
estéricas e topológicas para determinar quais as características que discriminam os
compostos com maior e menor afinidade pelos receptores 5-HT1A.
- Obter modelos teóricos da relação qualitativa (SAR) e quantitativa (QSAR) bi- e
tridimensionais entre as afinidades pelos receptores 5-HT1A, determinadas
experimentalmente, e os parâmetros calculados que descrevem os aspectos
eletrônicos, estéricos e/ou topológicos dos compostos estudados.
- Modelar a estrutura de alguns compostos arilpiperazínicos e do receptor 5-HT1A, bem
como do complexo ligante-receptor, a fim de verificar os principais modos de
interação entre esses ligantes e o receptor.
5. Metodologia 59
5. METODOLOGIA
A fim de obter um maior entendimento das interações entre o receptor 5-HT1A e
compostos arilpiperazínicos, foram realizados inicialmente estudos de QSAR 2D e 3D. O
primeiro deles foi um estudo quimiométrico feito com base em descritores teóricos. No
segundo estudo, foi empregado o método de QSAR por hologramas (HQSAR) e, no terceiro
estudo, o método de QSAR 3D CoMFA.
Em cada um desses estudos, um conjunto de compostos com valores de afinidade pelo
receptor 5-HT1A medidos sob as mesmas condições experimentais foi selecionado da
literatura para compor o conjunto de dados. Esse conjunto foi dividido em conjunto de
treinamento, para a construção do modelo QSAR e conjunto de teste, para a validação
externa do modelo obtido. Inicialmente, a abordagem de validação interna conhecida como
validação cruzada LOO (leaving-one-out) foi empregada sobre os modelos obtidos. Em
seguida, o poder preditivo dos modelos foi avaliado empregando o conjunto de teste e, por
fim, o teste de scrambling progressivo foi empregado para avaliar a estabilidade dos modelos
resultantes.
Essas análises da relação estrutura-atividade foram complementadas com a
modelagem por homologia do receptor 5-HT1A, seguida de estudos de docking ligante-
receptor efetuados para alguns ligantes selecionados. As características do sítio de interação
modelados dessa forma foram confrontadas especialmente com os resultados obtidos com o
método de QSAR 3D, que fornece uma representação tridimensional das características
consideradas importantes para a afinidade pelo receptor 5-HT1A. Os detalhes computacionais
de cada um desses estudos, assim como os resultados obtidos, serão apresentados nos
capítulos subseqüentes.
6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 60
6. ESTUDO QUIMIOMÉTRICO DOS COMPOSTOS ARILPIPERAZÍN ICOS
Neste capítulo, serão apresentados os resultados do estudo quimiométrico realizado
com o objetivo de construir modelos qualitativos e quantitativos da relação estrutura-atividade
de um conjunto de compostos arilpiperazínicos com afinidade pelo receptor 5-HT1A
(WEBER; DA SILVA, 2008). Com o intuito de identificar descritores teóricos que pudessem
ser relacionados com as afinidades apresentadas por esses compostos, foi calculada uma
grande quantidade de descritores eletrônicos, estruturais e topológicos para serem utilizados
em análises realizadas com os métodos quimiométricos PCA (Análise de Componentes
Principais), HCA (Análise Hierárquica de Agrupamentos), KNN (K-ésimo vizinho mais
próximo), SIMCA (Modelagem Independente por Analogia de Classes) e PLS (Mínimos
Quadrados Parciais), de acordo com o procedimento descrito a seguir.
6.1. Procedimento Computacional
Dos compostos arilpiperazínicos sintetizados por Martínez-Esparza e colaboradores
(2001), foram selecionados 52 compostos para constituir o conjunto de treinamento
(mostrados na Tabela 1) e 14 compostos para fazerem parte do conjunto de teste, para a
validação externa dos modelos obtidos (ver Tabela 2). A escolha dos compostos foi feita de
maneira que os dois conjuntos apresentassem diversidade estrutural e uma boa distribuição da
propriedade biológica (valores de pKi, variando entre 5,30 e 8,30). O conjunto de compostos
foi dividido em duas classes: compostos com valores de pKi > 6,70 foram considerados como
compostos com afinidades maiores pelo receptor 5-HT1A (Classe 1) e aqueles com pKi < 6,70
foram considerados compostos com afinidades menores pelo receptor 5-HT1A (Classe 2).
6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 61
Tabela 1. Estruturas químicas e valores de pKi dos compostos do conjunto de treinamento
Composto Estrutura geral R Z Ar1 pKi
1 H CHOH 2-metoxifenil 7.32 2 H CHO-4-
CF3C6H4 2-metoxifenil 6.35
3 H CNOH 2-metoxifenil 7.76 4 H CO 4-clorofenil 6.10 5 H CHO-4-
CH3C6H4 4-clorofenil 5.84
6 H CHO-3,4-OCH2OC6H3
4-clorofenil 6.26
7 H CO 4-metoxifenil 5.30 8 H CHOH 4-metoxifenil 5.30 9 H CO 2-clorofenil 6.74 10 H CHOH 2-clorofenil 6.94 11 H CHO-4-
CF3C6H4 2-clorofenil 5.30
12 H CO 4-fluorofenil 6.10 13 H CHO-4-
CF3C6H4 4-fluorofenil 5.30
14 H CO 2-piridil 7.30 15 H CHOH 2-piridil 6.81 16 H CO 4-nitrofenil 5.30 17 H CHOH 4-nitrofenil 5.30 18 H CHO-4-
CF3C6H4 4-nitrofenil 5.30
19 fenil CO 2-metoxifenil 5.44 20 fenil CHO-4-
CF3C6H4 2-metoxifenil 5.30
21 metóxi CO 2-metoxifenil 5.76 22 metóxi CHOH 2-metoxifenil 6.49 23
NN
R
zAr1
metóxi CHO-4-CF3C6H4
2-metoxifenil 6.00
24 H CHOH 2-metoxifenil 7.30 25 H CHO-4-
CF3C6H4 2-metoxifenil 6.59
26 H CNOH 2-metoxifenil 8.19 27 H CO 4-clorofenil 6.15 28 H CO 2-clorofenil 6.70 29 H CHOH 2-clorofenil 6.70 30 H CO 1-naftil 7.46 31 2,5-
dimetil CO 2-metoxifenil 8.30
32 2,5-dimetil
CO 2-metoxifenil 8.12
33 2,5-dimetil
CHOH 2-metoxifenil 7.04
34
Ar1
S
NN
zR
2,5-dimetil
CO 1-naftil 7.00
35 H CO 2-metoxifenil 8.00 36 H CHOH 2-metoxifenil 7.72 37 H CO 4-clorofenil 5.30 38 H CHOH 4-clorofenil 5.30 39
S
Ar1N
N
R
z
5-metil CO 2-metoxifenil 7.76 40 H CHOH 2-metoxifenil 6.38 41 H CO 4-clorofenil 5.30 42
Ar1N
NR z
H CHOH 4-clorofenil 5.30
6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 62
Tabela 1. continuação. 43 H CO 2-metoxifenil 7.36 44 H CHOH 2-metoxifenil 7.70 45 H CO 4-clorofenil 5.30 46 H CHOH 4-clorofenil 5.30 47 H CO 2-hidroxifenil 6.96 48 H CHOH 2-hidroxifenil 7.74 49 H CO 4-cloro-2-
metoxifenil 6.30
50 H CHOH 4-cloro-2-metoxifenil
6.44
51 H CHOH 4-fluoro-2-metoxifenil
6.30
52
S
NNR
zAr1
H CO 1-naftil 7.00 Tabela 2. Estruturas e valores de pKi dos compostos do conjunto de teste
Composto Estrutura geral R Z Ar1 pKi
53 H CO 2-metoxifenil 7.30 54 H CHOH 4-clorofenil 6.10 55 H CHO-4-
CF3C6H4 4-methoxyphenyl 5.30
56 H CO 2-pirimidil 6.92 57 H CHO-4-
CF3C6H4 2-pirimidil 5.80
58 H CHO-4-CF3C6H4
2-piridil 5.80
59
NN
R
zAr1
fenil CHOH 2-metoxifenil 6.07 60 H CO 2-metoxifenil 7.80 61 H CHOH 4-clorofenil 5.56 62
Ar1
S
NN
zR
2,5-dimetil CHOH 2-metoxifenil 7.92
63 5-metil CHOH 2-metoxifenil 7.47 64
S
Ar1N
N
R
z
5-nitro CO 2-metoxifenil 6.47
65 Ar1N
NR z
H CO 2-metoxifenil 6.60
66
S
NNR
zAr1
H CO 4-fluoro-2-metoxifenil
6.30
6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 63
6.1.1. Otimização das geometrias e cálculo dos descritores moleculares
As estruturas de todos os compostos foram inicialmente otimizadas com o método de
mecânica molecular MM+ (ALLINGER; YUH; LII, 1989; HYPERCUBE, 1995). Uma
otimização final da geometria foi realizada utilizando o método semi-empírico AM1
(DEWAR et al., 1985; GAUSSIAN, 2004). Para estas estruturas, foram calculados 10
descritores eletrônicos com o método AM1 e 567 descritores 2D com o programa Dragon 2.1
(TODESCHINI; CONSONNI; PAVAN, 2002). Todos esses descritores representam
propriedades eletrônicas, estruturais e topológicas que podem ser correlacionadas às
afinidades pelo receptor 5-HT1A observadas experimentalmente. As análises quimiométricas
foram realizadas com o programa Pirouette 3.11 (INFOMETRIX, 2002a).
6.1.2. Seleção de descritores
Com o objetivo de reduzir o grande número de descritores obtidos, foram calculados
os pesos de Fisher de cada descritor, a fim de selecionar aqueles que apresentassem os
melhores potenciais discriminatórios para distinguir os compostos com maiores e menores
afinidades (BRUNS; FAIGLE, 1985; LIN; LI; TSAI, 2004). O peso de Fisher, W1-2, para o i-
ésimo descritor e para amostras pertencentes às classes 1 e 2 é calculado pela Eq. (5):
)2()1(
)]2()1([)(
22
2
21ii
ii
SS
XXiW
+−
=− (5)
6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 64
onde iX são os valores médios para amostras de cada classe e Si2 são os valores das
variâncias de cada classe.
Os 20 descritores apresentando valores considerados significativos para os pesos de
Fisher, ou seja, W1-2 > 1,00, foram selecionados. Após este procedimento, foram testadas
diferentes combinações destes descritores até que boas separações nos métodos HCA e PCA
fossem obtidas, sem que nenhuma amostra tivesse sido alocada em um grupo incorreto. Os
melhores modelos HCA e PCA foram obtidos com as seguintes variáveis: AECC, ICR,
HVcpx, MATS5v, GATS5e, GGI5, JGI5, JGI8 e H3m. Os tipos e as definições destes
descritores são listados na Tabela 3. AECC, ICR e HVcpx são índices topológicos obtidos da
teoria dos grafos moleculares (KOSTANTINOVA, 1996; RAYCHAUDHURY, 1984);
MATS5v e GATS5e são descritores de auto-correlação 2D, também obtidas desta teoria,
somando-se os produtos dos pesos atômicos dos átomos terminais de todos os caminhos do
comprimento de caminho considerado (MORAN, 1950; GEARY, 1954); GGI5, JGI5 e JGI8
são índices topológicos de carga de Gálvez, que avaliam as transferências de carga entre pares
de átomos e as transferências de carga globais na molécula (GALVEZ et al., 1994); e,
finalmente, H3m é um descritor do tipo GETAWAY, calculado dos elementos da matriz de
leverage obtidos pelas coordenadas atômicas centradas, pesado pelas massas atômicas
(CONSONNI; TODESCHINI; PAVAN, 2002, CONSONNI et al., 2002).
Todas as análises foram realizadas após o auto-escalamento dos valores das variáveis
para que fosse dada a mesma importância para todas. Assim, é possível garantir que as
influências relativas de diferentes variáveis em todos os cálculos sejam independentes de suas
unidades (SHARAF; ILLMAN; KOWALSKI, 1986).
6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 65
Tabela 3. Descritores selecionados e suas definições
Descritor Tipo Definição
AECC Average eccentricity
ICR Radial centric information index
HVcpx
topológico
Graph vertex complexity index
MATS5v Moran autocorrelation - lag 5 / weighted
by atomic van der Waals volumes
GATS5e
auto-correlações 2D Geary autocorrelation - lag 5 / weighted
by atomic Sanderson electronegativities
GGI5 Topological charge index of order 5
JGI5 Mean topological charge index of order 5
JGI8
índice topológico de carga de
Gálvez Mean topological charge index of order 8
H3m GETAWAY H autocorrelation of lag 3 / weighted by
atomic masses
6.1.3. Análises quimiométricas
Os métodos quimiométricos empregados neste trabalho podem ser classificados em
três categorias: reconhecimento de padrões não-supervisionado (HCA e PCA),
reconhecimento de padrões supervisionado (KNN e SIMCA) e calibração multivariada
(PLS). O método HCA foi útil para definir as classes às quais os compostos pertenceriam e o
método PCA forneceu um conhecimento inicial da estrutura básica do conjunto de dados. Os
métodos KNN e SIMCA, que são baseados na hipótese de que quanto mais próximas estão as
amostras no espaço das variáveis, maior é a probabilidade de que elas pertençam à mesma
classe, foram utilizados para construir modelos de classificação para os compostos
6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 66
arilpiperazínicos. A regressão PLS foi realizada para obter-se um modelo quantitativo da
relação estrutura-atividade para as afinidades pelo receptor 5-HT1A apresentadas pelos
compostos em estudo. Com exceção do método HCA, cada um destes métodos foi utilizado
neste trabalho em duas etapas. Primeiro, um modelo foi construído e refinado com base no
conjunto de treinamento e, em seguida, foi usado para fazer predições sobre os compostos do
conjunto de teste (validação externa do modelo).
6.2. Resultados e Discussão
6.2.1. Reconhecimento de padrões não-supervisionado
O objetivo destas análises é encontrar agrupamentos de amostras no espaço das
variáveis, que reflitam a existência de inter-relações significativas. A existência de
agrupamentos em um conjunto de dados é avaliada sem usar informação da classe a que as
amostras pertencem (SHARAF; ILLMAN; KOWALSKI, 1986).
Análise Hierárquica de Agrupamentos
Na metodologia HCA, as distâncias entre pares de amostras são calculadas e
comparadas. Pequenas distâncias entre amostras implicam que elas são similares. Por outro
lado, amostras dissimilares serão separadas por distâncias relativamente maiores. O método
HCA começa com cada amostra sendo definida como seu próprio agrupamento e, então, vai
6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 67
unindo amostras semelhantes para formar novos agrupamentos até que todas as amostras
façam parte de um único agrupamento. O propósito principal do HCA é representar os dados
de maneira que os agrupamentos naturais sejam enfatizados atribuindo, assim, categorias às
quais as amostras pertençam. A visualização dos grupos correspondentes às diferentes classes
é realizada na forma de dendrogramas, que são gráficos onde estas classes podem ser
facilmente identificadas. Diferentes dendrogramas podem ser obtidos de acordo com as
técnicas usadas para unir os agrupamentos (SHARAF; ILLMAN; KOWALSKI, 1986).
A Figura 10 mostra o dendrograma das amostras obtido com a conexão incremental.
As ramificações à esquerda do dendrograma representam os compostos do conjunto de
treinamento. O comprimento das ramificações que ligam dois agrupamentos está relacionado
às suas similaridades. Quanto maior a ramificação, menor a similaridade; quanto menor a
ramificação, maior a similaridade e, conseqüentemente, menor a distância entre os
agrupamentos. A similaridade é representada no topo do gráfico, com um valor de 1,0
correspondendo a uma duplicata exata e 0,0 indicando distância e dissimilaridade máximas
(INFOMETRIX, 2002b).
6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 68
Figura 10 - Dendrograma para os compostos do conjunto de treinamento, obtido com a conexão incremental.
Na Figura 10, os compostos do conjunto de treinamento aparecem agrupados em dois
grupos: Grupo 1, caracterizado pelos compostos de maiores afinidades (compostos 1, 3, 9,
10, 14, 15, 24, 26, 28-36, 39, 43, 44, 47, 48 e 52), e Grupo 2, contendo os compostos de
menores afinidades (compostos 2, 4-8, 11-13, 16-23, 25, 27, 37, 38, 40-42, 45, 46 e 49-51). O
Grupo 2 divide-se em dois sub-grupos: sub-grupo 2a, no qual os substituintes Z são grupos
CO ou CHOH (ver estruturas na Tabela 1) e sub-grupo 2b, no qual a maioria dos compostos
apresenta como característica comum substituintes Z volumosos. Outras características podem
ser observadas nestes grupos: no Grupo 1, quase todos os compostos apresentam como
substituinte Ar1 um grupo 2-metóxifenil ou 2-hidróxifenil, enquanto no Grupo 2, a maioria
6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 69
dos compostos apresenta um grupo 4-clorofenil ou 4-fluorofenil como Ar1. Além disso, a
maioria dos compostos apresenta um anel tiofeno com substituições em diferentes posições ou
fundido com um anel benzeno. Estes resultados estão de acordo com estudos SAR anteriores,
que indicam que uma substituição na posição orto de Ar1 é favorável para altas afinidades
pelo receptor 5-HT1A, assim como a presença de um anel tiofeno na molécula (GAILLARD et
al., 1996; LÓPEZ-RODRÍGUEZ et al., 2001b; MARTÍNEZ-ESPARZA et al., 2001).
Uma vez que os compostos aparecem agrupados de acordo com seus valores de pKi
(Grupo 1, pKi > 6,70 e Grupo 2, pKi < 6,70), as classes dos compostos em todas as análises
realizadas neste trabalho foram atribuídas seguindo este critério, assim a Classe 1 corresponde
ao Grupo 1 e a Classe 2 corresponde ao Grupo 2.
Análise de Componentes Principais
A Análise de Componentes Principais (PCA) é uma manipulação matemática da
matriz de dados em que o objetivo é representar a variação contida em muitas variáveis
usando um número pequeno de componentes principais (PCs). O método PCA encontra
combinações lineares das variáveis independentes originais que contenham quantidades
máximas de variação. Assim, a projeção das amostras neste novo espaço formado pelas duas
ou três primeiras PCs (colocadas nos eixos ao invés das variáveis originais) garante que a
visualização das relações entre amostras seja ótima do ponto de vista da variância
representada. É importante mencionar que em dados multivariados, nenhuma das variáveis
originais descreve completamente a variação no conjunto de dados. Entretanto, a primeira
componente principal é calculada de maneira que ela descreva a variação no conjunto de
dados mais do que qualquer uma das variáveis originais. Assim, o método PCA fornece a
6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 70
melhor visualização possível da variabilidade nas variáveis independentes, o que revela se há
agrupamentos naturais no conjunto de dados e se existem amostras anômalas (outliers). Pode-
se também atribuir significado químico (ou biológico, ou físico) aos padrões que emergem da
análise PCA. Finalmente, um modelo PCA pode ser construído para servir como parâmetro
para comparações com amostras desconhecidas (BEEBE; PELL; SEASHOLTZ, 1998;
BRERETON, 1992).
A Figura 11 ilustra o gráfico de escores das duas primeiras PCs, obtido com a
combinação das nove variáveis citadas anteriormente (ver Tabela 3). Juntas, estas
componentes contêm 83% da variância total dos dados originais, fornecendo assim uma
representação confiável dos mesmos. Na Figura 11 é possível perceber que PC1 separa o
conjunto de dados nos mesmos dois grupos que o método HCA: Grupo 1 (maiores
afinidades) e Grupo 2 (menores afinidades).
Figura 11 - Gráfico de escores de PC2 versus PC1 para os compostos do conjunto de treinamento.
6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 71
A Tabela 4 mostra os loadings de cada variável em PC1 e PC2. Pode-se observar que
todas as variáveis possuem importância semelhante para PC1, com contribuições maiores das
variáveis GGI5, HVcpx, ICR e AECC. Por outro lado, o descritor de auto-correlação 2D,
GATS5e, apresenta a maior contribuição para PC2.
Tabela 4. Loadings das variáveis em cada PC
PC1 PC2
AECC 0.36 0.30 ICR 0.37 0.04 HVcpx 0.37 0.27 MATS5v 0.25 -0.60 GATS5e -0.24 0.59 GGI5 0.37 0.21 JGI5 0.29 -0.26 JGI8 0.35 0.08 H3m 0.36 0.10
O modelo PCA obtido com estas variáveis foi submetido a dois procedimentos de
validação: validação cruzada e validação externa com o conjunto de teste da Tabela 2. A
validação cruzada (leaving-one-out) resultou em 100% de informação correta, ou seja,
nenhum composto foi alocado incorretamente. A projeção dos compostos do conjunto de teste
no espaço das PCs é mostrada na Figura 12.
6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 72
Figura 12 - Gráfico de escores para a predição feita pelo PCA para os compostos do conjunto de teste.
O propósito da predição no método PCA é decidir se a amostra desconhecida difere
significativamente do conjunto de treinamento ou não. Esta decisão é baseada principalmente
na magnitude dos resíduos quando a amostra desconhecida é projetada no espaço das PCs do
modelo, ou seja, amostras significativamente diferentes apresentarão resíduos altos. Para a
predição do método PCA, uma caixa em torno dos escores em cada PC baseada nos valores
do conjunto de treinamento é construída. Para cada PC, o limite inferior para os escores é:
tlower scttt *min)lim( −= (6)
e o limite superior é:
tupper scttt *max)lim( += (7)
6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 73
onde tmin e tmax são os valores máximos e mínimos dos escores, st é o desvio padrão dos
escores, t* é um valor t com graus de liberdade baseados no número de amostras do conjunto
de treinamento e c é uma constante chamada de multiplicador do desvio padrão, que pode ser
variada para contrair ou expandir os limites tmin e tmax escolhendo-se um valor negativo ou
positivo, respectivamente (INFOMETRIX, 2002b). Na Figura 12, a caixa formada pelos
limites superior e inferior é representada pelo retângulo ao redor das amostras. Os cinco
compostos com maiores afinidades pelo receptor 5-HT1A do nosso conjunto de teste estão
posicionados na mesma região correspondente ao Grupo 1 do conjunto de treinamento, da
mesma maneira que os compostos com menores afinidades estão na região do Grupo 2.
Assim, tanto a validação externa quanto a validação cruzada indicam que nosso modelo PCA
apresenta boa habilidade preditiva. Como os compostos do conjunto de teste mostraram-se
similares aos do conjunto de treinamento, podem ser considerados bastante adequados para
serem usados na validação externa de todos os modelos obtidos neste trabalho.
6.2.2 Reconhecimento de padrões supervisionado
Nos métodos de reconhecimento de padrões supervisionado, utiliza-se a informação
sobre as classes a que pertencem as amostras do conjunto de treinamento. O objetivo principal
é desenvolver uma regra que classifique estas amostras corretamente e então aplicar esta regra
para a classificação de amostras desconhecidas (SHARAF; ILLMAN; KOWALSKI, 1986).
6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 74
Resultados do KNN
No método KNN, a distância Euclidiana separando cada par de amostras no conjunto
de treinamento é calculada e armazenada em uma tabela de distâncias. A classe à qual a
maioria dos vizinhos mais próximos pertence é atribuída para cada uma das amostras. Assim,
o modelo de classificação obtido pode ser usado para a predição das classes de amostras
desconhecidas (BEEBE; PELL; SEASHOLTZ, 1998).
Os descritores selecionados com os métodos HCA e PCA foram utilizados na análise
KNN. A Tabela 5 apresenta o sumário da classificação obtido com até nove vizinhos mais
próximos. Todos os compostos do conjunto de treinamento foram classificados corretamente,
o que mostra que as classes são bem distintas e que as variáveis selecionadas possuem boa
habilidade para a discriminação entre as classes de compostos.
Tabela 5. Sumário da classificação KNN para os compostos do conjunto de treinamento
Compostos classificados incorretamente Classe
Número de membros 1NN 3NN 5NN 7NN 9NN
1 23 0 0 0 0 0
2 29 0 0 0 0 0
Total 52 0 0 0 0 0
Informação correta 100% 100% 100% 100% 100%
Uma validação externa deste modelo foi realizada. Conforme mencionado
anteriormente, o critério utilizado para dividir o conjunto de treinamento em duas classes foi
utilizado também para atribuir as classes para o conjunto de teste, ou seja, compostos com pKi
> 6,70 pertencem à Classe 1 e compostos com pKi < 6,70 pertencem à Classe 2. Nenhum erro
de predição foi encontrado quando computadas as distâncias para 1, 3, 5, 7 e 9 vizinhos mais
6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 75
próximos. Os cinco compostos com maiores afinidades do conjunto de teste foram
classificados corretamente como pertencentes à Classe 1 e os nove compostos com menores
afinidades foram alocados na Classe 2. Isto indica que um modelo de classificação confiável e
preditivo foi obtido.
Resultados do SIMCA
O método SIMCA desenvolve modelos de componentes principais para cada classe do
conjunto de treinamento. Quando os valores das variáveis independentes de uma nova
amostra são projetados no espaço das componentes principais de cada classe, a nova amostra
é alocada na classe a que se ajustar melhor. Além de construir um modelo de classificação
para ser usado para predição de amostras desconhecidas, o método SIMCA também fornece
ferramentas de diagnóstico relacionadas a outros aspectos interessantes da classificação, tais
como poder discriminante e poder de modelagem das variáveis, distâncias entre classes e
detecção de outliers. Além disso, uma importante característica do SIMCA é sua capacidade
de fazer predições mais realistas do que o KNN. Este último aloca cada amostra a exatamente
uma classe do conjunto de treinamento (a classe dos vizinhos mais próximos), enquanto o
SIMCA é capaz de identificar se a amostra não pertence a nenhuma das classes ou se pode ser
membro de ambas as classes, uma vez que os resultados são expressos em termos
probabilísticos (BEEBE; PELL; SEASHOLTZ, 1998).
O melhor modelo SIMCA foi construído com os mesmos descritores do HCA, do PCA
e do KNN. A Figura 13 apresenta as distâncias das amostras às classes calculadas de acordo
com os resíduos das amostras quando elas são ajustadas às classes. Este gráfico é dividido por
duas linhas que representam valores críticos de variâncias residuais. Compostos posicionados
6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 76
no quadrante noroeste (NW) pertencem apenas à classe correspondente ao eixo-x, pois elas
estão a distâncias pequenas o suficiente para serem consideradas membros desta classe. Da
mesma forma, compostos no quadrante sudeste (SE) são membros apenas da classe do eixo-y.
Compostos no quadrante sudoeste (SW) podem pertencer a ambas as classes, enquanto
aquelas no quadrante nordeste (NE) pertencem a nenhuma das classes. Na Figura 13 é
possível ver os 29 compostos com menores afinidades no quadrante SE, o que significa que
eles podem pertencer à Classe 2 apenas. Por outro lado, há 12 compostos com maiores
afinidades no quadrante NW (Classe 1, apenas), enquanto o método SIMCA considera que 11
compostos apresentam probabilidade de pertencerem não somente à Classe 1 mas também à
Classe 2 (uma vez que estão posicionados no quadrante SW).
Figura 13 - Distâncias dos compostos às classes obtidas para o conjunto de treinamento.
Este modelo foi empregado também para fazer predições sobre o conjunto de teste.
Para este conjunto, nenhum composto foi predito como não pertencente a uma das classes ou
6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 77
como membro de ambas as classes. Assim como o modelo KNN apresentado anteriormente, a
análise SIMCA resultou em um modelo preditivo.
Outras tendências nos dados podem ser analisadas com o método SIMCA. A distância
entre as classes, que é uma medida da separação (distinção) entre as classes, foi calculada para
o nosso modelo como sendo igual a 6,22, mostrando que as classes são bem distintas - em
quimiometria, uma regra prática diz que duas classes podem ser consideradas separáveis
quando a distância entre as classes for maior do que 3 (BRERETON, 1992). Considerando as
medidas de importância das variáveis, o descritor mais importante para a separação das
classes é GATS5e, que apresenta o Poder Discriminante mais alto. O descritor que apresenta
o Poder de Modelagem mais alto é AECC, o que significa que esta é a variável que melhor
descreve a informação contida nas duas classes do conjunto de treinamento.
6.2.3. Regressão PLS
O método quimiométrico de regressão PLS foi utilizado neste trabalho para modelar a
variável dependente (pKi), Y, usando um conjunto de variáveis independentes (Xi),
representando as estruturas químicas dos compostos em estudo. Da mesma maneira que o
PCA, o método PLS encontra combinações lineares das variáveis independentes originais que
contenham quantidades máximas de variação. Entretanto, no método PLS, a matriz de
loadings é definida de forma que não apenas a variância seja maximizada, mas também o
produto da variância pela correlação com Y seja otimizada. Assim, na forma matricial, a
equação de regressão é dada por:
FXβY += (8)
6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 78
onde β é o vetor de regressão e F representa os erros na estimativa de Y.
O melhor modelo é escolhido com base na soma dos quadrados dos erros de predição
(PRESS) obtidos no procedimento de validação cruzada do modelo. O número ótimo de
componentes PLS é aquele que minimiza o valor de PRESS. Se o modelo apresenta boa
qualidade, o que é verificado pelos valores dos coeficientes de correlação r2 e q2 e também
pelos resíduos de predição, pode ser utilizado para fazer predições da propriedade biológica
de compostos desconhecidos que sejam estruturalmente similares àqueles presentes no
conjunto de treinamento (WOLD; SJOSTROM; ERIKSSON, 2001).
No presente trabalho, o melhor modelo encontrado foi construído com os mesmos
descritores que os modelos de reconhecimento de padrões apresentados anteriormente. O
número ótimo de componentes PLS foi escolhido avaliando-se o valor de PRESS, para os
resíduos de predição do modelo após a validação cruazada (leaving-one-out). Na Tabela 6,
pode-se verificar que o número de componentes PLS correspondente ao menor valor de
PRESS e ao maior valor de q2 é igual a 6, sendo portanto o número ótimo de componentes
PLS para o nosso conjunto de dados. Este número resultou em um modelo com coeficientes
de regressão r2 = 0,83 e q2 = 0,76, o que indica que um bom modelo foi obtido.
Tabela 6. Porcentagem de variância, PRESS, q2 e r2
Componente PLS
% Variância Cumulativa
PRESS q2 r2
1 66 17.757 0.621 0.654 2 81 12.645 0.730 0.776 3 87 11.911 0.746 0.811 4 92 11.597 0.754 0.825 5 95 11.342 0.759 0.831 6 98 11.305 0.760 0.832 7 100 11.539 0.755 0.833 8 100 12.091 0.744 0.834 9 100 12.185 0.743 0.835
6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 79
A Figura 14 mostra a reta de regressão para os valores de pKi preditos para o conjunto
de treinamento. A maioria dos resíduos de predição são menores do que 0,60, com apenas
dois compostos apresentando resíduos altos (0,92 e 0,99, para os compostos 19 e 33,
respectivamente). A Figura 14 mostra também a reta de regressão para os compostos do
conjunto de teste usados na validação externa do modelo PLS. Os resultados da predição para
este conjunto são mostrados na Tabela 7, onde é possível observar que os erros de predição
são menores do que 0,34 (com exceção do composto 64), indicando que um modelo com bom
poder preditivo foi obtido.
Figura 14 - Valores de pKi preditos versus experimentais para a regressão PLS obtida com 6 componentes principais, mostrando os compostos dos conjuntos de treinamento e teste.
6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 80
Tabela 7. Resíduos de predição para o conjunto de teste
Composto pKi experimental pKi predito Resíduo
53 7.30 7.22 0.08 54 6.10 5.79 0.30 55 5.30 5.54 -0.24 56 6.92 7.03 -0.11 57 5.80 6.14 -0.34 58 5.80 6.09 -0.29 59 6.07 6.05 0.02 60 7.80 7.69 0.11 61 5.56 5.80 -0.24 62 7.92 7.59 0.33 63 7.47 7.20 0.27 64 6.47 5.78 0.69 65 6.60 6.51 0.10 66 6.30 6.06 0.24
Com o objetivo de avaliar a confiabilidade do modelo PLS obtido, foi também
empregado o método de scrambling progressivo (CLARK; FOZ, 2004), que determina a
sensitividade de um modelo QSAR a correlações por acaso. Os testes de scrambling levaram
a modelos com valores de q2 entre 0,20 e 0,40, com altos valores de erro padrão de validação
cruzada (cSDEP), que é modelado como uma função do coeficiente de correlação entre os
valores reais de Y e os valores submetidos à randomização (Y’). Assim, uma vez que os
valores de q2 obtidos com os valores randomizados foram muito menores do que o obtido
para o modelo PLS, pode-se afirmar que este modelo não é resultado de correlações ao acaso.
Quando se comparam os resultados obtidos em todas as análises quimiométricas,
pode-se notar que modelos de relação estrutura-atividade qualitativos e quantitativos
apresentando confiabilidade e poder preditivo foram obtidos com o mesmo conjunto de
variáveis, o que é um forte indicativo de que os descritores selecionados em nosso trabalho
são de fato importantes para a afinidade pelo receptor 5-HT1A. Os modelos são capazes de
separar os compostos de acordo com seus valores de pKi e os seguintes requisitos para
afinidade pelo receptor 5-HT1A foram evidenciados nos dois grupos de compostos (Classes 1
6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 81
e 2): orto-substituição no anel Ar1 e um anel tiofeno ao invés de anéis benzenos ou naftalenos
são favoráveis para afinidades maiores. Esta observação está de acordo com estudos SAR
anteriores com compostos arilpiperazínicos (MARTÍNEZ-ESPARZA et al., 2001; LÓPEZ-
RODRÍGUEZ et al., 2001b; GAILLARD et al., 1996). Além disso, as componentes principais
(nas análises PCA e SIMCA), assim como as variáveis latentes (componentes PLS)
construídas com estes descritores contêm porcentagens significativas da variância total da
matriz de dados, mostrando que a estrutura dos dados foi capturada adequadamente pelas
variáveis utilizadas nos modelos. Por todas estas considerações, pode-se afirmar que os
modelos obtidos neste trabalho podem ser bastante úteis no planejamento de novos compostos
arilpiperazínicos similares aos compostos estudados.
6.3. Conclusões
Neste capítulo, foram apresentados modelos SAR e QSAR confiáveis e preditivos,
obtidos com métodos quimiométricos e usando um conjunto de descritores 2D. Todos os
modelos apresentaram consistência interna e foram validados externamente com um conjunto
de teste. Os descritores selecionados, que contêm informações úteis sobre vários aspectos da
estrutura molecular, mostraram boa correlação com as afinidades pelo receptor 5-HT1A
apresentadas pelos compostos em estudo, uma vez que foram empregados com sucesso em
todas as análises. Propriedades estéricas estão bem representadas pelos índices topológicos. A
seleção dos índices de carga de Gálvez indica a importância das características eletrônicas dos
compostos que podem estar envolvidas na interação com o receptor. Além disso, as
características dos compostos em cada um dos grupos estudados (Classes 1 e 2) estão de
6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 82
acordo com análises SAR realizadas anteriormente para compostos arilpiperazínicos e
confirmam as características consideradas importantes para afinidade pelo receptor 5-HT1A.
7. HQSAR 83
7. HQSAR
No presente capítulo, serão mostrados os resultados de um estudo de relação estrutura-
atividade utilizando a metodologia HQSAR (Hologram Quantitative Structure-Activity
Relationships), realizado com o objetivo de explorar parâmetros bidimensionais dos
compostos arilpiperazínicos e encontrar informações úteis para a síntese de novos ligantes
(WEBER et al., 2008). A metodologia HQSAR explica as diferenças na atividade biológica
de uma série de compostos quantificando variações em seus hologramas moleculares e
empregando o método PLS para a correlação estatística. Em geral, os resultados produzidos
apresentam qualidade comparável a das técnicas tridimensionais, como CoMFA, com a
vantagem de eliminar a necessidade de estabelecer uma conformação ótima e um alinhamento
estrutural das moléculas da série (HONÓRIO; ANDRICOPULO, 2007).
7.1. Procedimento Computacional
Para compor o conjunto de dados, foram selecionados 90 compostos da literatura
(MARTÍNEZ-ESPARZA et al., 2001; ORÚS et al., 2002). As estruturas químicas e as
afinidades pelo receptor 5-HT1A correspondentes são listadas na Tabela 8. Os valores de Ki
desses compostos variam de 1,9 a 5000 nM e são bem distribuídos nesse intervalo. Esses
valores foram medidos sob as mesmas condições experimentais, o que é um requisito
fundamental para estudos de QSAR.
7. HQSAR 84
Tabela 8. Estruturas químicas e valores de Ki para os compostos em estudo
Compostos do conjunto de treinamento
Comp. Estrutura geral R Z Ar 1 Ki (nM)
1 H CHOH 2-metoxifenil 47,5 2 H CHO-4-
CF3C6H4 2-metoxifenil 450
3 H CHO-4-CH3OC6H4
2-metoxifenil 90
4 H CHO-3,4-OCH2OC6H3
2-metoxifenil 20
5 H CNOH 2-metoxifenil 17,5 6 H CO 4-clorofenil 800 7 H CHOH 4-clorofenil 800 8 H CHO-4-
CF3C6H4 4-clorofenil >5000
9 H CHO-4-CH3C6H4
4-clorofenil 1450
10 H CNOH 4-clorofenil >5000 11 H CHOH 4-metoxifenil >5000 12 H CHOH 2-pirimidil 375 13 H CHO-4-
CF3C6H4 2-pirimidil 1600
14 H CO 2-clorofenil 180 15 H CHOH 2-clorofenil 115 16 H CO 4-fluorofenil 800 17 H CHOH 4-fluorofenil 145 18 H CHO-4-
CF3C6H4 4-fluorofenil >5000
19 H CO 2-piridil 50 20 H CHOH 2-piridil 155 21 H CO 4-nitrofenil >5000 22 H CHOH 4-nitrofenil >5000 23 fenil CHO-4-
CF3C6H4 2-metoxifenil >5000
24 metóxi CHOH 2-metoxifenil 325 25 metóxi CHO-4-
CF3C6H4 2-metoxifenil 1000
26 nitro CO 2-metoxifenil 50 27
NN
R
zAr1
nitro CHOH 2-metoxifenil 10 28 H CO 2-metoxifenil 16 29 H CHOH 2-metoxifenil 50 30 H CHO-3,4-
OCH2OC6H3 2-metoxifenil 55
31 H CHO-1-C10H7
2-metoxifenil 180
32 H CNOH 2-metoxifenil 6,5 33 H CO 4-clorofenil 700 34 H CHOH 2-clorofenil 200 35 H CO 1-naftil 35 36 2,5-
dimetil CO 2-metoxifenil 5
37 2,5-dimetil
CHOH 2-metoxifenil 12
38 2,5-dimetil
CO 2-hidroxifenil 7,5
39
NN Ar1z
S
R
2,5-dimetil
CO 4-cloro-2-metoxifenil 500
7. HQSAR 85
Tabela 8. continuação
Comp. Estrutura geral R Z Ar 1 Ki (nM)
40 H CHO-1-C10H7
2-metoxifenil 220
41 H CO 4-clorofenil >5000 42 H CHOH 4-clorofenil >5000 43 5-metil CO 2-metoxifenil 17,5 44
S
Ar1N
N
R
z
5-metil CHOH 2-metoxifenil 34 45 H CO 2-metoxifenil 250 46 H CHOH 2-metoxifenil 420 47 H CO 4-clorofenil >5000 48 H CHOH 4-clorofenil >5000 49
Ar1
NN
R z
H CHOH 2-hidroxifenil 190
50 H CHOH 2-metoxifenil 20 51 H CNOH 2-metoxifenil 60 52 H CO 4-clorofenil >5000 53 H CHOH 4-clorofenil >5000 54 H CO 2-hidroxifenil 110 55 H CO 4-fluoro-2-metoxifenil 500 56 H CHOH 4-fluoro-2-metoxifenil 500 57 H CO 1-naftil 100 58 H CHOH 1-naftil 66,7 59 H CHOH 3-quinolil 995 60 H CHOH 5-quinolil 36,8 61 H CHOH 6-quinolil 546 62 H CHOH 8-quinolil 6,3 63 H CHOH 8-quinaldinil 10.2 64 H CHOH 4-indolil 5,5 65 H CHOH 3,4-dihidro-2H-1,5-
benzo[b]dioxepin-6-il 1,9
66 H CHOH 5-benzo[b]tiofenil 913 67 F CHOH 8-quinolil 2,7 68 F CHOH 8-quinaldinil 2,5 69 F CHOH 4-indolil 5,9 70
S
NNR
zAr1
F CHOH 3,4-dihidro-2H-1,5-benzo[b]dioxepin-6-il
3
7. HQSAR 86
Tabela 8. continuação
Compostos do conjunto de teste
Comp. Estrutura geral R Z Ar1 Ki (nM)
71 H CO 2-metoxifenil 50 72 H CHO-3,4-
OCH2OC6H3 4-clorofenil 550
73 H CHO-4-CF3C6H4
4-metoxifenil >5000
74 H CO 2-pirimidil 120 75 H CHO-4-
CF3C6H4 2-clorofenil >5000
76 H CHO-4-CF3C6H4
2-piridil 1600
77
NN
R
zAr1
H CHO-4-CF3C6H4
4-nitrofenil >5000
78 H CHO-4-CF3C6H4
2-metoxifenil 255
79 H CHOH 4-clorofenil 2750 80 H CO 2-clorofenil 200 81
NN Ar1z
S
R
2,5-dimetil
CHOH 2-hidroxifenil 90
82 H CO 2-metoxifenil 10 83
S
Ar1N
N
R
z
H CHOH 2-metoxifenil 19
84 Ar1N
NR z
H CO 2-hidroxifenil 1000
85 H CO 2-metoxifenil 44 86 H CHOH 2-hidroxifenil 18 87 H CO 4-cloro-2-metoxifenil 500 88 H CHOH 4-cloro-2-metoxifenil 361 89 H CHOH 2,3-dihidro-1,4-
benzodioxin-5-il 5,7
90
S
NNR
zAr1
F CHOH 2,3-dihidro-1,4-benzodioxin-5-il
6
O conjunto original de 90 compostos foi dividido em conjunto de treinamento
(compostos de 1 a 70 da Tabela 8), para a construção do modelo, e conjunto de teste
(compostos 71 a 90 da Tabela 8) para a validação externa do modelo. Essa escolha foi feita de
maneira que moléculas estruturalmente diversas apresentando valores de afinidade bem
distribuídos fossem incluídas em ambos os conjuntos. As estruturas dos compostos foram
construídas empregando o módulo Concord (PEARLMAN) do pacote SYBYL 7.2 (TRIPOS)
e submetidas a um procedimento de minimização de energia empregando o campo de força
7. HQSAR 87
Tripos (CLARK; CRAMER III; VAN OPDENBOSCH, 1989), com o algoritmo steepest
descent. Todos os cálculos e visualizações foram também realizados neste pacote, em
plataforma Linux/Red Hat.
Na metodologia HQSAR, cada molécula do conjunto de dados é dividida em uma
série de fragmentos estruturais únicos, que são arranjados para formar um holograma
molecular. Diferentemente de outros métodos baseados em molecular fingerprints, o método
HQSAR considera todos os fragmentos moleculares possíveis, assim como informação
tridimensional suplementar sobre hibridização e quiralidade das moléculas (HERITAGE;
LOWIS, 1999).
A análise HQSAR envolve três passos principais: a geração de fragmentos sub-
estruturais para cada uma das moléculas do conjunto de treinamento; a transformação desses
fragmentos em hologramas; e a correlação destes com os dados biológicos disponíveis. De
acordo com este protocolo, uma molécula é descrita como uma única série de números ou
“bins” (holograma molecular). Os bins representam cada um dos fragmentos incluídos em
uma molécula em particular e são atribuídos por um algoritmo de redundância cíclica (CRC -
cyclic redundancy check) (HERITAGE; LOWIS, 1999).
Todos os fragmentos estruturais lineares, de ramificação e de sobreposição foram
usados neste trabalho para gerar os descritores HQSAR. Os fragmentos estruturais de cada
molécula original consistiam de números de átomos mínimo e máximo previamente definidos,
que são chamados de parâmetros de tamanho de fragmento. A informação em cada
fragmento foi definida por parâmetros de distinção de fragmentos, incluindo átomos (A),
ligações (B), conexões (C), átomos de hidrogênio (H), quiralidade (Ch) e doadores ou
receptores de ligações de hidrogênio (DA). Os fragmentos gerados foram então divididos em
um arranjo de comprimento fixo para produzir um holograma molecular. Este comprimento
fixo foi definido como parâmetro de comprimento de holograma.
7. HQSAR 88
O módulo HQSAR utilizado neste trabalho fornece 12 comprimentos padrões de
holograma (53, 59, 61, 71, 83, 97, 151, 199, 257, 307, 353 e 401), que são números primos
para minimizar a possibilidade da chamada “fragment collision” (quando os fragmentos mais
importantes para a atividade biológica são atribuídos ao mesmo bin no holograma, sem
discriminação). A natureza particular dos fragmentos sub-estruturais gerados pelo HQSAR e,
conseqüentemente, a informação contida nos hologramas moleculares resultantes é alterada
pelo ajuste desses parâmetros. Finalmente, a correlação dos descritores obtidos dessa forma
com a propriedade biológica foi feita empregando o método PLS.
7.2. Resultados e Discussão
Conforme dito anteriormente, o desempenho dos modelos HQSAR é afetado por três
parâmetros: o tamanho do fragmento, o tipo (distinção) de fragmento e o comprimento do
holograma. Neste trabalho, um modelo HQSAR foi gerado inicialmente com o tamanho de
fragmento padrão (4-7) combinado com vários tipos de fragmentos e vários comprimentos de
holograma (ver Tabela 9). O melhor modelo (q2 = 0,762) foi obtido usando um comprimento
de holograma de 307 e uma combinação dos tipos de fragmentos A/B/C/Ch/DA.
7. HQSAR 89
Tabela 9. Resultados da análise HQSAR utilizando vários tipos de fragmentos, com o tamanho de fragmento padrão 4 - 7
Modelo Tipo de
Fragmento q2 SEP r2 SEE HL N
1 A/B 0.599 0.716 0.804 0.478 61 6 2 A/B/C 0.569 0.708 0.859 0.405 257 6 3 A/B/C/H 0.591 0.690 0.830 0.445 353 6 4 A/B/C/H/Ch 0.584 0.696 0.846 0.424 71 6 5 A/B/C/H/Ch/DA 0.689 0.602 0.893 0.353 97 6 6 A/B/H 0.582 0.698 0.799 0.483 53 6 7 A/B/C/Ch 0.595 0.686 0.840 0.432 83 6 8 A/B/DA 0.678 0.612 0.908 0.327 401 6 9 A/B/C/DA 0.660 0.629 0.907 0.329 307 6 10 A/B/H/DA 0.680 0.611 0.841 0.430 53 6 11 A/B/C/Ch/DA 0.762 0.527 0.933 0.280 307 6 12 A/B/C/H/DA 0.636 0.651 0.827 0.448 307 6 13 A/B/H/Ch/DA 0.596 0.675 0.757 0.524 53 4
q2, coeficiente de correlação da validação cruzada; SEP, erro padrão da validação cruzada; r2, coeficiente de correlação; SEE, erro padrão de calibração; HL, comprimento do holograma; N, número ótimo de componentes PLS. Tipos de Fragmentos: A, átomos; B, ligações; C, conexões; H, átomos de hidrogênio; Ch, quiralidade; DA, doador e receptor.
Com estes tipos de fragmentos, foram realizadas outras análises PLS para investigar se
diferentes tamanhos de fragmentos poderiam melhorar os parâmetros estatísticos. Os
resultados de HQSAR para diferentes tamanhos de fragmentos são apresentados na Tabela 10.
O melhor modelo encontrado (q2 = 0,813) foi aquele com o tamanho de fragmento 6 - 9, com
a combinação A/B/C/Ch/DA, comprimento de holograma de 353 e 6 componentes PLS.
Com o objetivo de avaliar o poder preditivo deste modelo, foi realizada a predição das
afinidades para os 20 compostos de teste (Tabela 8), que não faziam parte do conjunto de
treinamento utilizado para a construção do modelo. Os resultados são mostrados na Figura 15,
que ilustra o gráfico dos valores de pKi preditos versus experimentais, tanto para o conjunto
de treinamento quanto para o de teste.
7. HQSAR 90
Tabela 10. Resultados da análise HQSAR variando o tamanho de fragmento, com a combinação A/B/C/Ch/DA
Tamanho de
Fragmento q2 SEP r2 SEE HL N
2 - 5 0.686 0.604 0.888 0.360 199 6 3 - 6 0.706 0.585 0.916 0.312 257 6 4 - 7 0.762 0.527 0.933 0.280 307 6 5 - 8 0.793 0.491 0.952 0.237 257 6 6 - 9 0.813 0.466 0.958 0.220 353 6 7 - 10 0.812 0.468 0.958 0.222 353 6
Figura 15 - Valores de pKi preditos versus experimentais para o conjunto de treinamento e para o conjunto de teste resultantes do modelo HQSAR.
7. HQSAR 91
A boa concordância entre os valores experimentais e preditos pelo modelo pode ser
observada na Tabela 11, que mostra valores baixos para os resíduos de predição (menores que
0,40) para a maioria dos compostos. Isso que indica que o modelo HQSAR obtido apresenta
qualidade suficiente para predizer a afinidade pelo receptor 5-HT1A de novos compostos com
estruturas semelhantes.
Tabela 11. Resíduos de predição para os compostos do conjunto de teste
Composto pKi Experimental
pKi Predito
Resíduo
13b 5.56 5.74 0.18 7jx 8.24 8.61 0.37 30b 7.74 7.02 -0.72 27a 6.00 6.5 0.50 31a 6.30 5.63 -0.67 19b 7.05 7.28 0.23 7c 5.80 5.68 -0.12 31b 6.44 5.63 -0.81 14a 6.70 6.61 -0.09 28a 7.36 7.43 0.07 8jx 8.22 7.92 -0.30 4a 6.92 7.14 0.22 2e 6.26 6.46 0.20 1a 7.30 7.27 -0.03 16a 8.00 7.75 -0.25 16b 7.72 6.91 -0.81 12c 6.59 6.4 -0.19 8c 5.30 5.24 -0.06 5c 5.30 5.58 0.28 3c 5.30 5.18 -0.12
Este modelo também foi submetido ao teste de scrambling progressivo, que forneceu
valores baixos para q2 (~ 0,40) dos modelos obtidos com Y randomizados. Isso mostra que as
correlações resultantes do modelo não foram obtidas por acaso.
Após o desenvolvimento de modelos estatísticos com boa capacidade de predição para
compostos não-testados, a metodologia HQSAR pode ser empregada para fornecer pistas
importantes sobre quais fragmentos estão relacionados mais diretamente com a atividade
7. HQSAR 92
biológica em estudo. Essa informação é obtida calculando-se a contribuição individual de
cada átomo de uma molécula para a atividade biológica, que pode ser visualizada pelos mapas
de contribuição. Um código de cores é usado para discriminar as contribuições atômicas mais
importantes para a atividade. As cores na extremidade vermelha do espectro (vermelho e
laranja) refletem contribuições pobres, enquanto as cores da extremidade verde (amarelo, azul
esverdeado e verde) refletem contribuições favoráveis. Átomos com contribuições
intermediárias aparecem na cor branca. A Figura 16 mostra as contribuições atômicas
individuais para o composto com maior valor de afinidade do nosso conjunto de dados
(composto 65). Conforme se pode observar nesta figura, os fragmentos correspondentes ao
anel piperazínico e também ao anel tiofeno apresentam contribuições favoráveis à afinidade
dos compostos arilpiperazínicos pelo receptor 5-HT1A. De fato, os compostos com as
afinidades mais altas do conjunto de dados apresentam um anel tiofeno ou benzotiofeno como
substituinte Ar2, o que indica que este é um grupo importante para a interação com o receptor
5-HT1A.
O
O
S
NN
OH
65
Figura 16 - Contribuições atômicas para a afinidade pelo receptor 5-HT1A do composto com maior afinidade do conjunto de dados (65).
7. HQSAR 93
7.3. Conclusões
O modelo HQSAR obtido mostrou boa consistência interna, conforme se pode
observar pelos parâmetros estatísticos r2 = 0,96, q2 = 0,81 e SEE=0,22, bem como bom poder
preditivo, uma vez que as predições feitas para o conjunto de teste apresentaram erros baixos.
Além disso, o teste de randomização da variável dependente indicou que as correlações não
foram obtidas ao acaso. Assim, este modelo pode ser utilizado para predizer a afinidade pelo
receptor 5-HT1A de novas moléculas a partir de seus hologramas. As informações obtidas com
os mapas de contribuição indicam a importância do substituinte Ar2 para o planejamento de
novos compostos com afinidade pelos receptores 5-HT1A.
8. QSAR 3D 94
8. QSAR 3D
Neste capítulo, serão relatados os resultados do estudo de QSAR 3D realizado com o
objetivo de obter uma correlação significativa entre as características tridimensionais dos
compostos em estudo e a afinidade pelo receptor 5-HT1A. Os métodos de QSAR 3D baseiam-
se no caráter tridimensional das interações entre um ligante e seu receptor biológico e na
utilização de campos moleculares de interação como descritores. As diferenças na variável
dependente (propriedade biológica) são descritas em função das diferenças nestes campos de
interação. Neste trabalho, foi empregado o método CoMFA, que é um dos mais utilizados no
planejamento de fármacos e foi brevemente descrito no Capítulo 2.
8.1. Procedimento Computacional
Assim como nos modelos apresentados anteriormente, um conjunto de 88 compostos
foi dividido em conjunto de treinamento (compostos de 1 a 70 da Tabela 12), para a
construção do modelo QSAR 3D, e conjunto de teste (compostos 71 a 88 da Tabela 12) para a
validação externa do modelo. Essa escolha também foi feita de forma que as moléculas de
ambos os conjuntos representassem a diversidade estrutural e a variabilidade dos valores de
afinidade do conjunto original.
8. QSAR 3D 95
Tabela 12. Estruturas químicas e valores de Ki para os compostos em estudo
Compostos do conjunto de treinamento
Comp. Estrutura geral R Z Ar 1 Ki (nM)
1 H CHO-4-CF3C6H4
2-metoxifenil 450
2 H CHO-4-CH3OC6H4
2-metoxifenil 90
3 H CHO-3,4-OCH2OC6H3
2-metoxifenil 20
4 H CO 4-clorofenil 800 5 H CHOH 4-clorofenil 800 6 H CHO-3,4-
OCH2OC6H3 4-clorofenil 550
7 H CHO-4-CH3C6H4
4-clorofenil 1450
8 H CNOH 4-clorofenil >5000 9 H CO 4-metoxifenil 5000 10 H CHOH 4-metoxifenil >5000 11 H CHO-4-
CF3C6H4 4-metoxifenil >5000
12 H CO 2-pirimidil 120 13 H CHO-4-
CF3C6H4 2-pirimidil 1600
14 H CO 2-clorofenil 180 15 H CHOH 2-clorofenil 115 16 H CHO-4-
CF3C6H4 2-clorofenil >5000
17 H CO 4-fluorofenil 800 18 H CHOH 4-fluorofenil 145 19 H CHO-4-
CF3C6H4 4-fluorofenil >5000
20 H CO 2-piridil 50 21 H CO 4-nitrofenil >5000 22 H CHOH 4-nitrofenil >5000 23 H CHO-4-
CF3C6H4 4-nitrofenil >5000
24 fenil CHO-4-CF3C6H4
2-metoxifenil >5000
25 metóxi CHOH 2-metoxifenil 325 26 metóxi CHO-4-
CF3C6H4 2-metoxifenil 1000
27
NN
R
zAr1
nitro CO 2-metoxifenil 50 28 H CHOH 2-metoxifenil 50 29 H CHO-3,4-
OCH2OC6H3 2-metoxifenil 55
30 H CHO-4-CF3C6H4
2-metoxifenil 255
31 H CHO-1-C10H7
2-metoxifenil 180
32 H CNOH 2-metoxifenil 6,5 33 H CO 1-naftil 35 34 2,5-
dimetil CHOH 2-metoxifenil 12
35 2,5-dimetil
CO 2-hidroxifenil 7,5
36
NN Ar1z
S
R
2,5-dimetil
CHOH 2-hidroxifenil 90
8. QSAR 3D 96
Tabela 12. continuação
Comp. Estrutura geral R Z Ar 1 Ki (nM)
37 H CO 2-clorofenil 200 38 H CHOH 4-clorofenil 2750 39
NN Ar1z
S
R
2,5-
dimetil CO 4-cloro-2-metoxifenil 500
40 H CHO-1-C10H7
2-metoxifenil 220
41 H CO 4-clorofenil >5000 42 H CO 2-metoxifenil 10 43 H CHOH 2-metoxifenil 19 44
S
Ar1N
N
R
z
5-metil CO 2-metoxifenil 17,5 45 H CO 2-metoxifenil 250 46 H CHOH 2-metoxifenil 420 47 H CO 4-clorofenil >5000 48 H CHOH 4-clorofenil >5000 49 H CO 2-hidroxifenil 1000 50
Ar1N
NR z
H CHOH 2-hidroxifenil 190
51 H CO 2-metoxifenil 44 52 H CHOH 2-metoxifenil 20 53 H CNOH 2-metoxifenil 60 54 H CHOH 4-clorofenil >5000 55 H CO 2-hidroxifenil 110 56 H CHOH 2-hidroxifenil 18 57 H CHOH 4-cloro-2-metoxifenil 361 58 H CO 4-fluoro-2-metoxifenil 500 59 H CHOH 4-fluoro-2-metoxifenil 500 60 H CO 1-naftil 100 61 H CHOH 1-naftil 66,7 62 H CHOH 3-quinolil 995 63 H CHOH 5-quinolil 36,8 64 H CHOH 8-quinaldinil 10,2 65 H CHOH 3,4-dihidro-2H-1,5-
benzo[b]dioxepin-6-il 1,9
66 H CHOH 2,3-dihidro-1,4-benzodioxin-5-il
5,7
67 F CHOH 8-quinolil 2,7 68 F CHOH 8-quinaldinil 2,5 69 F CHOH 2,3-dihidro-1,4-
benzodioxin-5-il 6
70
S
NNR
zAr1
F CHOH 3,4-dihidro-2H-1,5-benzo[b]dioxepin-6-il
3
8. QSAR 3D 97
Tabela 12. continuação
Compostos do conjunto de teste
Comp. Estrutura geral R Z Ar1 Ki (nM)
71 H CO 2-metoxifenil 50 72 H CHOH 2-metoxifenil 47,5 73 H CHO-4-
CF3C6H4 4-clorofenil >5000
74 H CHOH 2-piridil 155 75 H CHO-4-
CF3C6H4 2-piridil 1600
76
NN
R
zAr1
H CHOH 2-pirimidil 375 77 H CO 2-metoxifenil 16 78 H CO 4-clorofenil 700 79 H CHOH 2-clorofenil 200 80 2,5-
dimetil CO 2-metoxifenil 5
81
NN Ar1z
S
R
2,5-dimetil
CO 1-naftil 100
82 H CHOH 4-clorofenil >5000 83
S
Ar1N
N
R
z
5-metil CHOH 2-metoxifenil 34
84 H CO 4-cloro-2-metoxifenil 500 85 H CHOH 5-benzo[b]tiofenil 913 86 H CHOH 8-quinolil 6,3 87 H CO 4-clorofenil >5000 88
S
NNR
zAr1
F CHOH 1,3-benzodioxol-4-il 9,4
As estruturas dos compostos foram construídas empregando o módulo CONCORD
(PEARLMAN) do pacote SYBYL 7.3 (TRIPOS) e submetidas a um procedimento de
otimização de geometrias empregando inicialmente o campo de força Tripos (CLARK;
CRAMER III; VAN OPDENBOSCH, 1989), com o algoritmo steepest descent. Em seguida,
uma nova otimização das geometrias dos compostos, juntamente com o cálculo das cargas
parciais, foi realizada com o método semi-empírico AM1. Em todas as moléculas, o átomo N1
foi modelado no estado protonado. Todos os cálculos e visualizações foram realizados no
pacote SYBYL 7.3 (TRIPOS), em plataforma Linux/Red Hat.
A próxima etapa na geração do modelo CoMFA é o alinhamento estrutural das
moléculas do conjunto de treinamento. Para obter este alinhamento, foi empregada uma
8. QSAR 3D 98
estratégia baseada numa hipótese farmacofórica gerada com o programa GALAHAD
(RICHMOND et al., 2006; SHEPPHIRD; CLARK, 2006).
Um farmacóforo é um ensemble de características estéricas e eletrostáticas dos
ligantes que são necessárias para garantir interações ótimas com seus receptores biológicos.
Para obter um modelo farmacofórico, uma série de compostos que atuem de acordo com o
mesmo mecanismo são alinhadas para determinar quais são suas características comuns, que
podem então ser associadas à sua atividade biológica (PATEL et al., 2002). Os descritores
farmacofóricos representam as principais forças intermoleculares não-covalentes (ligações de
hidrogênio, interações eletrostáticas, hidrofóbicas e de van der Waals). Um modelo ideal deve
incorporar as características comuns de um sub-conjunto de moléculas potentes, juntamente
com suas distribuições espaciais (SHEPPHIRD; CLARK, 2006).
O programa GALAHAD, empregado neste trabalho, realiza alinhamentos pela
construção iterativa de hipermoléculas que representam os aspectos sub-estruturais e
conformacionais comuns mais importantes dentro de um conjunto de moléculas, podendo
então fornecer uma regra de alinhamento para moléculas não usadas na construção da
hipermolécula. Vinte modelos foram gerados para um sub-conjunto contendo cinco dos
compostos com maiores afinidades do conjunto de treinamento (compostos 32, 65, 66, 67 e
69 - ver Tabela 12). A hipótese farmacofórica gerada desta forma foi usada para o
alinhamento estrutural das moléculas do conjunto de treinamento, empregado na construção
do modelo CoMFA.
As moléculas alinhadas foram inseridas em uma grade tridimensional com
espaçamento de 2,0 Å entre os vértices nas direções x, y e z. Os mapas estéricos e
eletrostáticos foram gerados utilizando o método AM1 e um carbono sp3 positivamente
carregado como sonda química. As contribuições dos campos eletrostáticos e estereoquímicos
foram calculadas empregando os potenciais de Coulomb e de Lennard-Jones,
8. QSAR 3D 99
respectivamente. Os valores de corte para as energias de interação foram de 30 kcal/mol. Para
que as energias de interação fossem tratadas como tendo a mesma ordem de grandeza, os
descritores foram escalonados pelo método CoMFA padrão.
A correlação estatística dos valores de afinidade pelo receptor 5-HT1A com os valores
de energia de interação em cada ponto da grade foi realizada com o método PLS. Para
determinar o número ótimo de componentes PLS, foi empregada a técnica de validação
cruzada, escolhendo-se então o número de componentes correspondente ao maior valor de q2.
Com o objetivo de obter um modelo com a máxima capacidade preditiva possível, foi
empregado o recurso de focagem da melhor região, que consiste em atribuir um peso maior
para os pontos da grade que contribuem de maneira mais significativa para o modelo e um
menor peso para pontos que apresentam redundância ou baixa variância dos dados. Uma
maneira de se evidenciar os pontos de maior contribuição é fazer a diferenciação dos campos
pelo coeficiente de desvio padrão (SDC). A partir de uma análise realizada previamente,
atribui-se o peso que determinado ponto terá em uma nova análise pela multiplicação da
variação dos valores dos campos de interação deste ponto pelo coeficiente que foi atribuído a
este ponto pela análise anterior.
Finalmente, o método CoMFA permite avaliar as posições de substituição que fazem
contribuições favoráveis ou desfavoráveis para a propriedade biológica em estudo, por meio
de poliedros denominados mapas de contorno, que evidenciam regiões estereoquímicas e
eletrostáticas ao redor das moléculas responsáveis pelas diferenças nos valores da propriedade
biológica.
8. QSAR 3D 100
8.2. Resultados e Discussão
As moléculas do conjunto de treinamento foram alinhadas com base no modelo
farmacofórico gerado pelo programa GALAHAD, que teve de ser refinado posteriormente
com o programa UNITY (TRIPOS), a fim de obter-se a mesma orientação para todas as
moléculas do conjunto de treinamento. As características identificadas como necessárias para
garantir interações ótimas desse composto com o receptor 5-HT1A são mostradas na Figura
17a: a esfera azul-ciano representa uma região aromática; as esferas vermelhas representam
regiões receptoras de ligações de hidrogênio; a esfera azul corresponde a um centro positivo,
enquanto a esfera amarela representa uma região hidrofóbica. O alinhamento de todas as
moléculas do conjunto de treinamento obtido a partir deste modelo farmacofórico é mostrado
na Figura 17b. As características observadas neste modelo estão de acordo com a hipótese
farmacofórica relatada em estudo anterior (ORÚS et al., 2002), que identificou os elementos
farmacofóricos necessários para altas afinidades pelo receptor 5-HT1A empregando uma
abordagem diferente da utilizada no presente trabalho.
8. QSAR 3D 101
(a)
(b)
Figura 17 - (a) Características farmacofóricas usadas para o alinhamento das estruturas do conjunto de dados e (b) alinhamento estrutural das moléculas do conjunto de treinamento.
O primeiro modelo CoMFA obtido apresentou parâmetros estatísticos insatisfatórios;
empregando o recurso de focagem da melhor região, foi possível obter um aumento na
consistência interna e um refinamento dos mapas de contorno. Os melhores resultados foram
obtidos quando os descritores relevantes foram potencializados pelo SDC com peso w = 0,8,
conforme mostrado na Tabela 13.
Tabela 13. Parâmetros estatísticos obtidos nas análises PLS para o modelo CoMFA
Parâmetros estatísticos Modelo
q2 r2 N
Porcentagens de
contribuição
sem focagem 0,52 0,79 6 estérica eletrostática
w = 0,8* 0,68 0,89 6 80% 20%
8. QSAR 3D 102
A fim de avaliar o poder preditivo deste modelo, foram feitas as predições das
afinidades dos compostos do conjunto de teste, que foram submetidos aos mesmos
procedimentos de minimização de energia, cálculo de cargas parciais e alinhamento molecular
tais como os compostos do conjunto de treinamento. Na Tabela 14 são mostrados os
resultados das predições para o conjunto de teste, que indicam a boa capacidade preditiva do
modelo obtido, uma vez que os resíduos de predição são bastante baixos.
Tabela 14. Resíduos de predição para os compostos do conjunto de teste
Composto pKi Experimental
pKi Predito
Resíduo
71 7,30 7,43 -0,13 2 7,32 7,67 -0,35 73 5,30 5,80 -0,50 74 6,81 6,88 -0,07 75 5,80 6,41 -0,61 76 6,43 6,25 0,18 77 7,80 7,51 0,29 78 6,15 6,03 0,12 79 6,70 6,56 0,14 80 8,30 8,05 0,25 81 7,00 7,05 -0,05 82 5,30 5,72 -0,42 83 7,47 7,12 0,35 84 6,30 6,37 -0,07 85 6,04 6,50 -0,46 86 8,20 7,87 0,33 87 5,30 5,57 -0,27 88 8,03 7,47 0,56
O gráfico dos valores de afinidade pelo receptor 5-HT1A experimentais versus preditos
para os conjuntos de treinamento e teste é ilustrado na Figura 18. A estabilidade do modelo
foi também avaliada com o método de scrambling progressivo. Os modelos obtidos com a
permutação das variáveis dependentes apresentaram valores de q2 menores do que 0,50, o que
indica que o modelo final obtido neste trabalho não é fruto de correlações ao acaso.
8. QSAR 3D 103
Figura 18 - Valores de pKi preditos versus experimentais para o conjunto de treinamento e para o conjunto de
teste resultantes do modelo CoMFA.
Os mapas de contorno gerados com o método CoMFA permitem a visualização dos
campos estéricos e eletrostáticos que apresentam maior importância para explicar as
diferenças nos valores de afinidade da série de compostos em estudo. Os mapas nas cores
verde e amarelo representam os campos estéricos: poliedros verdes sugerem substituições por
grupos volumosos, enquanto poliedros amarelos sugerem grupos pouco volumosos. Por outro
lado, os mapas azuis e vermelhos se referem às características eletrostáticas: poliedros azuis
sugerem substituições por grupos positivos e os vermelhos sugerem substituições por grupos
eletronegativos. É importante ressaltar que estes mapas são encontrados nas áreas da grade
caracterizadas pela variância das propriedades estéricas e eletrostáticas dos ligantes. Assim, a
ausência de um mapa não significa que determinado elemento farmacofórico não seja
8. QSAR 3D 104
importante, mas apenas que todos os ligantes do conjunto analisado exercem, nesta
determinada área, mais ou menos a mesma influência estérica ou eletrostática.
A Figura 19 ilustra os mapas de contorno para o composto de maior afinidade da série.
Na Figura 19a, podem ser observados poliedros amarelos em torno do anel benzodioxepínico,
na hidroxila (substituinte Z) e em determinadas regiões do anel benzotiofeno. Sendo assim, na
maior parte do ligante, somente a substituição por grupos pouco volumosos é favorável a um
aumento nos valores de afinidade pelo receptor 5-HT1A. Isso indica que a cavidade do
receptor deve apresentar restrições nessas regiões que limitam o volume disponível para os
ligantes. Em outras palavras, a introdução de substituintes volumosos nessas posições, sejam
quais forem suas características eletrostáticas, causarão uma diminuição da afinidade pelo
receptor 5-HT1A. A única exceção é a posição do anel benzotiofeno em que aparece um
poliedro verde, indicando que substituintes volumosos podem ser tolerados nessa região.
(a) (b)
Figura 19 - Mapas de contorno (a) estéricos e (b) eletrostáticos para o composto com maior afinidade pelo receptor 5-HT1A do conjunto de dados.
8. QSAR 3D 105
A Figura 19b traz indicações sobre as regiões nas quais altas densidades eletrônicas
podem aumentar (vermelho) ou diminuir (azul) as afinidades dos ligantes. Os mapas
vermelhos em torno do anel benzotiofeno e nas proximidades do anel piperazínico sugerem
que substituintes eletronegativos nessas posições podem aumentar a afinidade pelo receptor 5-
HT1A. O poliedro azul no anel benzodioxepínico indica que substituintes positivos nessa
posição exercerão um efeito positivo sobre a afinidade. Por outro lado, a substituição por
grupos eletronegativos resultará em uma diminuição da afinidade.
8.3. Conclusões
O método CoMFA foi aplicado com sucesso para o conjunto de compostos
arilpiperazínicos em estudo. O modelo de QSAR 3D resultante foi capaz de fornecer uma
correlação significativa entre os campos estéricos e eletrostáticos e as afinidades pelo receptor
5-HT1A, além de fazer predições em concordância com os valores experimentais. Os mapas de
contorno indicaram que, na maior parte das posições, as substituições por grupos pouco
volumosos e eletronegativos são favoráveis para a afinidade pelo receptor 5-HT1A. Essas
informações podem ser úteis para a otimização da afinidade de ligantes estruturalmente
relacionados aos compostos analisados neste trabalho.
9. Modelagem do Receptor 5-HT1A 106
9. MODELAGEM DO RECEPTOR 5-HT 1A
Neste capítulo serão apresentados os resultados dos estudos de modelagem do receptor
5-HT1A realizados com o objetivo de obter um modelo tridimensional deste receptor que
pudesse ser utilizado para analisar as características do sítio ativo e os modos de interação
com os compostos arilpiperazínicos em estudo, de forma a complementar as análises QSAR
apresentadas anteriormente. Para tal, foram empregadas as metodologias de modelagem por
homologia e docking ligante-receptor, cujos fundamentos foram comentados no Capítulo 3.2
9.1. Procedimento Computacional
Inicialmente, a seqüência de aminoácidos do receptor 5-HT1A foi submetida ao
programa PSIPRED (JONES, 1999) para a predição da estrutura secundária e, em seguida, ao
programa FUGUE (SHI; BLUNDELL; MIZUGUCHI, 2001), que realiza a busca por
estruturas homólogas comparando seqüência contra estrutura. O programa PSIPRED emprega
redes neurais para predizer a estrutura secundária de uma proteína baseando-se em matrizes
de escore dependentes da posição geradas pelo PSI-BLAST (ALTSCHUL et al., 1997). O
programa FUGUE conta com tabelas de substituição dependentes do meio, com um algoritmo
de alinhamento global-local para alinhar pares seqüência/estrutura quando há grandes
diferenças de comprimento, ou o algoritmo global em outros casos. As penalidades para
lacunas em cada posição da estrutura são determinadas de acordo com a acessibilidade ao
solvente, a posição relativa aos elementos de estrutura secundária e a conservação desses
elementos.
2 Esta etapa do trabalho foi realizado em um estágio de doutorado sanduíche na Universidade de Cambridge, no grupo do Prof. Tom L. Blundell, com bolsa do programa PDEE/CAPES.
9. Modelagem do Receptor 5-HT1A 107
A estrutura selecionada para ser empregada como molde na modelagem comparativa
foi a da rodopsina bovina determinada por OKADA et al. (2004) - código no PDB: 1u19 - que
apresenta 18,8% de identidade seqüencial com o receptor 5-HT1A. A partir do arquivo de
alinhamento gerado com o programa FUGUE, a construção do modelo foi realizada com o
pacote de programas ORCHESTRAR (TRIPOS).
Neste pacote, a modelagem das regiões estruturalmente conservadas do receptor é
realizada empregando o programa CHORAL (MONTALVÃO et al., 2005), que foi descrito
no Capítulo 3. Em seguida, é feita uma validação da estrutura e do alinhamento com o
programa CANTATA (Richard E. Smith, resultados não publicados), que avalia a presença de
resíduos que não atendam aos “parâmetros acurados de ligações e ângulos” para estruturas
cristalográficas, conforme especificado por Engh e Huber (1991), de maneira análoga ao
programa PROCHECK (LASKOWSKI et al., 1993).
Para a modelagem das regiões estruturalmente variáveis, inicialmente um script em
Python chamado de PRELUDE identifica lacunas no core da estrutura e utiliza os seguintes
programas para preenchê-las: (i) BRIDGE (Paul de Bakker, resultados não publicados),
utilizado para preencher lacunas de no máximo dois resíduos através de uma busca
conformacional ab initio pelas coordenadas mais adequadas dos resíduos em questão; (ii)
CODA, que combina uma abordagem “knowledge-based”, selecionando fragmentos de
proteínas de um banco de dados, com uma construção ab initio da região em questão, e é
empregado quando o loop é formado por três a oito resíduos (DEANE; BLUNDELL, 2001);
(iii) RAPPER, um programa ab initio de busca conformacional usado nos casos em que o
programa CODA não é capaz de produzir um modelo adequado para preencher determinada
lacuna (DE BAKKER et al., 2003; DEPRISTO et al., 2003).
9. Modelagem do Receptor 5-HT1A 108
Os loops são conectados à estrutura do modelo pelo programa TUNER (Simon Lovell,
resultados não publicados), que varia a conformação local das posições de âncora do modelo e
dos loops a fim de regularizar a geometria dessas regiões.
A etapa seguinte é a modelagem das cadeias laterais com o programa ANDANTE, que
emprega informação sobre famílias de proteínas alinhadas estruturalmente, na forma de regras
de conservação de ângulos χ, para atribuir conformações a cada cadeia lateral (SMITH et al.,
2007).
Finalmente, o modelo é validado novamente pelo programa CANTATA e refinado
com o programa ARPEGGIO (R.W. Montalvão, S. C. Lovell, T. L. Blundell, resultados não
publicados), que emprega um algoritmo de dinâmica molecular baseado nos dados de ligação
e estruturas de raios-X de Engh e Huber (1991). Esse refinamento é feito para corrigir erros
nos parâmetros de ligações e ângulos por meio de pequenas variações locais nas coordenadas
atômicas empregando uma simulação de 200 passos com o algoritmo steepest descent.
Em seguida, ligantes com afinidades pelo receptor 5-HT1A variáveis foram docados na
estrutura do modelo assim obtido, utilizando a metodologia implementada no programa
GOLD (descrita no Capítulo 3). As estruturas dos ligantes, mostradas na Figura 20, foram
modeladas utilizando o módulo CONCORD do pacote SYBYL (TRIPOS) e minimizadas
usando o campo de força Tripos (CLARK; CRAMER III; VAN OPDENBOSCH, 1989), com
o algoritmo steepest descent.
9. Modelagem do Receptor 5-HT1A 109
NN Ar1
Ar2
z
1
4
Estrutura geral das arilpiperazinas
O
O
S
NN
OH
1
Ki = 1,9 nM
NS
NN
OH
CH32
Ki = 10,2 nM
S
NN
MeO
O
3
Ki = 16 nM
S
NN
O
4
Ki = 35 nM
Figura 20 - Estrutura geral dos compostos em estudo e estruturas dos ligantes empregados no estudo de docking.
De acordo com estudos anteriores (LOPEZ-RODRÍGUEZ et al., 2002), as interações
específicas entre ligantes e o receptor 5-HT1A podem ser classificadas como essenciais,
determinando a atividade do composto, e adicionais, aumentando sua afinidade e fornecendo
seletividade sobre outros alvos biológicos. A principal interação do tipo essencial confirmada
experimentalmente é a interação iônica entre o oxigênio carboxílico da cadeia lateral de
Asp3.32 e o nitrogênio protonado N1 do anel piperazínico. Portanto, foi adicionada uma
restrição de distância entre esses dois grupos. O sítio ativo foi definido estabelecendo-se uma
esfera de raio de 10 Å em torno do resíduo Asp3.32. Entretanto, os complexos obtidos nos
primeiros testes de docking apresentavam uma orientação ligeiramente desfavorável da cadeia
lateral do resíduo Asp3.32 com relação ao N1 do anel piperazínico. Assim, um procedimento
de variação conformacional, utilizando o programa ANDANTE, foi empregado com o
9. Modelagem do Receptor 5-HT1A 110
objetivo de obter novos rotâmeros para esta cadeia lateral. Os ligantes foram então docados no
modelo contendo o rotâmero mais adequado.
9.2. Resultados e Discussão
O alinhamento entre as seqüências da proteína-molde e do receptor 5-HT1A gerado
com o programa FUGUE é mostrado na Figura 21, utilizando a notação do formato JOY
(MIZUGUCHI et al., 1998), que representa informação tridimensional no alinhamento
seqüencial de forma a auxiliar a visualização das características estruturais e ambientais
importantes para a análise das estruturas (ver Tabela 15). Os elementos da estrutura
secundária, preditos para o receptor 5-HT1A com o programa PSIPRED, são representados
neste alinhamento de acordo com o seguinte código de cores: vermelho para alfa-hélices, azul
para fitas-beta e preto para estrutura desorganizada.
Tabela 15. Notação do formato JOY
JOY
Inacessível ao solvente MAIÚSCULAS X
Acessível ao solvente Minúsculas x
Alfa-hélice Vermelho x
Fita-beta Azul x
Hélice 310 Marrom x
Ligação de hidrogênio com
amida da cadeia principal
Negrito x
Ligação de hidrogênio com
carbonila da cadeia principal
Sublinhado X
Ponte de dissulfeto Cedilha ç
Phi positivo Itálico x
9. Modelagem do Receptor 5-HT1A 111
Figura 21 - Alinhamento das seqüências do receptor 5-HT1A e da rodopsina bovina (código 1u19 no PDB) obtido com o programa FUGUE, com a anotação da proteína-molde no formato JOY e a representação da estrutura secundária predita pelo PSIPRED para o receptor 5-HT1A.
5-HT1A VSYQVITSLLLGTLIFCAVLGNACVVAAIAL1u19 pwqFsmlAay MflLImlGfpiN flT lyVT vq
5-HT1A -MD VLSPGQGNNTTSPPAPFETGGNTTGISDVT1u19 mn Gt egpnf yVPfs nktgvVrsPFeapQyy Lae
1 10 20 30
40 50 60
5-HT1A ERSLQN1u19 HkkLr t
5-HT1A VANYLIGSLAVTDLMVSVLVLPMAALYQVL1u19 plNyILlnLAvAD lfMVfg GFt TTLyTSlh
65
70 80 90
5-HT1A NKWTL1u19 GyFvf
100
5-HT1A GQVTCDLFIALDVLCCTSSILHLCAIALDRYWAI1u19 gptGÇn l EGffAT LGGEIaLWSLvvLAieR yvvV
110 120 130
5-HT1A TDPIDYVNKRTRod. C kpms-nfrfg
140
5-HT1A PRRAAALISLTWLIGFLISI PPMLRod. enhaimgvafT wvmAlaCAapPl v
150 160 170
5-HT1A GWRTPEDRSDPDAC-------- TIS K1u19 gw SrY IP EGMQCSÇGI DYYTpheet n
180 190
5-HT1A DHGYTIYSTFGAFYIPLLLMLVLY1u19 NesFViy Mfvv HfiiPlivIffc y
200 210
N-term.
HTM1
LI1
HTM2
LE1
HTM3
LI2
HTM4
LE2
HTM5
5-HT1A VSYQVITSLLLGTLIFCAVLGNACVVAAIAL1u19 pwqFsmlAay MflLImlGfpiN flT lyVT vq
5-HT1A -MD VLSPGQGNNTTSPPAPFETGGNTTGISDVT1u19 mn Gt egpnf yVPfs nktgvVrsPFeapQyy Lae
1 10 20 30
40 50 60
5-HT1A ERSLQN1u19 HkkLr t
5-HT1A VANYLIGSLAVTDLMVSVLVLPMAALYQVL1u19 plNyILlnLAvAD lfMVfg GFt TTLyTSlh
65
70 80 90
5-HT1A NKWTL1u19 GyFvf
100
5-HT1A GQVTCDLFIALDVLCCTSSILHLCAIALDRYWAI1u19 gptGÇn l EGffAT LGGEIaLWSLvvLAieR yvvV
110 120 130
5-HT1A TDPIDYVNKRTRod. C kpms-nfrfg
140
5-HT1A PRRAAALISLTWLIGFLISI PPMLRod. enhaimgvafT wvmAlaCAapPl v
150 160 170
5-HT1A GWRTPEDRSDPDAC-------- TIS K1u19 gw SrY IP EGMQCSÇGI DYYTpheet n
180 190
5-HT1A DHGYTIYSTFGAFYIPLLLMLVLY1u19 NesFViy Mfvv HfiiPlivIffc y
200 210
N-term.
HTM1
LI1
HTM2
LE1
HTM3
LI2
HTM4
LE2
HTM5
9. Modelagem do Receptor 5-HT1A 112
Figura 21 - (Continuação) Alinhamento das seqüências do receptor 5-HT1A e da rodopsina bovina (código 1u19 no PDB) obtido com o programa FUGUE, com a anotação da proteína-molde no formato JOY e a representação da estrutura secundária predita pelo PSIPRED para o receptor 5-HT1A.
Este alinhamento teve de ser corrigido manualmente de modo a ajustar os loops à
estrutura do modelo. Dessa forma, o princípio e o fim de cada uma das regiões do modelo
final do receptor 5-HT1A são as seguintes: N-terminal (M1-T32), HTM1 (V33-L63), loop
intracelular (LI ) 1 (E64-N69), HTM2 (V70-L99), loop extracelular (LE) 1 (N100-L104),
HTM3 (G105-I138), LI2 (T139-T149), HTM4 (P150-L173), LE2 (G174-K191), HTM5
(D192-Y215), LI3 (G216-K334), HTM6 (M335-F370), LE3 (C371-P378), TMH7 (T379-
5-HT1A GRIFRAARFRIRKTVKKVEKTGADTRHGASPAPQ1u19 gq Lvftvk--------------------------
220 230 240
5-HT1A PKKSVNGESGSRNWRLGVESKAGGALCANGAVRQ1u19 ----------------------------------
5-HT1A GDDGAALEVIEVHRVGNSKEHLPLPSEAGPTPCA1u19 ----------------------------------
5-HT1A PASFERKNERNAEAKRK1u19 -------eaaa qqqesa
320 330
5-HT1A MALARERKTVKTLGIIMGTFILCWLPFFIVALVLPF1u19 ttq kaeke vTrMViiMviAFliC WlpYAgvAfyIft
340 350 360 370
5-HT1A CESSCHMP1u19 Hq gs-dFg
375
5-HT1A TLLGAIINWLGYSNSLLNPVIYAYFNKDFQNAFKKII1u19 pifM TipAFf AKtSAVYNPvIYim MnkqFrNCmvTt l
380 390 400 410
5-HT1A KCKFCRQ--------------------1u19 c cgknplgddeasttVsktets qvapa
420
LI3
HTM6
EL3
TMH7
C-term.
250 260 270 280
290 300 310
5-HT1A GRIFRAARFRIRKTVKKVEKTGADTRHGASPAPQ1u19 gq Lvftvk--------------------------
220 230 240
5-HT1A PKKSVNGESGSRNWRLGVESKAGGALCANGAVRQ1u19 ----------------------------------
5-HT1A GDDGAALEVIEVHRVGNSKEHLPLPSEAGPTPCA1u19 ----------------------------------
5-HT1A PASFERKNERNAEAKRK1u19 -------eaaa qqqesa
320 330
5-HT1A MALARERKTVKTLGIIMGTFILCWLPFFIVALVLPF1u19 ttq kaeke vTrMViiMviAFliC WlpYAgvAfyIft
340 350 360 370
5-HT1A CESSCHMP1u19 Hq gs-dFg
375
5-HT1A TLLGAIINWLGYSNSLLNPVIYAYFNKDFQNAFKKII1u19 pifM TipAFf AKtSAVYNPvIYim MnkqFrNCmvTt l
380 390 400 410
5-HT1A KCKFCRQ--------------------1u19 c cgknplgddeasttVsktets qvapa
420
LI3
HTM6
EL3
TMH7
C-term.
250 260 270 280
290 300 310
9. Modelagem do Receptor 5-HT1A 113
I415) e C-terminal (K416-Q422). A representação tridimensional deste modelo é mostrada
na Figura 22, omitindo-se a região LI3 (loop de 119 resíduos). Este loop foi modelado com o
programa RAPPER (DE BAKKER et al., 2003; DEPRISTO et al., 2003), mas não foi
empregado nos estudos de docking de ligantes por estar muito distante do sítio de interação.
Figura 22 - Representação das HTMs do modelo obtido.
Após a minimização deste modelo, não restaram choques estéricos significativos na
estrutura. A análise do mapa de Ramachandran do modelo (ver Figura 23), realizada com o
programa RAMPAGE (LOVELL et al., 2002), mostra 86,9% dos resíduos em regiões
favoráveis e 8,7% em regiões permitidas. Os resíduos posicionados em regiões desfavoráveis
9. Modelagem do Receptor 5-HT1A 114
(4,4%) são resíduos distantes do sítio de interação, o que não compromete a utilização deste
modelo em estudos de docking.
Figura 23 - Mapa de Ramachandran do modelo obtido mostrando as regiões favoráveis (cores escuras), permitidas (cores claras) e desfavoráveis (branco).
9. Modelagem do Receptor 5-HT1A 115
Embora a identidade seqüencial entre as HTMs do receptor 5-HT1A e a rodopsina
bovina seja de apenas 18,8%, é possível inferir que este receptor apresente um enovelamento
bastante semelhante ao da proteína-molde, uma vez que ambos possuem diversos motivos
conservados (seqüências de aminoácidos altamente conservadas). Assim, apesar da baixa
identidade seqüencial quando se leva em consideração as seqüências como um todo, os
aminoácidos estruturalmente ou funcionalmente importantes são conservados ou ao menos
substituídos por aminoácidos de alta similaridade. Nesse caso, pode-se esperar modelos mais
precisos do que no caso de outros tipos de proteínas baseados em moldes de baixa identidade
seqüencial.
Entretanto, é necessário ressaltar que essa consideração é válida apenas para as regiões
transmembrânicas, uma vez que as regiões terminais e os loops são extremamente flexíveis e
divergentes com relação à seqüência de aminoácidos da rodopsina. Uma vez que o sítio de
interação do receptor 5-HT1A fica localizado na região transmembrânica, essas outras regiões
não são importantes para o presente estudo. A única exceção é o loop LE2, que na estrutura
cristalográfica da rodopsina fica bastante próximo das HTMs e, especialmente, do retinal
(ligante co-cristalizado com a estrutura da rodopsina). É bastante provável que isso ocorra
também em outros GPCRs, uma vez que existe uma ponte de dissulfeto entre cisteínas na
HTM3 e em LE2.
Na Figura 24a, pode-se observar que os resíduos cruciais para a interação com os
ligantes, tais como Asp3.32, Asn7.39, Ser5.42, Thr5.43 e Trp 6.48 aparecem localizados na
superfície acessível aos ligantes, assim como uma parte do loop LE2. Com o objetivo de
analisar as características das interações entre o receptor 5-HT1A e os compostos
arilpiperazínicos da série em estudo, foram feitos estudos de docking com quatro ligantes (ver
Figura 20), cuja ordem de afinidade é: 1 > 2 > 3 > 4.
9. Modelagem do Receptor 5-HT1A 116
(a) (b) Figura 24 - (a) Localização dos resíduos cruciais para a interação com os ligantes nas HTMs e (b) Posicionamento dos ligantes nas HTMs.
Conforme mostrado na Figura 24b, os resultados do estudo de docking sugerem que os
ligantes estão posicionados entre as hélices 3, 5, 6 e 7. Todos os ligantes estudados
apresentam um alto grau de liberdade conformacional, o que resulta em evidentes diferenças
nas interações específicas entre cada ligante e o modelo do receptor. Como foi adicionada a
restrição de distância entre o resíduo Asp3.32 e o próton ligado ao N1 (ver Figura 20), todos
os ligantes contam com esta interação específica como ponto de ancoragem para o
reconhecimento pelo receptor.
Na Figura 25 são mostradas as interações entre o modelo do receptor 5-HT1A e os
ligantes 1 e 2. Embora o posicionamento desses ligantes seja bastante semelhante, é possível
verificar diferenças significativas nos modos de interação. O anel benzotiofeno do ligante 1
pode fazer uma interação aromática com Trp6.48; o grupo OH pode formar uma ligação de
hidrogênio com Thr3.37 e o oxigênio do anel benzodioxepínico pode formar uma ligação de
hidrogênio com Asn7.39. Já o ligante 2 apresenta uma interação a menos, o que pode ser
relacionado à diminuição de afinidade: o grupo OH pode interagir com Asn7.39, o anel
benzotiofeno pode interagir com Trp6.48 (embora esteja em uma posição menos favorável
9. Modelagem do Receptor 5-HT1A 117
com relação ao sistema aromático deste resíduo do que o do ligante 1), mas o substituinte Ar1
não encontra resíduos próximos capazes de fazer interações mais fortes do que as de van der
Waals.
1 2
Figura 25 - Interações específicas entre os ligantes 1 e 2 e o modelo do receptor 5-HT1A.
O posicionamento dos ligantes 3 e 4 é semelhante ao dos ligantes 1 e 2. Interações
entre o substituinte Ar2 (que neste caso é um anel tiofeno) e o resíduo Trp6.48 também podem
ser observadas para os ligantes 3 e 4, como mostrado na Figura 26. Entretanto, esses ligantes
perdem a interação com Asn7.39, que fica distante de grupos dos ligantes com os quais
poderia interagir.
9. Modelagem do Receptor 5-HT1A 118
3 4
Figura 26 - Interações específicas entre os ligantes 3 e 4 e o modelo do receptor 5-HT1A.
Os resultados obtidos permitem fazer certas generalizações sobre as interações entre o
receptor 5-HT1A e os compostos em estudo: (a) o anel piperazínico fica localizado entre as
hélices 3 e 7 devido à interação iônica entre o próton ligado ao nitrogênio 1 e o resíduo
Asp3.32, que é considerado o resíduo essencial para o reconhecimento desses ligantes pelo
receptor; (b) o resíduo Asn7.39 faz importantes interações com os ligantes que apresentam
maiores afinidades. Dependendo da conformação adotada pelo ligante, essas interações
podem ocorrer com os subtituintes do anel Ar1 ou com os grupos Z (ver Figura 20); (c) todos
os ligantes desse grupo apresentam uma interação aromática entre o anel Ar2 e os anéis do
resíduo Trp6.48. Esta observação é consistente com estudos anteriores que sugerem a
existência de uma região hidrofóbica altamente conservada em GPCRs da classe “A”, que
favorece o reconhecimento por ligantes apresentando substituintes aromáticos (LOPEZ-
RODRÍGUEZ et al., 2002). Além disso, este resultado é compatível com os mapas de
contribuição obtidos em nosso modelo HQSAR (ver Figura 16, Capítulo 7), nos quais o grupo
benzotiofeno aparece como uma das mais importantes contribuições favoráveis a altas
afinidades, juntamente com o anel piperazínico.
9. Modelagem do Receptor 5-HT1A 119
Outro resíduo considerado importante para a interação com o receptor 5-HT1A e que já
foi observado em estudos anteriores de modelagem deste receptor é a Ser5.42 (LOPEZ-
RODRÍGUEZ et al., 2002). Este resíduo está presente em todos os receptores para os quais o-
metoxifenilpiperazinas apresentam afinidades altas, não somente como o receptor 5-HT1A,
mas também com o receptor serotoninérgico 5-HT7 e com o adrenérgico R1A. Devido à
importância desse resíduo para a interação com ligantes diferentes dos nossos, os autores
desses estudos chegavam a modificar o modelo inicial ou restringir a trajetória da DM para
aproximar as hélices HTM3 e HTM5 (LOPEZ-RODRÍGUEZ et al., 2001b; SEEBER; DE
BENEDETTI; FANELLI, 2003).
Na Figura 24a, pode-se verificar que a HTM5 que contém o resíduo Ser5.42 aparece
relativamente distante da HTM3. Para os nossos ligantes, a distância entre essas hélices
acabou trazendo problemas para interpretar as interações feitas pelo substituinte Ar1. Por isso,
é possível apenas supor que as diferenças observadas nas afinidades possam ter alguma
relação com interações com Ser5.42, uma vez que os ligantes que escolhemos para analisar
apresentam diferenças significativas nos grupos substituintes dos anéis Ar1. A principal
diferença nos modos de interação do substituinte Ar1 pode ser observada na Figura 24b, que
mostra que o anel aril do ligante 2 fica torcido em direção à HTM5, favorecendo a interação
do nitrogênio do anel quinolínico com a Ser5.42, o que pode explicar a afinidade mais alta
deste ligante com relação aos demais (com exceção do ligante 1, que é o de maior afinidade
da série). Da mesma forma, o grupo 2-metóxi ligado ao anel fenil do ligante 3 pode interagir
com Ser5.42.
Nos ligantes com afinidades mais baixas, o substituinte Ar1 fica distante deste resíduo,
porém próximo do loop LE2. Um estudo anterior já havia sugerido que o loop LE2 poderia
estar envolvido na interação de certas aminas biogênicas com seus receptores formando uma
“tampa” sobre os ligantes, estabilizando essa interação (KRISTIANSEN, 2004). Além disso,
9. Modelagem do Receptor 5-HT1A 120
como já foi comentado anteriormente, essa característica é observada nas estruturas
cristalográficas da rodopsina e do receptor adrenérgico-β2, nas quais os loops LE2 ficam
próximos dos ligantes retinal e carazolol, respectivamente. Isso demonstra a importância da
modelagem deste loop em modelos de receptores serotoninérgicos, ao contrário do que é
comum na literatura, ou seja, a modelagem apenas das hélices transmembrânicas.
As características observadas no sítio de interação permitem fazer relevantes
comparações com os mapas de contorno obtidos com o método CoMFA (ver Figura 19,
Capítulo 8): (a) um substituinte retirador de elétrons enfraquecerá a interação do O
benzodioxepínico com Asn7.39, por isso a introdução de um grupo positivo no anel
benzodioxepínico pode ser favorável para a afinidade; (b) a região próxima à hidroxila é
claramente impedida, por isso somente a substituição por grupos pouco volumosos é
favorável a um aumento nos valores de afinidade; (c) a região ocupada pelo anel Ar1 é
restringida por resíduos no loop LE2, o que está de acordo com o poliedro amarelo
correspondente a esse anel no mapa de contorno estérico resultante do modelo CoMFA.
9.3. Conclusões
O modelo do receptor 5-HT1A obtido neste estudo apresentou boa qualidade
estereoquímica, conforme avaliado pelas principais ferramentas de validação empregadas. A
região do sítio de interação demonstrou características observadas em estudos anteriores,
tendo sido possível observar as principais interações descritas em estudos de mutagênese
sítio-dirigida (resíduos Asp3.32, Asn7.39 e Ser5.42) e de modelagem molecular (resíduos
Trp6.48 e Thr3.37). Além destas, o posicionamento do loop LE2 mostrou ser perfeitamente
possível a participação de resíduos desta região na interação com arilpiperazinas.
9. Modelagem do Receptor 5-HT1A 121
A determinação dos modos de interação dos ligantes estudados é dificultada por dois
fatores: o alto grau de liberdade conformacional dos ligantes e o fato de que o nosso modelo é
estático, embora as proteínas sejam na realidade mais ou menos flexíveis. Isso pode levar a
imprecisões adicionais, especialmente para receptores ativados, uma vez que o sítio de
interação do estado ativado dos GPCRs provavelmente tenha uma flexibilidade maior do que
no estado fundamental. Entretanto, devido à consistência entre as interações observadas para
o nosso modelo com interações verificadas em estudos de mutagênese sítio-dirigida e outros
estudos de modelagem molecular, podemos sugerir que os complexos ligante-receptor obtidos
neste estudo podem servir de ponto de partida para estudos visando, por exemplo, o
entendimento do potencial antagonista desses ligantes, que possam fornecer subsídios para o
planejamento de fármacos capazes de proporcionar avanços para a terapia antidepressiva.
10. Considerações Finais 122
10. CONSIDERAÇÕES FINAIS
Embora sejam a classe mais prescrita de antidepressivos, os ISRSs apresentam
diversas propriedades indesejáveis, tais como demora no início da ação terapêutica, o que traz
a necessidade do desenvolvimento de novas estratégias para a obtenção de fármacos mais
eficazes. A combinação de ISRSs com antagonistas do receptor 5-HT1A mostrou ser uma
abordagem interessante para o aceleramento da resposta clínica desses medicamentos. Assim,
a busca por antagonistas do receptor 5-HT1A resultou na obtenção de derivados
arilpiperazínicos demonstrando afinidade por este receptor e potencial utilização como
auxiliares no tratamento da depressão com ISRSs.
Nesse contexto, o presente trabalho teve a intenção de contribuir para o entendimento
das características dos compostos arilpiperazínicos responsáveis pelas interações com o
receptor 5-HT1A, empregando diferentes abordagens computacionais. Os principais resultados
dos estudos de QSAR indicaram algumas características como sendo importantes para altas
afinidades: (a) a presença de um anel benzotiofeno como substituinte Ar2, conforme indicado
pelos mapas de contribuição gerados com o método HQSAR e pelo modelo de interação entre
o ligante com maior afinidade do conjunto de dados e o receptor e (b) grupos pouco
volumosos como substituintes Z e ligados à posição orto do anel Ar1, com preferência por
receptores de ligações de hidrogênio nessas posições.
Essas características foram confirmadas pelo estudo das interações do composto com
maior afinidade do conjunto de dados com o modelo do receptor, que indicou uma importante
interação hidrofóbica do grupo benzotiofeno com o resíduo Trp6.48 do receptor, assim como
uma ligação de hidrogênio entre a hidroxila na posição Z e o resíduo Thr3.37 e, ainda, entre o
oxigênio do anel Ar1 e o resíduo Asn7.39.
10. Considerações Finais 123
Assim, podemos afirmar que os métodos escolhidos foram empregados com sucesso
na caracterização dos requisitos estruturais necessários para a afinidade pelo receptor em
estudo. Além disso, modelos de QSAR com boa consistência interna, habilidade preditiva e
estabilidade foram obtidos e podem servir de base para a busca por novos ligantes do receptor
5-HT1A. O modelo tridimensional deste receptor apresentou consistência com dados
experimentais disponíveis sobre os resíduos importantes para as interações com ligantes
arilpiperazínicos, o que torna possível sua utilização em estudos mais cuidadosos sobre os
aspectos energéticos e conformacionais das interações deste receptor com ligantes.
Cada um dos métodos empregados neste trabalho possui suas vantagens e limitações.
Entretanto, os avanços metodológicos que têm sido feitos nos últimos anos, bem como a
integração de diferentes abordagens, especialmente unindo informações da estrutura dos
ligantes com a do receptor biológico, confirmam a importância da utilização desses métodos
na otimização das propriedades farmacodinâmicas de novos ligantes que possam ser
empregados na terapia antidepressiva.
Referências Bibliográficas 124
REFERÊNCIAS BIBLIOGRÁFICAS AKAMATSU, M. Current state and perspectives of 3D-QSAR. Current Topics in Medicinal Chemistry, v. 2, p. 1381-1394, 2002. ALBERT, P. R.; LEMONDE, S. 5-HT1A Receptors, Gene Repression, and Depression: Guilt by Association. Neuroscientist, v. 10, p. 575–593, 2004. ALTSCHUL, S. F.; MADDEN, T. L.; SCHAFFER, A. A.; ZHANG, J. H.; ZHANG, Z.; MILLER, W.; LIPMAN, D. J. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Research, v. 25, n. 17, p. 3389-3402, 1997. ALLINGER, N. L.; YUH, Y. H.; LII, J. H. Molecular mechanics. The MM3 force field for hydrocarbons. Journal of the American Chemical Society, v. 111, p .8551-8566, 1989. ARVIDSSON, L. E.; HACKSELL, U.; NILSSON, J. L.; HJORTH, S.; CARLSSON, A.; LINDBERG, P.; SANCHEZ, D.; WIKSTROM, H. 8-Hydroxy-2-(di-n-propylamino)tetralin, a new centrally acting 5-hydroxytryptamine receptor agonist. Journal of Medicinal Chemistry, v. 24, p. 921-923, 1981. AZMITIA, E. C. Neuronal instability: Implications for Rett’s syndrome. Brain and Development, v. 23, Suplemento 1, p. 1-10, 2001. BAKER, D.; SALI, A. Protein structure prediction and structural genomics. Science, v. 294, p. 93-96, 2001. BALABAN, A.T. Highly discriminating distance-based topological index. Chemical Physics Letters, v.89, p.399-404, 1982. BALDWIN, J. M.; SCHERTLER, G. F.; UNGER, V. M. An alpha-carbon template for the transmembrane helices in the rhodopsin family of G-protein-coupled receptors. Journal of Molecular Biology, v. 272, p. 144-164, 1997. BALLESTEROS, J. A.; WEINSTEIN, H. Integrated methods for modeling G-protein coupled receptors. Methods in Neuroscience, v.25, p. 366-428, 1996. BARNARD, J.M.; DOWNS, G.M. Chemical fragment generation and clustering software. Journal of Chemical Information and Computer Science, v.37, p.141-142, 1997. BARNES, N. M.; SHARP, T. A review of central 5-HT receptors and their function. Neuropharmacology, v. 38, p. 1083-1152, 1999. BARRETT, J.E.; VANOVER, K.E. 5-HT receptors as targets for the development of novel anxiolytic drugs - models, mechanisms and future-directions. Psychopharmacology, v.112, p.1-12, 1993. BECK-SICKINGER, A.G. Structural characterization and binding sites of G protein-coupled receptors. Drug Discovery Today, v.1, p. 502–513, 1996.
Referências Bibliográficas 125
BEEBE, K. R.; PELL, R. J.; SEASHOLTZ, M. B. Chemometrics: a practical guide. New York: John Wiley, 1998. 459p. BERMAN, H.M.; WESTBROOK, J.; FENG, Z.; GILLILAND, G.; BHAT, T.N.; WEISSIG, H.; SHINDYALOV, I.N.; BOURNE, P.E. The Protein Data Bank. Nucleic Acids Research, v. 28, p. 235-242, 2000. BISSANTZ, C.; FOLKERS, G.; ROGNAN, D. Protein-based virtual screening of chemical databases. 1. Evaluation of different docking/scoring combinations. Journal of Medicinal Chemistry, v. 43, p. 4759-4767, 2000. BLANKLEY, C. J. Recent Developments in 3D-QSAR. In: VAN DE WATERBEEMD, H. (Ed.). Structure-property correlations in drug research. Austin: R. G. Landes Company, 1996. p.120-121. BLIER, P.; DE MONTIGNY, C.; CHAPUT, Y. A role for the serotonin system in the mechanism of action of antidepressant treatments: preclinical evidence. Journal of Clinical Psychiatry, v. 51, p. 14-20, 1990. BOWIE, J. U.; LUTHY, R.; EISENBERG, D. A method to identify protein sequences that fold into a known three-dimensional structure. Science, v. 253, p. 164-170, 1991. BROWN, N.; LEWIS, R. A. Exploiting QSAR methods in lead optimization. Current Opinion in Drug Discovery, v.9, p.419-424, 2006. BRENNER, S. E.; CHOTHIA, C.; HUBBARD, T. J. Assessing sequence comparison methods with reliable structurally identified distant evoulutionary relationships. Proceedings of the National Academy of Sciences of the United States of America, v. 95, p. 6073-6078, 1998. BRERETON, R. G. Multivariate pattern recognition in chemometrics, illustrated by case studies. Amsterdam: Elsevier, 1992. 325 p. BRONOWSKA, A.; LES, A.; CHILMONCZYK, Z.; FILIPEK, S.; EDVARDSEN, O.; OSTENSEN, R.; SYLTE, I. Molecular dynamics of buspirone analogues interacting with the 5-HT1A and 5-HT2A serotonin receptors. Bioorganic and Medicinal Chemistry, v. 9, p. 881-895, 2001. BROWN, Frank. Editorial Opinion: Chemoinformatics – a ten year update. Current Opinion in Drug Discovery and Development, v. 8, p. 296-302, 2005. BRUNS, R. E.; FAIGLE, J.F.G. Quimiometria. Química Nova, p.84-99, 1985. BULTINCK, P.; TOLLENAERE, J. P.; WINTER, H. Computational medicinal chemistry for drug discovery. New York: Marcel Dekker Inc., 2003, 794p. CASTRÉN, E. Is mood chemistry? Nature Reviews Neuroscience, v.6, p.241-246, 2005.
Referências Bibliográficas 126
CHEREZOV, V.; ROSENBAUM, D. M.; HANSON, M. A.; RASMUSSEN, S. G. F.; THIAN, F. S.; KOBILKA, T. S.; CHOI, H.-J.; KUHN, P.; WEIS, W. I.; KOBILKA, B. K.; STEVENS, R. C. High-Resolution Crystal Structure of an Engineered Human b2-Adrenergic G Protein–Coupled Receptor. Science, v. 318, p. 1258-1265, 2007. CLARK, M.; CRAMER III, R. D.; VAN OPDENBOSCH, N. Validation of the general purpose tripos 5.2 force field. Journal of Computational Chemistry, v. 10, p. 982-1012, 1989. CONSONNI, V.; TODESCHINI, R.; PAVAN, M. Structure/response correlations and similarity/diversity analysis by GETAWAY descriptors. 1. Theory of the novel 3D molecular descriptors.Journal of Chemical Information and Computer Science, v.42, p.682-692, 2002. CONSONNI, V.; TODESCHINI, R.; PAVAN, M.; GRAMATICA, P. Structure/response correlations and similarity/diversity analysis by GETAWAY descriptors. 2. Application of the novel 3D molecular descriptors to QSAR/QSPR studies. Journal of Chemical Information and Computer Science, v.42, p.693-705, 2002. CRAMER III, R. D.; PATTERSON, D. E.; BUNCE, J. D. Comparative Molecular Field Analysis (CoMFA). 1. Effect of Shape on Binding of Steroids to Carrier Proteins. Journal of the American Chemical Society, v.110, p.5959-5967, 1988. CRIVORI, P.; CRUCIANI, G.; CARRUPT, P.-A.; TESTA, B. Predicting blood-brain barrier permeation from three-dimensional molecular structure. Journal of Medicinal Chemistry, v.43, p.2204-2216, 2000. CRUCIANI, C.; CRIVORI, P.; CARRUPT, P.-A.; TESTA, B. Molecular fields in quantitative structure-permeation relationships: the VolSurf approach. Journal of Molecular Structure: Theochem, v.503, p.17-30, 2000. DABROWSKA, J.; BRYLINSKI, M. Stereoselectivity of 8-OH-DPAT toward the serotonin 5-HT1A receptor: Biochemical and molecular modeling study. Biochemical Pharmacology, v. 72, p. 498-511, 2006. DEANE, C. M.; BLUNDELL, T. L. A novel exhaustive search algorithm for predicting the conformation of polypeptide segments in proteins. Proteins, v. 40, p. 135-144, 2000. DEANE, C.M. and BLUNDELL, T.L. CODA: a combined algorithm for predicting the structurally variable regions of protein models. Protein Science, v. 10, p. 599-612, 2001. DEANE, C. M.; BLUNDELL, T. L. Protein comparative modelling and drug discovery. In: WERMUTH, C. G. (Ed.). The practice of medicinal chemistry. 2.ed. London: Elsevier Academic Press, 2003. 768 p. DE BAKKER, P. I.; DEPRISTO, M. A.; BURKE, D. F.; BLUNDELL, T. L. Ab initio construction of polypeptide fragments: Accuracy of loop decoy discrimination by an all-atom statistical potential and the AMBER force field with the Generalized Born solvation model. Proteins, v. 51, p. 21-40, 2003.
Referências Bibliográficas 127
DEL OLMO, E.; LOPEZ-GIMENEZ, J. F.; VILARO, M. T.; MENGOD, G.; PALACIOS, J. M.; PAZOS, A. Early localization of mRNA coding for 5-HT1A receptors in human brain during development. Molecular Brain Research, v. 60, p. 123-126, 1998. DEPRISTO, M. A.; DE BAKKER, P. I.; LOVELL, S. C.; BLUNDELL, T. L. Ab initio construction of polypeptide fragments: efficient generation of accurate, representative ensembles. Proteins, v. 51, p. 41-55, 2003. DEWAR, M. J. S.; ZOEBISCH, E.G.; HEALY, E.F.; STEWART, J.J.P. AM1: A New General Purpose Quantum Mechanical Molecular Model. Journal of the American Chemical Society, v.107, p.3902-3909, 1985. DOVE, S.; BUSCHAUER, A. Improved alignment by weighted field fit in CoMFA of histamine H-2 receptor agonists imidazolylpropylguanidines. Quantitative Structure-Activity Relationships, v.18, p.329- 341, 1999. DRESHFIELD, L. J.; WONG, D. T.; PERRY, K. W.; ENGLEMAN, E. A. Enhancement of fluoxetine-dependent increase of extracellular serotonin (5-HT) levels by (-)-pindolol, an antagonist at 5-HT1A receptors. Neurochemistry Research, v.21, p.557, 1996. DUDEK, A. Z.; ARODZ, T.; GÁLVEZ, J. Computational methods in developing quantitative structure-activity relationships (QSAR): a review. Combinatorial Chemistry and High Throughput Screening, v.9, p.213-228, 2006. DUNBRACK JR, R. L.; KARPLUS, M. Backbone-dependent rotamer library for proteins. Application to side-chain prediction. Journal of Molecular Biology, v. 230, p. 543-574, 1993. EDDY, S. R. Profile hidden Markov models. Bioinformatics, v. 14, p. 755-763, 1998. EL MESTIKAWY, S.; RIAD, M.; LAPORTE, A. M.; VERGE, D.; DAVAL, G.; GOZLAN, H.; HAMON, M. Production of specific anti-rat 5-HT1A receptor antibodies in rabbits injected with a synthetic peptide. Neuroscience Letters, v. 118, p.189-192, 1990. ENGH, R.A.; HUBER, R. Accurate Bond And Angle Parameters For X-Ray Protein- Structure Refinement. Acta Crystallographica Section A, v. 47, p. 392-400, 1991. ERIKSSON, L.; JAWORSKA, J.; WORTH, A. P.; CRONIN, M. T. D.; MCDOWELL, R. M.; GRAMATICA, P. Methods for Reliability and Uncertainty Assessment and for Applicability Evaluations of Classification- and Regression-Based QSARs. Environmental Health Perspectives, v. 111, p. 1361-1375, 2003. ERIKSSON, L.; JOHANSSON, E. Multivariate design and modeling in QSAR. Chemometrics Intelligent Laboratory Systems, v.34, p.1-19, 1996. FARGIN, A.; RAYMOND, J. R.; LOHSE, M. J.; KOBILKA, B. K.; CARON, M. G.; LEFKOWITZ, R. J. The genomic clone G-21 which resembles a β-adrenergic receptor sequence encodes the 5-HT1A receptor. Nature, v. 335, p. 358-360, 1988.
Referências Bibliográficas 128
FISCHER, D.; EISENBERG, D. Protein fold recognition using sequence-derived predictions. Protein Science, v. 5, p. 947-955, 1996. FOYE, W. O.; LEMKE, T. L.; WILLIAMS, D. A. Principles of medicinal chemistry. 4.ed. Baltimore: Williams & Wilkins, 1995. 995p. GAILLARD, P.; CARRUPT, P.-A., TESTA, B.; SCHAMBEL, P. Binding of arylpiperazines, (aryloxy)propanolamines, and tetrahydropyridylinldoles to the 5-HT1A receptor: Contribution of the molecular lipophilicity potential to three-dimensional quantitative structure-affinity relationship models. Journal of Medicinal Chemistry, v.39, p.126-134, 1996. GALLEGOS, A.; GIRONES, X. Topological quantum similarity indices based on fitted densities: Theoretical background and QSPR application. Journal of Chemical Information and Computer Science, v.45, p.321-326, 2005. GÁLVEZ, J.; GARCIA, R.; SALABERT, M.T.; SOLER, R. Charge indexes - new topological descriptors. Journal of Chemical Information and Computer Science, v.34, p.520-552, 1994. GANELLIN, C. R.; ROBERTS, S. M. Medicinal chemistry: The role of organic chemistry in drug research. 2.ed. San Diego: Academic Press, 1994. 1275p. GAUSSIAN INC. Gaussian 03, Revision C.02, Wallingford CT, 2004. [Programa de Computador] GEARY, R. C. The contiguity ratio and statistical mapping. Incorporated Statistics, v.5, p.115-145, 1954. GETHER, U. Uncovering molecular mechanisms involved in activation of G-protein coupled receptors. Endocrine Reviews, v. 21, p. 90-113, 2000. GOPAL, S.; SCHROEDER, M.; PIEPER, U.; SCZYRBA, A.; AYTEKIN-KURBAN, G.; BEKIRANOV, S.; FAJARDO, J. E.; ESWAR, N.; SANCHEZ, R.; SALI, A.; GAASTERLAND, T. Homology-based annotation yields 1,042 new candidate genes in the Drosophila melanogaster genome. Nature Genetics, v. 27, p. 337-340, 2001. GOZLAN, H.; ELMESTIKAWY, S.; PICHAT, L.; GLOWINSKI, J.; HAMON, M. Identification of presynaptic serotonin autoreceptors using a new ligand: 3H-PAT. Nature, v. 305, p. 140-142, 1983. GRAMATICA, P. Principles of QSAR models validation: internal and external. QSAR and Combinatorial Science, v. 26, p. 694-701, 2007. GREER, J. Model for haptoglobin heavy chain based upon structural homology. Proceedings of the National Academy of Sciences of the United States of America, v. 77, p. 3393–3397, 1980. GRIEBEL, G. 5-HT1A receptor blockers as potential drug candidates for the treatment of anxiety disorders. Drug News and Perspectives, v. 12, p. 484-490, 1999.
Referências Bibliográficas 129
GROSS, C.; ZHUANG, X.; STARK, K.; RAMBOZ, S.; OOSTING, R.; KIRBY, L.; SANTARELLI, L.; BECK, S.; HEN, R. Serotonin1A receptor acts during development to establish normal anxiety-like behaviour in the adult. Nature, v. 416, p. 396-400, 2002. GUAN, X. M.; PEROUTKA, S. J.; KOBILKA, B. K. Identification of a single amino acid residue responsible for the binding of a class of betaadrenergic receptor antagonists to 5- hydroxytryptamine1A receptors. Molecular Pharmacology, v. 41, p. 695-698, 1992. GÜNER, O.F. History and Evolution of the Pharmacophore Concept in Computer-Aided Drug Design. Current Topics in Medicinal Chemistry, v.2, p.1321-1332, 2002. HEDBERG, M. H.; JANSEN, J. M.; NORDVALL, G.; HJORTH, S.; UNELIUS, L.; JOHANSSON, A. M. 10-substituted 11-oxygenated (R)-aporphines: synthesis, pharmacology, and modeling of 5-HT1A receptor interactions. Journal of Medicinal Chemistry, v. 39, p. 3491-3502, 1996. HEINRICH, T.; BÖTTCHER, H.; BARTOSZYK, G. D.; GREINER, H. E.; SEYFRIED, C. A.; VAN AMSTERDAM, C. Indolebutylamines as Selective 5-HT1A Agonists. Journal of Medicinal Chemistry, v.47, p.4677-4683, 2004. HEINRICH, T.; BÖTTCHER, H.; GERICKE, R.; BARTOSZYK, G. D.; ANZALI, S.; SEYFRIED, C. A.; GREINER, H. E.; VAN AMSTERDAM, C. Synthesis and Structure-Activity Relationship in a Class of Indolebutylpiperazines as Dual 5-HT1A Receptor Agonists and Serotonin Reuptake Inhibitors. Journal of Medicinal Chemistry, v.47, p.4684-4692, 2004. HERITAGE, T. W.; LOWIS, D. R. Molecular hologram QSAR. In: PARRILL, A. L., REDDY, M. R. (Eds.). Rational Drug Design: Novel methodology and practical applications. Washington: American Chemical Society, 1999. 400 p. HIGO, J.; GO, N. Algorithm for rapid calculation of excluded volume of large molecules. Journal of Computational Chemistry, v.10, p.376-379, 1989. HOLDEN, C. Future Brightening for Depression Treatments. Science, v.302, p.810-813, 2003. HOMAN, E. J.; WIKSTROM, H. V.; GROL, C. J. Molecular modeling of the dopamine D2 and serotonin 5-HT1A receptor binding modes of the enantiomers of 5-OMe-BPAT. Bioorganic and Medicinal Chemistry, v. 7, p. 1805-1820, 1999. HONÓRIO, K.M.; ANDRICOPULO, A.D. Two-dimensional quantitative structure-activity relationships: Hologram QSAR. In TAFT, C. A.; SILVA, C. H. T. P. (Eds.) Current methods in medicinal chemistry and biological physics, 2007, v.1, p. 49-60. HOYER, D., HANNON, J. P., AND MARTIN, G. R. Molecular, pharmacological and functional diversity of 5-HT receptors. Pharmacoly Biochemistry and Behavior, v. 71, p. 533-554, 2002. HYPERCUBE, HyperChem: Release 4.5 for Windows. Ontario, 1995. [Programa de Computador]
Referências Bibliográficas 130
INFOMETRIX INC. Pirouette 3.11. Woodinville, 2002. [Programa de Computador] INFOMETRIX INC. Pirouette: user’s guide. Woodinville, 2002. 430p. ITSKOWITZ, P.; TROPSHA, A. Kappa-nearest neighbors QSAR modeling as a variational problem: Theory and applications. Journal of Chemical Information and Modelling, v.45, p.777-785, 2005. JOHNSON, M. S.; SRINIVASAN, N.; SOWDHAMINI, R.; BLUNDELL, T. L. Knowledge-based protein modeling. Critical Reviews in Biochemistry and Molecular Biology, v. 29, p. 1-68, 1994. JONES, D. T. Protein Secondary Structure Prediction Based on Position-specific Scoring Matrices. Journal of Molecular Biology, v. 292, p. 195-202, 1999. JONES, D. T.; TAYLOR, W. R.; THORNTON, J. M. A new approach to protein fold recognition. Nature, v. 358, p. 86-89, 1992. JONES, G.; WILLETT, P.; GLEN, R.C. Molecular recognition of receptor sites using a genetic algorithm with a description of desolvation. Journal of Molecular Biology, v. 245, p. 43-53, 1995. JONES, G.; WILLETT, P.; GLEN, R.C.; LEACH, A.R.; TAYLOR, R. (1997) Development and validation of a genetic algorithm for flexible docking. Journal of Molecular Biology, v. 267, p. 727-748, 1997. JONES, T. A.; KLEYWEGT, G. J. CASP3 comparative modeling evaluation. Proteins, v. 37, p. 30-46, 1996. KARPLUS, K.; SJOLANDER, K.; BARRETT, C.; CLINE, M.; HAUSSLER, D.; HUGHEY, R.; HOLM, L.; SANDER, C. Predicting protein structure using hidden Markov models. Proteins. Suplemento 1, p. 134-139, 1997. KATRITZKY, A. R.; KARELSON, M.; PETRUKHIN, R. CODESSA [Programa de Computador] Florida, 2001. KIER, L.B.; HALL, L.H. Derivation and significance of valence molecular connectivity Journal of Pharmaceutical Sciences, v.70, p.583-589, 1981. KIRKPATRICK, S.; GELATT, C.D.; VECCHI, M.P. Optimization By Simulated Annealing. Science, v. 220, p. 671-680, 1983. KITCHEN, D. B.; DECORNEZ, H.; FURR, J. R.; BAJORATH, J. Docking and scoring in virtual screening for drug discovery: methods and applications. Nature Reviews in Drug Discovery, v. 3, p. 935-948, 2004. KLEBE, G.; ABRAHAM, U.; MIETZNER, T. Molecular similarity indices in a comparative analysis (CoMSIA) of drug molecules to correlate and predict their biological activity. Journal of Medicinal Chemistry, v.37, p.4130-4146, 1994.
Referências Bibliográficas 131
KOBILKA, B. K.; FRIELLE, T.; COLLINS, S.; YANG-FENG, T.; KOBILKA, T. S.; FRANCKE, U.; LEFKOWITZ, R. J.; CARON, M. G. An intronless gene encoding a potential member of the family of receptors coupled to guanine nucleotide regulatory proteins. Nature, v. 329, p. 75-79, 1987. KOHAVI, R.; JOHN, G. Wrappers for feature subset selection. Artificial Intelligence , v.97, p.273-324, 1997. KORETKE, K. K., RUSSELL, R. B.; COPLEY, R. R.; LUPAS, A. N. Fold recognition using sequence and secondary structure information. Proteins, v. 37, p. 141-148, 1999. KOSTANTINOVA, E. V. The Discrimination Ability of Some Topological and Information Distance Indices for Graphs of Unbranched Hexagonal Systems. Journal of Chemical Information and Computer Science, v.36, p.54-57, 1996. KRISTIANSEN, K. Molecular mechanisms of ligand binding, signaling, and regulation within the superfamily of Gprotein-coupled receptors: molecular modeling and mutagenesis approaches to receptor structure and function. Pharmacology and Therapeutics, v.103, p. 21-80, 2004. KUBINYI, H. QSAR: Hansch analysis and related approaches. New York: VCH, 1993. 240p. KUIPERS, W.; VAN WIJNGAARDEN, I.; KRUSE, C. G.; TER HORST-VAN AMSTEL, M.; TULP, M. T.; IJZERMAN, A. P. N4-unsubstituted N1-arylpiperazines as high-affinity 5-HT1A receptor ligands. Journal of Medicinal Chemistry, v. 38, p. 1942-1954, 1995. LABUTE, P. A widely applicable set of descriptors. Journal of Molecular Graphics and Modelling, v.18, p.464-477, 2000. LASKOWSKI, R.A., MACARTHUR, M.W., MOSS, D.S.; THORNTON, J.M. Procheck - A Program To Check The Stereochemical Quality Of Protein Structures. Journal Of Applied Crystallography, v. 26, p. 283-291, 1993. LEFKOWITZ, R., COTECCHIA, S., SAMAMA, P. AND COSTA, T., Constitutive activity of receptors coupled to guanine nucleotide regulatory proteins. Trends in Pharmacological Science, v. 14, p. 303–307, 1993. LEMMEN, C.; LENGAUER, T. Computational methods for the structural alignment of molecules. Journal of Computer-Aided Molecular Design, v.14, p.215-232, 2000. LIAPAKIS, G.; BALLESTEROS, J. A.; PAPACHRISTOU, S.; CHAN, W. C.; CHEN, X.; JAVITCH, J. A. The forgotten serine. A critical role for Ser-2035.42 in ligand binding to and activation of the beta 2-adrenergic receptor. Journal of Biological Chemistry, v. 275, p. 37779-37788, 2000. LIN, T.-H.; LI, H.-T.; TSAI, K.-C. Implementing the Fisher's discriminant ratio in a k-means clustering algorithm for feature selection and data set trimming. Journal of Chemical Information and Computer Science, v.44, p.76-87, 2004.
Referências Bibliográficas 132
LOPEZ-RODRIGUEZ, M. L.; AYALA, D.; BENHAMU, B.; MORCILLO, M. J.; VISO, A. Arylpiperazine derivatives acting at 5-HT(1A) receptors. Current Medicinal Chemistry , v. 9, p. 443-469, 2002. LÓPEZ-RODRÍGUEZ, M. L.; AYALA, D.; VISO, A.; BENHAMÚ, B.; FERNÁNDEZ DE LA PRADILLA, R.; ZARZA, F.; RAMOS, J. A. Synthesis and Structure-Activity Relationships of a New Model of Arylpiperazines. 7. Study of the Influence of Lipophilic Factors at the Terminal Amide Fragment on 5-HT1A Affinity/Selectivity. Bioorganic and Medicinal Chemistry, v.12, p.1551-1557, 2004. LÓPEZ-RODRÍGUEZ, M. L.; MORCILLO, M. J.; FERNÁNDEZ, E.; BENHAMÚ, B.; TEJADA, I.; AYALA, D.; VISO, A.; CAMPILLO, M.; PARDO, L.; DELGADO, M.; MANZANARES, J.; FUENTES, J. A. Synthesis and Structure-Activity Relationships of a New Model of Arylpiperazines. 8.1 Computational Simulation of Ligand-Receptor Interaction of 5-HT1AR Agonists with Selectivity over r1-Adrenoceptors. Journal of Medicinal Chemistry, v.48, p.2548-2558, 2005. LÓPEZ -RODRÍGUEZ, M. L.; MORCILLO, M. J.; FERNÁNDEZ, E.; PORRAS, E.; MURCIA, M.; SANZ, A. M.; ORENSANZ, L. Synthesis and Structure-Activity Relationships of a New Model of Arylpiperazines. 3. 2-[ö-(4-Arylpiperazin-1-yl)alkyl]perhydropyrrolo-[1,2-c]imidazoles and -perhydroimidazo[1,5-a]pyridines: Study of the Influence of the Terminal Amide Fragment on 5-HT1A Affinity/Selectivity. Journal of Medicinal Chemistry, v.40, p.2653-2656, 1997. LÓPEZ-RODRÍGUEZ, M. L.; MORCILLO, M. J.; FERNÁNDEZ, E.; PORRAS, E.; ORENSANZ, L.; BENEYTEZ, M. E.; MANZANARES, J.; FUENTES, J. A. Synthesis and Structure-Activity Relationships of a New Model of Arylpiperazines. 5. Study of the Physicochemical Influence of the Pharmacophore on 5-HT1A/R1-Adrenergic Receptor Affinity. Synthesis of a New Selective Derivative with Mixed 5-HT1A/D2 Antagonist Properties. Journal of Medicinal Chemistry, v.44, p.186-197, 2001. LÓPEZ-RODRÍGUEZ, M. L.; MORCILLO, M. J.; FERNÁNDEZ, E.; ROSADO, M. L.; PARDO, L.; SCHAPER, K.-J. Synthesis and Structure-Activity Relationships of a New Model of Arylpiperazines. 6. Study of the 5-HT1A/r1-Adrenergic Receptor Affinity by Classical Hansch Analysis, Artificial Neural Networks, and Computational Simulation of Ligand Recognition. Journal of Medicinal Chemistry, v.44, p.198-207, 2001. LÓPEZ -RODRÍGUEZ, M. L.; MORCILLO, M. J.; ROVAT, T. K.; FERNÁNDEZ, E.; VICENTE, B.; SANZ, A. M.; HERNÁNDEZ, M. Synthesis and Structure-Activity Relationships of a New Model of Arylpiperazines. 4. 1-[ö-(4-Arylpiperazin-1-yl)alkyl]-3-(diphenylmethylene)-2,5-pyrrolidinediones and -3-(9H-fluoren-9-ylidene)-2,5-pyrrolidinediones: Study of the Steric Requirements of the Terminal Amide Fragment on 5-HT1A Affinity/Selectivity. Journal of Medicinal Chemistry, v.42, p.36-49, 1999. LÓPEZ -RODRÍGUEZ, M. L.; ROSADO, M. L.; BENHAMU, B.; MORCILLO, M. J.; FERNÁNDEZ, E.; SCHAPER, K.-J. Synthesis and Structure- Activity Relationships of a New Model of Arylpiperazines. 2. Three-Dimensional Quantitative Structure-Activity Relationships of Hydantoin-Phenylpiperazine Derivatives with Affinity for 5-HT1A and R1 Receptors. A Comparison of CoMFA Models. Journal of Medicinal Chemistry, v.40, p.1648-1656, 1997.
Referências Bibliográficas 133
LÓPEZ-RODRÍGUEZ, M. L.; ROSADO, M. L.; BENHAMU, B.; MORCILLO, M. J.; SANZ, A. M.; ORENSANZ, L.; BENEITEZ, M. E.; FUENTES, J. A.; MANZANARES , J. Synthesis and Structure-Activity Relationships of a New Model of Arylpiperazines. 1. 2-[[4-(o-Methoxyphenyl)piperazin-1-yl]methyl]-1,3-dioxoperhydroimidazo[1,5-a]pyridine: A Selective 5-HT1A Receptor Agonist. Journal of Medicinal Chemistry, v.39, p.4439-4450, 1996. LOVELL, S. C.; DAVIS, I. W.; ARENDALL III, W. B.; DE BAKKER, P. I.; WORD, J.M; PRISANT, M. G.; RICHARDSON, J. S.; RICHARDSON, D. C. Structure validation by Calpha geometry: phi,psi and Cbeta deviation. Proteins: Structure, Function & Genetics. v. 50, p. 437-450, 2002. LOVELL, S. C.; WORD, J. M.; RICHARDSON, J. S.; RICHARDSON, D. C. The penultimate rotamer library. Proteins, v. 40, p. 389-408, 2000. LOWIS, D. R. HQSAR: a new, highly predictive QSAR technique. Tripos Technical Notes. v.1. Disponível em: http://www.tripos.com/data/SYBYL/HQSAR_Application_Note_072605.pdf MARTÍNEZ-ESPARZA, J.; OFICIALDEGUI, A. M.; PÉREZ-SILANES, S.; HERAS, B.; ORÚS, L.; PALOP, J. A.; LASHERAS, B.; ROCA, J.; MOURELLE, M.; BOSCH, A.; DEL CASTILLO, J. C.; TORDERA, R.; DEL RIO, J.; MONGE, A. New 1-Aryl-3-(4-arylpiperazin-1-yl)propane Derivatives, with Dual Action at 5-HT1A Serotonin Receptors and Serotonin Transporter, as a New Class of Antidepressants. Journal of Medicinal Chemistry, v.44, p.418-428, 2001. MENZIANI, M. C.; DE BENEDETTI, P. G.; KARELSON, M. Theoretical Descriptors in Quantitative Structure-Affinity and Selectivity Relationship Study of Potent N4-Substituted Arylpiperazine 5-HT1A Receptor Antagonists. Bioorganic and Medicinal Chemistry, v.6, p.535-550, 1998. MERKWIRTH, C.; MAUSER, H.; SCHULZ-GASCH, T.; ROCHE, O.; STAHL, M.; LENGAUER, T. Ensemble methods for classification in cheminformatics. Journal of Chemical Information and Computer Science, v.44, p.1971-1978, 2004. MIZUGUCHI, K.; DEANE, C. M.; BLUNDELL, T. L.; JOHNSON, M. S.; OVERINGTON, J. P. JOY: Protein sequence-structure representation and analysis. Bioinformatics, v. 14, p. 617-623, 1998. MONTALVÃO, R. W. Protein structure prediction: differential geometry of proteins and comparative modelling. 2005. Tese (Doutorado) - Universidade de Cambridge, Cambridge, 2005. MONTALVÃO, R. W.; SMITH, R. E.; LOVELL, S. C.; BLUNDELL, T. L. CHORAL: a differential geometry approach to the prediction of the cores of protein structures. Bioinformatics, v. 21, n. 19, p. 3719–3725, 2005. MORAN, P. A. P. Notes on continuous stochastic phenomena. Biometrika, v.37, p.17-23, 1950.
Referências Bibliográficas 134
MOULT, J. Predicting protein three-dimensional structure. Current Opinion in Biotechnology, v. 10, p. 583-588, 1999. MURPHY, D. L.,WICHEMS, C., LI, Q., AND HEILS, A. Molecular manipulations as tools for enhancing our understanding of 5-HT neurotransmission. Trends in Pharmacological Science, v. 20, p. 246-252, 1999. NATIONAL INSTITUTE OF MENTAL HEALTH. Depression. Bethesda (MD): National Institute of Mental Health, National Institutes of Health, US, 2002, 25 p. Disponível em: http://www.nimh.nih.gov/publicat/depression.cfm NOWAK, M.; KOŁACZKOWSKI, M.; PAWŁOWSKI, M.; BOJARSKI, A. J. Homology Modeling of the Serotonin 5-HT1A Receptor Using Automated Docking of Bioactive Compounds with Defined Geometry. Journal of Medicinal Chemistry, v. 49, p. 205-214, 2006. OFICIALDEGUI, A.M.; MARTINEZ, J.; PÉREZ, S.; HERAS, B.; IRURZUN, M.; PALOP, J.A.; TORDERA, R.; LASHERAS, B.; DEL RIO, J.; MONGE, A. Design, synthesis and biological evaluation of new 3-[(4-aryl)piperazin-1-yl]-1-arylpropane derivatives as potential antidepressants with a dual mode of action: serotonin reuptake inhibition and 5-HT1A receptor antagonism. Il Farmaco, v.55, p.345-353, 2000. OH, S. J.; HA, H.-J.; CHI, D. Y.; LEE, H. K. Serotonin Receptor and Transporter Ligands - Current Status. Current Medicinal Chemistry, v.8, p.999-1034, 2001. OKADA, T.; SUGIHARA, M.; BONDAR, A.N.; ELSTNER, M.; ENTEL, P.; BUSS, V. The retinal conformation and its environment in rhodopsin in light of a new 2.2 A crystal structure. Journal of Molecular Biology, v. 342, p. 571-583, 2004. ORÚS, L.; PÉREZ-SILANES, S.; OFICIALDEGUI, A. M.; MARTÍNEZ-ESPARZA, J.; DEL CASTILLO, J. C.; MOURELLE, M.; LANGER, T.; GUCCIONE, S.; DONZELLA, G.; KROVAT, E. M.; POPTODOROV, K.; LASHERAS, B.; BALLAZ, S.; HERVÍAZ, I.; TORDERA, R.; DEL RIO, J.; MONGE, A. Synthesis and Molecular Modeling of New 1-Aryl-3-[4-arylpiperazin-1-yl]-1-propane Derivatives with High Affinity at the Serotonin Transporter and at 5-HT1A Receptors. Journal of Medicinal Chemistry, v.45, p.4128-4139, 2002. PALCZEWSKI, K.; KUMASAKA, T.; HORI, T.; BEHNKE, C. A.; MOTOSHIMA, H.; FOX, B. A.; LE, T. I.; TELLER, D. C.; OKADA, T.; STENKAMP, R. E.; YAMAMOTO, M.; MIYANO, M. Crystal structure of rhodopsin: A G protein-coupled receptor. Science, v. 289, p. 739-745, 2000. PANCHENKO, A.; MARCHLER-BAUER, A.; BRYANT, S.H. Threading with explicit models for evolutionary conservation of structure and sequence. Proteins, v. 37, p. 133-140, 1999. PASTOR, M.; CRUCIANI, G.; MCLAY, I.; PICKETT, S.; CLEMENTI, S. GRid-INdependent descriptors (GRIND): A novel class of alignment-independent three-dimensional molecular descriptors. Journal of Medicinal Chemistry, v.43, p.3233-3243, 2000.
Referências Bibliográficas 135
PATEL, Y.; GILLET, V. J.; BRAVI, G.; LEACH, A. R. A comparison of the pharmacophore identification programs: Catalyst, DISCO and GASP. Journal of Computer-Aided Molecular Design, v. 16, p. 653-681, 2002. PEARLMAN, R. S. Concord, Tripos Inc., St. Louis [Programa de Computador] PEARSON, W. R.; LIPMAN, D. J. Improved tools for biological sequence comparison. Proceedings of the National Academy of Sciences of the United States of America, v. 85, p. 2444-2448, 1988. PÉREZ-SILANES, S. P.; ORÚS, L.; OFICIALDEGUI, A. M.; ESPARZA, J. M.; LASHERAS, B.; DEL RÍO, J.; MONGE, A. New 3-[4-(2,3-dihydro-1,4-benzodioxin-5-yl)piperazin-1-yl]-1-(5-substitutedbenzo[b]thiophen-3-yl)propanol derivatives with dual action at 5-HT1A serotonin receptors and serotonin transporter as a new class of antidepressants. Pharmazie, v. 59, p.499-501, 2004. PIERCE, K. L.; PREMONT, R. T.; LEFKOWITZ, R. J. Seven-transmembrane receptors. Nature Reviews Molecular Cell Biology, v. 3, p. 639-650, 2002. PUCADYIL, T. J.; KALIPATNAPU, S.; CHATTOPADHYAY, A. The serotonin1A receptor: a representative member of the serotonin receptor family. Cellular and Molecular Neurobiology, v.25, p.553-580, 2005. RANDIC, M. Characterization of molecular branching. Journal of the American Chemical Society, v.97, p.6609-6615, 1975. RASMUSSEN, S. G. F.; CHOI1, H.-J.; ROSENBAUM, D. M.; KOBILKA, T. S.; THIAN, F. S.; EDWARDS, P. C.; BURGHAMMER, M.; RATNALA, V. R. P.; SANISHVILI, R.; FISCHETTI, R. F.; SCHERTLER, G. F. X.; WEIS, W. I.; KOBILKA, B. K. Crystal structure of the human 2 adrenergic G-protein-coupled receptor. Nature, v. 450, p. 383-387, 2007. RAYCHAUDHURY, C.; S. RAY, K.; GOSH, J. J.; ROY, A. B.; BASAK, S. C. Discrimination of isomeric structures using information theoretic topological indexes. Journal of Computational Chemistry, v.5, p.581-588, 1984. RAYMOND, J. R.; MUKHIN, Y. V.; GETTYS, T. W.; GARNOVSKAYA, M. N. The recombinant 5-HT1A receptor: G protein coupling and signaling pathways. British Journal of Pharmacology, v. 127, p. 1751-1764, 1999. RICHMOND, N. J.; ABRAMS, C. A.; WOLOHAN, P. R.; ABRAHAMIAN, E.; WILLETT, P.; CLARK, R. D. GALAHAD: 1. Pharmacophore identification by hypermolecular alignment of ligands in 3D. Journal of Computer-Aided Molecular Design, v. 20, p. 567-587, 2006. ROMEIRO, L. A. S.; FRAGA, C. A. M.; BARREIRO, E. J. Novas estratégias terapêuticas para o tratamento da depressão: uma visão da química medicinal. Química Nova, v.26, p.347-358, 2003.
Referências Bibliográficas 136
RUBENSTEIN, L. A.; LANZARA, R. G. Activation of G protein-coupled receptors entails cysteine modulation of agonist binding. Journal of Molecular Structure (Theochem), v. 430: p. 57–71, 1998. SALI, A.; BLUNDELL, T. L. Definition of general topological equivalence in protein structures. A procedure involving comparison of properties and relationships through simulated annealing and dynamic programming. Journal of Molecular Biology, v. 212, p. 403-428, 1990. SCHULTZ, H.P. Topological organic-chemistry. 1. Graph-theory and topological indexes of alkanes. Journal of Chemical Information and Computer Science, v.29, p.227-222, 1989. SEEBER, M.; DE BENEDETTI, P. G.; FANELLI, F. Molecular dynamics simulations of the ligand-induced chemical information transfer in the 5-HT1A receptor. Journal of Chemical Information and Computer Science, v. 43, p. 1520-1531, 2003. SHARAF, M.A.; ILLMAN, D. L.; KOWALSKI, B. R. Chemometrics. New York: Wiley, 1986, 357p. SHARP, T.; UMBERS, V.; GARTSIDE, S. Effect of a selective 5-HT reuptake inhibitor in combination with 5-HT1A and 5-HT1B receptor antagonists on extracellular 5-HT in rat frontal cortex in vivo. British Journal of Pharmacology, v.121, p.941-946, 1997. SHEPPHIRD, J. K.; CLARK, R. D. A marriage made in torsional space: using GALAHAD models to drive pharmacophore multiplet searches. Journal of Computer-Aided Molecular Design, v. 20, p. 763-771, 2006. SHI, J.; BLUNDELL, T. L.; MIZUGUCHI, K. FUGUE: sequence-structure homology recognition using environment-specific substitution tables and structure-dependent gap penalties. Journal of Molecular Biology, v. 310, p. 243-257, 2001. SIEDLECKI, W.; SKLANSKY, J. On automatic feature selection. International Journal of Pattern Recognition and Artificial Intelligence, v.2, p.197-220, 1988. SILVERMAN, R.B. The organic chemistry of drug design and drug action. San Diego: Academic Press, 1992. 358p. SINGH, J. K.; CHROMY, B. A.; BOYERS, M. J.; DAWSON, G.; BANERJEE, P. Induction of the serotonin1A receptor in neuronal cells during prolonged stress and degeneration. Journal of Neurochemistry, v. 66, p. 2361-2372, 1996. SMITH, R. E.; LOVELL, S. C.; BURKE, D. F.; MONTALVÃO, R. W.; BLUNDELL, T. L. Andante: reducing side-chain rotamer search space during comparative modeling using environment-specific substitution probabilities. Bioinformatics, v. 23, n. 9, p. 1099-1105, 2007. SMITH, T. F.; WATERMAN, M. S. Identification of common molecular subsequences. Journal of Molecular Biology, v. 147, p. 195-197, 1981.
Referências Bibliográficas 137
SRINIVASAN, N.; BLUNDELL, T. L. An evaluation of the performance of an automated procedure for comparative modeling of protein tertiary structure. Protein Engineering, v. 6, p. 501-512, 1993. STERNBERG, M. J. E. Protein structure prediction. Oxford: Oxford University Press, 1996. 298 p. STRADER, C. D.; CANDELORE, M. R.; HILL, W. S.; DIXON, R. A.; SIGAL, I. S. A single amino acid substitution in the beta-adrenergic receptor promotes partial agonist activity from antagonists. Journal of Biological Chemistry, v. 264, p. 16470-16477, 1989. STRADER, C. D.; SIGAL, I. S.; CANDELORE, M. R.; RANDS, E.; HILL, W. S.; DIXON, R. A. Conserved aspartic acid residues 79 and 113 of the beta-adrenergic receptor have different roles in receptor function. Journal of Biological Chemistry, v. 263, p. 10267-10271, 1988. SYLTE, I.; CHILMONCZYK, Z.; DAHL, S. G.; CYBULSKI, J.; EDVARDSEN, O. The ligand-binding site of buspirone analogues at the 5-HT1A receptor. Journal of Pharmacy and Pharmacology, v. 49, p. 698-705, 1997. SYLTE, I.; EDVARDSEN, O.; DAHL, S. G. Molecular dynamics of the 5-HT1a receptor and ligands. Protein Engineering, v. 6, p. 691-700, 1993. THEODORIDIS, S.; KOUTROUMBAS, K. Pattern recognition. London: Academic Press, 1998. 837 p. THIEL, K. A. Structure-aided drug design's next generation. Nature Biotechnology, v. 22, p. 513-519, 2004. TODESCHINI, R.; CONSONNI, V.; PAVAN, M. Dragon 2.1. Milano, 2002. [Programa de Computador] TODESCHINI, R.; GRAMATICA, P. New 3D molecular descriptors: The WHIM theory and QSAR applications. Perspectives in Drug Discovery and Design, v.9-11, p.355-380, 1998. TODESCHINI, R.; LASAGNI, M.; MARENGO, E. New molecular descriptors for 2D and 3D structures - theory. Journal of Chemometrics, v.8, p.263-272, 1994. TRIPOS INC. SYBYL 7.2 St. Louis [Programa de Computador] TRIPOS INC. SYBYL 7.3 St. Louis [Programa de Computador] TROPSHA, A. Application of predictive QSAR Models to Database Mining. In OPREA, T. (Ed.). Chemoinformatics in Drug Discovery, Weinheim: Wiley-VCH, 2005. TRUMPP-KALLMEYER, S.; HOFLACK, J.; BRUINVELS, A.; HIBERT, M. Modeling of G-protein-coupled receptors: application to dopamine, adrenaline, serotonin, acetylcholine, and mammalian opsin receptors. Journal of Medicinal Chemistry, v. 35, p. 3448-3462, 1992.
Referências Bibliográficas 138
VAN DE WATERBEEMD, H.; ROSE, S. Quantitative approaches to structure-activity relationships. In: WERMUTH, C. G. (Ed.). The practice of medicinal chemistry. 2.ed. London: Elsevier Academic Press, 2003. WEBER, K.C.; DA SILVA, A.B.F. A chemometric study of the 5-HT1A receptor affinities presented by arylpiperazine compounds. European Journal of Medicinal Chemistry, v. 43, p. 364-372, 2008. WEBER, K. C.; HONÓRIO, K. M.; ANDRICOPULO, A. D.; DA SILVA, A. B. F. Two-dimensional QSAR studies on arylpiperazines as high-affinity 5-HT1A receptor ligands. Medicinal Chemistry, 2008. No prelo. WOLD, S.; ERIKSSON, L. Statistical validation of QSAR results. In VAN DER WATERBEEMD, H. (Ed.). Chemometric methods in molecular design, Weinheim: Wiley-VCH, 1995. p. 309-318. WOLD, S.; SJOSTROM, M.; ERIKSSON, L. PLS-regression: a basic tool of chemometrics. Chemometrics and Intelligent Laboratory Systems, v.58, p.109–130, 2001. WONG, M.-L.; LICINIO, J. From monoamines to genomic targets: a paradigm shift for drug discovery in depression. Nature Reviews Drug Discovery, v.3, p.136-150, 2004. WONG, M.-L.; LICINIO, J. Research and treatment approaches to depression. Nature Reviews Neuroscience, v.2, p.343-351, 2001. WORLD HEALTH ORGANIZATION. Depression. 2005. Disponível em: http://www.who.int/mental_health ZHANG, H.; LAI, L.; WANG, L.; HAN, Y.; TANG, Y. A fast and efficient program for modeling protein loops. Biopolymers, v. 41, p. 61-72, 1997. ZLATOVIC, M. V.; SUKALOVIC, V. V.; SCHNEIDERC, C.; ROGLIC, G. M. Interaction of arylpiperazine ligands with the hydrophobic part of the 5-HT1A receptor binding site. Bioorganic and Medicinal Chemistry, v. 14, p. 2994–3001, 2006.