modelagem molecular de compostos arilpiperazínicos e suas

KAREN CACILDA WEBER

MODELAGEM MOLECULAR DE COMPOSTOS ARILPIPERAZÍNICOS E SUAS INTERAÇÕES

COM O RECEPTOR 5-HT1A

Tese apresentada ao Instituto de Química de São Carlos da Universidade de São Paulo para obtenção do título de Doutor em Ciências (Físico-Química). Orientador: Prof. Dr. Albérico B. F. da Silva

São Carlos 2008

Aos meus pais, Paulo e Noemi, com amor.

AGRADECIMENTOS Ao Prof. Albérico, pela orientação, amizade, incentivo e, principalmente, por seus valiosos ensinamentos ao longo de toda a minha pós-graduação. Ao Prof. Adriano D. Andricopulo, por ceder gentilmente os recursos para a realização de parte dos estudos de QSAR. Ao Prof. Sir Tom L. Blundell, por me receber em seu laboratório na Universidade de Cambridge para a realização do estágio no exterior. Ao Dr. Rinaldo W. Montalvão, pelo auxílio com a modelagem do receptor, por toda sua paciência e seus ensinamentos, e à sua esposa, Lis, por terem me acolhido tão amavelmente em Cambridge. À Profa. Káthia M. Honório e às queridas colegas Alícia P. Higueruelo e Lívia B. Sallum, pelo auxílio com os aspectos práticos dos métodos computacionais e pelas importantes discussões sobre o trabalho. Aos professores e funcionários do IQSC, especialmente ao pessoal da Química Estrutural (Vânia, Shirlei e Joel), ao pessoal da Seção Técnica de Informática (Ângelo, Flávio, Irineu e Talhati) e às meninas do Serviço de Pós-Graduação (Sílvia e Andréia). Aos meus familiares, especialmente ao meu irmão, Paulo Jr., pelo apoio e compreensão ao longo de todos esses anos. A todos os amigos que estiveram ao meu lado durante o doutorado, contribuindo com uma palavra de incentivo, um abraço ou um almoço no domingo: Agnaldo, Aline, André, Andressa, Carlise, Chicão, Corinne, Dai, Diógenes, Fábio, Ednilsom, Fernando, Gelita, Hugão, Ivanete, Janinha, Joelmir, Josmar, Kathy, Leo, Lia, Lu, Lucas-Bleicher, Manu, Marcello, Márcio, Marlise, Maurão, Melissa, Milena, Natália, Nathália, Nayara, Paulinha, Rachell, Rodrigo, Sandra, Sânia, Sherlan, Sid, Simon, Soninha, Talita, Tatá, Tiago, Titi e Zilda. À CAPES, pela bolsa de estágio no exterior. À FAPESP, pela bolsa de doutorado.

RESUMO

Os inibidores seletivos da recaptação de serotonina (ISRSs) representam a classe mais

importante de antidepressivos em uso clínico atualmente. Entretanto, esses medicamentos

costumam levar de duas a seis semanas para apresentar os efeitos de sua ação terapêutica.

Estudos clínicos mostram que quando um antagonista do receptor 5-HT1A é administrado

juntamente com um ISRS, um aumento da concentração extracelular de serotonina é

observado nas áreas terminais dos neurônios. Assim, a combinação de um antagonista do

receptor 5-HT1A com um ISRS pode acelerar o início da ação antidepressiva, aumentando a

eficácia do tratamento farmacológico da depressão. A classe mais importante de ligantes do

receptor 5-HT1A são os compostos arilpiperazínicos. O presente estudo teve como objetivo o

entendimento das características importantes para as interações entre uma série de compostos

arilpiperazínicos com o receptor 5-HT1A. Para tal, foram realizados estudos de Relação

Quantitativa entre Estrutura e Atividade (QSAR) bi- e tridimensionais, empregando as

seguintes abordagens: métodos quimiométricos baseados em descritores teóricos, QSAR por

hologramas (HQSAR) e o método de Análise Comparativa de Campos Moleculares

(CoMFA). Essas análises foram complementadas com a modelagem por homologia do

receptor 5-HT1A e com estudos de docking ligante-receptor realizados para alguns compostos

arilpiperazínicos. Modelos de QSAR com boa consistência interna, habilidade preditiva e

estabilidade foram obtidos em todos os casos. Os modos de interação observados

apresentaram consistência com dados experimentais disponíveis sobre os resíduos

importantes para as interações com ligantes arilpiperazínicos. Os principais resultados

indicaram algumas características dos ligantes que são importantes para a afinidade pelo

receptor 5-HT1A, tais como a presença de um anel benzotiofeno como substituinte Ar2,

substituintes pouco volumosos na posição Z e receptores de ligações de hidrogênio na posição

orto do anel Ar1. Esses resultados foram corroborados pelo estudo das interações com o

modelo do receptor 5-HT1A, que indicou uma importante interação hidrofóbica do grupo

benzotiofeno com o resíduo Trp6.48 do receptor, assim como uma ligação de hidrogênio entre

a hidroxila na posição Z e o resíduo Thr3.37 e, ainda, entre o oxigênio do anel Ar1 e o resíduo

Asn7.39. As informações obtidas neste estudo podem fornecer subsídios para o planejamento

de novos ligantes com afinidade pelo receptor 5-HT1A.

ABSTRACT

Selective serotonin reuptake inhibitors (SSRIs) are the most important class of

antidepressants in current clinical use. However, they present the serious drawback of a delay

of two to six weeks in the onset of therapeutic effect. Clinical studies have shown that when a

5-HT1A receptor antagonist is administrated along with a SSRI, an increase of extracellular

serotonin concentration in neuronal terminal areas is observed. Thus, the combination of a 5-

HT1A receptor antagonist and a SSRI could accelerate the onset of antidepressant action,

improving the pharmacological treatment of depression. The most important class of 5-HT1A

receptor ligands are arylpiperazine compounds. In the present study, our aim was to

understand the main features of the interaction between a series of arylpiperazines and the 5-

HT1A receptor. Bi- and Tridimensional Quantitative Structure-Activity Relationship (QSAR)

studies were conducted employing the following approaches: chemometric methods based on

theoretical descriptors, Hologram QSAR (HQSAR), and Comparative Molecular Field

Analysis (CoMFA). These analyses were complemented by 5-HT1A receptor homology

modeling and ligand-receptor docking studies. QSAR models presenting good internal

consistency, predictive power and stability were obtained in all cases. The observed binding

modes are consistent with available experimental data on residues considered crucial for

interactions with arylpiperazine compounds. The main results have indicated some important

features for optimal binding to the 5-HT1A receptor, such as the presence of a benzothiophene

ring as Ar2 substituent, small groups at position Z and hydrogen bond acceptors at the ortho

position of Ar1 ring. These results were corroborated by modeling the interactions with the 5-

HT1A receptor, which has indicated an important hydrophobic interaction between the

benzothiophene group and residue Trp6.48, a hydrogen bond between the OH group at

position Z and residue Thr3.37, as well as between the oxygen in Ar1 and residue Asn7.39.

The information gathered in these studies can be useful for the design of new ligands

displaying affinity to the 5-HT1A receptor.

LISTA DE FIGURAS Figura 1 - Exemplos de medicamentos antidepressivos das classes IMAO, ATC e ISRS......18 Figura 2 - Estrutura química do pindolol, o primeiro antagonista do receptor 5-HT1A

conhecido..................................................................................................................................19 Figura 3 - (a) estrutura geral das arilpiperazinas; (b) buspirona; (c) NAN-190; (d) WAY 100635; (e) flesinoxan..............................................................................................................35 Figura 4 - Estrutura geral dos compostos sintetizados inicialmente por Oficialdegui et al....37 Figura 5 - Estrutura geral dos compostos das séries I, II, III e IV de Martinez-Esparza et al...............................................................................................................................................38 Figura 6 - Compostos sintetizados por Martinez-Esparza et al. com afinidades mais altas....38 Figura 7 - Compostos com melhores resultados sintetizados por Pérez-Silanes et al.............39 Figura 8 - (a) Estrutura geral dos compostos indolbutilpiperazínicos sintetizados por Heinrich et al.; (b) estrutura da vilazodona.............................................................................................40 Figura 9 - Mapa de Ramachandran para a rodopsina bovina..................................................50 Figura 10 - Dendrograma para os compostos do conjunto de treinamento, obtido com a conexão incremental.................................................................................................................68 Figura 11 - Gráfico de escores de PC2 versus PC1 para os compostos do conjunto de treinamento...............................................................................................................................70 Figura 12 - Gráfico de escores para a predição feita pelo PCA para os compostos do conjunto de teste......................................................................................................................................72 Figura 13 - Distâncias dos compostos às classes obtidas para o conjunto de treinamento.....76 Figura 14 - Valores de pKi preditos versus experimentais para a regressão PLS obtida com 6 componentes principais, mostrando os compostos dos conjuntos de treinamento e teste........79 Figura 15 - Valores de pKi preditos versus experimentais para o conjunto de treinamento e para o conjunto de teste resultantes do modelo HQSAR..........................................................90 Figura 16 - Contribuições atômicas para a afinidade pelo receptor 5-HT1A do composto com maior afinidade do conjunto de dados (65).....................................................................92 Figura 17 - (a) Características farmacofóricas usadas para o alinhamento das estruturas do conjunto de dados e (b) alinhamento estrutural das moléculas do conjunto de treinamento..101 Figura 18 - Valores de pKi preditos versus experimentais para o conjunto de treinamento e para o conjunto de teste resultantes do modelo CoMFA........................................................103

Figura 19 - Mapas de contorno (a) estéricos e (b) eletrostáticos para o composto com maior afinidade pelo receptor 5-HT1A do conjunto de dados............................................................104 Figura 20 - Estrutura geral dos compostos em estudo e estruturas dos ligantes empregados no estudo de docking....................................................................................................................109 Figura 21 - Alinhamento das seqüências do receptor 5-HT1A e da rodopsina bovina (código 1u19 no PDB) obtido com o programa FUGUE, com a anotação da proteína-molde no formato JOY e a representação da estrutura secundária predita pelo PSIPRED para o receptor 5-HT1A.....................................................................................................................................111 Figura 22 - Representação das HTMs do modelo obtido......................................................113 Figura 23 - Mapa de Ramachandran do modelo obtido mostrando as regiões favoráveis (cores escuras), permitidas (cores claras) e desfavoráveis (branco)..................................................114 Figura 24 - (a) Localização dos resíduos cruciais para a interação com os ligantes nas HTMs e (b) Posicionamento dos ligantes nas HTMs.........................................................................116 Figura 25 - Interações específicas entre os ligantes 1 e 2 e o modelo do receptor 5-HT1A...117 Figura 26 - Interações específicas entre os ligantes 3 e 4 e o modelo do receptor 5-HT1A...118

LISTA DE TABELAS Tabela 1 - Estruturas químicas e valores de pKi dos compostos do conjunto de treinamento.61 Tabela 2 - Estruturas e valores de pKi dos compostos do conjunto de teste............................62 Tabela 3 - Descritores selecionados e suas definições.............................................................65 Tabela 4 - Loadings das variáveis em cada PC........................................................................71 Tabela 5 - Sumário da classificação KNN para os compostos do conjunto de treinamento....74 Tabela 6 - Porcentagem de variância, PRESS, q2 e r2.............................................................78 Tabela 7 - Resíduos de predição para o conjunto de teste.......................................................80 Tabela 8 - Estruturas químicas e valores de Ki para os compostos em estudo ........................84 Tabela 9 - Resultados da análise HQSAR utilizando vários tipos de fragmentos, com o tamanho de fragmento padrão 4 - 7 ..........................................................................................89 Tabela 10 - Resultados da análise HQSAR variando o tamanho de fragmento, com a combinação A/B/C/Ch/DA.......................................................................................................90 Tabela 11 - Resíduos de predição para os compostos do conjunto de teste.............................91 Tabela 12 - Estruturas químicas e valores de Ki para os compostos em estudo.......................95 Tabela 13 - Parâmetros estatísticos obtidos nas análises PLS para o modelo CoMFA…….101 Tabela 14 - Resíduos de predição para os compostos do conjunto de teste...........................102 Tabela 15 - Notação do formato JOY....................................................................................110

SUMÁRIO 1 INTRODUÇÃO 12 1.1 A Depressão e a Hipótese Monoaminérgica 13 1.2 A Serotonina e Seus Receptores 15 1.3 Os Antidepressivos 17

2 ESTUDOS DE QSAR 20 2.1 Requisitos do Conjunto de Dados 22 2.2 Cálculo de Descritores Moleculares 23 2.2.1 Descritores bidimensionais 25 2.2.2 Descritores tridimensionais 27 2.3 Seleção de Descritores Relevantes 30 2.4 Construção do Modelo de Relação Estrutura-Atividade 31 2.5 Validação dos Modelos de QSAR 32 2.6 Estudos de Relação Estrutura-Atividade dos Compostos Arilpiperazínicos 34

3 MODELAGEM MOLECULAR DE PROTEÍNAS 41 3.1 A Modelagem por Homologia 42 3.1.1 Identificação de moldes estruturais 43 3.1.2 Alinhamento da seqüência-alvo com a estrutura-molde 44 3.1.3 Construção do modelo 45 3.1.4 Validação do modelo 49 3.2 Docking ligante-receptor 51 3.3 Estudos de Modelagem do Receptor 5-HT1A e seus Ligantes 53

4 OBJETIVOS 58

5 METODOLOGIA 59

6 ESTUDO QUIMIOMÉTRICO DOS COMPOSTOS ARILPIPERAZÍNICO S 60 6.1 Procedimento Computacional 60 6.1.1 Otimização das geometrias e cálculo dos descritores moleculares 63 6.1.2 Seleção de descritores 63 6.1.3 Análises quimiométricas 65 6.2 Resultados e Discussão 66 6.2.1 Reconhecimento de padrões não-supervisionado 66 6.2.2 Reconhecimento de padrões supervisionado 73 6.2.3 Regressão PLS 77 6.3 Conclusões 81

7 HQSAR 83 7.1 Procedimento Computacional 83 7.2 Resultados e Discussão 88 7.3 Conclusões 93

8 QSAR 3D 94 8.1 Procedimento Computacional 94 8.2 Resultados e Discussão 100 8.3 Conclusões 105

9 MODELAGEM DO RECEPTOR 5-HT 1A 106 9.1 Procedimento Computacional 106 9.2 Resultados e Discussão 110 9.3 Conclusões 120 10 CONSIDERAÇÕES FINAIS 122 REFERÊNCIAS BIBLIOGRÁFICAS 124

1. Introdução 12

1. INTRODUÇÃO

Métodos de química computacional têm se tornado cada vez mais importantes para a

resolução de problemas da química medicinal. Desde as primeiras aplicações introduzidas nos

anos 60, quando computadores eram usados, por exemplo, para cálculos de orbitais

moleculares de Hückel, simulação de espectros de RMN e análises de Hansch de relação

estrutura-atividade, até os dias de hoje, as contribuições da química computacional para a

química medicinal vêm crescendo em importância e abrangência, especialmente graças ao

desenvolvimento da tecnologia computacional, em termos de velocidade e disponibilidade dos

computadores (BULTINCK et al., 2003).

A partir disso, as aplicações da química computacional evoluíram para o conceito de

quimioinformática, que pode ser definida como o conjunto de recursos computacionais e da

tecnologia de informação utilizado para transformar dados em informação e informação em

conhecimento, com o propósito de agilizar a tomada de decisões nos processos de

identificação e otimização de compostos protótipos (BROWN, 2005). As principais

contribuições da quimioinformática para o planejamento de fármacos incluem a criação de

bases de dados relacionados a compostos químicos, a triagem virtual de grandes coleções de

compostos com a finalidade de encontrar novas estruturas químicas com perfil farmacológico

único e a utilização de métodos modernos de QSAR que permitem o emprego de um número

maior de descritores da estrutura química das moléculas, combinados com a aplicação de

abordagens de otimização lineares e não-lineares e uma forte ênfase na validação rigorosa dos

modelos obtidos.

O presente trabalho consiste na aplicação de diversos métodos computacionais para o

estudo das afinidades pelo receptor 5-HT1A apresentadas por compostos arilpiperazínicos,

com vistas a sua utilização no tratamento da depressão, um transtorno de humor que afeta

1. Introdução 13

cerca de 120 milhões de pessoas em todo o mundo, segundo dados da Organização Mundial

da Saúde. Segue uma breve descrição deste transtorno e das hipóteses sugeridas como base

bioquímica desta doença, a fim de demonstrar o papel dos compostos em estudo na

farmacoterapia antidepressiva.

1.1. A Depressão e a Hipótese Monoaminérgica

A depressão é um distúrbio de humor cujos sintomas apresentam-se como alterações

nas funções vegetativas (sono, apetite, peso e libido), cognitivas (concentração, memória,

atenção, tomada de decisões), comportamentais (interesse, motivação, prazer), somáticas

(cefaléias, dores estomacais, tensão muscular) e de controle do impulso (suicídio, homicídio)

de um indivíduo. Outras manifestações deste distúrbio são a distimia, caracterizada por

sintomas mais leves, porém crônicos e o transtorno bipolar, também conhecido como

transtorno maníaco-depressivo, no qual o paciente alterna estados de extrema euforia e

depressão severa (NATIONAL INSTITUTE OF MENTAL HEALTH, 2002).

Medicação, aliada a psicoterapia, é efetiva em 60 a 80% dos casos; entretanto, menos de

25% das pessoas afetadas recebe tais tratamentos, devido principalmente à falta de recursos e

de uma política de saúde pública adequada, bem como ao estigma social associado a

transtornos mentais. Nos casos mais severos, ou naqueles em que o paciente não responde à

medicação, a terapia eletroconvulsiva (TEC) pode ser muito eficaz (WORLD HEALTH

ORGANIZATION, 2005).

Devido às dificuldades na modelagem da depressão em animais, a abordagem

empregada para entender os mecanismos da doença tem sido o estudo dos efeitos dos

medicamentos antidepressivos (WONG; LICINIO, 2001). Os primeiros antidepressivos foram

1. Introdução 14

descobertos por acaso acerca de 50 anos, quando percebeu-se que a Iproniazida (fármaco

utilizado no tratamento da tuberculose) e a Imipramina (que estava sendo testada como anti-

histamínico) eram capazes de melhorar o humor dos pacientes que os recebiam (CASTRÉN,

2005).

Logo após esta descoberta, observou-se que esses fármacos aumentavam as

concentrações extracelulares de dois importantes neurotransmissores, a serotonina (5-HT) e a

noradrenalina (NA), por meio de dois mecanismos distintos: (i) inibindo sua recaptação nas

terminações neuronais ou (ii) inibindo a ação da enzima monoaminoxidase, responsável pela

degradação desses neurotransmissores. Como esses medicamentos causavam um aumento na

concentração dessas aminas, supôs-se que a depressão fosse o resultado de uma deficiência

dessas substâncias em locais importantes no cérebro, uma proposição conhecida como

hipótese monoaminérgica (WONG; LICINIO, 2004). Outra evidência clínica que serviu para

sustentar esta hipótese foi a associação entre o uso crônico da Reserpina no tratamento de

hipertensão e esquizofrenia com o aumento do risco de aparecimento da depressão em ca.

25% dos indivíduos. Após a elucidação do principal mecanismo de ação da Reserpina, que

consiste na inibição do armazenamento de 5-HT e NA nas vesículas das terminações

nervosas, a hipótese de que o efeito depressivo resultava da depleção de uma ou mais aminas

biogênicas no cérebro ganhou ainda mais força (ROMEIRO; FRAGA; BARREIRO, 2003).

Contudo, outras hipóteses têm surgido recentemente. Sabe-se que o hipotálamo produz

a substância CRH (corticotropin-releasing hormone), que estimula a glândula pituitária que,

por sua vez, desencadeia a liberação de hormônios glucocorticóides, que são hormônios do

estresse, como o cortisol. Por isso, essa hipótese é conhecida como hipótese do estresse e é

sustentada por estudos com animais que mostram uma diminuição das substâncias que

mantêm os neurônios saudáveis, causada por esses hormônios. Por outro lado, sabe-se que

animais deprimidos apresentam um baixo crescimento de novos neurônios (neurogênese).

1. Introdução 15

Esses conhecimentos deram origem à teoria neurotrófica, que está de acordo com o que se

conhece sobre os efeitos do estresse no cérebro, bem como com os resultados de estudos que

indicam que o hipocampo e o córtex pré-frontal apresentam-se atrofiados em animais

cronicamente deprimidos (HOLDEN, 2003).

Uma posição conciliatória entre estas hipóteses vem da observação de que a depressão

pode resultar apenas em parte da atividade diminuída do sistema serotoninérgico. A

neurotransmissão de 5-HT desempenha um papel fundamental no controle do humor e do

comportamento. Sabendo-se que a síntese de 5-HT é regulada pelo nível do seu precursor, o

triptofano, e pela atividade da enzima triptofanohidroxilase (TPH) e que, após sua liberação, a

ação da serotonina é terminada pela recaptação via transportador 5-HT (5-HTT) e

subseqüente degradação pela enzima monoaminoxidase (MAO), considera-se que a ação

antidepressiva, inibindo a recaptação de 5-HT ou a degradação da mesma pela MAO, causa

mudanças adaptativas no sistema serotoninérgico. Entretanto, este seria apenas um efeito

primário que levaria a numerosos efeitos secundários em outros sistemas neurotransmissores,

que podem resultar em outras mudanças adaptativas tais como a neurogênese, conforme

indicado por estudos com diversos medicamentos antidepressivos, TEC e atividade física

(ALBERT; LEMONDE, 2004).

1.2. A Serotonina e Seus Receptores

O sistema serotoninérgico desempenha um papel fundamental na modulação de várias

funções cognitivas e comportamentais, tais como sono, humor, libido, dor, dependência

química, agressividade, memória e aprendizagem. Problemas no sistema serotoninérgico estão

implicados na etiologia de desordens como esquizofrenia, enxaqueca, depressão, tendências

1. Introdução 16

suicidas, autismo infantil, transtornos alimentares e transtorno obsessivo-compulsivo

(MURPHY, 1999).

A serotonina exerce sua ação de neurotransmissão interagindo com diversos receptores

que diferem quanto a suas respostas farmacológicas a ligantes específicos, características

seqüenciais ou mecanismos de acoplamento a segundos mensageiros. Diversos estudos

comprovaram a existência de 14 subtipos de receptores de serotonina. A maioria deles, exceto

o receptor 5-HT3, pertence à família dos receptores acoplados à proteína G (G-protein-

coupled receptors, GPCRs), constituídos de α-hélices em sete domínios transmembrânicos

(BARNES; SHARP, 1999; HOYER; HANNON; MARTIN, 2002).

Os GPCRs são ativados por um sinal externo na forma de um ligante ou de outro

estímulo (como a luz), que cria uma variação conformacional no receptor, causando a

ativação de uma proteína G heterotrimérica. A transdução de sinais através da membrana feita

por um receptor desse tipo não é completamente entendida. Sabe-se que a proteína G inativa

existe ligada ao receptor em seu estado inativo. Uma vez que um ligante seja reconhecido, o

receptor muda de conformação e ativa a proteína G, que irá dissociar a subunidade alfa

(Gα) do dímero Gβγ e do receptor, dando continuidade à cascata de sinais celulares (PIERCE;

PREMONT; LEFKOWITZ, 2002).

Acredita-se que os GPCRs existem num equilíbrio conformacional entre os estados

biofísicos ativo e inativo, e que a interação com um ligante pode deslocar este equilíbrio na

direção de um ou outro estado do receptor. Os ligantes conhecidos como agonistas deslocam o

equilíbrio na direção do estado ativo; os agonistas inversos favorecem o estado inativo e os

antagonistas são ligantes que não afetam este equilíbrio. Entretanto, ainda não se sabe como

os estados ativo e inativo diferem entre si (LEFKOWITZ et al., 1993; RUBENSTEIN;

LANZARA, 1998).

1. Introdução 17

1.3. Os Antidepressivos

Os principais medicamentos antidepressivos utilizados na prática médica atual podem

ser agrupados nas seguintes classes (ROMEIRO; FRAGA; BARREIRO, 2003):

- Inibidores de Monoaminoxidase (IMAO): estão entre os primeiros medicamentos

utilizados no tratamento de depressão. Atuam como inibidores da enzima

monoaminoxidase, responsável pela oxidação de aminas biogênicas (especialmente NE).

São pouco seletivos (o que acarreta diversos efeitos colaterais) e interferem no

metabolismo hepático de muitos fármacos (exemplos: fenelzina, clorgilina e

meclobemida).

- Antidepressivos Tricíclicos (ATC): inicialmente foram descobertos inibidores

relativamente não-seletivos da recaptação de 5-HT e NE por seus respectivos receptores

neuronais (exemplos: imipramina e amitriptilina). Uma segunda geração de compostos

estruturalmente análogos foi desenvolvida, dando origem a compostos mais seletivos

que apresentam neurofarmacologia menos definida, sendo considerados, portanto,

atípicos (exemplos: amoxapina e maprotilina).

- Inibidores Seletivos da Recaptação de Serotonina (ISRS): estão envolvidos no

aumento da neurotransmissão de 5-HT, como resultado da dessensibilização dos

autoreceptores 5-HT somatodendríticos e terminais (exemplos: fluoxetina e paroxetina).

1. Introdução 18

Figura 1 – Exemplos de medicamentos antidepressivos das classes IMAO, ATC e ISRS.

Os ISRS representam a classe mais prescrita pelos médicos, por apresentarem menor

incidência de efeitos colaterais. Entretanto, aproximadamente 30% dos pacientes não

respondem à medicação. Além disso, embora o bloqueio da recaptação de 5-HT ocorra em

poucas horas, o tempo de latência até que esses medicamentos comecem a apresentar efeito

terapêutico significativo é de 2 a 6 semanas, tempo considerado muito longo por haver

possibilidade de suicídio (MURPHY, 1999).

Presume-se que esse atraso seja devido à ativação dos receptores 5-HT1A, que inibem a

estimulação de neurônios serotoninérgicos. Sob tratamento com um ISRS, a ativação desses

receptores ocorre para reduzir a liberação de serotonina com o objetivo de compensar o

aumento da concentração de 5-HT produzida pelo tratamento com o ISRS. Assim, o tempo de

latência de 2 a 6 semanas necessário para a ação dos antidepressivos sugere que uma mudança

adaptativa no sistema serotoninérgico deve ocorrer antes que os sintomas depressivos

apresentem melhora significativa (ALBERT; LEMONDE, 2004).

Assim, postula-se que a chave para essa mudança adaptativa sejam os receptores 5-

HT1A, que devem ser dessensibilizados para permitir a ação antidepressiva. A

dessensibilização desses receptores é observada em ratos sob tratamento crônico com

N

O

NH

F

O

CH(CH2)2N(CH3)2

O NH

CH3

CF3

Meclobemida (IMAO) Amitriptilina (ATC) Fluoxetina (ISRS)

1. Introdução 19

antidepressivos ou TEC. Essa suposição é sustentada pelo aumento da concentração de 5-HT

extracelular após a administração de antagonistas do receptor 5-HT1A, tais como o pindolol

(cuja estrutura é mostrada na Figura 2), juntamente com ISRSs, que têm diminuído o tempo

de latência e melhorado a eficácia do tratamento com esses antidepressivos (SHARP;

UMBERS; GARTSIDE, 1997).

NH

O NH

CH3

CH3

OH

Figura 2 – Estrutura química do pindolol, o primeiro antagonista do receptor 5-HT1A conhecido.

Com o presente trabalho, espera-se contribuir para o entendimento das interações entre

o receptor 5-HT1A e compostos arilpiperazínicos, uma classe de ligantes que demonstrou ação

antagonista desse receptor, podendo, assim, ser usados para acelerar o efeito dos ISRSs. Para

tal, foram empregados métodos de QSAR e de modelagem molecular de proteínas, cujos

fundamentos serão apresentados a seguir.

2. Estudos de QSAR 20

2. ESTUDOS DE QSAR

Os estudos de Relação Quantitativa entre Estrutura e Atividade (QSAR) têm como

finalidade a geração de modelos capazes de correlacionar as propriedades estruturais e/ou

físico-químicas dos compostos e a resposta biológica de interesse. No processo de

planejamento de um fármaco, a otimização de um composto protótipo pode ser acompanhada

em cada passo por análises QSAR, que auxiliam a tomada de decisão quanto aos compostos

que devem ser sintetizados (GANELLIN; ROBERTS, 1994). Além disso, a estratégia e a

filosofia dos estudos de QSAR permitem que o químico medicinal possa olhar para as

estruturas em termos de propriedades físico-químicas e/ou estruturais, ao invés de considerar

apenas certos grupos farmacofóricos (KUBINYI, 1993).

Apesar de serem mais utilizados na etapa de otimização de compostos protótipos,

estudos dessa natureza podem ser empregados em cada fase do desenvolvimento de novos

fármacos, aplicando-se a diferentes desafios em química medicinal, como na investigação de

propriedades (QSPR), de toxidez (QSTR) e seletividade (QSSR) de ligantes, entre outros

(BROWN; LEWIS, 2006). No âmbito da química combinatória, podem ser utilizados como

filtros de bibliotecas combinatórias, ajudando a eliminar compostos com propriedades

farmacocinéticas ou de toxidez indesejáveis, ou compostos que se mostram não-específicos

em diferentes ensaios e raramente resultam em protótipos adequados. Incluir essas

considerações nas primeiras etapas da pesquisa resulta na chamada otimização

multidimensional, tomando-se atividades altas como um objetivo essencial, porém não único

(DUDEK; ARODZ; GÁLVEZ, 2006).

A principal premissa que fundamenta os estudos de QSAR é que as interações dos

fármacos com seus alvos biológicos são determinadas por forças intermoleculares, ou seja,

interações hidrofóbicas, polares, eletrostáticas e estéreas. Os fármacos que exercem seus


efeitos biológicos interagindo com um alvo específico (uma enzima, um receptor, um canal

iônico, um ácido nucléico ou qualquer outra macromolécula biológica) devem ter uma

estrutura tridimensional tal que os grupos funcionais e as propriedades de superfície sejam

mais ou menos complementares ao sítio de interação. Desde que o sistema biológico seja

mantido constante, a interação de dois fármacos diferentes com o sítio de interação bem como

suas distribuições no sistema dependem apenas das estruturas químicas dos compostos. Se

estas estruturas são intimamente relacionadas, as diferenças em suas propriedades físico-

químicas e assim as diferenças nas forças de interação podem ser facilmente descritas de uma

maneira quantitativa; a variação correspondente nas atividades biológicas deve ser

diretamente relacionada às variações nessas propriedades. Assim, todos os modelos

quantitativos de relação estrutura-atividade são baseados na suposição de uma aditividade das

contribuições de grupos aos valores da atividade biológica (KUBINYI, 1993).

Quanto aos aspectos práticos desses estudos, para que um modelo QSAR possa ser

desenvolvido com sucesso, vários aspectos devem ser considerados. Com relação ao conjunto

de dados empregados para a construção de um modelo, alguns requisitos relacionados ao tipo

de atividade biológica medida e às estruturas dos compostos devem ser preenchidos. A

seleção dos descritores que representam as moléculas deve ser eficiente para identificar

parâmetros que sejam de fato relevantes para a atividade em estudo. Além disso, a realização

cuidadosa da análise estatística, assim como a aplicação de testes de validação dos modelos,

são imprescindíveis para assegurar a confiabilidade e a utilidade do modelo. Os principais

aspectos práticos a serem considerados em um estudo QSAR serão comentados a seguir.


2.1. Requisitos do Conjunto de Dados

A condição mais importante em um estudo QSAR é a disponibilidade de uma série

congênere, incluindo apenas compostos que apresentem o mesmo mecanismo de ação. Em

outras palavras, as moléculas devem possuir um esqueleto comum com variação estrutural em

apenas uma ou mais posições (VAN DE WATERBEEMD; ROSE, 2003). Embora

normalmente o mecanismo de ação não seja provado para todos os membros de uma série,

pode-se avaliar o mecanismo de ação para alguns compostos e assumir que todos os outros

apresentem o mesmo comportamento frente a seu receptor biológico (KUBINYI, 1993).

Ao escolher o conjunto de dados, geralmente se quer tantos compostos quantos forem

possíveis. Quando se faz uma análise com a utilização de técnicas de regressão múltipla, o

objetivo deve ser incluir ao menos cinco compostos para cada descritor considerado

(ERIKSSON; JOHANSSON, 1996).

Quanto aos dados biológicos, os seguintes tipos de dados de atividade biológica

podem ser usados em estudos QSAR, desde que estejam na escala correta: valores de

atividade biológica in vitro (usando culturas de bactérias, fungos e outras, bem como órgãos

isolados) e in vivo (atividades farmacodinâmicas e tóxicas de fármacos); dados de afinidade,

como constantes de interação com um receptor ou substrato; constantes de velocidade, como

associação/dissociação e constantes de Michaelis-Menten; constantes de inibição,

especialmente valores de Ki e IC50 de diferentes enzimas; parâmetros farmacocinéticos, como

constantes de velocidade de absorção, parâmetros de distribuição, constantes de velocidade de

degradação metabólica e constantes de velocidade de eliminação (KUBINYI, 1993).

Uma vez que as constantes de equilíbrio ou de velocidade estão relacionadas aos

valores de energia livre ∆G por relações como a da Eq. (1):


∆G = -2,303 RT log K (1)

apenas constantes de equilíbrio (por exemplo, valores de Ki ou IC50 e não % de inibição a

determinada concentração) e constantes de velocidade (como valores de log k e não % de

absorção ou % de concentração) são apropriadas para estudos de QSAR, o que significa que

todos os dados biológicos devem ser transformados de uma maneira apropriada antes de

serem usados em análises quantitativas. Ainda de acordo com a Eq. (1), é preferível que todos

os valores sejam convertidos à escala logarítmica. Como convenção, os negativos dos

logaritmos, i.e., logaritmos dos recíprocos das concentrações molares (p.ex. log 1/C ou pC)

são usados para que se obtenham valores maiores para compostos mais ativos. Há ainda outra

razão para o uso da escala logarítmica. Uma condição para a aplicação das análises de

regressão é uma distribuição normal do erro experimental na variável dependente. Para dados

biológicos, isso é verdadeiro para a escala logarítmica e não para a linear. Além disso, os

dados de atividade biológica devem ser razoavelmente distribuídos sobre toda a faixa de

valores, sem agrupamentos de dados (KUBINYI, 1993).

2.2. Cálculo de Descritores Moleculares

As estruturas químicas não contêm a informação relacionada à atividade biológica de

maneira explícita. Esta informação deve ser extraída das estruturas na forma de descritores

moleculares que acentuem diferentes propriedades químicas implícitas na estrutura da

molécula. Tais propriedades, que vão desde parâmetros físico-químicos, eletrônicos ou

químico-quânticos a características geométricas e topológicas das moléculas, podem ser então


correlacionadas diretamente com a atividade (FOYE; LEMKE; WILLIAMS, 1995;

(GANELLIN; ROBERTS, 1994).

A maioria dos métodos usados para predizer a atividade requer como input vetores

numéricos de determinadas características, com escala uniforme para todas as moléculas.

Tecnicamente, os descritores moleculares convertem a estrutura à forma de conjuntos de

valores numéricos bem definidos para serem usados na análise estatística dos dados

representando várias propriedades moleculares que são consideradas importantes para

explicar a atividade biológica (DUDEK; ARODZ; GÁLVEZ, 2006).

Dois tipos de descritores distintos podem ser definidos com base na dependência da

informação sobre a orientação tridimensional e da conformação da molécula. Os modelos

QSAR obtidos com descritores bidimensionais são, em geral, estatisticamente robustos e

podem fornecer resíduos de predição baixos. Entretanto, estes modelos podem ser de difícil

interpretação e, assim, acabam sendo usados como guias na otimização de compostos

protótipos de maneira mais indireta do que os modelos tridimensionais. Apesar disto, para

aplicações em que a qualidade da predição é importante, como na triagem virtual de grandes

bancos de dados, estes modelos são preferíveis. Os modelos obtidos com descritores

tridimensionais são mais fáceis de interpretar, pois fornecem uma representação mais clara da

região de um composto protótipo que deve ser modificada para modular a atividade.

Entretanto, algumas suposições subjetivas têm que ser feitas durante o desenvolvimento

desses modelos, o que reduz, em geral, a confiabilidade dos mesmos (BROWN; LEWIS,

2006). Os principais descritores dessas duas categorias serão analisados a seguir.


2.2.1. Descritores bidimensionais

Os descritores bidimensionais (2D) possuem a propriedade comum de serem

independentes da orientação tridimensional da molécula. Estes descritores vão de simples

medidas das entidades constituintes da estrutura química, de suas propriedades geométricas e

topológicas, até descritores eletrônicos calculados por métodos químico-quânticos e, ainda,

com métodos de contagem de fragmentos (DUDEK; ARODZ; GÁLVEZ, 2006). Os

principais descritores 2D podem ser classificados como:

- Descritores Constitucionais: capturam propriedades da molécula que são relacionados aos

elementos constituintes de sua estrutura. São descritores que podem ser calculados rápida e

facilmente. Exemplos incluem massa molecular, número total de átomos na molécula e

número de átomos de identidades diferentes. Informações relacionadas a ligações são também

consideradas, como números totais de ligações simples, duplas, triplas ou aromáticas, assim

como número de anéis aromáticos.

- Descritores Geométricos: dependem do arranjo espacial dos átomos constituintes da

molécula. Representam, por exemplo, informações sobre a superfície molecular, obtida das

áreas de van der Waals dos átomos, assim como sobre o volume molecular (HIGO; GO, 1986;

LABUTE, 2000).

- Descritores Eletrônicos: Estimados a partir de cálculos químico-quânticos, esses parâmetros

descrevem as propriedades eletrônicas das moléculas, bem como a influência de certos grupos

ou substituintes na densidade de distribuição eletrônica. Como exemplo, temos: cargas

atômicas, energias dos orbitais de fronteira, potencial de ionização, energia eletrônica e calor


de formação. Além destes, incluem-se parâmetros de polarizabilidade, refratividade molar e

momento dipolar, que indicam o modo pelo qual eventuais alterações nos substituintes de

uma estrutura podem modificar a distribuição de cargas como um todo (FOYE; LEMKE;

WILLIAMS, 1995).

- Descritores Topológicos: tratam a estrutura da molécula como um objeto geométrico

(“graph”), tendo os átomos como vértices e as ligações covalentes como arestas. Com base

nesta abordagem, muitos índices quantificando a conectividade molecular são definidos,

como o índice de Wiener, que conta o número total de ligações em caminhos curtos entre

todos os pares de átomos não-hidrogênios. Outros descritores topológicos incluem índices de

Randic (RANDIC, 1975), de Balaban (BALABAN, 1982) e de Schultz (SCHULTZ, 1989).

Informações sobre elétrons de valência podem ser incluídas em descritores topológicos, como

índices de Kier e Hall (KIER; HALL, 1981) ou índices topológicos de carga de Gálvez

(GÁLVEZ et al., 1994). Os primeiros usam médias geométricas das conectividades de

valência ao longo dos caminhos. Os últimos medem valências topológicas de átomos e cargas

totais entre pares de átomos separados por um dado número de ligações.

- Descritor de Lipofilia: especificamente, o logaritmo do coeficiente de partição (log P),

definido como sendo o logaritmo da razão entre a solubilidade de uma substância em um

solvente orgânico e a solubilidade da mesma em água. Este parâmetro está relacionado

principalmente com a distribuição do fármaco no organismo (SILVERMAN, 1992).

- Descritores baseados em fragmentos: a família de descritores dependentes de motivos sub-

estruturais é frequentemente usada, especialmente para uma varredura rápida de bases de

dados com muitos compostos. Os BCI fingerprints (BARNARD; DOWNS, 1997) são


derivados como “bits” que descrevem a presença ou ausência na molécula de certos

fragmentos, incluindo átomos com seus vizinhos mais próximos, pares de átomos e

seqüências ou fragmentos de anéis. De maneira similar, a abordagem de QSAR por

Hologramas (HQSAR) é baseada na contagem de números de ocorrências de certas sub-

estruturas ou grupos funcionais. Uma molécula é descrita como uma única série de números

ou “bins”, que formam o holograma molecular. Os bins representam cada um dos fragmentos

presentes em uma molécula em particular e são atribuídos por um algoritmo conhecido como

CRC (cyclic redundancy check) (HERITAGE; LOWIS, 1999).

2.2.2. Descritores tridimensionais

A metodologia de QSAR tridimensional (3D) é computacionalmente mais complexa

do que a abordagem bidimensional. Em geral, envolve vários passos para a obtenção de

descritores numéricos da estrutura dos compostos. Primeiro, a conformação de um composto

tem de ser determinada com o auxílio de dados experimentais ou métodos de otimização de

energia (AKAMATSU, 2002; GÜNER, 2002). Em seguida, os confôrmeros do conjunto de

dados tem de ser alinhados uniformemente no espaço (embora existam alguns métodos

independentes de alinhamento). Finalmente, o espaço em torno dos confôrmeros é submetido

a uma sonda química (como uma carga de prova) para o cálculo de vários descritores.

Os métodos que requerem alinhamento molecular antes do cálculo de descritores são

fortemente dependentes de informação sobre o receptor que interage com os ligantes em

estudo. Quando estes dados estão disponíveis, o alinhamento pode ser guiado pelo estudo dos

complexos ligante-receptor. De outro modo, métodos puramente computacionais para


sobrepor as estruturas no espaço podem ser usados (DOVE; BUSCHAUER, 1999;

LEMMEN; LENGAUER, 2000).

O método mais utilizado em QSAR 3D é a Análise Comparativa de Campos

Moleculares (CoMFA), que utiliza campos de energia eletrostáticos (Coulomb) e estéricos

(van der Waals) definidos para os compostos em estudo (CRAMER III; PATTERSON;

BUNCE, 1988). As moléculas alinhadas são posicionadas em uma grade tridimensional. Em

pontos definidos desta grade, um átomo de prova com carga unitária é posicionado e os

potenciais (Coulomb e Lennard-Jones) dos campos de energia são computados, para servirem

como descritores em análises estatísticas, que tipicamente empregam a regressão por mínimos

quadrados parciais (PLS). Esta análise permite a identificação de regiões das estruturas que

são relacionadas positiva ou negativamente com a atividade em estudo (BLANKLEY, 1996).

Uma variação do método CoMFA surgida posteriormente é a Análise Comparativa de

Índices de Similaridade Molecular (CoMSIA). Neste método, são calculados campos de

similaridade na forma de potenciais gaussianos. O método CoMSIA permite a consideração

de várias propriedades físico-químicas (ocupação estérea, cargas atômicas parciais, hidrofobia

local e propriedades de doador ou receptor de ligações de hidrogênio). Além disso, os mapas

de contribuição resultantes podem ser interpretados intuitivamente. A principal vantagem do

método CoMSIA é que ele pode evitar algumas das deficiências inerentes à forma funcional

dos potenciais de Lennard-Jones e de Coulomb (KLEBE; ABRAHAM; MIETZNER, 1994).

Há ainda abordagens 3D em que nenhum alinhamento das estruturas é necessário, uma

vez que não variam com a rotação e a translação das moléculas no espaço. As principais

abordagens deste tipo são:

- WHIM, que emprega o método PCA no centro das coordenadas dos átomos constituintes da

molécula, capturando a máxima variância neste espaço em que diversos descritores são


calculados. A contribuição de cada átomo pode ser pesada por uma propriedade química,

levando a diferentes componentes principais que capturem variância contida na dada

propriedade. Os átomos podem ser pesados pela massa, volume de van der Waals,

eletronegatividade atômica, polarizabilidade atômica, índices eletrotopológicos de Kier e Hall

e potencial eletrostático molecular (TODESCHINI; GRAMATICA, 1998; TODESCHINI;

LASAGNI; MARENGO, 1994).

- VolSurf, que é baseada na sondagem de uma grade em torno das moléculas com sondas

específicas para avaliar, por exemplo, interações hidrofóbicas ou grupos receptores ou

doadores de ligações hidrogênio. As caixas da malha resultantes são usadas para computar

descritores dependentes dos volumes ou das superfícies de contorno 3D, definidas pelo

mesmo valor da energia de interação sonda-molécula. Usando várias sondas e valores de corte

para a energia, diferentes propriedades moleculares podem ser quantificadas, como volume e

superfície molecular e regiões hidrofóbicas ou hidrofílicas. Quantidades derivadas, como

globularidade molecular ou fatores relacionando a superfície de regiões hidrofóbicas ou

hidrofílicas à superfície da molécula inteira, podem ser também calculadas (CRIVORI et al.,

2000; CRUCIANI et al., 2000).

- GRIND, projetado para superar os problemas de interpretação comuns aos descritores

independentes do alinhamento. De maneira similar ao VolSurf, utiliza a sondagem de uma

grade em torno das moléculas. As regiões mostrando as energias mais favoráveis de interação

são selecionadas, desde que as distâncias entre as regiões sejam grandes. Depois, as energias

baseadas nas sondas são codificadas de maneira independente do arranjo das moléculas. Para

este fim, as distâncias entre os nós no grid são discretizadas em um conjunto de bins. Para

cada bin de distância, os nós com os mais altos produtos de energia servem como descritores


numéricos. Além disso, a informação armazenada na posição dos nós pode ser usada para

encontrar as regiões exatas da molécula relacionadas a uma dada propriedade (PASTOR et al.,

2000).

2.3. Seleção de Descritores Relevantes

Os métodos para a seleção dos melhores descritores a serem usados na construção de

um modelo QSAR podem ser divididos em duas categorias: (i) os descritores são

selecionados por um determinado critério, antes da construção de um modelo, reduzindo-se

assim o número de descritores e independentemente da técnica usada para a construção do

modelo. (ii) a qualidade de um subconjunto de descritores é obtida construindo e avaliando

modelos, até que o melhor entre eles, de acordo com determinado critério, seja obtido.

Exemplos da primeira categoria são:

- métodos baseados na correlação de descritores, como os coeficientes de Pearson

(MERKWIRTH et al., 2004), que servem para descartar descritores intercorrelacionados; ou

ainda, a escolha dos descritores que apresentam correlações mais altas com a atividade

biológica (GALLEGOS; GIRONES, 2005).

- critérios estatísticos, como o peso de Fisher, que avalia a variância inter- e intra-classes e

serve para identificar os descritores que apresentam o maior potencial discriminatório (LIN;

LI; TSAI, 2004).


Os métodos da segunda categoria operam necessariamente em conjunto com um

método de construção de modelos QSAR. A escolha do subconjunto de descritores é guiada

pelo erro do algoritmo de construção para um dado subconjunto, avaliado, por exemplo, com

validação cruzada. Iterativamente, várias configurações de descritores selecionados e

descartados são avaliadas pela criação de um modelo e avaliação da acurácia da predição. Os

descritores finais são aqueles que fornecem a acurácia mais alta dentro de uma família de

modelos. Exemplos são Algoritmos Genéticos (SIEDLECKI; SKLANSKY, 1988) e

Simulated Annealing (ITSKOWITZ; TROPSHA, 2005) baseados em uma abordagem

estocástica, ou os métodos determinísticos como a seleção ou eliminação seqüenciais

(Sequential Feature Forward Selection e Sequential Backward Feature Elimination)

(KOHAVI; JOHN, 1997).

2.4. Construção do Modelo de Relação Estrutura-Atividade

Tendo selecionado os descritores, o passo final dos estudos de QSAR é a construção

do modelo de relação estrutura-atividade. Diversos tipos de modelos podem ser obtidos,

dependendo da natureza dos dados biológicos. Se os dados disponíveis forem em termos de

categorias de atividade, como “compostos ativos” e “inativos”, pode-se lançar mão de

métodos de classificação para a criação de modelos de relação estrutura-atividade (SAR).

Neste caso, os modelos são de natureza qualitativa apenas, uma vez que não serão feitas

predições sobre o valor numérico da atividade biológica. Se os dados forem de natureza

contínua, podem ser usados métodos de regressão para a obtenção de modelos quantitativos

(QSAR) (VAN DE WATERBEEMD; ROSE, 2003).


Outra distinção entre os tipos de modelos depende da abordagem matemática utilizada.

A atividade pode ser modelada como uma função linear dos descritores, como nos métodos de

regressão MLR e PLS, ou por relações mais complexas, com o auxílio de métodos não-

lineares, como Redes Neurais Artificiais (ANN), Decision Trees, Support Vector Machines,

entre outros (DUDEK; ARODZ; GÁLVEZ, 2006).

Independente da técnica utilizada para a construção dos modelos, estes devem ser

submetidos a testes de validação para garantir sua confiabilidade e avaliar sua capacidade

preditiva.

2.5. Validação dos Modelos de QSAR

A etapa final do desenvolvimento de um modelo QSAR é a sua validação.

Inicialmente, deve-se avaliar a qualidade do coeficiente de correlação r2, que depende da

variância total da variável dependente (Syy), de acordo com a Eq. (2):

yy

calcobs

S

yyr ∑ −

−=2

2)(

1 (2)

onde yobs é o valor experimental da atividade biológica e ycalc é o valor calculado pelo modelo.

Considera-se que um modelo QSAR pode ser aceito se o coeficiente de correlação estiver

próximo ou for maior do que 0,90 (KUBINYI, 1993).

A maioria dos métodos de QSAR utiliza uma abordagem de validação interna,

conhecida como validação cruzada. Amostras do conjunto de treinamento são retiradas do

modelo inicial, enquanto um novo modelo é construído para as restantes. A partir desse


modelo, as atividades biológicas das amostras retiradas são preditas, calculando-se os resíduos

entre os valores obtidos e os valores reais. Esse procedimento é repetido até que todas as

amostras tenham sido excluídas ao menos uma vez. Como resultado deste procedimento,

obtém-se o coeficiente de correlação da validação cruzada, q2, calculado de acordo com a Eq.

(3):

∑

∑−−

−=2

22

)(

)(1

médioobs

calcobs

yy

yyq (3)

O valor de q2 é usado como um critério para avaliar a robustez e a habilidade preditiva

do modelo. Valores de q2 > 0,50 são geralmente considerados como bons e q2 > 0,90 como

excelentes. A diferença entre r2 e q2 não deve ser maior do que 0,30, pois uma diferença

substancialmente maior pode indicar um modelo com ajuste forçado ou a presença de

variáveis independentes irrelevantes ou de outliers nos dados (ERIKSSON et al., 2003).

A característica mais importante de um modelo QSAR é o seu poder preditivo, que

pode ser definido como a habilidade de um modelo em encontrar uma correlação significativa

entre a atividade biológica predita e a observada experimentalmente para compostos que não

foram usados na construção do modelo. Isso pode ser feito dividindo-se o conjunto de dados

em conjunto de treinamento e conjunto de teste, que serão usados para a construção do

modelo e para a validação do modelo, respectivamente (TROPSHA, 2005).

Outra abordagem que deve ser usada paralelamente a essas técnicas de validação é a

randomização das atividades biológicas (WOLD, ERIKSSON, 1995). Essa abordagem

consiste em repetir o procedimento de construção do modelo com as atividades randomizadas

e, em seguida, fazer uma avaliação estatística dos modelos assim produzidos. Se todos os

modelos obtidos com as atividades randomizadas apresentarem coeficientes de correlação r2 e


q2 altos, isso significa que a correlação foi obtida por acaso e não porque a atividade biológica

está definitivamente relacionada aos descritores empregados no modelo. Isso implica que não

será possível obter um modelo QSAR aceitável para este conjunto de dados utilizando o

método que foi empregado (GRAMATICA, 2007; TROPSHA, 2005).

2.6. Estudos de Relação Estrutura-Atividade dos Compostos Arilpiperazínicos

O receptor 5-HT1A tem sido objeto de diversos estudos que demonstram sua

participação em várias funções fisiológicas, tais como sono, apetite e libido, bem como em

condições patológicas como ansiedade e depressão (BARRETT; VANOVER, 1993;

PUCADYIL; KALIPATNAPU; CHATTOPADHYAY, 2005).

Os compostos arilpiperazínicos constituem a classe mais importante de ligantes do

receptor 5-HT1A (ver estrutura geral, Figura 3a). Exemplos são a buspirona (3b), NAN-190

(3c), WAY 100635 (3d) e flesinoxan (3e) (OH et al., 2001). Uma vez que a estrutura

cristalográfica do receptor não foi determinada, os estudos de relação estrutura-atividade com

diversas séries de ligantes arilpiperazínicos são de fundamental importância para o

entendimento das características estruturais necessárias para a interação ligante-receptor e,

conseqüentemente, para o desenvolvimento de ligantes capazes de suscitar a resposta

desejada.


NN Ar1(CH2)n

Ar2

N

N

NN

N

O

O

NN

N

O

O

MeO

N

NNN

MeOO

NNN

O O O

OH

3a

3b 3c

3d3e

Figura 3 - (a) estrutura geral das arilpiperazinas; (b) buspirona; (c) NAN-190; (d) WAY 100635; (e) flesinoxan.

Uma das mais extensas e importantes séries de arilpiperazinas já sintetizadas resultou

do trabalho de López-Rodríguez et al. (1996, 1997a, 1997b, 1999, 2001a, 2001b, 2004, 2005)

em que derivados arilpiperazínicos contendo diferentes grupos Ar1 e Ar2 foram estudados

quanto à relação entre a afinidade pelo receptor e a presença de diferentes grupos, como

hidantoína, imidazol, piridina, e seus substituintes, bem como diferentes comprimentos da

cadeia que liga o anel piperazínico e o grupo Ar2. Dentre esses estudos, dois utilizaram

metodologias de análise quantitativa da relação estrutura-atividade. Um deles empregou a

metodologia CoMFA na construção de um modelo QSAR 3D para um conjunto de 48

arilpiperazinas (LÓPEZ-RODRÍGUEZ et al., 1997a) e no outro, uma análise de Hansch foi

realizada, juntamente com um estudo utilizando o método ANN para um conjunto de 32

arilpiperazinas (LÓPEZ-RODRÍGUEZ et al., 2001b). Os resultados mais importantes (ver

Figura 1a) indicam que substituintes volumosos nas posições orto e meta do anel aromático


Ar1 são favoráveis para afinidades mais altas pelo receptor 5-HT1A. A posição meta é

importante, também, para a seletividade por este receptor em comparação com o receptor

adrenérgico α1, pois enquanto o primeiro é capaz de acomodar substituintes volumos nesta

região, o receptor adrenérgico apresenta maiores restrições estéreas. Além disso, a análise do

comprimento da cadeia que separa o anel piperazínico e o substituinte Ar2 indica que os

ligantes com as maiores afinidades apresentam n = 3 ou 4.

Outro estudo empregando a metodologia CoMFA foi realizado por Gaillard et al.

(1996), com base em uma série de 101 compostos. O melhor modelo empregando apenas

arilpiperazinas (q2 = 0,65) indicou (a) uma região estérica favorável próxima ao anel

aromático Ar1; (b) uma região proibida próxima ao nitrogênio básico; (c) uma carga negativa

favorável próxima à posição orto do anel aromático Ar1 e (d) efeitos lipofílicos e

eletrostáticos opostos no substituinte do nitrogênio (ver Figura 1a).

Utilizando uma série com substituintes Ar1 e Ar2 bastante variados e com o auxílio do

programa CODESSA (KATRITZKY; KARELSON; PETRUKHIN, 2001), Menziani e

colaboradores (MENZIANI; DE BENEDETTI; KARELSON, 1998) realizaram uma análise

MLR com 29 compostos arilpiperazínicos, na qual o melhor modelo (r2 = 0,83) foi

encontrado com descritores ad hoc de tamanho e forma, índices de orbitais moleculares e área

superficial carregada. Os autores interpretam os resultados apontando que a interação

eletrostática entre a função amina protonada e um sítio nucleofílico primário no receptor,

necessária para o reconhecimento molecular, é descrita pelos índices de orbitais moleculares

localizados no grupo N-H+, enquanto as interações atrativas e repulsivas de curto alcance

(forças polares e dispersivas) são descritas pelos índices computados para a molécula inteira e

pelos descritores ad hoc.

Uma importante linha de pesquisa existente atualmente é baseada em compostos que

possuem atividade simultânea em receptores serotoninérgicos e/ou adrenérgicos e/ou


transportadores (HEINRICH et al., 2004). Em particular, conforme dito anteriormente, a

combinação de compostos que sejam simultaneamente inibidores seletivos da recaptação de

serotonina e apresentem afinidade pelo receptor 5-HT1A tem sido objeto de pesquisa desde

que o pindolol, que é um antagonista deste receptor, demonstrou bons resultados para a

terapia antidepressiva quando administrado juntamente com um ISRS (DRESHFIELD et al.

1996; SHARP; UMBERS; GARTSIDE, 1997).

Com o objetivo de encontrar compostos que apresentassem afinidade pelo receptor 5-

HT1A e, simultaneamente, capacidade de inibir a recaptação de serotonina, várias séries de

compostos foram planejadas por Monge e colaboradores em diversos trabalhos, que

começaram com a síntese de derivados do 3-[(4-aril)piperazin-1-il]-1-arilpropano por

Oficialdegui et al. (2000) - ver Figura 4.

NAr2N Ar1

z

Figura 4 - Estrutura geral dos compostos sintetizados inicialmente por Oficialdegui et al. (2000).

Dando continuidade a esse projeto, Martínez-Esparza et al. (2001) sintetizaram

diferentes séries de derivados arilpiperazínicos com o objetivo de obter novos compostos com

afinidade pelo receptor 5-HT1A e pelo 5-HTT (transportador de serotonina). O estudo do

grupo funcional Z, do anel aromático acoplado à piperazina (Ar1) e do anel aromático Ar2 (ver

Figura 4) sugeriu as seguintes SARs: (i) a introdução de um éter aril em Z não foi necessária

para obter a atividade dual desejada, sendo que os melhores resultados foram obtidos com

hidroxilas nesta posição. (ii) entre todas as arilpiperazinas testadas, as afinidades mais altas

foram obtidas com derivados 2-metóxifenilpiperazínicos. (iii) Com relação ao anel Ar2, as


afinidades foram claramente aumentadas quando o anel benzênico foi substituído por tiofeno

(séries I e II) e também nas séries em que o naftaleno foi substituído pelo benzotiofeno (séries

III e IV) – ver Figura 5.

NN

R

zAr1

I

NNz

Ar1

III

R NNz

Ar1

II

NNz

Ar1

SIV

Figura 5 - Estrutura geral dos compostos das séries I, II, III e IV de Martinez-Esparza et al. (2001).

Partindo dos resultados de que os compostos 6a e 6b (Figura 6) apresentavam as

maiores afinidades, uma nova série de compostos foi sintetizada por Orús et al. (2002) com o

objetivo de obter bloqueadores de 5-HTT eficazes, apresentando ao mesmo tempo uma

atividade antagonista nos receptores 5-HT1A.

S

NN

OH

MeO

6a

S

NN

OH

MeO

F

6b

Figura 6 - Compostos sintetizados por Martinez-Esparza et al. com afinidades mais altas.


Considerando estes compostos, as seguintes SARs foram estabelecidas pelos autores:

− Variações conformacionais da molécula como conseqüência dos efeitos retiradores de

elétrons do flúor podem explicar a reduzida seletividade no receptor apresentada pelos

compostos que possuem um flúor no anel benzotiofeno;

− A presença de um heteroátomo e sua posição parecem ser críticas para a afinidade

pelos receptores 5-HT1A, com os compostos derivados do 8-quinolil mostrando os

melhores resultados. Heteroátomos podem levar a interações não-covalentes

cooperativas adicionais, finalmente aumentando a valência do ligante em termos de

pontos de contato no reconhecimento e no processo de interação, ou seja, estendendo a

capacidade farmacofórica;

− O grupo metil do anel quinaldínico não afeta significativamente as afinidades,

sugerindo que não existem restrições estéreas no processo de interação, que pode ser

governado principalmente por fatores eletrônicos.

Estes estudos resultaram na síntese de novos derivados, cujos melhores resultados

foram obtidos com os compostos 7a e 7b, mostrados na Figura 7 (PÉREZ-SILANES et al.,

2004).

S

NN

OHOH

O

O

7a

S

NN

OHO2N

O

O

7b

Figura 7 – Compostos com melhores resultados sintetizados por Pérez-Silanes et al. (2004).


Outro exemplo recente de síntese de compostos apresentando ação dual são os

trabalhos de Heinrich et al. com derivados indolbutilpiperazínicos (ver Figura 8a), que se

mostraram capazes de aumentar o nível de serotonina em importantes áreas do cérebro (córtex

frontal e hipocampo ventral) (HEINRICH et al., 2004a; 2004b). Nestes estudos, a vilazodona

(ver Figura 8b) foi identificada como um ligante altamente seletivo por receptores 5-HT1A

pré-sinápticos e apresentou atividade subnanomolar (0,5 nM) como inibidor de recaptação de

serotonina. Por causar um aumento significativo dos níveis de serotonina no córtex frontal de

ratos em uma quantidade jamais alcançada com ISRSs administrados isoladamente, este

composto é considerado de extremo interesse para o exame do impacto que o aumento dos

níveis de serotonina em importantes áreas do cérebro tem nas disfunções do humor.

8a 8b Figura 8 - (a) Estrutura geral dos compostos indolbutilpiperazínicos sintetizados por Heinrich et al.; (b) estrutura da vilazodona.

NH NN

R

R' NH NN

CN

O

NH2

O

3. Modelagem Molecular de Proteínas 41

3. MODELAGEM MOLECULAR DE PROTEÍNAS

No processo de planejamento de fármacos, informações estruturais sobre o alvo

biológico e o modo de interação de seus ligantes são fundamentais. Embora o banco de dados

estruturais de proteínas - PDB (Protein Data Bank) - (BERMAN et al., 2000) venha

crescendo substancialmente graças aos aperfeiçoamentos em técnicas de determinação

estrutural, ainda existem alguns alvos biológicos relevantes que não apresentam dados

disponíveis. Nesses casos, se faz necessária a utilização de métodos de predição da estrutura

terciária de proteínas (DEANE; BLUNDELL, 2003).

O objetivo destes métodos é a predição da estrutura tridimensional de uma proteína a

partir de sua seqüência de aminoácidos, geralmente incluindo informações adicionais, como

dados estruturais de proteínas relacionadas (JOHNSON et al., 1994). Entretanto, alguns

fatores tornam a predição da estrutura de proteínas uma tarefa difícil. Os dois principais

problemas são o grande número de conformações possíveis e o fato de que a base física para a

estabilidade estrutural das proteínas não é completamente entendida. Assim, qualquer método

de predição da estrutura de proteínas necessita de uma maneira eficiente de explorar o espaço

de possíveis estruturas (uma estratégia de busca conformacional) e uma maneira de identificar

a estrutura mais plausível energeticamente - uma função de energia (DEANE; BLUNDELL,

2003).

Nos métodos de modelagem por homologia, ou modelagem comparativa, o espaço de

busca é restringido assumindo-se que a proteína em questão adota uma estrutura que é

razoavelmente próxima da estrutura de ao menos uma proteína conhecida. Já na modelagem

ab initio ou de novo, nenhuma suposição quanto ao arranjo tridimensional é feita inicialmente

(MOULT, 1999).


Os modelos tridimensionais obtidos podem ser empregados em estudos de docking

ligante-receptor ou proteína-proteína, bem como para anotação funcional de genes

identificados no genoma de um organismo. Mesmo modelos apresentando baixa acurácia

podem ser úteis para esses propósitos, pois suas imprecisões tendem a serem localizadas nas

regiões dos loops, que são normalmente variáveis, mesmo em proteínas extremamente

relacionadas. As regiões funcionais das proteínas, especialmente os sítios ativos, costumam

ser altamente conservados e, assim, modelados com maior precisão (BAKER; SALI, 2001;

GOPAL et al., 2001).

Os fundamentos da modelagem de proteínas por homologia e dos estudos de docking

ligante-receptor serão brevemente revisados a seguir, juntamente com os estudos de

modelagem do receptor 5-HT1A relatados na literatura.

3.1. A Modelagem por Homologia

Os métodos de modelagem por homologia baseiam-se no princípio de que proteínas

pertencentes a uma mesma família ou superfamília são homólogas, ou seja, derivam de um

mesmo ancestral comum. Assumindo que a estrutura tridimensional de uma proteína seja

determinada apenas pela sua seqüência de aminoácidos e por seu meio, um modelo para uma

seqüência de estrutura desconhecida pode ser construído pela extrapolação de características

tridimensionais de estruturas homólogas conhecidas (STERNBERG, 1996).

Em geral, o procedimento adotado pode ser dividido nas seguintes etapas (DEANE;

BLUNDELL, 2003): (1) identificação de uma ou mais proteínas com estruturas determinadas

(“proteína-molde”) que sejam semelhantes à estrutura da proteína a ser modelada (“proteína-


alvo”); (2) produção de um alinhamento dos resíduos da proteína-alvo com o(s) molde(s); (3)

construção de um modelo tridimensional da proteína-alvo; (4) validação do modelo obtido.

3.1.1. Identificação de moldes estruturais

Esta etapa pode ser trivial se a identidade seqüencial entre o alvo e as estruturas

tridimensionais conhecidas for alta (> 30%), pois então métodos simples de comparação entre

pares de seqüências, tais como FASTA e SSEARCH (PEARSON; LIPMAN, 1988) serão

capazes de identificar uma relação facilmente (BRENNER; CHOTHIA; HUBBARD, 1998).

Quando a identidade seqüencial for mais baixa, o reconhecimento da similaridade

estrutural entre duas seqüências pode ser mais complicado. Métodos de busca baseados

apenas na seqüência, tais como PSI-BLAST (ALTSCHUL et al., 1997) e hidden Markov

models (EDDY, 1998; KARPLUS et al., 1997), podem usar informações de alinhamentos

múltiplos de seqüência para representar as características compartilhadas por seqüências

relacionadas (perfis seqüenciais) e, assim, encontrar estruturas conhecidas que possam ser

usadas como moldes (KORETKE et al., 1999).

Por outro lado, existem métodos que utilizam informações da estrutura tridimensional

para a busca por estruturas homólogas. Dentre estes, os métodos conhecidos como threading

exploram a diferença na distribuição de distâncias entre resíduos nas estruturas de proteínas

para diferentes pares de aminoácidos (JONES; TAYLOR; THORNTON, 1992;

PANCHENKO; MARCHLER-BAUER; BRYANT, 1999). Outros métodos baseiam-se em

perfis gerados por alinhamentos seqüenciais múltiplos, que são avaliados de acordo com

tabelas de substituição de aminoácidos (BOWIE; LUTHY; EISENBERG, 1991; FISCHER;

EISENBERG, 1996; SHI; BLUNDELL; MIZUGUCHI, 2001).


3.1.2. Alinhamento da seqüência-alvo com a estrutura-molde

Esta é uma etapa crucial na modelagem por homologia e a mais importante fonte de

erros (JONES; KLEYWEGT, 1999; SRINIVASAN; BLUNDELL, 1993). Seqüências muito

curtas ou muito semelhantes podem ser alinhadas manualmente; entretanto, problemas mais

complexos requerem a construção de algoritmos para a produção de alinhamentos seqüenciais

de boa qualidade. Nos casos em que a identidade seqüencial entre o alvo e o molde é baixa,

um alinhamento adequado só pode ser obtido com intervenção manual (DEANE;

BLUNDELL, 2003).

Em geral, os algoritmos avaliam alinhamentos de seqüências usando esquemas

contendo escores para os 210 pares de aminoácidos possíveis, armazenados em uma matriz de

similaridade, onde são atribuídos escores mais altos para o alinhamento de resíduos idênticos

e para aqueles de caráter similar, enquanto pares dissimilares recebem escores mais baixos. O

problema de gerar um alinhamento ótimo varia de acordo com o tipo de alinhamento que se

quer fazer: métodos para pares de seqüências, métodos para seqüências múltiplas e métodos

que incorporam informações adicionais (por exemplo, da estrutura terciária de uma proteína).

Algoritmos de programação dinâmica são os mais comuns e operam identificando o

alinhamento ótimo para duas seqüências de acordo com um determinado esquema de escores,

incluindo penalidades para lacunas e extensões de lacunas entre seqüências (SMITH;

WATERMAN, 1981). Estes alinhamentos são então usados como base para predizer a

conformação do alvo a partir das estruturas-molde.


3.1.3. Construção do modelo

Tendo obtido um alinhamento entre o alvo e o(s) molde(s), a informação contida no

arquivo de alinhamento é usada para gerar um modelo tridimensional do alvo, representado

como um conjunto de coordenadas Cartesianas para cada átomo na proteína. Existem duas

principais classes de métodos para a geração de modelos: métodos baseados em restrições

espaciais e métodos baseados em fragmentos (BAKER; SALI, 2001; STERNBERG, 1996).

Nos métodos baseados em restrições espaciais, o modelo tridimensional é obtido de

forma a satisfazer determinadas restrições derivadas do alinhamento com estruturas

relacionadas. Um ou mais alinhamentos são usados para estabelecer um conjunto de critérios

geométricos que são então convertidos em funções de densidade de probabilidade para cada

restrição. Restrições aplicadas às principais coordenadas internas da proteína - distâncias entre

átomos e ângulos diedros - servem como base para um procedimento de otimização global

usado para refinar as posições dos átomos. Este processo de modelagem pode ser refinado

também com dados experimentais e/ou conhecimento teórico sobre a estrutura das proteínas

(SALI; BLUNDELL, 1990). Restrições experimentais podem vir de dados de RMN,

espectroscopia de fluorescência, microscopia eletrônica ou mutagênese sítio-dirigida,

enquanto restrições teóricas incluem regras de empacotamento da estrutura secundária,

hidrofobia, mutações correlacionadas e potenciais empíricos. Programas baseados na

satisfação de restrições espaciais, como o programa MODELLER (SALI; BLUNDELL,

1993), que é o mais utilizado pela comunidade científica, normalmente produzem modelos

completos, mas com qualidade variável em diferentes regiões. Isto ocorre por causa das

dificuldades em lidar com deleções e inserções no alinhamento, para as quais não se consegue

derivar restrições facilmente a partir de proteínas de estrutura conhecida. Além disso, esses


programas geralmente necessitam de maior capacidade e tempo computacionais para a

geração de modelos (MONTALVÃO et al., 2005).

Nos métodos baseados em fragmentos, a proteína-alvo normalmente é modelada

construindo-se inicialmente as regiões estruturalmente conservadas (structural conserved

regions, SCRs) - que correspondem às regiões de máxima similaridade - e, em seguida, as

regiões estruturalmente variáveis (structural variable regions, SVRs) (GREER, 1980). Os

fragmentos identificados em estruturas homólogas são então avaliados de acordo com sua

similaridade com a seqüência alvo de modo que um modelo seja construído a partir dos

melhores fragmentos (JOHNSON et al., 1994). As diversas implementações destes métodos

diferem principalmente na maneira como são tratadas as SVRs, que podem ser construídas

usando-se fragmentos de proteínas conhecidas ou por meio de métodos ab initio ou de busca

conformacional (DEANE; BLUNDELL, 2000; ZHANG et al., 1997). Outro ponto importante

é a orientação correta das cadeias laterais dos aminoácidos, que é fortemente dependente da

conformação do esqueleto principal do modelo e de características do meio. De maneira geral,

o posicionamento mais confiável das cadeias laterais é obtido com o uso de coleções de

rotâmeros (DUNBRACK; KARPLUS, 1993; LOVELL, et al., 2000). Finalmente,

inconsistências estéricas devem ser removidas do modelo, o que pode ser feito com

algoritmos de minimização de energia.

No presente trabalho, foi empregada uma metodologia desenvolvida recentemente por

Montalvão e colaboradores (2005), implementada no programa CHORAL, que faz parte do

pacote ORCHESTRARTM (TRIPOS INC.). O programa CHORAL introduz o conceito de

clusters estruturalmente conservados (SCCs), que usa o máximo de informação disponível

para a família de proteínas e também introduz novos requisitos geométricos como condição

suficiente de conservação estrutural. Esta abordagem foi planejada para melhorar o

desempenho da modelagem de famílias com baixa identidade seqüencial.


No programa CHORAL, resíduos alinhados de estruturas superpostas são definidos

como agregados quando todas as separações entre carbonos α (Cα) no ensemble ficam abaixo

de 3.6Å. Uma região em duas ou mais proteínas, de no mínimo três resíduos de comprimento,

é considerada conservada quando todos os seus resíduos são agregados e as diferenças para

todas as suas características de geometria diferencial (curvatura e torção) estão abaixo de um

limite específico. Os parâmetros de curvatura e torção são calculados a partir de três funções

paramétricas spline que ajustam as coordenadas x, y e z dos Cα com o índice do resíduo usado

como parâmetro (MONTALVÃO, 2005). Usando estes valores é possível agrupar os resíduos

para uma posição alinhada criando conjuntos de resíduos que são classificados como

geometricamente conservados. Para fazer esses agrupamentos, aplica-se um esquema

modificado do algoritmo seqüencial básico (THEODORIDIS; KOUTROUMBAS, 1998)

usando distâncias Euclideanas entre os pontos no espaço de curvatura e torção como medida

de dissimilaridade.

O próximo passo é comparar cada posição com seus vizinhos para determinar os

SCCs. Um SCC é definido como uma região de três ou mais resíduos onde todos os sub-

conjuntos são iguais. A definição do SCC é obtida das análises de similaridade construídas

usando geometria diferencial com a adição de um limite de separação Cα-Cα e o critério de

comprimento mínimo. Para a modelagem do core da proteína, o limite de separação Cα-Cα é

uma condição necessária, assim qualquer equivalência entre resíduos usando qualquer medida

interna, tal como curvatura e torção, deve ser aplicada apenas para resíduos que obedeçam a

este critério. Se as posições alinhadas forem agrupadas inicialmente pelas separações Cα-Cα

e, assim, os agrupamentos forem sub-agrupados pela distância curvatura-torção, o resultado

deve conter apenas resíduos que são geometricamente equivalentes (MONTALVÃO et al.,

2005).


Em seguida, o programa utiliza tabelas de propensão de aminoácidos com restrições

dependentes do meio (DEANE; BLUNDELL, 2001) para atribuir escores a todos os resíduos

da família de proteínas do molde no alinhamento. Assim, o escore de um determinado SCC é

uma indicação de sua propensão a representar a estrutura da seqüência alvo para aquela região

(com comprimento mínimo de três resíduos).

O processo de agrupamento cria um ensemble de SCCs sobrepostos, cada um com

geometria única, que precisa ser reduzido a uma única solução. Para isso, o programa

CHORAL aplica uma abordagem de otimização combinatória baseada em simulated

annealing (KIRKPATRICK; GELATT; VECCHI, 1983).

A etapa final é a construção das coordenadas do esqueleto principal da proteína-alvo.

O programa cria um framework F multiplicando o vetor α das coordenadas dos Cα de cada

resíduo de cada estrutura i no SCC por seu escore normalizado Si:

rii

r S αF ⋅=∑ (4)

Aplicando a Eq. (4) para todos os resíduos em todos os SCCs cria-se o framework completo

no qual os resíduos da proteína-alvo serão construídos.

A definição do SCC foi planejada especificamente para acomodar a natureza

multimodal de ensembles de proteínas pertencentes a famílias homólogas, que é característica

particular das distribuições dos Cα em superfamílias de baixa similaridade e também de

regiões de loop. Sendo assim, em avaliações feitas com diferentes conjuntos de teste a fim de

comparar o desempenho do programa CHORAL com relação ao MODELLER, os modelos

obtidos apresentaram qualidades equivalentes, mas os melhores resultados foram obtidos com

famílias em que a PID (porcentagem de identidade) média é menor que 40%. Além disso, o

programa CHORAL emprega um algoritmo muito mais rápido; o tempo de cálculo típico para


produzir cinco modelos alternativos para um determinado alvo é de menos de cinco minutos,

enquanto o programa MODELLER leva cerca de duas horas, sob as mesmas condições

(MONTALVÃO et al., 2005).

3.1.4. Validação do modelo

Os modelos produzidos com o método de modelagem por homologia devem ser

examinados à luz de todos os dados experimentais disponíveis e de técnicas de validação.

Uma das ferramentas fundamentais para avaliar a qualidade de um modelo é o mapa de

Ramachandran, que mostra a distribuição dos ângulos de torção ϕ e ψ para cada aminoácido

em uma proteína. Nesse diagrama, cujo exemplo é apresentado na Figura 9, as áreas em

branco correspondem a conformações onde os átomos em um polipeptídeo estão mais

próximos do que a soma dos seus raios de van der Waals. Essas regiões são estericamente

proibidas para todos os aminoácidos, exceto para a glicina, que não possui cadeias laterais. As

regiões em azul-ciano escuro correspondem a conformações nas quais não há impedimentos

estéricos, ou seja, são as regiões favoráveis para conformações de alfa-hélices e folhas-beta.

As áreas em azul-ciano claro mostram as regiões permitidas se raios de van der Waals

ligeiramente menores forem usados nos cálculos, ou seja, permite-se que átomos fiquem mais

próximos. Em um modelo ideal, espera-se que aproximadamente 98% dos aminoácidos

estejam nas regiões favoráveis e cerca de 2% nas regiões permitidas (LOVELL et al., 2002).


Figura 9 - Mapa de Ramachandran para a rodopsina bovina.

Informações adicionais podem ser obtidas para que o modelo seja validado em

diferentes níveis de organização estrutural, avaliando-se a qualidade do empacotamento

global da proteína, os possíveis erros estruturais em regiões localizadas e outros parâmetros


estereoquímicos como ângulos e distâncias de ligação, choques entre átomos, posicionamento

de moléculas de água, ligações de hidrogênio, etc.

Existem, ainda, experimentos de benchmarking em larga-escala que são feitos para

avaliar a qualidade relativa dos vários métodos de modelagem por homologia, tais como:

CASP (Critical Assessment of Techniques for Protein Structure Prediction), no qual

pesquisadores submetem modelos estruturais de seqüências cujas estruturas tenham sido

resolvidas recentemente, mas que ainda não foram publicadas; e CAFASP (Critical

Assessment of Fully Automated Structure Prediction), que avalia apenas modelos produzidos

via servidores completamente automatizados.

3.2. Docking ligante-receptor

Os estudos de docking ligante-receptor são utilizados para encontrar a conformação e a

orientação de um ligante com relação a um determinado receptor quando a estrutura do

mesmo é conhecida ou pode ser modelada. A partir disto, é possível estimar a força de

associação entre ligante e receptor por meio de funções de escore. Assim, o procedimento dos

estudos de docking pode ser descrito como uma combinação entre um algoritmo de busca

conformacional e uma função de escore. A abordagem mais comum é tratar o receptor como

sendo rígido e considerar apenas o espaço conformacional do ligante, embora o ideal seja

considerar também a flexibilidade do receptor (KITCHEN et al., 2004).

Neste trabalho, os estudos de docking foram feitos utilizando o programa GOLD, que

emprega um algoritmo genético para explorar o espaço conformacional do ligante e uma

função de escore baseada em campos de força. O programa GOLD permite o tratamento da

flexibilidade completa dos ligantes, bem como flexibilidade parcial do receptor - cadeias


laterais e esqueleto principal de até 10 resíduos definidos pelo usuário (JONES et al., 1997).

Os algoritmos genéticos aplicam idéias derivadas da genética e da teoria da evolução

para a busca conformacional. Estes algoritmos partem de uma população inicial de diferentes

conformações do ligante. Cada conformação é definida por um conjunto de variáveis

estabelecidas (definidos como genes) que descrevem aspectos como translação, orientação e

conformação do ligante em relação ao receptor. O conjunto completo das variáveis dos

ligantes é definido como genótipo, enquanto as coordenadas atômicas são conhecidas como

fenótipo. Operadores genéticos (mutações, crossovers e migrações) são aplicados à população

para explorar o espaço conformacional, até que seja encontrada uma população final que

otimize uma função de ajuste pré-definida (JONES; WILLETT; GLEN, 1997).

Quanto às funções de escore, de modo geral, campos de força padrões quantificam a

soma de dois tipos de energia: a energia de interação entre o receptor e o ligante e a energia

interna do ligante. As energias são normalmente avaliadas por meio de uma combinação de

termos eletrostáticos e de van der Waals. Um potencial de Lennard-Jones é usado para

descrever o termo relacionado às interações de van der Waals, enquanto o termo eletrostático

é obtido com uma função Coulômbica dielétrica dependente da distância (KITCHEN et al.,

2004; BISSANTZ; FOLKERS; ROGNAN, 2000). A função de escore do programa GOLD é

baseada em campos de força e inclui três termos: um termo para as ligações de hidrogênio,

um potencial de dispersão intermolecular 4-8 e um potencial intramolecular 6-12 para a

energia interna do ligante.


3.3. Estudos de Modelagem do Receptor 5-HT1A e seus Ligantes

O receptor 5-HT1A é um dos mais estudados membros da família dos receptores

acoplados à proteína G (GPCRs), especialmente devido à disponibilidade do ligante seletivo

8-OH-DPAT [8-hidroxi-2-(di-N-propilamino)tetralina], que permitiu extensivas

caracterizações bioquímicas, fisiológicas e farmacológicas deste receptor (ARVIDSSON et

al., 1981; GOZLAN et al., 1983). Este foi o primeiro receptor serotoninérgico a ser

completamente seqüenciado (FARGIN et al., 1988; KOBILKA et al., 1987) e também o

primeiro para o qual anticorpos policlonais foram obtidos, permitindo sua visualização no

nível sub-celular em várias regiões do cérebro (EL MESTIKAWY et al., 1990).

Como o receptor 5-HT1A apresenta relação com o desenvolvimento neuronal (DEL

OLMO et al., 1998; GROSS et al., 2002) e com a proteção para neurônios submetidos a

degeneração e apoptose (SINGH et al., 1996), o tratamento usando agonistas desses

receptores tem sido empregado em crianças com disfunções de desenvolvimento (AZMITIA,

2001). Além disso, agonistas e antagonistas do receptor 5-HT1A representam a maior classe de

moléculas com potencial terapêutico contra disfunções relacionadas à ansiedade. Desse modo,

o receptor 5-HT1A representa um importante alvo no desenvolvimento de agentes terapêuticos

para tratar disfunções neuropsiquiátricas como a ansiedade e a depressão (BLIER; DE

MONTIGNY; CHAPUT, 1990; GRIEBEL, 1990; PUCADYIL; KALIPATNAPU;

CHATTOPADHYAY, 2005).

Até o presente momento, nenhuma estrutura de alta resolução deste receptor foi obtida

por técnicas como cristalografia de raios-X, espectroscopia de ressonância magnética ou

microscopia eletrônica. As informações estruturais obtidas por métodos complementares

indicam que o receptor é constituído por 422 aminoácidos, distribuídos em sete domínios

transmembrânicos, cada um com aproximadamente 25 resíduos (RAYMOND et al., 1999). As


α-hélices são conectadas por 6 loops, sendo três intracelulares e três extracelulares,

apresentando o resíduo N-terminal fora da célula e o resíduo C-terminal no lado

citoplasmático. Esta topologia faz com que o receptor 5-HT1A seja classificado como

pertencente à família A dos GPCRs (GETHER, 2000).

A determinação da estrutura cristalográfica do receptor 5-HT1A (e dos GPCRs em

geral) é dificultada por duas razões. Primeiro, porque é difícil expressar uma quantidade

suficiente desse receptor e, segundo, porque a conformação natural dos GPCRs – com sete

domínios transmembrânicos introduzidos dentro e fora da superfície celular – é difícil de ser

reproduzida nas condições de cristalização. Por isso, para obterem-se novos conhecimentos

sobre estes importantes alvos biológicos, a utilização de métodos computacionais torna-se

extremamente importante, com a construção de modelos preditivos e o estudo de suas

interações com ligantes conhecidos (THIEL, 2004).

Alguns modelos do receptor 5-HT1A foram construídos em trabalhos anteriores

utilizando diferentes abordagens. Entretanto, as conclusões destes trabalhos divergem quanto

ao posicionamento dos ligantes no sítio de interação. Embora sejam a maior e mais estudada

classe de ligantes do receptor 5-HT1A, os modos de interação das arilpiperazinas permanece

ambíguo.

Duas metodologias complementares foram usadas até agora na investigação da

interação desses ligantes com o receptor. Experimentos de mutagênese sítio-dirigida

sugeriram que os resíduos Asp3.32, Asn7.39, Ser5.42 e Thr5.43 podem estar envolvidos na

interação com ligantes (GUAN; PEROUTKA; KOBILKA, 1992; LIAPAKIS et al., 2000;

STRADER et al., 1989). A interação entre o nitrogênio protonado da arilpiperazina e o


resíduo Asp3.32 foi considerada crucial para todos os receptores de neurotransmissores

monoaminérgicos (STRADER et al., 1988).1

Por outro lado, métodos de modelagem molecular foram empregados para construir

modelos tridimensionais do receptor 5-HT1A. Os primeiros esforços para modelar este

receptor datam do começo dos anos 90, quando a bacteriorodopsina foi usada como molde

(HEDBERG et al., 1996; HOMAN; WIKSTROM; GROL, 1999; KUIPERS et al., 1995;

SYLTE; EDVARDSEN; DAHL, 1993; TRUMPP-KALLMEYER et al., 1992). Com a

publicação das coordenadas do mapa de projeção da rodopsina em 1997 (BALDWIN;

SCHERTLER; UNGER, 1997) e a resolução da estrutura cristalográfica da rodopsina bovina

em 2000 (PALCZEWSKI et al., 2000), esta tornou-se o molde preferencial na modelagem de

GPCRs. Recentemente, no final do ano de 2007, foi determinada a estrutura cristalográfica do

receptor adrenérgico-β2 complexado com o ligante carazolol, que deve tornar-se um

importante molde para os GPCRs (CHEREZOV et al., 2007; RASMUSSEN et al., 2007).

Desde 1997, Sylte e colaboradores têm apresentado uma série de modelos do receptor

5-HT1A construídos utilizando o mapa de projeção da rodopsina (SYLTE et al., 1997) e, mais

tarde, a estrutura cristalográfica da rodopsina (BRONOWSKA et al., 2001). Os modelos

foram obtidos por meio de modelagem por homologia e, posteriormente, equilibrados em uma

série de simulações de dinâmica molecular (DM). Dois modos de interação possíveis foram

propostos para análogos da buspirona, baseados nas simulações de DM dos complexos

ligante-receptor, ambos considerando Asp3.32 como ponto de ancoragem para o nitrogênio

protonado do ligante. No primeiro modo de interação, um ligante é posicionado dentro de

uma cavidade profunda entre as hélices transmembrânicas (HTMs) 2, 3 e 7. Esse modo

assume uma conformação estendida para os ligantes estudados. No segundo modo, a

1 A fim de facilitar a comparação entre todos os estudos, adotamos neste trabalho a nomenclatura de Ballesteros-Weinstein para os aminoácidos das hélices transmembrânicas (BALLESTEROS; WEINSTEIN, 1996). Nesta nomenclatura, cada resíduo é identificado pela hélice em que se encontra e pela posição com relação ao resíduo mais conservado na hélice (numerado arbitrariamente como 50).


conformação dos análogos da buspirona é dobrada devido às torções das ligações do

espaçador alquílico que liga o anel piperazínico ao grupo imida. O anel aril do ligante alcança

o resíduo Phe6.61 e outros aminoácidos nas HTMs 5, 6 e 7, enquanto o oxigênio carboxílico

da imida pode formar uma ligação de hidrogênio com Ser7.46.

No modelo apresentado por Lopez-Rodriguez e colaboradores (2001b), certas

modificações foram introduzidas na estrutura do feixe das 7 hélices transmembrânicas. Neste

modelo, HTM3 é significativamente curvada na direção de HTM5. Esta modificação reduz as

distâncias Asp3.32-Ser5.42 e Asp3.32-Thr5.43, possibilitando interações concorrentes do

grupo amina do ligante com Asp3.32 e do grupo amida com Ser5.42 e Thr5.43. Esta

conformação da HTM3 foi obtida agrupando a trajetória da DM e foi resultado da

modificação dos ângulos ϕ e ψ dos resíduos 3.35 e 3.46. O modo de interação proposto neste

estudo é diferente daqueles propostos por Sylte e colaboradores (1997) e assume que o grupo

arilpiperazínico é localizado entre as hélices HTM3 e HTM7. A porção aromática do ligante

pode interagir com Phe3.28, Trp7.40 e Tyr7.43, enquanto os substituintes no anel aril

interagem com Asn7.39. Os grupos carbonila do grupo hidantoína do ligante formam ligações

de hidrogênio com Ser5.42, Thr5.43, Thr3.37 e Trp6.48 e o substituinte imida é posicionado

dentro da cavidade entre TMH4 e TMH6.

Um modelo publicado por Seeber e colaboradores (SEEBER; DE BENEDETTI;

FANELLI, 2003) foi usado em estudos de simulação de DM das variações conformacionais

induzidas por agonistas e antagonistas. A posição dos ligantes no receptor, determinada pelo

derivado arilpiperazínico WAY100635 por meio de docking automático é similar ao proposto

por Lopez-Rodriguez e colaboradores (2001b), mas a orientação do ligante e,

conseqüentemente, as interações específicas, são opostas. O grupo 2-metoxifenilpiperazina do

ligante é posicionado na cavidade de interação formada pelas TMH4 e TMH6, enquanto o


nitrogênio do anel piridínico substituído no fragmento amida forma uma ligação de

hidrogênio com o nitrogênio da cadeia lateral do Asn7.39.

Posteriormente, Nowak e colaboradores (2006) empregaram uma metodologia

diferenciada para obter uma descrição detalhada dos modos de interação, que consistiu de três

passos básicos: (a) geração de uma extensa população de modelos para explorar o espaço

conformacional do receptor, (b) docking automático de ligantes rígidos em todos os modelos

gerados visando a seleção do melhor ajuste conformacional entre ligante e receptor e (c)

modificação do receptor para desenvolver modelos que descrevessem adequadamente a

interação com ligantes. Os resultados obtidos são consistentes com os propostos por Seeber e

colaboradores (2003); entretanto, um número maior de interações específicas foi descrito,

especialmente aquelas responsáveis pelo reconhecimento da porção aromática dos ligantes.

Outro modelo tridimensional do receptor 5-HT1A foi construído e validado por estudos

de docking e simulações de DM da interação com o agonista natural - a serotonina - e os

enantiômeros do 8-OH-DPAT (DABROWSKA; BRYLINSKI, 2006). Os resultados obtidos,

confirmados por ensaios bioquímicos, enfatizam os diferentes perfis farmacológicos desses

compostos. Diferentemente do enantiômero-S, o R-8-OH-DPAT atua como um potente

agonista total, enquanto a forma racêmica apresenta perfil similar ao do enantiômero-R. Os

autores apontam o papel fundamental dos resíduos Ser5.42 e Thr5.43 na interação com a

serotonina, em concordância com os estudos de mutagênese sítio-dirigida (GUAN;

PEROUTKA; KOBILKA, 1992; LIAPAKIS et al., 2000; STRADER et al., 1989), assim

como interações (do tipo aromatic stacking) entre os anéis aromáticos do ligante e os anéis

dos resíduos Phe6.51 e Phe6.52. Esta interação também foi observada no caso dos

enantiômeros do 8-OH-DPAT, o que indica uma importante contribuição de interações

hidrofóbicas para a afinidade, conforme observado em outro estudo sobre a porção

hidrofóbica do sitio de interação do receptor 5-HT1A (ZLATOVIC et al., 2006).

4. Objetivos 58

4. OBJETIVOS

4.1. Objetivo Geral

Investigar teoricamente as interações observadas experimentalmente entre compostos

derivados de arilpiperazinas com o receptor 5-HT1A, cujo antagonismo é relacionado a um

aumento de eficácia da farmacoterapia antidepressiva, a fim de possibilitar um maior

entendimento das características importantes para tais interações.

4.2. Objetivos Específicos

- Partindo das estruturas otimizadas dos compostos, calcular propriedades eletrônicas,

estéricas e topológicas para determinar quais as características que discriminam os

compostos com maior e menor afinidade pelos receptores 5-HT1A.

- Obter modelos teóricos da relação qualitativa (SAR) e quantitativa (QSAR) bi- e

tridimensionais entre as afinidades pelos receptores 5-HT1A, determinadas

experimentalmente, e os parâmetros calculados que descrevem os aspectos

eletrônicos, estéricos e/ou topológicos dos compostos estudados.

- Modelar a estrutura de alguns compostos arilpiperazínicos e do receptor 5-HT1A, bem

como do complexo ligante-receptor, a fim de verificar os principais modos de

interação entre esses ligantes e o receptor.

5. Metodologia 59

5. METODOLOGIA

A fim de obter um maior entendimento das interações entre o receptor 5-HT1A e

compostos arilpiperazínicos, foram realizados inicialmente estudos de QSAR 2D e 3D. O

primeiro deles foi um estudo quimiométrico feito com base em descritores teóricos. No

segundo estudo, foi empregado o método de QSAR por hologramas (HQSAR) e, no terceiro

estudo, o método de QSAR 3D CoMFA.

Em cada um desses estudos, um conjunto de compostos com valores de afinidade pelo

receptor 5-HT1A medidos sob as mesmas condições experimentais foi selecionado da

literatura para compor o conjunto de dados. Esse conjunto foi dividido em conjunto de

treinamento, para a construção do modelo QSAR e conjunto de teste, para a validação

externa do modelo obtido. Inicialmente, a abordagem de validação interna conhecida como

validação cruzada LOO (leaving-one-out) foi empregada sobre os modelos obtidos. Em

seguida, o poder preditivo dos modelos foi avaliado empregando o conjunto de teste e, por

fim, o teste de scrambling progressivo foi empregado para avaliar a estabilidade dos modelos

resultantes.

Essas análises da relação estrutura-atividade foram complementadas com a

modelagem por homologia do receptor 5-HT1A, seguida de estudos de docking ligante-

receptor efetuados para alguns ligantes selecionados. As características do sítio de interação

modelados dessa forma foram confrontadas especialmente com os resultados obtidos com o

método de QSAR 3D, que fornece uma representação tridimensional das características

consideradas importantes para a afinidade pelo receptor 5-HT1A. Os detalhes computacionais

de cada um desses estudos, assim como os resultados obtidos, serão apresentados nos

capítulos subseqüentes.

6. Estudo Quimiométrico dos Compostos Arilpiperazínicos 60

6. ESTUDO QUIMIOMÉTRICO DOS COMPOSTOS ARILPIPERAZÍN ICOS

Neste capítulo, serão apresentados os resultados do estudo quimiométrico realizado

com o objetivo de construir modelos qualitativos e quantitativos da relação estrutura-atividade

de um conjunto de compostos arilpiperazínicos com afinidade pelo receptor 5-HT1A

(WEBER; DA SILVA, 2008). Com o intuito de identificar descritores teóricos que pudessem

ser relacionados com as afinidades apresentadas por esses compostos, foi calculada uma

grande quantidade de descritores eletrônicos, estruturais e topológicos para serem utilizados

em análises realizadas com os métodos quimiométricos PCA (Análise de Componentes

Principais), HCA (Análise Hierárquica de Agrupamentos), KNN (K-ésimo vizinho mais

próximo), SIMCA (Modelagem Independente por Analogia de Classes) e PLS (Mínimos

Quadrados Parciais), de acordo com o procedimento descrito a seguir.

6.1. Procedimento Computacional

Dos compostos arilpiperazínicos sintetizados por Martínez-Esparza e colaboradores

(2001), foram selecionados 52 compostos para constituir o conjunto de treinamento

(mostrados na Tabela 1) e 14 compostos para fazerem parte do conjunto de teste, para a

validação externa dos modelos obtidos (ver Tabela 2). A escolha dos compostos foi feita de

maneira que os dois conjuntos apresentassem diversidade estrutural e uma boa distribuição da

propriedade biológica (valores de pKi, variando entre 5,30 e 8,30). O conjunto de compostos

foi dividido em duas classes: compostos com valores de pKi > 6,70 foram considerados como

compostos com afinidades maiores pelo receptor 5-HT1A (Classe 1) e aqueles com pKi < 6,70

foram considerados compostos com afinidades menores pelo receptor 5-HT1A (Classe 2).


Tabela 1. Estruturas químicas e valores de pKi dos compostos do conjunto de treinamento

Composto Estrutura geral R Z Ar1 pKi

1 H CHOH 2-metoxifenil 7.32 2 H CHO-4-

CF3C6H4 2-metoxifenil 6.35

3 H CNOH 2-metoxifenil 7.76 4 H CO 4-clorofenil 6.10 5 H CHO-4-

CH3C6H4 4-clorofenil 5.84

6 H CHO-3,4-OCH2OC6H3

4-clorofenil 6.26

7 H CO 4-metoxifenil 5.30 8 H CHOH 4-metoxifenil 5.30 9 H CO 2-clorofenil 6.74 10 H CHOH 2-clorofenil 6.94 11 H CHO-4-

CF3C6H4 2-clorofenil 5.30

12 H CO 4-fluorofenil 6.10 13 H CHO-4-

CF3C6H4 4-fluorofenil 5.30

14 H CO 2-piridil 7.30 15 H CHOH 2-piridil 6.81 16 H CO 4-nitrofenil 5.30 17 H CHOH 4-nitrofenil 5.30 18 H CHO-4-

CF3C6H4 4-nitrofenil 5.30

19 fenil CO 2-metoxifenil 5.44 20 fenil CHO-4-


21 metóxi CO 2-metoxifenil 5.76 22 metóxi CHOH 2-metoxifenil 6.49 23

NN

R

zAr1

metóxi CHO-4-CF3C6H4

2-metoxifenil 6.00

24 H CHOH 2-metoxifenil 7.30 25 H CHO-4-


26 H CNOH 2-metoxifenil 8.19 27 H CO 4-clorofenil 6.15 28 H CO 2-clorofenil 6.70 29 H CHOH 2-clorofenil 6.70 30 H CO 1-naftil 7.46 31 2,5-

dimetil CO 2-metoxifenil 8.30

32 2,5-dimetil

CO 2-metoxifenil 8.12

33 2,5-dimetil

CHOH 2-metoxifenil 7.04

34

Ar1

S

NN

zR

2,5-dimetil

CO 1-naftil 7.00

35 H CO 2-metoxifenil 8.00 36 H CHOH 2-metoxifenil 7.72 37 H CO 4-clorofenil 5.30 38 H CHOH 4-clorofenil 5.30 39

S

Ar1N

N

R

z

5-metil CO 2-metoxifenil 7.76 40 H CHOH 2-metoxifenil 6.38 41 H CO 4-clorofenil 5.30 42

Ar1N

NR z

H CHOH 4-clorofenil 5.30


Tabela 1. continuação. 43 H CO 2-metoxifenil 7.36 44 H CHOH 2-metoxifenil 7.70 45 H CO 4-clorofenil 5.30 46 H CHOH 4-clorofenil 5.30 47 H CO 2-hidroxifenil 6.96 48 H CHOH 2-hidroxifenil 7.74 49 H CO 4-cloro-2-

metoxifenil 6.30

50 H CHOH 4-cloro-2-metoxifenil

6.44

51 H CHOH 4-fluoro-2-metoxifenil

6.30

52

S

NNR

zAr1

H CO 1-naftil 7.00 Tabela 2. Estruturas e valores de pKi dos compostos do conjunto de teste

Composto Estrutura geral R Z Ar1 pKi

53 H CO 2-metoxifenil 7.30 54 H CHOH 4-clorofenil 6.10 55 H CHO-4-

CF3C6H4 4-methoxyphenyl 5.30

56 H CO 2-pirimidil 6.92 57 H CHO-4-

CF3C6H4 2-pirimidil 5.80

58 H CHO-4-CF3C6H4

2-piridil 5.80

59

NN

R

zAr1

fenil CHOH 2-metoxifenil 6.07 60 H CO 2-metoxifenil 7.80 61 H CHOH 4-clorofenil 5.56 62

Ar1

S

NN

zR

2,5-dimetil CHOH 2-metoxifenil 7.92

63 5-metil CHOH 2-metoxifenil 7.47 64

S

Ar1N

N

R

z

5-nitro CO 2-metoxifenil 6.47

65 Ar1N

NR z

H CO 2-metoxifenil 6.60

66

S

NNR

zAr1

H CO 4-fluoro-2-metoxifenil

6.30


6.1.1. Otimização das geometrias e cálculo dos descritores moleculares

As estruturas de todos os compostos foram inicialmente otimizadas com o método de

mecânica molecular MM+ (ALLINGER; YUH; LII, 1989; HYPERCUBE, 1995). Uma

otimização final da geometria foi realizada utilizando o método semi-empírico AM1

(DEWAR et al., 1985; GAUSSIAN, 2004). Para estas estruturas, foram calculados 10

descritores eletrônicos com o método AM1 e 567 descritores 2D com o programa Dragon 2.1

(TODESCHINI; CONSONNI; PAVAN, 2002). Todos esses descritores representam

propriedades eletrônicas, estruturais e topológicas que podem ser correlacionadas às

afinidades pelo receptor 5-HT1A observadas experimentalmente. As análises quimiométricas

foram realizadas com o programa Pirouette 3.11 (INFOMETRIX, 2002a).

6.1.2. Seleção de descritores

Com o objetivo de reduzir o grande número de descritores obtidos, foram calculados

os pesos de Fisher de cada descritor, a fim de selecionar aqueles que apresentassem os

melhores potenciais discriminatórios para distinguir os compostos com maiores e menores

afinidades (BRUNS; FAIGLE, 1985; LIN; LI; TSAI, 2004). O peso de Fisher, W1-2, para o i-

ésimo descritor e para amostras pertencentes às classes 1 e 2 é calculado pela Eq. (5):

)2()1(

)]2()1([)(

22

2

21ii

ii

SS

XXiW

+−

=− (5)


onde iX são os valores médios para amostras de cada classe e Si2 são os valores das

variâncias de cada classe.

Os 20 descritores apresentando valores considerados significativos para os pesos de

Fisher, ou seja, W1-2 > 1,00, foram selecionados. Após este procedimento, foram testadas

diferentes combinações destes descritores até que boas separações nos métodos HCA e PCA

fossem obtidas, sem que nenhuma amostra tivesse sido alocada em um grupo incorreto. Os

melhores modelos HCA e PCA foram obtidos com as seguintes variáveis: AECC, ICR,

HVcpx, MATS5v, GATS5e, GGI5, JGI5, JGI8 e H3m. Os tipos e as definições destes

descritores são listados na Tabela 3. AECC, ICR e HVcpx são índices topológicos obtidos da

teoria dos grafos moleculares (KOSTANTINOVA, 1996; RAYCHAUDHURY, 1984);

MATS5v e GATS5e são descritores de auto-correlação 2D, também obtidas desta teoria,

somando-se os produtos dos pesos atômicos dos átomos terminais de todos os caminhos do

comprimento de caminho considerado (MORAN, 1950; GEARY, 1954); GGI5, JGI5 e JGI8

são índices topológicos de carga de Gálvez, que avaliam as transferências de carga entre pares

de átomos e as transferências de carga globais na molécula (GALVEZ et al., 1994); e,

finalmente, H3m é um descritor do tipo GETAWAY, calculado dos elementos da matriz de

leverage obtidos pelas coordenadas atômicas centradas, pesado pelas massas atômicas

(CONSONNI; TODESCHINI; PAVAN, 2002, CONSONNI et al., 2002).

Todas as análises foram realizadas após o auto-escalamento dos valores das variáveis

para que fosse dada a mesma importância para todas. Assim, é possível garantir que as

influências relativas de diferentes variáveis em todos os cálculos sejam independentes de suas

unidades (SHARAF; ILLMAN; KOWALSKI, 1986).


Tabela 3. Descritores selecionados e suas definições

Descritor Tipo Definição

AECC Average eccentricity

ICR Radial centric information index

HVcpx

topológico

Graph vertex complexity index

MATS5v Moran autocorrelation - lag 5 / weighted

by atomic van der Waals volumes

GATS5e

auto-correlações 2D Geary autocorrelation - lag 5 / weighted

by atomic Sanderson electronegativities

GGI5 Topological charge index of order 5

JGI5 Mean topological charge index of order 5

JGI8

índice topológico de carga de

Gálvez Mean topological charge index of order 8

H3m GETAWAY H autocorrelation of lag 3 / weighted by

atomic masses

6.1.3. Análises quimiométricas

Os métodos quimiométricos empregados neste trabalho podem ser classificados em

três categorias: reconhecimento de padrões não-supervisionado (HCA e PCA),

reconhecimento de padrões supervisionado (KNN e SIMCA) e calibração multivariada

(PLS). O método HCA foi útil para definir as classes às quais os compostos pertenceriam e o

método PCA forneceu um conhecimento inicial da estrutura básica do conjunto de dados. Os

métodos KNN e SIMCA, que são baseados na hipótese de que quanto mais próximas estão as

amostras no espaço das variáveis, maior é a probabilidade de que elas pertençam à mesma

classe, foram utilizados para construir modelos de classificação para os compostos


arilpiperazínicos. A regressão PLS foi realizada para obter-se um modelo quantitativo da

relação estrutura-atividade para as afinidades pelo receptor 5-HT1A apresentadas pelos

compostos em estudo. Com exceção do método HCA, cada um destes métodos foi utilizado

neste trabalho em duas etapas. Primeiro, um modelo foi construído e refinado com base no

conjunto de treinamento e, em seguida, foi usado para fazer predições sobre os compostos do

conjunto de teste (validação externa do modelo).

6.2. Resultados e Discussão

6.2.1. Reconhecimento de padrões não-supervisionado

O objetivo destas análises é encontrar agrupamentos de amostras no espaço das

variáveis, que reflitam a existência de inter-relações significativas. A existência de

agrupamentos em um conjunto de dados é avaliada sem usar informação da classe a que as

amostras pertencem (SHARAF; ILLMAN; KOWALSKI, 1986).

Análise Hierárquica de Agrupamentos

Na metodologia HCA, as distâncias entre pares de amostras são calculadas e

comparadas. Pequenas distâncias entre amostras implicam que elas são similares. Por outro

lado, amostras dissimilares serão separadas por distâncias relativamente maiores. O método

HCA começa com cada amostra sendo definida como seu próprio agrupamento e, então, vai


unindo amostras semelhantes para formar novos agrupamentos até que todas as amostras

façam parte de um único agrupamento. O propósito principal do HCA é representar os dados

de maneira que os agrupamentos naturais sejam enfatizados atribuindo, assim, categorias às

quais as amostras pertençam. A visualização dos grupos correspondentes às diferentes classes

é realizada na forma de dendrogramas, que são gráficos onde estas classes podem ser

facilmente identificadas. Diferentes dendrogramas podem ser obtidos de acordo com as

técnicas usadas para unir os agrupamentos (SHARAF; ILLMAN; KOWALSKI, 1986).

A Figura 10 mostra o dendrograma das amostras obtido com a conexão incremental.

As ramificações à esquerda do dendrograma representam os compostos do conjunto de

treinamento. O comprimento das ramificações que ligam dois agrupamentos está relacionado

às suas similaridades. Quanto maior a ramificação, menor a similaridade; quanto menor a

ramificação, maior a similaridade e, conseqüentemente, menor a distância entre os

agrupamentos. A similaridade é representada no topo do gráfico, com um valor de 1,0

correspondendo a uma duplicata exata e 0,0 indicando distância e dissimilaridade máximas

(INFOMETRIX, 2002b).


Figura 10 - Dendrograma para os compostos do conjunto de treinamento, obtido com a conexão incremental.

Na Figura 10, os compostos do conjunto de treinamento aparecem agrupados em dois

grupos: Grupo 1, caracterizado pelos compostos de maiores afinidades (compostos 1, 3, 9,

10, 14, 15, 24, 26, 28-36, 39, 43, 44, 47, 48 e 52), e Grupo 2, contendo os compostos de

menores afinidades (compostos 2, 4-8, 11-13, 16-23, 25, 27, 37, 38, 40-42, 45, 46 e 49-51). O

Grupo 2 divide-se em dois sub-grupos: sub-grupo 2a, no qual os substituintes Z são grupos

CO ou CHOH (ver estruturas na Tabela 1) e sub-grupo 2b, no qual a maioria dos compostos

apresenta como característica comum substituintes Z volumosos. Outras características podem

ser observadas nestes grupos: no Grupo 1, quase todos os compostos apresentam como

substituinte Ar1 um grupo 2-metóxifenil ou 2-hidróxifenil, enquanto no Grupo 2, a maioria


dos compostos apresenta um grupo 4-clorofenil ou 4-fluorofenil como Ar1. Além disso, a

maioria dos compostos apresenta um anel tiofeno com substituições em diferentes posições ou

fundido com um anel benzeno. Estes resultados estão de acordo com estudos SAR anteriores,

que indicam que uma substituição na posição orto de Ar1 é favorável para altas afinidades

pelo receptor 5-HT1A, assim como a presença de um anel tiofeno na molécula (GAILLARD et

al., 1996; LÓPEZ-RODRÍGUEZ et al., 2001b; MARTÍNEZ-ESPARZA et al., 2001).

Uma vez que os compostos aparecem agrupados de acordo com seus valores de pKi

(Grupo 1, pKi > 6,70 e Grupo 2, pKi < 6,70), as classes dos compostos em todas as análises

realizadas neste trabalho foram atribuídas seguindo este critério, assim a Classe 1 corresponde

ao Grupo 1 e a Classe 2 corresponde ao Grupo 2.

Análise de Componentes Principais

A Análise de Componentes Principais (PCA) é uma manipulação matemática da

matriz de dados em que o objetivo é representar a variação contida em muitas variáveis

usando um número pequeno de componentes principais (PCs). O método PCA encontra

combinações lineares das variáveis independentes originais que contenham quantidades

máximas de variação. Assim, a projeção das amostras neste novo espaço formado pelas duas

ou três primeiras PCs (colocadas nos eixos ao invés das variáveis originais) garante que a

visualização das relações entre amostras seja ótima do ponto de vista da variância

representada. É importante mencionar que em dados multivariados, nenhuma das variáveis

originais descreve completamente a variação no conjunto de dados. Entretanto, a primeira

componente principal é calculada de maneira que ela descreva a variação no conjunto de

dados mais do que qualquer uma das variáveis originais. Assim, o método PCA fornece a


melhor visualização possível da variabilidade nas variáveis independentes, o que revela se há

agrupamentos naturais no conjunto de dados e se existem amostras anômalas (outliers). Pode-

se também atribuir significado químico (ou biológico, ou físico) aos padrões que emergem da

análise PCA. Finalmente, um modelo PCA pode ser construído para servir como parâmetro

para comparações com amostras desconhecidas (BEEBE; PELL; SEASHOLTZ, 1998;

BRERETON, 1992).

A Figura 11 ilustra o gráfico de escores das duas primeiras PCs, obtido com a

combinação das nove variáveis citadas anteriormente (ver Tabela 3). Juntas, estas

componentes contêm 83% da variância total dos dados originais, fornecendo assim uma

representação confiável dos mesmos. Na Figura 11 é possível perceber que PC1 separa o

conjunto de dados nos mesmos dois grupos que o método HCA: Grupo 1 (maiores

afinidades) e Grupo 2 (menores afinidades).

Figura 11 - Gráfico de escores de PC2 versus PC1 para os compostos do conjunto de treinamento.


A Tabela 4 mostra os loadings de cada variável em PC1 e PC2. Pode-se observar que

todas as variáveis possuem importância semelhante para PC1, com contribuições maiores das

variáveis GGI5, HVcpx, ICR e AECC. Por outro lado, o descritor de auto-correlação 2D,

GATS5e, apresenta a maior contribuição para PC2.

Tabela 4. Loadings das variáveis em cada PC

PC1 PC2

AECC 0.36 0.30 ICR 0.37 0.04 HVcpx 0.37 0.27 MATS5v 0.25 -0.60 GATS5e -0.24 0.59 GGI5 0.37 0.21 JGI5 0.29 -0.26 JGI8 0.35 0.08 H3m 0.36 0.10

O modelo PCA obtido com estas variáveis foi submetido a dois procedimentos de

validação: validação cruzada e validação externa com o conjunto de teste da Tabela 2. A

validação cruzada (leaving-one-out) resultou em 100% de informação correta, ou seja,

nenhum composto foi alocado incorretamente. A projeção dos compostos do conjunto de teste

no espaço das PCs é mostrada na Figura 12.


Figura 12 - Gráfico de escores para a predição feita pelo PCA para os compostos do conjunto de teste.

O propósito da predição no método PCA é decidir se a amostra desconhecida difere

significativamente do conjunto de treinamento ou não. Esta decisão é baseada principalmente

na magnitude dos resíduos quando a amostra desconhecida é projetada no espaço das PCs do

modelo, ou seja, amostras significativamente diferentes apresentarão resíduos altos. Para a

predição do método PCA, uma caixa em torno dos escores em cada PC baseada nos valores

do conjunto de treinamento é construída. Para cada PC, o limite inferior para os escores é:

tlower scttt *min)lim( −= (6)

e o limite superior é:

tupper scttt *max)lim( += (7)


onde tmin e tmax são os valores máximos e mínimos dos escores, st é o desvio padrão dos

escores, t* é um valor t com graus de liberdade baseados no número de amostras do conjunto

de treinamento e c é uma constante chamada de multiplicador do desvio padrão, que pode ser

variada para contrair ou expandir os limites tmin e tmax escolhendo-se um valor negativo ou

positivo, respectivamente (INFOMETRIX, 2002b). Na Figura 12, a caixa formada pelos

limites superior e inferior é representada pelo retângulo ao redor das amostras. Os cinco

compostos com maiores afinidades pelo receptor 5-HT1A do nosso conjunto de teste estão

posicionados na mesma região correspondente ao Grupo 1 do conjunto de treinamento, da

mesma maneira que os compostos com menores afinidades estão na região do Grupo 2.

Assim, tanto a validação externa quanto a validação cruzada indicam que nosso modelo PCA

apresenta boa habilidade preditiva. Como os compostos do conjunto de teste mostraram-se

similares aos do conjunto de treinamento, podem ser considerados bastante adequados para

serem usados na validação externa de todos os modelos obtidos neste trabalho.

6.2.2 Reconhecimento de padrões supervisionado

Nos métodos de reconhecimento de padrões supervisionado, utiliza-se a informação

sobre as classes a que pertencem as amostras do conjunto de treinamento. O objetivo principal

é desenvolver uma regra que classifique estas amostras corretamente e então aplicar esta regra

para a classificação de amostras desconhecidas (SHARAF; ILLMAN; KOWALSKI, 1986).


Resultados do KNN

No método KNN, a distância Euclidiana separando cada par de amostras no conjunto

de treinamento é calculada e armazenada em uma tabela de distâncias. A classe à qual a

maioria dos vizinhos mais próximos pertence é atribuída para cada uma das amostras. Assim,

o modelo de classificação obtido pode ser usado para a predição das classes de amostras

desconhecidas (BEEBE; PELL; SEASHOLTZ, 1998).

Os descritores selecionados com os métodos HCA e PCA foram utilizados na análise

KNN. A Tabela 5 apresenta o sumário da classificação obtido com até nove vizinhos mais

próximos. Todos os compostos do conjunto de treinamento foram classificados corretamente,

o que mostra que as classes são bem distintas e que as variáveis selecionadas possuem boa

habilidade para a discriminação entre as classes de compostos.

Tabela 5. Sumário da classificação KNN para os compostos do conjunto de treinamento

Compostos classificados incorretamente Classe

Número de membros 1NN 3NN 5NN 7NN 9NN

1 23 0 0 0 0 0

2 29 0 0 0 0 0

Total 52 0 0 0 0 0

Informação correta 100% 100% 100% 100% 100%

Uma validação externa deste modelo foi realizada. Conforme mencionado

anteriormente, o critério utilizado para dividir o conjunto de treinamento em duas classes foi

utilizado também para atribuir as classes para o conjunto de teste, ou seja, compostos com pKi

> 6,70 pertencem à Classe 1 e compostos com pKi < 6,70 pertencem à Classe 2. Nenhum erro

de predição foi encontrado quando computadas as distâncias para 1, 3, 5, 7 e 9 vizinhos mais


próximos. Os cinco compostos com maiores afinidades do conjunto de teste foram

classificados corretamente como pertencentes à Classe 1 e os nove compostos com menores

afinidades foram alocados na Classe 2. Isto indica que um modelo de classificação confiável e

preditivo foi obtido.

Resultados do SIMCA

O método SIMCA desenvolve modelos de componentes principais para cada classe do

conjunto de treinamento. Quando os valores das variáveis independentes de uma nova

amostra são projetados no espaço das componentes principais de cada classe, a nova amostra

é alocada na classe a que se ajustar melhor. Além de construir um modelo de classificação

para ser usado para predição de amostras desconhecidas, o método SIMCA também fornece

ferramentas de diagnóstico relacionadas a outros aspectos interessantes da classificação, tais

como poder discriminante e poder de modelagem das variáveis, distâncias entre classes e

detecção de outliers. Além disso, uma importante característica do SIMCA é sua capacidade

de fazer predições mais realistas do que o KNN. Este último aloca cada amostra a exatamente

uma classe do conjunto de treinamento (a classe dos vizinhos mais próximos), enquanto o

SIMCA é capaz de identificar se a amostra não pertence a nenhuma das classes ou se pode ser

membro de ambas as classes, uma vez que os resultados são expressos em termos

probabilísticos (BEEBE; PELL; SEASHOLTZ, 1998).

O melhor modelo SIMCA foi construído com os mesmos descritores do HCA, do PCA

e do KNN. A Figura 13 apresenta as distâncias das amostras às classes calculadas de acordo

com os resíduos das amostras quando elas são ajustadas às classes. Este gráfico é dividido por

duas linhas que representam valores críticos de variâncias residuais. Compostos posicionados


no quadrante noroeste (NW) pertencem apenas à classe correspondente ao eixo-x, pois elas

estão a distâncias pequenas o suficiente para serem consideradas membros desta classe. Da

mesma forma, compostos no quadrante sudeste (SE) são membros apenas da classe do eixo-y.

Compostos no quadrante sudoeste (SW) podem pertencer a ambas as classes, enquanto

aquelas no quadrante nordeste (NE) pertencem a nenhuma das classes. Na Figura 13 é

possível ver os 29 compostos com menores afinidades no quadrante SE, o que significa que

eles podem pertencer à Classe 2 apenas. Por outro lado, há 12 compostos com maiores

afinidades no quadrante NW (Classe 1, apenas), enquanto o método SIMCA considera que 11

compostos apresentam probabilidade de pertencerem não somente à Classe 1 mas também à

Classe 2 (uma vez que estão posicionados no quadrante SW).

Figura 13 - Distâncias dos compostos às classes obtidas para o conjunto de treinamento.

Este modelo foi empregado também para fazer predições sobre o conjunto de teste.

Para este conjunto, nenhum composto foi predito como não pertencente a uma das classes ou


como membro de ambas as classes. Assim como o modelo KNN apresentado anteriormente, a

análise SIMCA resultou em um modelo preditivo.

Outras tendências nos dados podem ser analisadas com o método SIMCA. A distância

entre as classes, que é uma medida da separação (distinção) entre as classes, foi calculada para

o nosso modelo como sendo igual a 6,22, mostrando que as classes são bem distintas - em

quimiometria, uma regra prática diz que duas classes podem ser consideradas separáveis

quando a distância entre as classes for maior do que 3 (BRERETON, 1992). Considerando as

medidas de importância das variáveis, o descritor mais importante para a separação das

classes é GATS5e, que apresenta o Poder Discriminante mais alto. O descritor que apresenta

o Poder de Modelagem mais alto é AECC, o que significa que esta é a variável que melhor

descreve a informação contida nas duas classes do conjunto de treinamento.

6.2.3. Regressão PLS

O método quimiométrico de regressão PLS foi utilizado neste trabalho para modelar a

variável dependente (pKi), Y, usando um conjunto de variáveis independentes (Xi),

representando as estruturas químicas dos compostos em estudo. Da mesma maneira que o

PCA, o método PLS encontra combinações lineares das variáveis independentes originais que

contenham quantidades máximas de variação. Entretanto, no método PLS, a matriz de

loadings é definida de forma que não apenas a variância seja maximizada, mas também o

produto da variância pela correlação com Y seja otimizada. Assim, na forma matricial, a

equação de regressão é dada por:

FXβY += (8)


onde β é o vetor de regressão e F representa os erros na estimativa de Y.

O melhor modelo é escolhido com base na soma dos quadrados dos erros de predição

(PRESS) obtidos no procedimento de validação cruzada do modelo. O número ótimo de

componentes PLS é aquele que minimiza o valor de PRESS. Se o modelo apresenta boa

qualidade, o que é verificado pelos valores dos coeficientes de correlação r2 e q2 e também

pelos resíduos de predição, pode ser utilizado para fazer predições da propriedade biológica

de compostos desconhecidos que sejam estruturalmente similares àqueles presentes no

conjunto de treinamento (WOLD; SJOSTROM; ERIKSSON, 2001).

No presente trabalho, o melhor modelo encontrado foi construído com os mesmos

descritores que os modelos de reconhecimento de padrões apresentados anteriormente. O

número ótimo de componentes PLS foi escolhido avaliando-se o valor de PRESS, para os

resíduos de predição do modelo após a validação cruazada (leaving-one-out). Na Tabela 6,

pode-se verificar que o número de componentes PLS correspondente ao menor valor de

PRESS e ao maior valor de q2 é igual a 6, sendo portanto o número ótimo de componentes

PLS para o nosso conjunto de dados. Este número resultou em um modelo com coeficientes

de regressão r2 = 0,83 e q2 = 0,76, o que indica que um bom modelo foi obtido.

Tabela 6. Porcentagem de variância, PRESS, q2 e r2

Componente PLS

% Variância Cumulativa

PRESS q2 r2

1 66 17.757 0.621 0.654 2 81 12.645 0.730 0.776 3 87 11.911 0.746 0.811 4 92 11.597 0.754 0.825 5 95 11.342 0.759 0.831 6 98 11.305 0.760 0.832 7 100 11.539 0.755 0.833 8 100 12.091 0.744 0.834 9 100 12.185 0.743 0.835


A Figura 14 mostra a reta de regressão para os valores de pKi preditos para o conjunto

de treinamento. A maioria dos resíduos de predição são menores do que 0,60, com apenas

dois compostos apresentando resíduos altos (0,92 e 0,99, para os compostos 19 e 33,

respectivamente). A Figura 14 mostra também a reta de regressão para os compostos do

conjunto de teste usados na validação externa do modelo PLS. Os resultados da predição para

este conjunto são mostrados na Tabela 7, onde é possível observar que os erros de predição

são menores do que 0,34 (com exceção do composto 64), indicando que um modelo com bom

poder preditivo foi obtido.

Figura 14 - Valores de pKi preditos versus experimentais para a regressão PLS obtida com 6 componentes principais, mostrando os compostos dos conjuntos de treinamento e teste.


Tabela 7. Resíduos de predição para o conjunto de teste

Composto pKi experimental pKi predito Resíduo

53 7.30 7.22 0.08 54 6.10 5.79 0.30 55 5.30 5.54 -0.24 56 6.92 7.03 -0.11 57 5.80 6.14 -0.34 58 5.80 6.09 -0.29 59 6.07 6.05 0.02 60 7.80 7.69 0.11 61 5.56 5.80 -0.24 62 7.92 7.59 0.33 63 7.47 7.20 0.27 64 6.47 5.78 0.69 65 6.60 6.51 0.10 66 6.30 6.06 0.24

Com o objetivo de avaliar a confiabilidade do modelo PLS obtido, foi também

empregado o método de scrambling progressivo (CLARK; FOZ, 2004), que determina a

sensitividade de um modelo QSAR a correlações por acaso. Os testes de scrambling levaram

a modelos com valores de q2 entre 0,20 e 0,40, com altos valores de erro padrão de validação

cruzada (cSDEP), que é modelado como uma função do coeficiente de correlação entre os

valores reais de Y e os valores submetidos à randomização (Y’). Assim, uma vez que os

valores de q2 obtidos com os valores randomizados foram muito menores do que o obtido

para o modelo PLS, pode-se afirmar que este modelo não é resultado de correlações ao acaso.

Quando se comparam os resultados obtidos em todas as análises quimiométricas,

pode-se notar que modelos de relação estrutura-atividade qualitativos e quantitativos

apresentando confiabilidade e poder preditivo foram obtidos com o mesmo conjunto de

variáveis, o que é um forte indicativo de que os descritores selecionados em nosso trabalho

são de fato importantes para a afinidade pelo receptor 5-HT1A. Os modelos são capazes de

separar os compostos de acordo com seus valores de pKi e os seguintes requisitos para

afinidade pelo receptor 5-HT1A foram evidenciados nos dois grupos de compostos (Classes 1


e 2): orto-substituição no anel Ar1 e um anel tiofeno ao invés de anéis benzenos ou naftalenos

são favoráveis para afinidades maiores. Esta observação está de acordo com estudos SAR

anteriores com compostos arilpiperazínicos (MARTÍNEZ-ESPARZA et al., 2001; LÓPEZ-

RODRÍGUEZ et al., 2001b; GAILLARD et al., 1996). Além disso, as componentes principais

(nas análises PCA e SIMCA), assim como as variáveis latentes (componentes PLS)

construídas com estes descritores contêm porcentagens significativas da variância total da

matriz de dados, mostrando que a estrutura dos dados foi capturada adequadamente pelas

variáveis utilizadas nos modelos. Por todas estas considerações, pode-se afirmar que os

modelos obtidos neste trabalho podem ser bastante úteis no planejamento de novos compostos

arilpiperazínicos similares aos compostos estudados.

6.3. Conclusões

Neste capítulo, foram apresentados modelos SAR e QSAR confiáveis e preditivos,

obtidos com métodos quimiométricos e usando um conjunto de descritores 2D. Todos os

modelos apresentaram consistência interna e foram validados externamente com um conjunto

de teste. Os descritores selecionados, que contêm informações úteis sobre vários aspectos da

estrutura molecular, mostraram boa correlação com as afinidades pelo receptor 5-HT1A

apresentadas pelos compostos em estudo, uma vez que foram empregados com sucesso em

todas as análises. Propriedades estéricas estão bem representadas pelos índices topológicos. A

seleção dos índices de carga de Gálvez indica a importância das características eletrônicas dos

compostos que podem estar envolvidas na interação com o receptor. Além disso, as

características dos compostos em cada um dos grupos estudados (Classes 1 e 2) estão de


acordo com análises SAR realizadas anteriormente para compostos arilpiperazínicos e

confirmam as características consideradas importantes para afinidade pelo receptor 5-HT1A.

7. HQSAR 83

7. HQSAR

No presente capítulo, serão mostrados os resultados de um estudo de relação estrutura-

atividade utilizando a metodologia HQSAR (Hologram Quantitative Structure-Activity

Relationships), realizado com o objetivo de explorar parâmetros bidimensionais dos

compostos arilpiperazínicos e encontrar informações úteis para a síntese de novos ligantes

(WEBER et al., 2008). A metodologia HQSAR explica as diferenças na atividade biológica

de uma série de compostos quantificando variações em seus hologramas moleculares e

empregando o método PLS para a correlação estatística. Em geral, os resultados produzidos

apresentam qualidade comparável a das técnicas tridimensionais, como CoMFA, com a

vantagem de eliminar a necessidade de estabelecer uma conformação ótima e um alinhamento

estrutural das moléculas da série (HONÓRIO; ANDRICOPULO, 2007).


Para compor o conjunto de dados, foram selecionados 90 compostos da literatura

(MARTÍNEZ-ESPARZA et al., 2001; ORÚS et al., 2002). As estruturas químicas e as

afinidades pelo receptor 5-HT1A correspondentes são listadas na Tabela 8. Os valores de Ki

desses compostos variam de 1,9 a 5000 nM e são bem distribuídos nesse intervalo. Esses

valores foram medidos sob as mesmas condições experimentais, o que é um requisito

fundamental para estudos de QSAR.

7. HQSAR 84

Tabela 8. Estruturas químicas e valores de Ki para os compostos em estudo

Compostos do conjunto de treinamento

Comp. Estrutura geral R Z Ar 1 Ki (nM)

1 H CHOH 2-metoxifenil 47,5 2 H CHO-4-

CF3C6H4 2-metoxifenil 450

3 H CHO-4-CH3OC6H4

2-metoxifenil 90


2-metoxifenil 20

5 H CNOH 2-metoxifenil 17,5 6 H CO 4-clorofenil 800 7 H CHOH 4-clorofenil 800 8 H CHO-4-

CF3C6H4 4-clorofenil >5000

9 H CHO-4-CH3C6H4

4-clorofenil 1450

10 H CNOH 4-clorofenil >5000 11 H CHOH 4-metoxifenil >5000 12 H CHOH 2-pirimidil 375 13 H CHO-4-

CF3C6H4 2-pirimidil 1600

14 H CO 2-clorofenil 180 15 H CHOH 2-clorofenil 115 16 H CO 4-fluorofenil 800 17 H CHOH 4-fluorofenil 145 18 H CHO-4-

CF3C6H4 4-fluorofenil >5000

19 H CO 2-piridil 50 20 H CHOH 2-piridil 155 21 H CO 4-nitrofenil >5000 22 H CHOH 4-nitrofenil >5000 23 fenil CHO-4-

CF3C6H4 2-metoxifenil >5000

24 metóxi CHOH 2-metoxifenil 325 25 metóxi CHO-4-


26 nitro CO 2-metoxifenil 50 27

NN

R

zAr1

nitro CHOH 2-metoxifenil 10 28 H CO 2-metoxifenil 16 29 H CHOH 2-metoxifenil 50 30 H CHO-3,4-

OCH2OC6H3 2-metoxifenil 55

31 H CHO-1-C10H7

2-metoxifenil 180

32 H CNOH 2-metoxifenil 6,5 33 H CO 4-clorofenil 700 34 H CHOH 2-clorofenil 200 35 H CO 1-naftil 35 36 2,5-

dimetil CO 2-metoxifenil 5

37 2,5-dimetil

CHOH 2-metoxifenil 12

38 2,5-dimetil

CO 2-hidroxifenil 7,5

39

NN Ar1z

S

R

2,5-dimetil

CO 4-cloro-2-metoxifenil 500

7. HQSAR 85

Tabela 8. continuação


40 H CHO-1-C10H7

2-metoxifenil 220

41 H CO 4-clorofenil >5000 42 H CHOH 4-clorofenil >5000 43 5-metil CO 2-metoxifenil 17,5 44

S

Ar1N

N

R

z

5-metil CHOH 2-metoxifenil 34 45 H CO 2-metoxifenil 250 46 H CHOH 2-metoxifenil 420 47 H CO 4-clorofenil >5000 48 H CHOH 4-clorofenil >5000 49

Ar1

NN

R z

H CHOH 2-hidroxifenil 190

50 H CHOH 2-metoxifenil 20 51 H CNOH 2-metoxifenil 60 52 H CO 4-clorofenil >5000 53 H CHOH 4-clorofenil >5000 54 H CO 2-hidroxifenil 110 55 H CO 4-fluoro-2-metoxifenil 500 56 H CHOH 4-fluoro-2-metoxifenil 500 57 H CO 1-naftil 100 58 H CHOH 1-naftil 66,7 59 H CHOH 3-quinolil 995 60 H CHOH 5-quinolil 36,8 61 H CHOH 6-quinolil 546 62 H CHOH 8-quinolil 6,3 63 H CHOH 8-quinaldinil 10.2 64 H CHOH 4-indolil 5,5 65 H CHOH 3,4-dihidro-2H-1,5-

benzo[b]dioxepin-6-il 1,9

66 H CHOH 5-benzo[b]tiofenil 913 67 F CHOH 8-quinolil 2,7 68 F CHOH 8-quinaldinil 2,5 69 F CHOH 4-indolil 5,9 70

S

NNR

zAr1

F CHOH 3,4-dihidro-2H-1,5-benzo[b]dioxepin-6-il

3

7. HQSAR 86


Compostos do conjunto de teste

Comp. Estrutura geral R Z Ar1 Ki (nM)

71 H CO 2-metoxifenil 50 72 H CHO-3,4-

OCH2OC6H3 4-clorofenil 550

73 H CHO-4-CF3C6H4

4-metoxifenil >5000

74 H CO 2-pirimidil 120 75 H CHO-4-


76 H CHO-4-CF3C6H4

2-piridil 1600

77

NN

R

zAr1

H CHO-4-CF3C6H4

4-nitrofenil >5000

78 H CHO-4-CF3C6H4

2-metoxifenil 255

79 H CHOH 4-clorofenil 2750 80 H CO 2-clorofenil 200 81

NN Ar1z

S

R

2,5-dimetil

CHOH 2-hidroxifenil 90

82 H CO 2-metoxifenil 10 83

S

Ar1N

N

R

z

H CHOH 2-metoxifenil 19

84 Ar1N

NR z

H CO 2-hidroxifenil 1000

85 H CO 2-metoxifenil 44 86 H CHOH 2-hidroxifenil 18 87 H CO 4-cloro-2-metoxifenil 500 88 H CHOH 4-cloro-2-metoxifenil 361 89 H CHOH 2,3-dihidro-1,4-

benzodioxin-5-il 5,7

90

S

NNR

zAr1

F CHOH 2,3-dihidro-1,4-benzodioxin-5-il

6

O conjunto original de 90 compostos foi dividido em conjunto de treinamento

(compostos de 1 a 70 da Tabela 8), para a construção do modelo, e conjunto de teste

(compostos 71 a 90 da Tabela 8) para a validação externa do modelo. Essa escolha foi feita de

maneira que moléculas estruturalmente diversas apresentando valores de afinidade bem

distribuídos fossem incluídas em ambos os conjuntos. As estruturas dos compostos foram

construídas empregando o módulo Concord (PEARLMAN) do pacote SYBYL 7.2 (TRIPOS)

e submetidas a um procedimento de minimização de energia empregando o campo de força

7. HQSAR 87

Tripos (CLARK; CRAMER III; VAN OPDENBOSCH, 1989), com o algoritmo steepest

descent. Todos os cálculos e visualizações foram também realizados neste pacote, em

plataforma Linux/Red Hat.

Na metodologia HQSAR, cada molécula do conjunto de dados é dividida em uma

série de fragmentos estruturais únicos, que são arranjados para formar um holograma

molecular. Diferentemente de outros métodos baseados em molecular fingerprints, o método

HQSAR considera todos os fragmentos moleculares possíveis, assim como informação

tridimensional suplementar sobre hibridização e quiralidade das moléculas (HERITAGE;

LOWIS, 1999).

A análise HQSAR envolve três passos principais: a geração de fragmentos sub-

estruturais para cada uma das moléculas do conjunto de treinamento; a transformação desses

fragmentos em hologramas; e a correlação destes com os dados biológicos disponíveis. De

acordo com este protocolo, uma molécula é descrita como uma única série de números ou

“bins” (holograma molecular). Os bins representam cada um dos fragmentos incluídos em

uma molécula em particular e são atribuídos por um algoritmo de redundância cíclica (CRC -

cyclic redundancy check) (HERITAGE; LOWIS, 1999).

Todos os fragmentos estruturais lineares, de ramificação e de sobreposição foram

usados neste trabalho para gerar os descritores HQSAR. Os fragmentos estruturais de cada

molécula original consistiam de números de átomos mínimo e máximo previamente definidos,

que são chamados de parâmetros de tamanho de fragmento. A informação em cada

fragmento foi definida por parâmetros de distinção de fragmentos, incluindo átomos (A),

ligações (B), conexões (C), átomos de hidrogênio (H), quiralidade (Ch) e doadores ou

receptores de ligações de hidrogênio (DA). Os fragmentos gerados foram então divididos em

um arranjo de comprimento fixo para produzir um holograma molecular. Este comprimento

fixo foi definido como parâmetro de comprimento de holograma.

7. HQSAR 88

O módulo HQSAR utilizado neste trabalho fornece 12 comprimentos padrões de

holograma (53, 59, 61, 71, 83, 97, 151, 199, 257, 307, 353 e 401), que são números primos

para minimizar a possibilidade da chamada “fragment collision” (quando os fragmentos mais

importantes para a atividade biológica são atribuídos ao mesmo bin no holograma, sem

discriminação). A natureza particular dos fragmentos sub-estruturais gerados pelo HQSAR e,

conseqüentemente, a informação contida nos hologramas moleculares resultantes é alterada

pelo ajuste desses parâmetros. Finalmente, a correlação dos descritores obtidos dessa forma

com a propriedade biológica foi feita empregando o método PLS.


Conforme dito anteriormente, o desempenho dos modelos HQSAR é afetado por três

parâmetros: o tamanho do fragmento, o tipo (distinção) de fragmento e o comprimento do

holograma. Neste trabalho, um modelo HQSAR foi gerado inicialmente com o tamanho de

fragmento padrão (4-7) combinado com vários tipos de fragmentos e vários comprimentos de

holograma (ver Tabela 9). O melhor modelo (q2 = 0,762) foi obtido usando um comprimento

de holograma de 307 e uma combinação dos tipos de fragmentos A/B/C/Ch/DA.

7. HQSAR 89

Tabela 9. Resultados da análise HQSAR utilizando vários tipos de fragmentos, com o tamanho de fragmento padrão 4 - 7

Modelo Tipo de

Fragmento q2 SEP r2 SEE HL N

1 A/B 0.599 0.716 0.804 0.478 61 6 2 A/B/C 0.569 0.708 0.859 0.405 257 6 3 A/B/C/H 0.591 0.690 0.830 0.445 353 6 4 A/B/C/H/Ch 0.584 0.696 0.846 0.424 71 6 5 A/B/C/H/Ch/DA 0.689 0.602 0.893 0.353 97 6 6 A/B/H 0.582 0.698 0.799 0.483 53 6 7 A/B/C/Ch 0.595 0.686 0.840 0.432 83 6 8 A/B/DA 0.678 0.612 0.908 0.327 401 6 9 A/B/C/DA 0.660 0.629 0.907 0.329 307 6 10 A/B/H/DA 0.680 0.611 0.841 0.430 53 6 11 A/B/C/Ch/DA 0.762 0.527 0.933 0.280 307 6 12 A/B/C/H/DA 0.636 0.651 0.827 0.448 307 6 13 A/B/H/Ch/DA 0.596 0.675 0.757 0.524 53 4

q2, coeficiente de correlação da validação cruzada; SEP, erro padrão da validação cruzada; r2, coeficiente de correlação; SEE, erro padrão de calibração; HL, comprimento do holograma; N, número ótimo de componentes PLS. Tipos de Fragmentos: A, átomos; B, ligações; C, conexões; H, átomos de hidrogênio; Ch, quiralidade; DA, doador e receptor.

Com estes tipos de fragmentos, foram realizadas outras análises PLS para investigar se

diferentes tamanhos de fragmentos poderiam melhorar os parâmetros estatísticos. Os

resultados de HQSAR para diferentes tamanhos de fragmentos são apresentados na Tabela 10.

O melhor modelo encontrado (q2 = 0,813) foi aquele com o tamanho de fragmento 6 - 9, com

a combinação A/B/C/Ch/DA, comprimento de holograma de 353 e 6 componentes PLS.

Com o objetivo de avaliar o poder preditivo deste modelo, foi realizada a predição das

afinidades para os 20 compostos de teste (Tabela 8), que não faziam parte do conjunto de

treinamento utilizado para a construção do modelo. Os resultados são mostrados na Figura 15,

que ilustra o gráfico dos valores de pKi preditos versus experimentais, tanto para o conjunto

de treinamento quanto para o de teste.

7. HQSAR 90

Tabela 10. Resultados da análise HQSAR variando o tamanho de fragmento, com a combinação A/B/C/Ch/DA

Tamanho de

Fragmento q2 SEP r2 SEE HL N

2 - 5 0.686 0.604 0.888 0.360 199 6 3 - 6 0.706 0.585 0.916 0.312 257 6 4 - 7 0.762 0.527 0.933 0.280 307 6 5 - 8 0.793 0.491 0.952 0.237 257 6 6 - 9 0.813 0.466 0.958 0.220 353 6 7 - 10 0.812 0.468 0.958 0.222 353 6

Figura 15 - Valores de pKi preditos versus experimentais para o conjunto de treinamento e para o conjunto de teste resultantes do modelo HQSAR.

7. HQSAR 91

A boa concordância entre os valores experimentais e preditos pelo modelo pode ser

observada na Tabela 11, que mostra valores baixos para os resíduos de predição (menores que

0,40) para a maioria dos compostos. Isso que indica que o modelo HQSAR obtido apresenta

qualidade suficiente para predizer a afinidade pelo receptor 5-HT1A de novos compostos com

estruturas semelhantes.

Tabela 11. Resíduos de predição para os compostos do conjunto de teste

Composto pKi Experimental

pKi Predito

Resíduo

13b 5.56 5.74 0.18 7jx 8.24 8.61 0.37 30b 7.74 7.02 -0.72 27a 6.00 6.5 0.50 31a 6.30 5.63 -0.67 19b 7.05 7.28 0.23 7c 5.80 5.68 -0.12 31b 6.44 5.63 -0.81 14a 6.70 6.61 -0.09 28a 7.36 7.43 0.07 8jx 8.22 7.92 -0.30 4a 6.92 7.14 0.22 2e 6.26 6.46 0.20 1a 7.30 7.27 -0.03 16a 8.00 7.75 -0.25 16b 7.72 6.91 -0.81 12c 6.59 6.4 -0.19 8c 5.30 5.24 -0.06 5c 5.30 5.58 0.28 3c 5.30 5.18 -0.12

Este modelo também foi submetido ao teste de scrambling progressivo, que forneceu

valores baixos para q2 (~ 0,40) dos modelos obtidos com Y randomizados. Isso mostra que as

correlações resultantes do modelo não foram obtidas por acaso.

Após o desenvolvimento de modelos estatísticos com boa capacidade de predição para

compostos não-testados, a metodologia HQSAR pode ser empregada para fornecer pistas

importantes sobre quais fragmentos estão relacionados mais diretamente com a atividade

7. HQSAR 92

biológica em estudo. Essa informação é obtida calculando-se a contribuição individual de

cada átomo de uma molécula para a atividade biológica, que pode ser visualizada pelos mapas

de contribuição. Um código de cores é usado para discriminar as contribuições atômicas mais

importantes para a atividade. As cores na extremidade vermelha do espectro (vermelho e

laranja) refletem contribuições pobres, enquanto as cores da extremidade verde (amarelo, azul

esverdeado e verde) refletem contribuições favoráveis. Átomos com contribuições

intermediárias aparecem na cor branca. A Figura 16 mostra as contribuições atômicas

individuais para o composto com maior valor de afinidade do nosso conjunto de dados

(composto 65). Conforme se pode observar nesta figura, os fragmentos correspondentes ao

anel piperazínico e também ao anel tiofeno apresentam contribuições favoráveis à afinidade

dos compostos arilpiperazínicos pelo receptor 5-HT1A. De fato, os compostos com as

afinidades mais altas do conjunto de dados apresentam um anel tiofeno ou benzotiofeno como

substituinte Ar2, o que indica que este é um grupo importante para a interação com o receptor

5-HT1A.

O

O

S

NN

OH

65

Figura 16 - Contribuições atômicas para a afinidade pelo receptor 5-HT1A do composto com maior afinidade do conjunto de dados (65).

7. HQSAR 93

7.3. Conclusões

O modelo HQSAR obtido mostrou boa consistência interna, conforme se pode

observar pelos parâmetros estatísticos r2 = 0,96, q2 = 0,81 e SEE=0,22, bem como bom poder

preditivo, uma vez que as predições feitas para o conjunto de teste apresentaram erros baixos.

Além disso, o teste de randomização da variável dependente indicou que as correlações não

foram obtidas ao acaso. Assim, este modelo pode ser utilizado para predizer a afinidade pelo

receptor 5-HT1A de novas moléculas a partir de seus hologramas. As informações obtidas com

os mapas de contribuição indicam a importância do substituinte Ar2 para o planejamento de

novos compostos com afinidade pelos receptores 5-HT1A.

8. QSAR 3D 94

8. QSAR 3D

Neste capítulo, serão relatados os resultados do estudo de QSAR 3D realizado com o

objetivo de obter uma correlação significativa entre as características tridimensionais dos

compostos em estudo e a afinidade pelo receptor 5-HT1A. Os métodos de QSAR 3D baseiam-

se no caráter tridimensional das interações entre um ligante e seu receptor biológico e na

utilização de campos moleculares de interação como descritores. As diferenças na variável

dependente (propriedade biológica) são descritas em função das diferenças nestes campos de

interação. Neste trabalho, foi empregado o método CoMFA, que é um dos mais utilizados no

planejamento de fármacos e foi brevemente descrito no Capítulo 2.


Assim como nos modelos apresentados anteriormente, um conjunto de 88 compostos

foi dividido em conjunto de treinamento (compostos de 1 a 70 da Tabela 12), para a

construção do modelo QSAR 3D, e conjunto de teste (compostos 71 a 88 da Tabela 12) para a

validação externa do modelo. Essa escolha também foi feita de forma que as moléculas de

ambos os conjuntos representassem a diversidade estrutural e a variabilidade dos valores de

afinidade do conjunto original.

8. QSAR 3D 95

Tabela 12. Estruturas químicas e valores de Ki para os compostos em estudo

Compostos do conjunto de treinamento


1 H CHO-4-CF3C6H4

2-metoxifenil 450

2 H CHO-4-CH3OC6H4

2-metoxifenil 90


2-metoxifenil 20

4 H CO 4-clorofenil 800 5 H CHOH 4-clorofenil 800 6 H CHO-3,4-

OCH2OC6H3 4-clorofenil 550

7 H CHO-4-CH3C6H4

4-clorofenil 1450

8 H CNOH 4-clorofenil >5000 9 H CO 4-metoxifenil 5000 10 H CHOH 4-metoxifenil >5000 11 H CHO-4-

CF3C6H4 4-metoxifenil >5000

12 H CO 2-pirimidil 120 13 H CHO-4-

CF3C6H4 2-pirimidil 1600

14 H CO 2-clorofenil 180 15 H CHOH 2-clorofenil 115 16 H CHO-4-


17 H CO 4-fluorofenil 800 18 H CHOH 4-fluorofenil 145 19 H CHO-4-

CF3C6H4 4-fluorofenil >5000

20 H CO 2-piridil 50 21 H CO 4-nitrofenil >5000 22 H CHOH 4-nitrofenil >5000 23 H CHO-4-

CF3C6H4 4-nitrofenil >5000

24 fenil CHO-4-CF3C6H4

2-metoxifenil >5000

25 metóxi CHOH 2-metoxifenil 325 26 metóxi CHO-4-


27

NN

R

zAr1

nitro CO 2-metoxifenil 50 28 H CHOH 2-metoxifenil 50 29 H CHO-3,4-

OCH2OC6H3 2-metoxifenil 55

30 H CHO-4-CF3C6H4

2-metoxifenil 255

31 H CHO-1-C10H7

2-metoxifenil 180

32 H CNOH 2-metoxifenil 6,5 33 H CO 1-naftil 35 34 2,5-

dimetil CHOH 2-metoxifenil 12

35 2,5-dimetil

CO 2-hidroxifenil 7,5

36

NN Ar1z

S

R

2,5-dimetil

CHOH 2-hidroxifenil 90

8. QSAR 3D 96



37 H CO 2-clorofenil 200 38 H CHOH 4-clorofenil 2750 39

NN Ar1z

S

R

2,5-

dimetil CO 4-cloro-2-metoxifenil 500

40 H CHO-1-C10H7

2-metoxifenil 220

41 H CO 4-clorofenil >5000 42 H CO 2-metoxifenil 10 43 H CHOH 2-metoxifenil 19 44

S

Ar1N

N

R

z

5-metil CO 2-metoxifenil 17,5 45 H CO 2-metoxifenil 250 46 H CHOH 2-metoxifenil 420 47 H CO 4-clorofenil >5000 48 H CHOH 4-clorofenil >5000 49 H CO 2-hidroxifenil 1000 50

Ar1N

NR z

H CHOH 2-hidroxifenil 190

51 H CO 2-metoxifenil 44 52 H CHOH 2-metoxifenil 20 53 H CNOH 2-metoxifenil 60 54 H CHOH 4-clorofenil >5000 55 H CO 2-hidroxifenil 110 56 H CHOH 2-hidroxifenil 18 57 H CHOH 4-cloro-2-metoxifenil 361 58 H CO 4-fluoro-2-metoxifenil 500 59 H CHOH 4-fluoro-2-metoxifenil 500 60 H CO 1-naftil 100 61 H CHOH 1-naftil 66,7 62 H CHOH 3-quinolil 995 63 H CHOH 5-quinolil 36,8 64 H CHOH 8-quinaldinil 10,2 65 H CHOH 3,4-dihidro-2H-1,5-

benzo[b]dioxepin-6-il 1,9

66 H CHOH 2,3-dihidro-1,4-benzodioxin-5-il

5,7

67 F CHOH 8-quinolil 2,7 68 F CHOH 8-quinaldinil 2,5 69 F CHOH 2,3-dihidro-1,4-

benzodioxin-5-il 6

70

S

NNR

zAr1

F CHOH 3,4-dihidro-2H-1,5-benzo[b]dioxepin-6-il

3

8. QSAR 3D 97


Compostos do conjunto de teste

Comp. Estrutura geral R Z Ar1 Ki (nM)

71 H CO 2-metoxifenil 50 72 H CHOH 2-metoxifenil 47,5 73 H CHO-4-


74 H CHOH 2-piridil 155 75 H CHO-4-

CF3C6H4 2-piridil 1600

76

NN

R

zAr1

H CHOH 2-pirimidil 375 77 H CO 2-metoxifenil 16 78 H CO 4-clorofenil 700 79 H CHOH 2-clorofenil 200 80 2,5-

dimetil CO 2-metoxifenil 5

81

NN Ar1z

S

R

2,5-dimetil

CO 1-naftil 100

82 H CHOH 4-clorofenil >5000 83

S

Ar1N

N

R

z

5-metil CHOH 2-metoxifenil 34

84 H CO 4-cloro-2-metoxifenil 500 85 H CHOH 5-benzo[b]tiofenil 913 86 H CHOH 8-quinolil 6,3 87 H CO 4-clorofenil >5000 88

S

NNR

zAr1

F CHOH 1,3-benzodioxol-4-il 9,4

As estruturas dos compostos foram construídas empregando o módulo CONCORD

(PEARLMAN) do pacote SYBYL 7.3 (TRIPOS) e submetidas a um procedimento de

otimização de geometrias empregando inicialmente o campo de força Tripos (CLARK;

CRAMER III; VAN OPDENBOSCH, 1989), com o algoritmo steepest descent. Em seguida,

uma nova otimização das geometrias dos compostos, juntamente com o cálculo das cargas

parciais, foi realizada com o método semi-empírico AM1. Em todas as moléculas, o átomo N1

foi modelado no estado protonado. Todos os cálculos e visualizações foram realizados no

pacote SYBYL 7.3 (TRIPOS), em plataforma Linux/Red Hat.

A próxima etapa na geração do modelo CoMFA é o alinhamento estrutural das

moléculas do conjunto de treinamento. Para obter este alinhamento, foi empregada uma

8. QSAR 3D 98

estratégia baseada numa hipótese farmacofórica gerada com o programa GALAHAD

(RICHMOND et al., 2006; SHEPPHIRD; CLARK, 2006).

Um farmacóforo é um ensemble de características estéricas e eletrostáticas dos

ligantes que são necessárias para garantir interações ótimas com seus receptores biológicos.

Para obter um modelo farmacofórico, uma série de compostos que atuem de acordo com o

mesmo mecanismo são alinhadas para determinar quais são suas características comuns, que

podem então ser associadas à sua atividade biológica (PATEL et al., 2002). Os descritores

farmacofóricos representam as principais forças intermoleculares não-covalentes (ligações de

hidrogênio, interações eletrostáticas, hidrofóbicas e de van der Waals). Um modelo ideal deve

incorporar as características comuns de um sub-conjunto de moléculas potentes, juntamente

com suas distribuições espaciais (SHEPPHIRD; CLARK, 2006).

O programa GALAHAD, empregado neste trabalho, realiza alinhamentos pela

construção iterativa de hipermoléculas que representam os aspectos sub-estruturais e

conformacionais comuns mais importantes dentro de um conjunto de moléculas, podendo

então fornecer uma regra de alinhamento para moléculas não usadas na construção da

hipermolécula. Vinte modelos foram gerados para um sub-conjunto contendo cinco dos

compostos com maiores afinidades do conjunto de treinamento (compostos 32, 65, 66, 67 e

69 - ver Tabela 12). A hipótese farmacofórica gerada desta forma foi usada para o

alinhamento estrutural das moléculas do conjunto de treinamento, empregado na construção

do modelo CoMFA.

As moléculas alinhadas foram inseridas em uma grade tridimensional com

espaçamento de 2,0 Å entre os vértices nas direções x, y e z. Os mapas estéricos e

eletrostáticos foram gerados utilizando o método AM1 e um carbono sp3 positivamente

carregado como sonda química. As contribuições dos campos eletrostáticos e estereoquímicos

foram calculadas empregando os potenciais de Coulomb e de Lennard-Jones,

8. QSAR 3D 99

respectivamente. Os valores de corte para as energias de interação foram de 30 kcal/mol. Para

que as energias de interação fossem tratadas como tendo a mesma ordem de grandeza, os

descritores foram escalonados pelo método CoMFA padrão.

A correlação estatística dos valores de afinidade pelo receptor 5-HT1A com os valores

de energia de interação em cada ponto da grade foi realizada com o método PLS. Para

determinar o número ótimo de componentes PLS, foi empregada a técnica de validação

cruzada, escolhendo-se então o número de componentes correspondente ao maior valor de q2.

Com o objetivo de obter um modelo com a máxima capacidade preditiva possível, foi

empregado o recurso de focagem da melhor região, que consiste em atribuir um peso maior

para os pontos da grade que contribuem de maneira mais significativa para o modelo e um

menor peso para pontos que apresentam redundância ou baixa variância dos dados. Uma

maneira de se evidenciar os pontos de maior contribuição é fazer a diferenciação dos campos

pelo coeficiente de desvio padrão (SDC). A partir de uma análise realizada previamente,

atribui-se o peso que determinado ponto terá em uma nova análise pela multiplicação da

variação dos valores dos campos de interação deste ponto pelo coeficiente que foi atribuído a

este ponto pela análise anterior.

Finalmente, o método CoMFA permite avaliar as posições de substituição que fazem

contribuições favoráveis ou desfavoráveis para a propriedade biológica em estudo, por meio

de poliedros denominados mapas de contorno, que evidenciam regiões estereoquímicas e

eletrostáticas ao redor das moléculas responsáveis pelas diferenças nos valores da propriedade

biológica.

8. QSAR 3D 100


As moléculas do conjunto de treinamento foram alinhadas com base no modelo

farmacofórico gerado pelo programa GALAHAD, que teve de ser refinado posteriormente

com o programa UNITY (TRIPOS), a fim de obter-se a mesma orientação para todas as

moléculas do conjunto de treinamento. As características identificadas como necessárias para

garantir interações ótimas desse composto com o receptor 5-HT1A são mostradas na Figura

17a: a esfera azul-ciano representa uma região aromática; as esferas vermelhas representam

regiões receptoras de ligações de hidrogênio; a esfera azul corresponde a um centro positivo,

enquanto a esfera amarela representa uma região hidrofóbica. O alinhamento de todas as

moléculas do conjunto de treinamento obtido a partir deste modelo farmacofórico é mostrado

na Figura 17b. As características observadas neste modelo estão de acordo com a hipótese

farmacofórica relatada em estudo anterior (ORÚS et al., 2002), que identificou os elementos

farmacofóricos necessários para altas afinidades pelo receptor 5-HT1A empregando uma

abordagem diferente da utilizada no presente trabalho.

8. QSAR 3D 101

(a)

(b)

Figura 17 - (a) Características farmacofóricas usadas para o alinhamento das estruturas do conjunto de dados e (b) alinhamento estrutural das moléculas do conjunto de treinamento.

O primeiro modelo CoMFA obtido apresentou parâmetros estatísticos insatisfatórios;

empregando o recurso de focagem da melhor região, foi possível obter um aumento na

consistência interna e um refinamento dos mapas de contorno. Os melhores resultados foram

obtidos quando os descritores relevantes foram potencializados pelo SDC com peso w = 0,8,

conforme mostrado na Tabela 13.

Tabela 13. Parâmetros estatísticos obtidos nas análises PLS para o modelo CoMFA

Parâmetros estatísticos Modelo

q2 r2 N

Porcentagens de

contribuição

sem focagem 0,52 0,79 6 estérica eletrostática

w = 0,8* 0,68 0,89 6 80% 20%

8. QSAR 3D 102

A fim de avaliar o poder preditivo deste modelo, foram feitas as predições das

afinidades dos compostos do conjunto de teste, que foram submetidos aos mesmos

procedimentos de minimização de energia, cálculo de cargas parciais e alinhamento molecular

tais como os compostos do conjunto de treinamento. Na Tabela 14 são mostrados os

resultados das predições para o conjunto de teste, que indicam a boa capacidade preditiva do

modelo obtido, uma vez que os resíduos de predição são bastante baixos.

Tabela 14. Resíduos de predição para os compostos do conjunto de teste

Composto pKi Experimental

pKi Predito

Resíduo

71 7,30 7,43 -0,13 2 7,32 7,67 -0,35 73 5,30 5,80 -0,50 74 6,81 6,88 -0,07 75 5,80 6,41 -0,61 76 6,43 6,25 0,18 77 7,80 7,51 0,29 78 6,15 6,03 0,12 79 6,70 6,56 0,14 80 8,30 8,05 0,25 81 7,00 7,05 -0,05 82 5,30 5,72 -0,42 83 7,47 7,12 0,35 84 6,30 6,37 -0,07 85 6,04 6,50 -0,46 86 8,20 7,87 0,33 87 5,30 5,57 -0,27 88 8,03 7,47 0,56

O gráfico dos valores de afinidade pelo receptor 5-HT1A experimentais versus preditos

para os conjuntos de treinamento e teste é ilustrado na Figura 18. A estabilidade do modelo

foi também avaliada com o método de scrambling progressivo. Os modelos obtidos com a

permutação das variáveis dependentes apresentaram valores de q2 menores do que 0,50, o que

indica que o modelo final obtido neste trabalho não é fruto de correlações ao acaso.

8. QSAR 3D 103

Figura 18 - Valores de pKi preditos versus experimentais para o conjunto de treinamento e para o conjunto de

teste resultantes do modelo CoMFA.

Os mapas de contorno gerados com o método CoMFA permitem a visualização dos

campos estéricos e eletrostáticos que apresentam maior importância para explicar as

diferenças nos valores de afinidade da série de compostos em estudo. Os mapas nas cores

verde e amarelo representam os campos estéricos: poliedros verdes sugerem substituições por

grupos volumosos, enquanto poliedros amarelos sugerem grupos pouco volumosos. Por outro

lado, os mapas azuis e vermelhos se referem às características eletrostáticas: poliedros azuis

sugerem substituições por grupos positivos e os vermelhos sugerem substituições por grupos

eletronegativos. É importante ressaltar que estes mapas são encontrados nas áreas da grade

caracterizadas pela variância das propriedades estéricas e eletrostáticas dos ligantes. Assim, a

ausência de um mapa não significa que determinado elemento farmacofórico não seja

8. QSAR 3D 104

importante, mas apenas que todos os ligantes do conjunto analisado exercem, nesta

determinada área, mais ou menos a mesma influência estérica ou eletrostática.

A Figura 19 ilustra os mapas de contorno para o composto de maior afinidade da série.

Na Figura 19a, podem ser observados poliedros amarelos em torno do anel benzodioxepínico,

na hidroxila (substituinte Z) e em determinadas regiões do anel benzotiofeno. Sendo assim, na

maior parte do ligante, somente a substituição por grupos pouco volumosos é favorável a um

aumento nos valores de afinidade pelo receptor 5-HT1A. Isso indica que a cavidade do

receptor deve apresentar restrições nessas regiões que limitam o volume disponível para os

ligantes. Em outras palavras, a introdução de substituintes volumosos nessas posições, sejam

quais forem suas características eletrostáticas, causarão uma diminuição da afinidade pelo

receptor 5-HT1A. A única exceção é a posição do anel benzotiofeno em que aparece um

poliedro verde, indicando que substituintes volumosos podem ser tolerados nessa região.

(a) (b)

Figura 19 - Mapas de contorno (a) estéricos e (b) eletrostáticos para o composto com maior afinidade pelo receptor 5-HT1A do conjunto de dados.

8. QSAR 3D 105

A Figura 19b traz indicações sobre as regiões nas quais altas densidades eletrônicas

podem aumentar (vermelho) ou diminuir (azul) as afinidades dos ligantes. Os mapas

vermelhos em torno do anel benzotiofeno e nas proximidades do anel piperazínico sugerem

que substituintes eletronegativos nessas posições podem aumentar a afinidade pelo receptor 5-

HT1A. O poliedro azul no anel benzodioxepínico indica que substituintes positivos nessa

posição exercerão um efeito positivo sobre a afinidade. Por outro lado, a substituição por

grupos eletronegativos resultará em uma diminuição da afinidade.

8.3. Conclusões

O método CoMFA foi aplicado com sucesso para o conjunto de compostos

arilpiperazínicos em estudo. O modelo de QSAR 3D resultante foi capaz de fornecer uma

correlação significativa entre os campos estéricos e eletrostáticos e as afinidades pelo receptor

5-HT1A, além de fazer predições em concordância com os valores experimentais. Os mapas de

contorno indicaram que, na maior parte das posições, as substituições por grupos pouco

volumosos e eletronegativos são favoráveis para a afinidade pelo receptor 5-HT1A. Essas

informações podem ser úteis para a otimização da afinidade de ligantes estruturalmente

relacionados aos compostos analisados neste trabalho.

9. Modelagem do Receptor 5-HT1A 106

9. MODELAGEM DO RECEPTOR 5-HT 1A

Neste capítulo serão apresentados os resultados dos estudos de modelagem do receptor

5-HT1A realizados com o objetivo de obter um modelo tridimensional deste receptor que

pudesse ser utilizado para analisar as características do sítio ativo e os modos de interação

com os compostos arilpiperazínicos em estudo, de forma a complementar as análises QSAR

apresentadas anteriormente. Para tal, foram empregadas as metodologias de modelagem por

homologia e docking ligante-receptor, cujos fundamentos foram comentados no Capítulo 3.2


Inicialmente, a seqüência de aminoácidos do receptor 5-HT1A foi submetida ao

programa PSIPRED (JONES, 1999) para a predição da estrutura secundária e, em seguida, ao

programa FUGUE (SHI; BLUNDELL; MIZUGUCHI, 2001), que realiza a busca por

estruturas homólogas comparando seqüência contra estrutura. O programa PSIPRED emprega

redes neurais para predizer a estrutura secundária de uma proteína baseando-se em matrizes

de escore dependentes da posição geradas pelo PSI-BLAST (ALTSCHUL et al., 1997). O

programa FUGUE conta com tabelas de substituição dependentes do meio, com um algoritmo

de alinhamento global-local para alinhar pares seqüência/estrutura quando há grandes

diferenças de comprimento, ou o algoritmo global em outros casos. As penalidades para

lacunas em cada posição da estrutura são determinadas de acordo com a acessibilidade ao

solvente, a posição relativa aos elementos de estrutura secundária e a conservação desses

elementos.

2 Esta etapa do trabalho foi realizado em um estágio de doutorado sanduíche na Universidade de Cambridge, no grupo do Prof. Tom L. Blundell, com bolsa do programa PDEE/CAPES.


A estrutura selecionada para ser empregada como molde na modelagem comparativa

foi a da rodopsina bovina determinada por OKADA et al. (2004) - código no PDB: 1u19 - que

apresenta 18,8% de identidade seqüencial com o receptor 5-HT1A. A partir do arquivo de

alinhamento gerado com o programa FUGUE, a construção do modelo foi realizada com o

pacote de programas ORCHESTRAR (TRIPOS).

Neste pacote, a modelagem das regiões estruturalmente conservadas do receptor é

realizada empregando o programa CHORAL (MONTALVÃO et al., 2005), que foi descrito

no Capítulo 3. Em seguida, é feita uma validação da estrutura e do alinhamento com o

programa CANTATA (Richard E. Smith, resultados não publicados), que avalia a presença de

resíduos que não atendam aos “parâmetros acurados de ligações e ângulos” para estruturas

cristalográficas, conforme especificado por Engh e Huber (1991), de maneira análoga ao

programa PROCHECK (LASKOWSKI et al., 1993).

Para a modelagem das regiões estruturalmente variáveis, inicialmente um script em

Python chamado de PRELUDE identifica lacunas no core da estrutura e utiliza os seguintes

programas para preenchê-las: (i) BRIDGE (Paul de Bakker, resultados não publicados),

utilizado para preencher lacunas de no máximo dois resíduos através de uma busca

conformacional ab initio pelas coordenadas mais adequadas dos resíduos em questão; (ii)

CODA, que combina uma abordagem “knowledge-based”, selecionando fragmentos de

proteínas de um banco de dados, com uma construção ab initio da região em questão, e é

empregado quando o loop é formado por três a oito resíduos (DEANE; BLUNDELL, 2001);

(iii) RAPPER, um programa ab initio de busca conformacional usado nos casos em que o

programa CODA não é capaz de produzir um modelo adequado para preencher determinada

lacuna (DE BAKKER et al., 2003; DEPRISTO et al., 2003).


Os loops são conectados à estrutura do modelo pelo programa TUNER (Simon Lovell,

resultados não publicados), que varia a conformação local das posições de âncora do modelo e

dos loops a fim de regularizar a geometria dessas regiões.

A etapa seguinte é a modelagem das cadeias laterais com o programa ANDANTE, que

emprega informação sobre famílias de proteínas alinhadas estruturalmente, na forma de regras

de conservação de ângulos χ, para atribuir conformações a cada cadeia lateral (SMITH et al.,

2007).

Finalmente, o modelo é validado novamente pelo programa CANTATA e refinado

com o programa ARPEGGIO (R.W. Montalvão, S. C. Lovell, T. L. Blundell, resultados não

publicados), que emprega um algoritmo de dinâmica molecular baseado nos dados de ligação

e estruturas de raios-X de Engh e Huber (1991). Esse refinamento é feito para corrigir erros

nos parâmetros de ligações e ângulos por meio de pequenas variações locais nas coordenadas

atômicas empregando uma simulação de 200 passos com o algoritmo steepest descent.

Em seguida, ligantes com afinidades pelo receptor 5-HT1A variáveis foram docados na

estrutura do modelo assim obtido, utilizando a metodologia implementada no programa

GOLD (descrita no Capítulo 3). As estruturas dos ligantes, mostradas na Figura 20, foram

modeladas utilizando o módulo CONCORD do pacote SYBYL (TRIPOS) e minimizadas

usando o campo de força Tripos (CLARK; CRAMER III; VAN OPDENBOSCH, 1989), com

o algoritmo steepest descent.


NN Ar1

Ar2

z

1

4

Estrutura geral das arilpiperazinas

O

O

S

NN

OH

1

Ki = 1,9 nM

NS

NN

OH

CH32

Ki = 10,2 nM

S

NN

MeO

O

3

Ki = 16 nM

S

NN

O

4

Ki = 35 nM

Figura 20 - Estrutura geral dos compostos em estudo e estruturas dos ligantes empregados no estudo de docking.

De acordo com estudos anteriores (LOPEZ-RODRÍGUEZ et al., 2002), as interações

específicas entre ligantes e o receptor 5-HT1A podem ser classificadas como essenciais,

determinando a atividade do composto, e adicionais, aumentando sua afinidade e fornecendo

seletividade sobre outros alvos biológicos. A principal interação do tipo essencial confirmada

experimentalmente é a interação iônica entre o oxigênio carboxílico da cadeia lateral de

Asp3.32 e o nitrogênio protonado N1 do anel piperazínico. Portanto, foi adicionada uma

restrição de distância entre esses dois grupos. O sítio ativo foi definido estabelecendo-se uma

esfera de raio de 10 Å em torno do resíduo Asp3.32. Entretanto, os complexos obtidos nos

primeiros testes de docking apresentavam uma orientação ligeiramente desfavorável da cadeia

lateral do resíduo Asp3.32 com relação ao N1 do anel piperazínico. Assim, um procedimento

de variação conformacional, utilizando o programa ANDANTE, foi empregado com o


objetivo de obter novos rotâmeros para esta cadeia lateral. Os ligantes foram então docados no

modelo contendo o rotâmero mais adequado.


O alinhamento entre as seqüências da proteína-molde e do receptor 5-HT1A gerado

com o programa FUGUE é mostrado na Figura 21, utilizando a notação do formato JOY

(MIZUGUCHI et al., 1998), que representa informação tridimensional no alinhamento

seqüencial de forma a auxiliar a visualização das características estruturais e ambientais

importantes para a análise das estruturas (ver Tabela 15). Os elementos da estrutura

secundária, preditos para o receptor 5-HT1A com o programa PSIPRED, são representados

neste alinhamento de acordo com o seguinte código de cores: vermelho para alfa-hélices, azul

para fitas-beta e preto para estrutura desorganizada.

Tabela 15. Notação do formato JOY

JOY

Inacessível ao solvente MAIÚSCULAS X

Acessível ao solvente Minúsculas x

Alfa-hélice Vermelho x

Fita-beta Azul x

Hélice 310 Marrom x

Ligação de hidrogênio com

amida da cadeia principal

Negrito x

Ligação de hidrogênio com

carbonila da cadeia principal

Sublinhado X

Ponte de dissulfeto Cedilha ç

Phi positivo Itálico x


Figura 21 - Alinhamento das seqüências do receptor 5-HT1A e da rodopsina bovina (código 1u19 no PDB) obtido com o programa FUGUE, com a anotação da proteína-molde no formato JOY e a representação da estrutura secundária predita pelo PSIPRED para o receptor 5-HT1A.

5-HT1A VSYQVITSLLLGTLIFCAVLGNACVVAAIAL1u19 pwqFsmlAay MflLImlGfpiN flT lyVT vq

5-HT1A -MD VLSPGQGNNTTSPPAPFETGGNTTGISDVT1u19 mn Gt egpnf yVPfs nktgvVrsPFeapQyy Lae

1 10 20 30

40 50 60

5-HT1A ERSLQN1u19 HkkLr t

5-HT1A VANYLIGSLAVTDLMVSVLVLPMAALYQVL1u19 plNyILlnLAvAD lfMVfg GFt TTLyTSlh

65

70 80 90

5-HT1A NKWTL1u19 GyFvf

100

5-HT1A GQVTCDLFIALDVLCCTSSILHLCAIALDRYWAI1u19 gptGÇn l EGffAT LGGEIaLWSLvvLAieR yvvV

110 120 130

5-HT1A TDPIDYVNKRTRod. C kpms-nfrfg

140

5-HT1A PRRAAALISLTWLIGFLISI PPMLRod. enhaimgvafT wvmAlaCAapPl v

150 160 170

5-HT1A GWRTPEDRSDPDAC-------- TIS K1u19 gw SrY IP EGMQCSÇGI DYYTpheet n

180 190

5-HT1A DHGYTIYSTFGAFYIPLLLMLVLY1u19 NesFViy Mfvv HfiiPlivIffc y

200 210

N-term.

HTM1

LI1

HTM2

LE1

HTM3

LI2

HTM4

LE2

HTM5

5-HT1A VSYQVITSLLLGTLIFCAVLGNACVVAAIAL1u19 pwqFsmlAay MflLImlGfpiN flT lyVT vq

5-HT1A -MD VLSPGQGNNTTSPPAPFETGGNTTGISDVT1u19 mn Gt egpnf yVPfs nktgvVrsPFeapQyy Lae

1 10 20 30

40 50 60

5-HT1A ERSLQN1u19 HkkLr t

5-HT1A VANYLIGSLAVTDLMVSVLVLPMAALYQVL1u19 plNyILlnLAvAD lfMVfg GFt TTLyTSlh

65

70 80 90

5-HT1A NKWTL1u19 GyFvf

100

5-HT1A GQVTCDLFIALDVLCCTSSILHLCAIALDRYWAI1u19 gptGÇn l EGffAT LGGEIaLWSLvvLAieR yvvV

110 120 130

5-HT1A TDPIDYVNKRTRod. C kpms-nfrfg

140

5-HT1A PRRAAALISLTWLIGFLISI PPMLRod. enhaimgvafT wvmAlaCAapPl v

150 160 170

5-HT1A GWRTPEDRSDPDAC-------- TIS K1u19 gw SrY IP EGMQCSÇGI DYYTpheet n

180 190

5-HT1A DHGYTIYSTFGAFYIPLLLMLVLY1u19 NesFViy Mfvv HfiiPlivIffc y

200 210

N-term.

HTM1

LI1

HTM2

LE1

HTM3

LI2

HTM4

LE2

HTM5


Figura 21 - (Continuação) Alinhamento das seqüências do receptor 5-HT1A e da rodopsina bovina (código 1u19 no PDB) obtido com o programa FUGUE, com a anotação da proteína-molde no formato JOY e a representação da estrutura secundária predita pelo PSIPRED para o receptor 5-HT1A.

Este alinhamento teve de ser corrigido manualmente de modo a ajustar os loops à

estrutura do modelo. Dessa forma, o princípio e o fim de cada uma das regiões do modelo

final do receptor 5-HT1A são as seguintes: N-terminal (M1-T32), HTM1 (V33-L63), loop

intracelular (LI ) 1 (E64-N69), HTM2 (V70-L99), loop extracelular (LE) 1 (N100-L104),

HTM3 (G105-I138), LI2 (T139-T149), HTM4 (P150-L173), LE2 (G174-K191), HTM5

(D192-Y215), LI3 (G216-K334), HTM6 (M335-F370), LE3 (C371-P378), TMH7 (T379-

5-HT1A GRIFRAARFRIRKTVKKVEKTGADTRHGASPAPQ1u19 gq Lvftvk--------------------------

220 230 240

5-HT1A PKKSVNGESGSRNWRLGVESKAGGALCANGAVRQ1u19 ----------------------------------

5-HT1A GDDGAALEVIEVHRVGNSKEHLPLPSEAGPTPCA1u19 ----------------------------------

5-HT1A PASFERKNERNAEAKRK1u19 -------eaaa qqqesa

320 330

5-HT1A MALARERKTVKTLGIIMGTFILCWLPFFIVALVLPF1u19 ttq kaeke vTrMViiMviAFliC WlpYAgvAfyIft

340 350 360 370

5-HT1A CESSCHMP1u19 Hq gs-dFg

375

5-HT1A TLLGAIINWLGYSNSLLNPVIYAYFNKDFQNAFKKII1u19 pifM TipAFf AKtSAVYNPvIYim MnkqFrNCmvTt l

380 390 400 410

5-HT1A KCKFCRQ--------------------1u19 c cgknplgddeasttVsktets qvapa

420

LI3

HTM6

EL3

TMH7

C-term.

250 260 270 280

290 300 310

5-HT1A GRIFRAARFRIRKTVKKVEKTGADTRHGASPAPQ1u19 gq Lvftvk--------------------------

220 230 240

5-HT1A PKKSVNGESGSRNWRLGVESKAGGALCANGAVRQ1u19 ----------------------------------

5-HT1A GDDGAALEVIEVHRVGNSKEHLPLPSEAGPTPCA1u19 ----------------------------------

5-HT1A PASFERKNERNAEAKRK1u19 -------eaaa qqqesa

320 330

5-HT1A MALARERKTVKTLGIIMGTFILCWLPFFIVALVLPF1u19 ttq kaeke vTrMViiMviAFliC WlpYAgvAfyIft

340 350 360 370

5-HT1A CESSCHMP1u19 Hq gs-dFg

375

5-HT1A TLLGAIINWLGYSNSLLNPVIYAYFNKDFQNAFKKII1u19 pifM TipAFf AKtSAVYNPvIYim MnkqFrNCmvTt l

380 390 400 410

5-HT1A KCKFCRQ--------------------1u19 c cgknplgddeasttVsktets qvapa

420

LI3

HTM6

EL3

TMH7

C-term.

250 260 270 280

290 300 310


I415) e C-terminal (K416-Q422). A representação tridimensional deste modelo é mostrada

na Figura 22, omitindo-se a região LI3 (loop de 119 resíduos). Este loop foi modelado com o

programa RAPPER (DE BAKKER et al., 2003; DEPRISTO et al., 2003), mas não foi

empregado nos estudos de docking de ligantes por estar muito distante do sítio de interação.

Figura 22 - Representação das HTMs do modelo obtido.

Após a minimização deste modelo, não restaram choques estéricos significativos na

estrutura. A análise do mapa de Ramachandran do modelo (ver Figura 23), realizada com o

programa RAMPAGE (LOVELL et al., 2002), mostra 86,9% dos resíduos em regiões

favoráveis e 8,7% em regiões permitidas. Os resíduos posicionados em regiões desfavoráveis


(4,4%) são resíduos distantes do sítio de interação, o que não compromete a utilização deste

modelo em estudos de docking.

Figura 23 - Mapa de Ramachandran do modelo obtido mostrando as regiões favoráveis (cores escuras), permitidas (cores claras) e desfavoráveis (branco).


Embora a identidade seqüencial entre as HTMs do receptor 5-HT1A e a rodopsina

bovina seja de apenas 18,8%, é possível inferir que este receptor apresente um enovelamento

bastante semelhante ao da proteína-molde, uma vez que ambos possuem diversos motivos

conservados (seqüências de aminoácidos altamente conservadas). Assim, apesar da baixa

identidade seqüencial quando se leva em consideração as seqüências como um todo, os

aminoácidos estruturalmente ou funcionalmente importantes são conservados ou ao menos

substituídos por aminoácidos de alta similaridade. Nesse caso, pode-se esperar modelos mais

precisos do que no caso de outros tipos de proteínas baseados em moldes de baixa identidade

seqüencial.

Entretanto, é necessário ressaltar que essa consideração é válida apenas para as regiões

transmembrânicas, uma vez que as regiões terminais e os loops são extremamente flexíveis e

divergentes com relação à seqüência de aminoácidos da rodopsina. Uma vez que o sítio de

interação do receptor 5-HT1A fica localizado na região transmembrânica, essas outras regiões

não são importantes para o presente estudo. A única exceção é o loop LE2, que na estrutura

cristalográfica da rodopsina fica bastante próximo das HTMs e, especialmente, do retinal

(ligante co-cristalizado com a estrutura da rodopsina). É bastante provável que isso ocorra

também em outros GPCRs, uma vez que existe uma ponte de dissulfeto entre cisteínas na

HTM3 e em LE2.

Na Figura 24a, pode-se observar que os resíduos cruciais para a interação com os

ligantes, tais como Asp3.32, Asn7.39, Ser5.42, Thr5.43 e Trp 6.48 aparecem localizados na

superfície acessível aos ligantes, assim como uma parte do loop LE2. Com o objetivo de

analisar as características das interações entre o receptor 5-HT1A e os compostos

arilpiperazínicos da série em estudo, foram feitos estudos de docking com quatro ligantes (ver

Figura 20), cuja ordem de afinidade é: 1 > 2 > 3 > 4.


(a) (b) Figura 24 - (a) Localização dos resíduos cruciais para a interação com os ligantes nas HTMs e (b) Posicionamento dos ligantes nas HTMs.

Conforme mostrado na Figura 24b, os resultados do estudo de docking sugerem que os

ligantes estão posicionados entre as hélices 3, 5, 6 e 7. Todos os ligantes estudados

apresentam um alto grau de liberdade conformacional, o que resulta em evidentes diferenças

nas interações específicas entre cada ligante e o modelo do receptor. Como foi adicionada a

restrição de distância entre o resíduo Asp3.32 e o próton ligado ao N1 (ver Figura 20), todos

os ligantes contam com esta interação específica como ponto de ancoragem para o

reconhecimento pelo receptor.

Na Figura 25 são mostradas as interações entre o modelo do receptor 5-HT1A e os

ligantes 1 e 2. Embora o posicionamento desses ligantes seja bastante semelhante, é possível

verificar diferenças significativas nos modos de interação. O anel benzotiofeno do ligante 1

pode fazer uma interação aromática com Trp6.48; o grupo OH pode formar uma ligação de

hidrogênio com Thr3.37 e o oxigênio do anel benzodioxepínico pode formar uma ligação de

hidrogênio com Asn7.39. Já o ligante 2 apresenta uma interação a menos, o que pode ser

relacionado à diminuição de afinidade: o grupo OH pode interagir com Asn7.39, o anel

benzotiofeno pode interagir com Trp6.48 (embora esteja em uma posição menos favorável


com relação ao sistema aromático deste resíduo do que o do ligante 1), mas o substituinte Ar1

não encontra resíduos próximos capazes de fazer interações mais fortes do que as de van der

Waals.

1 2

Figura 25 - Interações específicas entre os ligantes 1 e 2 e o modelo do receptor 5-HT1A.

O posicionamento dos ligantes 3 e 4 é semelhante ao dos ligantes 1 e 2. Interações

entre o substituinte Ar2 (que neste caso é um anel tiofeno) e o resíduo Trp6.48 também podem

ser observadas para os ligantes 3 e 4, como mostrado na Figura 26. Entretanto, esses ligantes

perdem a interação com Asn7.39, que fica distante de grupos dos ligantes com os quais

poderia interagir.


3 4

Figura 26 - Interações específicas entre os ligantes 3 e 4 e o modelo do receptor 5-HT1A.

Os resultados obtidos permitem fazer certas generalizações sobre as interações entre o

receptor 5-HT1A e os compostos em estudo: (a) o anel piperazínico fica localizado entre as

hélices 3 e 7 devido à interação iônica entre o próton ligado ao nitrogênio 1 e o resíduo

Asp3.32, que é considerado o resíduo essencial para o reconhecimento desses ligantes pelo

receptor; (b) o resíduo Asn7.39 faz importantes interações com os ligantes que apresentam

maiores afinidades. Dependendo da conformação adotada pelo ligante, essas interações

podem ocorrer com os subtituintes do anel Ar1 ou com os grupos Z (ver Figura 20); (c) todos

os ligantes desse grupo apresentam uma interação aromática entre o anel Ar2 e os anéis do

resíduo Trp6.48. Esta observação é consistente com estudos anteriores que sugerem a

existência de uma região hidrofóbica altamente conservada em GPCRs da classe “A”, que

favorece o reconhecimento por ligantes apresentando substituintes aromáticos (LOPEZ-

RODRÍGUEZ et al., 2002). Além disso, este resultado é compatível com os mapas de

contribuição obtidos em nosso modelo HQSAR (ver Figura 16, Capítulo 7), nos quais o grupo

benzotiofeno aparece como uma das mais importantes contribuições favoráveis a altas

afinidades, juntamente com o anel piperazínico.


Outro resíduo considerado importante para a interação com o receptor 5-HT1A e que já

foi observado em estudos anteriores de modelagem deste receptor é a Ser5.42 (LOPEZ-

RODRÍGUEZ et al., 2002). Este resíduo está presente em todos os receptores para os quais o-

metoxifenilpiperazinas apresentam afinidades altas, não somente como o receptor 5-HT1A,

mas também com o receptor serotoninérgico 5-HT7 e com o adrenérgico R1A. Devido à

importância desse resíduo para a interação com ligantes diferentes dos nossos, os autores

desses estudos chegavam a modificar o modelo inicial ou restringir a trajetória da DM para

aproximar as hélices HTM3 e HTM5 (LOPEZ-RODRÍGUEZ et al., 2001b; SEEBER; DE

BENEDETTI; FANELLI, 2003).

Na Figura 24a, pode-se verificar que a HTM5 que contém o resíduo Ser5.42 aparece

relativamente distante da HTM3. Para os nossos ligantes, a distância entre essas hélices

acabou trazendo problemas para interpretar as interações feitas pelo substituinte Ar1. Por isso,

é possível apenas supor que as diferenças observadas nas afinidades possam ter alguma

relação com interações com Ser5.42, uma vez que os ligantes que escolhemos para analisar

apresentam diferenças significativas nos grupos substituintes dos anéis Ar1. A principal

diferença nos modos de interação do substituinte Ar1 pode ser observada na Figura 24b, que

mostra que o anel aril do ligante 2 fica torcido em direção à HTM5, favorecendo a interação

do nitrogênio do anel quinolínico com a Ser5.42, o que pode explicar a afinidade mais alta

deste ligante com relação aos demais (com exceção do ligante 1, que é o de maior afinidade

da série). Da mesma forma, o grupo 2-metóxi ligado ao anel fenil do ligante 3 pode interagir

com Ser5.42.

Nos ligantes com afinidades mais baixas, o substituinte Ar1 fica distante deste resíduo,

porém próximo do loop LE2. Um estudo anterior já havia sugerido que o loop LE2 poderia

estar envolvido na interação de certas aminas biogênicas com seus receptores formando uma

“tampa” sobre os ligantes, estabilizando essa interação (KRISTIANSEN, 2004). Além disso,


como já foi comentado anteriormente, essa característica é observada nas estruturas

cristalográficas da rodopsina e do receptor adrenérgico-β2, nas quais os loops LE2 ficam

próximos dos ligantes retinal e carazolol, respectivamente. Isso demonstra a importância da

modelagem deste loop em modelos de receptores serotoninérgicos, ao contrário do que é

comum na literatura, ou seja, a modelagem apenas das hélices transmembrânicas.

As características observadas no sítio de interação permitem fazer relevantes

comparações com os mapas de contorno obtidos com o método CoMFA (ver Figura 19,

Capítulo 8): (a) um substituinte retirador de elétrons enfraquecerá a interação do O

benzodioxepínico com Asn7.39, por isso a introdução de um grupo positivo no anel

benzodioxepínico pode ser favorável para a afinidade; (b) a região próxima à hidroxila é

claramente impedida, por isso somente a substituição por grupos pouco volumosos é

favorável a um aumento nos valores de afinidade; (c) a região ocupada pelo anel Ar1 é

restringida por resíduos no loop LE2, o que está de acordo com o poliedro amarelo

correspondente a esse anel no mapa de contorno estérico resultante do modelo CoMFA.

9.3. Conclusões

O modelo do receptor 5-HT1A obtido neste estudo apresentou boa qualidade

estereoquímica, conforme avaliado pelas principais ferramentas de validação empregadas. A

região do sítio de interação demonstrou características observadas em estudos anteriores,

tendo sido possível observar as principais interações descritas em estudos de mutagênese

sítio-dirigida (resíduos Asp3.32, Asn7.39 e Ser5.42) e de modelagem molecular (resíduos

Trp6.48 e Thr3.37). Além destas, o posicionamento do loop LE2 mostrou ser perfeitamente

possível a participação de resíduos desta região na interação com arilpiperazinas.


A determinação dos modos de interação dos ligantes estudados é dificultada por dois

fatores: o alto grau de liberdade conformacional dos ligantes e o fato de que o nosso modelo é

estático, embora as proteínas sejam na realidade mais ou menos flexíveis. Isso pode levar a

imprecisões adicionais, especialmente para receptores ativados, uma vez que o sítio de

interação do estado ativado dos GPCRs provavelmente tenha uma flexibilidade maior do que

no estado fundamental. Entretanto, devido à consistência entre as interações observadas para

o nosso modelo com interações verificadas em estudos de mutagênese sítio-dirigida e outros

estudos de modelagem molecular, podemos sugerir que os complexos ligante-receptor obtidos

neste estudo podem servir de ponto de partida para estudos visando, por exemplo, o

entendimento do potencial antagonista desses ligantes, que possam fornecer subsídios para o

planejamento de fármacos capazes de proporcionar avanços para a terapia antidepressiva.

10. Considerações Finais 122

10. CONSIDERAÇÕES FINAIS

Embora sejam a classe mais prescrita de antidepressivos, os ISRSs apresentam

diversas propriedades indesejáveis, tais como demora no início da ação terapêutica, o que traz

a necessidade do desenvolvimento de novas estratégias para a obtenção de fármacos mais

eficazes. A combinação de ISRSs com antagonistas do receptor 5-HT1A mostrou ser uma

abordagem interessante para o aceleramento da resposta clínica desses medicamentos. Assim,

a busca por antagonistas do receptor 5-HT1A resultou na obtenção de derivados

arilpiperazínicos demonstrando afinidade por este receptor e potencial utilização como

auxiliares no tratamento da depressão com ISRSs.

Nesse contexto, o presente trabalho teve a intenção de contribuir para o entendimento

das características dos compostos arilpiperazínicos responsáveis pelas interações com o

receptor 5-HT1A, empregando diferentes abordagens computacionais. Os principais resultados

dos estudos de QSAR indicaram algumas características como sendo importantes para altas

afinidades: (a) a presença de um anel benzotiofeno como substituinte Ar2, conforme indicado

pelos mapas de contribuição gerados com o método HQSAR e pelo modelo de interação entre

o ligante com maior afinidade do conjunto de dados e o receptor e (b) grupos pouco

volumosos como substituintes Z e ligados à posição orto do anel Ar1, com preferência por

receptores de ligações de hidrogênio nessas posições.

Essas características foram confirmadas pelo estudo das interações do composto com

maior afinidade do conjunto de dados com o modelo do receptor, que indicou uma importante

interação hidrofóbica do grupo benzotiofeno com o resíduo Trp6.48 do receptor, assim como

uma ligação de hidrogênio entre a hidroxila na posição Z e o resíduo Thr3.37 e, ainda, entre o

oxigênio do anel Ar1 e o resíduo Asn7.39.

10. Considerações Finais 123

Assim, podemos afirmar que os métodos escolhidos foram empregados com sucesso

na caracterização dos requisitos estruturais necessários para a afinidade pelo receptor em

estudo. Além disso, modelos de QSAR com boa consistência interna, habilidade preditiva e

estabilidade foram obtidos e podem servir de base para a busca por novos ligantes do receptor

5-HT1A. O modelo tridimensional deste receptor apresentou consistência com dados

experimentais disponíveis sobre os resíduos importantes para as interações com ligantes

arilpiperazínicos, o que torna possível sua utilização em estudos mais cuidadosos sobre os

aspectos energéticos e conformacionais das interações deste receptor com ligantes.

Cada um dos métodos empregados neste trabalho possui suas vantagens e limitações.

Entretanto, os avanços metodológicos que têm sido feitos nos últimos anos, bem como a

integração de diferentes abordagens, especialmente unindo informações da estrutura dos

ligantes com a do receptor biológico, confirmam a importância da utilização desses métodos

na otimização das propriedades farmacodinâmicas de novos ligantes que possam ser

empregados na terapia antidepressiva.

Referências Bibliográficas 124

REFERÊNCIAS BIBLIOGRÁFICAS AKAMATSU, M. Current state and perspectives of 3D-QSAR. Current Topics in Medicinal Chemistry, v. 2, p. 1381-1394, 2002. ALBERT, P. R.; LEMONDE, S. 5-HT1A Receptors, Gene Repression, and Depression: Guilt by Association. Neuroscientist, v. 10, p. 575–593, 2004. ALTSCHUL, S. F.; MADDEN, T. L.; SCHAFFER, A. A.; ZHANG, J. H.; ZHANG, Z.; MILLER, W.; LIPMAN, D. J. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Research, v. 25, n. 17, p. 3389-3402, 1997. ALLINGER, N. L.; YUH, Y. H.; LII, J. H. Molecular mechanics. The MM3 force field for hydrocarbons. Journal of the American Chemical Society, v. 111, p .8551-8566, 1989. ARVIDSSON, L. E.; HACKSELL, U.; NILSSON, J. L.; HJORTH, S.; CARLSSON, A.; LINDBERG, P.; SANCHEZ, D.; WIKSTROM, H. 8-Hydroxy-2-(di-n-propylamino)tetralin, a new centrally acting 5-hydroxytryptamine receptor agonist. Journal of Medicinal Chemistry, v. 24, p. 921-923, 1981. AZMITIA, E. C. Neuronal instability: Implications for Rett’s syndrome. Brain and Development, v. 23, Suplemento 1, p. 1-10, 2001. BAKER, D.; SALI, A. Protein structure prediction and structural genomics. Science, v. 294, p. 93-96, 2001. BALABAN, A.T. Highly discriminating distance-based topological index. Chemical Physics Letters, v.89, p.399-404, 1982. BALDWIN, J. M.; SCHERTLER, G. F.; UNGER, V. M. An alpha-carbon template for the transmembrane helices in the rhodopsin family of G-protein-coupled receptors. Journal of Molecular Biology, v. 272, p. 144-164, 1997. BALLESTEROS, J. A.; WEINSTEIN, H. Integrated methods for modeling G-protein coupled receptors. Methods in Neuroscience, v.25, p. 366-428, 1996. BARNARD, J.M.; DOWNS, G.M. Chemical fragment generation and clustering software. Journal of Chemical Information and Computer Science, v.37, p.141-142, 1997. BARNES, N. M.; SHARP, T. A review of central 5-HT receptors and their function. Neuropharmacology, v. 38, p. 1083-1152, 1999. BARRETT, J.E.; VANOVER, K.E. 5-HT receptors as targets for the development of novel anxiolytic drugs - models, mechanisms and future-directions. Psychopharmacology, v.112, p.1-12, 1993. BECK-SICKINGER, A.G. Structural characterization and binding sites of G protein-coupled receptors. Drug Discovery Today, v.1, p. 502–513, 1996.


BEEBE, K. R.; PELL, R. J.; SEASHOLTZ, M. B. Chemometrics: a practical guide. New York: John Wiley, 1998. 459p. BERMAN, H.M.; WESTBROOK, J.; FENG, Z.; GILLILAND, G.; BHAT, T.N.; WEISSIG, H.; SHINDYALOV, I.N.; BOURNE, P.E. The Protein Data Bank. Nucleic Acids Research, v. 28, p. 235-242, 2000. BISSANTZ, C.; FOLKERS, G.; ROGNAN, D. Protein-based virtual screening of chemical databases. 1. Evaluation of different docking/scoring combinations. Journal of Medicinal Chemistry, v. 43, p. 4759-4767, 2000. BLANKLEY, C. J. Recent Developments in 3D-QSAR. In: VAN DE WATERBEEMD, H. (Ed.). Structure-property correlations in drug research. Austin: R. G. Landes Company, 1996. p.120-121. BLIER, P.; DE MONTIGNY, C.; CHAPUT, Y. A role for the serotonin system in the mechanism of action of antidepressant treatments: preclinical evidence. Journal of Clinical Psychiatry, v. 51, p. 14-20, 1990. BOWIE, J. U.; LUTHY, R.; EISENBERG, D. A method to identify protein sequences that fold into a known three-dimensional structure. Science, v. 253, p. 164-170, 1991. BROWN, N.; LEWIS, R. A. Exploiting QSAR methods in lead optimization. Current Opinion in Drug Discovery, v.9, p.419-424, 2006. BRENNER, S. E.; CHOTHIA, C.; HUBBARD, T. J. Assessing sequence comparison methods with reliable structurally identified distant evoulutionary relationships. Proceedings of the National Academy of Sciences of the United States of America, v. 95, p. 6073-6078, 1998. BRERETON, R. G. Multivariate pattern recognition in chemometrics, illustrated by case studies. Amsterdam: Elsevier, 1992. 325 p. BRONOWSKA, A.; LES, A.; CHILMONCZYK, Z.; FILIPEK, S.; EDVARDSEN, O.; OSTENSEN, R.; SYLTE, I. Molecular dynamics of buspirone analogues interacting with the 5-HT1A and 5-HT2A serotonin receptors. Bioorganic and Medicinal Chemistry, v. 9, p. 881-895, 2001. BROWN, Frank. Editorial Opinion: Chemoinformatics – a ten year update. Current Opinion in Drug Discovery and Development, v. 8, p. 296-302, 2005. BRUNS, R. E.; FAIGLE, J.F.G. Quimiometria. Química Nova, p.84-99, 1985. BULTINCK, P.; TOLLENAERE, J. P.; WINTER, H. Computational medicinal chemistry for drug discovery. New York: Marcel Dekker Inc., 2003, 794p. CASTRÉN, E. Is mood chemistry? Nature Reviews Neuroscience, v.6, p.241-246, 2005.


CHEREZOV, V.; ROSENBAUM, D. M.; HANSON, M. A.; RASMUSSEN, S. G. F.; THIAN, F. S.; KOBILKA, T. S.; CHOI, H.-J.; KUHN, P.; WEIS, W. I.; KOBILKA, B. K.; STEVENS, R. C. High-Resolution Crystal Structure of an Engineered Human b2-Adrenergic G Protein–Coupled Receptor. Science, v. 318, p. 1258-1265, 2007. CLARK, M.; CRAMER III, R. D.; VAN OPDENBOSCH, N. Validation of the general purpose tripos 5.2 force field. Journal of Computational Chemistry, v. 10, p. 982-1012, 1989. CONSONNI, V.; TODESCHINI, R.; PAVAN, M. Structure/response correlations and similarity/diversity analysis by GETAWAY descriptors. 1. Theory of the novel 3D molecular descriptors.Journal of Chemical Information and Computer Science, v.42, p.682-692, 2002. CONSONNI, V.; TODESCHINI, R.; PAVAN, M.; GRAMATICA, P. Structure/response correlations and similarity/diversity analysis by GETAWAY descriptors. 2. Application of the novel 3D molecular descriptors to QSAR/QSPR studies. Journal of Chemical Information and Computer Science, v.42, p.693-705, 2002. CRAMER III, R. D.; PATTERSON, D. E.; BUNCE, J. D. Comparative Molecular Field Analysis (CoMFA). 1. Effect of Shape on Binding of Steroids to Carrier Proteins. Journal of the American Chemical Society, v.110, p.5959-5967, 1988. CRIVORI, P.; CRUCIANI, G.; CARRUPT, P.-A.; TESTA, B. Predicting blood-brain barrier permeation from three-dimensional molecular structure. Journal of Medicinal Chemistry, v.43, p.2204-2216, 2000. CRUCIANI, C.; CRIVORI, P.; CARRUPT, P.-A.; TESTA, B. Molecular fields in quantitative structure-permeation relationships: the VolSurf approach. Journal of Molecular Structure: Theochem, v.503, p.17-30, 2000. DABROWSKA, J.; BRYLINSKI, M. Stereoselectivity of 8-OH-DPAT toward the serotonin 5-HT1A receptor: Biochemical and molecular modeling study. Biochemical Pharmacology, v. 72, p. 498-511, 2006. DEANE, C. M.; BLUNDELL, T. L. A novel exhaustive search algorithm for predicting the conformation of polypeptide segments in proteins. Proteins, v. 40, p. 135-144, 2000. DEANE, C.M. and BLUNDELL, T.L. CODA: a combined algorithm for predicting the structurally variable regions of protein models. Protein Science, v. 10, p. 599-612, 2001. DEANE, C. M.; BLUNDELL, T. L. Protein comparative modelling and drug discovery. In: WERMUTH, C. G. (Ed.). The practice of medicinal chemistry. 2.ed. London: Elsevier Academic Press, 2003. 768 p. DE BAKKER, P. I.; DEPRISTO, M. A.; BURKE, D. F.; BLUNDELL, T. L. Ab initio construction of polypeptide fragments: Accuracy of loop decoy discrimination by an all-atom statistical potential and the AMBER force field with the Generalized Born solvation model. Proteins, v. 51, p. 21-40, 2003.


DEL OLMO, E.; LOPEZ-GIMENEZ, J. F.; VILARO, M. T.; MENGOD, G.; PALACIOS, J. M.; PAZOS, A. Early localization of mRNA coding for 5-HT1A receptors in human brain during development. Molecular Brain Research, v. 60, p. 123-126, 1998. DEPRISTO, M. A.; DE BAKKER, P. I.; LOVELL, S. C.; BLUNDELL, T. L. Ab initio construction of polypeptide fragments: efficient generation of accurate, representative ensembles. Proteins, v. 51, p. 41-55, 2003. DEWAR, M. J. S.; ZOEBISCH, E.G.; HEALY, E.F.; STEWART, J.J.P. AM1: A New General Purpose Quantum Mechanical Molecular Model. Journal of the American Chemical Society, v.107, p.3902-3909, 1985. DOVE, S.; BUSCHAUER, A. Improved alignment by weighted field fit in CoMFA of histamine H-2 receptor agonists imidazolylpropylguanidines. Quantitative Structure-Activity Relationships, v.18, p.329- 341, 1999. DRESHFIELD, L. J.; WONG, D. T.; PERRY, K. W.; ENGLEMAN, E. A. Enhancement of fluoxetine-dependent increase of extracellular serotonin (5-HT) levels by (-)-pindolol, an antagonist at 5-HT1A receptors. Neurochemistry Research, v.21, p.557, 1996. DUDEK, A. Z.; ARODZ, T.; GÁLVEZ, J. Computational methods in developing quantitative structure-activity relationships (QSAR): a review. Combinatorial Chemistry and High Throughput Screening, v.9, p.213-228, 2006. DUNBRACK JR, R. L.; KARPLUS, M. Backbone-dependent rotamer library for proteins. Application to side-chain prediction. Journal of Molecular Biology, v. 230, p. 543-574, 1993. EDDY, S. R. Profile hidden Markov models. Bioinformatics, v. 14, p. 755-763, 1998. EL MESTIKAWY, S.; RIAD, M.; LAPORTE, A. M.; VERGE, D.; DAVAL, G.; GOZLAN, H.; HAMON, M. Production of specific anti-rat 5-HT1A receptor antibodies in rabbits injected with a synthetic peptide. Neuroscience Letters, v. 118, p.189-192, 1990. ENGH, R.A.; HUBER, R. Accurate Bond And Angle Parameters For X-Ray Protein- Structure Refinement. Acta Crystallographica Section A, v. 47, p. 392-400, 1991. ERIKSSON, L.; JAWORSKA, J.; WORTH, A. P.; CRONIN, M. T. D.; MCDOWELL, R. M.; GRAMATICA, P. Methods for Reliability and Uncertainty Assessment and for Applicability Evaluations of Classification- and Regression-Based QSARs. Environmental Health Perspectives, v. 111, p. 1361-1375, 2003. ERIKSSON, L.; JOHANSSON, E. Multivariate design and modeling in QSAR. Chemometrics Intelligent Laboratory Systems, v.34, p.1-19, 1996. FARGIN, A.; RAYMOND, J. R.; LOHSE, M. J.; KOBILKA, B. K.; CARON, M. G.; LEFKOWITZ, R. J. The genomic clone G-21 which resembles a β-adrenergic receptor sequence encodes the 5-HT1A receptor. Nature, v. 335, p. 358-360, 1988.


FISCHER, D.; EISENBERG, D. Protein fold recognition using sequence-derived predictions. Protein Science, v. 5, p. 947-955, 1996. FOYE, W. O.; LEMKE, T. L.; WILLIAMS, D. A. Principles of medicinal chemistry. 4.ed. Baltimore: Williams & Wilkins, 1995. 995p. GAILLARD, P.; CARRUPT, P.-A., TESTA, B.; SCHAMBEL, P. Binding of arylpiperazines, (aryloxy)propanolamines, and tetrahydropyridylinldoles to the 5-HT1A receptor: Contribution of the molecular lipophilicity potential to three-dimensional quantitative structure-affinity relationship models. Journal of Medicinal Chemistry, v.39, p.126-134, 1996. GALLEGOS, A.; GIRONES, X. Topological quantum similarity indices based on fitted densities: Theoretical background and QSPR application. Journal of Chemical Information and Computer Science, v.45, p.321-326, 2005. GÁLVEZ, J.; GARCIA, R.; SALABERT, M.T.; SOLER, R. Charge indexes - new topological descriptors. Journal of Chemical Information and Computer Science, v.34, p.520-552, 1994. GANELLIN, C. R.; ROBERTS, S. M. Medicinal chemistry: The role of organic chemistry in drug research. 2.ed. San Diego: Academic Press, 1994. 1275p. GAUSSIAN INC. Gaussian 03, Revision C.02, Wallingford CT, 2004. [Programa de Computador] GEARY, R. C. The contiguity ratio and statistical mapping. Incorporated Statistics, v.5, p.115-145, 1954. GETHER, U. Uncovering molecular mechanisms involved in activation of G-protein coupled receptors. Endocrine Reviews, v. 21, p. 90-113, 2000. GOPAL, S.; SCHROEDER, M.; PIEPER, U.; SCZYRBA, A.; AYTEKIN-KURBAN, G.; BEKIRANOV, S.; FAJARDO, J. E.; ESWAR, N.; SANCHEZ, R.; SALI, A.; GAASTERLAND, T. Homology-based annotation yields 1,042 new candidate genes in the Drosophila melanogaster genome. Nature Genetics, v. 27, p. 337-340, 2001. GOZLAN, H.; ELMESTIKAWY, S.; PICHAT, L.; GLOWINSKI, J.; HAMON, M. Identification of presynaptic serotonin autoreceptors using a new ligand: 3H-PAT. Nature, v. 305, p. 140-142, 1983. GRAMATICA, P. Principles of QSAR models validation: internal and external. QSAR and Combinatorial Science, v. 26, p. 694-701, 2007. GREER, J. Model for haptoglobin heavy chain based upon structural homology. Proceedings of the National Academy of Sciences of the United States of America, v. 77, p. 3393–3397, 1980. GRIEBEL, G. 5-HT1A receptor blockers as potential drug candidates for the treatment of anxiety disorders. Drug News and Perspectives, v. 12, p. 484-490, 1999.


GROSS, C.; ZHUANG, X.; STARK, K.; RAMBOZ, S.; OOSTING, R.; KIRBY, L.; SANTARELLI, L.; BECK, S.; HEN, R. Serotonin1A receptor acts during development to establish normal anxiety-like behaviour in the adult. Nature, v. 416, p. 396-400, 2002. GUAN, X. M.; PEROUTKA, S. J.; KOBILKA, B. K. Identification of a single amino acid residue responsible for the binding of a class of betaadrenergic receptor antagonists to 5- hydroxytryptamine1A receptors. Molecular Pharmacology, v. 41, p. 695-698, 1992. GÜNER, O.F. History and Evolution of the Pharmacophore Concept in Computer-Aided Drug Design. Current Topics in Medicinal Chemistry, v.2, p.1321-1332, 2002. HEDBERG, M. H.; JANSEN, J. M.; NORDVALL, G.; HJORTH, S.; UNELIUS, L.; JOHANSSON, A. M. 10-substituted 11-oxygenated (R)-aporphines: synthesis, pharmacology, and modeling of 5-HT1A receptor interactions. Journal of Medicinal Chemistry, v. 39, p. 3491-3502, 1996. HEINRICH, T.; BÖTTCHER, H.; BARTOSZYK, G. D.; GREINER, H. E.; SEYFRIED, C. A.; VAN AMSTERDAM, C. Indolebutylamines as Selective 5-HT1A Agonists. Journal of Medicinal Chemistry, v.47, p.4677-4683, 2004. HEINRICH, T.; BÖTTCHER, H.; GERICKE, R.; BARTOSZYK, G. D.; ANZALI, S.; SEYFRIED, C. A.; GREINER, H. E.; VAN AMSTERDAM, C. Synthesis and Structure-Activity Relationship in a Class of Indolebutylpiperazines as Dual 5-HT1A Receptor Agonists and Serotonin Reuptake Inhibitors. Journal of Medicinal Chemistry, v.47, p.4684-4692, 2004. HERITAGE, T. W.; LOWIS, D. R. Molecular hologram QSAR. In: PARRILL, A. L., REDDY, M. R. (Eds.). Rational Drug Design: Novel methodology and practical applications. Washington: American Chemical Society, 1999. 400 p. HIGO, J.; GO, N. Algorithm for rapid calculation of excluded volume of large molecules. Journal of Computational Chemistry, v.10, p.376-379, 1989. HOLDEN, C. Future Brightening for Depression Treatments. Science, v.302, p.810-813, 2003. HOMAN, E. J.; WIKSTROM, H. V.; GROL, C. J. Molecular modeling of the dopamine D2 and serotonin 5-HT1A receptor binding modes of the enantiomers of 5-OMe-BPAT. Bioorganic and Medicinal Chemistry, v. 7, p. 1805-1820, 1999. HONÓRIO, K.M.; ANDRICOPULO, A.D. Two-dimensional quantitative structure-activity relationships: Hologram QSAR. In TAFT, C. A.; SILVA, C. H. T. P. (Eds.) Current methods in medicinal chemistry and biological physics, 2007, v.1, p. 49-60. HOYER, D., HANNON, J. P., AND MARTIN, G. R. Molecular, pharmacological and functional diversity of 5-HT receptors. Pharmacoly Biochemistry and Behavior, v. 71, p. 533-554, 2002. HYPERCUBE, HyperChem: Release 4.5 for Windows. Ontario, 1995. [Programa de Computador]


INFOMETRIX INC. Pirouette 3.11. Woodinville, 2002. [Programa de Computador] INFOMETRIX INC. Pirouette: user’s guide. Woodinville, 2002. 430p. ITSKOWITZ, P.; TROPSHA, A. Kappa-nearest neighbors QSAR modeling as a variational problem: Theory and applications. Journal of Chemical Information and Modelling, v.45, p.777-785, 2005. JOHNSON, M. S.; SRINIVASAN, N.; SOWDHAMINI, R.; BLUNDELL, T. L. Knowledge-based protein modeling. Critical Reviews in Biochemistry and Molecular Biology, v. 29, p. 1-68, 1994. JONES, D. T. Protein Secondary Structure Prediction Based on Position-specific Scoring Matrices. Journal of Molecular Biology, v. 292, p. 195-202, 1999. JONES, D. T.; TAYLOR, W. R.; THORNTON, J. M. A new approach to protein fold recognition. Nature, v. 358, p. 86-89, 1992. JONES, G.; WILLETT, P.; GLEN, R.C. Molecular recognition of receptor sites using a genetic algorithm with a description of desolvation. Journal of Molecular Biology, v. 245, p. 43-53, 1995. JONES, G.; WILLETT, P.; GLEN, R.C.; LEACH, A.R.; TAYLOR, R. (1997) Development and validation of a genetic algorithm for flexible docking. Journal of Molecular Biology, v. 267, p. 727-748, 1997. JONES, T. A.; KLEYWEGT, G. J. CASP3 comparative modeling evaluation. Proteins, v. 37, p. 30-46, 1996. KARPLUS, K.; SJOLANDER, K.; BARRETT, C.; CLINE, M.; HAUSSLER, D.; HUGHEY, R.; HOLM, L.; SANDER, C. Predicting protein structure using hidden Markov models. Proteins. Suplemento 1, p. 134-139, 1997. KATRITZKY, A. R.; KARELSON, M.; PETRUKHIN, R. CODESSA [Programa de Computador] Florida, 2001. KIER, L.B.; HALL, L.H. Derivation and significance of valence molecular connectivity Journal of Pharmaceutical Sciences, v.70, p.583-589, 1981. KIRKPATRICK, S.; GELATT, C.D.; VECCHI, M.P. Optimization By Simulated Annealing. Science, v. 220, p. 671-680, 1983. KITCHEN, D. B.; DECORNEZ, H.; FURR, J. R.; BAJORATH, J. Docking and scoring in virtual screening for drug discovery: methods and applications. Nature Reviews in Drug Discovery, v. 3, p. 935-948, 2004. KLEBE, G.; ABRAHAM, U.; MIETZNER, T. Molecular similarity indices in a comparative analysis (CoMSIA) of drug molecules to correlate and predict their biological activity. Journal of Medicinal Chemistry, v.37, p.4130-4146, 1994.


KOBILKA, B. K.; FRIELLE, T.; COLLINS, S.; YANG-FENG, T.; KOBILKA, T. S.; FRANCKE, U.; LEFKOWITZ, R. J.; CARON, M. G. An intronless gene encoding a potential member of the family of receptors coupled to guanine nucleotide regulatory proteins. Nature, v. 329, p. 75-79, 1987. KOHAVI, R.; JOHN, G. Wrappers for feature subset selection. Artificial Intelligence , v.97, p.273-324, 1997. KORETKE, K. K., RUSSELL, R. B.; COPLEY, R. R.; LUPAS, A. N. Fold recognition using sequence and secondary structure information. Proteins, v. 37, p. 141-148, 1999. KOSTANTINOVA, E. V. The Discrimination Ability of Some Topological and Information Distance Indices for Graphs of Unbranched Hexagonal Systems. Journal of Chemical Information and Computer Science, v.36, p.54-57, 1996. KRISTIANSEN, K. Molecular mechanisms of ligand binding, signaling, and regulation within the superfamily of Gprotein-coupled receptors: molecular modeling and mutagenesis approaches to receptor structure and function. Pharmacology and Therapeutics, v.103, p. 21-80, 2004. KUBINYI, H. QSAR: Hansch analysis and related approaches. New York: VCH, 1993. 240p. KUIPERS, W.; VAN WIJNGAARDEN, I.; KRUSE, C. G.; TER HORST-VAN AMSTEL, M.; TULP, M. T.; IJZERMAN, A. P. N4-unsubstituted N1-arylpiperazines as high-affinity 5-HT1A receptor ligands. Journal of Medicinal Chemistry, v. 38, p. 1942-1954, 1995. LABUTE, P. A widely applicable set of descriptors. Journal of Molecular Graphics and Modelling, v.18, p.464-477, 2000. LASKOWSKI, R.A., MACARTHUR, M.W., MOSS, D.S.; THORNTON, J.M. Procheck - A Program To Check The Stereochemical Quality Of Protein Structures. Journal Of Applied Crystallography, v. 26, p. 283-291, 1993. LEFKOWITZ, R., COTECCHIA, S., SAMAMA, P. AND COSTA, T., Constitutive activity of receptors coupled to guanine nucleotide regulatory proteins. Trends in Pharmacological Science, v. 14, p. 303–307, 1993. LEMMEN, C.; LENGAUER, T. Computational methods for the structural alignment of molecules. Journal of Computer-Aided Molecular Design, v.14, p.215-232, 2000. LIAPAKIS, G.; BALLESTEROS, J. A.; PAPACHRISTOU, S.; CHAN, W. C.; CHEN, X.; JAVITCH, J. A. The forgotten serine. A critical role for Ser-2035.42 in ligand binding to and activation of the beta 2-adrenergic receptor. Journal of Biological Chemistry, v. 275, p. 37779-37788, 2000. LIN, T.-H.; LI, H.-T.; TSAI, K.-C. Implementing the Fisher's discriminant ratio in a k-means clustering algorithm for feature selection and data set trimming. Journal of Chemical Information and Computer Science, v.44, p.76-87, 2004.


LOPEZ-RODRIGUEZ, M. L.; AYALA, D.; BENHAMU, B.; MORCILLO, M. J.; VISO, A. Arylpiperazine derivatives acting at 5-HT(1A) receptors. Current Medicinal Chemistry , v. 9, p. 443-469, 2002. LÓPEZ-RODRÍGUEZ, M. L.; AYALA, D.; VISO, A.; BENHAMÚ, B.; FERNÁNDEZ DE LA PRADILLA, R.; ZARZA, F.; RAMOS, J. A. Synthesis and Structure-Activity Relationships of a New Model of Arylpiperazines. 7. Study of the Influence of Lipophilic Factors at the Terminal Amide Fragment on 5-HT1A Affinity/Selectivity. Bioorganic and Medicinal Chemistry, v.12, p.1551-1557, 2004. LÓPEZ-RODRÍGUEZ, M. L.; MORCILLO, M. J.; FERNÁNDEZ, E.; BENHAMÚ, B.; TEJADA, I.; AYALA, D.; VISO, A.; CAMPILLO, M.; PARDO, L.; DELGADO, M.; MANZANARES, J.; FUENTES, J. A. Synthesis and Structure-Activity Relationships of a New Model of Arylpiperazines. 8.1 Computational Simulation of Ligand-Receptor Interaction of 5-HT1AR Agonists with Selectivity over r1-Adrenoceptors. Journal of Medicinal Chemistry, v.48, p.2548-2558, 2005. LÓPEZ -RODRÍGUEZ, M. L.; MORCILLO, M. J.; FERNÁNDEZ, E.; PORRAS, E.; MURCIA, M.; SANZ, A. M.; ORENSANZ, L. Synthesis and Structure-Activity Relationships of a New Model of Arylpiperazines. 3. 2-[ö-(4-Arylpiperazin-1-yl)alkyl]perhydropyrrolo-[1,2-c]imidazoles and -perhydroimidazo[1,5-a]pyridines: Study of the Influence of the Terminal Amide Fragment on 5-HT1A Affinity/Selectivity. Journal of Medicinal Chemistry, v.40, p.2653-2656, 1997. LÓPEZ-RODRÍGUEZ, M. L.; MORCILLO, M. J.; FERNÁNDEZ, E.; PORRAS, E.; ORENSANZ, L.; BENEYTEZ, M. E.; MANZANARES, J.; FUENTES, J. A. Synthesis and Structure-Activity Relationships of a New Model of Arylpiperazines. 5. Study of the Physicochemical Influence of the Pharmacophore on 5-HT1A/R1-Adrenergic Receptor Affinity. Synthesis of a New Selective Derivative with Mixed 5-HT1A/D2 Antagonist Properties. Journal of Medicinal Chemistry, v.44, p.186-197, 2001. LÓPEZ-RODRÍGUEZ, M. L.; MORCILLO, M. J.; FERNÁNDEZ, E.; ROSADO, M. L.; PARDO, L.; SCHAPER, K.-J. Synthesis and Structure-Activity Relationships of a New Model of Arylpiperazines. 6. Study of the 5-HT1A/r1-Adrenergic Receptor Affinity by Classical Hansch Analysis, Artificial Neural Networks, and Computational Simulation of Ligand Recognition. Journal of Medicinal Chemistry, v.44, p.198-207, 2001. LÓPEZ -RODRÍGUEZ, M. L.; MORCILLO, M. J.; ROVAT, T. K.; FERNÁNDEZ, E.; VICENTE, B.; SANZ, A. M.; HERNÁNDEZ, M. Synthesis and Structure-Activity Relationships of a New Model of Arylpiperazines. 4. 1-[ö-(4-Arylpiperazin-1-yl)alkyl]-3-(diphenylmethylene)-2,5-pyrrolidinediones and -3-(9H-fluoren-9-ylidene)-2,5-pyrrolidinediones: Study of the Steric Requirements of the Terminal Amide Fragment on 5-HT1A Affinity/Selectivity. Journal of Medicinal Chemistry, v.42, p.36-49, 1999. LÓPEZ -RODRÍGUEZ, M. L.; ROSADO, M. L.; BENHAMU, B.; MORCILLO, M. J.; FERNÁNDEZ, E.; SCHAPER, K.-J. Synthesis and Structure- Activity Relationships of a New Model of Arylpiperazines. 2. Three-Dimensional Quantitative Structure-Activity Relationships of Hydantoin-Phenylpiperazine Derivatives with Affinity for 5-HT1A and R1 Receptors. A Comparison of CoMFA Models. Journal of Medicinal Chemistry, v.40, p.1648-1656, 1997.


LÓPEZ-RODRÍGUEZ, M. L.; ROSADO, M. L.; BENHAMU, B.; MORCILLO, M. J.; SANZ, A. M.; ORENSANZ, L.; BENEITEZ, M. E.; FUENTES, J. A.; MANZANARES , J. Synthesis and Structure-Activity Relationships of a New Model of Arylpiperazines. 1. 2-[[4-(o-Methoxyphenyl)piperazin-1-yl]methyl]-1,3-dioxoperhydroimidazo[1,5-a]pyridine: A Selective 5-HT1A Receptor Agonist. Journal of Medicinal Chemistry, v.39, p.4439-4450, 1996. LOVELL, S. C.; DAVIS, I. W.; ARENDALL III, W. B.; DE BAKKER, P. I.; WORD, J.M; PRISANT, M. G.; RICHARDSON, J. S.; RICHARDSON, D. C. Structure validation by Calpha geometry: phi,psi and Cbeta deviation. Proteins: Structure, Function & Genetics. v. 50, p. 437-450, 2002. LOVELL, S. C.; WORD, J. M.; RICHARDSON, J. S.; RICHARDSON, D. C. The penultimate rotamer library. Proteins, v. 40, p. 389-408, 2000. LOWIS, D. R. HQSAR: a new, highly predictive QSAR technique. Tripos Technical Notes. v.1. Disponível em: http://www.tripos.com/data/SYBYL/HQSAR_Application_Note_072605.pdf MARTÍNEZ-ESPARZA, J.; OFICIALDEGUI, A. M.; PÉREZ-SILANES, S.; HERAS, B.; ORÚS, L.; PALOP, J. A.; LASHERAS, B.; ROCA, J.; MOURELLE, M.; BOSCH, A.; DEL CASTILLO, J. C.; TORDERA, R.; DEL RIO, J.; MONGE, A. New 1-Aryl-3-(4-arylpiperazin-1-yl)propane Derivatives, with Dual Action at 5-HT1A Serotonin Receptors and Serotonin Transporter, as a New Class of Antidepressants. Journal of Medicinal Chemistry, v.44, p.418-428, 2001. MENZIANI, M. C.; DE BENEDETTI, P. G.; KARELSON, M. Theoretical Descriptors in Quantitative Structure-Affinity and Selectivity Relationship Study of Potent N4-Substituted Arylpiperazine 5-HT1A Receptor Antagonists. Bioorganic and Medicinal Chemistry, v.6, p.535-550, 1998. MERKWIRTH, C.; MAUSER, H.; SCHULZ-GASCH, T.; ROCHE, O.; STAHL, M.; LENGAUER, T. Ensemble methods for classification in cheminformatics. Journal of Chemical Information and Computer Science, v.44, p.1971-1978, 2004. MIZUGUCHI, K.; DEANE, C. M.; BLUNDELL, T. L.; JOHNSON, M. S.; OVERINGTON, J. P. JOY: Protein sequence-structure representation and analysis. Bioinformatics, v. 14, p. 617-623, 1998. MONTALVÃO, R. W. Protein structure prediction: differential geometry of proteins and comparative modelling. 2005. Tese (Doutorado) - Universidade de Cambridge, Cambridge, 2005. MONTALVÃO, R. W.; SMITH, R. E.; LOVELL, S. C.; BLUNDELL, T. L. CHORAL: a differential geometry approach to the prediction of the cores of protein structures. Bioinformatics, v. 21, n. 19, p. 3719–3725, 2005. MORAN, P. A. P. Notes on continuous stochastic phenomena. Biometrika, v.37, p.17-23, 1950.


MOULT, J. Predicting protein three-dimensional structure. Current Opinion in Biotechnology, v. 10, p. 583-588, 1999. MURPHY, D. L.,WICHEMS, C., LI, Q., AND HEILS, A. Molecular manipulations as tools for enhancing our understanding of 5-HT neurotransmission. Trends in Pharmacological Science, v. 20, p. 246-252, 1999. NATIONAL INSTITUTE OF MENTAL HEALTH. Depression. Bethesda (MD): National Institute of Mental Health, National Institutes of Health, US, 2002, 25 p. Disponível em: http://www.nimh.nih.gov/publicat/depression.cfm NOWAK, M.; KOŁACZKOWSKI, M.; PAWŁOWSKI, M.; BOJARSKI, A. J. Homology Modeling of the Serotonin 5-HT1A Receptor Using Automated Docking of Bioactive Compounds with Defined Geometry. Journal of Medicinal Chemistry, v. 49, p. 205-214, 2006. OFICIALDEGUI, A.M.; MARTINEZ, J.; PÉREZ, S.; HERAS, B.; IRURZUN, M.; PALOP, J.A.; TORDERA, R.; LASHERAS, B.; DEL RIO, J.; MONGE, A. Design, synthesis and biological evaluation of new 3-[(4-aryl)piperazin-1-yl]-1-arylpropane derivatives as potential antidepressants with a dual mode of action: serotonin reuptake inhibition and 5-HT1A receptor antagonism. Il Farmaco, v.55, p.345-353, 2000. OH, S. J.; HA, H.-J.; CHI, D. Y.; LEE, H. K. Serotonin Receptor and Transporter Ligands - Current Status. Current Medicinal Chemistry, v.8, p.999-1034, 2001. OKADA, T.; SUGIHARA, M.; BONDAR, A.N.; ELSTNER, M.; ENTEL, P.; BUSS, V. The retinal conformation and its environment in rhodopsin in light of a new 2.2 A crystal structure. Journal of Molecular Biology, v. 342, p. 571-583, 2004. ORÚS, L.; PÉREZ-SILANES, S.; OFICIALDEGUI, A. M.; MARTÍNEZ-ESPARZA, J.; DEL CASTILLO, J. C.; MOURELLE, M.; LANGER, T.; GUCCIONE, S.; DONZELLA, G.; KROVAT, E. M.; POPTODOROV, K.; LASHERAS, B.; BALLAZ, S.; HERVÍAZ, I.; TORDERA, R.; DEL RIO, J.; MONGE, A. Synthesis and Molecular Modeling of New 1-Aryl-3-[4-arylpiperazin-1-yl]-1-propane Derivatives with High Affinity at the Serotonin Transporter and at 5-HT1A Receptors. Journal of Medicinal Chemistry, v.45, p.4128-4139, 2002. PALCZEWSKI, K.; KUMASAKA, T.; HORI, T.; BEHNKE, C. A.; MOTOSHIMA, H.; FOX, B. A.; LE, T. I.; TELLER, D. C.; OKADA, T.; STENKAMP, R. E.; YAMAMOTO, M.; MIYANO, M. Crystal structure of rhodopsin: A G protein-coupled receptor. Science, v. 289, p. 739-745, 2000. PANCHENKO, A.; MARCHLER-BAUER, A.; BRYANT, S.H. Threading with explicit models for evolutionary conservation of structure and sequence. Proteins, v. 37, p. 133-140, 1999. PASTOR, M.; CRUCIANI, G.; MCLAY, I.; PICKETT, S.; CLEMENTI, S. GRid-INdependent descriptors (GRIND): A novel class of alignment-independent three-dimensional molecular descriptors. Journal of Medicinal Chemistry, v.43, p.3233-3243, 2000.


PATEL, Y.; GILLET, V. J.; BRAVI, G.; LEACH, A. R. A comparison of the pharmacophore identification programs: Catalyst, DISCO and GASP. Journal of Computer-Aided Molecular Design, v. 16, p. 653-681, 2002. PEARLMAN, R. S. Concord, Tripos Inc., St. Louis [Programa de Computador] PEARSON, W. R.; LIPMAN, D. J. Improved tools for biological sequence comparison. Proceedings of the National Academy of Sciences of the United States of America, v. 85, p. 2444-2448, 1988. PÉREZ-SILANES, S. P.; ORÚS, L.; OFICIALDEGUI, A. M.; ESPARZA, J. M.; LASHERAS, B.; DEL RÍO, J.; MONGE, A. New 3-[4-(2,3-dihydro-1,4-benzodioxin-5-yl)piperazin-1-yl]-1-(5-substitutedbenzo[b]thiophen-3-yl)propanol derivatives with dual action at 5-HT1A serotonin receptors and serotonin transporter as a new class of antidepressants. Pharmazie, v. 59, p.499-501, 2004. PIERCE, K. L.; PREMONT, R. T.; LEFKOWITZ, R. J. Seven-transmembrane receptors. Nature Reviews Molecular Cell Biology, v. 3, p. 639-650, 2002. PUCADYIL, T. J.; KALIPATNAPU, S.; CHATTOPADHYAY, A. The serotonin1A receptor: a representative member of the serotonin receptor family. Cellular and Molecular Neurobiology, v.25, p.553-580, 2005. RANDIC, M. Characterization of molecular branching. Journal of the American Chemical Society, v.97, p.6609-6615, 1975. RASMUSSEN, S. G. F.; CHOI1, H.-J.; ROSENBAUM, D. M.; KOBILKA, T. S.; THIAN, F. S.; EDWARDS, P. C.; BURGHAMMER, M.; RATNALA, V. R. P.; SANISHVILI, R.; FISCHETTI, R. F.; SCHERTLER, G. F. X.; WEIS, W. I.; KOBILKA, B. K. Crystal structure of the human 2 adrenergic G-protein-coupled receptor. Nature, v. 450, p. 383-387, 2007. RAYCHAUDHURY, C.; S. RAY, K.; GOSH, J. J.; ROY, A. B.; BASAK, S. C. Discrimination of isomeric structures using information theoretic topological indexes. Journal of Computational Chemistry, v.5, p.581-588, 1984. RAYMOND, J. R.; MUKHIN, Y. V.; GETTYS, T. W.; GARNOVSKAYA, M. N. The recombinant 5-HT1A receptor: G protein coupling and signaling pathways. British Journal of Pharmacology, v. 127, p. 1751-1764, 1999. RICHMOND, N. J.; ABRAMS, C. A.; WOLOHAN, P. R.; ABRAHAMIAN, E.; WILLETT, P.; CLARK, R. D. GALAHAD: 1. Pharmacophore identification by hypermolecular alignment of ligands in 3D. Journal of Computer-Aided Molecular Design, v. 20, p. 567-587, 2006. ROMEIRO, L. A. S.; FRAGA, C. A. M.; BARREIRO, E. J. Novas estratégias terapêuticas para o tratamento da depressão: uma visão da química medicinal. Química Nova, v.26, p.347-358, 2003.


RUBENSTEIN, L. A.; LANZARA, R. G. Activation of G protein-coupled receptors entails cysteine modulation of agonist binding. Journal of Molecular Structure (Theochem), v. 430: p. 57–71, 1998. SALI, A.; BLUNDELL, T. L. Definition of general topological equivalence in protein structures. A procedure involving comparison of properties and relationships through simulated annealing and dynamic programming. Journal of Molecular Biology, v. 212, p. 403-428, 1990. SCHULTZ, H.P. Topological organic-chemistry. 1. Graph-theory and topological indexes of alkanes. Journal of Chemical Information and Computer Science, v.29, p.227-222, 1989. SEEBER, M.; DE BENEDETTI, P. G.; FANELLI, F. Molecular dynamics simulations of the ligand-induced chemical information transfer in the 5-HT1A receptor. Journal of Chemical Information and Computer Science, v. 43, p. 1520-1531, 2003. SHARAF, M.A.; ILLMAN, D. L.; KOWALSKI, B. R. Chemometrics. New York: Wiley, 1986, 357p. SHARP, T.; UMBERS, V.; GARTSIDE, S. Effect of a selective 5-HT reuptake inhibitor in combination with 5-HT1A and 5-HT1B receptor antagonists on extracellular 5-HT in rat frontal cortex in vivo. British Journal of Pharmacology, v.121, p.941-946, 1997. SHEPPHIRD, J. K.; CLARK, R. D. A marriage made in torsional space: using GALAHAD models to drive pharmacophore multiplet searches. Journal of Computer-Aided Molecular Design, v. 20, p. 763-771, 2006. SHI, J.; BLUNDELL, T. L.; MIZUGUCHI, K. FUGUE: sequence-structure homology recognition using environment-specific substitution tables and structure-dependent gap penalties. Journal of Molecular Biology, v. 310, p. 243-257, 2001. SIEDLECKI, W.; SKLANSKY, J. On automatic feature selection. International Journal of Pattern Recognition and Artificial Intelligence, v.2, p.197-220, 1988. SILVERMAN, R.B. The organic chemistry of drug design and drug action. San Diego: Academic Press, 1992. 358p. SINGH, J. K.; CHROMY, B. A.; BOYERS, M. J.; DAWSON, G.; BANERJEE, P. Induction of the serotonin1A receptor in neuronal cells during prolonged stress and degeneration. Journal of Neurochemistry, v. 66, p. 2361-2372, 1996. SMITH, R. E.; LOVELL, S. C.; BURKE, D. F.; MONTALVÃO, R. W.; BLUNDELL, T. L. Andante: reducing side-chain rotamer search space during comparative modeling using environment-specific substitution probabilities. Bioinformatics, v. 23, n. 9, p. 1099-1105, 2007. SMITH, T. F.; WATERMAN, M. S. Identification of common molecular subsequences. Journal of Molecular Biology, v. 147, p. 195-197, 1981.


SRINIVASAN, N.; BLUNDELL, T. L. An evaluation of the performance of an automated procedure for comparative modeling of protein tertiary structure. Protein Engineering, v. 6, p. 501-512, 1993. STERNBERG, M. J. E. Protein structure prediction. Oxford: Oxford University Press, 1996. 298 p. STRADER, C. D.; CANDELORE, M. R.; HILL, W. S.; DIXON, R. A.; SIGAL, I. S. A single amino acid substitution in the beta-adrenergic receptor promotes partial agonist activity from antagonists. Journal of Biological Chemistry, v. 264, p. 16470-16477, 1989. STRADER, C. D.; SIGAL, I. S.; CANDELORE, M. R.; RANDS, E.; HILL, W. S.; DIXON, R. A. Conserved aspartic acid residues 79 and 113 of the beta-adrenergic receptor have different roles in receptor function. Journal of Biological Chemistry, v. 263, p. 10267-10271, 1988. SYLTE, I.; CHILMONCZYK, Z.; DAHL, S. G.; CYBULSKI, J.; EDVARDSEN, O. The ligand-binding site of buspirone analogues at the 5-HT1A receptor. Journal of Pharmacy and Pharmacology, v. 49, p. 698-705, 1997. SYLTE, I.; EDVARDSEN, O.; DAHL, S. G. Molecular dynamics of the 5-HT1a receptor and ligands. Protein Engineering, v. 6, p. 691-700, 1993. THEODORIDIS, S.; KOUTROUMBAS, K. Pattern recognition. London: Academic Press, 1998. 837 p. THIEL, K. A. Structure-aided drug design's next generation. Nature Biotechnology, v. 22, p. 513-519, 2004. TODESCHINI, R.; CONSONNI, V.; PAVAN, M. Dragon 2.1. Milano, 2002. [Programa de Computador] TODESCHINI, R.; GRAMATICA, P. New 3D molecular descriptors: The WHIM theory and QSAR applications. Perspectives in Drug Discovery and Design, v.9-11, p.355-380, 1998. TODESCHINI, R.; LASAGNI, M.; MARENGO, E. New molecular descriptors for 2D and 3D structures - theory. Journal of Chemometrics, v.8, p.263-272, 1994. TRIPOS INC. SYBYL 7.2 St. Louis [Programa de Computador] TRIPOS INC. SYBYL 7.3 St. Louis [Programa de Computador] TROPSHA, A. Application of predictive QSAR Models to Database Mining. In OPREA, T. (Ed.). Chemoinformatics in Drug Discovery, Weinheim: Wiley-VCH, 2005. TRUMPP-KALLMEYER, S.; HOFLACK, J.; BRUINVELS, A.; HIBERT, M. Modeling of G-protein-coupled receptors: application to dopamine, adrenaline, serotonin, acetylcholine, and mammalian opsin receptors. Journal of Medicinal Chemistry, v. 35, p. 3448-3462, 1992.


VAN DE WATERBEEMD, H.; ROSE, S. Quantitative approaches to structure-activity relationships. In: WERMUTH, C. G. (Ed.). The practice of medicinal chemistry. 2.ed. London: Elsevier Academic Press, 2003. WEBER, K.C.; DA SILVA, A.B.F. A chemometric study of the 5-HT1A receptor affinities presented by arylpiperazine compounds. European Journal of Medicinal Chemistry, v. 43, p. 364-372, 2008. WEBER, K. C.; HONÓRIO, K. M.; ANDRICOPULO, A. D.; DA SILVA, A. B. F. Two-dimensional QSAR studies on arylpiperazines as high-affinity 5-HT1A receptor ligands. Medicinal Chemistry, 2008. No prelo. WOLD, S.; ERIKSSON, L. Statistical validation of QSAR results. In VAN DER WATERBEEMD, H. (Ed.). Chemometric methods in molecular design, Weinheim: Wiley-VCH, 1995. p. 309-318. WOLD, S.; SJOSTROM, M.; ERIKSSON, L. PLS-regression: a basic tool of chemometrics. Chemometrics and Intelligent Laboratory Systems, v.58, p.109–130, 2001. WONG, M.-L.; LICINIO, J. From monoamines to genomic targets: a paradigm shift for drug discovery in depression. Nature Reviews Drug Discovery, v.3, p.136-150, 2004. WONG, M.-L.; LICINIO, J. Research and treatment approaches to depression. Nature Reviews Neuroscience, v.2, p.343-351, 2001. WORLD HEALTH ORGANIZATION. Depression. 2005. Disponível em: http://www.who.int/mental_health ZHANG, H.; LAI, L.; WANG, L.; HAN, Y.; TANG, Y. A fast and efficient program for modeling protein loops. Biopolymers, v. 41, p. 61-72, 1997. ZLATOVIC, M. V.; SUKALOVIC, V. V.; SCHNEIDERC, C.; ROGLIC, G. M. Interaction of arylpiperazine ligands with the hydrophobic part of the 5-HT1A receptor binding site. Bioorganic and Medicinal Chemistry, v. 14, p. 2994–3001, 2006.

Documents

modelagem molecular de compostos arilpiperazínicos e suas