View
214
Download
0
Category
Preview:
Citation preview
©2
01
5 D
r. W
alter
F.
de
Aze
ve
do
Jr.
Bioinformática Aplicada
ao Desenvolvimento
de Fármacos
(aula 1)
Prof. Dr. Walter F. de Azevedo Jr.
walter.junior@pucrs.br
ou
walter.filgueira@hotmail.com1
Máquina de escrever inventada pelo padre paraibano,
Francisco João de Azevedo.
Disponível em:<
http://revistapesquisa2.fapesp.br/?art=1406&bd=1&pg=1&lg=
>
Acesso em: 12 de junho de 2015.
Antes de iniciarmos a disciplina, gostaria
de destacar que todo esforço foi realizado
para que o texto esteja em concordância
com as regras vigentes da nova
ortografia. Mas eu cometo erros de
digitação com frequência, por isso já peço
desculpas antecipadas. Outro ponto que
gostaria de destacar, as aulas em
PowerPoint têm como objetivo
disponibilizar o conteúdo completo do
curso em PDF (Portable Document
Format). Visto que os slides foram
preparados como material de estudo, eles
apresentam um texto longo para o padrão
de apresentações de slides. Por isso, veja
a apresentação disponibilizada como
material de estudo, e não somente o slide
da aula, onde recomenda-se escrevermos
pouco. O texto está com fonte arial e
tamanho 18. 2
Prefácio
Como podemos usar a Bioinformática no desenho
de fármacos?
Como fármacos interagem com enzimas?
Como funcionam os fármacos anti-HIV ?
Como funcionam os fármacos anticâncer?
Fonte: http://www.kurzweilai.net/
3
Uma grande parte de cientistas da área
de inteligência artificial, acredita que
vivemos um momento especial da história
do desenvolvimento científico. Devido à
importância deste momento, destaco nos
meus modestos cursos alguns aspectos
relevantes do processo da singularidade
tecnológica. Uma das características
desta última é o aumento expressivo da
expectativa de vida. Se compararmos a
expectativa de vida hoje, com a de um
brasileiro do início do século XX, vemos
que mais que dobramos nossa
expectativa. No gráfico ao lado, vemos
que a expectativa de vida do brasileiro em
1910 era de 34 anos, e hoje está acima
de 70 anos. O aumento deve-se a
diversos fatores, tais como o
desenvolvimento no saneamento básico e
as conquistas científicas da medicina
moderna.4
Ano
Expectativa de vida do Brasileiro entre 1910 e 2009. Fonte
dos dados: Informe da Previdência Social. Disponível em: <
http://www.previdencia.gov.br/arquivos/office/4_110525-
171625-908.pdf >. Acesso em: 12 de junho de 2015.
0
10
20
30
40
50
60
70
80
1900 1920 1940 1960 1980 2000 2020
Singularidade Tecnológica
Exp
ecta
tiva
de
vid
a
Dados para expectativa de vida, antes de
1910, indicam números ainda piores.
Segundo algumas fontes, a expectativa
de vida no Brasil em 1900 era inferior a 30
anos. Fonte: Laboratório de Demografia e
Estudo Populacionais. Disponível em: <
http://www.ufjf.br/ladem/2012/02/28/aume
nto-da-longevidade-e-estancamento-da-
esperanca-de-vida-artigo-de-jose-
eustaquio-diniz-alves/ >. Acesso em: 12
de junho de 2015.
Um gráfico da evolução da expectativa de
vida ano a ano (2000-2012), mostra
aspectos curiosos do aumento. Vemos um
avanço considerável entre 2002 e 2004.
Este pulo na melhora da expectativa de
vida, é, também, uma consequência direta
de políticas públicas de redução da
pobreza.
5
Expectativa de vida do Brasileiro entre 2000 e 2012. Fonte
dos dados: Index Mundi. Disponível em: <
http://www.indexmundi.com/g/g.aspx?c=br&v=30&l=pt >.
Acesso em: 12 de junho de 2015.
60
62
64
66
68
70
72
74
76
78
80
1998 2000 2002 2004 2006 2008 2010 2012 2014
Exp
ecta
tiva
de
vid
a
Ano
Singularidade Tecnológica
Olhando para o futuro, a expectativa de
vida traz grandes promessas. Um
geneticista da Cambridge University -
Reino Unido, prevê que a primeira pessoa
a viver mais de 1000 anos já está entre
nós (Site da BBC. Disponível em: <
http://news.bbc.co.uk/2/hi/uk_news/40030
63.stm >. Acesso em: 12 de junho de
2015.
Isto mesmo, mil anos! Não é erro de
digitação. Eu sou cético com relação a
este número, mas acredito, baseado na
aceleração do desenvolvimento científico,
que ultrapassaremos o limite de 120 anos
nas próximas décadas.
6
Página de entrada do site da Strategies for Engineered
Negligible Senescence (SENS) Foundation.
Disponível em: < http://sens.org/>. Acesso em: 12 de junho
de 2015.
Singularidade Tecnológica
A evolução da ciência médica, nos deu
nas últimas décadas desenvolvimentos
como transplantes, vacinas, novos
fármacos etc. Além disso, temos a
expectativa da substituição de órgãos,
como o rim crescido artificialmente
mostrado ao lado (Song et al., 2013).
Baseado neste cenário, podemos ser
otimistas quanto à expectativa de vida do
ser humano. Esperamos que, nas
próximas décadas, teremos a
possibilidade de substituição de nossos
órgãos conforme envelhecemos. A
substituição do rim por um crescido
artificialmente tem uma perspectiva de ser
possível numa década. Outros órgãos
apresentam equivalente biomecânico,
como o coração.
7
Rim artificial testado em ratos.
Disponível em: < http://www.bbc.co.uk/news/science-
environment-22149844>. Acesso em: 12 de junho de 2015.
Referência:
Song JJ, Guyette JP, Gilpin SE, Gonzalez G, Vacanti JP, Ott
HC.
Regeneration and experimental orthotopic transplantation of
a bioengineered kidney. Nat Med. 2013 Apr 14. doi:
10.1038/nm.3154
Singularidade Tecnológica
O gráfico ao lado ilustra a lei de Moore,
que estabelece que aproximadamente
entre 18 e 24 meses o número de
transistores por chip dobra. Esta lei foi
proposta por Gordon Moore cofundador
da Intel. Ou seja, considerando-se os
processadores hoje, esperamos que em
aproximadamente entre 18 e 24 meses
teremos disponíveis, pelo mesmo preço,
computadores com o dobro da
capacidade de processamento. Uma
extrapolação da lei de Moore para 2030,
ou um pouco depois, indica que teremos
computadores com a complexidade do
cérebro humano.
Disponível em: <
http://www.kurzweilai.net/the-law-of-
accelerating-returns >. Acesso em: 12 de
junho de 2015.
Evolução do número de transistores por chip em função do
ano.
Disponível em:
http://library.thinkquest.org/4116/Science/moore%27s.htm.
Acesso em: 12 de junho de 2015.
8
Singularidade Tecnológica
Além do aumento expressivo do número
de anos vividos, a humanidade usufruirá
de facilidades tecnológicas cada vez mais
baratas.
A evolução da medicina e da cibernética,
permitirá o desenvolvimento de um
equivalente computacional ao cérebro
humano. Como o desenvolvimento
concomitante da neurociência, espera-se
que tenhamos a capacidade tecnológica
de transferirmos o conjunto de nossas
sinapses para um cérebro eletrônico, ou
seja, a substituição do cérebro humano,
por um equivalente computacional. Nessa
fase a humanidade atingirá virtualmente a
imortalidade. A situação onde esta
transição ocorrerá, é chamada de
singularidade tecnológica.Visão artística da modelagem matemática do cérebro.
Disponível em: <http://www.kurzweilai.net/mind-uploading-
featured-in-academic-journal-for-first-time>. Acesso em: 12
de junho de 2015.
9
Singularidade Tecnológica
A pesquisa em singularidade tecnológica
é uma atividade multidisciplinar, cujo o
foco é o entendimento dos sistemas
biológicos e computacionais,
especificamente a interface do ser
humano com máquinas. A partir deste
conhecimento, teremos condições de
prolongar nossa expectativa de vida, até
termos condições tecnológicas de
transferirmos nossa consciência para um
sistema computacional, o que abre a
possibilidade da imortalidade, bem como
uma nova fase da evolução humana. Tal
fase da evolução permitirá a integração
das consciências computacionais, o que
abre um amplo espectro de
possibilidades. Tais tecnologias ainda não
existem, mas se consideramos a lei de
Moore, vemos que o rápido
desenvolvimento tecnológico nos levará
até este estágio.
Visão artística do cérebro digital.
Disponível em: < http://www.kurzweilai.net/critique-of-
against-naive-uploadism#!prettyPhoto>. Acesso em: 12 de
junho de 2015.
10
Singularidade Tecnológica
Muitos autores destacam que, as
pesquisas mais importantes e
desafiadoras nos dias de hoje, estão
relacionadas com a singularidade
tecnológica. A bioinformática pode
contribuir nesta área em duas frentes de
atuação. Uma frente para entendermos as
bases moleculares do funcionamento do
cérebro, que permitirá seu entendimento e
então sua modelagem computacional.
Noutra frente, ao vivermos mais (aumento
da expectativa de vida), nos tornamos
sujeitos a novas enfermidades, que
podem ser combatidas com abordagens
do desenho de fármacos baseado em
computadores.
11
Página de entrada do site Kurzweil Accelerating Intelligence.
Disponível em:<http://www.kurzweilai.net/ >. Acesso em: 12
de junho de 2015.
Singularidade Tecnológica
12
Ao atingirmos a singularidade
tecnológica, abandonaremos as
limitações biológicas do nosso ser e
atingiremos um universo de novas
possibilidades que tal fase nos
trará.
Singularidade Tecnológica
Maiores informações sobre a singularidade tecnológica podem ser encontradas nos
artigos de Ray Kurzweil disponíveis on-line no site Kurzweil Accelerating Intelligence.
► Kurzweil responds: Don’t underestimate the Singularity. Disponível em: <
http://www.kurzweilai.net/kurzweil-responds-dont-underestimate-the-singularity>.
Acesso em: 12 de junho de 2015.
► The new era of health and medicine as an information technology is broader
than individual genes. Disponível em: < http://www.kurzweilai.net/the-new-era-of-
health-and-medicine >. Acesso em: 12 de junho de 2015.
► How my predictions are faring — an update by Ray Kurzweil. Disponível em: <
http://www.kurzweilai.net/how-my-predictions-are-faring-an-update-by-ray-kurzweil >.
Acesso em: 12 de junho de 2015.
► The Law of Accelerating Returns. Disponível em: < http://www.kurzweilai.net/the-
law-of-accelerating-returns >. Acesso em: 12 de junho de 2015.
13
Singularidade Tecnológica
Bioinformática é a aplicação de
ferramentas computacionais para o
estudo de sistemas biológicos. O foco é o
armazenamento, recuperação e
interpretação da informação biológica.
Boa parte do conhecimento humano hoje
está depositada na forma de bancos de
dados. Especialmente com a Biologia e as
Ciências da Saúde, essas informações
precisam de sistemas computacionais
para o armazenamento eficiente e,
consequentemente, recuperação da
informação de forma confiável. A
bioinformática teve grande progresso com
a explosão de informações obtidas nos
projetos de sequenciamento de genomas
e o posterior estudo das proteínas. Primeiro cluster de brasileiro desenvolvido exclusivamente
para bioinformática. UNESP-S. J. R. P.-SP, 2004
Disponível em:
http://www.ita.br/online/2005/itanamidia05/jul2005/infoexame
25jul05.html >
Acesso em: 12 de junho de 2015.14
Bioinformática
Química
Computação
Biologia
Como uma área de pesquisa
interdisciplinar, onde temos a
convergência de diferentes áreas como
biologia, computação, física, química e
matemática. A bioinformática acaba por
desenvolver uma linguagem própria,
usando aspectos das disciplinas já
citadas. Agora, como área de pesquisa,
apesar da sua interdisciplinaridade,
muitos consideram que a bioinformática
está interessada em problemas da área
da biologia, por isso podemos dizer que
os problemas da bioinformática, são, em
última análise, problemas biológicos.
Bioinformática como uma área de pesquisa interdisciplinar.
15
Física
Matemática
Bioinformática
Bioinformática
Diversos programas gráficos permitem a visualização molecular, como a representada
abaixo para o aminoácido alanina. A representação da figura é chamada CPK,
referente aos nomes dos cientistas que a propuseram (Corey, Pauling e Koltun)
(COREY e PAULING, 1953; KOLTUN, 1965). A figura abaixo foi gerada com o
programa VMD (visual molecular dynamics, disponível em:
http://www.ks.uiuc.edu/Development/Download/download.cgi?PackageName=VMD
)(HUMPHREY et al, 1996). As esferas em ciano representam os átomos de carbono,
em branco os átomos de hidrogênio, vermelho para oxigênio e azul para o nitrogênio.
Os bastões são ligações covalentes entre os átomos.
VMD é o acrônimo para visual molecular dynamics.
16
-COREY, RB; PAULING L. Molecular
models of amino acids, peptides and
proteins. Review of Scientific
Instruments, Nova York, v. 24, n.8,
p.621-627, 1953.
-HUMPHREY W; DALKE A; SCHULTEN
K. VMD - Visual Molecular Dynamics.
Journal of Molecular Graphics,
Amsterdã, v.14, p.33-38, 1996.
-KOLTUN WL. Precision space-filling
atomic models. Biopolymers, Hoboken,
v.3, n.6, p.665-79, 1965.
Bases Moleculares
Os aminoácidos apresentam diferenças
na carga elétrica, hidrofobicidade
(literalmente “temor à água”), polaridade e
massa molecular, para citar as principais
características físico-químicas.
Normalmente usamos a unidade Dálton
(Da) para medir a massa molecular de
aminoácidos e moléculas biológicas em
geral. Um Dálton equivale à massa de
1/12 do átomo de carbono 12. Para
proteínas usamos o kiloDálton (kDa), 1
kDa = 103 Da.
Na figura ao lado temos o aminoácido
alanina, que apresenta uma massa
molecular de 89,09 Da, e uma proteína
chamada lisozima, que apresenta uma
massa molecular de 14331,20 Da.
Usaremos o símbolo MW (molecular
weight) para representarmos a massa
molecular.
Lisozima de ovo de galinha (MW = 14331,20 Da ou
14,331 kDa). Código PDB: 6LYZ.
As figuras não estão na mesma escala.
Alanina (MW = 89,09 Da)
17
Aminoácidos
Considerando-se a massa molecular de
cada resíduo de aminoácido, temos uma
massa molecular média de 118,89 Da.
Este valor médio é útil na estimativa da
massa molecular aproximada de
proteínas e peptídeos, a partir do
conhecimento do número de resíduos de
aminoácidos presentes na molécula. A
equação abaixo indica a massa molecular
aproximada (MW),
MW = 118,89 . Naa
onde Naa é o número de resíduos de
aminoácidos presentes na molécula.
No exemplo ao lado temos a CDK2 (cyclin-
dependente kinase)(quinase dependente
de ciclina 2), com massa molecular de
34331,25 Da e 298 resíduos de
aminoácidos.
CDK2 humana(MW = 34331,25 Da )
Código PDB: 2A4L.
A massa molecular calculada pela equação, é de MW =
35429,22 Da, aproximadamente 3,2 % maior que a
massa molecular precisa da proteína. A equação é útil
para aproximações. 18
Aminoácidos
Podemos pensar que a proteína é
formada por uma sequência de
aminoácidos ligados covalentemente. O
primeiro aminoácido liga-se
covalentemente ao segundo, que liga-se
ao terceiro, assim sucessivamente. Tal
arranjo molecular é chamado de polímero,
ou seja, proteínas são polímeros de
aminoácidos. Ao ligarem-se uns aos
outros, cada par de aminoácidos perde
uma molécula de água, o que permite a
formação da ligação peptídica, como
mostrado na figura ao lado. O aminoácido
inserido na estrutura da proteína chama-
se resíduo de aminoácido.
Aspartato
Fenilalanina
Aspartame
H2O
19
Ligação Peptídica
A molécula de aspartame é um
dipeptídeo, pois é formado por dois
resíduos de aminoácidos, aspartato (Asp)
e fenilalanina (Phe). A ligação peptídica
está indicada na molécula. O aspartame é
um adoçante com sabor de 100 a 200
vezes mais doce que a sacarose, por ser
formado de resíduos de aminoácidos é
facilmente metabolizado como as outras
proteínas que ingerimos.
No caso de 3 resíduos de aminoácidos
temos um tripeptídeo, 4 um tetrapeptideo,
5 um pentapeptídeo, e assim
sucessivamente.
Aspartame
Ligação peptídica
20
Peptídeos
A molécula de Ala-Gly é um dipeptídeo,
pois é formado por dois resíduos de
aminoácidos, alanina (Ala) e glicina (Gly).
A ligação peptídica está indicada na
molécula. A tabela abaixo mostra a
identificação dos principais tipos de
peptídeos, no que se refere ao número de
resíduos de aminoácidos presentes na
estrutura.
Ala-Gly
Ligação peptídica
Número de resíduos de aminoácido Nome
2 Dipeptídeo
3 Tripeptídeo
4 Tetrapeptídeo
5 Pentapeptídeo
6 Hexapeptídeo
7 Heptapeptídeo
8 Octapeptídeo
9 Eneapeptídeo
10 Decapeptídeo
21
Peptídeos
A figura abaixo mostra uma cadeia peptídica de 6 resíduos de aminoácidos (um
hexapeptídeo), onde lemos a sequência do N (terminal amino) para o C (terminal
carboxílico), tal convenção é usada para numerar os resíduos na sequência. Este
procedimento facilita a análise de diversas características das sequências de
aminoácidos, tais como, conservação de resíduos de aminoácidos em determinada
posição, identidade sequencial entre diversas proteínas, identificação de sítios ativos,
no caso de enzimas, entre outros aspectos.
Terminal N
Terminal CR1 R3 R5
R2 R4 R6
R’s indicam as cadeias laterais
22
Peptídeos
Sempre que estudamos a interação de fármacos com proteínas, temos interesse na
informação sobre as distâncias interatômicas, assim vamos definir como medimos tais
distâncias. No mundo molecular, usamos a unidade chamada angstrom (Å), que
equivale a 10-10m. Outra unidade usada no estudo de moléculas é o nanomêtro (nm),
1 nm = 10-9 m. Na presente disciplina usaremos sempre angstroms para medidas de
distâncias. Abaixo temos a distância interatômica entre átomos de um fármaco
(roscovitine) e a proteína quinase dependente de ciclina 2 em Å.
23
Angstrom
1 Å = 10-10 m
Abaixo temos a representação de van der Waals do aminoácido alanina, onde os
átomos são desenhados como esferas com o raio de van der Waals. Esta
representação mostra a superfície de van der Waals, definida pela área contínua das
superfícies esféricas. A tabela abaixo mostra os raios de van der Waals dos principais
átomos encontrados em moléculas biológicas.
Esferas representado átomos,
onde o raio de cada esfera é o
raio de van der Waals. O
código de cores é o mesmo
usado para representação
CPK.
Átomo Raio de van der Waals (Å)
H 1,20
C 1,85
N 1,54
O 1,40
P 1,90
S 1,85
24
Superfície de van der Waals
A superfície molecular é a superfície de van der Waals suavizada nas reentrâncias,
pois consideramos uma molécula de água esférica rolando sobre a superfície de van
der Waals. Tal molécula de água é chamada sonda. Quando aplicada à uma proteína,
permite a visualização de cavidades na superfície proteica.
Simplificação da representação
da molécula de água, como uma
esfera de raio de 1,4 Å.
Superfície molecular
A superfície molecular do
aminoácido alanina. O código
de cores é o mesmo usado
para representação CPK.
25
Superfície Molecular
As proteínas em solução permitem a interação de moléculas de água com sua
estrutura. A área acessível ao solvente (ASA, para accessible surface area) é um
parâmetro geométrico usado para analisar a interação de ligantes e água com a
superfície da proteína. O conceito de tal parâmetro é relativamente simples. Imagine
uma molécula de água deslizando sobre a superfície da proteína, uma molécula
esférica com um raio 1,4 Å é usada na representação, como mostrado abaixo. Esta
forma esférica para a molécula de água não é realista, mas é uma boa aproximação
para nossos propósitos. A superfície acessível ao solvente é traçada pelo movimento
do centro da esfera do solvente, indicada pela linha tracejada.
Simplificação da representação
da molécula de água, como uma
esfera de raio de 1,4 Å.
ASA é o acrônimo em inglês para accessible surface area.
Superfície de van der Waals
Molécula de água
Superfície acessível ao solvente
Esferas representado átomos,
onde o raio de cada esfera é o
raio de van der Waals.
26
Área Acessível ao Solvente
Há uma equação simples (LESK, 2001), que relaciona a massa molecular em Dáltons
(MW) de uma proteína monomérica, com sua área acessível ao solvente (ASA), esta
equação é uma aproximação, mas pode ser usada para termos uma ideia preliminar
da ASA. O resultado sai em angstroms ao quadrado (Å2).
ASA = 11,1 (MW)2/3 ou ASA = 11,1 (MW)0,666667
Superfície molecular
Esferas representado átomos,
onde o raio de cada átomo é o
raio de van der Waals.
Molécula de águaSimplificação da representação
da molécula de água, como uma
esfera de raio de 1,4 Å.
Superfície acessível ao solvente
Referência para a equação da área acessível ao solvente: LESK A. M. Introduction to Protein
Architecture. Oxford University Press, Oxford UK, 2001, página 27..27
Área Acessível ao Solvente
A figura ao lado representa a superfície
molecular de um fármaco (superfície em
verde) ligado a uma proteína. A superfície
molecular da proteína está representada
em cores diferentes, com os átomos
neutros representados por ciano, os
átomos polares negativos por vermelho e
os positivos por azul. Vemos claramente o
encaixe do fármaco no sítio ativo da
enzima. Podemos pensar que a proteína
é a fechadura e o fármaco é a chave, tal
analogia é chamada de modelo ‘chave-
fechadura’.
Proteína
“fechadura”
Fármaco
“chave”
CDK2 humana em complexo com o fármaco roscovitine.
Código PDB: 2A4L.
.Modelo ‘chave-fechadura’.
28
Modelo Chave-Fechadura
1. Cristalização. Nesta
etapa a macromolécula é
trazida a um estado de
supersaturação que
favorece a formação de
cristais, como os
mostrados acima. Os
cristais de moléculas
biológicas normalmente
apresentam dimensões
inferiores a 1 mm de
comprimento em cada
aresta.
2. Coleta de dados de difração de raios X no LNLS.
Os cristais apresentam um arranjo ordenado de
moléculas, como uma pilha de tijolos ordenados. Na
analogia, cada tijolo representa uma molécula. As
distâncias entre os átomos são da ordem de 1 Å (0,1 nm
ou 10-10 m), usando-se raios X (com comprimento de
onda da ordem de Å ) teremos difração.
3. Interpretação do padrão de
difração de raios X. A figura
abaixo é o registro da difração de
raios X de um cristal. Os raios X
interagem com o cristal, o que
produz um padrão de difração. A
análise desta informação
possibilita a resolução de estrutura
3D.
4. Resolução da estrutura.
A partir da análise do
padrão de difração é
possível gerar mapas de
densidade eletrônica (à
direita). A interpretação de
tais mapas gera a estrutura
3D de molécula.
5. Análise. A partir da estrutura
resolvida procedemos à análise,
onde relaciona-se a estrutura 3D à
sua função biológica.
Etapas para resolução da
estrutura 3D de
macromoléculas biológicas
por cristalografia
29
Cristalografia de Proteínas
Experimentos de cristalização no
espaço normalmente geram cristais
de melhor qualidade para estudos
de difração de raios X. As
condições de microgravidade do
espaço propiciam um
empacotamento cristalino mais
ordenado, gerando cristais que
difratam à mais alta resolução. A
proteína uropesina (Canduri et al.,
2001) foi cristalizada em condições
de microgravidade na missão STS-
95 do ônibus espacial Discovery (
Disponível em: <
http://www.youtube.com/watch?v=N
9IFiQNY8mE >).
Fonte: http://www.aviationspectator.com/more-aviation-photos?page=405. Crédito: NASA
Cristal de uropepsina .30
Cristalização de Proteínas no Espaço
Estes átomos estão ligados covalentemente, cada ligação é representada
por um bastão ligando os átomos, representados por esferas.
A ligação covalente é a responsável por ligações químicas entre os átomos. Uma
ligação forte mantém a cadeia principal da proteína e as cadeias laterais unidas. Na
representação CPK, a ligação covalente é indicada por um bastão unindo esferas. As
esferas indicam os átomos.
31
Interações Moleculares (Ligação Covalent)
Interação hidrofóbica, literalmente “temor à água”, indica uma força que impele os
resíduos hidrofóbicos para o interior da estrutura da proteína. Resíduos hidrofílicos
apresentam uma leve tendência estatística de apresentarem-se na superfície da
proteína. De forma inversa, temos uma tendência estatística de encontrarmos
resíduos hidrofóbicos enterrados na proteína. Na figura abaixo temos em ciano os
átomos de carbono (hidrofóbicos), em vermelho e azul os átomo hidrofílicos.
Representação de átomos polares na superfície da
proteína Purina Nucleosídeo Fosforilase.
Visualização do interior hidrofóbico da proteína,
representado no centro da figura.
32
Interações Moleculares (Hidrofóbica)
É a interação devido à proximidade entre átomos e envolve regiões não polares das
moléculas. As nuvens eletrônicas dos átomos passam a interagir por causa do dipolo
(cargas positiva e negativa posicionadas em extremos da molécula ou átomo) que
surge na nuvem eletrônica do átomo. Este dipolo é devido às características quânticas
do sistema, onde a indeterminação da posição do elétron leva à possibilidade de num
dado instante termos um elétron numa posição favorável à formação de um dipolo
elétrico. Tal dipolo pode interagir com a nuvem eletrônica de um átomo próximo. A
interação é relativamente fraca e de curto alcance.
RVDW RVDW
Átomos próximos permitem uma interação entre as nuvens eletrônicas, o que causa a força de van
der Waals. Quando a distância é menor que a soma dos raios de van der Waals (RVDW) a repulsão
surge entre os átomos. 33
Interações Moleculares (van der Waals)
O gráfico abaixo mostra a interação de van der Waals entre 2 átomos, vemos
claramente que temos uma distância (soma dos raios de van der Waals), para o qual a
energia é mínima.
Soma dos raios de van der Waals de dois átomos interagindo
34
Interações Moleculares (van der Waals)
As ligações de hidrogênio são de origem eletrostática, onde ocorre o
compartilhamento de um H entre átomos não ligados covalentemente. A ligação de
hidrogênio pode ocorrer entre moléculas diferentes. Por exemplo, quando moléculas
de água entram em contato com a superfície de uma proteína, as interações ocorrem
por meio de ligações de H. Numa ligação de hidrogênio temos sempre um átomo
doador de H e um aceitador de H. Na verdade não há transferência do H do doador
para o aceitador, e sim uma ação eletrostática do próton (H) sobre o aceitador. Na
figura abaixo o oxigênio é o aceitador e o nitrogênio é o doador. A distância (r) entre o
doador e o aceitador (r) varia entre 2,5 a 3,4 Å.
CON H
Doador Aceitador
r
35
Interações Moleculares (Ligações de Hidrogênio)
As ligações de H são responsáveis pela
estabilização de diversas macromoléculas
biológicas. Entre elas as moléculas de
DNA e RNA. Os pares de bases que
estabilizam a molécula de DNA
apresentam um padrão de ligações de
hidrogênio. Quando Watson e Crick
elucidaram a estrutura tridimensional do
DNA identificaram os pares de bases,
Citosina-Guanina (C-G) e Adenina-Timina
(A-T), que se conectam por ligações de
hidrogênio. A figura ao lado ilustra a
estrutura cristalográfica do DNA, os pares
de bases na região central da molécula
funcionam como amarras que seguram as
duas fitas do DNA.
36
A estrutura da hélice alfa foi prevista
teoricamente por Linus Pauling em 1950.
Vale a pena lembrar, que naquela data,
não havia informação estrutural sobre
proteínas, e sua previsão foi baseada na
estrutura cristalográfica de aminoácidos,
dipeptídeos e tripeptídeos, determinados
a partir de cristalografia por difração de
raios X. A estrutura de hélice alfa foi
posteriormente confirmada, quando a
estrutura cristalográfica da mioglobina foi
determinada em 1959.
37
Hélice Alfa
O enovelamento da hélice alfa leva a uma
estrutura onde as cadeias laterais ficam
voltadas para fora da estrutura, criando
uma estrutura cilíndrica compacta. Uma
análise das preferências dos resíduos de
aminoácidos indicou que leucina (Leu),
glutamato (Glu), metionina (Met) e alanina
(Ala), são encontrados preferencialmente
em hélices alfa (regra do LEMA), e os
resíduos prolina (Pro), isoleucina (Ile),
glicina (Gly) e serina (Ser), dificilmente
são encontrados em hélices alfas, regra
do PIGS. A figura da direita ilustra uma
visão de cima da hélice alfa, indicando as
cadeias laterais voltadas para o lado de
fora da hélice, tal estrutura tem um
diâmetro aproximado de 5 Å.
Normalmente encontramos em hélices
alfas os seguintes resíduos de
aminoácidos (regra do LEMA):
Leucina (L),
Glutamato (E),
Metionina (M) e
Alanina (A)
Normalmente ausentes em hélices alfas
(regra do PIGS):
Prolina (P),
Isoleucina (I),
Glicina (G) e
Serina (S) 38
Hélice Alfa
A estrutura tridimensional da hélice alfa é
estabilizada por um padrão de ligações de
hidrogênio, envolvendo o oxigênio da
carbonila do resíduo i com o nitrogênio do
resíduo i+4, como ilustrado na figura ao
lado com linhas tracejadas.
Há várias representações possíveis das
hélices numa estrutura. A representação
CPK faz uso de esferas para cada átomo
e bastões para as ligações covalentes,
como mostrada na figura ao lado. Tal
representação permite a identificação de
detalhes estruturais, possibilitando
destacar características estruturais, tais
como, ligações de hidrogênio, orientação
espacial e conectividade, contudo, tal
representação torna-se pesada, ao
olharmos para estruturas completas,
como a do próximo slide.
Ligação de hidrogênio
39
Hélice Alfa
Na figura ao lado temos a representação
em CPK da estrutura da mioglobina. A
presença das hélices fica de difícil
visualização, devido à grande quantidade
de átomos. A mioglobina tem 1260
átomos, ou seja, uma esfera para cada
átomo, o que dificulta a identificação das
hélices. Uma forma alternativa é
representação estilizada da hélice, onde
usamos somente os átomos da cadeia
principal, ou somente os carbonos alfa,
para geramos uma representação gráfica
da estrutura.
Representação gráfica: CPK
Código de acesso PDB: 1VXA
N
C
40
Estrutura da Mioglobina
A representação ao lado conecta os
carbonos alfa da estrutura, o que facilita a
visualização das hélices. Vemos na
estrutura diversas hélices, num total de 8.
Usamos o programa VMD com a opção
trace. O programa representa trechos em
hélice alfa em rosa. Estão destacados na
figura o início (terminal N, ou amino-
terminal) e o final (terminal C ou carboxi-
terminal).
Representação gráfica: trace
Código de acesso PDB: 1VXA
N
C
41
Estrutura da Mioglobina
Programas de visualização gráfica de
macromoléculas, como o VMD,
apresentam opções de representação em
cartoons, que perde os detalhes mas
facilita a identificação de aspectos gerais
sobre a estrutura tridimensional da
proteína, como na figura, gerada com o
VMD, com opção de representação
gráfica new cartoons. Os laços que
conectam a estrutura não apresentam o
formato helicoidal, sendo representado
por um tubo contínuo mais fino que a fita
usada nas representações das hélices.
Representação gráfica: new cartoon
Código de acesso PDB: 1VXA
N
C
42
Estrutura da Mioglobina
Outra representação gráfica possível para
as hélices é a representação em cilindro,
onde cada hélice é indicada como um
cilindro. A figura ao lado representa a
estrutura das hélices da mioglobina como
cilindros. A topologia da hélice é comum
em estruturas de proteínas, tal ubiquidade
deve-se às características geométricas
das hélices, que permitem a compactação
dos aminoácidos, numa estrutura regular
e relativamente rígida. As hélices
permitem, ainda, que resíduos de
aminoácidos hidrofóbicos concentrem-se
numa parte da hélice, deixando do outro
lado resíduos hidrofílicos, tais
características são úteis em proteínas
transmembranares, por exemplo. Assim,
na história evolutiva de cada ser, a
presença de hélices nas proteínas pode
levar a vantagens, daí sua ubiquidade.
Representação gráfica: cartoon
Código de acesso PDB: 1VXA
N
C
43
Estrutura da Mioglobina
Vamos analisar uma proteína composta
de hélices, a mioglobina, vista nos slides
anteriores. Em mamíferos terrestres a
mioglobina atua na facilitação da difusão
de oxigênio no músculo. Enquanto para
organismos da ordem Cetacea, a
mioglobina funciona como reserva de
oxigênio. A concentração de mioglobina
nos tecidos musculares desses
mamíferos marinhos chega a ser
aproximadamente 10 vezes maior que em
mamíferos terrestres, tal reserva de
oxigênio é importante em longos
mergulhos. Durante a história evolutiva
dos cetáceos, as características de
armazenamento de oxigênio da
mioglobina, apresentaram uma vantagem
evolutiva, o que permitiu que tais
organismos explorassem o oceano em
grandes profundidades.
Imagem disponível em:
<http://animaldiversity.ummz.umich.edu/site/accounts/pict
ures/Physeter_catodon.html >
Acesso em: 12 de junho de 2015.
Foto da Physeter catodon. (cachalote)
44
Mioglobina de Cetáceos
Ao lado temos a estrutura da mioglobina
com destaque para o grupo heme, que
aparece ligado a essas proteínas. Esse
grupo não proteico apresenta um átomo
de ferro (em verde) no centro, coordenado
por 4 átomos de nitrogênio do grupo
heme e com um quinto nitrogênio da
histidina 93 da mioglobina. O átomo de
ferro liga-se ao oxigênio (O2), o que
funciona como reserva para os
mergulhos. A partir da análise da estrutura
tridimensional da mioglobina, vemos que
o grupo heme está fortemente ligado à
mioglobina e apresenta um espaço no
bolsão onde fica o grupo. Esse espaço
permite a captura do oxigênio pelo átomo
de ferro.
Mioglobina de Physeter catodon (cachalote).
Destaque do grupo heme com o átomo
de ferro em verde.
His93
O2
45
Mioglobina de Cetáceos
A fita beta apresenta uma cadeia principal
distendida, não havendo hélices em sua
topologia. Uma cadeia distendida, como
mostrada na figura ao lado, não possibilita
a existência de ligações de hidrogênio,
como observadas nas hélices, contudo,
tal arranjo, libera o oxigênio da carbonila e
o nitrogênio da cadeia principal para
fazerem ligações de hidrogênio, com
partes distantes da cadeia peptídica, ou
mesmo, com outras cadeias peptídicas. A
condição necessária é a proximidade do
par doador-aceitador da ligação de
hidrogênio. Os terminais N e C são
indicados na figura.
C
N
46
Fita Beta
N
C
Ligação de hidrogênio
C
N
A disposição próxima das fitas beta
possibilita ligações de hidrogênio que
fortalecem a estrutura tridimensional da
proteína. O arranjo mostrado ao lado é a
base para a montagem de uma folha beta,
com várias fitas betas. Quando as fitas,
que formam a folha beta, apontam todas
na mesma direção, temos um folha beta
paralela. O padrão entrelaçado das
ligações de hidrogênio fornece uma
estabilidade estrutural ao sistema, o que
possibilita a montagem de folhas betas
com várias fitas.
N
C
47
Fita Beta
Para simplificar a representação gráfica,
normalmente usamos vetores, como os
indicados ao lado. Cada vetor representa
uma fita beta, que em conjunto formam a
folha. A cabeça do vetor indica o terminal
C e o início do vetor o terminal N.
C C
NN
N
C
48
Fita Beta
Outra possibilidade de formarmos uma
folha beta é com fitas beta alternadas,
como mostrado na figura ao lado. Na
folha ao lado temos 3 fitas, onde a
primeira segue com o terminal N na parte
superior, a segunda com o terminal C na
parte superior, e assim alternando-se,
num padrão antiparalelo de fitas beta.
49
Fita Beta
N
C
Na representação das fitas beta como
vetores, fica claro a alternância do sentido
das fitas beta, desenhadas em azul. Os
trechos em amarelo são partes da cadeia
proteica que conectam as fitas, chamados
de alças. As alças não apresentam a
geometria da hélice nem da fita, mas
conectam tais elementos estruturais.
50
Alças
Alça
Fita beta
Fita Beta
Primária Secundária Terciária Quaternária
Na análise da estrutura de uma proteína podemos visualizar diferentes níveis de
complexidade. Do mais simples para o mais complexo. A sequência de resíduos de
aminoácidos é a estrutura primária. A identificação das partes da estrutura primária
que formam hélices, fitas e laços é a estrutura secundária. As coordenadas atômicas
de todos os átomos que formam a proteína é a estrutura terciária. Por último, se a
proteína tem mais de uma cadeia polipeptídica, esta apresenta uma estrutura
quaternária.
51
Níveis Estruturais de Proteínas
Uma forma de armazenarmos informações sobre a estrutura primária de uma proteína
é num arquivo texto simples, onde o códigos de uma letra são armazenados. A
primeira letra é o resíduo de aminoácido do terminal amino, a segundo letra é o
resíduo de aminoácido ligado ao primeiro, e assim sucessivamente até o último
resíduo de aminoácido que está no terminal carboxilíco. Um dos formatos mais usados
é chamado formato FASTA, pois um dos primeiros programa usados para busca em
base de dados de sequência recebeu este nome (FASTA). Abaixo temos o arquivo
FASTA para a estrutura primária da cadeia beta da hemoglobina humana.
52
>2HBS:B|PDBID|CHAIN|SEQUENCE
VHLTPVEKSAVTALWGKVNVDEVGGEALGRLLVVYPWTQRFFESFGDLSTPDAV
MGNPKVKAHGKKVLGAFSDGLAHLDN
LKGTFATLSELHCDKLHVDPENFRLLGNVLVCVLAHHFGKEFTPPVQAAYQKVVA
GVANALAHKYH
Linha de identificação da proteína (não contém aminoácidos)Onde inicia a sequência (terminal N) o aminoácido Valina
Onde termina a sequência (terminal C) o aminoácido Histidina
Estrutura Primária de Proteínas
Todo arquivo FASTA inicia com o símbolo “>”, é um símbolo usado para marcar a linha
de identificação, as outras linhas mostram a estrutura primária da proteína. O formato
FASTA pode ser usado também para armazenar estruturas primárias de ácidos
nucleicos, só que nesse caso teremos nucleotídeos, ao invés de resíduos de
aminoácidos. Vimos o formato FASTA no exemplo do dogma central da biologia
molecular.
53
>2HBS:B|PDBID|CHAIN|SEQUENCE
VHLTPVEKSAVTALWGKVNVDEVGGEALGRLLVVYPWTQRFFESFGDLSTPDAV
MGNPKVKAHGKKVLGAFSDGLAHLDN
LKGTFATLSELHCDKLHVDPENFRLLGNVLVCVLAHHFGKEFTPPVQAAYQKVVA
GVANALAHKYH
Linha de identificação da proteína (não contém aminoácidos)Onde inicia a sequência (terminal N) o aminoácido Valina
Onde termina a sequência (terminal C) o aminoácido Histidina
Estrutura Primária de Proteínas
A partir da elucidação da estrutura
tridimensional da hemoglobina, uma
proteína formada preponderantemente
por hélices alfa),foi possível identificar as
bases estruturais da patologia conhecida
como anemia falciforme. Tal doença é
caracterizada pela mutação de um
resíduo de aminoácido da hemoglobina. A
mutação é de glutamato para valina, na
posição 6 da cadeia beta. A hemoglobina
tem a função de transportar oxigênio dos
alvéolos pulmonares até as células
receptoras.
54
Estrutura cristalográfica da hemoglobina humana. Código
PDB: 3HHH.
>2HBS:B|PDBID|CHAIN|SEQUENCE
VHLTPVEKSAVTALWGKVNVDEVGGEALGRLLVVYPWTQRFFESFGDLSTPDAV
MGNPKVKAHGKKVLGAFSDGLAHLDN
LKGTFATLSELHCDKLHVDPENFRLLGNVLVCVLAHHFGKEFTPPVQAAYQKVVA
GVANALAHKYH
Anemia Falciforme
Se usarmos o diagrama de Venn dos
aminoácidos, podemos ver que tal
mudança é de um resíduo ácido e polar
(glutamato) para um hidrofóbico (valina).
Gly
Ala
Val
Leu
Ile
Phe Trp
MetProCys
Ser
Thr
TyrAsn
Gln
Asp Glu
His Lys
ArgHidrofóbicos
Alifáticos
Aromáticos
Com enxofrePolares
Ácidos
Básicos
55
Anemia Falciforme
A hemácia, sem a hemoglobina com esta
mutação (HbA), passa facilmente pelos
capilares, realizando a liberação de
oxigênio nas células (figura ao lado
superior). A hemácia (com a hemoglobina
que apresenta a mutação), ao passar
para forma desoxigenada, muda sua
forma de disco para uma forma de foice
(figura de baixo). Tal forma é mais rígida,
dificultando a circulação da hemácia.
Imagem disponível em: <
http://sickle.bwh.harvard.edu/scd_background.html
>
Acesso em: 12 de junho de 2015.56
Anemia Falciforme
A presença de um resíduo hidrofóbico
(valina), onde antes havia um hidrofílico
(glutamato), cria uma porção adesiva na
superfície da hemoglobina. Tal superfície
adesiva promove a formação de um
polímero de hemoglobinas, como
mostrado na figura ao lado. Esse polímero
limita a flexibilidade de hemácia,
causando a obstrução do capilares. Cada
hemoglobina é representada como uma
conta na estrutura ao lado, a
sobreposição das contas ocorre para
evitar o contato da porção hidrofóbica
(valina) com o meio.
57
Imagem disponível em: <
http://sickle.bwh.harvard.edu/scd_background.html
>
Acesso em: 12 de junho de 2015.
Anemia Falciforme
Diferentes formas de estudo de sistemas
biológicos.
In silico. Usa simulação e modelagem
computacional para o estudo de sistemas
biológicos. Tem como principal vantagem
o baixo custo e a possibilidade de
testarmos diversos sistemas diferentes
em computador. O principal problema é a
confiabilidade dos sistemas simulados.
Nem sempre é possível obtermos
modelos computacionais realísticos para
um sistema biológico. A abordagem in
silico é comum no estudo de novos
fármacos. É uma forma de acelerar o
processo de descoberta e
desenvolvimento de fármacos,
adicionando inteligência e ética ao
desenvolvimento de novos fármacos.
Fármaco contra tuberculose em estudo in silico.
Fonte: Bio-Inspired Algorithms Applied to Molecular Docking
Simulations. Heberlé G, De Azevedo WF Jr. Curr Med Chem
2011; 18 (9): 1339-1352. 58
Testes Pré-clínicos
Adicionamos inteligência, pois podemos
testar milhares de sistemas em
computador. No caso específico do
desenho de fármacos in silico, podemos
testar em computador milhares, até
mesmos milhões de moléculas, que
apresentam potencial de se tornarem
fármacos.
Adicionamos uma abordagem ética ao
desenvolvimento de fármacos, pois ao
invés de sacrificarmos milhões de cobaias
em testes pré-clínicos, focamos os testes
pré-clínicos (que não envolvem humanos)
nas moléculas mais promissoras.
Muitos testes pré-clínicos são feitos em camundongos e em
cachorros. 59
Testes Pré-clínicos
In vitro. Usa experimentos de laboratório
sem envolvimento direto de cobaias
(testes em tubos de ensaios). Tem um
custo relativamente mais alto que a
simulação computacional, mas é mais
realista, visto que os experimentos são
realizados em situações próximas às
encontradas no ser vivo.
In vivo. É o experimento mais realista,
visto que é feito em seres vivos. Tem
como principais problemas o custo
elevado, quando comparado com as
outras abordagens, e os aspectos éticos
envolvidos.
Fonte da imagem: http://www.vivopharm.com.au/us/in_vitro.php
Acesso em: 12 de junho de 2015.
Cientistas demonstram a eficácia de nanopartículas para
entrega de droga anticancerígena (doxorubicin) nas células
alvos.
Fonte da imagem:
http://newsroom.ucla.edu/portal/ucla/srpview.aspx?id=13868360
Testes Pré-clínicos
O teste mais avançado e realista dos
estudos in vivo é o teste clínico. Em tais
testes, moléculas com potencial
farmacológico são aplicadas em
humanos. Os testes visam verificar se o
fármaco em potencial apresenta eficácia e
toxicidade tolerável. Normalmente, são
realizados testes pré-clínicos, onde os
fármacos em potencial são testados in
vitro e in vivo, com animais não humanos.
Classicamente os testes clínicos são
divididos nas seguintes fases: Fase 0. Tal
denominação é relativamente mais
recente ("Guidance for Industry,
Investigators, and Reviewers". Food and
Drug Administration, Acesso em: 12 de
junho de 2015) e visa testar o fármaco em
potencial em humanos em doses sub-
terapêuticas, onde é testado se o fármaco
em potencial comporta-se como
esperado.
Pílulas de óleo de Salvia officinalis (ou placebo) usada em
testes clínicos como remédio para memória. Fonte da
imagem:http://www.sciencephoto.com/media/281222/enlarg
e . Acesso em: 12 de junho de 2015.61
Testes Clínicos
Fase I. Nesta fase um grupo
relativamente pequeno de indivíduos
(entre 100 e 200) são testados. A fase I
testa a tolerância da droga e usa
indivíduos saudáveis. As regras para a
participação nos testes variam de país
para país, nos EUA pagam para
indivíduos participarem de tais testes.
Fase II. Nesta fase é testada a eficácia da
droga, bem como sua toxidade. O número
de indivíduos pode chegar a 300.
Fase III. Nesta fase é realizado um
estudo multicentro e com um número
maior de pacientes, até 3000.
Fase IV. É a fase pós-mercado, ocorre
depois do fármaco ter sido liberado para
comercialização.
Seriado Two and half men. Alan foi convencido a participar
de um teste clínico.
Fonte da imagem:
http://www.youtube.com/watch?v=8ypYeK8L-DQ
Acesso em: 12 de junho de 2015.62
Testes Clínicos
Imagem disponível em: <
http://missinglink.ucsf.edu/lm/cell_cycle/cycle.html
>
Acesso em: 12 de junho de 2015.
63
A enzima quinase dependente de ciclina
CDK (cyclin-dependent kinase) apresenta-
se como alvo para desenho de fármacos
contra câncer, pois a inibição dessas
enzimas bloqueia o progresso do ciclo
celular, podendo levar a célula
cancerígena à apoptose (morte celular
programada). Uma das CDKs mais
estudas é a CDK2, envolvida na
passagem de G1 para S, como mostrado
no diagrama ao lado. A inibição da CDK2
impede a progressão do ciclo celular na
passagem de G1/S.
Progressão do Ciclo Celular
A CDK2 é inativa como monômero e sua ativação requer uma sequência de eventos
mostrados no diagrama esquemático abaixo. A CDK liga-se à ciclina, uma proteína
cujo o nível oscila durante a progressão do ciclo celular. Além da ligação da ciclina, é
necessária uma sequência de fosforilação e desfosoforilação, que culminam com a
ativação da complexo CDK-ciclina.
Fonte: Canduri F, de Azevedo WF Jr. Curr Computer-Aided
Drug Design 2005; 1(1): 53-64. 64
Progressão do Ciclo Celular
A elucidação de estrutura cristalográfica
da CDK2 humana na forma apo (sem
inibidores ou outros ligantes), e depois
complexada com inibidores e com a
ciclina, desvendou os detalhes estruturais
da especificidade de diferentes inibidores
pela CDK2. A grande maioria dos
inibidores de CDK ligam-se no bolsão de
ligação de ATP (adenosina trifosfato),
mostrado na figura ao lado, sendo
inibidores do tipo competitivo. A região de
ligação do ATP e dos inibidores
competitivos está indicada por uma elipse
na figura ao lado.
Bolsão de ligação de ATP
Fonte: Canduri F, de Azevedo WF Jr. Curr Computer-Aided
Drug Design 2005; 1(1): 53-64.
Terminal C
Terminal N
65
Quinase Dependente de Ciclina
A partir da elucidação de várias estruturas cristalográficas complexadas com
inibidores, podemos propor uma explicação para os aspectos estruturais em comum,
necessários para a inibição da CDK2. Inibidores de CDK2 apresentam um padrão
complementar de ligações de hidrogênio com a enzima, chamado de garfo molecular
(figura abaixo). Há na CDK2 uma sequência de aceitador, doador e aceitador de
ligação de hidrogênio, que é complementar no inibidor.
Glu 81 C=O
Leu 83 C=O
Leu 83 N-H
CDK266
Quinase Dependente de Ciclina
Assim, as estruturas dos compostos para apresentarem uma boa interação com a
CDK2, devem ter pelo menos dois átomos com potencial para participarem de
ligações de hidrogênio, não muito afastados um do outro e, possivelmente, um terceiro
átomo nas proximidades dos dois primeiros. Nem todos os inibidores de CDK2
completam as três interações intermoleculares, mas pelo menos uma está sempre
presente.
Glu 81 C=O
Leu 83 C=O
Leu 83 N-H
Doador de ligação de H
Doador de ligação de H
Aceitador de ligação de H
CDK2 Inibidor 67
Quinase Dependente de Ciclina
Veja na estrutura dos inibidores os átomos que participam de ligações de hidrogênio
intermoleculares com o garfo molecular da CDK2.
Aceitador de ligação de hidrogênio
Doador de ligação de hidrogênio
68
Quinase Dependente de Ciclina
Muitos dos fármacos anticâncer usados em quimioterapia são moléculas que
interagem diretamente com o DNA. A interação intermolecular entre fármacos e a
molécula de DNA ocorre principalmente envolvendo agentes intercalantes, descritos a
seguir.Esses agentes são moléculas capazes de
encaixar-se entre os pares de bases da
molécula de DNA. Tal interação deforma a
estrutura de hélice dupla do DNA, o que
previne replicação e transcrição dessa.
Exemplo de uma droga intercalante é
doxorubicin (mostrada na figura ao lado),
que é usada no tratamento de tumores
sólidos. Essa molécula aproxima-se do
DNA via a cavidade maior e se intercala
usando o sistema de anéis tricíclicos.
Doxorubicin
69
Agentes Intercalantes de DNA
A estrutura cristalográfica do DNA, em
complexo com doxorubicin, revelou o
encaixe do doxorubicin entre os pares de
bases, indicados na figura ao lado. A
molécula ajusta-se na molécula de DNA
deformando-a, vemos ao lado o
emparelhamento dos pares de bases e da
molécula de doxorubicin (Código de
acesso PDB: 1D12).
Doxorubicin
70
Doxorubicin
Doxorubicin
Agentes Intercalantes de DNA
Consideremos um sistema biológico
formado por uma proteína (P) e um
ligante (L) em solução. No sistema o
ligante é uma pequena molécula que
apresenta afinidade pela proteína, por
exemplo, o fármaco indinavir, um inibidor
a protease do HIV. Tal sistema possibilita
a formação de um complexo binário
proteína-ligante (PL), com constante de
reação indicada por k1 e constante
reversa de reação dada por k-1, ambos
descritos na equação reversível abaixo,
P + L PL
A reação pode ser caracterizada pela
constante de equilíbrio (Keq). Na prática
são usadas as constantes de dissociação
(Kd) e inibição (Ki).
k1
k-1
Formação do complexo proteína (P) com ligante (L),
complexo proteína-ligante (PL).
A estrutura em destaque é o complexo protease do HIV (P)
e o fármaco indinavir (L), usado no tratamento contra a
AIDS.
Interação Proteína-Ligante
71
Ligante
Proteína
As interações entre o inibidor de CDK2
(roscovitine mostrado ao lado) e a
proteína alvo (CDK2) são não covalentes.
Tais contatos intermoleculares
apresentam uma interação energética
favorável, o que leva o equilíbrio da
reação química indicada abaixo para o
lado da formação do complexo binário
(PL).
P + L PL
A análise da energia da interação
proteína-ligante indica a formação de um
composto de transição, onde a energia do
sistema é elevada e o composto formado
instável. Este estado é chamado estado
de transição, e a reação caminha para
uma menor energia, com a formação do
complexo binário PL.
k1
k-1
Estrutura molecular do inibidor de CDK2 roscovitine. A
figura foi gerada com o programa VMD e a opção CPK. As
coordenadas foram extraídas do arquivo PDB: 2a4l.
72
Interação Proteína-Ligante
+
Proteína + Ligante Estado de transição Complexo proteína-ligante
Energ
ia
Coordenada da interação
Ea
Ed
E
Ea = Energia de ativação para associação
Ed = Energia de ativação para dissociação
E = Variação total da energia
73
Interação Proteína-Ligante
P + L PL
Podemos representar a formação do complexo proteína-ligante (PL) a partir dos
componentes proteína (P) e ligante(L), como esquematizado abaixo. Temos a proteína
(P) e o ligante (L) em solução, no caso do ligante apresentar afinidade pela proteína, o
equilíbrio desta reação será favorável à formação do complexo proteína-ligante (PL).
k1
k-1
74
Interação Proteína-Ligante
No caso do complexo binário proteína-
ligante (PL) apresentar uma energia
menor que as moléculas livres (proteína e
ligante sem interação), a formação do
complexo proteína-ligante ocorrerá de
forma espontânea, ou seja, sem a
necessidade de fornecimento de energia
para que ocorra a formação. Uma forma
de estudar a formação do complexo
binário é a partir da avaliação da variação
de energia livre de Gibbs (G), definida
pela seguinte equação,
G = H -TS
Onde H é a entalpia do sistema
proteína-ligante, T é a temperatura e S é
a variação da entropia do sistema. Na figura acima temos a formação espontânea de um
complexo proteína-ligante, pois este apresenta energia
menor que das moléculas livres (proteína e ligante sem
interação)
P
L
PL
75
Interação Proteína-Ligante
G = H -TSCom G > 0 a reação não é favorável à formação do
complexo, como na figura inferior. Com G < 0 temos
uma reação favorável à formação do complexo, como na
figura superior.
L
P
G < 0
G > 0
O termo H indica a entalpia do sistema,
que representa as forças moleculares
envolvidas nas interações proteína-
ligante. O termo S é a variação da
entropia do sistema, que pode ser
entendida como a quantidade de
energia que não pode ser convertida
em trabalho. Na equação anterior, o
produto da temperatura absoluta (T) pela
variação da entropia (S), indica que um
aumento da entropia favorece a formação
do complexo binário.
Um valor negativo de G indica formação
espontânea do complexo.
PL
76
Interação Proteína-Ligante
O termo entálpico (H) contribui para variação da energia livre de Gibbs, por meio de
interações não-covalentes, resultantes da quebra ou formação destas interações, são
elas:
1) Ligações de hidrogênio. Esta ligação envolve um átomo doador (D) e um átomo
aceitador (A).
2) Interações eletrostáticas (iônicas e polares).
3) Interações aromáticas.
4) Interações dispersivas (van der Waals). 77
Interação Proteína-Ligante
O termo entrópico (S) está relacionado
com a variação de graus de liberdades
das moléculas presentes no sistema
proteína-ligante. Na parte de cima da
figura ao lado temos o sítio ativo da
enzima (esquerda) e o ligante livre
(direita). Temos que lembrar que a
interação proteína-ligante não ocorre no
vácuo, temos no sistema moléculas de
água, que têm participação decisiva na
interação intermolecular. As cadeias
laterais dos resíduos de aminoácido do
sítio ativo estão livres para girarem, o
ligante também está livre para girar, se
apresentar ligações simples. A proteína e
ligante interagem com água.
Fonte: Caceres RA, Pauli I, Timmers LFS, de Azevedo Jr. WF. Curr. Drug
Targets 2008; 9(12): 1077-1083.
Sítio de ligação
solvatado
Complexo proteína-ligante solvatado
Contatos hidrofóbicos
Ligações de hidrogênio
78
Interação Proteína-Ligante
A figura ao lado ilustra a formação do
complexo proteína-ligante, a liberação
das moléculas de água tende a aumentar
a entropia do sistema, o que compensa a
perda de entropia devida à formação do
complexo. O ligante e a proteína perdem
liberdade na estrutura do complexo
binário.
Fonte: Caceres RA, Pauli I, Timmers LFS, de Azevedo Jr. WF. Curr. Drug
Targets 2008; 9(12): 1077-1083.
Sítio de ligação
solvatado
Complexo proteína-ligante solvatado
Contatos hidrofóbicos
Ligações de hidrogênio
79
Interação Proteína-Ligante
Quando o sistema proteína-ligante está
em equilíbrio, a formação do complexo
binário e a dissociação ocorrem, assim a
constante de equilíbrio (Keq) da reação é
dada por,
onde os termos [P], [L], [PL] indicam as
concentrações molares da proteína,
ligante e complexo proteína-ligante,
respectivamente. A partir da análise
dimensional da constante de equilíbrio
vemos claramente que sua unidade é M-1.
LP
PL
k
kK
1
1eq
Estrutura do complexo entre a proteína quinase
dependente de ciclina 2 (Cyclin-Dependent Kinase 2,
CDK2) e o inibidor roscovitine. 80
Interação Proteína-Ligante
A AIDS surgiu como pandemia há
algumas décadas atrás e causou grande
temor, pois inicialmente não havia
conhecimento da sua causa. O estudo da
AIDS registra um dos maiores sucessos
da moderna abordagem do desenho de
fármacos, usando-se recursos
computacionais. A AIDS é causada pelo
HIV. Os vírus são formados por uma capa
de proteína que envolve seu material
genético, no caso do HIV é o RNA. Aqui
descreveremos o uso da protease do HIV,
como alvo para o desenvolvimento de
fármacos contra a AIDS.
Concepção artística da pesquisa de novos fármacos
contra a AIDS.
Imagem disponível em:
<http://www.sciencephoto.com/media/206187/view>
Acesso em: 12 de junho de 2015.81
Inibidores da Protease do HIV
As proteases são enzimas que catalisam
a clivagem de outras proteínas, a
protease do HIV catalisa tal clivagem.
Esta protease realiza uma importante
etapa no ciclo da infecção viral. Como em
outros vírus, o HIV leva a célula infectada
a produzir muitas cópias de suas
proteínas. Tais proteínas apresentam
inicialmente como um única cadeia
polipeptídica (poliproteína), que apresenta
várias proteínas coladas numa cadeia. A
função da protease do HIV é catalisar a
clivagem da poliproteína em unidades
menores funcionais. A correta execução
de tal clivagem é crítica para o processo
de infecção viral.
Célula (linfócito T)(em verde) infectada com o HIV (em
vermelho). As esferas vermelhas são partículas repletas
de HIV, que saem da linfócito T para infectar outras
células.
Imagem disponível em:
http://www.sciencephoto.com/media/248205/enlarge
Acesso em: 12 de junho de 2015.
82
Inibidores da Protease do HIV
A poliproteína intacta é necessária no
início do processo de infecção, quando
monta a forma imatura do vírus. Em
seguida a poliproteína tem que ser
clivada, para formar o vírus maduro, que
pode então infectar uma nova célula. As
reações de clivagem da poliproteína têm
que ser coordenadas perfeitamente, o que
permite a montagem do vírus. Devido a tal
sensibilidade e seu papel essencial para
infecção viral, a protease do HIV é um
alvo importante para o desenho de
fármacos contra a AIDS. A inibição da
protease do HIV impede a maturação do
vírus, cessando a progressão da infecção. A estrutura da protease do HIV é dimérica, com duas
unidades idênticas. Os inibidores ligam-se na cavidade
entre as duas unidades. O inibidor está indicado pela
esferas verde s, no meio da estrutura.
Imagem disponível em: ftp://resources.rcsb.org/motm/tiff/6-
HIV-1Protease-7hvp_activesite.tif
Acesso em: 12 de junho de 2015. 83
Inibidores da Protease do HIV
A variação da energia livre de Gibbs da
interação intermolecular entre proteína e
ligante é dada pela seguinte equação,
onde Go é a variação da energia livre
de Gibbs padrão, ou seja, a variação em
G que acompanha a formação do
complexo no estado padrão de equilíbrio
(temperatura de 25oC, pressão de 100
kPa).
)]L][P[
]PL[ln(RTGG o
Estrutura cristalográfica da protease do HIV em
complexo com inibidor. A estrutura destaca as
interações intermoleculares entre um fármaco (ligante)
e sua proteína alvo.
84
Inibidores da Protease do HIV
No equilíbrio termodinâmico temos G = 0 (estado estacionário), assim temos,
O termo Go é chamado variação na energia livre de Gibbs da ligação (Gbinding),
assim temos,
)]L][P[
]PL[ln(RTG
)]L][P[
]PL[ln(RTG0
o
o
)]L][P[
]PL[ln(RTGbinding
85
Inibidores da Protease do HIV
De uma forma geral podemos expressar a afinidade proteína-ligante pela variação da
energia livre de Gibbs (Gbinding), quanto menor a energia, maior a afinidade do ligante
pela proteína. Esta grandeza física depende das concentrações do complexo proteína-
ligante [PL], das concentrações da proteína [P] e do ligante [L], bem como da
temperatura. O “R” (R=1,99 cal/mol.K = 8,31 J/mol.K) na equação indica a constante
dos gases.
A constante de dissociação (Kd) é dada por:
Assim temos como calcular a energia livre de uma interação proteína-ligante, a partir
da constante de dissociação determinada experimentalmente.
][
]][[
PL
LPKd
)ln(
)ln()ln(
)]][[
][ln(
dbinding
dd
binding
binding
K
KK
RTG
RT1
RTG
LP
PLRTG
86
Inibidores da Protease do HIV
Vamos considerar o estudo do
desenvolvimento de drogas contra o HIV.
Vimos que o principal alvo para o desenho
de fármacos contra HIV é a protease do
HIV. Os dados sobre a constante de
dissociação (Kd) de 4 inibidores da
protease estão indicados na tabela
abaixo, todos feitos na temperatura de 25º
C. As estruturas são mostradas ao lado.
A partir dessa informação calcularemos a
variação na energia livre de Gibbs da
ligação (Gbinding).Estruturas de alguns inibidores da protease do HIV. A)
Indinavir. B) Saquinavir. C) Ritonavir. D) Nelfinavir.Inibidor Kd (nM) Gbinding (kJ/mol)
Indinavir 1,07
Saquinavir 0,31
Ritonavir 0,6
Nelfinavir 0,0122
87
Inibidores da Protease do HIV
Estudo do indinavir. As constantes de dissociação foram determinadas a uma
temperatura de 25º C, para converter para Kelvin é só somar 273, assim temos T= 298
K.
kJ/mol 51,2- G
J/mol 51201,6- (-20,6556) . 2478,8236 G
1,07.10ln . 2478,8236 1,07.10ln . 298 . 8,3182 ln(K R.T. G
binding
binding
-9-9d binding
)
Inibidor Kd (nM) Gbinding (kJ/mol)
Indinavir 1,07 -51,2
Saquinavir 0,31
Ritonavir 0,6
Nelfinavir 0,0122
Estrutura molecular do fármaco indinavir. A
figura foi gerada com o programa VMD e a
opção CPK. As coordenadas foram extraídas
do arquivo PDB: 1hsg.
88
Inibidores da Protease do HIV
A partir da análise da tabela abaixo vemos que o inibidor que apresenta menor energia
livre de Gibbs de ligação é o nelfinavir, cujo a estrutura do complexo proteína-ligante
está mostrada abaixo.
Inibidor Kd (nM) Gbinding (kJ/mol)
Indinavir 1,07 -51,2
Saquinavir 0,31 -54,3
Ritonavir 0,6 -52,6
Nelfinavir 0,0122 -62,3
89
Inibidores da Protease do HIV
Muitos fármacos são desenvolvidos a
partir do uso de simulações
computacionais, inclusive baseados
nas ideias da evolução darwiniana.
Para entender tais estudos, temos que
ver a interação do fármaco com uma
proteína alvo. Podemos usar a
analogia da interação da chave com a
fechadura, onde o fármaco é a chave
e a proteína alvo é a fechadura. No
caso de enzimas a fechadura será o
sítio ativo, e o inibidor a chave. Temos
que destacar que tal analogia é só
para captarmos a essencial da
interação, o fenômeno da interação
proteína-fármaco é mais complexo,
mas para nossos propósitos será
suficiente tal comparação.
Interação da chave (fármaco) com a fechadura (sítio
ativo da enzima)
Fonte
da im
agem
: http://w
ww
.scie
ncephoto
.com
/media
/215959/e
nla
rge
Consultado e
m 6
/06/2
014
90
Desenho de Fármacos
Na figura ao lado temos a
representação gráfica da interação de
um inibidor (chave) com o sítio ativo
de uma enzima (fechadura). A
estrutura representada é da CDK2
(cyclin-dependent kinase 2), uma
enzima envolvida no controle da
progressão do ciclo celular. A inibição
dessa enzima leva a célula a parar a
progressão do ciclo celular. Tal parada
pode levar a célula à apoptose. Este
efeito mostrou atividade
anticancerígena. Por isso grande
esforço tem sido feito no
desenvolvimento de inibidores de
CDK2. Na figura ao lado temos a
superfície molecular da CDK2
interagindo com inibidor (em verde).
As cores da superfície molecular da CDK2 representam a
carga elétrica parcial, com vermelho indicando concentração
de carga negativa, azul positiva e ciano neutro.
91
Desenho de Fármacos
A interação de um possível inibidor de
uma enzima pode ser obtida por meio
de algoritmos evolucionários, num
método chamado docking molecular
(docagem molecular). Nesta
simulação computacional, são
tentadas várias posições possíveis
para a chave (possível inibidor),
mudando-se sua orientação relativa
dentro do sítio ativo da enzima. Ao
final da simulação temos várias
posições possíveis para a chave
(possível inibidor) no sítio ativo da
enzima (fechadura). O melhor
resultado (a melhor posição da chave
na fechadura) é escolhido a partir de
uma função de ajuste (também
chamada de escore).
Zoom do sítio ativo da CDK2. Vemos o inibidor (chave) em
verde bem acomodado no sítio ativo (fechadura). As cores
da superfície molecular da CDK2 representam a carga
elétrica parcial, com vermelho indicando concentração de
carga negativa, azul positiva e ciano neutro.
92
Docking Molecular
Toda simulação de docking molecular
tem duas etapas. Na primeira etapa
são geradas posições para a molécula
no sítio ativo da enzima. Numa
segunda etapa selecionamos, dentro
de um critério (função ajuste), a
melhor posição. Na simulação de
docking molecular, as posições do
inibidor (chave) são geradas
aleatoriamente. Depois selecionamos
as melhores posições. No passo
seguinte operamos o cruzamento
entre as melhores posições, gerando
as posições filhas. Aplicamos de forma
aleatória mutações às posições filhas.
Selecionamos os melhores, entre pais
e filhas e iniciamos novo ciclo
(iteração).
Cinco posições possíveis de um inibidor no sítio ativo da
CDK2. A melhor posição será selecionada a partir da função
ajuste (também chamada função escore). A superfície da
CDK2 está colorida para indicar potencial elétrico, com
vermelho indicando potencial negativo, azul positivo e
branco neutro.
93
Docking Molecular
A simulação computacional finaliza ao
atingirmos um critério de parada, que
pode ser o número de repetições da
iteração, ou um critério de
convergência. As novas posições em
um novo ciclo não mostram grande
variação com relações às posições do
ciclo anterior.
A simulação de docking está
disponível em diversos programas de
computador. E são usadas de forma
intensa por laboratórios farmacêuticos
para o desenvolvimento de novos
fármacos. Um dos maiores sucessos
de tal abordagem, foi a descoberta de
inibidores da protease do HIV,
mostrada ao lado. Tais inibidores são
usados no coquetel contra AIDS.
Inibidor no sítio ativo da HIV protease.
94
Docking Molecular
Como toda metodologia, a simulação de
docking tem uma etapa de validação e
refinamento do protocolo. Tal etapa é que
chamamos de redocking, onde achamos o
melhor protocolo capaz de recuperar a
posição cristalográfica de um ligante
acoplado ao sítio ativo de uma enzima. A
condição para que possamos validar
nosso protocolo de docking é que haja
informações sobre pelo menos uma
estrutura cristalográfica de um complexo
proteína-ligante.Chamamos da posição obtida computacionalmente de pose
(em vermelho) e a comparamos com a cristalográfica (em
cinza) a partir do RMSD (Root-Mean Squared Deviation)
que pode ser pensado como uma régua que mede a
distância da posição cristalográfica da pose.
Bio-Inspired Algorithms Applied to Molecular Docking
Simulations. Heberlé G, De Azevedo WF Jr. Curr Med Chem
2011; 18 (9): 1339-1352.
95
Docking Molecular
Moléculas
puras
Base de dados
moleculares
Cálculo da
afinidade
proteína-ligante
teórico
Seleção dos
melhores
resultados
Testes in vitro
Seleção de alvo
molecular
Simulações de
docking
Testes in vivo
in silico
in vitro
in vivo
Na descoberta de fármacos podemos usar as abordagens in silico. Para
isso temos que ter a estrutura 3D da proteína, que foi selecionada a
partir do conhecimento do sistema biológico, como descrito para a
CDK2. Usamos uma metodologia chamada docking molecular, para
procurarmos “chaves” em potencial que se encaixem do sítio ativo da
enzima. O teste de várias molécula é chamado Virtual Screening. As
melhores moléculas selecionadas são submetidas aos testes
posteriores.
Virtual Screening
96
97
Sites Indicados
Segue uma breve descrição de dois sites relacionados à aula de hoje. Se você tiver
alguma sugestão envie-me (walter.junior@pucrs.br ).
1) http://www.rcsb.org/pdb . O site do PDB (Protein Data Bank) traz o arquivo com as
coordenadas atômicas de todas as estruturas de macromoléculas biológicas
resolvidas até hoje. O site apresenta várias funcionalidades que facilitam o estudo
de moléculas biológicas. Não deixem de visitar o site. O site é em inglês.
2) http://www.rcsb.org/pdb/101/motm_archive.do . Este site traz informações sobre
diversas proteínas que tiveram sua estrutura elucidada. O site explora as
aplicações do estudo estrutural de diversas proteínas, com destaque para aquelas
que são alvos para desenvolvimento de fármacos.
ALBERTS, B. et al. Biologia Molecular da Célula. 4a edição.
Artmed editora, Porto Alegre, 2004 (Capítulo 3).
Gasteiger, J. & Engel, T. (Eds) Chemoinformatics. A textbook.
Willey-VCH Verlag GmbH & Co. KGaA, Weinheim, 2003.
Leach, A. R. & Gillet, V. J. An introduction to chemoinformatics.
Springer, The Netherlands, 2007.
Schneider, G. & Baringhaus, K. –H. Molecular Design. Concepts
and Applications. WILEY-VCH Verlag GmbH & Co. KGaA,
Weinheim, 2008.
Verma & Hansch. QSAR modeling of taxane analogues against
colon cancer. European Journal of Medicinal Chemistry 45 (2010)
1470–1477
Artigos científicos de periódicos dedicados ao desenho de
drogas: Current Drug Targets (ISSN: 1389-4501), The Open Drug
Discovery Journal (ISSN: 1877-3818), Medicinal Chemistry
(ISSN: 1573-4064) .
98
Referências
Recommended