Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
Teobaldo Ricardo Cuya Guizado
ESTUDOS COMPUTACIONAIS DA INTERAÇÃO DE
PORFIRINAS E SEUS COMPLEXOS DE FERRO COM
ALBUMINA SÉRICA HUMANA
Dissertação de Mestrado
Dissertação apresentada como requisito parcial para obtenção do grau de Mestre pelo Programa de Pós-Graduação em Física do Departamento de Física da PUC-Rio.
Orientadora: Sônia Renaux Wanderley Louro Co-Orientador: Pedro Geraldo Pascutti
Rio de Janeiro, março de 2008
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
Teobaldo Ricardo Cuya Guizado
Estudos Computacionais da Interação de Porfir inas e seus Complexos de Ferro com Albumina Sérica Human a
Dissertação apresentada como requisito parcial para obtenção do grau de Mestre pelo Programa de Pós-Graduação em Física do Departamento de Física do Centro Técnico Científico da PUC-Rio. Aprovada pela Comissão Examinadora abaixo assinada.
Profa. Sônia Renaux Wanderley Louro Orientadora
Departamento de Física – PUC-Rio
Prof. Pedro Geraldo Pascutti Co-Orientador
UFRJ
Profa. Célia Anteneodo Departamento de Física – PUC-Rio
Prof. Iouri Borissevitch USP
Prof. André Silva Pimentel Departamento de Química – PUC-Rio
José Eugenio Leal Coordenador Setorial do Centro
Técnico Científico – PUC-Rio
Rio de Janeiro, 28 de março de 2008
Todos os direitos reservados. É proibida a reprodução total ou parcial do trabalho
sem autorização da universidade, do autor e da orientadora.
Teobaldo Ricardo Cuya Guizado
Graduou-se em Física na Universidad Nacional Mayor de San Marcos
(Lima-Perú) em 1995 com ênfase em Física,
Iniciou o mestrado em Física na PUC em 2006 na área de Biofísica Molecular.
Ficha Catalográfica
CDD: 530
Cuya Guizado, Teobaldo Ricardo Estudos computacionais da interação de porfirinas e seus complexos de ferro com albumina sérica humana / Teobaldo Ricardo Cuya Guizado ; orientadora: Sônia Renaux Wanderley Louro ; co-orientador: Pedro Geraldo Pascutti. – 2008. 138 f. : il. ; 30 cm Dissertação (Mestrado em Física)–Pontifícia Universidade Católica do Rio de Janeiro, Rio de Janeiro, 2008. Inclui bibliografia 1. Física – Teses. 2. Biofísica. 3. Dinâmica molecular. 4. Porfirinas. 5. Albumina. I. Louro, Sônia Renaux Wanderley. II. Pascutti, Pedro Geraldo. III. Pontifícia Universidade Católica do Rio de Janeiro. Departamento de Física. IV. Título.
A mi querido hermano, José Antonio Cuya Guizado
Agradecimentos
A minha orientadora, professora Sônia Renaux Wanderley Louro, por ter me
aceitado e acreditado em minha pessoa. Sua ajuda durante o desenvolvimento do
projeto foi importante, pela sua amizade.
Ao meu co-orientador Pedro Pascutti do Laboratório de Modelagem e Dinâmica
Molecular do Instituto Carlos Chagas Filho da Universidade Federal do Rio de
Janeiro pelo seu ensino, ajuda e amizade.
A todo o pessoal administrativo do Departamento de Física da PUC-Rio,
especialmente a Giza e Julinho pela ajuda sempre oportuna.
A meus colegas do Departamento de Física da Universidade da PUC-Rio, e do
Laboratório de Modelagem e Dinâmica Molecular do Instituto Carlos Chagas
Filho da UFRJ. Especiais menções merecem Arlan Gonçalves, Samuel Pita,
Diego Enry e Pedro Loureiro, pela sua amizade.
À instituição CNPq pelo apoio financeiro.
Resumo
Cuya Guizado, Teobaldo Ricardo; Louro, Sônia Renaux Wanderley; Pascutti, Pedro Geraldo. Estudos Computacionais da Interação de Porfirinas e seus Complexos de Ferro com Albumina Sérica Humana. Rio de Janeiro, 2008. 138p. Dissertação de Mestrado - Departamento de Física, Pontifícia Universidade Católica do Rio de Janeiro.
A aparição do HIV na década de 80 e de outros vírus presentes no sangue
dos doadores, assim como a expansão de doenças como a hepatite C, tem
estimulado as pesquisas para desenvolver substitutos do sangue. Pesquisas
recentes têm sido realizadas em derivados artificiais da albumina de soro humano
(human serum albumin – HSA) associados com heme, representando uma linha
promissora nesse sentido. No presente trabalho, fazemos um estudo
computacional da ligação do heme e de seu precursor, a protoporfirina IX, com a
HSA, com o objetivo de conhecer os aminoácidos que contribuem à estabilidade
da ligação, a natureza do sítio de ligação, a formação de possíveis sítios
secundários de ligação e a influência das porfirinas na estrutura global da proteína.
Para conseguir este objetivo utilizamos técnicas de cálculo quântico usando a
Teoria do Funcional de Densidade, Docking Molecular e Dinâmica Molecular.
Finalmente fazemos um estudo da correlação existente entre as diferentes regiões
da HSA e de como este padrão muda na presença das porfirinas. Para este
propósito usamos os coeficientes de correlação generalizada baseados na
formulação de Kraskov. Com base nestas informações, discutimos a contribuição
que poderiam fornecer nossos cálculos para a reengenharia do HSA, no sentido de
fornecer-lhe características de hemoproteínas.
Palavras-chaves Biofísica, Heme, Protoporfirina IX, Dinâmica Molecular, Teoria do
Funcional de Densidade, Hidrofobicidade, Solvatação, RESP, Docking Molecular,
Correlação Generalizada.
Abstract
Cuya Guizado, Teobaldo Ricardo; Louro, Sônia Renaux Wanderley; Pascutti, Pedro Geraldo. Computational Studies of the Interaction of Porphyrins and their Iron Complexes with Human Serum Albumin. Rio de Janeiro, 2008. 138p. Dissertação de Mestrado - Departamento de Física, Pontifícia Universidade Católica do Rio de Janeiro.
The uprising of HIV and other viruses in the beginning of the 80s, as well as
the expansion of other diseases like hepatitis C has stimulated research in order to
develop blood substitutes. Research based on modified Human Serum Albumin
associated with heme has shown a promissory line in this direction. In the present
work we make a computational study about the heme and its precursor, the
Protoporphyrin IX complexed with HSA, in order to know the contribution of the
main amino acids to the stability of the binding, the character of the binding site,
secondary binding sites formation, and the influence of the porphyrins in the
global protein structure. To find this objective we use quantum calculations based
on Functional Density Theory, Molecular Docking and Molecular Dynamics.
Finally, a correlation study between different regions of HSA and the pattern
modifications caused by the porphyrins were performed, using the generalized
correlation coefficients based on the Kraskov formulation. We also discuss the
contribution that our calculations could give to the reengineering of HSA, to
provide them with hemeprotein characteristics.
Keywords
Biophysics, Heme, Protoporphyrin IX, Molecular Dynamics, Functional
Density Theory, Hydrophobicity, Solvation, RESP, Molecular Docking,
Generalyzed Correlation.
Sumário
1. Introdução 16
1.1 Posicionamento e abordagem do problema 16 1.1.1 As Porfirinas 18 1.1.2 A albumina Serica Humana 22
1.2 Objetivos 26
1.3 Estrutura dos Capítulos 26
2. Técnicas computacionais – Aproximação clássica e aproximação quântica 28
2.1 Aproximação Clássica - Função de interação e equações de movimento 29
2.2 O Hamiltoniano e a Função de Interação: Campo de Forças 31 2.2.1 Interações entre átomos (ou grupos) ligados 31 2.2.2 Interações não ligadas 33 2.2.3 Potenciais especiais devido a restrições 34
2.3 Tratamento das interações entre átomos não ligados, aproximações. 35
2.3.1 Exclusão ou modificação de interações 35 2.3.2 Distância de corte de interações não ligadas 36 2.3.3 Interações eletrostáticas - limites sobre as interações
eletrostáticas 37
2.4 Tratamento das fronteiras 37 2.4.1 Condições periódicas 37
2.5 Geração da topologia, coordenadas atômicas e adição do solvente 39 2.5.1 Topologia do Sistema 39 2.5.2 Colocando o soluto numa caixa de água 39
2.6 Mecânica e Dinâmica Molecular 40 2.6.1 Minimização de energia 40 2.6.2 Dinâmica Molecular 42
2.7 Controle da temperatura 44
2.8 Controle da Pressão 44
2.9 Função de distribuição radial 46
2.10 Modelo para a água 47
2.10.1 O modelo SPC (Single Point Charge) 48
2.11 Tratamento eletrostático da proteína 49 2.11.1 Aplicação da Equação de Poisson-Boltzmann para o cálculo de energias eletrostáticas em proteínas 50
2.12 Superfícies de interação molecular 52
2.13 ”Docking” Molecular - Algoritmo Genético 53
2.14 Correlação em dinâmica de biomoléculas 53
2.15 Aproximação Quântica - Teoria do Funcional de Densidade ( DFT) 55 2.15.1 Introdução à DFT 56 2.15.2 Descrição da teoria 57 2.15.3 Descrição matemática 57 2.15.4 O Método RESP (Restrained Electrostatic Potential) 58
3. Resultados e Discussão 60
3.1 Cálculo das cargas das porfirinas 60 3.1.1 Cálculo quântico - programa Gamess 60 3.1.2 Base escolhida na entrada do Gamess para o cálculo do ESP 61 3.1.3 Otimizando a geometria das porfirinas 62 3.1.4 Obtenção das cargas a partir do ESP 62
3.2 Geração das topologias para as porfirinas 65
3.3 Solvatação e estabilidade das porfirinas na água 65 3.3.1 Heme e PPIX 67 3.3.2 Grupo carboxil 68 3.3.3 Oxigênio do carboxil 68 3.3.4 O Fe2+ do heme 69
3.4 DM dos sistemas HSA, HSA-PPIX e HSA-HEME, Propriedades globais 70 3.4.1 Desvio médio quadrático 71 3.4.2 Desvio médio quadrático 3D 76 3.4.3 Raio de Giro 79 3.4.4 Evolução da energia 81 3.4.5 Flexibilidade dos resíduos na proteína 83
3.5 Superfície de contato intermolecular entre HSA e as porfirinas 85
3.6 Distância entre os aminoácidos do HSA que mais interagem com as porfirinas 88 3.6.1 Distância entre os aminoácidos do HSA que mais interagem com PPIX 88
3.6.2 Distância entre os amino ácidos do HSA que mais interagem com o HEME 91
3.7 Pontes de hidrogênio entre o HSA e as porfirinas 94
3.8 Análise da superfície eletrostática dos sistemas HSA, HSA-PPIX e HSA-heme 97
3.9 Prováveis segundos sitio de ligação das porfirinas no HSA 101
3.10 Existem regiões do HSA correlacionadas ao subdomínio IB? 102
4. Conclusão e Perspectivas 110
4.1 Conclusões 110
4.2 Perspectivas 111
Referencias Bibliograficas 112
Apêndice A : Inputs do Gammes 118
Apêndice B : Topologia da Protoporfirina ix 129
Apendice C: Protocolo da Dinamica Molecular 138
Lista de figuras
Figura 1.1 Estrutura básica da porfirina 19
Figura 1.2 Bandas de Soret e bandas Q no espectro de absorção da porfirina. 19
Figura 1.3 Heme (esquerda), PPIX (direita) 20
Figura 1.4 Esquema da estrutura secundaria de HSA com subdomínios codificados por cores 22
Figura 1.5 Esquema mostrando os sítios de vários ligantes da albumina sérica humana 24
Figura 2.1 Potencial de Lennard-Jones 34
Figura 2.3 Interações entre primeiros vizinhos (1-2), segundos vizinhos (1-3) e terceiros vizinhos (1-4) 35
Figura 2.4 Método da dupla distância de corte. 36
Figura 2.5 Condições periódicas em duas dimensões 38
Figura 2.7 A molécula Heme numa caixa de água 40
Figura 2.8 Superfície de energia potencial 41
Figura 2.9 Integração das equações de movimento no algoritmo de leap-frog 43
Figura 2.10 Função g(r) mostrando a distribuição da matéria em torno do átomo central 47
Figura 2.11 Modelos de solvente implícito e modelos de solvente explicito 47
Figura 2.12 Molécula de água no modelo SPC 48
Figura 2.13 Modelo para cálculo da superfície eletrostática 51
Figura 2.14 Constantes dielétricas que caracterizam os diferentes meios nos quais se aplica a equação de Poisson-Boltzmann 51
Figura 2.15 Definições de SAS e SM. 52
Figura 2.16 Correlação de variáveis aleatórias 54
Fig 2.17 A obtenção das cargas a partir do ESP para o heme 59
Figura 3.2 PPIX e Heme numa caixa de água 66
Figura 3.3 Gráfico de g(r) para as moléculas de protoporfirina IX e heme 67
Figura 3.4 Gráfico do g(r) para o grupo carboxil 68
Figura 3.5. Gráfico de g(r) para o oxigênio do carboxil das porfirinas 69
Figura 3.6 Gráfico de g(r) para o íon Fe2+ 70
Figura 3.7 Da esquerda para a direita, HSA-HEME, HSA-PPIX e HSA, mostrando a conformação da porfirina cada 2 ns 72
Figura 3.8 De cima para baixo, sobreposição da estrutura inicial e final da HSA, HSA-PPIX e HSA-HEME 73
Figura 3.9 De cima para baixo: Em preto, RMSD da cadeia de HSA, HSA-PPIX e HSA-HEME em relação à cadeia da estrutura inicial 74
Figura 3.10 RMSD da PPIX com relação a PPIX na estrutura inicial 75
Figura 3.11 RMSD do heme no sítio de ligação durante o primeiro nano segundo da simulação 76
Figura 3.12 RMSD 3D do HSA, mostrando as quatro vistas principais 77
Figura 3.13 RMSD 3D do HSA-PPIX, mostrando as quatro vistas principais 78
Figura 3.14 RMSD 3D do HSA-HEME, mostrando as quatro vistas principais 79
Figura 3.15 Raio de giro da HSA 80
Figura 3.16 Raio de giro do complexo HSA-PPIX 80
Figura 3.17 Raio de giro do complexo HSA-HEME 81
Figura 3.18 Energia total do HSA e seus complexos, mostrando que o sistema é estável energeticamente 82
Figura 3.19 Energia total do HSA e seus complexos, mostrando que o sistema já é estável a partir dos 100 ps 82
Figura 3.20 RMSF de HSA e de HSA complexada com PPIX 84
Figura 3.21 RMSF de HSA e de HSA complexada com heme 84
Figura 3.22 RMSF do HSA-heme e do HSA-PPIX 85
Figura 3.23 Área de contacto intermolecular entre HSA e as porfirinas 87
Figura 3.24 Distância do centro de massas dos aminoácidos e do ligante PPIX à cadeia de HSA 89
Figura 3.25 Distância entre o OH da TYR-161 e os nitrogênios NAW e NAE do ligante PPIX 90
Figura 3.26 Distância entre o OH da TYR-161 e os nitrogênios NBA e NAN do ligante PPIX 90
Figura 3.27 Distância dos principais aminoácidos do HSA que interagem com o heme ao CM da cadeia 92
Figura 3.28 No lado proximal, TYR-161 interagindo frontalmente com o Fe2+ do heme; no lado distal TYR-138 interagindo com os nitrogênios do anel 92
Figura 3.29 Distância entre o oxigênio OH-TYR161 e o íon Fe2+ do heme 93
Figura 3.30 Comparação teórica-experimental da microvizinhança molecular obtido por raios X e a microvizinhança molecular obtido em nossos cálculos 93
Figura 3.31 Ligações de hidrogênio da PPIX com HSA e o com o água nas vizinhanças do sítio de ligação 96
Figura 3.32 Número de ligações de hidrogênio do heme com a proteína (preto) e com o solvente presente nas vizinhanças do sítio de ligação 96
Figura 3.33 De cima para baixo: superfície eletrostática do HSA, HSA-PPIX e HSA-heme depois de 20 ns de DM 99
Figura 3.34 De cima para baixo: superfície eletrostática do subdomínio IB do HSA, HSA-PPIX e HSA-heme depois de 20 ns de DM. 100
Figura 3.35 Segundo provável sitio de ligação da PPIX no HSA 101
Figura 3.36 Potencial eletrostático na superfície da proteína na região do segundo provável sitio de ligação da PPIX no HSA 102
Figura 3.37 Padrão de correlação do HSA 103
Figura 3.38 Matriz da diferença entre as matrizes de correlação total e linear do HSA 104
Figura 3.39 Padrão de correlação generalizada do HSA e HSA-HEME 105
Figura 3.40 Padrão de correlação generalizada do HSA e HSA-PPIX 106
Figura 3.41 Padrão de correlação generalizada: HSA e HSA-HEME, nesta figura mostra-se entre as paralelas as regiões diretamente correlacionados com a região compreendida entre os resíduos 100-200 107
Figura 3.42 Região (100-118, vermelho) correlacionada com a região (460-465, amarelo) 108
Figura 3.43 Região (100-118, vermelho) correlacionada com a região (306-313, amarelo) 108
Figura 3.44 Região (110-140, vermelho) correlacionada com a região (500-582, amarelo) 109
Abreviaturas
CHELPG Cargas do potencial eletrostático usando um método
baseado em grade (CHarges from ELectrostatic Potential
based on Grid)
RF Campo de reação (Reaction Field)
DM Dinâmica Molecular
DFT Teoria do Funcional de Densidade (Density Funtional
Theory)
ESP Potencial Eletrostático (Electrostatic Potential)
FDR Função de distribuição radial
HF Hartree –Fock
HSA Albumina sérica humana (Human Serun Albumin)
MM Mecânica Molecular
NMR Ressonância Magnética Nuclear (Nuclear magnetic
resonance)
PDT Terapia Fotodinâmica (Photodynamic Therapy)
PPIX Protoporfirina IX (Protoporphyrin IX)
RESP Restrição do potencial eletrostático (Restrained Electrostatic
Potential).
RMSD Desvio da raiz média quadrática (Root mean square
desviation)
RMSF Flutuação da raiz média quadrática (Root mean square
fluctuation)
SAS Superfície acessível ao solvente
SCI Superfície de contato intermolecular
1. Introdução
1.1 Posicionamento e abordagem do problema
As pesquisas sobre a interação entre as macromoléculas biológicas e drogas
envolvem um dos mais importantes tópicos no campo das ciências da vida devido
a que os sítios de ligação provêem informação importante sobre o transporte e o
metabolismo de moléculas no corpo humano.
A albumina sérica humana é a proteína mais abundante no soro sanguíneo.
Sua estrutura obtida por difração de Raios X encontra-se no banco de dados de
proteínas, RCSB Protein Data Bank (PDB). Aparece como molécula do mês de
janeiro de 2003, nesse site, junto com um resumo sobre sua importância, escrito
por David S. Goodsell.
Pensemos o quanto é conveniente sermos capazes de comer. Cada uma das
nossas dez trilhões de células precisam de um constante suprimento de nutrição.
Mas não temos que nos preocupar com isso – nós simplesmente comemos nossa
refeição e nosso corpo faz o resto. O alimento é digerido e os pedaços úteis são
distribuídos às células de todo o corpo, usando o fluxo sanguíneo como sistema de
transporte. A distribuição de moléculas solúveis em água, como açúcares, é fácil.
Elas circulam na corrente sanguínea e são capturadas pelas células ao longo do
caminho. Outros nutrientes importantes, no entanto, não são solúveis em água e
precisam de carreadores especiais para levá-los até as células famintas.
A albumina sérica (estrutura 1e7i do PDB) tem o papel de carregar ácidos
graxos no sangue. Ácidos graxos são essenciais para duas funções principais em
nosso corpo. Eles são os blocos para construção dos lipídios, que formam todas as
membranas ao redor e dentro das células; são também ricas fontes de energia e
podem ser quebrados dentro das células para formar adenosina trifosfato (ATP).
Então, nosso corpo mantém uma reserva de ácidos graxos, armazenados como
gorduras. Quando o corpo precisa de energia ou de materiais para construção das
17
suas estruturas, células de gordura liberam ácidos graxos no sangue. Aí, eles são
capturados pela albumina sérica e distribuídos a partes do corpo distantes.
A albumina humana é uma proteína versátil. Cada molécula dessa proteína
pode carregar sete moléculas de ácidos graxos, que se ligam a fendas profundas na
proteína, enterrando suas caudas ricas em carbono, hidrofóbicas, a salvo da água
circundante. A albumina sérica também se liga a muitas outras moléculas
insolúveis em água. Associa-se, por exemplo, a moléculas de inúmeros fármacos e
pode afetar fortemente a maneira como eles são distribuídos através do corpo.
Como a albumina sérica é muito abundante no sangue e tão fácil de
purificar, ela foi uma das primeiras proteínas a serem estudadas pelos cientistas.
Atualmente, a proteína similar do sangue de boi - albumina sérica bovina ou BSA
(do inglês bovine serum albumin) – é largamente utilizada em pesquisa quando se
necessita de uma proteína genérica.
A hemina (protoporfirina IX complexada com Fe+3) liberada durante a
nucleação das células vermelhas ou através da hemólise é capturada pela
Albumina Serica Humana (Human Serum Albumin – HSA) a qual tem uma alta
constante de afinidade para este ligante (Kb ~ 108 M-1) (Wardell et al., 2002). Esta
forte afinidade tem estimulado esforços para desenvolver albumina como uma
hemoproteína artificial para mimetizar, por exemplo, a capacidade de ligação de
oxigênio da hemoglobina (Hb) e mioglobina (Mb). O heme, grupo prostético das
hemoproteínas, é a protoporfirina IX com um íon Fe2+ no centro.
Sérios esforços para desenvolver substitutos do sangue começaram na
década de 1980. Esta necessidade se viu aumentada com a aparição do HIV além
de vírus como o da hepatite C e outros vírus presentes no sangue de doadores.
Diferentemente das células vermelhas do sangue, os substituintes artificiais
podem ser esterilizados por pasteurização, ultrafiltração e métodos químicos. Isto
elimina os agentes responsáveis pelas infecções, além de permitir armazenamento
por longos períodos de tempo.
Pesquisas recentes têm demonstrado que derivados artificiais do heme
associados com HSA fornecem uma significante capacidade de ligação com
oxigênio (Tsuchida et al., 1997), representando uma linha promissora no
desenvolvimento de substitutos artificiais do sangue. Um dos estudos mais
importantes no sentido de criar compostos artificiais da sangue usando albumina
estão baseados na mutação da micro-vizinhança molecular do complexo HSA-
18
heme (Komatsu et al., 2005), mas o problema ainda não resolvido é fazer com que
a ligação do oxigênio ao heme seja reversível no micro entorno do heme em HSA.
Na Ressonância Magnética Nuclear (RMN) outra ferro porfirina, a
Tetrafenilporfirina Sulfonatada complexada com Fe (FeTPPS4) é usada como
marcador e na Terapia Fotodinâmica (FDT) as porfirinas são usadas para destruir
tumores.
Por outro lado a Protoporfirina IX (PPIX) é o precursor de muitas porfirinas
que dela se derivam, por conseguinte um adequado conhecimento dos sítios de
ligação com a HSA nos forneceria informação importante sobre a natureza das
ligações nesse entorno.
Até o momento se sabe que o heme tem um sítio de ligação principal no sub
domínio IB de HSA e que poderia ter outros sítios secundários e que a PPIX
poderia ter características similares (Zunszain et al., 2003; Zhang et al., 2002),
mas até agora não se tem a estrutura cristalina que mostre estes sítios secundários.
O presente trabalho tenta revelar essa interrogação e propõe os possíveis sítios
secundários.
Sem dúvida devemos saber que nos processos in vivo se dão maiores
complicações devido a interações entre drogas e ligantes endógenos, para o HSA.
Isto é especialmente importante no caso de ácidos graxos os quais ocorrem em
níveis de 0.1 e 2 mol por mol de HSA e podem competir ou cooperar com drogas
nos sítios de ligação da proteína. (Zunszain et al., 2003)
1.1.1 As Porfirinas
As porfirinas são moléculas importantes em vários aspectos da vida, muito
se tem escrito sobre elas, nos tomaremos a descrição que delas se da em
http://pt.wikipedia.org/wiki/Porfirina .
A estrutura da porfirina é um macrociclo tetrapirrólico (formado por quatro
anéis pirrol), ligados por ligações metínicas (-CH-), que possui no seu centro um
espaço apropriado para acomodar um íon metálico (Fig. 1.1). Este íon pode-se
ligar aos átomos de nitrogênio presentes na parte central da estrutura. Os
representantes mais comuns desta classe de compostos são o grupo heme, que
contém ferro, a clorofila, que contém magnésio, e os pigmentos biliares. O
principal local de síntese de porfirinas é o fígado, nos hepatócitos.
19
A aumento no nível de porfirinas em nosso organismo geram patologias
como a porfiria,
Figura 1.1 Estrutura básica da porfirina (http://pt.wikipedia.org/wiki/Porfirina)
Características Fundamentais
Devido a sua estrutura em anel tetrapirrol, um sistema de enlaces duplos
conjugados, as porfirinas se caracterizam por uma intensa banda de absorção perto
de 400 nm, (com coeficiente de absorção molar maior do que 200.000) conhecida
como banda de Soret, propriedade que permite sua detecção e quantificação em
laboratórios. Quando irradiada com luz deste comprimento de onda, as porfirinas
livres mostram uma intensa fluorescência no vermelho. No caso da PPIX a
fluorescencia não e muito intensa e quando e complexada com Fe a fluorescencia
desaparesce.A Banda de Soret é seguida por outras bandas de absorção mais
fracas (bandas Q), em comprimentos de ondas maiores (450 a 700 nm).
Figura 1.2 Bandas de Soret e bandas Q no espectro de absorção da porfirina.
As variações dos substitutos periféricos no anel da porfirina, causam
mudanças de menor importância na intensidade e no comprimento de onda destas
absorções. A protonação de dois dos átomos internos de nitrogênio ou a inserção
20
de um metal na cavidade da porfirina também muda o espectro de absorção
visível. Estas variações no espectro de absorção podem ser muito proveitosas na
determinação de propriedades características da porfirina.
Importância Biológica
Os complexos de porfirina são essenciais para a vida e têm múltiplas
aplicações. O heme (protoporfirina IX-Fe2+, Fig. 1.3), por exemplo, é o grupo
encarregado de fazer a ligação do oxigênio à hemoglobina e, daí, transportá-lo às
diversas partes do corpo.
O precursor na síntese do heme é a protoporfirina IX (PPIX, Fig. 1.3). A
inserção do ferro II na PPIX é realizada por meio da enzima ferroquelatase.
Figura 1.3 Heme (esquerda), PPIX (direita) (Gráfico realizado com o programa
Ghemical)
Quando o ciclo de síntese do grupo heme e interrompido se produz o
aumento das porfirinas precursoras do heme, isto termina gerando uma grave
doença chamada porfíria. A porfíria pode-se classificar como hepática e
eritropoiética, é responsável por ataques neurológicos agudos e problemas de pele,
geralmente erupções de bolhas sensíveis à luz solar e crescimento aumentado de
pêlos.
Carbono
Oxigênio
Nitrogênio
Íon Ferro (II)
Hidrogênio
21
As propriedades óticas das porfirinas são responsáveis por sua grande
aplicação na área de eletrônica molecular assim como sua incorporação na forma
sintética em células solares.
Aplicações das Porfirinas
Materiais Químicos
Porfirinas e metaloporfirinas têm uma ampla aplicação como fotosensores,
particularmente para aplicações opto-eletrônicas. Por exemplo, a fácil substituição
dos componentes periféricos das porfirinas tem gerado uma série de materiais
líquido-cristalinos incomuns (Chou et al., 2000).
As propriedades ópticas não lineares destes materiais são de especial interesse, em
parte pela transferência de energia com controle molecular, e em parte por
aplicações em comunicação óptica, armazenamento de dados e processamento de
sinais eletro-ópticos. (Chou et al., 2000)
As porfirinas têm presença relevante na nanotecnologia devido à
possibilidade de construir nanotubos por auto agregação. Nesse sentido
numerosos estudos vêm se desenvolvendo. Tem sido demonstrado que os
nanotubos contendo Sn porfirinas são fotocatalíticos e podem reduzir íons
metálicos em solução aquosa (Rotomskis et al., 2004).
Metaloporfirinas como catalisadores para síntese ma cromolecular
Em 1978 Inoue Takeda e colaboradores em seus estudos de fixação de
dióxido de carbono com metaloporfirinas descobriram o potencial utilidade de
metalo-proteínas como catalisadores para a síntese controlada de macromoléculas.
(Takeda et al., 1978). Em várias metaloporfirinas, estudaram compostos de
alumínio ou zinco no anel central para fixação química do dióxido de carbono.
Terapia Fotodinâmica (PDT, Photodynamic Therapy )
Devido ao comportamento particular das porfirinas sob ação da luz, estas
têm sido aplicadas para combater o câncer. Nos anos 70 (Diamond et al., 1972;
Dougherty et al; 1978) mostrou-se através de probas in vitro e in vivo que
derivados de hemoporfirina (HpD) irradiados com luz têm capacidade de
destruição dos tumores. Atualmente diferentes tipos de porfirinas são investigados
e utilizadas na luta contra o câncer.
22
1.1.2 A albumina Serica Humana
A albumina sérica é a mais abundante proteína do plasma humano,
produzida no fígado, é um monômero de 66 kDa. Estruturalmente, a albumina é
composta de vários segmentos em alfa hélice, que se agrupam para formar dois
subdomínios (A e B). Três pares idênticos destes subdomínios se unem para
formar a albumina (Fig. 1.4).
Figura 1.4 Esquema da estrutura secundaria de HSA com subdomínios codificados por
cores da seguinte forma: IA,vermelho; IB – vermelho claro; IIA,verde; IIB – verde claro;
IIIA, azul; IIIB – azul claro. (Obtido de Ghuman et al., 2005)
O HSA tem características específicas que são importantes para a estrutura e
função: 18 resíduos de tirosina, 6 resíduos de metionina, 1 resíduos de triptofano,
59 resíduos de lisina, 1 resíduo de cisteína (Cys-34), e 17 pontes disulfetos.
(Wong et al., 2007).
A cisteína livre tem um sulfidril reduzido que é responsável por mais de
75% dos grupos tiol no plasma. O tiol é envolvido em várias reações bioquímicas
que inativam as espécies reativas de oxigênio, dando à albumina um papel
antioxidante importante em nosso corpo (Wong et al., 2007).
A albumina tem uma concentração plasmática típica de 35 - 45 g/l, que
representa 30 a 40% da albumina sintetizada no fígado. O restante encontra-se
23
distribuído entre os músculos e a pele. Sua principal função fisiológica é manter a
pressão osmótica.
Esta proteína é caracterizada por sua habilidade de ligar uma ampla
variedade de moléculas hidrofóbicas, ácidos graxos, bilirrubina, hemina, tiroxina e
esteróides. Serve como um solubilizador e transportador destes compostos. HSA
tem alta afinidade pelo heme, sendo a constante de dissociação ~10 nM em uma
mistura 3:5 de dimetil sulfóxido e água (Zunszain et al., 2003). Na Fig 1.5 pode se
observar os sítios de ligação principais de diversos ligantes.
Estudos de ligação indicam um só sítio de ligação para a hemina, no
subdomínio IB, o qual corresponde a um dos sítios de ligação para ácidos graxos
(Zunszain et al., 2003).
Um dos fatores mais importantes que afetam a distribuição e a concentração
ativa de muitas drogas no organismo é a afinidade pela HSA. Um grau de
afinidade pela albumina é desejável, para ajudar a solubilizar substâncias que de
outra forma poderiam agregar-se e ser pobremente distribuídas. No caso oposto,
drogas com uma grande afinidade pela proteína requereriam grandes doses para
atingir uma concentração efetiva in vivo, seriam lentamente distribuídas aos sítios
de ação e poderiam não ser eficientemente eliminadas.
Funções fisiológicas da albumina
Pressão Osmótica Coloidal
A função mais importante da albumina é manter a pressão osmótica
coloidal. A albumina provê 60% da pressão osmótica coloidal. A proteína é
negativamente carregada e, por conseguinte atrai íons de sódio, os quais por sua
vez retêm a água. A albumina também atrai outros íons positivos osmoticamente
ativos (efeito Gibbs-Donnan) os quais aumentam a retenção da água (Nguyen et
al., 2006).
Associação de ligantes
A organização estrutural globular da HSA dá a possibilidade de se ligar com
várias substâncias em múltiplos sítios da molécula, unindo-se assim a vários
componentes endógenos e exógenos. Estes compostos incluem ácidos graxos,
bilirrubina, metal, tiroxina e triptofano, assim como drogas que têm características
ácidas ou eletronegativas (e.g. warfarina, diazepan e ibuprofeno). Estas
24
características fazem com que a HSA seja um dos maiores transportadores de
fármacos no sangue (Fig 1.5).
A HSA pode facilitar a ativação de várias sustâncias, tais como hormônios
ou drogas, ou diminuir a presença de toxinas no plasma. Por exemplo, a ligação
do triptofano a HSA regula a deposição deste nos tecidos. Em pacientes com uma
avançada cirrose e hipoalbuminemia, a diminuição dos sítios de ligação gera uma
quantidade adicional de triptofano livre o qual pode gerar o desenvolvimento de
encefalopatia hepática (Greco et al; 2000).
A ligação de HSA também afeta a farmacocinética e eficácia de muitas
drogas. Por exemplo, drogas com alta afinidade pelo HSA têm que ser
administradas em altas doses para atingir uma efetiva concentração in vivo; sua
distribuição nos sítios de ação poderia ser reduzida ou mesmo eliminada. Apesar
disso, uma alta ligação da droga com a HSA poderia ser desejável porque ajudaria
a solubilizar compostos que de outra forma formariam agregados e seriam
pobremente eliminados.
Figura 1.5 Esquema mostrando os sítios de vários ligantes da albumina sérica
humana (Ghuman et al., 2005).
25
Efeitos Antioxidantes
Espécies reativas de oxigênio e nitrogênio são extremamente voláteis e
capazes de reagir com outras moléculas, que dão origem à acumulação de
produtos tóxicos finais e dano celular. Estudos in vivo têm mostrado que o HSA
pode ligar e, por conseguinte, remover neutrófilos derivados de espécies reativas
de oxigênio, regulando a sinalização celular que é ativada nos processos
inflamatórios (Kouoh et al., 1999).
HSA também influencia o status redox do plasma ao ligar metais como o
ferro e o cobre que de outra forma se transformariam em formas redox-ativas
(Kragh-Hansen et al., 2002).
Desta forma o HSA tem um papel antioxidante importante em situações de
inflamação.
Patologia
Hipoalbuminemia
Baixos níveis de HSA (hypoalbuminemia) podem ser causados por:
• Doenças no fígado/ Cirrose do fígado (a mais comum)
• Decréscimo na produção de HSA (má nutrição/má absorção)
• Excessiva excreção pelos rins (síndrome nefrótica)
• Excesso de perda no intestino (Redistribuição hemodilução, como na
gravidez, incremento da permeabilidade vascular).
Hyperalbuminemia
• Sinal de desidratação
26
1.2 Objetivos
Essa dissertação tem os seguintes objetivos principais:
i. Determinar a relação estrutura-solvente das porfirinas, as camadas de solvatação e seu comportamento hidropático.
ii. Caracterizar, usando técnicas de Dinâmica Molecular, o sitio principal de ligação, determinando os aminoácidos que compõem estes sítios e seu rol na estabilidade do ligante.
iii. Determinar possíveis sítios secundários de ligação das porfirinas PPIX, PPIX-Fe2+ na HSA, usando técnicas de Docking Molecular.
iv. Determinar o padrão de correlação do HSA e como este muda pela presença das porfirinas.
1.3 Estrutura dos Capítulos
No capítulo 2 apresentam-se uma descrição da Metodologia e Técnicas
Computacionais usadas no presente estudo. As principais técnicas que usamos
são: Cálculo Quântico, Dinâmica Molecular e Docking Molecular,
O desenvolvimento deste capítulo nos itens 2.1-2.4 e 2.6-2.9 está baseado
no manual do GROMACS (van der Spoel et al., 2005) e no trabalho de Baanden
M. (Baanden M., 2003). Quando as informações apresentadas sejam tomadas de
outras fontes, se fará a respectiva citacão.
No capítulo 3 apresentam-se os Resultados e Discussão do presente trabalho
No capítulo 4 apresentam-se as Conclusões e Perspectivas.
27
28
2. Técnicas Computacionais – Aproximação Clássica e Aproximação Quântica
O desenvolvimento deste capítulo nos itens 2.1-2.4 e 2.6-2.9 está baseado
no manual do GROMACS (van der Spoel et al., 2005) e no trabalho de Baaden M.
(Baanden M., 2003). Quando as informações apresentadas sejam tomadas de
outras fontes, se fará a respectiva referência.
O comportamento da matéria em nível de partículas constituintes dos
átomos e moléculas é descrito pela Mecânica Quântica, enquanto que em níveis
mais complexos a matéria composta de átomos e moléculas pode ser descrita de
forma aproximada pela Mecânica Clássica não relativística.
Uma aproximação clássica perde detalhes do sistema molecular em estudo,
mas permite acessar propriedades macromoleculares do sistema, assim como
economizar tempo de cálculo.
Os pacotes de Dinâmica Molecular baseados numa aproximação clássica
estão fundamentados em duas aproximações:
1. As leis de Newton são aplicáveis.
2. O movimento dos elétrons é muito mais rápido que o movimento dos
núcleos (Aproximação de Born-Oppenheimer).
Nossos modelos utilizados estão representados por sistemas massa-mola
onde cada átomo é representado por sua massa, um raio e uma carga atômica e as
ligações entre os átomos são representadas por molas (van der Spoel et al., 2005).
As características do sistema massa-mola estão contidas no campo de força. As
interações físicas entre os átomos são levadas em conta e introduzidas no termo de
energia potencial. A partir do modelo físico definido pelos parâmetros do campo
de forças e a representação da energia potencial, nós vamos utilizar as leis de
Newton para estudar a evolução das moléculas definida pelos vetores de posição e
pelos vetores de quantidade de movimento. Desta forma geraremos ensambles
29
estatísticos de configurações de átomos e moléculas em diversas fases (Berendsen
at al., 1996).
Para se ter uma média temporal estatisticamente significativa de um sistema
qualquer com a DM, seriam necessárias acessar todas as possíveis configurações
do sistema e estabelecer a probabilidade de cada estado conformacional. Há que
se ter em mente, porém, que neste trabalho estamos aplicando a DM sobre um
sistema envolvendo uma única macromolécula e por um intervalo de tempo de
poucas dezenas de nanosegundos. Embora não se possa falar neste caso de
ensemble estatístico, a simulação da dinâmica de proteínas na conformação
biologicamente ativa, nesta escala de tempo, é útil para obter informações sobre a
estabilidade da estrutura, transições conformacionais locais e várias propriedades
de interações com ligantes. Considerando que proteínas expressam sua atividade
biológica em estados conformacionais próximos ao mínimo global em um funil de
energia livre (Onuchic et al., 2004), espera-se que a probabilidade desses estados
bio-ativos sejam bastante alta em relação ao número astronômico de possíveis
conformações desta macromolécula. Mas devemos mencionar que variacões na
estrutura tamben estan relacionadas com a atividade (enzimas).
Em nossos cálculos vamos utilizar o pacote GROMACS (van der Spoel et
al., 2005). Os detalhes referentes a representação de energia e parâmetros da
simulação são próprios deste campo de forças.
Neste capítulo daremos a descrição clássica e explicaremos o hamiltoniano
do sistema, a energia cinética, a energia potencial e a representação das forças,
assim como a aplicação de restrições de distâncias, tratamentos de contorno, etc.
Também veremos os métodos para a Minimização de Energia (ME), Dinâmica
Molecular, tratamento eletrostático, superfícies de interação molecular, docking
molecular e a geração de matrizes de correlação.
No final do capítulo veremos a aproximação quântica no cálculo de cargas
através do método DFT e o formalismo RESP.
2.1 Aproximação Clássica - Função de interação e equaçõ es de movimento
Referimos-nos a cálculos clássicos como aproximações onde são válidas as
leis de Newton. Para descrever corretamente os sistemas devemos estabelecer os
30
graus de liberdade que serão explicitamente tratados e aqueles que serão
implicitamente tratados e incorporados à função de interação.
Dentro de nosso esquema de cálculo estamos interessados nos graus de
liberdade de posição das coordenadas dos átomos.
Num sistema clássico o hamiltoniano de um sistema molecular é descrito da
seguinte forma:
),(),(),,,( mpKgrVgmrpH += (1)
onde V é a energia potencial, K a energia cinética, p é o momento das partículas, r
a posição, m a massa, e g são parâmetros presentes no campo de forças. A energia
cinética está representada da seguinte forma:
∑ ∑= =
==N
i
N
i
ii
i
i vm
m
pmpK
1 1
22
22);( (2)
e depende das massas e velocidades, e é independente das coordenadas r da
partícula. V(r;g) corresponde a energia potencial que descreve a interação em
função das coordenadas das partículas.
),..;,..,();( 2,121 NN gggrrrVxrV = (3)
Em geral V(r;g) depende dos parâmetros do campo de forças indicados por
),..( 2,1 Ngggg = , e é a soma de termos que representam as distintas interações no
sistema.
Uma partícula nesse sistema está submetida a uma força if que tem a
seguinte representação:
),..,( 21 Ni
i rrrVrf
∂∂−=
(4)
Devemos lembrar que as trajetórias dependem unicamente das forças que
agem sobre os átomos, e não explicitamente das energias.
Usamos as equações de Newton para descrever a evolução da posição na
seguinte forma:
)()(
tvdt
tdri
i = (5)
i
ii
m
f
dt
tdv=
)( (6)
Na simulação estas equações são integradas numericamente no tempo.
31
Inclui-se um termo suplementar Vrestr(r), que é uma função de penalidade
(van der Spoel et al., 2003), dentro da função de interação do sistema que limita o
movimento das partículas de tal forma que o valor simulado da partícula se
aproxima ao valor desejado.
2.2 O Hamiltoniano e a Função de Interação: Campo de Fo rças
De uma forma geral a energia potencial no campo de forças pode ser escrito
da seguinte forma (van der Spoel et al., 2005: item 4.1, 4.2 e 4.3):
);();();();( grVgrVgrVgrV especiaisbondednobonded ++= (7)
Onde Vbonded corresponde aos termos chamados covalentes, Vno bonded aos
termos chamados não ligados (forcas eletrostáticas e de van der Waals) e Vespeciais
aos termos especiais como, por exemplo, as restrições de posição e vínculos em
comprimentos e ângulos de ligação. Assim o Hamiltoniano da equação 1 quedo
descrito por:
),();();();(),,,( mpKgrVgrVgrVgmrpH especiaisbondednobonded +++=
2.2.1 Interações entre átomos (ou grupos) ligados
Na expressão para Vbonded (r;g)
);();();();( grVgrVgrVgrVV impropdiedroângulobondbonded +++= (8)
Esta expressão descreve a variação do comprimento das ligações, a
deformação dos ângulos e as torções devido aos ângulos diedros próprios e
impróprios.
Variação do comprimento das ligações covalentes ent re átomos
A interação entre termos ligados é expressa por um potencial de tipo
harmônico, com uma soma feita sobres todas as ligações covalentes n=1,....Nb.
2
1
)(n
b
n on
N
n
harmonicobbond bbKV −=∑
=
No GROMACS é utilizada por razões de eficiência computacional a expressão
para Vbond
32
∑=
−=
bnn
N
n
onbbond
bbKV
1
222
4
)( (9)
As unidades para non
bb − e para nb
K são nm e kJmol-1nm-4, respectivamente.
Onde:
22
2−
= onharmonicob
b
bKK n
n
Deformação dos ângulos nos átomos ligados
A seguinte relação e utilizada no GROMACS para representar o termo de
deformação entre átomos ligados por uma ligação covalente (van der Spoel et al.,
2005)
∑=
−=
θ θθθN
n
onangulo
nnK
V1
2
2
)cos(cos (10)
Os ângulos são dados em graus e n
Kθ em kJmol-1.EKBT, a soma envolve os
ângulos desde n=1,…Nθ do sistema molecular.
15961575.0 −= molKcalE TKB é a constante de Boltzmann a 300 K.
Termos de torsão, ângulos diedros e impróprios
No campo de força GROMACS a função de interação que representa os
termos harmônicos impróprios da deformação dos ângulos diedros (fora do plano,
fora da configuração tetraédrica) é descrita por:
∑=
−=
ξ ξξξ
N
n
onimprop no
KgrV1
2
2
)();( (11)
A soma compreende n=1,...,Nξ definidos para manter os grupos de átomos
vizinhos dentro de uma configuração espacial determinada, por exemplo para
manter os grupos de átomos em um plano como no caso de um anel aromático.
Em suma, este potencial simula a hibridação de orbitais sp2 ou sp3.
Os termos de torção de ângulos diedros têm a forma (Lindahl et al. 2003):
∑=
+=ϕ
ϕδϕN
nnnn
diedro mKgrVn
1
)]cos()cos(1[);( (12)
33
onde a constante de força n
Kϕ , o angulo diedro nϕ e os valores de nδ e nm estão
limitados aos valores nδ =0,π e nm é um inteiro positivo diferente de zero, por
conseguinte )cos( nδ = ±1 . A soma é feita sobre todos os ângulos diedros
n = 1,..,Nϕ , selecionados de acordo a topologia da molécula.
2.2.2 Interações não ligadas
As interações entre átomos não ligados são descritos por dois termos, VLJ
para as interações de Lenard-Jones e VCoul para as interações eletrostáticas.
∑ +=ligadosnaopares
rfrfojiijCoul
ijLJbondno RCqqrVjiCjiCrVgrV ]},,,,,,[)],(),,(,[{);( 1612 εε (13)
Esta soma é estendida a todos os pares de átomos (i,j) salvo as exceções
citadas adiante (2.3.1).
Interações de Lenard-Jones
Estas interações são chamadas também de van der Waals. Dentro do campo
de forças GROMOS96 se utilizam os parâmetros C6 em kJmol-1nm6 e C12 em
kJmol-1nm12 para a interação entre os átomos i e j a uma distância rij(nm).
−=
66
1212
)(
),(
)(
),(
ijij
LJ
r
jiC
r
jiCV (14)
O primeiro termo em 12)( ijr corresponde à repulsão entre dois átomos, de
tal forma que haja certo grau de superposição de suas nuvens eletrônicas, e cuja
origem esta na repulsão entre os núcleos atômicos e no principio de exclusão de
Pauli. O segundo termo 6)( ijr corresponde à dispersão atrativa de London, a
combinação destes dois fatores dá o perfil de energia de interação mostrada na
Fig. 2.1.
Estas equações levam em consideração as regras para determinar os
parâmetros mistos entre dois átomos i e j de tipos diferentes.
34
),().,(),(
),().,(),(
666
121212
jjCiiCjiC
jjCiiCjiC
=
= (15)
Figura 2.1 Potencial de Lennard-Jones
Interações eletrostáticas
O primeiro termo corresponde às interações eletrostáticas coulombianas e os
outros dois termos correspondem ao campo de reação, o qual simula o efeito de
blindagem causada pelo solvente além do raio de corte das interações
coulombianas.
−−−=
rf
rf
rf
ijrf
ijo
jiRFCoul
R
C
R
rC
r
qqV
21
2
)(1
4 3
2
1
_
επε (16)
O campo de reação no GROMACS é de tipo Poisson-Boltzmann que leva
em conta os efeitos de força iônica. Neste modelo o exterior de uma esfera de raio
Rrf ao redor de um soluto e modelado por um meio homogêneo polarizável.
2.2.3 Potenciais especiais devido a restrições
Existem potenciais “especiais” devido a restrições que são impostas sobre o
sistema para se ter resultados próximos à realidade, estes podem ser usados em
casos particulares. Por exemplo, constrições sobre a distância de ligação e
ângulos, ou restrições sobre a posição.
Vemos o caso de restrição de posição.
35
2
1
)(21);( onn
prn
N
n
pr rrKgrVpr
−=∑=
(18)
Onde pr é referido a uma restrição de posição (position restraints), a soma
é estendida a todos os Npr átomos selecionados, prnK é a constante de força do
oscilador harmônico e onr é a posição de referência. As outras expressões dos
termos para outros casos de forças especiais podem ser vistas na referência van
Gunsteren et al., 1996.
2.3 Tratamento das interações entre átomos não ligados, aproximações.
2.3.1 Exclusão ou modificação de interações
Chamaremos de primeiros vizinhos (posições 1-2, Fig. 2.3) aos átomos i e j
ligados por uma ligação covalente e de segundos vizinhos aos átomos i e k, se k
está ligado a j (posições 1-3, Fig. 2.3).
Figura 2.3. Interações entre primeiros vizinhos (1-2), segundos vizinhos (1-3) e
terceiros vizinhos (1-4)
As interações entre primeiros e segundos vizinhos não serão tomadas em
conta dentro da soma da equação 13, porque estas interações são do tipo
harmônico e não são representados por um potencial de tipo Lenard-Jones. Essas
interações serão levadas em conta na representação dos átomos ligados (2.2.1). As
interações 1-4 entre terceiros vizinhos podem ser excluídas dentro de certos casos,
por exemplo, átomos dentro de um anel aromático. Mas, com maior freqüência,
36
esta interação é tratada reduzindo o diâmetro das esferas de van der Waals dos
átomos envolvidos, para evitar colisões estéricas.
2.3.2 Distância de corte de interações não ligadas
A soma da equação 13 se estende a todos os pares de átomos exceto aqueles
excluídos pelas considerações do parágrafo precedente. O número de interações
aumenta com o tamanho do sistema estudado.
Grande parte do tempo de cálculo se consome em procurar os pares de
átomos e avaliar suas interações. Com o objetivo de limitar o tempo
computacional nós utilizamos uma dupla distância de corte (twin cutoff) além da
qual as interações “não ligadas” (eletrostáticas e de van der Waals) são
substituídas pelo campo de reação. No método ilustrado na Fig. 2.4, a interação
dos átomos j com o átomo i no interior da zona I, limitada pelo raio R1c, é
calculada a partir das posições instantâneas de j para cada passo da dinâmica. Se j
se encontra entre R1c < rij < R2c, suas interações com o átomo i são calculadas a
partir de uma posição fixa promedio durante um número de passos Nc.
Figura 2.4 Método da dupla distância de corte.
Em geral, o método é aplicado a grupos de átomos e não a átomos isolados.
Neste caso o espaço limitado pelo cut-off é igual à união das esferas ao redor de
cada átomo do grupo. No GROMACS estes são chamados “grupos de cargas”, se
tratando de átomos onde a soma das cargas é neutra (ou inteira, por causa dos
íons).
37
2.3.3 Interações eletrostáticas - limites sobre as intera ções eletrostáticas
As interações coulombianas são inversamente proporcionais à distância rij
entre os átomos i e j. Em conseqüência, estas interações são de longo alcance e
não podem ser omitidas para as cargas atômicas parciais da ordem de 0.1 a 0.4 e e
até a distâncias de corte típicas de 8 a 10 Ao. Dois métodos permitem reduzir os
artefatos devidos ao truncamento de interações não ligadas. Primeiramente, não se
consideram as componentes de alta freqüência da interação coulombiana na região
R1c < rij < R2c, como descrito anteriormente. Em segundo lugar, a definição de
“grupos de cargas” (átomos de H podem se unir a átomos de C e formar um
“átomo” CH com uma carga que seria a suma das cargas componentes) dentro do
GROMACS nos permite reduzir certas interações a tipo 1/r3.
2.4 Tratamento das fronteiras
Em toda simulação deve-se levar em conta o tratamento das fronteiras. No
caso de um líquido ou uma solução, os efeitos de fronteira devem ser reduzidos
com a aplicação de condições periódicas de contorno.
2.4.1 Condições periódicas
Para reduzir os efeitos de fronteira de um sistema finito, nós utilizamos as
condições periódicas de contorno. Os átomos de um sistema são introduzidos
dentro de uma caixa cúbica rodeada de imagens idênticas eqüidistantes Rcaixa
como se mostra na Fig. 2.5.
38
Figura 2.5 Condições periódicas em duas dimensões, mostrando a vista superior e
frontal (acima e embaixo respectivamente)
O cálculo das forças sobre o átomo representado pela esfera cheia dentro da
caixa central se efetua a partir das contribuições de outros átomos desta caixa e
das caixas vizinhas, imagens da caixa central, que se encontram no interior da
distância de corte Rc. Quando o átomo abandona a caixa por uma face, ele entra
novamente pela face oposta, transladando a distância Rcaixa, com a mesma
velocidade. A aplicação das condições periódicas de fronteira lembra assim a
ordem dentro de um cristal. Desta forma não há fronteiras no sistema. O artefato
causado por condições indesejadas de um sistema isolado e o efeito de superfície
são substituídos por condições periódicas.
Para evitar que uma molécula possa interagir com uma ou mais de suas
imagens, a menor dimensão da caixa deve exceder em duas vezes a distância de
corte:
ccaixa RR 2> (19)
Quando uma macromolécula é estudada em solução esta restrição não é
suficiente. Em princípio, uma única molécula de solvente não deve interagir com
ambos os lados da macromolécula. Isto significa que o comprimento de um
determinado lado da caixa deve exceder o comprimento da macromolécula na
39
mesma direção mais duas vezes o raio de corte Rc. Uma estratégia comum é fazer
a camada de solvatação o quanto menor para reduzir o custo computacional,
respeitando-se o estabelecido acima.
2.5 Geração da topologia, coordenadas atômicas e adição do solvente
2.5.1 Topologia do Sistema
Para que os programas de simulação reconheçam as moléculas, nós
devemos fornecer informações sobre as ligações entre átomos, constituição de
cada molécula, massas e cargas a utilizar. Este conjunto de dados é conhecido
como a topologia do sistema. No GROMACS o módulo pdb2gmx permite gerar
topologias a partir de uma biblioteca já existente. As topologias assim geradas
reproduzem valores consistentes com os experimentos quando se trata de
proteínas. Este módulo não é aplicável quando o ligante não se encontra na
biblioteca do GROMACS ou de complexos organometálicos (exceto o heme).
O GROMACS possui a topologia da água pré-estabelecida. Como as
moléculas de água são todas idênticas, só é necessária a topologia de uma só
molécula.
2.5.2 Colocando o soluto numa caixa de água
Para o cálculo em solução o soluto (porfirina, HSA e HSA-porfirinas) deve
ser inserido numa caixa de água e íons Na+ e CL- para tentar simular o meio
fisiológico. Este serão reproduzido periodicamente dentro das três dimensões, tal
como é mostrado na figura abaixo.
40
Figura 2.7 A molécula Heme numa caixa de água (Gráfico realizado com o programa
VMD)
As dimensões da caixa Rcaixa devem ser escolhidas em função das dimensões
dos solutos para evitar os artefatos no cálculo. Para construir esta caixa de
simulação o soluto deve ser localizado no centro de um cubo constituído de uma
concatenação de n3 moléculas de solvente.
2.6 Mecânica e Dinâmica Molecular
2.6.1 Minimização de energia
A mecânica molecular nos permite minimizar a energia calculada a partir da
equação (7) com o objetivo de obter as configurações do sistema no estado
fundamental e de reduzir as forças iniciais muito grandes que poderiam produzir
trajetórias sem sentido físico.
Mas atingir o mínimo absoluto é impraticável pelas numerosas
conformações que uma proteína pode apresentar. O método steepest-descent
permite encontrar o mínimo local mais próximo da superfície de energia potencial
(Fig. 2.8), já o método dos Gradientes Conjugados encontra o mínimo de energia
41
de maneira mais rápida, aproximando-se mais ao mínimo absoluto. A seguir
mostraremos os dois métodos:
Figura 2.8 Superfície de energia potencial: Dependendo da configuração inicial da
proteína ela percorre diferentes caminhos até o mínimo de energia mais próximo ao
absoluto.
O primeiro método utilizado nos nossos cálculos é o método “steepest-
descent” (Courant, 1943). Os n+1 passos de minimização são feitos com base no
cálculo das forcas f(tn) a partir da derivada da equação (7) para a configuração
r(tn) dada, e do cálculo da configuração seguinte r(tn+1) com um passo ∆x.
)()()( 1 nnon txfNtrtr ∆+=+ (19)
Nn é um fator de normalização. Ao início do cálculo um valor inicial de ∆x é
dado. Nos passos da simulação, se V(r) decresce então ∆x deve aumentar, se V(r)
aumenta, ∆x diminui. Assim, este método permite descer rapidamente para perto
de um mínimo local, mas isso não assegura a convergência.
No caso do método dos Gradientes Conjugados (Fletcher et al., 1964), a
força (o gradiente) f(tn+1) calculada em cada iteração é a conjugada da precedente
para determinar o vetor unitário p(tn+1) da direção descendente sobre a
hipersuperficie energética.
)()()( 11 nnnn tptftp β+= ++ (20)
42
><
43
A partir da diferença das séries de Taylor das velocidades vi(tn-∆t/2) a t=tn e
vi(tn+∆t/2) a t=tn nós obtemos:
ttfmttvttv niinini ∆+∆−=∆+− )()2/()2/( 1 (23)
na qual desprezamos os termos de 3a ordem e ordens superiores. Da mesma
forma, fazendo as diferenças entre as séries de Taylor das posições em ri(tn) a
t=tn+∆t/2 e ri(tn+ ∆t) a t=tn+∆t/2 dando o seguinte:
tttvtrttr ninini ∆∆++=∆+ )2/()()( (24)
Estas duas equações permitem a integração no tempo conforme mostrado no
esquema da figura 2.9.
Figura 2.9 Integração das equações de movimento no algoritmo de leap-frog
Para deduzir o algoritmo de Verlet, devem-se eliminar as velocidades nas
equações 23 e 24 e substituir tn por tn-∆t na equação 24, obtendo-se 21 ))(()()(2)( ttfmttrtrttr niinnini ∆+∆−−=∆+
− (25)
A particularidade do algoritmo é que a velocidade dos átomos não aparece
explicitamente na equação, e assim um banho térmico por acoplamento de
velocidades não é possível.
O tempo de cálculo necessário é proporcional ao passo de integração ∆t. O
passo de tempo deve ser menor que o menor período de vibração do sistema para
poder desta forma representar adequadamente o movimento do sistema. Em geral
são as vibrações X-H que limitam ∆t a 10-15s= 1fs (as vibrações nos átomos de
hidrogênio se da em intervalos de femtosegundo).
44
2.7 Controle da temperatura
Há muitos métodos para o controle da temperatura nas simulações de DM.
Um método simples que nós utilizamos no nosso sistema é o Método de
Acoplamento Fraco (“weak coupling method”) (Berendsen, 1991) onde a equação
de movimento dos átomos é modificada a fim de obter uma relação de primeira
ordem da temperatura T perto da temperatura de referência To .
)]([)( 1 tTT
dt
tdToT −=
−τ (26)
A temperatura de um ensemble de Ndf graus de liberdade é definida em
termos da energia cinética desses graus de liberdade. O controle da temperatura
pode se realizar por uma modificação das velocidades dos átomos por um fator de
correção λ(t)
21
]]1)(
[1[)( −∆+=tT
Ttt o
Tτλ (27)
A velocidade de relaxação da temperatura é controlada pelos tempos de
relaxação da temperatura Tτ Este parâmetro é ajustado em função do sistema,
Tτ deve ser suficientemente pequeno (acoplamento forte) para manter a
temperatura média em To, mas suficientemente grande (acoplamento fraco) para
evitar perturbar o sistema.
Diferentes partes de um sistema molecular podem apresentar diferentes
tempos de aquecimento. Por conseguinte, é preferível acoplar as diferentes partes
de um sistema separadamente aos banhos térmicos. Acoplando cada um dos três
subsistemas proteína, ligante e solvente a três banhos térmicos com a mesma
temperatura de referência To (310 K em nosso caso), garante-se uma distribuição
de velocidades tal que nenhum dos subsistemas estará mais quente ou mais frio
em relação à temperatura média global.
2.8 Controle da Pressão
O controle da pressão é realizado por um método de acoplamento fraco
(Berendsen, 1984) como o controle da temperatura, mas neste caso a pressão faz o
papel da temperatura e as posições atômicas das velocidades. As equações de
45
movimento são modificadas para obter a pressão de relaxação P, numa
aproximação de primeira ordem perto do valor de referência Po.
)]([)( 1 tPP
dt
TdPoP −=
−τ (28)
A pressão pode ser definida usando o teorema do virial,
)(
)()(3
2)(tV
tWtEtP kin
−= (29)
Onde W(t) é o virial e V(t) o volume da caixa de simulação e Ekin(t) a energia
cinética do sistema. O virial molecular é definido por:
∑<
−=NN
tFtRtWβα
αβαβ )()(21)( (30)
Com αβR sendo a distância entre os centros de massa das moléculas α e β
no instante t e αβF a força sobre o centro de massa de α sobre β. Como a pressão
à temperatura constante está relacionada ao volume pela compressibilidade
térmica Tκ , o acoplamento é efetuado por um ajuste das coordenadas atômicas e o
tamanho da caixa de simulação por um fator de correção µ. Neste caso o ajuste
isotrópico é obtido por
31
)]]([1[)( tPPt
t oP
T −∆−=τ
κµ (31)
O valor de Tκ para a água, utilizado é 44,6 x 10-6 bar-1[92]. Como o tempo
de relaxação da pressão Pτ é um parâmetro adaptável, não é necessário conhecer
o valor de Tκ do sistema com exatidão. Pτ foi escolhido considerando o valor
para o água (que é o sistema com maior mobilidade).
Como a definição da pressão depende da energia cinética, o acoplamento da
pressão não deverá ser mais forte que o da temperatura.
Pτ ≥ Tτ (58)
Para nosso cálculo, nós utilizamos um valor de 1.0 ps e uma pressão de
referência de 1 atm.
46
2.9 Função de distribuição radial
Para a correta descrição da posição média das partículas em solução, usamos
a função de distribuição radial g(r) (Funtion radial distribution -FDR). Calculamos
unicamente a função normalizada por pares cortada pela função g(r), a qual nos dá
uma medida de como a matéria está se distribuindo ao redor do átomo ou grupos
de átomos de interesse.
))((34
)()()(
33 rdrr
rNdrrNrg
j
ij−+
−+=πρ
(32)
O cálculo de )(rgij envolve a densidade dos átomosjρ e o número médio
N(r) de átomos j dentro de uma esfera de raio r ao redor do átomo i (Fig. 2.10) e
leva em conta as correlações na distribuição das moléculas provenientes das
forças que elas exercem umas sobre as outras.
Quando g(r) =1 não existe correlação entre as moléculas e não se exerce
influência uma sobre outra. A Energia Livre de Helmholtz pode ser escrita na
forma de um potencial de Campo Médio (PCM), definido como W(r)= - kT ln g(r)
e é usado para determinar a hidropaticidade. Se W(r) < 0 (g(r) > 1) o potencial é
atrativo (comportamento hidrofílico), e é repulsivo no caso contrario (g(r) < 1,
comportamento hidrofóbico) (Manfred, 1996)
O número de átomos contido numa camada é obtido por integração da
função 4πr2g(r) na largura da camada, adicionalmente a amplitude g(r) à distância
r, é necessário analisar os tipos de interação entre átomos e moléculas. Em grupos
polares, por exemplo, uma ligação de hidrogênio acontecendo no limite de r =
0.35 nm conectando doador e aceitador com um ângulo de tolerância hidrogênio-
doador-aceitador de 30o.
A avaliação da FDR e os enlaces de hidrogênio mostram a possível
localização das camadas de água ao redor de cada átomo presente na molécula,
permitindo-nos analisar o padrão hidrofóbico em cada forma pontual e total.
47
Figura 2.10 Função g(r) mostrando a distribuição da matéria em torno do átomo central
(azul).
2.10 Modelo para a água
A água é importante em todos os processos da vida conhecida na Terra. Nós
somos 80% água e, por conseguinte muito do êxito que se possa conseguir numa
simulação de DM vai depender do modelo de água utilizado. Além disso, a água
tem propriedades especificas que não são facilmente reproduzidas na simulação
(efeito túnel nos átomos de hidrogênio a T ambiente), e dependendo dos
fenômenos a estudar, eles poderiam ser desprezados. Uma dessas propriedades
específicas é a dependência da densidade com a temperatura, a qual alcança um
máximo perto de ~ 4 oC.
Os níveis de detalhe no modelo da água passam desde os modelos de
solvatação contínua até os modelos de solvente explícito (Fig. 2.11).
Figura 2.11 Modelos de solvente implícito (esquerda), modelos de solvente explicito
(direita) (Gráfico obtido e modificado de http://agave.wustl.edu/)
Nível de detalhe
48
2.10.1 O modelo SPC (Single Point Charge)
Para determinar as interações entre as moléculas de água existem vários
modelos, uns dos mais sucedidos por sua simplicidade e eficiência computacional,
usado em nosso caso, é o modelo SPC (Berendsen et al., 1981) o qual contem o
efeito das cargas. No modelo SPC a molécula de água tem três centros de carga:
as cargas positivas dos átomos de hidrogênio e a carga negativa do oxigênio,
sendo um modelo de 3 sítios.
O fato de assumir cargas pontuais é uma aproximação que não reproduz de
maneira correta o momento dipolar da molécula. Para tentar reproduzir o
resultado experimental, este modelo considera o ângulo H—O—H 109.47o, como
se mostra na Fig. 2.12.
Figura 2.12 Molécula de água no modelo SPC. A carga parcial negativa do átomo de
oxigênio tem duas vezes a carga parcial positiva dos átomos de hidrogênio.
Resultado da concentração da carga e do redimensionamento do ângulo
H—O—H , o momento dipolar no modelo tem um valor próximo ao valor
experimental. A mobilidade da água no modelo é maior que a mobilidade da água
na natureza, pois não contém o par de elétrons isolados (elétrons do oxigênio). No
entanto, este efeito decresce rapidamente com a temperatura.
Além do modelo SPC, existem muitos que consideram efeitos de
polarização, mediante átomos “fantasmas”, para tentar reproduzir os efeitos dos
orbitais eletrônicos do oxigênio, etc.
O momento dipolar efetivo de uma molécula de água em fase liquida é
aproximadamente 2,6 D. Os modelos reproduzem os seguintes valores: SPC, 2.27
D e TIP4P, 2.18 D (modelo de quarto sítio, localiza uma carga negativa sobre um
49
átomo fantasma perto do oxigênio ao longo do bissetor do ângulo HOH)
(http://en.wikipedia.org/wiki/Water_model).
Propriedades estruturais e termodinâmicas tais como a densidade, função de
distribuição radial, entalpia de vaporização, capacidade calorífica, coeficiente de
difusão e constante dielétrica são usadas para ajustar os parâmetros destes
modelos.
O modelo SPC é um modelo rígido, por conseguinte algumas propriedades
da água não podem ser calculadas. Por exemplo, os aspectos vibracionais só
poderão ser calculados se forem inseridos termos de flexibilidade na função de
energia potencial.
Finalmente um fator importante no momento de escolher o modelo é o custo
computacional. Deve-se tomar em conta que no processo da solvatação do
sistema, uma quantidade apreciável de água é inserida no mesmo. Um modelo
extremamente fino poderia tornar muito custosa a simulação.
2.11 Tratamento eletrostático da proteína
O tratamento eletrostático nos dá informação a respeito dos aspectos
funcionais das diferentes regiões da proteína, sobre a posição dos sítios de
interesses, sobre o componente eletrostático na energia de ligação do ligante, etc.
A grande maioria dos aminoácidos que constituem uma proteína interage
através de forças de longo alcance, essencialmente de natureza eletrostática. Os
campos elétricos gerados por proteínas estendem-se significativamente a uma
distância de 10-15 Å, dependendo de condições de temperatura, solvente e carga
elétrica da proteína (em maiores distâncias, as flutuações térmicas aleatórias do
solvente predominam sobre grande parte do efeito que o campo elétrico da
proteína pode exercer).
Desta forma, para entender as forças de atração-repulsão entre biomoléculas
é necessário compreender as leis da eletrostática que regem as interações
intermoleculares. Os fundamentos da física eletrostática são bem estabelecidos e
podem ser expressos concisamente por equações relativamente simples. Contudo,
a aparente simplicidade destas equações esconde algumas dificuldades conceituais
e numéricas da aplicação das mesmas ao estudo de sistemas complexos. Este é um
50
problema relevante devido à vasta quantidade de estruturas tridimensionais de
biomoléculas disponíveis recentemente.
2.11.1 Aplicação da Equação de Poisson-Boltzmann para o cá lculo de energias eletrostáticas em proteínas
Um sistema biomolecular sempre está rodeado de um meio o qual pode
estar composto de íons, estes íons interagem eletrostaticamente com a
biomolécula a qual poderia também ter carga elétrica.
Uma das aproximações que tem descrito com sucesso as interações
eletrostáticas em sistemas biomoleculares é a equação de Poisson-Boltzmann
(http://bessie.che.uc.edu/tlb/rctb6/rctb6.html).
)]]())(
exp[()]())(
exp[()([4))()(.( rvTk
rqqnrv
Tk
rqqnrrr
BB
rr
rr
rrrrr −+−−−+−=∇∇ −+φφρπφε
(33)
Onde o primeiro termo a direita da igualdade representa a contribuição pelas
cargas fixas na biomolécula e os outros termos representam a contribuição dos
íons móveis positivos e negativos respectivamente.
ε(r) : A constante dielétrica
Φ(r) : Potencial eletrostático
ρ(r) : Densidade de cargas na biomolécula
q: Carga de cada íon positivo ou negativo
n± : Densidade iônica
kB : Constante de Boltzmann
v(r): é 0 ou ∞ em regiões accessíveis ou inacessíveis para o íon.
Na aproximação de campo fraco, considerando-se um conjunto de cargas
em um meio de constante dielétrica uniforme e de baixa força iônica, a equação
33, pode ser escrita na forma a seguir:
51
)(4)()]()([. 2 rrkrrrrrr πρφεφε −=∇∇ (34)
Figura 2.13 Modelo para cálculo da superfície eletrostática na equação de Poisson-
Boltzmann (Gráfico obtido de http://agave.wustl.edu/)
Onde k é a constante de Debye-Hückel ou blindagem iônica do meio. A forma
da interface dielétrica e a exclusão de íons contidos no interior da proteína são
introduzidos no cálculo através da dependência das constantes ε e k do vetor r.
Em condições onde k = 0, íons estão ausentes e a Equação (34) pode ser reduzida
à equação de Poisson. Devido à diferença de polarizabilidade da água e do interior
da proteína, duas constantes dielétricas ε e εp são necessárias para representar
realisticamente o sistema (ver Fig. 2.14).
Figura 2.14 Constantes dielétricas que caracterizam os diferentes meios nos quais se
aplica a equação de Poisson-Boltzmann (Gráfico obtido e modificado de
http://agave.wustl.edu/).
52
2.12 Superfícies de interação molecular
Superfície acessível ao solvente
A superfície acessível ao solvente (SAS) de uma biomolécula é uma forma
de quantificar o efeito hidrofóbico, este conceito tem sua origem no trabalho de
Lee e Richards (Lee et al., 1971) no ano 1971. A área acessível ao solvente
descreve a área na qual o contato entre a proteína e o solvente ocorre.
A SAS é definida como o lugar geométrico dos centros de uma esfera de
prova (representando a molécula do solvente) como se esta rodasse sobre uma
superfície de van der Waals da proteína (Fig. 2.15).
Superfície molecular (ou superfície excluída do sol vente)
A superfície molecular (SM) é traçada pela frente interna da esfera de prova
(Fig. 2.15). Está composta de:
• Superfície de contato: a parte da superfície de van der Waals que
pode ser tocada pela esfera de prova.
• Superfície reentrante: formada pela frente interna da esfera de prova
quando esta está em contato com mais de uma molécula.
Figura 2.15 Esquema gráfico que mostra as definições de SAS e SM.
53
2.13
” Docking” Molecular - Algoritmo Genético
Nos estudos de “docking” fizemos uso do programa AUTODOCK (Morris
et al., 1998), que utiliza o Algoritmo Genético (do inglês, Genetic Algorithm,
GA), para otimizar a interação e descobrir os possíveis sítios de ligação entre as
porfirinas e o HSA. No programa AUTODOCK também foi implementado um
algoritmo genético modificado que introduz passos de busca conformacional local
entre cada passo, possibilitando que as mudanças fenotípicas (adaptações
conformacionais da molécula ao ambiente) possam ser adquiridas pelas próximas
gerações. Este híbrido do Algoritmo Genético é chamado de Algoritmo Genético
Lamarchiano (do inglês, Lamarchian Genetic Algorithm, LGA). O método de
busca local utilizado é baseado no algoritmo de otimização de Solis e Wets (SW)
(Solis e Wets, 1981).
Na terminologia desses algoritmos, uma solução candidata é chamada de
indivíduo e ao conjunto de indivíduos simultaneamente avaliados é dado o nome
de população. Inicia-se com uma população de conformações, orientações e
translações randômicas do ligante. Então o programa executa o número de
avaliações energéticas e gerações (iterações) requisitadas pelo usuário e seleciona
os indivíduos sobreviventes (os melhores adaptados). Uma taxa de mutação e
cruzamento é especificada e introduzida no problema a fim de possibilitar uma
melhor adaptação das gerações futuras (Sousa, 2005). Mais detalhes sobre o
Algoritmo Genético implementado podem ser encontrados no próprio manual do
AUTODOCK.
2.14 Correlação em dinâmica de biomoléculas
Movimentos correlacionados em sistemas moleculares são essenciais para a
função biomolecular, exemplos são os efeitos alostéricos e efeitos cooperativos.
Muitas vezes a função energética da proteína é dominada por contribuições
entrópicas que estão diretamente relacionadas a movimentos atômicos
correlacionados (Lange et al., 2006). A correta compreensão destes movimentos
54
correlacionados é importante para o entendimento da função da proteína e poderia
melhorar a interpretação dos experimentos de NMR e espalhamento de raios X.
Correlação é uma forma de medir quanto associadas ou relacionadas estão
duas variáveis. O propósito de fazer correlações é fazer predição acerca de uma
variável baseada no conhecimento de outra variável
Coeficientes de Correlação Generalizada
Os coeficientes de correlação generalizada estão baseados na formulação da
Mutua Informação de Kraskov, e residem na definição fundamental de
independência de variáveis aleatórias. A descrição que daremos ésta baseada no
trabalho desenvolvido por ele no ano 2004 (Kraskov et al., 2004). Segundo este
trabalho duas variáveis são independentes se e somente se a distribuição do
conjunto é um produto de suas distribuições marginais,
)()(),( YPXPYXP = (35)
a idéia é expressar a correlação como a diferença entre P(X,Y) e P(X)P(Y) (ver
Fig 2.16).
Figura 2.16 Correlação de variáveis aleatórias são definidas como a desviação de sua
distribuição de probabilidade (cinza) da distribuição de probabilidades das variáveis
aleatórias independentes (preto). (Gráfico obtido de Lange et al., 2006)
Isto equivale a definir a correlação C como a entropia de Shannon
(correlação total) (Lange et al., 2006).
],[][][],[ YXHYHXHYXC −+= (36)
55
onde H denota a entropia das variáveis aleatórias. Esta relação é equivalente a:
][][],[ YHXHYXH +≤ (37)
a qual é uma igualdade se e somente se as variáveis são independentes. Pode-se
observar que quando não existe correlação entre as variáveis X e Y, C[X,Y]=0,
caso contrário tem um valor positivo.
A matrix de correlacào esta formado pelos coeficientes de corrrelacão e nos
forneceria informacão sobre como estan relacionadas as diferentes regiones da
proteina.
2.15 Aproximação Quântica - Teoria do Funcional de Densi dade ( DFT)
Porque usamos o método DFT (do inglês Density Funtional Theory) em
nossos cálculos com as Porfirinas?
A aproximação de Hartree - Fock (HF) descreve a função de onda de N
elétrons por um determinante simples construído de orbitais ocupados, os quais
são variacionalmente determinados minimizando-se a energia. Este cálculo não
incorpora a correlação eletrônica e não é adequado para descrever compostos com
metais de transição (Margulis et al., 2002).
A precisão do método DFT comparado com HF é muito melhor (Ghosh et
al., 2003; Himo et al., 2003, Siegbanhn et al., 2000). Neste tipo de cálculo, a
densidade eletrônica tem um papel central porque a energia e as propriedades
moleculares são derivadas da densidade. A expressão para a energia incorpora a
correlação eletrônica através do termo de correlação de intercâmbio. A aplicação
do DFT precisa de um funcional de intercâmbio adequado e de uma base
adequada. Na literatura há muitos funcionais desde a Aproximacão de Densidade
Local (local density approximation, LDA), passando por funcionais de gradiente
corrigido (generalized gradient approximation, GGA) e funcionais híbridos (com
mistura de HF e termos de intercâmbio) para formas mais avançadas.
Alguns destes funcionais são derivados de primeiros princípios, outros
envolvem uma calibração semi-empírica ajustada a dados teóricos ou
experimentais. Na prática, funcionais de gradiente corrigidos tais como BP86,
BLYP e BPW91 são aplicados adequadamente a espécies enzimáticas. Sem
dúvida, os funcionais híbridos como B3LYP ou B3PW91 (Ghosh et al., 2003;
56
Himo et al., 2003) estão entre os mais usados. Em particular, B3LYP tem tido
êxito ao reproduzir valores experimentais de entalpias de formação com desvio
médio absoluto de 3 kcal.mol-1 (Curtiss et al., 2000). B3LYP cálcula muito bem
um número de outras propriedades (Siegbanhn et al., 2000) ainda que não
reproduza bem as barreiras de reação. B3LYP é geralmente o método preferido
para um cálculo DFT em sistemas biológicos e na investigação de precursores e
derivados do heme (Ghosh et al., 2003; Himo et al., 2003).
2.15.1 Introdução à DFT
A teoria do Funcional de Densidade está baseada na noção de que a
energia total, E, de um sistema eletrônico é determinado pela distribuicão da
densidade eletrônica.
Os tempos de computação nos diferentes métodos baseados em HF escalam
como n4 a n6 onde n é o número de elétrons no sistema estudado. Neste aspecto, o
método DFT é mais bem sucedido porque tem a vantagem de o tempo de
computação escalar com ~ n3.
Os métodos ab initio baseados no formalismo HF dão precisões de 0,2 Å
para as distâncias de ligação, mas estes métodos têm sido menos bem sucedidos
nos cálculos que envolvem metais de transição (Lüthi et al., 1982). Os parâmetros
geométricos calculados por métodos DFT têm mostrado, há mais de duas décadas,
uma razoável aproximação com os experimentos através das distâncias de ligação
(Dunlap et al., 1986).
A Teoria do Funcional de Densidade é uma aproximação de muito êxito
para a descrição de estados fundamentais de metais, semicondutores, moléculas,
etc.
A idéia principal é descrever um sistema de férmions interagentes via
densidade e não via função de onda de muitos corpos. Para N elétrons em um
sólido, que obedecem ao princípio de Pauli, isto significa que a variável básica
dos sistemas depende das coordenadas espaciais x, y, e z em vez de 3N graus de
liberdade (aproximação de Thomas-Fermi). Desta forma, a energia total passa a
ser escrita como um funcional E[ρ(r)].
A DFT considera o termo de correlação eletrônica no potencial. Os elétrons
se movem tentando evitar a interação eletrônica e assim existem zonas dentro das
57
quais os elétrons não podem penetrar. Isto é chamado o buraco da correlação de
intercâmbio e vai dar o termo de intercâmbio (Energia de Intercâmbio) (Ziegler et
al., 1991; Gritsenko et al., 1997).
2.15.2 Descrição da teoria
Os métodos tradicionais estão baseados nas funções de onda de muitos
elétrons, uma das ventagems do metodo DFT é substituir a função de onda
eletrônica de muitos corpos pela densidade eletrônica. A implementação mais
comum da teoria é através do método de Kohn-Sham (Kohn et al., 1965), que
reduz o sistema a um conjunto de elétrons interagentes num potencial efetivo. O
potencial efetivo inclui o potencial externo e a interação de Coulomb. Modelar as
últimas duas interações é o problema, sendo a aproximação