Teobaldo Ricardo Cuya Guizado ESTUDOS COMPUTACIONAIS DA INTERAÇÃO …livros01.livrosgratis.com.br/cp063469.pdf · 1.1.2 A albumina Serica Humana 22 1.2 Objetivos 26 1.3 Estrutura

Teobaldo Ricardo Cuya Guizado

ESTUDOS COMPUTACIONAIS DA INTERAÇÃO DE

PORFIRINAS E SEUS COMPLEXOS DE FERRO COM

ALBUMINA SÉRICA HUMANA

Dissertação de Mestrado

Dissertação apresentada como requisito parcial para obtenção do grau de Mestre pelo Programa de Pós-Graduação em Física do Departamento de Física da PUC-Rio.

Orientadora: Sônia Renaux Wanderley Louro Co-Orientador: Pedro Geraldo Pascutti

Rio de Janeiro, março de 2008

Livros Grátis

http://www.livrosgratis.com.br

Milhares de livros grátis para download.


Estudos Computacionais da Interação de Porfir inas e seus Complexos de Ferro com Albumina Sérica Human a

Dissertação apresentada como requisito parcial para obtenção do grau de Mestre pelo Programa de Pós-Graduação em Física do Departamento de Física do Centro Técnico Científico da PUC-Rio. Aprovada pela Comissão Examinadora abaixo assinada.

Profa. Sônia Renaux Wanderley Louro Orientadora

Departamento de Física – PUC-Rio

Prof. Pedro Geraldo Pascutti Co-Orientador

UFRJ

Profa. Célia Anteneodo Departamento de Física – PUC-Rio

Prof. Iouri Borissevitch USP

Prof. André Silva Pimentel Departamento de Química – PUC-Rio

José Eugenio Leal Coordenador Setorial do Centro

Técnico Científico – PUC-Rio

Rio de Janeiro, 28 de março de 2008

Todos os direitos reservados. É proibida a reprodução total ou parcial do trabalho

sem autorização da universidade, do autor e da orientadora.


Graduou-se em Física na Universidad Nacional Mayor de San Marcos

(Lima-Perú) em 1995 com ênfase em Física,

Iniciou o mestrado em Física na PUC em 2006 na área de Biofísica Molecular.

Ficha Catalográfica

CDD: 530

Cuya Guizado, Teobaldo Ricardo Estudos computacionais da interação de porfirinas e seus complexos de ferro com albumina sérica humana / Teobaldo Ricardo Cuya Guizado ; orientadora: Sônia Renaux Wanderley Louro ; co-orientador: Pedro Geraldo Pascutti. – 2008. 138 f. : il. ; 30 cm Dissertação (Mestrado em Física)–Pontifícia Universidade Católica do Rio de Janeiro, Rio de Janeiro, 2008. Inclui bibliografia 1. Física – Teses. 2. Biofísica. 3. Dinâmica molecular. 4. Porfirinas. 5. Albumina. I. Louro, Sônia Renaux Wanderley. II. Pascutti, Pedro Geraldo. III. Pontifícia Universidade Católica do Rio de Janeiro. Departamento de Física. IV. Título.

A mi querido hermano, José Antonio Cuya Guizado

Agradecimentos

A minha orientadora, professora Sônia Renaux Wanderley Louro, por ter me

aceitado e acreditado em minha pessoa. Sua ajuda durante o desenvolvimento do

projeto foi importante, pela sua amizade.

Ao meu co-orientador Pedro Pascutti do Laboratório de Modelagem e Dinâmica

Molecular do Instituto Carlos Chagas Filho da Universidade Federal do Rio de

Janeiro pelo seu ensino, ajuda e amizade.

A todo o pessoal administrativo do Departamento de Física da PUC-Rio,

especialmente a Giza e Julinho pela ajuda sempre oportuna.

A meus colegas do Departamento de Física da Universidade da PUC-Rio, e do

Laboratório de Modelagem e Dinâmica Molecular do Instituto Carlos Chagas

Filho da UFRJ. Especiais menções merecem Arlan Gonçalves, Samuel Pita,

Diego Enry e Pedro Loureiro, pela sua amizade.

À instituição CNPq pelo apoio financeiro.

Resumo

Cuya Guizado, Teobaldo Ricardo; Louro, Sônia Renaux Wanderley; Pascutti, Pedro Geraldo. Estudos Computacionais da Interação de Porfirinas e seus Complexos de Ferro com Albumina Sérica Humana. Rio de Janeiro, 2008. 138p. Dissertação de Mestrado - Departamento de Física, Pontifícia Universidade Católica do Rio de Janeiro.

A aparição do HIV na década de 80 e de outros vírus presentes no sangue

dos doadores, assim como a expansão de doenças como a hepatite C, tem

estimulado as pesquisas para desenvolver substitutos do sangue. Pesquisas

recentes têm sido realizadas em derivados artificiais da albumina de soro humano

(human serum albumin – HSA) associados com heme, representando uma linha

promissora nesse sentido. No presente trabalho, fazemos um estudo

computacional da ligação do heme e de seu precursor, a protoporfirina IX, com a

HSA, com o objetivo de conhecer os aminoácidos que contribuem à estabilidade

da ligação, a natureza do sítio de ligação, a formação de possíveis sítios

secundários de ligação e a influência das porfirinas na estrutura global da proteína.

Para conseguir este objetivo utilizamos técnicas de cálculo quântico usando a

Teoria do Funcional de Densidade, Docking Molecular e Dinâmica Molecular.

Finalmente fazemos um estudo da correlação existente entre as diferentes regiões

da HSA e de como este padrão muda na presença das porfirinas. Para este

propósito usamos os coeficientes de correlação generalizada baseados na

formulação de Kraskov. Com base nestas informações, discutimos a contribuição

que poderiam fornecer nossos cálculos para a reengenharia do HSA, no sentido de

fornecer-lhe características de hemoproteínas.

Palavras-chaves Biofísica, Heme, Protoporfirina IX, Dinâmica Molecular, Teoria do

Funcional de Densidade, Hidrofobicidade, Solvatação, RESP, Docking Molecular,

Correlação Generalizada.

Abstract

Cuya Guizado, Teobaldo Ricardo; Louro, Sônia Renaux Wanderley; Pascutti, Pedro Geraldo. Computational Studies of the Interaction of Porphyrins and their Iron Complexes with Human Serum Albumin. Rio de Janeiro, 2008. 138p. Dissertação de Mestrado - Departamento de Física, Pontifícia Universidade Católica do Rio de Janeiro.

The uprising of HIV and other viruses in the beginning of the 80s, as well as

the expansion of other diseases like hepatitis C has stimulated research in order to

develop blood substitutes. Research based on modified Human Serum Albumin

associated with heme has shown a promissory line in this direction. In the present

work we make a computational study about the heme and its precursor, the

Protoporphyrin IX complexed with HSA, in order to know the contribution of the

main amino acids to the stability of the binding, the character of the binding site,

secondary binding sites formation, and the influence of the porphyrins in the

global protein structure. To find this objective we use quantum calculations based

on Functional Density Theory, Molecular Docking and Molecular Dynamics.

Finally, a correlation study between different regions of HSA and the pattern

modifications caused by the porphyrins were performed, using the generalized

correlation coefficients based on the Kraskov formulation. We also discuss the

contribution that our calculations could give to the reengineering of HSA, to

provide them with hemeprotein characteristics.

Keywords

Biophysics, Heme, Protoporphyrin IX, Molecular Dynamics, Functional

Density Theory, Hydrophobicity, Solvation, RESP, Molecular Docking,

Generalyzed Correlation.

Sumário

1. Introdução 16

1.1 Posicionamento e abordagem do problema 16 1.1.1 As Porfirinas 18 1.1.2 A albumina Serica Humana 22

1.2 Objetivos 26

1.3 Estrutura dos Capítulos 26

2. Técnicas computacionais – Aproximação clássica e aproximação quântica 28

2.1 Aproximação Clássica - Função de interação e equações de movimento 29

2.2 O Hamiltoniano e a Função de Interação: Campo de Forças 31 2.2.1 Interações entre átomos (ou grupos) ligados 31 2.2.2 Interações não ligadas 33 2.2.3 Potenciais especiais devido a restrições 34

2.3 Tratamento das interações entre átomos não ligados, aproximações. 35

2.3.1 Exclusão ou modificação de interações 35 2.3.2 Distância de corte de interações não ligadas 36 2.3.3 Interações eletrostáticas - limites sobre as interações

eletrostáticas 37

2.4 Tratamento das fronteiras 37 2.4.1 Condições periódicas 37

2.5 Geração da topologia, coordenadas atômicas e adição do solvente 39 2.5.1 Topologia do Sistema 39 2.5.2 Colocando o soluto numa caixa de água 39

2.6 Mecânica e Dinâmica Molecular 40 2.6.1 Minimização de energia 40 2.6.2 Dinâmica Molecular 42

2.7 Controle da temperatura 44

2.8 Controle da Pressão 44

2.9 Função de distribuição radial 46

2.10 Modelo para a água 47

2.10.1 O modelo SPC (Single Point Charge) 48

2.11 Tratamento eletrostático da proteína 49 2.11.1 Aplicação da Equação de Poisson-Boltzmann para o cálculo de energias eletrostáticas em proteínas 50

2.12 Superfícies de interação molecular 52

2.13 ”Docking” Molecular - Algoritmo Genético 53

2.14 Correlação em dinâmica de biomoléculas 53

2.15 Aproximação Quântica - Teoria do Funcional de Densidade ( DFT) 55 2.15.1 Introdução à DFT 56 2.15.2 Descrição da teoria 57 2.15.3 Descrição matemática 57 2.15.4 O Método RESP (Restrained Electrostatic Potential) 58

3. Resultados e Discussão 60

3.1 Cálculo das cargas das porfirinas 60 3.1.1 Cálculo quântico - programa Gamess 60 3.1.2 Base escolhida na entrada do Gamess para o cálculo do ESP 61 3.1.3 Otimizando a geometria das porfirinas 62 3.1.4 Obtenção das cargas a partir do ESP 62

3.2 Geração das topologias para as porfirinas 65

3.3 Solvatação e estabilidade das porfirinas na água 65 3.3.1 Heme e PPIX 67 3.3.2 Grupo carboxil 68 3.3.3 Oxigênio do carboxil 68 3.3.4 O Fe2+ do heme 69

3.4 DM dos sistemas HSA, HSA-PPIX e HSA-HEME, Propriedades globais 70 3.4.1 Desvio médio quadrático 71 3.4.2 Desvio médio quadrático 3D 76 3.4.3 Raio de Giro 79 3.4.4 Evolução da energia 81 3.4.5 Flexibilidade dos resíduos na proteína 83

3.5 Superfície de contato intermolecular entre HSA e as porfirinas 85

3.6 Distância entre os aminoácidos do HSA que mais interagem com as porfirinas 88 3.6.1 Distância entre os aminoácidos do HSA que mais interagem com PPIX 88

3.6.2 Distância entre os amino ácidos do HSA que mais interagem com o HEME 91

3.7 Pontes de hidrogênio entre o HSA e as porfirinas 94

3.8 Análise da superfície eletrostática dos sistemas HSA, HSA-PPIX e HSA-heme 97

3.9 Prováveis segundos sitio de ligação das porfirinas no HSA 101

3.10 Existem regiões do HSA correlacionadas ao subdomínio IB? 102

4. Conclusão e Perspectivas 110

4.1 Conclusões 110

4.2 Perspectivas 111

Referencias Bibliograficas 112

Apêndice A : Inputs do Gammes 118

Apêndice B : Topologia da Protoporfirina ix 129

Apendice C: Protocolo da Dinamica Molecular 138

Lista de figuras

Figura 1.1 Estrutura básica da porfirina 19

Figura 1.2 Bandas de Soret e bandas Q no espectro de absorção da porfirina. 19

Figura 1.3 Heme (esquerda), PPIX (direita) 20

Figura 1.4 Esquema da estrutura secundaria de HSA com subdomínios codificados por cores 22

Figura 1.5 Esquema mostrando os sítios de vários ligantes da albumina sérica humana 24

Figura 2.1 Potencial de Lennard-Jones 34

Figura 2.3 Interações entre primeiros vizinhos (1-2), segundos vizinhos (1-3) e terceiros vizinhos (1-4) 35

Figura 2.4 Método da dupla distância de corte. 36

Figura 2.5 Condições periódicas em duas dimensões 38

Figura 2.7 A molécula Heme numa caixa de água 40

Figura 2.8 Superfície de energia potencial 41

Figura 2.9 Integração das equações de movimento no algoritmo de leap-frog 43

Figura 2.10 Função g(r) mostrando a distribuição da matéria em torno do átomo central 47

Figura 2.11 Modelos de solvente implícito e modelos de solvente explicito 47

Figura 2.12 Molécula de água no modelo SPC 48

Figura 2.13 Modelo para cálculo da superfície eletrostática 51

Figura 2.14 Constantes dielétricas que caracterizam os diferentes meios nos quais se aplica a equação de Poisson-Boltzmann 51

Figura 2.15 Definições de SAS e SM. 52

Figura 2.16 Correlação de variáveis aleatórias 54

Fig 2.17 A obtenção das cargas a partir do ESP para o heme 59

Figura 3.2 PPIX e Heme numa caixa de água 66

Figura 3.3 Gráfico de g(r) para as moléculas de protoporfirina IX e heme 67

Figura 3.4 Gráfico do g(r) para o grupo carboxil 68

Figura 3.5. Gráfico de g(r) para o oxigênio do carboxil das porfirinas 69

Figura 3.6 Gráfico de g(r) para o íon Fe2+ 70

Figura 3.7 Da esquerda para a direita, HSA-HEME, HSA-PPIX e HSA, mostrando a conformação da porfirina cada 2 ns 72

Figura 3.8 De cima para baixo, sobreposição da estrutura inicial e final da HSA, HSA-PPIX e HSA-HEME 73

Figura 3.9 De cima para baixo: Em preto, RMSD da cadeia de HSA, HSA-PPIX e HSA-HEME em relação à cadeia da estrutura inicial 74

Figura 3.10 RMSD da PPIX com relação a PPIX na estrutura inicial 75

Figura 3.11 RMSD do heme no sítio de ligação durante o primeiro nano segundo da simulação 76

Figura 3.12 RMSD 3D do HSA, mostrando as quatro vistas principais 77

Figura 3.13 RMSD 3D do HSA-PPIX, mostrando as quatro vistas principais 78

Figura 3.14 RMSD 3D do HSA-HEME, mostrando as quatro vistas principais 79

Figura 3.15 Raio de giro da HSA 80

Figura 3.16 Raio de giro do complexo HSA-PPIX 80

Figura 3.17 Raio de giro do complexo HSA-HEME 81

Figura 3.18 Energia total do HSA e seus complexos, mostrando que o sistema é estável energeticamente 82

Figura 3.19 Energia total do HSA e seus complexos, mostrando que o sistema já é estável a partir dos 100 ps 82

Figura 3.20 RMSF de HSA e de HSA complexada com PPIX 84

Figura 3.21 RMSF de HSA e de HSA complexada com heme 84

Figura 3.22 RMSF do HSA-heme e do HSA-PPIX 85

Figura 3.23 Área de contacto intermolecular entre HSA e as porfirinas 87

Figura 3.24 Distância do centro de massas dos aminoácidos e do ligante PPIX à cadeia de HSA 89

Figura 3.25 Distância entre o OH da TYR-161 e os nitrogênios NAW e NAE do ligante PPIX 90

Figura 3.26 Distância entre o OH da TYR-161 e os nitrogênios NBA e NAN do ligante PPIX 90

Figura 3.27 Distância dos principais aminoácidos do HSA que interagem com o heme ao CM da cadeia 92

Figura 3.28 No lado proximal, TYR-161 interagindo frontalmente com o Fe2+ do heme; no lado distal TYR-138 interagindo com os nitrogênios do anel 92

Figura 3.29 Distância entre o oxigênio OH-TYR161 e o íon Fe2+ do heme 93

Figura 3.30 Comparação teórica-experimental da microvizinhança molecular obtido por raios X e a microvizinhança molecular obtido em nossos cálculos 93

Figura 3.31 Ligações de hidrogênio da PPIX com HSA e o com o água nas vizinhanças do sítio de ligação 96

Figura 3.32 Número de ligações de hidrogênio do heme com a proteína (preto) e com o solvente presente nas vizinhanças do sítio de ligação 96

Figura 3.33 De cima para baixo: superfície eletrostática do HSA, HSA-PPIX e HSA-heme depois de 20 ns de DM 99

Figura 3.34 De cima para baixo: superfície eletrostática do subdomínio IB do HSA, HSA-PPIX e HSA-heme depois de 20 ns de DM. 100

Figura 3.35 Segundo provável sitio de ligação da PPIX no HSA 101

Figura 3.36 Potencial eletrostático na superfície da proteína na região do segundo provável sitio de ligação da PPIX no HSA 102

Figura 3.37 Padrão de correlação do HSA 103

Figura 3.38 Matriz da diferença entre as matrizes de correlação total e linear do HSA 104

Figura 3.39 Padrão de correlação generalizada do HSA e HSA-HEME 105

Figura 3.40 Padrão de correlação generalizada do HSA e HSA-PPIX 106

Figura 3.41 Padrão de correlação generalizada: HSA e HSA-HEME, nesta figura mostra-se entre as paralelas as regiões diretamente correlacionados com a região compreendida entre os resíduos 100-200 107

Figura 3.42 Região (100-118, vermelho) correlacionada com a região (460-465, amarelo) 108



Abreviaturas

CHELPG Cargas do potencial eletrostático usando um método

baseado em grade (CHarges from ELectrostatic Potential

based on Grid)

RF Campo de reação (Reaction Field)

DM Dinâmica Molecular

DFT Teoria do Funcional de Densidade (Density Funtional

Theory)

ESP Potencial Eletrostático (Electrostatic Potential)

FDR Função de distribuição radial

HF Hartree –Fock

HSA Albumina sérica humana (Human Serun Albumin)

MM Mecânica Molecular

NMR Ressonância Magnética Nuclear (Nuclear magnetic

resonance)

PDT Terapia Fotodinâmica (Photodynamic Therapy)

PPIX Protoporfirina IX (Protoporphyrin IX)

RESP Restrição do potencial eletrostático (Restrained Electrostatic

Potential).

RMSD Desvio da raiz média quadrática (Root mean square

desviation)

RMSF Flutuação da raiz média quadrática (Root mean square

fluctuation)

SAS Superfície acessível ao solvente

SCI Superfície de contato intermolecular

1. Introdução

1.1 Posicionamento e abordagem do problema

As pesquisas sobre a interação entre as macromoléculas biológicas e drogas

envolvem um dos mais importantes tópicos no campo das ciências da vida devido

a que os sítios de ligação provêem informação importante sobre o transporte e o

metabolismo de moléculas no corpo humano.

A albumina sérica humana é a proteína mais abundante no soro sanguíneo.

Sua estrutura obtida por difração de Raios X encontra-se no banco de dados de

proteínas, RCSB Protein Data Bank (PDB). Aparece como molécula do mês de

janeiro de 2003, nesse site, junto com um resumo sobre sua importância, escrito

por David S. Goodsell.

Pensemos o quanto é conveniente sermos capazes de comer. Cada uma das

nossas dez trilhões de células precisam de um constante suprimento de nutrição.

Mas não temos que nos preocupar com isso – nós simplesmente comemos nossa

refeição e nosso corpo faz o resto. O alimento é digerido e os pedaços úteis são

distribuídos às células de todo o corpo, usando o fluxo sanguíneo como sistema de

transporte. A distribuição de moléculas solúveis em água, como açúcares, é fácil.

Elas circulam na corrente sanguínea e são capturadas pelas células ao longo do

caminho. Outros nutrientes importantes, no entanto, não são solúveis em água e

precisam de carreadores especiais para levá-los até as células famintas.

A albumina sérica (estrutura 1e7i do PDB) tem o papel de carregar ácidos

graxos no sangue. Ácidos graxos são essenciais para duas funções principais em

nosso corpo. Eles são os blocos para construção dos lipídios, que formam todas as

membranas ao redor e dentro das células; são também ricas fontes de energia e

podem ser quebrados dentro das células para formar adenosina trifosfato (ATP).

Então, nosso corpo mantém uma reserva de ácidos graxos, armazenados como

gorduras. Quando o corpo precisa de energia ou de materiais para construção das

17

suas estruturas, células de gordura liberam ácidos graxos no sangue. Aí, eles são

capturados pela albumina sérica e distribuídos a partes do corpo distantes.

A albumina humana é uma proteína versátil. Cada molécula dessa proteína

pode carregar sete moléculas de ácidos graxos, que se ligam a fendas profundas na

proteína, enterrando suas caudas ricas em carbono, hidrofóbicas, a salvo da água

circundante. A albumina sérica também se liga a muitas outras moléculas

insolúveis em água. Associa-se, por exemplo, a moléculas de inúmeros fármacos e

pode afetar fortemente a maneira como eles são distribuídos através do corpo.

Como a albumina sérica é muito abundante no sangue e tão fácil de

purificar, ela foi uma das primeiras proteínas a serem estudadas pelos cientistas.

Atualmente, a proteína similar do sangue de boi - albumina sérica bovina ou BSA

(do inglês bovine serum albumin) – é largamente utilizada em pesquisa quando se

necessita de uma proteína genérica.

A hemina (protoporfirina IX complexada com Fe+3) liberada durante a

nucleação das células vermelhas ou através da hemólise é capturada pela

Albumina Serica Humana (Human Serum Albumin – HSA) a qual tem uma alta

constante de afinidade para este ligante (Kb ~ 108 M-1) (Wardell et al., 2002). Esta

forte afinidade tem estimulado esforços para desenvolver albumina como uma

hemoproteína artificial para mimetizar, por exemplo, a capacidade de ligação de

oxigênio da hemoglobina (Hb) e mioglobina (Mb). O heme, grupo prostético das

hemoproteínas, é a protoporfirina IX com um íon Fe2+ no centro.

Sérios esforços para desenvolver substitutos do sangue começaram na

década de 1980. Esta necessidade se viu aumentada com a aparição do HIV além

de vírus como o da hepatite C e outros vírus presentes no sangue de doadores.

Diferentemente das células vermelhas do sangue, os substituintes artificiais

podem ser esterilizados por pasteurização, ultrafiltração e métodos químicos. Isto

elimina os agentes responsáveis pelas infecções, além de permitir armazenamento

por longos períodos de tempo.

Pesquisas recentes têm demonstrado que derivados artificiais do heme

associados com HSA fornecem uma significante capacidade de ligação com

oxigênio (Tsuchida et al., 1997), representando uma linha promissora no

desenvolvimento de substitutos artificiais do sangue. Um dos estudos mais

importantes no sentido de criar compostos artificiais da sangue usando albumina

estão baseados na mutação da micro-vizinhança molecular do complexo HSA-

18

heme (Komatsu et al., 2005), mas o problema ainda não resolvido é fazer com que

a ligação do oxigênio ao heme seja reversível no micro entorno do heme em HSA.

Na Ressonância Magnética Nuclear (RMN) outra ferro porfirina, a

Tetrafenilporfirina Sulfonatada complexada com Fe (FeTPPS4) é usada como

marcador e na Terapia Fotodinâmica (FDT) as porfirinas são usadas para destruir

tumores.

Por outro lado a Protoporfirina IX (PPIX) é o precursor de muitas porfirinas

que dela se derivam, por conseguinte um adequado conhecimento dos sítios de

ligação com a HSA nos forneceria informação importante sobre a natureza das

ligações nesse entorno.

Até o momento se sabe que o heme tem um sítio de ligação principal no sub

domínio IB de HSA e que poderia ter outros sítios secundários e que a PPIX

poderia ter características similares (Zunszain et al., 2003; Zhang et al., 2002),

mas até agora não se tem a estrutura cristalina que mostre estes sítios secundários.

O presente trabalho tenta revelar essa interrogação e propõe os possíveis sítios

secundários.

Sem dúvida devemos saber que nos processos in vivo se dão maiores

complicações devido a interações entre drogas e ligantes endógenos, para o HSA.

Isto é especialmente importante no caso de ácidos graxos os quais ocorrem em

níveis de 0.1 e 2 mol por mol de HSA e podem competir ou cooperar com drogas

nos sítios de ligação da proteína. (Zunszain et al., 2003)

1.1.1 As Porfirinas

As porfirinas são moléculas importantes em vários aspectos da vida, muito

se tem escrito sobre elas, nos tomaremos a descrição que delas se da em

http://pt.wikipedia.org/wiki/Porfirina .

A estrutura da porfirina é um macrociclo tetrapirrólico (formado por quatro

anéis pirrol), ligados por ligações metínicas (-CH-), que possui no seu centro um

espaço apropriado para acomodar um íon metálico (Fig. 1.1). Este íon pode-se

ligar aos átomos de nitrogênio presentes na parte central da estrutura. Os

representantes mais comuns desta classe de compostos são o grupo heme, que

contém ferro, a clorofila, que contém magnésio, e os pigmentos biliares. O

principal local de síntese de porfirinas é o fígado, nos hepatócitos.

19

A aumento no nível de porfirinas em nosso organismo geram patologias

como a porfiria,

Figura 1.1 Estrutura básica da porfirina (http://pt.wikipedia.org/wiki/Porfirina)

Características Fundamentais

Devido a sua estrutura em anel tetrapirrol, um sistema de enlaces duplos

conjugados, as porfirinas se caracterizam por uma intensa banda de absorção perto

de 400 nm, (com coeficiente de absorção molar maior do que 200.000) conhecida

como banda de Soret, propriedade que permite sua detecção e quantificação em

laboratórios. Quando irradiada com luz deste comprimento de onda, as porfirinas

livres mostram uma intensa fluorescência no vermelho. No caso da PPIX a

fluorescencia não e muito intensa e quando e complexada com Fe a fluorescencia

desaparesce.A Banda de Soret é seguida por outras bandas de absorção mais

fracas (bandas Q), em comprimentos de ondas maiores (450 a 700 nm).

Figura 1.2 Bandas de Soret e bandas Q no espectro de absorção da porfirina.

As variações dos substitutos periféricos no anel da porfirina, causam

mudanças de menor importância na intensidade e no comprimento de onda destas

absorções. A protonação de dois dos átomos internos de nitrogênio ou a inserção

20

de um metal na cavidade da porfirina também muda o espectro de absorção

visível. Estas variações no espectro de absorção podem ser muito proveitosas na

determinação de propriedades características da porfirina.

Importância Biológica

Os complexos de porfirina são essenciais para a vida e têm múltiplas

aplicações. O heme (protoporfirina IX-Fe2+, Fig. 1.3), por exemplo, é o grupo

encarregado de fazer a ligação do oxigênio à hemoglobina e, daí, transportá-lo às

diversas partes do corpo.

O precursor na síntese do heme é a protoporfirina IX (PPIX, Fig. 1.3). A

inserção do ferro II na PPIX é realizada por meio da enzima ferroquelatase.

Figura 1.3 Heme (esquerda), PPIX (direita) (Gráfico realizado com o programa

Ghemical)

Quando o ciclo de síntese do grupo heme e interrompido se produz o

aumento das porfirinas precursoras do heme, isto termina gerando uma grave

doença chamada porfíria. A porfíria pode-se classificar como hepática e

eritropoiética, é responsável por ataques neurológicos agudos e problemas de pele,

geralmente erupções de bolhas sensíveis à luz solar e crescimento aumentado de

pêlos.

Carbono

Oxigênio

Nitrogênio

Íon Ferro (II)

Hidrogênio

21

As propriedades óticas das porfirinas são responsáveis por sua grande

aplicação na área de eletrônica molecular assim como sua incorporação na forma

sintética em células solares.

Aplicações das Porfirinas

Materiais Químicos

Porfirinas e metaloporfirinas têm uma ampla aplicação como fotosensores,

particularmente para aplicações opto-eletrônicas. Por exemplo, a fácil substituição

dos componentes periféricos das porfirinas tem gerado uma série de materiais

líquido-cristalinos incomuns (Chou et al., 2000).

As propriedades ópticas não lineares destes materiais são de especial interesse, em

parte pela transferência de energia com controle molecular, e em parte por

aplicações em comunicação óptica, armazenamento de dados e processamento de

sinais eletro-ópticos. (Chou et al., 2000)

As porfirinas têm presença relevante na nanotecnologia devido à

possibilidade de construir nanotubos por auto agregação. Nesse sentido

numerosos estudos vêm se desenvolvendo. Tem sido demonstrado que os

nanotubos contendo Sn porfirinas são fotocatalíticos e podem reduzir íons

metálicos em solução aquosa (Rotomskis et al., 2004).

Metaloporfirinas como catalisadores para síntese ma cromolecular

Em 1978 Inoue Takeda e colaboradores em seus estudos de fixação de

dióxido de carbono com metaloporfirinas descobriram o potencial utilidade de

metalo-proteínas como catalisadores para a síntese controlada de macromoléculas.

(Takeda et al., 1978). Em várias metaloporfirinas, estudaram compostos de

alumínio ou zinco no anel central para fixação química do dióxido de carbono.

Terapia Fotodinâmica (PDT, Photodynamic Therapy )

Devido ao comportamento particular das porfirinas sob ação da luz, estas

têm sido aplicadas para combater o câncer. Nos anos 70 (Diamond et al., 1972;

Dougherty et al; 1978) mostrou-se através de probas in vitro e in vivo que

derivados de hemoporfirina (HpD) irradiados com luz têm capacidade de

destruição dos tumores. Atualmente diferentes tipos de porfirinas são investigados

e utilizadas na luta contra o câncer.

22

1.1.2 A albumina Serica Humana

A albumina sérica é a mais abundante proteína do plasma humano,

produzida no fígado, é um monômero de 66 kDa. Estruturalmente, a albumina é

composta de vários segmentos em alfa hélice, que se agrupam para formar dois

subdomínios (A e B). Três pares idênticos destes subdomínios se unem para

formar a albumina (Fig. 1.4).

Figura 1.4 Esquema da estrutura secundaria de HSA com subdomínios codificados por

cores da seguinte forma: IA,vermelho; IB – vermelho claro; IIA,verde; IIB – verde claro;

IIIA, azul; IIIB – azul claro. (Obtido de Ghuman et al., 2005)

O HSA tem características específicas que são importantes para a estrutura e

função: 18 resíduos de tirosina, 6 resíduos de metionina, 1 resíduos de triptofano,

59 resíduos de lisina, 1 resíduo de cisteína (Cys-34), e 17 pontes disulfetos.

(Wong et al., 2007).

A cisteína livre tem um sulfidril reduzido que é responsável por mais de

75% dos grupos tiol no plasma. O tiol é envolvido em várias reações bioquímicas

que inativam as espécies reativas de oxigênio, dando à albumina um papel

antioxidante importante em nosso corpo (Wong et al., 2007).

A albumina tem uma concentração plasmática típica de 35 - 45 g/l, que

representa 30 a 40% da albumina sintetizada no fígado. O restante encontra-se

23

distribuído entre os músculos e a pele. Sua principal função fisiológica é manter a

pressão osmótica.

Esta proteína é caracterizada por sua habilidade de ligar uma ampla

variedade de moléculas hidrofóbicas, ácidos graxos, bilirrubina, hemina, tiroxina e

esteróides. Serve como um solubilizador e transportador destes compostos. HSA

tem alta afinidade pelo heme, sendo a constante de dissociação ~10 nM em uma

mistura 3:5 de dimetil sulfóxido e água (Zunszain et al., 2003). Na Fig 1.5 pode se

observar os sítios de ligação principais de diversos ligantes.

Estudos de ligação indicam um só sítio de ligação para a hemina, no

subdomínio IB, o qual corresponde a um dos sítios de ligação para ácidos graxos

(Zunszain et al., 2003).

Um dos fatores mais importantes que afetam a distribuição e a concentração

ativa de muitas drogas no organismo é a afinidade pela HSA. Um grau de

afinidade pela albumina é desejável, para ajudar a solubilizar substâncias que de

outra forma poderiam agregar-se e ser pobremente distribuídas. No caso oposto,

drogas com uma grande afinidade pela proteína requereriam grandes doses para

atingir uma concentração efetiva in vivo, seriam lentamente distribuídas aos sítios

de ação e poderiam não ser eficientemente eliminadas.

Funções fisiológicas da albumina

Pressão Osmótica Coloidal

A função mais importante da albumina é manter a pressão osmótica

coloidal. A albumina provê 60% da pressão osmótica coloidal. A proteína é

negativamente carregada e, por conseguinte atrai íons de sódio, os quais por sua

vez retêm a água. A albumina também atrai outros íons positivos osmoticamente

ativos (efeito Gibbs-Donnan) os quais aumentam a retenção da água (Nguyen et

al., 2006).

Associação de ligantes

A organização estrutural globular da HSA dá a possibilidade de se ligar com

várias substâncias em múltiplos sítios da molécula, unindo-se assim a vários

componentes endógenos e exógenos. Estes compostos incluem ácidos graxos,

bilirrubina, metal, tiroxina e triptofano, assim como drogas que têm características

ácidas ou eletronegativas (e.g. warfarina, diazepan e ibuprofeno). Estas

24

características fazem com que a HSA seja um dos maiores transportadores de

fármacos no sangue (Fig 1.5).

A HSA pode facilitar a ativação de várias sustâncias, tais como hormônios

ou drogas, ou diminuir a presença de toxinas no plasma. Por exemplo, a ligação

do triptofano a HSA regula a deposição deste nos tecidos. Em pacientes com uma

avançada cirrose e hipoalbuminemia, a diminuição dos sítios de ligação gera uma

quantidade adicional de triptofano livre o qual pode gerar o desenvolvimento de

encefalopatia hepática (Greco et al; 2000).

A ligação de HSA também afeta a farmacocinética e eficácia de muitas

drogas. Por exemplo, drogas com alta afinidade pelo HSA têm que ser

administradas em altas doses para atingir uma efetiva concentração in vivo; sua

distribuição nos sítios de ação poderia ser reduzida ou mesmo eliminada. Apesar

disso, uma alta ligação da droga com a HSA poderia ser desejável porque ajudaria

a solubilizar compostos que de outra forma formariam agregados e seriam

pobremente eliminados.

Figura 1.5 Esquema mostrando os sítios de vários ligantes da albumina sérica

humana (Ghuman et al., 2005).

25

Efeitos Antioxidantes

Espécies reativas de oxigênio e nitrogênio são extremamente voláteis e

capazes de reagir com outras moléculas, que dão origem à acumulação de

produtos tóxicos finais e dano celular. Estudos in vivo têm mostrado que o HSA

pode ligar e, por conseguinte, remover neutrófilos derivados de espécies reativas

de oxigênio, regulando a sinalização celular que é ativada nos processos

inflamatórios (Kouoh et al., 1999).

HSA também influencia o status redox do plasma ao ligar metais como o

ferro e o cobre que de outra forma se transformariam em formas redox-ativas

(Kragh-Hansen et al., 2002).

Desta forma o HSA tem um papel antioxidante importante em situações de

inflamação.

Patologia

Hipoalbuminemia

Baixos níveis de HSA (hypoalbuminemia) podem ser causados por:

• Doenças no fígado/ Cirrose do fígado (a mais comum)

• Decréscimo na produção de HSA (má nutrição/má absorção)

• Excessiva excreção pelos rins (síndrome nefrótica)

• Excesso de perda no intestino (Redistribuição hemodilução, como na

gravidez, incremento da permeabilidade vascular).

Hyperalbuminemia

• Sinal de desidratação

26

1.2 Objetivos

Essa dissertação tem os seguintes objetivos principais:

i. Determinar a relação estrutura-solvente das porfirinas, as camadas de solvatação e seu comportamento hidropático.

ii. Caracterizar, usando técnicas de Dinâmica Molecular, o sitio principal de ligação, determinando os aminoácidos que compõem estes sítios e seu rol na estabilidade do ligante.

iii. Determinar possíveis sítios secundários de ligação das porfirinas PPIX, PPIX-Fe2+ na HSA, usando técnicas de Docking Molecular.

iv. Determinar o padrão de correlação do HSA e como este muda pela presença das porfirinas.

1.3 Estrutura dos Capítulos

No capítulo 2 apresentam-se uma descrição da Metodologia e Técnicas

Computacionais usadas no presente estudo. As principais técnicas que usamos

são: Cálculo Quântico, Dinâmica Molecular e Docking Molecular,

O desenvolvimento deste capítulo nos itens 2.1-2.4 e 2.6-2.9 está baseado

no manual do GROMACS (van der Spoel et al., 2005) e no trabalho de Baanden

M. (Baanden M., 2003). Quando as informações apresentadas sejam tomadas de

outras fontes, se fará a respectiva citacão.

No capítulo 3 apresentam-se os Resultados e Discussão do presente trabalho

No capítulo 4 apresentam-se as Conclusões e Perspectivas.

28

2. Técnicas Computacionais – Aproximação Clássica e Aproximação Quântica

O desenvolvimento deste capítulo nos itens 2.1-2.4 e 2.6-2.9 está baseado

no manual do GROMACS (van der Spoel et al., 2005) e no trabalho de Baaden M.

(Baanden M., 2003). Quando as informações apresentadas sejam tomadas de

outras fontes, se fará a respectiva referência.

O comportamento da matéria em nível de partículas constituintes dos

átomos e moléculas é descrito pela Mecânica Quântica, enquanto que em níveis

mais complexos a matéria composta de átomos e moléculas pode ser descrita de

forma aproximada pela Mecânica Clássica não relativística.

Uma aproximação clássica perde detalhes do sistema molecular em estudo,

mas permite acessar propriedades macromoleculares do sistema, assim como

economizar tempo de cálculo.

Os pacotes de Dinâmica Molecular baseados numa aproximação clássica

estão fundamentados em duas aproximações:

1. As leis de Newton são aplicáveis.

2. O movimento dos elétrons é muito mais rápido que o movimento dos

núcleos (Aproximação de Born-Oppenheimer).

Nossos modelos utilizados estão representados por sistemas massa-mola

onde cada átomo é representado por sua massa, um raio e uma carga atômica e as

ligações entre os átomos são representadas por molas (van der Spoel et al., 2005).

As características do sistema massa-mola estão contidas no campo de força. As

interações físicas entre os átomos são levadas em conta e introduzidas no termo de

energia potencial. A partir do modelo físico definido pelos parâmetros do campo

de forças e a representação da energia potencial, nós vamos utilizar as leis de

Newton para estudar a evolução das moléculas definida pelos vetores de posição e

pelos vetores de quantidade de movimento. Desta forma geraremos ensambles

29

estatísticos de configurações de átomos e moléculas em diversas fases (Berendsen

at al., 1996).

Para se ter uma média temporal estatisticamente significativa de um sistema

qualquer com a DM, seriam necessárias acessar todas as possíveis configurações

do sistema e estabelecer a probabilidade de cada estado conformacional. Há que

se ter em mente, porém, que neste trabalho estamos aplicando a DM sobre um

sistema envolvendo uma única macromolécula e por um intervalo de tempo de

poucas dezenas de nanosegundos. Embora não se possa falar neste caso de

ensemble estatístico, a simulação da dinâmica de proteínas na conformação

biologicamente ativa, nesta escala de tempo, é útil para obter informações sobre a

estabilidade da estrutura, transições conformacionais locais e várias propriedades

de interações com ligantes. Considerando que proteínas expressam sua atividade

biológica em estados conformacionais próximos ao mínimo global em um funil de

energia livre (Onuchic et al., 2004), espera-se que a probabilidade desses estados

bio-ativos sejam bastante alta em relação ao número astronômico de possíveis

conformações desta macromolécula. Mas devemos mencionar que variacões na

estrutura tamben estan relacionadas com a atividade (enzimas).

Em nossos cálculos vamos utilizar o pacote GROMACS (van der Spoel et

al., 2005). Os detalhes referentes a representação de energia e parâmetros da

simulação são próprios deste campo de forças.

Neste capítulo daremos a descrição clássica e explicaremos o hamiltoniano

do sistema, a energia cinética, a energia potencial e a representação das forças,

assim como a aplicação de restrições de distâncias, tratamentos de contorno, etc.

Também veremos os métodos para a Minimização de Energia (ME), Dinâmica

Molecular, tratamento eletrostático, superfícies de interação molecular, docking

molecular e a geração de matrizes de correlação.

No final do capítulo veremos a aproximação quântica no cálculo de cargas

através do método DFT e o formalismo RESP.

2.1 Aproximação Clássica - Função de interação e equaçõ es de movimento

Referimos-nos a cálculos clássicos como aproximações onde são válidas as

leis de Newton. Para descrever corretamente os sistemas devemos estabelecer os

30

graus de liberdade que serão explicitamente tratados e aqueles que serão

implicitamente tratados e incorporados à função de interação.

Dentro de nosso esquema de cálculo estamos interessados nos graus de

liberdade de posição das coordenadas dos átomos.

Num sistema clássico o hamiltoniano de um sistema molecular é descrito da

seguinte forma:

),(),(),,,( mpKgrVgmrpH += (1)

onde V é a energia potencial, K a energia cinética, p é o momento das partículas, r

a posição, m a massa, e g são parâmetros presentes no campo de forças. A energia

cinética está representada da seguinte forma:

∑ ∑= =

==N

i

N

i

ii

i

i vm

m

pmpK

1 1

22

22);( (2)

e depende das massas e velocidades, e é independente das coordenadas r da

partícula. V(r;g) corresponde a energia potencial que descreve a interação em

função das coordenadas das partículas.

),..;,..,();( 2,121 NN gggrrrVxrV = (3)

Em geral V(r;g) depende dos parâmetros do campo de forças indicados por

),..( 2,1 Ngggg = , e é a soma de termos que representam as distintas interações no

sistema.

Uma partícula nesse sistema está submetida a uma força if que tem a

seguinte representação:

),..,( 21 Ni

i rrrVrf

∂∂−=

(4)

Devemos lembrar que as trajetórias dependem unicamente das forças que

agem sobre os átomos, e não explicitamente das energias.

Usamos as equações de Newton para descrever a evolução da posição na

seguinte forma:

)()(

tvdt

tdri

i = (5)

i

ii

m

f

dt

tdv=

)( (6)

Na simulação estas equações são integradas numericamente no tempo.

31

Inclui-se um termo suplementar Vrestr(r), que é uma função de penalidade

(van der Spoel et al., 2003), dentro da função de interação do sistema que limita o

movimento das partículas de tal forma que o valor simulado da partícula se

aproxima ao valor desejado.

2.2 O Hamiltoniano e a Função de Interação: Campo de Fo rças

De uma forma geral a energia potencial no campo de forças pode ser escrito

da seguinte forma (van der Spoel et al., 2005: item 4.1, 4.2 e 4.3):

);();();();( grVgrVgrVgrV especiaisbondednobonded ++= (7)

Onde Vbonded corresponde aos termos chamados covalentes, Vno bonded aos

termos chamados não ligados (forcas eletrostáticas e de van der Waals) e Vespeciais

aos termos especiais como, por exemplo, as restrições de posição e vínculos em

comprimentos e ângulos de ligação. Assim o Hamiltoniano da equação 1 quedo

descrito por:

),();();();(),,,( mpKgrVgrVgrVgmrpH especiaisbondednobonded +++=

2.2.1 Interações entre átomos (ou grupos) ligados

Na expressão para Vbonded (r;g)

);();();();( grVgrVgrVgrVV impropdiedroângulobondbonded +++= (8)

Esta expressão descreve a variação do comprimento das ligações, a

deformação dos ângulos e as torções devido aos ângulos diedros próprios e

impróprios.

Variação do comprimento das ligações covalentes ent re átomos

A interação entre termos ligados é expressa por um potencial de tipo

harmônico, com uma soma feita sobres todas as ligações covalentes n=1,....Nb.

2

1

)(n

b

n on

N

n

harmonicobbond bbKV −=∑

=

No GROMACS é utilizada por razões de eficiência computacional a expressão

para Vbond

32

∑=

−=

bnn

N

n

onbbond

bbKV

1

222

4

)( (9)

As unidades para non

bb − e para nb

K são nm e kJmol-1nm-4, respectivamente.

Onde:

22

2−

= onharmonicob

b

bKK n

n

Deformação dos ângulos nos átomos ligados

A seguinte relação e utilizada no GROMACS para representar o termo de

deformação entre átomos ligados por uma ligação covalente (van der Spoel et al.,

2005)

∑=

−=

θ θθθN

n

onangulo

nnK

V1

2

2

)cos(cos (10)

Os ângulos são dados em graus e n

Kθ em kJmol-1.EKBT, a soma envolve os

ângulos desde n=1,…Nθ do sistema molecular.

15961575.0 −= molKcalE TKB é a constante de Boltzmann a 300 K.

Termos de torsão, ângulos diedros e impróprios

No campo de força GROMACS a função de interação que representa os

termos harmônicos impróprios da deformação dos ângulos diedros (fora do plano,

fora da configuração tetraédrica) é descrita por:

∑=

−=

ξ ξξξ

N

n

onimprop no

KgrV1

2

2

)();( (11)

A soma compreende n=1,...,Nξ definidos para manter os grupos de átomos

vizinhos dentro de uma configuração espacial determinada, por exemplo para

manter os grupos de átomos em um plano como no caso de um anel aromático.

Em suma, este potencial simula a hibridação de orbitais sp2 ou sp3.

Os termos de torção de ângulos diedros têm a forma (Lindahl et al. 2003):

∑=

+=ϕ

ϕδϕN

nnnn

diedro mKgrVn

1

)]cos()cos(1[);( (12)

33

onde a constante de força n

Kϕ , o angulo diedro nϕ e os valores de nδ e nm estão

limitados aos valores nδ =0,π e nm é um inteiro positivo diferente de zero, por

conseguinte )cos( nδ = ±1 . A soma é feita sobre todos os ângulos diedros

n = 1,..,Nϕ , selecionados de acordo a topologia da molécula.

2.2.2 Interações não ligadas

As interações entre átomos não ligados são descritos por dois termos, VLJ

para as interações de Lenard-Jones e VCoul para as interações eletrostáticas.

∑ +=ligadosnaopares

rfrfojiijCoul

ijLJbondno RCqqrVjiCjiCrVgrV ]},,,,,,[)],(),,(,[{);( 1612 εε (13)

Esta soma é estendida a todos os pares de átomos (i,j) salvo as exceções

citadas adiante (2.3.1).

Interações de Lenard-Jones

Estas interações são chamadas também de van der Waals. Dentro do campo

de forças GROMOS96 se utilizam os parâmetros C6 em kJmol-1nm6 e C12 em

kJmol-1nm12 para a interação entre os átomos i e j a uma distância rij(nm).

−=

66

1212

)(

),(

)(

),(

ijij

LJ

r

jiC

r

jiCV (14)

O primeiro termo em 12)( ijr corresponde à repulsão entre dois átomos, de

tal forma que haja certo grau de superposição de suas nuvens eletrônicas, e cuja

origem esta na repulsão entre os núcleos atômicos e no principio de exclusão de

Pauli. O segundo termo 6)( ijr corresponde à dispersão atrativa de London, a

combinação destes dois fatores dá o perfil de energia de interação mostrada na

Fig. 2.1.

Estas equações levam em consideração as regras para determinar os

parâmetros mistos entre dois átomos i e j de tipos diferentes.

34

),().,(),(

),().,(),(

666

121212

jjCiiCjiC

jjCiiCjiC

=

= (15)

Figura 2.1 Potencial de Lennard-Jones

Interações eletrostáticas

O primeiro termo corresponde às interações eletrostáticas coulombianas e os

outros dois termos correspondem ao campo de reação, o qual simula o efeito de

blindagem causada pelo solvente além do raio de corte das interações

coulombianas.

−−−=

rf

rf

rf

ijrf

ijo

jiRFCoul

R

C

R

rC

r

qqV

21

2

)(1

4 3

2

1

_

επε (16)

O campo de reação no GROMACS é de tipo Poisson-Boltzmann que leva

em conta os efeitos de força iônica. Neste modelo o exterior de uma esfera de raio

Rrf ao redor de um soluto e modelado por um meio homogêneo polarizável.

2.2.3 Potenciais especiais devido a restrições

Existem potenciais “especiais” devido a restrições que são impostas sobre o

sistema para se ter resultados próximos à realidade, estes podem ser usados em

casos particulares. Por exemplo, constrições sobre a distância de ligação e

ângulos, ou restrições sobre a posição.

Vemos o caso de restrição de posição.

35

2

1

)(21);( onn

prn

N

n

pr rrKgrVpr

−=∑=

(18)

Onde pr é referido a uma restrição de posição (position restraints), a soma

é estendida a todos os Npr átomos selecionados, prnK é a constante de força do

oscilador harmônico e onr é a posição de referência. As outras expressões dos

termos para outros casos de forças especiais podem ser vistas na referência van

Gunsteren et al., 1996.

2.3 Tratamento das interações entre átomos não ligados, aproximações.

2.3.1 Exclusão ou modificação de interações

Chamaremos de primeiros vizinhos (posições 1-2, Fig. 2.3) aos átomos i e j

ligados por uma ligação covalente e de segundos vizinhos aos átomos i e k, se k

está ligado a j (posições 1-3, Fig. 2.3).

Figura 2.3. Interações entre primeiros vizinhos (1-2), segundos vizinhos (1-3) e

terceiros vizinhos (1-4)

As interações entre primeiros e segundos vizinhos não serão tomadas em

conta dentro da soma da equação 13, porque estas interações são do tipo

harmônico e não são representados por um potencial de tipo Lenard-Jones. Essas

interações serão levadas em conta na representação dos átomos ligados (2.2.1). As

interações 1-4 entre terceiros vizinhos podem ser excluídas dentro de certos casos,

por exemplo, átomos dentro de um anel aromático. Mas, com maior freqüência,

36

esta interação é tratada reduzindo o diâmetro das esferas de van der Waals dos

átomos envolvidos, para evitar colisões estéricas.

2.3.2 Distância de corte de interações não ligadas

A soma da equação 13 se estende a todos os pares de átomos exceto aqueles

excluídos pelas considerações do parágrafo precedente. O número de interações

aumenta com o tamanho do sistema estudado.

Grande parte do tempo de cálculo se consome em procurar os pares de

átomos e avaliar suas interações. Com o objetivo de limitar o tempo

computacional nós utilizamos uma dupla distância de corte (twin cutoff) além da

qual as interações “não ligadas” (eletrostáticas e de van der Waals) são

substituídas pelo campo de reação. No método ilustrado na Fig. 2.4, a interação

dos átomos j com o átomo i no interior da zona I, limitada pelo raio R1c, é

calculada a partir das posições instantâneas de j para cada passo da dinâmica. Se j

se encontra entre R1c < rij < R2c, suas interações com o átomo i são calculadas a

partir de uma posição fixa promedio durante um número de passos Nc.

Figura 2.4 Método da dupla distância de corte.

Em geral, o método é aplicado a grupos de átomos e não a átomos isolados.

Neste caso o espaço limitado pelo cut-off é igual à união das esferas ao redor de

cada átomo do grupo. No GROMACS estes são chamados “grupos de cargas”, se

tratando de átomos onde a soma das cargas é neutra (ou inteira, por causa dos

íons).

37

2.3.3 Interações eletrostáticas - limites sobre as intera ções eletrostáticas

As interações coulombianas são inversamente proporcionais à distância rij

entre os átomos i e j. Em conseqüência, estas interações são de longo alcance e

não podem ser omitidas para as cargas atômicas parciais da ordem de 0.1 a 0.4 e e

até a distâncias de corte típicas de 8 a 10 Ao. Dois métodos permitem reduzir os

artefatos devidos ao truncamento de interações não ligadas. Primeiramente, não se

consideram as componentes de alta freqüência da interação coulombiana na região

R1c < rij < R2c, como descrito anteriormente. Em segundo lugar, a definição de

“grupos de cargas” (átomos de H podem se unir a átomos de C e formar um

“átomo” CH com uma carga que seria a suma das cargas componentes) dentro do

GROMACS nos permite reduzir certas interações a tipo 1/r3.

2.4 Tratamento das fronteiras

Em toda simulação deve-se levar em conta o tratamento das fronteiras. No

caso de um líquido ou uma solução, os efeitos de fronteira devem ser reduzidos

com a aplicação de condições periódicas de contorno.

2.4.1 Condições periódicas

Para reduzir os efeitos de fronteira de um sistema finito, nós utilizamos as

condições periódicas de contorno. Os átomos de um sistema são introduzidos

dentro de uma caixa cúbica rodeada de imagens idênticas eqüidistantes Rcaixa

como se mostra na Fig. 2.5.

38

Figura 2.5 Condições periódicas em duas dimensões, mostrando a vista superior e

frontal (acima e embaixo respectivamente)

O cálculo das forças sobre o átomo representado pela esfera cheia dentro da

caixa central se efetua a partir das contribuições de outros átomos desta caixa e

das caixas vizinhas, imagens da caixa central, que se encontram no interior da

distância de corte Rc. Quando o átomo abandona a caixa por uma face, ele entra

novamente pela face oposta, transladando a distância Rcaixa, com a mesma

velocidade. A aplicação das condições periódicas de fronteira lembra assim a

ordem dentro de um cristal. Desta forma não há fronteiras no sistema. O artefato

causado por condições indesejadas de um sistema isolado e o efeito de superfície

são substituídos por condições periódicas.

Para evitar que uma molécula possa interagir com uma ou mais de suas

imagens, a menor dimensão da caixa deve exceder em duas vezes a distância de

corte:

ccaixa RR 2> (19)

Quando uma macromolécula é estudada em solução esta restrição não é

suficiente. Em princípio, uma única molécula de solvente não deve interagir com

ambos os lados da macromolécula. Isto significa que o comprimento de um

determinado lado da caixa deve exceder o comprimento da macromolécula na

39

mesma direção mais duas vezes o raio de corte Rc. Uma estratégia comum é fazer

a camada de solvatação o quanto menor para reduzir o custo computacional,

respeitando-se o estabelecido acima.

2.5 Geração da topologia, coordenadas atômicas e adição do solvente

2.5.1 Topologia do Sistema

Para que os programas de simulação reconheçam as moléculas, nós

devemos fornecer informações sobre as ligações entre átomos, constituição de

cada molécula, massas e cargas a utilizar. Este conjunto de dados é conhecido

como a topologia do sistema. No GROMACS o módulo pdb2gmx permite gerar

topologias a partir de uma biblioteca já existente. As topologias assim geradas

reproduzem valores consistentes com os experimentos quando se trata de

proteínas. Este módulo não é aplicável quando o ligante não se encontra na

biblioteca do GROMACS ou de complexos organometálicos (exceto o heme).

O GROMACS possui a topologia da água pré-estabelecida. Como as

moléculas de água são todas idênticas, só é necessária a topologia de uma só

molécula.

2.5.2 Colocando o soluto numa caixa de água

Para o cálculo em solução o soluto (porfirina, HSA e HSA-porfirinas) deve

ser inserido numa caixa de água e íons Na+ e CL- para tentar simular o meio

fisiológico. Este serão reproduzido periodicamente dentro das três dimensões, tal

como é mostrado na figura abaixo.

40

Figura 2.7 A molécula Heme numa caixa de água (Gráfico realizado com o programa

VMD)

As dimensões da caixa Rcaixa devem ser escolhidas em função das dimensões

dos solutos para evitar os artefatos no cálculo. Para construir esta caixa de

simulação o soluto deve ser localizado no centro de um cubo constituído de uma

concatenação de n3 moléculas de solvente.

2.6 Mecânica e Dinâmica Molecular

2.6.1 Minimização de energia

A mecânica molecular nos permite minimizar a energia calculada a partir da

equação (7) com o objetivo de obter as configurações do sistema no estado

fundamental e de reduzir as forças iniciais muito grandes que poderiam produzir

trajetórias sem sentido físico.

Mas atingir o mínimo absoluto é impraticável pelas numerosas

conformações que uma proteína pode apresentar. O método steepest-descent

permite encontrar o mínimo local mais próximo da superfície de energia potencial

(Fig. 2.8), já o método dos Gradientes Conjugados encontra o mínimo de energia

41

de maneira mais rápida, aproximando-se mais ao mínimo absoluto. A seguir

mostraremos os dois métodos:

Figura 2.8 Superfície de energia potencial: Dependendo da configuração inicial da

proteína ela percorre diferentes caminhos até o mínimo de energia mais próximo ao

absoluto.

O primeiro método utilizado nos nossos cálculos é o método “steepest-

descent” (Courant, 1943). Os n+1 passos de minimização são feitos com base no

cálculo das forcas f(tn) a partir da derivada da equação (7) para a configuração

r(tn) dada, e do cálculo da configuração seguinte r(tn+1) com um passo ∆x.

)()()( 1 nnon txfNtrtr ∆+=+ (19)

Nn é um fator de normalização. Ao início do cálculo um valor inicial de ∆x é

dado. Nos passos da simulação, se V(r) decresce então ∆x deve aumentar, se V(r)

aumenta, ∆x diminui. Assim, este método permite descer rapidamente para perto

de um mínimo local, mas isso não assegura a convergência.

No caso do método dos Gradientes Conjugados (Fletcher et al., 1964), a

força (o gradiente) f(tn+1) calculada em cada iteração é a conjugada da precedente

para determinar o vetor unitário p(tn+1) da direção descendente sobre a

hipersuperficie energética.

)()()( 11 nnnn tptftp β+= ++ (20)

42

><

43

A partir da diferença das séries de Taylor das velocidades vi(tn-∆t/2) a t=tn e

vi(tn+∆t/2) a t=tn nós obtemos:

ttfmttvttv niinini ∆+∆−=∆+− )()2/()2/( 1 (23)

na qual desprezamos os termos de 3a ordem e ordens superiores. Da mesma

forma, fazendo as diferenças entre as séries de Taylor das posições em ri(tn) a

t=tn+∆t/2 e ri(tn+ ∆t) a t=tn+∆t/2 dando o seguinte:

tttvtrttr ninini ∆∆++=∆+ )2/()()( (24)

Estas duas equações permitem a integração no tempo conforme mostrado no

esquema da figura 2.9.

Figura 2.9 Integração das equações de movimento no algoritmo de leap-frog

Para deduzir o algoritmo de Verlet, devem-se eliminar as velocidades nas

equações 23 e 24 e substituir tn por tn-∆t na equação 24, obtendo-se 21 ))(()()(2)( ttfmttrtrttr niinnini ∆+∆−−=∆+

− (25)

A particularidade do algoritmo é que a velocidade dos átomos não aparece

explicitamente na equação, e assim um banho térmico por acoplamento de

velocidades não é possível.

O tempo de cálculo necessário é proporcional ao passo de integração ∆t. O

passo de tempo deve ser menor que o menor período de vibração do sistema para

poder desta forma representar adequadamente o movimento do sistema. Em geral

são as vibrações X-H que limitam ∆t a 10-15s= 1fs (as vibrações nos átomos de

hidrogênio se da em intervalos de femtosegundo).

44

2.7 Controle da temperatura

Há muitos métodos para o controle da temperatura nas simulações de DM.

Um método simples que nós utilizamos no nosso sistema é o Método de

Acoplamento Fraco (“weak coupling method”) (Berendsen, 1991) onde a equação

de movimento dos átomos é modificada a fim de obter uma relação de primeira

ordem da temperatura T perto da temperatura de referência To .

)]([)( 1 tTT

dt

tdToT −=

−τ (26)

A temperatura de um ensemble de Ndf graus de liberdade é definida em

termos da energia cinética desses graus de liberdade. O controle da temperatura

pode se realizar por uma modificação das velocidades dos átomos por um fator de

correção λ(t)

21

]]1)(

[1[)( −∆+=tT

Ttt o

Tτλ (27)

A velocidade de relaxação da temperatura é controlada pelos tempos de

relaxação da temperatura Tτ Este parâmetro é ajustado em função do sistema,

Tτ deve ser suficientemente pequeno (acoplamento forte) para manter a

temperatura média em To, mas suficientemente grande (acoplamento fraco) para

evitar perturbar o sistema.

Diferentes partes de um sistema molecular podem apresentar diferentes

tempos de aquecimento. Por conseguinte, é preferível acoplar as diferentes partes

de um sistema separadamente aos banhos térmicos. Acoplando cada um dos três

subsistemas proteína, ligante e solvente a três banhos térmicos com a mesma

temperatura de referência To (310 K em nosso caso), garante-se uma distribuição

de velocidades tal que nenhum dos subsistemas estará mais quente ou mais frio

em relação à temperatura média global.

2.8 Controle da Pressão

O controle da pressão é realizado por um método de acoplamento fraco

(Berendsen, 1984) como o controle da temperatura, mas neste caso a pressão faz o

papel da temperatura e as posições atômicas das velocidades. As equações de

45

movimento são modificadas para obter a pressão de relaxação P, numa

aproximação de primeira ordem perto do valor de referência Po.

)]([)( 1 tPP

dt

TdPoP −=

−τ (28)

A pressão pode ser definida usando o teorema do virial,

)(

)()(3

2)(tV

tWtEtP kin

−= (29)

Onde W(t) é o virial e V(t) o volume da caixa de simulação e Ekin(t) a energia

cinética do sistema. O virial molecular é definido por:

∑<

−=NN

tFtRtWβα

αβαβ )()(21)( (30)

Com αβR sendo a distância entre os centros de massa das moléculas α e β

no instante t e αβF a força sobre o centro de massa de α sobre β. Como a pressão

à temperatura constante está relacionada ao volume pela compressibilidade

térmica Tκ , o acoplamento é efetuado por um ajuste das coordenadas atômicas e o

tamanho da caixa de simulação por um fator de correção µ. Neste caso o ajuste

isotrópico é obtido por

31

)]]([1[)( tPPt

t oP

T −∆−=τ

κµ (31)

O valor de Tκ para a água, utilizado é 44,6 x 10-6 bar-1[92]. Como o tempo

de relaxação da pressão Pτ é um parâmetro adaptável, não é necessário conhecer

o valor de Tκ do sistema com exatidão. Pτ foi escolhido considerando o valor

para o água (que é o sistema com maior mobilidade).

Como a definição da pressão depende da energia cinética, o acoplamento da

pressão não deverá ser mais forte que o da temperatura.

Pτ ≥ Tτ (58)

Para nosso cálculo, nós utilizamos um valor de 1.0 ps e uma pressão de

referência de 1 atm.

46

2.9 Função de distribuição radial

Para a correta descrição da posição média das partículas em solução, usamos

a função de distribuição radial g(r) (Funtion radial distribution -FDR). Calculamos

unicamente a função normalizada por pares cortada pela função g(r), a qual nos dá

uma medida de como a matéria está se distribuindo ao redor do átomo ou grupos

de átomos de interesse.

))((34

)()()(

33 rdrr

rNdrrNrg

j

ij−+

−+=πρ

(32)

O cálculo de )(rgij envolve a densidade dos átomosjρ e o número médio

N(r) de átomos j dentro de uma esfera de raio r ao redor do átomo i (Fig. 2.10) e

leva em conta as correlações na distribuição das moléculas provenientes das

forças que elas exercem umas sobre as outras.

Quando g(r) =1 não existe correlação entre as moléculas e não se exerce

influência uma sobre outra. A Energia Livre de Helmholtz pode ser escrita na

forma de um potencial de Campo Médio (PCM), definido como W(r)= - kT ln g(r)

e é usado para determinar a hidropaticidade. Se W(r) < 0 (g(r) > 1) o potencial é

atrativo (comportamento hidrofílico), e é repulsivo no caso contrario (g(r) < 1,

comportamento hidrofóbico) (Manfred, 1996)

O número de átomos contido numa camada é obtido por integração da

função 4πr2g(r) na largura da camada, adicionalmente a amplitude g(r) à distância

r, é necessário analisar os tipos de interação entre átomos e moléculas. Em grupos

polares, por exemplo, uma ligação de hidrogênio acontecendo no limite de r =

0.35 nm conectando doador e aceitador com um ângulo de tolerância hidrogênio-

doador-aceitador de 30o.

A avaliação da FDR e os enlaces de hidrogênio mostram a possível

localização das camadas de água ao redor de cada átomo presente na molécula,

permitindo-nos analisar o padrão hidrofóbico em cada forma pontual e total.

47

Figura 2.10 Função g(r) mostrando a distribuição da matéria em torno do átomo central

(azul).

2.10 Modelo para a água

A água é importante em todos os processos da vida conhecida na Terra. Nós

somos 80% água e, por conseguinte muito do êxito que se possa conseguir numa

simulação de DM vai depender do modelo de água utilizado. Além disso, a água

tem propriedades especificas que não são facilmente reproduzidas na simulação

(efeito túnel nos átomos de hidrogênio a T ambiente), e dependendo dos

fenômenos a estudar, eles poderiam ser desprezados. Uma dessas propriedades

específicas é a dependência da densidade com a temperatura, a qual alcança um

máximo perto de ~ 4 oC.

Os níveis de detalhe no modelo da água passam desde os modelos de

solvatação contínua até os modelos de solvente explícito (Fig. 2.11).

Figura 2.11 Modelos de solvente implícito (esquerda), modelos de solvente explicito

(direita) (Gráfico obtido e modificado de http://agave.wustl.edu/)

Nível de detalhe

48

2.10.1 O modelo SPC (Single Point Charge)

Para determinar as interações entre as moléculas de água existem vários

modelos, uns dos mais sucedidos por sua simplicidade e eficiência computacional,

usado em nosso caso, é o modelo SPC (Berendsen et al., 1981) o qual contem o

efeito das cargas. No modelo SPC a molécula de água tem três centros de carga:

as cargas positivas dos átomos de hidrogênio e a carga negativa do oxigênio,

sendo um modelo de 3 sítios.

O fato de assumir cargas pontuais é uma aproximação que não reproduz de

maneira correta o momento dipolar da molécula. Para tentar reproduzir o

resultado experimental, este modelo considera o ângulo H—O—H 109.47o, como

se mostra na Fig. 2.12.

Figura 2.12 Molécula de água no modelo SPC. A carga parcial negativa do átomo de

oxigênio tem duas vezes a carga parcial positiva dos átomos de hidrogênio.

Resultado da concentração da carga e do redimensionamento do ângulo

H—O—H , o momento dipolar no modelo tem um valor próximo ao valor

experimental. A mobilidade da água no modelo é maior que a mobilidade da água

na natureza, pois não contém o par de elétrons isolados (elétrons do oxigênio). No

entanto, este efeito decresce rapidamente com a temperatura.

Além do modelo SPC, existem muitos que consideram efeitos de

polarização, mediante átomos “fantasmas”, para tentar reproduzir os efeitos dos

orbitais eletrônicos do oxigênio, etc.

O momento dipolar efetivo de uma molécula de água em fase liquida é

aproximadamente 2,6 D. Os modelos reproduzem os seguintes valores: SPC, 2.27

D e TIP4P, 2.18 D (modelo de quarto sítio, localiza uma carga negativa sobre um

49

átomo fantasma perto do oxigênio ao longo do bissetor do ângulo HOH)

(http://en.wikipedia.org/wiki/Water_model).

Propriedades estruturais e termodinâmicas tais como a densidade, função de

distribuição radial, entalpia de vaporização, capacidade calorífica, coeficiente de

difusão e constante dielétrica são usadas para ajustar os parâmetros destes

modelos.

O modelo SPC é um modelo rígido, por conseguinte algumas propriedades

da água não podem ser calculadas. Por exemplo, os aspectos vibracionais só

poderão ser calculados se forem inseridos termos de flexibilidade na função de

energia potencial.

Finalmente um fator importante no momento de escolher o modelo é o custo

computacional. Deve-se tomar em conta que no processo da solvatação do

sistema, uma quantidade apreciável de água é inserida no mesmo. Um modelo

extremamente fino poderia tornar muito custosa a simulação.

2.11 Tratamento eletrostático da proteína

O tratamento eletrostático nos dá informação a respeito dos aspectos

funcionais das diferentes regiões da proteína, sobre a posição dos sítios de

interesses, sobre o componente eletrostático na energia de ligação do ligante, etc.

A grande maioria dos aminoácidos que constituem uma proteína interage

através de forças de longo alcance, essencialmente de natureza eletrostática. Os

campos elétricos gerados por proteínas estendem-se significativamente a uma

distância de 10-15 Å, dependendo de condições de temperatura, solvente e carga

elétrica da proteína (em maiores distâncias, as flutuações térmicas aleatórias do

solvente predominam sobre grande parte do efeito que o campo elétrico da

proteína pode exercer).

Desta forma, para entender as forças de atração-repulsão entre biomoléculas

é necessário compreender as leis da eletrostática que regem as interações

intermoleculares. Os fundamentos da física eletrostática são bem estabelecidos e

podem ser expressos concisamente por equações relativamente simples. Contudo,

a aparente simplicidade destas equações esconde algumas dificuldades conceituais

e numéricas da aplicação das mesmas ao estudo de sistemas complexos. Este é um

50

problema relevante devido à vasta quantidade de estruturas tridimensionais de

biomoléculas disponíveis recentemente.

2.11.1 Aplicação da Equação de Poisson-Boltzmann para o cá lculo de energias eletrostáticas em proteínas

Um sistema biomolecular sempre está rodeado de um meio o qual pode

estar composto de íons, estes íons interagem eletrostaticamente com a

biomolécula a qual poderia também ter carga elétrica.

Uma das aproximações que tem descrito com sucesso as interações

eletrostáticas em sistemas biomoleculares é a equação de Poisson-Boltzmann

(http://bessie.che.uc.edu/tlb/rctb6/rctb6.html).

)]]())(

exp[()]())(

exp[()([4))()(.( rvTk

rqqnrv

Tk

rqqnrrr

BB

rr

rr

rrrrr −+−−−+−=∇∇ −+φφρπφε

(33)

Onde o primeiro termo a direita da igualdade representa a contribuição pelas

cargas fixas na biomolécula e os outros termos representam a contribuição dos

íons móveis positivos e negativos respectivamente.

ε(r) : A constante dielétrica

Φ(r) : Potencial eletrostático

ρ(r) : Densidade de cargas na biomolécula

q: Carga de cada íon positivo ou negativo

n± : Densidade iônica

kB : Constante de Boltzmann

v(r): é 0 ou ∞ em regiões accessíveis ou inacessíveis para o íon.

Na aproximação de campo fraco, considerando-se um conjunto de cargas

em um meio de constante dielétrica uniforme e de baixa força iônica, a equação

33, pode ser escrita na forma a seguir:

51

)(4)()]()([. 2 rrkrrrrrr πρφεφε −=∇∇ (34)

Figura 2.13 Modelo para cálculo da superfície eletrostática na equação de Poisson-

Boltzmann (Gráfico obtido de http://agave.wustl.edu/)

Onde k é a constante de Debye-Hückel ou blindagem iônica do meio. A forma

da interface dielétrica e a exclusão de íons contidos no interior da proteína são

introduzidos no cálculo através da dependência das constantes ε e k do vetor r.

Em condições onde k = 0, íons estão ausentes e a Equação (34) pode ser reduzida

à equação de Poisson. Devido à diferença de polarizabilidade da água e do interior

da proteína, duas constantes dielétricas ε e εp são necessárias para representar

realisticamente o sistema (ver Fig. 2.14).

Figura 2.14 Constantes dielétricas que caracterizam os diferentes meios nos quais se

aplica a equação de Poisson-Boltzmann (Gráfico obtido e modificado de

http://agave.wustl.edu/).

52

2.12 Superfícies de interação molecular

Superfície acessível ao solvente

A superfície acessível ao solvente (SAS) de uma biomolécula é uma forma

de quantificar o efeito hidrofóbico, este conceito tem sua origem no trabalho de

Lee e Richards (Lee et al., 1971) no ano 1971. A área acessível ao solvente

descreve a área na qual o contato entre a proteína e o solvente ocorre.

A SAS é definida como o lugar geométrico dos centros de uma esfera de

prova (representando a molécula do solvente) como se esta rodasse sobre uma

superfície de van der Waals da proteína (Fig. 2.15).

Superfície molecular (ou superfície excluída do sol vente)

A superfície molecular (SM) é traçada pela frente interna da esfera de prova

(Fig. 2.15). Está composta de:

• Superfície de contato: a parte da superfície de van der Waals que

pode ser tocada pela esfera de prova.

• Superfície reentrante: formada pela frente interna da esfera de prova

quando esta está em contato com mais de uma molécula.

Figura 2.15 Esquema gráfico que mostra as definições de SAS e SM.

53

2.13

” Docking” Molecular - Algoritmo Genético

Nos estudos de “docking” fizemos uso do programa AUTODOCK (Morris

et al., 1998), que utiliza o Algoritmo Genético (do inglês, Genetic Algorithm,

GA), para otimizar a interação e descobrir os possíveis sítios de ligação entre as

porfirinas e o HSA. No programa AUTODOCK também foi implementado um

algoritmo genético modificado que introduz passos de busca conformacional local

entre cada passo, possibilitando que as mudanças fenotípicas (adaptações

conformacionais da molécula ao ambiente) possam ser adquiridas pelas próximas

gerações. Este híbrido do Algoritmo Genético é chamado de Algoritmo Genético

Lamarchiano (do inglês, Lamarchian Genetic Algorithm, LGA). O método de

busca local utilizado é baseado no algoritmo de otimização de Solis e Wets (SW)

(Solis e Wets, 1981).

Na terminologia desses algoritmos, uma solução candidata é chamada de

indivíduo e ao conjunto de indivíduos simultaneamente avaliados é dado o nome

de população. Inicia-se com uma população de conformações, orientações e

translações randômicas do ligante. Então o programa executa o número de

avaliações energéticas e gerações (iterações) requisitadas pelo usuário e seleciona

os indivíduos sobreviventes (os melhores adaptados). Uma taxa de mutação e

cruzamento é especificada e introduzida no problema a fim de possibilitar uma

melhor adaptação das gerações futuras (Sousa, 2005). Mais detalhes sobre o

Algoritmo Genético implementado podem ser encontrados no próprio manual do

AUTODOCK.

2.14 Correlação em dinâmica de biomoléculas

Movimentos correlacionados em sistemas moleculares são essenciais para a

função biomolecular, exemplos são os efeitos alostéricos e efeitos cooperativos.

Muitas vezes a função energética da proteína é dominada por contribuições

entrópicas que estão diretamente relacionadas a movimentos atômicos

correlacionados (Lange et al., 2006). A correta compreensão destes movimentos

54

correlacionados é importante para o entendimento da função da proteína e poderia

melhorar a interpretação dos experimentos de NMR e espalhamento de raios X.

Correlação é uma forma de medir quanto associadas ou relacionadas estão

duas variáveis. O propósito de fazer correlações é fazer predição acerca de uma

variável baseada no conhecimento de outra variável

Coeficientes de Correlação Generalizada

Os coeficientes de correlação generalizada estão baseados na formulação da

Mutua Informação de Kraskov, e residem na definição fundamental de

independência de variáveis aleatórias. A descrição que daremos ésta baseada no

trabalho desenvolvido por ele no ano 2004 (Kraskov et al., 2004). Segundo este

trabalho duas variáveis são independentes se e somente se a distribuição do

conjunto é um produto de suas distribuições marginais,

)()(),( YPXPYXP = (35)

a idéia é expressar a correlação como a diferença entre P(X,Y) e P(X)P(Y) (ver

Fig 2.16).

Figura 2.16 Correlação de variáveis aleatórias são definidas como a desviação de sua

distribuição de probabilidade (cinza) da distribuição de probabilidades das variáveis

aleatórias independentes (preto). (Gráfico obtido de Lange et al., 2006)

Isto equivale a definir a correlação C como a entropia de Shannon

(correlação total) (Lange et al., 2006).

],[][][],[ YXHYHXHYXC −+= (36)

55

onde H denota a entropia das variáveis aleatórias. Esta relação é equivalente a:

][][],[ YHXHYXH +≤ (37)

a qual é uma igualdade se e somente se as variáveis são independentes. Pode-se

observar que quando não existe correlação entre as variáveis X e Y, C[X,Y]=0,

caso contrário tem um valor positivo.

A matrix de correlacào esta formado pelos coeficientes de corrrelacão e nos

forneceria informacão sobre como estan relacionadas as diferentes regiones da

proteina.

2.15 Aproximação Quântica - Teoria do Funcional de Densi dade ( DFT)

Porque usamos o método DFT (do inglês Density Funtional Theory) em

nossos cálculos com as Porfirinas?

A aproximação de Hartree - Fock (HF) descreve a função de onda de N

elétrons por um determinante simples construído de orbitais ocupados, os quais

são variacionalmente determinados minimizando-se a energia. Este cálculo não

incorpora a correlação eletrônica e não é adequado para descrever compostos com

metais de transição (Margulis et al., 2002).

A precisão do método DFT comparado com HF é muito melhor (Ghosh et

al., 2003; Himo et al., 2003, Siegbanhn et al., 2000). Neste tipo de cálculo, a

densidade eletrônica tem um papel central porque a energia e as propriedades

moleculares são derivadas da densidade. A expressão para a energia incorpora a

correlação eletrônica através do termo de correlação de intercâmbio. A aplicação

do DFT precisa de um funcional de intercâmbio adequado e de uma base

adequada. Na literatura há muitos funcionais desde a Aproximacão de Densidade

Local (local density approximation, LDA), passando por funcionais de gradiente

corrigido (generalized gradient approximation, GGA) e funcionais híbridos (com

mistura de HF e termos de intercâmbio) para formas mais avançadas.

Alguns destes funcionais são derivados de primeiros princípios, outros

envolvem uma calibração semi-empírica ajustada a dados teóricos ou

experimentais. Na prática, funcionais de gradiente corrigidos tais como BP86,

BLYP e BPW91 são aplicados adequadamente a espécies enzimáticas. Sem

dúvida, os funcionais híbridos como B3LYP ou B3PW91 (Ghosh et al., 2003;

56

Himo et al., 2003) estão entre os mais usados. Em particular, B3LYP tem tido

êxito ao reproduzir valores experimentais de entalpias de formação com desvio

médio absoluto de 3 kcal.mol-1 (Curtiss et al., 2000). B3LYP cálcula muito bem

um número de outras propriedades (Siegbanhn et al., 2000) ainda que não

reproduza bem as barreiras de reação. B3LYP é geralmente o método preferido

para um cálculo DFT em sistemas biológicos e na investigação de precursores e

derivados do heme (Ghosh et al., 2003; Himo et al., 2003).

2.15.1 Introdução à DFT

A teoria do Funcional de Densidade está baseada na noção de que a

energia total, E, de um sistema eletrônico é determinado pela distribuicão da

densidade eletrônica.

Os tempos de computação nos diferentes métodos baseados em HF escalam

como n4 a n6 onde n é o número de elétrons no sistema estudado. Neste aspecto, o

método DFT é mais bem sucedido porque tem a vantagem de o tempo de

computação escalar com ~ n3.

Os métodos ab initio baseados no formalismo HF dão precisões de 0,2 Å

para as distâncias de ligação, mas estes métodos têm sido menos bem sucedidos

nos cálculos que envolvem metais de transição (Lüthi et al., 1982). Os parâmetros

geométricos calculados por métodos DFT têm mostrado, há mais de duas décadas,

uma razoável aproximação com os experimentos através das distâncias de ligação

(Dunlap et al., 1986).

A Teoria do Funcional de Densidade é uma aproximação de muito êxito

para a descrição de estados fundamentais de metais, semicondutores, moléculas,

etc.

A idéia principal é descrever um sistema de férmions interagentes via

densidade e não via função de onda de muitos corpos. Para N elétrons em um

sólido, que obedecem ao princípio de Pauli, isto significa que a variável básica

dos sistemas depende das coordenadas espaciais x, y, e z em vez de 3N graus de

liberdade (aproximação de Thomas-Fermi). Desta forma, a energia total passa a

ser escrita como um funcional E[ρ(r)].

A DFT considera o termo de correlação eletrônica no potencial. Os elétrons

se movem tentando evitar a interação eletrônica e assim existem zonas dentro das

57

quais os elétrons não podem penetrar. Isto é chamado o buraco da correlação de

intercâmbio e vai dar o termo de intercâmbio (Energia de Intercâmbio) (Ziegler et

al., 1991; Gritsenko et al., 1997).

2.15.2 Descrição da teoria

Os métodos tradicionais estão baseados nas funções de onda de muitos

elétrons, uma das ventagems do metodo DFT é substituir a função de onda

eletrônica de muitos corpos pela densidade eletrônica. A implementação mais

comum da teoria é através do método de Kohn-Sham (Kohn et al., 1965), que

reduz o sistema a um conjunto de elétrons interagentes num potencial efetivo. O

potencial efetivo inclui o potencial externo e a interação de Coulomb. Modelar as

últimas duas interações é o problema, sendo a aproximação

Documents

Teobaldo Ricardo Cuya Guizado ESTUDOS COMPUTACIONAIS DA INTERAÇÃO …livros01.livrosgratis.com.br/cp063469.pdf · 1.1.2 A albumina Serica Humana 22 1.2 Objetivos 26 1.3 Estrutura