21
1ª Escola de Bioinformática Estrutural da Ulbra 2010 versão atualizada 2011 Curso Simulações por Dinâmica Molecular Prof. Hermes Luís Neubauer de Amorim - [email protected] Rúbia Raubach Trespach - [email protected] Luis Andre Baptista - [email protected] (Laboratório de Bioinformática Estrutural - LaBiE - ULBRA) Prof. Paulo Augusto Netz - [email protected] (Grupo de Química Teórica - GQT - UFRGS) Canoas, agosto de 2011 Tutorial Simulação da dinâmica molecular do complexo ternário entre uma fosfolipase A2 e a aspirina Nesta prática, iremos usar o pacote GROMACS 4.0 para simular o complexo ternário entre uma fosfolipase A2 de veneno de serpente e a aspirina. Fosfolipases A2 (FLA2) catalisam a hidrólise da posição sn-2 de glicerofosfolipídios de membrana, produzindo 1-acilfosfolipidios e ácidos graxos livres. Esta reação é particularmente importante quando o ácido graxo gerado é o ácido araquidônico, já que este último é convertido

Dinâmica Complexo

Embed Size (px)

Citation preview

Page 1: Dinâmica Complexo

1ª Escola de Bioinformática Estrutural da Ulbra

2010

versão atualizada 2011

Curso

Simulações por Dinâmica Molecular

Prof. Hermes Luís Neubauer de Amorim - [email protected]

Rúbia Raubach Trespach - [email protected]

Luis Andre Baptista - [email protected]

(Laboratório de Bioinformática Estrutural - LaBiE - ULBRA)

Prof. Paulo Augusto Netz - [email protected]

(Grupo de Química Teórica - GQT - UFRGS)

Canoas, agosto de 2011

Tutorial

Simulação da dinâmica molecular do complexoternário entre uma fosfolipase A2 e a aspirina

Nesta prática, iremos usar o pacote GROMACS 4.0 para simular o complexo ternárioentre uma fosfolipase A2 de veneno de serpente e a aspirina. Fosfolipases A2 (FLA2)catalisam a hidrólise da posição sn-2 de glicerofosfolipídios de membrana, produzindo1-acilfosfolipidios e ácidos graxos livres. Esta reação é particularmente importantequando o ácido graxo gerado é o ácido araquidônico, já que este último é convertido

Page 2: Dinâmica Complexo

por enzimas metabólicas em vários compostos bioativos (eicosanoides), tais como asprostagrandinas e os leucotrienos. Outros produtos da reação, por exemplo ácidolisofosfatídico e lisofosfatidilcolina, também são biologicamente ativos, sendoprecursores de outros potentes mediadores bioativos, tais como o fator de ativaçãoplaquetária (PAF). Há evidências de que a ação anti-inflamatória da aspirina decorre,em parte, da inibição de enzimas da família FLA2.

Primeiro, faremos o download da estrutura do complexo enzima-fármaco a partir dobanco de dados Protein Data Bank (PDB). A estrutura do complexo que iremos estudarfoi determinada através de cristalografia de raio-X, a uma resolução de 1,9 Å. Paramaiores detalhes, a referência primária para esta estrutura é: Singh, RK et al. “Aspirininduces its anti-inflammatory effects through its specific binding to phospholipase A2:crystal structure of the complex formed between phospholipase A2 and aspirin at 1.9angstroms resolution” J. Drug Target 2005, 13(2):113-9 (PubMed).

Após, iremos gerar os arquivos de topologia e de entrada para o programa. A seguir, aestrutura será hidratada e procede-se a uma minimização da energia. As etapasseguintes são uma simulação com restrição de posições e uma simulação dinâmicamolecular propriamente dita, para explorar as propriedades termodinâmicas eestruturais do sistema.

1.1 Recuperando a estrutura cristalográfica do complexo enzima-fármaco

Antes de mais nada, abra um terminal (com o cursor sobre a área do Desktop, cliquecom o botão direito do mouse - escolha a opção Terminal ou Konsole) e crie uma pastacom seu nome no diretório /home/visit/mini6/

Page 3: Dinâmica Complexo

mkdir seunome

vá para a pasta criada

cd seunome

Obtenha a estrutura da proteína complexo entre a fosfolipase A2 e a aspirina, códigopdb (PDB ID) 1OXR do endereço do PDB. Para isto, digite o PDB ID na áreacorrespondente de busca do site do Protein Data Bank. Uma vez encontrada aestrutura, faça download do arquivo PDB, da área de download files, localizada nocanto superior direito da página - opção PDB File (Text). Clique com o botão direito domouse no link para armazenar o arquivo na pasta com o seu nome(/home/visit/mini6/seunome). Mude o nome do arquivo baixado para pla2complx.pdb.

1.2 Preparando o ligante

O programa GROMACS gera a topologia e as coordenadas para a simulação de DMsomente de moléculas que estão parametrizadas em seu banco de dados. Assim, atopologia e as coordenadas da aspirina devem ser obtidas a partir de um outroprograma, o PRODRG.

Primeiro, precisamos extrair as coordenadas do ligante (aspirina) no arquivopla2complx.pdb.

Abra o arquivo pla2complx.pdb com um editor de texto qualquer. Por exemplo:

gedit pla2complx.pdb

Role até a parte final do arquivo. Selecione e copie as coordenadas da estrutura daaspirina (linhas que começam com HETATM..........AIN), destacadas abaixo:

Page 4: Dinâmica Complexo

Utilizando um navegador de internet, vá até a página do servidor PRODRG, e cole ascoordenadas do fármaco na janela de input.

Page 5: Dinâmica Complexo

Antes de prosseguir, selecione No na opção EM (minimização de energia).

Depois, clique em Run PRODRG.

Na janela que abre, localize o campo “Coordinates” e clique em “polar/aromatic H's”

Page 6: Dinâmica Complexo

Selecione e copie as coordenadas da aspirina no formato GROMACS.

Sem fechar o navegador, abra um documento em branco no editor de texto e cole ascoordenadas copiadas previamente. Salve o arquivo como ain.gro

Volte à página do PRODRG. Role para cima e, no campo “Docking / MD simulations”,clique na opção “GROMACS [D] (topology)”.

Selecione e copie a topologia da aspirina no formato GROMACS.

No editor de texto, abra um documento em branco e cole a topologia.

Salve o arquivo como ain.itp

Page 7: Dinâmica Complexo

Um problema nos arquivos de topologia obtidos a partir do PRODRG são as cargasatômicas geradas pelo programa. Compare abaixo as cargas geradas para a aspirinapelo PRODRG com as cargas geradas com o método ab initio CHELPG 6-31G**(d,p).

Estrutura Átomo CargasPRODRG

CargasCHELPG

O1

C7

O2

C3

C4

H4

C5

H5

C6

H6

C1

H1

C2

O3

C8

O4

C9

-0.255

0.396

-0.255

-0.001

0.012

0.046

0.012

0.045

0.007

0.026

0.007

0.026

0.092

-0.097

0.231

-0.407

0.115

-0.857

0.966

-0.857

-0.178

-0.062

0.117

-0.175

0.086

-0.068

0.082

-0.304

0.126

0.431

-0.558

0.995

-0.667

-0.074

Page 8: Dinâmica Complexo

Neste caso, é necessário substituir as cargas atômicas no arquivo ain.itp por cargasmelhores.

Em função do tempo reduzido, já preparamos um arquivo de topologia do ligante comcargas CHELPG 6-31G**(d,p). Ele está identificado na pasta "tutorial"(/home/visit/mini6/tutorial/) com o nome ain_c.itp.

Assumindo que você está na pasta criada com seu nome, digite no terminal:

cd ../tutorial

Copie o arquivo ain_c.itp para sua pasta

cp ain_c.itp ../seunome

Volte para sua pasta

cd ../seunome

1.3 Gerando a topologia e as coordenadas da proteína no formato GROMACS apartir do arquivo .pdb

Já que o programa GROMACS não gera a topologia e as coordenadas para moléculasque não sejam aminoácidos ou nucleotídeos, é necessário remover as coordenadas doligante no arquivo que contém a estrutura da proteína.

Para tanto, abra o arquivo pla2complx.pdb no editor de texto.

Delete as coordenadas da aspirina (linhas que começam com AIN) e as coordenadasque seguem (águas cristalográficas), até o final do arquivo. Salve o arquivo com ascoordenas removidas com o nome pla2livre.pdb.

No terminal, use o programa pdb2gmx, do pacote do GROMACS, para gerar o arquivode topologia (extensão top) e o arquivo de entrada do programa, com as coordenadascartesianas da proteína (extensão gro).

g_pdb2gmx -f pla2livre.pdb -o pla2livre.gro -p pla2livre.top

pdb2gmx -f pla2livre.pdb -o pla2livre.gro -p pla2livre.top -ff gromos53a6 -water none

O programa pede a escolha do campo de forças. Escolha GROMOS96 53a6 (opção13, em seguida selecione 1).

Examine o arquivo pla2livre.top abrindo-o com o editor de texto.

Page 9: Dinâmica Complexo

Agora, é necessário acrescentar a topologia do ligante com as cargas corrigidas(ain_c.itp) no arquivo de topologia geral (pla2livre.top). Também é necessário colar ascoordenadas da aspirina no formato GROMACS (ain.gro) no arquivo que contém ascoordenadas da fosfolipase A2 (pla2livre.gro).

Abra o arquivo pla2livre.top com o editor de texto. Vá até a parte final do arquivo eacrescente as linhas que incluem a topologia do ligante, conforme destacado abaixo.

Salve o arquivo como pla2complx.top.

Abra o arquivo ain.gro e selecione e copie as coordenadas da aspirina.

Page 10: Dinâmica Complexo

Abra o arquivo pla2livre.gro com o editor de texto. Altere o número que consta nasegunda linha do arquivo para 1206 (número de coordenadas).

Depois, role até a parte final do arquivo e cole as linhas que incluem as coordenadasdo ligante, conforme destacado abaixo.

Page 11: Dinâmica Complexo

Salve o arquivo como pla2complx.gro.

1.4 Inserindo as condições periódicas de contorno e solvente

A seguir, definimos o sistema como centrado numa caixa cúbica, cujas faces distam nomínimo 1,0 nm da proteína. Esta caixa será então “preenchida” com moléculas de água(do tipo SPC). O arquivo de topologia é alterado e é gerado um novo arquivo decoordenadas, desta vez contendo proteína e água. Use o programa vmd paravisualizar a estrutura final obtida.

g_editconf -bt cubic -f pla2complx.gro -o pla2complx.gro -c -d 1.0

g_genbox -cp pla2complx.gro -cs spc216.gro -o pla2complx_box.gro -p pla2complx.top

tail pla2complx_box.gro

editconf -bt cubic -f pla2complx.gro -o pla2complx.gro -c -d 1.0

genbox -cp pla2complx.gro -cs spc216.gro -o pla2complx_box.gro -p pla2complx.top

tail pla2complx_box.gro

Page 12: Dinâmica Complexo

Também é possível solvatar o complexo com outro solvente, como metanol, DMSO,tetracloreto de carbono, etc.

1.5 Minimização de energia

A próxima etapa é a minimização de energia. A maior parte das ações do GROMACSutiliza a combinação dos programas grompp e mdrun. O primeiro utiliza parâmetroscontidos num arquivo editável de extensão mdp para produzir um arquivo binário deextensão tpr, o qual irá servir de entrada ao programa mdrun. Na minimização,usamos um arquivo em.mdp, disponibilizado na pasta tutorial.

Para obtê-lo, digite no terminal:

cd ../tutorial

Copie o arquivo em.mdp para sua pasta

cp em.mdp ../seunome

Volte para sua pasta

cd ../seunome

Analise o arquivo em.mdp:

cpp = /lib/cppdefine = -DFLEX_SPCconstraints = noneintegrator = steepnsteps = 500;; Energy minimizing stuff;emtol = 2000emstep = 0.01nstcomm = 1ns_type = gridrlist = 1rcoulomb = 1.0rvdw = 1.0Tcoupl = noPcoupl = nogen_vel = no

Page 13: Dinâmica Complexo

Rode em seqüência os programas grompp e mdrun, como a seguir:

g_grompp -v -f em.mdp -c pla2complx_box.gro -o pla2complx_em.tpr -p pla2complx.top

grompp -v -f em.mdp -c pla2complx_box.gro -o pla2complx_em.tpr -p pla2complx.top

(este comando gera o arquivo binário "em.tpr", que contém as informações - arquivos deinput - sobre as coordenadas iniciais - arquivo "pla2complx_box.gro" -, a topologia -arquivo "pla2complx.top" - e os parâmetros do cálculo - arquivo "em.mdp")

g_mdrun -v -s pla2complx_em.tpr -o pla2complx_em.trr -c pla2complx_em.gro -g emlog

(este comando roda a minimização de energia; o flag –v ativa o método verbose; o flag –saponta para o arquivo criado pelo grompp, com extensão .tpr; o flag –c indica no nome doarquivo final com as coordenadas minimizadas; o flag –o indica no nome do arquivo desaída com a trajetória da minimização de energia, o qual não é importante para cálculosdeste tipo)

O cálculo termina quando a minimização converge ou quando o número de passos previamenteestabelecido atinge o limite.

1.6 Dinâmica molecular com restrição de posições

A próxima etapa é a dinâmica molecular com restrição de posições (position restraints)na qual a macromolécula é restrita, mas as moléculas de solvente têm liberdade demovimento. Uma dinâmica de 1,0 ps com estas condições leva a uma relaxação dasinterações desfavoráveis soluto-solvente. Crie, com os parâmetros abaixorelacionados, um arquivo de nome pr.mdp.

Analise o arquivo pr.mdp disponibilizado para o tutorial:

title = Yocpp = /lib/cppdefine = -DPOSRESconstraints = all-bondsintegrator = md

Page 14: Dinâmica Complexo

dt = 0.002 ; ps !nsteps = 500 ; total 1 ps.nstcomm = 1nstxout = 250nstvout = 1000nstfout = 0nstlog = 100nstenergy = 100nstlist = 10ns_type = gridrlist = 1.0coulombtype = PMErcoulomb = 1.0vdwtype = cut-offrvdw = 1.4fourierspacing = 0.12fourier_nx = 0fourier_ny = 0fourier_nz = 0pme_order = 4ewald_rtol = 1e-5optimize_fft = yes; Berendsen temperature coupling is on in three groupsTcoupl = berendsentau_t = 0.1 0.1 0.1 0.1tc_grps = Protein SOL AIN CAref_t = 100 100 100 100; Pressure coupling is not onPcoupl = parrinello-rahmanpcoupltype = isotropictau_p = 0.5compressibility = 4.5e-5ref_p = 1.0; Generate velocites is on at 100 K.gen_vel = yesgen_temp = 100.0gen_seed = 173529

A seguir, rode os programas grompp e mdrun:

g_grompp -f pr.mdp -o pla2complx_pr.tpr -c pla2complx_em.gro -r pla2complx_em.gro -p pla2complx.top

Page 15: Dinâmica Complexo

(este comando gera o arquivo binário "pr.tpr", que contém as informações sobre as coordenadas iniciais, obtidas no final da minização de energia - arquivo "pla2complx_em.gro" -, a topologia - aquivo "pla2complx.top" - e os parâmetros do cálculo - aquivo "pr.mdp")

g_mdrun -v -s pla2complx_pr.tpr -e pla2complx_pr.edr -o pla2complx_pr.trr -c pla2complx_pr.gro -g prlog >& pr.job &

(este comando roda a DM com restrição de posições; o flag –c indica no nome do arquivofinal da simulação; o flag –o indica no nome do arquivo de saída com a trajetória dasimulação; o flag –e indica no nome do arquivo de saída com a trajetória das energias)

tail -f pr.job

para matar o comando tail, tecle simultaneamente Ctrl C

Analise a energia da simulação

g_energy -f pla2complx_pr.edr -o out -w

9

0

O resultado desta simulação pode ser visualizado como programa VMD

vmd pla2complx_pr.gro

Visualização com o programa VMD

Na janela VMD Main clique em Graphics e depois em Representations

No campo Selected Atoms digite protein e depois tecle Enter

Em Drawing Method escolha NewCartoon

Em Coloring Method escolha Secondary Structure

Clique em Create Rep

Page 16: Dinâmica Complexo

No campo Selected Atoms digite resname CA e depois tecle Enter

Em Drawing Method escolha Licorice

Em Coloring Method escolha Name

Clique em Create Rep

No campo Selected Atoms digite resname AIN e depois tecle Enter

Em Drawing Method escolha Licorice

Clique em Apply

1.7 Dinâmica molecular sem restrições

A última etapa da simulação consiste na dinâmica molecular propriamente dita, na qualtodos os graus de liberdade são amostrados. O arquivo de parâmetros correspondentetem o nome 100ps.mdp.

Para obtê-lo, digite no terminal

cd ../tutorial

Copie o arquivo 100ps.mdp para sua pasta

cp 100ps.mdp ../seunome

Volte para sua pasta

cd ../seunome

Analise o arquivo 100ps.mdp disponibilizado para o tutorial:

title = fwscpp = /usr/bin/cppconstraints = all-bondsintegrator = md

Page 17: Dinâmica Complexo

tinit = 0dt = 0.002 ; ps !nsteps = 50000 ; total 100 ps.nstcomm = 1nstxout = 500nstvout = 0nstfout = 0nstlog = 100nstenergy = 100nstlist = 10ns_type = gridrlist = 1.0coulombtype = PMErcoulomb = 1.0vdwtype = cut-offrvdw = 1.4fourierspacing = 0.12fourier_nx = 0fourier_ny = 0fourier_nz = 0pme_order = 4ewald_rtol = 1e-5optimize_fft = yes; Berendsen temperature coupling is on in three groupsTcoupl = berendsentau_t = 0.1 0.1 0.1 tc_grps = Protein SOL AINref_t = 300 300 300; Pressure coupling is onPcoupl = parrinello-rahmanpcoupltype = isotropictau_p = 0.5compressibility = 4.5e-5ref_p = 1.0; Generate velocites is on at 300 K.gen_vel = yesgen_temp = 300.0gen_seed = 173529

O uso seqüencial dos programas grompp e mdrun completa a simulação:g

g_grompp -f 100ps.mdp -o pla2complx_100ps.tpr -c pla2complx _pr.gro -p pla2complx.top

g_mdrun -v -s pla2complx_100ps.tpr -e pla2complx_100ps.edr -o pla2complx_100ps.trr -c

Page 18: Dinâmica Complexo

pla2complx_100ps.gro -g 100pslog >& 100ps.job &

tail f 100ps.job

para encerrar o programa tail, tecle simultaneamente Ctrl C

Atenção! feche o terminal digitando exit (não utilize o mouse)

1.8 Análise das simulações

Há diferentes âmbitos de resultados da simulação:

Visualização da dinâmica:

vmd pla2complx_100ps.gro

Visualização da estrutura com o programa VMD

Proceda como anteriormente

Visualização de trajetória com o programa VMD

Na janela VMD Main clique sobre pla2complx_100ps.gro de forma a linhafique verde

Em File escolha Load Data Into Molecule...

No campo Filename use Browse para selecionar o arquivopla2complx_100ps.trr

Selecione Ok e, em seguida Load

clique em Graphics e depois em Representation s

No campo Selected Atoms digite protein e depois tecle Enter

Em Drawing Method escolha NewCartoon

Page 19: Dinâmica Complexo

Em Coloring Method escolha Secondary Structure

Na janela VMD Main, clique no botão Play localizado no canto inferiordireito

Análise da energia.

g_energy -f pla2complx_100ps -o pla2complx100ps_ene (com a escolha dos termos adequados)

Obs: os arquivos .xvg podem ser visualizados com o programa xmgrace:

xmgrace pla2complx100ps_ene.xvg (e similar para os outrosarquivos)

Análise da evolução da estrutura média através do desvio médio quadrático (RMSD) das posições atômicas:

g_rms -s pla2complx_pr -f pla2complx_100ps -o pla2complx100ps_rmsd (escolha o grupo carbono-alfa, 3, em ambas opções)

xmgrace pla2complx100ps_rmsd.xvg

O RMSD convergiu no tempo simulado? Caso contrário, o que isto significa?

Análise do raio de giro:

g_gyrate -s pla2complx_pr -f pla2complx_100ps -o pla2complx100ps_rg (escolha o grupo proteína, 1)

xmgrace pla2complx100ps_rg.xvg

O raio de giro mudou durante a simulação?

Análise da mobilidade relativa de segmentos:

g_rmsf -s pla2complx_pr -f pla2complx_100ps -res -o pla2complx100ps_rmsf (escolha ogrupo proteína, 1)

Page 20: Dinâmica Complexo

xmgrace pla2complx100ps_rmsf.xvg

Quais segmentos são mais flexíveis durante a simulação?

Análise do gráfico de Ramachandran:

g_rama -s pla2complx_pr -f pla2complx_100ps -o pla2complx100ps_rama

xmgrace pla2complx100ps_rama.xvg

Análise da superfície acessível ao solvente (SAS):

g_sas -s pla2complx_pr -f pla2complx_100ps -o pla2complx100ps_sas (escolha o grupo proteína, 1, duas vezes)

xmgrace pla2complx100ps_sas.xvg

Análise das ligações de hidrogênio:

g_hbond -s pla2complx_100ps -f pla2complx_100ps -num pla2complx100ps_hbintra (escolha o grupo proteína, 1, duas vezes)

xmgrace pla2complx100ps_hbintra.xvg

g_hbond -s pla2complx_100ps -f pla2complx_100ps -num pla2complx100ps_hbprotein-drug (proteína-ligante; escolha o grupo proteína, 1, e depois ligante, 13)

xmgrace pla2complx100ps_hbprotein-drug.xvg

1.8.1 Comparação das formas livre e complexada da PLA2

Usando o xmgrace, abra os arquivos .xvg para as duas simulações e interprete umapossível influência do ligante sobre a estrutura e a conformação da enzima.

Geração de gráficos com xmgrace

Abrir o arquivo com

xmgrace –nxy nome.xvg

Page 21: Dinâmica Complexo

FILE

PRINT SETUP

Escolher formato (DEVICE)

Escolher nome do arquivo de saída

APPLY

ACCEPT

FILE

PRINT

Tabela dos nomes dos aminoácidos

Nome Símbolo Abreviação Glicina ou Glicocola Gly, Gli G Alanina Ala A Leucina Leu L Valina Val V Isoleucina Ile I Prolina Pro P Fenilalanina Phe ou Fen F Serina Ser S Treonina Thr, The T Cisteina Cys, Cis C Tirosina Tyr, Tir Y Asparagina Asn N Glutamina Gln Q Aspartato ou Ácido aspárticoAsp D Glutamato ou Ácido glutâmico

Glu E

Arginina Arg R Lisina Lys, Lis K Histidina His H Triptofano Trp, Tri W Metionina Met M

Fonte: wikipedia