Model agem, Avaliação, Modificação e Seleção de Estruturas de Proteínas

Preview:

DESCRIPTION

UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA MESTRADO EM CIÊNCIA DA COMPUTAÇÃO. Model agem, Avaliação, Modificação e Seleção de Estruturas de Proteínas. Projeto de Pós-Graduação. Aluno Erico Souza Teixeira | Orientadora Katia Silva Guimarães. PROTEÍNAS. Conceitos. - PowerPoint PPT Presentation

Citation preview

Modelagem, Avaliação, Modificação e Seleção de Estruturas de Proteínas

Projeto de Pós-Graduação

UNIVERSIDADE FEDERAL DE PERNAMBUCOCENTRO DE INFORMÁTICA

MESTRADO EM CIÊNCIA DA COMPUTAÇÃO

Aluno Erico Souza Teixeira | Orientadora Katia Silva Guimarães

PROTEÍNAS

Conceitos

Citosina | Guanina Adenina | Timina

PROJETO

Área de Desenvolvimento

• BioInformática– Química Computacional

• Modelagem Molecular

• Descoberta das estruturas 3D

O Problema

• Construção de um modelo 3D de uma proteína a partir da seqüência primária

O Problema

>gi|532319|pir|TVFV2E|TVFV2E envelope proteinELRLRYCAPAGFALLKCNDADYDGFKTNCSNVSVVHCTNLMNTTVTTGLLLNGSYSENRTQIWQKHRTSNDSALILLNKHYNLTVTCKRPGNKTVLPVTIMAGLVFHSQKYNLRLRQAWCHFPSNWKGAWKEVKEEIVNLPKERYRGTNDPKRIFFQRQWGDPETANLWFNCHGEFFYCKMDWFLNYLNNLTVDADHNECKNTSGTKSGNKRAPGPCVQRTYVACHIRSVIIWLETISKKTYAPPREGHLECTSTVTGMTVELNYIPKNRTNVTLSPQIESIWAAELDRYKLVEITPIGFAPTEVRRYTGGHERQKRVPFVXXXXXXXXXXXXXXXXXXXXXXVQSQHLLAGILQQQKNLLAAVEAQQQMLKLTIWGVK

ATOM 145 N VAL A 25 32.433 16.336 57.540 1.00 11.92 A1 N

ATOM 146 CA VAL A 25 31.132 16.439 58.160 1.00 11.85 A1 C

ATOM 147 C VAL A 25 30.447 15.105 58.363 1.00 12.34 A1 C

ATOM 148 O VAL A 25 29.520 15.059 59.174 1.00 15.65 A1 O

ATOM 149 CB AVAL A 25 30.385 17.437 57.230 0.28 13.88 A1 C

ATOM 150 CB BVAL A 25 30.166 17.399 57.373 0.72 15.41 A1 C

ATOM 151 CG1AVAL A 25 28.870 17.401 57.336 0.28 12.64 A1 C

ATOM 152 CG1BVAL A 25 30.805 18.788 57.449 0.72 15.11 A1 C

ATOM 153 CG2AVAL A 25 30.835 18.826 57.661 0.28 13.58 A1 C

ATOM 154 CG2BVAL A 25 29.909 16.996 55.922 0.72 13.25 A1 C

O Problema

• Importância– Funcionalidade de uma proteína está

relacionada com sua estrutura 3D– Desenvolvimento de novos medicamentos– Descobrir estruturas de outras proteínas

• Situação atual– 1/6 das seqüências tem estrutura conhecida– Swiss-Prot (155576) X PDB (26403 )

Atacando o problema

• Métodos experimentais– Estático

• cristalografia de raios-X

– Dinâmico• técnicas de ressonância nuclear magnética

Atacando o problema

• Aplicações teóricas– métodos físicos

• ab initio

– métodos empíricos• threading

• homologia

Homologia

busca e seleção dos templates

alinhamento alvo-template

construção do modelo

avaliação do modelo

fim

Atacando o problema

• Precisões

Experimentais (o.3 - o.5Å )

Físicos (3.5Å )

Empíricos (1.oÅ )

Atacando o problema

• Dificuldades– Experimentais

• Tempo

• Equipamentos e laboratórios especializados

– Teóricos• Manuseio com diversos programas (entrada/saída,

interfaces)

• Precisão

Melhorando a Precisão

• Avaliadores– Indicam possíveis regiões problemáticas– Metodologia baseada em conhecimento prévio

• Interações não covalentes entre os átomos de C-O-NFreqüências de interações: janela e uma distância

• Propriedades estereoquímicas (ângulos e distância de ligação, Ramanchandran Plot, ângulos diedros das cadeias laterais, ...)Morris et al. (1992) e Engh & Huber (1991)

• Interações entre os átomosCálculo de Energia potencial

Melhorando a Precisão

• Criando Novas Conformações– Modelos de uma seqüência polipeptídica próximos

da estrutura nativa– Coordenadas Cartesianas dos Cα

• estágios iniciais da difração de raios-X• seqüências do PDB• Analítica• Baseado em conhecimento• Minimização de energia

– Ângulos de torção Φ (phi), ψ (psi)• Construir a geometria ideal da proteínas

Seleção dos Modelos

• Métodos– Campos de força

• Equações de potenciais de energia• Termos não-ligados (interações de Lennard-Jones e

Coulomb )• Ligados (distância das ligações, ângulos de ligação,

ângulos diedros)• Restrições de posição e de distância

– Baseados em conhecimento • Ou potenciais estatísticos• Função de pontuação

O Projeto

• Definição– eliminação defeitos presentes nas estruturas de

proteínas originadas da modelagem por homologia

– Construir, avaliar, modificar e selecionas as melhores conformações

O Projeto

Modelagem

Avaliação da estrutura

Construção das conformações

Seleção das regiões

defeituosas

Estrutura primária da proteína

Estrutura terciária da proteína

Novos modelos

Modelo final

OUTROS PROJETOS

Modelagem

• MODELLER– Interface da Accelrys– Nenhum estudo de automatização do processo

Avaliadores

• 3 tipos de avaliadores– Estereoquímicas– Energia potencial– Propriedades não presentes no processo de

modelagem

• Não há um projeto de relacionamento

Criando novas conformações

• Analítico– 2-3 resíduos

• RAPPER e PETRA– Ab initio

• FREAD– Baseado em conhecimento prévio– 3-8 resíduos

• CODA– Combinação entre o FREAD e PETRA

• Não há aplicação em “mundo real”

Seleção de estruturas

• Comparação entre– Campos de Força (CHARMM)– Potenciais estatísticos– RMSD Cα– Choque de energia das cadeias laterais

• Problemas– Seleção empírica– Sob modelos originados de processos

experimentais

Como Resolver o Problema

Ferramentas Aplicadas

• Modelagem– MODELLER

• Projeto na graduação

• Mais conhecida

• Bom material teórico

Ferramentas Aplicadas

• Avaliadores– PROCHECK– ANoLEA– ProSa– PROVE

Ferramentas Aplicadas

• Criação das conformações– Ab initio– Ângulos de torção Φ (phi), ψ (psi)

• Seleção das Conformações– TINKER– Campo OPLSAA

Linguagens de Programação

• Perl– Saídas das ferramentas apresentavam um

formato ASCII– Projetos em iniciação científica

• Java– Orientada o objeto– Não dominava a linguagem C++

Entrada/Saída

O Projeto

CODIGO=<"CODIGO">

MODELLER=<on/off>

SEQUENCIA=<"SEQUENCIA">

TEMPLATES=

INICIO=

FIM=

NOME=

ORIGEM=

SEARCH=<no/yes/only>

AVALIADOR3D=<on/off>

PDB=default

ANOLEA=1

PROCHECK=1

PROSA=1

PROVE=1

WINDOW=5

CONFORMACOES=<on/off>

PDB=default

ANOLEA=0

PROCHECK=0

PROSA=0

PROVE=0

WINDOW=5

AUTOMATIC=yes/no

Exemplo

Modelagem

• Search

• Tabela de seqüências similares

Modelagem

• Download dos arquivos PDB

• Alinhamento entre as estruturas e a seqüência alvo

• Construção da Árvore de Distância

Modelagem

• Construção de 5 modelos

• Seleção pela menor energia

Avaliadores

• Escolha dos pesos para cada uma das ferramenta

• Execução

• Cálculo da região de maior pontuação

Construção das estruturas

Há 1000 conformações no conjunto final?

sim

Sai do algoritmo

não Retira uma conformação da fila

Insere o próximo resíduo

Após 25 tentativas

Conformação recusada

Tem o tamanho da região – 1?

Insere a nova e a antiga conformação

na fila

não

sim

Aproximação entre o dummy e a

penúltima âncora

Insere a última âncora

Não houve choques

Insere a nova conformação no conjunto final e a antiga

na fila

Houve choques

Construção das Estruturas

Seleção da melhor conformação

• Construção das cadeias laterais

• Validação dos choques

• Cálculo da energia sem minimização

• Escolha das 50 com menor energia

• Cálculo do campo de força com minimização

• Seleção daquela que apresenta a menor energia

Alternativas

Modelagem

• Construção de interface que permita– Alterar os alinhamentos– Visualizar agrupamentos das seqüências

similares

• Função de pontuação para a seleção automática ou classificação dos templates

Avaliadores

• Clustering da informação– Associar os tipos usados como modelos de cada

ferramenta com os templates da homologia– Determinar uma função de pontuação de acordo

com as famílias de proteínas

Construção de conformações

• Inserir parcelas de campos de força como filtro de construção

• Aplicação de análises originados de estruturas representativas do PDB– Ab initio + conhecimento prévio

Seleção das conformações

• Aplicação de outros campos de força de acordo com a famílias dos templates

Docking

• Aplicação dos campos de força

• Busca dos sítios ativos

Modelagem, Avaliação, Modificação e Seleção de Estruturas de Proteínas

Projeto de Pós-Graduação

UNIVERSIDADE FEDERAL DE PERNAMBUCOCENTRO DE INFORMÁTICA

MESTRADO EM CIÊNCIA DA COMPUTAÇÃO

Obrigado !!!

Análise de um Modelador de Estrutura de Proteínas e seus Componentes

Trabalho de Graduação em Teoria da Computação

UNIVERSIDADE FEDERAL DE PERNAMBUCOCENTRO DE INFORMÁTICA

GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO

Obrigado !!!