73
Introdução à Modelagem de Proteínas por Homologia Belém-PA Novembro de 2012 MSc. Ronaldo Correia Genética e Biologia Molecular - Bioinformática Laboratório de Planejamento e Desenvolvimento de Fármacos – LPDF - UFPa

Aula teorica minicurso modelagem de proteinas por homologia

Embed Size (px)

Citation preview

Page 1: Aula teorica minicurso modelagem de proteinas por homologia

Introdução à Modelagem de Proteínas por Homologia

Belém-PANovembro de 2012

MSc. Ronaldo Correia

Genética e Biologia Molecular - Bioinformática

Laboratório de Planejamento e Desenvolvimento de Fármacos – LPDF - UFPa

Page 2: Aula teorica minicurso modelagem de proteinas por homologia

Objetivos

Oferecer noções básicas sobre Proteínas;

Apresentar técnicas de modelagem de Proteínas;

Discutir a importância dessas técnicas para o proteoma e planejamento de fármacos.

Page 3: Aula teorica minicurso modelagem de proteinas por homologia

Introdução

Bioinformática

Proteínas

Métodos experimentai

s

Métodos Teóricos

Page 4: Aula teorica minicurso modelagem de proteinas por homologia
Page 5: Aula teorica minicurso modelagem de proteinas por homologia

Seres protéicos

A vida está intimamente ligada às proteínas. Estas moléculas especiais realizam as mais variadas funções no nosso organismo tais como:

Transporte de nutrientes e metabólitos, catálise de reações biológicas;

Apesar da complexidade de suas funções, as proteínas são relativamente simples;

Repetições de 20 unidades básicas, os aminoácidos.

Page 6: Aula teorica minicurso modelagem de proteinas por homologia

Proteínas x Meio Ambiente

Metano: 25 x maior potencial efeito estufa que CO2

As arqueias metanogênicas são responsáveis por 74% do metano liberado em nossa atmosfera.

Metil coenzima redutase (MCR): catálise da metanogênese.

LIMA, 2012

Page 7: Aula teorica minicurso modelagem de proteinas por homologia

LIMA, 2012

Proteínas x Meio Ambiente

Page 9: Aula teorica minicurso modelagem de proteinas por homologia

AminoácidoUm aminoácido consiste em um caborno

“central” com uma ligação a grupo amino (-NH2), outra a um grupo carboxila (-COOH), a terceira a um átomo de hidrogênio e a quarta a uma cadeia lateral variável

Carbono α

Page 11: Aula teorica minicurso modelagem de proteinas por homologia

Aminoácidos Single- & three-letter amino acid codes

G Glycine Gly P Proline ProA Alanine Ala V Valine ValL Leucine Leu I Isoleucine IleM Methionine Met C Cysteine CysF Phenylalanine Phe Y Tyrosine TyrW Tryptophan Trp H Histidine HisK Lysine Lys R Arginine ArgQ Glutamine Gln N Asparagine AsnE Glutamic Acid Glu D Aspartic Acid AspS Serine Ser T Threonine Thr

Page 12: Aula teorica minicurso modelagem de proteinas por homologia

Classificação dos aminoácidosOs aminoácidos podem ser classificados de

acordo com o grupo R como:

Alifáticos (não polares) – sem polos,sem carga;

Não carregados, polares – mas com eminência;

Carregados positivamente;

Carregados Negativamente.

Page 13: Aula teorica minicurso modelagem de proteinas por homologia

Sem O2 para fazer ligações.

Page 14: Aula teorica minicurso modelagem de proteinas por homologia

O2 presente (possui pólos) para fazer ligações com carbono e hidrogênio.

Page 15: Aula teorica minicurso modelagem de proteinas por homologia
Page 16: Aula teorica minicurso modelagem de proteinas por homologia
Page 17: Aula teorica minicurso modelagem de proteinas por homologia

Ligação PeptídicaOs peptídeos são biomoléculas formadas

pela ligação de dois ou mais aminoácidos através de ligações do tipo amida. Os peptídeos são resultantes do processamento de proteínas e podem variar de 2 ou mais aminoácidos.

2 aminoácidos: Dipeptídeo3 aminoácidos: Tripeptídeo4 a 10 aminoácidos: Oligopeptídeo10 a 100 aminoácidos: Polipeptídeomais de 100 aminoácidos: Proteína

Page 18: Aula teorica minicurso modelagem de proteinas por homologia

Insulina

51 amino ácidos

Glucagon

29 amino ácidos

oxitocina ou ocitocina.9 aminoácidos

Vasopressina (ADH)9 aminoácidos

Page 19: Aula teorica minicurso modelagem de proteinas por homologia

Conformação do Esqueleto

Page 20: Aula teorica minicurso modelagem de proteinas por homologia
Page 21: Aula teorica minicurso modelagem de proteinas por homologia

Interações não covalentesLigação de Hidrogênio

Ponte de H formada entre duas moléculas de água

Page 22: Aula teorica minicurso modelagem de proteinas por homologia

Eletronegatividade

Page 23: Aula teorica minicurso modelagem de proteinas por homologia

Low Barrier Hydrogen Bond (LBHB)Ligação de Hidrogênio

Page 25: Aula teorica minicurso modelagem de proteinas por homologia

Interação Hidrofóbica

Gotas de óleo na água

Page 26: Aula teorica minicurso modelagem de proteinas por homologia

Ponte de Dissulfeto

Grupo sulfidril

Page 27: Aula teorica minicurso modelagem de proteinas por homologia
Page 28: Aula teorica minicurso modelagem de proteinas por homologia

Resíduo %Cysteine 17.5Serine 11.7

Glutamic acid 11.1Threonine 6.9

Glycine 6.5Leucine 6.1Valine 5.9

Arginine 5.6Aspartic acid 5.0

Alanine 4.8Proline 3.6

Isoleucine 2.7Tyrosine 1.9

Phenylalanine 1.4Histidine 0.8

Page 29: Aula teorica minicurso modelagem de proteinas por homologia

Covalent Bond ~ 50 - 100kcal/molIonic Bond ~ 5 - 80kcal/molHydrogen Bond ~ 3 - 6kcal/molHydrophobic Interaction ~ 0.5 -

3kcal/mol (not a bond per se)Van der Waals Interaction ~ 1kcal/mol

Page 30: Aula teorica minicurso modelagem de proteinas por homologia

ProteínasDefinição: são macromoléculas

complexas, compostas de aminoácidos, e necessárias para os processos químicos que ocorrem nos organismos vivos

Nos animais, as proteínas correspondem a cerca de 80% do peso dos músculos desidratados, cerca de 70% da pele e 90% do sangue seco.

Page 31: Aula teorica minicurso modelagem de proteinas por homologia

Estrutura Primária

amino terminal ou "N-terminal" (NH3+)

carboxi terminal ("C-terminal") (COO-)

Page 32: Aula teorica minicurso modelagem de proteinas por homologia

>2ANL:A|PDBID|CHAIN|SEQUENCESENDVIELDDVANLMFYGEGEVGDNHQKFMLIFDTGSANLWVPS KCNSIGCSTKHLYDSSKSKSYEKDGTKVEITYGSGVRGFFSKDLVTLGYLSLPYKFIEVTDTDDLEPLYTAAEFDGILGLGWKDLSIGSIDPIVVELKNQNKIDQALFTFYLPVHDKHSGYLTIGGIEEKFYEGELTYEKLNHDLFWQVDLDVNFGKTSMEKANVIVDSGTSTITAPTSFINKFFKDLNVIKVPFLPFYITTCNNKDMPTLEFKSANNTYTLEPEYYMEPLLDIDDTLCMLYILPVDIDKNTFILGDPFMRKYFTVFDYDKESIGFAVAKN

FASTA

Page 33: Aula teorica minicurso modelagem de proteinas por homologia

Estrutura Secundária

A estrutura secundária é uma função dos ângulos formados pelas ligações peptídicas que ligam os aminoácidos

A conformação espacial é mantida graças as interações intermoleculares (ligação hidrogênio) entre os hidrogênios dos grupos amino e os átomos de oxigênio dos outros amino ácidos.

Page 34: Aula teorica minicurso modelagem de proteinas por homologia

-Hélice

É a forma mais comum de estrutura secundária regular;

Caracteriza-se por uma hélice em espiral formada por volta de 3 a 6 aminoácidos;

As cadeias laterais dos aminoácidos se distribuem para fora da hélice

A principal força de estabilização da a - Hélice é a ponte de hidrogênio.

Page 35: Aula teorica minicurso modelagem de proteinas por homologia

-Folhas Envolve 2 ou mais segmentos

polipeptídicos da mesma molécula ou de moléculas diferentes, arranjados em paralelo ou no sentido anti-paralelo

Os segmentos em folha da proteína adquirem um aspecto de uma folha de papel dobrada em pregas.

As pontes de hidrogênio mais uma vez são a força de estabilização principal desta estrutura

Page 36: Aula teorica minicurso modelagem de proteinas por homologia
Page 37: Aula teorica minicurso modelagem de proteinas por homologia
Page 38: Aula teorica minicurso modelagem de proteinas por homologia

Qual seria Beta Folha?

Page 39: Aula teorica minicurso modelagem de proteinas por homologia

Estrutura Terciária A estrutura terciária relaciona-se com os

loopings e dobraduras da cadeia protéica sobre ela mesma.

É a conformação espacial da proteína, como um todo, e não de determinados segmentos particulares da cadeia protéica.

A forma das proteínas está relacionada com sua estrutura terciária.

Page 40: Aula teorica minicurso modelagem de proteinas por homologia

Estrutura Terciária

2CBJ

-Hélice

-Folhas

Loop

Page 41: Aula teorica minicurso modelagem de proteinas por homologia

Estrutura Quaternária

Page 42: Aula teorica minicurso modelagem de proteinas por homologia

Hemoglobina

Page 43: Aula teorica minicurso modelagem de proteinas por homologia
Page 44: Aula teorica minicurso modelagem de proteinas por homologia

Previsão de Estrutura de Proteínas

Experimental

Raios X

RMN

Cerca de 10 a 14 mil estruturas em repositórios públicos

Teórico

102.000 mil estruturas primárias

Homologia

Ab initio

Page 45: Aula teorica minicurso modelagem de proteinas por homologia
Page 46: Aula teorica minicurso modelagem de proteinas por homologia

Por que modelar proteínas?

Dificuldade em se obter estruturas experimentais;

Custo elevado

Page 47: Aula teorica minicurso modelagem de proteinas por homologia

Por que modelar proteínas?

Page 48: Aula teorica minicurso modelagem de proteinas por homologia

Informações Obtidas Através da Estrutura 3DOrganização estrutural

Estudos sobre o comportamento dos resíduos

Propriedades eletrostáticas dos sítios ativos de enzimas

Page 49: Aula teorica minicurso modelagem de proteinas por homologia

Informações Obtidas Através da Estrutura 3DInformações funcionais

Estudos sobre a natureza da ligação

Localização da região de ligação

Seleção de alvos moleculares para o desenvolvimento de drogas e vacinas

Page 50: Aula teorica minicurso modelagem de proteinas por homologia

Modelagem por HomologiaA ferramenta mais bem sucedida de predição de

estruturas tridimensionais de proteínas é a modelagem por homologia, também conhecida como modelagem comparativa.

As proteínas agrupam-se em um número limitado de famílias tridimensionais. Estima-se que existam cerca de 5.000 famílias protéicas.

Conseqüentemente, quando se conhece a estrutura de pelo menos um representante de uma família, é geralmente possível modelar, por homologia, os demais membros da família.

Page 51: Aula teorica minicurso modelagem de proteinas por homologia

Mioglobina

Em função do número de mutações envolvidas, as seqüências de aminoácidos de proteínas homólogas podem ser, idênticas, semelhantes ou dissemelhantes.

Page 52: Aula teorica minicurso modelagem de proteinas por homologia

Modelagem por Homologia Esta abordagem baseia-se em alguns padrões gerais que

têm sido observados, em nível molecular, no processo de evolução biológica:

Homologia entre seqüências de aminoácidos implica em semelhança estrutural e funcional;

Proteínas homólogas apresentam regiões internas conservadas (principalmente constituídas de elementos de estrutura secundária: -Hélice e -Folhas;

As principais diferenças estruturais entre proteínas homólogas ocorrem nas regiões externas, constituídas principalmente por alças ("loops"), que ligam os elementos de estruturas secundárias.

Page 53: Aula teorica minicurso modelagem de proteinas por homologia

Modelagem por HomologiaA modelagem de uma proteína (proteína-

problema) pelo método da homologia baseia-se no conceito de evolução molecular.

Isto é, parte-se do princípio de que a semelhança entre as estruturas primárias desta proteína e de proteínas homólogas de estruturas tridimensionais conhecidas (proteínas-molde) implica em similaridade estrutural entre elas.

Page 54: Aula teorica minicurso modelagem de proteinas por homologia

MODELAGEM MOLECULAR POR HOMOLOGIA ESTRUTURAL

• Geralmente, o processo de obtenção de um modelo protéico virtual através da execução da estratégia da modelagem molecular por homologia estrutural envolve quatro etapas principais.

Page 55: Aula teorica minicurso modelagem de proteinas por homologia

Identificação dos moldes

Alinhamento de sequências

Construção da cadeia principal das regiões conservada

Modelagem das alças

Modelo primitivo

Otimização e validação

OK? FIMsimnão

Alinhamento das seqüências

Construção dos modelos

Validação dos Modelos

Busca por proteínas Homólogas

Page 56: Aula teorica minicurso modelagem de proteinas por homologia

Identificação e seleção de proteínas-molde

(a) conhece-se a família protéica a que pertence a proteína-problema;

(b) não se sabe a que família a proteína-problema pertence.

Se o grau de identidade entre as estruturas primárias das proteínas-molde e da proteína–problema for igual ou superior a cerca de

25%, quando o número de resíduos é superior a 80, existe grande probabilidade de que estas proteínas tenham estruturas tridimensionais semelhantes.

Page 57: Aula teorica minicurso modelagem de proteinas por homologia

Alinhamento das seqüências de resíduos de aminoácidos

Page 58: Aula teorica minicurso modelagem de proteinas por homologia

Construção do modeloModelagem das regiões estruturalmente

conservadas;

Modelagem das regiões de alças (loop);

Modelagem das cadeias laterais;

Otimização do modelo gerado.

Page 59: Aula teorica minicurso modelagem de proteinas por homologia

Validação do modeloA qualidade estereoquímica do modelo é de

importância fundamental. O programa mais utilizado na avaliação dos parâmetros estereoquímicos, o PROCHECK.

O gráfico de Ramachandran é particularmente útil porque ele define os resíduos que se encontram nas regiões energicamente mais favoráveis e desfavoráveis e orienta a avaliação da qualidade de modelos teóricos ou experimentais de proteínas.

Page 60: Aula teorica minicurso modelagem de proteinas por homologia

Ramachandran

Page 61: Aula teorica minicurso modelagem de proteinas por homologia

RMSDO parâmetro mais comum que expressa a diferença entre duas estruturas protéicas é o RMSD, ou desvio médio quadrático, em posições atômicas entre as duas estruturas.

Page 62: Aula teorica minicurso modelagem de proteinas por homologia
Page 63: Aula teorica minicurso modelagem de proteinas por homologia
Page 64: Aula teorica minicurso modelagem de proteinas por homologia

Isoformas (classificação):

Calpaínas

Isoforma Domínios EF-Hand

Tecido Doença

Calpaína 1 e 2 (µ,m)

+ Ubíquas AVE, IAM

Calpaína 3 + Músculo-esquelético

Distrofia muscular

Calpaína 6 - Útero e placenta

SOP

Calpaína 9 + Aparelho digestivo

Câncer

Calpaína 10 - Ubíqua Diabetes

SILVA, 2012

Page 69: Aula teorica minicurso modelagem de proteinas por homologia

SILVA, 2012

Page 70: Aula teorica minicurso modelagem de proteinas por homologia

SILVA, 2012

Page 71: Aula teorica minicurso modelagem de proteinas por homologia

www.bioinform

Alpha Helix for Linus Pauling (2004)Escultura de Julian Voss-Andreae3 m de altura, revestida de aço.

Portland, EUA

Fonte: http://en.wikipedia.org

OBRIGADO

Page 72: Aula teorica minicurso modelagem de proteinas por homologia

B. Rost (2001) Protein secondary structure prediction continues to rise. Journal of Structural Biology, 134, pp. 204-218 (Columbia University).

Bystroff, C., Thorsson, V. & Baker, D. (2000). HMMSTR: a hidden Markov model for local sequence-structure correlations in proteins. J. Mol. Biol., 301, 173-190 (University of Washington)

Cuff, J. A., Clamp, M. E., Siddiqui, A. S., Finlay, M. & Barton, G. J. (1998). JPred: a consensus secondary structure prediction server. Bioinformatics, 14, 892-893 (JPred – Oxford/Cambridge)

Cuff, J. A. & Barton, G. J. (2000). Application of multiple sequence alignment profiles to improve protein secondary structure prediction. Proteins, 40, 502-511 (JPred2)

Rost, B. (1996). PHD: predicting one-dimensional protein structure by profile based neural networks. Meth. Enzymol., 266, 525-539. (PHD – Heidelberg – Germany)

Referências

Page 73: Aula teorica minicurso modelagem de proteinas por homologia

Referências Donald Voet; Judith G. Voet; Charlotte W. Pratt, Funadmentos de

BIOQUÌMICA A vida em nível molecular 2ª ed., 2006. Lehninger Principles of Biochemistry Princípios de Bioquímica ( Lehninger ) - 4ª edição - LEHNINGER,

ALBERT L. , COX, NELSON, KAY YARBOROUGH. Przybylski, D. & Rost, B. (2000). PSI-BLAST for structure prediction: plug-in

and win. Columbia University (PHDPsi) Rost WWW, B. (2000). Better secondary structure prediction through more

data. Columbia University, WWW document (http://cubic.bioc.columbia.edu/predictprotein) (PROF)

Altschul, S., Madden, T., Shaffer, A., Zhang, J., Zhang, Z. et al. (1997). Gapped Blast and PSI-Blast: a new generation of protein database search programs. Nucl. Acids Res., 25, 3389-3402. (PSI-BLAST – USA)

Jones, D. T. (1999). Protein secondary structure prediction based on position-specific scoring matrices. J. Mol. Biol., 292, 195-202 (PSIPRED – Warwick)