New Neuza Filipa Análise filogenética de péptidos salivares … · 2016. 8. 8. · superior da mucosa do sistema digestivo. No sistema digestivo, a saliva total representa um papel

Universidade de Aveiro

2011

Departamento de Química

Neuza Filipa Rodrigues Faustino

Análise filogenética de péptidos salivares

Universidade de Aveiro

2011

Departamento de Química

Neuza Filipa Rodrigues Faustino


Dissertação apresentada à Universidade de Aveiro para cumprimento dos requisitos

necessários à obtenção do grau de Mestre em Bioquímica, realizada sob a orientação

científica do Doutor Rui Vitorino, Investigador Auxiliar do Departamento de Química

da Universidade de Aveiro e Doutor Francisco Amado Professor Associado do

Departamento de Química da Universidade de Aveiro.

Dedico este trabalho aos meus pais e irmão

o júri

presidente Doutor Pedro Miguel Dimas Neves Domingues Professor auxiliar do Departamento de Química da Universidade de Aveiro

Doutor Rui Miguel Pinheiro Vitorino Investigador auxiliar do De partamento de Química da Universidade de Aveiro Doutor Francisco Manuel Lemos Amado Professor associado do De partamento de Química da Universidade de Aveiro

Doutor Pedro José de Castro Esteves Professor Coordenador do Instituto Politécnico de Saúde Norte - CESPU

Agradecimentos

Agradeço ao Doutor Rui Vitorino e ao Professor Doutor Francisco Amado pela orientação do trabalho e apoio. Agradeço aos meus pais e irmão por o incentivo e apoio durante a realização deste trabalho.

palavras-chave

Saliva,péptidos, filogenética, PRPs, estaterinas, histatinas, cistatina

resumo

A saliva é um fluido corporal presente na cavidade oral importante para a proteção e manutenção da integridade da parte superior da mucosa do sistema digestivo. Estas propriedades estão associadas à sua composição proteica, nomeadamente em péptidos salivares como estaterina, histatinas, proteínas ricas em prolina (PRPs) e cistatinas. Apesar de já caracterizadas funcionalmente no Homem, pouco ou nada está descrito quanto à sua presença/função em outras espécies animais. Neste contexto, a análise filogenética dos péptidos salivares parece ser relevante para a compreensão dos processos fisiológicos nos quais participam. Assim, o principal objectivo da presente dissertação consistiu em encontrar novos péptidos salivares em mamíferos, homólogos com péptidos salivares encontrados em humanos com recurso a ferramentas filogenéticas, como o BLAST, alinhamento múltiplo, construção e avaliação de árvores filogenéticas. De forma a validar os resultados obtidos, procedeu-se à análise por espectrometria de massa de amostras de saliva recolhidas das espécies: Oryctolagus cuniculus, Canis familiaris, Rattus novergicus e Ovis aries. Na pesquisa de péptidos salivares foram encontradas 140 sequências da família das PRPs, 49 sequências da família das histatinas/estaterinas e 62 sequências da família das cistatinas, tendo sido identificados 75 novos péptidos nestas famílias. Destes novos péptidos detectados por análise filogenética é de salientar um péptido homólogo às estaterinas identificado na saliva de Canis Familiaris que propomos como uma nova estaterina nesta espécie.

keywords

Saliva,phylogenetic, peptides, PRPs, statherin,histatin, cystatin

abstract

Saliva is a bodily fluid present in the oral cavity important for protection and maintenance of upper digestive system’s mucosa integrity. These properties are related with the salivary protein composition with emphasis to statherin, histatins, proline rich proteins (PRPs) and cystatins. Although characterized in the human specie, few is known about their presence/function in other animal species. Thus, phylogenetic analysis of salivary peptides seems relevant to the comprehension of their physiological role. So, the main goal of the present dissertation was to find new salivary peptides in other species using phylogenetic tools, like BLAST, multiple alignment, construction and evaluation of phylogenetic trees. In order to validate phylogenetic analysis findings, mass spectrometry analysis was performed to identify those peptides in the salivary samples collected from: Oryctolagus cuniculus, Canis familiaris, Rattus novergicus e Ovis aries. With this approach, 140 sequences of salivary peptides from the PRPs family were identified, together with 49 sequences of the histatin /statherin family and 62 sequences of the cystatin family, with 75 new peptides found in these different families. Among these we found a peptide homologous to statherin in the saliva of Canis familiaris. that we propose as a new statherin in this specie.

i

Índice

11.. IINNTTRROODDUUÇÇÃÃOO.............................................................................................................. I

1.1. Saliva ................................................................................................................................... 3

1.1.1. Proteínas ricas em prolina (PRPs) ......................................................................... 6

1.1.1.1. Proteínas ricas em prolina ácidas (aPRPs) .................................................... 7

a) Características gerais ............................................................................................... 7

b) Funções ............................................................................................................................. 8

1.1.1.2. Proteínas ricas em prolina básicas (bPRPs) e glicosiladas (gPRPs) ..... 9

a) Características gerais ................................................................................................. 9

b) Funções ........................................................................................................................... 10

1.1.2. Histatinas ....................................................................................................................... 11

a) Características gerais ........................................................................................................... 11

b) Funções .................................................................................................................................. 12

1.1.3. Estaterinas .................................................................................................................... 14

a) Características gerais ............................................................................................... 14

b) Funções ........................................................................................................................... 16

1.1.4. Cistatinas ....................................................................................................................... 17

a) Família 1 ou Estefinas ............................................................................................ 17

c) Família 3 ou Quininógeneo ....................................................................................... 18

1.1.4.1. Filogenética das cistatinas tipo 2 .................................................................. 19

1.1.4.2. Cistatinas em saliva .......................................................................................... 20

1.1.4.2.1. Função ........................................................................................................ 21

a) Inibição das proteases de cisteína .............................................................................. 21

b) Controlo de mineralização ....................................................................................... 22

c) Actividades anti-microbianas e anti-virais ................................................................ 23

1.2. Filogenética molecular ................................................................................................ 24

1.2.1. Aspectos gerais ............................................................................................................ 24

1.2.1.1. Alinhamento das sequências ............................................................................. 25

1.2.1.2. Determinação do modelo de substituição ................................................... 27

1.2.1.3. Construção da árvore ........................................................................................... 29

1.2.1.4. Avaliação da árvore ............................................................................................... 29

1.3. Objectivo .......................................................................................................................... 30

22.. MMAATTEERRIIAALL EE MMÉÉTTOODDOOSS ................................................................................... 31

2.1. Análise Filogenética ..................................................................................................... 33

a) Recolha dos dados .............................................................................................................. 33

b) Alinhamento das sequências ......................................................................................... 33

c) Construção e avaliação da árvore ................................................................................ 33

2.2. Análise da saliva ............................................................................................................ 34

a) Colecta e preparação de amostras de saliva ............................................................... 34

b) Digestão enzimática e separação de péptidos por Nano-HPLC ....................... 34

c) Análise por espectrometria de massa e processamento de dados .................... 35

33.. RREESSUULLTTAADDOOSS.......................................................................................................... 37

3.1. Análise Filogenética ..................................................................................................... 39

a) Proteínas ricas em prolina.............................................................................................. 39

ii

b) Estaterina e Histatina ...................................................................................................... 40

a) Cistatinas ............................................................................................................................... 42

3.2. Análise da saliva ................................................................................................................... 45

44.. DDIISSCCUUSSSSÃÃOO .............................................................................................................. 49

4.1. PPRRPPss ....................................................................................................................................... 51

4.2. Estaterinas e Histatinas .............................................................................................. 54

4.3. Cistatinas ........................................................................................................................... 58

55.. CCOONNCCLLUUSSÃÃOO ............................................................................................................ 61

66.. BBIIBBLLIIOOGGRRAAFFIIAA ....................................................................................................... 65

AANNEEXXOOSS ................................................................................................................................ 85

iii

Índice de Figuras Figura 1Saliva e suas funções ...................................................................................................................... 4

Figura 2 Características estruturais e funcionais da estaterina .................................................................. 16

Figura 3 Representação da estrutura da cistatina de galinha. Estão identificadas na figura as três regiões conservadas G11,QXVXG e PW e as duas pontes de dissulfureto (SS1 é no terminal amina, SS2, é o terminal carboxilo). A região de inibição da legumaína N39 (Leg) está indicada na estrutura. .......... 22

Figura 4 Representação da formação da árvore pelo método neighbor-joining ........................................ 29

Figura 5 Representação das sequências alinhadas de estaterina e histatina por software ClustalW. A zona sombreada a preto são os aminoácidos idênticos enquanto a zona sombreada a cinzento identifica substituições conservadas. As sequências identificadas de estaterina de Bos taurus (STAT BOVIN), Callithrix jacchus ( Uncharact F7HQI8; Uncharact F7HQR7), Canis familiaris, Gorilla gorilla gorilla (Uncharact G3SG71), Homo sapiens ( STAT_HUMAN; STAT isofCRA_c), Macaca arctoide (STAT MACAR), Macaca fascicularis (STAT MACFA), Macaca mulatta (STATH MACMU), Nomascus leucogenys (Uncharact G1R7Y6), Pan troglodytes (ENSPTRP00000027723; ENSPTRP00000053497), Pongo pygmaeus ( ENSPPYP00000016521) e Sus scrofa (STAT PIG). As sequências identificadas de histatinas de Chlorocebus aethiops (COLRB4 CHLAE, histatina 1; COLRB7 CHLAE, histatina 3), Gorilla gorilla (COLRB0_9PRIM, histatina 1,;COLRB5_9PRIM, histatina 3,), Homo sapiens (HIS1_HUMAN, histatina 1; HIS3_HUMAN, histatina 3,), Nomascus leucogenys (COLRB2_NOMLE, histatina 1, ACN88340;COLRB6_NOMLE, histatina 3, HIS3-LIKE NOMLE; LOC100590184 NOMLE),Macaca fascicularis (HIS1_MACFA e COLRB1_MACFA, histatina 1; COLRB9_MACFA, histatina 3), Pan troglodytes (ENSPTRP00000027724, histatina 1; ENSPTRP00000053498 histatina 3,), Pongo abelii ( HIS3 LIKE PONAB, histatina 3-like;histatina 1,ENSPPYP00000016523;histatina 3, ENSPPYP00000016522),Trachypithecus cristatus(COLRB3_TRACR, histatina 1;COLRB8_ TRACR, histatina 3). Outras sequências identificadas são as histatherin de Bos taurus (C6KGD8_BOV, C6KGD7_BOV, C6KGD9_BOVIN corresponde) e as proteínas hipotéticas de Canis familiaris ( XP_848687 CANFA, XP_862196 CANFA, XP_862059 CANFA, XP_861969 CANFA, XP_862144 CANFA, XP_862168 CANFA, XP_856826 CANFA, XP_856868 CANFA, XP_003431878 CANFA) e de Rattus novergicus (Theobromine induced RAT) ............................................................................................ 41

Figure 6 Alinhamento das sequências das cistatinas por software ClustalW. As sequências identificadas pertencem as seguintes espécies: Ailuropoda melanoleuca (AILME), Bos taurus (BOVIN), Callithrix

jacchus (CALJA), Cavia porcellus (CAVPO), Cricetulus griseus (CRIGR), Dasypus novemcinctus

(DASNO), Dipodomys ordii (DIPOR), Echinops telfairi (ECHTE), Equus caballus (HORSE), Erinaceus

europaeus (ERIEU), Felis catus (FELCA), Gorilla gorilla (GORGO), Homo sapiens (HUMAN), Loxodonta

africana (LOXAF), Macaca mulatta (MACMU), Microcebus murinus (MICMU), Mus musculus

(MOUSE), Myotis lucifugus (MYOLU), Nomascus leucogenys (NOMLE), Oryctolagus cuniculus (RABIT),

Otolemur garnetii (OTOGA), Pan troglodytes ( PANTR), Pongo abelii ( PONAB), Pteropus vampyrus

(PTEVA), Rattus novergicus (RAT), Saimiri sciureus (SAISC), Sarcophilus harrisii (SARHA) e Sus Scrofa

(PIG). ................................................................................................................................................. 43

Figura 7 Árvore Filogenética das PRPs A árvore foi construída usado o método neighbor-joining (NJ). Os valores nos ramos referem-se ao Bootstrap, que são valores obtidos por 1000 réplicas e estão representados em percentagem. Os ramos com valores de Bootstrap inferiores a 50% foram eliminados. As sequências identificadas com um círculo são espécies que com análise na saliva foram detectadas neste estudo. .................................................................................................................. 52

Figura 8 Árvore Filogenética das Estaterinas e Histatinas. A árvore foi construída usado o método neighbor-joining (NJ). Os valores nos ramos referem-se ao Bootstrap, que são valores obtidos por 1000 réplicas e estão representados em percentagem. Os ramos com valores de Bootstrap inferiores a 50% foram eliminados. ................................................................................................................... 57

Figura 9 Árvore Filogenética das Cistatinas A árvore foi construída usado o método neighbor-joining (NJ). Os valores nos ramos referem-se ao Bootstrap, que são valores obtidos por 1000 réplicas e estão representados em percentagem. Os ramos com valores de Bootstrap inferiores a 50% foram eliminados. As cistatinas identificas com quadrado preto são as cistatinas já encontradas em saliva anteriormente. .................................................................................................................................. 59

iv

Figura 10 10 Representação das sequências alinhadas das PRPs por software ClustalW. A zona sombreada a preto são os aminoácidos idênticos enquanto a zona sombreada a cinzento identifica substituições conservadas ............................................................................................................... 121

v

Índice de Tabelas Tabela 1 Representação dos péptidos salivares encontrados por análise da saliva de Canis familiaris, Ovis

aries e Rattus novergicus .................................................................................................................. 46

Tabela 1 Representação dos péptidos salivares encontrados por análise da saliva de Canis familiaris, Ovis

aries e Rattus novergicus (Continuação)............................................................................................ 47

Tabela 2 Representação das sequências de PRPs recolhidas das bases de dados ..................................... 87

Tabela 3 Representação das sequências de histatinas e estaterinas recolhidas das bases de dados ...... 108

Tabela 4 Representação das sequências de cistatinas recolhidas das bases de dados ............................. 112

vi

Índice de Abreviaturas

Ala -alanina

aPRPs- proteínas ricas em prolina ácidas

Arg- arginina

bPRPs- proteínas ricas em prolina básicas

CD-dicroismo circular

Cys- cisteína

Gln- Glutamina

Glu-ácido glutâmico

gPRPs- proteínas ricas em prolina glicosiladas

HAP-hidroxiapatite

Ile-isoleucina

Leu- leucina

Phe-fenilalanina

PRPs – proteínas ricas em prolina

11.. IInnttrroodduuççããoo

Introdução

3

1.1. Saliva

A saliva é um fluído corporal presente na cavidade oral que é vital para

manutenção da saúde oral [1, 2]. A saliva é constituída pela mistura das secreções das

glândulas salivares maiores (parótida, submandibular e sublingual) e glândulas salivares

menores (labial, bucal, lingual, palatal) [3]. Os termos “fluido oral ” ou “saliva total” é

referente a um fluido mais complexo com a mistura da secreção das glândulas salivares,

com substâncias oriundas do fluído gengival, das secreções brônquicas e nasais, de

bactérias e dos produtos bacterianos, de componentes do soro e derivados de sangue

provenientes de lesões orais, dos vírus e dos fungos, de células provenientes da

descamação do epitélio e dos restos de alimentos [4].

A saliva total é predominantemente constituída por água (99%), mas também

composta por uma fracção inorgânica e uma fracção orgânica. A fracção inorgânica inclui

iões como Na+, Cl– , Ca2+,K+,HCO3–,H2PO4

–, F–, I–,Mg2+ e o tiocianato. A fracção

orgânica da saliva inclui um grande número de compostos tais como: ureia, amónia, ácido

úrico, glucose, colesterol, ácidos gordos, mono-, di- e triglicerídeos, lípidos neutros e

fosforilados, glicolípidos, aminoácidos, hormonas esteróides e proteínas [5].

O papel fundamental da saliva é a proteção e manutenção da integridade da parte

superior da mucosa do sistema digestivo. No sistema digestivo, a saliva total representa um

papel importante na fisiologia do esófago, no processo digestivo, e protecção celular

gástrica. Na cavidade oral, a saliva toma parte na mastigação, fala, deglutição, percepção

do sabor, lubrificação dos tecidos orais, protecção da mucosa oral, actividade anti-

bacteriana, anti-fúngica e anti-viral, maturação pós-eruptiva, regulação do balanço iónico

na remineralização do esmalte, formação da película de esmalte aderida e limitação da

difusão ácida (Figura 1) [6-9].

Análise filogenética de péptdos salivares

4

O estudo da composição salivar é um importante recurso para a avaliação de

condições salivares com implicações fisiológicas e patológicas e é utilizado como meio de

diagnóstico, principalmente devido a sua origem, composição, funções e interacções com

outros sistemas de órgãos. O método de colecta de saliva é simples, não invasivo, de fácil

armazenamento e não é caro quando comparado com a colecta de sangue. Apesar do

método de recolha de saliva humana ser simples, o estudo da composição da saliva é

complicado por a sua variabilidade inter- e intra- individual e o seu comportamento

dinâmico.

Na última década, vários estudos proteómicos [10-20] foram realizados para a

caracterização da composição proteica da saliva. Esses estudos indicam a presença de mais

do que 2000 proteínas diferentes em saliva humana [21], que podem ser divididas em

proteínas de origem da secreção glandular (α-amilase, histatinas, cistatinas, lactoferrinas,

lisozima, mucinas, proteínas ricas em prolina (PRPs)) e proteínas de origem diversa,

comuns a outros fluidos corporais, como derivados do plasma (albumina, imunoglobulina

A (sIgA), transferrina) [13] ou tecidos [22], mas também proteínas derivadas de

Figura 1Saliva e suas funções

Introdução

5

microrganismos [23]. Contudo, as proteínas glandulares são responsáveis por mais de 85%

do proteoma salivar e provavelmente as mais importantes para a saúde oral [24].

Um aspecto comum das principais proteínas/péptidos salivares é que apresentam

polimorfismos genéticos que dão origem às várias famílias de moléculas relacionadas

funcionalmente e estruturalmente. A base biossintética para estes polimorfismos tem sido

ligada a uma diversidade de processos moleculares como a variação alélica, a duplicação

do gene, splicing diferencial de mRNA e as modificações pós-traducionais antes, durante e

depois da secreção através da acção de enzimas endógenas e exógenas (da microflora),

como proteólise, fosforilação, sulfatação, acilação, desamidação e glicosilação, mas apenas

a proteólise, glicosilação e fosforilação tem evidenciado relevância funcional [25-28].

Em alguns casos, as formas polimórficas diferem significativamente em tamanho.

Noutras instâncias, as formas polimórficas mostram somente rearranjos menores dos

aminoácidos que não afectam o valor da massa molecular. De facto, os polimorfismos

genéticos que são normalmente encontrados nas principais proteínas salivares indicam uma

natureza evolutiva, no processo de selecção natural para melhoria da sua funcionalidade

[25] .

Os níveis de similaridade entre duas ou mais sequências implica terem um

ancestral comum e a similaridade entre sequências pode organizar os genes ou proteínas

homólogas numa árvore filogenética que descreve a sua relação evolutiva. Com uso de

ferramentas filogenéticas para construção da árvore filogenética é possível relacionar

grupos de proteínas que pertençam a mesma superfamília, família, e subfamília. Estas

ferramentas filogenéticas têm sido fundamentais para perceber a origem, evolução e função

de proteína.

Neste estudo, a análise filogenética vai ser utilizada para relacionar péptidos

salivares de mamíferos que pertençam a mesma família de alguns péptidos secretados pelas

glândulas salivares: PRPs, estaterinas, histatinas e cistatinas.


6

1.1.1.Proteínas ricas em prolina (PRPs)

As secreções salivares humanas da parótida e da submandibular são

essencialmente compostas por uma família de proteínas designada de proteínas ricas em

prolina (PRPs) que representam cerca de 70% da composição do proteoma salivar humano

[29-33]. Estas proteínas foram as primeiras detectadas em saliva humana por Mandel et al.

[34] e posteriormente foram purificadas e caracterizadas. Baseadas na mobilidade

electroforética e nas suas propriedades químicas, as PRPs podem ser classificadas em três

grupos: ácidas (aPRPs), básicas (bPRPs), e glicosiladas (básicas) (gPRPs) [35-43].

As PRPs são codificadas por uma família de seis genes, localizados no cromossoma

12p13.2 [44, 45]. A ordem dos genes no cromossoma é 5 'PRB2-PRBI-PRB4-PRH2-

PRB3-PRH1 3'. Estes seis genes podem ser divididos em duas subfamílias: uma subfamília

que codifica as aPRPs com dois genes do tipo HaeIII (PRH1 e PRH2), que tem locais onde

enzima de restrição HaeIII ocorre repetidamente e uma outra subfamília que codifica

bPRPs e gPRPs com quatro genes tipo BstNI (PRB1, PRB2, PRB3 e PRB4), que tem

locais onde enzima de restrição BstNI ocorre repetidamente [30, 43, 46-49].

As PRPs têm sido caracterizadas de acordo com as propriedades físico-químicas,

sequências de aminoácidos, modificações pós-traducionais e polimorfismos das proteínas

[35, 36, 50-54]. Um único gene de PRP pode produzir várias PRPs por variação alélica,

splicing RNA diferencial e por clivagem proteolítica antes da secreção [46, 55-57]. A

heterogenidade destas proteínas ao nível da sequência primária, de tamanho e modificações

pós-traducionais sugerem uma diversidade funcional significante.

O peso molecular das PRPs é estimado na gama de 1000 a 25000 Da [58, 59].

Estas proteínas são normalmente caracterizadas por uma predominância de resíduos de

prolina que representam entre 25 a 45% do conteúdo total de aminoácidos, mas também é

rico em resíduos glicina (18-22%) e glutamina (18-22%) e com as aPRPs contendo

resíduos de aspartato (9-11%) e as bPRPs contendo 7-10% de resíduos de lisina e arginina

[60].

As PRPs têm também sido isolados e caracterizadas na saliva ou em glândulas

salivares de vários animais incluindo ratinho [60-62], rato [63], macaco [64-66], coelho

[67] hamster [68, 69] e porco [70, 71]. Todas estas proteínas codificadas por cDNAs e

genes partilham uma estrutura comum de quatro regiões: a região do péptido sinal, uma

Introdução

7

região de transição, uma região repeat e uma região do terminal carboxilo. Os péptidos

sinal e regiões repeat exibem uma elevada homologia entre as espécies, enquanto as

regiões de transição e o terminal carboxilo variam grandemente [60, 62, 69].

1.1.1.1. Proteínas ricas em prolina ácidas (aPRPs)

a) Características gerais

Os genes PRH1 e PRH2 expressam cinco isoformas principais de aPRPs. O gene

PRH2 sintetiza as isoformas PRP-1 e PRP-2, e o gene PRH1 sintetiza as isoformas PIF-s,

Pa e Db-s [37, 55].

As isoformas PRP-1, PRP-2 e PIF-s são compostas por 150 aminoácidos e

apresentam sequências de aminoácidos idênticas com a excepção da PRP-2 ser diferente da

PRP-1 pela substituição de Asp por Asn na posição 50, e a PIF-s diferir da PRP-1 por

substituição de Asn por Asp no resíduo 4 [72].

Outra isoforma também constituída por 150 resíduos de aminoácidos é a isoforma

Pa que difere das isoformas PIF-s, PRP-1 e PRP-2 por apresentar na posição 103 uma Cys

em vez de uma Arg e na posição 26 apresentar uma Leu em vez de uma Ile [73, 74].

A isoforma Db-s é constituída por 171 resíduos de aminoácidos devido a inserção

de 21 aminoácidos depois da posição 81 da isoforma PIF-s, além disso, a Db-s, como a

isoforma Pa apresenta a substituição da Ile por uma Leu na posição 26.

Além disso, as PRP-1, PRP-2, PIF-s e Db-s sofrem uma clivagem pós-traducional

depois da Arg106 (Arg127 em proteína Db-s) antes do armazenamento do grânulo por uma

convertase específica (enzima pertencente a uma família de endoproteases de serina

dependente de Ca2+), que cliva o péptido na sequência R103XXR106↓; esta gera o mesmo

péptido básico com uma sequência de 44 aminoácidos do terminal carboxilo, chamado de

péptido P-C, e outras quatro isoformas truncadas, PRP- 3, PRP-4, PIF-f e Db-f,

respetivamente [31, 37, 73, 75]. Por outro lado, o péptido Pa não é clivado devido a

substituição de uma Arg103 por uma Cys103, anulando o local de reconhecimento da

protease, em vez disso, sofre um processo de dimerização por formação de ligações

disulfito através do resíduo Cys103 [56, 76]. Em menores quantidades são também

detectados, outros derivados que perderam resíduos no terminal carboxilo em quase todas

as isoformas [77].


8

Todas as isoformas possuem um resíduo de piroglutâmico no terminal amina

devido a ciclização de glutamina, um aminoácido final do terminal amina, com o grupo

amida presente na sua cadeia lateral. Além disso, todas as aPRPs são fosforiladas nas

posições Ser-8 e Ser-22 [29, 54]. Estas modificações ocorrem antes de as proteínas

acumularem nos grânulos secretores, que são vesículas originárias de retículo trans-Golgi e

que actuam como compartimentos de armazenamento [78]. As espécies monofosforiladas e

não fosforiladas são detectadas em menores quantidades na saliva total. As isoformas

trifosforiladas (na Ser-17) são também detectadas em menor percentagem [77]. A

fosforilação específica da Ser-8 e da Ser-22 em aPRPs foi demonstrada a partir da

construção de uma linha celular de PRP da glândula submandibular [79]. O local da

fosforilação da Ser-8 em aPRPs corresponde à sequência Ser- Xaa-Glu/pSer, porque é o

local de reconhecimento da caseína cinase de Golgi (G-CK) [80]. No caso da fosforilação

da Ser-22 é utilizada uma sequência consenso, nomeadamente, Ser-Xaa-Gln-Xaa-Xaa-

Asp/Glu [81].

b) Funções

As aPRPs têm uma elevada afinidade a hidroxiapatite (HAP) e são inibidores

eficazes do crescimento do cristal do fosfato de cálcio (precipitação secundária) [82-84] e

participam na formação da película de esmalte dentária [85]. Estas propriedades residem

nos 30 aminoácidos do terminal amina que estão carregados negativamente e tem duas

fosfoserinas que são fundamentais para estas propriedades e para a homeostasia mineral

[82, 83, 86, 87].

Na análise da estrutura secundária das aPRPs observou-se que ocorre uma mudança

conformacional quando o segmento de 30 aminoácidos do terminal amina é adsorvido na

superfície da HAP, expondo o domínio da proteína que não é acessível em solução e

promove a interacção com bactérias orais como Actinomyces viscous [88, 89],

Streptococcus mutans e S. gordonii [90, 91], que reside no péptido de 44 aminoácidos do

terminal carboxilo, sugerindo que aPRPs tem uma actividade anti-bacteriana.

Além disso, o péptido de 44 aminoácidos do terminal carboxilo após a sua

clivagem das aPRPs é eficaz na precipitação de taninos [91].

Introdução

9

1.1.1.2. Proteínas ricas em prolina básicas (bPRPs) e

glicosiladas (gPRPs)


A família PRPs básica (bPRPs) é codificada por genes em quatro loci separados

abrangido PRB1, PRB2,PRB3 e PRB4 [43, 46, 48, 49, 56]. Os genes PRB1 e PRB2 dão

origem a bPRP não glicosiladas e os genes PRB3 e PRB4 geram bPRP glicosilada. Cada

gene das bPRPs é associado a diversos alelos dando origem um extensivo e complexo

padrão de polimorfismo. A variedade destes polimorfismos bPRPs é ditada por

inserções/delecções de aminoácidos individuais, diferentes sequências repeat tandem, e

modificações pós-traduccionais, como glicosilação e proteólise [25]. Pelo menos quatro

alelos (S, M, L, VL) estão presentes nos loci PRB-1 e PRB-3 e três alelos (S, M, L) estão

presentes no loci PRB2 e PRB4 [26, 43, 46, 92].

Os oito péptidos de bPRP electroforeticamente distintas têm sido descritos: Pe

(=DEAEII-2), PmF, PmS, Ps, Pc, Con1, Con2, e Po [48, 93-98]. Simultaneamente, as

sequências de aminoácidos de fragmentos ricos em prolina básicos foram determinadas e

nomeadas P-D ou IB-5, P-E ou IB-9, P-F ou IB-8c, P-H ou IB-4, e P-I ou IB-6 [99-103],

II-1, II-2, IB-1, IB-7, e IB-8a [39, 94, 104, 105] Quando a estrutura do gene da família da

bPRP tornaram-se disponíveis [55], os péptidos identificados puderam condizer com as

sequências de proteínas previstas, e as diferenças em nomenclatura foram resolvidas [26,

43, 46, 106, 107].

Ao contrário das aPRPs que são presentes em isoformas inteiras e truncadas, as

bPRPs são detectados em grânulos e em saliva apenas em fragmentos das proteínas

maiores[76]. A estrutura de alguns destes fragmentos não é conhecida [108]. Muitas das

bPRPs são clivadas na cavidade oral em fragmentos mais pequenos (7-20 aminoácidos) na

sequência PQ↓ por uma endoproteinase de glutamina de estrutura desconhecida, que é

localizada na placa dentária e é provavelmente de origem microbiana [109].

A presença e distribuição espacial da cadeia de carbohidratos nas gPRPs parecem

ser os factores que condicionam a sua susceptibilidade para a proteólise. As regiões não


10

glicosiladas de bPRPs são clivadas na Arg-Ser-Xaa-Arg↓ (a seta indica o local de

clivagem) [46]. A sequência Arg-Xaa-Xaa-Arg é um local típico de reconhecimento das

convertases, como a furina que tem sido demonstrado que esta enzima está envolvida no

processamento das bPRPs in vivo [110].

b) Funções

As bPRPs formam um complexo com os taninos e precipitam de forma a

neutralizar os efeitos nocivos dos taninos [111-113]. A interacção molecular de taninos e

PRPs tem sido objecto de estudo utilizando um péptido que tem uma sequência repetida

típica de PRP de rato e bPRPs em humanos designada de IB-5 [114, 115].

As gPRPs funcionalmente têm propriedades lubrificantes na saliva [116], que

ajudam na protecção dos tecidos orais contra as forças abrasivas durante a mastigação e a

fala, sendo função comum em outras proteínas salivares glicosiladas [117]. Além disso, as

gPRPs ligam-se a uma variedade de bactérias como Fusobacterium nucleatum, S.mitis e

S.sanguis com gPRPs [117-120]. Os resíduos não substituídos Galβ1→4GlcNAc presente

em gPRPs têm sido identificadas como epítopo de reconhecimento de F. nucleatum,

explicando a elevada afinidade de gPRPs com estes microrganismos [119, 121, 122]. F.

nucleatum tem sido associada com doença periodontal [123], e a aglutinação mediada por

gPRPs destes microrganismos pode facilitar sua limpeza da cavidade oral. Por exemplo, a

clivagem do produto do gene PRB4 produz um fragmento não glicosilado que se liga aos

taninos (IB-5) e um fragmento glicosilado (II-I) com propriedades lubrificantes, assim gera

dois fragmentos com diferentes capacidades funcionais [111].

Recentes estudos têm demonstrado que um componente não identificado desta

família de proteínas apresenta uma actividade anti-viral contra HIV [124] e um fragmento

de um péptido de 10 aminoácidos inibe consideravelmente o crescimento de

Propionobacter acnes [125], revelando potenciais aplicações biotecnológicas para a

peptidómica ligada a bPRPs.

Introdução

11

1.1.2.Histatinas


As histatinas são péptidos catiónicos ricos em histidina de baixo peso molecular

presente nas secreções salivares humanas [42]. A origem do seu nome deriva do número

elevado de resíduo de histidina, um aminácido cujo a sua presença é baixa em proteínas de

mamíferos, mas na sua estrutura representa cerca de 25% da sequência [59, 113, 126-128].

São secretadas pelas glândulas salivares parótida e submandibular/sublingual [33, 126,

129-132] nos humanos e nalguns primatas superiores [59, 127, 133]. Mais recentemente,

estes péptidos também foram detectados no fluído lacrimal [134].

Da secreção da parótida foram isoladas doze histatinas salivares por cromatografia

e sequenciadas por degradação de Edman [130] e os fragmentos mais pequenos foram

encontrados por espectrometria de massa [14].

As principais histatinas são as histatinas 1 e 3 que tem origem em dois genes

diferentes HTN1 (HIS1) e HTN2 (HIS2), respectivamente, localizados no cromossoma

4q13 [127]. A histatina 1 e a histatina 3 são compostas por 38 e 32 aminoácidos,

respectivamente e são idênticos nos 24 aminoácidos do terminal amina, excepto nos

resíduos 4 e 11 por substituição de Glu e Arg na histatina 1 por Ala e Lys na histatina 3,

respectivamente [130]

A histatina 1 contém a Ser2 fosforilada mas, a histatina 3 devido à substituição do

resíduo Glu4 por Ala4, que é essencial para o reconhecimento da fosfocinase, não é

fosforilada na Ser2 [126, 135, 136].

A histatina 1 é parcialmente polisulfatada nas quatro Tyr terminais na glândula

submandibular, diferentemente da histatina 3 à qual falta uma tirosina equivalente a Tyr 27

da histatina 1, que provavelmente é essencial para o reconhecimento tyrosylprotein

sulfotransferase [137].

As histatinas 1 e 3 sofrem proteólise pós-traduccional dando origem as restantes

dez histatinas [133]. Troxler et al. [130] identificaram na saliva humana um péptido da

histatina 1 designado de histatina 2 correspondente a 26 resíduos do terminal carboxilo e

nove péptidos correspondentes a histatina 3 (histatinas 4-12). A histatina 3 gera por

clivagem sequencial primeiro a histatina 6 (histatina3 1/25) e depois a histatina 5 (histatina3


12

1/24) e em seguida os outros fragmentos [138]. A diferente susceptibilidade para clivar

deriva da presença da sequência consenso da convertase RGYR↓ na histatina 3, que está

ausente na histatina 1. No entanto, em trabalhos recentes verificou-se que esta classe era

bastante afectada pela proteólise permitindo a detecção de várias espécies após a

caracterização por espectrometria de massa [14].

O principal fragmento formado por clivagem do terminal carboxilo do resíduo de

Tyr da histatina 3 é a histatina 5 composta por 24 aminoácidos, estando presente em maior

concentração que as outras histatinas menores [126, 135].

O processamento de histatina 3 em histatina 5 provavelmente ocorre dentro da

célula acinar uma vez que, a relação entre histatina 3 e a histatina 5 é aproximadamente 1:1

em ambas as secreções glandulares e esta relação é muito pouco afectada pela taxa do

fluxo salivar. As principais histatinas em secreções salivares são as histatinas 1,3 e 5 que

contribuem cada uma com cerca de 80% para a composição total de histatinas presentes

nas secreções glandulares [126, 135] .

Uma variação alélica no gene HIS2 tem sido referida em sujeitos de descendência

africana. O alelo HIS2 (2) codifica um isómero da histatina 3, designado de histatina 3-2

em que a Arg22 é substituída por Gln22. Além disso, a introdução de um codão stop na

histatina 3-2 faz com que seja composta por 27 resíduo em vez de 32 resíduos [139].

A concentração de histatinas em saliva total é muito mais baixa (na gama 50-425

µM [132]) do que em secreções glandulares puras, representando cerca de 2.6% das

proteínas salivares [140, 141]. Estas diferenças de concentrações são provavelmente

devido a elevada actividade proteolítica da saliva total, causando uma degradação rápida

de histatinas quando são libertadas na cavidade oral [128, 142, 143]. Além disso, a

formação de complexos e ligação a tecidos duros e moles orais pode reduzir os níveis

livres de histatina em saliva total [144].

b) Funções

As histatinas participam na cavidade oral na formação da película de esmalte

adquirida e inibidora do crescimento dos cristais de HAP [130, 145, 146]. O domínio

responsável por esta função é o terminal amina das histatinas. Mas observa-se uma clara

Introdução

13

diferença funcional entre a histatina 1 que é fosforilada e a histatina 3 que não é

fosforilada. Siqueira et al. [147] encontraram evidências dada a presença da fosfoserina,

histatinas nativas ou em histatinas sintéticas, apresentam um maior grau de protecção

contra a desmineralização ácida. Esta análise é consistente com os dados de adsorção

anteriores que demonstram que a histatina 1 nativa mostra uma maior afinidade de

adsorção à HAP do que a histatina 1 recombinante sem fosfatos ligados covalentemente na

posição 2 [136]. A protecção com histatinas fosforiladas foi maior do que a observada nas

histatinas não fosforiladas. Sugerindo, assim que as histatinas participam na mineralização

dinâmica do fluido oral que é responsável pela manutenção da integridade da superfície do

esmalte [146, 148, 149].

Existe uma ampla evidência que as histatinas humanas representam um papel

importante na cavidade oral tomando parte no sistema de defesa não imune do hospedeiro

[85, 94, 108]. As histatinas são potentes inibidores in vitro do crescimento e germinação do

fungo patogénico, Candida albicans [132, 150-154]. Os estudos clínicos sugerem que

podem limitar o crescimento da C. albicans e prevenir a candidiasis in vivo [238].

Verificando-se que a histatina 5 é mais eficaz na inibição da C. albicans do que as

histatinas 1 e 3. A estrutura da histatina 5 na região do terminal carboxilo (resíduo 9-24)

com 14 aminoácidos e com uma conformação helicoidal favorece a sua eficácia na inibição

da C. albicans. Também foi detectada a actividade anticandical na histatina 1 de Macaca

fascicularis (M-histatina 1) com uma extensão igual ou maior do que para as histatinas

humanas [153].

As histatinas também exercem actividade anti-fúngica contra Cryptococcus

neoformans [155-158], Saccharomyces cerevisiae e Candida dubliniensi que é susceptível

aos efeitos da histatina 3 [159].

A actividade anti-bacteriana das histatinas foi demonstrada pela inibição do

crescimento do Streptococcus mutans e Streptococcus sangui [143, 160]. Murakami et al.

estudaram a actividade da histatina 5 sobre Porphyrornonas gingivalis, bactéria Gram-

negativa associada à patogénese da doença periodontal [161], e concluíram que inibem a

hemaglutinação de P. gingivalis pela ligação a um componente específico da célula

bacteriana, o que sugere que as histatinas possam ter uma função protectora na prevenção

da colonização dos tecidos orais por P.gingivalis [162-165]. Observaram que existem dois

motivos fundamentais para esta função: a presença de certos aminoácidos como histidina, a


14

arginina e lisina que são importantes para facilitar esta inibição [164, 166, 167]; e que a

eficácia do péptido pode ser relacionada com o comprimento e com a carga iónica total do

péptido [168]. O essencial para inibição da hemaglutinação foi a presença de aminoácidos

carregados positivamente [166]. Foi colocada a hipótese de que a presença destes péptidos

carregados positivamente pode potenciar uma interacção electrostática inibidora com a

hemaglutina ligando os domínios na superfície da hemácia [164].

Além disso, a histatina, neutraliza os lipopolissacarídeos endotóxicos localizados

na membrana externa das bactérias Gram-negativas, podendo ser uma importante parte do

sistema de defesa do hospedeiro [169] , liga-se aos taninos hidrolisáveis e condensados

formando um complexo que permite neutralizar o seu efeito nocivo [113] e inibe a

libertação de histaminas dos mastócitos, sugerindo um importante papel na inflamação na

cavidade oral [170, 171].

Mais recentemente foi demonstrada uma função específica para histatina 1. Este

péptido apresenta uma actividade na cicatrização de feridas [172]. O domínio que está

minimamente activo para esta função é o fragmento 20-32 da histatina 1.

1.1.3.Estaterinas


A estaterina é um péptido salivar secretado por as glândulas parótida,

submandibular e von Ebner’s [129, 173, 174]. A estaterina é codificada por o gene STATH

localizado no cromossoma 4 [175].

Este péptido é constituído por 43 aminoácidos, de baixo peso molecular (5.380) e

com um número elevado de resíduos de tirosina. Além da tirosina, a estaterina também é

rica em prolina e ácido glutâmico. Em dois terços do terminal carboxilo da proteína, estes

aminoácidos aparecem em múltiplas repetições de sequências de di- e tretapéptidos, isto é

4 × Gln-Pro, 3 × Tyr-Gln and 2 × Pro-Tyr-Gln-Pro. Um terço do terminal amina contém

mais resíduos carregados negartivamente do que positivamente, sendo considerado um

péptido salivar ácido (4.2). Os cinco primeiros do terminal amina são resíduos ácidos, um

Introdução

15

resíduo de ácido aspártico, duas fosfoserinas (Ser-2 e Ser 3) e dois resíduos de ácido

glutãmico [176].

A estaterina, como outros péptidos salivares tem isoformas que são formadas pela

clivagem de resíduos do terminal carboxilo [76]. Estas três variantes têm sido identificadas

em secreções submandibular/sublingual [177]. A isoforma SV2, uma variante de splicing

alternativo, falta os resíduos 6-15 codificados pelo exão 4. As variantes SV1 e SV3 são

produtos resultantes da clivagem pós-traducional de estaterina e SV2, respectivamente e

ambas falta o resíduo Phe do terminal carboxilo [178]. Mais recentemente, uma nova

variante de estaterina foi descoberta em saliva total originária da ciclização intramolecular

depois da secreção pela transglutaminase 2 do epitélio oral, ligando Glu37 a Lys6 [179].

As concentrações médias de estaterina em fluidos orais em saliva total é 4.3 µg/mL

e de 95.9 e 73.6 µg/mL em secreções glandulares da parótida e da

submandibular/sublingual, respectivamente [180]. As diferenças de concentrações entre a

saliva total e as secreções glandulares são significantes e apontam para processamento

proteolítico após a secreção de estaterina, favorecendo crescente da sua diversidade

estrutural.

A estaterina foi o primeiro péptido salivar a ser isolado e sequenciado em

humanos [176], mas posteriormente foi encontrada em Macaca fascicularis [181] e

Macaca arctoides [182]. Na análise RT-PCR em RNA do tecido das glândulas salivares de

bovino foi detectado por transcrição do gene do cromossoma 6, a estaterina [183]. Mais

recentemente, foi encontrada a sequência de cDNA codificante de estaterina de porco no

cromossoma 8 e Manconi et al. [184] identificaram e caracterizaram estruturalmente a

estaterina em Sus scrofa ao isolarem dos grânulos da parótida e da saliva.


16

b) Funções

A polaridade dentro na estrutura das estaterinas com respeito aos domínios

carregados e hidrofóbicos favorece estas proteínas com características funcionais únicas

(Figura 2).

Devido a sua natureza anfipática, estaterina inteira exibe propriedades lubrificantes,

reduzindo as forças fricionais durante a mastigação [185, 186]. As propriedades de ligação

à HAP da estaterina estão associada os seis primeiros resíduos do terminal amina

(DSpSpEEK) bem como a sua capacidade de inibir a precipitação secundária de fosfato de

cálcio (crescimento do cristal). Além disso, a estaterina também inibe a precipitação

primária de fosfato de cálcio (precipitação espontânea), uma propriedade fundamental para

manter saliva sobressaturada com respeito os sais fosfato e cálcio [84, 174, 176, 187-189].

Estas funções são fundamentais para a capacidade da remineralização dos dentes

[176, 190].

Quando adsorvida na superfície do dente, o domínio do terminal carboxilo sofre

umatransição de uma conformação random coil para uma conformação alfa-helicoidal

[191, 192], promovendo a aderência de bactérias orais como Porphyromonas gingivalis

Figura 2 Características estruturais e funcionais da estaterina

Introdução

17

[193-195], Actinomyces viscous [88], Actinomyces naeslundii [196, 197] e Fusobacterium

nucleatum fimbrae [198, 199], que não é possível quando as estaterinas estão solução [200,

201]. Desta forma, a estaterina inibe o crescimento de bactérias na cavidade oral,

contribuindo para a protecção da mucosa oral e tecidos duros. Recentemente, a estaterina

tem sido demonstrada inibir a conversão C. albicans blastoconidia para uma forma de

crescimento mais virulento de hifas [202].

A estaterina pode ter outras funções orais desconhecidas relevantes implicado na

formação da película de esmalte [203] provavelmente tem uma ligação funcional com o

péptido P-B, um péptido salivar rico em prolina com o terminal amina básico cuja função é

desconhecida [24].

1.1.4.Cistatinas

A superfamília das cistatinas é um grupo de proteínas que são inibidores

competitivos reversíveis de duas famílias de proteases de cisteína, a família C1 e a família

C13. As cistatinas encontram-se distribuídas em tecidos e em fluidos corporais [204-206].

Baseado no número de domínios apresentados as cistatinas podem ser divididas em

tipo 1,2 e 3 [207]. Outro sistema de classificação dos inibidores de proteases (peptidases)

coloca as cistatinas na família I25 que contém as subfamílias I25A, B e C. Este sistema de

classificação é baseado por a similaridade da sequência e da estrutura tridimensional da

proteína [208].

Baseados na homologia das sequências, na presença ou ausência de pontes de

dissulfureto e na localização fisiológica, esta superfamília tem sido divida em três famílias

em mamíferos e aves: a família 1 ou estefinas, família 2 ou cistatinas e família 3 ou

quinógeneos [205].

a) Família 1 ou Estefinas

A família 1 ou família das estefinas são proteínas de baixo peso molecular de

aproximadamente 10-11kDa. Em humanos, as estefinas A e B contém cerca de 100

aminoácidos. Têm uma cadeia de polipéptidos sem pontes dissulfureto e sem

carbohidratos[209]. As estefinas são inibidores de proteases intracelulares e seus genes não

codificam o peptídeo sinal [210, 211].


18

Comparativamente, na família 2, as estefinas diferem por não terem uma região

correspondente à hélice α-2/loop e terem uma extensão de nove aminoácidos no terminal

carboxilo [210].

Foram encontradas estefinas homólogas entre as espécies humana, rato [212],

bovino [213, 214] e porco [215] e algumas plantas [216]. As estefinas encontram-se

distribuídas em tecidos, mas encontram-se em menor concentração em todos os fluidos

humanos. Os genes que codificam a estefina A e estefina B nos humanos são localizados

no cromossoma 3 e cromossoma 21, respectivamente [217].

b) Família 2 ou Cistatinas

As cistatinas são proteínas compostas por 120-125 aminoácidos e tem uma

massa molecular de 13 –14 kDa. São sintentizadas como proproteínas contendo um

péptido sinal que sugere que as cistatinas apresentam uma actividade extracelular

[218]. As cistatinas contém duas pontes de dissulfureto e algumas são glicosiladas.,

contendo péptido sinal e pontes de dissulfureto no terminal carboxilo da molécula.

Alguns membros da família são glicosilados.

As cistatinas humanas da família 2 são codificadas por genes localizados no

cromossoma 20 e no locus 20p11.21 [219] sendo encontradas em tecidos e fluidos

corporais. As cistatinas pertencentes a esta família são as cistatinas S, SA, SN, C, D, E

e F.

c) Família 3 ou Quininógeneo

A terceira família das cistatinas consiste em 3 membros: quininógeneo humano de

elevada massa molecular, cerca de 120KDa; quininógeneo humano de baixa massa

molecular com cerca 68 kDa e quininógeneos T que se encontram apenas presentes em

ratos. Os quininógeneos humanos são glicoproteínas libertadas como proproteínas

contendo um peptídeo sinal com 18 resíduos de aminoácidos[217].

A molécula quininógeneo é dividida em três regiões, a cadeia pesada do terminal

amina, a região quinino no núcleo e a região da cadeia leve do terminal carboxilo.

Introdução

19

A L- quininógeneo é composta por três domínios de cistatina [220]. Nos três

domínios do terminal da cadeia pesada de ou L- quininógeneo, só 2 têm conservado o

motivo QXVXG correspondendo ao local activo das cistatinas. Apenas 2 dos 3 locais dos

quininógeneos são locais funcionais na inibição proteases de cisteína.

Os quininógeneos (família 3) apresentam uma forma mais complexa e encontram-

se no plasma sanguíneo, fluído sinovial e fluído amniótico [221].

1.1.4.1. Filogenética das cistatinas tipo 2

Na análise filogenética de cistatinas é problemática porque as proteínas são muito

pequenas e a origem de das diferentes famílias e subfamílias é antiga, existiu uma

extensiva divergência. Além disso os diferentes ramos parecem ter evoluído em diferentes

taxas.

Ao longo do tempo, os estudos evolutivos e as árvores filogenéticas das cistatinas

têm sido referidos [222-227].Vários esquemas têm sido propostos para a evolução das

diferentes famílias [224].

Um modelo plausível de evolução das cistatinas das cistatina tipo 2 é que as plantas

e animais divergiram de um ancestral comum de que possuía uma cistatina, talvez à volta

de 1.6 bilões de anos. As modernas fitocistatinas potencialmente representam a forma

ancestral de todos os tipos de cistatinas. O α-hélice 2/loop e uma primeira ligação de

dissulfureto adquirido antes da divergência dos nemátodos (cerca 1.2 biliões de anos). Nas

cistatinas tipo 2 está presente no caranguejo-ferradura a segunda ligação dissulfureto e os

aspectos gerais das cistatinas tipo 2 podem ter evoluído antes da divergência de

Protostomia e deuterostómios cerca 1 bilões de anos. Assim, apesar dos dados particulares

destes processos (isto é um argumento considerável), as cistatinas tipo 2 são proteínas

antigas têm mais diversificadas na linhagem dos mamíferos. Nesta família das cistatinas

tipo 2 tem surgindo uma jovem subfamília de cistatinas salivares (cistatinas S, SA, SN e

D) que vai ser descrita de seguida [210].


20

1.1.4.2. Cistatinas em saliva

As cistatinas S, SA, SN, C e D humanas pertencentes a família 2 da superfamília

das cistatinas são as principais encontradas em secreções glandulares [228-230].

As cistatinas S, SA e SN ou também designadas como cistatinas salivares são

compostas por 121 aminoácidos com uma massa molecular de 14.2-14.4 kDa. As cistatinas

SN, SA e S são codificadas pelos genes CST1, CST2 e CST4, respectivamente. O gene

CST1 codifica apenas a cistatina SN, enquanto o gene CST2 codifica dois alelos, as

cistatinas SA1 e SA2 e o gene CST4 codifica quatro alelos, a cistatina S não fosforilada, e

três isómeros fosforilados que têm sido designados S1 (fosforilada na Ser-3), S2

(difosforilada na Ser-1 e Ser-3) e SAIII (fosforilada na Ser3, Ser99, Ser112, e Ser116)

[231, 232]. Estes isómeros de cistatinas S fosforilados diferem apenas no número e posição

dos grupos fosfatos [228, 232, 233].

A cistatina C é codificada pelo gene CST3 e é composta por 120 aminoácidos com

uma massa molecular de 13.4 kDa [234, 235]. Além da cistatina C, o gene CST3 pode

formar uma variante associada a uma doença autossomal dominante rara (hemorragia

cerebral hereditária com amiloidose tipo Islandês contendo a substituição na posição 68 de

Leu por Gln [236] .

O gene CST5 é responsável pela expressão da cistatina D. A cistatina D é composta

por 122 aminoácidos com uma massa molecular cerca de 13.8 kDa [237, 238]. A proteína

existe em duas formas polimórficas: uma contém um quinto resíduo de cisteína na posição

26 e outra contém na mesma posição um resíduo de arginina [233].

Em todas as isoformas de cistatinas pertencentes à classe tipo 2, os quatro resíduos

de cisteína localizados no meio do terminal carboxilo da cadeia do polipéptido são

altamente conservados e conferem a estrutura secundária específica para estas proteínas

através de pontes de dissulfureto intramoleculares [25].

Ao nível da transcrição é interessante notar que os genes CST2 e CST5 são somente

expressos nas glândulas submandibular e parótida. Os genes CST1 e CST4 não são apenas

expressos pelas glândulas salivares, mas também pelas glândulas lacrimais e glândulas

traqueais, no revestimento do epitélio da vesícula biliar e pelas vesículas seminais [239],

enquanto a CST3 se encontra em elevada concentração em fluidos biológicos como por

exemplo o fluído cerebroespinal, o plasma seminal, o leite, o fluído sinovial e o plasma

Introdução

21

sanguíneo [240], enquanto na saliva humana e nas glândulas submandibular e parótida é

encontrada em menor concentração [221].

Além da cistatina em saliva de humano, também foi encontrada cistatina S de rato

que foi inicialmente identificada como proteína LM (large, mobile) que foi induzida em

saliva seguido o tratamento isoproterenol e mostra ser uma proteína clonada e sequenciada

to [241].

1.1.4.2.1. Função

As principais funções das cistatinas presentes na saliva são a inibição directa de

proteases de cisteína; a actividade anti-viral e anti-bacteriana e um papel na mineralização

na superfície do dente [25].

a) Inibição das proteases de cisteína

Todas as cistatinas são potentes inibidores de proteases de cisteína da família C1

mas só algumas podem inibir as proteases de cisteína da família C13. A família C1 inclui a

papaína e as catepsinas B, H, K, L e S, enquanto a família C13 inclui a legumaína [205,

221, 242, 243].

As propriedades inibidoras das cistatinas sugerem terem um papel fundamental no

controlo da actividade proteolítica de proteases de cisteína lisossomal como as catepsinas

[221, 244, 245]. Os processos proteolíticos resultam na destruição dos tecidos orais

associados a doenças peridontais [246, 247]. Esta destruição pode ser atribuída em parte a

libertação de enzimas proteolíticas por colónias de bactérias tais como Porphyromonas

gingivalis [161].

A estrutura terciária das cistatinas tem sido caracterizada e observou-se que é

conservada e exibe o enovelamento da cistatina (cystatin fold) formado por 5 cadeias de

folha β anti-paralela embrulhado à volta de uma hélice α five-turn [211].

Por estudos realizados utilizando a cristalografia de raio X, mutagénese e

espectroscopia de RMN foram identificadas três regiões em cistatinas que ao longo do

processo da evolução têm sido conservadas. As três regiões incluem um resíduo de glicina

na região do terminal amina, uma sequência elevadamente conservada, QXVXG, que está

envolvida num β-hairpin loop (loop L1) e um segundo β-hairpin loop (loop L2) que


22

contém um segmento similarmente conservado, PW. Estas regiões conservadas são

implicadas no mecanismo de inibição da papaína, para formar uma estrutura wedge-like

[211, 248, 249].

No estudo de cistatina C recombinante foi demonstrado que a actividade inibidora

da papaína/catepsina e da legumaína são independentes porque a legumaína requere a

presença de um resíduo de aspargina que é localizado em um loop no lado oposto a

superfície de ligação da papaína (Figura 2). Embora a cistatina D tenha um resíduo

aspargina não é possível a inibição da legumaína devido a posição em que está localizado

este resíduo. As cistatinas salivares como falta o resíduo de aspargina nesta região são

inactivos contra a legumaína [250].

Além dos domínios específicos das proteases de cisteína, as cistatinas apresentam

domínios específicos da cadeia polipeptídica que são homólogos com os inibidores de

proteases de serina [251], sugerindo que a fragmentação das cistatinas poderia dar origem a

inibidores para esta classe de enzimas por clivagem ocorrida na cavidade oral.

b) Controlo de mineralização

As cistatinas salivares fosforiladas estão envolvidas na formação de película de

esmalte contribuindo para o processo de remineralização [229, 252, 253]. Foi demonstrado

que as cistatinas salivares fosforiladas ligam-se à HAP. A remoção dos grupos fosfatos

reduz a afinidade das cistatinas a HAP, mas não elimina [254-256].

Figura 3 Representação da estrutura da cistatina de galinha. Estão identificadas na figura as três regiões conservadas G11,QXVXG e PW e as duas pontes de dissulfureto (SS1 é no terminal amina, SS2, é o terminal carboxilo). A região de inibição da legumaína N39 (Leg) está indicada na estrutura.

Introdução

23

As cistatinas salivares também são responsáveis pela inibição da precipitação

secundária de fosfato de cálcio, mas a capacidade de inibição das cistatinas salivares é

cerca de 1/10 comparativamente à estaterina [253].

No modelo molecular da cistatina S identificaram-se duas regiões carregadas

negativamente que poderiam estar potencialmente envolvidas na ligação à HAP [257].

Uma região localiza-se próxima do terminal amina na hélice-α 1 e um péptido tríptico

pertencente a esta região liga-se à HAP. A segunda região foi localizada na hélice-α 2

[257].

c) Actividades anti-microbianas e anti-virais

Tem sido demonstrado que as cistatinas S de rato e humana inibem o crescimento

de P.gingivalis que é associada a com doenças peridontal [210]. A elevada actividade

inibidora da cistatina S humana a P.gingivalis demonstra ter maiores propriedades anti-

microbianas [210, 211].

Uma capacidade geral das cistatinas é a inibir é a replicação viral. A cistatina C

humana foi encontrada bloquear replicação HSV-1 completamente, com uma actividade

comparável com que aciclovir [258]. Embora as proteínas cistatina tipo S também inibam a

replicação HSV-1 não são tão eficazes como cistatina C [210]. A cistatina C é também um

inibidor eficaz da replicação de coronavírus, que pode causar gastroenterite aguda,

ligeiramente acima dos níveis fisiológicos [259]. A cistatina D aos níveis fisiológicos

(0.12-1.9 FM) tem sido encontrada inibir a replicação coronavírus em células pulmonares

[210]. A cistatina de galinha foi mostrada bloquear a replicação do polivírus parcialmente,

embora nem cistatina C humana nem cistatina S de rato tinha um efeito na replicação

polivirus [258]. Colectivamente, estes resultados sugerem que as cistatinas foram

absorvidas por células, onde podem interferir na replicação viral que requere as proteases

de cisteína hospedeiras ou virais, tal como a maturação capsídeo. Contudo, os alvos e

mecanismos de inibição não são conhecidos. Se a inibição viral é uma função das cistatinas

salivares e da cistatina D, o alvo para qual foram seleccionadas é também desconhecido. A

inibição de coronavírus aos níveis fisiológicos é certamente sugestiva. O olho e a cavidade

oral são pontos de entrada para adenovírus. Recentemente, uma mistura de cistatinas

purificadas de lágrimas e saliva (cistatinas S, SA e SN) foi demonstrado inibirem a


24

adenain, uma protease de cisteína codificada por o genoma adenovírus que é essencial para

infectividade, mas a ligação das cistatinas à adenain é uma ligação muito fraca para um

papel significante para a inibição viral [260]

1.2. Filogenética molecular

1.2.1.Aspectos gerais

A evolução é a mudança das características hereditárias de uma população de uma

geração para outra. Para produzir novas ou alterar características hereditárias são

necessários processos de variação genética como as mutações, duplicação de genes e

transferência horizontal de genes.

A evolução ocorre quando as variações genéticas ocorrem de acordo com

mecanismos não aleatórios como selecção natural ou aleatórios com a derivação genética e

fluxo de genes. As consequências resultantes da evolução são a adaptação, co-evolução,

cooperação, especiação e a extinção.

A evolução molecular é uma área que explica os processos evolutivos das espécies

a partir das alterações ocorridas ao nível dos ácidos nucleicos (DNA e RNA) e proteínas,

diferindo dos seus ancestrais. A partir, dos dados moleculares podemos estabelecer

relações evolutivas entre espécies e construir sua história evolutiva, isto designamos de

filogenia. O principal objectivo dos estudos filogenéticos é levantar hipóteses sobre a

história evolutiva entre organismos. Os estudos filogenéticos têm sido aplicados em

sistemas de classificação biológica que reflectem a evolução dos organismos e permitem

interpretações de diversos processos evolutivos morfológicos, moleculares e

biogeográficos. Com o desenvolvimento das técnicas moleculares, começou-se por

estabelecer relações evolutivas entre organismos por uso de dados moleculares como

sequências de DNA e proteínas, surgindo assim filogenia molecular [261, 262]. A filogenia

molecular é uma das áreas da evolução molecular, que tem como objectivos a reconstrução

das ligações genealógicas correctas entre as entidades biológicas e estimar o tempo de

divergência entre organismos (isto é, o tempo desde a última partilha com um antecessor

comum), e pela ordem cronológica da sequência de acontecimentos ao longo da linhagem

evolutiva [261].

Introdução

25

A história evolutiva é normalmente representada por uma árvore filogenética (ou

dendograma). A árvore filogenética é um diagrama de ramificações que expressa as

relações evolutivas entre os vários organismos ou moléculas tendo em conta, as

similaridades, diferenças nas suas características físicas e/ou genéticas e a ancestralidade

ou parentescos evolutivos entre espécies ou grupo de espécies. Uma árvore filogenética é

um gráfico composto por nós e ramos, em que apenas um ramo liga a alguns nós

adjacentes. Os “nós” são uma bifurcação que representa unidades taxonómicas que podem

ser espécies, populações, indivíduos, ou genes. Os ramos definem as relações entre as

unidades taxonómicas em termos de descendentes e ancestrais. O padrão de ramificação de

uma árvore é chamado a sua topologia. [198].

Os nós podem ser terminais ou internos enquanto os ramos podem ser externos e

internos. Os “nós” terminais representam as unidades taxonómicas existentes sobre

comparação, que são referidas como unidades taxonómicas operacionais (OTUs).

As espécies ou grupo de espécies são designados taxon. Um dos objectivos da

filogenética é estabelecer as relações evolutivas entre diferentes taxas. Em particular,

estamos interessados na identificação de clades naturais (ou grupos monofiléticos). Um

clade é definido como um grupo de todos os taxa que têm sido derivados de um antecessor

comum. Em filogenética molecular é comum usar o termo clade para grupos de

organismos ou genes que incluem o antecessor comum mais recente de todos os membros.

Um grupo taxonómico cujo antecessor comum é partilhado por outro taxon é designado

parafilético.

A análise filogenética consiste em quatro passos: alinhamento das sequências,

determinação do modelo de substituição, construção da árvore e avaliação da árvore.

1.2.1.1. Alinhamento das sequências

O estudo da evolução dos genes e proteínas envolve a comparação de sequências

de DNA e de proteínas homólogas que têm a mesma origem, mas podem ou não partilhar a

mesma actividade. Para comparação das sequências constrói-se alinhamentos de

sequências que apresentam um nível limiar de similaridade na sua totalidade ou em

fragmentos, designado sequências homólogas. A similaridade e a diferença das bases ou

aminoácidos são analisados com o objectivo de inferir as relações estruturais/funcionais e


26

evolutivas entre as sequências. Os termos similaridade e homologia são distintos. A

similaridade tem uma quantidade evolutiva comum. Quer os genes sejam ou não

homólogos não existe grau para a homologia como existe para a similaridade. As

sequências homólogas têm divergido de uma sequência ancestral através de mudanças

moleculares tais como substituições, inserções e deleções [263]. A similaridade pode ser

expressa em percentagem de identificação enquanto a homologia refere-se à conclusão

extraída dos dados que os genes partilham em termos de história.

Os homólogos podem ser designados de ortólogos, parálogos e xenólogos. Os

ortólogos são homólogos produzidos por especiação. Representam genes derivados de

antecessor comum que divergem devido a divergência de organismos que estão associados

e tendem a ter uma função similar. Os parálogos são produzidos por duplicação do gene.

Representam genes derivados de um gene ancestral comum que duplica dentro de um

organismo e seguidamente diverge e tende a ter funções diferentes. Os xenólogos são

homólogos resultando da transferência horizontal do gene entre dois organismos.. A

função de xenólogos pode ser variável dependendo com a mudança significantiva do gene

movido, mas geralmente, a função tende a ser similar.

Os resultados dos alinhamentos são importantes para a análise de regiões

conservadas dos genes ou que sofreram mutações, bem como, no estudo das estruturas

secundárias de proteínas e na construção de árvores filogenéticas [264].

A ideia central é diminuir as diferenças entre as sequências comparadas após os

deslocamentos. Smith e Waterman [265] idealizaram um algoritmo utilizando técnicas de

programação dinâmica para obter o chamado alinhamento óptimo.

O alinhamento consiste na introdução de espaços designados de gaps,

representados por hífens consecutivos alinhados com letras, que correspondem ao

deslocamento dos segmentos de forma que a maioria dos caracteres sejam idênticos em

alguma posição.

No alinhamento é calculado um valor designado de score que representa o grau de

similaridade entre sequências. Um valor elevado de score pode ser uma boa indicação de

grande similaridade entre sequências mas não implica, que exista uma grande homologia.

Os alinhamentos podem ser simples (entre duas sequências) ou múltiplos (entre

três ou mais sequências). O alinhamento simples abrange o alinhamento global e o

alinhamento local. O alinhamento global tem esta denominação porque as sequências

Introdução

27

envolvidas são consideradas de uma extremidade a outra. Após a inclusão dos espaços

tomam-se as sequências e coloca-se uma sobre a outra de forma que o carácter da primeira

se alinha com um carácter ou espaço da segunda e vice-versa. No alinhamento local, o

objectivo é encontrar e extrair regiões de cada uma das sequências que exibam grande

similaridade.

O alinhamento global é usado para determinar as regiões conservadas entre

sequências homólogas, enquanto o alinhamento local é usado na pesquisa da base de

dados, na comparação de um segmento com uma parte da sequência encontrada na base de

dados e na montagem do genoma [266].

Como anteriormente referido, o alinhamento múltiplo alinha três ou mais

sequências e é utilizado quando a utilização do alinhamento simples não é satisfatório. O

alinhamento múltiplo é o ponto de partida para a previsão da estrutura secundária e

terciária das proteínas, acessibilidade dos resíduos, função e identificação dos resíduos

para esta função.

Para o alinhamento das sequências são utilizadas algumas ferramentas, como o

BLAST (Basic Local Alignment Search Tool) [267] e o CLUSTALW (alinhamento

múltiplo) [268]. O BLAST é baseado no alinhamento local das sequências, isto é, compara

as sequências de nucleotídeos ou proteínas com sequências existentes na base de dados. O

BLAST pode ser usado para inferir as relações funcionais e evolutivas entre sequências

como para identificar taxons [267]. O CLUSTAL W é um programa que tem como

propósito geral o alinhamento múltiplo de sequências de DNA e proteínas. Calcula e

realiza o melhor emparelhamento das sequências seleccionadas alinhando-as de forma que

as suas identidades possam ser notadas [268, 269].

1.2.1.2. Determinação do modelo de substituição

Ao modelo de substituição devia ser dada a mesma ênfase como ao alinhamento e à

construção da árvore. Os modelos de substituição influenciam o alinhamento das

sequências. Nesta tese, o modelo de substituição utilizados é de aminoácidos.

Os modelos de substituição de aminoácidos utilizados são as matrizes PAM e

BLOSSUM. As matrizes PAM e BLOSSUM são utilizadas para aumentar a sensibilidade


28

dos alinhamentos fracos quando comparamos as sequências. É conhecido que certos

aminoácidos podem ser facilmente substituídos por outros em proteínas relacionadas,

A primeira matriz a ter uma utilização generalizada foi a matriz PAM [270]. A

matriz PAM é uma unidade de divergência evolutiva em que 1% dos aminoácidos das

sequências foram alterados. Este método não implica que depois de 100 PAMs todos os

aminoácidos sejam diferentes. Quando as sequências alinhadas são elevadamente

divergentes, melhoram-se os resultados quando se utiliza uma matriz PAM com um valor

mais elevado, tal como PAM200 ou PAM250. As matrizes PAM com um valor mais baixo

podem ser usadas se as sequências têm um maior grau de similaridade [271]. A matriz

BLOSUM foi construída de forma similar, mas usa uma estratégia diferente para estimar as

frequências alvo [272]. Os dados são derivados da base de dados BLOCKS [273], que

contêm alinhamentos múltiplos locais (‘‘blocks’’) envolvendo sequências divergentes.

Embora não exista um modelo evolutivo neste caso, é vantajoso ter os dados gerados por

observação directa, em vez de por extrapolação. Como na matriz PAM, existe uma série

numerada de matrizes BLOSUM, mas o número neste caso refere-se ao nível máximo de

identificação que as sequências podem ter e ainda contribuir independentemente do

modelo. As matrizes de substituição têm sido construídas usando cortes mais elevados (até

BLOSUM90) para comparar sequências muito similares e cortes mais baixos (até

BLOSUM30) para sequências elevadamente divergentes.

A utilização da matriz PAM ou da matriz BLOSSUM depende do grau de

similaridade da sequência das proteínas.

Introdução

29

1.2.1.3. Construção da árvore

Neighbor-Joining (NJ)

O algoritmo neighbor-joining [274] é normalmente aplicado na construção da

árvore de distância, independentemente do critério de optimização. A construção da árvore

é a partir de uma árvore-estrela através da introdução de ramos sucessivos entre um par

mais próximo de vizinhos e os restantes terminais da árvore. O par vizinho mais próximo é

em seguida consolidado, de forma eficaz reforma uma árvore estrela e o processo é

repetido. O método é relativamente rápido.

1.2.1.4. Avaliação da árvore

Os vários procedimentos estão disponíveis para avaliar o sinal filogenético nos

dados e a robustez das árvores [262, 275]. O teste utilizado nesta dissertação foi o

bootstrap. O bootstrap é um método de avaliação da reamostragem da árvore que trabalha

com os métodos de distância, parcimónia, probabilidade e outro qualquer método de

derivação da árvore. Foi inventando por Efron em 1979 [276] e apresentado como método

de avaliação da análise da árvore filogenética por Felsenstein [277]. O resultado da análise

de bootstrap é um número associado a um determinado ramo da árvore filogenética que dá

a proporção de repetições que suporta a monofilia do clado.

O bootstrapping pode ser considerado um processo com duas etapas que

compreende a geração de novos conjuntos de dados a partir do conjunto original e o

cálculo do número de vezes que um ramo particular apareceu na árvore. Esse número é

Figura 4 Representação da formação da árvore pelo método neighbor-joining


30

normalmente referido como o valor de bootstrap. O novo conjunto de dados é criado a

partir do conjunto de dados originais por amostragem de colunas de caracteres aleatórios

por um conjunto de dados originais com substituição. O “com substituição” significa que

cada local pode ser utilizado na geração aleatória de dados com a mesma probabilidade

como qualquer um dos outros sites. Como consequência, cada conjunto de dados recém-

criados tem o mesmo número de posições em aberto como o conjunto de dados originais,

mas algumas posições são duplicadas ou triplicadas e outras estão desaparecidas. Assim, é

possível que alguns dos conjuntos de dados recém-criados sejam completamente idênticos

ao conjunto original ou, noutro extremo, que apenas um dos sites seja replicado, digamos,

500 vezes, enquanto as restantes 499 posições no conjunto de dados originais são

ignorados.

Embora se tenha tornado prática comum incluir bootstrapping como parte de uma

análise filogenética completa, há alguma discussão sobre o que exactamente é medido por

este método. Foi originalmente sugerido que o valor de bootstrap é uma medida de

repetibilidade [277]. Em interpretações mais recentes, tem sido considerada ser uma

medida de precisão, um parâmetro biologicamente mais relevante que dá a probabilidade

para que a filogenia verdadeira tenha sido recuperada. Com base nos estudos de simulação,

tem sido sugerido que, em condições favoráveis (taxas praticamente iguais de mudança,

ramos simétricos), valores bootstrap maiores que 70 % correspondem a uma probabilidade

de mais de 95 % de que a filogenia verdadeira foi encontrada [278].

O bootstrapping pode ser usado em experiências em que as árvores são aferidas

após a eliminação dos ramos internos um a um. Os resultados fornecem informações

sobre as ordens de ramificação que são ambíguas no completo conjunto de dados.

1.3. Objectivo

Nesta dissertação, o principal objectivo é encontrar novos péptidos em mamíferos,

homólogos com péptidos salivares encontrados em humanos com ajuda de ferramentas

filogenéticas, como o BLAST, múltiplo alinhamento, construção e avaliação de uma árvore

filogenética perceber a origem, a evolução e função destas novas espécies. Outro objectivo

deste trabalho, é comparar as sequências encontradas por análise filogenética com os

péptidos encontrados na análise de saliva de quatro mamíferos: Oryctolagus cuniculus,

Canis familiaris, Rattus novergicus e Ovis aries..

31

22.. MMaatteerriiaall ee mmééttooddooss

Material e métodos

33

2.1. Análise Filogenética

a) Recolha dos dados

As sequências das proteína salivares foram obtidas nas bases de dados National

Center for Biotechnology Information (NCBI) http://www.ncbi.nlm.nih.gov, Ensembl

http://www.ensembl.org e UNIPROT http://www.uniprot.org/. Para encontrar sequências

similares a família das estaterinas/histatinas, PRPs e cistatinas utilizou-se o programa

BLASTP, a matriz de substituição BLOSUM62 [272], com um threshold de 10 na busca

das sequências das histatinas/ estaterina e um threshold de 10-5 na busca das sequências das

restantes famílias de uma base de dados não redundante.

b) Alinhamento das sequências

As sequências de aminoácidos foram alinhadas com CLUSTAL W, usando uma

série de matrizes BLOSUM 62, manualmente editada por BioEdit versão 7.0.5 [268]. Os

resíduos conservados foram determinados manualmente.

c) Construção e avaliação da árvore

A construção da árvore filogenética foi realizada usando o método neighbor-

joining (NJ) [211]. O nível de confiança atribuída nos diferentes ramos é determinado por

replicações de bootstrap de 1000 [277]. As distâncias evolutivas foram calculadas usando o

método de correcção de Poisson e estão nas unidades do número de substituições de

aminoácidos por site. Todas as posições ambíguas foram eliminadas para cada par de

sequências. A análise filogenética foi realizada usando a plataforma de análise MEGA

versão 5.05 [279].


34

2.2. Análise da saliva

a) Colecta e preparação de amostras de saliva

A saliva utilizada neste estudo foi colectada dos seguintes animais: coelho

selvagem (Oryctolagus cuniculus), cão (Canis familiaris), ovelha (Ovis aries) e rato

(Rattus novergicus). No caso da ovelha, coelho e cão a saliva foi colectada com auxílio de

Salivette®. A Salivette® foi colocada na boca dos animais durante 20 minutos sendo

posteriormente centrifugada a 3000g durante 10 minutos. O sobrenadante obtido foi

recolhido para análise. No caso da saliva recolhida de rato, procedeu-se à estimulação com

pilocarpina. Neste caso, administrou-se via intra-peritoneal uma dose de 100 µM de

pilocarpina. Após um intervalo de 5 minutos começou-se a recolher a saliva com o auxílio

de uma micropipeta. A saliva foi posteriormente processada de igual forma que os

sobrenadantes obtidos da Salivette®.

Considerando que o objectivo deste trabalho incidia sobre a análise de péptidos

salivares, procedeu-se então à acidificação da amostra com ácido trifluoroacético (TFA,

0,2%) na proporção de 1: 1 entre amostra e ácido. Após a incubação no gelo durante 5

minutos, as amostras forma centrifugadas a 8000g durante 10 minutos (4ºC). Recolheu-se

o sobrenadante e procedeu-se à determinação da concentração de proteína total com o

método colorimétrico “DC protein assay” da BioRad. Os valores de densidade óptica

foram determinados a 750nm num leitor de placas MultiskanGo (Thermo).

Simultaneamente foi efectuada uma curva de calibração utilizando-se para o efeito padrões

de albumina sérica bovina (BSA) a diferentes concentrações.

b) Digestão enzimática e separação de péptidos por Nano-HPLC

Após a quantificação, 20 µg de cada uma das amostras obtidas foram

neutralizadas com adição de hidrogenocarbonato de amónio (50mM) e digeridas com

tripsina (Promega) na proporção de 1: 20. A digestão ocorreu durante toda a noite a 37ºC.

Após a incubação, a reacção foi terminada pela adição de TFA para uma concentração

Material e métodos

35

final de 0,1%. A separação dos péptidos obtidos foi realizada por nano-HPLC utlizando o

módulo de separação Ultimate 3000 (Dionex) com uma coluna capilar (C18, Pepmap 100;

0,75um de diâmetro interno, 15 cm de comprimento). Foram injectadas 2ug de proteína

total de cada amostra e a separação foi realizada com um gradiente linear de 95% de

solvente A (constituído pro 95% de água, 5 % de acetonitrilo e 0,05% de TFA), 5% de

solvente B (contituido por 85% de acetonitrilo, 15% de água e 0,045% de TFA) até 55% de

solvente B, 45% solvente A com um fluxo de 300nL/min.

Os péptidos depois de eluídos da coluna capilar nanolítica foram aplicados

directamente numa placa de MALDI em fracções de 20 segundos, utilizando para isso um

colector automático de fracções Probot (Lc Packings) com adição de 270nL de matriz

constituída por 12mg de ácido alfa-ciano-4-hidroxicinâmico, 70% acetonirilo, 30% de

água, 0,1% TFA e padrão interno (péptido Glu-Fib 15fM).

c) Análise por espectrometria de massa e processamento de dados

Os espectros de massa foram adquiridos num espectrómetro de massa MALDI-

TOF/TOF (4800 ABSciex) com o reflectrão em modo positivo e obtidos no intervalo de

m/z entre 700-4500Da. Para espectrometria de massa tandem, os 15 iões com sinal mais

intenso de cada fracção foram seleccionados automaticamente e submetidos à

fragmentação com ar.

Os espectros de massa obtidos foram processados e analisados com o auxílio do

software “Global Protein Server Workstation” (Applied Biosystems) e Mascot (v2.1.1

Matrix Science Ltd). As sequências obtidas da análise filogenética foram incorporadas

numa base de dados interna para a identificação de proteínas das amostras de saliva.

Assim, Os espectros obtidos foram importados para a GPS e a pesquisa no Mascot utilizou

os seguintes critérios: 30ppm de desvio para o ião precursor, 0.3Da para os iões fragmento,

com e sem digestão com tripsina, 2 clivagens perdidas. A identificação de cada péptido foi

positiva quando o Mascot score foi superior a 35 (p<0.05) e um grau de confiança acima

de 95%.

37

33.. RReessuullttaaddooss

Resultados

39

3. Resultados

3.1. Análise Filogenética

As sequências das proteínas salivares foram recolhidas da Uniprot, NCBI e do

Ensemble. De seguida, procedeu-se ao alinhamento das sequências de cada família de

proteínas usando o ClustalW. As sequências foram alinhadas em função das respectivas

famílias: histatinas/estaterina, família das PRPs e família das cistatinas e procedeu-se à

reconstrução da árvore filogenética com o método de neighbor-joining usando a

plataforma de análise MEGA versão 5.0.5. Para a construção da árvore foram considerados

apenas os valores de bootstrap iguais ou superiores a 50.

a) Proteínas ricas em prolina

Na colecta das sequências das PRPs usando uma base de dados distinta, foram

detectadas 140 sequências de PRPs de Primatas (Homo sapiens, Pan troglodytes,

nomascus leucogenys, Macaca fascicularis, Macaca mulatta, Pongo abeii, Gorilla gorilla,

Microcebus murinus, e Callithrix jachus), Roedores (Mus musculus, Rattus novergicus e

Mesocricetus auratus) Carnívoros (Canis familiaris e Ailuropoda melanoleuca),

Artiodáctilos (Bos taurus, Sus scrofa), Lagomorfos (Oryctolagus cuniculus) Quiropteras

(Pteropus vampyrus) , Didelphimorphia (Monodelphis domestica) (Figura 10, em Anexo)..

Destas sequências de PRPs detectadas, algumas já foram previamente isoladas e

caracterizadas na saliva e glândulas salivares de algumas espécies como Homo sapiens

[49], Rattus novergicus, Mus musculus [60], Macaca fascicularis [181], Oryctolagus

cuniculus [280] , Mesocricetus auratus [69] e Sus scrofa [70, 281] (Figura 10, em Anexo).

No alinhamento destas sequências observa-se uma maior conservação na região do péptido

sinal e na região repeat

Na árvore filogenética observa-se a clara separação da árvore em quatro ramos

principais as PRPs ácidas e PRPs básicas dos Primatas, as PRPs dos roedores e as PRPs

básica de Porco. No ramo das PRPs ácidas e básicas dos Primatas são detectadas além das

PRPs presentes em Homo sapiens e Macaca fascicularis já detectadas anteriormente em


40

saliva são detectadas em outros primatas. Também se observa a presença de possível PRPs

de Monodelphis domestica, Canis familiaris e Ailuropoda melanoleuca.

b) Estaterina e Histatina

Nas sequências recolhidas foram alinhadas 49 que inclui sequências de

estaterina, histaterinas , histatinas e proteínas hipotéticas a pertencerem a esta família.. As

sequências das histatinas identificadas pertencem só a primatas, enquanto as sequências de

estaterina foram encontradas nos primatas e em Bos taurus, Sus scrofa. As histaterinas

foram identificadas em Bos taurus. Também foram encontradas péptidos de Canis

familiaris e Rattus novergicus. No alinhamento de todas as sequências observa-se

principalmente a conservação dos cinco primeiros aminoácidos do terminal amina e no

terminal carboxilo a conservação do resíduo de tirosina (Figura 5).

Como se pode verificar pela figura 8, a árvore divide-se principalmente em dois

ramos: num dos ramos está presente a família das histatinas e noutro ramo está presente a

família das estaterinas. No ramo das estaterinas, as sequências estão agrupadas de acordo

com a ordem que pertence cada espécie (Primatas, Artiodáctilos e Carnívoros).

Este ramo é composto por Primatas (Callithrix jacchus, Gorilla gorilla gorilla,

Homo sapiens, Macaca arctoide, Macaca fascicularis, Macaca mulatta, Nomascus

leucogenys, Pan troglodytes Pongo abelii), Artiodáctilos (Bos taurus, e Sus scrofa) e os

péptidos de Canis familiaris que tem o ancestral comum com as restantes estaterinas.

As histaterinas estão incorporadas na família das estaterinas com um valor de

bootstrap de 100%.

De salientar, as sequências de Canis familiaris, estas apresentaram maior

homologia com a estaterina de S. scrofa e Bos taurus.

Sugere-se que dado agrupamento no ramo das estaterinas daquelas proteínas

hipotéticas de Canis familairis, estas pertençam à família das estaterinas. Nos ramos das

histatinas só estão agrupados sequências de Primatas com um valor de boostrap de 77%,

em que estão identificadas a histatina 1 e histatina 3 em todos os primatas identificados.

41

Fig

ura

5 R

epre

sen

taçã

o d

as s

equ

ênci

as a

lin

had

as d

e es

tate

rin

a e

his

tati

na

por

sof

twar

e C

lust

alW

. A

zon

a so

mbr

eada

a p

reto

são

os

amin

oáci

dos

idên

tico

s en

quan

to a

zon

a so

mbr

eada

a

cinz

ento

ide

ntif

ica

subs

titu

içõe

s co

nser

vada

s. A

s se

quên

cias

ide

ntif

icad

as d

e es

tate

rina

de

Bos

tau

rus

(ST

AT

BO

VIN

), C

alli

thri

x ja

cchu

s (

Unc

hara

ct F

7HQ

I8;

Unc

hara

ct F

7HQ

R7)

, C

anis

fa

mil

iari

s, G

oril

la g

oril

la g

oril

la (

Unc

hara

ct G

3SG

71),

Hom

o sa

pien

s (

ST

AT

_HU

MA

N; S

TA

T is

ofC

RA

_c),

Mac

aca

arct

oide

(S

TA

T M

AC

AR

), M

acac

a fa

scic

ular

is (

ST

AT

MA

CF

A),

Mac

aca

mul

atta

(S

TA

TH

MA

CM

U),

Nom

ascu

s le

ucog

enys

(U

ncha

ract

G1R

7Y6)

, P

an t

rogl

odyt

es (

EN

SP

TR

P00

0000

2772

3; E

NS

PT

RP

0000

0053

497)

, P

ongo

pyg

mae

us (

EN

SP

PY

P00

0000

1652

1) e

S

us s

crof

a (S

TA

T P

IG).

As

sequ

ênci

as i

dent

ific

adas

de

hist

atin

as d

e C

hlor

oceb

us a

ethi

ops

(CO

LR

B4

CH

LA

E,

hist

atin

a 1;

CO

LR

B7

CH

LA

E, h

ista

tina

3),

Gor

illa

gor

illa

(C

OL

RB

0_9P

RIM

, hi

stat

ina

1,;C

OL

RB

5_9P

RIM

, hi

stat

ina

3,),

H

omo

sapi

ens

(HIS

1_H

UM

AN

, hi

stat

ina

1;

HIS

3_H

UM

AN

, hi

stat

ina

3,),

N

omas

cus

leuc

ogen

ys

(CO

LR

B2_

NO

ML

E,

hist

atin

a 1,

A

CN

8834

0;C

OL

RB

6_N

OM

LE

, hi

stat

ina

3, H

IS3-

LIK

E N

OM

LE

; L

OC

1005

9018

4 N

OM

LE

),M

acac

a fa

scic

ular

is (

HIS

1_M

AC

FA

e C

OL

RB

1_M

AC

FA

, hi

stat

ina

1; C

OL

RB

9_M

AC

FA

, hi

stat

ina

3),

Pan

tr

oglo

dyte

s (E

NS

PT

RP

0000

0027

724,

hi

stat

ina

1;

EN

SP

TR

P00

0000

5349

8 hi

stat

ina

3,),

P

ongo

ab

elii

(

HIS

3 L

IKE

P

ON

AB

, hi

stat

ina

3-l

ike;

hist

atin

a 1,

EN

SP

PY

P00

0000

1652

3;hi

stat

ina

3, E

NS

PP

YP

0000

0016

522)

,Tra

chyp

ithe

cus

cris

tatu

s(C

OL

RB

3_T

RA

CR

, hi

stat

ina

1;C

OL

RB

8_ T

RA

CR

, hi

stat

ina

3).

Out

ras

seq

uênc

ias

iden

tifi

cada

s sã

o as

his

tath

erin

de

Bos

tau

rus

(C6K

GD

8_B

OV

, C

6KG

D7_

BO

V,

C6K

GD

9_B

OV

IN

corr

espo

nde)

e a

s pr

oteí

nas

hipo

téti

cas

de C

anis

fam

ilia

ris

( X

P_8

4868

7 C

AN

FA

, X

P_8

6219

6 C

AN

FA

, X

P_8

6205

9 C

AN

FA

, X

P_8

6196

9 C

AN

FA

, X

P_8

6214

4 C

AN

FA

, X

P_8

6216

8 C

AN

FA

, X

P_8

5682

6 C

AN

FA

, X

P_8

5686

8 C

AN

FA

, X

P_0

0343

1878

CA

NF

A)

e de

Rat

tus

nove

rgic

us

(Th

eob

rom

ine

ind

uce

d R

AT

)


42

a) Cistatinas

Na colecta dos dados de cistatinas foram identificadas 68 sequências abrangendo

diferentes tipos de cistatinas de várias espécies de mamíferos estando incluídas as

cistatinas tipo S, as cistatinas D, cistatinas C e cistatinas 10.

Nas sequências identificadas das cistatina tipo S estão presentes não só em

humanos bem como em outros primatas, bem como as cistatinas D. As cistatinas 10 foram

identificadas só em roedores e as cistatinas C foram identificadas em várias espécies.

Estas sequências foram alinhadas e observou-se a conservação de três regiões das

cistatinas salivares e das cistatinas C e D em todas as espécies do resíduo de glicina no

terminal N, do motivo QXVXG que está contido no loop L1 e da sequência PW inserida

no loop L2 do terminal C. As cistatinas 10, não apresentam a conservação do resíduo de

glicina nem do motivo QXVXG, mas conservam a sequência PW.

No alinhamento das sequências como acima referido, observa-se em todas as

sequências a conservação de três motivos (G, QXVXG e PW) comuns às espécies:

Ailuropoda melanoleuca (AILME), Bos taurus (BOVIN), Callithrix jacchus (CALJA),

Cavia porcellus (CAVPO), Cricetulus griseus (CRIGR), Dasypus novemcinctus (DASNO),

Dipodomys ordii (DIPOR), Echinops telfairi (ECHTE), Equus caballus (HORSE),

Erinaceus europaeus (ERIEU), Felis catus (FELCA), Gorilla gorilla (GORGO), Homo

sapiens (HUMAN), Loxodonta africana (LOXAF), Macaca mulatta (MACMU),

Microcebus murinus (MICMU), Mus musculus (MOUSE), Myotis lucifugus (MYOLU),

Nomascus leucogenys (NOMLE), Oryctolagus cuniculus (RABIT), Otolemur garnetii

(OTOGA), Pan troglodytes (PANTR), Pongo abelii ( PONAB), Pteropus vampyrus

(PTEVA), Rattus novergicus (RAT), Saimiri sciureus (SAISC), Sarcophilus harrisii

(SARHA) e Sus Scrofa (PIG (Figura 6)).

Res

ulta

dos 43

Fig

ure

6 A

lin

ham

ento

das

seq

uên

cias

das

cis

tati

nas

p

or s

oftw

are

Clu

stal

W.

As

seq

uên

cias

id

enti

fica

das

per

ten

cem

as

segu

inte

s es

péc

ies:

Ail

uro

po

da

mel

an

ole

uca

(AIL

ME

), B

os

tau

rus

(BO

VIN

), C

all

ith

rix

ja

cch

us

(CA

LJ

A),

Ca

via

po

rcell

us

(CA

VP

O),

Cri

cetu

lus

gri

seu

s (C

RIG

R),

Da

syp

us

no

vem

cin

ctu

s (D

AS

NO

), D

ipo

dom

ys o

rdii

(DIP

OR

), E

ch

ino

ps

telf

air

i (E

CH

TE

), E

qu

us

cab

all

us

(HO

RS

E),

Eri

na

ceu

s eu

rop

aeu

s (E

RIE

U),

Fel

is c

atu

s (F

EL

CA

), G

ori

lla

go

rill

a (

GO

RG

O),

Hom

o s

ap

ien

s (H

UM

AN

),

Lo

xo

do

nta

afr

ica

na

(L

OX

AF

), M

aca

ca m

ula

tta

(M

AC

MU

), M

icro

ceb

us

mu

rin

us

(MIC

MU

), M

us

mu

scu

lus

(MO

US

E),

Myo

tis

luci

fug

us

(MY

OL

U),

N

om

asc

us

leu

cog

enys

(NO

ML

E),

O

ryct

ola

gu

s cu

nic

ulu

s (R

AB

IT),

O

tole

mu

r g

arn

etii

(O

TO

GA

), P

an

tr

og

lod

ytes

(

PA

NT

R),

P

on

go

a

bel

ii (

PO

NA

B),

P

tero

pu

s va

mp

yru

s (P

TE

VA

), R

att

us

no

verg

icu

s (R

AT

), S

aim

iri

sciu

reu

s (S

AIS

C),

Sa

rco

ph

ilu

s h

arr

isii

(S

AR

HA

) e

Su

s S

cro

fa (

PIG

).

´


44

A partir das sequências alinhadas de cistatinas, procedeu-se a construção da árvore

filogenética em que se observa a separação em quatro tipos de cistatinas: a cistatina C, as

cistatinas tipo S, a cistatina D e a cistatina 10.

As cistatinas tipo S ou cistatinas salivares de primatas encontram-se agrupadas

com um valor de bootstrap de 99%. As cistatinas D de primatas formam um clade

monofilético com as cistatinas salivares com valor de bootstrap de 99 %. Esta árvore

também mostra as cistatinas salivares e D tem um ancestral comum com a cistatina C.

Nesta árvore a cistatina S de rato, não se encontra agrupada com as cistatinas

salivares humanas.

Resultados

45

3.2. Análise da saliva

A análise de saliva das quatro espécies: coelho selvagem (Oryctolagus cuniculus),

cão (Canis familiaris), ovelha (Ovis aries) e rato (Rattus novergicus) consistiu na colecta

da saliva com uso com auxílio de Salivette®, em todas as espécies excepto no rato. No

caso do rato, procedeu-se a estimulação da saliva com uso de pilocarpina, tendo sido

depois recolhida a saliva com o auxílio de uma micropipeta. Da saliva recolhida em todos

animais, procedeu-se a sua centrifugação e o sobrenadante foi acidificado com TFA, para

efectuar a análise dos péptidos salivares. Depois procedeu-se a incubação e nova

centrifugação das amostras e o sobrenadante foi recolhido para determinação da proteína

total pelo método colorimétrico “DC protein assay” da BioRad.

Após a quantificação de proteína total em cada a amostra procedeu-se a digestão

com tripsina. Efectuou-se posteriormente, a separação dos péptidos das amostras por nano-

HPLC. Os péptidos eluídos da coluna capilar nanolítica foram aplicados directamente

numa placa de MALDI.

Os espectros de massa obtidos no MALDI foram processados e analisados com o

auxílio do software “Global Protein Server Workstation” (Applied Biosystems) e Mascot

(v2.1.1 Matrix Science Ltd). As sequências obtidas da análise filogenética foram

incorporadas numa base de dados interna para a identificação de proteínas das amostras de

saliva.

Na análise dos espectros de massa obtidos foram apenas encontrados em Canis

familiaris, Rattus novergicus e Ovis aries, as sequências obtidas da análise filogenética

(Tabela 1).

Destas sequências identificadas pertenciam somente a duas famílias as PRPs e

estaterina. Na saliva de Canis familiaris foram identificados fragmentos homólogos de

Monodelphis domestica (ENSMODP00000002977), de Oryctolagus cuniculus (G1SNU9),

pertencente a família das PRPs e dois péptidos de Canis familiaris pertencentes a família

da estaterina. Na saliva de Rattus novergicus, foram identificados fragmentos de péptidos

homólogos de Rattus novergicus (F1LMA2,P01065, E9PU40). Na saliva de Ovis aries

foram identificados vários fragmentos da sequência Oryctolagus cuniculus (G1SNU9)

pertencentes a família das PRPs.

Aná

lise

fil

ogen

étic

a de

pép

tido

s sa

liva

res

46

Tab

ela

1 R

epre

sen

taçã

o d

os p

épti

dos

sal

ivar

es e

nco

ntr

ados

por

an

ális

e d

a sa

liva

de

Ca

nis

fa

mil

iari

s, O

vis

ari

es e

Ra

ttu

s n

ove

rgic

us

Sal

iva

Org

anis

mo

Ace

sso

Fam

ília

Nom

e T

otal

Ion

S

core

T

otal

Io

n

Sco

re

C.I

. %

Pes

o m

olec

ula

r S

equ

ênci

a P

osiç

ão

inic

ial

Pos

ição

fi

nal

Io

n

Sco

re

Ion

S

core

C

.I.

%

Can

is

fam

ilia

ris

Can

is

fam

ilia

ris

XP

_856

868

Sta

ther

in

PR

ED

ICT

ED

: st

athe

rin-

like

is

ofor

m 3

262,

7477

722

10

0 70

69,4

8

SS

EE

RY

PR

21

28

43

,63

99,3

9

100

PP

VY

PY

PA

PA

QY

PP

SS

45

60

66,7

7 99

,997

Can

is

fam

ilia

ris

XP

_862

144

Sta

ther

in

PR

ED

ICT

ED

: st

athe

rin-

like

is

ofor

m 2

250,

0956

726

100

7674

,72

V

YP

YN

AP

EQ

YP

PS

S

52

65

46,9

4 99

,715

100

YP

YN

AP

EQ

YP

PS

S

53

65

71,8

99

,999

Mon

odel

phis

do

mes

tica

E

NS

MO

DP

0000

0002

977

PR

Ps

74

,586

7385

9 10

0 21

895,

03

LP

PP

PP

GN

SQ

GT

S

171

183

38,7

6 98

,127

Ory

ctol

agus

cu

nicu

lus

G1S

NU

9 P

RP

s U

ncha

ravc

teri

zed

prot

ein

259,

2079

773

100

1235

1,88

F

QG

NR

PQ

GP

PQ

GQ

PP

Q

109

124

41,9

1 99

,093

Rat

tus

norv

egic

us

Rat

tus

norv

egic

us

F1L

MA

2 P

RP

s U

ncha

ract

eriz

ed

prot

ein

107,

8901

138

100

2096

9,83

984

PQ

GP

PP

QG

GP

QQ

R

131

143

74,4

899

100

Rat

tus

norv

egic

us

P10

165

PR

Ps

Pro

line

-ric

h pr

oteo

glyc

an 2

29

6,19

9371

3 10

0 30

007,

5800

8 S

PQ

GP

PP

PG

GP

QQ

R

114

127

75,0

299

100

Rat

tus

norv

egic

us

E9P

U40

P

RP

s U

ncha

ract

eriz

ed

prot

ein

343,

4589

233

100

2421

1,27

93

PQ

GP

PP

PG

GP

QQ

R

74

86

82,3

600

100

100

PQ

GP

PP

PG

GP

QQ

RP

Q

74

88

63,9

199

99,9

94

Res

ulta

dos 47

Sal

iva

Org

ansm

o A

cess

o F

amíl

ia

Nom

e T

otal

Ion

S

core

Tot

al

Ion

S

core

C

.I. %

Pes

o m

olec

ula

r S

equ

ênci

a P

osiç

ão

inic

ial

Pos

ição

fi

nal

Io

n

Sco

re

Ion

S

core

C

.I.

%

Ovi

s

ari

es

Ory

ctol

agus

cun

icul

us

G1S

NU

9 P

RP

s U

ncha

ract

eriz

ed

prot

ein

1287

,642

09

100

1235

1,87

988

RG

GP

QG

GP

QG

GP

QQ

GG

PQ

40

57

42

,75

99,2

95

100

1235

1,87

988

QG

GP

QG

GP

QQ

GG

PQ

GG

PQ

QG

GP

QG

GP

QQ

R

44

72

49,7

2 99

,858

100

1235

1,87

988

GG

PQ

GG

PQ

QG

GP

QG

GP

QQ

GG

PQ

GG

PQ

QR

45

72

73

,43

99,9

99

100

1235

1,87

988

GG

PQ

QG

GP

QG

GP

QQ

GG

PQ

GG

PQ

QR

49

72

34

,8

95,6

06

100

1235

1,87

988

GP

QQ

GG

PQ

GG

PQ

QG

GP

QG

GP

QQ

R

50

72

77,9

4 10

0

100

1235

1,87

988

QG

GP

QG

GP

QQ

GG

PQ

GG

PQ

QR

GP

53

74

47

,14

99,7

44

100

1235

1,87

988

GP

QQ

GG

PQ

GG

PQ

QR

59

72

44

,89

99,5

7 10

0 12

351,

8798

8 G

GP

QQ

GG

PQ

QG

PQ

SR

94

10

8 62

,96

99,9

93

Tab

ela

1 R

epre

sen

taçã

o d

os p

épti

dos

sal

ivar

es e

nco

ntr

ados

por

an

ális

e d

a sa

liva

de

Ca

nis

fa

mil

iari

s, O

vis

ari

es e

Ra

ttu

s n

ove

rgic

us

(Con

tin

uaç

ão)

49

44.. DDiissccuussssããoo

Discussão

51

4.1. PPRRPPss

As sequências das PRPs têm sido divididas em quatro regiões: o péptido sinal, a região

de transição, a região repetida e a região do terminal carboxilo.

No alinhamento das sequências por Clustal W, verificou-se uma maior

similaridade no alinhamento do péptido sinal entre as PRPs dos primatas, dos roedores, do

Bos taurus Pteropus vampyrus e de Sus scrofa.

Na comparação das PRPs humanas com os primatas observa-se uma maior

similaridade. Num estudo que comparou a PRP1 e a PRP de Macaca fascicularis

observou-se que 11 dos 12 primeiros resíduos são idênticos. Estas duas sequências

apresentam 57% de homologia [65]. A MnP4 da Macaca fascicularis apresenta maior

similaridade com as PRPs básicas humanas, principalmente com a PRB1 e PRB2.

As três sequências de cDNA precursores das proteínas de porco Q95JC9,

Q95JC9-2, Q95JC9-3 que são compostos por 660, 550 e 495 aminoácidos,

respectivamente, são responsáveis pela geração de pequenos péptidos correspondendo aos

resíduos do terminal amina 1-56 das sequências Q95JC9-2 e Q95JC9-3 (designado por

peptídeo PRP-SP-A) e 43 sequências repetidas designadas por peptídeo PRP-SPB. Bem

como, as PRPs ácidas humanas são fosforiladas nas posições Ser8 e Ser22 [29, 54], a PRP

de porco é fosforilada nas Ser12 e Ser14 [71].

O péptido SP-A de porco partilha com as PRPs ácidas de Rattus novergicus

(P04474) e Homo sapiens (P02810, Q16378) e a similaridade pertence à sequência

localizada entre as regiões ácida e básica das proteínas. O péptido SP-B partilha a sua

sequência com as PRPs de Mus musculus da parótida salivar, tendo uma sequência comum

GPPP [71].

A diferença relevante entre sequências conhecidas de PRP de porco e as PRPs

humanas, Mus musculus e Rattus novergicus é a completa falta de resíduos de glutamina

entre as repetições de poliprolina sugerindo que os resíduos de glutamina desempenham

um papel relevante na ligação aos polifenóis como demonstrado para as PRPs de ratos e

humanas [111], a diferença estrutural em SP-B sugere a diferença de papel para estes

péptidos na cavidade oral. As suas características estruturais sugerem que este péptido

como a PRP tem uma actividade anti-microbiana.


52

aPRP 1/2 NP_005033 HUMAN ENSPTRP00000050434 PANTR aPRP 1/2-L XP_003313543 PANTR

PRPC P02810 HUMAN PRH2 protein AAI41917.1 HUMAN PRH1 isofCRA_b EAW96215 HUMAN prepro PRP AAA60184 HUMAN Uncharact G3SCR9 GORGO Uncharact G3S043 GORGO Uncharact PRH1 E9PAQ5 HUMAN PRH1 Db allele A27307 HUMAN PRH1 protein AAI28193 HUMAN PRB3-like XP_003313554 PANTR ENSPPYP00000004896 PONAB ENSPPYP00000004899 PONAB XP_002833778 PONAB Uncharact G3RBW4 GORGO PRH2 isofCRA_c EAW96221 HUMAN Uncharact G1QT82 NOMLE XP_003265552 NOMLE PRH2 isofCRA_b EAW96220 HUMAN LOC100415384 XP_002752225 CALJA LOC100415016 XP_002752224 CALJA DKFZp686C09257 Q68D45 HUMAN LOC722356 XP_001118513 MACMU LOC722360 XP_001118517 MACMU PRP1/PRP2 EHH20508 MACMU

PRP Q7M2S8 MACFA EGK_03375 EHH20506 MACMU Uncharact F7GSJ5 MACMU Uncharact F7GSJ7 MACMU Uncharact G1QT94 NOMLE

PRPs ácidas Primatas

Uncharact F7GZ58 CALJA LOC100412163 XP_002752221 CALJA LOC100398712 XP_002763688 CALJA Uncharact F7IGY3 CALJA Uncharact F7I094 CALJA Uncharact F7IGV1 CALJA LOC100412507 XP_002752222 CALJA

PRB1 P04280 HUMAN PRB1 protein Q86YA1 HUMAN PRB1 protein A5D903 HUMAN HCG26567 isofCRA_c G3V1R1_HUMAN HCG26567 isofCRA_b G3V1M9_HUMAN ENSPTRP00000008024 PANTR ENSPTRP00000008030 PANTR Uncharct G3RWV9 GORGO Uncharact G3RMU1 GORGO

PRB2 P02812 HUMAN Basic PRP IB-8a Q7M4Q5 HUMAN ENSPPYP00000004911 PONAB

MnP4 Q29427 MACFA ENSPTRP00000050430 PANTR

PRB4 P10163 HUMAN Po protein CAA30542 HUMAN Uncharact E9PAL0 HUMAN Uncharact G3S0G6_GORGO ENSPTRP00000008026 PANTR Uncharact E7EXA8 HUMAN ENSP00000412740! HUMAN PRB4 protein A2VCL9 HUMAN Uncharact G3QEF1 GORGO Uncharact G1QT96 NOMLE Uncharact G1QTA0_NOMLE Uncharact G1QT98 NOMLE ENSP00000279573 HUMAN ENSPTRP00000050433 PANTR ENSPTRP00000008028 PANTR PRB3 XP_001137791 PANTR PRP G1 CAA30728 HUMAN Uncharact G3RTV7 GORGO Uncharact E7ER59 HUMAN PRB3 protein Q4VAY2 HUMAN Uncharact C9JW35 HUMAN PRB3 NP_006240 HUMAN PRB3 protein AAH96211 HUMAN

PRB3 Q04118 HUMAN Uncharact F5H7C1 HUMAN

PRPs básicas Primatas

Uncharact G3N0R9_BOVIN Uncharact F1N4B8 BOVIN Glycoprotein Q63179 RAT ENSPVAP00000010780 PTEVA Uncharcat G3QHE7 GORGO

PROL4 Q16378 HUMAN pHLE1F1 isof2 XP_520746 PANTR Uncharct G3UCG0 LOXAF

Prp2 P05143 MOUSE Isof 2 Prp2 P05143-2 MOUSE

Uncharact D3Z1V5 MOUSE Uncharact F8VPU9 MOUSE Prh1 P05142 MOUSE Uncharact E9QMX6 MOUSE mCG118762 EDL29788 MOUSE mCG118762 EDL29787 MOUSE Prp2 Q04154 RAT

Uncharact E9PU40 RAT Acidic PRP25 P10164 RAT

Uncharact F1LV68 RAT Uncharact E9PU38 RAT Prp15 Q04105 RAT RGD1559532 Q04117 RAT ENSMICP00000006831 MICMU

Uncharact G1SNU9 RABIT Prpmp5 Q64306 MOUSE Prpg1 Q07610 RAT Uncharact E9PSV2 RAT Uncharact F1LMA2 RAT Acidic PRP33 P04474 RAT Uncharact G3V7D3 RAT

Prpg2 P10165 RAT Acidic PRP HP43A P06680 MESAU Uncharact D3Z543 MOUSE Uncharact D3Z544 MOUSE Prb1 Q91X93 MOUSE Uncharact D3YX21 MOUSE Prpmp5 Q58E44 MOUSE Uncharact E9PXN1 MOUSE Uncharact Q61888 MOUSE mCG118763 EDL29793 MOUSE 31-kDa PRP Q62105 MOUSE EG667929 B7ZW90 MOUSE Uncharact E9Q7E4 MOUSE mCG118763 EDL29792 MOUSE

PRPs Roedores

Uncharact G1PRT3_MYOLU ENSMICP00000005057 MICMU ENSMICP00000007944 MICMU

Basic PRP Q95JC9 PIG Uncharact F1SQ50 PIG

Iso2 Basic PRP Q95JC9-2 PIG Iso3 Basic PRP Q95JC9-3 PIG

Uncharact F1SQ51 PIG

PRPs Básicas Porco

Uncharact F1P7E0 CANFA ENSCAFP00000035521 CANFA Uncharact F1Q0L0_CANFA similarPRB4 XP_001147634 PANTR ENSCAFP00000030671 CANFA

ENSMODP00000002977 MONDO similar PRP XP_001150134 PANTR ENSAMEP00000002166 AILME ENSCAFP00000032468 CANFA

69100

5394

9069

52100

100

100

100

100

100

100

84100

89

99

99

97

79

99

8664

99

85

8199

99

99

99

96

90

6059

88

64

52

66

95

6175

62

55

79

99

98

96

98

92

7872

54

97

94

66

94

63

55

57

54

56

90

89

50

50

92

68

97

97

7479

64

60

55

50

97

7494

86

6785

75

100100

8251

Figura 7 Árvore Filogenética das PRPs A árvore foi construída usado o método neighbor-joining (NJ). Os valores nos ramos referem-se ao Bootstrap, que são valores obtidos por 1000 réplicas e estão representados em percentagem. Os ramos com valores de Bootstrap inferiores a 50% foram eliminados. As sequências identificadas com um círculo são espécies que com análise na saliva foram detectadas neste estudo.

Discussão

53

O fragmento de Oryctolagus cuniculus (G1SNU9) alinhado com as PRPs humanas,

rato, ratinho e macaco, apresentou uma grande similaridade entre algumas destas regiões

das PRPs, mas particularmente com as PRPs básicas, sugerindo que este fragmento deverá

pertencer à família das PRP básicas. De salientar que as PRPs básicas de coelho já foram

anteriormente isoladas e caracterizadas observando-se que estas possuem uma menor

quantidade de prolina comparativamente a outras espécies [280].

Na análise da árvore das PRPs verifica-se uma clara separação em dois ramos

principais um composto por primatas e outro ramo composto só por roedores. No ramo

composto por PRPs primatas observa-se a separação em dois tipos de PRPs: as PRPs

ácidas, PRPs básicas e PRPs glicosiladas.

Um ponto a realçar é formação de um clade monofilético das sequências de

Oryctolagus cuniculus e Microcebus murinus com as PRPs dos roedores com um valor de

bootstrap de 68%. Com observa na tabela 1, na análise da saliva de três das espécies

analisadas foram identificados fragmentos de péptidos pertencentes a família das PRPs. Na

saliva de Canis familiaris foram identificados fragmentos homólogos de Monodelphis

domestica (ENSMODP00000002977), de Oryctolagus cuniculus (G1SNU9). Na saliva de

Rattus novergicus, foram identificados péptidos de Rattus novergicus (F1LMA2,P01065,

E9PU40). Na saliva de Ovis aries foram identificados vários fragmentos homólogos a

sequência Oryctolagus cuniculus (G1SNU9).


54

4.2. Estaterinas e Histatinas

No alinhamento das 49 sequências observa-se a conservação dos cinco primeiros

aminoácidos do terminal amina de todas as sequências, excepto na sequência do péptido

hipotético de Rattus novergicus. Na região do terminal carboxilo encontra-se conservado

um resíduo de tirosina (Tyr), como se observa Figura 5. Destas sequências foram

identificadas: histatina 1, histatina 3, estaterina, péptidos hipotéticos e histaterina.

Os genes das histatinas e da estaterina são localizados na mesma região (4q13) e

têm origem num único gene, sugerindo que surgiram por duplicação do gene [133] .

A histaterina é uma quimera que contém aspectos estruturais semelhantes às

histatinas e estaterinas com um grau de similaridade de 30-50%. Encontrada em Bos taurus

pela análise de cDNA [78], a sua forma madura e função ainda não são conhecidas (Swiss

Prot n.c C6KGD7-9).

A estrutura primária da estaterina humana tem uma grande assimetria de carga,

presente na maior parte dos seus aminoácidos ionizáveis na região do terminal amina

(resíduos 1-13) [176] composto por um segmento ácido e por um segmento básico. No

segmento ácido, todos os aminoácidos estão carregados negativamente (DSS(E/D)E),

enquanto no segmento básico (região 6-13), a lisina na posição 6 e três argininas nas

posições 9, 10 e 13 se encontram carregadas positivamente. No terminal carboxilo

encontra-se um único aminoácido carregado, o ácido glutâmico na posição 26 [282].

A comparação entre as sequências de estaterina humana e de Macaca fascicularis

mostra que os dez primeiros aminoácidos, contendo as duas fosfoserinas nas posições 2 e

3, e os resíduos 13,14,17,38 e 39 são idênticos. No alinhamento destas estaterinas

verificou-se que 33 dos 42 aminoácidos são idênticos [181].

A estaterina de Macaca arctoides é composta por 42 aminoácidos e difere da

estaterina humana nos aminoácidos 11,12,15,16,18,25-27,38-40 e da estaterina Macaca

fascicularis nas posições 26 e 28 [182].

A estaterina de porco tem conservada a região negativa do terminal amina e uma

região central carregada positivamente. Na região do terminal carboxilo apresenta três

resíduos de Tyr e três resíduos de Pro conservados, mas diferem na ausência de quatro

resíduos de Gln que são conservados nas três estaterinas de primatas, já caracterizados e

três dos resíduos de Gln que estão ausentes em Bos taurus.

Discussão

55

Além das destas estaterinas já isoladas e caracterizadas na análise filogenética foi

detectada sequências similares em Callithrix jacchus, Gorilla gorilla gorilla, Macaca

mulatta, Nomascus leucogenys, Pan troglodytes, Pongo abelii e Canis familiaris. Estes

péptidos têm um ancestral comum com as estaterinas já caracterizadas. Destas sequências

dois péptidos de Canis familiaris (XP_862144; XP_856868) foram identificados em saliva

de cão analisada neste estudo (tabela 1). Estes dois péptidos apresentam uma similaridade

de cerca 45-47% com a estaterina humana, de 56-58% com estaterina de bovino e de 48-

50% com estaterina de porco. Podendo por a hipótese da identificação de nova estaterina

estaterina presente no cão.

Nos estudos da estrutura secundária da estaterina humana utilizando RMN e CD

(dicroismo circular) [188, 283], verificou-se que estruturalmente aquela se encontra

desordenada em soluções aquosas mas que numa solução de 50% trifluoretanol/água é

composta por uma estrutura de hélice α na região do terminal amina (resíduos Asp1-

Try16), uma hélice tipo II de poliprolina na região intermédia (Gly19-Gln35) e uma hélice

310 na região do terminal carboxilo (Pro36-Phe43) [283].

Como já referido na introdução, a estaterina possui como uma das suas funções, o

controle do processo de desmineralização da superfície do dente. Em medições com RMN

de estado sólido verificou-se que para a estaterina adsorvida na HAP o domínio do

terminal amina (resíduos 1-12) adopta uma conformação α-hélice e que os cinco primeiros

resíduos do terminal amina são imobilizados na superfície [191, 284-291]. Podemos

considerar que as outras estaterinas alinhadas possam ter esta função por conservarem o

segmento ácido no terminal amina.

Mas também, foi estudado Gobbes et al.[282] o papel do segmento básico (região

6-13) no reconhecimento da HAP por péptidos mutantes com uma ou múltiplas mutações,

com a substituição de resíduos carregados positivamente por resíduos de alanina (Ala).

Neste estudo, foi verificado que o péptido com uma única mutação reduziu a afinidade da

ligação, mas não alterava significativamente a densidade de empacotamento da estaterina e

a saturação da ligação. No caso do péptido com a mutação simultânea de quatro resíduos

de Ala reduzia-se substancialmente a afinidade de ligação e a cobertura da superfície da

HAP mas sem modificar a estrutura secundária e as propriedades dinâmicas do domínio no

terminal amina. Estes resultados sugerem que o papel do segmento básico é reduzir as


56

interacções repulsivas proteína-proteína, devido a diminuição da carga global (negativa) do

péptido, promovendo assim uma maior superfície total da afinidade e cobertura da HAP.

Na maioria dos péptidos e proteínas salivares adsorvidos no esmalte e HAP são

fosforilados [145]. As estaterinas humana, de Macaca fascicularis e Macaca arctoides são

difosforiladas na Ser-2 e Ser-3 [176, 181, 182] enquanto a estaterina do porco é

monofosforilada. A explicação da estaterina do porco ser só fosforilada na Ser-3 deve-se

provavelmente à substituição da Asp4→Glu presente no péptido do suíno e devido ao

envolvimento pleiotrópico Golgi- caseína cinase que é responsável pela fosforilação de

vários péptidos salivares humanos [292]. Esta cinase Golgi-caseína reconhece SX(E/pS)

como a principal sequência consenso, e portanto não é capaz de fosforilar o resíduo Ser-2.

Além dos péptidos salivares humanos, também se verifica a actuação desta mesma enzima

na fosforilação de outros péptidos salivares de porco, tal como o péptido rico em prolina

SP-A, caracterizado na saliva em porco [71].

Em estudos realizados com a estaterina humana de forma a avaliar a interacção

com as bactérias, verificou-se que os resíduos 29-43 e 33-39 do terminal carboxilo

funcionavam como o domínio de ligação para a Porphromonas gingivalis e o

Fusobacterium nucleatum fimbriae, respectivamente [193, 198]. As bactérias ligam-se

preferencialmente à estaterina quando esta se encontra imobilizada na superfície da HAP

[198, 199] sugerindo que a adsorção à superfície da HAP pode expor os locais receptores

para a ligação à fibrilina da bactéria. Além disso, o terminal carboxilo da estaterina

humana (especialmente ao nível das sequências QYQQYTF, YQQYTF, QQYTF, QYTF e

YTF) tem a capacidade de inibir o crescimento das bactérias anaeróbicas

(Pteptostreptococcus estirpe, Fusobacterium necrogenes e F. necrophorum) que podem

estar associadas a doenças do periodonto [293]. Porém, Niemi e Johansson [196]

verificaram que ao usarem um péptido híbrido, alguns tipos de Actinomyces spp. ligavam-

se aos péptidos QQYTF e PYQPYQ mas outros tipos ligavam-se ao YQPVE e QPLYPQ.

O resíduo de Tyr exibe propriedades hidrofóbicas e pontes de hidrogénio comuns nestas

sequências. No entanto, o péptido AQPVE (onde o resíduo de tirosina foi substituído por

alanina) e manteve a actividade inibidora sugerindo que o resíduo de Tyr não tem

importância para a ligação.

Tal como em humanos, foi detectado nos péptidos trípticos de EGPs (preparação do

grânulo enriquecido) da glândula parótida por HPLC-ESI-MS, a presença de duas

Discussão

57

STAT P02809 MACFA STAT P14709 MACAR

STATH EHH25962 MACMU ENSPTRP00000027723 PANTR

STAT P02808 HUMAN Uncharact G3SG71 GORGO ENSPPYP00000016521 PONAB STAT isofCRA_c A6NKE9_HUMAN ENSPTRP00000053497 PANTR Uncharact G1R7Y6 NOMLE Uncharact F7HQI8 CALJA Uncharact F7HQR7 CALJA

Primatas

Histatherin C6KGD7_BOVIN Histatherin C6KGD9_BOVIN Histatherin C6KGD8_BOVIN

STAT D8WUT6 PIG STAT Q8HY86 BOVIN

Artiodálios

LOC608829 isof1 XP_861969 CANFA LOC608829 isof4 XP_862059 CANFA XP_857103 isoform 4 XP_862196 CANFA XP_843594 isoform 1 XP_848687 CANFA

STAT-LIKE isof3 XP_856868 CANFA STAT-LIKE isof2 XP_856826 CANFA XP_857075 isoform 3 XP_862168 CANFA STAT-LIKE XP_003431878 CANFA

STAT-LIKE isof 2 XP_862144 CANFA

Carnívoros

Estaterina

Theobromine induced Q5J6K0 RAT LOC100590184 XP_003265951 NOMLE

HIS1 C0LRB4_CHLAE HIS1 C0LRB3_TRACR HIS1 C0LRB1_MACFA HIS3 C0LRB6_NOMLE

HIS3-LIKE XP_003265744 NOMLE HIS1 C0LRB2_NOMLE

Uncharact G3QQV0 GORGO HIS1 C0LRB0 9PRIM HIS1 P15515_HUMAN

ENSPTRP00000027724 PANTR ENSPPYP00000016523 PONAB HIS3-LIKE XP_002814869 PONAB ENSPPYP00000016522 PONAB Uncharact G3R990 GORGO

HIS3 C0LRB5 9PRIM HIS3 P15516 HUMAN

ENSPTRP00000053498 PANTR HIS3 C0LRB7_CHLAE

HIS1 P34084_MACFA HIS3 C0LRB9_MACFA

HRP 3 EHH25961 MACMU HIS3 C0LRB8_TRACR

Histatinas

94100

55100

99

98

5998

5664

95

95

93

57

53

52

51

51

95

86

93

77

68

75

74

64

70

isoformas de estaterina de porco mas diferindo na presença no terminal carboxilo do

resíduo de Ala. A isoforma truncada do terminal carboxilo ocorre antes ou durante o

armazenamento do grânulo nas glândulas salivares do porco e humanas [184].

Nas histatinas, observa-se a conservação de um resíduo de lisina, dois resíduos de

arginina e três resíduos de histidina, mas na histatina 3 de Trachypithecus cristatus

(COLRB8_ TRACR), só estão conservados dois resíduos de histidinas.

As histatinas humanas são idênticas nos 24 resíduos do terminal amina, excepto a

substituição de Glu e Arg (resíduos 4 e 11) em histatina 1 com Ala e Lys, respectivamente,

em histatina 3. A histatina 1 contém 9 aminoácidos inseridos ausentes na histatina 3, e

histatina 3 contém 3 aminoácidos inseridos ausentes na histatina 1. Entre estas sequências

existe um grau de similaridade de 88% [126].

Figura 8 Árvore Filogenética das Estaterinas e Histatinas. A árvore foi construída usado o método neighbor-joining (NJ). Os valores nos ramos referem-se ao Bootstrap, que são valores obtidos por 1000 réplicas e estão representados em percentagem. Os ramos com valores de Bootstrap inferiores a 50% foram eliminados.


58

Na Macaca fascicularis são encontrados a histatina 1 (M-histatina 1) e a histatina 3

(M-histatina 3) que são iguais em 20 aminoácidos no terminal amina. Mas a M-histatina 1

é mais abundante na secreção em parótida do que a M-histatina 3.

Num estudo em que se comparou a M-histatina 1 com as histatinas 1 e 3,

observou-se que M-histatina 1 contém uma sequência de 6 aminoácidos, -Arg-His-Gly-

His-His-Lys- (resíduos 10-15), ausentes na histatina 1 e histatina 3, e a histatina 1 contém

uma sequência de 6 aminoácidos, -Phe-Pro-Phe-Tyr-Gly-Asp- (resíduos 24-29), que não

está presente em M-histatina 1 ou na histatina 3. Os resíduos da M-histatina 1 nas posições

1-3,6-9,16,18.28,30 e 32-38 são idênticos às histatinas humanas. Isso demonstra que os

domínios no terminal amina, meio e no terminal carboxilo têm sido conservados e

implicam que estes domínios são relevante funcionalmente [153].

Ao observamos a região dos resíduos 9-24 das histatinas humanas estão alinhados

com as outras sequências da família das histatinas e observa-se a conservação desta região

que é descrita na histatina 5 humana e na M-histatina 1 como região responsável pela

inibição da Candida albicans [132, 150-154], podendo também ser responsável por esta

mesma função nas histatinas dos outros primatas.

4.3. Cistatinas

No alinhamento das 62 sequências observa-se a conservação de três regiões das

cistatinas salivares e das cistatinas C e D do resíduo de glicina no terminal amina, do

motivo QXVXG que está contido no loop L1 e da sequência PW inserida no loop L2 no

terminal carboxilo. A conservação destas três regiões nas cistatinas salivares e cistatinas C

e D é responsável pela inibição das proteases de cisteína da família C1.

Na análise da árvore filogenética, as sequências das cistatinas SD de Primatas e cistatinas

C estão separadas em dois ramos. Uma análise mais precisa do ramo das cistatinas SD que

é composta por 22 sequências de cistatinas derivadas apenas de primatas subdividido em

dois grupos: o das cistatinas tipo S e das cistatinas D e em ambos grupos apresentam um

nível de confiança de bootstrap 100%. No ramo das cistatinas tipo S foram agrupados

sequências de Pan troglodytes, Pongo abelii, Nomascus leucogens, Callithrix jacchus e

Discussão

59

Uncharact F6UBH5 HORSE ENSFCAP00000004756 FELCA CysC D5MTH1 FELCA Put uncharact D2I7P5 AILME Uncharact G1LU45 AILME

Cistatina C Carnívoros

ENSPVAP00000003380 PTEVA CysC P01035 BOVIN CysC Q0Z8R0 PIG Uncharact F1SAS7 PIG CysC (Frag) Q29212 PIG

Cistatina C Artiodálios

Uncharact G1Q2V3 MYOLU ENSCPOP00000001466 CAVPO ENSEEUP00000013930 ERIEU Uncharact F7CAH1_MONDO Uncharact G3VZM3_SARHA ENSDNOP00000004937 DASNO ENSETEP00000003593 ECHTE Uncharact G3TEB6_LOXAF ENSMICP00000004204 MICMU ENSOGAP00000009111 OTOGA CysC O97862 RABIT Uncharact G1SUE4 RABIT

CysC P01034 HUMAN ENSPPYP00000012040 PONAB Uncharact G1RLM2 NOMLE CysC O19092 MACMU CysC O19093 SAISC Uncharact F6UCB8 CALJA

Cistatina C Primatas

CysC G3H705_CRIGR CysC P14841 RAT Put uncharact Q3U5K7 MOUSE CysC P21460 MOUSE CysC A2APX3 MOUSE CysC Q9EPX9_MOUSE

Cistatina C Roedores

Cys10 P21460 MOUSE Cys10 D4AAU9 RAT ENSDORP00000008399 DIPOR

Cistatina 10 Roedores

ENSMICP00000014007 MICMU ENSMICP00000001300 MICMU ENSMICP00000011557 MICMU Uncharact G3RKA9_GORGO

CysD P28325 HUMAN Uncharact G1RZZ5 NOMLE Uncharact F7HAW3 MACMU Uncharact F6VIZ9 CALJA

Cistatina D Primatas

Uncharact F6VIW1 CALJA Uncharact F6ZNT9 MACMU

CysSN P01037 HUMAN ENSPTRP00000022847 PANTR Uncharact G3QJY3 GORGO ENSPPYP00000012585 PONAB ENSPPYP00000012595 PONAB ENSPTRP00000022848 PANTR ENSPPYP00000012041 PONAB

CysSA P09228 HUMAN Uncharact G3QXG3_GORGO ENSPTRP00000022846 PANTR

CysS P01036 HUMAN Uncharact G1RZZ0 NOMLE ENSPPYP00000012590 PONAB ENSPPYP00000023548 PONAB ENSPPYP00000023565 PONAB

Cistatinas tipo S Primatas

CysS G3H704_CRIGR Uncharact D3ZUY2 RAT Uncharact D3ZP68_RAT

CysS P19313 RAT Uncharact F1M6D7 RAT LM protein Q3MIE8 RAT

Cistatina S Roedores

55

98

99

9999

99

9252

95

99

99

99

96

7994

9392

9056

52

72

93

99

9279

97

7499

57

99

98

97

97

94

6884

83

63

60

7199

62

Figura 9 Árvore Filogenética das Cistatinas A árvore foi construída usado o método neighbor-joining (NJ). Os valores nos ramos referem-se ao Bootstrap, que são valores obtidos por 1000 réplicas e estão representados em percentagem. Os ramos com valores de Bootstrap inferiores a 50% foram eliminados. As cistatinas identificas com quadrado preto é as cistatinas já encontradas em saliva anteriormente.


60

Macaca mulatta. No alinhamento destas sequências observa-se uma região homóloga

situada na posição 9-26 da cistatina S humana em todas as sequências de primatas com

excepção das sequências de Callithrix jacchus. Esta região tem sido descrita na cistatina S

humana como local de ligação da HAP [251] onde é associada ao controlo da

mineralização, levantado a hipótese nestas sequências que o mesma função.

O ramo das cistatinas D formam um clade monofilético com as cistatinas salivares com

valor de bootstrap de 99 %. Tal como no ramo das cistatinas tipo S, o ramo das cistatinas

D, estão apenas identificadas sequências de primatas.

Esta árvore também mostra as cistatinas salivares e D tem um ancestral comum

com a cistatina C. No ramo das cistatinas C foram identificados 28 sequências que estão

subdivididas em cistatina C de Primatas, Roedores, Artiodáctilos e Carnívoros.

Nesta árvore a cistatina S de rato, não se encontra agrupada com as cistatinas

salivares humanas implicando ter uma origem independente. Não estando claro se é um

ortólogo elevadamente divergente das proteínas humanas ou caso de evolução

independente [210]. Mas também associada a este ramo da cistatina S de rato uma cistatina

S de Cricetulus griseus com bootstrap de 99%. Que além de partilhar homologia na

sequência deve ter a mesmas funções que cistatina S de rato.

A cistatinas C identificada apenas a cistatina C humana foi detectada em saliva,

enquanto as restantes não estão descritas como péptidos salivares.

Na análise da saliva das quatro espécies para comparar com as sequências obtidas

por análise filogenética não foram encontrados qualquer péptido homólogo a família das

cistatinas.

Discussão

61

55.. CCoonncclluussããoo

Conclusão

63

Na elaboração desta tese teve como objectivo principal encontrar novos péptidos

salivares da família das PRPs, histatinas/estaterinas e cistatinas com auxílio de ferramentas

filogenéticas para conhecer a sua origem, evolução e função. Para posterior, criação da

base de dados de péptidos salivares. Na recolha das sequências das diferentes bases de

dados, foram encontradas 140 sequências de PRPs, 49 sequências de estaterina/ histatina e

62 sequências de cistatinas.

Nas sequências da família PRPs foram detectados péptidos em espécies como Pan

troglodytes, Nomascus leucogenys, Macaca mulatta, Pongo abeii, Gorilla gorilla,

Microcebus murinus, Callithrix jachus, Canis familiaris, Ailuropoda melanoleuca, Bos

taurus, Pteropus vampyrus Monodelphis domestica que não estão descritos.. No

alinhamento das sequências observa-se uma maior homologia na região do péptido sinal e

na região repeat

A sequência da família histatinas/estaterinas identificadas, além das sequências já

isoladas e caracterizadas em saliva identificou-se novos péptidos homólogos a estaterinas

de Pan troglodytes, Nomascus leucogenys, Macaca mulatta, Pongo abelii, Gorilla gorilla

gorilla Callithrix jachus, e Canis familiaris mas também a histatinas de Pongo abelii,

Gorilla gorilla gorilla, Pan troglodytes. Em todas as sequências estão conservados os

cinco primeiros aminoácidos. Nas histatinas uma região presente nas histatinas humanas

nos resíduos 9-24 que é conservada nas outras sequências de histatinas que é responsável

pela inibição da C. albicans.

Nas sequências das cistatinas todas mantêm conservada as três regiões de inibição

da protease de cisteína papaína (G, QXVXG, PW). No caso especícifico das cistatinas tipo

S há a conservação. uma região dos resíduos 9-26 (numeração da cistatina S humana), em

todas as sequências deste tipo identificadas, nesta dissertação .

Destas sequências, criamos uma base de dados das sequências obtida da análise de

filogenética para comparar com a saliva analisada de quatro espécies (cão, coelho

selvagem, rato e ovelha). Destas espécies identificou-se a presença de fragmentos

homólogos, a duas sequências identificadas na análise filogenética como homólogas a

estaterina humana , em que podemos concluir estarmos perante um péptido hipotético de

estaterina de cão.


64

Num trabalho futuro, é necessário isolar estes péptidos e testar se tem as mesmas

características funcionais que outras espécies de péptidos salivares já identificados. Além

disso, deve-se proceder a análise de saliva de outras espécies de mamíferos, e comparar

com esta base de dados.

65

66.. BBiibblliiooggrraaffiiaa


66

Bibliografia

67

1. Amerongen, A.V. and E.C. Veerman, Saliva--the defender of the oral cavity. Oral Dis, 2002. 8(1): p. 12-22.

2. van Nieuw Amerongen, A., J.G.M. Bolscher, and E.C.I. Veerman, Salivary

Proteins: Protective and Diagnostic Value in Cariology? Caries Research, 2004. 38(3): p. 247-253.

3. Veerman, E.C.I., et al., Human glandular salivas: their separate collection and

analysis. European Journal of Oral Sciences, 1996. 104(4): p. 346-352. 4. Kaufman, E. and I.B. Lamster, The Diagnostic Applications of Saliva— A

Review. Critical Reviews in Oral Biology & Medicine, 2002. 13(2): p. 197-212. 5. Dodds, M.W.J., D.A. Johnson, and C.-K. Yeh, Health benefits of saliva: a

review. Journal of Dentistry, 2005. 33(3): p. 223-233. 6. Mandel, I.D., The functions of saliva. J Dent Res, 1987. 66 Spec No: p. 623-7. 7. Humphrey, S.P. and R.T. Williamson, A review of saliva: Normal composition,

flow, and function. The Journal of Prosthetic Dentistry, 2001. 85(2): p. 162-169. 8. Amerongen, A.V.a.E.C.V.a.A.V., Saliva: Properties and functions, in Salivary

Diagnostics, D.T. Wong, Editor. 2008, Wiley-Blackwell. p. 27-36. 9. Prinz, J.F. and P.W. Lucas, An optimization model for mastication and

swallowing in mammals. Proc Biol Sci, 1997. 264(1389): p. 1715-21. 10. Yao, Y., et al., Identification of Protein Components in Human Acquired

Enamel Pellicle and Whole Saliva Using Novel Proteomics Approaches. Journal of Biological Chemistry, 2003. 278(7): p. 5300-5308.

11. Wilmarth, P.A., et al., Two-Dimensional Liquid Chromatography Study of the

Human Whole Saliva Proteome. Journal of Proteome Research, 2004. 3(5): p. 1017-1023.

12. Vitorino, R., et al., Analysis of salivary peptides using HPLC–electrospray mass

spectrometry. Biomedical Chromatography, 2004. 18(8): p. 570-575. 13. Huang, C.-M., Comparative proteomic analysis of human whole saliva.

Archives of Oral Biology, 2004. 49(12): p. 951-962. 14. Hardt, M., et al., Toward defining the human parotid gland salivary proteome

and peptidome: identification and characterization using 2D SDS-PAGE,

ultrafiltration, HPLC, and mass spectrometry. Biochemistry, 2005. 44(8): p. 2885-99.

15. Hu, S., et al., Large-scale identification of proteins in human salivary proteome

by liquid chromatography/mass spectrometry and two-dimensional gel

electrophoresis-mass spectrometry. PROTEOMICS, 2005. 5(6): p. 1714-1728. 16. Xie, H., et al., A Catalogue of Human Saliva Proteins Identified by Free Flow

Electrophoresis-based Peptide Separation and Tandem Mass Spectrometry. Molecular & Cellular Proteomics, 2005. 4(11): p. 1826-1830.

17. Hu, S., J.A. Loo, and D.T. Wong, Human body fluid proteome analysis. PROTEOMICS, 2006. 6(23): p. 6326-6353.

18. Guo, T., et al., Characterization of the Human Salivary Proteome by Capillary

Isoelectric Focusing/Nanoreversed-Phase Liquid Chromatography Coupled

with ESI-Tandem MS. Journal of Proteome Research, 2006. 5(6): p. 1469-1478. 19. Ramachandran, P., et al., Identification of N-Linked Glycoproteins in Human

Saliva by Glycoprotein Capture and Mass Spectrometry. Journal of Proteome Research, 2006. 5(6): p. 1493-1503.

20. Hu, S., et al., Salivary proteomic and genomic biomarkers for primary Sjögren's

syndrome. Arthritis & Rheumatism, 2007. 56(11): p. 3588-3600.


68

21. Bandhakavi, S., et al., A Dynamic Range Compression and Three-Dimensional

Peptide Fractionation Analysis Platform Expands Proteome Coverage and the

Diagnostic Potential of Whole Saliva. Journal of Proteome Research, 2009. 8(12): p. 5590-5600.

22. Kojima, T., et al., Human Gingival Crevicular Fluid Contains MRP8 (S100A8)

and MRP14 (S100A9), Two Calcium-binding Proteins of the S100 Family. Journal of Dental Research, 2000. 79(2): p. 740-747.

23. Macarthur, D.J. and N.A. Jacques, Proteome Analysis of Oral Pathogens. Journal of Dental Research, 2003. 82(11): p. 870-876.

24. Messana, I., et al., Facts and artifacts in proteomics of body fluids. What

proteomics of saliva is telling us? J Sep Sci, 2008. 31(11): p. 1948-63. 25. Oppenheim, F.G., et al., Salivary Proteome and Its Genetic Polymorphisms.

Annals of the New York Academy of Sciences, 2007. 1098(1): p. 22-50. 26. Azen, E.A., et al., PRB1, PRB2, and PRB4 coded polymorphisms among human

salivary concanavalin-A binding, II-1, and Po proline-rich proteins. Am J Hum Genet, 1996. 58(1): p. 143-53.

27. Azen, E.A., Genetics of Salivary Protein Polymorphisms. Critical Reviews in Oral Biology & Medicine, 1993. 4(3): p. 479-485.

28. Helmerhorst, E.J. and F.G. Oppenheim, Saliva: a Dynamic Proteome. Journal of Dental Research, 2007. 86(8): p. 680-693.

29. Wong, R.S., T. Hofmann, and A. Bennick, The complete primary structure of a

proline-rich phosphoprotein from human saliva. J Biol Chem, 1979. 254(11): p. 4800-8.

30. Kim, H.S. and N. Maeda, Structures of two HaeIII-type genes in the human

salivary proline-rich protein multigene family. J Biol Chem, 1986. 261(15): p. 6712-8.

31. Bennick, A., Salivary proline-rich proteins. Molecular and Cellular Biochemistry, 1982. 45(2): p. 83-99.

32. Bennick, A., Structural and Genetic Aspects of Proline-rich Proteins. Journal of Dental Research, 1987. 66(2): p. 457-461.

33. Minaguchi, K. and A. Bennick, Genetics of human salivary proteins. J Dent Res, 1989. 68(1): p. 2-15.

34. Mandel, I.D., R.H. Thompson, Jr., and S.A. Ellison, Studies on the mucoproteins

of human parotid saliva. Arch Oral Biol, 1965. 10(3): p. 499-507. 35. Oppenheim, F.G., D.I. Hay, and C. Franzblau, Proline-rich proteins from human

parotid saliva. I. Isolation and partial characterization. Biochemistry, 1971. 10(23): p. 4233-4238.

36. Bennick, A. and G.E. Connell, Purification and partial characterization of four

proteins from human parotid saliva. Biochem J, 1971. 123(3): p. 455-64. 37. Hay, D.I., et al., Human salivary acidic proline-rich protein polymorphisms and

biosynthesis studied by high-performance liquid chromatography. J Dent Res, 1994. 73(11): p. 1717-26.

38. Levine, M. and P.J. Keller, The isolation of some basic proline-rich proteins

from human parotid saliva. Arch Oral Biol, 1977. 22(1): p. 37-41. 39. Kauffman, D., et al., Basic proline-rich proteins from human parotid saliva:

complete covalent structures of proteins IB-1 and IB-6. Biochemistry, 1986. 25(9): p. 2387-92.

40. Levine, M.J., J.C. Weill, and S.A. Ellison, The isolation and analysis of a

glycoprotein from parotid saliva. Biochim Biophys Acta, 1969. 188(1): p. 165-7.

Bibliografia

69

41. Bennick, A., Structure and Function of Salivary Proline-rich Proteins. Molecular Cell Biochemistry, 1982. 45: p. 83-99.

42. Azen, E.A., Properties of salivary basic proteins showing polymorphism. Biochemical Genetics, 1973. 9(1): p. 69-86.

43. Stubbs, M., et al., Encoding of human basic and glycosylated proline-rich

proteins by the PRB gene complex and proteolytic processing of their precursor

proteins. Archives of Oral Biology, 1998. 43(10): p. 753-770. 44. Mamula, P.W., et al., Localization of the human salivary protein complex (SPC)

to chromosome band 12p13.2. Cytogenet Cell Genet, 1985. 39(4): p. 279-84. 45. Kim, H.-S., O. Smithies, and N. Maeda, A physical map of the human salivary

proline-rich protein gene cluster covers over 700 kbp of DNA. Genomics, 1990. 6(2): p. 260-267.

46. Lyons, K.M., et al., Many Protein Products From a Few Loci: Assignment of

Human Salivary Proline-Rich Proteins to Specific Loci. Genetics, 1988. 120(1): p. 255-265.

47. Kauffman, D.L., et al., Alignment of amino acid and DNA sequences of human

proline-rich proteins. Crit Rev Oral Biol Med, 1993. 4(3-4): p. 287-92. 48. Azen, E. and P.-L. Yu, Genetic polymorphisms of Pe and Po salivary proteins

with probable linkage of their genes to the salivary protein gene complex (SPC). Biochemical Genetics, 1984. 22(11): p. 1065-1080.

49. Robinson, R., et al., Primary structure and possible origin of the non-

glycosylated basic proline-rich protein of human submandibular/sublingual

saliva. Biochem J, 1989. 263(2): p. 497-503. 50. Azen, E.A. and F.G. Oppenheim, Genetic polymorphism of proline-rich human

salivary proteins. Science, 1973. 180(90): p. 1067-9. 51. Azen, E.A. and C.L. Denniston, Genetic polymorphism of human salivary

proline-rich proteins: Further genetic analysis. Biochemical Genetics, 1974. 12(2): p. 109-120.

52. Azen, E.A. and C. Denniston, Genetic polymorphism of PIF (parotid isoelectric

focusing variant) proteins with linkage to the PPP (parotid proline-rich protein)

gene complex. Biochemical Genetics, 1981. 19(5): p. 475-485. 53. Schlesinger, D.H. and D.I. Hay, Complete covalent structure of a proline-rich

phosphoprotein, PRP-2, an inhibitor of calcium phosphate crystal growth from

human parotid saliva. International Journal of Peptide and Protein Research, 1986. 27(4): p. 373-379.

54. Wong, R.S. and A. Bennick, The primary structure of a salivary calcium-

binding proline-rich phosphoprotein (protein C), a possible precursor of a

related salivary protein A. Journal of Biological Chemistry, 1980. 255(12): p. 5943-5948.

55. Maeda, N., Inheritance of the human salivary proline-rich proteins: a

reinterpretation in terms of six loci forming two subfamilies. Biochem Genet, 1985. 23(5-6): p. 455-64.

56. Maeda, N., et al., Differential RNA splicing and post-translational cleavages in

the human salivary proline-rich protein gene system. J Biol Chem, 1985. 260(20): p. 11123-30.

57. Kim, H.S., et al., The structure and evolution of the human salivary proline-rich

protein gene family. Mammalian Genome, 1993. 4(1): p. 3-14. 58. McArthur, C., G.D. Sanson, and A.M. Beal, Salivary proline-rich proteins in

mammals: Roles in oral homeostasis and counteracting dietary tannin. Journal of Chemical Ecology, 1995. 21(6): p. 663-691.


70

59. Bennick, A., Interaction of Plant Polyphenols with Salivary Proteins. Critical Reviews in Oral Biology & Medicine, 2002. 13(2): p. 184-196.

60. Clements, S., H. Mehansho, and D.M. Carlson, Novel multigene families

encoding highly repetitive peptide sequences. Sequence analyses of rat and

mouse proline-rich protein cDNAs. Journal of Biological Chemistry, 1985. 260(25): p. 13471-13477.

61. Mehansho, H., et al., Induction of proline-rich glycoprotein synthesis in mouse

salivary glands by isoproterenol and by tannins. Journal of Biological Chemistry, 1985. 260(7): p. 4418-4423.

62. Ann, D.K. and D.M. Carlson, The structure and organization of a proline-rich

protein gene of a mouse multigene family. J Biol Chem, 1985. 260(29): p. 15863-72.

63. Ziemer, M.A., et al., Nucleotide sequence analysis of a proline-rich protein

cDNA and peptide homologies of rat and human proline-rich proteins. J Biol Chem, 1984. 259(16): p. 10475-80.

64. Oppenheim, F.G., E. Kousvelari, and R. Troxler, Immunological cross-reactivity

and sequence homology between salivary proline-rich proteins in human and

macque monkey (Macaca fascicularis) parotid saliva. Arch Oral Biol, 1979. 24(8): p. 595-9.

65. Oppenheim, F.G., et al., Molecular basis of salivary proline-rich protein and

peptide synthesis: cell-free translations and processing of human and macaque

statherin mRNAs and partial amino acid sequence of their signal peptides. J Dent Res, 1987. 66(2): p. 462-6.

66. Lin, H.H., E.E. Kousvelari, and D.K. Ann, Sequence and expression of the

MnP4 gene encoding basic proline-rich protein in macaque salivary glands. Gene, 1991. 104(2): p. 219-26.

67. Rajan, A.I. and A. Bennick, Demonstration of proline-rich proteins in rabbit

parotid saliva and partial characterization of some of the proteins. Arch Oral Biol, 1983. 28(5): p. 431-9.

68. Mehansho, H., et al., Induction of proline-rich proteins in hamster salivary

glands by isoproterenol treatment and an unusual growth inhibition by tannins. Journal of Biological Chemistry, 1987. 262(25): p. 12344-12350.

69. Ann, D.K., D. Gadbois, and D.M. Carlson, Structure, organization, and

regulation of a hamster proline-rich protein gene. A multigene family. Journal of Biological Chemistry, 1987. 262(9): p. 3958-3963.

70. Zhang, Q., et al., Cloning and functional study of porcine parotid hormone, a

novel proline-rich protein. J Biol Chem, 2005. 280(23): p. 22233-44. 71. Patamia, M., et al., Two proline-rich peptides from pig (Sus scrofa) salivary

glands generated by pre-secretory pathway underlying the action of a

proteinase cleaving ProAla bonds. Peptides, 2005. 26(9): p. 1550-1559. 72. Inzitari, R., et al., Proteomic analysis of salivary acidic proline-rich proteins in

human preterm and at-term newborns. J Proteome Res, 2007. 6(4): p. 1371-7. 73. Azen, E.A., et al., Alleles at the PRH1 locus coding for the human salivary-

acidic proline-rich proteins Pa, Db, and PIF. Am J Hum Genet, 1987. 41(6): p. 1035-47.

74. Azen, E.A., et al., Alleles at the PRB3 locus coding for a disulfide-bonded

human salivary proline-rich glycoprotein (Gl 8) and a null in an Ashkenazi Jew. Am J Hum Genet, 1990. 47(4): p. 686-97.

Bibliografia

71

75. Hay, D.I., et al., The primary structures of six human salivary acidic proline-

rich proteins (PRP-1, PRP-2, PRP-3, PRP-4, PIF-s and PIF-f). Biochem J, 1988. 255(1): p. 15-21.

76. Messana, I., et al., Trafficking and Postsecretory Events Responsible for the

Formation of Secreted Human Salivary Peptides. Molecular & Cellular Proteomics, 2008. 7(5): p. 911-926.

77. Inzitari, R., et al., Different isoforms and post-translational modifications of

human salivary acidic proline-rich proteins. PROTEOMICS, 2005. 5(3): p. 805-815.

78. Castagnola, M., et al., Biotechnological implications of the salivary proteome. Trends in Biotechnology, 2011. 29(8): p. 409-418.

79. Drzymala, L., et al., Cellular phosphorylation of an acidic proline-rich protein,

PRP1, a secreted salivary phosphoprotein. Biochemistry, 2000. 39(8): p. 2023-31.

80. Lasa, M., et al., Phosphorylation of Osteopontin by Golgi Apparatus Casein

Kinase. Biochemical and Biophysical Research Communications, 1997. 240(3): p. 602-605.

81. Brunati, A.M., et al., Novel consensus sequence for the Golgi apparatus casein

kinase, revealed using proline-rich protein-1 (PRP1)-derived peptide substrates. Biochem. J., 2000. 351(3): p. 765-768.

82. Hay, D., et al., Inhibition of calcium phosphate precipitation by human salivary

acidic proline-rich proteins: Structure-activity relationships. Calcified Tissue International, 1987. 40(3): p. 126-132.

83. Bennick, A., et al., The location and nature of calcium-binding sites in salivary

acidic proline-rich phosphoproteins. Journal of Biological Chemistry, 1981. 256(10): p. 4741-4746.

84. Moreno, E., K. Varughese, and D. Hay, Effect of human salivary proteins on the

precipitation kinetics of calcium phosphate. Calcified Tissue International, 1979. 28(1): p. 7-16.

85. Kousvelari, E.E., et al., Basic Biological Sciences. Journal of Dental Research, 1980. 59(8): p. 1430-1438.

86. Bennick, A., D. Kells, and G. Madapallimattam, Interaction of calcium ions and

salivary acidic proline-rich proteins with hydroxyapatite. A possible aspect of

inhibition of hydroxyapatite formation. Biochem J, 1983. 213(1): p. 11-20. 87. Bennick, A., M. Cannon, and G. Madapallimattam, Factors affecting the

adsorption of salivary acidic proline-rich proteins to hydroxyapatite. Caries Res, 1981. 15(1): p. 9-20.

88. Gibbons, R.J. and D.I. Hay, Human salivary acidic proline-rich proteins and

statherin promote the attachment of Actinomyces viscosus LY7 to apatitic

surfaces. Infect. Immun., 1988. 56(2): p. 439-445. 89. Gibbons, R.J., et al., Adsorbed salivary proline-rich protein 1 and statherin:

receptors for type 1 fimbriae of Actinomyces viscosus T14V-J1 on apatitic

surfaces. Infect. Immun., 1988. 56(11): p. 2990-2993. 90. Gibbons, R.J. and D.I. Hay, Adsorbed Salivary Acidic Proline-rich Proteins

Contribute to the Adhesion of Streptococcus mutans JBP to Apatitic Surfaces. Journal of Dental Research, 1989. 68(9): p. 1303-1307.

91. Gibbons, R.J., D.I. Hay, and D.H. Schlesinger, Delineation of a segment of

adsorbed salivary acidic proline-rich proteins which promotes adhesion of

Streptococcus gordonii to apatitic surfaces. Infection and immunity, 1991. 59(9): p. 2948-54.


72

92. Lyons, K.M., J.H. Stein, and O. Smithies, Length polymorphisms in human

proline-rich protein genes generated by intragenic unequal crossing over. Genetics, 1988. 120(1): p. 267-78.

93. Azen, E.A., C.K. Hurley, and C. Denniston, Genetic polymorphism of the major

parotid salivary glycoprotein (Gl) with linkage to the genes for Pr, Db, and Pa. Biochem Genet, 1979. 17(3-4): p. 257-79.

94. Kauffman, D.L. and P.J. Keller, The basic proline-rich proteins in human

parotid saliva from a single subject. Arch Oral Biol, 1979. 24(4): p. 249-56. 95. Azen, E.A. and C. Denniston, Polymorphism of Ps (parotid size variant) and

detection of a protein (PmS) related to the Pm (parotid middle band) system

with genetic linkage of Ps and Pm to Gl, Db, and Pr genetic determinants. Biochem Genet, 1980. 18(5-6): p. 483-501.

96. Anderson, L.C., D.L. Kauffman, and P.J. Keller, Identification of the Pm and

PmS human parotid salivary proteins as basic proline-rich proteins. Biochem Genet, 1982. 20(11-12): p. 1131-7.

97. Azen, E.A. and P.L. Yu, Genetic polymorphism of CON 1 and CON 2 salivary

proteins detected by immunologic and concanavalin A reactions on

nitrocellulose with linkage of CON 1 and CON 2 genes to the SPC (salivary

protein gene complex). Biochem Genet, 1984. 22(1-2): p. 1-19. 98. Karn, R.C., P.A. Goodman, and P.L. Yu, Description of a genetic polymorphism

of a human proline-rich salivary protein, Pc, and its relationship to other

proteins in the salivary protein complex (SPC). Biochem Genet, 1985. 23(1-2): p. 37-51.

99. Isemura, S., E. Saitoh, and K. Sanada, Fractionation and characterization of

basic proline-rich peptides of human parotid saliva and the amino acid

sequence of proline-rich peptide P-E. J Biochem, 1982. 91(6): p. 2067-75. 100. SAITOH, E., S. ISEMURA, and K. SANADA, Complete Amino Acid Sequence

of a Basic Proline-Rich Peptide, P-D, from Human Parotid Saliva. Journal of Biochemistry, 1983. 93(2): p. 495-502.

101. Saitoh, E., S. Isemura, and K. Sanada, Complete amino acid sequence of a basic

proline-rich peptide, P-F, from human parotid saliva. J Biochem, 1983. 93(3): p. 883-8.

102. Saitoh, E., S. Isemura, and K. Sanada, Further fractionation of basic proline-

rich peptides from human parotid saliva and complete amino acid sequence of

basic proline-rich peptide P-H. J Biochem, 1983. 94(6): p. 1991-9. 103. Isemura, S., E. Saitoh, and K. Sanada, Isolation and amino acid sequences of

proline-rich peptides of human whole saliva. J Biochem, 1979. 86(1): p. 79-86. 104. Kauffman, D.L., et al., Basic proline-rich proteins from human parotid saliva:

relationships of the covalent structures of ten proteins from a single individual. Biochemistry, 1991. 30(14): p. 3351-3356.

105. Kauffman, D., et al., Basic proline-rich proteins from human parotid saliva:

complete covalent structure of protein IB-9 and partial structure of protein IB-6,

members of a polymorphic pair. Biochemistry, 1982. 21(25): p. 6558-62. 106. Azen, E.A. and N. Maeda, Molecular genetics of human salivary proteins and

their polymorphisms. Adv Hum Genet, 1988. 17: p. 141-99. 107. Azen, E.A., P. Latreille, and R.L. Niece, PRBI gene variants coding for length

and null polymorphisms among human salivary Ps, PmF, PmS, and Pe proline-

rich proteins (PRPs). Am J Hum Genet, 1993. 53(1): p. 264-78.

Bibliografia

73

108. Messana, I., et al., Characterization of the Human Salivary Basic Proline-Rich

Protein Complex by a Proteomic Approach. Journal of Proteome Research, 2004. 3(4): p. 792-800.

109. Helmerhorst, E.J., et al., Identification of Lys-Pro-Gln as a Novel Cleavage Site

Specificity of Saliva-associated Proteases. Journal of Biological Chemistry, 2008. 283(29): p. 19957-19966.

110. Chan, M. and A. Bennick, Proteolytic processing of a human salivary proline-

rich protein precursor by proprotein convertases. European Journal of Biochemistry, 2001. 268(12): p. 3423-3431.

111. Lu, Y. and A. Bennick, Interaction of tannin with human salivary proline-rich

proteins. Archives of Oral Biology, 1998. 43(9): p. 717-728. 112. Hagerman, A.E. and L.G. Butler, The specificity of proanthocyanidin-protein

interactions. Journal of Biological Chemistry, 1981. 256(9): p. 4494-4497. 113. Yan, Q. and A. Bennick, Identification of histatins as tannin-binding proteins in

human saliva. Biochem J, 1995. 311 ( Pt 1): p. 341-7. 114. Charlton, A.J., et al., Tannin interactions with a full-length human salivary

proline-rich protein display a stronger affinity than with single proline-rich

repeats. FEBS Letters, 1996. 382(3): p. 289-292. 115. Baxter, N.J., et al., Multiple Interactions between Polyphenols and a Salivary

Proline-Rich Protein Repeat Result in Complexation and Precipitation†. Biochemistry, 1997. 36(18): p. 5566-5577.

116. Hatton, M.N., et al., Masticatory lubrication. The role of carbohydrate in the

lubricating property of a salivary glycoprotein-albumin complex. Biochem J, 1985. 230(3): p. 817-20.

117. Levine, M.J., et al., Structural Aspects of Salivary Glycoproteins. Journal of Dental Research, 1987. 66(2): p. 436-441.

118. Nagata, K., et al., Purification and characterization of galactosephilic

component present on the cell surfaces of Streptococcus sanguis ATCC 10557. J Periodontol, 1983. 54(3): p. 163-72.

119. Gillece-Castro, B.L., et al., Structure and bacterial receptor activity of a human

salivary proline-rich glycoprotein. Journal of Biological Chemistry, 1991. 266(26): p. 17358-17368.

120. Ruhl, S., A.L. Sandberg, and J.O. Cisar, Salivary Receptors for the Proline-rich

Protein-binding and Lectin-like Adhesins of Oral Actinomyces and Streptococci. Journal of Dental Research, 2004. 83(6): p. 505-510.

121. Prakobphol, A., P.A. Murray, and S.J. Fisher, Bacterial adherence on replicas of

sodium dodecyl sulfate-polyacrylamide gels. Analytical Biochemistry, 1987. 164(1): p. 5-11.

122. Azen, E., A. Prakobphol, and S.J. Fisher, PRB3 null mutations result in absence

of the proline-rich glycoprotein Gl and abolish Fusobacterium nucleatum

interactions with saliva in vitro. Infect. Immun., 1993. 61(10): p. 4434-4439. 123. Bolstad, A., H. Jensen, and V. Bakken, Taxonomy, biology, and periodontal

aspects of Fusobacterium nucleatum. Clin. Microbiol. Rev., 1996. 9(1): p. 55-71.

124. Robinovitch, M.R., et al., Parotid salivary basic proline-rich proteins inhibit

HIV-1 infectivity. Oral Diseases, 2001. 7(2): p. 86-93. 125. Huang, C.-M., et al., A Peptide with a ProGln C Terminus in the Human Saliva

Peptidome Exerts Bactericidal Activity against Propionibacterium acnes. Antimicrob. Agents Chemother., 2008. 52(5): p. 1834-1836.


74

126. Oppenheim, F.G., et al., Histatins, a novel family of histidine-rich proteins in

human parotid secretion. Isolation, characterization, primary structure, and

fungistatic effects on Candida albicans. J Biol Chem, 1988. 263(16): p. 7472-7. 127. vanderSpek, J.C., et al., Localization of the genes for histatins to human

chromosome 4q13 and tissue distribution of the mRNAs. Am J Hum Genet, 1989. 45(3): p. 381-7.

128. Baum, B.J., et al., Studies on histidine-rich polypeptides from human parotid

saliva. Archives of Biochemistry and Biophysics, 1976. 177(2): p. 427-436. 129. Sabatini, L.M., et al., Tissue distribution of RNAs for cystatins, histatins,

statherin, and proline-rich salivary proteins in humans and macaques. J Dent Res, 1989. 68(7): p. 1138-45.

130. Troxler, R.F., et al., Structural relationship between human salivary histatins. J Dent Res, 1990. 69(1): p. 2-6.

131. Ahmad, M., et al., Immunocytochemical Localization of Histatins in Human

Salivary Glands. J. Histochem. Cytochem., 2004. 52(3): p. 361-370. 132. Helmerhorst, E.J., et al., Synthetic histatin analogues with broad-spectrum

antimicrobial activity. Biochem. J., 1997. 326(1): p. 39-45. 133. Sabatini, L.M., T. Ota, and E.A. Azen, Nucleotide sequence analysis of the

human salivary protein genes HIS1 and HIS2, and evolution of the STATH/HIS

gene family. Mol Biol Evol, 1993. 10(3): p. 497-511. 134. Jumblatt, M.M., et al., Glycoprotein 340 in Normal Human Ocular Surface

Tissues and Tear Film. Infect. Immun., 2006. 74(7): p. 4058-4063. 135. Oppenheim, F.G., et al., The primary structure and functional characterization

of the neutral histidine-rich polypeptide from human parotid secretion. J Biol Chem, 1986. 261(3): p. 1177-82.

136. Driscoll, J., et al., Functional Comparison of Native and Recombinant Human

Salivary Histatin 1. Journal of Dental Research, 1995. 74(12): p. 1837-1844. 137. Cabras, T., et al., Tyrosine Polysulfation of Human Salivary Histatin 1. A Post-

Translational Modification Specific of the Submandibular Gland. Journal of Proteome Research, 2007. 6(7): p. 2472-2480.

138. Castagnola, M., et al., A cascade of 24 histatins (histatin 3 fragments) in human

saliva. Suggestions for a pre-secretory sequential cleavage pathway. J Biol Chem, 2004. 279(40): p. 41436-43.

139. Sabatini, L.M. and E.A. Azen, Two coding change mutations in the HIS22 allele

characterize the salivary histatin 3-2 protein variant. Human Mutation, 1994. 4(1): p. 12-19.

140. Sugiyama, K. and K. Ogata, High-performance liquid chromatographic

determination of histatins in human saliva. Journal of Chromatography: Biomedical Applications, 1993. 619(2): p. 306-309.

141. Schenkels, L.C., E.C. Veerman, and A.V. Nieuw Amerongen, Biochemical

composition of human saliva in relation to other mucosal fluids. Crit Rev Oral Biol Med, 1995. 6(2): p. 161-75.

142. Helmerhorst, E.J., et al., Oral fluid proteolytic effects on histatin 5 structure and

function. Arch Oral Biol, 2006. 51(12): p. 1061-70. 143. Payne, J.B., et al., Selective effects of histidine-rich polypeptides on the

aggregation and viability of Streptococcus mutans and Streptococcus sanguis. Oral Microbiology and Immunology, 1991. 6(3): p. 169-176.

144. Bruno, L.S., et al., Two-hybrid analysis of human salivary mucin MUC7

interactions. Biochimica et Biophysica Acta (BBA) - Molecular Cell Research, 2005. 1746(1): p. 65-72.

Bibliografia

75

145. Mayhall, C.W., Concerning the composition and source of the acquired enamel

pellicle of human teeth. Archives of Oral Biology, 1970. 15(12): p. 1327-1341. 146. Hay, D.I., Fractionation of human parotid salivary proteins and the isolation of

an histidine-rich acidic peptide which shows high affinity for hydroxyapatite

surfaces. Arch Oral Biol, 1975. 20(9): p. 553-8. 147. Siqueira, W.L., et al., Evidence of Intact Histatins in the in vivo Acquired

Enamel Pellicle. Journal of Dental Research, 2010. 89(6): p. 626-630. 148. Jensen, J.L., M.S. Lamkin, and F.G. Oppenheim, Adsorption of human salivary

proteins to hydroxyapatite: a comparison between whole saliva and glandular

salivary secretions. J Dent Res, 1992. 71(9): p. 1569-76. 149. Hay, D.I., The interaction of human parotid salivary proteins with

hydroxyapatite. Archives of Oral Biology, 1973. 18(12): p. 1517-1528, IN5-IN6, 1529.

150. Pollock, J.J., et al., Fungistatic and fungicidal activity of human parotid salivary

histidine-rich polypeptides on Candida albicans. Infect Immun, 1984. 44(3): p. 702-7.

151. Xu, T., et al., Anticandidal activity of major human salivary histatins. Infect Immun, 1991. 59(8): p. 2549-54.

152. Gyurko, C., et al., Candida albicans Mutants Deficient in Respiration Are

Resistant to the Small Cationic Salivary Antimicrobial Peptide Histatin 5. Antimicrob. Agents Chemother., 2000. 44(2): p. 348-354.

153. Xu, T., et al., Primary structure and anticandidal activity of the major histatin

from parotid secretion of the subhuman primate, Macaca fascicularis. J Dent Res, 1990. 69(11): p. 1717-23.

154. Raj, P.A., M. Edgerton, and M.J. Levine, Salivary histatin 5: dependence of

sequence, chain length, and helical conformation for candidacidal activity. Journal of Biological Chemistry, 1990. 265(7): p. 3898-3905.

155. Helmerhorst, E.J., et al., Amphotericin B- and Fluconazole-Resistant Candida

spp., Aspergillus fumigatus, and Other Newly Emerging Pathogenic Fungi Are

Susceptible to Basic Antifungal Peptides. Antimicrob. Agents Chemother., 1999. 43(3): p. 702-704.

156. Tsai, H. and L.A. Bobek, Human salivary histatin-5 exerts potent fungicidal

activity against Cryptococcus neoformans. Biochimica et Biophysica Acta (BBA) - General Subjects, 1997. 1336(3): p. 367-369.

157. Driscoll, J., et al., Candidacidal activity of human salivary histatin recombinant

variants produced by site-directed mutagenesis. Gene, 1996. 177(1-2): p. 29-34. 158. Tsai, H. and L.A. Bobek, Human Salivary Histatins: Promising Anti-Fungal

Therapeutic Agents. Critical Reviews in Oral Biology & Medicine, 1998. 9(4): p. 480-497.

159. Fitzgerald, D.H., D.C. Coleman, and B.C. O'Connell, Susceptibility of Candida

dubliniensis to Salivary Histatin 3. Antimicrob. Agents Chemother., 2003. 47(1): p. 70-76.

160. MacKay, B.J., et al., Growth-inhibitory and bactericidal effects of human

parotid salivary histidine-rich polypeptides on Streptococcus mutans. Infect Immun, 1984. 44(3): p. 695-701.

161. Travis, J., et al., Porphyromonas gingivalis proteinases as virulence factors in

the development of periodontitis. Journal of Periodontal Research, 1997. 32(1): p. 120-125.


76

162. Murakami, Y., et al., Purification and characterization from human parotid

secretion of a peptide which inhibits hemagglutination of Bacteroides gingivalis

381. FEMS Microbiology Letters, 1990. 72(3): p. 275-279. 163. Murakami, Y., et al., Binding of a histidine-rich peptide to Porphyromonas

gingivalis. FEMS Microbiology Letters, 1991. 82(3): p. 253-256. 164. Murakami, Y., et al., Inhibitory effects of synthetic histidine-rich peptides on

haemagglutination by Bacteroides gingivalis 381. Archives of Oral Biology, 1990. 35(9): p. 775-777.

165. Murakami, Y., et al., Biological role of an arginine residue present in a

histidine-rich peptide which inhibits hemagglutination of Porphyromonas

gingivalis. FEMS Microbiology Letters, 1992. 98(1-3): p. 201-204. 166. Inoshita, E., et al., Isolation and some properties of exohemagglutinin from the

culture medium of Bacteroides gingivalis 381. Infect. Immun., 1986. 52(2): p. 421-427.

167. Murakami, Y., et al., Inhibitory effects of human salivary histatins and lysozyme

on coaggregation between Porphyromonas gingivalis and Streptococcus mitis. Infect. Immun., 1991. 59(9): p. 3284-3286.

168. Hancock, R.E.W. and G. Diamond, The role of cationic antimicrobial peptides

in innate host defences. Trends in Microbiology, 2000. 8(9): p. 402-410. 169. Sugiyama, K., Anti-lipopolysaccharide activity of histatins, peptides from

human saliva. Experientia, 1993. 49(12): p. 1095-7. 170. Sugiyama, K., T. Ogino, and K. Ogata, Rapid purification and characterization

of histatins (histidine-rich polypeptides) from human whole saliva. Archives of Oral Biology, 1990. 35(6): p. 415-419.

171. Sugiyama, K., Y. Suzuki, and H. Furuta, Isolation and characterization of

histamine-releasing peptides from human parotid saliva. Life Sciences, 1985. 37(5): p. 475-480.

172. Oudhoff, M.J., et al., Histatins are the major wound-closure stimulating factors

in human saliva as identified in a cell culture assay. FASEB J., 2008. 22(11): p. 3805-3812.

173. Azen, E.A., et al., mRNAs for PRPs, statherin, and histatins in von Ebner's

gland tissues. J Dent Res, 1990. 69(11): p. 1724-30. 174. Hay, D.I., et al., Relationship between concentration of human salivary statherin

and inhibition of calcium phosphate precipitation in stimulated human parotid

saliva. J Dent Res, 1984. 63(6): p. 857-63. 175. Sabatini, L.M., et al., cDNA cloning and chromosomal localization (4q11-13) of

a gene for statherin, a regulator of calcium in saliva. Am J Hum Genet, 1987. 41(6): p. 1048-60.

176. Schlesinger, D.H. and D.I. Hay, Complete covalent structure of statherin, a

tyrosine-rich acidic peptide which inhibits calcium phosphate precipitation from

human parotid saliva. J Biol Chem, 1977. 252(5): p. 1689-95. 177. Jensen, J.L., et al., Multiple forms of statherin in human salivary secretions.

Arch Oral Biol, 1991. 36(7): p. 529-34. 178. Sabatini, L.M., Y.Z. He, and E.A. Azen, Structure and sequence determination

of the gene encoding human salivary statherin. Gene, 1990. 89(2): p. 245-51. 179. Cabras, T., et al., HPLC-MS characterization of cyclo-statherin Q-37, a specific

cyclization product of human salivary statherin generated by transglutaminase

2. J Sep Sci, 2006. 29(17): p. 2600-8. 180. Li, J., et al., Statherin is an in vivo pellicle constituent: identification and

immuno-quantification. Archives of Oral Biology, 2004. 49(5): p. 379-385.

Bibliografia

77

181. Oppenheim, F.G., G.D. Offner, and R.F. Troxler, Phosphoproteins in the

parotid saliva from the subhuman primate Macaca fascicularis. Isolation and

characterization of a proline-rich phosphoglycoprotein and the complete

covalent structure of a proline-rich phosphopeptide. J Biol Chem, 1982. 257(16): p. 9271-82.

182. Schlesinger, D.H., D.I. Hay, and M.J. Levine, Complete primary structure of

statherin, a potent inhibitor of calcium phosphate precipitation, from the saliva

of the monkey, Macaca arctoides. Int J Pept Protein Res, 1989. 34(5): p. 374-80. 183. Rijnkels, M., et al., Multispecies comparative analysis of a mammalian-specific

genomic domain encoding secretory proteins. Genomics, 2003. 82(4): p. 417-432.

184. Manconi, B., et al., Structural characterization of a new statherin from pig

parotid granules. Journal of Peptide Science, 2010. 16(6): p. 269-275. 185. Berg, C.I.H., L. Lindh, and T. Arnebrant, Intraoral Lubrication of PRP-1,

Statherin and Mucin as Studied by AFM. Biofouling: The Journal of Bioadhesion and Biofilm Research, 2004. 20(1): p. 65 - 70.

186. Douglas, W.H., et al., Statherin: A major boundary lubricant of human saliva. Biochemical and Biophysical Research Communications, 1991. 180(1): p. 91-97.

187. Raj, P.A., et al., Salivary statherin. Dependence on sequence, charge, hydrogen

bonding potency, and helical conformation for adsorption to hydroxyapatite and

inhibition of mineralization. J Biol Chem, 1992. 267(9): p. 5968-76. 188. Gururaja, T., G. Naganagowda, and M. Levine, Solution structure of human

salivary statherin, in Peptides Frontiers of Peptide Science, J.P. Tam and P.T.P. Kaumaya, Editors. 2002, Springer Netherlands. p. 483-484.

189. Tamaki, N., et al., Comparison of inhibitory activity on calcium phosphate

precipitation by acidic proline-rich proteins, statherin, and histatin-1. Calcif Tissue Int, 2002. 71(1): p. 59-62.

190. Schwartz, S.S., D.I. Hay, and S.K. Schluckebier, Inhibition of calcium

phosphate precipitation by human salivary statherin: structure-activity

relationships. Calcif Tissue Int, 1992. 50(6): p. 511-7. 191. Goobes, G., et al., Folding of the C-terminal bacterial binding domain in

statherin upon adsorption onto hydroxyapatite crystals. Proceedings of the National Academy of Sciences, 2006. 103(44): p. 16083-16088.

192. Goobes, G., et al., The structure, dynamics, and energetics of protein

adsorption-lessons learned from adsorption of statherin to hydroxyapatite. Magn Reson Chem, 2008. 45(S1): p. S32-S47.

193. Amano, A., et al., Structural domains of Porphyromonas gingivalis recombinant

fimbrillin that mediate binding to salivary proline-rich protein and statherin. Infect Immun, 1996. 64(5): p. 1631-7.

194. Amano, A., et al., Salivary receptors for recombinant fimbrillin of

Porphyromonas gingivalis. Infect Immun, 1994. 62(8): p. 3372-80. 195. Nagata, H., et al., Role of the carboxyl-terminal region of Porphyromonas

gingivalis fimbrillin in binding to salivary proteins. Infect Immun, 1997. 65(2): p. 422-7.

196. Niemi, L.D. and I. Johansson, Salivary Statherin Peptide-Binding Epitopes of

Commensal and Potentially Infectious Actinomyces spp. Delineated by a Hybrid

Peptide Construct. Infect. Immun., 2004. 72(2): p. 782-787.


78

197. Stromberg, N., et al., Salivary receptors for GalNAc beta-sensitive adherence of

Actinomyces spp.: evidence for heterogeneous GalNAc beta and proline-rich

protein receptor properties. Infect. Immun., 1992. 60(8): p. 3278-3286. 198. Sekine, S., et al., Active domains of salivary statherin on apatitic surfaces for

binding to Fusobacterium nucleatum cells. Microbiology, 2004. 150(7): p. 2373-2379.

199. Xie, H., R.J. Gibbons, and D.I. Hay, Adhesive properties of strains of

Fusobacterium nucleatum of the subspecies nucleatum, vincentii and

polymorphum. Oral Microbiol Immunol, 1991. 6(5): p. 257-63. 200. Amano, A., et al., Binding of Porphyromonas gingivalis fimbriae to proline-rich

glycoproteins in parotid saliva via a domain shared by major salivary

components. Infect Immun, 1998. 66(5): p. 2072-7. 201. Li, T., et al., Strains of Actinomyces naeslundii andActinomyces viscosus Exhibit

Structurally Variant Fimbrial Subunit Proteins and Bind to Different Peptide

Motifs in Salivary Proteins. Infection and immunity, 1999. 67(5): p. 2053-2059. 202. Leito, J.T.D., et al., Identification of salivary components that induce transition

of hyphae to yeast in Candida albicans. FEMS Yeast Research, 2009. 9(7): p. 1102-1110.

203. Raj, P.A., L. Rajkumar, and A.R. Dentino, Novel molecules for intra-oral

delivery of antimicrobials to prevent and treat oral infectious diseases. Biochem J, 2008. 409(2): p. 601-9.

204. Barrett, A.J., The cystatins: a new class of peptidase inhibitors. Trends in Biochemical Sciences, 1987. 12: p. 193-196.

205. Barrett, A.J., et al., Nomenclature and classification of the proteins homologous

with the cysteine-proteinase inhibitor chicken cystatin. Biochem J, 1986. 236(1): p. 312.

206. Turk, V. and W. Bode, The cystatins: protein inhibitors of cysteine proteinases. FEBS Lett, 1991. 285(2): p. 213-9.

207. Saitoh, E., et al., Human cysteine-proteinase inhibitors: nucleotide sequence

analysis of three members of the cystatin gene family. Gene, 1987. 61(3): p. 329-338.

208. Salvesen, G., et al., Human low-Mr kininogen contains three copies of a cystatin

sequence that are divergent in structure and in inhibitory activity for cysteine

proteinases. Biochem J, 1986. 234(2): p. 429-34. 209. Abrahamson, M., Cystatins. Methods Enzymol, 1994. 244: p. 685-700. 210. Dickinson, D.P., Salivary (SD-type) cystatins: over one billion years in the

making--but to what purpose? Crit Rev Oral Biol Med, 2002. 13(6): p. 485-508. 211. Bode, W., et al., The 2.0 A X-ray crystal structure of chicken egg white cystatin

and its possible mode of interaction with cysteine proteinases. EMBO J, 1988. 7(8): p. 2593-9.

212. Takeda, A., S. Kobayashi, and T. Samejima, Isolation and Characterization of

Two Thiol Proteinase Inhibitors of Low Molecular Weight from Newborn Rat

Epidermis. J Biochem, 1983. 94(3): p. 811-820. 213. Turk, B., I. Krizaj, and V. Turk, Isolation and characterization of bovine stefin

B. Biol Chem Hoppe Seyler, 1992. 373(7): p. 441-6. 214. Turk, B., et al., Identification of bovine stefin A, a novel protein inhibitor of

cysteine proteinases. FEBS Letters, 1995. 360(2): p. 101-105. 215. Lenarcic, B., et al., Pig leukocyte cysteine proteinase inhibitor (PLCPI), a new

member of the stefin family. FEBS Letters, 1993. 336(2): p. 289-292.

Bibliografia

79

216. Kondo, H., et al., Inhibitory effect of oryzacystatins and a truncation mutant on

the replication of poliovirus in infected Vero cells. FEBS Letters, 1992. 299(1): p. 48-50.

217. Grzonka, Z., et al., Structural studies of cysteine proteases and their inhibitors. Acta Biochim Pol, 2001. 48(1): p. 1-20.

218. Freije, J.P., et al., Localization of the human cystatin D gene (CST5) to

chromosome 20p11.21 by in situ hybridization. Cytogenet Cell Genet, 1993. 62(1): p. 29-31.

219. Warfel, A.H., et al., Constitutive secretion of cystatin C (gamma-trace) by

monocytes and macrophages and its downregulation after stimulation. J Exp Med, 1987. 166(6): p. 1912-7.

220. Moroi, R., et al., Immunocytochemical study of cathepsin L and rat salivary

cystatin-3 in rat osteoclasts treated with E-64 in vivo. Archives of Oral Biology, 1997. 42(4): p. 305-315.

221. Dickinson, D.P., CYSTEINE PEPTIDASES OF MAMMALS: THEIR

BIOLOGICAL ROLES AND POTENTIAL EFFECTS IN THE ORAL CAVITY

AND OTHER TISSUES IN HEALTH AND DISEASE. Critical Reviews in Oral Biology & Medicine, 2002. 13(3): p. 238-275.

222. Rawlings, N.D. and A.J. Barrett, Evolution of proteins of the cystatin

superfamily. Journal of Molecular Evolution, 1990. 30(1): p. 60-71. 223. Saitoh, E. and S. Isemura, Molecular biology of human salivary cysteine

proteinase inhibitors. Crit Rev Oral Biol Med, 1993. 4(3-4): p. 487-93. 224. Brown, W.M. and K.M. Dziegielewska, Friends and relations of the cystatin

superfamily--new members and their evolution. Protein Sci, 1997. 6(1): p. 5-12. 225. Brillard-Bourdet, M., et al., Purification and characterization of a new cystatin

inhibitor from Taiwan cobra (Naja naja atra) venom. Biochem. J., 1998. 331(1): p. 239-244.

226. Ni, J., et al., Cystatin F is a glycosylated human low molecular weight cysteine

proteinase inhibitor. J Biol Chem, 1998. 273(38): p. 24797-804. 227. Margis, R., E.M. Reis, and V. Villeret, Structural and Phylogenetic

Relationships among Plant and Animal Cystatins. Archives of Biochemistry and Biophysics, 1998. 359(1): p. 24-30.

228. Lamkin, M.S., et al., Salivary cystatin SA-III, a potential precursor of the

acquired enamel pellicle, is phosphorylated at both its amino- and carboxyl-

terminal regions. Arch Biochem Biophys, 1991. 288(2): p. 664-70. 229. Bobek, L.A. and M.J. Levine, Cystatins--inhibitors of cysteine proteinases. Crit

Rev Oral Biol Med, 1992. 3(4): p. 307-32. 230. Isemura, S., E. Saitoh, and K. Sanada, Characterization and amino acid

sequence of a new acidic cysteine proteinase inhibitor (cystatin SA) structurally

closely related to cystatin S, from human whole saliva. J Biochem, 1987. 102(4): p. 693-704.

231. Isemura, S., et al., Identification of full-sized forms of salivary (S-type) cystatins

(cystatin SN, cystatin SA, cystatin S, and two phosphorylated forms of cystatin S)

in human whole saliva and determination of phosphorylation sites of cystatin S. J Biochem, 1991. 110(4): p. 648-54.

232. Ramasubbu, N., et al., Large-scale purification and characterization of the

major phosphoproteins and mucins of human submandibular-sublingual saliva. Biochem J, 1991. 280 ( Pt 2): p. 341-52.


80

233. Balbín, M., et al., A sequence variation in the human cystatin D gene resulting

in an amino acid (Cys/Arg) polymorphism at the protein level. Human Genetics, 1993. 90(6): p. 668-669.

234. Grubb, A. and H. Lofberg, Human gamma-trace, a basic microprotein: amino

acid sequence and presence in the adenohypophysis. Proc Natl Acad Sci U S A, 1982. 79(9): p. 3024-7.

235. Abrahamson, M., et al., Molecular cloning and sequence analysis of cDNA

coding for the precursor of the human cysteine proteinase inhibitor cystatin C. FEBS Letters, 1987. 216(2): p. 229-233.

236. Abrahamson, M., et al., Hereditary cystatin C amyloid angiopathy:

identification of the disease-causing mutation and specific diagnosis by

polymerase chain reaction based analysis. Hum Genet, 1992. 89(4): p. 377-80. 237. Freije, J.P., et al., Structure and expression of the gene encoding cystatin D, a

novel human cysteine proteinase inhibitor. J Biol Chem, 1991. 266(30): p. 20538-43.

238. Freije, J.P., et al., Human cystatin D. cDNA cloning, characterization of the

Escherichia coli expressed inhibitor, and identification of the native protein in

saliva. J Biol Chem, 1993. 268(21): p. 15737-44. 239. Dickinson, D.P., M. Thiesse, and M.J. Hicks, Expression of Type 2 Cystatin

Genes CST1-CST5 in Adult Human Tissues and the Developing Submandibular

Gland. DNA and Cell Biology, 2002. 21(1): p. 47-65. 240. Abrahamson, M., et al., Isolation of six cysteine proteinase inhibitors from

human urine. Their physicochemical and enzyme kinetic properties and

concentrations in biological fluids. J Biol Chem, 1986. 261(24): p. 11282-9. 241. Shaw, P.A., et al., Cloning and sequencing of cDNA encoding a rat salivary

cysteine proteinase inhibitor inducible by beta-adrenergic agonists. J Biol Chem, 1988. 263(34): p. 18133-7.

242. Minakata, K. and M. Asano, New protein inhibitors of cysteine proteinases in

human saliva and salivary glands. Hoppe Seylers Z Physiol Chem, 1984. 365(3): p. 399-403.

243. Isemura, S., E. Saitoh, and K. Sanada, Characterization of a new cysteine

proteinase inhibitor of human saliva, cystatin SN, which is immunologically

related to cystatin S. FEBS Lett, 1986. 198(1): p. 145-9. 244. Sandholm, L., Proteases and their inhibitors in chronic inflammatory

periodontal disease. J Clin Periodontol, 1986. 13(1): p. 19-26. 245. Eley, B.M. and S.W. Cox, Cathepsin B/L-, elastase-, tryptase-, trypsin- and

dipeptidyl peptidase IV-like activities in gingival crevicular fluid: correlation

with clinical parameters in untreated chronic periodontitis patients. J Periodontal Res, 1992. 27(1): p. 62-9.

246. Socransky, S.S., et al., New concepts of destructive periodontal disease. J Clin Periodontol, 1984. 11(1): p. 21-32.

247. Eley, B.M. and S.W. Cox, Advances in periodontal diagnosis. 7. Proteolytic and

hydrolytic enzymes link with periodontitis. Br Dent J, 1998. 184(7): p. 323-8. 248. Machleidt, W., et al., Mechanism of inhibition of papain by chicken egg white

cystatin: Inhibition constants of N-terminally truncated forms and cyanogen

bromide fragments of the inhibitor. FEBS Letters, 1989. 243(2): p. 234-238. 249. Schwabe, C., et al., Cystatin. Amino acid sequence and possible secondary

structure. Biochem J, 1984. 217(3): p. 813-7.

Bibliografia

81

250. Alvarez-Fernandez, M., et al., Inhibition of mammalian legumain by some

cystatins is due to a novel second reactive site. J Biol Chem, 1999. 274(27): p. 19195-203.

251. Lamkin, M.S. and F.G. Oppenheim, Structural Features of Salivary Function. Critical Reviews in Oral Biology & Medicine, 1993. 4(3): p. 251-259.

252. Al-Hashimi, I. and M.J. Levine, Characterization of in vivo salivary-derived

enamel pellicle. Archives of Oral Biology, 1989. 34(4): p. 289-295. 253. Johnsson, M., et al., The effects of human salivary cystatins and statherin on

hydroxyapatite crystallization. Arch Oral Biol, 1991. 36(9): p. 631-6. 254. Shomers, J.P., et al., Characterization of cysteine-containing phosphoproteins

from human submandibular-sublingual saliva. J Dent Res, 1982. 61(6): p. 764-7.

255. Shomers, J.P., et al., The isolation of a family of cysteine-containing

phosphoproteins from human submandibular-sublingual saliva. J Dent Res, 1982. 61(8): p. 973-7.

256. Shomers, J.P., et al., Properties of cysteine-containing phosphoproteins from

human submandibular-sublingual saliva. J Dent Res, 1982. 61(2): p. 397-9. 257. Bell, J.E., et al., Examination of the potential structure of human salivary

cystatins based on computer modelling. Archives of Oral Biology. 42(10-11): p. 761-772.

258. Bjorck, L., A. Grubb, and L. Kjellen, Cystatin C, a human proteinase inhibitor,

blocks replication of herpes simplex virus. J Virol, 1990. 64(2): p. 941-3. 259. Collins, A.R. and A. Grubb, Inhibitory effects of recombinant human cystatin C

on human coronaviruses. Antimicrob. Agents Chemother., 1991. 35(11): p. 2444-2446.

260. Ruzindana-Umunyana, A. and J.M. Weber, Interactions of human lacrimal and

salivary cystatins with adenovirus endopeptidase. Antiviral Research, 2001. 51(3): p. 203-214.

261. Graur, D. and W.H. Li, Fundamentals of molecular evolution. 2000: Sinauer. 262. Hillis, D.M., C. Moritz, and B. Mable, Molecular systematics. 1996, Sinauer

Associates. p. p.407-514. 263. Baxevanis, A. and B. Ouellette, Bioinformatics: a practical guide to the analysis

of genes and proteins. 2001: Wiley-Interscience. 264. Feng, D.-F. and R. Doolittle, Progressive sequence alignment as a

prerequisitetto correct phylogenetic trees. Journal of Molecular Evolution, 1987. 25(4): p. 351-360.

265. Smith, T.F. and M.S. Waterman, Identification of common molecular

subsequences. J Mol Biol, 1981. 147(1): p. 195-7. 266. Brudno, M., et al., Glocal alignment: finding rearrangements during alignment.

Bioinformatics, 2003. 19(suppl 1): p. i54-i62. 267. Altschul, S.F., et al., Basic local alignment search tool. J Mol Biol, 1990.

215(3): p. 403-10. 268. Larkin, M.A., et al., Clustal W and Clustal X version 2.0. Bioinformatics, 2007.

23(21): p. 2947-2948. 269. Thompson, J.D., D.G. Higgins, and T.J. Gibson, CLUSTAL W: improving the

sensitivity of progressive multiple sequence alignment through sequence

weighting, position-specific gap penalties and weight matrix choice. Nucleic Acids Res, 1994. 22(22): p. 4673-80.


82

270. Dayhoff, M.O., R.M. Schwartz, and B.C. Orcutt, {A model of evolutionary

change in proteins}. Atlas of protein sequence and structure, 1978. 5(suppl 3): p. 345-351.

271. Altschul, S.F., Amino acid substitution matrices from an information theoretic

perspective. Journal of Molecular Biology, 1991. 219(3): p. 555-565. 272. Henikoff, S. and J.G. Henikoff, Amino acid substitution matrices from protein

blocks. Proc Natl Acad Sci U S A, 1992. 89(22): p. 10915-9. 273. Henikoff, S. and J.G. Henikoff, Automated assembly of protein blocks for

database searching. Nucleic Acids Research, 1991. 19(23): p. 6565-6572. 274. Saitou, N. and M. Nei, The neighbor-joining method: a new method for

reconstructing phylogenetic trees. Mol Biol Evol, 1987. 4(4): p. 406-25. 275. Huelsenbeck, J.P., Performance of Phylogenetic Methods in Simulation.

Systematic Biology, 1995. 44(1): p. 17-48. 276. Efron, B., Bootstrap Methods: Another Look at the Jackknife. The Annals of

Statistics, 1979. 7(1): p. 1-26. 277. Felsenstein, J., Confidence Limits on Phylogenies: An Approach Using the

Bootstrap. Evolution, 1985. 39(4): p. 783-791. 278. Hillis, D.M. and J.J. Bull, An Empirical Test of Bootstrapping as a Method for

Assessing Confidence in Phylogenetic Analysis. Systematic Biology, 1993. 42(2): p. 182-192.

279. Kumar, S., et al., MEGA: A biologist-centric software for evolutionary analysis

of DNA and protein sequences. Briefings in Bioinformatics, 2008. 9(4): p. 299-306.

280. Ferreira, F.D., et al., Differential expression of proline-rich proteins in rabbit

salivary glands. Journal of Histochemistry & Cytochemistry, 1992. 40(9): p. 1393-404.

281. Fanali, C., et al., Mass spectrometry strategies applied to the characterization of

proline-rich peptides from secretory parotid granules of pig (Sus scrofa). Journal of Separation Science, 2008. 31(3): p. 516-522.

282. Goobes, R., et al., Thermodynamics of Statherin Adsorption onto

Hydroxyapatite†. Biochemistry, 2006. 45(17): p. 5576-5586. 283. Naganagowda, G.A., T.L. Gururaja, and M.J. Levine, Delineation of

conformational preferences in human salivary statherin by 1H, 31P NMR and

CD studies: sequential assignment and structure-function correlations. J Biomol Struct Dyn, 1998. 16(1): p. 91-107.

284. Gibson, J.M., et al., A REDOR NMR Study of a Phosphorylated Statherin

Fragment Bound to Hydroxyapatite Crystals. Journal of the American Chemical Society, 2005. 127(26): p. 9350-9351.

285. Long, J.R., et al., A peptide that inhibits hydroxyapatite growth is in an extended

conformation on the crystal surface. Proc Natl Acad Sci U S A, 1998. 95(21): p. 12083-7.

286. Long, J.R., et al., Structure and dynamics of hydrated statherin on

hydroxyapatite as determined by solid-state NMR. Biochemistry, 2001. 40(51): p. 15451-5.

287. Raghunathan, V., et al., Homonuclear and Heteronuclear NMR Studies of a

Statherin Fragment Bound to Hydroxyapatite Crystals. The Journal of Physical Chemistry B, 2006. 110(18): p. 9324-9332.

288. Ramasubbu, N., et al., Structural Characteristics of Human Salivary Statherin:

A Model for Boundary Lubrication at the Enamel Surface. Critical Reviews in Oral Biology & Medicine, 1993. 4(3): p. 363-370.

Bibliografia

83

289. Shaw, W.J., et al., A Solid State NMR Study of Dynamics in a Hydrated Salivary

Peptide Adsorbed to Hydroxyapatite. Journal of the American Chemical Society, 2000. 122(29): p. 7118-7119.

290. Shaw, W.J., et al., Determination of Statherin N-Terminal Peptide Conformation

on Hydroxyapatite Crystals. Journal of the American Chemical Society, 2000. 122(8): p. 1709-1716.

291. Wikiel, K., et al., Hydroxyapatite mineralization and demineralization in the

presence of synthetic phosphorylated pentapeptides. Archives of Oral Biology, 1994. 39(8): p. 715-721.

292. Marina, L., M. Oriano, and A.P. Lorenzo, Rat Liver Golgi Apparatus Contains a

Protein Kinase Similar to the Casein Kinase of Lactating Mammary Gland. European Journal of Biochemistry, 1997. 243(3): p. 719-725.

293. Kochanska, B., et al., The effect of statherin and its shortened analogues on

anaerobic bacteria isolated from the oral cavity. Acta Microbiol Pol, 2000. 49(3-4): p. 243-51.

85

AAnneexxooss

Anexos

87

Tabela 2 Representação das sequências de PRPs recolhidas das bases de dados

Organismo

Acesso Nome Gene Sequência Tamanho

Ailuropoda

melanoleuca

ENSAMEP00000002166 SHPVPSGPPPXXPPRGPEPGPTTRTRTFASDSKGSPNQEHTRGPHTPVPASAAGMGCPAARSTGPPSPGHAGQGAREGHSAQRRPGTGQRPGPASQGLRLCCQPPRVHFHMAPGKNVLVPTRPGKEGAAFPKSCPLSWPRPFCPSAAQLPLG

305

Bos taurus

G3N0R9

Uncharacterized

protein

MLLILLSVALLALSSAQDPVSVLEPESSTYAFSQPDSESQLTGYDFQRPPLQGDEAEQETPLEDGKHHHRLPPKDGKPHHRPPAQGDEAEQEPPTQGDDNEQGTPPEHGKHHHRPPPKDGKPHHRPPPKDDKPHHRPPPPGDEAQPGQPPQDGEPEQVPSSQNGEPQQGRLSGRGLRNRSSPPPPPERNHGPLPQDGQRRQGRPPEDGEQQQGPSSQENQPQWEPSSSDGKPQDPPHKMGNNSRDHPLQEGQPQQRPPPPRDPPNGCSPPPPPGRSQIPPPPGHGPQRPPQGSPPQ

296

F1N4B8 Uncharacterized

protein

KSRASSKMLLILLSVALLALSSAQDPVSDRNSEEFLSNIPDFQRPPLQGDEAEQETPLEDGKHHHRLPPKDGKPHHRPPAQGDEAEQEPPTQGDDNEQGTPPEHGKHHHRPPPKDGKPHHRPPPKDDKPHHRPPPPGDEAQPGQPPQDGEPEQVPSSQNGEPQQGRPPEDGEQQQGPSSQENQPQWEPSSSDGKPQQEPHPTPTDPPHKMGNNSRDHPLQEGQPQQRPPPPRDPPNGCSPPPPPGRSQIPPPPGHGPQRPPQGSPPQ

267

Callithrix

jacchus

F7GZ58 Uncharacterized

protein

LOC100412507 MLLILLSVALLALGSAQSLNEDVSQEQLPSVISGKSQPPPQEGNKPQGPPPPPGKPQGPPPPGGHPQRPPPPPAGKPQGPPPPPQGGRPPRSLQGPLPQGPPPPPEGRRPPRSLQGLPPQGPPPPQSLQGPPPQGPPPPGPPPPGPPPPQGGRPPRSLQGPPPQRPPLQGPPSQPPPQEGHKPQGPPPPPGKPQGPPPPGGHPQKPHPPPAGKPPGPPPPGGHPQKPHPPPAGKPEGTPAPPQESKPPKPPQEQ

254

F7IGY3 Uncharacterized

protein

LOC100412507 MLLILLSVALLALGSAQSLNEGKTEGGEDAVTVVGDGGDSNQSSDEKPQKPPFGGRPPKPPAGNGSQDDGPPHRPPPQEGNKPQGPPPPPGKPQGPPPPGGHPQRPPPPPAGKPQGPPPPPQGPPPPPGKPQGPPPPGGHPQKPHPPPAGKPPGPPPPGGHPQKP

165

F7IGV1 Uncharacterized

protein

LOC100412507 MLLILLSVALLALSSAQSLNEDVSQEQLPSVISDGGDSNQSSEEKPQRPPFGGRPPKPPAGNGSQDERPPHRPPPQEGHKPQGPPPPPGKPQGPPPPGGHPQKPHPPPAGKPPGPPPPGGHPQKPHPPPAGKPE

134

F7I094 Uncharacterized

protein

LOC100412507 MLLILLSVALLALGSAQSLNEDVSQEQLPSVISDGGDSNQSSDEKPQKPPFGGRPPKPPAGNGSQDDGPPHRPPPQEGNKPQGPPPPPGKPQGPPPPGGPPPPPGKPQGPPPPGGHPQKPHPPPAGKPPGPPPPGGHPQKPHPPPAGKPEGTPAPPQESKPPKPPQEQLSE

171

XP_002752222 PREDICTED:

hypothetical protein

LOC100412507

LOC100412507 MLLILLSVALLALSSAQSLNEDVSQEQLPSVISDGGDSNQSSEEKPQRPPFGGRPPKPPAGNGSQDERPPHRPPPQEGHKPQGPPPPPGKPQGPPPPGGHPQKPHPPPAGKPPGPPPPGGHPQKPHPPPAGKPEGTPAPPQESKPPKPPQEQLSE

155

Anexos

88

Organismo


Callithrix

jacchus



LOC100415384

LOC100415384 MEQSELRRELPIQDTERTFGNLIVYCPTVRTKVKIKGAAMFLSHKAGSNTRASCKMLVILLSVALLAVSSAQSLYEDDNQEDVPSLISDAGDSYQSPDEESQKPPLGEDPPAGDENQDDGPQQGPPPQGGRHHHGPPPPPGKPQGPHPQGGHHHHGPPPPPGKPQGGHHHHGPPPPPGKPQGGHHHHGPPPPPGKPQGPPPQGGHHHHGPPPPPGKPQGPPPQQGQPPQ

229



LOC100415016

LOC100415016 MLVILLSVALLAVSSAQSLYEDDNQEDVPSLISDAGDSYQSPDEESQKSPLGEDPPAEDENQDDGPQQGPPPQGGRHHHRPPPPPGKPQGPHPQGGHHHHGPPPPPGKPQGGHHHHARRQSSHYLPAEAPPCYRGVHPVAVGLRPVAVGCALLLLAPPCWRSLSVMAGCLGNSWLRQQWECTSVGTECLGHPDQCILCGVPLRCGDGLNGCASRKGCAGIPCLSYTWVFPRSVGNKDPSGNALGLTLCTFTESCNPELFLLP

262



LOC100398712

LOC100398712 MLLILLSVALLALGSAQSLNEDVSQEQLPSVISDGGDSNQSSDEKPQRPPFGGLPPKPPAGNGSQDDGPQRPPPQEGHKPQGPPPPPGKPQGPPPPGGHPQRPPPPPAGKPQGPPPPPQGGRPPRSLQGPPPKGPPPRGPPLQGPPPPPQGGRPPRSLQGPPPQGPPPQGPPPQGPPPQGPPPQGRPPQGPPPQGPPPQGQPPQGPPPQGPPPQGPPPPPQGGRPPRSLQGPSPQGPPPQGPPPQGRPPQGPPPQGPPPQGQPPQGPPPQGPPPQGPPPPPQGGRPPRSLQRPPPQGPPPQGRPPQGQPPLGPPPQGPPPQGPPPQGQPPQGPPPQGPPPPPQGGRPPRSLQGPSPQGPPPQGPPPQGPPPQGPPPQRQPPQGPPPQGPRPQGPPPPPQGGRPPRSLQGPPPQGPPPQGPPPQGPPPQGRPPQGPPPQGQPPQGPPPQGPPPQGPPPPPRGEGPPRSLQGPPPQGPPPQGPPPHGPFQ

489



LOC100412163

LOC100412163 MLLILLSVALLALGSAQSLNEDVSQEQLPSVISDGGDSNQSSDEKPQKPPFGGRPPKPPAGNGSQDDGPPHRPPPQEGNKPQGPPPPPGPQGPPPPGGHPQRPPPPPAGKPQGPPPPPQGGRPPRSLQAGRPPRSLQGPPPQGPPPQGPPPQGPPPPPQGGRPPRSLQGPPPQGPPPPQEGRPPRSLQGPPPQGPPPPGPPPPGPPPPQGGRPPRSLQGPPPQRPPLQGPPSQ

234

Canis

familiaris

F1Q0L0 Uncharacterized

protein

SAATGQALGRRPSGGSGPRPRPVLRGEDTGRPTGTRNMTQQPRPDPRLPGGPPPRSASEKPPPSPAANEKPLPRSANEKPPPSPAANEKPPPHSASEKPPPSPAANEKPPPHSASEKPPPPYCNPRPGFPDKTPCSGGRESQGEAERPGRPAGGRIQQPSQGASLHAGPLSQEGLPEGCCTRGQAGTPSPHPRTGKGPASPVASGSRRAGDPPVPAAAPAVLPRPGEAPPGPPLPDLPPAPGEGPAQPHPPDKPGPTPEAEARSPAHPGEAQRVP

275

F1P7E0 Uncharacterized

protein

PPPGGRTPVSPPPGGRTPVSPPPGGRTPVSPPPGGRIPVSPPPGGRTPVSPPPGGRIPVSPPPGGRTPVSPPPGGRTPVSPPPGGRPPAPLPQVGGPRPPLPQVGGPRSPLPQVGGPRSPLPQVGGSRSPLPQVGGPRSPLPQVGGPRSPLPQVGGPPLPSPQMGGRTPVSPPPGGRPPVSPPPRWTAPGPPGERTPVSPPPRWAAPRSPPPGEGPRPPLPQVGGPRSPLPQVGGRSPLPQVGGRTPGLPSPQEGGPVPTTGRNPPPR

269

Anexos

89

Organismo


Canis

familiaris

ENSCAFP00000032468 HPGLHRSEPERTGVLPAGPQRPGQRCPPRPGSAPSRAWGVPCPTPALQQSLPPLLEGGSQEIPLPTNKTPAGPPPPGSPNPPSTAPSNPGKTGNQDSKGSPQQTHTRGSHRCTPASASGACLTAAPSQGPPSPGHPHAPAALSDPSFSRRPPSQRGAEPRGLRTEAQPPRVHPGPAGRAVVAVPPRPGQSHLPPAVRAPDSTSHRFHDGGAQDGPGEGEPRCLSTGAGRPGEGWGPPPEGVNQGHPPSLPGDPCPPPEGSPVFLPQPGRGVPPPWGRALDQAGRLLGDPAPGGRPSQPPPPGAHRGPPRGGGAQCAEPPMRFLGVGSPGVGGRTRVHPPKKLHPRPRPQPLPGLPPRSPHPGPPPQGLPPRASPPRASPPGPP

383

ENSCAFP00000030671 HLRTHTWSPRVSAHPAFCSPGPGAPGWGDPGSAAGGAAPAQTPAPPPAPLAVVPPGGVTPSQPRSALLKPPAPPRPRQPPPRERPPPRGPGTRPWPRRPPKRTAREARPPRGGVHGLPPGPGARPPLGAGCTASPREEGARSPPTPRKRGAQPHPPPSRVHAPPGAGCTASPPPPQHGAGSPWSGVHGLSPTPAGCRVSMERGARPPPHPSRVQGLPGAGCTAFPPQQGAHPLPPSGVQGLPPRGAGCTPPPAGCPPTGSPRPRPRRRPRRRMAPRPRPAGRPRKKKRSASPSRSPSSLAGAPARVQSGRPPGGG

315

ENSCAFP00000035521 ALRAALQILTEGLLFAEPPVVRLGCPPTRPPLPHQGHIPDPPSSSRALGARGRGGPRSGAPAALEAPASLPGPPEPQGVPSALHPHCLPRSPKPPGGPEQGPQGLSPPRGKTSRPQGPSPPEGPAMVGQHPPPPRLGGGDTGPQNPPPPIVSGPLWPPLAPSGQGISGGLPAAPASPTCVPPGWGLGQSPPGGPGWPRGLVGGGRRGSRGPSCLARGPPAKGRQPPAPERPQSEPPQGRPGLSQPLRLSPPPPPASCCHPDPSPPAGGFPQGEPEPAQAGLPQGPAAGQRP

291

Gorilla gorilla

gorilla

G3S043 Uncharacterized

protein

PRH1 MLLILLSVALLAFSSAQDLNEDVSQEDVPLVISDGGDSEQFLDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPPPPRGRPQGPPQQGGHPRPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQPPQ

166

G3SCR9 Uncharacterized

protein

PRH1 MLLILLSVALLAFSSAQDLNEDVSQEDVPLVISDGGDSEQFLDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPPPQGRPQGPPQQGGHPPPPQGRPQGPPQQGGHPRPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQPPQ

166

Gorilla gorilla

gorilla

G3RBW4 Uncharacterized

protein

PRH2 MLLILLSVALLAFSSAQDLDEDVSQEDVPLVISDGGDSEQFLDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPHPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQPPQ

149

G3QHE7

Uncharacterized

protein

PRR4 MLLVLLSVVLLALSSAQSTDNDVNYEDFTFTIPDVEDSSQRPDQGPQRPPPEGLLPRPPGDSGNQDDGPQQRPPQPGGHHRHPPPPPFQNQQRPPRRGHRQLSLPRFPSVSLQEASSFFWRDRPARHSQEQPLW

134

Anexos

90

Organismo


Gorilla gorilla

gorilla

G3RWV9 Uncharacterized

protein

MLLILLSVGLLALSSAQNLNEDVSQEESPSLIAGNPQGAPPQGDNQPQGPPPPPGKPQGPPPQGDKSRSARSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGDKSRSARSPPEKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGDKSRSARSPPGKPQGPPPQGDNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDNKSRSARSPPEKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDSNSRSARSPPGKPQGPPPQGGNQPQGPPSPPGNPQGPPPQGGNQPQGPPPPPGKPQGPPPQGDKSRSARSPPGKPQGPPQQEGNNPQGPPPPAGGNPQQPQAPPAGQPQGPPPPPQGGRPSRPPQ

416

G3RMU1 Uncharacterized

protein

ENSG0000012

1335 MLLILLSVGLLALSSAQNLNEDVSQEESPSLIAGKPQGPPPQGDNQPQGPPPPPGKPQGPPPQGDKSRSARSPPEKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDKSRSARSPPGNPQGPPPQGGNQPQGPPPPPGKPQGPPPQGDKSRSARSPPGKPQGPPPQGDKSRSARSPPGNPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGDNKSRSARSPPEKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDSNSRSARSPPGKPQGPPPQGGNQPQGPPSPPGNPQGPPPQGGNQPQGPPPPPGKPQGPPPQGDKSRSARSPPGKPQGPPQQEGNNPQGPPPPAGGNPQQPQAPPAGQPQGPPPPPQGGRPSRPPQ

415

G3S0G6 Uncharacterized

protein

PRB4 MLLILLSVALLALSSAESSSEDVSQEESLFLISGKPEGRHPQGGNQSQGPPPHPGKPERPPPQGGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGPPSPPGKPQGPPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGPPHHPGKPEGPPPQGGNKSRSARSPPGKPQGPPQQEGNKPQGPPPPGKPQGPPPAGGNPQQPQAPPAGKPQGPPPPPQGGRPPRPAQGQQPPQ

257

G3RTV7 Uncharacterized

protein

PRB4 MLLILLSVALLALSSAQSLNEDVSQEESPSVISVPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSHGPPPHPGKPEGQTPQGGNQSQGLPPHPGKPEGPPPQGGNRSQGPPPRPGKPEGQSPQGGNQSQGPPSRQGKPEGTPQEGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPRPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ

250

G3QEF1 Uncharacterized

protein

PRB4 MLLILLSVALLALSSAESSSEDVSQEESLFLISGKPEGRHPQGGNQSQGPPPHPGKPERPPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGPPHRPGKPEGPPPQGGNKSRSARSPPGKPQGPPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGPPHRPGKPEGPPPQGGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPHPGKPEGPPPQGGNKPQGPPPRPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ

309

Anexos

91

Organismo


Homo sapiens

P02810 RecName:

Full=Salivary acidic

proline-rich

phosphoprotein 1/2;

PRH1

PRH2 MLLILLSVALLAFSSAQDLDEDVSQEDVPLVISDGGDSEQFIDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPPPPQGRPQGPPQQGGHPRPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQSPQ

166

P04280 Basic salivary

proline-rich protein 1

PRB1 MLLILLSVALLALSSAQNLNEDVSQEESPSLIAGNPQGPSPQGGNKPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDKSRSPRSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDKSQSPRSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDKSQSPRSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPQQGGNRPQGPPPPGKPQGPPPQGDKSRSPQSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPAQGGSKSQSARAPPGKPQGPPQQEGNNPQGPPPPAGGNPQQPQAPPAGQPQGPPRPPQGGRPSRPPQ

392

Q86YA1 PRB1 protein PRB1 DSRASCKMLLILLSVALLALSSAQNLNEDVSQEESPSLIAGNPQGPSPQGGNKPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDKSRSPRSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDKSQSPRSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPQQGGNRPQGPPPPGKPQGPPPQGDKSRSPQSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPAQGGSKSQSARAPPGKPQGPPQQEGNNPQGPPPPAGGNPQQPQAPPAGQPQGPPRPPQGGRPSRPPQ

338

A5D903 PRB1 protein PRB1 MLLILLSVALLALSSAQNLNEDVSQEESPSLIAGNPQGPSPQGGNKPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDKSRSPRSPPGKPQGPPPQGGKPQGPPPQGGNKPQGPLPPGKPQGPPAQGGSKSQSARAPPGKPQGPPQQEGNNPQGPPPPAGGNPQQPQAPPAGQPQGPPRPPQGGRPSRPPQ

198

G3V1M9 HCG26567, isoform

CRA_b

PRB1 MLLILLSVALLALSSAQNLNEDVSQEESPSLIAGNPQGPSPQGGNKPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDKSRSPRSPPGKPQGPPPQGGKPQGPPPQGGNKPQGPPPPGKPQGPPAQGGSKSQSARSPPGKPQGPPQQEGNNPQGPPPPAGGNPQQPQAPPAGQPQGPPRPPQGGRPSRPPQ

198



PRB2 MLLILLSVALLALSSAQNLNEDVSQEESPSLIAGNPQGAPPQGGNKPQGPPSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDKSRSPRSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDNKSRSSRSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDNKSQSARSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKSQGPPPPGKPQGPPPQGGSKSRSSRSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGGSKSRSARSPPGKPQGPPQQEGNNPQGPPPPAGGNPQQPQAPPAGQPQGPPRPPQGGRPSRPPQ

416

Anexos

92

Organismo


Homo sapiens

Q04118 Basic salivary


PRB3 MLLILLSVALLALSSAQSLNEDVSQEESPSVISGKPEGRRPQGGNQPQRTPPPPGKPEGRPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGSPSQGGNKPQGPPPHPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ

309

Q4VAY2 PRB3 protein PRB3 MLLILLSVALLALSSAQSLNEDVSQEESPSVISGKPEGRRPQGGNQPQRTPPPPGKPEGRPPQGGNQSQGPPPRPGKPEGQPPQGGNKPQGPPPHPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ

162

F5H7C1 Uncharacterized

protein

PRB3 MLLILLSVALLALSSAQSLNEDVSQEESPSVISGKPEGRRPQGGNQPQRTPPPPGKPEGRPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPSQGGNKPQGPPPHPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ

309



PRB4 MLLILLSVALLALSSAESSSEDVSQEESLFLISGKPEGRRPQGGNQPQRPPPPPGKPQGPPPQGGNQSQGPPPPPGKPEGRPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGPPPHPGKPESRPPQGGHQSQGPPPTPGKPEGPPPQGGNQSQGTPPPPGKPEGRPPQGGNQSQGPPPHPGKPERPPPQGGNQSHRPPPPPGKPERPPPQGGNQSQGPPPHPGKPEGPPPQEGNKSRSARSPPGKPQGPPQQEGNKPQGPPPPGKPQGPPPPGGNPQQPQAPPAGKPQGPPPPPQGGRPPRPAQGQQPPQ

310

E9PAL0 Uncharacterized

protein

PRB4 MLLILLSVALLALSSAESSSEDVSQEESLFLISGKPEGRRPQGGNQPQRPPPPPGKPQGPPPQGGNQSQGPPPPPGKPEGRPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGTPPPPGKPERPPPQGGNQSHRPPPPPGKPERPPPQGGNQSQGPPPHPGKPEGPPPQEGNKSRSARSPPGKPQGPPQQEGNKPQGPPPPGKPQGPPPAGGNPQQPQAPPAGKPQGPPPPPQGGRPPRPAQGQQPPQ

247

A2VCL9 PRB4 protein

(Fragment)

PRB4 MLLILLSVALLALSSAESSSEDVSQEESLFLISGKPEGRRPQGGNQPQRPPPPPGKPQGPPPQGGNQSQGPPPPPGKPEGRPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGKPQGPPQQEGNKPQGPPPPGKPQGPPPPGGNPQQPQAPPAGKPQGPPPPPQGGRPPRPAQGQQPPQSSRIQ

183

Q7M4Q5 Basic proline-rich

peptide IB-8a

(Fragments)

SPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDNKSQSAKPQGPPPQGGKPQGPPPQGGNKPQGPPPQGKSARSPPGKPQGPPQQEGNNPQGPPPPAGGNPGSKSR

128

Anexos

93

Organismo


E7EXA8 Uncharacterized

protein

PRB4 MLLILLSVALLALSSAESSSEDVSQEESLFLISGKPEGRRPQGGNQPQRPPPPPGKPQGPPPQGGNQSQGPPPPPGKPEGRPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGKPQGPPQQEGNKPQGPPPPGKPQGPPPAGGNPQQPQAPPAGKPQGPPPPPQGGRPPRPAQGQQPPQ

178

ENSP00000412740

MLLILLSVALLALSSAESSSEDVSQEESLFLISGKPEGRRPQGGNQPQRPPPPPGKPQGPPPQGGNQSQGPPPPPGKPEGRPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGKPQGPPQQEGNKPQGPPPPGKPQGPPPAGGNPQQPQAPPAGKPQGPPPPPQGGRPPRPAQGQQPPQ

178

G3V1R1 HCG26567, isoform

CRA_c

PRB1 MLLILLSVALLALSSAQNLNEDVSQEESPSLIAGNPQGPSPQGGNKPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDKSRSPRSPPGKPQGPPPQGGKPQGPPAQGGSKSQSARSPPGKPQGPPQQEGNNPQGPPPPAGGNPQQPQAPPAGQPQGPPRPPQGGRPSRPPQ

178

Homo sapiens EAW96215 proline-rich protein

HaeIII subfamily 1,

isoform CRA_b

PRH1 MRVGVSCYPGWSSVVGSWLTAVWNSWAQTILPPQPSAAEEYFACWNLLYLLKSGSFHRELTRFSQHKVGSDTRASCKMLLILLSVALLAFSSAQDLNEDVSQEDVPLVISDGGDSEQFIDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPPPPQGRPQGPPQQGGHPRPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQSPQ

244

AAI41917 PRH2 protein PRH2 MLLILLSVALLAFSSAQDLDEDVSQEDVPLVISDGGDSEQFIDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPPPPQGRPQGPPQQGGHPRPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQSPQSSRI

170

NP_005033 salivary acidic

proline-rich

phosphoprotein 1/2

PRH1 MLLILLSVALLAFSSAQDLNEDVSQEDVPLVISDGGDSEQFLDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPPPPQGRPQGPPQQGGHPRPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQSPQSSRIQ

171

AAI28193 PRH1 protein PRH1 MLLILLSVALLAFSSAQDLNEDVSQEDVPLVISDGGDSEQFLDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPPPPQGRPQGPPQQGGHPRPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQSPQ

166

EAW96220 proline-rich protein

HaeIII subfamily 2,

isoform CRA_b

PRH2 MLLILLSVALLAFSSAQDLDEDVSQEDVPLVISDGGDSEQFIDEERQGPPLGGQQSQPSAGDGNQNDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPPPPQGRPSARSSPTSSWKAPGTTSPRGPPTRTSTGAVSSVI

142


HaeIII subfamily 2,

isoform CRA_c

PRH2 MLLILLSVALLAFSSAQDLDEDVSQEDVPLVISDGGDSEQFIDEERQGPPLGGQQSQPSAGDGNQNDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQSPQ

132

Anexos

94

Organismo


Homo sapiens

A27307 proline-rich

phosphoprotein (gene

PRH1, Db allele) -

human

QDLNEDVSQEDVPLVISDGGDSEQFLDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPPPPQGRPQGPPQQGGHPRPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQSPQ

171

NP_006240 basic salivary


precursor

PRB3 MLLILLSVALLALSSAQSLNEDVSQEESPSVISGKPEGRRPQGGNQPQRTPPPPGKPEGRPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPSQGGNKPQGPPPHPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ

309


BstNI subfamily 3

PRB3 MLLILLSVALLALSSAQSLNEDVSQEESPSVISGKPEGRRPQGGNQPQRTPPPPGKPEGRPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGSPSQGGNKPQGPPPHPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ

309

AAH96211 PRB3 protein PRB3 MLLILLSVALLALSSAQSLNEDVSQEESPSVISGKPEGRRPQGGNQPQRTPPPPGKPEGRPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGSPSQGGNKPQGPPPHPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ

309

Q68D45 DKFZp686C09257

protein

MLLILLSVALLAFSSAQDLDEDVSQEDVPLVISDGGDSEQFIDEEGHKDHPNREAISKVLPHLLLESPRDHLPKGAAHKDLHRGSLLSNLGFNDRK

96

CAA30728 proline-rich protein

G1

PRB3 MLLILLSVALLALSSAQSLNEDVSQEESPSVISGKPEGRPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGEPEGPPPQGGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGSPSQGGNKPRGPPPHPGKPQGPPPQEGNKPQRPPPPRRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ

309

Anexos

95

Organismo


Homo sapiens C9JW35 Uncharacterized

protein

MLLILLSVALLALSSAQSLNEDVSQEESPSVISGKPEGRRPQGGNQPQRTPPPPGKPEGRPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNKPQGPPPRPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ

309

Q16378 Proline-rich protein 4 PRR4 LPRP

PROL4 MLLVLLSVVLLALSSAQSTDNDVNYEDFTFTIPDVEDSSQRPDQGPQRPPPEGLLPRPPGDSGNQDDGPQQRPPKPGGHHRHPPPPPFQNQQRPPRRGHRQLSLPRFPSVSLQEASSFFRRDRPARHPQEQPLW

134

AAA60184 prepro salivary

proline-rich protein

MLLILLSVALLAFSSAQDLNEDVSQEDVPLVISDGGDSEQFIDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPPPPQGRPQGPPQQGGHPRPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQSPQ

166

CAA30542 Po protein PRB3 KPQGRRPQGGNQPQRPPPPPGKPQGPPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGPPPTPGKPEGPPPQGGNQSQGPPPHPGKPERPPPQGGNQSHRPPPPPGKPERPPPQGGNQSQGPPPHPGKPEGPPPQEGNKSRSARSPPGKPQGPPQQEGNKPQGPPPPGKPQGPPPPGGNPQQPQAPPAGKPQGPPPPPQGGRPPRPAQGQQPPQ

234

Loxodonta

africana

G3UCG0 Uncharct LOXAF QGPPPQGGSQQNRPPPPPEGQQGPPPQGGEQPNGPPPPPQGPPRPPQQEGDQLLRRRRAPQGQQGPPPQGGDQPNGPPPPPQGPPRPQQQEGDQLRRRPRAPQGQQGPPPQGGDQPNGPPPPPQGPPRPPQQEGDQLLRRRRAPQGQQGPPPQGGDQPNGPPPPPQGPPRPPQQEGQQGPPPQGGDQPNGPPPPPQGPPRPPQ

203

Macaca

fascicularis

Q29427 Proline-rich protein MnP4 MLLILLSVALLALSSAQNLNEDVGQEESPSLISEHQQGQPQQGGNRPQGPPSPPGNAQGPPQQGGKKPQGPPPPGKPQGPPKQGGKKPQGPPPPGKPQGPPQQGGNKPQGPPPPGKPQGPPQQGGNKPQGPPPPGKPQGPPQQGGNAQQAQPPPAGRPRDHHPLLKGADPLDLPKDSLPSNLGFNDRK

188

Q7M2S8

Proline-rich

phosphoprotein

SSEDVSQEDVPSIISDEEDSDQFIDEAHQGPPLGGQLSKHPAGDGNKDDGPQQKPPHHGGHHHRPPPPTGEPQNTQKPGGHHHHRPTPPPGKPEGSPPPSQGSRPSRPPKEQSPQ

115

Macaca

mulatta



LOC722360

MLLILLSVALLAFSSVQSSSEDVSQEDVPSIISDEEDSDQFIDEAHQGPPLGGQLSKHPAGDGNKDDGPQHKPPHHGGHHHHPPPPTGEPQNTQKPGGHHHHRPSPPPGKPERTPPPSQGSRPSRPPKEQSPQ

133

Anexos

96

Organismo


Macaca

mulatta



LOC722356

MLLILLSVALLAFSSVQSSSEDVSQEDVPSIISDEEDSDQFIDEAHQGPPLGGQLSKHPAGDGNKDDGPQHKPPHHGGHHHRPPPPTGEPQNTQKPGGHHHHRPSPPPGKPEGTPPPSQGSRPSRPPKEQSPQ

133

F7GSJ5 Uncharacterized

protein

LOC722356 SFLDVSQEDVPSIISDEEDSDQFIDEAHQGPPLGGQLSKHPAGDGNKDDGPQHKPPHHGGHHHRPPPPTGEPQNTQKPGGHHHHRPSPPPGKPEGTPPPSQGSRPSRPPKEQSPQ

115

F7GSJ7 Uncharacterized

protein

LOC722360 SFLDVSQEDVPSIISDEEDSDQFIDEAHQGPPLGGQLSKHPAGDGNKDDGPQHKPPHHGGHHHHPPPPTGEPQNTQKPGGHHHHRPSPPPGKPERTPPPSQGSRPSRPPKEQSPQ

115

Mesocricetus

auratus

P06680 Acidic proline-rich

protein HP43A

H29 MLVVLLTAALLAEHATIYEDSISQLSEEEQQGQDPGQLHQRPGQFPPQPSASDEEGDDDGEEDGNAPEGPPQQGGDHQKPRPPKPGNQQGPPQQEGQQQNRPPKPGNQEGPPQQEGQQQNRPPKPGNQEGPPQQEGQQQNRPPKPGNQEGPPQQEGQQQNRPPKPGNQEGPPQQGSEEQSTSL

183

Microcebus

murinus

ENSMICP00000006831 PPQRPGKQQGPHGQGGNQQGPPQGGRPQGRPQGGRPHGPPQGGRSEESQVQEPPTCGWKPKGPPQQEGQEQQDRPEKPQGPPEQGGNQQGPPQGGRPQGRPQGGRPQGPPQGGKRQGPPFGGDNPQGGRQQGPPQGGEQQGPPLRPQGGRQQRPSQGQGPQ

161

ENSMICP00000005057 MLLVLLSAALLALTAAQNLNEDVHSEESPVVSSDVRKPSEKPHKPQGPPAGPPPSGKPPQGPPPPESPKDHHHLLPPPSGKPQGPPPPPPSGKPQGPPPPPPFGKPQGPPPSFWKAPPEKPAQDQPSQ

128

ENSMICP00000007944 VQSEASPLLSSDVRKPSEKPHKPQGPPAGPPPSGKPPQGPPPPESPKDHHHLLPPPSGKPQGPPPPPPSGKPQGPPPPPPFGKPQGPPPSFWKAPPEKPAQDQPSQ

106

Monodelphis

domestica

ENSMODP00000002977 PESEQSPDPRKPKLSPPSECPSRGPPPSGPPNRGAQGEPPAGRQWESRPTRDRAGGQPPHSGGPGAPIPEGAEHPGGPGSSPAPFRGARSTHPGGSLAARGALQPRSGGPGAPIPEGAEHPGGPGSSPAPPEGCRLPPQEVGKPRPHGLPRPGPICPVRPDRRICGFPVSLPPPPPGNSQGTSAALGRRANPRPGKKPPSPSPIPGGRSPAGGEGEARSG

220

Mus

musculus

D3Z1V5 Uncharacterized

protein

Prp2 MLVVLFTVALLALSSAQEPREELQNQIQIPNQRPPPSGSQPRPPVNGSQQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQQRPPQGPPPPGGPQQRPPQGPPPPGGPQPRPPQGPPPPAGPQPRPPQGPPPTGGPQQRYPQSPPPPGGPQPRPPQGPPPPGGPHPRPTQGPPPTGPQPRPTQGPPPTGGPQQRPPQGPPPPGGPQPRPPQGPPPPTGPQPRPTQGPHPTGGPQQTPPLAGNPQGPPQGRPQGPQ

303

Anexos

97

Organismo


Mus

musculus

Q91X93 Proline-rich protein

BstNI subfamily 1

Prb1 MLVVLLTAALLVLSSAQRQDEEITYEDSNSQLLERGEKSQGYGHHFPKPPPGGMPPRPPSSDENNDGDEDGSEEDVNRPEGPPQHPPHPGHHHGPPQQGGPQGPPRPGNQQGPPPPGPPPQGSPQQRPPQPGKQQGPPPQGGSQGPPMPVNQQGPPPKGGPQQRPPQPGNQQGPPPQGGPQQRPPQPGNQQGPPPQGGPQQRPPQPGNQQGPPLHGGPQRPPQPGNQQGPPPQGGPQQRPPQPGNQQGPHPQGGLQGPPRPGNQQGPPPKGGPQRPPQPGYQQGPPPQGGPQGPPMPGNQQGPPPQGGLQQRPPQPGNPQGPPPQGGPQGPPRPGNQQGPPPQGGPQQRPPQPGNQQGPPPKGGPQRPPQPGYQQGPPPQGGPQGPPMSGNQQGPPPQGGLQQRPPQPGNPQGPSPQGGPQGPPRPGNQQGPPPQGGPQQRPPQPGNQQGPPQQGGPQGPPRPGNQQGPPPQGGPQRPSQPGNHQGPPQHGNKEQPNYLWSLFA

504

P05143 Proline-rich protein 2 Prp2 Prh1 Prp MLVVLFTVALLALSSAQGPREELQNQIQIPNQRPPPSGSQPRPPVNGSQQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQQRPPQGPPPPGGPQPRPPQGPPPPAGPQPRPPQGPPPPAGPHLRPTQGPPPTGGPQQRYPQSPPPPGGPQPRPPQGPPPPGGPHPRPTQGPPPTGPQPRPTQGPPPTGGPQQRPPQGPPPPGGPQPRPPQGPPPPTGPQPRPTQGPHPTGGPQQTPPLAGNPQGPPQGRPQGPQ

317

P05143-2 Isoform 2 of Proline-

rich protein 2

Prp2 Prh1 Prp MLVVLFTVALLALSSAQGPREELQNQIQIPNQRPPPSGSQPRPPVNGSQQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQQRPPQGPPPPGGPQPRPPQGPPPPAGPQPRPPQGPPPTGGPQQRYPQSPPPPGGPQPRPPQGPPPPGGPHPRPTQGPPPTGPQPRPTQGPPPTGGPQQRPPQGPPPPGGPQPRPPQGPPPPTGPQPRPTQGPHPTGGPQQTPPLAGNPQGPPQGRPQGPQ

303

D3Z544 Uncharacterized

protein

Prb1 MLVVLLTAALLVLSSAQRQDEEITYEDSNSQLLERGEKSQGYGHHFPKPPPGGMPPRPPSSDENNDGDEDGSEEDVNRPEGPPQHPPHPGHHHGPPQQGGPQGPPRPGNQQGPPPPGPPPQGSPQQRPPQPGKQQGPPPQGGPQQRPPQPGNQQGPPPQGGPQQRPPQPGNQQGPPPQGGPQGPPRPGNQQGPPPQGGPQQRPPQPGNQQGPPPKGGPQRPPQPGYQQGPPPQGGPQGPPMSGNQQGPPPQGGPQGPPRPGNQQGPPPQGGPQRPSQPGNHQGPPQHGNKEQPNYLWSLFA

301

D3Z543 Uncharacterized

protein

Gm4736 MLVVLLTAALLVLSSAQRQDEGMKWGGSNSGRNRSEEDVNRPEGPPQHPPHPGHHHGPPQQGGPQGPPRPGNQQGPPPPGPPPQGSPQQRPPQPGKQQGPPPQGGSQGPPMPVNQQGPPPKGGPQQRPPQPGNQQGPPPQGPPRPGNQQGPPPKGSPQGPPMPGNQQGPPPQGGLQQRPPQAGNPQGPPPQGGPQGHPRPGNQQGPPPQGGPQGPPRPGNQQGPPPQGGPQRPSQPGNHQGPPQHGNNEQPNYLWSLFA

259

Anexos

98

Organismo


Mus

musculus

F8VPU9 Uncharacterized

protein

Prp2 MLVVLFTVALLALSSAQEPREELQNQIQIPNQRPPPSGSQPRPPVNGSQQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQQRPPQGPPPPGGPQQRPPQGPPPPGGPQPRPPQGPPPPAGPQPRPPQGPPPPGPHLRPTQGPPPTGGPQQRYPQSPPPPGGPQPRPPQGPPPPGGPHPRPTQGPPPTGPQPRPTQGPPPTGGPQQRPPQGPPPPGGPQPRPPQGPPPPTGPQPRPTQGPHPTGGPQQTPPLAGNPQGPPQGRPQGPQ

316

D3YX21 Uncharacterized

protein

Gm4736 MLVVLLTAALLVLSSAQRQDEEITYEDSNSQLLERGEKSQGYGHHFPKPPPGGMPPRPPSSDENNDGDEDGSEEDVNRPEGPPQHPPHPGHHHGPPQQGGPQGPPRPGNQQGPPPPGPPPQGSPQQRPPQPGKQQGPPPQGGPQQRPPQPGNQQGPPPQGGPQQRPPQPGNQQGPPPQGGPQGPPRPGNQQGPPPQGGPQERPPQPGNQQGPHPQGGLQGPPRPGNQQGPPPKGSPQGPPMPGNQQGPPPQEGPQGPPRPGNQQGPPPQGGPQRPSQPGNHQGPPQHGNNEQPNYLWSLFA

301

P05142 Proline-rich protein

HaeIII subfamily 1

Prh1 Prp MLVVLFTVALLALSSAQGPREENQNQIQIPNQRPPPSGFQPRPPVNGSQQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQQRPPQGPPPPGGPQQRPPQGPPPPGGPQPRPPQGPPPPGGPQLRPPQGPPPPAGPQPRPPQGPPPPAGPQPRPPQGPPPTGPQPRPTQGPPPTGGPQQRPPQGPPPPGGPQPRPPQGPPPPGGPQPSPTQGPPPTGGPQQTPPLAGNTQGPPQGRPQGPR

261

E9QMX6 Uncharacterized

protein

Prh1 MLVVLFTVALLALSSAQEPREENQNQIQIPNQRPPPSGFQPRPPVNGSQQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGVPQPRPPQGPPPPGGPQQRPPQGPPPPGGPQHRPPQGPPPPGGPQQRPPQGPPPPGGPQLRPPQGPPPPAGPQPRPPQGPPPPAGPQPRPPQGPPTTGPQPRPTQGPPPTGGPQQRPPQGPPPPGGPQPRPPQGPPPPGGPQPSPTQGPPPTGGPQQTPPLAGNTQGPPQGRPQGPR

261

Q58E44 Proline-rich protein

MP5

Prpmp5 MLVVLLTAALLVLSSAQRQDEEITYEDSNSQLLEMGEQSQGYGHHFPKPPPGGMPPRPPSSDENDDGDEDGSEEDVNRPEEPPQHPPHPGHHHGPPPQGGPQQRPPQPGKQQGPPPQGGPQSPLRPGNQQGPPPQGGPQQRPPQPGNQQGPPLQGGPQGPLRPGNHEGPPPQGGPQGHPRPGNQQGPPPQGGLQRPPQPGNQQGPPPQRGPQQRPPQPGNQQGPPPQGGPQQRPPQPGNQQGPPPPGSPQGPPRPGNQQGPPPQGGPQRPPQPGNHQGPPQYGNNEQPSYLWSLFA

296

E9PXN1 Uncharacterized

protein

Prpmp5 MLVVLLTAALLVLSSAQRQDEEITYEDSNSQLLEMGEQSQGYGHHFPKPPPGGMPPRPPSSDENDDGDEDGSEEDVNRPEEPPQHPPHPGHHHGPPPQGGPQQRPPQPGKQQGPPPQGGPQSPLRPGNQQGPPPQGGPQQRPPQPGNQQGPPLQGGPQGPLRPGNHEGPPPQGGPQGHPRPGNQQGPPPQGGLQRPPQPGNQQGPPPQRGPQQRPPQPGNQQGPPPQGGPQQRPPQPGNQQGPPPPGSPQGPPRPGNQQGPPPQGGPQRPPQPRNHQGPPQYGNNEQPSYLWSLFA

296

Anexos

99

Organismo


Mus

musculus

Q61888 Proline rich protein Gm8882 Gm47

36 MP4

MLVILLTAALLVLSSAQREDEEITYEDSNSQLLEMGEQSQGYGHHFPKPPPGGMPPRPPSSDENNDDDEDGSEEDVNRPEGPPQHPPHSGNHHAPPQQGDAHGPPRPGNQQGPPSPGPPPQGSSQQRPPQPGNQQGPPPQGGPQQRPPQPGNQQGPPPPGGPQQRPPQPGGNQGGPPQGGPHPPPRPGNQQGPPPQGGPQQRPTQPGNQQGPPQQGGPQAPPRPGNQQGPPPQGPQGPPRTGNQQGPPPQGGPQGPPRPGNQQGPPPQGGPQRPPQPGNHQGPPQHGNNEQPSYLWSLFA

300

B7ZW90 EG667929 protein Gm8882EG667

929 MLVILLTAALLVLSSAQREDEEITYEDSNSQLLEMGEQSQGYGHHFPKPPPGGMPPRPPSSDENDDGDEDGSEEDVNRPERPPQHPPHSGHHHGPPPQGDAQGPPRPGNQQGPPPQGSSQQRSPQPGNQQGPPPQGGPQQRPPQPGNQQGPPPQGGPQQRPPQPGNQQGPPPQGGPQGPPRPGNQQGPPPQGGPQQRPTQPGNQQGPPQQGGPQGPPRPGNQQGPPPQGGPQGPPRPGNQQGPPPQGGPQRPPQPRNHQGPPQHGNNEQPSYLWSLFA

278

Q62105 31-kDa proline-rich

salivary protein,

complete cds of clone

Pump125

Gm5154 MLVILLTEALLVLSSAQREDEEITYEDSNSQLLEMGEQSQGYGHHFPKPPPGGMPPRPPSSGENDDGDEDGSEEDVNGPERPPQHPPHSGHHHGPPPQGDAQGPPRPGNQQGPPPPGPPPQGSSQQRPPQPGNQQGPPPQGGPQQRPPQPGNQQGPPPPGGPQQRPPQPGGNQGPPPQGGPQGPPRPGNQQGPPPQGGPQQRPTQPGNQQGPPQQGGPQGPPRPGNQQCPPPQGGPQGPPRPGNQQRPPPQGGPQGPPRPGNQQGPPPQGGPQRPPQPGNHQGPPQHGNNEQPNYLWSLFA

301

E9Q7E4 Uncharacterized

protein

Gm8882

MLVILLTAALLVLSSAQREDEEITYEDSNSQLLEMGEQSQGYGHHFPKPPPGGMPPRPPSSDENDDGDEDGSEEDVNRPERPPQHPPHSGHHHGPPPQGDAQGPPRPGNQQGPPPPGPPPQGSSQQRSPQPGNQQGPPPQGGPQQRPPQPGNQQGPPPQGGPQQRPPQPGNQQGPPPQGGPQGPPRPGNQQGPPPQGGPQQRPTQPGNQQGPPQQGGPQGPPRPGNQQGPPPQGGPQGPPRPGNQQGPPPQGGPQRPPQPRNHQGPPQHGNNEQPSYLWSLFA

283

Q64306 Proline-rich protein Prpmp5 PRP

MP5 MLVILLTEALLVLSSAQRVDEGISYRGDNSSRGHSTTVVSDPSPTPQPRPKHSGPPPKGPRPGSTQGPPRVPNQQGPPPPGPPPQGSSQQRPPQPGNQQGPPPQGGPQGPPRPGNQQVPPPQEGSQQRPPQPGNQQGPPPQGPPRPGNQQGPPPQGGPQGPSRPGNQQGPPPQGGPQQRPPQPGNQQGPPPQGGPQGGPQPGNQQGPPPQGGPQGPPRPGNQQGPPPQGGPQRPPQPGNHQGPPQYGNNEQPSYLWSLFA

260

Anexos

100

Organismo


Myotis

lucifugus

G1PRT3 Uncharacterized

protein

MGRRSTSSTKSGKFMNPTDQARKEARKRELKKNKKQRMMVRAAVLKMKDPKQIIRDMEKLDEMEFNPVQQPQLNEKVLKDKRKKLRETFERILRLYEKENPDTYKELRKLEVDYEQKRAQLSQYFDAVKNAQHVEVDSIPLPDMPHAPSNILIQDIPLPGAQPPSILKKTSAYGPPTRAVSILPLLGHGVPRLPPGRKPPGPPPGPPPPQVLQMYGRKVGFALDLPPRRRDEDMLYSPELAQRGHDDDVSSTSEDDGYPEDMDQDKHDDSTDDSDTDRSDGESDGDEFVHRDDNERNNNEEKKSGLSVRFADMPGKSRKKKKNIKELTPLQAMMLRMAGKEIPEEGREVEEFSEDDDEGDSDDSEAEKQSQKQHKEESLSDGTSASSQQQAPPQSVPPSQIQAPPMPGPPPLGPPPAPPLRPPGPPTGLPPGPPPGAPPFLRPPGMPGLRGPLPRLLPPGPPPGRPPGPPPGPPPGLPPGPPPRGPPPRLPPPAPPGIPPPRPGMMRPPLVPPLGPAPPGLFPPAPLPNPGVLSAPPNLIQRPKADDTSAATIEKKATATISAKPQITNPKAEITRFVPTALRVRRENKGATAAPQRKSEDDSAVPLAKAAPKSGPTVPVSVQTKDDVYEAFMKEMEGLL

640

Nomascus

leucogenys

G1QT98 uncharacterized

protein

ENSG0000012

1335 MLWILLSVALLALSSAHNLNEDVSQEESPSVISEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSRSRRSPPGKPQGPPAAGGNPQQPPAPPAGKPQGPPPPPQGGRPPRPAQGQQP

309


protein

ENSG0000012

1335 MLWILLSVALLALSSAHNLNEDVSQEESPSVISGNPQGPPPQGGNKPQGPPPPPGKPQGPPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSRSRRSPPGKPQGPPAAGGNPQQPPAPPAGKPQGPPPPPQGGRPPRPAQGQQPPR

248


protein

MLLILLSVALLAFSSAQDLNEDVSQEDVPSIHTDGGDSDQFLDEERQGPPLGGQQSQPSAGDGNEDDGPQQGPPRQGGQQNQGPPLPQGKPQGPPPQGGHPRPPHGRPQGPPPQGGHQHHPPPPLHGKPQGPPPQGGHPQGPPQSPPGKPQGPPPQGGNKPQGPPPPPKPQ

171


protein

MLLILLSVALLAFSSAQDLSEDVSQEDVPFVVSDGGHSEQFLDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQHQQGPPPPQGKPQGPPQHRGHPHPPHGRPQGPPPQGGHQHHHPPPPHGKPQGPPPQGGRPQGPP

143

Anexos

101

Organismo


Nomascus

leucogenys

G1QTA0 Uncharacterized

protein

ENSG0000012

1335

MLWILLSVALLALSSAHNLNEDVSQEESPSVISGNPQGPPPQGGNKPQGPPPPPGKPQGPPPQEGDEARSRRSPPGKPEGPPPQGGDKPQGPPPPPKPQGPPPQEGDEARRRRSPPGKPQGPPPQEGNKPQGPPPPPGKPQGPPPQGGDKPQGPPPPPKPQGPPPQEGDEARRRRSPPGQPQGPPPAGGNPQQPQPPPPGKSEGEPPQGGNQSQGPPPRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQPQGPPAAGGNPQQPPAPPAGKPQGPPPPPQGGRPPRPAQ

419

Pan

troglodytes

XP_003265552.1 PREDICTED:


LOC100584047

LOC100584047 MLLILLSVALLAFSSAQDLSEDVSQEDVPFVVSDGGHSEQFLDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQHQQGPPPPQGKPQGPPQHRGHPHPPHGRPQGPPPQGGHQHHHPPPPHGKPQGPPPQGGRPQGPPQGQPPQ

149

XP_001137791 PREDICTED: basic

salivary proline-rich

protein 3

MLPILLSVALLALSSAQSLNEDVSQEESPSVIPGKPEGPPPQGGNQSQGTPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGPPSQGGNKPQGPPPHPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ

162

XP_001150134 PREDICTED: similar

to salivary proline-

rich protein

MIWVRTDGELGPEHGRQDLMVVQQSGTVTGAGDGGPECRTALGPGGGPASEKGAPPPGCPAAWKEHGLEAAMGRREGLAPEAAPGGGSRSEQRASAPSTEARAPCAGETTSPRSELPPREQNRETTSPRSVFPPREQNRETTSPRSELPPQGTEQGNHIPAQRAPPQGTEQGNHIPAQRAPPPGNRTGKPHPCPVCSPGRGPKEAEGRTAEQRETEQGNHIPAQRAPPQGTEQGNHIPAQRAPPPGNRTGKPHPCPVCSPGRGPKEAEGRTAEQR

275

XP_001147634 PREDICTED: similar

to Basic salivary


allele L (Salivary


Po) (Parotid o

protein)

MAGSLRLPRLRPGSHRSEAPGVRARGRQGRPAPSRALPRPTLLRAALPATPLGFAIFPTPPGKGALRPPKTPREPLVPVGVPSRGSAEKPRPPRPPETQSAPERPRVAGQHQGQRPGLHWGPAPGLPSVAGRGTAAPCAAGSRFSPPHPSLRNSDCSRLPCGSLFFRKASVLSLNFKSRGLVQSPPLKSFPPSSGSCGKPRVLDCSSGCQRWQSQSVRCSSPAHSPLSLPLALPPFLSSSLSSSTAPSLSCLLSFLHRESNCAKPWLPRTNPERDPGTGTATPPKLDEAAGPVCARAWRRSAWEGTSGALETPGPSSSSMEPAQSCPFSQDSPQVLCGC

339

ENSPTRP00000008026 MLLILLSVALLALSSAESSSEDVSQEESLFLISGKPEGRRPQGGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGPPPHPGKPERPPPQEGNKSRSARSPPGKPQGPPQQEGNKPQGPPPPGKPQGPPPAGGNPQQPQAPPAGKPQGPPPPPQGGRPPRPAQGQQPPQ

205

ENSPTRP00000008024 MLLILLSVALLALSSAQNLNEDVSQEESPSLIAGNPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPQGKPEGPPPQGDKSRSARSPPGKPQGPPPQGGKPQGPPPQGGSKPQGPPPPPGKPQGPPPQGGSKSRSARSPPGNPQGPPQQEGNNPQGPPPPAGGNPQQPQAPPAGQPQGPPSPPQGGRPSRPPQ

199

Anexos

102

Organismo


Pan

troglodytes

XP_003313543.1 PREDICTED: LOW

QUALITY

PROTEIN: salivary

acidic proline-rich

phosphoprotein 1/2-

like

MLLILLSVALLAFSSAQDLDEDVSQEDVPLVISDGGDSEQFIDEERXGPPLGGQQSQPSAGDGNQNDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPPPPQGRPQGPPQQGGHPRPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQSPQ

166

ENSPTRP00000050434 MLLILLSVALLAFSSAQDLDEDVSQEDVPLVISDGGDSEQFIDEERGPPLGGQQSQPSAGDGNQNDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPPPPQGRPQGPPQQGGHPRPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQSPQ

165

ENSPTRP00000050430 MLLILLSVALLALSSAQNLNEDVSQEESPSLIAGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGSKPQGPPPPPGKPEGRRPQGGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPHPNQSQGPPPHPGKPERPPPQEGNKSRSARSPPGKPQGPPQQEGNKPQGPPPPGKPQGPPPAGGNPQQPQAPPAGKPQGPPPPPQGGRPPRPAQGQQPPQ

278

ENSPTRP00000050433 MLPILLSVALLALSSAQSLNEDVSQEESPSVIPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKSEGQPPQGGNQSQGSPPRPGKPEGPPPQGGNQSQGTPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGPPSQGGNKPQGPPPHPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ

292

ENSPTRP00000008024 MLLILLSVALLALSSAQNLNEDVSQEESPSLIAGNPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPQGKPEGPPPQGDKSRSARSPPGKPQGPPPQGGKPQGPPPQGGSKPQGPPPPPGKPQGPPPQGGSKSRSARSPPGNPQGPPQQEGNNPQGPPPPAGGNPQQPQAPPAGQPQGPPSPPQGGRPSRPPQ

199

ENSPTRP00000008028 MLPILLSVALLALSSAQSLNEDVSQEESPSVIPGKPEGPPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKSEGQPPQGGNQSQGSPPRPGKPEGPPPQGGNQSQGTPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGPPSQGGNKPQGPPPHPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ

267

XP_003313554 PREDICTED: basic

salivary proline-rich

protein 3-like

MLLILLSVALLAFSSAQDLDEDVSQEDVPLVISDGGDSEQFLDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPRPPREGPQGPPQQGGHPRPPREGPQGPPQQGGHPRPPREGPQGPPQQGGHPRPPRERPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQSPQ

200

Anexos

103

Organismo


Pan

troglodytes

XP_520746 pHLE1F1 isoform 2 MLLVLLSVVLLALSSAQSTDNDVNYEDFTFTIPDVEDSSQRPDQGPQRPPPEGLLPRPPGDSGNQDDGPQQRPPKPGGHHRHPPPPPFQNQQRPPRRGHRQLSLPRFPSVSLQEASSFFRRDRPARHPQEQPLW

134

Pongo abelii

ENSPPYP00000004896 MLLILLSVALLAFSSAQDLNEDVSQEDVPFVISDGGDSEQFLDEESQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPRPQGKPQGPPQKGGHHRPPQGRPQGPPHQGGHPHPPQGRLQGLPHQGGHQQRPPPPPHGRPQGPPPQGGRPQGPPQGQSPQ

166

ENSPPYP00000004899 MLLILLVALLAFSSAQASNEDVSQEDVPLVISDGGDSEQFDEESQGPPLGGQQSQPSAGDGNQDDGPQQRPPQQGGQQQQGPPRPQGKPQGPPQQGGHQQRPPPPPHGRPQGPPPQGGRPQGPPQGQSPQ

130



LOC100461262,

partial

LOC100461262

,

VSQEDVPLVISDGGDSEQFLDEERQGPPLGGQQSQPSAGDGNQDDGPQQRPPQQGGQQQQGPPRPQGKPQGPPQQGGHQQRPPPPPHGRPQGPPPQGGRPQGPPQGQSPQ

110

ENSPPYP00000004911 NPRASRKMLVILLSVALLALSSAENLNEDVSQEESPSLISGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPPGPPPPGKPQGPPPQGGSKSRSSRSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPPGPPPPGKPQGPPPQGGSKSRSSRSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGSKSRSSRSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGSKSRSSRSPPGKPQGPPPQGGNNPQGPPPPAGGNPRQPRAPPAGQPQGPPPPPQGGRPSRPPHG

344

Pteropus

vampyrus

ENSPVAP00000010780 MLLVFLLAALLALGSAHNAVNDVVYEENLSGVPPPSENLPPRPPQDGDKKIRPPRPEGQQQNPPPPPPPGKQERPPRPAGHQKNPPPPPLFEKQERPPRPEGHQKNPPPPPPPGKQERPPQPEGEKSPPPPLFEKQERPPRPEGQQQNPPPPPPPGKQQRPPRPEGHQKNPPPPPPKAGETPQPGGEKSSTTPPPGKQRGPPQPRQPKNPPPPPLFEKQERPPRPEGSKPPPPPPPGKQERPPRPEGSKSPTPPGKQERPPQPGGPQRPPRPEGSQRPPRPEGSQRPPQPGGPQRPPRPEGRKDRRPEGSQRPPRPEGSQRPPRPEGSQRPPRPGSPPGGRQPNPI

346

Oryctolagus

cuniculus

G1SNU9 Uncharacterized

protein

QQGGPQGRPQQRGPQQGGPQQGGPQQGPQQGGQQQEVPQRGGPQGGPQGGPQQGGPQGGPQQGGPQGGPQQRGPQEGPQQRGPQGGPQQGGPQGGPQQGGPQQGPQSRFQGNRPQGPPQGQPPQ

124

Anexos

104

Organismo


Rattus

novergicus

P10165 Proline-rich

proteoglycan 2

Prpg2 MLVVLLTAALLVLSSAQGVDEEVVYEDSSQQLELEQQSQGHGQHHPKPPPGGLPPRPPASDENGDGDDNDDGDDDGSGDDVNRPERPPQHGGNHHHPHHPPPAAGPQRPPQPGSPQGPPPPGGPQQRPPQGPPPQGGPQRPPQPGSPQGPPPPGGPQQRPPQGPPPQGGPQRPPQPGSPQGPPPPGGPQQRAPQGPPPQGGPQRPPQPGSPQGPPPPGGPQQRPPQGPPPQGGPQRPPQPGSPQGPPPPGGPQQRPPQGPPPQGGPQRPPQPGNPQGPPQQGGQQQSSFLWSFSA

295

Q04154 Salivary proline-rich

protein

Prp2 RP15 MLVALLTMVLLGLSFAQEPELQNLNQVPNQRPPPSGFLPRPPGNRNQQGPPPKGGPQQRPPQGPPPPGGPQQKPQGPPPPGGPQQRPQGPPPPGGPQQGPQGPPPPGGPQQRPQGPPPPGGPQQGPQGPPPPGGPQQGPQGPPPPGGPQQSPPQGPPPPGGPQQGPQGPPPPGGPQQSPPQGPPPPGGPQQGPQGPPPPGGPQQGRQGPPPPGGPQQDPPQGPPPPGGPQQRPPQGPPPPGRPQQRPPQPGNQQGPPQGPQSGRPQGPQQTRYQ

274

E9PU40 Uncharacterized

protein

MLVALLTMVLLGLSFAQEPELQNLNQVPNQRPPPSGFLPRPPGNRNQQGPPPKGGPQQRPPQGPPPPGGPQQKPQGPPPPGGPQQRPQGPPPPGGPQQGPQGPPPPGGPQQRPQGPPPPGGPQQGPQGPPPPGGPQQGPQGPPPPGGPQQSPPQGPPPPGGPQQGPQGPPPPGGPQQGRQGPPPPGGPQQRPPQGPPPPGGPQQRPPQGPPPPGRPQQRPPQPGNQQGPPQGPQSGRPQGPQ

242

E9PU38 Uncharacterized

protein

MLVVLFTAVLLTLSYAQEAELQSLDQTPNQKPPPPGFPPRPPANGSQQGPPPQGGPQQKPPQPGKPQGPPPPGGPQQKPPQPGNQQGPPPPGGPQQKPPQSGKPQGPPPPGGPQQRPPQPGNQKPQGPPPPGGPQKKPPQPGKPQGPPPPGGPQQKPPQPGKPQGPPPPGGPQQRPPQPGNQQSPPQGPQFGRPQGSFQSLGPQ

204

E9PSV2 Uncharacterized

protein

MLVVLLTAALLVLSSAHGSDEEVIYEDSSSQLLDVEQQNQKHGQHHQKPPPASDENGDGDDSDDGDDDGSGDDGNRPERPPPHGGNHQRPPPGHHHGPPPSGGPQTPPQPGKPQGPPPQGGPQGPPQPGNPQGPPPQGGHQQRPPQPGKPQDPAQDATHEQPSYLWSFFA

170

Q63179 Glycoprotein MLVVLLTVVLLPLSSVQSSHEDHGHQTQPLPPHPDHGNQTQPRPPHPDIGNQTQPRPPHPDHGNQTQPRPPHPDQGNQTQPRPPHPDHGNQTQPRPPHPDQGNQTQPRPPHPDHGNQTQPRPPHPDQGNQTQPRPPQPGQGNHTHPRPPHPDHGNQTQPHPPHPDQGNQTQPRPPHPDHGNQTQPRPPHPDQGNQTQPRPPHPDHGNQTQPRPPHPDQGNQTQPRPPHPDQGNQTQPRPPHPDQGNQTQPRPPHPDQGNQTQPRPPHPDLGNQTQPRPPRPGQGNQTQPRPPRPGQGNQTQPRPPLPGQGNQNQHPHSPLPDHPPHPDYQRTPQQDGGNQLGSQPPPPAY

350

Anexos

105

Organismo


Rattus

novergicus


protein

RGD1559532

RP4

MLVVLFTAVLLTLSYAQEPELQSLDQTPNQKPPPPGFPPRPPANGSQQGPPPQGGPQQKPPQPGKPQGPTPPGGPQQKPPQPGNQQGPPPPGGPQQKPPQPEKPQGPPPPGGPQQRPPQPGNQQGPPPPGGPQQKPPQPEKPQGPPPPGGPQQKPPQPGKPQGPPPPGGPQQRPPQPGNQQSPPQGPQLDRPQGSFQSLGPQ

202

F1LMA2 Uncharacterized

protein

MLVVLLTAALLVLSSAHGSDEEVIYEDSSSQLLDVEQQNQKHGQHHQKPPPASDENGDGDDSDDGDDDGSGDDGNRPERPPPHGGNHQRPPPGHHHGPPPSGGPQTSSQPGNPQGPPPQGGPQGPPQPGNPQGPPPQGGPQQRPPQPGKPQGPPPQGGPQGPPQPGNPQGPPPQGGHQQRPPQPGKPQDPAQDATHEQPSYLW

203

F1LV68 Uncharacterized

protein

ELQSLDQTPNQKPPPPGFPPRPPANGSQQGPPPQGGPQQKPPQPGKPQGPPPPGGPQQKPPQPGNQQGPPPPGGPQQKPTQPEKPQGPPPPGGPQQRTPQPGNQQGPPPPGGPQQKPPQPEKPQGPPPPGGPQQKPPQPGNQQGPPPPGGPQQKPPQPEKPQGPP

165


protein PRP33

Prpg1 MLVVLLTAALLVLSSAHGSDEEVIYEDSSSQLLDVEQQNQKHGQHHQKPPPASDENGDGDDSDDGDDDGSGDDGNRPERPPPHGGNHQRPPPGHHHGPPPSGGPQTSSQPGNPQGPPPQGGPQGPPQPGNPQGPPPQGGPQQRPPQPGKPQGPPPQGGPQGPPQPGNPQGPPPQGGHQQRPPQPRKPQDPAQDATHEQPSYLWFSS

426


protein PRP25

(Fragment)

MLVVLFTAVLLTLSYAQEPGDELQILDQTPNQKPPPPGFPPRPPANGSQQGPPPQGGPQQSPLQPGKPQDPPPQGSPQQKPPQPGKPQGPPPPGGPQKKPPQPGKPQGPPPPGGPQKKPPQPGKPQGPTPPGGPQQKPPQAGKPQGPPPPGGPQQKPPQPGNQQGPPPPGGP

172


protein

MLVVLFTAVLLTLSYAQEAELQSLDQTPNQKPPPPGFPPRPPANGSQQGPPPQGGPQQKPPQPGKPQGPPPPGGPQQKPPQPGKPQGPPPPGGPQQKPPQPGNQQGPPPPGGPQQKPPQSGKPQGPPPPGGPQQRPPQPGNQQSPPQGPQFGRPQGSFQSLGPQ

164

G3V7D3 Uncharacterized

protein

Prpg2 MLVVLLTAALLVLSSAQGVDEEVIYEDSSQQLELEQQSQGHGQHHPKPPPGGLPPRPPASDENGDGDDNDDGDDDGSGDDVNRPERPPQHGGNHHHPHHPPPAAGPQRPPQPGSPQGPPPPGGPQQRPPQGPPPQGGPQRPPQPGSPQGPPPPGGPQQRPPQGPPPQGGPQRPPQPGSPQGPPPPGGPQQRAPQGPPPQGGPQRPPQPGSPQGPPPPGGPQQRPPQGPPPQGGPQRPPQPGSPQGPPPPGGPQQRPPQGPPPQGGPQRPPQPGNPQGPPQQGGQQQSSFLWSFSA

295

Q07610 Proline-rich

proteoglycan

Prpg1 PRPG1 MLVVLLTAALLVLSSAHGSDEEVIYEDSSSQLLDVEQQNQKHGQHHQKPPPASDENGDGDDSDDGDDDGSGDDGNRPERPPPHGGNHQRPPPGHHHGPPPSGGPQTSPQPGKPQGPPPQGGPQGPPQPGNPQGPPPQGGHQQRPPQPGKPQDPAQDATHEQPSYLWSFFA

170

Anexos

106

Organismo


Sus scrofa

Q95JC9 Isoform 1 of Basic


MLPILLSVALLALSSARSPFFDLEDANSNSAEKFLRPPPGGGPPRPPPPEESQGEGHQKRPRPPGDGPEQGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPLGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPPPPPPADEPQQGPAPSGDKPKKKPPPPAGPPPPGPPSPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPPPGPSPPRPPPGPPPQ

676

Q95JC9-2 Isoform 2 of Basic


MLPILLSVALLALSSARSPFFDLEDANSNSAEKFLRPPPGGGPPRPPPPEESQGEGHQKRPRPPGDGPEQGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPAGGLQQGPAPSHVGPKKKPPPPGAGHPPRPPPPANESQPGPRPPPGPPSPPANDSQEGSPPSADGPQQGPAPSGDKPKKKPPPPAGPPPPPPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPADEPQQGAPSGDKPKKKPPPPAGPPPPPPPPPGIQGQKMSAKTPVLRRAVTLECDG

511

Q95JC9-3 Isoform 3 of Basic


MLPILLSVALLALSSARSPFFDLEDANSNSAEKFLRPPPGGGPPRPPPPEESQGEGHQKRPRPPGDGPEQGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPAGGLQQGPAPSHVGPKKKPPPPGAGHPPRPPPPANESQPGPRPPPGPPSPPANDSQEGSPPSADGPQQGPAPSGDKPKKKPPPPAGPPPPPPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPADEPQQGPAPSGDKPKKKPPPPAGPPPPPPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPPPGPSPPRPPPGPPPQ

566

Anexos

107

Organismo


Sus scrofa

F1SQ50 Uncharact Ssc.52331 MLPILLSVALLALSSARSPFFDLEDANSNSAEKFLRPPPGGGPPRPPPPEESQGEGHQKRPRPPGDGPEQGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPAGGLQQGPAPSHVGPKKKPPPPGAGHPPRPPPPANESQPGPRPPPGPPSPPANDSQEGSPPSADGPQQGPAPSGDKPKKKPPPPAGPPPPPPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPAGGLQQGPAPPIPPPGPPPPGPPPPGPAPPGARPPPGPPPPPPGPSPPRPPPGPPP

363

F1SQ51 Uncharact Ssc.52331 GGPPRPPPPEESQGEGHQKRPRPPGDGPEQGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPAGGLQQGPAPSHVGPKKKPPPPGPPPGPPPPGPPPPGPAPPGARPPPGPPPPPPGPSPPRPPPGPPPQ

177

Anexos

108

Tabela 3 Representação das sequências de histatinas e estaterinas recolhidas das bases de dados

Organismo Acesso Nome Gene Sequência Tamanho

Bos Taurus

Q8HY86 Statherin STATH MKIFFFAFIMALMVAMIKADSSEEEHRLRFNPRFYYPNQQGGYIPSYPAYPYPYPYPVQ

59

C6KGD9 Histatherin MKIFIFVFIMALILAMIRADSSEEKRHRKRXKHHXGYFQQYQPYQRYPLNYPPAYPFP

58

C6KGD7 Histatherin MKIFIFVFIMALILAMIRADSSEEKRHRKRXKHHXGYFQQYQPYQRYPLNYPPAYPFP

58

C6KGD7 Histatherin HSTN

MKIFIFIFIMALILAMIRADSSEEKRHRKRKKHHRGYFQQYQPYQRYPLNYPPAYPFP

58

Callithix

jacchus

F7HQR7 Uncharacterized protein STATH MKFLVFAFLLAFMVSMIGADSSEESFSFTGKFVYWYRPYPQPYRQPFPQPYQPQYQPQPNPYQPYSF

67

F7HQI8 Uncharacterized protein STATH MKFLVFAFLLAFMVSMIGADSSEEYWYRPYPQPYRQPFPQPYQPQYQPQPNPYQPYSF

58

Canis familiaris

XP_848687.1 PREDICTED: hypothetical protein

XP_843594 isoform 1

MKIFVFAFVMALMIAMIGADSSEERYPRFYPFPVSIPLILWYNTNIFCPYLFFKKNQYPSLNHIYVLDC

69

XP_862144.1 PREDICTED: statherin-like isoform

2 STATH

MKIFVFAFVMALMIAMIGADSSEENLLYRPYPRFYPYPLYPPVYPYNPYQPVYPYNAPEQYPPSS

65

XP_861969.1 PREDICTED: hypothetical protein

XP_856876 isoform 1

MKIFVFAFIMALMIALIGADSSDEEYGRHRKHHHVKDALKIFIISNIQNFRDIMMINNLIMLHRNPQQDYRGFMESPTCSLTHDDSSYSKIL

92


2

LOC607475

MKIFVFAFVMALMIAMIGADSSEERYPRFYPFPPYPPVYPYPAPAQYPPSS

51


3

LOC607475

MKIFVFAFVMALMIAMIGADSSEERYPRFYPFPRYPRFYPFPPYPPVYPYPAPAQYPPSS

60

Anexos

109


Canis familiaris

XP_003431878

PREDICTED: statherin-like STATH

MKIFVFAFVMALMIAMIGADSSEENLLYRPYPRFYPYPPYQPVYPYNAPEQYPPSS

56

XP_862196 PREDICTED: hypothetical protein

XP_857103 isoform 4

MKIFVFAFVMALMIAMIGADSSEEGGYLSGEIRPFHSLINLIMMPVLIF

49

XP_862059 hypothetical protein LOC608829

isoform 4 LOC608829

MKIFVFAFIMALMIALIGADSSDEEYGRHRKHHHRGRSENFYYQQYPKFQRYYDDK 56


XP_857075 isoform 3

MKIFVFAFVMALMIAMIGADSSEEPYPRFYPYPLYPPVYPYNAPEQYPPSS

51

Chlorocebus

aethiops

C0LRB4 Histatin 1 HTN1 MKFLVFALILALMISMTGADSHEEKHHGHRRKHHGKHHSH

40

C0LRB7 Histatin 3 HTN3 MKFLVFALLLALMVSMIGADSHEERHHGRHGHHGYGRKFHEKHHSHRGYRSNYLYGN

57

Gorilla gorilla

gorilla

G3SG71 Uncharacterized protein STATH MKFLVFAFILALMVSMIGADSSEEKFLRRIGRFGYGYGPYQPVPEQPLYPQPYQPQYQQYTF

62

G3QQV0 Uncharacterized protein HTN1 MKFFVFALILALMISMTRADSHEKRHHGYRRKFHEKHHSHREFPFYGDYGSNYLYDN

57

G3R990 Uncharacterized protein HTN3 MKFFVFALILALMLSMTGADSHEKRHHGYKRKSHEKHHSHRGYRSNYLYDN

51

Gorilla gorilla

C0LRB0 Histatin 1 HTN1 MKFFVFALILALMISMTRADSHEKRHHGYRRKFHEKHHSHIEFPFYGDYGTNYLYDN

57

C0LRB5 Histatin 3 HTN3 MKFFVFALILALMVSMTGADSHEKRHHGYKRKSHEKHHSHRGYRSNYLYDN

51

Homo sapiens

P02808 Statherin STATH MKFLVFAFILALMVSMIGADSSEEKFLRRIGRFGYGYGPYQPVPEQPLYPQPYQPQYQQYTF

62

A6NKE9 Statherin, isoform CRA_c

STATH

MKFLVFAFILALMVSMIGADSSEEYGYGPYQ

PVPEQPLYPQPYQPQYQQYTF 52

Anexos

110


Homo sapiens

P15515 Histatin-1

HTN1

MKFFVFALVLALMISMISADSHEKRHHGYRRKFHEKHHSHREFPFYGDYGSNYLYDN

57

P15516 Histatin-3 HTN3 MKFFVFALILALMLSMTGADSHAKRHHGYKRKFHEKHHSHRGYRSNYLYDN

51

Macaca

arctoides P14709 Statherin STATH

DSSEEKFLRRLRRFDEGRYGPYQPFVPPPLYPQPYQPYQPQY

42

Macaca

fascicularis

P02809 Statherin STATH MXFLXFXLXLLXMXXMXXXDSSEEKFLRRLRRFDEGRYGPYQPFAPQPLYPQPYQPYQPQY

61

C0LRB1 Histatin 1 HTN1 MKFFVFALVLALMISMIRADSHKGKHHGHRRKFHEKHHSH

40

P34084 Histatin-1 HTN1 DSHEERHHGRHGHHKYGRKFHEKHHSHRGYRSNYLYDN

38

C0LRB9 Histatin 3 HTN3 MKFLVFALILALMVSMTRADSHEERRQGRHGHHEYGRKFHEKHHSHRGYRSNYLYGN

57

Macaca

Mulatta

EHH25962 Statherin STATH MKFLVFAFILAVMVSMIGADSSEEKFLRRLRRLDGRYGPYQPFVPPPLYPQPYQPYQPQY

60

EHH25961 Histidine-rich protein 3

MKFLVFALILALMVSMTVSISGNFKGYILVVCMQEKHHSHRGYRSNYLYGN

51

Nomascus

leucogenys

G1R7Y6 Uncharacterized protein STATH MKFLVFAFILALMVSMIGADSSEEVSHFHSLENLFNGFGPYQQFPEQLYPQPYQPPYQQYPF

62

C0LRB6 Histatin 1

HTN1

MKFFVFALILALMISMTRADSHEKRHHEHRRKFHEKHHSHREYPFYGYYR

50

C0LRB2 Histatin 3

HTN3

MKFFVFALILALMISMTRADSHEKRHHEHRRKFHEKHHSHRGYRSNYLDEN

51

Anexos

111


Nomascus

leucogenys

XP_003265744 PREDICTED: histatin-3-like LOC100601272

MKFFVFALILALMISMTGADSHDKRHHEHRRKFHEKHHSHRGYRSNYLDEN

51


LOC100590184 LOC100590184

MAYCSWRQPSRKGHLLRLHFGFTDFLTLLLSKRTQPTMKFFVFALILALMISMTRADSHEKRHHEHRRKFHV

72

Pan troglodytes

ENSPTRP00000027723 Statherin STATH MKFLVFAFILALMVSMIGADSSEEKFLRRIGRFGYGYGPYQPVPEQPLYPQPYQPQYQQYPF 62

ENSPTRP00000027724 Histatin 1 HTN1 MKFFVFALILALMISMTSADSHEKRHHGYRRKFHEKHHSHREFPFYGDYGSNYLYDN

57

ENSPTRP00000053498 Histatin 3 HTN3 MKFFVFALILALMLSMTGADSHEKRHHGYKRKFHEKHHSHRGYRSNYLYDN

51

ENSPTRP00000053497 Statherin STATH MKFLVFAFILALMVSMIGADSSEEYGYGPYQPVPEQPLYPQPYQPQYQQYPF

52

Pongo abelii

ENSPPYP00000016521 Statherin STATH MKFVLAIILALMVSMIGADSSEEKFLRRLGRYSYGYGPYQPVPEERLYPQPYPPPYQQYAF

61

ENSPPYP00000016523 Histatin 1 HTN1 MKFFVFALILALMISMTRHHGYRRKFHEKHHSHREFPFYGDYRNYLYDN

49

ENSPPYP00000016522 Histatin 3 HTN3 MKFFIFALILALVISMTGADSHEKRHHGYRRKSHEKHHSHRGYRSNYLYDN

51

XP_002814869.1 PREDICTED: histatin-3-like LOC100453551

MKFFIFALILALVISMTGADSHEKRHHGYRRKSHEKHHSHRGYRSNYLYDN 51

Presbytis

cristata

C0LRB3 Histatin 1 HTN1 MKFLIFALILALMISMTRADSHIEKHHAHRRKFPERHHSHREFPSYGGYRSNYLYYS

57

C0LRB8 Histatin 3 HTN3 MKFLIFALILALMVSMTRADSHEEKHHGRHGHHEYGRKFQEKHYSHRGYRSNYLYGN

57

Rattus

novergicus Q5J6K0 Theobromine induced protein

LOC689604 MRFLVFALIIALMVSMITADKSRERHFKHGEKRHRRYRRYVPAENSADINTDLSQNEVLLPYYYPSDY

68

Sus scrofa D8WUT6 Statherin

STATH

MKLFIFAFIMALMFAMIKADSSDEKHHRKWQNREREHYGRNRPYYPYAPNYPAYPLNYPYA 61

Anexos

112

Tabela 4 Representação das sequências de cistatinas recolhidas das bases de dados

Organismo Acesso

Nome Gene Sequência Tamanho

Ailuropoda

melanoleuca

G1LU45 Uncharacterized

protein

MAGHLRTPLLLLAALALTLAPSTTRPKSLLLGGVFDADVNEDDVQEALNFALSEYNKASNDAYHSRAIRVVRARKQVVAGMNYFLEVEIGRTTCTKSQPNLDSCPFHDQPRLMRKTLCSFQIYTVPWLGKTSLVKSSCQDA

141

D2I7P5

Putative

uncharacterized

protein

PANDA_021998

MAGHLRTPLLLLAALALTLALAVAVSPGTSRRNGKSSLVGGALDADVNEEGVQQALNFALSDEYNKASNDAYHSRAIRVVRARKQVVAGMNYFLEVEIGRTTCTKSQPNLDSCPFHDQPRLMRVCAC

127

Bos taurus P01035

cystatin-C

precursor

CST3

MVGSPRAPLLLLASLIVALALALAVSPAAAQGPRKGRLLGGLMEADVNEEGVQEALSFAVSEFNKRSNDAYQSRVVRVVRARKQVVSGMNYFLDVELGRTTCTKSQANLDSCPFHNQPHLKREKLCSFQVYVVPWMNTINLVKFSCQD

148

Callithrix

jacchus

F6VIW1 Uncharacterized

protein LOC100407294

MARPLCIPLLLLATLPVALASQEENQNFAGGIHDADLSDEWVQRALHFAISKYNKATKDAYYRRLLRVLRAREQTVAGTNYFFDVEIGRTTCTKSQPNLDTCPFREQPELQKKQFCSFQIYEVPWEDRMSLVKSRCQKA

139

F6VIZ9 Uncharacterized


MAWPLNTPLLLLTALMMTLAGSASAQSGMTLLGGIHAADLNDKSVQRALNFAISEYNKDSKDEYYSRPRQVMAAQKQIVGGVNYFFNVKFARTTCTKSQPNLDNCPFNDQPELKEFCSFQIYEVPREDKISMVNYKCRKV

140

F6UCB8 Uncharacterized


MAGPLRDPLLLLAVLALALAVSPAAGTSPGRQPRLLGGPMDASVEEEGVRRALDFAVSEYNKASNDRYHSRALQVVRARKQIVAGVNYFLDVEMGRTTCTKDQPNLDNCPFHEQPHLKRKAFCSFQIYSVPWQGLMTLSKSSCQNA

146

Cavia

porcellus ENSCPOP00000001466 ENSCPOG00000001625

LSSRSTAAMARTALLLAAALVAMLSLALAAEPVKRPRLLGGPEEADVREEGVRRALDFALSEYNKASNDRFHSRARQVLRARKQLVAGVNYFLEVEIGRTTCTKSQPNLADCPFHEEPHLKRNSVCSFQIYTVPWEGKISLTKSSCRDA

149

Anexos

113

Organismo Acesso


Cricetulus

griseus

G3H705

Cystatin-C

I79_006129

MASPLRTPLLLLAILAVASAANTKQGPRLLGGLQEAKVEEEGVKQALDFAISEYNKGSNDAYHSRALEVVRARKQKTLCSFQIYTVPWQGTQTLTKSSCKSA

102

G3H704 Cystatin-S

I79_006128

MACPLHAPLLLLTTLMVAVNLSLNPVLGNILLGGIEESSMQEEGAPEALEYAVGKYNENNNDLYLSHVVEVKRVRKQVVAGENFLFDVVLGQTTCTKAQDDLTNCPLNDQAEV

113

Dasypus

novemcinctus

ENSDNOP00000004937

MALPLRAALLLLAALALALAVSPAAGRDPGKQPRLVGGPIEADAKEEGVQRALEFAISEYNKASNDKYHSRVVEVLRTRKQIVSGVNYFIDVLIGRTTCTKSQPNLATCPFHDQGQLSKKTHCSFQVYTVPWMNITSLKFNCREA

145

Dipodomys

ordii ENSDORP00000008399

cystatin 10

(chondrocytes)

CST10

MAKTLHLLLASLVIALTLNFAACTNTKEKQKVVGHVEAADANDKEVQRVVDFSLRVYNDANNDLYYSRAVKVISARQQVVNGMKYYLRIEVGWTTCTKSQSHLPDCPFREQPDQQKKEICSFVVYTIPRLQKISMESYSCHSA

143

Echinops

telfairi ENSETEP00000003593 ENSETEG00000004390

MAALLRAPLFVLGALALAGMLSSGGAASPARPPRLLGGLLEADANEEGVQRALDFAVSEYNKASNDKFHHRVVRLKGARKQLVSGVNYFLDVELGRTTCTKSQPNLTTCPFHDQPHLKK

119

Equus

cabalus F6UBH5

Uncharacterized

protein

MAVLPRAPLLLLAALALGLAASPAAAASAGKRQLVGGISEADISEQGVQQALDFALSDGTRGSGELLYFSEPFEILLSRVQVVAGLNYFLDVEIGRTRCSKSQPNLTTCPLHDPLRVSRKGLCSFQIYTVPWMGTMSVVKSSCHEA

146

Erinaceus

europaeus ENSEEUP00000013930 ENSEEUG00000015274

MSGTSYFPLPPLALALTVALALVVTAGPASGASPAKSPRLIGGLMDADVNEEGVQRALDFALSEYNKANNDAYHSRAVQVLRARKQ

86

Felis catus ENSFCAP00000004756 ENSFCAG00000005133

MAGSLRTPLLLLAAVALTLALAMSPGTGRRNNKSALVGAPLDADVNEEGVQQALNFALSEYNKASNDAYHSRAMRVVRARKQXXXXXXYFLDVEIGRTRCTKSQPNLDTCPFHDQPHLMRKTLCSFQIYTVPWMGKTSLVKSSCQDA

147

Felis catus D5MTH1 Cystatin-C

CST3

MAGSLRTPLLLLAAVALTLALAMSPGTGRRNNKSALVGAPLDADVNEEGVQQALNFALSEYNKASNDAYHSRAMRVVRARKQVVAGMNYFLDVEIGRTRCTKSQPNLDTCPFHDQPHLMRKTLCSFQIYTVPWMGKTSLVKSSCQDA

147

Anexos

114

Organismo Acesso


Gorilla

gorilla gorilla

G3QJY3 Uncharacterized

protein CST1

MARHLSTLLLLLATLAVALAWSPKEEDRIILGGIYDADLNDEWVQRALHFAISEYNKATKDDYYRRPLRVLRARQQTVGGVNYFFDVEVGRTICTKSQLNLDTCAFHEQPELQKKQLCSFEIYEVPWENRRSLVKSRCQEA

141

G3QXG3

Uncharacterized

protein

ENSG00000101441

MARHLCTLLLLMATLAGALASSSEEEDRIISGGIYDADLNDEWVQRALHFAISEYNKATEDEYYRRPLQVLRAREQ

76

G3RKA9

Uncharacterized

protein

CST5

MTWPMHTSLLLLTALMVAVAGSASAQSRTLAGGIHAADLNDKSVQRALDFAISEYNKDISKDEYYSRPLQVMAAYQQIVGGVNYYFNVKFGRTTCTKSQPNLDNCPFNDQPKLKEEEFCSFQINEVPWEDKISILNYKCRKV

146

Homo

sapiens

P01036 Cystatin S

CST4

MARPLCTLLLLMATLAGALASSSKEENRIIPGGIYDADLNDEWVQRALHFAISEYNKATEDEYYRRPLQVLRAREQTFGGVNYFFDVEVGRTICTKSQPNLDTCAFHEQPELQKKQLCSFEIYEVPWEDRMSLVNSRCQEA

141

P01037 Cystatin-SN CST1

MAQYLSTLLLLLATLAVALAWSPKEEDRIIPGGIYNADLNDEWVQRALHFAISEYNKATKDDYYRRPLRVLRARQQTVGGVNYFFDVEVGRTICTKSQPNLDTCAFHEQPELQKKQLCSFEIYEVPWENRRSLVKSRCQES

141

P09228 Cystatin-SA CST2

MAWPLCTLLLLLATQAVALAWSPQEEDRIIEGGIYDADLNDERVQRALHFVISEYNKATEDEYYRRLLRVLRAREQIVGGVNYFFDIEVGRTICTKSQPNLDTCAFHEQPELQKKQLCSFQIYEVPWEDRMSLVNSRCQEA

141

P28325 Cystatin-D

CST5

MMWPMHTPLLLLTALMVAVAGSASAQSRTLAGGIHATDLNDKSVQCALDFAISEYNKVINKDEYYSRPLQVMAAYQQIVGGVNYYFNVKFGRTTCTKSQPNLDNCPFNDQPKLKEEEFCSFQINEVPWEDKISILNYKCRKV

142

P01034 Cystatin-C

CST3

MAGPLRAPLLLLAILAVALAVSPAAGSSPGKPPRLVGGPMDASVEEEGVRRALDFAVGEYNKASNDMYHSRALQVVRARKQIVAGVNYFLDVELGRTTCTKTQPNLDNCPFHDQPHLKRKAFCSFQIYAVPWQGTMTLSKSTCQDA

146

Loxodonta

africana G3TEB6

Uncharacterized

protein

GEPLRSPLFLLAALALAVMLLGGIMDADENEEGVQRALDFAISEYNKASNDKFHSRVVQVVRARKQIVSGVNYFLDVEIGRTTCTKSQPNLANCPFHDQPQLKKKALCSFQIYTVPWLGTTSLTKSSCQDA

131

Anexos

115

Organismo Acesso


Macaca

mulatta

F6ZNT9 Uncharacterized

protein CST1

MAQPLCTLLLLLAALAGAQAWSPKEEDRVIPGGIYDADLNDDEVQHALHFAISEYNKATEDEYYRRPLRVLRAREQVVAGMNYFLDVELGRTTCTKSQPNLDTCAFHEQPELQKKQLCSFQIYEVPWEDRMSLVNSRCQEA

141

F7HAW3 Uncharacterized

protein CST5

TMAWPMRALLLLLTALMVVLARSASAQSRKTSSGDIHAADLNDKSVQRVLNFTIREYNKDISKDEYYSRPLQVMAAYQQVVGGVNYYFNVKFGRTTCTKSQPNLDNCPFNDQPELKEEEFCSFQINEVSQENKISILNYKCRKV

144

O19092 Cystatin-C

MAGPLRAPLLLLAILAVALAVSPAAGASPGKPPRLVGGPMDASVEEEGVRRALDFAVSEYNKASNDMYHSRALQVVRARKQIVAGVNYFLDVELGRTTCTKTQPNLDNCPFHEQPHLKRKAFCSFQIYTVPWQGTMTLSKSTCQDA

146

Microcebus

murinus

ENSMICP00000004204 Cystatin C

LLLAALAVALAVSAAAGPSLGPASPLVGGLMDANVNEEDVQRALDFAVSEYNKASNDRYHSRALQVVRARKQXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXEELCSFQIYSVPWLGKISVVKSSCENA

137

ENSMICP00000011557

MAGPLRAPLLLLAILAMTLAMTLAKSVAKTTLGGMEEADVNDDEVQRALDFATGKYNEESNDTYYSQVRQVVRARQQAVAGTNYFFYVKMGRTTCTKSQPNLDNCPFQEQPRQKREELCSFEIYSVPWEDSMTLVKSSCRKA

142

ENSMICP00000014007

MARPLRAPLLLLAILALTWAMPLAKNSKRVGGIKEADVNNEGVQQRLDFATSKHNKENDEDEDKHWQGQVMSVFDQVLFRLAYSLYMEISQTICNKSQANLDNCPFQEQPHLKR

114

ENSMICP00000001300

MARPLRTPLLLLAILAVTLAVTLAMPLAKNSKGVVGIEKADVNDEGVQRELDFAISKYNMRRNDSSNNVLDELFRIFEQAVVKVYLDTIRTTNKSQPYLDNCQARPHLKRELCYFIYSVRWEDSLTLVNSSCQKA

135

Monodelphis

domestica F7CAH1

Uncharacterized


RTATMAGSRLSLVLLPLLLIALVCAVHAERKPRLVGGITEANENEEGVQRAVNFAISEYNKASNDKFGHRIVRVVRAQKQLVAGIKYILEVEISRTTCTKSVTDFSSCPLHEDPTLKKHSICNFVVYFVPWLGKISLIKNECKII

145

Mus

musculus P21460 Cystatin-C Cst3

MASPLRSLLFLLAVLAVAWAATPKQGPRMLGAPEEADANEEGVRRALDFAVSEYNKGSNDAYHSRAIQVVRARKQLVAGVNYFLDVEMGRTTCTKSQTNLTDCPFHDQPHLMRKALCSFQIYSVPWKGTHSLTKFSCKNA

140

Anexos

116

Organismo Acesso


Mus

musculus

A2APX3 Cystatin C Cst3

MASPLRSLLFLLAVLAVAWAATPKQGPRMLGAPEEADANEEGVRRALDFAVSEYNKGSNDAYHSRAIQVVRARKQLVAGVNYFLDVEMGRTTCTKSQTNLTD

102

Q9JM84 Cystatin 10

(Chondrocytes) Cst10

MASLLSPSMPVLAAVALTLTLAVIPEASTNAEAKQVVLGGVEPADPKDKEVQKVVKFAVRTYNDMDNDLYLSKPIRLMSASQQVVAGKNYYLKIELGRTTCTKTESNLVDCPFNEQPDQQKRVICNFQINVAPWLNKMSMTNFNCYNF

148

Q3U5K7

Putative

uncharacterized

protein

Cst3

MASPLRSLLFLLAVLAVAWAATPKQGPRMLGAPEEADANEEGVRRALDFAVSEYNKGSNDAYHSRAIQVVRARKQLVAGVNYFLDVEMGRTTCTKSQTNLTDCPFHDQPHLMRKALCSFQIYSVPWKGTHSLTKFSC

137

Q9EPX9 Cystatin C

Cst3

MASPLRSLLFLLAVLAVAWAATPKQGPRMLGAPEEADANEEGVRRALDFAVSEYNKGSNDAYHSRAIQVVRARKQLVAGVNYFLDVEMGRTTCTKSQTNLTDCPFHDQPHLMRKALCSFQIYSVPWKGTHSLTNFSCKNA

140

Myotis

lucifugus G1Q2V3

Uncharacterized

protein

LEATMAGLSRAPLFLLALALALALTASPAAGATAGRPRLVGGLAEADVNEEGVQQALNFALSEYNKASNDAFHSRAMRVVRARKQLVAGLNYFLDVEIGRTTCTKSQPNLASCPFHVQPHLRKEALCSFQVYTVPWLGKTSLVKSSCQDA

150

Nomascus

leucogenys

G1RZZ0 Uncharacterized

protein CST1

MAQPLCTLLLLLATLAGALAWSPEEEDRIIGGGIYDADLDDEWVQRALHFAISEYNKATEDEYYRRPLRVLKAREQTVAGTNYFFDIEVGRTVCTKSQPNLDTCAFHEQPELQKKQLCSFQIYEVPWENRRSLVKSRCQEN

141

G1RLM2 Uncharacterized

protein CST3

MAGPLRAPLLLLAILAVALAVSPAAGASPGKPPRLVGGPMDASVEEEGVRRALDFAVSEYNRASNDMYHSRALQVVRARKQIVAGVNYFLDVELGRTTCTKTQPNLDNCPLHDQPHLKRKAFCSFQIYAVPWQGTMTLSKSTCQDA

146

G1RZZ5 Uncharacterized

protein CST5

MTWPMYTPLLLLTALMVAVAGSASTQSRNLVGGVHAADLNDKSVQRALDFTISEYNKDISKDEYYSRPLQVMAAYQQIVDGVNYYFNVKFGRTICTKSQSNLDNCPFNDQPKLKEEEFCSFEINEVPKEDKISILNYKCRKV

142

Anexos

117

Organismo Acesso


Oryctolagus

cuniculus

O97862 Cystatin C CST3

MARSLGVPLLLLAALVVALALAVSPAAGARTRQSPRLLGGLEDVDAQEKDVQRALGFAESEYNKGSNDRYHSRALQVVRARRQIVSGVKYYLDVLIGRTTCTKTQTNLANCPFHDQPDLQRKMLCSFEIYSVPWLNKISLLKSDCQNA

148

G1SUE4 Uncharacterized

protein

ARTMARSLGVPLLLLAALVVALALAVSPAAGARTRQSPRLLGGLEDVDAQEKDVQRALGFAESEYNKGSNDRYHSRALQVVRARRQIVSGVKYYLDVLIGRTTCTKTQTNLANCPFHDQPDLQRKMLCSFEIYSVPWLNKISLLKSDCQNA

151

Otolemur

garnetii ENSOGAP00000009111 Cystatin C CST3

MAGSPRATLLLLATLAVALAVSSATGASSGLRKRLLGGFMDADVNEEGVQHALNFAMSEYNKASNDRYHSRALQVVRASKQXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXKVLCSFEIYSIPWQDKMTMTKYSCQNA

146

Pan

troglodytes

ENSPTRP00000022846 Cystatin S CST4

MARHLCTLLLLMATLAGALASSSEEEDRIISGGIYDADLNDEWVQRALHFAISEYNKATEDEYYRRPLQVLRAREQTVAGTNYFFDVELGRTICTKSQPNLDTCAFHEQPELQKKQLCSFEIYEVPWEDRRSLVNSRCQEA

141

ENSPTRP00000022847 Cystatin SN CST1

MARHLSTLLLLLATVAVARAWSPKEEDRIIPGGIYNADLNDEWVQRALHFAISEYNKATKDDYYRRPLRVLRARQQTVEGVNFFFDVEVGRTICTKSQPNLDTCAFHEQPELQKKQLCSFEIYEVPWEDRRSLVKSRCQES

141

ENSPTRP00000022848 Cystatin SA CST2

MAWPLCTLLLLLAAQAVALAWSPQEEDRIIGGGIYDADLNDEWVQRALHFAISEYNKATEDEYYRRPLRVLRAREQTVAGMNYFFDVEVGRTICTKSQPNLDTCAFHEQPELQKKQLCSFEIYEVPWEDRMSLVNSRCQEA

141

Pongo abelii

ENSPPYP00000012041 Cystatin SA CST2

MAWPLCTLLLLLATQAVALAWSPQVEDRIIGGGIYDADLNDEWVQRALHFAINEYNKATEDEYYRRTLRVLRAREQTVAGTNYFFDVEVGRTICTKSQPNLDTCAFHEQPELQKKQLCSFEIYEVPWENIRSLVNSRCQEA

141

ENSPPYP00000012040 Cystatin C CST3

MAGPLRAPLLLLAILAVALAVSPAAGSSPGKPPRLVGGPMDASVEEEGVRRALDFAVGEYNKASNDMYHSRALQVVRARKQIVAGVNYFLDVELGRTTCTKTQPNLDNCPFHDQPHLKRKAFCSFQIYAVPWQGTMTLSKSTCQDA

146

Anexos

118

Organismo Acesso


Pongo abelii

ENSPPYP00000023548

MAWPLCTLLLLLAALAGALAWSPKEEDRIILGRVYDPDINDEWVQRALHFAISEYNKATEDEYYRRPLRVLRARQQIVARTNYFFDIEVGRTICTKSQPNLDTCAFHEQPELQKKQLCSFTIYEVPWNKRRSLVKSRCQEA

141

ENSPPYP00000012590

MARPLCTLLLLLAALAGALAWSPEEEDRIILRGIYNADLSDEWVQRALHFAISEYNKATEDEYYRCPLRVLRARQQTVARTNYFFDVEVGRTTCAKSQPNLDTCAFHEQPELQKKQLCSFQIYEIPWEDKRSLVKSRCQEA

141

ENSPPYP00000023565

MAWPLCTLLLLLAALAGALAWSPKEEDRIILGRIYDADLNDEWVQCALHFAVSEYNKATEDEYYRRPLRVLRARQQIVAGTNYFFDIEMGRTICTKSQPNLDTCAFHEQPELQKKQLCSFTICEVPWNKRRSLVKSRCQEA

141

ENSPPYP00000012585

MARPLCTLLLLLVTLAVALSWSPEEDRIIPGGIYKADLNDEWVQRALDFAISEYNKANEDDYYRRPLRVLRARQQIVGGVNYFFDVEVGRTICTKSQPNLDTCAFHEQPELQKKQLCSFKIHEVAWEDRISLVNSRCQE

139

ENSPPYP00000012595

MAQPLCTLLLLLATLAVALAWSPEEDRIITGGIYKADLTDEGVQRALHFAISEYNKATEDDYYRRPLRVLRARQQIVGGVNYFFDVEVGRTICTKSQPNLDTCAFHEQPELQKKQLCSFKIHEVAWEDRISLVNSRCQEA

140

Pteropus

vampyrus ENSPVAP00000003380

MARSLRIALLLMATLVLALALAVSPAASANPSKTRLVGGLEDADVNEEGVQQALNFALSEYNKASNDAFHSRAIRVVRARKQXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXKSLCSFQIYTVPWMGKISMVKSTCQAA

147

Rattus

novergicus

P14841 Cystatin C CST3

MASPLRSLMLLLAVLAVAWAGTSRPPPRLLGAPQEADASEEGVQRALDFAVSEYNKGSNDAYHSRAIQVVRARKQLVAGINYYLDVEMGRTTCTKSQTNLTNCPFHDQPHLMRKALCSFQIYSVPWKGTHTLTKSSCKNA

140

D4AAU9 Cystatin 10 CST10

MSEGALSTPTMASLLSPSLPLLAALALTLALTVNPAASTNAKGKQVAVGGVEPADPNDKEVQKVINFAVKTYNDMNNDLYLSRPIRVMSASQQVVSGKNFYLKIELGQTMCTKAQSDLADCPFNEQPDQQKRAVCNFQINVEPWLNKISLTNFKCYNV

158

Anexos

119

Organismo Acesso


Rattus

novergicus

Q3MIE8

Similar to

Cystatin S (LM

protein)

LOC296235

MACLLYTQLFLLNTFILFLNLSLNPVLGQILAGIEKSIIEEEGALEALNFAVSEYNENNSDLYLSRVVEVKTVKTIQQQIEAGKTLLFDVILGKTACLKTQDDLSDCPLNEPTDLQEREFCSFEVHLPDWANAINLLSSICNRI

144

D3ZUY2

Uncharacterized

protein

MAYLLHARLFLLTTFMLVLNLCTYPVMSHIPGGIEKSSMEDEGARESLNFAVSQYNENKRDLYLSRVFGIHTLFTILNNVVAGTKFLFDVILVKKTCLKTQADLTNCPGKDQSGQQEHEFCSFEVYDTPWENDMALISSSCHNI

144

D3ZP68 Uncharacterized

protein

MAYLLHARLFLLTTFMLVLKLCTYPVLGHILGGIEKSSMEDEGARESLNFAVSQYNENNSDLYLSRVLEVKNVQKQVVAGTKFLFDVILVKTNCLKSQNDLTNCPAKDQDGQQEQEFCSFEVYDAPWENDMALISSSCHNI

141

P19313 Cystatin S CST4

MAYLLHAQLFLLTTFILVLNMRLCPVLGHFLGGIEKSSMEEEGASEALNYAVNEYNEKNSDLYLSRVVEVKDVQKQVVAGTKFFFDVILGKTICLKTQGDLTNCPLNEEADQQEHEFCSFVVHDIPWENYIVLLSSSCHSI

141

F1M6D7 Uncharacterized

protein

VDCLLYTQLFLLTTLILVLNLSHYPVIGQIVGMEESSIEEEGAPEALNFAVSQYNENSSDMYLSHMVEVKTVPKIQLKVVAERILLFDVILGKTTCMKTQDLSNCLLNEETDQKE

115

Saimiri

sciureus

O19093

Cystatin C CST3

MAGPLRAPLLLLAILAVALALSPAAGASPGRTPRLLGGPMDASVEEEGVRRALDFAVSEYNKASNDMYHSRALQVVRARKQIVAGVNYFLDVEMGRTTCTKNQPNLDNCPFHEQPHLKRKAFCSFQIYSVPWQGIMTLSKSTCQDA

146

Sarcophilus

harrisii

G3VZM3 Uncharacterized

protein

PRLIGGLSEANVNDEKVQRAITFALREFNQASNDKYGSRVFRVLEAKKQLVAGIKYIFQVEIGRTTCTKSVADFSNCPDHKEPPLKKHSICNFEVYTIPWMGKTNLVKSECRDI

114

Sus scrofa

Q0Z8R0 Cystatin C

CST3

MAGSPRSPLLLLAALALALALAVSPAAGQGHKGRLVGGLIDADVNEEGVQQALSFALSEYNKASNDAYHGRVLRVLRVRKQVVAGMNYFLEVEIGRTTCTKSQANLDNCPFPNQPDLQKKTLCSFQVYTVPWKGTTSLVKSSCRDE

146

Anexos

120

Organismo Acesso


Sus scrofa

F1SAS7 Uncharacterized

protein CST3

RETMAGSPRSPLLLLAALALALALAVSPAAGQGHKGRLVGGLIDADVNEEGVQQALSFALSEYNKASNDAYHGRVLRVLRVRKQVVAGMNYFLEVEIGRTTCTKSQANLDNCPFPNQPDLQKKTLCSFQVYTVPWKGTTSLVKSSCRDE

149

Q29212 Cystatin C

(Fragment) CST3

MAGSPRSPLLLLAXLAXXLXLAVSPAAGQGHKARLVDXXIDXDVNXEGVQQALSFXLSEYNKASNXAYHXRXLRVLXVRKQ

81

Anexos

121

Figura 10 10 Representação das sequências alinhadas das PRPs por software ClustalW. A zona sombreada a preto são os aminoácidos idênticos enquanto a zona

sombreada a cinzento identifica substituições conservadas

Anexos

122

Anexos

123

Anexos

124

Anexos

125

Anexos

126

Anexos

127

Anexos

128

Anexos

129

Anexos

130

Anexos

131

Anexos

132

Anexos

133

Anexos

134

Anexos

135

Documents

New Neuza Filipa Análise filogenética de péptidos salivares … · 2016. 8. 8. · superior da mucosa do sistema digestivo. No sistema digestivo, a saliva total representa um papel