Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
Universidade de Aveiro
2011
Departamento de Química
Neuza Filipa Rodrigues Faustino
Análise filogenética de péptidos salivares
Universidade de Aveiro
2011
Departamento de Química
Neuza Filipa Rodrigues Faustino
Análise filogenética de péptidos salivares
Dissertação apresentada à Universidade de Aveiro para cumprimento dos requisitos
necessários à obtenção do grau de Mestre em Bioquímica, realizada sob a orientação
científica do Doutor Rui Vitorino, Investigador Auxiliar do Departamento de Química
da Universidade de Aveiro e Doutor Francisco Amado Professor Associado do
Departamento de Química da Universidade de Aveiro.
Dedico este trabalho aos meus pais e irmão
o júri
presidente Doutor Pedro Miguel Dimas Neves Domingues Professor auxiliar do Departamento de Química da Universidade de Aveiro
Doutor Rui Miguel Pinheiro Vitorino Investigador auxiliar do De partamento de Química da Universidade de Aveiro Doutor Francisco Manuel Lemos Amado Professor associado do De partamento de Química da Universidade de Aveiro
Doutor Pedro José de Castro Esteves Professor Coordenador do Instituto Politécnico de Saúde Norte - CESPU
Agradecimentos
Agradeço ao Doutor Rui Vitorino e ao Professor Doutor Francisco Amado pela orientação do trabalho e apoio. Agradeço aos meus pais e irmão por o incentivo e apoio durante a realização deste trabalho.
palavras-chave
Saliva,péptidos, filogenética, PRPs, estaterinas, histatinas, cistatina
resumo
A saliva é um fluido corporal presente na cavidade oral importante para a proteção e manutenção da integridade da parte superior da mucosa do sistema digestivo. Estas propriedades estão associadas à sua composição proteica, nomeadamente em péptidos salivares como estaterina, histatinas, proteínas ricas em prolina (PRPs) e cistatinas. Apesar de já caracterizadas funcionalmente no Homem, pouco ou nada está descrito quanto à sua presença/função em outras espécies animais. Neste contexto, a análise filogenética dos péptidos salivares parece ser relevante para a compreensão dos processos fisiológicos nos quais participam. Assim, o principal objectivo da presente dissertação consistiu em encontrar novos péptidos salivares em mamíferos, homólogos com péptidos salivares encontrados em humanos com recurso a ferramentas filogenéticas, como o BLAST, alinhamento múltiplo, construção e avaliação de árvores filogenéticas. De forma a validar os resultados obtidos, procedeu-se à análise por espectrometria de massa de amostras de saliva recolhidas das espécies: Oryctolagus cuniculus, Canis familiaris, Rattus novergicus e Ovis aries. Na pesquisa de péptidos salivares foram encontradas 140 sequências da família das PRPs, 49 sequências da família das histatinas/estaterinas e 62 sequências da família das cistatinas, tendo sido identificados 75 novos péptidos nestas famílias. Destes novos péptidos detectados por análise filogenética é de salientar um péptido homólogo às estaterinas identificado na saliva de Canis Familiaris que propomos como uma nova estaterina nesta espécie.
keywords
Saliva,phylogenetic, peptides, PRPs, statherin,histatin, cystatin
abstract
Saliva is a bodily fluid present in the oral cavity important for protection and maintenance of upper digestive system’s mucosa integrity. These properties are related with the salivary protein composition with emphasis to statherin, histatins, proline rich proteins (PRPs) and cystatins. Although characterized in the human specie, few is known about their presence/function in other animal species. Thus, phylogenetic analysis of salivary peptides seems relevant to the comprehension of their physiological role. So, the main goal of the present dissertation was to find new salivary peptides in other species using phylogenetic tools, like BLAST, multiple alignment, construction and evaluation of phylogenetic trees. In order to validate phylogenetic analysis findings, mass spectrometry analysis was performed to identify those peptides in the salivary samples collected from: Oryctolagus cuniculus, Canis familiaris, Rattus novergicus e Ovis aries. With this approach, 140 sequences of salivary peptides from the PRPs family were identified, together with 49 sequences of the histatin /statherin family and 62 sequences of the cystatin family, with 75 new peptides found in these different families. Among these we found a peptide homologous to statherin in the saliva of Canis familiaris. that we propose as a new statherin in this specie.
i
Índice
11.. IINNTTRROODDUUÇÇÃÃOO.............................................................................................................. I
1.1. Saliva ................................................................................................................................... 3
1.1.1. Proteínas ricas em prolina (PRPs) ......................................................................... 6
1.1.1.1. Proteínas ricas em prolina ácidas (aPRPs) .................................................... 7
a) Características gerais ............................................................................................... 7
b) Funções ............................................................................................................................. 8
1.1.1.2. Proteínas ricas em prolina básicas (bPRPs) e glicosiladas (gPRPs) ..... 9
a) Características gerais ................................................................................................. 9
b) Funções ........................................................................................................................... 10
1.1.2. Histatinas ....................................................................................................................... 11
a) Características gerais ........................................................................................................... 11
b) Funções .................................................................................................................................. 12
1.1.3. Estaterinas .................................................................................................................... 14
a) Características gerais ............................................................................................... 14
b) Funções ........................................................................................................................... 16
1.1.4. Cistatinas ....................................................................................................................... 17
a) Família 1 ou Estefinas ............................................................................................ 17
c) Família 3 ou Quininógeneo ....................................................................................... 18
1.1.4.1. Filogenética das cistatinas tipo 2 .................................................................. 19
1.1.4.2. Cistatinas em saliva .......................................................................................... 20
1.1.4.2.1. Função ........................................................................................................ 21
a) Inibição das proteases de cisteína .............................................................................. 21
b) Controlo de mineralização ....................................................................................... 22
c) Actividades anti-microbianas e anti-virais ................................................................ 23
1.2. Filogenética molecular ................................................................................................ 24
1.2.1. Aspectos gerais ............................................................................................................ 24
1.2.1.1. Alinhamento das sequências ............................................................................. 25
1.2.1.2. Determinação do modelo de substituição ................................................... 27
1.2.1.3. Construção da árvore ........................................................................................... 29
1.2.1.4. Avaliação da árvore ............................................................................................... 29
1.3. Objectivo .......................................................................................................................... 30
22.. MMAATTEERRIIAALL EE MMÉÉTTOODDOOSS ................................................................................... 31
2.1. Análise Filogenética ..................................................................................................... 33
a) Recolha dos dados .............................................................................................................. 33
b) Alinhamento das sequências ......................................................................................... 33
c) Construção e avaliação da árvore ................................................................................ 33
2.2. Análise da saliva ............................................................................................................ 34
a) Colecta e preparação de amostras de saliva ............................................................... 34
b) Digestão enzimática e separação de péptidos por Nano-HPLC ....................... 34
c) Análise por espectrometria de massa e processamento de dados .................... 35
33.. RREESSUULLTTAADDOOSS.......................................................................................................... 37
3.1. Análise Filogenética ..................................................................................................... 39
a) Proteínas ricas em prolina.............................................................................................. 39
ii
b) Estaterina e Histatina ...................................................................................................... 40
a) Cistatinas ............................................................................................................................... 42
3.2. Análise da saliva ................................................................................................................... 45
44.. DDIISSCCUUSSSSÃÃOO .............................................................................................................. 49
4.1. PPRRPPss ....................................................................................................................................... 51
4.2. Estaterinas e Histatinas .............................................................................................. 54
4.3. Cistatinas ........................................................................................................................... 58
55.. CCOONNCCLLUUSSÃÃOO ............................................................................................................ 61
66.. BBIIBBLLIIOOGGRRAAFFIIAA ....................................................................................................... 65
AANNEEXXOOSS ................................................................................................................................ 85
iii
Índice de Figuras Figura 1Saliva e suas funções ...................................................................................................................... 4
Figura 2 Características estruturais e funcionais da estaterina .................................................................. 16
Figura 3 Representação da estrutura da cistatina de galinha. Estão identificadas na figura as três regiões conservadas G11,QXVXG e PW e as duas pontes de dissulfureto (SS1 é no terminal amina, SS2, é o terminal carboxilo). A região de inibição da legumaína N39 (Leg) está indicada na estrutura. .......... 22
Figura 4 Representação da formação da árvore pelo método neighbor-joining ........................................ 29
Figura 5 Representação das sequências alinhadas de estaterina e histatina por software ClustalW. A zona sombreada a preto são os aminoácidos idênticos enquanto a zona sombreada a cinzento identifica substituições conservadas. As sequências identificadas de estaterina de Bos taurus (STAT BOVIN), Callithrix jacchus ( Uncharact F7HQI8; Uncharact F7HQR7), Canis familiaris, Gorilla gorilla gorilla (Uncharact G3SG71), Homo sapiens ( STAT_HUMAN; STAT isofCRA_c), Macaca arctoide (STAT MACAR), Macaca fascicularis (STAT MACFA), Macaca mulatta (STATH MACMU), Nomascus leucogenys (Uncharact G1R7Y6), Pan troglodytes (ENSPTRP00000027723; ENSPTRP00000053497), Pongo pygmaeus ( ENSPPYP00000016521) e Sus scrofa (STAT PIG). As sequências identificadas de histatinas de Chlorocebus aethiops (COLRB4 CHLAE, histatina 1; COLRB7 CHLAE, histatina 3), Gorilla gorilla (COLRB0_9PRIM, histatina 1,;COLRB5_9PRIM, histatina 3,), Homo sapiens (HIS1_HUMAN, histatina 1; HIS3_HUMAN, histatina 3,), Nomascus leucogenys (COLRB2_NOMLE, histatina 1, ACN88340;COLRB6_NOMLE, histatina 3, HIS3-LIKE NOMLE; LOC100590184 NOMLE),Macaca fascicularis (HIS1_MACFA e COLRB1_MACFA, histatina 1; COLRB9_MACFA, histatina 3), Pan troglodytes (ENSPTRP00000027724, histatina 1; ENSPTRP00000053498 histatina 3,), Pongo abelii ( HIS3 LIKE PONAB, histatina 3-like;histatina 1,ENSPPYP00000016523;histatina 3, ENSPPYP00000016522),Trachypithecus cristatus(COLRB3_TRACR, histatina 1;COLRB8_ TRACR, histatina 3). Outras sequências identificadas são as histatherin de Bos taurus (C6KGD8_BOV, C6KGD7_BOV, C6KGD9_BOVIN corresponde) e as proteínas hipotéticas de Canis familiaris ( XP_848687 CANFA, XP_862196 CANFA, XP_862059 CANFA, XP_861969 CANFA, XP_862144 CANFA, XP_862168 CANFA, XP_856826 CANFA, XP_856868 CANFA, XP_003431878 CANFA) e de Rattus novergicus (Theobromine induced RAT) ............................................................................................ 41
Figure 6 Alinhamento das sequências das cistatinas por software ClustalW. As sequências identificadas pertencem as seguintes espécies: Ailuropoda melanoleuca (AILME), Bos taurus (BOVIN), Callithrix
jacchus (CALJA), Cavia porcellus (CAVPO), Cricetulus griseus (CRIGR), Dasypus novemcinctus
(DASNO), Dipodomys ordii (DIPOR), Echinops telfairi (ECHTE), Equus caballus (HORSE), Erinaceus
europaeus (ERIEU), Felis catus (FELCA), Gorilla gorilla (GORGO), Homo sapiens (HUMAN), Loxodonta
africana (LOXAF), Macaca mulatta (MACMU), Microcebus murinus (MICMU), Mus musculus
(MOUSE), Myotis lucifugus (MYOLU), Nomascus leucogenys (NOMLE), Oryctolagus cuniculus (RABIT),
Otolemur garnetii (OTOGA), Pan troglodytes ( PANTR), Pongo abelii ( PONAB), Pteropus vampyrus
(PTEVA), Rattus novergicus (RAT), Saimiri sciureus (SAISC), Sarcophilus harrisii (SARHA) e Sus Scrofa
(PIG). ................................................................................................................................................. 43
Figura 7 Árvore Filogenética das PRPs A árvore foi construída usado o método neighbor-joining (NJ). Os valores nos ramos referem-se ao Bootstrap, que são valores obtidos por 1000 réplicas e estão representados em percentagem. Os ramos com valores de Bootstrap inferiores a 50% foram eliminados. As sequências identificadas com um círculo são espécies que com análise na saliva foram detectadas neste estudo. .................................................................................................................. 52
Figura 8 Árvore Filogenética das Estaterinas e Histatinas. A árvore foi construída usado o método neighbor-joining (NJ). Os valores nos ramos referem-se ao Bootstrap, que são valores obtidos por 1000 réplicas e estão representados em percentagem. Os ramos com valores de Bootstrap inferiores a 50% foram eliminados. ................................................................................................................... 57
Figura 9 Árvore Filogenética das Cistatinas A árvore foi construída usado o método neighbor-joining (NJ). Os valores nos ramos referem-se ao Bootstrap, que são valores obtidos por 1000 réplicas e estão representados em percentagem. Os ramos com valores de Bootstrap inferiores a 50% foram eliminados. As cistatinas identificas com quadrado preto são as cistatinas já encontradas em saliva anteriormente. .................................................................................................................................. 59
iv
Figura 10 10 Representação das sequências alinhadas das PRPs por software ClustalW. A zona sombreada a preto são os aminoácidos idênticos enquanto a zona sombreada a cinzento identifica substituições conservadas ............................................................................................................... 121
v
Índice de Tabelas Tabela 1 Representação dos péptidos salivares encontrados por análise da saliva de Canis familiaris, Ovis
aries e Rattus novergicus .................................................................................................................. 46
Tabela 1 Representação dos péptidos salivares encontrados por análise da saliva de Canis familiaris, Ovis
aries e Rattus novergicus (Continuação)............................................................................................ 47
Tabela 2 Representação das sequências de PRPs recolhidas das bases de dados ..................................... 87
Tabela 3 Representação das sequências de histatinas e estaterinas recolhidas das bases de dados ...... 108
Tabela 4 Representação das sequências de cistatinas recolhidas das bases de dados ............................. 112
vi
Índice de Abreviaturas
Ala -alanina
aPRPs- proteínas ricas em prolina ácidas
Arg- arginina
bPRPs- proteínas ricas em prolina básicas
CD-dicroismo circular
Cys- cisteína
Gln- Glutamina
Glu-ácido glutâmico
gPRPs- proteínas ricas em prolina glicosiladas
HAP-hidroxiapatite
Ile-isoleucina
Leu- leucina
Phe-fenilalanina
PRPs – proteínas ricas em prolina
11.. IInnttrroodduuççããoo
Introdução
3
1.1. Saliva
A saliva é um fluído corporal presente na cavidade oral que é vital para
manutenção da saúde oral [1, 2]. A saliva é constituída pela mistura das secreções das
glândulas salivares maiores (parótida, submandibular e sublingual) e glândulas salivares
menores (labial, bucal, lingual, palatal) [3]. Os termos “fluido oral ” ou “saliva total” é
referente a um fluido mais complexo com a mistura da secreção das glândulas salivares,
com substâncias oriundas do fluído gengival, das secreções brônquicas e nasais, de
bactérias e dos produtos bacterianos, de componentes do soro e derivados de sangue
provenientes de lesões orais, dos vírus e dos fungos, de células provenientes da
descamação do epitélio e dos restos de alimentos [4].
A saliva total é predominantemente constituída por água (99%), mas também
composta por uma fracção inorgânica e uma fracção orgânica. A fracção inorgânica inclui
iões como Na+, Cl– , Ca2+,K+,HCO3–,H2PO4
–, F–, I–,Mg2+ e o tiocianato. A fracção
orgânica da saliva inclui um grande número de compostos tais como: ureia, amónia, ácido
úrico, glucose, colesterol, ácidos gordos, mono-, di- e triglicerídeos, lípidos neutros e
fosforilados, glicolípidos, aminoácidos, hormonas esteróides e proteínas [5].
O papel fundamental da saliva é a proteção e manutenção da integridade da parte
superior da mucosa do sistema digestivo. No sistema digestivo, a saliva total representa um
papel importante na fisiologia do esófago, no processo digestivo, e protecção celular
gástrica. Na cavidade oral, a saliva toma parte na mastigação, fala, deglutição, percepção
do sabor, lubrificação dos tecidos orais, protecção da mucosa oral, actividade anti-
bacteriana, anti-fúngica e anti-viral, maturação pós-eruptiva, regulação do balanço iónico
na remineralização do esmalte, formação da película de esmalte aderida e limitação da
difusão ácida (Figura 1) [6-9].
Análise filogenética de péptdos salivares
4
O estudo da composição salivar é um importante recurso para a avaliação de
condições salivares com implicações fisiológicas e patológicas e é utilizado como meio de
diagnóstico, principalmente devido a sua origem, composição, funções e interacções com
outros sistemas de órgãos. O método de colecta de saliva é simples, não invasivo, de fácil
armazenamento e não é caro quando comparado com a colecta de sangue. Apesar do
método de recolha de saliva humana ser simples, o estudo da composição da saliva é
complicado por a sua variabilidade inter- e intra- individual e o seu comportamento
dinâmico.
Na última década, vários estudos proteómicos [10-20] foram realizados para a
caracterização da composição proteica da saliva. Esses estudos indicam a presença de mais
do que 2000 proteínas diferentes em saliva humana [21], que podem ser divididas em
proteínas de origem da secreção glandular (α-amilase, histatinas, cistatinas, lactoferrinas,
lisozima, mucinas, proteínas ricas em prolina (PRPs)) e proteínas de origem diversa,
comuns a outros fluidos corporais, como derivados do plasma (albumina, imunoglobulina
A (sIgA), transferrina) [13] ou tecidos [22], mas também proteínas derivadas de
Figura 1Saliva e suas funções
Introdução
5
microrganismos [23]. Contudo, as proteínas glandulares são responsáveis por mais de 85%
do proteoma salivar e provavelmente as mais importantes para a saúde oral [24].
Um aspecto comum das principais proteínas/péptidos salivares é que apresentam
polimorfismos genéticos que dão origem às várias famílias de moléculas relacionadas
funcionalmente e estruturalmente. A base biossintética para estes polimorfismos tem sido
ligada a uma diversidade de processos moleculares como a variação alélica, a duplicação
do gene, splicing diferencial de mRNA e as modificações pós-traducionais antes, durante e
depois da secreção através da acção de enzimas endógenas e exógenas (da microflora),
como proteólise, fosforilação, sulfatação, acilação, desamidação e glicosilação, mas apenas
a proteólise, glicosilação e fosforilação tem evidenciado relevância funcional [25-28].
Em alguns casos, as formas polimórficas diferem significativamente em tamanho.
Noutras instâncias, as formas polimórficas mostram somente rearranjos menores dos
aminoácidos que não afectam o valor da massa molecular. De facto, os polimorfismos
genéticos que são normalmente encontrados nas principais proteínas salivares indicam uma
natureza evolutiva, no processo de selecção natural para melhoria da sua funcionalidade
[25] .
Os níveis de similaridade entre duas ou mais sequências implica terem um
ancestral comum e a similaridade entre sequências pode organizar os genes ou proteínas
homólogas numa árvore filogenética que descreve a sua relação evolutiva. Com uso de
ferramentas filogenéticas para construção da árvore filogenética é possível relacionar
grupos de proteínas que pertençam a mesma superfamília, família, e subfamília. Estas
ferramentas filogenéticas têm sido fundamentais para perceber a origem, evolução e função
de proteína.
Neste estudo, a análise filogenética vai ser utilizada para relacionar péptidos
salivares de mamíferos que pertençam a mesma família de alguns péptidos secretados pelas
glândulas salivares: PRPs, estaterinas, histatinas e cistatinas.
Análise filogenética de péptdos salivares
6
1.1.1.Proteínas ricas em prolina (PRPs)
As secreções salivares humanas da parótida e da submandibular são
essencialmente compostas por uma família de proteínas designada de proteínas ricas em
prolina (PRPs) que representam cerca de 70% da composição do proteoma salivar humano
[29-33]. Estas proteínas foram as primeiras detectadas em saliva humana por Mandel et al.
[34] e posteriormente foram purificadas e caracterizadas. Baseadas na mobilidade
electroforética e nas suas propriedades químicas, as PRPs podem ser classificadas em três
grupos: ácidas (aPRPs), básicas (bPRPs), e glicosiladas (básicas) (gPRPs) [35-43].
As PRPs são codificadas por uma família de seis genes, localizados no cromossoma
12p13.2 [44, 45]. A ordem dos genes no cromossoma é 5 'PRB2-PRBI-PRB4-PRH2-
PRB3-PRH1 3'. Estes seis genes podem ser divididos em duas subfamílias: uma subfamília
que codifica as aPRPs com dois genes do tipo HaeIII (PRH1 e PRH2), que tem locais onde
enzima de restrição HaeIII ocorre repetidamente e uma outra subfamília que codifica
bPRPs e gPRPs com quatro genes tipo BstNI (PRB1, PRB2, PRB3 e PRB4), que tem
locais onde enzima de restrição BstNI ocorre repetidamente [30, 43, 46-49].
As PRPs têm sido caracterizadas de acordo com as propriedades físico-químicas,
sequências de aminoácidos, modificações pós-traducionais e polimorfismos das proteínas
[35, 36, 50-54]. Um único gene de PRP pode produzir várias PRPs por variação alélica,
splicing RNA diferencial e por clivagem proteolítica antes da secreção [46, 55-57]. A
heterogenidade destas proteínas ao nível da sequência primária, de tamanho e modificações
pós-traducionais sugerem uma diversidade funcional significante.
O peso molecular das PRPs é estimado na gama de 1000 a 25000 Da [58, 59].
Estas proteínas são normalmente caracterizadas por uma predominância de resíduos de
prolina que representam entre 25 a 45% do conteúdo total de aminoácidos, mas também é
rico em resíduos glicina (18-22%) e glutamina (18-22%) e com as aPRPs contendo
resíduos de aspartato (9-11%) e as bPRPs contendo 7-10% de resíduos de lisina e arginina
[60].
As PRPs têm também sido isolados e caracterizadas na saliva ou em glândulas
salivares de vários animais incluindo ratinho [60-62], rato [63], macaco [64-66], coelho
[67] hamster [68, 69] e porco [70, 71]. Todas estas proteínas codificadas por cDNAs e
genes partilham uma estrutura comum de quatro regiões: a região do péptido sinal, uma
Introdução
7
região de transição, uma região repeat e uma região do terminal carboxilo. Os péptidos
sinal e regiões repeat exibem uma elevada homologia entre as espécies, enquanto as
regiões de transição e o terminal carboxilo variam grandemente [60, 62, 69].
1.1.1.1. Proteínas ricas em prolina ácidas (aPRPs)
a) Características gerais
Os genes PRH1 e PRH2 expressam cinco isoformas principais de aPRPs. O gene
PRH2 sintetiza as isoformas PRP-1 e PRP-2, e o gene PRH1 sintetiza as isoformas PIF-s,
Pa e Db-s [37, 55].
As isoformas PRP-1, PRP-2 e PIF-s são compostas por 150 aminoácidos e
apresentam sequências de aminoácidos idênticas com a excepção da PRP-2 ser diferente da
PRP-1 pela substituição de Asp por Asn na posição 50, e a PIF-s diferir da PRP-1 por
substituição de Asn por Asp no resíduo 4 [72].
Outra isoforma também constituída por 150 resíduos de aminoácidos é a isoforma
Pa que difere das isoformas PIF-s, PRP-1 e PRP-2 por apresentar na posição 103 uma Cys
em vez de uma Arg e na posição 26 apresentar uma Leu em vez de uma Ile [73, 74].
A isoforma Db-s é constituída por 171 resíduos de aminoácidos devido a inserção
de 21 aminoácidos depois da posição 81 da isoforma PIF-s, além disso, a Db-s, como a
isoforma Pa apresenta a substituição da Ile por uma Leu na posição 26.
Além disso, as PRP-1, PRP-2, PIF-s e Db-s sofrem uma clivagem pós-traducional
depois da Arg106 (Arg127 em proteína Db-s) antes do armazenamento do grânulo por uma
convertase específica (enzima pertencente a uma família de endoproteases de serina
dependente de Ca2+), que cliva o péptido na sequência R103XXR106↓; esta gera o mesmo
péptido básico com uma sequência de 44 aminoácidos do terminal carboxilo, chamado de
péptido P-C, e outras quatro isoformas truncadas, PRP- 3, PRP-4, PIF-f e Db-f,
respetivamente [31, 37, 73, 75]. Por outro lado, o péptido Pa não é clivado devido a
substituição de uma Arg103 por uma Cys103, anulando o local de reconhecimento da
protease, em vez disso, sofre um processo de dimerização por formação de ligações
disulfito através do resíduo Cys103 [56, 76]. Em menores quantidades são também
detectados, outros derivados que perderam resíduos no terminal carboxilo em quase todas
as isoformas [77].
Análise filogenética de péptdos salivares
8
Todas as isoformas possuem um resíduo de piroglutâmico no terminal amina
devido a ciclização de glutamina, um aminoácido final do terminal amina, com o grupo
amida presente na sua cadeia lateral. Além disso, todas as aPRPs são fosforiladas nas
posições Ser-8 e Ser-22 [29, 54]. Estas modificações ocorrem antes de as proteínas
acumularem nos grânulos secretores, que são vesículas originárias de retículo trans-Golgi e
que actuam como compartimentos de armazenamento [78]. As espécies monofosforiladas e
não fosforiladas são detectadas em menores quantidades na saliva total. As isoformas
trifosforiladas (na Ser-17) são também detectadas em menor percentagem [77]. A
fosforilação específica da Ser-8 e da Ser-22 em aPRPs foi demonstrada a partir da
construção de uma linha celular de PRP da glândula submandibular [79]. O local da
fosforilação da Ser-8 em aPRPs corresponde à sequência Ser- Xaa-Glu/pSer, porque é o
local de reconhecimento da caseína cinase de Golgi (G-CK) [80]. No caso da fosforilação
da Ser-22 é utilizada uma sequência consenso, nomeadamente, Ser-Xaa-Gln-Xaa-Xaa-
Asp/Glu [81].
b) Funções
As aPRPs têm uma elevada afinidade a hidroxiapatite (HAP) e são inibidores
eficazes do crescimento do cristal do fosfato de cálcio (precipitação secundária) [82-84] e
participam na formação da película de esmalte dentária [85]. Estas propriedades residem
nos 30 aminoácidos do terminal amina que estão carregados negativamente e tem duas
fosfoserinas que são fundamentais para estas propriedades e para a homeostasia mineral
[82, 83, 86, 87].
Na análise da estrutura secundária das aPRPs observou-se que ocorre uma mudança
conformacional quando o segmento de 30 aminoácidos do terminal amina é adsorvido na
superfície da HAP, expondo o domínio da proteína que não é acessível em solução e
promove a interacção com bactérias orais como Actinomyces viscous [88, 89],
Streptococcus mutans e S. gordonii [90, 91], que reside no péptido de 44 aminoácidos do
terminal carboxilo, sugerindo que aPRPs tem uma actividade anti-bacteriana.
Além disso, o péptido de 44 aminoácidos do terminal carboxilo após a sua
clivagem das aPRPs é eficaz na precipitação de taninos [91].
Introdução
9
1.1.1.2. Proteínas ricas em prolina básicas (bPRPs) e
glicosiladas (gPRPs)
a) Características gerais
A família PRPs básica (bPRPs) é codificada por genes em quatro loci separados
abrangido PRB1, PRB2,PRB3 e PRB4 [43, 46, 48, 49, 56]. Os genes PRB1 e PRB2 dão
origem a bPRP não glicosiladas e os genes PRB3 e PRB4 geram bPRP glicosilada. Cada
gene das bPRPs é associado a diversos alelos dando origem um extensivo e complexo
padrão de polimorfismo. A variedade destes polimorfismos bPRPs é ditada por
inserções/delecções de aminoácidos individuais, diferentes sequências repeat tandem, e
modificações pós-traduccionais, como glicosilação e proteólise [25]. Pelo menos quatro
alelos (S, M, L, VL) estão presentes nos loci PRB-1 e PRB-3 e três alelos (S, M, L) estão
presentes no loci PRB2 e PRB4 [26, 43, 46, 92].
Os oito péptidos de bPRP electroforeticamente distintas têm sido descritos: Pe
(=DEAEII-2), PmF, PmS, Ps, Pc, Con1, Con2, e Po [48, 93-98]. Simultaneamente, as
sequências de aminoácidos de fragmentos ricos em prolina básicos foram determinadas e
nomeadas P-D ou IB-5, P-E ou IB-9, P-F ou IB-8c, P-H ou IB-4, e P-I ou IB-6 [99-103],
II-1, II-2, IB-1, IB-7, e IB-8a [39, 94, 104, 105] Quando a estrutura do gene da família da
bPRP tornaram-se disponíveis [55], os péptidos identificados puderam condizer com as
sequências de proteínas previstas, e as diferenças em nomenclatura foram resolvidas [26,
43, 46, 106, 107].
Ao contrário das aPRPs que são presentes em isoformas inteiras e truncadas, as
bPRPs são detectados em grânulos e em saliva apenas em fragmentos das proteínas
maiores[76]. A estrutura de alguns destes fragmentos não é conhecida [108]. Muitas das
bPRPs são clivadas na cavidade oral em fragmentos mais pequenos (7-20 aminoácidos) na
sequência PQ↓ por uma endoproteinase de glutamina de estrutura desconhecida, que é
localizada na placa dentária e é provavelmente de origem microbiana [109].
A presença e distribuição espacial da cadeia de carbohidratos nas gPRPs parecem
ser os factores que condicionam a sua susceptibilidade para a proteólise. As regiões não
Análise filogenética de péptdos salivares
10
glicosiladas de bPRPs são clivadas na Arg-Ser-Xaa-Arg↓ (a seta indica o local de
clivagem) [46]. A sequência Arg-Xaa-Xaa-Arg é um local típico de reconhecimento das
convertases, como a furina que tem sido demonstrado que esta enzima está envolvida no
processamento das bPRPs in vivo [110].
b) Funções
As bPRPs formam um complexo com os taninos e precipitam de forma a
neutralizar os efeitos nocivos dos taninos [111-113]. A interacção molecular de taninos e
PRPs tem sido objecto de estudo utilizando um péptido que tem uma sequência repetida
típica de PRP de rato e bPRPs em humanos designada de IB-5 [114, 115].
As gPRPs funcionalmente têm propriedades lubrificantes na saliva [116], que
ajudam na protecção dos tecidos orais contra as forças abrasivas durante a mastigação e a
fala, sendo função comum em outras proteínas salivares glicosiladas [117]. Além disso, as
gPRPs ligam-se a uma variedade de bactérias como Fusobacterium nucleatum, S.mitis e
S.sanguis com gPRPs [117-120]. Os resíduos não substituídos Galβ1→4GlcNAc presente
em gPRPs têm sido identificadas como epítopo de reconhecimento de F. nucleatum,
explicando a elevada afinidade de gPRPs com estes microrganismos [119, 121, 122]. F.
nucleatum tem sido associada com doença periodontal [123], e a aglutinação mediada por
gPRPs destes microrganismos pode facilitar sua limpeza da cavidade oral. Por exemplo, a
clivagem do produto do gene PRB4 produz um fragmento não glicosilado que se liga aos
taninos (IB-5) e um fragmento glicosilado (II-I) com propriedades lubrificantes, assim gera
dois fragmentos com diferentes capacidades funcionais [111].
Recentes estudos têm demonstrado que um componente não identificado desta
família de proteínas apresenta uma actividade anti-viral contra HIV [124] e um fragmento
de um péptido de 10 aminoácidos inibe consideravelmente o crescimento de
Propionobacter acnes [125], revelando potenciais aplicações biotecnológicas para a
peptidómica ligada a bPRPs.
Introdução
11
1.1.2.Histatinas
a) Características gerais
As histatinas são péptidos catiónicos ricos em histidina de baixo peso molecular
presente nas secreções salivares humanas [42]. A origem do seu nome deriva do número
elevado de resíduo de histidina, um aminácido cujo a sua presença é baixa em proteínas de
mamíferos, mas na sua estrutura representa cerca de 25% da sequência [59, 113, 126-128].
São secretadas pelas glândulas salivares parótida e submandibular/sublingual [33, 126,
129-132] nos humanos e nalguns primatas superiores [59, 127, 133]. Mais recentemente,
estes péptidos também foram detectados no fluído lacrimal [134].
Da secreção da parótida foram isoladas doze histatinas salivares por cromatografia
e sequenciadas por degradação de Edman [130] e os fragmentos mais pequenos foram
encontrados por espectrometria de massa [14].
As principais histatinas são as histatinas 1 e 3 que tem origem em dois genes
diferentes HTN1 (HIS1) e HTN2 (HIS2), respectivamente, localizados no cromossoma
4q13 [127]. A histatina 1 e a histatina 3 são compostas por 38 e 32 aminoácidos,
respectivamente e são idênticos nos 24 aminoácidos do terminal amina, excepto nos
resíduos 4 e 11 por substituição de Glu e Arg na histatina 1 por Ala e Lys na histatina 3,
respectivamente [130]
A histatina 1 contém a Ser2 fosforilada mas, a histatina 3 devido à substituição do
resíduo Glu4 por Ala4, que é essencial para o reconhecimento da fosfocinase, não é
fosforilada na Ser2 [126, 135, 136].
A histatina 1 é parcialmente polisulfatada nas quatro Tyr terminais na glândula
submandibular, diferentemente da histatina 3 à qual falta uma tirosina equivalente a Tyr 27
da histatina 1, que provavelmente é essencial para o reconhecimento tyrosylprotein
sulfotransferase [137].
As histatinas 1 e 3 sofrem proteólise pós-traduccional dando origem as restantes
dez histatinas [133]. Troxler et al. [130] identificaram na saliva humana um péptido da
histatina 1 designado de histatina 2 correspondente a 26 resíduos do terminal carboxilo e
nove péptidos correspondentes a histatina 3 (histatinas 4-12). A histatina 3 gera por
clivagem sequencial primeiro a histatina 6 (histatina3 1/25) e depois a histatina 5 (histatina3
Análise filogenética de péptdos salivares
12
1/24) e em seguida os outros fragmentos [138]. A diferente susceptibilidade para clivar
deriva da presença da sequência consenso da convertase RGYR↓ na histatina 3, que está
ausente na histatina 1. No entanto, em trabalhos recentes verificou-se que esta classe era
bastante afectada pela proteólise permitindo a detecção de várias espécies após a
caracterização por espectrometria de massa [14].
O principal fragmento formado por clivagem do terminal carboxilo do resíduo de
Tyr da histatina 3 é a histatina 5 composta por 24 aminoácidos, estando presente em maior
concentração que as outras histatinas menores [126, 135].
O processamento de histatina 3 em histatina 5 provavelmente ocorre dentro da
célula acinar uma vez que, a relação entre histatina 3 e a histatina 5 é aproximadamente 1:1
em ambas as secreções glandulares e esta relação é muito pouco afectada pela taxa do
fluxo salivar. As principais histatinas em secreções salivares são as histatinas 1,3 e 5 que
contribuem cada uma com cerca de 80% para a composição total de histatinas presentes
nas secreções glandulares [126, 135] .
Uma variação alélica no gene HIS2 tem sido referida em sujeitos de descendência
africana. O alelo HIS2 (2) codifica um isómero da histatina 3, designado de histatina 3-2
em que a Arg22 é substituída por Gln22. Além disso, a introdução de um codão stop na
histatina 3-2 faz com que seja composta por 27 resíduo em vez de 32 resíduos [139].
A concentração de histatinas em saliva total é muito mais baixa (na gama 50-425
µM [132]) do que em secreções glandulares puras, representando cerca de 2.6% das
proteínas salivares [140, 141]. Estas diferenças de concentrações são provavelmente
devido a elevada actividade proteolítica da saliva total, causando uma degradação rápida
de histatinas quando são libertadas na cavidade oral [128, 142, 143]. Além disso, a
formação de complexos e ligação a tecidos duros e moles orais pode reduzir os níveis
livres de histatina em saliva total [144].
b) Funções
As histatinas participam na cavidade oral na formação da película de esmalte
adquirida e inibidora do crescimento dos cristais de HAP [130, 145, 146]. O domínio
responsável por esta função é o terminal amina das histatinas. Mas observa-se uma clara
Introdução
13
diferença funcional entre a histatina 1 que é fosforilada e a histatina 3 que não é
fosforilada. Siqueira et al. [147] encontraram evidências dada a presença da fosfoserina,
histatinas nativas ou em histatinas sintéticas, apresentam um maior grau de protecção
contra a desmineralização ácida. Esta análise é consistente com os dados de adsorção
anteriores que demonstram que a histatina 1 nativa mostra uma maior afinidade de
adsorção à HAP do que a histatina 1 recombinante sem fosfatos ligados covalentemente na
posição 2 [136]. A protecção com histatinas fosforiladas foi maior do que a observada nas
histatinas não fosforiladas. Sugerindo, assim que as histatinas participam na mineralização
dinâmica do fluido oral que é responsável pela manutenção da integridade da superfície do
esmalte [146, 148, 149].
Existe uma ampla evidência que as histatinas humanas representam um papel
importante na cavidade oral tomando parte no sistema de defesa não imune do hospedeiro
[85, 94, 108]. As histatinas são potentes inibidores in vitro do crescimento e germinação do
fungo patogénico, Candida albicans [132, 150-154]. Os estudos clínicos sugerem que
podem limitar o crescimento da C. albicans e prevenir a candidiasis in vivo [238].
Verificando-se que a histatina 5 é mais eficaz na inibição da C. albicans do que as
histatinas 1 e 3. A estrutura da histatina 5 na região do terminal carboxilo (resíduo 9-24)
com 14 aminoácidos e com uma conformação helicoidal favorece a sua eficácia na inibição
da C. albicans. Também foi detectada a actividade anticandical na histatina 1 de Macaca
fascicularis (M-histatina 1) com uma extensão igual ou maior do que para as histatinas
humanas [153].
As histatinas também exercem actividade anti-fúngica contra Cryptococcus
neoformans [155-158], Saccharomyces cerevisiae e Candida dubliniensi que é susceptível
aos efeitos da histatina 3 [159].
A actividade anti-bacteriana das histatinas foi demonstrada pela inibição do
crescimento do Streptococcus mutans e Streptococcus sangui [143, 160]. Murakami et al.
estudaram a actividade da histatina 5 sobre Porphyrornonas gingivalis, bactéria Gram-
negativa associada à patogénese da doença periodontal [161], e concluíram que inibem a
hemaglutinação de P. gingivalis pela ligação a um componente específico da célula
bacteriana, o que sugere que as histatinas possam ter uma função protectora na prevenção
da colonização dos tecidos orais por P.gingivalis [162-165]. Observaram que existem dois
motivos fundamentais para esta função: a presença de certos aminoácidos como histidina, a
Análise filogenética de péptdos salivares
14
arginina e lisina que são importantes para facilitar esta inibição [164, 166, 167]; e que a
eficácia do péptido pode ser relacionada com o comprimento e com a carga iónica total do
péptido [168]. O essencial para inibição da hemaglutinação foi a presença de aminoácidos
carregados positivamente [166]. Foi colocada a hipótese de que a presença destes péptidos
carregados positivamente pode potenciar uma interacção electrostática inibidora com a
hemaglutina ligando os domínios na superfície da hemácia [164].
Além disso, a histatina, neutraliza os lipopolissacarídeos endotóxicos localizados
na membrana externa das bactérias Gram-negativas, podendo ser uma importante parte do
sistema de defesa do hospedeiro [169] , liga-se aos taninos hidrolisáveis e condensados
formando um complexo que permite neutralizar o seu efeito nocivo [113] e inibe a
libertação de histaminas dos mastócitos, sugerindo um importante papel na inflamação na
cavidade oral [170, 171].
Mais recentemente foi demonstrada uma função específica para histatina 1. Este
péptido apresenta uma actividade na cicatrização de feridas [172]. O domínio que está
minimamente activo para esta função é o fragmento 20-32 da histatina 1.
1.1.3.Estaterinas
a) Características gerais
A estaterina é um péptido salivar secretado por as glândulas parótida,
submandibular e von Ebner’s [129, 173, 174]. A estaterina é codificada por o gene STATH
localizado no cromossoma 4 [175].
Este péptido é constituído por 43 aminoácidos, de baixo peso molecular (5.380) e
com um número elevado de resíduos de tirosina. Além da tirosina, a estaterina também é
rica em prolina e ácido glutâmico. Em dois terços do terminal carboxilo da proteína, estes
aminoácidos aparecem em múltiplas repetições de sequências de di- e tretapéptidos, isto é
4 × Gln-Pro, 3 × Tyr-Gln and 2 × Pro-Tyr-Gln-Pro. Um terço do terminal amina contém
mais resíduos carregados negartivamente do que positivamente, sendo considerado um
péptido salivar ácido (4.2). Os cinco primeiros do terminal amina são resíduos ácidos, um
Introdução
15
resíduo de ácido aspártico, duas fosfoserinas (Ser-2 e Ser 3) e dois resíduos de ácido
glutãmico [176].
A estaterina, como outros péptidos salivares tem isoformas que são formadas pela
clivagem de resíduos do terminal carboxilo [76]. Estas três variantes têm sido identificadas
em secreções submandibular/sublingual [177]. A isoforma SV2, uma variante de splicing
alternativo, falta os resíduos 6-15 codificados pelo exão 4. As variantes SV1 e SV3 são
produtos resultantes da clivagem pós-traducional de estaterina e SV2, respectivamente e
ambas falta o resíduo Phe do terminal carboxilo [178]. Mais recentemente, uma nova
variante de estaterina foi descoberta em saliva total originária da ciclização intramolecular
depois da secreção pela transglutaminase 2 do epitélio oral, ligando Glu37 a Lys6 [179].
As concentrações médias de estaterina em fluidos orais em saliva total é 4.3 µg/mL
e de 95.9 e 73.6 µg/mL em secreções glandulares da parótida e da
submandibular/sublingual, respectivamente [180]. As diferenças de concentrações entre a
saliva total e as secreções glandulares são significantes e apontam para processamento
proteolítico após a secreção de estaterina, favorecendo crescente da sua diversidade
estrutural.
A estaterina foi o primeiro péptido salivar a ser isolado e sequenciado em
humanos [176], mas posteriormente foi encontrada em Macaca fascicularis [181] e
Macaca arctoides [182]. Na análise RT-PCR em RNA do tecido das glândulas salivares de
bovino foi detectado por transcrição do gene do cromossoma 6, a estaterina [183]. Mais
recentemente, foi encontrada a sequência de cDNA codificante de estaterina de porco no
cromossoma 8 e Manconi et al. [184] identificaram e caracterizaram estruturalmente a
estaterina em Sus scrofa ao isolarem dos grânulos da parótida e da saliva.
Análise filogenética de péptdos salivares
16
b) Funções
A polaridade dentro na estrutura das estaterinas com respeito aos domínios
carregados e hidrofóbicos favorece estas proteínas com características funcionais únicas
(Figura 2).
Devido a sua natureza anfipática, estaterina inteira exibe propriedades lubrificantes,
reduzindo as forças fricionais durante a mastigação [185, 186]. As propriedades de ligação
à HAP da estaterina estão associada os seis primeiros resíduos do terminal amina
(DSpSpEEK) bem como a sua capacidade de inibir a precipitação secundária de fosfato de
cálcio (crescimento do cristal). Além disso, a estaterina também inibe a precipitação
primária de fosfato de cálcio (precipitação espontânea), uma propriedade fundamental para
manter saliva sobressaturada com respeito os sais fosfato e cálcio [84, 174, 176, 187-189].
Estas funções são fundamentais para a capacidade da remineralização dos dentes
[176, 190].
Quando adsorvida na superfície do dente, o domínio do terminal carboxilo sofre
umatransição de uma conformação random coil para uma conformação alfa-helicoidal
[191, 192], promovendo a aderência de bactérias orais como Porphyromonas gingivalis
Figura 2 Características estruturais e funcionais da estaterina
Introdução
17
[193-195], Actinomyces viscous [88], Actinomyces naeslundii [196, 197] e Fusobacterium
nucleatum fimbrae [198, 199], que não é possível quando as estaterinas estão solução [200,
201]. Desta forma, a estaterina inibe o crescimento de bactérias na cavidade oral,
contribuindo para a protecção da mucosa oral e tecidos duros. Recentemente, a estaterina
tem sido demonstrada inibir a conversão C. albicans blastoconidia para uma forma de
crescimento mais virulento de hifas [202].
A estaterina pode ter outras funções orais desconhecidas relevantes implicado na
formação da película de esmalte [203] provavelmente tem uma ligação funcional com o
péptido P-B, um péptido salivar rico em prolina com o terminal amina básico cuja função é
desconhecida [24].
1.1.4.Cistatinas
A superfamília das cistatinas é um grupo de proteínas que são inibidores
competitivos reversíveis de duas famílias de proteases de cisteína, a família C1 e a família
C13. As cistatinas encontram-se distribuídas em tecidos e em fluidos corporais [204-206].
Baseado no número de domínios apresentados as cistatinas podem ser divididas em
tipo 1,2 e 3 [207]. Outro sistema de classificação dos inibidores de proteases (peptidases)
coloca as cistatinas na família I25 que contém as subfamílias I25A, B e C. Este sistema de
classificação é baseado por a similaridade da sequência e da estrutura tridimensional da
proteína [208].
Baseados na homologia das sequências, na presença ou ausência de pontes de
dissulfureto e na localização fisiológica, esta superfamília tem sido divida em três famílias
em mamíferos e aves: a família 1 ou estefinas, família 2 ou cistatinas e família 3 ou
quinógeneos [205].
a) Família 1 ou Estefinas
A família 1 ou família das estefinas são proteínas de baixo peso molecular de
aproximadamente 10-11kDa. Em humanos, as estefinas A e B contém cerca de 100
aminoácidos. Têm uma cadeia de polipéptidos sem pontes dissulfureto e sem
carbohidratos[209]. As estefinas são inibidores de proteases intracelulares e seus genes não
codificam o peptídeo sinal [210, 211].
Análise filogenética de péptdos salivares
18
Comparativamente, na família 2, as estefinas diferem por não terem uma região
correspondente à hélice α-2/loop e terem uma extensão de nove aminoácidos no terminal
carboxilo [210].
Foram encontradas estefinas homólogas entre as espécies humana, rato [212],
bovino [213, 214] e porco [215] e algumas plantas [216]. As estefinas encontram-se
distribuídas em tecidos, mas encontram-se em menor concentração em todos os fluidos
humanos. Os genes que codificam a estefina A e estefina B nos humanos são localizados
no cromossoma 3 e cromossoma 21, respectivamente [217].
b) Família 2 ou Cistatinas
As cistatinas são proteínas compostas por 120-125 aminoácidos e tem uma
massa molecular de 13 –14 kDa. São sintentizadas como proproteínas contendo um
péptido sinal que sugere que as cistatinas apresentam uma actividade extracelular
[218]. As cistatinas contém duas pontes de dissulfureto e algumas são glicosiladas.,
contendo péptido sinal e pontes de dissulfureto no terminal carboxilo da molécula.
Alguns membros da família são glicosilados.
As cistatinas humanas da família 2 são codificadas por genes localizados no
cromossoma 20 e no locus 20p11.21 [219] sendo encontradas em tecidos e fluidos
corporais. As cistatinas pertencentes a esta família são as cistatinas S, SA, SN, C, D, E
e F.
c) Família 3 ou Quininógeneo
A terceira família das cistatinas consiste em 3 membros: quininógeneo humano de
elevada massa molecular, cerca de 120KDa; quininógeneo humano de baixa massa
molecular com cerca 68 kDa e quininógeneos T que se encontram apenas presentes em
ratos. Os quininógeneos humanos são glicoproteínas libertadas como proproteínas
contendo um peptídeo sinal com 18 resíduos de aminoácidos[217].
A molécula quininógeneo é dividida em três regiões, a cadeia pesada do terminal
amina, a região quinino no núcleo e a região da cadeia leve do terminal carboxilo.
Introdução
19
A L- quininógeneo é composta por três domínios de cistatina [220]. Nos três
domínios do terminal da cadeia pesada de ou L- quininógeneo, só 2 têm conservado o
motivo QXVXG correspondendo ao local activo das cistatinas. Apenas 2 dos 3 locais dos
quininógeneos são locais funcionais na inibição proteases de cisteína.
Os quininógeneos (família 3) apresentam uma forma mais complexa e encontram-
se no plasma sanguíneo, fluído sinovial e fluído amniótico [221].
1.1.4.1. Filogenética das cistatinas tipo 2
Na análise filogenética de cistatinas é problemática porque as proteínas são muito
pequenas e a origem de das diferentes famílias e subfamílias é antiga, existiu uma
extensiva divergência. Além disso os diferentes ramos parecem ter evoluído em diferentes
taxas.
Ao longo do tempo, os estudos evolutivos e as árvores filogenéticas das cistatinas
têm sido referidos [222-227].Vários esquemas têm sido propostos para a evolução das
diferentes famílias [224].
Um modelo plausível de evolução das cistatinas das cistatina tipo 2 é que as plantas
e animais divergiram de um ancestral comum de que possuía uma cistatina, talvez à volta
de 1.6 bilões de anos. As modernas fitocistatinas potencialmente representam a forma
ancestral de todos os tipos de cistatinas. O α-hélice 2/loop e uma primeira ligação de
dissulfureto adquirido antes da divergência dos nemátodos (cerca 1.2 biliões de anos). Nas
cistatinas tipo 2 está presente no caranguejo-ferradura a segunda ligação dissulfureto e os
aspectos gerais das cistatinas tipo 2 podem ter evoluído antes da divergência de
Protostomia e deuterostómios cerca 1 bilões de anos. Assim, apesar dos dados particulares
destes processos (isto é um argumento considerável), as cistatinas tipo 2 são proteínas
antigas têm mais diversificadas na linhagem dos mamíferos. Nesta família das cistatinas
tipo 2 tem surgindo uma jovem subfamília de cistatinas salivares (cistatinas S, SA, SN e
D) que vai ser descrita de seguida [210].
Análise filogenética de péptdos salivares
20
1.1.4.2. Cistatinas em saliva
As cistatinas S, SA, SN, C e D humanas pertencentes a família 2 da superfamília
das cistatinas são as principais encontradas em secreções glandulares [228-230].
As cistatinas S, SA e SN ou também designadas como cistatinas salivares são
compostas por 121 aminoácidos com uma massa molecular de 14.2-14.4 kDa. As cistatinas
SN, SA e S são codificadas pelos genes CST1, CST2 e CST4, respectivamente. O gene
CST1 codifica apenas a cistatina SN, enquanto o gene CST2 codifica dois alelos, as
cistatinas SA1 e SA2 e o gene CST4 codifica quatro alelos, a cistatina S não fosforilada, e
três isómeros fosforilados que têm sido designados S1 (fosforilada na Ser-3), S2
(difosforilada na Ser-1 e Ser-3) e SAIII (fosforilada na Ser3, Ser99, Ser112, e Ser116)
[231, 232]. Estes isómeros de cistatinas S fosforilados diferem apenas no número e posição
dos grupos fosfatos [228, 232, 233].
A cistatina C é codificada pelo gene CST3 e é composta por 120 aminoácidos com
uma massa molecular de 13.4 kDa [234, 235]. Além da cistatina C, o gene CST3 pode
formar uma variante associada a uma doença autossomal dominante rara (hemorragia
cerebral hereditária com amiloidose tipo Islandês contendo a substituição na posição 68 de
Leu por Gln [236] .
O gene CST5 é responsável pela expressão da cistatina D. A cistatina D é composta
por 122 aminoácidos com uma massa molecular cerca de 13.8 kDa [237, 238]. A proteína
existe em duas formas polimórficas: uma contém um quinto resíduo de cisteína na posição
26 e outra contém na mesma posição um resíduo de arginina [233].
Em todas as isoformas de cistatinas pertencentes à classe tipo 2, os quatro resíduos
de cisteína localizados no meio do terminal carboxilo da cadeia do polipéptido são
altamente conservados e conferem a estrutura secundária específica para estas proteínas
através de pontes de dissulfureto intramoleculares [25].
Ao nível da transcrição é interessante notar que os genes CST2 e CST5 são somente
expressos nas glândulas submandibular e parótida. Os genes CST1 e CST4 não são apenas
expressos pelas glândulas salivares, mas também pelas glândulas lacrimais e glândulas
traqueais, no revestimento do epitélio da vesícula biliar e pelas vesículas seminais [239],
enquanto a CST3 se encontra em elevada concentração em fluidos biológicos como por
exemplo o fluído cerebroespinal, o plasma seminal, o leite, o fluído sinovial e o plasma
Introdução
21
sanguíneo [240], enquanto na saliva humana e nas glândulas submandibular e parótida é
encontrada em menor concentração [221].
Além da cistatina em saliva de humano, também foi encontrada cistatina S de rato
que foi inicialmente identificada como proteína LM (large, mobile) que foi induzida em
saliva seguido o tratamento isoproterenol e mostra ser uma proteína clonada e sequenciada
to [241].
1.1.4.2.1. Função
As principais funções das cistatinas presentes na saliva são a inibição directa de
proteases de cisteína; a actividade anti-viral e anti-bacteriana e um papel na mineralização
na superfície do dente [25].
a) Inibição das proteases de cisteína
Todas as cistatinas são potentes inibidores de proteases de cisteína da família C1
mas só algumas podem inibir as proteases de cisteína da família C13. A família C1 inclui a
papaína e as catepsinas B, H, K, L e S, enquanto a família C13 inclui a legumaína [205,
221, 242, 243].
As propriedades inibidoras das cistatinas sugerem terem um papel fundamental no
controlo da actividade proteolítica de proteases de cisteína lisossomal como as catepsinas
[221, 244, 245]. Os processos proteolíticos resultam na destruição dos tecidos orais
associados a doenças peridontais [246, 247]. Esta destruição pode ser atribuída em parte a
libertação de enzimas proteolíticas por colónias de bactérias tais como Porphyromonas
gingivalis [161].
A estrutura terciária das cistatinas tem sido caracterizada e observou-se que é
conservada e exibe o enovelamento da cistatina (cystatin fold) formado por 5 cadeias de
folha β anti-paralela embrulhado à volta de uma hélice α five-turn [211].
Por estudos realizados utilizando a cristalografia de raio X, mutagénese e
espectroscopia de RMN foram identificadas três regiões em cistatinas que ao longo do
processo da evolução têm sido conservadas. As três regiões incluem um resíduo de glicina
na região do terminal amina, uma sequência elevadamente conservada, QXVXG, que está
envolvida num β-hairpin loop (loop L1) e um segundo β-hairpin loop (loop L2) que
Análise filogenética de péptdos salivares
22
contém um segmento similarmente conservado, PW. Estas regiões conservadas são
implicadas no mecanismo de inibição da papaína, para formar uma estrutura wedge-like
[211, 248, 249].
No estudo de cistatina C recombinante foi demonstrado que a actividade inibidora
da papaína/catepsina e da legumaína são independentes porque a legumaína requere a
presença de um resíduo de aspargina que é localizado em um loop no lado oposto a
superfície de ligação da papaína (Figura 2). Embora a cistatina D tenha um resíduo
aspargina não é possível a inibição da legumaína devido a posição em que está localizado
este resíduo. As cistatinas salivares como falta o resíduo de aspargina nesta região são
inactivos contra a legumaína [250].
Além dos domínios específicos das proteases de cisteína, as cistatinas apresentam
domínios específicos da cadeia polipeptídica que são homólogos com os inibidores de
proteases de serina [251], sugerindo que a fragmentação das cistatinas poderia dar origem a
inibidores para esta classe de enzimas por clivagem ocorrida na cavidade oral.
b) Controlo de mineralização
As cistatinas salivares fosforiladas estão envolvidas na formação de película de
esmalte contribuindo para o processo de remineralização [229, 252, 253]. Foi demonstrado
que as cistatinas salivares fosforiladas ligam-se à HAP. A remoção dos grupos fosfatos
reduz a afinidade das cistatinas a HAP, mas não elimina [254-256].
Figura 3 Representação da estrutura da cistatina de galinha. Estão identificadas na figura as três regiões conservadas G11,QXVXG e PW e as duas pontes de dissulfureto (SS1 é no terminal amina, SS2, é o terminal carboxilo). A região de inibição da legumaína N39 (Leg) está indicada na estrutura.
Introdução
23
As cistatinas salivares também são responsáveis pela inibição da precipitação
secundária de fosfato de cálcio, mas a capacidade de inibição das cistatinas salivares é
cerca de 1/10 comparativamente à estaterina [253].
No modelo molecular da cistatina S identificaram-se duas regiões carregadas
negativamente que poderiam estar potencialmente envolvidas na ligação à HAP [257].
Uma região localiza-se próxima do terminal amina na hélice-α 1 e um péptido tríptico
pertencente a esta região liga-se à HAP. A segunda região foi localizada na hélice-α 2
[257].
c) Actividades anti-microbianas e anti-virais
Tem sido demonstrado que as cistatinas S de rato e humana inibem o crescimento
de P.gingivalis que é associada a com doenças peridontal [210]. A elevada actividade
inibidora da cistatina S humana a P.gingivalis demonstra ter maiores propriedades anti-
microbianas [210, 211].
Uma capacidade geral das cistatinas é a inibir é a replicação viral. A cistatina C
humana foi encontrada bloquear replicação HSV-1 completamente, com uma actividade
comparável com que aciclovir [258]. Embora as proteínas cistatina tipo S também inibam a
replicação HSV-1 não são tão eficazes como cistatina C [210]. A cistatina C é também um
inibidor eficaz da replicação de coronavírus, que pode causar gastroenterite aguda,
ligeiramente acima dos níveis fisiológicos [259]. A cistatina D aos níveis fisiológicos
(0.12-1.9 FM) tem sido encontrada inibir a replicação coronavírus em células pulmonares
[210]. A cistatina de galinha foi mostrada bloquear a replicação do polivírus parcialmente,
embora nem cistatina C humana nem cistatina S de rato tinha um efeito na replicação
polivirus [258]. Colectivamente, estes resultados sugerem que as cistatinas foram
absorvidas por células, onde podem interferir na replicação viral que requere as proteases
de cisteína hospedeiras ou virais, tal como a maturação capsídeo. Contudo, os alvos e
mecanismos de inibição não são conhecidos. Se a inibição viral é uma função das cistatinas
salivares e da cistatina D, o alvo para qual foram seleccionadas é também desconhecido. A
inibição de coronavírus aos níveis fisiológicos é certamente sugestiva. O olho e a cavidade
oral são pontos de entrada para adenovírus. Recentemente, uma mistura de cistatinas
purificadas de lágrimas e saliva (cistatinas S, SA e SN) foi demonstrado inibirem a
Análise filogenética de péptdos salivares
24
adenain, uma protease de cisteína codificada por o genoma adenovírus que é essencial para
infectividade, mas a ligação das cistatinas à adenain é uma ligação muito fraca para um
papel significante para a inibição viral [260]
1.2. Filogenética molecular
1.2.1.Aspectos gerais
A evolução é a mudança das características hereditárias de uma população de uma
geração para outra. Para produzir novas ou alterar características hereditárias são
necessários processos de variação genética como as mutações, duplicação de genes e
transferência horizontal de genes.
A evolução ocorre quando as variações genéticas ocorrem de acordo com
mecanismos não aleatórios como selecção natural ou aleatórios com a derivação genética e
fluxo de genes. As consequências resultantes da evolução são a adaptação, co-evolução,
cooperação, especiação e a extinção.
A evolução molecular é uma área que explica os processos evolutivos das espécies
a partir das alterações ocorridas ao nível dos ácidos nucleicos (DNA e RNA) e proteínas,
diferindo dos seus ancestrais. A partir, dos dados moleculares podemos estabelecer
relações evolutivas entre espécies e construir sua história evolutiva, isto designamos de
filogenia. O principal objectivo dos estudos filogenéticos é levantar hipóteses sobre a
história evolutiva entre organismos. Os estudos filogenéticos têm sido aplicados em
sistemas de classificação biológica que reflectem a evolução dos organismos e permitem
interpretações de diversos processos evolutivos morfológicos, moleculares e
biogeográficos. Com o desenvolvimento das técnicas moleculares, começou-se por
estabelecer relações evolutivas entre organismos por uso de dados moleculares como
sequências de DNA e proteínas, surgindo assim filogenia molecular [261, 262]. A filogenia
molecular é uma das áreas da evolução molecular, que tem como objectivos a reconstrução
das ligações genealógicas correctas entre as entidades biológicas e estimar o tempo de
divergência entre organismos (isto é, o tempo desde a última partilha com um antecessor
comum), e pela ordem cronológica da sequência de acontecimentos ao longo da linhagem
evolutiva [261].
Introdução
25
A história evolutiva é normalmente representada por uma árvore filogenética (ou
dendograma). A árvore filogenética é um diagrama de ramificações que expressa as
relações evolutivas entre os vários organismos ou moléculas tendo em conta, as
similaridades, diferenças nas suas características físicas e/ou genéticas e a ancestralidade
ou parentescos evolutivos entre espécies ou grupo de espécies. Uma árvore filogenética é
um gráfico composto por nós e ramos, em que apenas um ramo liga a alguns nós
adjacentes. Os “nós” são uma bifurcação que representa unidades taxonómicas que podem
ser espécies, populações, indivíduos, ou genes. Os ramos definem as relações entre as
unidades taxonómicas em termos de descendentes e ancestrais. O padrão de ramificação de
uma árvore é chamado a sua topologia. [198].
Os nós podem ser terminais ou internos enquanto os ramos podem ser externos e
internos. Os “nós” terminais representam as unidades taxonómicas existentes sobre
comparação, que são referidas como unidades taxonómicas operacionais (OTUs).
As espécies ou grupo de espécies são designados taxon. Um dos objectivos da
filogenética é estabelecer as relações evolutivas entre diferentes taxas. Em particular,
estamos interessados na identificação de clades naturais (ou grupos monofiléticos). Um
clade é definido como um grupo de todos os taxa que têm sido derivados de um antecessor
comum. Em filogenética molecular é comum usar o termo clade para grupos de
organismos ou genes que incluem o antecessor comum mais recente de todos os membros.
Um grupo taxonómico cujo antecessor comum é partilhado por outro taxon é designado
parafilético.
A análise filogenética consiste em quatro passos: alinhamento das sequências,
determinação do modelo de substituição, construção da árvore e avaliação da árvore.
1.2.1.1. Alinhamento das sequências
O estudo da evolução dos genes e proteínas envolve a comparação de sequências
de DNA e de proteínas homólogas que têm a mesma origem, mas podem ou não partilhar a
mesma actividade. Para comparação das sequências constrói-se alinhamentos de
sequências que apresentam um nível limiar de similaridade na sua totalidade ou em
fragmentos, designado sequências homólogas. A similaridade e a diferença das bases ou
aminoácidos são analisados com o objectivo de inferir as relações estruturais/funcionais e
Análise filogenética de péptdos salivares
26
evolutivas entre as sequências. Os termos similaridade e homologia são distintos. A
similaridade tem uma quantidade evolutiva comum. Quer os genes sejam ou não
homólogos não existe grau para a homologia como existe para a similaridade. As
sequências homólogas têm divergido de uma sequência ancestral através de mudanças
moleculares tais como substituições, inserções e deleções [263]. A similaridade pode ser
expressa em percentagem de identificação enquanto a homologia refere-se à conclusão
extraída dos dados que os genes partilham em termos de história.
Os homólogos podem ser designados de ortólogos, parálogos e xenólogos. Os
ortólogos são homólogos produzidos por especiação. Representam genes derivados de
antecessor comum que divergem devido a divergência de organismos que estão associados
e tendem a ter uma função similar. Os parálogos são produzidos por duplicação do gene.
Representam genes derivados de um gene ancestral comum que duplica dentro de um
organismo e seguidamente diverge e tende a ter funções diferentes. Os xenólogos são
homólogos resultando da transferência horizontal do gene entre dois organismos.. A
função de xenólogos pode ser variável dependendo com a mudança significantiva do gene
movido, mas geralmente, a função tende a ser similar.
Os resultados dos alinhamentos são importantes para a análise de regiões
conservadas dos genes ou que sofreram mutações, bem como, no estudo das estruturas
secundárias de proteínas e na construção de árvores filogenéticas [264].
A ideia central é diminuir as diferenças entre as sequências comparadas após os
deslocamentos. Smith e Waterman [265] idealizaram um algoritmo utilizando técnicas de
programação dinâmica para obter o chamado alinhamento óptimo.
O alinhamento consiste na introdução de espaços designados de gaps,
representados por hífens consecutivos alinhados com letras, que correspondem ao
deslocamento dos segmentos de forma que a maioria dos caracteres sejam idênticos em
alguma posição.
No alinhamento é calculado um valor designado de score que representa o grau de
similaridade entre sequências. Um valor elevado de score pode ser uma boa indicação de
grande similaridade entre sequências mas não implica, que exista uma grande homologia.
Os alinhamentos podem ser simples (entre duas sequências) ou múltiplos (entre
três ou mais sequências). O alinhamento simples abrange o alinhamento global e o
alinhamento local. O alinhamento global tem esta denominação porque as sequências
Introdução
27
envolvidas são consideradas de uma extremidade a outra. Após a inclusão dos espaços
tomam-se as sequências e coloca-se uma sobre a outra de forma que o carácter da primeira
se alinha com um carácter ou espaço da segunda e vice-versa. No alinhamento local, o
objectivo é encontrar e extrair regiões de cada uma das sequências que exibam grande
similaridade.
O alinhamento global é usado para determinar as regiões conservadas entre
sequências homólogas, enquanto o alinhamento local é usado na pesquisa da base de
dados, na comparação de um segmento com uma parte da sequência encontrada na base de
dados e na montagem do genoma [266].
Como anteriormente referido, o alinhamento múltiplo alinha três ou mais
sequências e é utilizado quando a utilização do alinhamento simples não é satisfatório. O
alinhamento múltiplo é o ponto de partida para a previsão da estrutura secundária e
terciária das proteínas, acessibilidade dos resíduos, função e identificação dos resíduos
para esta função.
Para o alinhamento das sequências são utilizadas algumas ferramentas, como o
BLAST (Basic Local Alignment Search Tool) [267] e o CLUSTALW (alinhamento
múltiplo) [268]. O BLAST é baseado no alinhamento local das sequências, isto é, compara
as sequências de nucleotídeos ou proteínas com sequências existentes na base de dados. O
BLAST pode ser usado para inferir as relações funcionais e evolutivas entre sequências
como para identificar taxons [267]. O CLUSTAL W é um programa que tem como
propósito geral o alinhamento múltiplo de sequências de DNA e proteínas. Calcula e
realiza o melhor emparelhamento das sequências seleccionadas alinhando-as de forma que
as suas identidades possam ser notadas [268, 269].
1.2.1.2. Determinação do modelo de substituição
Ao modelo de substituição devia ser dada a mesma ênfase como ao alinhamento e à
construção da árvore. Os modelos de substituição influenciam o alinhamento das
sequências. Nesta tese, o modelo de substituição utilizados é de aminoácidos.
Os modelos de substituição de aminoácidos utilizados são as matrizes PAM e
BLOSSUM. As matrizes PAM e BLOSSUM são utilizadas para aumentar a sensibilidade
Análise filogenética de péptdos salivares
28
dos alinhamentos fracos quando comparamos as sequências. É conhecido que certos
aminoácidos podem ser facilmente substituídos por outros em proteínas relacionadas,
A primeira matriz a ter uma utilização generalizada foi a matriz PAM [270]. A
matriz PAM é uma unidade de divergência evolutiva em que 1% dos aminoácidos das
sequências foram alterados. Este método não implica que depois de 100 PAMs todos os
aminoácidos sejam diferentes. Quando as sequências alinhadas são elevadamente
divergentes, melhoram-se os resultados quando se utiliza uma matriz PAM com um valor
mais elevado, tal como PAM200 ou PAM250. As matrizes PAM com um valor mais baixo
podem ser usadas se as sequências têm um maior grau de similaridade [271]. A matriz
BLOSUM foi construída de forma similar, mas usa uma estratégia diferente para estimar as
frequências alvo [272]. Os dados são derivados da base de dados BLOCKS [273], que
contêm alinhamentos múltiplos locais (‘‘blocks’’) envolvendo sequências divergentes.
Embora não exista um modelo evolutivo neste caso, é vantajoso ter os dados gerados por
observação directa, em vez de por extrapolação. Como na matriz PAM, existe uma série
numerada de matrizes BLOSUM, mas o número neste caso refere-se ao nível máximo de
identificação que as sequências podem ter e ainda contribuir independentemente do
modelo. As matrizes de substituição têm sido construídas usando cortes mais elevados (até
BLOSUM90) para comparar sequências muito similares e cortes mais baixos (até
BLOSUM30) para sequências elevadamente divergentes.
A utilização da matriz PAM ou da matriz BLOSSUM depende do grau de
similaridade da sequência das proteínas.
Introdução
29
1.2.1.3. Construção da árvore
Neighbor-Joining (NJ)
O algoritmo neighbor-joining [274] é normalmente aplicado na construção da
árvore de distância, independentemente do critério de optimização. A construção da árvore
é a partir de uma árvore-estrela através da introdução de ramos sucessivos entre um par
mais próximo de vizinhos e os restantes terminais da árvore. O par vizinho mais próximo é
em seguida consolidado, de forma eficaz reforma uma árvore estrela e o processo é
repetido. O método é relativamente rápido.
1.2.1.4. Avaliação da árvore
Os vários procedimentos estão disponíveis para avaliar o sinal filogenético nos
dados e a robustez das árvores [262, 275]. O teste utilizado nesta dissertação foi o
bootstrap. O bootstrap é um método de avaliação da reamostragem da árvore que trabalha
com os métodos de distância, parcimónia, probabilidade e outro qualquer método de
derivação da árvore. Foi inventando por Efron em 1979 [276] e apresentado como método
de avaliação da análise da árvore filogenética por Felsenstein [277]. O resultado da análise
de bootstrap é um número associado a um determinado ramo da árvore filogenética que dá
a proporção de repetições que suporta a monofilia do clado.
O bootstrapping pode ser considerado um processo com duas etapas que
compreende a geração de novos conjuntos de dados a partir do conjunto original e o
cálculo do número de vezes que um ramo particular apareceu na árvore. Esse número é
Figura 4 Representação da formação da árvore pelo método neighbor-joining
Análise filogenética de péptdos salivares
30
normalmente referido como o valor de bootstrap. O novo conjunto de dados é criado a
partir do conjunto de dados originais por amostragem de colunas de caracteres aleatórios
por um conjunto de dados originais com substituição. O “com substituição” significa que
cada local pode ser utilizado na geração aleatória de dados com a mesma probabilidade
como qualquer um dos outros sites. Como consequência, cada conjunto de dados recém-
criados tem o mesmo número de posições em aberto como o conjunto de dados originais,
mas algumas posições são duplicadas ou triplicadas e outras estão desaparecidas. Assim, é
possível que alguns dos conjuntos de dados recém-criados sejam completamente idênticos
ao conjunto original ou, noutro extremo, que apenas um dos sites seja replicado, digamos,
500 vezes, enquanto as restantes 499 posições no conjunto de dados originais são
ignorados.
Embora se tenha tornado prática comum incluir bootstrapping como parte de uma
análise filogenética completa, há alguma discussão sobre o que exactamente é medido por
este método. Foi originalmente sugerido que o valor de bootstrap é uma medida de
repetibilidade [277]. Em interpretações mais recentes, tem sido considerada ser uma
medida de precisão, um parâmetro biologicamente mais relevante que dá a probabilidade
para que a filogenia verdadeira tenha sido recuperada. Com base nos estudos de simulação,
tem sido sugerido que, em condições favoráveis (taxas praticamente iguais de mudança,
ramos simétricos), valores bootstrap maiores que 70 % correspondem a uma probabilidade
de mais de 95 % de que a filogenia verdadeira foi encontrada [278].
O bootstrapping pode ser usado em experiências em que as árvores são aferidas
após a eliminação dos ramos internos um a um. Os resultados fornecem informações
sobre as ordens de ramificação que são ambíguas no completo conjunto de dados.
1.3. Objectivo
Nesta dissertação, o principal objectivo é encontrar novos péptidos em mamíferos,
homólogos com péptidos salivares encontrados em humanos com ajuda de ferramentas
filogenéticas, como o BLAST, múltiplo alinhamento, construção e avaliação de uma árvore
filogenética perceber a origem, a evolução e função destas novas espécies. Outro objectivo
deste trabalho, é comparar as sequências encontradas por análise filogenética com os
péptidos encontrados na análise de saliva de quatro mamíferos: Oryctolagus cuniculus,
Canis familiaris, Rattus novergicus e Ovis aries..
31
22.. MMaatteerriiaall ee mmééttooddooss
Material e métodos
33
2.1. Análise Filogenética
a) Recolha dos dados
As sequências das proteína salivares foram obtidas nas bases de dados National
Center for Biotechnology Information (NCBI) http://www.ncbi.nlm.nih.gov, Ensembl
http://www.ensembl.org e UNIPROT http://www.uniprot.org/. Para encontrar sequências
similares a família das estaterinas/histatinas, PRPs e cistatinas utilizou-se o programa
BLASTP, a matriz de substituição BLOSUM62 [272], com um threshold de 10 na busca
das sequências das histatinas/ estaterina e um threshold de 10-5 na busca das sequências das
restantes famílias de uma base de dados não redundante.
b) Alinhamento das sequências
As sequências de aminoácidos foram alinhadas com CLUSTAL W, usando uma
série de matrizes BLOSUM 62, manualmente editada por BioEdit versão 7.0.5 [268]. Os
resíduos conservados foram determinados manualmente.
c) Construção e avaliação da árvore
A construção da árvore filogenética foi realizada usando o método neighbor-
joining (NJ) [211]. O nível de confiança atribuída nos diferentes ramos é determinado por
replicações de bootstrap de 1000 [277]. As distâncias evolutivas foram calculadas usando o
método de correcção de Poisson e estão nas unidades do número de substituições de
aminoácidos por site. Todas as posições ambíguas foram eliminadas para cada par de
sequências. A análise filogenética foi realizada usando a plataforma de análise MEGA
versão 5.05 [279].
Análise filogenética de péptidos salivares
34
2.2. Análise da saliva
a) Colecta e preparação de amostras de saliva
A saliva utilizada neste estudo foi colectada dos seguintes animais: coelho
selvagem (Oryctolagus cuniculus), cão (Canis familiaris), ovelha (Ovis aries) e rato
(Rattus novergicus). No caso da ovelha, coelho e cão a saliva foi colectada com auxílio de
Salivette®. A Salivette® foi colocada na boca dos animais durante 20 minutos sendo
posteriormente centrifugada a 3000g durante 10 minutos. O sobrenadante obtido foi
recolhido para análise. No caso da saliva recolhida de rato, procedeu-se à estimulação com
pilocarpina. Neste caso, administrou-se via intra-peritoneal uma dose de 100 µM de
pilocarpina. Após um intervalo de 5 minutos começou-se a recolher a saliva com o auxílio
de uma micropipeta. A saliva foi posteriormente processada de igual forma que os
sobrenadantes obtidos da Salivette®.
Considerando que o objectivo deste trabalho incidia sobre a análise de péptidos
salivares, procedeu-se então à acidificação da amostra com ácido trifluoroacético (TFA,
0,2%) na proporção de 1: 1 entre amostra e ácido. Após a incubação no gelo durante 5
minutos, as amostras forma centrifugadas a 8000g durante 10 minutos (4ºC). Recolheu-se
o sobrenadante e procedeu-se à determinação da concentração de proteína total com o
método colorimétrico “DC protein assay” da BioRad. Os valores de densidade óptica
foram determinados a 750nm num leitor de placas MultiskanGo (Thermo).
Simultaneamente foi efectuada uma curva de calibração utilizando-se para o efeito padrões
de albumina sérica bovina (BSA) a diferentes concentrações.
b) Digestão enzimática e separação de péptidos por Nano-HPLC
Após a quantificação, 20 µg de cada uma das amostras obtidas foram
neutralizadas com adição de hidrogenocarbonato de amónio (50mM) e digeridas com
tripsina (Promega) na proporção de 1: 20. A digestão ocorreu durante toda a noite a 37ºC.
Após a incubação, a reacção foi terminada pela adição de TFA para uma concentração
Material e métodos
35
final de 0,1%. A separação dos péptidos obtidos foi realizada por nano-HPLC utlizando o
módulo de separação Ultimate 3000 (Dionex) com uma coluna capilar (C18, Pepmap 100;
0,75um de diâmetro interno, 15 cm de comprimento). Foram injectadas 2ug de proteína
total de cada amostra e a separação foi realizada com um gradiente linear de 95% de
solvente A (constituído pro 95% de água, 5 % de acetonitrilo e 0,05% de TFA), 5% de
solvente B (contituido por 85% de acetonitrilo, 15% de água e 0,045% de TFA) até 55% de
solvente B, 45% solvente A com um fluxo de 300nL/min.
Os péptidos depois de eluídos da coluna capilar nanolítica foram aplicados
directamente numa placa de MALDI em fracções de 20 segundos, utilizando para isso um
colector automático de fracções Probot (Lc Packings) com adição de 270nL de matriz
constituída por 12mg de ácido alfa-ciano-4-hidroxicinâmico, 70% acetonirilo, 30% de
água, 0,1% TFA e padrão interno (péptido Glu-Fib 15fM).
c) Análise por espectrometria de massa e processamento de dados
Os espectros de massa foram adquiridos num espectrómetro de massa MALDI-
TOF/TOF (4800 ABSciex) com o reflectrão em modo positivo e obtidos no intervalo de
m/z entre 700-4500Da. Para espectrometria de massa tandem, os 15 iões com sinal mais
intenso de cada fracção foram seleccionados automaticamente e submetidos à
fragmentação com ar.
Os espectros de massa obtidos foram processados e analisados com o auxílio do
software “Global Protein Server Workstation” (Applied Biosystems) e Mascot (v2.1.1
Matrix Science Ltd). As sequências obtidas da análise filogenética foram incorporadas
numa base de dados interna para a identificação de proteínas das amostras de saliva.
Assim, Os espectros obtidos foram importados para a GPS e a pesquisa no Mascot utilizou
os seguintes critérios: 30ppm de desvio para o ião precursor, 0.3Da para os iões fragmento,
com e sem digestão com tripsina, 2 clivagens perdidas. A identificação de cada péptido foi
positiva quando o Mascot score foi superior a 35 (p<0.05) e um grau de confiança acima
de 95%.
37
33.. RReessuullttaaddooss
Resultados
39
3. Resultados
3.1. Análise Filogenética
As sequências das proteínas salivares foram recolhidas da Uniprot, NCBI e do
Ensemble. De seguida, procedeu-se ao alinhamento das sequências de cada família de
proteínas usando o ClustalW. As sequências foram alinhadas em função das respectivas
famílias: histatinas/estaterina, família das PRPs e família das cistatinas e procedeu-se à
reconstrução da árvore filogenética com o método de neighbor-joining usando a
plataforma de análise MEGA versão 5.0.5. Para a construção da árvore foram considerados
apenas os valores de bootstrap iguais ou superiores a 50.
a) Proteínas ricas em prolina
Na colecta das sequências das PRPs usando uma base de dados distinta, foram
detectadas 140 sequências de PRPs de Primatas (Homo sapiens, Pan troglodytes,
nomascus leucogenys, Macaca fascicularis, Macaca mulatta, Pongo abeii, Gorilla gorilla,
Microcebus murinus, e Callithrix jachus), Roedores (Mus musculus, Rattus novergicus e
Mesocricetus auratus) Carnívoros (Canis familiaris e Ailuropoda melanoleuca),
Artiodáctilos (Bos taurus, Sus scrofa), Lagomorfos (Oryctolagus cuniculus) Quiropteras
(Pteropus vampyrus) , Didelphimorphia (Monodelphis domestica) (Figura 10, em Anexo)..
Destas sequências de PRPs detectadas, algumas já foram previamente isoladas e
caracterizadas na saliva e glândulas salivares de algumas espécies como Homo sapiens
[49], Rattus novergicus, Mus musculus [60], Macaca fascicularis [181], Oryctolagus
cuniculus [280] , Mesocricetus auratus [69] e Sus scrofa [70, 281] (Figura 10, em Anexo).
No alinhamento destas sequências observa-se uma maior conservação na região do péptido
sinal e na região repeat
Na árvore filogenética observa-se a clara separação da árvore em quatro ramos
principais as PRPs ácidas e PRPs básicas dos Primatas, as PRPs dos roedores e as PRPs
básica de Porco. No ramo das PRPs ácidas e básicas dos Primatas são detectadas além das
PRPs presentes em Homo sapiens e Macaca fascicularis já detectadas anteriormente em
Análise filogenética de péptidos salivares
40
saliva são detectadas em outros primatas. Também se observa a presença de possível PRPs
de Monodelphis domestica, Canis familiaris e Ailuropoda melanoleuca.
b) Estaterina e Histatina
Nas sequências recolhidas foram alinhadas 49 que inclui sequências de
estaterina, histaterinas , histatinas e proteínas hipotéticas a pertencerem a esta família.. As
sequências das histatinas identificadas pertencem só a primatas, enquanto as sequências de
estaterina foram encontradas nos primatas e em Bos taurus, Sus scrofa. As histaterinas
foram identificadas em Bos taurus. Também foram encontradas péptidos de Canis
familiaris e Rattus novergicus. No alinhamento de todas as sequências observa-se
principalmente a conservação dos cinco primeiros aminoácidos do terminal amina e no
terminal carboxilo a conservação do resíduo de tirosina (Figura 5).
Como se pode verificar pela figura 8, a árvore divide-se principalmente em dois
ramos: num dos ramos está presente a família das histatinas e noutro ramo está presente a
família das estaterinas. No ramo das estaterinas, as sequências estão agrupadas de acordo
com a ordem que pertence cada espécie (Primatas, Artiodáctilos e Carnívoros).
Este ramo é composto por Primatas (Callithrix jacchus, Gorilla gorilla gorilla,
Homo sapiens, Macaca arctoide, Macaca fascicularis, Macaca mulatta, Nomascus
leucogenys, Pan troglodytes Pongo abelii), Artiodáctilos (Bos taurus, e Sus scrofa) e os
péptidos de Canis familiaris que tem o ancestral comum com as restantes estaterinas.
As histaterinas estão incorporadas na família das estaterinas com um valor de
bootstrap de 100%.
De salientar, as sequências de Canis familiaris, estas apresentaram maior
homologia com a estaterina de S. scrofa e Bos taurus.
Sugere-se que dado agrupamento no ramo das estaterinas daquelas proteínas
hipotéticas de Canis familairis, estas pertençam à família das estaterinas. Nos ramos das
histatinas só estão agrupados sequências de Primatas com um valor de boostrap de 77%,
em que estão identificadas a histatina 1 e histatina 3 em todos os primatas identificados.
41
Fig
ura
5 R
epre
sen
taçã
o d
as s
equ
ênci
as a
lin
had
as d
e es
tate
rin
a e
his
tati
na
por
sof
twar
e C
lust
alW
. A
zon
a so
mbr
eada
a p
reto
são
os
amin
oáci
dos
idên
tico
s en
quan
to a
zon
a so
mbr
eada
a
cinz
ento
ide
ntif
ica
subs
titu
içõe
s co
nser
vada
s. A
s se
quên
cias
ide
ntif
icad
as d
e es
tate
rina
de
Bos
tau
rus
(ST
AT
BO
VIN
), C
alli
thri
x ja
cchu
s (
Unc
hara
ct F
7HQ
I8;
Unc
hara
ct F
7HQ
R7)
, C
anis
fa
mil
iari
s, G
oril
la g
oril
la g
oril
la (
Unc
hara
ct G
3SG
71),
Hom
o sa
pien
s (
ST
AT
_HU
MA
N; S
TA
T is
ofC
RA
_c),
Mac
aca
arct
oide
(S
TA
T M
AC
AR
), M
acac
a fa
scic
ular
is (
ST
AT
MA
CF
A),
Mac
aca
mul
atta
(S
TA
TH
MA
CM
U),
Nom
ascu
s le
ucog
enys
(U
ncha
ract
G1R
7Y6)
, P
an t
rogl
odyt
es (
EN
SP
TR
P00
0000
2772
3; E
NS
PT
RP
0000
0053
497)
, P
ongo
pyg
mae
us (
EN
SP
PY
P00
0000
1652
1) e
S
us s
crof
a (S
TA
T P
IG).
As
sequ
ênci
as i
dent
ific
adas
de
hist
atin
as d
e C
hlor
oceb
us a
ethi
ops
(CO
LR
B4
CH
LA
E,
hist
atin
a 1;
CO
LR
B7
CH
LA
E, h
ista
tina
3),
Gor
illa
gor
illa
(C
OL
RB
0_9P
RIM
, hi
stat
ina
1,;C
OL
RB
5_9P
RIM
, hi
stat
ina
3,),
H
omo
sapi
ens
(HIS
1_H
UM
AN
, hi
stat
ina
1;
HIS
3_H
UM
AN
, hi
stat
ina
3,),
N
omas
cus
leuc
ogen
ys
(CO
LR
B2_
NO
ML
E,
hist
atin
a 1,
A
CN
8834
0;C
OL
RB
6_N
OM
LE
, hi
stat
ina
3, H
IS3-
LIK
E N
OM
LE
; L
OC
1005
9018
4 N
OM
LE
),M
acac
a fa
scic
ular
is (
HIS
1_M
AC
FA
e C
OL
RB
1_M
AC
FA
, hi
stat
ina
1; C
OL
RB
9_M
AC
FA
, hi
stat
ina
3),
Pan
tr
oglo
dyte
s (E
NS
PT
RP
0000
0027
724,
hi
stat
ina
1;
EN
SP
TR
P00
0000
5349
8 hi
stat
ina
3,),
P
ongo
ab
elii
(
HIS
3 L
IKE
P
ON
AB
, hi
stat
ina
3-l
ike;
hist
atin
a 1,
EN
SP
PY
P00
0000
1652
3;hi
stat
ina
3, E
NS
PP
YP
0000
0016
522)
,Tra
chyp
ithe
cus
cris
tatu
s(C
OL
RB
3_T
RA
CR
, hi
stat
ina
1;C
OL
RB
8_ T
RA
CR
, hi
stat
ina
3).
Out
ras
seq
uênc
ias
iden
tifi
cada
s sã
o as
his
tath
erin
de
Bos
tau
rus
(C6K
GD
8_B
OV
, C
6KG
D7_
BO
V,
C6K
GD
9_B
OV
IN
corr
espo
nde)
e a
s pr
oteí
nas
hipo
téti
cas
de C
anis
fam
ilia
ris
( X
P_8
4868
7 C
AN
FA
, X
P_8
6219
6 C
AN
FA
, X
P_8
6205
9 C
AN
FA
, X
P_8
6196
9 C
AN
FA
, X
P_8
6214
4 C
AN
FA
, X
P_8
6216
8 C
AN
FA
, X
P_8
5682
6 C
AN
FA
, X
P_8
5686
8 C
AN
FA
, X
P_0
0343
1878
CA
NF
A)
e de
Rat
tus
nove
rgic
us
(Th
eob
rom
ine
ind
uce
d R
AT
)
Análise filogenética de péptidos salivares
42
a) Cistatinas
Na colecta dos dados de cistatinas foram identificadas 68 sequências abrangendo
diferentes tipos de cistatinas de várias espécies de mamíferos estando incluídas as
cistatinas tipo S, as cistatinas D, cistatinas C e cistatinas 10.
Nas sequências identificadas das cistatina tipo S estão presentes não só em
humanos bem como em outros primatas, bem como as cistatinas D. As cistatinas 10 foram
identificadas só em roedores e as cistatinas C foram identificadas em várias espécies.
Estas sequências foram alinhadas e observou-se a conservação de três regiões das
cistatinas salivares e das cistatinas C e D em todas as espécies do resíduo de glicina no
terminal N, do motivo QXVXG que está contido no loop L1 e da sequência PW inserida
no loop L2 do terminal C. As cistatinas 10, não apresentam a conservação do resíduo de
glicina nem do motivo QXVXG, mas conservam a sequência PW.
No alinhamento das sequências como acima referido, observa-se em todas as
sequências a conservação de três motivos (G, QXVXG e PW) comuns às espécies:
Ailuropoda melanoleuca (AILME), Bos taurus (BOVIN), Callithrix jacchus (CALJA),
Cavia porcellus (CAVPO), Cricetulus griseus (CRIGR), Dasypus novemcinctus (DASNO),
Dipodomys ordii (DIPOR), Echinops telfairi (ECHTE), Equus caballus (HORSE),
Erinaceus europaeus (ERIEU), Felis catus (FELCA), Gorilla gorilla (GORGO), Homo
sapiens (HUMAN), Loxodonta africana (LOXAF), Macaca mulatta (MACMU),
Microcebus murinus (MICMU), Mus musculus (MOUSE), Myotis lucifugus (MYOLU),
Nomascus leucogenys (NOMLE), Oryctolagus cuniculus (RABIT), Otolemur garnetii
(OTOGA), Pan troglodytes (PANTR), Pongo abelii ( PONAB), Pteropus vampyrus
(PTEVA), Rattus novergicus (RAT), Saimiri sciureus (SAISC), Sarcophilus harrisii
(SARHA) e Sus Scrofa (PIG (Figura 6)).
Res
ulta
dos 43
Fig
ure
6 A
lin
ham
ento
das
seq
uên
cias
das
cis
tati
nas
p
or s
oftw
are
Clu
stal
W.
As
seq
uên
cias
id
enti
fica
das
per
ten
cem
as
segu
inte
s es
péc
ies:
Ail
uro
po
da
mel
an
ole
uca
(AIL
ME
), B
os
tau
rus
(BO
VIN
), C
all
ith
rix
ja
cch
us
(CA
LJ
A),
Ca
via
po
rcell
us
(CA
VP
O),
Cri
cetu
lus
gri
seu
s (C
RIG
R),
Da
syp
us
no
vem
cin
ctu
s (D
AS
NO
), D
ipo
dom
ys o
rdii
(DIP
OR
), E
ch
ino
ps
telf
air
i (E
CH
TE
), E
qu
us
cab
all
us
(HO
RS
E),
Eri
na
ceu
s eu
rop
aeu
s (E
RIE
U),
Fel
is c
atu
s (F
EL
CA
), G
ori
lla
go
rill
a (
GO
RG
O),
Hom
o s
ap
ien
s (H
UM
AN
),
Lo
xo
do
nta
afr
ica
na
(L
OX
AF
), M
aca
ca m
ula
tta
(M
AC
MU
), M
icro
ceb
us
mu
rin
us
(MIC
MU
), M
us
mu
scu
lus
(MO
US
E),
Myo
tis
luci
fug
us
(MY
OL
U),
N
om
asc
us
leu
cog
enys
(NO
ML
E),
O
ryct
ola
gu
s cu
nic
ulu
s (R
AB
IT),
O
tole
mu
r g
arn
etii
(O
TO
GA
), P
an
tr
og
lod
ytes
(
PA
NT
R),
P
on
go
a
bel
ii (
PO
NA
B),
P
tero
pu
s va
mp
yru
s (P
TE
VA
), R
att
us
no
verg
icu
s (R
AT
), S
aim
iri
sciu
reu
s (S
AIS
C),
Sa
rco
ph
ilu
s h
arr
isii
(S
AR
HA
) e
Su
s S
cro
fa (
PIG
).
´
Análise filogenética de péptidos salivares
44
A partir das sequências alinhadas de cistatinas, procedeu-se a construção da árvore
filogenética em que se observa a separação em quatro tipos de cistatinas: a cistatina C, as
cistatinas tipo S, a cistatina D e a cistatina 10.
As cistatinas tipo S ou cistatinas salivares de primatas encontram-se agrupadas
com um valor de bootstrap de 99%. As cistatinas D de primatas formam um clade
monofilético com as cistatinas salivares com valor de bootstrap de 99 %. Esta árvore
também mostra as cistatinas salivares e D tem um ancestral comum com a cistatina C.
Nesta árvore a cistatina S de rato, não se encontra agrupada com as cistatinas
salivares humanas.
Resultados
45
3.2. Análise da saliva
A análise de saliva das quatro espécies: coelho selvagem (Oryctolagus cuniculus),
cão (Canis familiaris), ovelha (Ovis aries) e rato (Rattus novergicus) consistiu na colecta
da saliva com uso com auxílio de Salivette®, em todas as espécies excepto no rato. No
caso do rato, procedeu-se a estimulação da saliva com uso de pilocarpina, tendo sido
depois recolhida a saliva com o auxílio de uma micropipeta. Da saliva recolhida em todos
animais, procedeu-se a sua centrifugação e o sobrenadante foi acidificado com TFA, para
efectuar a análise dos péptidos salivares. Depois procedeu-se a incubação e nova
centrifugação das amostras e o sobrenadante foi recolhido para determinação da proteína
total pelo método colorimétrico “DC protein assay” da BioRad.
Após a quantificação de proteína total em cada a amostra procedeu-se a digestão
com tripsina. Efectuou-se posteriormente, a separação dos péptidos das amostras por nano-
HPLC. Os péptidos eluídos da coluna capilar nanolítica foram aplicados directamente
numa placa de MALDI.
Os espectros de massa obtidos no MALDI foram processados e analisados com o
auxílio do software “Global Protein Server Workstation” (Applied Biosystems) e Mascot
(v2.1.1 Matrix Science Ltd). As sequências obtidas da análise filogenética foram
incorporadas numa base de dados interna para a identificação de proteínas das amostras de
saliva.
Na análise dos espectros de massa obtidos foram apenas encontrados em Canis
familiaris, Rattus novergicus e Ovis aries, as sequências obtidas da análise filogenética
(Tabela 1).
Destas sequências identificadas pertenciam somente a duas famílias as PRPs e
estaterina. Na saliva de Canis familiaris foram identificados fragmentos homólogos de
Monodelphis domestica (ENSMODP00000002977), de Oryctolagus cuniculus (G1SNU9),
pertencente a família das PRPs e dois péptidos de Canis familiaris pertencentes a família
da estaterina. Na saliva de Rattus novergicus, foram identificados fragmentos de péptidos
homólogos de Rattus novergicus (F1LMA2,P01065, E9PU40). Na saliva de Ovis aries
foram identificados vários fragmentos da sequência Oryctolagus cuniculus (G1SNU9)
pertencentes a família das PRPs.
Aná
lise
fil
ogen
étic
a de
pép
tido
s sa
liva
res
46
Tab
ela
1 R
epre
sen
taçã
o d
os p
épti
dos
sal
ivar
es e
nco
ntr
ados
por
an
ális
e d
a sa
liva
de
Ca
nis
fa
mil
iari
s, O
vis
ari
es e
Ra
ttu
s n
ove
rgic
us
Sal
iva
Org
anis
mo
Ace
sso
Fam
ília
Nom
e T
otal
Ion
S
core
T
otal
Io
n
Sco
re
C.I
. %
Pes
o m
olec
ula
r S
equ
ênci
a P
osiç
ão
inic
ial
Pos
ição
fi
nal
Io
n
Sco
re
Ion
S
core
C
.I.
%
Can
is
fam
ilia
ris
Can
is
fam
ilia
ris
XP
_856
868
Sta
ther
in
PR
ED
ICT
ED
: st
athe
rin-
like
is
ofor
m 3
262,
7477
722
10
0 70
69,4
8
SS
EE
RY
PR
21
28
43
,63
99,3
9
100
PP
VY
PY
PA
PA
QY
PP
SS
45
60
66,7
7 99
,997
Can
is
fam
ilia
ris
XP
_862
144
Sta
ther
in
PR
ED
ICT
ED
: st
athe
rin-
like
is
ofor
m 2
250,
0956
726
100
7674
,72
V
YP
YN
AP
EQ
YP
PS
S
52
65
46,9
4 99
,715
100
YP
YN
AP
EQ
YP
PS
S
53
65
71,8
99
,999
Mon
odel
phis
do
mes
tica
E
NS
MO
DP
0000
0002
977
PR
Ps
74
,586
7385
9 10
0 21
895,
03
LP
PP
PP
GN
SQ
GT
S
171
183
38,7
6 98
,127
Ory
ctol
agus
cu
nicu
lus
G1S
NU
9 P
RP
s U
ncha
ravc
teri
zed
prot
ein
259,
2079
773
100
1235
1,88
F
QG
NR
PQ
GP
PQ
GQ
PP
Q
109
124
41,9
1 99
,093
Rat
tus
norv
egic
us
Rat
tus
norv
egic
us
F1L
MA
2 P
RP
s U
ncha
ract
eriz
ed
prot
ein
107,
8901
138
100
2096
9,83
984
PQ
GP
PP
QG
GP
R
131
143
74,4
899
100
Rat
tus
norv
egic
us
P10
165
PR
Ps
Pro
line
-ric
h pr
oteo
glyc
an 2
29
6,19
9371
3 10
0 30
007,
5800
8 S
PQ
GP
PP
PG
GP
R
114
127
75,0
299
100
Rat
tus
norv
egic
us
E9P
U40
P
RP
s U
ncha
ract
eriz
ed
prot
ein
343,
4589
233
100
2421
1,27
93
PQ
GP
PP
PG
GP
R
74
86
82,3
600
100
100
PQ
GP
PP
PG
GP
RP
Q
74
88
63,9
199
99,9
94
Res
ulta
dos 47
Sal
iva
Org
ansm
o A
cess
o F
amíl
ia
Nom
e T
otal
Ion
S
core
Tot
al
Ion
S
core
C
.I. %
Pes
o m
olec
ula
r S
equ
ênci
a P
osiç
ão
inic
ial
Pos
ição
fi
nal
Io
n
Sco
re
Ion
S
core
C
.I.
%
Ovi
s
ari
es
Ory
ctol
agus
cun
icul
us
G1S
NU
9 P
RP
s U
ncha
ract
eriz
ed
prot
ein
1287
,642
09
100
1235
1,87
988
RG
GP
QG
GP
QG
GP
GG
PQ
40
57
42
,75
99,2
95
100
1235
1,87
988
QG
GP
QG
GP
GG
PQ
GG
PQ
QG
GP
QG
GP
R
44
72
49,7
2 99
,858
100
1235
1,87
988
GG
PQ
GG
PQ
QG
GP
QG
GP
GG
PQ
GG
PQ
QR
45
72
73
,43
99,9
99
100
1235
1,87
988
GG
PQ
QG
GP
QG
GP
GG
PQ
GG
PQ
QR
49
72
34
,8
95,6
06
100
1235
1,87
988
GP
GG
PQ
GG
PQ
QG
GP
QG
GP
R
50
72
77,9
4 10
0
100
1235
1,87
988
QG
GP
QG
GP
GG
PQ
GG
PQ
QR
GP
53
74
47
,14
99,7
44
100
1235
1,87
988
GP
GG
PQ
GG
PQ
QR
59
72
44
,89
99,5
7 10
0 12
351,
8798
8 G
GP
GG
PQ
QG
PQ
SR
94
10
8 62
,96
99,9
93
Tab
ela
1 R
epre
sen
taçã
o d
os p
épti
dos
sal
ivar
es e
nco
ntr
ados
por
an
ális
e d
a sa
liva
de
Ca
nis
fa
mil
iari
s, O
vis
ari
es e
Ra
ttu
s n
ove
rgic
us
(Con
tin
uaç
ão)
49
44.. DDiissccuussssããoo
Discussão
51
4.1. PPRRPPss
As sequências das PRPs têm sido divididas em quatro regiões: o péptido sinal, a região
de transição, a região repetida e a região do terminal carboxilo.
No alinhamento das sequências por Clustal W, verificou-se uma maior
similaridade no alinhamento do péptido sinal entre as PRPs dos primatas, dos roedores, do
Bos taurus Pteropus vampyrus e de Sus scrofa.
Na comparação das PRPs humanas com os primatas observa-se uma maior
similaridade. Num estudo que comparou a PRP1 e a PRP de Macaca fascicularis
observou-se que 11 dos 12 primeiros resíduos são idênticos. Estas duas sequências
apresentam 57% de homologia [65]. A MnP4 da Macaca fascicularis apresenta maior
similaridade com as PRPs básicas humanas, principalmente com a PRB1 e PRB2.
As três sequências de cDNA precursores das proteínas de porco Q95JC9,
Q95JC9-2, Q95JC9-3 que são compostos por 660, 550 e 495 aminoácidos,
respectivamente, são responsáveis pela geração de pequenos péptidos correspondendo aos
resíduos do terminal amina 1-56 das sequências Q95JC9-2 e Q95JC9-3 (designado por
peptídeo PRP-SP-A) e 43 sequências repetidas designadas por peptídeo PRP-SPB. Bem
como, as PRPs ácidas humanas são fosforiladas nas posições Ser8 e Ser22 [29, 54], a PRP
de porco é fosforilada nas Ser12 e Ser14 [71].
O péptido SP-A de porco partilha com as PRPs ácidas de Rattus novergicus
(P04474) e Homo sapiens (P02810, Q16378) e a similaridade pertence à sequência
localizada entre as regiões ácida e básica das proteínas. O péptido SP-B partilha a sua
sequência com as PRPs de Mus musculus da parótida salivar, tendo uma sequência comum
GPPP [71].
A diferença relevante entre sequências conhecidas de PRP de porco e as PRPs
humanas, Mus musculus e Rattus novergicus é a completa falta de resíduos de glutamina
entre as repetições de poliprolina sugerindo que os resíduos de glutamina desempenham
um papel relevante na ligação aos polifenóis como demonstrado para as PRPs de ratos e
humanas [111], a diferença estrutural em SP-B sugere a diferença de papel para estes
péptidos na cavidade oral. As suas características estruturais sugerem que este péptido
como a PRP tem uma actividade anti-microbiana.
Análise filogenética de péptidos salivares
52
aPRP 1/2 NP_005033 HUMAN ENSPTRP00000050434 PANTR aPRP 1/2-L XP_003313543 PANTR
PRPC P02810 HUMAN PRH2 protein AAI41917.1 HUMAN PRH1 isofCRA_b EAW96215 HUMAN prepro PRP AAA60184 HUMAN Uncharact G3SCR9 GORGO Uncharact G3S043 GORGO Uncharact PRH1 E9PAQ5 HUMAN PRH1 Db allele A27307 HUMAN PRH1 protein AAI28193 HUMAN PRB3-like XP_003313554 PANTR ENSPPYP00000004896 PONAB ENSPPYP00000004899 PONAB XP_002833778 PONAB Uncharact G3RBW4 GORGO PRH2 isofCRA_c EAW96221 HUMAN Uncharact G1QT82 NOMLE XP_003265552 NOMLE PRH2 isofCRA_b EAW96220 HUMAN LOC100415384 XP_002752225 CALJA LOC100415016 XP_002752224 CALJA DKFZp686C09257 Q68D45 HUMAN LOC722356 XP_001118513 MACMU LOC722360 XP_001118517 MACMU PRP1/PRP2 EHH20508 MACMU
PRP Q7M2S8 MACFA EGK_03375 EHH20506 MACMU Uncharact F7GSJ5 MACMU Uncharact F7GSJ7 MACMU Uncharact G1QT94 NOMLE
PRPs ácidas Primatas
Uncharact F7GZ58 CALJA LOC100412163 XP_002752221 CALJA LOC100398712 XP_002763688 CALJA Uncharact F7IGY3 CALJA Uncharact F7I094 CALJA Uncharact F7IGV1 CALJA LOC100412507 XP_002752222 CALJA
PRB1 P04280 HUMAN PRB1 protein Q86YA1 HUMAN PRB1 protein A5D903 HUMAN HCG26567 isofCRA_c G3V1R1_HUMAN HCG26567 isofCRA_b G3V1M9_HUMAN ENSPTRP00000008024 PANTR ENSPTRP00000008030 PANTR Uncharct G3RWV9 GORGO Uncharact G3RMU1 GORGO
PRB2 P02812 HUMAN Basic PRP IB-8a Q7M4Q5 HUMAN ENSPPYP00000004911 PONAB
MnP4 Q29427 MACFA ENSPTRP00000050430 PANTR
PRB4 P10163 HUMAN Po protein CAA30542 HUMAN Uncharact E9PAL0 HUMAN Uncharact G3S0G6_GORGO ENSPTRP00000008026 PANTR Uncharact E7EXA8 HUMAN ENSP00000412740! HUMAN PRB4 protein A2VCL9 HUMAN Uncharact G3QEF1 GORGO Uncharact G1QT96 NOMLE Uncharact G1QTA0_NOMLE Uncharact G1QT98 NOMLE ENSP00000279573 HUMAN ENSPTRP00000050433 PANTR ENSPTRP00000008028 PANTR PRB3 XP_001137791 PANTR PRP G1 CAA30728 HUMAN Uncharact G3RTV7 GORGO Uncharact E7ER59 HUMAN PRB3 protein Q4VAY2 HUMAN Uncharact C9JW35 HUMAN PRB3 NP_006240 HUMAN PRB3 protein AAH96211 HUMAN
PRB3 Q04118 HUMAN Uncharact F5H7C1 HUMAN
PRPs básicas Primatas
Uncharact G3N0R9_BOVIN Uncharact F1N4B8 BOVIN Glycoprotein Q63179 RAT ENSPVAP00000010780 PTEVA Uncharcat G3QHE7 GORGO
PROL4 Q16378 HUMAN pHLE1F1 isof2 XP_520746 PANTR Uncharct G3UCG0 LOXAF
Prp2 P05143 MOUSE Isof 2 Prp2 P05143-2 MOUSE
Uncharact D3Z1V5 MOUSE Uncharact F8VPU9 MOUSE Prh1 P05142 MOUSE Uncharact E9QMX6 MOUSE mCG118762 EDL29788 MOUSE mCG118762 EDL29787 MOUSE Prp2 Q04154 RAT
Uncharact E9PU40 RAT Acidic PRP25 P10164 RAT
Uncharact F1LV68 RAT Uncharact E9PU38 RAT Prp15 Q04105 RAT RGD1559532 Q04117 RAT ENSMICP00000006831 MICMU
Uncharact G1SNU9 RABIT Prpmp5 Q64306 MOUSE Prpg1 Q07610 RAT Uncharact E9PSV2 RAT Uncharact F1LMA2 RAT Acidic PRP33 P04474 RAT Uncharact G3V7D3 RAT
Prpg2 P10165 RAT Acidic PRP HP43A P06680 MESAU Uncharact D3Z543 MOUSE Uncharact D3Z544 MOUSE Prb1 Q91X93 MOUSE Uncharact D3YX21 MOUSE Prpmp5 Q58E44 MOUSE Uncharact E9PXN1 MOUSE Uncharact Q61888 MOUSE mCG118763 EDL29793 MOUSE 31-kDa PRP Q62105 MOUSE EG667929 B7ZW90 MOUSE Uncharact E9Q7E4 MOUSE mCG118763 EDL29792 MOUSE
PRPs Roedores
Uncharact G1PRT3_MYOLU ENSMICP00000005057 MICMU ENSMICP00000007944 MICMU
Basic PRP Q95JC9 PIG Uncharact F1SQ50 PIG
Iso2 Basic PRP Q95JC9-2 PIG Iso3 Basic PRP Q95JC9-3 PIG
Uncharact F1SQ51 PIG
PRPs Básicas Porco
Uncharact F1P7E0 CANFA ENSCAFP00000035521 CANFA Uncharact F1Q0L0_CANFA similarPRB4 XP_001147634 PANTR ENSCAFP00000030671 CANFA
ENSMODP00000002977 MONDO similar PRP XP_001150134 PANTR ENSAMEP00000002166 AILME ENSCAFP00000032468 CANFA
69100
5394
9069
52100
100
100
100
100
100
100
84100
89
99
99
97
79
99
8664
99
85
8199
99
99
99
96
90
6059
88
64
52
66
95
6175
62
55
79
99
98
96
98
92
7872
54
97
94
66
94
63
55
57
54
56
90
89
50
50
92
68
97
97
7479
64
60
55
50
97
7494
86
6785
75
100100
8251
Figura 7 Árvore Filogenética das PRPs A árvore foi construída usado o método neighbor-joining (NJ). Os valores nos ramos referem-se ao Bootstrap, que são valores obtidos por 1000 réplicas e estão representados em percentagem. Os ramos com valores de Bootstrap inferiores a 50% foram eliminados. As sequências identificadas com um círculo são espécies que com análise na saliva foram detectadas neste estudo.
Discussão
53
O fragmento de Oryctolagus cuniculus (G1SNU9) alinhado com as PRPs humanas,
rato, ratinho e macaco, apresentou uma grande similaridade entre algumas destas regiões
das PRPs, mas particularmente com as PRPs básicas, sugerindo que este fragmento deverá
pertencer à família das PRP básicas. De salientar que as PRPs básicas de coelho já foram
anteriormente isoladas e caracterizadas observando-se que estas possuem uma menor
quantidade de prolina comparativamente a outras espécies [280].
Na análise da árvore das PRPs verifica-se uma clara separação em dois ramos
principais um composto por primatas e outro ramo composto só por roedores. No ramo
composto por PRPs primatas observa-se a separação em dois tipos de PRPs: as PRPs
ácidas, PRPs básicas e PRPs glicosiladas.
Um ponto a realçar é formação de um clade monofilético das sequências de
Oryctolagus cuniculus e Microcebus murinus com as PRPs dos roedores com um valor de
bootstrap de 68%. Com observa na tabela 1, na análise da saliva de três das espécies
analisadas foram identificados fragmentos de péptidos pertencentes a família das PRPs. Na
saliva de Canis familiaris foram identificados fragmentos homólogos de Monodelphis
domestica (ENSMODP00000002977), de Oryctolagus cuniculus (G1SNU9). Na saliva de
Rattus novergicus, foram identificados péptidos de Rattus novergicus (F1LMA2,P01065,
E9PU40). Na saliva de Ovis aries foram identificados vários fragmentos homólogos a
sequência Oryctolagus cuniculus (G1SNU9).
Análise filogenética de péptidos salivares
54
4.2. Estaterinas e Histatinas
No alinhamento das 49 sequências observa-se a conservação dos cinco primeiros
aminoácidos do terminal amina de todas as sequências, excepto na sequência do péptido
hipotético de Rattus novergicus. Na região do terminal carboxilo encontra-se conservado
um resíduo de tirosina (Tyr), como se observa Figura 5. Destas sequências foram
identificadas: histatina 1, histatina 3, estaterina, péptidos hipotéticos e histaterina.
Os genes das histatinas e da estaterina são localizados na mesma região (4q13) e
têm origem num único gene, sugerindo que surgiram por duplicação do gene [133] .
A histaterina é uma quimera que contém aspectos estruturais semelhantes às
histatinas e estaterinas com um grau de similaridade de 30-50%. Encontrada em Bos taurus
pela análise de cDNA [78], a sua forma madura e função ainda não são conhecidas (Swiss
Prot n.c C6KGD7-9).
A estrutura primária da estaterina humana tem uma grande assimetria de carga,
presente na maior parte dos seus aminoácidos ionizáveis na região do terminal amina
(resíduos 1-13) [176] composto por um segmento ácido e por um segmento básico. No
segmento ácido, todos os aminoácidos estão carregados negativamente (DSS(E/D)E),
enquanto no segmento básico (região 6-13), a lisina na posição 6 e três argininas nas
posições 9, 10 e 13 se encontram carregadas positivamente. No terminal carboxilo
encontra-se um único aminoácido carregado, o ácido glutâmico na posição 26 [282].
A comparação entre as sequências de estaterina humana e de Macaca fascicularis
mostra que os dez primeiros aminoácidos, contendo as duas fosfoserinas nas posições 2 e
3, e os resíduos 13,14,17,38 e 39 são idênticos. No alinhamento destas estaterinas
verificou-se que 33 dos 42 aminoácidos são idênticos [181].
A estaterina de Macaca arctoides é composta por 42 aminoácidos e difere da
estaterina humana nos aminoácidos 11,12,15,16,18,25-27,38-40 e da estaterina Macaca
fascicularis nas posições 26 e 28 [182].
A estaterina de porco tem conservada a região negativa do terminal amina e uma
região central carregada positivamente. Na região do terminal carboxilo apresenta três
resíduos de Tyr e três resíduos de Pro conservados, mas diferem na ausência de quatro
resíduos de Gln que são conservados nas três estaterinas de primatas, já caracterizados e
três dos resíduos de Gln que estão ausentes em Bos taurus.
Discussão
55
Além das destas estaterinas já isoladas e caracterizadas na análise filogenética foi
detectada sequências similares em Callithrix jacchus, Gorilla gorilla gorilla, Macaca
mulatta, Nomascus leucogenys, Pan troglodytes, Pongo abelii e Canis familiaris. Estes
péptidos têm um ancestral comum com as estaterinas já caracterizadas. Destas sequências
dois péptidos de Canis familiaris (XP_862144; XP_856868) foram identificados em saliva
de cão analisada neste estudo (tabela 1). Estes dois péptidos apresentam uma similaridade
de cerca 45-47% com a estaterina humana, de 56-58% com estaterina de bovino e de 48-
50% com estaterina de porco. Podendo por a hipótese da identificação de nova estaterina
estaterina presente no cão.
Nos estudos da estrutura secundária da estaterina humana utilizando RMN e CD
(dicroismo circular) [188, 283], verificou-se que estruturalmente aquela se encontra
desordenada em soluções aquosas mas que numa solução de 50% trifluoretanol/água é
composta por uma estrutura de hélice α na região do terminal amina (resíduos Asp1-
Try16), uma hélice tipo II de poliprolina na região intermédia (Gly19-Gln35) e uma hélice
310 na região do terminal carboxilo (Pro36-Phe43) [283].
Como já referido na introdução, a estaterina possui como uma das suas funções, o
controle do processo de desmineralização da superfície do dente. Em medições com RMN
de estado sólido verificou-se que para a estaterina adsorvida na HAP o domínio do
terminal amina (resíduos 1-12) adopta uma conformação α-hélice e que os cinco primeiros
resíduos do terminal amina são imobilizados na superfície [191, 284-291]. Podemos
considerar que as outras estaterinas alinhadas possam ter esta função por conservarem o
segmento ácido no terminal amina.
Mas também, foi estudado Gobbes et al.[282] o papel do segmento básico (região
6-13) no reconhecimento da HAP por péptidos mutantes com uma ou múltiplas mutações,
com a substituição de resíduos carregados positivamente por resíduos de alanina (Ala).
Neste estudo, foi verificado que o péptido com uma única mutação reduziu a afinidade da
ligação, mas não alterava significativamente a densidade de empacotamento da estaterina e
a saturação da ligação. No caso do péptido com a mutação simultânea de quatro resíduos
de Ala reduzia-se substancialmente a afinidade de ligação e a cobertura da superfície da
HAP mas sem modificar a estrutura secundária e as propriedades dinâmicas do domínio no
terminal amina. Estes resultados sugerem que o papel do segmento básico é reduzir as
Análise filogenética de péptidos salivares
56
interacções repulsivas proteína-proteína, devido a diminuição da carga global (negativa) do
péptido, promovendo assim uma maior superfície total da afinidade e cobertura da HAP.
Na maioria dos péptidos e proteínas salivares adsorvidos no esmalte e HAP são
fosforilados [145]. As estaterinas humana, de Macaca fascicularis e Macaca arctoides são
difosforiladas na Ser-2 e Ser-3 [176, 181, 182] enquanto a estaterina do porco é
monofosforilada. A explicação da estaterina do porco ser só fosforilada na Ser-3 deve-se
provavelmente à substituição da Asp4→Glu presente no péptido do suíno e devido ao
envolvimento pleiotrópico Golgi- caseína cinase que é responsável pela fosforilação de
vários péptidos salivares humanos [292]. Esta cinase Golgi-caseína reconhece SX(E/pS)
como a principal sequência consenso, e portanto não é capaz de fosforilar o resíduo Ser-2.
Além dos péptidos salivares humanos, também se verifica a actuação desta mesma enzima
na fosforilação de outros péptidos salivares de porco, tal como o péptido rico em prolina
SP-A, caracterizado na saliva em porco [71].
Em estudos realizados com a estaterina humana de forma a avaliar a interacção
com as bactérias, verificou-se que os resíduos 29-43 e 33-39 do terminal carboxilo
funcionavam como o domínio de ligação para a Porphromonas gingivalis e o
Fusobacterium nucleatum fimbriae, respectivamente [193, 198]. As bactérias ligam-se
preferencialmente à estaterina quando esta se encontra imobilizada na superfície da HAP
[198, 199] sugerindo que a adsorção à superfície da HAP pode expor os locais receptores
para a ligação à fibrilina da bactéria. Além disso, o terminal carboxilo da estaterina
humana (especialmente ao nível das sequências QYQQYTF, YQQYTF, QQYTF, QYTF e
YTF) tem a capacidade de inibir o crescimento das bactérias anaeróbicas
(Pteptostreptococcus estirpe, Fusobacterium necrogenes e F. necrophorum) que podem
estar associadas a doenças do periodonto [293]. Porém, Niemi e Johansson [196]
verificaram que ao usarem um péptido híbrido, alguns tipos de Actinomyces spp. ligavam-
se aos péptidos QQYTF e PYQPYQ mas outros tipos ligavam-se ao YQPVE e QPLYPQ.
O resíduo de Tyr exibe propriedades hidrofóbicas e pontes de hidrogénio comuns nestas
sequências. No entanto, o péptido AQPVE (onde o resíduo de tirosina foi substituído por
alanina) e manteve a actividade inibidora sugerindo que o resíduo de Tyr não tem
importância para a ligação.
Tal como em humanos, foi detectado nos péptidos trípticos de EGPs (preparação do
grânulo enriquecido) da glândula parótida por HPLC-ESI-MS, a presença de duas
Discussão
57
STAT P02809 MACFA STAT P14709 MACAR
STATH EHH25962 MACMU ENSPTRP00000027723 PANTR
STAT P02808 HUMAN Uncharact G3SG71 GORGO ENSPPYP00000016521 PONAB STAT isofCRA_c A6NKE9_HUMAN ENSPTRP00000053497 PANTR Uncharact G1R7Y6 NOMLE Uncharact F7HQI8 CALJA Uncharact F7HQR7 CALJA
Primatas
Histatherin C6KGD7_BOVIN Histatherin C6KGD9_BOVIN Histatherin C6KGD8_BOVIN
STAT D8WUT6 PIG STAT Q8HY86 BOVIN
Artiodálios
LOC608829 isof1 XP_861969 CANFA LOC608829 isof4 XP_862059 CANFA XP_857103 isoform 4 XP_862196 CANFA XP_843594 isoform 1 XP_848687 CANFA
STAT-LIKE isof3 XP_856868 CANFA STAT-LIKE isof2 XP_856826 CANFA XP_857075 isoform 3 XP_862168 CANFA STAT-LIKE XP_003431878 CANFA
STAT-LIKE isof 2 XP_862144 CANFA
Carnívoros
Estaterina
Theobromine induced Q5J6K0 RAT LOC100590184 XP_003265951 NOMLE
HIS1 C0LRB4_CHLAE HIS1 C0LRB3_TRACR HIS1 C0LRB1_MACFA HIS3 C0LRB6_NOMLE
HIS3-LIKE XP_003265744 NOMLE HIS1 C0LRB2_NOMLE
Uncharact G3QQV0 GORGO HIS1 C0LRB0 9PRIM HIS1 P15515_HUMAN
ENSPTRP00000027724 PANTR ENSPPYP00000016523 PONAB HIS3-LIKE XP_002814869 PONAB ENSPPYP00000016522 PONAB Uncharact G3R990 GORGO
HIS3 C0LRB5 9PRIM HIS3 P15516 HUMAN
ENSPTRP00000053498 PANTR HIS3 C0LRB7_CHLAE
HIS1 P34084_MACFA HIS3 C0LRB9_MACFA
HRP 3 EHH25961 MACMU HIS3 C0LRB8_TRACR
Histatinas
94100
55100
99
98
5998
5664
95
95
93
57
53
52
51
51
95
86
93
77
68
75
74
64
70
isoformas de estaterina de porco mas diferindo na presença no terminal carboxilo do
resíduo de Ala. A isoforma truncada do terminal carboxilo ocorre antes ou durante o
armazenamento do grânulo nas glândulas salivares do porco e humanas [184].
Nas histatinas, observa-se a conservação de um resíduo de lisina, dois resíduos de
arginina e três resíduos de histidina, mas na histatina 3 de Trachypithecus cristatus
(COLRB8_ TRACR), só estão conservados dois resíduos de histidinas.
As histatinas humanas são idênticas nos 24 resíduos do terminal amina, excepto a
substituição de Glu e Arg (resíduos 4 e 11) em histatina 1 com Ala e Lys, respectivamente,
em histatina 3. A histatina 1 contém 9 aminoácidos inseridos ausentes na histatina 3, e
histatina 3 contém 3 aminoácidos inseridos ausentes na histatina 1. Entre estas sequências
existe um grau de similaridade de 88% [126].
Figura 8 Árvore Filogenética das Estaterinas e Histatinas. A árvore foi construída usado o método neighbor-joining (NJ). Os valores nos ramos referem-se ao Bootstrap, que são valores obtidos por 1000 réplicas e estão representados em percentagem. Os ramos com valores de Bootstrap inferiores a 50% foram eliminados.
Análise filogenética de péptidos salivares
58
Na Macaca fascicularis são encontrados a histatina 1 (M-histatina 1) e a histatina 3
(M-histatina 3) que são iguais em 20 aminoácidos no terminal amina. Mas a M-histatina 1
é mais abundante na secreção em parótida do que a M-histatina 3.
Num estudo em que se comparou a M-histatina 1 com as histatinas 1 e 3,
observou-se que M-histatina 1 contém uma sequência de 6 aminoácidos, -Arg-His-Gly-
His-His-Lys- (resíduos 10-15), ausentes na histatina 1 e histatina 3, e a histatina 1 contém
uma sequência de 6 aminoácidos, -Phe-Pro-Phe-Tyr-Gly-Asp- (resíduos 24-29), que não
está presente em M-histatina 1 ou na histatina 3. Os resíduos da M-histatina 1 nas posições
1-3,6-9,16,18.28,30 e 32-38 são idênticos às histatinas humanas. Isso demonstra que os
domínios no terminal amina, meio e no terminal carboxilo têm sido conservados e
implicam que estes domínios são relevante funcionalmente [153].
Ao observamos a região dos resíduos 9-24 das histatinas humanas estão alinhados
com as outras sequências da família das histatinas e observa-se a conservação desta região
que é descrita na histatina 5 humana e na M-histatina 1 como região responsável pela
inibição da Candida albicans [132, 150-154], podendo também ser responsável por esta
mesma função nas histatinas dos outros primatas.
4.3. Cistatinas
No alinhamento das 62 sequências observa-se a conservação de três regiões das
cistatinas salivares e das cistatinas C e D do resíduo de glicina no terminal amina, do
motivo QXVXG que está contido no loop L1 e da sequência PW inserida no loop L2 no
terminal carboxilo. A conservação destas três regiões nas cistatinas salivares e cistatinas C
e D é responsável pela inibição das proteases de cisteína da família C1.
Na análise da árvore filogenética, as sequências das cistatinas SD de Primatas e cistatinas
C estão separadas em dois ramos. Uma análise mais precisa do ramo das cistatinas SD que
é composta por 22 sequências de cistatinas derivadas apenas de primatas subdividido em
dois grupos: o das cistatinas tipo S e das cistatinas D e em ambos grupos apresentam um
nível de confiança de bootstrap 100%. No ramo das cistatinas tipo S foram agrupados
sequências de Pan troglodytes, Pongo abelii, Nomascus leucogens, Callithrix jacchus e
Discussão
59
Uncharact F6UBH5 HORSE ENSFCAP00000004756 FELCA CysC D5MTH1 FELCA Put uncharact D2I7P5 AILME Uncharact G1LU45 AILME
Cistatina C Carnívoros
ENSPVAP00000003380 PTEVA CysC P01035 BOVIN CysC Q0Z8R0 PIG Uncharact F1SAS7 PIG CysC (Frag) Q29212 PIG
Cistatina C Artiodálios
Uncharact G1Q2V3 MYOLU ENSCPOP00000001466 CAVPO ENSEEUP00000013930 ERIEU Uncharact F7CAH1_MONDO Uncharact G3VZM3_SARHA ENSDNOP00000004937 DASNO ENSETEP00000003593 ECHTE Uncharact G3TEB6_LOXAF ENSMICP00000004204 MICMU ENSOGAP00000009111 OTOGA CysC O97862 RABIT Uncharact G1SUE4 RABIT
CysC P01034 HUMAN ENSPPYP00000012040 PONAB Uncharact G1RLM2 NOMLE CysC O19092 MACMU CysC O19093 SAISC Uncharact F6UCB8 CALJA
Cistatina C Primatas
CysC G3H705_CRIGR CysC P14841 RAT Put uncharact Q3U5K7 MOUSE CysC P21460 MOUSE CysC A2APX3 MOUSE CysC Q9EPX9_MOUSE
Cistatina C Roedores
Cys10 P21460 MOUSE Cys10 D4AAU9 RAT ENSDORP00000008399 DIPOR
Cistatina 10 Roedores
ENSMICP00000014007 MICMU ENSMICP00000001300 MICMU ENSMICP00000011557 MICMU Uncharact G3RKA9_GORGO
CysD P28325 HUMAN Uncharact G1RZZ5 NOMLE Uncharact F7HAW3 MACMU Uncharact F6VIZ9 CALJA
Cistatina D Primatas
Uncharact F6VIW1 CALJA Uncharact F6ZNT9 MACMU
CysSN P01037 HUMAN ENSPTRP00000022847 PANTR Uncharact G3QJY3 GORGO ENSPPYP00000012585 PONAB ENSPPYP00000012595 PONAB ENSPTRP00000022848 PANTR ENSPPYP00000012041 PONAB
CysSA P09228 HUMAN Uncharact G3QXG3_GORGO ENSPTRP00000022846 PANTR
CysS P01036 HUMAN Uncharact G1RZZ0 NOMLE ENSPPYP00000012590 PONAB ENSPPYP00000023548 PONAB ENSPPYP00000023565 PONAB
Cistatinas tipo S Primatas
CysS G3H704_CRIGR Uncharact D3ZUY2 RAT Uncharact D3ZP68_RAT
CysS P19313 RAT Uncharact F1M6D7 RAT LM protein Q3MIE8 RAT
Cistatina S Roedores
55
98
99
9999
99
9252
95
99
99
99
96
7994
9392
9056
52
72
93
99
9279
97
7499
57
99
98
97
97
94
6884
83
63
60
7199
62
Figura 9 Árvore Filogenética das Cistatinas A árvore foi construída usado o método neighbor-joining (NJ). Os valores nos ramos referem-se ao Bootstrap, que são valores obtidos por 1000 réplicas e estão representados em percentagem. Os ramos com valores de Bootstrap inferiores a 50% foram eliminados. As cistatinas identificas com quadrado preto é as cistatinas já encontradas em saliva anteriormente.
Análise filogenética de péptidos salivares
60
Macaca mulatta. No alinhamento destas sequências observa-se uma região homóloga
situada na posição 9-26 da cistatina S humana em todas as sequências de primatas com
excepção das sequências de Callithrix jacchus. Esta região tem sido descrita na cistatina S
humana como local de ligação da HAP [251] onde é associada ao controlo da
mineralização, levantado a hipótese nestas sequências que o mesma função.
O ramo das cistatinas D formam um clade monofilético com as cistatinas salivares com
valor de bootstrap de 99 %. Tal como no ramo das cistatinas tipo S, o ramo das cistatinas
D, estão apenas identificadas sequências de primatas.
Esta árvore também mostra as cistatinas salivares e D tem um ancestral comum
com a cistatina C. No ramo das cistatinas C foram identificados 28 sequências que estão
subdivididas em cistatina C de Primatas, Roedores, Artiodáctilos e Carnívoros.
Nesta árvore a cistatina S de rato, não se encontra agrupada com as cistatinas
salivares humanas implicando ter uma origem independente. Não estando claro se é um
ortólogo elevadamente divergente das proteínas humanas ou caso de evolução
independente [210]. Mas também associada a este ramo da cistatina S de rato uma cistatina
S de Cricetulus griseus com bootstrap de 99%. Que além de partilhar homologia na
sequência deve ter a mesmas funções que cistatina S de rato.
A cistatinas C identificada apenas a cistatina C humana foi detectada em saliva,
enquanto as restantes não estão descritas como péptidos salivares.
Na análise da saliva das quatro espécies para comparar com as sequências obtidas
por análise filogenética não foram encontrados qualquer péptido homólogo a família das
cistatinas.
Discussão
61
55.. CCoonncclluussããoo
Conclusão
63
Na elaboração desta tese teve como objectivo principal encontrar novos péptidos
salivares da família das PRPs, histatinas/estaterinas e cistatinas com auxílio de ferramentas
filogenéticas para conhecer a sua origem, evolução e função. Para posterior, criação da
base de dados de péptidos salivares. Na recolha das sequências das diferentes bases de
dados, foram encontradas 140 sequências de PRPs, 49 sequências de estaterina/ histatina e
62 sequências de cistatinas.
Nas sequências da família PRPs foram detectados péptidos em espécies como Pan
troglodytes, Nomascus leucogenys, Macaca mulatta, Pongo abeii, Gorilla gorilla,
Microcebus murinus, Callithrix jachus, Canis familiaris, Ailuropoda melanoleuca, Bos
taurus, Pteropus vampyrus Monodelphis domestica que não estão descritos.. No
alinhamento das sequências observa-se uma maior homologia na região do péptido sinal e
na região repeat
A sequência da família histatinas/estaterinas identificadas, além das sequências já
isoladas e caracterizadas em saliva identificou-se novos péptidos homólogos a estaterinas
de Pan troglodytes, Nomascus leucogenys, Macaca mulatta, Pongo abelii, Gorilla gorilla
gorilla Callithrix jachus, e Canis familiaris mas também a histatinas de Pongo abelii,
Gorilla gorilla gorilla, Pan troglodytes. Em todas as sequências estão conservados os
cinco primeiros aminoácidos. Nas histatinas uma região presente nas histatinas humanas
nos resíduos 9-24 que é conservada nas outras sequências de histatinas que é responsável
pela inibição da C. albicans.
Nas sequências das cistatinas todas mantêm conservada as três regiões de inibição
da protease de cisteína papaína (G, QXVXG, PW). No caso especícifico das cistatinas tipo
S há a conservação. uma região dos resíduos 9-26 (numeração da cistatina S humana), em
todas as sequências deste tipo identificadas, nesta dissertação .
Destas sequências, criamos uma base de dados das sequências obtida da análise de
filogenética para comparar com a saliva analisada de quatro espécies (cão, coelho
selvagem, rato e ovelha). Destas espécies identificou-se a presença de fragmentos
homólogos, a duas sequências identificadas na análise filogenética como homólogas a
estaterina humana , em que podemos concluir estarmos perante um péptido hipotético de
estaterina de cão.
Análise filogenética de péptidos salivares
64
Num trabalho futuro, é necessário isolar estes péptidos e testar se tem as mesmas
características funcionais que outras espécies de péptidos salivares já identificados. Além
disso, deve-se proceder a análise de saliva de outras espécies de mamíferos, e comparar
com esta base de dados.
65
66.. BBiibblliiooggrraaffiiaa
Análise filogenética de péptidos salivares
66
Bibliografia
67
1. Amerongen, A.V. and E.C. Veerman, Saliva--the defender of the oral cavity. Oral Dis, 2002. 8(1): p. 12-22.
2. van Nieuw Amerongen, A., J.G.M. Bolscher, and E.C.I. Veerman, Salivary
Proteins: Protective and Diagnostic Value in Cariology? Caries Research, 2004. 38(3): p. 247-253.
3. Veerman, E.C.I., et al., Human glandular salivas: their separate collection and
analysis. European Journal of Oral Sciences, 1996. 104(4): p. 346-352. 4. Kaufman, E. and I.B. Lamster, The Diagnostic Applications of Saliva— A
Review. Critical Reviews in Oral Biology & Medicine, 2002. 13(2): p. 197-212. 5. Dodds, M.W.J., D.A. Johnson, and C.-K. Yeh, Health benefits of saliva: a
review. Journal of Dentistry, 2005. 33(3): p. 223-233. 6. Mandel, I.D., The functions of saliva. J Dent Res, 1987. 66 Spec No: p. 623-7. 7. Humphrey, S.P. and R.T. Williamson, A review of saliva: Normal composition,
flow, and function. The Journal of Prosthetic Dentistry, 2001. 85(2): p. 162-169. 8. Amerongen, A.V.a.E.C.V.a.A.V., Saliva: Properties and functions, in Salivary
Diagnostics, D.T. Wong, Editor. 2008, Wiley-Blackwell. p. 27-36. 9. Prinz, J.F. and P.W. Lucas, An optimization model for mastication and
swallowing in mammals. Proc Biol Sci, 1997. 264(1389): p. 1715-21. 10. Yao, Y., et al., Identification of Protein Components in Human Acquired
Enamel Pellicle and Whole Saliva Using Novel Proteomics Approaches. Journal of Biological Chemistry, 2003. 278(7): p. 5300-5308.
11. Wilmarth, P.A., et al., Two-Dimensional Liquid Chromatography Study of the
Human Whole Saliva Proteome. Journal of Proteome Research, 2004. 3(5): p. 1017-1023.
12. Vitorino, R., et al., Analysis of salivary peptides using HPLC–electrospray mass
spectrometry. Biomedical Chromatography, 2004. 18(8): p. 570-575. 13. Huang, C.-M., Comparative proteomic analysis of human whole saliva.
Archives of Oral Biology, 2004. 49(12): p. 951-962. 14. Hardt, M., et al., Toward defining the human parotid gland salivary proteome
and peptidome: identification and characterization using 2D SDS-PAGE,
ultrafiltration, HPLC, and mass spectrometry. Biochemistry, 2005. 44(8): p. 2885-99.
15. Hu, S., et al., Large-scale identification of proteins in human salivary proteome
by liquid chromatography/mass spectrometry and two-dimensional gel
electrophoresis-mass spectrometry. PROTEOMICS, 2005. 5(6): p. 1714-1728. 16. Xie, H., et al., A Catalogue of Human Saliva Proteins Identified by Free Flow
Electrophoresis-based Peptide Separation and Tandem Mass Spectrometry. Molecular & Cellular Proteomics, 2005. 4(11): p. 1826-1830.
17. Hu, S., J.A. Loo, and D.T. Wong, Human body fluid proteome analysis. PROTEOMICS, 2006. 6(23): p. 6326-6353.
18. Guo, T., et al., Characterization of the Human Salivary Proteome by Capillary
Isoelectric Focusing/Nanoreversed-Phase Liquid Chromatography Coupled
with ESI-Tandem MS. Journal of Proteome Research, 2006. 5(6): p. 1469-1478. 19. Ramachandran, P., et al., Identification of N-Linked Glycoproteins in Human
Saliva by Glycoprotein Capture and Mass Spectrometry. Journal of Proteome Research, 2006. 5(6): p. 1493-1503.
20. Hu, S., et al., Salivary proteomic and genomic biomarkers for primary Sjögren's
syndrome. Arthritis & Rheumatism, 2007. 56(11): p. 3588-3600.
Análise filogenética de péptidos salivares
68
21. Bandhakavi, S., et al., A Dynamic Range Compression and Three-Dimensional
Peptide Fractionation Analysis Platform Expands Proteome Coverage and the
Diagnostic Potential of Whole Saliva. Journal of Proteome Research, 2009. 8(12): p. 5590-5600.
22. Kojima, T., et al., Human Gingival Crevicular Fluid Contains MRP8 (S100A8)
and MRP14 (S100A9), Two Calcium-binding Proteins of the S100 Family. Journal of Dental Research, 2000. 79(2): p. 740-747.
23. Macarthur, D.J. and N.A. Jacques, Proteome Analysis of Oral Pathogens. Journal of Dental Research, 2003. 82(11): p. 870-876.
24. Messana, I., et al., Facts and artifacts in proteomics of body fluids. What
proteomics of saliva is telling us? J Sep Sci, 2008. 31(11): p. 1948-63. 25. Oppenheim, F.G., et al., Salivary Proteome and Its Genetic Polymorphisms.
Annals of the New York Academy of Sciences, 2007. 1098(1): p. 22-50. 26. Azen, E.A., et al., PRB1, PRB2, and PRB4 coded polymorphisms among human
salivary concanavalin-A binding, II-1, and Po proline-rich proteins. Am J Hum Genet, 1996. 58(1): p. 143-53.
27. Azen, E.A., Genetics of Salivary Protein Polymorphisms. Critical Reviews in Oral Biology & Medicine, 1993. 4(3): p. 479-485.
28. Helmerhorst, E.J. and F.G. Oppenheim, Saliva: a Dynamic Proteome. Journal of Dental Research, 2007. 86(8): p. 680-693.
29. Wong, R.S., T. Hofmann, and A. Bennick, The complete primary structure of a
proline-rich phosphoprotein from human saliva. J Biol Chem, 1979. 254(11): p. 4800-8.
30. Kim, H.S. and N. Maeda, Structures of two HaeIII-type genes in the human
salivary proline-rich protein multigene family. J Biol Chem, 1986. 261(15): p. 6712-8.
31. Bennick, A., Salivary proline-rich proteins. Molecular and Cellular Biochemistry, 1982. 45(2): p. 83-99.
32. Bennick, A., Structural and Genetic Aspects of Proline-rich Proteins. Journal of Dental Research, 1987. 66(2): p. 457-461.
33. Minaguchi, K. and A. Bennick, Genetics of human salivary proteins. J Dent Res, 1989. 68(1): p. 2-15.
34. Mandel, I.D., R.H. Thompson, Jr., and S.A. Ellison, Studies on the mucoproteins
of human parotid saliva. Arch Oral Biol, 1965. 10(3): p. 499-507. 35. Oppenheim, F.G., D.I. Hay, and C. Franzblau, Proline-rich proteins from human
parotid saliva. I. Isolation and partial characterization. Biochemistry, 1971. 10(23): p. 4233-4238.
36. Bennick, A. and G.E. Connell, Purification and partial characterization of four
proteins from human parotid saliva. Biochem J, 1971. 123(3): p. 455-64. 37. Hay, D.I., et al., Human salivary acidic proline-rich protein polymorphisms and
biosynthesis studied by high-performance liquid chromatography. J Dent Res, 1994. 73(11): p. 1717-26.
38. Levine, M. and P.J. Keller, The isolation of some basic proline-rich proteins
from human parotid saliva. Arch Oral Biol, 1977. 22(1): p. 37-41. 39. Kauffman, D., et al., Basic proline-rich proteins from human parotid saliva:
complete covalent structures of proteins IB-1 and IB-6. Biochemistry, 1986. 25(9): p. 2387-92.
40. Levine, M.J., J.C. Weill, and S.A. Ellison, The isolation and analysis of a
glycoprotein from parotid saliva. Biochim Biophys Acta, 1969. 188(1): p. 165-7.
Bibliografia
69
41. Bennick, A., Structure and Function of Salivary Proline-rich Proteins. Molecular Cell Biochemistry, 1982. 45: p. 83-99.
42. Azen, E.A., Properties of salivary basic proteins showing polymorphism. Biochemical Genetics, 1973. 9(1): p. 69-86.
43. Stubbs, M., et al., Encoding of human basic and glycosylated proline-rich
proteins by the PRB gene complex and proteolytic processing of their precursor
proteins. Archives of Oral Biology, 1998. 43(10): p. 753-770. 44. Mamula, P.W., et al., Localization of the human salivary protein complex (SPC)
to chromosome band 12p13.2. Cytogenet Cell Genet, 1985. 39(4): p. 279-84. 45. Kim, H.-S., O. Smithies, and N. Maeda, A physical map of the human salivary
proline-rich protein gene cluster covers over 700 kbp of DNA. Genomics, 1990. 6(2): p. 260-267.
46. Lyons, K.M., et al., Many Protein Products From a Few Loci: Assignment of
Human Salivary Proline-Rich Proteins to Specific Loci. Genetics, 1988. 120(1): p. 255-265.
47. Kauffman, D.L., et al., Alignment of amino acid and DNA sequences of human
proline-rich proteins. Crit Rev Oral Biol Med, 1993. 4(3-4): p. 287-92. 48. Azen, E. and P.-L. Yu, Genetic polymorphisms of Pe and Po salivary proteins
with probable linkage of their genes to the salivary protein gene complex (SPC). Biochemical Genetics, 1984. 22(11): p. 1065-1080.
49. Robinson, R., et al., Primary structure and possible origin of the non-
glycosylated basic proline-rich protein of human submandibular/sublingual
saliva. Biochem J, 1989. 263(2): p. 497-503. 50. Azen, E.A. and F.G. Oppenheim, Genetic polymorphism of proline-rich human
salivary proteins. Science, 1973. 180(90): p. 1067-9. 51. Azen, E.A. and C.L. Denniston, Genetic polymorphism of human salivary
proline-rich proteins: Further genetic analysis. Biochemical Genetics, 1974. 12(2): p. 109-120.
52. Azen, E.A. and C. Denniston, Genetic polymorphism of PIF (parotid isoelectric
focusing variant) proteins with linkage to the PPP (parotid proline-rich protein)
gene complex. Biochemical Genetics, 1981. 19(5): p. 475-485. 53. Schlesinger, D.H. and D.I. Hay, Complete covalent structure of a proline-rich
phosphoprotein, PRP-2, an inhibitor of calcium phosphate crystal growth from
human parotid saliva. International Journal of Peptide and Protein Research, 1986. 27(4): p. 373-379.
54. Wong, R.S. and A. Bennick, The primary structure of a salivary calcium-
binding proline-rich phosphoprotein (protein C), a possible precursor of a
related salivary protein A. Journal of Biological Chemistry, 1980. 255(12): p. 5943-5948.
55. Maeda, N., Inheritance of the human salivary proline-rich proteins: a
reinterpretation in terms of six loci forming two subfamilies. Biochem Genet, 1985. 23(5-6): p. 455-64.
56. Maeda, N., et al., Differential RNA splicing and post-translational cleavages in
the human salivary proline-rich protein gene system. J Biol Chem, 1985. 260(20): p. 11123-30.
57. Kim, H.S., et al., The structure and evolution of the human salivary proline-rich
protein gene family. Mammalian Genome, 1993. 4(1): p. 3-14. 58. McArthur, C., G.D. Sanson, and A.M. Beal, Salivary proline-rich proteins in
mammals: Roles in oral homeostasis and counteracting dietary tannin. Journal of Chemical Ecology, 1995. 21(6): p. 663-691.
Análise filogenética de péptidos salivares
70
59. Bennick, A., Interaction of Plant Polyphenols with Salivary Proteins. Critical Reviews in Oral Biology & Medicine, 2002. 13(2): p. 184-196.
60. Clements, S., H. Mehansho, and D.M. Carlson, Novel multigene families
encoding highly repetitive peptide sequences. Sequence analyses of rat and
mouse proline-rich protein cDNAs. Journal of Biological Chemistry, 1985. 260(25): p. 13471-13477.
61. Mehansho, H., et al., Induction of proline-rich glycoprotein synthesis in mouse
salivary glands by isoproterenol and by tannins. Journal of Biological Chemistry, 1985. 260(7): p. 4418-4423.
62. Ann, D.K. and D.M. Carlson, The structure and organization of a proline-rich
protein gene of a mouse multigene family. J Biol Chem, 1985. 260(29): p. 15863-72.
63. Ziemer, M.A., et al., Nucleotide sequence analysis of a proline-rich protein
cDNA and peptide homologies of rat and human proline-rich proteins. J Biol Chem, 1984. 259(16): p. 10475-80.
64. Oppenheim, F.G., E. Kousvelari, and R. Troxler, Immunological cross-reactivity
and sequence homology between salivary proline-rich proteins in human and
macque monkey (Macaca fascicularis) parotid saliva. Arch Oral Biol, 1979. 24(8): p. 595-9.
65. Oppenheim, F.G., et al., Molecular basis of salivary proline-rich protein and
peptide synthesis: cell-free translations and processing of human and macaque
statherin mRNAs and partial amino acid sequence of their signal peptides. J Dent Res, 1987. 66(2): p. 462-6.
66. Lin, H.H., E.E. Kousvelari, and D.K. Ann, Sequence and expression of the
MnP4 gene encoding basic proline-rich protein in macaque salivary glands. Gene, 1991. 104(2): p. 219-26.
67. Rajan, A.I. and A. Bennick, Demonstration of proline-rich proteins in rabbit
parotid saliva and partial characterization of some of the proteins. Arch Oral Biol, 1983. 28(5): p. 431-9.
68. Mehansho, H., et al., Induction of proline-rich proteins in hamster salivary
glands by isoproterenol treatment and an unusual growth inhibition by tannins. Journal of Biological Chemistry, 1987. 262(25): p. 12344-12350.
69. Ann, D.K., D. Gadbois, and D.M. Carlson, Structure, organization, and
regulation of a hamster proline-rich protein gene. A multigene family. Journal of Biological Chemistry, 1987. 262(9): p. 3958-3963.
70. Zhang, Q., et al., Cloning and functional study of porcine parotid hormone, a
novel proline-rich protein. J Biol Chem, 2005. 280(23): p. 22233-44. 71. Patamia, M., et al., Two proline-rich peptides from pig (Sus scrofa) salivary
glands generated by pre-secretory pathway underlying the action of a
proteinase cleaving ProAla bonds. Peptides, 2005. 26(9): p. 1550-1559. 72. Inzitari, R., et al., Proteomic analysis of salivary acidic proline-rich proteins in
human preterm and at-term newborns. J Proteome Res, 2007. 6(4): p. 1371-7. 73. Azen, E.A., et al., Alleles at the PRH1 locus coding for the human salivary-
acidic proline-rich proteins Pa, Db, and PIF. Am J Hum Genet, 1987. 41(6): p. 1035-47.
74. Azen, E.A., et al., Alleles at the PRB3 locus coding for a disulfide-bonded
human salivary proline-rich glycoprotein (Gl 8) and a null in an Ashkenazi Jew. Am J Hum Genet, 1990. 47(4): p. 686-97.
Bibliografia
71
75. Hay, D.I., et al., The primary structures of six human salivary acidic proline-
rich proteins (PRP-1, PRP-2, PRP-3, PRP-4, PIF-s and PIF-f). Biochem J, 1988. 255(1): p. 15-21.
76. Messana, I., et al., Trafficking and Postsecretory Events Responsible for the
Formation of Secreted Human Salivary Peptides. Molecular & Cellular Proteomics, 2008. 7(5): p. 911-926.
77. Inzitari, R., et al., Different isoforms and post-translational modifications of
human salivary acidic proline-rich proteins. PROTEOMICS, 2005. 5(3): p. 805-815.
78. Castagnola, M., et al., Biotechnological implications of the salivary proteome. Trends in Biotechnology, 2011. 29(8): p. 409-418.
79. Drzymala, L., et al., Cellular phosphorylation of an acidic proline-rich protein,
PRP1, a secreted salivary phosphoprotein. Biochemistry, 2000. 39(8): p. 2023-31.
80. Lasa, M., et al., Phosphorylation of Osteopontin by Golgi Apparatus Casein
Kinase. Biochemical and Biophysical Research Communications, 1997. 240(3): p. 602-605.
81. Brunati, A.M., et al., Novel consensus sequence for the Golgi apparatus casein
kinase, revealed using proline-rich protein-1 (PRP1)-derived peptide substrates. Biochem. J., 2000. 351(3): p. 765-768.
82. Hay, D., et al., Inhibition of calcium phosphate precipitation by human salivary
acidic proline-rich proteins: Structure-activity relationships. Calcified Tissue International, 1987. 40(3): p. 126-132.
83. Bennick, A., et al., The location and nature of calcium-binding sites in salivary
acidic proline-rich phosphoproteins. Journal of Biological Chemistry, 1981. 256(10): p. 4741-4746.
84. Moreno, E., K. Varughese, and D. Hay, Effect of human salivary proteins on the
precipitation kinetics of calcium phosphate. Calcified Tissue International, 1979. 28(1): p. 7-16.
85. Kousvelari, E.E., et al., Basic Biological Sciences. Journal of Dental Research, 1980. 59(8): p. 1430-1438.
86. Bennick, A., D. Kells, and G. Madapallimattam, Interaction of calcium ions and
salivary acidic proline-rich proteins with hydroxyapatite. A possible aspect of
inhibition of hydroxyapatite formation. Biochem J, 1983. 213(1): p. 11-20. 87. Bennick, A., M. Cannon, and G. Madapallimattam, Factors affecting the
adsorption of salivary acidic proline-rich proteins to hydroxyapatite. Caries Res, 1981. 15(1): p. 9-20.
88. Gibbons, R.J. and D.I. Hay, Human salivary acidic proline-rich proteins and
statherin promote the attachment of Actinomyces viscosus LY7 to apatitic
surfaces. Infect. Immun., 1988. 56(2): p. 439-445. 89. Gibbons, R.J., et al., Adsorbed salivary proline-rich protein 1 and statherin:
receptors for type 1 fimbriae of Actinomyces viscosus T14V-J1 on apatitic
surfaces. Infect. Immun., 1988. 56(11): p. 2990-2993. 90. Gibbons, R.J. and D.I. Hay, Adsorbed Salivary Acidic Proline-rich Proteins
Contribute to the Adhesion of Streptococcus mutans JBP to Apatitic Surfaces. Journal of Dental Research, 1989. 68(9): p. 1303-1307.
91. Gibbons, R.J., D.I. Hay, and D.H. Schlesinger, Delineation of a segment of
adsorbed salivary acidic proline-rich proteins which promotes adhesion of
Streptococcus gordonii to apatitic surfaces. Infection and immunity, 1991. 59(9): p. 2948-54.
Análise filogenética de péptidos salivares
72
92. Lyons, K.M., J.H. Stein, and O. Smithies, Length polymorphisms in human
proline-rich protein genes generated by intragenic unequal crossing over. Genetics, 1988. 120(1): p. 267-78.
93. Azen, E.A., C.K. Hurley, and C. Denniston, Genetic polymorphism of the major
parotid salivary glycoprotein (Gl) with linkage to the genes for Pr, Db, and Pa. Biochem Genet, 1979. 17(3-4): p. 257-79.
94. Kauffman, D.L. and P.J. Keller, The basic proline-rich proteins in human
parotid saliva from a single subject. Arch Oral Biol, 1979. 24(4): p. 249-56. 95. Azen, E.A. and C. Denniston, Polymorphism of Ps (parotid size variant) and
detection of a protein (PmS) related to the Pm (parotid middle band) system
with genetic linkage of Ps and Pm to Gl, Db, and Pr genetic determinants. Biochem Genet, 1980. 18(5-6): p. 483-501.
96. Anderson, L.C., D.L. Kauffman, and P.J. Keller, Identification of the Pm and
PmS human parotid salivary proteins as basic proline-rich proteins. Biochem Genet, 1982. 20(11-12): p. 1131-7.
97. Azen, E.A. and P.L. Yu, Genetic polymorphism of CON 1 and CON 2 salivary
proteins detected by immunologic and concanavalin A reactions on
nitrocellulose with linkage of CON 1 and CON 2 genes to the SPC (salivary
protein gene complex). Biochem Genet, 1984. 22(1-2): p. 1-19. 98. Karn, R.C., P.A. Goodman, and P.L. Yu, Description of a genetic polymorphism
of a human proline-rich salivary protein, Pc, and its relationship to other
proteins in the salivary protein complex (SPC). Biochem Genet, 1985. 23(1-2): p. 37-51.
99. Isemura, S., E. Saitoh, and K. Sanada, Fractionation and characterization of
basic proline-rich peptides of human parotid saliva and the amino acid
sequence of proline-rich peptide P-E. J Biochem, 1982. 91(6): p. 2067-75. 100. SAITOH, E., S. ISEMURA, and K. SANADA, Complete Amino Acid Sequence
of a Basic Proline-Rich Peptide, P-D, from Human Parotid Saliva. Journal of Biochemistry, 1983. 93(2): p. 495-502.
101. Saitoh, E., S. Isemura, and K. Sanada, Complete amino acid sequence of a basic
proline-rich peptide, P-F, from human parotid saliva. J Biochem, 1983. 93(3): p. 883-8.
102. Saitoh, E., S. Isemura, and K. Sanada, Further fractionation of basic proline-
rich peptides from human parotid saliva and complete amino acid sequence of
basic proline-rich peptide P-H. J Biochem, 1983. 94(6): p. 1991-9. 103. Isemura, S., E. Saitoh, and K. Sanada, Isolation and amino acid sequences of
proline-rich peptides of human whole saliva. J Biochem, 1979. 86(1): p. 79-86. 104. Kauffman, D.L., et al., Basic proline-rich proteins from human parotid saliva:
relationships of the covalent structures of ten proteins from a single individual. Biochemistry, 1991. 30(14): p. 3351-3356.
105. Kauffman, D., et al., Basic proline-rich proteins from human parotid saliva:
complete covalent structure of protein IB-9 and partial structure of protein IB-6,
members of a polymorphic pair. Biochemistry, 1982. 21(25): p. 6558-62. 106. Azen, E.A. and N. Maeda, Molecular genetics of human salivary proteins and
their polymorphisms. Adv Hum Genet, 1988. 17: p. 141-99. 107. Azen, E.A., P. Latreille, and R.L. Niece, PRBI gene variants coding for length
and null polymorphisms among human salivary Ps, PmF, PmS, and Pe proline-
rich proteins (PRPs). Am J Hum Genet, 1993. 53(1): p. 264-78.
Bibliografia
73
108. Messana, I., et al., Characterization of the Human Salivary Basic Proline-Rich
Protein Complex by a Proteomic Approach. Journal of Proteome Research, 2004. 3(4): p. 792-800.
109. Helmerhorst, E.J., et al., Identification of Lys-Pro-Gln as a Novel Cleavage Site
Specificity of Saliva-associated Proteases. Journal of Biological Chemistry, 2008. 283(29): p. 19957-19966.
110. Chan, M. and A. Bennick, Proteolytic processing of a human salivary proline-
rich protein precursor by proprotein convertases. European Journal of Biochemistry, 2001. 268(12): p. 3423-3431.
111. Lu, Y. and A. Bennick, Interaction of tannin with human salivary proline-rich
proteins. Archives of Oral Biology, 1998. 43(9): p. 717-728. 112. Hagerman, A.E. and L.G. Butler, The specificity of proanthocyanidin-protein
interactions. Journal of Biological Chemistry, 1981. 256(9): p. 4494-4497. 113. Yan, Q. and A. Bennick, Identification of histatins as tannin-binding proteins in
human saliva. Biochem J, 1995. 311 ( Pt 1): p. 341-7. 114. Charlton, A.J., et al., Tannin interactions with a full-length human salivary
proline-rich protein display a stronger affinity than with single proline-rich
repeats. FEBS Letters, 1996. 382(3): p. 289-292. 115. Baxter, N.J., et al., Multiple Interactions between Polyphenols and a Salivary
Proline-Rich Protein Repeat Result in Complexation and Precipitation†. Biochemistry, 1997. 36(18): p. 5566-5577.
116. Hatton, M.N., et al., Masticatory lubrication. The role of carbohydrate in the
lubricating property of a salivary glycoprotein-albumin complex. Biochem J, 1985. 230(3): p. 817-20.
117. Levine, M.J., et al., Structural Aspects of Salivary Glycoproteins. Journal of Dental Research, 1987. 66(2): p. 436-441.
118. Nagata, K., et al., Purification and characterization of galactosephilic
component present on the cell surfaces of Streptococcus sanguis ATCC 10557. J Periodontol, 1983. 54(3): p. 163-72.
119. Gillece-Castro, B.L., et al., Structure and bacterial receptor activity of a human
salivary proline-rich glycoprotein. Journal of Biological Chemistry, 1991. 266(26): p. 17358-17368.
120. Ruhl, S., A.L. Sandberg, and J.O. Cisar, Salivary Receptors for the Proline-rich
Protein-binding and Lectin-like Adhesins of Oral Actinomyces and Streptococci. Journal of Dental Research, 2004. 83(6): p. 505-510.
121. Prakobphol, A., P.A. Murray, and S.J. Fisher, Bacterial adherence on replicas of
sodium dodecyl sulfate-polyacrylamide gels. Analytical Biochemistry, 1987. 164(1): p. 5-11.
122. Azen, E., A. Prakobphol, and S.J. Fisher, PRB3 null mutations result in absence
of the proline-rich glycoprotein Gl and abolish Fusobacterium nucleatum
interactions with saliva in vitro. Infect. Immun., 1993. 61(10): p. 4434-4439. 123. Bolstad, A., H. Jensen, and V. Bakken, Taxonomy, biology, and periodontal
aspects of Fusobacterium nucleatum. Clin. Microbiol. Rev., 1996. 9(1): p. 55-71.
124. Robinovitch, M.R., et al., Parotid salivary basic proline-rich proteins inhibit
HIV-1 infectivity. Oral Diseases, 2001. 7(2): p. 86-93. 125. Huang, C.-M., et al., A Peptide with a ProGln C Terminus in the Human Saliva
Peptidome Exerts Bactericidal Activity against Propionibacterium acnes. Antimicrob. Agents Chemother., 2008. 52(5): p. 1834-1836.
Análise filogenética de péptidos salivares
74
126. Oppenheim, F.G., et al., Histatins, a novel family of histidine-rich proteins in
human parotid secretion. Isolation, characterization, primary structure, and
fungistatic effects on Candida albicans. J Biol Chem, 1988. 263(16): p. 7472-7. 127. vanderSpek, J.C., et al., Localization of the genes for histatins to human
chromosome 4q13 and tissue distribution of the mRNAs. Am J Hum Genet, 1989. 45(3): p. 381-7.
128. Baum, B.J., et al., Studies on histidine-rich polypeptides from human parotid
saliva. Archives of Biochemistry and Biophysics, 1976. 177(2): p. 427-436. 129. Sabatini, L.M., et al., Tissue distribution of RNAs for cystatins, histatins,
statherin, and proline-rich salivary proteins in humans and macaques. J Dent Res, 1989. 68(7): p. 1138-45.
130. Troxler, R.F., et al., Structural relationship between human salivary histatins. J Dent Res, 1990. 69(1): p. 2-6.
131. Ahmad, M., et al., Immunocytochemical Localization of Histatins in Human
Salivary Glands. J. Histochem. Cytochem., 2004. 52(3): p. 361-370. 132. Helmerhorst, E.J., et al., Synthetic histatin analogues with broad-spectrum
antimicrobial activity. Biochem. J., 1997. 326(1): p. 39-45. 133. Sabatini, L.M., T. Ota, and E.A. Azen, Nucleotide sequence analysis of the
human salivary protein genes HIS1 and HIS2, and evolution of the STATH/HIS
gene family. Mol Biol Evol, 1993. 10(3): p. 497-511. 134. Jumblatt, M.M., et al., Glycoprotein 340 in Normal Human Ocular Surface
Tissues and Tear Film. Infect. Immun., 2006. 74(7): p. 4058-4063. 135. Oppenheim, F.G., et al., The primary structure and functional characterization
of the neutral histidine-rich polypeptide from human parotid secretion. J Biol Chem, 1986. 261(3): p. 1177-82.
136. Driscoll, J., et al., Functional Comparison of Native and Recombinant Human
Salivary Histatin 1. Journal of Dental Research, 1995. 74(12): p. 1837-1844. 137. Cabras, T., et al., Tyrosine Polysulfation of Human Salivary Histatin 1. A Post-
Translational Modification Specific of the Submandibular Gland. Journal of Proteome Research, 2007. 6(7): p. 2472-2480.
138. Castagnola, M., et al., A cascade of 24 histatins (histatin 3 fragments) in human
saliva. Suggestions for a pre-secretory sequential cleavage pathway. J Biol Chem, 2004. 279(40): p. 41436-43.
139. Sabatini, L.M. and E.A. Azen, Two coding change mutations in the HIS22 allele
characterize the salivary histatin 3-2 protein variant. Human Mutation, 1994. 4(1): p. 12-19.
140. Sugiyama, K. and K. Ogata, High-performance liquid chromatographic
determination of histatins in human saliva. Journal of Chromatography: Biomedical Applications, 1993. 619(2): p. 306-309.
141. Schenkels, L.C., E.C. Veerman, and A.V. Nieuw Amerongen, Biochemical
composition of human saliva in relation to other mucosal fluids. Crit Rev Oral Biol Med, 1995. 6(2): p. 161-75.
142. Helmerhorst, E.J., et al., Oral fluid proteolytic effects on histatin 5 structure and
function. Arch Oral Biol, 2006. 51(12): p. 1061-70. 143. Payne, J.B., et al., Selective effects of histidine-rich polypeptides on the
aggregation and viability of Streptococcus mutans and Streptococcus sanguis. Oral Microbiology and Immunology, 1991. 6(3): p. 169-176.
144. Bruno, L.S., et al., Two-hybrid analysis of human salivary mucin MUC7
interactions. Biochimica et Biophysica Acta (BBA) - Molecular Cell Research, 2005. 1746(1): p. 65-72.
Bibliografia
75
145. Mayhall, C.W., Concerning the composition and source of the acquired enamel
pellicle of human teeth. Archives of Oral Biology, 1970. 15(12): p. 1327-1341. 146. Hay, D.I., Fractionation of human parotid salivary proteins and the isolation of
an histidine-rich acidic peptide which shows high affinity for hydroxyapatite
surfaces. Arch Oral Biol, 1975. 20(9): p. 553-8. 147. Siqueira, W.L., et al., Evidence of Intact Histatins in the in vivo Acquired
Enamel Pellicle. Journal of Dental Research, 2010. 89(6): p. 626-630. 148. Jensen, J.L., M.S. Lamkin, and F.G. Oppenheim, Adsorption of human salivary
proteins to hydroxyapatite: a comparison between whole saliva and glandular
salivary secretions. J Dent Res, 1992. 71(9): p. 1569-76. 149. Hay, D.I., The interaction of human parotid salivary proteins with
hydroxyapatite. Archives of Oral Biology, 1973. 18(12): p. 1517-1528, IN5-IN6, 1529.
150. Pollock, J.J., et al., Fungistatic and fungicidal activity of human parotid salivary
histidine-rich polypeptides on Candida albicans. Infect Immun, 1984. 44(3): p. 702-7.
151. Xu, T., et al., Anticandidal activity of major human salivary histatins. Infect Immun, 1991. 59(8): p. 2549-54.
152. Gyurko, C., et al., Candida albicans Mutants Deficient in Respiration Are
Resistant to the Small Cationic Salivary Antimicrobial Peptide Histatin 5. Antimicrob. Agents Chemother., 2000. 44(2): p. 348-354.
153. Xu, T., et al., Primary structure and anticandidal activity of the major histatin
from parotid secretion of the subhuman primate, Macaca fascicularis. J Dent Res, 1990. 69(11): p. 1717-23.
154. Raj, P.A., M. Edgerton, and M.J. Levine, Salivary histatin 5: dependence of
sequence, chain length, and helical conformation for candidacidal activity. Journal of Biological Chemistry, 1990. 265(7): p. 3898-3905.
155. Helmerhorst, E.J., et al., Amphotericin B- and Fluconazole-Resistant Candida
spp., Aspergillus fumigatus, and Other Newly Emerging Pathogenic Fungi Are
Susceptible to Basic Antifungal Peptides. Antimicrob. Agents Chemother., 1999. 43(3): p. 702-704.
156. Tsai, H. and L.A. Bobek, Human salivary histatin-5 exerts potent fungicidal
activity against Cryptococcus neoformans. Biochimica et Biophysica Acta (BBA) - General Subjects, 1997. 1336(3): p. 367-369.
157. Driscoll, J., et al., Candidacidal activity of human salivary histatin recombinant
variants produced by site-directed mutagenesis. Gene, 1996. 177(1-2): p. 29-34. 158. Tsai, H. and L.A. Bobek, Human Salivary Histatins: Promising Anti-Fungal
Therapeutic Agents. Critical Reviews in Oral Biology & Medicine, 1998. 9(4): p. 480-497.
159. Fitzgerald, D.H., D.C. Coleman, and B.C. O'Connell, Susceptibility of Candida
dubliniensis to Salivary Histatin 3. Antimicrob. Agents Chemother., 2003. 47(1): p. 70-76.
160. MacKay, B.J., et al., Growth-inhibitory and bactericidal effects of human
parotid salivary histidine-rich polypeptides on Streptococcus mutans. Infect Immun, 1984. 44(3): p. 695-701.
161. Travis, J., et al., Porphyromonas gingivalis proteinases as virulence factors in
the development of periodontitis. Journal of Periodontal Research, 1997. 32(1): p. 120-125.
Análise filogenética de péptidos salivares
76
162. Murakami, Y., et al., Purification and characterization from human parotid
secretion of a peptide which inhibits hemagglutination of Bacteroides gingivalis
381. FEMS Microbiology Letters, 1990. 72(3): p. 275-279. 163. Murakami, Y., et al., Binding of a histidine-rich peptide to Porphyromonas
gingivalis. FEMS Microbiology Letters, 1991. 82(3): p. 253-256. 164. Murakami, Y., et al., Inhibitory effects of synthetic histidine-rich peptides on
haemagglutination by Bacteroides gingivalis 381. Archives of Oral Biology, 1990. 35(9): p. 775-777.
165. Murakami, Y., et al., Biological role of an arginine residue present in a
histidine-rich peptide which inhibits hemagglutination of Porphyromonas
gingivalis. FEMS Microbiology Letters, 1992. 98(1-3): p. 201-204. 166. Inoshita, E., et al., Isolation and some properties of exohemagglutinin from the
culture medium of Bacteroides gingivalis 381. Infect. Immun., 1986. 52(2): p. 421-427.
167. Murakami, Y., et al., Inhibitory effects of human salivary histatins and lysozyme
on coaggregation between Porphyromonas gingivalis and Streptococcus mitis. Infect. Immun., 1991. 59(9): p. 3284-3286.
168. Hancock, R.E.W. and G. Diamond, The role of cationic antimicrobial peptides
in innate host defences. Trends in Microbiology, 2000. 8(9): p. 402-410. 169. Sugiyama, K., Anti-lipopolysaccharide activity of histatins, peptides from
human saliva. Experientia, 1993. 49(12): p. 1095-7. 170. Sugiyama, K., T. Ogino, and K. Ogata, Rapid purification and characterization
of histatins (histidine-rich polypeptides) from human whole saliva. Archives of Oral Biology, 1990. 35(6): p. 415-419.
171. Sugiyama, K., Y. Suzuki, and H. Furuta, Isolation and characterization of
histamine-releasing peptides from human parotid saliva. Life Sciences, 1985. 37(5): p. 475-480.
172. Oudhoff, M.J., et al., Histatins are the major wound-closure stimulating factors
in human saliva as identified in a cell culture assay. FASEB J., 2008. 22(11): p. 3805-3812.
173. Azen, E.A., et al., mRNAs for PRPs, statherin, and histatins in von Ebner's
gland tissues. J Dent Res, 1990. 69(11): p. 1724-30. 174. Hay, D.I., et al., Relationship between concentration of human salivary statherin
and inhibition of calcium phosphate precipitation in stimulated human parotid
saliva. J Dent Res, 1984. 63(6): p. 857-63. 175. Sabatini, L.M., et al., cDNA cloning and chromosomal localization (4q11-13) of
a gene for statherin, a regulator of calcium in saliva. Am J Hum Genet, 1987. 41(6): p. 1048-60.
176. Schlesinger, D.H. and D.I. Hay, Complete covalent structure of statherin, a
tyrosine-rich acidic peptide which inhibits calcium phosphate precipitation from
human parotid saliva. J Biol Chem, 1977. 252(5): p. 1689-95. 177. Jensen, J.L., et al., Multiple forms of statherin in human salivary secretions.
Arch Oral Biol, 1991. 36(7): p. 529-34. 178. Sabatini, L.M., Y.Z. He, and E.A. Azen, Structure and sequence determination
of the gene encoding human salivary statherin. Gene, 1990. 89(2): p. 245-51. 179. Cabras, T., et al., HPLC-MS characterization of cyclo-statherin Q-37, a specific
cyclization product of human salivary statherin generated by transglutaminase
2. J Sep Sci, 2006. 29(17): p. 2600-8. 180. Li, J., et al., Statherin is an in vivo pellicle constituent: identification and
immuno-quantification. Archives of Oral Biology, 2004. 49(5): p. 379-385.
Bibliografia
77
181. Oppenheim, F.G., G.D. Offner, and R.F. Troxler, Phosphoproteins in the
parotid saliva from the subhuman primate Macaca fascicularis. Isolation and
characterization of a proline-rich phosphoglycoprotein and the complete
covalent structure of a proline-rich phosphopeptide. J Biol Chem, 1982. 257(16): p. 9271-82.
182. Schlesinger, D.H., D.I. Hay, and M.J. Levine, Complete primary structure of
statherin, a potent inhibitor of calcium phosphate precipitation, from the saliva
of the monkey, Macaca arctoides. Int J Pept Protein Res, 1989. 34(5): p. 374-80. 183. Rijnkels, M., et al., Multispecies comparative analysis of a mammalian-specific
genomic domain encoding secretory proteins. Genomics, 2003. 82(4): p. 417-432.
184. Manconi, B., et al., Structural characterization of a new statherin from pig
parotid granules. Journal of Peptide Science, 2010. 16(6): p. 269-275. 185. Berg, C.I.H., L. Lindh, and T. Arnebrant, Intraoral Lubrication of PRP-1,
Statherin and Mucin as Studied by AFM. Biofouling: The Journal of Bioadhesion and Biofilm Research, 2004. 20(1): p. 65 - 70.
186. Douglas, W.H., et al., Statherin: A major boundary lubricant of human saliva. Biochemical and Biophysical Research Communications, 1991. 180(1): p. 91-97.
187. Raj, P.A., et al., Salivary statherin. Dependence on sequence, charge, hydrogen
bonding potency, and helical conformation for adsorption to hydroxyapatite and
inhibition of mineralization. J Biol Chem, 1992. 267(9): p. 5968-76. 188. Gururaja, T., G. Naganagowda, and M. Levine, Solution structure of human
salivary statherin, in Peptides Frontiers of Peptide Science, J.P. Tam and P.T.P. Kaumaya, Editors. 2002, Springer Netherlands. p. 483-484.
189. Tamaki, N., et al., Comparison of inhibitory activity on calcium phosphate
precipitation by acidic proline-rich proteins, statherin, and histatin-1. Calcif Tissue Int, 2002. 71(1): p. 59-62.
190. Schwartz, S.S., D.I. Hay, and S.K. Schluckebier, Inhibition of calcium
phosphate precipitation by human salivary statherin: structure-activity
relationships. Calcif Tissue Int, 1992. 50(6): p. 511-7. 191. Goobes, G., et al., Folding of the C-terminal bacterial binding domain in
statherin upon adsorption onto hydroxyapatite crystals. Proceedings of the National Academy of Sciences, 2006. 103(44): p. 16083-16088.
192. Goobes, G., et al., The structure, dynamics, and energetics of protein
adsorption-lessons learned from adsorption of statherin to hydroxyapatite. Magn Reson Chem, 2008. 45(S1): p. S32-S47.
193. Amano, A., et al., Structural domains of Porphyromonas gingivalis recombinant
fimbrillin that mediate binding to salivary proline-rich protein and statherin. Infect Immun, 1996. 64(5): p. 1631-7.
194. Amano, A., et al., Salivary receptors for recombinant fimbrillin of
Porphyromonas gingivalis. Infect Immun, 1994. 62(8): p. 3372-80. 195. Nagata, H., et al., Role of the carboxyl-terminal region of Porphyromonas
gingivalis fimbrillin in binding to salivary proteins. Infect Immun, 1997. 65(2): p. 422-7.
196. Niemi, L.D. and I. Johansson, Salivary Statherin Peptide-Binding Epitopes of
Commensal and Potentially Infectious Actinomyces spp. Delineated by a Hybrid
Peptide Construct. Infect. Immun., 2004. 72(2): p. 782-787.
Análise filogenética de péptidos salivares
78
197. Stromberg, N., et al., Salivary receptors for GalNAc beta-sensitive adherence of
Actinomyces spp.: evidence for heterogeneous GalNAc beta and proline-rich
protein receptor properties. Infect. Immun., 1992. 60(8): p. 3278-3286. 198. Sekine, S., et al., Active domains of salivary statherin on apatitic surfaces for
binding to Fusobacterium nucleatum cells. Microbiology, 2004. 150(7): p. 2373-2379.
199. Xie, H., R.J. Gibbons, and D.I. Hay, Adhesive properties of strains of
Fusobacterium nucleatum of the subspecies nucleatum, vincentii and
polymorphum. Oral Microbiol Immunol, 1991. 6(5): p. 257-63. 200. Amano, A., et al., Binding of Porphyromonas gingivalis fimbriae to proline-rich
glycoproteins in parotid saliva via a domain shared by major salivary
components. Infect Immun, 1998. 66(5): p. 2072-7. 201. Li, T., et al., Strains of Actinomyces naeslundii andActinomyces viscosus Exhibit
Structurally Variant Fimbrial Subunit Proteins and Bind to Different Peptide
Motifs in Salivary Proteins. Infection and immunity, 1999. 67(5): p. 2053-2059. 202. Leito, J.T.D., et al., Identification of salivary components that induce transition
of hyphae to yeast in Candida albicans. FEMS Yeast Research, 2009. 9(7): p. 1102-1110.
203. Raj, P.A., L. Rajkumar, and A.R. Dentino, Novel molecules for intra-oral
delivery of antimicrobials to prevent and treat oral infectious diseases. Biochem J, 2008. 409(2): p. 601-9.
204. Barrett, A.J., The cystatins: a new class of peptidase inhibitors. Trends in Biochemical Sciences, 1987. 12: p. 193-196.
205. Barrett, A.J., et al., Nomenclature and classification of the proteins homologous
with the cysteine-proteinase inhibitor chicken cystatin. Biochem J, 1986. 236(1): p. 312.
206. Turk, V. and W. Bode, The cystatins: protein inhibitors of cysteine proteinases. FEBS Lett, 1991. 285(2): p. 213-9.
207. Saitoh, E., et al., Human cysteine-proteinase inhibitors: nucleotide sequence
analysis of three members of the cystatin gene family. Gene, 1987. 61(3): p. 329-338.
208. Salvesen, G., et al., Human low-Mr kininogen contains three copies of a cystatin
sequence that are divergent in structure and in inhibitory activity for cysteine
proteinases. Biochem J, 1986. 234(2): p. 429-34. 209. Abrahamson, M., Cystatins. Methods Enzymol, 1994. 244: p. 685-700. 210. Dickinson, D.P., Salivary (SD-type) cystatins: over one billion years in the
making--but to what purpose? Crit Rev Oral Biol Med, 2002. 13(6): p. 485-508. 211. Bode, W., et al., The 2.0 A X-ray crystal structure of chicken egg white cystatin
and its possible mode of interaction with cysteine proteinases. EMBO J, 1988. 7(8): p. 2593-9.
212. Takeda, A., S. Kobayashi, and T. Samejima, Isolation and Characterization of
Two Thiol Proteinase Inhibitors of Low Molecular Weight from Newborn Rat
Epidermis. J Biochem, 1983. 94(3): p. 811-820. 213. Turk, B., I. Krizaj, and V. Turk, Isolation and characterization of bovine stefin
B. Biol Chem Hoppe Seyler, 1992. 373(7): p. 441-6. 214. Turk, B., et al., Identification of bovine stefin A, a novel protein inhibitor of
cysteine proteinases. FEBS Letters, 1995. 360(2): p. 101-105. 215. Lenarcic, B., et al., Pig leukocyte cysteine proteinase inhibitor (PLCPI), a new
member of the stefin family. FEBS Letters, 1993. 336(2): p. 289-292.
Bibliografia
79
216. Kondo, H., et al., Inhibitory effect of oryzacystatins and a truncation mutant on
the replication of poliovirus in infected Vero cells. FEBS Letters, 1992. 299(1): p. 48-50.
217. Grzonka, Z., et al., Structural studies of cysteine proteases and their inhibitors. Acta Biochim Pol, 2001. 48(1): p. 1-20.
218. Freije, J.P., et al., Localization of the human cystatin D gene (CST5) to
chromosome 20p11.21 by in situ hybridization. Cytogenet Cell Genet, 1993. 62(1): p. 29-31.
219. Warfel, A.H., et al., Constitutive secretion of cystatin C (gamma-trace) by
monocytes and macrophages and its downregulation after stimulation. J Exp Med, 1987. 166(6): p. 1912-7.
220. Moroi, R., et al., Immunocytochemical study of cathepsin L and rat salivary
cystatin-3 in rat osteoclasts treated with E-64 in vivo. Archives of Oral Biology, 1997. 42(4): p. 305-315.
221. Dickinson, D.P., CYSTEINE PEPTIDASES OF MAMMALS: THEIR
BIOLOGICAL ROLES AND POTENTIAL EFFECTS IN THE ORAL CAVITY
AND OTHER TISSUES IN HEALTH AND DISEASE. Critical Reviews in Oral Biology & Medicine, 2002. 13(3): p. 238-275.
222. Rawlings, N.D. and A.J. Barrett, Evolution of proteins of the cystatin
superfamily. Journal of Molecular Evolution, 1990. 30(1): p. 60-71. 223. Saitoh, E. and S. Isemura, Molecular biology of human salivary cysteine
proteinase inhibitors. Crit Rev Oral Biol Med, 1993. 4(3-4): p. 487-93. 224. Brown, W.M. and K.M. Dziegielewska, Friends and relations of the cystatin
superfamily--new members and their evolution. Protein Sci, 1997. 6(1): p. 5-12. 225. Brillard-Bourdet, M., et al., Purification and characterization of a new cystatin
inhibitor from Taiwan cobra (Naja naja atra) venom. Biochem. J., 1998. 331(1): p. 239-244.
226. Ni, J., et al., Cystatin F is a glycosylated human low molecular weight cysteine
proteinase inhibitor. J Biol Chem, 1998. 273(38): p. 24797-804. 227. Margis, R., E.M. Reis, and V. Villeret, Structural and Phylogenetic
Relationships among Plant and Animal Cystatins. Archives of Biochemistry and Biophysics, 1998. 359(1): p. 24-30.
228. Lamkin, M.S., et al., Salivary cystatin SA-III, a potential precursor of the
acquired enamel pellicle, is phosphorylated at both its amino- and carboxyl-
terminal regions. Arch Biochem Biophys, 1991. 288(2): p. 664-70. 229. Bobek, L.A. and M.J. Levine, Cystatins--inhibitors of cysteine proteinases. Crit
Rev Oral Biol Med, 1992. 3(4): p. 307-32. 230. Isemura, S., E. Saitoh, and K. Sanada, Characterization and amino acid
sequence of a new acidic cysteine proteinase inhibitor (cystatin SA) structurally
closely related to cystatin S, from human whole saliva. J Biochem, 1987. 102(4): p. 693-704.
231. Isemura, S., et al., Identification of full-sized forms of salivary (S-type) cystatins
(cystatin SN, cystatin SA, cystatin S, and two phosphorylated forms of cystatin S)
in human whole saliva and determination of phosphorylation sites of cystatin S. J Biochem, 1991. 110(4): p. 648-54.
232. Ramasubbu, N., et al., Large-scale purification and characterization of the
major phosphoproteins and mucins of human submandibular-sublingual saliva. Biochem J, 1991. 280 ( Pt 2): p. 341-52.
Análise filogenética de péptidos salivares
80
233. Balbín, M., et al., A sequence variation in the human cystatin D gene resulting
in an amino acid (Cys/Arg) polymorphism at the protein level. Human Genetics, 1993. 90(6): p. 668-669.
234. Grubb, A. and H. Lofberg, Human gamma-trace, a basic microprotein: amino
acid sequence and presence in the adenohypophysis. Proc Natl Acad Sci U S A, 1982. 79(9): p. 3024-7.
235. Abrahamson, M., et al., Molecular cloning and sequence analysis of cDNA
coding for the precursor of the human cysteine proteinase inhibitor cystatin C. FEBS Letters, 1987. 216(2): p. 229-233.
236. Abrahamson, M., et al., Hereditary cystatin C amyloid angiopathy:
identification of the disease-causing mutation and specific diagnosis by
polymerase chain reaction based analysis. Hum Genet, 1992. 89(4): p. 377-80. 237. Freije, J.P., et al., Structure and expression of the gene encoding cystatin D, a
novel human cysteine proteinase inhibitor. J Biol Chem, 1991. 266(30): p. 20538-43.
238. Freije, J.P., et al., Human cystatin D. cDNA cloning, characterization of the
Escherichia coli expressed inhibitor, and identification of the native protein in
saliva. J Biol Chem, 1993. 268(21): p. 15737-44. 239. Dickinson, D.P., M. Thiesse, and M.J. Hicks, Expression of Type 2 Cystatin
Genes CST1-CST5 in Adult Human Tissues and the Developing Submandibular
Gland. DNA and Cell Biology, 2002. 21(1): p. 47-65. 240. Abrahamson, M., et al., Isolation of six cysteine proteinase inhibitors from
human urine. Their physicochemical and enzyme kinetic properties and
concentrations in biological fluids. J Biol Chem, 1986. 261(24): p. 11282-9. 241. Shaw, P.A., et al., Cloning and sequencing of cDNA encoding a rat salivary
cysteine proteinase inhibitor inducible by beta-adrenergic agonists. J Biol Chem, 1988. 263(34): p. 18133-7.
242. Minakata, K. and M. Asano, New protein inhibitors of cysteine proteinases in
human saliva and salivary glands. Hoppe Seylers Z Physiol Chem, 1984. 365(3): p. 399-403.
243. Isemura, S., E. Saitoh, and K. Sanada, Characterization of a new cysteine
proteinase inhibitor of human saliva, cystatin SN, which is immunologically
related to cystatin S. FEBS Lett, 1986. 198(1): p. 145-9. 244. Sandholm, L., Proteases and their inhibitors in chronic inflammatory
periodontal disease. J Clin Periodontol, 1986. 13(1): p. 19-26. 245. Eley, B.M. and S.W. Cox, Cathepsin B/L-, elastase-, tryptase-, trypsin- and
dipeptidyl peptidase IV-like activities in gingival crevicular fluid: correlation
with clinical parameters in untreated chronic periodontitis patients. J Periodontal Res, 1992. 27(1): p. 62-9.
246. Socransky, S.S., et al., New concepts of destructive periodontal disease. J Clin Periodontol, 1984. 11(1): p. 21-32.
247. Eley, B.M. and S.W. Cox, Advances in periodontal diagnosis. 7. Proteolytic and
hydrolytic enzymes link with periodontitis. Br Dent J, 1998. 184(7): p. 323-8. 248. Machleidt, W., et al., Mechanism of inhibition of papain by chicken egg white
cystatin: Inhibition constants of N-terminally truncated forms and cyanogen
bromide fragments of the inhibitor. FEBS Letters, 1989. 243(2): p. 234-238. 249. Schwabe, C., et al., Cystatin. Amino acid sequence and possible secondary
structure. Biochem J, 1984. 217(3): p. 813-7.
Bibliografia
81
250. Alvarez-Fernandez, M., et al., Inhibition of mammalian legumain by some
cystatins is due to a novel second reactive site. J Biol Chem, 1999. 274(27): p. 19195-203.
251. Lamkin, M.S. and F.G. Oppenheim, Structural Features of Salivary Function. Critical Reviews in Oral Biology & Medicine, 1993. 4(3): p. 251-259.
252. Al-Hashimi, I. and M.J. Levine, Characterization of in vivo salivary-derived
enamel pellicle. Archives of Oral Biology, 1989. 34(4): p. 289-295. 253. Johnsson, M., et al., The effects of human salivary cystatins and statherin on
hydroxyapatite crystallization. Arch Oral Biol, 1991. 36(9): p. 631-6. 254. Shomers, J.P., et al., Characterization of cysteine-containing phosphoproteins
from human submandibular-sublingual saliva. J Dent Res, 1982. 61(6): p. 764-7.
255. Shomers, J.P., et al., The isolation of a family of cysteine-containing
phosphoproteins from human submandibular-sublingual saliva. J Dent Res, 1982. 61(8): p. 973-7.
256. Shomers, J.P., et al., Properties of cysteine-containing phosphoproteins from
human submandibular-sublingual saliva. J Dent Res, 1982. 61(2): p. 397-9. 257. Bell, J.E., et al., Examination of the potential structure of human salivary
cystatins based on computer modelling. Archives of Oral Biology. 42(10-11): p. 761-772.
258. Bjorck, L., A. Grubb, and L. Kjellen, Cystatin C, a human proteinase inhibitor,
blocks replication of herpes simplex virus. J Virol, 1990. 64(2): p. 941-3. 259. Collins, A.R. and A. Grubb, Inhibitory effects of recombinant human cystatin C
on human coronaviruses. Antimicrob. Agents Chemother., 1991. 35(11): p. 2444-2446.
260. Ruzindana-Umunyana, A. and J.M. Weber, Interactions of human lacrimal and
salivary cystatins with adenovirus endopeptidase. Antiviral Research, 2001. 51(3): p. 203-214.
261. Graur, D. and W.H. Li, Fundamentals of molecular evolution. 2000: Sinauer. 262. Hillis, D.M., C. Moritz, and B. Mable, Molecular systematics. 1996, Sinauer
Associates. p. p.407-514. 263. Baxevanis, A. and B. Ouellette, Bioinformatics: a practical guide to the analysis
of genes and proteins. 2001: Wiley-Interscience. 264. Feng, D.-F. and R. Doolittle, Progressive sequence alignment as a
prerequisitetto correct phylogenetic trees. Journal of Molecular Evolution, 1987. 25(4): p. 351-360.
265. Smith, T.F. and M.S. Waterman, Identification of common molecular
subsequences. J Mol Biol, 1981. 147(1): p. 195-7. 266. Brudno, M., et al., Glocal alignment: finding rearrangements during alignment.
Bioinformatics, 2003. 19(suppl 1): p. i54-i62. 267. Altschul, S.F., et al., Basic local alignment search tool. J Mol Biol, 1990.
215(3): p. 403-10. 268. Larkin, M.A., et al., Clustal W and Clustal X version 2.0. Bioinformatics, 2007.
23(21): p. 2947-2948. 269. Thompson, J.D., D.G. Higgins, and T.J. Gibson, CLUSTAL W: improving the
sensitivity of progressive multiple sequence alignment through sequence
weighting, position-specific gap penalties and weight matrix choice. Nucleic Acids Res, 1994. 22(22): p. 4673-80.
Análise filogenética de péptidos salivares
82
270. Dayhoff, M.O., R.M. Schwartz, and B.C. Orcutt, {A model of evolutionary
change in proteins}. Atlas of protein sequence and structure, 1978. 5(suppl 3): p. 345-351.
271. Altschul, S.F., Amino acid substitution matrices from an information theoretic
perspective. Journal of Molecular Biology, 1991. 219(3): p. 555-565. 272. Henikoff, S. and J.G. Henikoff, Amino acid substitution matrices from protein
blocks. Proc Natl Acad Sci U S A, 1992. 89(22): p. 10915-9. 273. Henikoff, S. and J.G. Henikoff, Automated assembly of protein blocks for
database searching. Nucleic Acids Research, 1991. 19(23): p. 6565-6572. 274. Saitou, N. and M. Nei, The neighbor-joining method: a new method for
reconstructing phylogenetic trees. Mol Biol Evol, 1987. 4(4): p. 406-25. 275. Huelsenbeck, J.P., Performance of Phylogenetic Methods in Simulation.
Systematic Biology, 1995. 44(1): p. 17-48. 276. Efron, B., Bootstrap Methods: Another Look at the Jackknife. The Annals of
Statistics, 1979. 7(1): p. 1-26. 277. Felsenstein, J., Confidence Limits on Phylogenies: An Approach Using the
Bootstrap. Evolution, 1985. 39(4): p. 783-791. 278. Hillis, D.M. and J.J. Bull, An Empirical Test of Bootstrapping as a Method for
Assessing Confidence in Phylogenetic Analysis. Systematic Biology, 1993. 42(2): p. 182-192.
279. Kumar, S., et al., MEGA: A biologist-centric software for evolutionary analysis
of DNA and protein sequences. Briefings in Bioinformatics, 2008. 9(4): p. 299-306.
280. Ferreira, F.D., et al., Differential expression of proline-rich proteins in rabbit
salivary glands. Journal of Histochemistry & Cytochemistry, 1992. 40(9): p. 1393-404.
281. Fanali, C., et al., Mass spectrometry strategies applied to the characterization of
proline-rich peptides from secretory parotid granules of pig (Sus scrofa). Journal of Separation Science, 2008. 31(3): p. 516-522.
282. Goobes, R., et al., Thermodynamics of Statherin Adsorption onto
Hydroxyapatite†. Biochemistry, 2006. 45(17): p. 5576-5586. 283. Naganagowda, G.A., T.L. Gururaja, and M.J. Levine, Delineation of
conformational preferences in human salivary statherin by 1H, 31P NMR and
CD studies: sequential assignment and structure-function correlations. J Biomol Struct Dyn, 1998. 16(1): p. 91-107.
284. Gibson, J.M., et al., A REDOR NMR Study of a Phosphorylated Statherin
Fragment Bound to Hydroxyapatite Crystals. Journal of the American Chemical Society, 2005. 127(26): p. 9350-9351.
285. Long, J.R., et al., A peptide that inhibits hydroxyapatite growth is in an extended
conformation on the crystal surface. Proc Natl Acad Sci U S A, 1998. 95(21): p. 12083-7.
286. Long, J.R., et al., Structure and dynamics of hydrated statherin on
hydroxyapatite as determined by solid-state NMR. Biochemistry, 2001. 40(51): p. 15451-5.
287. Raghunathan, V., et al., Homonuclear and Heteronuclear NMR Studies of a
Statherin Fragment Bound to Hydroxyapatite Crystals. The Journal of Physical Chemistry B, 2006. 110(18): p. 9324-9332.
288. Ramasubbu, N., et al., Structural Characteristics of Human Salivary Statherin:
A Model for Boundary Lubrication at the Enamel Surface. Critical Reviews in Oral Biology & Medicine, 1993. 4(3): p. 363-370.
Bibliografia
83
289. Shaw, W.J., et al., A Solid State NMR Study of Dynamics in a Hydrated Salivary
Peptide Adsorbed to Hydroxyapatite. Journal of the American Chemical Society, 2000. 122(29): p. 7118-7119.
290. Shaw, W.J., et al., Determination of Statherin N-Terminal Peptide Conformation
on Hydroxyapatite Crystals. Journal of the American Chemical Society, 2000. 122(8): p. 1709-1716.
291. Wikiel, K., et al., Hydroxyapatite mineralization and demineralization in the
presence of synthetic phosphorylated pentapeptides. Archives of Oral Biology, 1994. 39(8): p. 715-721.
292. Marina, L., M. Oriano, and A.P. Lorenzo, Rat Liver Golgi Apparatus Contains a
Protein Kinase Similar to the Casein Kinase of Lactating Mammary Gland. European Journal of Biochemistry, 1997. 243(3): p. 719-725.
293. Kochanska, B., et al., The effect of statherin and its shortened analogues on
anaerobic bacteria isolated from the oral cavity. Acta Microbiol Pol, 2000. 49(3-4): p. 243-51.
85
AAnneexxooss
Anexos
87
Tabela 2 Representação das sequências de PRPs recolhidas das bases de dados
Organismo
Acesso Nome Gene Sequência Tamanho
Ailuropoda
melanoleuca
ENSAMEP00000002166 SHPVPSGPPPXXPPRGPEPGPTTRTRTFASDSKGSPNQEHTRGPHTPVPASAAGMGCPAARSTGPPSPGHAGQGAREGHSAQRRPGTGQRPGPASQGLRLCCQPPRVHFHMAPGKNVLVPTRPGKEGAAFPKSCPLSWPRPFCPSAAQLPLG
305
Bos taurus
G3N0R9
Uncharacterized
protein
MLLILLSVALLALSSAQDPVSVLEPESSTYAFSQPDSESQLTGYDFQRPPLQGDEAEQETPLEDGKHHHRLPPKDGKPHHRPPAQGDEAEQEPPTQGDDNEQGTPPEHGKHHHRPPPKDGKPHHRPPPKDDKPHHRPPPPGDEAQPGQPPQDGEPEQVPSSQNGEPQQGRLSGRGLRNRSSPPPPPERNHGPLPQDGQRRQGRPPEDGEQQQGPSSQENQPQWEPSSSDGKPQDPPHKMGNNSRDHPLQEGQPQQRPPPPRDPPNGCSPPPPPGRSQIPPPPGHGPQRPPQGSPPQ
296
F1N4B8 Uncharacterized
protein
KSRASSKMLLILLSVALLALSSAQDPVSDRNSEEFLSNIPDFQRPPLQGDEAEQETPLEDGKHHHRLPPKDGKPHHRPPAQGDEAEQEPPTQGDDNEQGTPPEHGKHHHRPPPKDGKPHHRPPPKDDKPHHRPPPPGDEAQPGQPPQDGEPEQVPSSQNGEPQQGRPPEDGEQQQGPSSQENQPQWEPSSSDGKPQQEPHPTPTDPPHKMGNNSRDHPLQEGQPQQRPPPPRDPPNGCSPPPPPGRSQIPPPPGHGPQRPPQGSPPQ
267
Callithrix
jacchus
F7GZ58 Uncharacterized
protein
LOC100412507 MLLILLSVALLALGSAQSLNEDVSQEQLPSVISGKSQPPPQEGNKPQGPPPPPGKPQGPPPPGGHPQRPPPPPAGKPQGPPPPPQGGRPPRSLQGPLPQGPPPPPEGRRPPRSLQGLPPQGPPPPQSLQGPPPQGPPPPGPPPPGPPPPQGGRPPRSLQGPPPQRPPLQGPPSQPPPQEGHKPQGPPPPPGKPQGPPPPGGHPQKPHPPPAGKPPGPPPPGGHPQKPHPPPAGKPEGTPAPPQESKPPKPPQEQ
254
F7IGY3 Uncharacterized
protein
LOC100412507 MLLILLSVALLALGSAQSLNEGKTEGGEDAVTVVGDGGDSNQSSDEKPQKPPFGGRPPKPPAGNGSQDDGPPHRPPPQEGNKPQGPPPPPGKPQGPPPPGGHPQRPPPPPAGKPQGPPPPPQGPPPPPGKPQGPPPPGGHPQKPHPPPAGKPPGPPPPGGHPQKP
165
F7IGV1 Uncharacterized
protein
LOC100412507 MLLILLSVALLALSSAQSLNEDVSQEQLPSVISDGGDSNQSSEEKPQRPPFGGRPPKPPAGNGSQDERPPHRPPPQEGHKPQGPPPPPGKPQGPPPPGGHPQKPHPPPAGKPPGPPPPGGHPQKPHPPPAGKPE
134
F7I094 Uncharacterized
protein
LOC100412507 MLLILLSVALLALGSAQSLNEDVSQEQLPSVISDGGDSNQSSDEKPQKPPFGGRPPKPPAGNGSQDDGPPHRPPPQEGNKPQGPPPPPGKPQGPPPPGGPPPPPGKPQGPPPPGGHPQKPHPPPAGKPPGPPPPGGHPQKPHPPPAGKPEGTPAPPQESKPPKPPQEQLSE
171
XP_002752222 PREDICTED:
hypothetical protein
LOC100412507
LOC100412507 MLLILLSVALLALSSAQSLNEDVSQEQLPSVISDGGDSNQSSEEKPQRPPFGGRPPKPPAGNGSQDERPPHRPPPQEGHKPQGPPPPPGKPQGPPPPGGHPQKPHPPPAGKPPGPPPPGGHPQKPHPPPAGKPEGTPAPPQESKPPKPPQEQLSE
155
Anexos
88
Organismo
Acesso Nome Gene Sequência Tamanho
Callithrix
jacchus
XP_002752225 PREDICTED:
hypothetical protein
LOC100415384
LOC100415384 MEQSELRRELPIQDTERTFGNLIVYCPTVRTKVKIKGAAMFLSHKAGSNTRASCKMLVILLSVALLAVSSAQSLYEDDNQEDVPSLISDAGDSYQSPDEESQKPPLGEDPPAGDENQDDGPQQGPPPQGGRHHHGPPPPPGKPQGPHPQGGHHHHGPPPPPGKPQGGHHHHGPPPPPGKPQGGHHHHGPPPPPGKPQGPPPQGGHHHHGPPPPPGKPQGPPPQQGQPPQ
229
XP_002752224 PREDICTED:
hypothetical protein
LOC100415016
LOC100415016 MLVILLSVALLAVSSAQSLYEDDNQEDVPSLISDAGDSYQSPDEESQKSPLGEDPPAEDENQDDGPQQGPPPQGGRHHHRPPPPPGKPQGPHPQGGHHHHGPPPPPGKPQGGHHHHARRQSSHYLPAEAPPCYRGVHPVAVGLRPVAVGCALLLLAPPCWRSLSVMAGCLGNSWLRQQWECTSVGTECLGHPDQCILCGVPLRCGDGLNGCASRKGCAGIPCLSYTWVFPRSVGNKDPSGNALGLTLCTFTESCNPELFLLP
262
XP_002763688 PREDICTED:
hypothetical protein
LOC100398712
LOC100398712 MLLILLSVALLALGSAQSLNEDVSQEQLPSVISDGGDSNQSSDEKPQRPPFGGLPPKPPAGNGSQDDGPQRPPPQEGHKPQGPPPPPGKPQGPPPPGGHPQRPPPPPAGKPQGPPPPPQGGRPPRSLQGPPPKGPPPRGPPLQGPPPPPQGGRPPRSLQGPPPQGPPPQGPPPQGPPPQGPPPQGRPPQGPPPQGPPPQGQPPQGPPPQGPPPQGPPPPPQGGRPPRSLQGPSPQGPPPQGPPPQGRPPQGPPPQGPPPQGQPPQGPPPQGPPPQGPPPPPQGGRPPRSLQRPPPQGPPPQGRPPQGQPPLGPPPQGPPPQGPPPQGQPPQGPPPQGPPPPPQGGRPPRSLQGPSPQGPPPQGPPPQGPPPQGPPPQRQPPQGPPPQGPRPQGPPPPPQGGRPPRSLQGPPPQGPPPQGPPPQGPPPQGRPPQGPPPQGQPPQGPPPQGPPPQGPPPPPRGEGPPRSLQGPPPQGPPPQGPPPHGPFQ
489
XP_002752221 PREDICTED:
hypothetical protein
LOC100412163
LOC100412163 MLLILLSVALLALGSAQSLNEDVSQEQLPSVISDGGDSNQSSDEKPQKPPFGGRPPKPPAGNGSQDDGPPHRPPPQEGNKPQGPPPPPGPQGPPPPGGHPQRPPPPPAGKPQGPPPPPQGGRPPRSLQAGRPPRSLQGPPPQGPPPQGPPPQGPPPPPQGGRPPRSLQGPPPQGPPPPQEGRPPRSLQGPPPQGPPPPGPPPPGPPPPQGGRPPRSLQGPPPQRPPLQGPPSQ
234
Canis
familiaris
F1Q0L0 Uncharacterized
protein
SAATGQALGRRPSGGSGPRPRPVLRGEDTGRPTGTRNMTQQPRPDPRLPGGPPPRSASEKPPPSPAANEKPLPRSANEKPPPSPAANEKPPPHSASEKPPPSPAANEKPPPHSASEKPPPPYCNPRPGFPDKTPCSGGRESQGEAERPGRPAGGRIQQPSQGASLHAGPLSQEGLPEGCCTRGQAGTPSPHPRTGKGPASPVASGSRRAGDPPVPAAAPAVLPRPGEAPPGPPLPDLPPAPGEGPAQPHPPDKPGPTPEAEARSPAHPGEAQRVP
275
F1P7E0 Uncharacterized
protein
PPPGGRTPVSPPPGGRTPVSPPPGGRTPVSPPPGGRIPVSPPPGGRTPVSPPPGGRIPVSPPPGGRTPVSPPPGGRTPVSPPPGGRPPAPLPQVGGPRPPLPQVGGPRSPLPQVGGPRSPLPQVGGSRSPLPQVGGPRSPLPQVGGPRSPLPQVGGPPLPSPQMGGRTPVSPPPGGRPPVSPPPRWTAPGPPGERTPVSPPPRWAAPRSPPPGEGPRPPLPQVGGPRSPLPQVGGRSPLPQVGGRTPGLPSPQEGGPVPTTGRNPPPR
269
Anexos
89
Organismo
Acesso Nome Gene Sequência Tamanho
Canis
familiaris
ENSCAFP00000032468 HPGLHRSEPERTGVLPAGPQRPGQRCPPRPGSAPSRAWGVPCPTPALQQSLPPLLEGGSQEIPLPTNKTPAGPPPPGSPNPPSTAPSNPGKTGNQDSKGSPQQTHTRGSHRCTPASASGACLTAAPSQGPPSPGHPHAPAALSDPSFSRRPPSQRGAEPRGLRTEAQPPRVHPGPAGRAVVAVPPRPGQSHLPPAVRAPDSTSHRFHDGGAQDGPGEGEPRCLSTGAGRPGEGWGPPPEGVNQGHPPSLPGDPCPPPEGSPVFLPQPGRGVPPPWGRALDQAGRLLGDPAPGGRPSQPPPPGAHRGPPRGGGAQCAEPPMRFLGVGSPGVGGRTRVHPPKKLHPRPRPQPLPGLPPRSPHPGPPPQGLPPRASPPRASPPGPP
383
ENSCAFP00000030671 HLRTHTWSPRVSAHPAFCSPGPGAPGWGDPGSAAGGAAPAQTPAPPPAPLAVVPPGGVTPSQPRSALLKPPAPPRPRQPPPRERPPPRGPGTRPWPRRPPKRTAREARPPRGGVHGLPPGPGARPPLGAGCTASPREEGARSPPTPRKRGAQPHPPPSRVHAPPGAGCTASPPPPQHGAGSPWSGVHGLSPTPAGCRVSMERGARPPPHPSRVQGLPGAGCTAFPPQQGAHPLPPSGVQGLPPRGAGCTPPPAGCPPTGSPRPRPRRRPRRRMAPRPRPAGRPRKKKRSASPSRSPSSLAGAPARVQSGRPPGGG
315
ENSCAFP00000035521 ALRAALQILTEGLLFAEPPVVRLGCPPTRPPLPHQGHIPDPPSSSRALGARGRGGPRSGAPAALEAPASLPGPPEPQGVPSALHPHCLPRSPKPPGGPEQGPQGLSPPRGKTSRPQGPSPPEGPAMVGQHPPPPRLGGGDTGPQNPPPPIVSGPLWPPLAPSGQGISGGLPAAPASPTCVPPGWGLGQSPPGGPGWPRGLVGGGRRGSRGPSCLARGPPAKGRQPPAPERPQSEPPQGRPGLSQPLRLSPPPPPASCCHPDPSPPAGGFPQGEPEPAQAGLPQGPAAGQRP
291
Gorilla gorilla
gorilla
G3S043 Uncharacterized
protein
PRH1 MLLILLSVALLAFSSAQDLNEDVSQEDVPLVISDGGDSEQFLDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPPPPRGRPQGPPQQGGHPRPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQPPQ
166
G3SCR9 Uncharacterized
protein
PRH1 MLLILLSVALLAFSSAQDLNEDVSQEDVPLVISDGGDSEQFLDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPPPQGRPQGPPQQGGHPPPPQGRPQGPPQQGGHPRPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQPPQ
166
Gorilla gorilla
gorilla
G3RBW4 Uncharacterized
protein
PRH2 MLLILLSVALLAFSSAQDLDEDVSQEDVPLVISDGGDSEQFLDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPHPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQPPQ
149
G3QHE7
Uncharacterized
protein
PRR4 MLLVLLSVVLLALSSAQSTDNDVNYEDFTFTIPDVEDSSQRPDQGPQRPPPEGLLPRPPGDSGNQDDGPQQRPPQPGGHHRHPPPPPFQNQQRPPRRGHRQLSLPRFPSVSLQEASSFFWRDRPARHSQEQPLW
134
Anexos
90
Organismo
Acesso Nome Gene Sequência Tamanho
Gorilla gorilla
gorilla
G3RWV9 Uncharacterized
protein
MLLILLSVGLLALSSAQNLNEDVSQEESPSLIAGNPQGAPPQGDNQPQGPPPPPGKPQGPPPQGDKSRSARSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGDKSRSARSPPEKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGDKSRSARSPPGKPQGPPPQGDNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDNKSRSARSPPEKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDSNSRSARSPPGKPQGPPPQGGNQPQGPPSPPGNPQGPPPQGGNQPQGPPPPPGKPQGPPPQGDKSRSARSPPGKPQGPPQQEGNNPQGPPPPAGGNPQQPQAPPAGQPQGPPPPPQGGRPSRPPQ
416
G3RMU1 Uncharacterized
protein
ENSG0000012
1335 MLLILLSVGLLALSSAQNLNEDVSQEESPSLIAGKPQGPPPQGDNQPQGPPPPPGKPQGPPPQGDKSRSARSPPEKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDKSRSARSPPGNPQGPPPQGGNQPQGPPPPPGKPQGPPPQGDKSRSARSPPGKPQGPPPQGDKSRSARSPPGNPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGDNKSRSARSPPEKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDSNSRSARSPPGKPQGPPPQGGNQPQGPPSPPGNPQGPPPQGGNQPQGPPPPPGKPQGPPPQGDKSRSARSPPGKPQGPPQQEGNNPQGPPPPAGGNPQQPQAPPAGQPQGPPPPPQGGRPSRPPQ
415
G3S0G6 Uncharacterized
protein
PRB4 MLLILLSVALLALSSAESSSEDVSQEESLFLISGKPEGRHPQGGNQSQGPPPHPGKPERPPPQGGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGPPSPPGKPQGPPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGPPHHPGKPEGPPPQGGNKSRSARSPPGKPQGPPQQEGNKPQGPPPPGKPQGPPPAGGNPQQPQAPPAGKPQGPPPPPQGGRPPRPAQGQQPPQ
257
G3RTV7 Uncharacterized
protein
PRB4 MLLILLSVALLALSSAQSLNEDVSQEESPSVISVPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSHGPPPHPGKPEGQTPQGGNQSQGLPPHPGKPEGPPPQGGNRSQGPPPRPGKPEGQSPQGGNQSQGPPSRQGKPEGTPQEGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPRPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ
250
G3QEF1 Uncharacterized
protein
PRB4 MLLILLSVALLALSSAESSSEDVSQEESLFLISGKPEGRHPQGGNQSQGPPPHPGKPERPPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGPPHRPGKPEGPPPQGGNKSRSARSPPGKPQGPPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGPPHRPGKPEGPPPQGGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPHPGKPEGPPPQGGNKPQGPPPRPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ
309
Anexos
91
Organismo
Acesso Nome Gene Sequência Tamanho
Homo sapiens
P02810 RecName:
Full=Salivary acidic
proline-rich
phosphoprotein 1/2;
PRH1
PRH2 MLLILLSVALLAFSSAQDLDEDVSQEDVPLVISDGGDSEQFIDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPPPPQGRPQGPPQQGGHPRPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQSPQ
166
P04280 Basic salivary
proline-rich protein 1
PRB1 MLLILLSVALLALSSAQNLNEDVSQEESPSLIAGNPQGPSPQGGNKPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDKSRSPRSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDKSQSPRSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDKSQSPRSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPQQGGNRPQGPPPPGKPQGPPPQGDKSRSPQSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPAQGGSKSQSARAPPGKPQGPPQQEGNNPQGPPPPAGGNPQQPQAPPAGQPQGPPRPPQGGRPSRPPQ
392
Q86YA1 PRB1 protein PRB1 DSRASCKMLLILLSVALLALSSAQNLNEDVSQEESPSLIAGNPQGPSPQGGNKPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDKSRSPRSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDKSQSPRSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPQQGGNRPQGPPPPGKPQGPPPQGDKSRSPQSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPAQGGSKSQSARAPPGKPQGPPQQEGNNPQGPPPPAGGNPQQPQAPPAGQPQGPPRPPQGGRPSRPPQ
338
A5D903 PRB1 protein PRB1 MLLILLSVALLALSSAQNLNEDVSQEESPSLIAGNPQGPSPQGGNKPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDKSRSPRSPPGKPQGPPPQGGKPQGPPPQGGNKPQGPLPPGKPQGPPAQGGSKSQSARAPPGKPQGPPQQEGNNPQGPPPPAGGNPQQPQAPPAGQPQGPPRPPQGGRPSRPPQ
198
G3V1M9 HCG26567, isoform
CRA_b
PRB1 MLLILLSVALLALSSAQNLNEDVSQEESPSLIAGNPQGPSPQGGNKPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDKSRSPRSPPGKPQGPPPQGGKPQGPPPQGGNKPQGPPPPGKPQGPPAQGGSKSQSARSPPGKPQGPPQQEGNNPQGPPPPAGGNPQQPQAPPAGQPQGPPRPPQGGRPSRPPQ
198
P02812 Basic salivary
proline-rich protein 2
PRB2 MLLILLSVALLALSSAQNLNEDVSQEESPSLIAGNPQGAPPQGGNKPQGPPSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDKSRSPRSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDNKSRSSRSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDNKSQSARSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKSQGPPPPGKPQGPPPQGGSKSRSSRSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGGSKSRSARSPPGKPQGPPQQEGNNPQGPPPPAGGNPQQPQAPPAGQPQGPPRPPQGGRPSRPPQ
416
Anexos
92
Organismo
Acesso Nome Gene Sequência Tamanho
Homo sapiens
Q04118 Basic salivary
proline-rich protein 3
PRB3 MLLILLSVALLALSSAQSLNEDVSQEESPSVISGKPEGRRPQGGNQPQRTPPPPGKPEGRPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGSPSQGGNKPQGPPPHPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ
309
Q4VAY2 PRB3 protein PRB3 MLLILLSVALLALSSAQSLNEDVSQEESPSVISGKPEGRRPQGGNQPQRTPPPPGKPEGRPPQGGNQSQGPPPRPGKPEGQPPQGGNKPQGPPPHPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ
162
F5H7C1 Uncharacterized
protein
PRB3 MLLILLSVALLALSSAQSLNEDVSQEESPSVISGKPEGRRPQGGNQPQRTPPPPGKPEGRPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPSQGGNKPQGPPPHPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ
309
P10163 Basic salivary
proline-rich protein 4
PRB4 MLLILLSVALLALSSAESSSEDVSQEESLFLISGKPEGRRPQGGNQPQRPPPPPGKPQGPPPQGGNQSQGPPPPPGKPEGRPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGPPPHPGKPESRPPQGGHQSQGPPPTPGKPEGPPPQGGNQSQGTPPPPGKPEGRPPQGGNQSQGPPPHPGKPERPPPQGGNQSHRPPPPPGKPERPPPQGGNQSQGPPPHPGKPEGPPPQEGNKSRSARSPPGKPQGPPQQEGNKPQGPPPPGKPQGPPPPGGNPQQPQAPPAGKPQGPPPPPQGGRPPRPAQGQQPPQ
310
E9PAL0 Uncharacterized
protein
PRB4 MLLILLSVALLALSSAESSSEDVSQEESLFLISGKPEGRRPQGGNQPQRPPPPPGKPQGPPPQGGNQSQGPPPPPGKPEGRPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGTPPPPGKPERPPPQGGNQSHRPPPPPGKPERPPPQGGNQSQGPPPHPGKPEGPPPQEGNKSRSARSPPGKPQGPPQQEGNKPQGPPPPGKPQGPPPAGGNPQQPQAPPAGKPQGPPPPPQGGRPPRPAQGQQPPQ
247
A2VCL9 PRB4 protein
(Fragment)
PRB4 MLLILLSVALLALSSAESSSEDVSQEESLFLISGKPEGRRPQGGNQPQRPPPPPGKPQGPPPQGGNQSQGPPPPPGKPEGRPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGKPQGPPQQEGNKPQGPPPPGKPQGPPPPGGNPQQPQAPPAGKPQGPPPPPQGGRPPRPAQGQQPPQSSRIQ
183
Q7M4Q5 Basic proline-rich
peptide IB-8a
(Fragments)
SPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDNKSQSAKPQGPPPQGGKPQGPPPQGGNKPQGPPPQGKSARSPPGKPQGPPQQEGNNPQGPPPPAGGNPGSKSR
128
Anexos
93
Organismo
Acesso Nome Gene Sequência Tamanho
E7EXA8 Uncharacterized
protein
PRB4 MLLILLSVALLALSSAESSSEDVSQEESLFLISGKPEGRRPQGGNQPQRPPPPPGKPQGPPPQGGNQSQGPPPPPGKPEGRPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGKPQGPPQQEGNKPQGPPPPGKPQGPPPAGGNPQQPQAPPAGKPQGPPPPPQGGRPPRPAQGQQPPQ
178
ENSP00000412740
MLLILLSVALLALSSAESSSEDVSQEESLFLISGKPEGRRPQGGNQPQRPPPPPGKPQGPPPQGGNQSQGPPPPPGKPEGRPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGKPQGPPQQEGNKPQGPPPPGKPQGPPPAGGNPQQPQAPPAGKPQGPPPPPQGGRPPRPAQGQQPPQ
178
G3V1R1 HCG26567, isoform
CRA_c
PRB1 MLLILLSVALLALSSAQNLNEDVSQEESPSLIAGNPQGPSPQGGNKPQGPPPPPGKPQGPPPQGGNKPQGPPPPGKPQGPPPQGDKSRSPRSPPGKPQGPPPQGGKPQGPPAQGGSKSQSARSPPGKPQGPPQQEGNNPQGPPPPAGGNPQQPQAPPAGQPQGPPRPPQGGRPSRPPQ
178
Homo sapiens EAW96215 proline-rich protein
HaeIII subfamily 1,
isoform CRA_b
PRH1 MRVGVSCYPGWSSVVGSWLTAVWNSWAQTILPPQPSAAEEYFACWNLLYLLKSGSFHRELTRFSQHKVGSDTRASCKMLLILLSVALLAFSSAQDLNEDVSQEDVPLVISDGGDSEQFIDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPPPPQGRPQGPPQQGGHPRPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQSPQ
244
AAI41917 PRH2 protein PRH2 MLLILLSVALLAFSSAQDLDEDVSQEDVPLVISDGGDSEQFIDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPPPPQGRPQGPPQQGGHPRPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQSPQSSRI
170
NP_005033 salivary acidic
proline-rich
phosphoprotein 1/2
PRH1 MLLILLSVALLAFSSAQDLNEDVSQEDVPLVISDGGDSEQFLDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPPPPQGRPQGPPQQGGHPRPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQSPQSSRIQ
171
AAI28193 PRH1 protein PRH1 MLLILLSVALLAFSSAQDLNEDVSQEDVPLVISDGGDSEQFLDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPPPPQGRPQGPPQQGGHPRPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQSPQ
166
EAW96220 proline-rich protein
HaeIII subfamily 2,
isoform CRA_b
PRH2 MLLILLSVALLAFSSAQDLDEDVSQEDVPLVISDGGDSEQFIDEERQGPPLGGQQSQPSAGDGNQNDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPPPPQGRPSARSSPTSSWKAPGTTSPRGPPTRTSTGAVSSVI
142
EAW96221 proline-rich protein
HaeIII subfamily 2,
isoform CRA_c
PRH2 MLLILLSVALLAFSSAQDLDEDVSQEDVPLVISDGGDSEQFIDEERQGPPLGGQQSQPSAGDGNQNDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQSPQ
132
Anexos
94
Organismo
Acesso Nome Gene Sequência Tamanho
Homo sapiens
A27307 proline-rich
phosphoprotein (gene
PRH1, Db allele) -
human
QDLNEDVSQEDVPLVISDGGDSEQFLDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPPPPQGRPQGPPQQGGHPRPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQSPQ
171
NP_006240 basic salivary
proline-rich protein 3
precursor
PRB3 MLLILLSVALLALSSAQSLNEDVSQEESPSVISGKPEGRRPQGGNQPQRTPPPPGKPEGRPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPSQGGNKPQGPPPHPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ
309
EAW96230 proline-rich protein
BstNI subfamily 3
PRB3 MLLILLSVALLALSSAQSLNEDVSQEESPSVISGKPEGRRPQGGNQPQRTPPPPGKPEGRPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGSPSQGGNKPQGPPPHPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ
309
AAH96211 PRB3 protein PRB3 MLLILLSVALLALSSAQSLNEDVSQEESPSVISGKPEGRRPQGGNQPQRTPPPPGKPEGRPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGSPSQGGNKPQGPPPHPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ
309
Q68D45 DKFZp686C09257
protein
MLLILLSVALLAFSSAQDLDEDVSQEDVPLVISDGGDSEQFIDEEGHKDHPNREAISKVLPHLLLESPRDHLPKGAAHKDLHRGSLLSNLGFNDRK
96
CAA30728 proline-rich protein
G1
PRB3 MLLILLSVALLALSSAQSLNEDVSQEESPSVISGKPEGRPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGEPEGPPPQGGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGSPSQGGNKPRGPPPHPGKPQGPPPQEGNKPQRPPPPRRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ
309
Anexos
95
Organismo
Acesso Nome Gene Sequência Tamanho
Homo sapiens C9JW35 Uncharacterized
protein
MLLILLSVALLALSSAQSLNEDVSQEESPSVISGKPEGRRPQGGNQPQRTPPPPGKPEGRPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGPPPQGGNKPQGPPPRPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ
309
Q16378 Proline-rich protein 4 PRR4 LPRP
PROL4 MLLVLLSVVLLALSSAQSTDNDVNYEDFTFTIPDVEDSSQRPDQGPQRPPPEGLLPRPPGDSGNQDDGPQQRPPKPGGHHRHPPPPPFQNQQRPPRRGHRQLSLPRFPSVSLQEASSFFRRDRPARHPQEQPLW
134
AAA60184 prepro salivary
proline-rich protein
MLLILLSVALLAFSSAQDLNEDVSQEDVPLVISDGGDSEQFIDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPPPPQGRPQGPPQQGGHPRPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQSPQ
166
CAA30542 Po protein PRB3 KPQGRRPQGGNQPQRPPPPPGKPQGPPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGPPPTPGKPEGPPPQGGNQSQGPPPHPGKPERPPPQGGNQSHRPPPPPGKPERPPPQGGNQSQGPPPHPGKPEGPPPQEGNKSRSARSPPGKPQGPPQQEGNKPQGPPPPGKPQGPPPPGGNPQQPQAPPAGKPQGPPPPPQGGRPPRPAQGQQPPQ
234
Loxodonta
africana
G3UCG0 Uncharct LOXAF QGPPPQGGSQQNRPPPPPEGQQGPPPQGGEQPNGPPPPPQGPPRPPQQEGDQLLRRRRAPQGQQGPPPQGGDQPNGPPPPPQGPPRPQQQEGDQLRRRPRAPQGQQGPPPQGGDQPNGPPPPPQGPPRPPQQEGDQLLRRRRAPQGQQGPPPQGGDQPNGPPPPPQGPPRPPQQEGQQGPPPQGGDQPNGPPPPPQGPPRPPQ
203
Macaca
fascicularis
Q29427 Proline-rich protein MnP4 MLLILLSVALLALSSAQNLNEDVGQEESPSLISEHQQGQPQQGGNRPQGPPSPPGNAQGPPQQGGKKPQGPPPPGKPQGPPKQGGKKPQGPPPPGKPQGPPQQGGNKPQGPPPPGKPQGPPQQGGNKPQGPPPPGKPQGPPQQGGNAQQAQPPPAGRPRDHHPLLKGADPLDLPKDSLPSNLGFNDRK
188
Q7M2S8
Proline-rich
phosphoprotein
SSEDVSQEDVPSIISDEEDSDQFIDEAHQGPPLGGQLSKHPAGDGNKDDGPQQKPPHHGGHHHRPPPPTGEPQNTQKPGGHHHHRPTPPPGKPEGSPPPSQGSRPSRPPKEQSPQ
115
Macaca
mulatta
XP_001118517 PREDICTED:
hypothetical protein
LOC722360
MLLILLSVALLAFSSVQSSSEDVSQEDVPSIISDEEDSDQFIDEAHQGPPLGGQLSKHPAGDGNKDDGPQHKPPHHGGHHHHPPPPTGEPQNTQKPGGHHHHRPSPPPGKPERTPPPSQGSRPSRPPKEQSPQ
133
Anexos
96
Organismo
Acesso Nome Gene Sequência Tamanho
Macaca
mulatta
XP_001118513 PREDICTED:
hypothetical protein
LOC722356
MLLILLSVALLAFSSVQSSSEDVSQEDVPSIISDEEDSDQFIDEAHQGPPLGGQLSKHPAGDGNKDDGPQHKPPHHGGHHHRPPPPTGEPQNTQKPGGHHHHRPSPPPGKPEGTPPPSQGSRPSRPPKEQSPQ
133
F7GSJ5 Uncharacterized
protein
LOC722356 SFLDVSQEDVPSIISDEEDSDQFIDEAHQGPPLGGQLSKHPAGDGNKDDGPQHKPPHHGGHHHRPPPPTGEPQNTQKPGGHHHHRPSPPPGKPEGTPPPSQGSRPSRPPKEQSPQ
115
F7GSJ7 Uncharacterized
protein
LOC722360 SFLDVSQEDVPSIISDEEDSDQFIDEAHQGPPLGGQLSKHPAGDGNKDDGPQHKPPHHGGHHHHPPPPTGEPQNTQKPGGHHHHRPSPPPGKPERTPPPSQGSRPSRPPKEQSPQ
115
Mesocricetus
auratus
P06680 Acidic proline-rich
protein HP43A
H29 MLVVLLTAALLAEHATIYEDSISQLSEEEQQGQDPGQLHQRPGQFPPQPSASDEEGDDDGEEDGNAPEGPPQQGGDHQKPRPPKPGNQQGPPQQEGQQQNRPPKPGNQEGPPQQEGQQQNRPPKPGNQEGPPQQEGQQQNRPPKPGNQEGPPQQEGQQQNRPPKPGNQEGPPQQGSEEQSTSL
183
Microcebus
murinus
ENSMICP00000006831 PPQRPGKQQGPHGQGGNQQGPPQGGRPQGRPQGGRPHGPPQGGRSEESQVQEPPTCGWKPKGPPQQEGQEQQDRPEKPQGPPEQGGNQQGPPQGGRPQGRPQGGRPQGPPQGGKRQGPPFGGDNPQGGRQQGPPQGGEQQGPPLRPQGGRQQRPSQGQGPQ
161
ENSMICP00000005057 MLLVLLSAALLALTAAQNLNEDVHSEESPVVSSDVRKPSEKPHKPQGPPAGPPPSGKPPQGPPPPESPKDHHHLLPPPSGKPQGPPPPPPSGKPQGPPPPPPFGKPQGPPPSFWKAPPEKPAQDQPSQ
128
ENSMICP00000007944 VQSEASPLLSSDVRKPSEKPHKPQGPPAGPPPSGKPPQGPPPPESPKDHHHLLPPPSGKPQGPPPPPPSGKPQGPPPPPPFGKPQGPPPSFWKAPPEKPAQDQPSQ
106
Monodelphis
domestica
ENSMODP00000002977 PESEQSPDPRKPKLSPPSECPSRGPPPSGPPNRGAQGEPPAGRQWESRPTRDRAGGQPPHSGGPGAPIPEGAEHPGGPGSSPAPFRGARSTHPGGSLAARGALQPRSGGPGAPIPEGAEHPGGPGSSPAPPEGCRLPPQEVGKPRPHGLPRPGPICPVRPDRRICGFPVSLPPPPPGNSQGTSAALGRRANPRPGKKPPSPSPIPGGRSPAGGEGEARSG
220
Mus
musculus
D3Z1V5 Uncharacterized
protein
Prp2 MLVVLFTVALLALSSAQEPREELQNQIQIPNQRPPPSGSQPRPPVNGSQQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQQRPPQGPPPPGGPQQRPPQGPPPPGGPQPRPPQGPPPPAGPQPRPPQGPPPTGGPQQRYPQSPPPPGGPQPRPPQGPPPPGGPHPRPTQGPPPTGPQPRPTQGPPPTGGPQQRPPQGPPPPGGPQPRPPQGPPPPTGPQPRPTQGPHPTGGPQQTPPLAGNPQGPPQGRPQGPQ
303
Anexos
97
Organismo
Acesso Nome Gene Sequência Tamanho
Mus
musculus
Q91X93 Proline-rich protein
BstNI subfamily 1
Prb1 MLVVLLTAALLVLSSAQRQDEEITYEDSNSQLLERGEKSQGYGHHFPKPPPGGMPPRPPSSDENNDGDEDGSEEDVNRPEGPPQHPPHPGHHHGPPQQGGPQGPPRPGNQQGPPPPGPPPQGSPQQRPPQPGKQQGPPPQGGSQGPPMPVNQQGPPPKGGPQQRPPQPGNQQGPPPQGGPQQRPPQPGNQQGPPPQGGPQQRPPQPGNQQGPPLHGGPQRPPQPGNQQGPPPQGGPQQRPPQPGNQQGPHPQGGLQGPPRPGNQQGPPPKGGPQRPPQPGYQQGPPPQGGPQGPPMPGNQQGPPPQGGLQQRPPQPGNPQGPPPQGGPQGPPRPGNQQGPPPQGGPQQRPPQPGNQQGPPPKGGPQRPPQPGYQQGPPPQGGPQGPPMSGNQQGPPPQGGLQQRPPQPGNPQGPSPQGGPQGPPRPGNQQGPPPQGGPQQRPPQPGNQQGPPQQGGPQGPPRPGNQQGPPPQGGPQRPSQPGNHQGPPQHGNKEQPNYLWSLFA
504
P05143 Proline-rich protein 2 Prp2 Prh1 Prp MLVVLFTVALLALSSAQGPREELQNQIQIPNQRPPPSGSQPRPPVNGSQQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQQRPPQGPPPPGGPQPRPPQGPPPPAGPQPRPPQGPPPPAGPHLRPTQGPPPTGGPQQRYPQSPPPPGGPQPRPPQGPPPPGGPHPRPTQGPPPTGPQPRPTQGPPPTGGPQQRPPQGPPPPGGPQPRPPQGPPPPTGPQPRPTQGPHPTGGPQQTPPLAGNPQGPPQGRPQGPQ
317
P05143-2 Isoform 2 of Proline-
rich protein 2
Prp2 Prh1 Prp MLVVLFTVALLALSSAQGPREELQNQIQIPNQRPPPSGSQPRPPVNGSQQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQQRPPQGPPPPGGPQPRPPQGPPPPAGPQPRPPQGPPPTGGPQQRYPQSPPPPGGPQPRPPQGPPPPGGPHPRPTQGPPPTGPQPRPTQGPPPTGGPQQRPPQGPPPPGGPQPRPPQGPPPPTGPQPRPTQGPHPTGGPQQTPPLAGNPQGPPQGRPQGPQ
303
D3Z544 Uncharacterized
protein
Prb1 MLVVLLTAALLVLSSAQRQDEEITYEDSNSQLLERGEKSQGYGHHFPKPPPGGMPPRPPSSDENNDGDEDGSEEDVNRPEGPPQHPPHPGHHHGPPQQGGPQGPPRPGNQQGPPPPGPPPQGSPQQRPPQPGKQQGPPPQGGPQQRPPQPGNQQGPPPQGGPQQRPPQPGNQQGPPPQGGPQGPPRPGNQQGPPPQGGPQQRPPQPGNQQGPPPKGGPQRPPQPGYQQGPPPQGGPQGPPMSGNQQGPPPQGGPQGPPRPGNQQGPPPQGGPQRPSQPGNHQGPPQHGNKEQPNYLWSLFA
301
D3Z543 Uncharacterized
protein
Gm4736 MLVVLLTAALLVLSSAQRQDEGMKWGGSNSGRNRSEEDVNRPEGPPQHPPHPGHHHGPPQQGGPQGPPRPGNQQGPPPPGPPPQGSPQQRPPQPGKQQGPPPQGGSQGPPMPVNQQGPPPKGGPQQRPPQPGNQQGPPPQGPPRPGNQQGPPPKGSPQGPPMPGNQQGPPPQGGLQQRPPQAGNPQGPPPQGGPQGHPRPGNQQGPPPQGGPQGPPRPGNQQGPPPQGGPQRPSQPGNHQGPPQHGNNEQPNYLWSLFA
259
Anexos
98
Organismo
Acesso Nome Gene Sequência Tamanho
Mus
musculus
F8VPU9 Uncharacterized
protein
Prp2 MLVVLFTVALLALSSAQEPREELQNQIQIPNQRPPPSGSQPRPPVNGSQQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQQRPPQGPPPPGGPQQRPPQGPPPPGGPQPRPPQGPPPPAGPQPRPPQGPPPPGPHLRPTQGPPPTGGPQQRYPQSPPPPGGPQPRPPQGPPPPGGPHPRPTQGPPPTGPQPRPTQGPPPTGGPQQRPPQGPPPPGGPQPRPPQGPPPPTGPQPRPTQGPHPTGGPQQTPPLAGNPQGPPQGRPQGPQ
316
D3YX21 Uncharacterized
protein
Gm4736 MLVVLLTAALLVLSSAQRQDEEITYEDSNSQLLERGEKSQGYGHHFPKPPPGGMPPRPPSSDENNDGDEDGSEEDVNRPEGPPQHPPHPGHHHGPPQQGGPQGPPRPGNQQGPPPPGPPPQGSPQQRPPQPGKQQGPPPQGGPQQRPPQPGNQQGPPPQGGPQQRPPQPGNQQGPPPQGGPQGPPRPGNQQGPPPQGGPQERPPQPGNQQGPHPQGGLQGPPRPGNQQGPPPKGSPQGPPMPGNQQGPPPQEGPQGPPRPGNQQGPPPQGGPQRPSQPGNHQGPPQHGNNEQPNYLWSLFA
301
P05142 Proline-rich protein
HaeIII subfamily 1
Prh1 Prp MLVVLFTVALLALSSAQGPREENQNQIQIPNQRPPPSGFQPRPPVNGSQQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGGPQQRPPQGPPPPGGPQQRPPQGPPPPGGPQPRPPQGPPPPGGPQLRPPQGPPPPAGPQPRPPQGPPPPAGPQPRPPQGPPPTGPQPRPTQGPPPTGGPQQRPPQGPPPPGGPQPRPPQGPPPPGGPQPSPTQGPPPTGGPQQTPPLAGNTQGPPQGRPQGPR
261
E9QMX6 Uncharacterized
protein
Prh1 MLVVLFTVALLALSSAQEPREENQNQIQIPNQRPPPSGFQPRPPVNGSQQGPPPPGGPQPRPPQGPPPPGGPQPRPPQGPPPPGVPQPRPPQGPPPPGGPQQRPPQGPPPPGGPQHRPPQGPPPPGGPQQRPPQGPPPPGGPQLRPPQGPPPPAGPQPRPPQGPPPPAGPQPRPPQGPPTTGPQPRPTQGPPPTGGPQQRPPQGPPPPGGPQPRPPQGPPPPGGPQPSPTQGPPPTGGPQQTPPLAGNTQGPPQGRPQGPR
261
Q58E44 Proline-rich protein
MP5
Prpmp5 MLVVLLTAALLVLSSAQRQDEEITYEDSNSQLLEMGEQSQGYGHHFPKPPPGGMPPRPPSSDENDDGDEDGSEEDVNRPEEPPQHPPHPGHHHGPPPQGGPQQRPPQPGKQQGPPPQGGPQSPLRPGNQQGPPPQGGPQQRPPQPGNQQGPPLQGGPQGPLRPGNHEGPPPQGGPQGHPRPGNQQGPPPQGGLQRPPQPGNQQGPPPQRGPQQRPPQPGNQQGPPPQGGPQQRPPQPGNQQGPPPPGSPQGPPRPGNQQGPPPQGGPQRPPQPGNHQGPPQYGNNEQPSYLWSLFA
296
E9PXN1 Uncharacterized
protein
Prpmp5 MLVVLLTAALLVLSSAQRQDEEITYEDSNSQLLEMGEQSQGYGHHFPKPPPGGMPPRPPSSDENDDGDEDGSEEDVNRPEEPPQHPPHPGHHHGPPPQGGPQQRPPQPGKQQGPPPQGGPQSPLRPGNQQGPPPQGGPQQRPPQPGNQQGPPLQGGPQGPLRPGNHEGPPPQGGPQGHPRPGNQQGPPPQGGLQRPPQPGNQQGPPPQRGPQQRPPQPGNQQGPPPQGGPQQRPPQPGNQQGPPPPGSPQGPPRPGNQQGPPPQGGPQRPPQPRNHQGPPQYGNNEQPSYLWSLFA
296
Anexos
99
Organismo
Acesso Nome Gene Sequência Tamanho
Mus
musculus
Q61888 Proline rich protein Gm8882 Gm47
36 MP4
MLVILLTAALLVLSSAQREDEEITYEDSNSQLLEMGEQSQGYGHHFPKPPPGGMPPRPPSSDENNDDDEDGSEEDVNRPEGPPQHPPHSGNHHAPPQQGDAHGPPRPGNQQGPPSPGPPPQGSSQQRPPQPGNQQGPPPQGGPQQRPPQPGNQQGPPPPGGPQQRPPQPGGNQGGPPQGGPHPPPRPGNQQGPPPQGGPQQRPTQPGNQQGPPQQGGPQAPPRPGNQQGPPPQGPQGPPRTGNQQGPPPQGGPQGPPRPGNQQGPPPQGGPQRPPQPGNHQGPPQHGNNEQPSYLWSLFA
300
B7ZW90 EG667929 protein Gm8882EG667
929 MLVILLTAALLVLSSAQREDEEITYEDSNSQLLEMGEQSQGYGHHFPKPPPGGMPPRPPSSDENDDGDEDGSEEDVNRPERPPQHPPHSGHHHGPPPQGDAQGPPRPGNQQGPPPQGSSQQRSPQPGNQQGPPPQGGPQQRPPQPGNQQGPPPQGGPQQRPPQPGNQQGPPPQGGPQGPPRPGNQQGPPPQGGPQQRPTQPGNQQGPPQQGGPQGPPRPGNQQGPPPQGGPQGPPRPGNQQGPPPQGGPQRPPQPRNHQGPPQHGNNEQPSYLWSLFA
278
Q62105 31-kDa proline-rich
salivary protein,
complete cds of clone
Pump125
Gm5154 MLVILLTEALLVLSSAQREDEEITYEDSNSQLLEMGEQSQGYGHHFPKPPPGGMPPRPPSSGENDDGDEDGSEEDVNGPERPPQHPPHSGHHHGPPPQGDAQGPPRPGNQQGPPPPGPPPQGSSQQRPPQPGNQQGPPPQGGPQQRPPQPGNQQGPPPPGGPQQRPPQPGGNQGPPPQGGPQGPPRPGNQQGPPPQGGPQQRPTQPGNQQGPPQQGGPQGPPRPGNQQCPPPQGGPQGPPRPGNQQRPPPQGGPQGPPRPGNQQGPPPQGGPQRPPQPGNHQGPPQHGNNEQPNYLWSLFA
301
E9Q7E4 Uncharacterized
protein
Gm8882
MLVILLTAALLVLSSAQREDEEITYEDSNSQLLEMGEQSQGYGHHFPKPPPGGMPPRPPSSDENDDGDEDGSEEDVNRPERPPQHPPHSGHHHGPPPQGDAQGPPRPGNQQGPPPPGPPPQGSSQQRSPQPGNQQGPPPQGGPQQRPPQPGNQQGPPPQGGPQQRPPQPGNQQGPPPQGGPQGPPRPGNQQGPPPQGGPQQRPTQPGNQQGPPQQGGPQGPPRPGNQQGPPPQGGPQGPPRPGNQQGPPPQGGPQRPPQPRNHQGPPQHGNNEQPSYLWSLFA
283
Q64306 Proline-rich protein Prpmp5 PRP
MP5 MLVILLTEALLVLSSAQRVDEGISYRGDNSSRGHSTTVVSDPSPTPQPRPKHSGPPPKGPRPGSTQGPPRVPNQQGPPPPGPPPQGSSQQRPPQPGNQQGPPPQGGPQGPPRPGNQQVPPPQEGSQQRPPQPGNQQGPPPQGPPRPGNQQGPPPQGGPQGPSRPGNQQGPPPQGGPQQRPPQPGNQQGPPPQGGPQGGPQPGNQQGPPPQGGPQGPPRPGNQQGPPPQGGPQRPPQPGNHQGPPQYGNNEQPSYLWSLFA
260
Anexos
100
Organismo
Acesso Nome Gene Sequência Tamanho
Myotis
lucifugus
G1PRT3 Uncharacterized
protein
MGRRSTSSTKSGKFMNPTDQARKEARKRELKKNKKQRMMVRAAVLKMKDPKQIIRDMEKLDEMEFNPVQQPQLNEKVLKDKRKKLRETFERILRLYEKENPDTYKELRKLEVDYEQKRAQLSQYFDAVKNAQHVEVDSIPLPDMPHAPSNILIQDIPLPGAQPPSILKKTSAYGPPTRAVSILPLLGHGVPRLPPGRKPPGPPPGPPPPQVLQMYGRKVGFALDLPPRRRDEDMLYSPELAQRGHDDDVSSTSEDDGYPEDMDQDKHDDSTDDSDTDRSDGESDGDEFVHRDDNERNNNEEKKSGLSVRFADMPGKSRKKKKNIKELTPLQAMMLRMAGKEIPEEGREVEEFSEDDDEGDSDDSEAEKQSQKQHKEESLSDGTSASSQQQAPPQSVPPSQIQAPPMPGPPPLGPPPAPPLRPPGPPTGLPPGPPPGAPPFLRPPGMPGLRGPLPRLLPPGPPPGRPPGPPPGPPPGLPPGPPPRGPPPRLPPPAPPGIPPPRPGMMRPPLVPPLGPAPPGLFPPAPLPNPGVLSAPPNLIQRPKADDTSAATIEKKATATISAKPQITNPKAEITRFVPTALRVRRENKGATAAPQRKSEDDSAVPLAKAAPKSGPTVPVSVQTKDDVYEAFMKEMEGLL
640
Nomascus
leucogenys
G1QT98 uncharacterized
protein
ENSG0000012
1335 MLWILLSVALLALSSAHNLNEDVSQEESPSVISEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSRSRRSPPGKPQGPPAAGGNPQQPPAPPAGKPQGPPPPPQGGRPPRPAQGQQP
309
G1QT96 uncharacterized
protein
ENSG0000012
1335 MLWILLSVALLALSSAHNLNEDVSQEESPSVISGNPQGPPPQGGNKPQGPPPPPGKPQGPPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSRSRRSPPGKPQGPPAAGGNPQQPPAPPAGKPQGPPPPPQGGRPPRPAQGQQPPR
248
G1QT94 uncharacterized
protein
MLLILLSVALLAFSSAQDLNEDVSQEDVPSIHTDGGDSDQFLDEERQGPPLGGQQSQPSAGDGNEDDGPQQGPPRQGGQQNQGPPLPQGKPQGPPPQGGHPRPPHGRPQGPPPQGGHQHHPPPPLHGKPQGPPPQGGHPQGPPQSPPGKPQGPPPQGGNKPQGPPPPPKPQ
171
G1QT82 uncharacterized
protein
MLLILLSVALLAFSSAQDLSEDVSQEDVPFVVSDGGHSEQFLDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQHQQGPPPPQGKPQGPPQHRGHPHPPHGRPQGPPPQGGHQHHHPPPPHGKPQGPPPQGGRPQGPP
143
Anexos
101
Organismo
Acesso Nome Gene Sequência Tamanho
Nomascus
leucogenys
G1QTA0 Uncharacterized
protein
ENSG0000012
1335
MLWILLSVALLALSSAHNLNEDVSQEESPSVISGNPQGPPPQGGNKPQGPPPPPGKPQGPPPQEGDEARSRRSPPGKPEGPPPQGGDKPQGPPPPPKPQGPPPQEGDEARRRRSPPGKPQGPPPQEGNKPQGPPPPPGKPQGPPPQGGDKPQGPPPPPKPQGPPPQEGDEARRRRSPPGQPQGPPPAGGNPQQPQPPPPGKSEGEPPQGGNQSQGPPPRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQSQGHPSRPEKPEGRPPQGGNQPQGPPAAGGNPQQPPAPPAGKPQGPPPPPQGGRPPRPAQ
419
Pan
troglodytes
XP_003265552.1 PREDICTED:
hypothetical protein
LOC100584047
LOC100584047 MLLILLSVALLAFSSAQDLSEDVSQEDVPFVVSDGGHSEQFLDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQHQQGPPPPQGKPQGPPQHRGHPHPPHGRPQGPPPQGGHQHHHPPPPHGKPQGPPPQGGRPQGPPQGQPPQ
149
XP_001137791 PREDICTED: basic
salivary proline-rich
protein 3
MLPILLSVALLALSSAQSLNEDVSQEESPSVIPGKPEGPPPQGGNQSQGTPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGPPSQGGNKPQGPPPHPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ
162
XP_001150134 PREDICTED: similar
to salivary proline-
rich protein
MIWVRTDGELGPEHGRQDLMVVQQSGTVTGAGDGGPECRTALGPGGGPASEKGAPPPGCPAAWKEHGLEAAMGRREGLAPEAAPGGGSRSEQRASAPSTEARAPCAGETTSPRSELPPREQNRETTSPRSVFPPREQNRETTSPRSELPPQGTEQGNHIPAQRAPPQGTEQGNHIPAQRAPPPGNRTGKPHPCPVCSPGRGPKEAEGRTAEQRETEQGNHIPAQRAPPQGTEQGNHIPAQRAPPPGNRTGKPHPCPVCSPGRGPKEAEGRTAEQR
275
XP_001147634 PREDICTED: similar
to Basic salivary
proline-rich protein 4
allele L (Salivary
proline-rich protein
Po) (Parotid o
protein)
MAGSLRLPRLRPGSHRSEAPGVRARGRQGRPAPSRALPRPTLLRAALPATPLGFAIFPTPPGKGALRPPKTPREPLVPVGVPSRGSAEKPRPPRPPETQSAPERPRVAGQHQGQRPGLHWGPAPGLPSVAGRGTAAPCAAGSRFSPPHPSLRNSDCSRLPCGSLFFRKASVLSLNFKSRGLVQSPPLKSFPPSSGSCGKPRVLDCSSGCQRWQSQSVRCSSPAHSPLSLPLALPPFLSSSLSSSTAPSLSCLLSFLHRESNCAKPWLPRTNPERDPGTGTATPPKLDEAAGPVCARAWRRSAWEGTSGALETPGPSSSSMEPAQSCPFSQDSPQVLCGC
339
ENSPTRP00000008026 MLLILLSVALLALSSAESSSEDVSQEESLFLISGKPEGRRPQGGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPHPGKPERPPPQGGNQSQGPPPHPGKPERPPPQEGNKSRSARSPPGKPQGPPQQEGNKPQGPPPPGKPQGPPPAGGNPQQPQAPPAGKPQGPPPPPQGGRPPRPAQGQQPPQ
205
ENSPTRP00000008024 MLLILLSVALLALSSAQNLNEDVSQEESPSLIAGNPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPQGKPEGPPPQGDKSRSARSPPGKPQGPPPQGGKPQGPPPQGGSKPQGPPPPPGKPQGPPPQGGSKSRSARSPPGNPQGPPQQEGNNPQGPPPPAGGNPQQPQAPPAGQPQGPPSPPQGGRPSRPPQ
199
Anexos
102
Organismo
Acesso Nome Gene Sequência Tamanho
Pan
troglodytes
XP_003313543.1 PREDICTED: LOW
QUALITY
PROTEIN: salivary
acidic proline-rich
phosphoprotein 1/2-
like
MLLILLSVALLAFSSAQDLDEDVSQEDVPLVISDGGDSEQFIDEERXGPPLGGQQSQPSAGDGNQNDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPPPPQGRPQGPPQQGGHPRPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQSPQ
166
ENSPTRP00000050434 MLLILLSVALLAFSSAQDLDEDVSQEDVPLVISDGGDSEQFIDEERGPPLGGQQSQPSAGDGNQNDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPPPPQGRPQGPPQQGGHPRPPRGRPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQSPQ
165
ENSPTRP00000050430 MLLILLSVALLALSSAQNLNEDVSQEESPSLIAGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGSKPQGPPPPPGKPEGRRPQGGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPHPGKPEGPPPQGGNQSQGPPPHPNQSQGPPPHPGKPERPPPQEGNKSRSARSPPGKPQGPPQQEGNKPQGPPPPGKPQGPPPAGGNPQQPQAPPAGKPQGPPPPPQGGRPPRPAQGQQPPQ
278
ENSPTRP00000050433 MLPILLSVALLALSSAQSLNEDVSQEESPSVIPPPRPGKPEGPPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKSEGQPPQGGNQSQGSPPRPGKPEGPPPQGGNQSQGTPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGPPSQGGNKPQGPPPHPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ
292
ENSPTRP00000008024 MLLILLSVALLALSSAQNLNEDVSQEESPSLIAGNPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPQGPPPQGKPEGPPPQGDKSRSARSPPGKPQGPPPQGGKPQGPPPQGGSKPQGPPPPPGKPQGPPPQGGSKSRSARSPPGNPQGPPQQEGNNPQGPPPPAGGNPQQPQAPPAGQPQGPPSPPQGGRPSRPPQ
199
ENSPTRP00000008028 MLPILLSVALLALSSAQSLNEDVSQEESPSVIPGKPEGPPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGQPPQGGNQSQGPPPRPGKSEGQPPQGGNQSQGSPPRPGKPEGPPPQGGNQSQGTPPRPGKPEGQPPQGGNQSQGPPPRPGKPEGPPSQGGNKPQGPPPHPGKPQGPPPQEGNKPQRPPPPGRPQGPPPPGGNPQQPLPPPAGKPQGPPPPPQGGRPHRPPQGQPPQ
267
XP_003313554 PREDICTED: basic
salivary proline-rich
protein 3-like
MLLILLSVALLAFSSAQDLDEDVSQEDVPLVISDGGDSEQFLDEERQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPPPQGKPQGPPQQGGHPRPPREGPQGPPQQGGHPRPPREGPQGPPQQGGHPRPPREGPQGPPQQGGHPRPPRERPQGPPQQGGHQQGPPPPPPGKPQGPPPQGGRPQGPPQGQSPQ
200
Anexos
103
Organismo
Acesso Nome Gene Sequência Tamanho
Pan
troglodytes
XP_520746 pHLE1F1 isoform 2 MLLVLLSVVLLALSSAQSTDNDVNYEDFTFTIPDVEDSSQRPDQGPQRPPPEGLLPRPPGDSGNQDDGPQQRPPKPGGHHRHPPPPPFQNQQRPPRRGHRQLSLPRFPSVSLQEASSFFRRDRPARHPQEQPLW
134
Pongo abelii
ENSPPYP00000004896 MLLILLSVALLAFSSAQDLNEDVSQEDVPFVISDGGDSEQFLDEESQGPPLGGQQSQPSAGDGNQDDGPQQGPPQQGGQQQQGPPRPQGKPQGPPQKGGHHRPPQGRPQGPPHQGGHPHPPQGRLQGLPHQGGHQQRPPPPPHGRPQGPPPQGGRPQGPPQGQSPQ
166
ENSPPYP00000004899 MLLILLVALLAFSSAQASNEDVSQEDVPLVISDGGDSEQFDEESQGPPLGGQQSQPSAGDGNQDDGPQQRPPQQGGQQQQGPPRPQGKPQGPPQQGGHQQRPPPPPHGRPQGPPPQGGRPQGPPQGQSPQ
130
XP_002833778 PREDICTED:
hypothetical protein
LOC100461262,
partial
LOC100461262
,
VSQEDVPLVISDGGDSEQFLDEERQGPPLGGQQSQPSAGDGNQDDGPQQRPPQQGGQQQQGPPRPQGKPQGPPQQGGHQQRPPPPPHGRPQGPPPQGGRPQGPPQGQSPQ
110
ENSPPYP00000004911 NPRASRKMLVILLSVALLALSSAENLNEDVSQEESPSLISGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPPGPPPPGKPQGPPPQGGSKSRSSRSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNKPPGPPPPGKPQGPPPQGGSKSRSSRSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGSKSRSSRSPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGNQPQGPPPPPGKPQGPPPQGGSKSRSSRSPPGKPQGPPPQGGNNPQGPPPPAGGNPRQPRAPPAGQPQGPPPPPQGGRPSRPPHG
344
Pteropus
vampyrus
ENSPVAP00000010780 MLLVFLLAALLALGSAHNAVNDVVYEENLSGVPPPSENLPPRPPQDGDKKIRPPRPEGQQQNPPPPPPPGKQERPPRPAGHQKNPPPPPLFEKQERPPRPEGHQKNPPPPPPPGKQERPPQPEGEKSPPPPLFEKQERPPRPEGQQQNPPPPPPPGKQQRPPRPEGHQKNPPPPPPKAGETPQPGGEKSSTTPPPGKQRGPPQPRQPKNPPPPPLFEKQERPPRPEGSKPPPPPPPGKQERPPRPEGSKSPTPPGKQERPPQPGGPQRPPRPEGSQRPPRPEGSQRPPQPGGPQRPPRPEGRKDRRPEGSQRPPRPEGSQRPPRPEGSQRPPRPGSPPGGRQPNPI
346
Oryctolagus
cuniculus
G1SNU9 Uncharacterized
protein
QQGGPQGRPQQRGPQQGGPQQGGPQQGPQQGGQQQEVPQRGGPQGGPQGGPQQGGPQGGPQQGGPQGGPQQRGPQEGPQQRGPQGGPQQGGPQGGPQQGGPQQGPQSRFQGNRPQGPPQGQPPQ
124
Anexos
104
Organismo
Acesso Nome Gene Sequência Tamanho
Rattus
novergicus
P10165 Proline-rich
proteoglycan 2
Prpg2 MLVVLLTAALLVLSSAQGVDEEVVYEDSSQQLELEQQSQGHGQHHPKPPPGGLPPRPPASDENGDGDDNDDGDDDGSGDDVNRPERPPQHGGNHHHPHHPPPAAGPQRPPQPGSPQGPPPPGGPQQRPPQGPPPQGGPQRPPQPGSPQGPPPPGGPQQRPPQGPPPQGGPQRPPQPGSPQGPPPPGGPQQRAPQGPPPQGGPQRPPQPGSPQGPPPPGGPQQRPPQGPPPQGGPQRPPQPGSPQGPPPPGGPQQRPPQGPPPQGGPQRPPQPGNPQGPPQQGGQQQSSFLWSFSA
295
Q04154 Salivary proline-rich
protein
Prp2 RP15 MLVALLTMVLLGLSFAQEPELQNLNQVPNQRPPPSGFLPRPPGNRNQQGPPPKGGPQQRPPQGPPPPGGPQQKPQGPPPPGGPQQRPQGPPPPGGPQQGPQGPPPPGGPQQRPQGPPPPGGPQQGPQGPPPPGGPQQGPQGPPPPGGPQQSPPQGPPPPGGPQQGPQGPPPPGGPQQSPPQGPPPPGGPQQGPQGPPPPGGPQQGRQGPPPPGGPQQDPPQGPPPPGGPQQRPPQGPPPPGRPQQRPPQPGNQQGPPQGPQSGRPQGPQQTRYQ
274
E9PU40 Uncharacterized
protein
MLVALLTMVLLGLSFAQEPELQNLNQVPNQRPPPSGFLPRPPGNRNQQGPPPKGGPQQRPPQGPPPPGGPQQKPQGPPPPGGPQQRPQGPPPPGGPQQGPQGPPPPGGPQQRPQGPPPPGGPQQGPQGPPPPGGPQQGPQGPPPPGGPQQSPPQGPPPPGGPQQGPQGPPPPGGPQQGRQGPPPPGGPQQRPPQGPPPPGGPQQRPPQGPPPPGRPQQRPPQPGNQQGPPQGPQSGRPQGPQ
242
E9PU38 Uncharacterized
protein
MLVVLFTAVLLTLSYAQEAELQSLDQTPNQKPPPPGFPPRPPANGSQQGPPPQGGPQQKPPQPGKPQGPPPPGGPQQKPPQPGNQQGPPPPGGPQQKPPQSGKPQGPPPPGGPQQRPPQPGNQKPQGPPPPGGPQKKPPQPGKPQGPPPPGGPQQKPPQPGKPQGPPPPGGPQQRPPQPGNQQSPPQGPQFGRPQGSFQSLGPQ
204
E9PSV2 Uncharacterized
protein
MLVVLLTAALLVLSSAHGSDEEVIYEDSSSQLLDVEQQNQKHGQHHQKPPPASDENGDGDDSDDGDDDGSGDDGNRPERPPPHGGNHQRPPPGHHHGPPPSGGPQTPPQPGKPQGPPPQGGPQGPPQPGNPQGPPPQGGHQQRPPQPGKPQDPAQDATHEQPSYLWSFFA
170
Q63179 Glycoprotein MLVVLLTVVLLPLSSVQSSHEDHGHQTQPLPPHPDHGNQTQPRPPHPDIGNQTQPRPPHPDHGNQTQPRPPHPDQGNQTQPRPPHPDHGNQTQPRPPHPDQGNQTQPRPPHPDHGNQTQPRPPHPDQGNQTQPRPPQPGQGNHTHPRPPHPDHGNQTQPHPPHPDQGNQTQPRPPHPDHGNQTQPRPPHPDQGNQTQPRPPHPDHGNQTQPRPPHPDQGNQTQPRPPHPDQGNQTQPRPPHPDQGNQTQPRPPHPDQGNQTQPRPPHPDLGNQTQPRPPRPGQGNQTQPRPPRPGQGNQTQPRPPLPGQGNQNQHPHSPLPDHPPHPDYQRTPQQDGGNQLGSQPPPPAY
350
Anexos
105
Organismo
Acesso Nome Gene Sequência Tamanho
Rattus
novergicus
Q04117 Salivary proline-rich
protein
RGD1559532
RP4
MLVVLFTAVLLTLSYAQEPELQSLDQTPNQKPPPPGFPPRPPANGSQQGPPPQGGPQQKPPQPGKPQGPTPPGGPQQKPPQPGNQQGPPPPGGPQQKPPQPEKPQGPPPPGGPQQRPPQPGNQQGPPPPGGPQQKPPQPEKPQGPPPPGGPQQKPPQPGKPQGPPPPGGPQQRPPQPGNQQSPPQGPQLDRPQGSFQSLGPQ
202
F1LMA2 Uncharacterized
protein
MLVVLLTAALLVLSSAHGSDEEVIYEDSSSQLLDVEQQNQKHGQHHQKPPPASDENGDGDDSDDGDDDGSGDDGNRPERPPPHGGNHQRPPPGHHHGPPPSGGPQTSSQPGNPQGPPPQGGPQGPPQPGNPQGPPPQGGPQQRPPQPGKPQGPPPQGGPQGPPQPGNPQGPPPQGGHQQRPPQPGKPQDPAQDATHEQPSYLW
203
F1LV68 Uncharacterized
protein
ELQSLDQTPNQKPPPPGFPPRPPANGSQQGPPPQGGPQQKPPQPGKPQGPPPPGGPQQKPPQPGNQQGPPPPGGPQQKPTQPEKPQGPPPPGGPQQRTPQPGNQQGPPPPGGPQQKPPQPEKPQGPPPPGGPQQKPPQPGNQQGPPPPGGPQQKPPQPEKPQGPP
165
P04474 Acidic proline-rich
protein PRP33
Prpg1 MLVVLLTAALLVLSSAHGSDEEVIYEDSSSQLLDVEQQNQKHGQHHQKPPPASDENGDGDDSDDGDDDGSGDDGNRPERPPPHGGNHQRPPPGHHHGPPPSGGPQTSSQPGNPQGPPPQGGPQGPPQPGNPQGPPPQGGPQQRPPQPGKPQGPPPQGGPQGPPQPGNPQGPPPQGGHQQRPPQPRKPQDPAQDATHEQPSYLWFSS
426
P10164 Acidic proline-rich
protein PRP25
(Fragment)
MLVVLFTAVLLTLSYAQEPGDELQILDQTPNQKPPPPGFPPRPPANGSQQGPPPQGGPQQSPLQPGKPQDPPPQGSPQQKPPQPGKPQGPPPPGGPQKKPPQPGKPQGPPPPGGPQKKPPQPGKPQGPTPPGGPQQKPPQAGKPQGPPPPGGPQQKPPQPGNQQGPPPPGGP
172
Q04105 Salivary proline-rich
protein
MLVVLFTAVLLTLSYAQEAELQSLDQTPNQKPPPPGFPPRPPANGSQQGPPPQGGPQQKPPQPGKPQGPPPPGGPQQKPPQPGKPQGPPPPGGPQQKPPQPGNQQGPPPPGGPQQKPPQSGKPQGPPPPGGPQQRPPQPGNQQSPPQGPQFGRPQGSFQSLGPQ
164
G3V7D3 Uncharacterized
protein
Prpg2 MLVVLLTAALLVLSSAQGVDEEVIYEDSSQQLELEQQSQGHGQHHPKPPPGGLPPRPPASDENGDGDDNDDGDDDGSGDDVNRPERPPQHGGNHHHPHHPPPAAGPQRPPQPGSPQGPPPPGGPQQRPPQGPPPQGGPQRPPQPGSPQGPPPPGGPQQRPPQGPPPQGGPQRPPQPGSPQGPPPPGGPQQRAPQGPPPQGGPQRPPQPGSPQGPPPPGGPQQRPPQGPPPQGGPQRPPQPGSPQGPPPPGGPQQRPPQGPPPQGGPQRPPQPGNPQGPPQQGGQQQSSFLWSFSA
295
Q07610 Proline-rich
proteoglycan
Prpg1 PRPG1 MLVVLLTAALLVLSSAHGSDEEVIYEDSSSQLLDVEQQNQKHGQHHQKPPPASDENGDGDDSDDGDDDGSGDDGNRPERPPPHGGNHQRPPPGHHHGPPPSGGPQTSPQPGKPQGPPPQGGPQGPPQPGNPQGPPPQGGHQQRPPQPGKPQDPAQDATHEQPSYLWSFFA
170
Anexos
106
Organismo
Acesso Nome Gene Sequência Tamanho
Sus scrofa
Q95JC9 Isoform 1 of Basic
proline-rich protein
MLPILLSVALLALSSARSPFFDLEDANSNSAEKFLRPPPGGGPPRPPPPEESQGEGHQKRPRPPGDGPEQGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPLGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPPPPPPADEPQQGPAPSGDKPKKKPPPPAGPPPPGPPSPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPPPGPSPPRPPPGPPPQ
676
Q95JC9-2 Isoform 2 of Basic
proline-rich protein
MLPILLSVALLALSSARSPFFDLEDANSNSAEKFLRPPPGGGPPRPPPPEESQGEGHQKRPRPPGDGPEQGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPAGGLQQGPAPSHVGPKKKPPPPGAGHPPRPPPPANESQPGPRPPPGPPSPPANDSQEGSPPSADGPQQGPAPSGDKPKKKPPPPAGPPPPPPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPADEPQQGAPSGDKPKKKPPPPAGPPPPPPPPPGIQGQKMSAKTPVLRRAVTLECDG
511
Q95JC9-3 Isoform 3 of Basic
proline-rich protein
MLPILLSVALLALSSARSPFFDLEDANSNSAEKFLRPPPGGGPPRPPPPEESQGEGHQKRPRPPGDGPEQGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPAGGLQQGPAPSHVGPKKKPPPPGAGHPPRPPPPANESQPGPRPPPGPPSPPANDSQEGSPPSADGPQQGPAPSGDKPKKKPPPPAGPPPPPPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPADEPQQGPAPSGDKPKKKPPPPAGPPPPPPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPPPGPSPPRPPPGPPPQ
566
Anexos
107
Organismo
Acesso Nome Gene Sequência Tamanho
Sus scrofa
F1SQ50 Uncharact Ssc.52331 MLPILLSVALLALSSARSPFFDLEDANSNSAEKFLRPPPGGGPPRPPPPEESQGEGHQKRPRPPGDGPEQGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPAGGLQQGPAPSHVGPKKKPPPPGAGHPPRPPPPANESQPGPRPPPGPPSPPANDSQEGSPPSADGPQQGPAPSGDKPKKKPPPPAGPPPPPPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPAGGLQQGPAPPIPPPGPPPPGPPPPGPAPPGARPPPGPPPPPPGPSPPRPPPGPPP
363
F1SQ51 Uncharact Ssc.52331 GGPPRPPPPEESQGEGHQKRPRPPGDGPEQGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPGPPPPGPAPPGARPPPGPPPPAGGLQQGPAPSHVGPKKKPPPPGPPPGPPPPGPPPPGPAPPGARPPPGPPPPPPGPSPPRPPPGPPPQ
177
Anexos
108
Tabela 3 Representação das sequências de histatinas e estaterinas recolhidas das bases de dados
Organismo Acesso Nome Gene Sequência Tamanho
Bos Taurus
Q8HY86 Statherin STATH MKIFFFAFIMALMVAMIKADSSEEEHRLRFNPRFYYPNQQGGYIPSYPAYPYPYPYPVQ
59
C6KGD9 Histatherin MKIFIFVFIMALILAMIRADSSEEKRHRKRXKHHXGYFQQYQPYQRYPLNYPPAYPFP
58
C6KGD7 Histatherin MKIFIFVFIMALILAMIRADSSEEKRHRKRXKHHXGYFQQYQPYQRYPLNYPPAYPFP
58
C6KGD7 Histatherin HSTN
MKIFIFIFIMALILAMIRADSSEEKRHRKRKKHHRGYFQQYQPYQRYPLNYPPAYPFP
58
Callithix
jacchus
F7HQR7 Uncharacterized protein STATH MKFLVFAFLLAFMVSMIGADSSEESFSFTGKFVYWYRPYPQPYRQPFPQPYQPQYQPQPNPYQPYSF
67
F7HQI8 Uncharacterized protein STATH MKFLVFAFLLAFMVSMIGADSSEEYWYRPYPQPYRQPFPQPYQPQYQPQPNPYQPYSF
58
Canis familiaris
XP_848687.1 PREDICTED: hypothetical protein
XP_843594 isoform 1
MKIFVFAFVMALMIAMIGADSSEERYPRFYPFPVSIPLILWYNTNIFCPYLFFKKNQYPSLNHIYVLDC
69
XP_862144.1 PREDICTED: statherin-like isoform
2 STATH
MKIFVFAFVMALMIAMIGADSSEENLLYRPYPRFYPYPLYPPVYPYNPYQPVYPYNAPEQYPPSS
65
XP_861969.1 PREDICTED: hypothetical protein
XP_856876 isoform 1
MKIFVFAFIMALMIALIGADSSDEEYGRHRKHHHVKDALKIFIISNIQNFRDIMMINNLIMLHRNPQQDYRGFMESPTCSLTHDDSSYSKIL
92
XP_856826.1 PREDICTED: statherin-like isoform
2
LOC607475
MKIFVFAFVMALMIAMIGADSSEERYPRFYPFPPYPPVYPYPAPAQYPPSS
51
XP_856868.1 PREDICTED: statherin-like isoform
3
LOC607475
MKIFVFAFVMALMIAMIGADSSEERYPRFYPFPRYPRFYPFPPYPPVYPYPAPAQYPPSS
60
Anexos
109
Organismo Acesso Nome Gene Sequência Tamanho
Canis familiaris
XP_003431878
PREDICTED: statherin-like STATH
MKIFVFAFVMALMIAMIGADSSEENLLYRPYPRFYPYPPYQPVYPYNAPEQYPPSS
56
XP_862196 PREDICTED: hypothetical protein
XP_857103 isoform 4
MKIFVFAFVMALMIAMIGADSSEEGGYLSGEIRPFHSLINLIMMPVLIF
49
XP_862059 hypothetical protein LOC608829
isoform 4 LOC608829
MKIFVFAFIMALMIALIGADSSDEEYGRHRKHHHRGRSENFYYQQYPKFQRYYDDK 56
XP_862168 PREDICTED: hypothetical protein
XP_857075 isoform 3
MKIFVFAFVMALMIAMIGADSSEEPYPRFYPYPLYPPVYPYNAPEQYPPSS
51
Chlorocebus
aethiops
C0LRB4 Histatin 1 HTN1 MKFLVFALILALMISMTGADSHEEKHHGHRRKHHGKHHSH
40
C0LRB7 Histatin 3 HTN3 MKFLVFALLLALMVSMIGADSHEERHHGRHGHHGYGRKFHEKHHSHRGYRSNYLYGN
57
Gorilla gorilla
gorilla
G3SG71 Uncharacterized protein STATH MKFLVFAFILALMVSMIGADSSEEKFLRRIGRFGYGYGPYQPVPEQPLYPQPYQPQYQQYTF
62
G3QQV0 Uncharacterized protein HTN1 MKFFVFALILALMISMTRADSHEKRHHGYRRKFHEKHHSHREFPFYGDYGSNYLYDN
57
G3R990 Uncharacterized protein HTN3 MKFFVFALILALMLSMTGADSHEKRHHGYKRKSHEKHHSHRGYRSNYLYDN
51
Gorilla gorilla
C0LRB0 Histatin 1 HTN1 MKFFVFALILALMISMTRADSHEKRHHGYRRKFHEKHHSHIEFPFYGDYGTNYLYDN
57
C0LRB5 Histatin 3 HTN3 MKFFVFALILALMVSMTGADSHEKRHHGYKRKSHEKHHSHRGYRSNYLYDN
51
Homo sapiens
P02808 Statherin STATH MKFLVFAFILALMVSMIGADSSEEKFLRRIGRFGYGYGPYQPVPEQPLYPQPYQPQYQQYTF
62
A6NKE9 Statherin, isoform CRA_c
STATH
MKFLVFAFILALMVSMIGADSSEEYGYGPYQ
PVPEQPLYPQPYQPQYQQYTF 52
Anexos
110
Organismo Acesso Nome Gene Sequência Tamanho
Homo sapiens
P15515 Histatin-1
HTN1
MKFFVFALVLALMISMISADSHEKRHHGYRRKFHEKHHSHREFPFYGDYGSNYLYDN
57
P15516 Histatin-3 HTN3 MKFFVFALILALMLSMTGADSHAKRHHGYKRKFHEKHHSHRGYRSNYLYDN
51
Macaca
arctoides P14709 Statherin STATH
DSSEEKFLRRLRRFDEGRYGPYQPFVPPPLYPQPYQPYQPQY
42
Macaca
fascicularis
P02809 Statherin STATH MXFLXFXLXLLXMXXMXXXDSSEEKFLRRLRRFDEGRYGPYQPFAPQPLYPQPYQPYQPQY
61
C0LRB1 Histatin 1 HTN1 MKFFVFALVLALMISMIRADSHKGKHHGHRRKFHEKHHSH
40
P34084 Histatin-1 HTN1 DSHEERHHGRHGHHKYGRKFHEKHHSHRGYRSNYLYDN
38
C0LRB9 Histatin 3 HTN3 MKFLVFALILALMVSMTRADSHEERRQGRHGHHEYGRKFHEKHHSHRGYRSNYLYGN
57
Macaca
Mulatta
EHH25962 Statherin STATH MKFLVFAFILAVMVSMIGADSSEEKFLRRLRRLDGRYGPYQPFVPPPLYPQPYQPYQPQY
60
EHH25961 Histidine-rich protein 3
MKFLVFALILALMVSMTVSISGNFKGYILVVCMQEKHHSHRGYRSNYLYGN
51
Nomascus
leucogenys
G1R7Y6 Uncharacterized protein STATH MKFLVFAFILALMVSMIGADSSEEVSHFHSLENLFNGFGPYQQFPEQLYPQPYQPPYQQYPF
62
C0LRB6 Histatin 1
HTN1
MKFFVFALILALMISMTRADSHEKRHHEHRRKFHEKHHSHREYPFYGYYR
50
C0LRB2 Histatin 3
HTN3
MKFFVFALILALMISMTRADSHEKRHHEHRRKFHEKHHSHRGYRSNYLDEN
51
Anexos
111
Organismo Acesso Nome Gene Sequência Tamanho
Nomascus
leucogenys
XP_003265744 PREDICTED: histatin-3-like LOC100601272
MKFFVFALILALMISMTGADSHDKRHHEHRRKFHEKHHSHRGYRSNYLDEN
51
XP_003265951 PREDICTED: hypothetical protein
LOC100590184 LOC100590184
MAYCSWRQPSRKGHLLRLHFGFTDFLTLLLSKRTQPTMKFFVFALILALMISMTRADSHEKRHHEHRRKFHV
72
Pan troglodytes
ENSPTRP00000027723 Statherin STATH MKFLVFAFILALMVSMIGADSSEEKFLRRIGRFGYGYGPYQPVPEQPLYPQPYQPQYQQYPF 62
ENSPTRP00000027724 Histatin 1 HTN1 MKFFVFALILALMISMTSADSHEKRHHGYRRKFHEKHHSHREFPFYGDYGSNYLYDN
57
ENSPTRP00000053498 Histatin 3 HTN3 MKFFVFALILALMLSMTGADSHEKRHHGYKRKFHEKHHSHRGYRSNYLYDN
51
ENSPTRP00000053497 Statherin STATH MKFLVFAFILALMVSMIGADSSEEYGYGPYQPVPEQPLYPQPYQPQYQQYPF
52
Pongo abelii
ENSPPYP00000016521 Statherin STATH MKFVLAIILALMVSMIGADSSEEKFLRRLGRYSYGYGPYQPVPEERLYPQPYPPPYQQYAF
61
ENSPPYP00000016523 Histatin 1 HTN1 MKFFVFALILALMISMTRHHGYRRKFHEKHHSHREFPFYGDYRNYLYDN
49
ENSPPYP00000016522 Histatin 3 HTN3 MKFFIFALILALVISMTGADSHEKRHHGYRRKSHEKHHSHRGYRSNYLYDN
51
XP_002814869.1 PREDICTED: histatin-3-like LOC100453551
MKFFIFALILALVISMTGADSHEKRHHGYRRKSHEKHHSHRGYRSNYLYDN 51
Presbytis
cristata
C0LRB3 Histatin 1 HTN1 MKFLIFALILALMISMTRADSHIEKHHAHRRKFPERHHSHREFPSYGGYRSNYLYYS
57
C0LRB8 Histatin 3 HTN3 MKFLIFALILALMVSMTRADSHEEKHHGRHGHHEYGRKFQEKHYSHRGYRSNYLYGN
57
Rattus
novergicus Q5J6K0 Theobromine induced protein
LOC689604 MRFLVFALIIALMVSMITADKSRERHFKHGEKRHRRYRRYVPAENSADINTDLSQNEVLLPYYYPSDY
68
Sus scrofa D8WUT6 Statherin
STATH
MKLFIFAFIMALMFAMIKADSSDEKHHRKWQNREREHYGRNRPYYPYAPNYPAYPLNYPYA 61
Anexos
112
Tabela 4 Representação das sequências de cistatinas recolhidas das bases de dados
Organismo Acesso
Nome Gene Sequência Tamanho
Ailuropoda
melanoleuca
G1LU45 Uncharacterized
protein
MAGHLRTPLLLLAALALTLAPSTTRPKSLLLGGVFDADVNEDDVQEALNFALSEYNKASNDAYHSRAIRVVRARKQVVAGMNYFLEVEIGRTTCTKSQPNLDSCPFHDQPRLMRKTLCSFQIYTVPWLGKTSLVKSSCQDA
141
D2I7P5
Putative
uncharacterized
protein
PANDA_021998
MAGHLRTPLLLLAALALTLALAVAVSPGTSRRNGKSSLVGGALDADVNEEGVQQALNFALSDEYNKASNDAYHSRAIRVVRARKQVVAGMNYFLEVEIGRTTCTKSQPNLDSCPFHDQPRLMRVCAC
127
Bos taurus P01035
cystatin-C
precursor
CST3
MVGSPRAPLLLLASLIVALALALAVSPAAAQGPRKGRLLGGLMEADVNEEGVQEALSFAVSEFNKRSNDAYQSRVVRVVRARKQVVSGMNYFLDVELGRTTCTKSQANLDSCPFHNQPHLKREKLCSFQVYVVPWMNTINLVKFSCQD
148
Callithrix
jacchus
F6VIW1 Uncharacterized
protein LOC100407294
MARPLCIPLLLLATLPVALASQEENQNFAGGIHDADLSDEWVQRALHFAISKYNKATKDAYYRRLLRVLRAREQTVAGTNYFFDVEIGRTTCTKSQPNLDTCPFREQPELQKKQFCSFQIYEVPWEDRMSLVKSRCQKA
139
F6VIZ9 Uncharacterized
protein LOC100404749
MAWPLNTPLLLLTALMMTLAGSASAQSGMTLLGGIHAADLNDKSVQRALNFAISEYNKDSKDEYYSRPRQVMAAQKQIVGGVNYFFNVKFARTTCTKSQPNLDNCPFNDQPELKEFCSFQIYEVPREDKISMVNYKCRKV
140
F6UCB8 Uncharacterized
protein LOC100404389
MAGPLRDPLLLLAVLALALAVSPAAGTSPGRQPRLLGGPMDASVEEEGVRRALDFAVSEYNKASNDRYHSRALQVVRARKQIVAGVNYFLDVEMGRTTCTKDQPNLDNCPFHEQPHLKRKAFCSFQIYSVPWQGLMTLSKSSCQNA
146
Cavia
porcellus ENSCPOP00000001466 ENSCPOG00000001625
LSSRSTAAMARTALLLAAALVAMLSLALAAEPVKRPRLLGGPEEADVREEGVRRALDFALSEYNKASNDRFHSRARQVLRARKQLVAGVNYFLEVEIGRTTCTKSQPNLADCPFHEEPHLKRNSVCSFQIYTVPWEGKISLTKSSCRDA
149
Anexos
113
Organismo Acesso
Nome Gene Sequência Tamanho
Cricetulus
griseus
G3H705
Cystatin-C
I79_006129
MASPLRTPLLLLAILAVASAANTKQGPRLLGGLQEAKVEEEGVKQALDFAISEYNKGSNDAYHSRALEVVRARKQKTLCSFQIYTVPWQGTQTLTKSSCKSA
102
G3H704 Cystatin-S
I79_006128
MACPLHAPLLLLTTLMVAVNLSLNPVLGNILLGGIEESSMQEEGAPEALEYAVGKYNENNNDLYLSHVVEVKRVRKQVVAGENFLFDVVLGQTTCTKAQDDLTNCPLNDQAEV
113
Dasypus
novemcinctus
ENSDNOP00000004937
MALPLRAALLLLAALALALAVSPAAGRDPGKQPRLVGGPIEADAKEEGVQRALEFAISEYNKASNDKYHSRVVEVLRTRKQIVSGVNYFIDVLIGRTTCTKSQPNLATCPFHDQGQLSKKTHCSFQVYTVPWMNITSLKFNCREA
145
Dipodomys
ordii ENSDORP00000008399
cystatin 10
(chondrocytes)
CST10
MAKTLHLLLASLVIALTLNFAACTNTKEKQKVVGHVEAADANDKEVQRVVDFSLRVYNDANNDLYYSRAVKVISARQQVVNGMKYYLRIEVGWTTCTKSQSHLPDCPFREQPDQQKKEICSFVVYTIPRLQKISMESYSCHSA
143
Echinops
telfairi ENSETEP00000003593 ENSETEG00000004390
MAALLRAPLFVLGALALAGMLSSGGAASPARPPRLLGGLLEADANEEGVQRALDFAVSEYNKASNDKFHHRVVRLKGARKQLVSGVNYFLDVELGRTTCTKSQPNLTTCPFHDQPHLKK
119
Equus
cabalus F6UBH5
Uncharacterized
protein
MAVLPRAPLLLLAALALGLAASPAAAASAGKRQLVGGISEADISEQGVQQALDFALSDGTRGSGELLYFSEPFEILLSRVQVVAGLNYFLDVEIGRTRCSKSQPNLTTCPLHDPLRVSRKGLCSFQIYTVPWMGTMSVVKSSCHEA
146
Erinaceus
europaeus ENSEEUP00000013930 ENSEEUG00000015274
MSGTSYFPLPPLALALTVALALVVTAGPASGASPAKSPRLIGGLMDADVNEEGVQRALDFALSEYNKANNDAYHSRAVQVLRARKQ
86
Felis catus ENSFCAP00000004756 ENSFCAG00000005133
MAGSLRTPLLLLAAVALTLALAMSPGTGRRNNKSALVGAPLDADVNEEGVQQALNFALSEYNKASNDAYHSRAMRVVRARKQXXXXXXYFLDVEIGRTRCTKSQPNLDTCPFHDQPHLMRKTLCSFQIYTVPWMGKTSLVKSSCQDA
147
Felis catus D5MTH1 Cystatin-C
CST3
MAGSLRTPLLLLAAVALTLALAMSPGTGRRNNKSALVGAPLDADVNEEGVQQALNFALSEYNKASNDAYHSRAMRVVRARKQVVAGMNYFLDVEIGRTRCTKSQPNLDTCPFHDQPHLMRKTLCSFQIYTVPWMGKTSLVKSSCQDA
147
Anexos
114
Organismo Acesso
Nome Gene Sequência Tamanho
Gorilla
gorilla gorilla
G3QJY3 Uncharacterized
protein CST1
MARHLSTLLLLLATLAVALAWSPKEEDRIILGGIYDADLNDEWVQRALHFAISEYNKATKDDYYRRPLRVLRARQQTVGGVNYFFDVEVGRTICTKSQLNLDTCAFHEQPELQKKQLCSFEIYEVPWENRRSLVKSRCQEA
141
G3QXG3
Uncharacterized
protein
ENSG00000101441
MARHLCTLLLLMATLAGALASSSEEEDRIISGGIYDADLNDEWVQRALHFAISEYNKATEDEYYRRPLQVLRAREQ
76
G3RKA9
Uncharacterized
protein
CST5
MTWPMHTSLLLLTALMVAVAGSASAQSRTLAGGIHAADLNDKSVQRALDFAISEYNKDISKDEYYSRPLQVMAAYQQIVGGVNYYFNVKFGRTTCTKSQPNLDNCPFNDQPKLKEEEFCSFQINEVPWEDKISILNYKCRKV
146
Homo
sapiens
P01036 Cystatin S
CST4
MARPLCTLLLLMATLAGALASSSKEENRIIPGGIYDADLNDEWVQRALHFAISEYNKATEDEYYRRPLQVLRAREQTFGGVNYFFDVEVGRTICTKSQPNLDTCAFHEQPELQKKQLCSFEIYEVPWEDRMSLVNSRCQEA
141
P01037 Cystatin-SN CST1
MAQYLSTLLLLLATLAVALAWSPKEEDRIIPGGIYNADLNDEWVQRALHFAISEYNKATKDDYYRRPLRVLRARQQTVGGVNYFFDVEVGRTICTKSQPNLDTCAFHEQPELQKKQLCSFEIYEVPWENRRSLVKSRCQES
141
P09228 Cystatin-SA CST2
MAWPLCTLLLLLATQAVALAWSPQEEDRIIEGGIYDADLNDERVQRALHFVISEYNKATEDEYYRRLLRVLRAREQIVGGVNYFFDIEVGRTICTKSQPNLDTCAFHEQPELQKKQLCSFQIYEVPWEDRMSLVNSRCQEA
141
P28325 Cystatin-D
CST5
MMWPMHTPLLLLTALMVAVAGSASAQSRTLAGGIHATDLNDKSVQCALDFAISEYNKVINKDEYYSRPLQVMAAYQQIVGGVNYYFNVKFGRTTCTKSQPNLDNCPFNDQPKLKEEEFCSFQINEVPWEDKISILNYKCRKV
142
P01034 Cystatin-C
CST3
MAGPLRAPLLLLAILAVALAVSPAAGSSPGKPPRLVGGPMDASVEEEGVRRALDFAVGEYNKASNDMYHSRALQVVRARKQIVAGVNYFLDVELGRTTCTKTQPNLDNCPFHDQPHLKRKAFCSFQIYAVPWQGTMTLSKSTCQDA
146
Loxodonta
africana G3TEB6
Uncharacterized
protein
GEPLRSPLFLLAALALAVMLLGGIMDADENEEGVQRALDFAISEYNKASNDKFHSRVVQVVRARKQIVSGVNYFLDVEIGRTTCTKSQPNLANCPFHDQPQLKKKALCSFQIYTVPWLGTTSLTKSSCQDA
131
Anexos
115
Organismo Acesso
Nome Gene Sequência Tamanho
Macaca
mulatta
F6ZNT9 Uncharacterized
protein CST1
MAQPLCTLLLLLAALAGAQAWSPKEEDRVIPGGIYDADLNDDEVQHALHFAISEYNKATEDEYYRRPLRVLRAREQVVAGMNYFLDVELGRTTCTKSQPNLDTCAFHEQPELQKKQLCSFQIYEVPWEDRMSLVNSRCQEA
141
F7HAW3 Uncharacterized
protein CST5
TMAWPMRALLLLLTALMVVLARSASAQSRKTSSGDIHAADLNDKSVQRVLNFTIREYNKDISKDEYYSRPLQVMAAYQQVVGGVNYYFNVKFGRTTCTKSQPNLDNCPFNDQPELKEEEFCSFQINEVSQENKISILNYKCRKV
144
O19092 Cystatin-C
MAGPLRAPLLLLAILAVALAVSPAAGASPGKPPRLVGGPMDASVEEEGVRRALDFAVSEYNKASNDMYHSRALQVVRARKQIVAGVNYFLDVELGRTTCTKTQPNLDNCPFHEQPHLKRKAFCSFQIYTVPWQGTMTLSKSTCQDA
146
Microcebus
murinus
ENSMICP00000004204 Cystatin C
LLLAALAVALAVSAAAGPSLGPASPLVGGLMDANVNEEDVQRALDFAVSEYNKASNDRYHSRALQVVRARKQXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXEELCSFQIYSVPWLGKISVVKSSCENA
137
ENSMICP00000011557
MAGPLRAPLLLLAILAMTLAMTLAKSVAKTTLGGMEEADVNDDEVQRALDFATGKYNEESNDTYYSQVRQVVRARQQAVAGTNYFFYVKMGRTTCTKSQPNLDNCPFQEQPRQKREELCSFEIYSVPWEDSMTLVKSSCRKA
142
ENSMICP00000014007
MARPLRAPLLLLAILALTWAMPLAKNSKRVGGIKEADVNNEGVQQRLDFATSKHNKENDEDEDKHWQGQVMSVFDQVLFRLAYSLYMEISQTICNKSQANLDNCPFQEQPHLKR
114
ENSMICP00000001300
MARPLRTPLLLLAILAVTLAVTLAMPLAKNSKGVVGIEKADVNDEGVQRELDFAISKYNMRRNDSSNNVLDELFRIFEQAVVKVYLDTIRTTNKSQPYLDNCQARPHLKRELCYFIYSVRWEDSLTLVNSSCQKA
135
Monodelphis
domestica F7CAH1
Uncharacterized
protein LOC100033234
RTATMAGSRLSLVLLPLLLIALVCAVHAERKPRLVGGITEANENEEGVQRAVNFAISEYNKASNDKFGHRIVRVVRAQKQLVAGIKYILEVEISRTTCTKSVTDFSSCPLHEDPTLKKHSICNFVVYFVPWLGKISLIKNECKII
145
Mus
musculus P21460 Cystatin-C Cst3
MASPLRSLLFLLAVLAVAWAATPKQGPRMLGAPEEADANEEGVRRALDFAVSEYNKGSNDAYHSRAIQVVRARKQLVAGVNYFLDVEMGRTTCTKSQTNLTDCPFHDQPHLMRKALCSFQIYSVPWKGTHSLTKFSCKNA
140
Anexos
116
Organismo Acesso
Nome Gene Sequência Tamanho
Mus
musculus
A2APX3 Cystatin C Cst3
MASPLRSLLFLLAVLAVAWAATPKQGPRMLGAPEEADANEEGVRRALDFAVSEYNKGSNDAYHSRAIQVVRARKQLVAGVNYFLDVEMGRTTCTKSQTNLTD
102
Q9JM84 Cystatin 10
(Chondrocytes) Cst10
MASLLSPSMPVLAAVALTLTLAVIPEASTNAEAKQVVLGGVEPADPKDKEVQKVVKFAVRTYNDMDNDLYLSKPIRLMSASQQVVAGKNYYLKIELGRTTCTKTESNLVDCPFNEQPDQQKRVICNFQINVAPWLNKMSMTNFNCYNF
148
Q3U5K7
Putative
uncharacterized
protein
Cst3
MASPLRSLLFLLAVLAVAWAATPKQGPRMLGAPEEADANEEGVRRALDFAVSEYNKGSNDAYHSRAIQVVRARKQLVAGVNYFLDVEMGRTTCTKSQTNLTDCPFHDQPHLMRKALCSFQIYSVPWKGTHSLTKFSC
137
Q9EPX9 Cystatin C
Cst3
MASPLRSLLFLLAVLAVAWAATPKQGPRMLGAPEEADANEEGVRRALDFAVSEYNKGSNDAYHSRAIQVVRARKQLVAGVNYFLDVEMGRTTCTKSQTNLTDCPFHDQPHLMRKALCSFQIYSVPWKGTHSLTNFSCKNA
140
Myotis
lucifugus G1Q2V3
Uncharacterized
protein
LEATMAGLSRAPLFLLALALALALTASPAAGATAGRPRLVGGLAEADVNEEGVQQALNFALSEYNKASNDAFHSRAMRVVRARKQLVAGLNYFLDVEIGRTTCTKSQPNLASCPFHVQPHLRKEALCSFQVYTVPWLGKTSLVKSSCQDA
150
Nomascus
leucogenys
G1RZZ0 Uncharacterized
protein CST1
MAQPLCTLLLLLATLAGALAWSPEEEDRIIGGGIYDADLDDEWVQRALHFAISEYNKATEDEYYRRPLRVLKAREQTVAGTNYFFDIEVGRTVCTKSQPNLDTCAFHEQPELQKKQLCSFQIYEVPWENRRSLVKSRCQEN
141
G1RLM2 Uncharacterized
protein CST3
MAGPLRAPLLLLAILAVALAVSPAAGASPGKPPRLVGGPMDASVEEEGVRRALDFAVSEYNRASNDMYHSRALQVVRARKQIVAGVNYFLDVELGRTTCTKTQPNLDNCPLHDQPHLKRKAFCSFQIYAVPWQGTMTLSKSTCQDA
146
G1RZZ5 Uncharacterized
protein CST5
MTWPMYTPLLLLTALMVAVAGSASTQSRNLVGGVHAADLNDKSVQRALDFTISEYNKDISKDEYYSRPLQVMAAYQQIVDGVNYYFNVKFGRTICTKSQSNLDNCPFNDQPKLKEEEFCSFEINEVPKEDKISILNYKCRKV
142
Anexos
117
Organismo Acesso
Nome Gene Sequência Tamanho
Oryctolagus
cuniculus
O97862 Cystatin C CST3
MARSLGVPLLLLAALVVALALAVSPAAGARTRQSPRLLGGLEDVDAQEKDVQRALGFAESEYNKGSNDRYHSRALQVVRARRQIVSGVKYYLDVLIGRTTCTKTQTNLANCPFHDQPDLQRKMLCSFEIYSVPWLNKISLLKSDCQNA
148
G1SUE4 Uncharacterized
protein
ARTMARSLGVPLLLLAALVVALALAVSPAAGARTRQSPRLLGGLEDVDAQEKDVQRALGFAESEYNKGSNDRYHSRALQVVRARRQIVSGVKYYLDVLIGRTTCTKTQTNLANCPFHDQPDLQRKMLCSFEIYSVPWLNKISLLKSDCQNA
151
Otolemur
garnetii ENSOGAP00000009111 Cystatin C CST3
MAGSPRATLLLLATLAVALAVSSATGASSGLRKRLLGGFMDADVNEEGVQHALNFAMSEYNKASNDRYHSRALQVVRASKQXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXKVLCSFEIYSIPWQDKMTMTKYSCQNA
146
Pan
troglodytes
ENSPTRP00000022846 Cystatin S CST4
MARHLCTLLLLMATLAGALASSSEEEDRIISGGIYDADLNDEWVQRALHFAISEYNKATEDEYYRRPLQVLRAREQTVAGTNYFFDVELGRTICTKSQPNLDTCAFHEQPELQKKQLCSFEIYEVPWEDRRSLVNSRCQEA
141
ENSPTRP00000022847 Cystatin SN CST1
MARHLSTLLLLLATVAVARAWSPKEEDRIIPGGIYNADLNDEWVQRALHFAISEYNKATKDDYYRRPLRVLRARQQTVEGVNFFFDVEVGRTICTKSQPNLDTCAFHEQPELQKKQLCSFEIYEVPWEDRRSLVKSRCQES
141
ENSPTRP00000022848 Cystatin SA CST2
MAWPLCTLLLLLAAQAVALAWSPQEEDRIIGGGIYDADLNDEWVQRALHFAISEYNKATEDEYYRRPLRVLRAREQTVAGMNYFFDVEVGRTICTKSQPNLDTCAFHEQPELQKKQLCSFEIYEVPWEDRMSLVNSRCQEA
141
Pongo abelii
ENSPPYP00000012041 Cystatin SA CST2
MAWPLCTLLLLLATQAVALAWSPQVEDRIIGGGIYDADLNDEWVQRALHFAINEYNKATEDEYYRRTLRVLRAREQTVAGTNYFFDVEVGRTICTKSQPNLDTCAFHEQPELQKKQLCSFEIYEVPWENIRSLVNSRCQEA
141
ENSPPYP00000012040 Cystatin C CST3
MAGPLRAPLLLLAILAVALAVSPAAGSSPGKPPRLVGGPMDASVEEEGVRRALDFAVGEYNKASNDMYHSRALQVVRARKQIVAGVNYFLDVELGRTTCTKTQPNLDNCPFHDQPHLKRKAFCSFQIYAVPWQGTMTLSKSTCQDA
146
Anexos
118
Organismo Acesso
Nome Gene Sequência Tamanho
Pongo abelii
ENSPPYP00000023548
MAWPLCTLLLLLAALAGALAWSPKEEDRIILGRVYDPDINDEWVQRALHFAISEYNKATEDEYYRRPLRVLRARQQIVARTNYFFDIEVGRTICTKSQPNLDTCAFHEQPELQKKQLCSFTIYEVPWNKRRSLVKSRCQEA
141
ENSPPYP00000012590
MARPLCTLLLLLAALAGALAWSPEEEDRIILRGIYNADLSDEWVQRALHFAISEYNKATEDEYYRCPLRVLRARQQTVARTNYFFDVEVGRTTCAKSQPNLDTCAFHEQPELQKKQLCSFQIYEIPWEDKRSLVKSRCQEA
141
ENSPPYP00000023565
MAWPLCTLLLLLAALAGALAWSPKEEDRIILGRIYDADLNDEWVQCALHFAVSEYNKATEDEYYRRPLRVLRARQQIVAGTNYFFDIEMGRTICTKSQPNLDTCAFHEQPELQKKQLCSFTICEVPWNKRRSLVKSRCQEA
141
ENSPPYP00000012585
MARPLCTLLLLLVTLAVALSWSPEEDRIIPGGIYKADLNDEWVQRALDFAISEYNKANEDDYYRRPLRVLRARQQIVGGVNYFFDVEVGRTICTKSQPNLDTCAFHEQPELQKKQLCSFKIHEVAWEDRISLVNSRCQE
139
ENSPPYP00000012595
MAQPLCTLLLLLATLAVALAWSPEEDRIITGGIYKADLTDEGVQRALHFAISEYNKATEDDYYRRPLRVLRARQQIVGGVNYFFDVEVGRTICTKSQPNLDTCAFHEQPELQKKQLCSFKIHEVAWEDRISLVNSRCQEA
140
Pteropus
vampyrus ENSPVAP00000003380
MARSLRIALLLMATLVLALALAVSPAASANPSKTRLVGGLEDADVNEEGVQQALNFALSEYNKASNDAFHSRAIRVVRARKQXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXKSLCSFQIYTVPWMGKISMVKSTCQAA
147
Rattus
novergicus
P14841 Cystatin C CST3
MASPLRSLMLLLAVLAVAWAGTSRPPPRLLGAPQEADASEEGVQRALDFAVSEYNKGSNDAYHSRAIQVVRARKQLVAGINYYLDVEMGRTTCTKSQTNLTNCPFHDQPHLMRKALCSFQIYSVPWKGTHTLTKSSCKNA
140
D4AAU9 Cystatin 10 CST10
MSEGALSTPTMASLLSPSLPLLAALALTLALTVNPAASTNAKGKQVAVGGVEPADPNDKEVQKVINFAVKTYNDMNNDLYLSRPIRVMSASQQVVSGKNFYLKIELGQTMCTKAQSDLADCPFNEQPDQQKRAVCNFQINVEPWLNKISLTNFKCYNV
158
Anexos
119
Organismo Acesso
Nome Gene Sequência Tamanho
Rattus
novergicus
Q3MIE8
Similar to
Cystatin S (LM
protein)
LOC296235
MACLLYTQLFLLNTFILFLNLSLNPVLGQILAGIEKSIIEEEGALEALNFAVSEYNENNSDLYLSRVVEVKTVKTIQQQIEAGKTLLFDVILGKTACLKTQDDLSDCPLNEPTDLQEREFCSFEVHLPDWANAINLLSSICNRI
144
D3ZUY2
Uncharacterized
protein
MAYLLHARLFLLTTFMLVLNLCTYPVMSHIPGGIEKSSMEDEGARESLNFAVSQYNENKRDLYLSRVFGIHTLFTILNNVVAGTKFLFDVILVKKTCLKTQADLTNCPGKDQSGQQEHEFCSFEVYDTPWENDMALISSSCHNI
144
D3ZP68 Uncharacterized
protein
MAYLLHARLFLLTTFMLVLKLCTYPVLGHILGGIEKSSMEDEGARESLNFAVSQYNENNSDLYLSRVLEVKNVQKQVVAGTKFLFDVILVKTNCLKSQNDLTNCPAKDQDGQQEQEFCSFEVYDAPWENDMALISSSCHNI
141
P19313 Cystatin S CST4
MAYLLHAQLFLLTTFILVLNMRLCPVLGHFLGGIEKSSMEEEGASEALNYAVNEYNEKNSDLYLSRVVEVKDVQKQVVAGTKFFFDVILGKTICLKTQGDLTNCPLNEEADQQEHEFCSFVVHDIPWENYIVLLSSSCHSI
141
F1M6D7 Uncharacterized
protein
VDCLLYTQLFLLTTLILVLNLSHYPVIGQIVGMEESSIEEEGAPEALNFAVSQYNENSSDMYLSHMVEVKTVPKIQLKVVAERILLFDVILGKTTCMKTQDLSNCLLNEETDQKE
115
Saimiri
sciureus
O19093
Cystatin C CST3
MAGPLRAPLLLLAILAVALALSPAAGASPGRTPRLLGGPMDASVEEEGVRRALDFAVSEYNKASNDMYHSRALQVVRARKQIVAGVNYFLDVEMGRTTCTKNQPNLDNCPFHEQPHLKRKAFCSFQIYSVPWQGIMTLSKSTCQDA
146
Sarcophilus
harrisii
G3VZM3 Uncharacterized
protein
PRLIGGLSEANVNDEKVQRAITFALREFNQASNDKYGSRVFRVLEAKKQLVAGIKYIFQVEIGRTTCTKSVADFSNCPDHKEPPLKKHSICNFEVYTIPWMGKTNLVKSECRDI
114
Sus scrofa
Q0Z8R0 Cystatin C
CST3
MAGSPRSPLLLLAALALALALAVSPAAGQGHKGRLVGGLIDADVNEEGVQQALSFALSEYNKASNDAYHGRVLRVLRVRKQVVAGMNYFLEVEIGRTTCTKSQANLDNCPFPNQPDLQKKTLCSFQVYTVPWKGTTSLVKSSCRDE
146
Anexos
120
Organismo Acesso
Nome Gene Sequência Tamanho
Sus scrofa
F1SAS7 Uncharacterized
protein CST3
RETMAGSPRSPLLLLAALALALALAVSPAAGQGHKGRLVGGLIDADVNEEGVQQALSFALSEYNKASNDAYHGRVLRVLRVRKQVVAGMNYFLEVEIGRTTCTKSQANLDNCPFPNQPDLQKKTLCSFQVYTVPWKGTTSLVKSSCRDE
149
Q29212 Cystatin C
(Fragment) CST3
MAGSPRSPLLLLAXLAXXLXLAVSPAAGQGHKARLVDXXIDXDVNXEGVQQALSFXLSEYNKASNXAYHXRXLRVLXVRKQ
81
Anexos
121
Figura 10 10 Representação das sequências alinhadas das PRPs por software ClustalW. A zona sombreada a preto são os aminoácidos idênticos enquanto a zona
sombreada a cinzento identifica substituições conservadas
Anexos
122
Anexos
123
Anexos
124
Anexos
125
Anexos
126
Anexos
127
Anexos
128
Anexos
129
Anexos
130
Anexos
131
Anexos
132
Anexos
133
Anexos
134
Anexos
135