16
Bancos de dados mais usados em Bioinformática NCBI O NCBI é dividido em vários bancos de dados específicos. Cada banco de dados armazena informações e apresenta links com outros bancos do próprio NCBI e bancos externos. Entrez (GQuery) é o sistema de busca do NCBI que faz pesquisa em mais de 30 banco de dados. Esse sistema faz busca nas seguintes divisões do NCBI: Literature Health Genome Genes Proteins Chemicals IMS/CAT-UFBA - Rua Rio de Contas, 58 – Quadra 17 – Lote 58 – Bairro Candeias Vitória da Conquista – BA - CEP 45.029-094/ Fone: (77) 3429 2714. E-mail: [email protected]

O NCBI é di vidi do em vários bancos de dados especí f i ... · Banco s d e d ad o s mai s u sad o s em Bi o i n fo rmáti ca NCBI O NCBI é di vidi do em vários bancos de dados

Embed Size (px)

Citation preview

Bancos de dados mais usados em Bioinformaacutetica

NCBI

O NCBI eacute dividido em vaacuterios bancos de dados especiacuteficos Cada banco de dados armazena informaccedilotildees e apresenta links com outros bancos do proacuteprio NCBI e bancos externos

Entrez (GQuery) eacute o sistema de busca do NCBI que faz pesquisa em mais de 30 banco de dados Esse sistema faz busca nas seguintes divisotildees do NCBI

Literature Health Genome Genes Proteins Chemicals

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

A busca no Entrez eacute realizada em todos os banco de dados ligados ao NCBI O Entrez

ainda aceita pesquisa especiacuteficas para cada banco ou pesquisas mais refinadas usando operadores

Exemplo (CASP1) AND Homo Sapiens O operador AND diz ao Entrez para retornar somente onde encontrar o termo CASP1 e

Homo sapiens como organismo (CASP1) AND Homo Sapiens[Organism] O operador AND diz ao Entrez para retornar somente onde encontrar o termo CASP1 e

Homo sapiens como organismo Em cada banco eacute possiacutevel montar uma busca refinada usando ferramenta de busca

avanccedilada Vamos usar o banco gene para fazer essa busca avanccedilada

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

GeneNCBI

httpswwwncbinlmnihgovgene

Figura Paacutegina de entrada do Gene Clicar em Advanced

Builder

Selecionar

Gene name e digitar CASP1

Usar o Operador AND

Organism e digitar Homo sapiens

Vejam que a busca jaacute estaacute sendo montada acima do Builder

Ao terminar a busca clicar em Search

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Agora experimentem montar diferentes buscas usando outros operados (ANDORNOT) para outros genes

e outras caracteristicas disponiacuteveis para busca Advanced

Vamos buscar o Gene TLR9 (Toll Like Receptor 9) no banco GeneNCBI para ver quais informaccedilotildees esse

banco de dados retorna

Official Symbol TLR9provided by HGNC

Official Full Name toll like receptor 9provided by HGNC

Primary source HGNCHGNC15633

See related EnsemblENSG00000239732 MIM605474 VegaOTTHUMG00000158106

Gene type protein coding

RefSeq status REVIEWED

Organism Homo sapiens

Lineage Eukaryota Metazoa Chordata Craniata Vertebrata Euteleostomi Mammalia Eutheria

Euarchontoglires Primates Haplorrhini Catarrhini Hominidae Homo

Also known as CD289

Summary The protein encoded by this gene is a member of the Toll-like receptor (TLR) family which plays

a fundamental role in pathogen recognition and activation of innate immunity TLRs are highly conserved

from Drosophila to humans and share structural and functional similarities They recognize

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

pathogen-associated molecular patterns (PAMPs) that are expressed on infectious agents and mediate the

production of cytokines necessary for the development of effective immunity The various TLRs exhibit

different patterns of expression This gene is preferentially expressed in immune cell rich tissues such as

spleen lymph node bone marrow and peripheral blood leukocytes Studies in mice and human indicate that

this receptor mediates cellular response to unmethylated CpG dinucleotides in bacterial DNA to mount an

innate immune response [provided by RefSeq Jul 2008]

Orthologs mouse all

Pathways from BioSystems

KEGG REACTOME WikiPathways

Homology

Homologs of the TLR9 gene The TLR9 gene is conserved in chimpanzee Rhesus monkey dog cow mouse rat zebrafish and frog Orthologs from Annotation Pipeline 72 organisms have orthologs with human gene TLR9 Map Viewer (Mouse Rat) The Hierarchical Catalog of Orthologs

Gene Ontology

Function Process Component

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

NucleotideNCBI

httpswwwncbinlmnihgovnuccore

O banco Nucleotide armazena sequecircncias e informaccedilotildees associadas a cada uma das sequecircncias A pesquisa nessa banco pode retornar vaacuterias sequecircncias depositadas por diferentes pesquisadores

Podemos selecionar as sequecircncias desejadas e baixar para analisar mutaccediloes diversidade presenccedila de regiotildees conservadas

A busca pelo termo TLR9 no banco nucleotide retorna 3258 entradas (Busca realizada 260117)

A descriccedilatildeo partial cds significa que a sequecircncia do gene natildeo estaacute completa o pesquisador que depositou natildeo obteve a sequecircncias completa e submeteu somente uma parte do gene A descriccedilatildeo complete cds significa que foi depositado a sequecircncia completa do gene CDS significa a regiatildeo codificante do gene

Vamos observar a entrada 33 dessa busca

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Figura Informaccedilotildees iniciais sobre a entrada nuacutemero 33 apoacutes a busca usando o termo

TLR9

Figura Informaccedilotildees sobre as caracteristicas jaacute descritas para essa sequecircncia Observem que mesmo dentro do banco Nucleotide noacutes temos acesso a sequecircncia de proteiacutena codificada por esse gene Dentro da FeatureCDStranslation O formato GenBank guarda toda a informaccedilatildeo sobre as proteiacutenas depositadas no banco Nucleotide do NCBI

ProteinNCBI

httpswwwncbinlmnihgovprotein

O banco Protein armazena sequecircncias de proteiacutenas e sequecircncias que foram traduzidas automaticamente de sequecircncias nucleotiacutedicas codificadoras O banco tambeacutem traz informaccedilotildees associadas a cada uma das sequecircncias A pesquisa nessa banco pode retornar vaacuterias sequecircncias depositadas por diferentes pesquisadores

Podemos selecionar as sequecircncias desejadas e baixar para analisar alteraccedilotildees na sequecircncia de proteiacutena diversidade presenccedila de regiotildees conservadas

A busca pelo termo TLR9 retorna 8 entradas (Busca realizada 260117) O termo partialsignifica que a sequecircncias da proteiacutena natildeo estaacute completa Vamos observar as informaccedilatildeo da entrada 20 da busca realizada com o termo TLR9

Figura Informaccedilotildees sobre a entrada 20 da busca TLR9

Figura Features da entrada 20 da busca por TLR9 No final da entrada encontramos a sequecircncia da proteiacutena O formato GenPept guarda toda a informaccedilatildeo sobre as proteiacutenas depositadas no banco Proteins do NCBI

TaxonomyNCBI httpswwwncbinlmnihgovtaxonomy Banco de dados com informaccedilotildees sobre a classificaccedilatildeo taxonocircmica das espeacutecies Esse banco de dados apresenta somente informaccedilotildees taxonocircmicas de espeacutecies que tecircm informaccedilotildees moleculares depositadas no NCBI Informaccedilotildees sobre a espeacutecie Homo sapiens no banco de dados Taxonomy Homo sapiens Taxonomy ID 9606 Genbank common name human Inherited blast name primates Rank species Genetic code Translation table 1 (Standard) Mitochondrial genetic code Translation table 2 (Vertebrate Mitochondrial) Other names

synonym humans

common name

man

authority Homo sapiens Linnaeus 1758

Lineage ( full ) cellular organisms Eukaryota Opisthokonta Metazoa Eumetazoa Bilateria Deuterostomia Chordata Craniata Vertebrata Gnathostomata Teleostomi Euteleostomi Sarcopterygii Dipnotetrapodomorpha Tetrapoda Amniota Mammalia Theria Eutheria Boreoeutheria Euarchontoglires Primates Haplorrhini Simiiformes Catarrhini Hominoidea Hominidae Homininae Homo A classificaccedilatildeo apresenta quantitativo de dados em outros banco de dados com links para essas informaccedilotildees na tabela Entrez records

Entrez records

Database name Subtree

links Direct links

Nucleotide 14112440 14112396

Nucleotide EST 8705106 8705106

Nucleotide GSS 1762817 1761491

Protein 1069030 1068738

Structure 33029 33029

Genome 1 1

Popset 23505 23504

SNP 165297523 165297523

Domains 24 24

GEO Datasets 1244816 1244816

UniGene 130056 130056

PubMed Central 553832 553829

Gene 219667 219594

HomoloGene 18713 18713

SRA Experiments 742541 742319

Probe 27382435 27382435

Assembly 90 90

Bio Project 32438 32427

Bio Sample 2516813 2516682

Bio Systems 3070 3070

Clone DB 17567413 17567413

dbVar 5064734 5064734

GEO Profiles 61958910 61958910

PubChem BioAssay 311510 311502

Protein Clusters 13 13

Taxonomy 3 1

Ainda podemos encontrar informaccedilotildees sobre projetos genomas e outros links para bancos taxonocircmicos nessa paacutegina Veja as informaccedilotildees que vocecirc pode encontrar para outras espeacutecies Mus musculus Taxonomy ID 10090 Genbank common name house mouse Inherited blast name rodents Arabidopsis thaliana Taxonomy ID 3702 Genbank common name thale cress

Uniprot

httpwwwuniprotorg

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias

Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

O uniprot fornece informaccedilotildees e sequecircncias sobre proteiacutenas As sequecircncias e informaccedilotildees funcionais das proteiacutenas podem vir de projetos genomas (sequecircncias codificantes) ou podem ser depositadas por curadores do UniProt Isso cria duas divisotildees dentro do Uniprot o UniProtKBTrEMBL e o UniProtKBSwiss-Prot As entradas do Uniprot apresentam nuacutemero de acesso alfanumeacuterico exemplo Q9NR96

O TrEMBL satildeo proteiacutenas que foram adicionadas no Uniprot de forma automaacutetica e natildeo passou por um processo de revisatildeo dos curadores (Status Unreviewed) Essas informaccedilotildees devem ser usadas com mais cuidado

O Swiss-Prot tem um crescimento lento porque todas as sequecircncias que estatildeo nessa subdivisatildeo passaram pela anotaccedilatildeo manual e revisatildeo de um curador (Status Reviewed) Essas informaccedilotildees satildeo confiaacuteveis As entradas trazem informaccedilotildees sobre resultados experimentais caracteriacutesticas e conclusotildees cientiacuteficas

Informaccedilotildees Protein Gene Organism Status (Reviewed ou Unreviewed)

- Annotation score -Experimental evidence at protein level ou Protein predicted

Function GO - Molecular function GO - Biological process Subcellular location

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Pesquisem sobre TLR9 no uniprot e vejam as informaccedilotildees que vocecircs podem encontrar Entrem no primeiro resultado (TLR( humano - Acesso Q9NR96)

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Protein Data Bank

wwwrcsborg

Banco de dados que armazena informaccedilotildees sobre estrutura tridimensional das proteiacutenas Nessa banco satildeo armazendas estruturas das proteiacutenas que foram avaliadas por cristalografia Raio-X Espectroscopia por ressonacircncia magneacutetica nuclear (NMR) Atualmente existem 126278 estruturas depositadas no PDB

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

A busca no Entrez eacute realizada em todos os banco de dados ligados ao NCBI O Entrez

ainda aceita pesquisa especiacuteficas para cada banco ou pesquisas mais refinadas usando operadores

Exemplo (CASP1) AND Homo Sapiens O operador AND diz ao Entrez para retornar somente onde encontrar o termo CASP1 e

Homo sapiens como organismo (CASP1) AND Homo Sapiens[Organism] O operador AND diz ao Entrez para retornar somente onde encontrar o termo CASP1 e

Homo sapiens como organismo Em cada banco eacute possiacutevel montar uma busca refinada usando ferramenta de busca

avanccedilada Vamos usar o banco gene para fazer essa busca avanccedilada

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

GeneNCBI

httpswwwncbinlmnihgovgene

Figura Paacutegina de entrada do Gene Clicar em Advanced

Builder

Selecionar

Gene name e digitar CASP1

Usar o Operador AND

Organism e digitar Homo sapiens

Vejam que a busca jaacute estaacute sendo montada acima do Builder

Ao terminar a busca clicar em Search

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Agora experimentem montar diferentes buscas usando outros operados (ANDORNOT) para outros genes

e outras caracteristicas disponiacuteveis para busca Advanced

Vamos buscar o Gene TLR9 (Toll Like Receptor 9) no banco GeneNCBI para ver quais informaccedilotildees esse

banco de dados retorna

Official Symbol TLR9provided by HGNC

Official Full Name toll like receptor 9provided by HGNC

Primary source HGNCHGNC15633

See related EnsemblENSG00000239732 MIM605474 VegaOTTHUMG00000158106

Gene type protein coding

RefSeq status REVIEWED

Organism Homo sapiens

Lineage Eukaryota Metazoa Chordata Craniata Vertebrata Euteleostomi Mammalia Eutheria

Euarchontoglires Primates Haplorrhini Catarrhini Hominidae Homo

Also known as CD289

Summary The protein encoded by this gene is a member of the Toll-like receptor (TLR) family which plays

a fundamental role in pathogen recognition and activation of innate immunity TLRs are highly conserved

from Drosophila to humans and share structural and functional similarities They recognize

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

pathogen-associated molecular patterns (PAMPs) that are expressed on infectious agents and mediate the

production of cytokines necessary for the development of effective immunity The various TLRs exhibit

different patterns of expression This gene is preferentially expressed in immune cell rich tissues such as

spleen lymph node bone marrow and peripheral blood leukocytes Studies in mice and human indicate that

this receptor mediates cellular response to unmethylated CpG dinucleotides in bacterial DNA to mount an

innate immune response [provided by RefSeq Jul 2008]

Orthologs mouse all

Pathways from BioSystems

KEGG REACTOME WikiPathways

Homology

Homologs of the TLR9 gene The TLR9 gene is conserved in chimpanzee Rhesus monkey dog cow mouse rat zebrafish and frog Orthologs from Annotation Pipeline 72 organisms have orthologs with human gene TLR9 Map Viewer (Mouse Rat) The Hierarchical Catalog of Orthologs

Gene Ontology

Function Process Component

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

NucleotideNCBI

httpswwwncbinlmnihgovnuccore

O banco Nucleotide armazena sequecircncias e informaccedilotildees associadas a cada uma das sequecircncias A pesquisa nessa banco pode retornar vaacuterias sequecircncias depositadas por diferentes pesquisadores

Podemos selecionar as sequecircncias desejadas e baixar para analisar mutaccediloes diversidade presenccedila de regiotildees conservadas

A busca pelo termo TLR9 no banco nucleotide retorna 3258 entradas (Busca realizada 260117)

A descriccedilatildeo partial cds significa que a sequecircncia do gene natildeo estaacute completa o pesquisador que depositou natildeo obteve a sequecircncias completa e submeteu somente uma parte do gene A descriccedilatildeo complete cds significa que foi depositado a sequecircncia completa do gene CDS significa a regiatildeo codificante do gene

Vamos observar a entrada 33 dessa busca

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Figura Informaccedilotildees iniciais sobre a entrada nuacutemero 33 apoacutes a busca usando o termo

TLR9

Figura Informaccedilotildees sobre as caracteristicas jaacute descritas para essa sequecircncia Observem que mesmo dentro do banco Nucleotide noacutes temos acesso a sequecircncia de proteiacutena codificada por esse gene Dentro da FeatureCDStranslation O formato GenBank guarda toda a informaccedilatildeo sobre as proteiacutenas depositadas no banco Nucleotide do NCBI

ProteinNCBI

httpswwwncbinlmnihgovprotein

O banco Protein armazena sequecircncias de proteiacutenas e sequecircncias que foram traduzidas automaticamente de sequecircncias nucleotiacutedicas codificadoras O banco tambeacutem traz informaccedilotildees associadas a cada uma das sequecircncias A pesquisa nessa banco pode retornar vaacuterias sequecircncias depositadas por diferentes pesquisadores

Podemos selecionar as sequecircncias desejadas e baixar para analisar alteraccedilotildees na sequecircncia de proteiacutena diversidade presenccedila de regiotildees conservadas

A busca pelo termo TLR9 retorna 8 entradas (Busca realizada 260117) O termo partialsignifica que a sequecircncias da proteiacutena natildeo estaacute completa Vamos observar as informaccedilatildeo da entrada 20 da busca realizada com o termo TLR9

Figura Informaccedilotildees sobre a entrada 20 da busca TLR9

Figura Features da entrada 20 da busca por TLR9 No final da entrada encontramos a sequecircncia da proteiacutena O formato GenPept guarda toda a informaccedilatildeo sobre as proteiacutenas depositadas no banco Proteins do NCBI

TaxonomyNCBI httpswwwncbinlmnihgovtaxonomy Banco de dados com informaccedilotildees sobre a classificaccedilatildeo taxonocircmica das espeacutecies Esse banco de dados apresenta somente informaccedilotildees taxonocircmicas de espeacutecies que tecircm informaccedilotildees moleculares depositadas no NCBI Informaccedilotildees sobre a espeacutecie Homo sapiens no banco de dados Taxonomy Homo sapiens Taxonomy ID 9606 Genbank common name human Inherited blast name primates Rank species Genetic code Translation table 1 (Standard) Mitochondrial genetic code Translation table 2 (Vertebrate Mitochondrial) Other names

synonym humans

common name

man

authority Homo sapiens Linnaeus 1758

Lineage ( full ) cellular organisms Eukaryota Opisthokonta Metazoa Eumetazoa Bilateria Deuterostomia Chordata Craniata Vertebrata Gnathostomata Teleostomi Euteleostomi Sarcopterygii Dipnotetrapodomorpha Tetrapoda Amniota Mammalia Theria Eutheria Boreoeutheria Euarchontoglires Primates Haplorrhini Simiiformes Catarrhini Hominoidea Hominidae Homininae Homo A classificaccedilatildeo apresenta quantitativo de dados em outros banco de dados com links para essas informaccedilotildees na tabela Entrez records

Entrez records

Database name Subtree

links Direct links

Nucleotide 14112440 14112396

Nucleotide EST 8705106 8705106

Nucleotide GSS 1762817 1761491

Protein 1069030 1068738

Structure 33029 33029

Genome 1 1

Popset 23505 23504

SNP 165297523 165297523

Domains 24 24

GEO Datasets 1244816 1244816

UniGene 130056 130056

PubMed Central 553832 553829

Gene 219667 219594

HomoloGene 18713 18713

SRA Experiments 742541 742319

Probe 27382435 27382435

Assembly 90 90

Bio Project 32438 32427

Bio Sample 2516813 2516682

Bio Systems 3070 3070

Clone DB 17567413 17567413

dbVar 5064734 5064734

GEO Profiles 61958910 61958910

PubChem BioAssay 311510 311502

Protein Clusters 13 13

Taxonomy 3 1

Ainda podemos encontrar informaccedilotildees sobre projetos genomas e outros links para bancos taxonocircmicos nessa paacutegina Veja as informaccedilotildees que vocecirc pode encontrar para outras espeacutecies Mus musculus Taxonomy ID 10090 Genbank common name house mouse Inherited blast name rodents Arabidopsis thaliana Taxonomy ID 3702 Genbank common name thale cress

Uniprot

httpwwwuniprotorg

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias

Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

O uniprot fornece informaccedilotildees e sequecircncias sobre proteiacutenas As sequecircncias e informaccedilotildees funcionais das proteiacutenas podem vir de projetos genomas (sequecircncias codificantes) ou podem ser depositadas por curadores do UniProt Isso cria duas divisotildees dentro do Uniprot o UniProtKBTrEMBL e o UniProtKBSwiss-Prot As entradas do Uniprot apresentam nuacutemero de acesso alfanumeacuterico exemplo Q9NR96

O TrEMBL satildeo proteiacutenas que foram adicionadas no Uniprot de forma automaacutetica e natildeo passou por um processo de revisatildeo dos curadores (Status Unreviewed) Essas informaccedilotildees devem ser usadas com mais cuidado

O Swiss-Prot tem um crescimento lento porque todas as sequecircncias que estatildeo nessa subdivisatildeo passaram pela anotaccedilatildeo manual e revisatildeo de um curador (Status Reviewed) Essas informaccedilotildees satildeo confiaacuteveis As entradas trazem informaccedilotildees sobre resultados experimentais caracteriacutesticas e conclusotildees cientiacuteficas

Informaccedilotildees Protein Gene Organism Status (Reviewed ou Unreviewed)

- Annotation score -Experimental evidence at protein level ou Protein predicted

Function GO - Molecular function GO - Biological process Subcellular location

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Pesquisem sobre TLR9 no uniprot e vejam as informaccedilotildees que vocecircs podem encontrar Entrem no primeiro resultado (TLR( humano - Acesso Q9NR96)

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Protein Data Bank

wwwrcsborg

Banco de dados que armazena informaccedilotildees sobre estrutura tridimensional das proteiacutenas Nessa banco satildeo armazendas estruturas das proteiacutenas que foram avaliadas por cristalografia Raio-X Espectroscopia por ressonacircncia magneacutetica nuclear (NMR) Atualmente existem 126278 estruturas depositadas no PDB

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

GeneNCBI

httpswwwncbinlmnihgovgene

Figura Paacutegina de entrada do Gene Clicar em Advanced

Builder

Selecionar

Gene name e digitar CASP1

Usar o Operador AND

Organism e digitar Homo sapiens

Vejam que a busca jaacute estaacute sendo montada acima do Builder

Ao terminar a busca clicar em Search

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Agora experimentem montar diferentes buscas usando outros operados (ANDORNOT) para outros genes

e outras caracteristicas disponiacuteveis para busca Advanced

Vamos buscar o Gene TLR9 (Toll Like Receptor 9) no banco GeneNCBI para ver quais informaccedilotildees esse

banco de dados retorna

Official Symbol TLR9provided by HGNC

Official Full Name toll like receptor 9provided by HGNC

Primary source HGNCHGNC15633

See related EnsemblENSG00000239732 MIM605474 VegaOTTHUMG00000158106

Gene type protein coding

RefSeq status REVIEWED

Organism Homo sapiens

Lineage Eukaryota Metazoa Chordata Craniata Vertebrata Euteleostomi Mammalia Eutheria

Euarchontoglires Primates Haplorrhini Catarrhini Hominidae Homo

Also known as CD289

Summary The protein encoded by this gene is a member of the Toll-like receptor (TLR) family which plays

a fundamental role in pathogen recognition and activation of innate immunity TLRs are highly conserved

from Drosophila to humans and share structural and functional similarities They recognize

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

pathogen-associated molecular patterns (PAMPs) that are expressed on infectious agents and mediate the

production of cytokines necessary for the development of effective immunity The various TLRs exhibit

different patterns of expression This gene is preferentially expressed in immune cell rich tissues such as

spleen lymph node bone marrow and peripheral blood leukocytes Studies in mice and human indicate that

this receptor mediates cellular response to unmethylated CpG dinucleotides in bacterial DNA to mount an

innate immune response [provided by RefSeq Jul 2008]

Orthologs mouse all

Pathways from BioSystems

KEGG REACTOME WikiPathways

Homology

Homologs of the TLR9 gene The TLR9 gene is conserved in chimpanzee Rhesus monkey dog cow mouse rat zebrafish and frog Orthologs from Annotation Pipeline 72 organisms have orthologs with human gene TLR9 Map Viewer (Mouse Rat) The Hierarchical Catalog of Orthologs

Gene Ontology

Function Process Component

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

NucleotideNCBI

httpswwwncbinlmnihgovnuccore

O banco Nucleotide armazena sequecircncias e informaccedilotildees associadas a cada uma das sequecircncias A pesquisa nessa banco pode retornar vaacuterias sequecircncias depositadas por diferentes pesquisadores

Podemos selecionar as sequecircncias desejadas e baixar para analisar mutaccediloes diversidade presenccedila de regiotildees conservadas

A busca pelo termo TLR9 no banco nucleotide retorna 3258 entradas (Busca realizada 260117)

A descriccedilatildeo partial cds significa que a sequecircncia do gene natildeo estaacute completa o pesquisador que depositou natildeo obteve a sequecircncias completa e submeteu somente uma parte do gene A descriccedilatildeo complete cds significa que foi depositado a sequecircncia completa do gene CDS significa a regiatildeo codificante do gene

Vamos observar a entrada 33 dessa busca

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Figura Informaccedilotildees iniciais sobre a entrada nuacutemero 33 apoacutes a busca usando o termo

TLR9

Figura Informaccedilotildees sobre as caracteristicas jaacute descritas para essa sequecircncia Observem que mesmo dentro do banco Nucleotide noacutes temos acesso a sequecircncia de proteiacutena codificada por esse gene Dentro da FeatureCDStranslation O formato GenBank guarda toda a informaccedilatildeo sobre as proteiacutenas depositadas no banco Nucleotide do NCBI

ProteinNCBI

httpswwwncbinlmnihgovprotein

O banco Protein armazena sequecircncias de proteiacutenas e sequecircncias que foram traduzidas automaticamente de sequecircncias nucleotiacutedicas codificadoras O banco tambeacutem traz informaccedilotildees associadas a cada uma das sequecircncias A pesquisa nessa banco pode retornar vaacuterias sequecircncias depositadas por diferentes pesquisadores

Podemos selecionar as sequecircncias desejadas e baixar para analisar alteraccedilotildees na sequecircncia de proteiacutena diversidade presenccedila de regiotildees conservadas

A busca pelo termo TLR9 retorna 8 entradas (Busca realizada 260117) O termo partialsignifica que a sequecircncias da proteiacutena natildeo estaacute completa Vamos observar as informaccedilatildeo da entrada 20 da busca realizada com o termo TLR9

Figura Informaccedilotildees sobre a entrada 20 da busca TLR9

Figura Features da entrada 20 da busca por TLR9 No final da entrada encontramos a sequecircncia da proteiacutena O formato GenPept guarda toda a informaccedilatildeo sobre as proteiacutenas depositadas no banco Proteins do NCBI

TaxonomyNCBI httpswwwncbinlmnihgovtaxonomy Banco de dados com informaccedilotildees sobre a classificaccedilatildeo taxonocircmica das espeacutecies Esse banco de dados apresenta somente informaccedilotildees taxonocircmicas de espeacutecies que tecircm informaccedilotildees moleculares depositadas no NCBI Informaccedilotildees sobre a espeacutecie Homo sapiens no banco de dados Taxonomy Homo sapiens Taxonomy ID 9606 Genbank common name human Inherited blast name primates Rank species Genetic code Translation table 1 (Standard) Mitochondrial genetic code Translation table 2 (Vertebrate Mitochondrial) Other names

synonym humans

common name

man

authority Homo sapiens Linnaeus 1758

Lineage ( full ) cellular organisms Eukaryota Opisthokonta Metazoa Eumetazoa Bilateria Deuterostomia Chordata Craniata Vertebrata Gnathostomata Teleostomi Euteleostomi Sarcopterygii Dipnotetrapodomorpha Tetrapoda Amniota Mammalia Theria Eutheria Boreoeutheria Euarchontoglires Primates Haplorrhini Simiiformes Catarrhini Hominoidea Hominidae Homininae Homo A classificaccedilatildeo apresenta quantitativo de dados em outros banco de dados com links para essas informaccedilotildees na tabela Entrez records

Entrez records

Database name Subtree

links Direct links

Nucleotide 14112440 14112396

Nucleotide EST 8705106 8705106

Nucleotide GSS 1762817 1761491

Protein 1069030 1068738

Structure 33029 33029

Genome 1 1

Popset 23505 23504

SNP 165297523 165297523

Domains 24 24

GEO Datasets 1244816 1244816

UniGene 130056 130056

PubMed Central 553832 553829

Gene 219667 219594

HomoloGene 18713 18713

SRA Experiments 742541 742319

Probe 27382435 27382435

Assembly 90 90

Bio Project 32438 32427

Bio Sample 2516813 2516682

Bio Systems 3070 3070

Clone DB 17567413 17567413

dbVar 5064734 5064734

GEO Profiles 61958910 61958910

PubChem BioAssay 311510 311502

Protein Clusters 13 13

Taxonomy 3 1

Ainda podemos encontrar informaccedilotildees sobre projetos genomas e outros links para bancos taxonocircmicos nessa paacutegina Veja as informaccedilotildees que vocecirc pode encontrar para outras espeacutecies Mus musculus Taxonomy ID 10090 Genbank common name house mouse Inherited blast name rodents Arabidopsis thaliana Taxonomy ID 3702 Genbank common name thale cress

Uniprot

httpwwwuniprotorg

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias

Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

O uniprot fornece informaccedilotildees e sequecircncias sobre proteiacutenas As sequecircncias e informaccedilotildees funcionais das proteiacutenas podem vir de projetos genomas (sequecircncias codificantes) ou podem ser depositadas por curadores do UniProt Isso cria duas divisotildees dentro do Uniprot o UniProtKBTrEMBL e o UniProtKBSwiss-Prot As entradas do Uniprot apresentam nuacutemero de acesso alfanumeacuterico exemplo Q9NR96

O TrEMBL satildeo proteiacutenas que foram adicionadas no Uniprot de forma automaacutetica e natildeo passou por um processo de revisatildeo dos curadores (Status Unreviewed) Essas informaccedilotildees devem ser usadas com mais cuidado

O Swiss-Prot tem um crescimento lento porque todas as sequecircncias que estatildeo nessa subdivisatildeo passaram pela anotaccedilatildeo manual e revisatildeo de um curador (Status Reviewed) Essas informaccedilotildees satildeo confiaacuteveis As entradas trazem informaccedilotildees sobre resultados experimentais caracteriacutesticas e conclusotildees cientiacuteficas

Informaccedilotildees Protein Gene Organism Status (Reviewed ou Unreviewed)

- Annotation score -Experimental evidence at protein level ou Protein predicted

Function GO - Molecular function GO - Biological process Subcellular location

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Pesquisem sobre TLR9 no uniprot e vejam as informaccedilotildees que vocecircs podem encontrar Entrem no primeiro resultado (TLR( humano - Acesso Q9NR96)

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Protein Data Bank

wwwrcsborg

Banco de dados que armazena informaccedilotildees sobre estrutura tridimensional das proteiacutenas Nessa banco satildeo armazendas estruturas das proteiacutenas que foram avaliadas por cristalografia Raio-X Espectroscopia por ressonacircncia magneacutetica nuclear (NMR) Atualmente existem 126278 estruturas depositadas no PDB

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Agora experimentem montar diferentes buscas usando outros operados (ANDORNOT) para outros genes

e outras caracteristicas disponiacuteveis para busca Advanced

Vamos buscar o Gene TLR9 (Toll Like Receptor 9) no banco GeneNCBI para ver quais informaccedilotildees esse

banco de dados retorna

Official Symbol TLR9provided by HGNC

Official Full Name toll like receptor 9provided by HGNC

Primary source HGNCHGNC15633

See related EnsemblENSG00000239732 MIM605474 VegaOTTHUMG00000158106

Gene type protein coding

RefSeq status REVIEWED

Organism Homo sapiens

Lineage Eukaryota Metazoa Chordata Craniata Vertebrata Euteleostomi Mammalia Eutheria

Euarchontoglires Primates Haplorrhini Catarrhini Hominidae Homo

Also known as CD289

Summary The protein encoded by this gene is a member of the Toll-like receptor (TLR) family which plays

a fundamental role in pathogen recognition and activation of innate immunity TLRs are highly conserved

from Drosophila to humans and share structural and functional similarities They recognize

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

pathogen-associated molecular patterns (PAMPs) that are expressed on infectious agents and mediate the

production of cytokines necessary for the development of effective immunity The various TLRs exhibit

different patterns of expression This gene is preferentially expressed in immune cell rich tissues such as

spleen lymph node bone marrow and peripheral blood leukocytes Studies in mice and human indicate that

this receptor mediates cellular response to unmethylated CpG dinucleotides in bacterial DNA to mount an

innate immune response [provided by RefSeq Jul 2008]

Orthologs mouse all

Pathways from BioSystems

KEGG REACTOME WikiPathways

Homology

Homologs of the TLR9 gene The TLR9 gene is conserved in chimpanzee Rhesus monkey dog cow mouse rat zebrafish and frog Orthologs from Annotation Pipeline 72 organisms have orthologs with human gene TLR9 Map Viewer (Mouse Rat) The Hierarchical Catalog of Orthologs

Gene Ontology

Function Process Component

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

NucleotideNCBI

httpswwwncbinlmnihgovnuccore

O banco Nucleotide armazena sequecircncias e informaccedilotildees associadas a cada uma das sequecircncias A pesquisa nessa banco pode retornar vaacuterias sequecircncias depositadas por diferentes pesquisadores

Podemos selecionar as sequecircncias desejadas e baixar para analisar mutaccediloes diversidade presenccedila de regiotildees conservadas

A busca pelo termo TLR9 no banco nucleotide retorna 3258 entradas (Busca realizada 260117)

A descriccedilatildeo partial cds significa que a sequecircncia do gene natildeo estaacute completa o pesquisador que depositou natildeo obteve a sequecircncias completa e submeteu somente uma parte do gene A descriccedilatildeo complete cds significa que foi depositado a sequecircncia completa do gene CDS significa a regiatildeo codificante do gene

Vamos observar a entrada 33 dessa busca

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Figura Informaccedilotildees iniciais sobre a entrada nuacutemero 33 apoacutes a busca usando o termo

TLR9

Figura Informaccedilotildees sobre as caracteristicas jaacute descritas para essa sequecircncia Observem que mesmo dentro do banco Nucleotide noacutes temos acesso a sequecircncia de proteiacutena codificada por esse gene Dentro da FeatureCDStranslation O formato GenBank guarda toda a informaccedilatildeo sobre as proteiacutenas depositadas no banco Nucleotide do NCBI

ProteinNCBI

httpswwwncbinlmnihgovprotein

O banco Protein armazena sequecircncias de proteiacutenas e sequecircncias que foram traduzidas automaticamente de sequecircncias nucleotiacutedicas codificadoras O banco tambeacutem traz informaccedilotildees associadas a cada uma das sequecircncias A pesquisa nessa banco pode retornar vaacuterias sequecircncias depositadas por diferentes pesquisadores

Podemos selecionar as sequecircncias desejadas e baixar para analisar alteraccedilotildees na sequecircncia de proteiacutena diversidade presenccedila de regiotildees conservadas

A busca pelo termo TLR9 retorna 8 entradas (Busca realizada 260117) O termo partialsignifica que a sequecircncias da proteiacutena natildeo estaacute completa Vamos observar as informaccedilatildeo da entrada 20 da busca realizada com o termo TLR9

Figura Informaccedilotildees sobre a entrada 20 da busca TLR9

Figura Features da entrada 20 da busca por TLR9 No final da entrada encontramos a sequecircncia da proteiacutena O formato GenPept guarda toda a informaccedilatildeo sobre as proteiacutenas depositadas no banco Proteins do NCBI

TaxonomyNCBI httpswwwncbinlmnihgovtaxonomy Banco de dados com informaccedilotildees sobre a classificaccedilatildeo taxonocircmica das espeacutecies Esse banco de dados apresenta somente informaccedilotildees taxonocircmicas de espeacutecies que tecircm informaccedilotildees moleculares depositadas no NCBI Informaccedilotildees sobre a espeacutecie Homo sapiens no banco de dados Taxonomy Homo sapiens Taxonomy ID 9606 Genbank common name human Inherited blast name primates Rank species Genetic code Translation table 1 (Standard) Mitochondrial genetic code Translation table 2 (Vertebrate Mitochondrial) Other names

synonym humans

common name

man

authority Homo sapiens Linnaeus 1758

Lineage ( full ) cellular organisms Eukaryota Opisthokonta Metazoa Eumetazoa Bilateria Deuterostomia Chordata Craniata Vertebrata Gnathostomata Teleostomi Euteleostomi Sarcopterygii Dipnotetrapodomorpha Tetrapoda Amniota Mammalia Theria Eutheria Boreoeutheria Euarchontoglires Primates Haplorrhini Simiiformes Catarrhini Hominoidea Hominidae Homininae Homo A classificaccedilatildeo apresenta quantitativo de dados em outros banco de dados com links para essas informaccedilotildees na tabela Entrez records

Entrez records

Database name Subtree

links Direct links

Nucleotide 14112440 14112396

Nucleotide EST 8705106 8705106

Nucleotide GSS 1762817 1761491

Protein 1069030 1068738

Structure 33029 33029

Genome 1 1

Popset 23505 23504

SNP 165297523 165297523

Domains 24 24

GEO Datasets 1244816 1244816

UniGene 130056 130056

PubMed Central 553832 553829

Gene 219667 219594

HomoloGene 18713 18713

SRA Experiments 742541 742319

Probe 27382435 27382435

Assembly 90 90

Bio Project 32438 32427

Bio Sample 2516813 2516682

Bio Systems 3070 3070

Clone DB 17567413 17567413

dbVar 5064734 5064734

GEO Profiles 61958910 61958910

PubChem BioAssay 311510 311502

Protein Clusters 13 13

Taxonomy 3 1

Ainda podemos encontrar informaccedilotildees sobre projetos genomas e outros links para bancos taxonocircmicos nessa paacutegina Veja as informaccedilotildees que vocecirc pode encontrar para outras espeacutecies Mus musculus Taxonomy ID 10090 Genbank common name house mouse Inherited blast name rodents Arabidopsis thaliana Taxonomy ID 3702 Genbank common name thale cress

Uniprot

httpwwwuniprotorg

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias

Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

O uniprot fornece informaccedilotildees e sequecircncias sobre proteiacutenas As sequecircncias e informaccedilotildees funcionais das proteiacutenas podem vir de projetos genomas (sequecircncias codificantes) ou podem ser depositadas por curadores do UniProt Isso cria duas divisotildees dentro do Uniprot o UniProtKBTrEMBL e o UniProtKBSwiss-Prot As entradas do Uniprot apresentam nuacutemero de acesso alfanumeacuterico exemplo Q9NR96

O TrEMBL satildeo proteiacutenas que foram adicionadas no Uniprot de forma automaacutetica e natildeo passou por um processo de revisatildeo dos curadores (Status Unreviewed) Essas informaccedilotildees devem ser usadas com mais cuidado

O Swiss-Prot tem um crescimento lento porque todas as sequecircncias que estatildeo nessa subdivisatildeo passaram pela anotaccedilatildeo manual e revisatildeo de um curador (Status Reviewed) Essas informaccedilotildees satildeo confiaacuteveis As entradas trazem informaccedilotildees sobre resultados experimentais caracteriacutesticas e conclusotildees cientiacuteficas

Informaccedilotildees Protein Gene Organism Status (Reviewed ou Unreviewed)

- Annotation score -Experimental evidence at protein level ou Protein predicted

Function GO - Molecular function GO - Biological process Subcellular location

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Pesquisem sobre TLR9 no uniprot e vejam as informaccedilotildees que vocecircs podem encontrar Entrem no primeiro resultado (TLR( humano - Acesso Q9NR96)

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Protein Data Bank

wwwrcsborg

Banco de dados que armazena informaccedilotildees sobre estrutura tridimensional das proteiacutenas Nessa banco satildeo armazendas estruturas das proteiacutenas que foram avaliadas por cristalografia Raio-X Espectroscopia por ressonacircncia magneacutetica nuclear (NMR) Atualmente existem 126278 estruturas depositadas no PDB

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

pathogen-associated molecular patterns (PAMPs) that are expressed on infectious agents and mediate the

production of cytokines necessary for the development of effective immunity The various TLRs exhibit

different patterns of expression This gene is preferentially expressed in immune cell rich tissues such as

spleen lymph node bone marrow and peripheral blood leukocytes Studies in mice and human indicate that

this receptor mediates cellular response to unmethylated CpG dinucleotides in bacterial DNA to mount an

innate immune response [provided by RefSeq Jul 2008]

Orthologs mouse all

Pathways from BioSystems

KEGG REACTOME WikiPathways

Homology

Homologs of the TLR9 gene The TLR9 gene is conserved in chimpanzee Rhesus monkey dog cow mouse rat zebrafish and frog Orthologs from Annotation Pipeline 72 organisms have orthologs with human gene TLR9 Map Viewer (Mouse Rat) The Hierarchical Catalog of Orthologs

Gene Ontology

Function Process Component

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

NucleotideNCBI

httpswwwncbinlmnihgovnuccore

O banco Nucleotide armazena sequecircncias e informaccedilotildees associadas a cada uma das sequecircncias A pesquisa nessa banco pode retornar vaacuterias sequecircncias depositadas por diferentes pesquisadores

Podemos selecionar as sequecircncias desejadas e baixar para analisar mutaccediloes diversidade presenccedila de regiotildees conservadas

A busca pelo termo TLR9 no banco nucleotide retorna 3258 entradas (Busca realizada 260117)

A descriccedilatildeo partial cds significa que a sequecircncia do gene natildeo estaacute completa o pesquisador que depositou natildeo obteve a sequecircncias completa e submeteu somente uma parte do gene A descriccedilatildeo complete cds significa que foi depositado a sequecircncia completa do gene CDS significa a regiatildeo codificante do gene

Vamos observar a entrada 33 dessa busca

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Figura Informaccedilotildees iniciais sobre a entrada nuacutemero 33 apoacutes a busca usando o termo

TLR9

Figura Informaccedilotildees sobre as caracteristicas jaacute descritas para essa sequecircncia Observem que mesmo dentro do banco Nucleotide noacutes temos acesso a sequecircncia de proteiacutena codificada por esse gene Dentro da FeatureCDStranslation O formato GenBank guarda toda a informaccedilatildeo sobre as proteiacutenas depositadas no banco Nucleotide do NCBI

ProteinNCBI

httpswwwncbinlmnihgovprotein

O banco Protein armazena sequecircncias de proteiacutenas e sequecircncias que foram traduzidas automaticamente de sequecircncias nucleotiacutedicas codificadoras O banco tambeacutem traz informaccedilotildees associadas a cada uma das sequecircncias A pesquisa nessa banco pode retornar vaacuterias sequecircncias depositadas por diferentes pesquisadores

Podemos selecionar as sequecircncias desejadas e baixar para analisar alteraccedilotildees na sequecircncia de proteiacutena diversidade presenccedila de regiotildees conservadas

A busca pelo termo TLR9 retorna 8 entradas (Busca realizada 260117) O termo partialsignifica que a sequecircncias da proteiacutena natildeo estaacute completa Vamos observar as informaccedilatildeo da entrada 20 da busca realizada com o termo TLR9

Figura Informaccedilotildees sobre a entrada 20 da busca TLR9

Figura Features da entrada 20 da busca por TLR9 No final da entrada encontramos a sequecircncia da proteiacutena O formato GenPept guarda toda a informaccedilatildeo sobre as proteiacutenas depositadas no banco Proteins do NCBI

TaxonomyNCBI httpswwwncbinlmnihgovtaxonomy Banco de dados com informaccedilotildees sobre a classificaccedilatildeo taxonocircmica das espeacutecies Esse banco de dados apresenta somente informaccedilotildees taxonocircmicas de espeacutecies que tecircm informaccedilotildees moleculares depositadas no NCBI Informaccedilotildees sobre a espeacutecie Homo sapiens no banco de dados Taxonomy Homo sapiens Taxonomy ID 9606 Genbank common name human Inherited blast name primates Rank species Genetic code Translation table 1 (Standard) Mitochondrial genetic code Translation table 2 (Vertebrate Mitochondrial) Other names

synonym humans

common name

man

authority Homo sapiens Linnaeus 1758

Lineage ( full ) cellular organisms Eukaryota Opisthokonta Metazoa Eumetazoa Bilateria Deuterostomia Chordata Craniata Vertebrata Gnathostomata Teleostomi Euteleostomi Sarcopterygii Dipnotetrapodomorpha Tetrapoda Amniota Mammalia Theria Eutheria Boreoeutheria Euarchontoglires Primates Haplorrhini Simiiformes Catarrhini Hominoidea Hominidae Homininae Homo A classificaccedilatildeo apresenta quantitativo de dados em outros banco de dados com links para essas informaccedilotildees na tabela Entrez records

Entrez records

Database name Subtree

links Direct links

Nucleotide 14112440 14112396

Nucleotide EST 8705106 8705106

Nucleotide GSS 1762817 1761491

Protein 1069030 1068738

Structure 33029 33029

Genome 1 1

Popset 23505 23504

SNP 165297523 165297523

Domains 24 24

GEO Datasets 1244816 1244816

UniGene 130056 130056

PubMed Central 553832 553829

Gene 219667 219594

HomoloGene 18713 18713

SRA Experiments 742541 742319

Probe 27382435 27382435

Assembly 90 90

Bio Project 32438 32427

Bio Sample 2516813 2516682

Bio Systems 3070 3070

Clone DB 17567413 17567413

dbVar 5064734 5064734

GEO Profiles 61958910 61958910

PubChem BioAssay 311510 311502

Protein Clusters 13 13

Taxonomy 3 1

Ainda podemos encontrar informaccedilotildees sobre projetos genomas e outros links para bancos taxonocircmicos nessa paacutegina Veja as informaccedilotildees que vocecirc pode encontrar para outras espeacutecies Mus musculus Taxonomy ID 10090 Genbank common name house mouse Inherited blast name rodents Arabidopsis thaliana Taxonomy ID 3702 Genbank common name thale cress

Uniprot

httpwwwuniprotorg

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias

Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

O uniprot fornece informaccedilotildees e sequecircncias sobre proteiacutenas As sequecircncias e informaccedilotildees funcionais das proteiacutenas podem vir de projetos genomas (sequecircncias codificantes) ou podem ser depositadas por curadores do UniProt Isso cria duas divisotildees dentro do Uniprot o UniProtKBTrEMBL e o UniProtKBSwiss-Prot As entradas do Uniprot apresentam nuacutemero de acesso alfanumeacuterico exemplo Q9NR96

O TrEMBL satildeo proteiacutenas que foram adicionadas no Uniprot de forma automaacutetica e natildeo passou por um processo de revisatildeo dos curadores (Status Unreviewed) Essas informaccedilotildees devem ser usadas com mais cuidado

O Swiss-Prot tem um crescimento lento porque todas as sequecircncias que estatildeo nessa subdivisatildeo passaram pela anotaccedilatildeo manual e revisatildeo de um curador (Status Reviewed) Essas informaccedilotildees satildeo confiaacuteveis As entradas trazem informaccedilotildees sobre resultados experimentais caracteriacutesticas e conclusotildees cientiacuteficas

Informaccedilotildees Protein Gene Organism Status (Reviewed ou Unreviewed)

- Annotation score -Experimental evidence at protein level ou Protein predicted

Function GO - Molecular function GO - Biological process Subcellular location

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Pesquisem sobre TLR9 no uniprot e vejam as informaccedilotildees que vocecircs podem encontrar Entrem no primeiro resultado (TLR( humano - Acesso Q9NR96)

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Protein Data Bank

wwwrcsborg

Banco de dados que armazena informaccedilotildees sobre estrutura tridimensional das proteiacutenas Nessa banco satildeo armazendas estruturas das proteiacutenas que foram avaliadas por cristalografia Raio-X Espectroscopia por ressonacircncia magneacutetica nuclear (NMR) Atualmente existem 126278 estruturas depositadas no PDB

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

NucleotideNCBI

httpswwwncbinlmnihgovnuccore

O banco Nucleotide armazena sequecircncias e informaccedilotildees associadas a cada uma das sequecircncias A pesquisa nessa banco pode retornar vaacuterias sequecircncias depositadas por diferentes pesquisadores

Podemos selecionar as sequecircncias desejadas e baixar para analisar mutaccediloes diversidade presenccedila de regiotildees conservadas

A busca pelo termo TLR9 no banco nucleotide retorna 3258 entradas (Busca realizada 260117)

A descriccedilatildeo partial cds significa que a sequecircncia do gene natildeo estaacute completa o pesquisador que depositou natildeo obteve a sequecircncias completa e submeteu somente uma parte do gene A descriccedilatildeo complete cds significa que foi depositado a sequecircncia completa do gene CDS significa a regiatildeo codificante do gene

Vamos observar a entrada 33 dessa busca

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Figura Informaccedilotildees iniciais sobre a entrada nuacutemero 33 apoacutes a busca usando o termo

TLR9

Figura Informaccedilotildees sobre as caracteristicas jaacute descritas para essa sequecircncia Observem que mesmo dentro do banco Nucleotide noacutes temos acesso a sequecircncia de proteiacutena codificada por esse gene Dentro da FeatureCDStranslation O formato GenBank guarda toda a informaccedilatildeo sobre as proteiacutenas depositadas no banco Nucleotide do NCBI

ProteinNCBI

httpswwwncbinlmnihgovprotein

O banco Protein armazena sequecircncias de proteiacutenas e sequecircncias que foram traduzidas automaticamente de sequecircncias nucleotiacutedicas codificadoras O banco tambeacutem traz informaccedilotildees associadas a cada uma das sequecircncias A pesquisa nessa banco pode retornar vaacuterias sequecircncias depositadas por diferentes pesquisadores

Podemos selecionar as sequecircncias desejadas e baixar para analisar alteraccedilotildees na sequecircncia de proteiacutena diversidade presenccedila de regiotildees conservadas

A busca pelo termo TLR9 retorna 8 entradas (Busca realizada 260117) O termo partialsignifica que a sequecircncias da proteiacutena natildeo estaacute completa Vamos observar as informaccedilatildeo da entrada 20 da busca realizada com o termo TLR9

Figura Informaccedilotildees sobre a entrada 20 da busca TLR9

Figura Features da entrada 20 da busca por TLR9 No final da entrada encontramos a sequecircncia da proteiacutena O formato GenPept guarda toda a informaccedilatildeo sobre as proteiacutenas depositadas no banco Proteins do NCBI

TaxonomyNCBI httpswwwncbinlmnihgovtaxonomy Banco de dados com informaccedilotildees sobre a classificaccedilatildeo taxonocircmica das espeacutecies Esse banco de dados apresenta somente informaccedilotildees taxonocircmicas de espeacutecies que tecircm informaccedilotildees moleculares depositadas no NCBI Informaccedilotildees sobre a espeacutecie Homo sapiens no banco de dados Taxonomy Homo sapiens Taxonomy ID 9606 Genbank common name human Inherited blast name primates Rank species Genetic code Translation table 1 (Standard) Mitochondrial genetic code Translation table 2 (Vertebrate Mitochondrial) Other names

synonym humans

common name

man

authority Homo sapiens Linnaeus 1758

Lineage ( full ) cellular organisms Eukaryota Opisthokonta Metazoa Eumetazoa Bilateria Deuterostomia Chordata Craniata Vertebrata Gnathostomata Teleostomi Euteleostomi Sarcopterygii Dipnotetrapodomorpha Tetrapoda Amniota Mammalia Theria Eutheria Boreoeutheria Euarchontoglires Primates Haplorrhini Simiiformes Catarrhini Hominoidea Hominidae Homininae Homo A classificaccedilatildeo apresenta quantitativo de dados em outros banco de dados com links para essas informaccedilotildees na tabela Entrez records

Entrez records

Database name Subtree

links Direct links

Nucleotide 14112440 14112396

Nucleotide EST 8705106 8705106

Nucleotide GSS 1762817 1761491

Protein 1069030 1068738

Structure 33029 33029

Genome 1 1

Popset 23505 23504

SNP 165297523 165297523

Domains 24 24

GEO Datasets 1244816 1244816

UniGene 130056 130056

PubMed Central 553832 553829

Gene 219667 219594

HomoloGene 18713 18713

SRA Experiments 742541 742319

Probe 27382435 27382435

Assembly 90 90

Bio Project 32438 32427

Bio Sample 2516813 2516682

Bio Systems 3070 3070

Clone DB 17567413 17567413

dbVar 5064734 5064734

GEO Profiles 61958910 61958910

PubChem BioAssay 311510 311502

Protein Clusters 13 13

Taxonomy 3 1

Ainda podemos encontrar informaccedilotildees sobre projetos genomas e outros links para bancos taxonocircmicos nessa paacutegina Veja as informaccedilotildees que vocecirc pode encontrar para outras espeacutecies Mus musculus Taxonomy ID 10090 Genbank common name house mouse Inherited blast name rodents Arabidopsis thaliana Taxonomy ID 3702 Genbank common name thale cress

Uniprot

httpwwwuniprotorg

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias

Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

O uniprot fornece informaccedilotildees e sequecircncias sobre proteiacutenas As sequecircncias e informaccedilotildees funcionais das proteiacutenas podem vir de projetos genomas (sequecircncias codificantes) ou podem ser depositadas por curadores do UniProt Isso cria duas divisotildees dentro do Uniprot o UniProtKBTrEMBL e o UniProtKBSwiss-Prot As entradas do Uniprot apresentam nuacutemero de acesso alfanumeacuterico exemplo Q9NR96

O TrEMBL satildeo proteiacutenas que foram adicionadas no Uniprot de forma automaacutetica e natildeo passou por um processo de revisatildeo dos curadores (Status Unreviewed) Essas informaccedilotildees devem ser usadas com mais cuidado

O Swiss-Prot tem um crescimento lento porque todas as sequecircncias que estatildeo nessa subdivisatildeo passaram pela anotaccedilatildeo manual e revisatildeo de um curador (Status Reviewed) Essas informaccedilotildees satildeo confiaacuteveis As entradas trazem informaccedilotildees sobre resultados experimentais caracteriacutesticas e conclusotildees cientiacuteficas

Informaccedilotildees Protein Gene Organism Status (Reviewed ou Unreviewed)

- Annotation score -Experimental evidence at protein level ou Protein predicted

Function GO - Molecular function GO - Biological process Subcellular location

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Pesquisem sobre TLR9 no uniprot e vejam as informaccedilotildees que vocecircs podem encontrar Entrem no primeiro resultado (TLR( humano - Acesso Q9NR96)

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Protein Data Bank

wwwrcsborg

Banco de dados que armazena informaccedilotildees sobre estrutura tridimensional das proteiacutenas Nessa banco satildeo armazendas estruturas das proteiacutenas que foram avaliadas por cristalografia Raio-X Espectroscopia por ressonacircncia magneacutetica nuclear (NMR) Atualmente existem 126278 estruturas depositadas no PDB

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Figura Informaccedilotildees iniciais sobre a entrada nuacutemero 33 apoacutes a busca usando o termo

TLR9

Figura Informaccedilotildees sobre as caracteristicas jaacute descritas para essa sequecircncia Observem que mesmo dentro do banco Nucleotide noacutes temos acesso a sequecircncia de proteiacutena codificada por esse gene Dentro da FeatureCDStranslation O formato GenBank guarda toda a informaccedilatildeo sobre as proteiacutenas depositadas no banco Nucleotide do NCBI

ProteinNCBI

httpswwwncbinlmnihgovprotein

O banco Protein armazena sequecircncias de proteiacutenas e sequecircncias que foram traduzidas automaticamente de sequecircncias nucleotiacutedicas codificadoras O banco tambeacutem traz informaccedilotildees associadas a cada uma das sequecircncias A pesquisa nessa banco pode retornar vaacuterias sequecircncias depositadas por diferentes pesquisadores

Podemos selecionar as sequecircncias desejadas e baixar para analisar alteraccedilotildees na sequecircncia de proteiacutena diversidade presenccedila de regiotildees conservadas

A busca pelo termo TLR9 retorna 8 entradas (Busca realizada 260117) O termo partialsignifica que a sequecircncias da proteiacutena natildeo estaacute completa Vamos observar as informaccedilatildeo da entrada 20 da busca realizada com o termo TLR9

Figura Informaccedilotildees sobre a entrada 20 da busca TLR9

Figura Features da entrada 20 da busca por TLR9 No final da entrada encontramos a sequecircncia da proteiacutena O formato GenPept guarda toda a informaccedilatildeo sobre as proteiacutenas depositadas no banco Proteins do NCBI

TaxonomyNCBI httpswwwncbinlmnihgovtaxonomy Banco de dados com informaccedilotildees sobre a classificaccedilatildeo taxonocircmica das espeacutecies Esse banco de dados apresenta somente informaccedilotildees taxonocircmicas de espeacutecies que tecircm informaccedilotildees moleculares depositadas no NCBI Informaccedilotildees sobre a espeacutecie Homo sapiens no banco de dados Taxonomy Homo sapiens Taxonomy ID 9606 Genbank common name human Inherited blast name primates Rank species Genetic code Translation table 1 (Standard) Mitochondrial genetic code Translation table 2 (Vertebrate Mitochondrial) Other names

synonym humans

common name

man

authority Homo sapiens Linnaeus 1758

Lineage ( full ) cellular organisms Eukaryota Opisthokonta Metazoa Eumetazoa Bilateria Deuterostomia Chordata Craniata Vertebrata Gnathostomata Teleostomi Euteleostomi Sarcopterygii Dipnotetrapodomorpha Tetrapoda Amniota Mammalia Theria Eutheria Boreoeutheria Euarchontoglires Primates Haplorrhini Simiiformes Catarrhini Hominoidea Hominidae Homininae Homo A classificaccedilatildeo apresenta quantitativo de dados em outros banco de dados com links para essas informaccedilotildees na tabela Entrez records

Entrez records

Database name Subtree

links Direct links

Nucleotide 14112440 14112396

Nucleotide EST 8705106 8705106

Nucleotide GSS 1762817 1761491

Protein 1069030 1068738

Structure 33029 33029

Genome 1 1

Popset 23505 23504

SNP 165297523 165297523

Domains 24 24

GEO Datasets 1244816 1244816

UniGene 130056 130056

PubMed Central 553832 553829

Gene 219667 219594

HomoloGene 18713 18713

SRA Experiments 742541 742319

Probe 27382435 27382435

Assembly 90 90

Bio Project 32438 32427

Bio Sample 2516813 2516682

Bio Systems 3070 3070

Clone DB 17567413 17567413

dbVar 5064734 5064734

GEO Profiles 61958910 61958910

PubChem BioAssay 311510 311502

Protein Clusters 13 13

Taxonomy 3 1

Ainda podemos encontrar informaccedilotildees sobre projetos genomas e outros links para bancos taxonocircmicos nessa paacutegina Veja as informaccedilotildees que vocecirc pode encontrar para outras espeacutecies Mus musculus Taxonomy ID 10090 Genbank common name house mouse Inherited blast name rodents Arabidopsis thaliana Taxonomy ID 3702 Genbank common name thale cress

Uniprot

httpwwwuniprotorg

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias

Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

O uniprot fornece informaccedilotildees e sequecircncias sobre proteiacutenas As sequecircncias e informaccedilotildees funcionais das proteiacutenas podem vir de projetos genomas (sequecircncias codificantes) ou podem ser depositadas por curadores do UniProt Isso cria duas divisotildees dentro do Uniprot o UniProtKBTrEMBL e o UniProtKBSwiss-Prot As entradas do Uniprot apresentam nuacutemero de acesso alfanumeacuterico exemplo Q9NR96

O TrEMBL satildeo proteiacutenas que foram adicionadas no Uniprot de forma automaacutetica e natildeo passou por um processo de revisatildeo dos curadores (Status Unreviewed) Essas informaccedilotildees devem ser usadas com mais cuidado

O Swiss-Prot tem um crescimento lento porque todas as sequecircncias que estatildeo nessa subdivisatildeo passaram pela anotaccedilatildeo manual e revisatildeo de um curador (Status Reviewed) Essas informaccedilotildees satildeo confiaacuteveis As entradas trazem informaccedilotildees sobre resultados experimentais caracteriacutesticas e conclusotildees cientiacuteficas

Informaccedilotildees Protein Gene Organism Status (Reviewed ou Unreviewed)

- Annotation score -Experimental evidence at protein level ou Protein predicted

Function GO - Molecular function GO - Biological process Subcellular location

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Pesquisem sobre TLR9 no uniprot e vejam as informaccedilotildees que vocecircs podem encontrar Entrem no primeiro resultado (TLR( humano - Acesso Q9NR96)

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Protein Data Bank

wwwrcsborg

Banco de dados que armazena informaccedilotildees sobre estrutura tridimensional das proteiacutenas Nessa banco satildeo armazendas estruturas das proteiacutenas que foram avaliadas por cristalografia Raio-X Espectroscopia por ressonacircncia magneacutetica nuclear (NMR) Atualmente existem 126278 estruturas depositadas no PDB

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Figura Informaccedilotildees sobre as caracteristicas jaacute descritas para essa sequecircncia Observem que mesmo dentro do banco Nucleotide noacutes temos acesso a sequecircncia de proteiacutena codificada por esse gene Dentro da FeatureCDStranslation O formato GenBank guarda toda a informaccedilatildeo sobre as proteiacutenas depositadas no banco Nucleotide do NCBI

ProteinNCBI

httpswwwncbinlmnihgovprotein

O banco Protein armazena sequecircncias de proteiacutenas e sequecircncias que foram traduzidas automaticamente de sequecircncias nucleotiacutedicas codificadoras O banco tambeacutem traz informaccedilotildees associadas a cada uma das sequecircncias A pesquisa nessa banco pode retornar vaacuterias sequecircncias depositadas por diferentes pesquisadores

Podemos selecionar as sequecircncias desejadas e baixar para analisar alteraccedilotildees na sequecircncia de proteiacutena diversidade presenccedila de regiotildees conservadas

A busca pelo termo TLR9 retorna 8 entradas (Busca realizada 260117) O termo partialsignifica que a sequecircncias da proteiacutena natildeo estaacute completa Vamos observar as informaccedilatildeo da entrada 20 da busca realizada com o termo TLR9

Figura Informaccedilotildees sobre a entrada 20 da busca TLR9

Figura Features da entrada 20 da busca por TLR9 No final da entrada encontramos a sequecircncia da proteiacutena O formato GenPept guarda toda a informaccedilatildeo sobre as proteiacutenas depositadas no banco Proteins do NCBI

TaxonomyNCBI httpswwwncbinlmnihgovtaxonomy Banco de dados com informaccedilotildees sobre a classificaccedilatildeo taxonocircmica das espeacutecies Esse banco de dados apresenta somente informaccedilotildees taxonocircmicas de espeacutecies que tecircm informaccedilotildees moleculares depositadas no NCBI Informaccedilotildees sobre a espeacutecie Homo sapiens no banco de dados Taxonomy Homo sapiens Taxonomy ID 9606 Genbank common name human Inherited blast name primates Rank species Genetic code Translation table 1 (Standard) Mitochondrial genetic code Translation table 2 (Vertebrate Mitochondrial) Other names

synonym humans

common name

man

authority Homo sapiens Linnaeus 1758

Lineage ( full ) cellular organisms Eukaryota Opisthokonta Metazoa Eumetazoa Bilateria Deuterostomia Chordata Craniata Vertebrata Gnathostomata Teleostomi Euteleostomi Sarcopterygii Dipnotetrapodomorpha Tetrapoda Amniota Mammalia Theria Eutheria Boreoeutheria Euarchontoglires Primates Haplorrhini Simiiformes Catarrhini Hominoidea Hominidae Homininae Homo A classificaccedilatildeo apresenta quantitativo de dados em outros banco de dados com links para essas informaccedilotildees na tabela Entrez records

Entrez records

Database name Subtree

links Direct links

Nucleotide 14112440 14112396

Nucleotide EST 8705106 8705106

Nucleotide GSS 1762817 1761491

Protein 1069030 1068738

Structure 33029 33029

Genome 1 1

Popset 23505 23504

SNP 165297523 165297523

Domains 24 24

GEO Datasets 1244816 1244816

UniGene 130056 130056

PubMed Central 553832 553829

Gene 219667 219594

HomoloGene 18713 18713

SRA Experiments 742541 742319

Probe 27382435 27382435

Assembly 90 90

Bio Project 32438 32427

Bio Sample 2516813 2516682

Bio Systems 3070 3070

Clone DB 17567413 17567413

dbVar 5064734 5064734

GEO Profiles 61958910 61958910

PubChem BioAssay 311510 311502

Protein Clusters 13 13

Taxonomy 3 1

Ainda podemos encontrar informaccedilotildees sobre projetos genomas e outros links para bancos taxonocircmicos nessa paacutegina Veja as informaccedilotildees que vocecirc pode encontrar para outras espeacutecies Mus musculus Taxonomy ID 10090 Genbank common name house mouse Inherited blast name rodents Arabidopsis thaliana Taxonomy ID 3702 Genbank common name thale cress

Uniprot

httpwwwuniprotorg

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias

Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

O uniprot fornece informaccedilotildees e sequecircncias sobre proteiacutenas As sequecircncias e informaccedilotildees funcionais das proteiacutenas podem vir de projetos genomas (sequecircncias codificantes) ou podem ser depositadas por curadores do UniProt Isso cria duas divisotildees dentro do Uniprot o UniProtKBTrEMBL e o UniProtKBSwiss-Prot As entradas do Uniprot apresentam nuacutemero de acesso alfanumeacuterico exemplo Q9NR96

O TrEMBL satildeo proteiacutenas que foram adicionadas no Uniprot de forma automaacutetica e natildeo passou por um processo de revisatildeo dos curadores (Status Unreviewed) Essas informaccedilotildees devem ser usadas com mais cuidado

O Swiss-Prot tem um crescimento lento porque todas as sequecircncias que estatildeo nessa subdivisatildeo passaram pela anotaccedilatildeo manual e revisatildeo de um curador (Status Reviewed) Essas informaccedilotildees satildeo confiaacuteveis As entradas trazem informaccedilotildees sobre resultados experimentais caracteriacutesticas e conclusotildees cientiacuteficas

Informaccedilotildees Protein Gene Organism Status (Reviewed ou Unreviewed)

- Annotation score -Experimental evidence at protein level ou Protein predicted

Function GO - Molecular function GO - Biological process Subcellular location

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Pesquisem sobre TLR9 no uniprot e vejam as informaccedilotildees que vocecircs podem encontrar Entrem no primeiro resultado (TLR( humano - Acesso Q9NR96)

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Protein Data Bank

wwwrcsborg

Banco de dados que armazena informaccedilotildees sobre estrutura tridimensional das proteiacutenas Nessa banco satildeo armazendas estruturas das proteiacutenas que foram avaliadas por cristalografia Raio-X Espectroscopia por ressonacircncia magneacutetica nuclear (NMR) Atualmente existem 126278 estruturas depositadas no PDB

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

ProteinNCBI

httpswwwncbinlmnihgovprotein

O banco Protein armazena sequecircncias de proteiacutenas e sequecircncias que foram traduzidas automaticamente de sequecircncias nucleotiacutedicas codificadoras O banco tambeacutem traz informaccedilotildees associadas a cada uma das sequecircncias A pesquisa nessa banco pode retornar vaacuterias sequecircncias depositadas por diferentes pesquisadores

Podemos selecionar as sequecircncias desejadas e baixar para analisar alteraccedilotildees na sequecircncia de proteiacutena diversidade presenccedila de regiotildees conservadas

A busca pelo termo TLR9 retorna 8 entradas (Busca realizada 260117) O termo partialsignifica que a sequecircncias da proteiacutena natildeo estaacute completa Vamos observar as informaccedilatildeo da entrada 20 da busca realizada com o termo TLR9

Figura Informaccedilotildees sobre a entrada 20 da busca TLR9

Figura Features da entrada 20 da busca por TLR9 No final da entrada encontramos a sequecircncia da proteiacutena O formato GenPept guarda toda a informaccedilatildeo sobre as proteiacutenas depositadas no banco Proteins do NCBI

TaxonomyNCBI httpswwwncbinlmnihgovtaxonomy Banco de dados com informaccedilotildees sobre a classificaccedilatildeo taxonocircmica das espeacutecies Esse banco de dados apresenta somente informaccedilotildees taxonocircmicas de espeacutecies que tecircm informaccedilotildees moleculares depositadas no NCBI Informaccedilotildees sobre a espeacutecie Homo sapiens no banco de dados Taxonomy Homo sapiens Taxonomy ID 9606 Genbank common name human Inherited blast name primates Rank species Genetic code Translation table 1 (Standard) Mitochondrial genetic code Translation table 2 (Vertebrate Mitochondrial) Other names

synonym humans

common name

man

authority Homo sapiens Linnaeus 1758

Lineage ( full ) cellular organisms Eukaryota Opisthokonta Metazoa Eumetazoa Bilateria Deuterostomia Chordata Craniata Vertebrata Gnathostomata Teleostomi Euteleostomi Sarcopterygii Dipnotetrapodomorpha Tetrapoda Amniota Mammalia Theria Eutheria Boreoeutheria Euarchontoglires Primates Haplorrhini Simiiformes Catarrhini Hominoidea Hominidae Homininae Homo A classificaccedilatildeo apresenta quantitativo de dados em outros banco de dados com links para essas informaccedilotildees na tabela Entrez records

Entrez records

Database name Subtree

links Direct links

Nucleotide 14112440 14112396

Nucleotide EST 8705106 8705106

Nucleotide GSS 1762817 1761491

Protein 1069030 1068738

Structure 33029 33029

Genome 1 1

Popset 23505 23504

SNP 165297523 165297523

Domains 24 24

GEO Datasets 1244816 1244816

UniGene 130056 130056

PubMed Central 553832 553829

Gene 219667 219594

HomoloGene 18713 18713

SRA Experiments 742541 742319

Probe 27382435 27382435

Assembly 90 90

Bio Project 32438 32427

Bio Sample 2516813 2516682

Bio Systems 3070 3070

Clone DB 17567413 17567413

dbVar 5064734 5064734

GEO Profiles 61958910 61958910

PubChem BioAssay 311510 311502

Protein Clusters 13 13

Taxonomy 3 1

Ainda podemos encontrar informaccedilotildees sobre projetos genomas e outros links para bancos taxonocircmicos nessa paacutegina Veja as informaccedilotildees que vocecirc pode encontrar para outras espeacutecies Mus musculus Taxonomy ID 10090 Genbank common name house mouse Inherited blast name rodents Arabidopsis thaliana Taxonomy ID 3702 Genbank common name thale cress

Uniprot

httpwwwuniprotorg

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias

Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

O uniprot fornece informaccedilotildees e sequecircncias sobre proteiacutenas As sequecircncias e informaccedilotildees funcionais das proteiacutenas podem vir de projetos genomas (sequecircncias codificantes) ou podem ser depositadas por curadores do UniProt Isso cria duas divisotildees dentro do Uniprot o UniProtKBTrEMBL e o UniProtKBSwiss-Prot As entradas do Uniprot apresentam nuacutemero de acesso alfanumeacuterico exemplo Q9NR96

O TrEMBL satildeo proteiacutenas que foram adicionadas no Uniprot de forma automaacutetica e natildeo passou por um processo de revisatildeo dos curadores (Status Unreviewed) Essas informaccedilotildees devem ser usadas com mais cuidado

O Swiss-Prot tem um crescimento lento porque todas as sequecircncias que estatildeo nessa subdivisatildeo passaram pela anotaccedilatildeo manual e revisatildeo de um curador (Status Reviewed) Essas informaccedilotildees satildeo confiaacuteveis As entradas trazem informaccedilotildees sobre resultados experimentais caracteriacutesticas e conclusotildees cientiacuteficas

Informaccedilotildees Protein Gene Organism Status (Reviewed ou Unreviewed)

- Annotation score -Experimental evidence at protein level ou Protein predicted

Function GO - Molecular function GO - Biological process Subcellular location

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Pesquisem sobre TLR9 no uniprot e vejam as informaccedilotildees que vocecircs podem encontrar Entrem no primeiro resultado (TLR( humano - Acesso Q9NR96)

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Protein Data Bank

wwwrcsborg

Banco de dados que armazena informaccedilotildees sobre estrutura tridimensional das proteiacutenas Nessa banco satildeo armazendas estruturas das proteiacutenas que foram avaliadas por cristalografia Raio-X Espectroscopia por ressonacircncia magneacutetica nuclear (NMR) Atualmente existem 126278 estruturas depositadas no PDB

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Figura Features da entrada 20 da busca por TLR9 No final da entrada encontramos a sequecircncia da proteiacutena O formato GenPept guarda toda a informaccedilatildeo sobre as proteiacutenas depositadas no banco Proteins do NCBI

TaxonomyNCBI httpswwwncbinlmnihgovtaxonomy Banco de dados com informaccedilotildees sobre a classificaccedilatildeo taxonocircmica das espeacutecies Esse banco de dados apresenta somente informaccedilotildees taxonocircmicas de espeacutecies que tecircm informaccedilotildees moleculares depositadas no NCBI Informaccedilotildees sobre a espeacutecie Homo sapiens no banco de dados Taxonomy Homo sapiens Taxonomy ID 9606 Genbank common name human Inherited blast name primates Rank species Genetic code Translation table 1 (Standard) Mitochondrial genetic code Translation table 2 (Vertebrate Mitochondrial) Other names

synonym humans

common name

man

authority Homo sapiens Linnaeus 1758

Lineage ( full ) cellular organisms Eukaryota Opisthokonta Metazoa Eumetazoa Bilateria Deuterostomia Chordata Craniata Vertebrata Gnathostomata Teleostomi Euteleostomi Sarcopterygii Dipnotetrapodomorpha Tetrapoda Amniota Mammalia Theria Eutheria Boreoeutheria Euarchontoglires Primates Haplorrhini Simiiformes Catarrhini Hominoidea Hominidae Homininae Homo A classificaccedilatildeo apresenta quantitativo de dados em outros banco de dados com links para essas informaccedilotildees na tabela Entrez records

Entrez records

Database name Subtree

links Direct links

Nucleotide 14112440 14112396

Nucleotide EST 8705106 8705106

Nucleotide GSS 1762817 1761491

Protein 1069030 1068738

Structure 33029 33029

Genome 1 1

Popset 23505 23504

SNP 165297523 165297523

Domains 24 24

GEO Datasets 1244816 1244816

UniGene 130056 130056

PubMed Central 553832 553829

Gene 219667 219594

HomoloGene 18713 18713

SRA Experiments 742541 742319

Probe 27382435 27382435

Assembly 90 90

Bio Project 32438 32427

Bio Sample 2516813 2516682

Bio Systems 3070 3070

Clone DB 17567413 17567413

dbVar 5064734 5064734

GEO Profiles 61958910 61958910

PubChem BioAssay 311510 311502

Protein Clusters 13 13

Taxonomy 3 1

Ainda podemos encontrar informaccedilotildees sobre projetos genomas e outros links para bancos taxonocircmicos nessa paacutegina Veja as informaccedilotildees que vocecirc pode encontrar para outras espeacutecies Mus musculus Taxonomy ID 10090 Genbank common name house mouse Inherited blast name rodents Arabidopsis thaliana Taxonomy ID 3702 Genbank common name thale cress

Uniprot

httpwwwuniprotorg

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias

Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

O uniprot fornece informaccedilotildees e sequecircncias sobre proteiacutenas As sequecircncias e informaccedilotildees funcionais das proteiacutenas podem vir de projetos genomas (sequecircncias codificantes) ou podem ser depositadas por curadores do UniProt Isso cria duas divisotildees dentro do Uniprot o UniProtKBTrEMBL e o UniProtKBSwiss-Prot As entradas do Uniprot apresentam nuacutemero de acesso alfanumeacuterico exemplo Q9NR96

O TrEMBL satildeo proteiacutenas que foram adicionadas no Uniprot de forma automaacutetica e natildeo passou por um processo de revisatildeo dos curadores (Status Unreviewed) Essas informaccedilotildees devem ser usadas com mais cuidado

O Swiss-Prot tem um crescimento lento porque todas as sequecircncias que estatildeo nessa subdivisatildeo passaram pela anotaccedilatildeo manual e revisatildeo de um curador (Status Reviewed) Essas informaccedilotildees satildeo confiaacuteveis As entradas trazem informaccedilotildees sobre resultados experimentais caracteriacutesticas e conclusotildees cientiacuteficas

Informaccedilotildees Protein Gene Organism Status (Reviewed ou Unreviewed)

- Annotation score -Experimental evidence at protein level ou Protein predicted

Function GO - Molecular function GO - Biological process Subcellular location

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Pesquisem sobre TLR9 no uniprot e vejam as informaccedilotildees que vocecircs podem encontrar Entrem no primeiro resultado (TLR( humano - Acesso Q9NR96)

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Protein Data Bank

wwwrcsborg

Banco de dados que armazena informaccedilotildees sobre estrutura tridimensional das proteiacutenas Nessa banco satildeo armazendas estruturas das proteiacutenas que foram avaliadas por cristalografia Raio-X Espectroscopia por ressonacircncia magneacutetica nuclear (NMR) Atualmente existem 126278 estruturas depositadas no PDB

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

TaxonomyNCBI httpswwwncbinlmnihgovtaxonomy Banco de dados com informaccedilotildees sobre a classificaccedilatildeo taxonocircmica das espeacutecies Esse banco de dados apresenta somente informaccedilotildees taxonocircmicas de espeacutecies que tecircm informaccedilotildees moleculares depositadas no NCBI Informaccedilotildees sobre a espeacutecie Homo sapiens no banco de dados Taxonomy Homo sapiens Taxonomy ID 9606 Genbank common name human Inherited blast name primates Rank species Genetic code Translation table 1 (Standard) Mitochondrial genetic code Translation table 2 (Vertebrate Mitochondrial) Other names

synonym humans

common name

man

authority Homo sapiens Linnaeus 1758

Lineage ( full ) cellular organisms Eukaryota Opisthokonta Metazoa Eumetazoa Bilateria Deuterostomia Chordata Craniata Vertebrata Gnathostomata Teleostomi Euteleostomi Sarcopterygii Dipnotetrapodomorpha Tetrapoda Amniota Mammalia Theria Eutheria Boreoeutheria Euarchontoglires Primates Haplorrhini Simiiformes Catarrhini Hominoidea Hominidae Homininae Homo A classificaccedilatildeo apresenta quantitativo de dados em outros banco de dados com links para essas informaccedilotildees na tabela Entrez records

Entrez records

Database name Subtree

links Direct links

Nucleotide 14112440 14112396

Nucleotide EST 8705106 8705106

Nucleotide GSS 1762817 1761491

Protein 1069030 1068738

Structure 33029 33029

Genome 1 1

Popset 23505 23504

SNP 165297523 165297523

Domains 24 24

GEO Datasets 1244816 1244816

UniGene 130056 130056

PubMed Central 553832 553829

Gene 219667 219594

HomoloGene 18713 18713

SRA Experiments 742541 742319

Probe 27382435 27382435

Assembly 90 90

Bio Project 32438 32427

Bio Sample 2516813 2516682

Bio Systems 3070 3070

Clone DB 17567413 17567413

dbVar 5064734 5064734

GEO Profiles 61958910 61958910

PubChem BioAssay 311510 311502

Protein Clusters 13 13

Taxonomy 3 1

Ainda podemos encontrar informaccedilotildees sobre projetos genomas e outros links para bancos taxonocircmicos nessa paacutegina Veja as informaccedilotildees que vocecirc pode encontrar para outras espeacutecies Mus musculus Taxonomy ID 10090 Genbank common name house mouse Inherited blast name rodents Arabidopsis thaliana Taxonomy ID 3702 Genbank common name thale cress

Uniprot

httpwwwuniprotorg

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias

Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

O uniprot fornece informaccedilotildees e sequecircncias sobre proteiacutenas As sequecircncias e informaccedilotildees funcionais das proteiacutenas podem vir de projetos genomas (sequecircncias codificantes) ou podem ser depositadas por curadores do UniProt Isso cria duas divisotildees dentro do Uniprot o UniProtKBTrEMBL e o UniProtKBSwiss-Prot As entradas do Uniprot apresentam nuacutemero de acesso alfanumeacuterico exemplo Q9NR96

O TrEMBL satildeo proteiacutenas que foram adicionadas no Uniprot de forma automaacutetica e natildeo passou por um processo de revisatildeo dos curadores (Status Unreviewed) Essas informaccedilotildees devem ser usadas com mais cuidado

O Swiss-Prot tem um crescimento lento porque todas as sequecircncias que estatildeo nessa subdivisatildeo passaram pela anotaccedilatildeo manual e revisatildeo de um curador (Status Reviewed) Essas informaccedilotildees satildeo confiaacuteveis As entradas trazem informaccedilotildees sobre resultados experimentais caracteriacutesticas e conclusotildees cientiacuteficas

Informaccedilotildees Protein Gene Organism Status (Reviewed ou Unreviewed)

- Annotation score -Experimental evidence at protein level ou Protein predicted

Function GO - Molecular function GO - Biological process Subcellular location

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Pesquisem sobre TLR9 no uniprot e vejam as informaccedilotildees que vocecircs podem encontrar Entrem no primeiro resultado (TLR( humano - Acesso Q9NR96)

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Protein Data Bank

wwwrcsborg

Banco de dados que armazena informaccedilotildees sobre estrutura tridimensional das proteiacutenas Nessa banco satildeo armazendas estruturas das proteiacutenas que foram avaliadas por cristalografia Raio-X Espectroscopia por ressonacircncia magneacutetica nuclear (NMR) Atualmente existem 126278 estruturas depositadas no PDB

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Entrez records

Database name Subtree

links Direct links

Nucleotide 14112440 14112396

Nucleotide EST 8705106 8705106

Nucleotide GSS 1762817 1761491

Protein 1069030 1068738

Structure 33029 33029

Genome 1 1

Popset 23505 23504

SNP 165297523 165297523

Domains 24 24

GEO Datasets 1244816 1244816

UniGene 130056 130056

PubMed Central 553832 553829

Gene 219667 219594

HomoloGene 18713 18713

SRA Experiments 742541 742319

Probe 27382435 27382435

Assembly 90 90

Bio Project 32438 32427

Bio Sample 2516813 2516682

Bio Systems 3070 3070

Clone DB 17567413 17567413

dbVar 5064734 5064734

GEO Profiles 61958910 61958910

PubChem BioAssay 311510 311502

Protein Clusters 13 13

Taxonomy 3 1

Ainda podemos encontrar informaccedilotildees sobre projetos genomas e outros links para bancos taxonocircmicos nessa paacutegina Veja as informaccedilotildees que vocecirc pode encontrar para outras espeacutecies Mus musculus Taxonomy ID 10090 Genbank common name house mouse Inherited blast name rodents Arabidopsis thaliana Taxonomy ID 3702 Genbank common name thale cress

Uniprot

httpwwwuniprotorg

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias

Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

O uniprot fornece informaccedilotildees e sequecircncias sobre proteiacutenas As sequecircncias e informaccedilotildees funcionais das proteiacutenas podem vir de projetos genomas (sequecircncias codificantes) ou podem ser depositadas por curadores do UniProt Isso cria duas divisotildees dentro do Uniprot o UniProtKBTrEMBL e o UniProtKBSwiss-Prot As entradas do Uniprot apresentam nuacutemero de acesso alfanumeacuterico exemplo Q9NR96

O TrEMBL satildeo proteiacutenas que foram adicionadas no Uniprot de forma automaacutetica e natildeo passou por um processo de revisatildeo dos curadores (Status Unreviewed) Essas informaccedilotildees devem ser usadas com mais cuidado

O Swiss-Prot tem um crescimento lento porque todas as sequecircncias que estatildeo nessa subdivisatildeo passaram pela anotaccedilatildeo manual e revisatildeo de um curador (Status Reviewed) Essas informaccedilotildees satildeo confiaacuteveis As entradas trazem informaccedilotildees sobre resultados experimentais caracteriacutesticas e conclusotildees cientiacuteficas

Informaccedilotildees Protein Gene Organism Status (Reviewed ou Unreviewed)

- Annotation score -Experimental evidence at protein level ou Protein predicted

Function GO - Molecular function GO - Biological process Subcellular location

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Pesquisem sobre TLR9 no uniprot e vejam as informaccedilotildees que vocecircs podem encontrar Entrem no primeiro resultado (TLR( humano - Acesso Q9NR96)

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Protein Data Bank

wwwrcsborg

Banco de dados que armazena informaccedilotildees sobre estrutura tridimensional das proteiacutenas Nessa banco satildeo armazendas estruturas das proteiacutenas que foram avaliadas por cristalografia Raio-X Espectroscopia por ressonacircncia magneacutetica nuclear (NMR) Atualmente existem 126278 estruturas depositadas no PDB

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

dbVar 5064734 5064734

GEO Profiles 61958910 61958910

PubChem BioAssay 311510 311502

Protein Clusters 13 13

Taxonomy 3 1

Ainda podemos encontrar informaccedilotildees sobre projetos genomas e outros links para bancos taxonocircmicos nessa paacutegina Veja as informaccedilotildees que vocecirc pode encontrar para outras espeacutecies Mus musculus Taxonomy ID 10090 Genbank common name house mouse Inherited blast name rodents Arabidopsis thaliana Taxonomy ID 3702 Genbank common name thale cress

Uniprot

httpwwwuniprotorg

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias

Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

O uniprot fornece informaccedilotildees e sequecircncias sobre proteiacutenas As sequecircncias e informaccedilotildees funcionais das proteiacutenas podem vir de projetos genomas (sequecircncias codificantes) ou podem ser depositadas por curadores do UniProt Isso cria duas divisotildees dentro do Uniprot o UniProtKBTrEMBL e o UniProtKBSwiss-Prot As entradas do Uniprot apresentam nuacutemero de acesso alfanumeacuterico exemplo Q9NR96

O TrEMBL satildeo proteiacutenas que foram adicionadas no Uniprot de forma automaacutetica e natildeo passou por um processo de revisatildeo dos curadores (Status Unreviewed) Essas informaccedilotildees devem ser usadas com mais cuidado

O Swiss-Prot tem um crescimento lento porque todas as sequecircncias que estatildeo nessa subdivisatildeo passaram pela anotaccedilatildeo manual e revisatildeo de um curador (Status Reviewed) Essas informaccedilotildees satildeo confiaacuteveis As entradas trazem informaccedilotildees sobre resultados experimentais caracteriacutesticas e conclusotildees cientiacuteficas

Informaccedilotildees Protein Gene Organism Status (Reviewed ou Unreviewed)

- Annotation score -Experimental evidence at protein level ou Protein predicted

Function GO - Molecular function GO - Biological process Subcellular location

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Pesquisem sobre TLR9 no uniprot e vejam as informaccedilotildees que vocecircs podem encontrar Entrem no primeiro resultado (TLR( humano - Acesso Q9NR96)

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Protein Data Bank

wwwrcsborg

Banco de dados que armazena informaccedilotildees sobre estrutura tridimensional das proteiacutenas Nessa banco satildeo armazendas estruturas das proteiacutenas que foram avaliadas por cristalografia Raio-X Espectroscopia por ressonacircncia magneacutetica nuclear (NMR) Atualmente existem 126278 estruturas depositadas no PDB

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

O uniprot fornece informaccedilotildees e sequecircncias sobre proteiacutenas As sequecircncias e informaccedilotildees funcionais das proteiacutenas podem vir de projetos genomas (sequecircncias codificantes) ou podem ser depositadas por curadores do UniProt Isso cria duas divisotildees dentro do Uniprot o UniProtKBTrEMBL e o UniProtKBSwiss-Prot As entradas do Uniprot apresentam nuacutemero de acesso alfanumeacuterico exemplo Q9NR96

O TrEMBL satildeo proteiacutenas que foram adicionadas no Uniprot de forma automaacutetica e natildeo passou por um processo de revisatildeo dos curadores (Status Unreviewed) Essas informaccedilotildees devem ser usadas com mais cuidado

O Swiss-Prot tem um crescimento lento porque todas as sequecircncias que estatildeo nessa subdivisatildeo passaram pela anotaccedilatildeo manual e revisatildeo de um curador (Status Reviewed) Essas informaccedilotildees satildeo confiaacuteveis As entradas trazem informaccedilotildees sobre resultados experimentais caracteriacutesticas e conclusotildees cientiacuteficas

Informaccedilotildees Protein Gene Organism Status (Reviewed ou Unreviewed)

- Annotation score -Experimental evidence at protein level ou Protein predicted

Function GO - Molecular function GO - Biological process Subcellular location

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Pesquisem sobre TLR9 no uniprot e vejam as informaccedilotildees que vocecircs podem encontrar Entrem no primeiro resultado (TLR( humano - Acesso Q9NR96)

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Protein Data Bank

wwwrcsborg

Banco de dados que armazena informaccedilotildees sobre estrutura tridimensional das proteiacutenas Nessa banco satildeo armazendas estruturas das proteiacutenas que foram avaliadas por cristalografia Raio-X Espectroscopia por ressonacircncia magneacutetica nuclear (NMR) Atualmente existem 126278 estruturas depositadas no PDB

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Pesquisem sobre TLR9 no uniprot e vejam as informaccedilotildees que vocecircs podem encontrar Entrem no primeiro resultado (TLR( humano - Acesso Q9NR96)

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Protein Data Bank

wwwrcsborg

Banco de dados que armazena informaccedilotildees sobre estrutura tridimensional das proteiacutenas Nessa banco satildeo armazendas estruturas das proteiacutenas que foram avaliadas por cristalografia Raio-X Espectroscopia por ressonacircncia magneacutetica nuclear (NMR) Atualmente existem 126278 estruturas depositadas no PDB

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr

Protein Data Bank

wwwrcsborg

Banco de dados que armazena informaccedilotildees sobre estrutura tridimensional das proteiacutenas Nessa banco satildeo armazendas estruturas das proteiacutenas que foram avaliadas por cristalografia Raio-X Espectroscopia por ressonacircncia magneacutetica nuclear (NMR) Atualmente existem 126278 estruturas depositadas no PDB

IMSCAT-UFBA - Rua Rio de Contas 58 ndash Quadra 17 ndash Lote 58 ndash Bairro Candeias Vitoacuteria da Conquista ndash BA - CEP 45029-094 Fone (77) 3429 2714 E-mail leandromartinsufbabr