58
INTRODUÇÃO A BANCOS DE DADOS BIOLÓGICOS FELIPE GUIMARÃES TORRES COORDENADO PELO PROF. MÁRCIO SOUSSA NÚCLEO DE SERVIÇOS TECNOLÓGICOS - NST

[INTERCULTE2012] Introdução a Banco de Dados Biológicos

Embed Size (px)

Citation preview

Page 1: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

INTRODUÇÃO A BANCOS DE DADOS BIOLÓGICOS

FELIPE GUIMARÃES TORRES COORDENADO PELO PROF. MÁRCIO SOUSSA NÚCLEO DE SERVIÇOS TECNOLÓGICOS - NST

Page 2: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONTATO

FELIPE GUIMARÃES TORRES

[email protected]

http://www.facebook.com/felipe.g.torres.5

http://www.twitter.com/felipegtorres

http://www.slideshare.net/fgtorres

Page 3: [INTERCULTE2012] Introdução a Banco de Dados Biológicos
Page 4: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – AGENDA

1.  Biologia Básica 2.  Seres vivos 3.  Células 4.  DNA

5.  História do con- ceito de BDB.

6.  Evolução de Re- curso.

7.  Bancos de Dados Biológicos

8.  Arquitetura com- putacional de um BDB.

9.  Conceitos mate- máticos.

10. Prática. 11. TecJorge. 12. Referências.

Page 5: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

BIOLOGIA BÁSICA

Page 6: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA

Page 7: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Seres formados por células… Seres vivos…

Exceção dos vírus…

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA

Page 8: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Células

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA

Page 9: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Procarióticas…

NOME DO CURSO – NOME DO BLOCO INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA

Page 10: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Eucarióticas…

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA

Page 11: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA

Page 12: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Ácido desoxirribonucléico. Armazena informações genéticas em genes. São formados por monômeros conhecidos como nucleotídeos.

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA

Page 13: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA

Page 14: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Estrutura nucleotídica …

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA

Page 15: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Relações entre nucleotídeos…

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA

Page 16: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Estrutura do DNA

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA

Page 17: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Ligações entre nucleotídeos

Fosfodiéster…

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA

Page 18: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Ligações entre nucleotídeos

Pontes de Hidrogênio…

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA

Page 19: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Dogma central…

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – BIOLOGIA BÁSICA

Page 20: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

HISTÓRIA DO CONCEITO BDB’S

Page 21: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

1965 1970

1982

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S

Page 22: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Década de 60…

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S

Page 23: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Tempo 13 anos (1990 - 2003)

Custo U$3.8 bilhões

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S

Page 24: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

INTRODUÇÃO ESTRUT. COMP. BANCO DE D. B. DADOS BIO. BANCO DE DADOS ATUAIS FERRAMENTAS

Page 25: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S

Page 26: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

SANGER ILLUMINA HISEQ2000

TOTAL DE BASES: 30~ 350 kb TEMPO DA CORRIDA: 15 HORAS CUSTO: U$1000/Mb

TOTAL DE BASES: 35 ~ 200 Gb TEMPO DA CORRIDA: 1.5 a 8 dias CUSTO: MENOS DE U$1/Mb

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S

Page 27: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

GRÁFICO DE SEQUÊNCIAS NUCLEOTÍDICAS INSERIDAS NO GENBANK ENTRE 1995 A 2011.

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S

Page 28: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

GRÁFICO DE SEQUÊNCIAS NUCLEOTÍDICAS INSERIDAS NO GOLD ENTRE 1997 A 2011.

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – HISTÓRIA DO CONCEITO DE BSB’S

Page 29: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

BANCOS DE DADOS BIOLÓGICOS

Page 30: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Banco de dados biológicos são locais computacionais para o armazenamento de dados biológicos.

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS

Page 31: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Sequências de DNA…

Sequências de Proteínas… Anotações…

Dados Biológicos

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS

Page 32: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Secundários… Especializados…

Tipos de BDB

Primários…

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS

Page 33: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Primários… Armazenam informações biológicas

originais.

Armazenam normalmente em arquivos de texto. Ex.: Fasta.

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS

Page 34: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Secundários…

Armazenam resultados de análises feitas a partir de dados primários.

Utilizam SGBD`s e estruturas computacionais mais complexas.

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS

Page 35: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

ARQUITETURA COMPUTACIONAL DE UM BDB

Page 36: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Modelos de BD

Relacional…

Orientado a objeto….

Arquivo de texto….

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – ARQUITETURA COMPUTACIONAL DE UM BDB

Page 37: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Relacional

Utilizando o conceito de keys…

Largamente utilizado e estável…

Planilhas que se relacionam…

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – ARQUITETURA COMPUTACIONAL DE UM BDB

Page 38: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Relacional

Exemplo de modelo relacional…

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – ARQUITETURA COMPUTACIONAL DE UM BDB

Page 39: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

OO

Conceito melhorado de keys…

Maior facilidade na abstração…

Conceito abstrato de objeto…

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – ARQUITETURA COMPUTACIONAL DE UM BDB

Page 40: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Orientado a objeto

Exemplo de modelo OO …

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – ARQUITETURA COMPUTACIONAL DE UM BDB

Page 41: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

CONCEITOS MATEMÁTICOS PARA ACESSO A DADOS

BIOLÓGICOS

Page 42: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Métodos de acesso… Estruturas de dados que podem ser

armazenadas em memória.

Utilizam SGBD`s e estruturas computacionais mais complexas.

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS –BANCOS DE DADOS BIOLÓGICOS

Page 43: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Hash Mapping

Armazena chave, valor e um ponteiro…

Alta performace em pesquisas id…

Conhecida como estrutura key-value…

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS

Page 44: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Hash Mapping

Exemplo de hash…

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS

Page 45: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Árvore de Sufixos

Resolve alguns problemas de similaridade…

Alta performace em textos…

Utilizado por aplicações para pesquisa…

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS

Page 46: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Matematicamente é…

Fórmula do prefixo e sufixo…

F = {α1, α2, ..., αn} F* = todas as sequências possíveis com o alfabeto F. T E F*. T = “TATA” c = |T| Logo: T[i:j] (1≤ i≤ j≤ c) T[1:j] = prefixo T[i:c] = sufixo

Page 47: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Prefixos Sufixos R[1:1] = “A” R[6:6] = “T” R[1:2] = “AG” R[5:6] = “AT” R[1:3] = “AGA” R[4:6] = “GAT” R[1:4] = “AGAG” R[3:6] = “AGAT” R[1:5] = “AGAGA” R[2:6] = “GAGAT” R[1:6] = “AGAGAT” R[1:6] = “AGAGAT”

R = “AGAGAT” |R| = 6

Sufixo e Prefixo…

Exemplo de prefixos e sufixos…

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS

Page 48: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Árvore de Sufixo…

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS

R = “AGAGAT”

Page 49: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

PRÁTICA

Page 50: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Visual Suffix Tree…

Software para criação de suffix trees…

Linguagem Java utilizando o jGraph

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS

Page 51: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Visual Suffix Tree…

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – CONCEITOS MATEMÁTICOS

Page 52: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

• No HIV Databases estam armazenados dados de sequências de HIV, epitopos e testes para vacinas. • Este projeto foi fundado pela Division of AIDS of the National Institute of Allergy and Infectious Diseases (NIAID) • Acesso disponível pelo link:

http://www.hiv.lanl.gov/content/index

HIV Databases INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – PRÁTICA

Page 53: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

UNIPROT • Banco de dados de proteínas e informações funcionais. • O UNIPROT é um consórcio entre:

•  European Bioinformatics Institute (EBI). •  Swiss Institute of Bioinformatics (SIB). •  Protein Information Resource (PIR).

• Esse banco de dados integrou quatro bancos de dados em 2002. Swiss-Prot e TrEMBL (EBI e SIB) e PIR-PSD e iProClass (PIR). • Acesso disponível pelo link:

http://www.uniprot.org/

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – PRÁTICA

Page 54: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

PROTEIN DATA BANK • É um repositório de estruturas tri-dimensionais de proteínas e ácidos nucléicos. • A maioria das estruturas foram obtidas por cristalograma ou por espectroscopia por ressonância magnética. • A estrutura pode ser visualizada em 3D. • Acesso disponível pelo link: http://www.rcsb.org/pdb

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – PRÁTICA

Page 55: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

ENTREZ • O NCBI alberga dados provenientes da sequenciação de genomas no seu GenBank e mantém um índice de artigos de investigação biomédica que disponibiliza nas bases de dados PubMed Central e PubMed. • Todas as bases de dados estão disponíveis na Internet através do motor de busca Entrez. É um grande integrador de dados no NCBI. • Acesso disponível pelo link: http://www.ncbi.nlm.nih.gov/sites/gquery

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – PRÁTICA

Page 56: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

1. Xiong, J. (2006). Essential Bioinformatics. Cambridge University Press.

2. Andrzej Polanski and Marek Kimmel (1998). Bioinformatics. Springer.

3. Helen M. Berman, John Westbrook, Zukang Feng, Gary Gilliland, T. N. Bhat, Helge Weissig, Ilya N. Shindyalov and Philip E. Bourne (2000). The Protein Data Bank. Oxford University Press, Nucleic Acids Research, 2000, Vol. 28, No. 1

4. Robert Schleif, (1993). Genetics and Molecular Biology. Department of Biology The Johns Hopkins University Baltimore, Maryland. All rights reserved. Printed in the United States of America on acid-free paper.

5. Bruce Alberts, Alexander Johnson, Julian Lewis, Martin Raff, Keith Roberts and Peter Walter, (2008). Molecular biology of the cell. Published by Garland science, Taylor & Francis Group, LLC, an informa business, 270 Madison Avenue, NewYork NY f 0016,USA,and 2 park Square,Milton park, Abingdon,OXl4 4RN,UK.

INTRODUÇÃO A BANCO DE DADOS BIOLÓGICOS – REFERÊNCIAS

Page 57: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Perguntas !?

Page 58: [INTERCULTE2012] Introdução a Banco de Dados Biológicos

Obrigado !