20
Comparação entre diferentes tecnologias em banco de dados para manipulação rápida e ubíqua de dados biológicos Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação Faculdade Fabrai-Anhanguera 1

Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação

  • Upload
    gada

  • View
    25

  • Download
    0

Embed Size (px)

DESCRIPTION

Comparação entre diferentes tecnologias em banco de dados para manipulação rápida e ubíqua de dados biológicos. Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação Faculdade Fabrai-Anhanguera. Objetivo. - PowerPoint PPT Presentation

Citation preview

Page 1: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação

1

Comparação entre diferentes tecnologias em banco de dados para

manipulação rápida e ubíqua de dados biológicos

Kátia de Paiva LopesOrientador: Sandro Renato Dias

Departamento de Sistemas de Informação Faculdade Fabrai-Anhanguera

Page 2: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação

2

Objetivo

Apresentar uma comparação entre duas diferentes ferramentas para manipulação de dados biológicos, com intuito de facilitar o trabalho dos profissionais de Bioinformática, que por ser uma área multidisciplinar, acolhe profissionais de diferentes formações.

Page 3: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação

3

IntroduçãoBanco de dados (RANMEZ, SHAMKAT, 2006)

repositório computacionalacesso Recuperação

Bancos de dados biológicos DNA, sequências de aminoácidos, nucleotídeos, proteínas

Page 4: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação

4

IntroduçãoPDB (Protein Data Bank):

armazena dados biológicos, flat files

Data Mining "o cruzamento de vários bancos de dados e a

descoberta de conexões impossíveis de se descobrir por outro método.” (EIRAS, 2009).

Page 5: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação

5

IntroduçãoSistemas de Gerenciamento de Banco de

Dados (SGBD’s)

OracleMySQLDB2MS SQLServer

Page 6: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação

6

Materiais e métodosNesse trabalho, para objeto de comparação,

foram utilizadas duas diferentes ferramentas:

SGBD MySQL (www.mysql.com)gratuito, diferentes sistemas operacionais, amplamente conhecido e utilizado.

Fusion Tables (BATERMAN, 2009).Google (fusiontables.googlelabs.com)Simplificação das operações de acesso aos

dados, Cloud Computing (Computação nas nuvens)

Page 7: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação

7

Materiais e MétodosO mesmo banco de dados foi criado

utilizando as ferramentas Mysql e Fusion Tables, a partir das tabelas de Dias & Nagem (2009).

Foi criada a mesma estrutura em ambos, e, para geração dos gráficos com o uso do SGBD MySQL foi criada uma aplicação com uso da linguagem PHP.

Page 8: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação

8Fig. 2 – Tela inicial da aplicação em PHP.

Fig. 1 – Parte do código da aplicação em PHP.

Page 9: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação

9

Fig. 3 – Tela inicial do Fusion Tables.

Page 10: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação

10

Em seguida, foram gerados os gráficos a partir da mesma consulta nas duas aplicações:

Fig. 4 – Arquivos PDB por método de resolução da proteína, desconsiderando os métodos: Solution NMR e X-Ray Difraction.

Page 11: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação

11

Fig. 5 – Número de arquivos PDB por valor de resolução da estrutura. Valores considerados, definidos entre 0.0 e 3.0 (ilegíveis na imagem).

Fig. 6 – Arquivos PDB por identificação do método de resolução da estrutura da proteína.

Page 12: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação

12

Fig. 7 – Visualização das tabelas

Page 13: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação

13

Resultados e Discussões

VantagensFacilidade de manipulação dos dados.Depois que o arquivo é copiado para o servidor não há necessidade de estar conectado ao banco para a importação das tabelas.Uso de Cloud Computing.Gráficos gerados automaticamente.Descarta o uso de SQL.Ubiquidade (Acessível via internet).

Fusion Tables

Page 14: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação

14

Resultados e Discussões

DesvantagensLimitação de 100 MB por planilha e 250 MB por usuário.Não funciona bem no browser Internet Explorer 8.0, mas atende as funcionalidades quando executado em modo de compatibilidade.Limitado quanto à realização de cálculos.Não há interação com outros aplicativos

Fusion Tables

Page 15: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação

15

Resultados e DiscussãoMySQL

VantagensFunciona em diferentes sistemas operacionais.Robustez para trabalhar com grande quantidade de dados.Realiza cálculos complexos.Interage com outros aplicativos.

Page 16: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação

16

Resultados e DiscussãoMySQL

DesvantagensNão faz uso de Cloud Computing.Não apresenta uma interface gráfica para manipulação dos dados.Exige conhecimentos em SQL.

Page 17: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação

17

Resultados e DiscussãoMySQL x Fusion Tables, do ponto de vista da

usabilidade:

Características MySQL Fusion TablesUso de Cloud Computing Não SimAcesso aos dados SQL GráficaCálculos complexos Sim LimitadoGeração de gráficos automaticamente

Sim Não

Interage com aplicativos Sim NãoImportação de dados .txt, .sql .xls, .csv

Page 18: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação

18

ConclusãoFusion Tables é uma boa opção para armazenamento de

dados biológicos, porque: não exige conhecimentos em alguma linguagem específica, manipulação dos dados é feita através da interface gráfica, faz uso de Cloud Computing, interpreta os dados e gera gráficos automaticamente.

MySQL, embora apresente robustez para trabalhar com grande quantidade de dados, requer o uso de SQL, e para gerar gráficos, por exemplo, é necessário que seja utilizada uma aplicação, exigindo assim: configuração de servidor web, conhecimentos sobre parametrização de gráficos, conhecimentos em Linguagem de Programação caso haja

necessidade de criação de uma aplicação.

Page 19: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação

19

ReferênciasBATERMAN, A., WOOD,M. Cloud Computing. Oxford Journals.

2009,1.

DIAS, S. R. ; Nagem, R. A. P. Residue-residue interaction database: use in the modification of proteins. In: International Network of Protein Engineering Centers, 2009, Ubatuba/SP. International Network of Protein Engineering Centers Meeting Abstract Book, 2009.

L. Eiras. O amigo do Estado. Revista Fonte - Prodemge, 142, 2009.

RANMEZ, E., SHAMKANT B.N. Introdução a Banco de Dados – Sistemas de Banco de Dados . São Paulo, 2006. 28 slides: color. Acompanha texto.

Page 20: Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação

20

Agradecimentos

Faculdade Fabrai - Anhanguera