View
7
Download
0
Category
Preview:
Citation preview
1
SISTEMAS DE BANCO DE DADOS
•EDIÇÃO
Ramez Elmasri Shamkant B. Navathe
Tradução Marília Guimarães Pinheiro Cláudio César Canhette, Glenda Cristina Valim Melo, Claudia Vicei Amadeu e Rinaldo Macedo de Morais
Revisão Técnica Luis Ricardo de Figueiredo Mestre em ciências da computação e doutorando pela USP-Ribeirão Preto
, •«•""»*lo.
PEARSON
Addison Wesley
«sói '••:.'.
2
© 2005 Pearson Education do Brasil Ltda. © 2004 Pearson Education, Inc.
Tradução autorizada a partir da edição original em inglês, Fundamentais of Database Systems 4th ed., Elmasri, Ramez; Navathe, Shamkant B., publicada pela Pearson Education, sob o selo
Addison Wesley.
Todos os direitos reservados. Nenhuma parte desta publicação poderá ser reproduzida ou transmitida de qualquer modo ou por qualquer outro meio, eletrônico ou mecânico, incluindo fotocópia, gravação ou qualquer outro tipo de sistema de armazenamento e transmissão de informação, sem prévia autorização, por escrito, da Pearson Education do Brasil.
Gerente Editorial: Roger Trimer Editora de Desenvolvimento: Renatha Prado Gerente de Produção: Heber Lisboa Editora de Texto: Tereza Gouveia Preparação: Maria Alice da Costa, Margô Negro e Nelson Luis Barbosa Revisão: Alessandra Miranda, Alexandra Costa e Thelma Babaoka Capa: Marcelo Françozo, sobre o projeto original de Beth Anderson Imagem da Capa © 2003 Digital Vision Editoração Eletrônica: ERJ Composição Editorial e Artes Gráficas Ltda.
A Figura 12.14 é uma definição de um diagrama do modelo lógico de dados em Rational Rose®. A Figura 12.15 é um projeto de banco de dados em Rational Rose®. A Figura 12.17 é um diagrama de classe para o banco de dados empresa gerado pela Rational Rose®.
Dados Internacionais de Catalogação na Publicação (CIP) (Câmara Brasileira do Livro, SP, Brasil)
Elmasri, Ramez Sistemas de banco de dados / Ramez Elmasri e Shamkant B. Navathe; revisor técnico Luis Ricardo de Figueiredo. -- São Paulo : Pearson Addison Wesley, 2005
Título original: Fundamentals of database systems Vários tradutores. Bibliografia.
ISBN 85-88639-17-3
1. Banco de dados I. Navathe, Shamkant B. II. Título.
04-6763 CDD-005.75
índices para catálogo sistemático
1. Banco de dados : Sistemas : Processamento de dados 005.75
2. Banco de dados : Fundamentos : Processamento de dados 005.75
2006 1a reimpressão Direitos exclusivos para a língua portuguesa cedidos à Pearson Education do Brasil, uma empresa do grupo Pearson Education Av. Ermano Marchetti, 1435 CEP: 05038-001 - Lapa - São Paulo - SP Tel: (11) 2178-8686 Fax: (11) 3611-0444 e-mail: vendas@pearsoned.com
3
A Amalia com amor R.E.
A minha mãe, Vijaya, e minha esposa, Aruna, pelo amor e apoio S.B.N.
4
Prefácio
Este livro introduz os conceitos fundamentais necessários para projetar, usar e implementar os sistemas de banco de dados e suas aplicações. Nossas
apresentações abordam com profundidade os fundamentos da modelagem e projeto de bancos de dados, suas linguagens e as funcionalidades dos sistemas
de gerenciamento de bancos de dados e as técnicas de implementação desses sistemas. O livro foi projetado para ser usado como um livro-texto para os
cursos de um ou dois semestres em sistemas de banco de dados nos níveis introdutório, avançado, de graduação ou de pós-graduação, e como um livro de
referência. Pressupomos que os leitores estejam familiarizados com a programação elementar e com os conceitos de estruturação de dados, e que tenham
tido algum contato com a organização básica de computadores. Iniciamos na Parte 1 com uma introdução e uma apresentação dos conceitos básicos e sua terminologia, além dos princípios de modelagem
conceitual de banco de dados. E concluímos o livro nas partes 7 e 8 com uma introdução sobre as tecnologias emergentes, como data mining (garimpagem
de dados), XML, segurança e banco de dados para Web. Nas partes intermediárias — 2 a 6 — tratamos com profundidade os aspectos mais importantes dos
fundamentos de banco de dados. As características fundamentais incluídas nesta edição são:
• O livro possui uma organização auto-ajustável e flexível para que possa ser adaptada a necessidades individuais.
• A abordagem para a modelagem de dados agora inclui o modelo ER e a UML.
• Um novo capítulo de SQL avançado com material sobre as técnicas de programação em SQL, como JDBC e SQL/CLI.
• Dois exemplos utilizados ao longo do livro — chamados EMPRESA e UNIVERSIDADE — permitem ao leitor comparar as diferentes
abordagens que usam a mesma aplicação.
• A cobertura de assuntos como segurança, bancos de dados móveis, GIS e gerenciamento de dados Genoma foi atualizada.
• Um novo capítulo em XML e bancos de dados para a Internet.
• Um capítulo novo em data mining.
• Uma significativa revisão dos suplementos para incluir um conjunto robusto de materiais para professores e estudantes e um estudo de caso on-
line.
Principais Diferenças em Relação à Terceira Edição Existem várias mudanças organizacionais na quarta edição, além de alguns capítulos novos muito importantes. As mudanças principais são:
• Os capítulos sobre organização de arquivos e indexação (capítulos 5 e 6 na terceira edição) foram movidos para a Parte 4 da atual edição e
correspondem agora aos capítulos 13 e 14. Essa parte inclui também os capítulos 15 e 16 sobre processamento de pesquisas (query) e sua
otimização e o projeto do banco de dados físico e sintonia (tuning) (que se referia ao Capítulo 18 e seções 16.3-16.4 da edição anterior).
• A cobertura do modelo relacional foi reorganizada e atualizada na Parte 2 desta edição. O Capítulo 5 cobre os conceitos do modelo relacional e as
restrições. O material sobre álgebra relacional e cálculo foi incorporado ao Capítulo 6. O projeto de banco de dados relacional usando os
mapeamentos do ER-para-relacional e do EER-para-relacional encontra-se no Capítulo 7. A SQL está nos capítulos 8 e 9, bem como o material
novo sobre técnicas de programação em SQL nas seções 9.3 a 9.6.
• A Parte 3 cobre a teoria e a metodologia de projeto de banco de dados. Os capítulos 10 e 11 sobre a teoria da normalização correspondem aos
capítulos 14 e 15 da edição anterior. O Capítulo 12, referente ao projeto de banco de dados, foi, na prática, atualizado para incluir mais cobertura
sobre a UML.
• Os capítulos sobre transações, controle de concorrência e recuperação (19, 20 e 21 na terceira edição) estão agora nos capítulos 17, 18 e 19 na
Parte 5 desta edição.
• Os capítulos que dizem respeito aos conceitos de orientação a objetos, modelo de objetos ODMG e sistemas objeto-relacional (11, 12 e 13 na
edição precedente) fazem parte atualmente dos capítulos 20, 21 e 22 na Parte 6. O Capítulo 22 foi reorganizado e atualizado.
5
VIII Prefácio
• Os capítulos 10 e 17 da terceira edição foram retirados. O material sobre arquitetura cliente-servidor foi incluído nos capítulos 2 e 25 da nova
edição.
• Os capítulos sobre segurança, modelos estendidos (ativo, temporal, espacial, multimídia) e bancos de dados distribuídos (capítulos 22, 23 e 24 na
edição anterior) correspondem agora aos capítulos 23, 24 e 25 na Parte 7.0 capítulo sobre segurança foi atualizado. O Capítulo 25 da terceira
edição relativo a bancos de dados dedutivos foi incorporado ao Capítulo 24 desta edição e faz parte da Seção 24-4.
• O Capítulo 26 é novo, se refere a XML (eXtended Markup Language) e está relacionado ao acesso a bancos de dados relacionais pela Internet.
• O material sobre data mining e data warehousing (Capítulo 26 na edição anterior) foi dividido em dois capítulos. O Capítulo 27 sobre data
mining foi ampliado e atualizado.
Conteúdo Desta Edição
A Parte 1 descreve os conceitos básicos necessários para um bom entendimento do projeto de banco de dados e sua implementação, bem como as técnicas
de modelagem conceituais usadas nos sistemas de banco de dados. Os capítulos 1 e 2 introduzem os bancos de dados, seus usuários típicos e os conceitos de
SGBDs, sua terminologia e arquitetura. No Capítulo 3, os conceitos do modelo Entidade-Relacionamento (ER) e os diagramas ER são apresentados e
utilizados para ilustrar o projeto de banco de dados conceitual. O Capítulo 4 está concentrado na abstração de dados e nos conceitos de modelagem de dados
semânticos, e estende o modelo ER para incorporar essas idéias, direcionando para o modelo de dados ER-Estendido (EER) e diagramas EER. Os conceitos
apresentados incluem subclasses, especialização, generalização e tipos de união (categorias). A notação para os diagramas de classe da UML também foi
introduzida nos capítulos 3 e 4- A Parte 2 descreve o modelo de dados relacional e os SGBDs relacionais. O Capítulo 5 descreve o modelo relacional básico, suas restrições de
integridade e operações de atualização. O Capítulo 6 traz as operações da álgebra relacional e introduz o cálculo relacional. O Capítulo 7 discute o projeto
de banco de dados relacional utilizando os mapeamentos do ER e do EER-para-relacional. O Capítulo 8 dá uma visão detalhada da linguagem SQL,
cobrindo o padrão SQL, que é implementado na maioria dos sistemas relacionais. O Capítulo 9 trata dos tópicos de programação SQL, como SQLJ, JDBC e
SQL/CLI. A Parte 3 cobre vários tópicos relacionados ao projeto de banco de dados. Os capítulos 10 e 11 tratam do formalismo, teorias e algoritmos
desenvolvidos para o projeto de banco de dados relacional por meio da normalização. Esse material inclui os tipos de dependências funcionais e outros
tipos, e a forma normal de relações. Passo a passo, a normalização intuitiva é apresentada no Capítulo 10, e o projeto de algoritmos relacionais é discutido
no Capítulo 11, que também define outros tipos de dependências, como a multivalorada e a junção. O Capítulo 12 apresenta uma visão geral das diferentes
fases do projeto de banco de dados para as aplicações de tamanhos médios e grandes, usando UML. A Parte 4 começa com uma descrição das estruturas de arquivo físicas e dos métodos de acesso usados em sistemas de banco de dados. O Capítulo
13 aborda os métodos primários de organizar os arquivos de registros em disco, incluindo o hash estático e o dinâmico. O Capítulo 14 refere-se a técnicas
de indexação de arquivos, incluindo as estruturas de dados árvore-B e árvore-B+, bem como arquivos grid. O Capítulo 15 introduz os fundamentos do
processamento e otimização de pesquisas, e o Capítulo 16 discute o projeto de banco de dados físico e sua sintonização. A Parte 5 analisa o processamento de transações, controle de concorrência e técnicas de recuperação, incluindo as discussões de como esses
conceitos são efetivados na SQL. A Parte 6 é uma introdução ampla aos sistemas de bancos de dados orientados a objeto e objeto-relacional. O Capítulo 20 insere os conceitos de
orientação a objetos. O Capítulo 21 dá uma visão detalhada do modelo de objetos ODMG e suas linguagens associadas ao ODL e OQL. O Capítulo 22
descreve como estão sendo estendidos os bancos de dados relacionais para incluir os conceitos orientados a objeto e apresenta as características do sistema
objeto-relacional, além da avaliação de algumas características do padrão SQL3 e o modelo de dados relacional aninhado. As partes 7 e 8 cobrem vários tópicos avançados. O Capítulo 23 fornece uma visão geral de segurança e autorização em banco de dados, inclusive
dos comandos privilegiados da SQL, GRANT (CONCEDER) e REVOKE (REVOGAR), e amplia os conceitos de segurança incluindo a criptografia, os
papéis e o controle de fluxo. O Capítulo 24 introduz vários modelos de banco de dados estendidos para aplicações avançadas. Inclui banco de dados ativo e
gatilhos (triggers), temporal, espacial, multimídia e bancos de dados dedutivos. O Capítulo 25 possui uma introdução a bancos de dados distribuídos e à
arquitetura cliente-servidor de três camadas. O Capítulo 26 é novo e trata do modelo XML (eXtended Markup Language). Primeiramente, discute as
diferenças entre os modelos estruturado, semi-estruturado e não-estruturado; a seguir, apresenta os conceitos de XML; e, finalmente, compara o modelo
XML com os modelos de banco de dados tradicionais. O Capítulo 27 sobre data mining foi ampliado e atualizado. O Capítulo 28 introduz os conceitos de
data warehousing. Por fim, o Capítulo 29 traz uma
6
Prefácio IX
introdução aos tópicos de bancos de dados móveis, bancos de dados multimídia, GIS (Sistemas de Informações Geográficas) e gerenciamento de dados
Genoma em bioinformática. O Apêndice A contém várias alternativas de notações diagramáticas para exibir um esquema conceitual de ER ou EER. Elas podem ser substituídas
pelas notações que empregamos, se o professor assim o desejar. O Apêndice C traz os mais importantes parâmetros físicos para os discos. Os apêndices B,
E e F estão no site. O Apêndice B é um estudo de caso que acompanha o projeto e a implementação do banco de dados de uma livraria. Os apêndices E e F
cobrem os sistemas de bancos de dados legados, baseados nos modelos de bancos de dados de rede e hierárquicos. Foram usados por mais de 30 anos como
base para muitas aplicações de bancos de dados comerciais existentes e sistemas de processamento de transações, e serão necessárias várias décadas para
substituí-los completamente. Consideramos importante apresentar aos estudantes de administração de banco de dados essas abordagens existentes há muito
tempo. Os capítulos completos da segunda edição podem ser encontrados no site como uma referência a esta edição.
Orientações Para o Uso Deste Livro
Existem diferentes formas de apresentação de um curso de banco de dados. Os capítulos das partes 1 a 5 podem ser usados em um curso introdutório de
sistemas de banco de dados na ordem em que estão ou na ordem escolhida pelo professor. O professor pode omitir capítulos e seções e incluir outros do
restante do livro, dependendo da ênfase do curso. Ao término de cada seção de apresentação do capítulo são apresentadas as seções que podem ser omitidas
se for aconselhável uma discussão menos detalhada do tópico abordado no capítulo. Sugerimos o uso até o Capítulo 14 em um curso de banco de dados
introdutório e a inclusão de outras partes selecionadas dos demais capítulos, dependendo do conhecimento dos estudantes e da profundidade desejada. Para
uma ênfase em técnicas de implementação de sistemas, os capítulos das partes 4 e 5 devem ser incluídos. Os capítulos 3 e 4, que tratam da modelagem conceitual usando-se os modelos ER e EER, são importantes para uma boa compreensão conceitual
sobre os bancos de dados. Porém, podem ser estudados parcialmente, estudados em outro curso ou até mesmo ser omitidos, se a ênfase for a implementação
do SGBD. Os capítulos 13 e 14, referentes à organização de arquivos e indexação, também podem ser estudados posteriormente ou ainda ser omitidos, caso a
ênfase seja nos modelos de banco de dados e linguagens. Para os estudantes que já participaram. .
7
X Prefácio
de um curso em organização de arquivos, partes desses capítulos poderiam ser utilizadas como material de leitura, ou alguns exercícios podem ser definidos
como revisão dos conceitos. Um ciclo de vida completo de projeto e implementação de um banco de dados engloba o projeto conceitual (capítulos 3 e 4), o mapeamento do
modelo (Capítulo 7), a normalização (Capítulo 10) e a implementação em SQL (Capítulo 9). A documentação adicional em SGBDRS também deve ser
providenciada. O livro foi escrito de forma a abranger todos esses tópicos, embora sua ordem de leitura possa ser alterada. A figura da página anterior mostra as
principais interdependências entre os capítulos. Como a figura ilustra, é possível começar com diferentes tópicos após os dois capítulos introdutórios.
Embora a figura possa parecer complexa, é importante observar que, se os capítulos forem lidos na ordem proposta, as interdependências não serão
perdidas. A figura pode ser consultada por professores que desejam utilizar uma ordem alternativa de apresentação. Para o curso de um único semestre baseado neste livro, alguns capítulos podem ser definidos como material de leitura, como as partes 4, 7 e 8. O
livro pode ser usado, também, para um caso de dois semestres. O primeiro curso, "Introdução ao projeto de sistemas de bancos de dados", nos níveis
introdutório, principiante ou avançado, deve cobrir os capítulos 1 a 14. O segundo, "Técnicas de projeto e implementação de bancos de dados", para níveis
mais avançados, deve abordar os capítulos 15 a 28. Os capítulos das partes 7 e 8 podem ser utilizados seletivamente em cada semestre, e outras bibliografias
descrevendo os SGBDs, disponíveis para os estudantes em bibliotecas, podem ser empregadas para complementar o material do livro.
Material de apoio (no Companion Website) No site www.aw.com/elmasri_br professores e estudantes encontram material de apoio exclusivo, incluindo:
• "Estudos de caso" sobre o projeto e a implementação do banco de dados de uma livraria.
• Capítulos 10 e 11 da terceira edição.
• Apêndices E e F (em inglês).
• Conjunto de "Notas de aula" em PowerPoint.
• Manual de soluções (em inglês) exclusivo para professores que lecionam a disciplina.
• Exercício de múltipla escolha.
Agradecimentos É um grande prazer agradecermos a assistência e contribuição de um grande número de pessoas que nos auxiliaram neste esforço. Primeiro, gostaríamos de
agradecer a nossos editores, Maite Suarez-Rivas, Katherine Harutunian, Daniel Rausch e Ju-liet Silveri. Em particular, agradecemos os esforços e a ajuda
de Katherine Harutunian, nosso primeiro contato para a quarta edição. Gostaríamos de expressar nosso reconhecimento a todos que tenham contribuído para
esta quarta edição. Agradecemos a contribuição dos seguintes revisores: Phil Berhnard, Florida Tech; Zhengxin Chen, University of Nebraska em Omaha;
Jan Chomicki, University of Buffalo; Hakan Ferhatosmagnoglu, Ohio State University; Len Fisk, Califórnia State University, Chico; William Hankley,
Kansas State University; Ali R. Hurson, Penn State University; Vijay Kumar, University of Missouri-Kansas City; Peretz Shoval, Ben-Guirion University,
Israel; Jason T. L. Wan, New Jersey Institute of Technology; e Ed Omiecinski da Geórgia Tech, que contribuiu com o Capítulo 27. Ramez Elmasri agradece a seus alunos Hyoil Han, Babak Hojabri, Jack Fu, Charley Li, Ande Swathi, e Steven Wu, que contribuíram com material
para o Capítulo 26. É grato também ao apoio oferecido pela University of Texas, Arlington. Sham Navathe agradece a Dan Forsythe e aos seguintes alunos da Geórgia Tech: Weimin Feng, Angshuman Guin, Abrar Ul-Haque, Bin Liu, Ying
Liu, Wanxia Xie e Waigen Yee. Gostaríamos de reforçar nossos agradecimentos àqueles que revisaram e contribuíram para as edições anteriores de Fundamentos de Sistemas de
Banco de Dados. Na primeira edição, somos gratos a: Alan Apt (editor), Don Batory, Scott Downing, Dennis Heimbinger, Julia Hodges, Yannis Ioannidis,
Jim Larson, Dennis McLeod, Per-Ake Larson, Rahul Patel, Nicholas Roussopoulos, David Stemple, Michael Stonebraker, Frank Tompa, e Kyu-Young
Whang; na segunda edição: Dan Joraans-tad (editor), Rafi Ahmed, Antônio Albano, David Beech, José Blakeley, Panos Chrysanthis, Suzanne Dietrich, Vic
Ghorpa-dey, Goets Graefe, Eric Hanson, Junguk L. Kim, Roger King, Vram Kouramajian, Vijay Kumar, John Lowther, Sanjay Manchanda, Toshimi
Minoura, Inderpal Mumick, Ed Omiecinski, Girish Pathak, Raghu Ramakrishnan, Ed Robertson, Eu-gene Sheng, David Stotts, Marianne Winslett, e Stan
Zdonick. Agradecemos às pessoas que contribuíram para a terceira edição: nossos editores na Addison-Wesley, Maite Suarez-Rivas, Katherine Harutunian,
e Bob Woodbury, e os seguintes colegas que contribuíram ou revisaram parcial ou totalmente a terceira edição: Suzanne Dietrich, Ed Omiecinski, Rafi
Ahmed, Fran-cois Bancilhon, José Blakeley, Rick Cattell, Ann Chervenak, David W. Embley, Henry A. Etlinger, Leonidas Fegaras, Dan
XI
Forsyth, Farshad Fõtouhi, Michael Franklin, Sreejith Gopinath, Goetz Craefe, Richard HuU,
Sushil Jajodia, Ramesh K. Kar-ne, Harish Kotbagi, Vijay Kumar, Tarcisio Lima, Ramon A.
Mata-Toledo, Jack McCaw, Dennis McLeod, Rokia Missaoui, Magdi Morsi, M.
Narayanaswamy, Carlos Ordonez, Joan Peckham, Betty Salzberg, Ming-Chien Shan, Junping
Sun, Rajs-hekhar Sunderraman, Aravindan Veerasamy e Emilia E. Villareal. Por último, mas nem por isso menos importante, somos muito gratos ao apoio, ao
encorajamento e à paciência de nossos familiares.
1 INTRODUÇÃO À
MODELAGEM
CONCEITUAL
2
2
1 Banco de Dados e os Usuários de
Banco de Dados
Os bancos de dados e os sistemas de bancos de dados se tornaram componentes essenciais no cotidiano da sociedade moderna. No decorrer do dia, a
maioria de nós se depara com atividades que envolvem alguma interação com os bancos de dados. Por exemplo, se formos ao banco para efetuarmos um
depósito ou retirar dinheiro, se fizermos reservas em um hotel ou para a compra de passagens aéreas, se acessarmos o catálogo de uma biblioteca
informatizada para consultar uma bibliografia, ou se comprarmos produtos — como livros, brinquedos ou computadores — de um fornecedor por
intermédio de sua página Web, muito provavelmente essas atividades envolverão uma pessoa ou um programa de computador que acessará um banco de da-
dos. Até mesmo os produtos adquiridos em supermercados, em muitos casos, atualmente, incluem uma atualização automática do banco de dados que
mantém o controle do estoque disponível nesses estabelecimentos. Essas interações são exemplos do que podemos denominar aplicações tradicionais de banco de dados, no qual a maioria das informações que são
armazenadas e acessadas apresenta-se em formatos textual ou numérico. Nos últimos anos, os avanços tecnológicos geraram aplicações inovadoras e
interessantes dos sistemas de banco de dados. Os bancos de dados de multimídia podem, agora, armazenar figuras, videoclipes e mensagens sonoras. Os sistemas de informações geográficas
(geographic information systems — GIS) são capazes de armazenar e analisar mapas, dados do tempo e imagens de satélite. Os data warehouses e os
online analytical processing (OLAP) — processamento analítico on-line — são utilizados em muitas empresas para extrair e analisar as informações úteis
dos bancos de dados para a tomada de decisões. A tecnologia de bancos de dados ativos (active database technology) e real time (tempo real) são usados no controle de processos industriais e de
produção (indústria). As técnicas de pesquisa em banco de dados estão sendo aplicadas na World Wide Web para aprimorar a recuperação de informações
necessárias pelos usuários da Internet. Entretanto, para entendermos os fundamentos da tecnologia de banco de dados, devemos começar pelas aplicações tradicionais de bancos de dados.
Sendo assim, na Seção 1.1 deste capítulo, definimos o que é um banco de dados e conceituamos alguns termos básicos. Na Seção 1.2 apresentamos um
banco de dados como exemplo, uma UNIVERSIDADE, para ilustrar nossa discussão. Em seguida, na Seção 1.3, descrevemos algumas características
principais dos sistemas de banco de dados, e nas seções 1.4 e 1.5 categorizamos os tipos de pessoas cujas profissões envolvem o uso e a interação com os
sistemas de banco de dados. Nas seções 1.6, 1.7 e 1.8 discutiremos as diversas capacidades de um sistema de banco de dados e algumas aplicações típicas.
A Seção 1.9 resume todo o capítulo. O leitor que optar por uma rápida introdução aos sistemas de banco de dados pode estudar as seções 1.1 a 1.5, depois, pode saltar ou folhear as
seções 1.6 até 1.8 e iniciar o Capítulo 2.
Nossa opção foi priorizar, sempre, o termo mais comumente utilizado nas áreas de ensino e pesquisa de banco de dados. Este termo é geralmente empregado em inglês, optamos por essa forma no texto traduzido. Entretanto, muitas vezes traduziremos também o termo para melhor compreensão daqueles que não estão familiarizados com tal terminologia. (N. de T.)
3
3
4 Capítulo 1 Banco de Dados e os Usuários de Banco de Dados
1.1 Introdução Os bancos de dados e a sua tecnologia estão provocando um grande impacto no crescimento do uso de computadores. É viável afirmar que eles representam
um papel crítico em quase todas as áreas em que os computadores são utilizados, incluindo negócios, comércio eletrônico, engenharia, medicina, direito,
educação e as ciências da informação, para citar apenas algumas delas. A palavra banco de dados é tão comumente utilizada que, primeiro, devemos defini-
la. Nossa definição inicial é bastante genérica. Um banco de dados é uma coleção de dados relacionados. Os dados são fatos que podem ser gravados e que possuem um significado implícito. Por
exemplo, considere nomes, números telefônicos e endereços de pessoas que você conhece. Esses dados podem ter sido escritos em uma agenda de telefones
ou armazenados em um computador, por meio de programas como o Microsoft Access ou Excel. Essas informações são uma coleção de dados com um
significado implícito, conseqüentemente, um banco de dados. A definição de banco de dados, mencionada anteriormente, é muito genérica. Por exemplo, podemos considerar o conjunto de palavras que formam
esta página como dados relacionados, portanto, constituindo um banco de dados. No entanto, o uso do termo banco de dados é geralmente mais restrito.
Possui as seguintes propriedades implícitas:
• Um banco de dados representa alguns aspectos do mundo real, sendo chamado, às vezes, de minimundo ou de universo de discurso (UoD). As
mudanças no minimundo são refletidas em um banco de dados.
• Um banco de dados é uma coleção lógica e coerente de dados com algum significado inerente. Uma organização de dados ao acaso (randômica)
não pode ser corretamente interpretada como um banco de dados.
• Um banco de dados é projetado, construído e povoado por dados, atendendo a uma proposta específica. Possui um grupo de usuários definido e
algumas aplicações preconcebidas, de acordo com o interesse desse grupo de usuários.
Em outras palavras, um banco de dados possui algumas fontes das quais os dados são derivados, alguns níveis de interação com os eventos do
mundo real e um público efetivamente interessado em seus conteúdos. Um banco de dados pode ser de qualquer tamanho e de complexidade variável. Por exemplo, a lista de nomes e endereços, citada anteriormente,
pode possuir apenas poucas centenas de registros, cada um com uma estrutura simples. Porém, o catálogo computadorizado de uma grande biblioteca pode
conter meio milhão de entradas organizadas em diferentes categorias — pelo sobrenome principal do autor, pelo assunto, pelo título —, sendo cada
categoria organizada em ordem alfabética. Um banco de dados muito maior e mais complexo é mantido pelo Internal Revenue Service (IRS), órgão
responsável pelo controle dos formulários de impostos preenchidos pelos contribuintes dos Estados Unidos. Se pressupomos que existam cem milhões de
contribuintes e cada um deles preenche em média cinco formulários com aproximadamente 400 caracteres de informações por formulário, teríamos um
banco de dados de 100 x 10° x 400 x 5 caracteres (bytes) de informação. Se o IRS mantiver os últimos três formulários para cada contribuinte teremos, além
do atual, um banco de dados de 8 x 100 bytes (800 gigabytes). Essa imensa quantidade de informação deve ser organizada e gerenciada para que os usuários
possam pesquisar, recuperar e atualizar os dados necessários. Um banco de dados pode ser gerado e mantido manualmente ou pode ser automatizado (computadorizado). Por exemplo, um catálogo de cartões
bibliotecários é um banco de dados que oferece a possibilidade de ser criado e mantido manualmente. Um banco de dados computadorizado pode ser criado
e mantido tanto por um grupo de aplicativos escritos especialmente para essa tarefa como por um sistema gerenciador de banco de dados. É claro que, neste
livro, o objetivo é abordar os bancos de dados computadorizados. Um sistema gerenciador de banco de dados (SGBD) é uma coleção de programas que permite aos usuários criar e manter um banco de dados. O
SGBD é, portanto, um sistema de software de propósito geral que facilita os processos de definição, construção, manipulação e compartilhamento de
bancos de dados entre vários usuários e aplicações. A definição de um banco de dados implica especificar os tipos de dados, as estruturas e as restrições
para os dados a serem armazenados em um banco de dados. A construção de um banco de dados é o processo de armazenar os dados em alguma mídia apropriada controlada pelo SGBD. A manipulação
inclui algumas funções, como pesquisas em banco de dados para recuperar um dado específico, atualização do banco para refletir as mudanças no
minimundo e gerar os relatórios dos dados. O compartilhamento permite aos múltiplos usuários e programas acessar, de forma concorrente, o banco de
dados. Outras funções importantes do SGBD são a proteção e a manutenção do banco de dados por longos períodos. A proteção inclui a proteção do
sistema contra o mau funcionamento ou falhas (crashes) no hardware ou software, e segurança contra acessos
1 Usaremos a palavra dados (data, em inglês) tanto para o singular como para o plural, como é usual na literatura; o contexto determinará a interpretação. No inglês formal, o
termo dados é utilizado para o plural, e datum, para o singular.
4
4
1.2 Um Exemplo 5
não autorizados ou maliciosos. Um banco de dados típico pode ter um ciclo de vida de muitos anos, então, os SGBD devem ser capazes de manter um
sistema de banco de dados que permita a evolução dos requisitos que se alteram ao longo do tempo. Não é necessário usar os softwares SGBD típicos para implementar um banco de dados computadorizado. Poderíamos escrever nosso próprio
conjunto de programas para criar e manter um banco de dados criando, de fato, nosso próprio SGBD com uma finalidade específica. Nesses casos — se
usarmos um SGBD de propósito geral ou não —, normalmente teremos de desenvolver uma quantidade considerável de softwares complexos. Na verdade, a
maioria dos SGBD é composta por sistemas muito complexos. Para completar nossa definição inicial chamaremos o banco de dados e o software SGBD, juntos, de sistema de banco de dados. A Figura 1.1
ilustra alguns dos conceitos discutidos.
1.2 UM EXEMPLO Considerando um exemplo simples com o qual a maioria dos leitores está muito familiarizada: um banco de dados de uma UNIVERSIDADE, no qual são
mantidas as informações do meio acadêmico, como alunos, cursos e notas. A Figura 1.2 mostra a estrutura do banco de dados e fornece uma pequena
amostra dos dados desse banco. O banco é organizado em cinco arquivos, cada um armazena os registros de dados do mesmo tipo. O arquivo ALUNO
conserva os dados de cada estudante, o CURSO preserva os dados sobre cada curso, o arquivo DISCIPLINA guarda os dados de cada disciplina do curso.
Continuando, o arquivo HISTORICO_ESCOLAR mantém as notas recebidas por aluno nas diversas disciplinas cursadas e, finalmente, o arquivo
PRE_REQUISITO armazena os pré-requisitos de cada curso. Para definir esse banco de dados devemos especificar a estrutura de cada registro em cada arquivo, considerando-se os diferentes tipos de elementos
dos dados a serem armazenados em cada registro. Na Figura 1.2, cada registro ALUNO inclui os dados que representam o NomedoEstudante,
NumerodoAluno, Turma (calouro ou 1, veterano ou 2...) e Curso Habilitação (matemática ou mat, ciência da computação ou CC...); cada registro CURSO
apresenta dados como NomedoCurso, NumerodoCurso, Créditos e Departamento (que oferece o curso) etc. Precisamos ainda especificar os tipos de dados
para cada elemento de dados em um registro. Por exemplo, podemos especificar que nome em ALUNO é uma string (cadeia) de caracteres alfabéticos, nú-
mero do aluno em ALUNO é um inteiro (integer) e o HISTORICO_ESCOLAR é um caractere único do conjunto {A, B, C, D, F, I}. Podemos
Usuários/Programadores
DE BANCO ] 1 Programas de Aplicações /Consultas {Queries) SOFTWARE SGBD \ 1 Programa para Processamento de Consultas/Programas
1 Software para Acesso aos Dados Armazenados
/ V Definição dos Dados Armazenados (metadados)
Banco de Dados Armazenados
FIGURA 1.1 Configuração de um sistema de banco de dados simplificado.
2 Usamos, aqui, o termo arquivo informalmente. No nível conceitual, arquivo é uma coleção de registros que podem ou não estar ordenados.
DE DADOS
5
5
6 Capítulo 1 Banco de Dados e os Usuários de Banco de Dados
usar ainda um esquema de código para representar os valores de um determinado dado. Por exemplo, na Figura 1.2, representamos a turma do ALUNO por
1 para os calouros; 2 para os veteranos; 3 para os que cursam o penúltimo ano; 4 para aqueles do último ano; e 5 para os alunos graduados. Para construir o banco de dados UNIVERSIDADE armazenamos os dados que representem cada aluno, curso, disciplina, relatório de notas e pré-
requisitos, bem como cada registro no arquivo apropriado. Pode-se perceber que os registros de diferentes arquivos podem estar relacionados. Por exemplo,
o registro para "Smith" no arquivo ALUNO está relacionado a dois registros no arquivo HISTORICO_ESCOLAR, cuja função é especificar as notas de Smith
em duas disciplinas. Por similaridade, cada registro, no arquivo PRE_REQUISITO, está relacionado a dois registros em curso: um representando o curso e o
outro, o pré-requisito. A maioria dos bancos de dados médios e grandes inclui muitos tipos de registros e tem muitos relacionamentos entre os registros. A manipulação do banco de dados envolve uma consulta (query) e atualização. Os exemplos de consulta são: a 'recuperação do histórico escolar —
lista de todos os cursos e notas — de Smith', a 'relação dos nomes dos alunos que fizeram as disciplinas do curso de banco de dados oferecido no segundo
semestre de 1999 e suas notas naquelas disciplinas' e 'quais os pré-requisitos do curso de banco de dados?' Os exemplos de atualização são: 'mudar a turma
de Smith para veteranos', 'criar uma nova disciplina para o curso de banco de dados neste semestre' e 'colocar a nota A para Smith na disciplina banco de
dados do último semestre'. Essas consultas informais e atualizações devem ser especificadas, precisamente, na linguagem de consulta (query language) do
SGBD, antes de serem processadas.
ALUNO Nome Numero Turma Curso_Hab
Smith 17 1 CC Brown 8 2 CC
NomedoCurso NumerodoCurso Créditos Departamento Introdução à Ciência da Computação CC1310 4 CC Estruturas de dados CC3320 4 CC Matemática Discreta MAT2410 3 MATH Banco de dados CC3380 3 CC
DISCIPLINA IdentificadordeDisciplina NumerodoCurso Semestre Ano Instrutor
85 MAT2410 Segundo Semestre 98 Kihg 92 CC1310 Segundo Semestre 98 Anderson 102 CC3320 Primeiro Semestre 99 Knuth
112 MAT2410 Segundo Semestre 99 Chang 119 CC1310 Segundo Semestre 99 Anderson 135 CC3380 Segundo Semestre 99 Stone
HISTORICO„ESCOLAR NumerodoAluno Identificador/Disciplinas Nota
17 112 B 17 119 C
8 85 A 8 92 A
8 102 B 8 135 A
PRE_REQUISITO NumerodoCurso NumerodoPre_requisito
CC3380 CC3320 CC3380 MAT2410 CC3320 CC1310
FIGURA 1.2 Um banco de dados que armazena as informações de alunos e cursos.
6
6
1.3 Características do Emprego de Bancos de Dados
1.3 CARACTERÍSTICAS DO EMPREGO DE BANCOS DE DADOS Um número significativo de características distingue a abordagem que utiliza o banco de dados daquela tradicional que usa a programação e arquivos. No
tradicional processamento de arquivos, cada usuário define e implementa os arquivos necessários para uma aplicação específica, como parte da
programação da aplicação. Por exemplo, um usuário, a secretaria de notas, pode manter um arquivo para os alunos e suas notas. Os programas para
imprimir um histórico do aluno e colocar novas notas no arquivo são implementados como parte da aplicação. Um segundo usuário, o departamento de
contabilidade, pode controlar os dados relacionados às mensalidades e pagamentos dos alunos. Apesar de ambos os usuários estarem interessados nos dados
sobre os estudantes, cada um mantém suas informações em arquivos separados — e os programas que manipulam esses arquivos — porque cada um deles
precisa de alguns dados não disponíveis nos arquivos do outro. Essas redundâncias, na definição e armazenamento dos dados, resultam em um espaço de
armazenamento desperdiçado e em esforços redundantes para manter os dados comuns atualizados. Na abordagem utilizando um banco de dados, um único repositório de dados é definido uma única vez, mantido e então acessado por vários usuários.
As principais características da abordagem de um banco de dados versus a abordagem de processamento de arquivos são as seguintes:
• Natureza autodescritiva do sistema de banco de dados.
• Isolamento entre os programas e os dados, e a abstração dos dados.
• Suporte para as múltiplas visões dos dados.
• Compartilhamento de dados e processamento de transações de multiusuários.
Descreveremos, a seguir, cada característica em seções separadas. As características adicionais dos sistemas de banco de dados serão discutidas nas
seções 1.6 a 1.8.
1.3.1 Natureza Autodescritiva do Sistema de Banco de Dados
Uma característica fundamental da abordagem de um banco de dados é que o sistema de banco de dados possui não apenas o banco de dados, mas também
uma completa definição ou descrição da estrutura desse banco de dados e suas restrições. Essa definição está armazenada no catálogo do SGBD, que
contém informações como a estrutura de cada arquivo, o tipo e o formato de armazenamento de cada item de dado e várias restrições sobre os dados. A
informação armazenada no catálogo é chamada metadados e descreve a estrutura do banco de dados primário (Figura 1.1). O catálogo é usado tanto pelo software SGBD como pelos usuários do banco de dados que precisam de informações sobre a estrutura desse banco.
Um pacote de software SGBD de propósito geral não está escrito para uma aplicação específica, portanto, será necessário acessar o catálogo para conhecer a
estrutura dos arquivos no banco de dados, como o tipo e o formato dos dados que o programa vai acessar. O SGBD precisa trabalhar bem com qualquer
número de aplicações — por exemplo, um banco de dados de uma universidade, de um banco ou de uma empresa —, desde que a definição do banco de
dados esteja armazenada no catálogo. No processamento tradicional de arquivos, a definição dos dados faz parte dos próprios programas da aplicação. Em conseqüência disso, esses
programas são restritos a trabalhar com um único banco de dados específico, cuja estrutura esteja declarada no programa da aplicação. Por exemplo, um
software de uma aplicação escrito em C++ pode ter a struct ou a declaração de classes, e um programa em COBOL tem comandos na Data Division para
definir seus arquivos. Porém, o programa de processamento de arquivos possibilita o acesso a um único banco de dados específico, enquanto o SGBD pode
acessar diversos bancos de dados, extraindo as definições de banco de dados do catálogo e usando-as depois. No exemplo mostrado na Figura 1.2, o catálogo do SGBD armazenará as definições de todos os arquivos mostrados. Elas são especificadas pelo
projetista antes de criar o banco de dados real e armazenadas no catálogo. Todas as vezes que um pedido for feito para acessar, digamos, o registro Nome de
um ALUNO, o SGBD se referirá ao catálogo para determinar a estrutura do arquivo ALUNO e a posição e tamanho do item de dado Nome dentro do registro
ALUNO. Em contraste, em uma aplicação típica de processamento de arquivos, a estrutura do arquivo e a localização exata, no caso extremo, de Nome
dentro do registro ALUNO, já estão codificadas em cada programa que acessa esses itens de dados.
1.3.2 Isolamento entre os Programas e Dados e Abstração de Dados
No processamento tradicional de arquivos, a estrutura do arquivo de dados está embutida no programa da aplicação, sendo assim, qualquer mudança na
estrutura de um arquivo pode exigir alterações de todos os programas que acessam esse arquivo. Ao
7
7
8 Capítulo 1 Banco de Dados e os Usuários de Banco de Dados
contrário, os programas para acesso ao SGBD não exigem essas alterações na maioria dos casos. A estrutura dos arquivos de dados é armazenada no
catálogo do SGDB separadamente do programa de acesso. Denominaremos essa propriedade independência programa-dados. Por exemplo, o programa de acesso a arquivos pode ser escrito de forma que acesse, apenas, os registros ALUNO da estrutura apresentada na Figura
1.3. Se quisermos adicionar outro dado ao registro de cada ALUNO, digamos, sua DatadeNascimento, esse programa não vai trabalhar por muito tempo e
precisará ser alterado. Ao contrário, em um ambiente SGBD, necessitamos alterar apenas a descrição do registro ALUNO no catálogo para refletir a inclusão
do novo item de dados DatadeNascimento; nenhum programa será modificado. A próxima vez que um programa SGBD acessar o catálogo, a nova estrutura
do registro ALUNO será acessada e utilizada.
Nome do Item de Dado Posição Inicial no Registro Tamanho em Caracteres (bytes) Nome 1 30 NumerodoAluno 31 4 Turma 35 4 Curso_Hab 39 4
FIGURA 1.3 Formato de armazenamento interno para um registro ALUNO.
Em alguns tipos de sistemas de banco de dados, como o orientado a objeto e o objeto-relacional (capítulos 20 a 22), os usuários podem estabelecer as
operações sobre os dados como parte das definições de dados. Uma operação (também chamada função ou método) é especificada em duas partes. A
interface (ou assinatura) de uma operação inclui o nome da operação e os tipos de dados de seus argumentos (ou parâmetros). A implementação (ou
método) de uma operação é definida separadamente e pode ser alterada sem afetar a interface. Os programas de usuários da aplicação podem operar nos
dados invocando essas operações por meio de seus nomes e argumentos, sem considerar como essas operações são implementadas. Isso pode ser chamado
de independência programa-operação. A característica que permite a independência programa-dados e programa-operação é intitulada abstração de dados. Um SGBD oferece aos
usuários uma representação conceitual de dados que não inclui muitos detalhes sobre como o dado é armazenado ou como as operações são
implementadas. Informalmente, o modelo de dados é um tipo de abstração de dados usado para prover essa representação conceitual. O modelo de dados
utiliza os conceitos lógicos, como objetos, suas propriedades e seus inter-relacionamentos, que podem ser mais fáceis para os usuários entenderem os
conceitos de armazenamento computacionais. Conseqüentemente, o modelo de dados esconde os detalhes de armazenamento e da implementação,
desinteressantes para a maioria dos usuários de banco de dados. Por exemplo, vamos considerar novamente a Figura 1.2. A implementação interna do arquivo pode ser definida pelo comprimento de seus registros
—, o número de caracteres (bytes) em cada registro —, e cada item de dado pode ser especificado pelo seu byte inicial dentro de um registro e seu
comprimento em bytes. O registro ALUNO poderia, em razão disso, ser representado como exposto na Figura 1.3. No entanto, um usuário típico de banco de
dados não está preocupado com a localização de cada item de dados dentro de um registro ou com o seu comprimento; na realidade, sua preocupação é que
quando for acessado o Nome do ALUNO, O valor correto seja retornado. Uma representação conceitual dos registros ALUNO é mostrada na Figura 1.2.
Muitos outros detalhes da organização do armazenamento de dados, como os caminhos de acesso especificados em um arquivo, podem ser escondidos dos
usuários de banco de dados pelo SGBD — discutiremos os detalhes do armazenamento nos capítulos 13 e 14. Na abordagem de banco de dados, a estrutura detalhada e a organização de cada arquivo são armazenadas no catálogo. Os usuários de banco de
dados e os programas de aplicação referem-se à representação conceitual dos arquivos, e o SGBD extrai os detalhes do armazenamento de arquivos do
catálogo, quando são necessários, pelos módulos de acesso a arquivos do SGBD. Muitos modelos de dados podem ser utilizados para prover essa abstração
dos dados aos usuários do banco. A maior parte deste livro é dedicada à apresentação dos vários modelos de dados e os conceitos que estes utilizam para
abstrair a representação dos dados. Nos bancos de dados orientados a objeto e a objeto-relacional, o processo de abstração não inclui apenas a estrutura de dados, mas também as
operações sobre os dados. Essas operações oferecem uma abstração das atividades do minimundo facilmente entendidas pelos usuários. Por exemplo, uma operação de CALCULO_GPA pode ser aplicada ao objeto ALUNO para calcular a média de pontos nas notas. Essas operações
podem ser invocadas pela consulta do usuário ou pelos programas de aplicação sem ter de se saber os detalhes de como as operações são implementadas.
Nesse sentido, uma abstração de uma atividade de um minimundo está disponível para o usuário como uma operação abstrata.
1.3 Características do Emprego de Bancos de Dados
1.3.3 Suporte para as Múltiplas Visões dos Dados
8
8
Um banco de dados típico tem muitos usuários, e cada qual pode solicitar diferentes perspectivas ou visões do banco de dados. Uma visão pode ser um
subconjunto de um banco de dados ou conter uma visão virtual dos dados, derivados dos arquivos do banco de dados, mas não, explicitamente,
armazenados. Alguns usuários podem não saber se os dados a que eles se referem são armazenados ou derivados. Um SGBD multiusuários, cujos usuários têm várias aplicações distintas, deve proporcionar facilidades para a definição de múltiplas visões. Por
exemplo, um usuário do banco de dados da Figura 1.2 pode estar interessado somente em acessar e imprimir o histórico de cada aluno; a visão para esse
usuário é mostrada na Figura 1.4a. Um segundo usuário, interessado em checar se os alunos cumpriram todos os pré-requisitos de cada curso para o qual se
matricularam, pode utilizar a visão apresentada na Figura 1.4b.
Histórico Escolar do Aluno HISTORICO_ESCOLAR NomedoAluno NumerodoCurso Nota Semestre Ano IdDisciplina
CC1310 C Outono 99 119
Smith MAT2410 B Outono 99 112
MAT2410 A Outono 98 85 CC1310 A Outono 98 92 CC3320 B Primavera 99 102
Brown
CC3380 A Outono 99 135
PRE.REQUISITOS NomedoCurso NumerodoCurso Pre_Requisitos
CC3320
Banco de Dados CC3380 MAT2410
Estruturas de Dados CC3320 CC1310
FIGURA 1.4 Duas visões derivadas de um banco de dados da Figura 1.2. (a) Visão do HISTÓRICO ESCOLAR DO ALUNO, (b) Visão dos PRÉ-REQUISITOS DO CURSO.
1.3.4 Compartilhamento de Dados e o Processamento de Transação Multiusuários
Um SGBD multiusuário, como o nome implica, deve permitir que diversos usuários acessem o banco de dados ao mesmo tempo. Isso é essencial se os
dados para as várias aplicações estão integrados e mantidos em um único banco de dados. O SGBD deve incluir um software de controle de concorrência
para garantir que muitos usuários, ao tentar atualizar o mesmo dado, o façam de um modo controlado, para assegurar que os resultados das atualizações
sejam corretos. Por exemplo, quando muitos atendentes tentam reservar um lugar em um vôo, o SGBD deve garantir que cada assento possa ser acessado
somente por um atendente de cada vez, para fazer a reserva de apenas um passageiro. Esses tipos de aplicações são, normalmente, denominados aplicações
de processamento de transações on-line — online transaction processing (OLTP). Uma regra fundamental do software do SGBD multiusuário é garantir que
as transações concorrentes operem corretamente. O conceito de transação tornou-se fundamental para muitas aplicações de banco de dados. Uma transação é um programa em execução ou processo
que inclui um ou mais acessos ao banco de dados, como a leitura ou a atualização de registros. Cada transação deve executar um acesso logicamente correto
ao banco de dados, se executado sem a interferência de outras transações. O SGBD deve garantir várias propriedades da transação. A propriedade de
isolamento garante que cada transação possa ser efetuada de forma isolada de outras transações; mesmo centenas de transações podem ser executadas
simultaneamente. A propriedade de atomicidade garante que todas as operações em um banco de dados, em uma transação, sejam executadas ou nenhuma
delas o seja. Discutiremos as transações em detalhes na Parte V do livro. As características precedentes são muito importantes para distinguir um SGBD de um software tradicional de processamento de arquivos. Na Seção
1.6 abordaremos as funcionalidades adicionais que caracterizam um SGBD. Primeiro, no entanto, categorizaremos os diferentes tipos de pessoas que
trabalham em um ambiente de sistema de banco de dados.
9
9
1 O Capítulo 1 Banco de Dados e os Usuários de Banco de Dados
1.4 ATORES NO PALCO Para um pequeno banco de dados pessoal, como a agenda de endereços discutida na Seção 1.1, uma pessoa em geral define, constrói e manipula um banco
de dados — não há compartilhamento. No entanto, muitas pessoas estão envolvidas no projeto, uso e manutenção de um grande banco de dados com
centenas de usuários. Nesta seção, identificaremos as pessoas cujas profissões envolvem o dia-a-dia do uso de um grande banco de dados; nós as
chamaremos de 'atores no palco'. Na Seção 1.5 consideraremos as pessoas que podem ser nomeadas 'trabalhadores dos bastidores', ou seja, aqueles que
trabalham para manter o ambiente dos sistemas de banco de dados, mas que não estão interessados no banco de dados de fato.
1.4.1 Administradores de Banco de Dados Em uma organização na qual muitas pessoas usam os mesmos recursos, há a necessidade de um administrador-chefe para gerenciar esses recursos. No
ambiente de banco de dados, o principal recurso é o próprio banco de dados e, a seguir, o SGBD e os softwares relacionados. Administrar esses recursos é
responsabilidade do administrador de banco de dados — database administrator (DBA). O DBA é o responsável pela autorização para o acesso ao
banco, pela coordenação e monitoração de seu uso e por adquirir recursos de software e hardware conforme necessário. O DBA é o responsável por
problemas como brechas de segurança ou tempo de resposta ruim do sistema. Em grandes organizações, o DBA possui suporte de assistentes que o auxiliam
no desempenho dessas funções.
1.4.2 Os Projetistas do Banco de Dados Os projetistas do banco de dados são responsáveis pela identificação dos dados que serão armazenados no banco e também por escolher as estruturas
apropriadas para representar e armazenar esses dados. Essas tarefas são, em sua maioria, realizadas antes que o banco de dados seja realmente
implementado e alimentado com os dados. Ainda é de responsabilidade desse profissional
comunicar-se antecipadamente com todos os prováveis usuários do banco para conhecer suas necessidades (requisitos) e criar projetos que as atendam. Em
alguns casos, os projetistas estão na equipe do DBA e podem executar outras tarefas, depois que o projeto do banco de dados estiver completo. Os projetistas de banco de dados normalmente interagem com os potenciais grupos de usuários e desenvolvem visões (views) do banco de dados que
atendam aos requisitos de dados e ao processamento desses grupos. Cada visão é, então, analisada e integrada às visões de outros grupos de usuários. O
projeto final do banco de dados deve ser capaz de suportar todos os requisitos de todos os grupos de usuários.
1.4.3 O Usuário Final Os usuários finais são pessoas cujas profissões requerem o acesso a um banco de dados para consultas, atualização e relatórios; o banco de dados existe
prioritariamente para os seus usuários. Há várias categorias de usuários finais:
• Usuários finais casuais: acionam o banco de dados ocasionalmente, mas precisam de informações diferentes a cada acesso. Eles usam uma
linguagem de consulta a banco de dados sofisticada para especificar suas solicitações e normalmente são gerentes de nível médio ou elevado ou
outros profissionais com necessidades ocasionais.
• Iniciantes ou usuários finais parametrizáveis: compõem uma grande parcela dos usuários finais de banco de dados. Seu trabalho exige
constante envolvimento com consulta e atualização de um banco de dados, usando tipos de consulta e atualizações padronizadas — chamadas
transações enlatadas — que tenham sido cuidadosamente programadas e testadas. As tarefas que esses usuários desempenham são variadas:
• Os caixas de banco checam os saldos das contas e informam as retiradas e os depósitos.
• Os funcionários responsáveis pela reserva de vôos, hotéis e locação de carros checam a viabilidade para atender às solicitações de reservas e as
confirmam.
• Os funcionários em agências de correio informam as identificações de pacotes por códigos de barra e informações descritivas para atualizar
um banco de dados central de pacotes recebidos e em trânsito.
• Usuários finais sofisticados: incluem os engenheiros, cientistas, analistas de negócios e outros que se familiarizam
com as facilidades do SGBD para implementar aplicações que atendam às suas solicitações complexas.
Em português, o termo mais comum são transações customizadas. (N. de T.).
10
10
1.5 Trabalhadores dos Bastidores
• Usuários autônomos (stand-alone): mantêm um banco de dados pessoal por meio do uso de pacotes de programas
prontos que possuem interfaces gráficas ou programas baseados em menus fáceis de usar. Um exemplo disso é o usuário de um pacote para
cálculo de impostos que armazena seus dados financeiros pessoais para o pagamento dos impostos.
Um SGBD típico provê múltiplas facilidades de acesso ao banco de dados. Os usuários iniciantes precisam aprender muito pouco sobre as
facilidades oferecidas pelo SGBD; eles têm de entender somente as interfaces das transações-padrão projetadas e implementadas para seu uso. Os usuários
casuais aprendem apenas as poucas facilidades que utilizam repetidamente. Os usuários sofisticados tentam aprender a maioria das funcionalidades do
SGBD com o objetivo de executar suas necessidades complexas. Os autônomos se tornam muito proficientes no uso de pacotes de softwares específicos.
1.4.4 Analistas de Sistemas e Programadores de Aplicações (Engenheiros de Software)
Os analistas de sistemas determinam as solicitações dos usuários finais, especialmente os usuários finais iniciantes e os parametrizáveis, além de
desenvolver as especificações das transações customizadas que atendam a essas solicitações. Os programadores de aplicações implementam essas
especificações como programas, então eles testam, documentam e mantêm essas transações customizadas. Esses analistas e programadores — também
conhecidos como engenheiros de software — precisam estar familiarizados com toda a gama de capacidades oferecidas pelo SGBD para realizar suas
tarefas.
1.5 TRABALHADORES DOS BASTIDORES Em adição àquelas pessoas que projetam, usam e administram um banco de dados, outras estão associadas ao projeto, desenvolvimento e operação do
programa e ambiente do sistema do SGBD. Essas pessoas não têm interesse no banco de dados; são os chamados 'trabalhadores dos bastidores' e incluem as
seguintes categorias:
• Projetistas e implementadores de sistemas SGBD: são pessoas que projetam e implementam os módulos e interfaces do SGBD, como um
pacote. Um SGBD é um sistema com programas complexos com muitos componentes ou módulos, incluindo aqueles para implementar o
catálogo, processamento de linguagem de consulta (query language), interfaces, acesso e armazenamento temporário (buffering) dos dados,
controle de concorrência, manuseio de recuperação de dados e segurança. O SGBD deve interagir com outros sistemas, tais como o sistema
operacional e compiladores de diferentes linguagens de programação.
• Desenvolvedores de ferramentas: são pessoas que projetam e implementam as ferramentas — os pacotes de programas que facilitam o projeto
e uso de um sistema de banco de dados e que ajudam a aprimorar seu desempenho. Essas ferramentas estão em um pacote opcional, adquirido
separadamente. Incluem pacotes para projetos de banco de dados, monitoramento de desempenho, interface gráfica ou linguagem natural,
protótipo, simulação e geração de dados para teste. Na maioria dos casos, os vendedores de software independentes desenvolvem e negociam
essas ferramentas.
• Pessoal de manutenção e operadores: são pessoas da administração do sistema, responsáveis pela execução e manutenção do ambiente de
hardware e software do sistema de banco de dados.
Embora esses trabalhadores sejam fundamentais para tornar os sistemas de banco de dados disponíveis para os usuários finais, eles normalmente não
usam o banco de dados para fins pessoais.
1.6 VANTAGENS DA UTILIZAÇÃO DA ABORDAGEM SGBD Nesta seção, discutiremos as vantagens da utilização e as funcionalidades que um bom SGBD deve possuir. Elas vão além das quatro características
principais abordadas na Seção 1.3. O DBA deve usar essas capacidades para atingir os objetivos relacionados ao projeto, administração e uso de um grande
banco de dados multiusuário.
1.6.1 Controle de Redundância
No desenvolvimento tradicional de software utilizando processamento de arquivos, cada usuário mantém seus próprios arquivos para suas aplicações de
processamento de dados. Consideremos, por exemplo, o banco de dados UNIVERSIDADE, mencionado na Seção 1.2; aqui, os dois grupos de usuários são
os da secretaria do curso e os da contabilidade. Na abordagem tradicional, cada grupo mantém seus arquivos de alunos de maneira independente. A
contabilidade também guarda os dados de matrícula e as informações relacionadas a pagamentos, enquanto a secretaria mantém o controle dos cursos e
notas dos
11
11
Capítulo 1 Banco de Dados e os Usuários de Banco de Dados 12 alunos. Muitos dos dados são armazenados duas vezes: uma vez no arquivo de cada grupo. Outros grupos de usuários podem duplicar alguns ou todos os dados novamente em seus próprios arquivos.
Essa redundância em armazenar os mesmos dados várias vezes gera muitos problemas. Primeiro, há a necessidade de desempenhar uma única
atualização lógica — como a entrada de dados de novos alunos — várias vezes: uma para cada arquivo no qual o dado do aluno estará armazenado. Isso
gera uma duplicação de esforços. Segundo, o espaço de armazenamento é desperdiçado quando o mesmo dado é armazenado repetidamente; esse problema
pode ser sério para os bancos de dados grandes. Terceiro, há a possibilidade de os arquivos que representam os mesmos dados se tornarem inconsistentes.
Isso pode ocorrer porque uma atualização é aplicada somente a alguns arquivos, mas não em outros. Até mesmo se uma atualização — como a adição de
novos alunos — fosse aplicada a todos os arquivos apropriados, os dados dos alunos poderiam, ainda, se tornar inconsistentes, porque as atualizações são
realizadas independentemente por grupo de usuários. Por exemplo, um grupo de usuários insere a data de nascimento de um aluno incorretamente, como 19-
JAN-1984, enquanto outro grupo de usuários pode entrar com a informação correta: 29-JAN-1984. Na abordagem de banco de dados, as visões de diferentes grupos de usuários são integradas durante o projeto do banco. Idealmente, devemos ter um
projeto do banco para armazenar cada item lógico do dado — como o nome do aluno ou a data de nascimento — em um único lugar no banco de dados.
Isso vai garantir a consistência e economizar espaço de armazenamento. Entretanto, na prática, algumas vezes é necessário o uso de redundância
controlada para melhorar a performance das consultas. Por exemplo, podemos armazenar NomedoAluno e o NumerodoCurso, redundantemente, em um
arquivo de HISTORICOESCOLAR (Figura 1.5a), pois quando consultamos um registro HISTORICO_ESCOLAR, queremos o nome do aluno e o número do
curso, como também a nota, o número do aluno e o identificador de disciplina. Colocando todos os dados juntos, não temos de pesquisar múltiplos arquivos
para coletá-los. Nesse caso, o SGBD deve ter a capacidade de controlar essas redundâncias, impedindo as inconsistências entre os arquivos. Isso pode ser
feito automaticamente verificando se os valores de NomeDoAluno-NumeroDoAluno para qualquer registro HISTORICO_ESCOLAR na Figura 1.5a possuem
correspondentes para Nome-Numero DoAluno nos registros ALUNO (Figura 1.2). De maneira similar, os valores IdentificadorDisciplinas-NumeroDoCurso
em historico_escolar podem ser checados com os registros DISCIPLINA.
HISTORICCOESCOLAR NumerodoAluno NomedoAluno IdentificadordeDisciplina NumerodoCurso Nota
17 Smith 112 MAT2410 B 17 Smith 119 CC1310 C
8 Brown 85 MAT2410 A 8 Brown 92 CC1310 A 8 Brown 102 CC3320 B 8 Brown 135 CC3320 A
HISTORICO_ESCOLAR NumerodoAluno NomedoAluno IdentificadordeDisciplina NumerodoCurso Nota
17 Brown 112 MAT2410 B
FIGURA 1.5 Armazenamento redundante do NomedoAluno e NumerodoCurso no HISTÓRICO ISCOLAR. (a) Dados consistentes, (b) Registro inconsistente.
Alguns desses testes podem ser especificados para o SGBD durante o projeto do banco de dados e automaticamente forçados pelo SGBD, sempre que o
arquivo RELATORIO_DE_NOTAS for atualizado. A Figura 1.5b mostra o registro de RELATORIO_DE_NOTAS
inconsistente com o arquivo ALUNO da Figura 1.2, que pode ter sido inserido erroneamente se a redundância não for controlada.
1.6.2 Restringindo Acesso Não Autorizado Quando vários usuários utilizam um grande banco de dados, é provável que a maioria desses usuários não seja autorizada a acessar todas as informações
disponíveis no banco de dados. Por exemplo, os dados financeiros são geralmente considerados confidenciais e, por essa razão, somente pessoas com
permissão poderão ter acesso a eles. Além disso, a alguns usuários é permitido, apenas, consultar; outros podem consultar e atualizar os dados. Em
conseqüência disso, o tipo de operação de acesso — consulta ou atualização — também deve ser controlado. O mais comum é fornecer aos usuários ou
grupo de usuários contas protegidas por senhas, utilizadas para acessar o banco de dados. O SGBD deve garantir a segurança e um subsistema de au-
torização usado pelo DBA para criar contas
e definir as restrições de cada uma. O SGBD deve, então, garantir essas restrições automaticamente. Como se pode ver, podemos
aplicar os controles semelhantes para o próprio SGBD. Por exemplo, apenas ao
13
13
1.6 Vantagens da Utilização da Abordagem SGBD 13
assistente de DBA é permitido o uso de certos softwares privilegiados, como o utilizado para criar novas contas. Da mesma forma, os usuários
parametrizáveis podem ter permissão para acessar o banco de dados somente por meio de transações específicas, desenvolvidas para seu uso.
1.6.3 Garantindo o Armazenamento Persistente para Objetos Programas Os bancos de dados podem ser usados para oferecer um armazenamento persistente aos objetos programas e estruturas de dados. Essa é uma das
principais justificativas para os sistemas de banco de dados orientados a objeto. As linguagens de programação têm uma estrutura de dados complexa,
como os tipos de registro em Pascal ou as definições de classe em C++ ou Java. Os valores das variáveis dos programas são descartados, uma vez que o
programa termina sua execução, a não ser que o programador os armazene, explicitamente, em arquivos permanentes, os quais, normalmente, envolvem a
conversão de estruturas complexas em um formato adequado para o armazenamento em arquivos. Quando surge a necessidade de ler os dados mais uma
vez, o programador deve convertê-los do formato de arquivo para uma estrutura variável do programa. Os sistemas de banco de dados orientado a objeto
são compatíveis com as linguagens de programação como C++ e Java, e o software SGBD, automaticamente, executa qualquer conversão necessária.
Conseqüentemente, um objeto complexo em C++ pode ser armazenado permanentemente em um SGBD orientado a objeto. Esse objeto é conhecido como
persistente, desde que exista após o término de execução dos programas e possa, depois, ser acessado por outro programa em C+ + . O armazenamento persistente de programas e as estruturas de dados são uma importante função do sistema de banco de dados. Os sistemas
tradicionais de banco de dados geralmente possuem o chamado problema de separação por impedância, quando as estruturas de dados fornecidas pelo
SGBD são incompatíveis com as estruturas de dados da linguagem de programação. Os sistemas de banco de dados orientados a objeto oferecem estruturas
de dados compatíveis com uma ou mais linguagens de programação orientadas a objeto.
1.6.4 Garantindo o Armazenamento de Estruturas para o Processamento Eficiente de Consultas
Os sistemas de banco de dados devem fornecer funcionalidades para a execução de atualizações e consultas eficientemente. Pelo fato de o banco de dados
ser armazenado, tipicamente, em disco, o SGBD deve possuir estruturas de dados especializadas para aumentar a velocidade de pesquisa no disco dos
registros desejados. Os arquivos auxiliares, chamados indexes (indexados), são utilizados com esse objetivo. Os indexes são baseados em estruturas de
dados árvores (tree) ou estruturas de dados hash, adequadamente adaptados para a pesquisa em disco. Com o intuito de processar os registros necessários do
banco de dados para uma consulta particular, aqueles registros devem ser copiados do disco para a memória. Conseqüentemente, os SGBD em geral têm um
módulo de armazenamento temporário (buffering) que mantém partes do banco de dados armazenado na memória principal. Em outros casos, o SGBD
pode utilizar o sistema operacional para fazer o armazenamento temporário dos dados no disco. O módulo do SGBD para o processamento de consulta e otimização é responsável pela escolha eficiente do plano de execução da consulta (query)
baseado nas estruturas de armazenamento existentes. A opção de qual index criar e manter é parte do projeto físico do banco de dados e seu ajuste
(tunning), que é de responsabilidade do DBA e sua equipe.
1.6.5 Garantindo Backup e Restauração Um SGBD deve prover facilidades para a restauração de falhas de hardware ou de software. O subsistema de backup e recuperação dos subsistemas do
SGBD é responsável pela recuperação dessas falhas. Por exemplo, se um sistema de computador falhar no meio de uma transação complexa de atualização,
o subsistema de recuperação é responsável por garantir que o banco de dados seja recolocado no mesmo estado em que estava, antes do início da execução
da transação. Alternativamente, o subsistema pode assegurar que a transação seja resumida do ponto em que foi interrompida — sendo assim, seu efeito
completo seria armazenado no banco de dados.
1.6.6 Fornecendo Múltiplas Interfaces para os Usuários Como diversos tipos de usuários com níveis de conhecimento técnico diferentes utilizam o banco de dados, o SGBD deve fornecer interfaces diferentes para
esses usuários. Essas interfaces incluem linguagens de consulta para os usuários casuais; interfaces de linguagens de programação para programadores de
aplicações; formulários e seqüências de comandos para usuários
14
14
14 Capítulo 1 Banco de Dados e os Usuários de Banco de Dados
parametrizáveis; interfaces de menus, interfaces de linguagem natural para usuários autônomos. Ambas, as interfaces com menus e aquelas com
formulários, são comumente conhecidas como interfaces gráficas para os usuários — Graphical User Interfaces (GUIs). Muitos ambientes e linguagens
especializadas existem para a especificação de GUIs. As capacidades para gerar interfaces Web GUI para um banco de dados — ou capacitando um banco
de dados para a Web (Web-enabling) — também são muito comuns.
1.6.7 Representando Relacionamentos Complexos entre os Dados Um banco de dados pode incluir uma grande variedade de dados que estão inter-relacionados de muitas maneiras. Veja o exemplo mostrado na Figura 1.2.
O registro de Brown no arquivo ALUNO está relacionado com quatro registros no arquivo HISTORICO_ESCOLAR. De forma similar, cada registro
Disciplina está relacionado com um registro de cursos e ainda com os registros HISTORICO_ESCOLAR, um para cada aluno que completou uma
disciplina. O SGBD deve ter a capacidade de representar a variedade de relacionamentos complexos entre os dados, bem como recuperar e atualizar os
dados relacionados fácil e eficientemente.
1.6.8 Forçando as Restrições de Integridade A maioria das aplicações de um banco de dados tem certas restrições de integridade que devem complementar os dados. O SGBD deve prover
funcionalidades para a definição e a garantia dessas restrições. O tipo mais simples de restrição de integridade envolve a especificação de um tipo de dado
para cada item de dados. Por exemplo, na Figura 1.2, podemos especificar que o valor do item de dados Turma, em cada registro ALUNO, tem de ser um
inteiro entre 1 e 5, e o valor de Nome deve ser uma string (cadeia de caracteres) menor que 50 caracteres alfabéticos. Os tipos mais complexos de restrições
podem ocorrer, com freqüência, envolvendo a definição de que o registro em um arquivo deve estar relacionado aos registros de outros arquivos. Por
exemplo, na Figura 1.2, podemos especificar que 'todo registro de disciplina deve estar relacionado com um registro de Curso'. Outro tipo de restrição
especifica a singularidade no valor do item de dado, como 'todo registro de curso deve ter um único valor para NumerodoCurso'. Essas restrições são
derivadas do significado ou da semântica dos dados e do minimundo que representam. Os projetistas do banco de dados são responsáveis por identificar as
restrições de integridade durante o projeto do banco. Algumas restrições podem ser especificadas para o SGBD e executadas automaticamente. Outras
podem ser testadas pelos programas de atualização ou no momento da entrada dos dados. Um item de dados pode ser inserido incorretamente e ainda assim satisfazer as restrições de integridade definidas. Por exemplo, se um aluno recebe
nota A, mas é inserida, no banco de dados, a nota C, o SGBD não pode descobrir esse erro, automaticamente, porque C é um valor válido para os tipos de
dados de NOTA. Esse erro pode ser descoberto manualmente (quando o aluno receber a nota e reclamar), sendo corrigido, depois, por meio da atualização
do banco de dados. Porém, a nota Z pode ser rejeitada automaticamente pelo SGBD, pois ela é um valor inválido para os tipos de dados de NOTA.
1.6.9 Permitindo Inferências e Ações Usando as Regras Alguns sistemas de banco de dados oferecem capacidades para definir as regras de dedução por inferência gerando novas informações de fatos
armazenados no banco de dados. Esses sistemas são chamados sistemas de banco de dados dedutivos. Por exemplo, podem existir regras complexas no
minimundo da aplicação para determinar quando um aluno está em recuperação. Isso pode ser especificado declaradamente como uma regra, e quando for
compilada e mantida pelo SGBD, poderá determinar todos os alunos em recuperação. No SGBD tradicional, um código explícito de programa procedural
teria de ser escrito para dar suporte a essas aplicações. No entanto, se as regras do minimundo mudarem, geralmente é mais conveniente mudar as regras de
dedução declaradas que reescrever os programas procedurais. Os sistemas de banco de dados ativos oferecem funcionalidades mais potentes, pois
permitem regras ativas que podem disparar automaticamente ações quando certos eventos e condições ocorrerem.
1.6.10 Implicações Adicionais do Uso da Abordagem de um Banco de Dados Esta seção discute algumas implicações adicionais da utilização da abordagem do uso de um banco de dados que beneficiam a maioria das organizações:
• Potencial para Garantir Padrões. A abordagem de um banco de dados permite ao DBA definir e forçar o uso de padrões entre os usuários de um
banco de dados em uma grande organização. Isso facilita a comunicação e cooperação entre os vários departamentos, projetos e os usuários na
organização. Os padrões podem ser definidos para os nomes e
1.7 Uma Breve História das Aplicações de um Banco de Dados 15
15
15
formato dos elementos de dados, formatos de exibição, estruturas de relatórios, terminologia, dentre outros. O DBA pode forçar o uso dos padrões
em um ambiente de banco de dados centralizado mais facilmente do que em um ambiente no qual cada grupo de usuário tenha o controle de seus
próprios arquivos e softwares. • Redução no Tempo de Desenvolvimento de Aplicações. O principal argumento de venda para o uso da abordagem de um banco de dados é que o
desenvolvimento de uma nova aplicação — como a recuperação de dados de um banco de dados para a impressão de um novo relatório —
demanda um tempo muito pequeno. Projetar e implementar um novo banco de dados do zero deve levar mais tempo do que escrever uma simples
aplicação de arquivo especializada. No entanto, uma vez que o banco de dados está ativo e em execução, certamente menos tempo será necessário
para criar aplicações usando as facilidades do SGBD. O tempo estimado de desenvolvimento utilizando o SGBD está entre 1/6 e 1/4 do tempo
gasto com o sistema tradicional de arquivos.
• Flexibilidade. Pode ser necessário alterar a estrutura do banco de dados quando os requisitos mudam. Por exemplo, um novo grupo de usuários
pode surgir e precisar de informações não disponíveis no banco de dados. A solução pode ser adicionar um novo arquivo ao banco ou estender os
elementos de dados em um arquivo existente. Um SGBD moderno permite certos tipos de alterações evolutivas que mudam a estrutura do banco
de dados sem afetar os dados armazenados e os programas de aplicação existentes.
• Disponibilidade para Atualizar as Informações. Um SGBD disponibiliza o banco de dados para todos os usuários. Imediatamente após ser feita
a atualização de um usuário, todos os outros usuários poderão vê-la. Essa disponibilidade de atualização da informação é essencial para muitas
aplicações de processamento de transações, como sistemas de reserva ou banco de dados bancários. É possível fazê-la por intermédio do
subsistema de controle de concorrência e recuperação do SGBD.
• Economias de Escala. A abordagem do SGBD permite a consolidação dos dados e das aplicações, reduzindo, dessa forma, a perda por
superposição entre as atividades de processamento de dados pessoais em diferentes projetos ou departamentos. Isso possibilita que a organização
faça investimentos em processadores mais potentes, dispositivos de armazenamento ou equipamentos de comunicação do que cada departamento
adquirir seu próprio (menos potente) equipamento, o que reduz o custo total da operação e gerenciamento.
1.7 UMA BREVE HISTÓRIA DAS APLICAÇÕES DE UM BANCO DE DADOS Apresentaremos, agora, uma breve visão histórica das aplicações que utilizam o SGBD e como elas forneceram a motivação para o surgimento de novos
tipos de sistemas de banco de dados.
1.7.1 Primeiras Aplicações de Bancos de Dados Usando Sistemas Hierárquicos e de Rede
A maioria das aplicações pioneiras utilizando um banco de dados mantinha os registros das grandes organizações, como as corporações, universidades,
hospitais e bancos. Em muitas dessas aplicações existia um grande número de registros de estruturas semelhantes. Por exemplo, em uma aplicação para uma
universidade, as informações similares seriam mantidas para cada aluno, cada curso, cada registro de nota, e assim por diante. Havia também muitos tipos
de registros e diversos inter-re lacionamentos entre eles. Um dos principais problemas com os sistemas de banco de dados pioneiros era a mistura entre os relacionamentos conceituais, o armazenamento
físico e a localização de registros no disco. Por exemplo, o registro de notas de um aluno específico poderia ser fisicamente armazenado próximo ao registro
de aluno. Apesar de prover acessos muito eficientes, destinados a consultas originais e transações, para as quais o banco de dados foi projetado para
executar, ele não oferecia flexibilidade suficiente e eficiente para os acessos a registros quando novas consultas e transações fossem necessárias. Em
especial, as novas consultas que precisavam de uma organização diferente de armazenamento para a eficiência no processamento eram muito difíceis de
serem implementadas. Também era muito complicado reorganizar o banco de dados quando as mudanças eram feitas para atender a novos requisitos da
aplicação. Outra deficiência desses sistemas era que forneciam somente as interfaces para a linguagem de programação. Isso fez com que o tempo consumido
fosse significativamente alto para implementar novas consultas e transações, pois os novos programas tinham de ser escritos, testados e depurados. A
maioria desses sistemas de banco de dados foi implementada em computadores grandes (mainframes) e caros, começando em meados de 1960 indo até os
anos 70 e 80. Os principais tipos desses sistemas iniciais foram baseados em três paradigmas principais: os sistemas hierárquicos, aqueles baseados em
modelo de rede, e os de arquivos invertidos.
16
16
16 Capítulo 1 Banco de Dados e os Usuários de Banco de Dados
1.7.2 Obtendo Flexibilidade de Aplicação com o Banco de Dados Relacional Os bancos de dados relacionais foram originalmente projetados com o objetivo de separar o armazenamento físico dos dados da sua representação
conceitual e prover uma fundamentação matemática para os bancos de dados. O modelo de dados relacional também introduziu as linguagens de consulta de
alto nível, que são uma alternativa às interfaces para as linguagens de programação; conseqüentemente, ficou mais rápido escrever novas consultas. A
representação de dados relacionais de algum modo assemelha-se ao exemplo apresentado na Figura 1.2. Os sistemas relacionais foram, a princípio,
direcionados para as mesmas aplicações dos sistemas pioneiros, mas foi decisivo o fato de oferecerem flexibilidade para o desenvolvimento rápido de novas
consultas e para reorganizar o banco de dados quando os requisitos eram alterados. Os primeiros sistemas relacionais experimentais desenvolveram-se no fim dos anos 70 e os SGBDRs (sistemas de gerenciamento de banco de dados
relacional) introduzidos no início dos anos 80 eram muito lentos, pois não usavam ponteiros para o armazenamento físico ou registros de localização para
acessar os registros de dados relacionados. Com o desenvolvimento de novas técnicas de armazenamento e indexação, e com o processamento aprimorado
de consultas e otimização, seu desempenho melhorou. Assim, os bancos de dados relacionais tornaram-se os tipos dominantes de sistemas para as
aplicações tradicionais de banco de dados. Os bancos de dados relacionais agora existem na maioria dos computadores, desde aqueles de uso pessoal até os
de grandes servidores.
1.7.3 Aplicações Orientadas a Objeto e a Necessidade de Bancos de Dados Mais Complexos
O aparecimento das linguagens de programação orientadas a objeto nos anos 80 e a necessidade de armazenar e partilhar os objetos complexos estruturados
conduziram ao desenvolvimento dos bancos de dados orientados a objeto. Inicialmente, foram considerados como competidores dos bancos de dados
relacionais, pois possuíam estruturas de dados mais gerais. Também incorporaram muitos paradigmas úteis orientados a objeto, como tipos de dados
abstratos, encapsulamento de operações, herança e identidade de objeto. No entanto, a complexidade do modelo e a falta de um padrão inicial contribuíram
para seu uso limitado. Hoje são usados principalmente em aplicações especializadas, tais como projetos em engenharia, publicidade multimídia e sistemas
para a indústria.
1.7.4 Trocando Dados na Web para o Comércio Eletrônico (E-commerce) A World Wide Web gerou uma grande rede de computadores interconectados. Os usuários podem criar documentos usando uma linguagem de publicação
na Web, como a HTML (Hypertext Markup Language), e armazenar esses documentos nos servidores da Web, na qual os outros usuários (clientes) podem
ter acesso. Os documentos podem ser conectados através de hyperlinks, que são ponteiros para os outros documentos. Nos anos 90, o comércio eletrônico
(e-commerce) surgiu como a principal aplicação da Web. Tornou-se rapidamente visível que partes das informações do comércio eletrônico nas páginas
Web eram, muitas vezes, dados extraídos dinamicamente dos SGBDs. Várias técnicas foram desenvolvidas para permitir o intercâmbio de dados na Web.
Atualmente, a XML (extended Markup Language) é considerada o principal padrão para o intercâmbio de dados entre os vários tipos de banco de dados e as
páginas Web. A XML combina os conceitos de modelos empregados nos sistemas de documentos com os conceitos de modelos de bancos de dados.
1.7.5 Ampliando as Funcionalidades dos Bancos de Dados para as Novas Aplicações O sucesso dos sistemas de banco de dados em aplicações tradicionais encorajou os desenvolvedores de outros tipos de aplicações a se esforçarem para usá-
los. Essas aplicações tradicionalmente usavam seus próprios arquivos especializados e estruturas de dados. A seguir, alguns exemplos dessas aplicações:
• Aplicações científicas, que armazenam uma grande quantidade de dados resultantes de experimentos científicos em áreas como física avançada
ou mapeamento do genoma humano.
• Armazenamento e restauração de imagens, de notícias escaneadas ou fotografias pessoais a imagens fotografadas por satélite e imagens de
procedimentos médicos, como raios X ou ressonância magnética.
• Armazenamento e recuperação de vídeos, como filmes ou videoclipes de notícias ou de máquinas fotográficas digitais.
• Aplicações para data mining (garimpagem de dados), que analisam grandes quantidades de dados pesquisando as ocorrências de padrões
específicos ou relacionamentos.
17
17
1.8 Quando Não Usar o SGBD 17
• Aplicações espaciais, que armazenam as informações espaciais dos dados, tais como informações a respeito do tempo ou sobre os mapas usados
em sistemas de informações geográficas.
• Aplicações referentes a séries temporais, que guardam informações como os dados econômicos em intervalos regulares de tempo, como, por
exemplo, vendas diárias ou composição mensal do produto interno bruto.
Percebeu-se rapidamente que os sistemas relacionais básicos não eram adequados para muitas dessas aplicações, por uma ou mais das razões a
seguir:
• As estruturas de dados mais complexas eram necessárias para a modelagem da aplicação do que uma representação relacional simples.
• Os novos tipos de dados eram imprescindíveis, além dos tipos numéricos básicos e as cadeias de caracteres (strings).
• As novas operações e construtores de linguagens de consulta eram essenciais para manipular os novos tipos de dados.
• As novas estruturas de armazenamento e indexação eram necess�
Recommended