View
212
Download
0
Category
Preview:
Citation preview
Banco de DadosProf. Christiano Lima Santos
Conteúdo do Curso
Introdução a Banco de Dados Modelo Relacional Modelo Entidade-Relacionamento Normalização Álgebra Relacional O SGBD MySQL Introdução à linguagem SQL
Linguagem de Definição de Dados – DDL Linguagem de Manipulação de Dados - DML
Quem sou eu? Formação:
Graduado em Ciência da Computação (Universidade Federal de Sergipe); Especialista em Gestão de Negócios (Universidade Cidade de São Paulo); Mestre em Ciência da Computação (Universidade Federal de Sergipe);
Linha de pesquisa: Engenharia de Software.
Áreas de Interesse: Informática Educativa (Jogos Educativos e Ambientes Virtuais de
Aprendizagem); Engenharia de Software (Desenvolvimento Dirigido por Modelos); Computação Inteligente (Geração de Linguagem Natural).
Introdução a Banco de Dados
Parte 01
Sumário Armazenamento e recuperação de dados O que é um Banco de Dados? Vantagens dos Bancos de Dados sobre os Arquivos
de Dados Arquitetura em três níveis de um SGBD Modelos de Dados Linguagens de Banco de Dados
Dado x Informação
Dado – todo valor (numérico, textual, lógico etc.) que pode ser armazenado em um computador;
Informação – todo dado ou conjunto de dados que, após algum tipo de processamento ou manipulação, apresenta algum significado útil.
Armazenamento e recuperação de dados Todo sistema de informação pode lidar com
armazenamento e recuperação de dados por meio de arquivos de dados;
Armazenamento e recuperação de dados Entretanto, certos sistemas de informação
podem apresentar problemas ao utilizar tal forma de armazenamento e recuperação de dados; Sistemas monousuários x sistemas multiusuários; Risco de redundância e inconsistência dos dados; Recuperação, processamento ou filtragem de grandes
volumes de dados. Bancos de dados podem solucionar tais problemas.
O que é um Banco de Dados? É uma coleção de dados relacionados; Podemos considerar como sendo um repositório para
armazenamento de informações persistente; Uma boa analogia pode ser um armário de arquivo.
Assim, um Sistema Gerenciador de Banco de Dados (SGBD) é um sistema que permite o armazenamento, atualização e recuperação das informações presentes nesse repositório.
Por meio de tal sistema, um usuário pode: Adicionar, alterar ou remover arquivos (tabelas) no banco de dados; Inserir, alterar, remover ou recuperar dados (registros) dos arquivos
(tabelas).
Exemplo de um Banco de Dados(Sistema de Biblioteca)
LivroID
Nome Autores
1 Engenharia de Software
R. Pressman
2 Banco de Dados C. J. Date3 Segurança da
InformaçãoJ. Smith
UsuarioID
Nome
1 Christiano2 Davi3 Márcio
EmprestimoID
LivroID UsuarioID
DataEmprestimo
DataDevolucao
1 1 1 01/06/2015 05/06/20152 2 1 05/06/20153 3 2 07/06/2015
Dados de Livros Dados de Usuários
Dados de Empréstimos
Representação simplificada de um SGBD
Fonte: (DATE, 2004)
Componentes de um sistema de banco de dados Hardware, em que o SGBD será mantido; Software, já que o SGBD é um software (ou conjunto de
softwares) responsável por gerenciar os dados; Procedimentos, isto é, instruções e regras que ditam
como projetar e usar o banco de dados (forma de log on, aplicações para acesso ao SGBD, política de backup etc.);
Dados, ponto central de todo SGBD; Usuários, ou seja, todos que, de alguma forma, se
utilizam do SGBD.
Tipos de usuário de um SGBD
1. Usuários finais – acessam o banco de dados por meio dos softwares criados pelos desenvolvedores de aplicação ou específicos para consultas a bancos de dados; Usuários simples – utilizam somente softwares criados pelos
desenvolvedores de aplicação e não precisam conhecer a estrutura do banco de dados ou linguagens para consultas;
Usuários sofisticados – podem utilizar os mesmos softwares empregados pelo grupo anterior, mas conhecem a estrutura do banco de dados e uma linguagem para consultas (geralmente SQL) e por isso podem realizar consultas mais personalizadas aos dados.
Tipos de usuário de um SGBD
2. Desenvolvedores de aplicação – responsáveis por desenvolver e/ou manter softwares que acessarão o banco de dados. Tais aplicações poderão recuperar, inserir, atualizar ou remover dados do banco;
Tipos de usuário de um SGBD
3. Projetistas de banco de dados (database designers) – responsáveis por identificar os dados, relacionamentos entre dados e quaisquer restrições sobre os dados (isto é, as regras de negócios). Assim, são responsáveis pelo projeto de banco de dados conceitual, lógico e físico;
Tipos de usuário de um SGBD
4. Administradores: Administradores de dados (DA) – responsáveis por
gerenciar os recursos de dados planejando, desenvolvendo e mantendo padrões, políticas e procedimentos referentes ao projeto e uso de banco de dados. Sua função é garantir que os bancos de dados da organização suportam os objetivos corporativos;
Administradores de banco de dados (DBA) – atuam diretamente sobre o SGBD, projetando melhorias para os bancos de dados bem como gerenciando seus recursos e possíveis falhas. Focam aspectos como otimização, segurança e desempenho.
Vantagens dos Bancos de Dados sobre Arquivos de Dados Dados podem ser compartilhados;
Melhor gerenciamento de acesso multiusuário aos dados; Redundância pode ser reduzida ou eliminada; Inconsistência pode ser evitada; Integridade pode ser mantida; Suporte a transações; Maior transparência na manipulação dos dados;
Flexibilidade de acesso aos dados.
Vantagens dos Bancos de Dados sobre Arquivos de Dados Requisitos conflitantes podem ser equilibrados; Redução do tempo para armazenamento,
recuperação e processamento dos dados; Segurança pode ser melhorada;
Maior proteção aos dados contra acessos indevidos ou perdas não intencionais;
“Relacionabilidade” dos dados; Possibilidade de estabelecer relacionamentos entre
diferentes tipos de dados.
Arquitetura em três níveis de um SGBD Nível externo – nível mais próximo dos usuários de um
sistema, referindo-se à forma como os usuários vêem os dados; A forma como um usuário ou grupo de usuários com necessidades
similares vê os dados é chamada de visão do usuário; Nível conceitual – representa a união de todas as visões de
usuário do nível externo; O banco de dados, neste nível é descrito em um esquema lógico;
Nível interno – corresponde à representação real (física) dos dados em um computador e os métodos usados para acessá-los; Também referenciado como nível físico.
Independência dos dados
Sistemas de banco de dados proporcionam dois tipos de independência dos dados: Independência física – o nível conceitual é
independente de mudanças no nível interno ou físico;
Independência lógica - o nível externo é independente de mudanças no nível conceitual.
Modelos de Dados
Um modelo de dados é uma coleção de ferramentas conceituais para descrever dados e seus relacionamentos e semântica bem como restrições de consistência (SILBERSCHATZ, KORTH e SUDARSHAN, 2011).
Modelos de Dados
Classificação dos modelos de dados: Modelo Relacional – usa uma coleção de
tabelas (relações) para representar dados e relacionamentos entre dados, onde cada tabela é formada por colunas (atributos) e cada linha pode ser considerada um registro. A maioria dos sistemas de bancos de dados baseiam-se no modelo relacional;
Modelos de Dados
Classificação dos modelos de dados: Modelo Entidade-Relacionamento – emprega
uma coleção de objetos (entidades) e relacionamentos entre tais objetos e é usado na modelagem de bancos de dados;
Modelos de Dados
Classificação dos modelos de dados: Modelo Orientado a Objetos – pode ser visto
como uma extensão do modelo ER com aspectos de orientação a objetos (encapsulamento, métodos etc.). O modelo objeto-relacional nasce como um híbrido dos modelos orientados a objetos e dos modelos relacionais;
Modelos de Dados
Classificação dos modelos de dados: Modelo de Dados Semiestruturados –
diferentemente dos modelos anteriores, permite que a especificação de dados de cada item apresente diferente conjunto de atributos. A linguagem de marcação XML é amplamente usada para representar dados semiestruturados.
Modelos de Dados
OBS: Antes de tais modelos, houveram o modelo em rede e o modelo hierárquico, mas devido à dificuldade de modelar os dados nos mesmos, caíram em desuso.
Linguagens de Banco de Dados
Linguagem de Definição dos Dados (DDL); Usada para especificar o esquema do banco de dados; Provê operações para descrever e nomear as entidades,
atributos e relacionamentos que representarão os dados para uma dada aplicação;
Linguagem de Manipulação dos Dados (DML); Usada para recuperar ou atualizar os dados em um banco; Provê operações para inserir, modificar, remover ou
recuperar os dados.
ExercíciosIntrodução a Banco de Dados
Parte 01
Modelo RelacionalParte 02
Sumário
Introdução ao Modelo Relacional
Introduzido por E. F. Codd em 1970 (IBM); Fundamentado na teoria dos conjuntos; Lida com conceitos simples de:
Relações (tabelas); Atributos (colunas); Domínios (intervalos de valores); Tuplas (linhas/registros).
Modelo seguido pela maioria dos atuais SGBD.
Objetivos
Permitir um alto grau de independência dos dados;
Prover o alicerce necessário para lidar com problemas de semântica, consistência e redundância dos dados; Ideia de relações normalizadas.
Habilitar a expansão das linguagens de manipulação de dados orientadas a conjuntos.
Principais conceitos
Relação; Atributo; Domínio; Tupla; Esquema.
Relação
Representa uma tabela, isto é, um conjunto de dados que apresentam alguma relação entre si, dispostos logicamente em colunas (atributos) e linhas (tuplas).
Matematicamente, um conjunto, onde seus elementos são as tuplas, que podem ser descritas pelos seus atributos (cada atributo admitindo um valor dentro de um domínio);
Em um banco de dados relacional, cada relação possui um nome único!
Relação Enfim, aqui estão três exemplos de relações:
LivroID
Nome Autores
1 Engenharia de Software
R. Pressman
2 Banco de Dados C. J. Date3 Segurança da
InformaçãoJ. Smith
UsuarioID
Nome
1 Christiano2 Davi3 Márcio
EmprestimoID
LivroID UsuarioID
DataEmprestimo
DataDevolucao
1 1 1 01/06/2015 05/06/20152 2 1 05/06/20153 3 2 07/06/2015
Relação Livro Relação Usuário
Relação Empréstimo
Atributo
Representa uma coluna dentro de uma relação;
Um conjunto de atributos descrevem uma relação;
Em uma relação, cada atributo possui um nome único!
Atributo
A relação Usuário (abaixo) possui dois atributos (UsuarioID e Nome):
UsuarioID
Nome
1 Christiano2 Davi3 Márcio
Relação Usuário
Atributo
Um atributo pode ser do tipo: Simples – quando apresenta um valor de um
único domínio; Composto – quando seu valor é na verdade uma
tupla formada por vários domínios (ideia de “sub-atributos”);
Multivalorado – quando pode armazenar mais de um valor (ideia de listas).
Domínio
É o conjunto de valores admissíveis para um ou mais atributos;
Isto é, intervalo de valores que podem ser atribuídos a uma coluna da tabela;
Em uma relação, dois ou mais atributos podem admitir o mesmo domínio.
Domínio
Na relação Usuário, podemos dizer que: Domínio do atributo UsuarioID é o
domínio dos valores inteiros;Em MySQL, INT.
Domínio do atributo Nome é o domínio dos valores textuais;Em MySQL, CHAR ou VARCHAR.
UsuarioID
Nome
1 Christiano2 Davi3 Márcio
Relação Usuário
Tupla
Trata-se de uma linha de uma relação; Em outras palavras, é um registro de uma
tabela, composto por valores que satisfazem os domínios dos atributos da mesma;
Em uma relação, não podemos ter duas tuplas idênticas, isto é, com os mesmos valores!
Tupla
A relação Usuário possui três tuplas:
UsuarioID
Nome
1 Christiano2 Davi3 Márcio
Relação Usuário
Esquema
Esquema de uma relação é a relação definida por um conjunto de atributos e seus respectivos domínios; RUsuario = (UsuarioID:INT, Nome:VARCHAR(50))
Esquema de um banco de dados relacional é o conjunto de esquemas das relações, cada qual com nomes distintos. R = { RLivro, RUsuario, REmprestimo }
Outros conceitos
Grau – o grau de uma relação é o número de atributos que ela contém;
Cardinalidade – a cardinalidade de uma relação é o número de tuplas que ela contém;
Banco de dados relacional – uma coleção de relações normalizadas com nomes de relações distintos.
Propriedades das relações
Cada relação possui um nome distinto de todas as outras relações no esquema relacional a que pertence;
Cada célula da relação (normalizada) contém exatamente um único valor atômico;
Cada atributo em uma relação tem um nome distinto;
(CONNOLLY e BEGG, 2005)
Propriedades das relações
Os valores de um atributo são todos do mesmo domínio;
Cada tupla é distinta, não há tuplas duplicadas; A ordem dos atributos não tem significância; A ordem das tuplas não tem significância, em
teoria (pois na prática, é importante para otimizar armazenamento e indexação das mesmas)!
(CONNOLLY e BEGG, 2005)
Chaves de uma relação
Não há tuplas duplicadas em uma relação;
Consequentemente, há um conjunto de um ou mais atributos capazes de identificar unicamente cada tupla em uma relação, tal conjunto é a superchave; Se uma chave é composta por mais de um atributo, ela é
uma chave composta;
Chaves de uma relação
Uma superchave pode conter atributos não necessários para identificar unicamente uma tupla, mas se não houver tais atributos desnecessários, então ela será uma chave candidata. Unicidade e irredutibilidade são, então, propriedades de uma chave candidata;
Chaves de uma relação
A chave candidata que for escolhida para identificar unicamente as tuplas de uma relação é chamada de chave primária (PK);
LivroPK LivroID: INT Nome: VARCHAR(50) Autores: VARCHAR(50)
UsuarioPK UsuarioID: INT Nome: VARCHAR(50)
Chaves de uma relação
E se um atributo ou conjunto de atributos de uma relação refere-se a uma chave candidata de alguma relação (outra relação ou a própria), tem-se então uma chave estrangeira (FK).
LivroPK LivroID: INT Nome: VARCHAR(50) Autores: VARCHAR(50)UsuarioPK UsuarioID: INT Nome: VARCHAR(50)
EmprestimoPK EmprestimoID: INTFK LivroID: INTFK UsuarioID: int DataEmprestimo: Date DataDevolucao: Date
Chaves de uma relação
Resumindo: Superchave - conjunto de um ou mais atributos capazes de
identificar unicamente cada tupla em uma relação; Chave candidata - uma superchave da qual nenhum atributo
pode ser removido sem prejudicar a unicidade da tupla; Chave primária - chave candidata escolhida para identificar
unicamente as tuplas de uma relação; Chave estrangeira - atributo ou conjunto de atributos de
uma relação que se refere a uma chave candidata de alguma relação (outra relação ou a própria).
Restrições de integridade
Integridade de Entidade Em uma relação, nenhum atributo de uma chave primária
pode assumir valor null (nulo); Null – Representa um valor para um atributo que é
atualmente desconhecido ou não é aplicável para aquela tupla;
Restrições de integridade
Integridade Referencial Se uma chave estrangeira existir em uma relação, o valor
da chave estrangeira deve “casar” com o valor de uma chave candidata de alguma tupla da relação de origem ou seu valor deve ser null;
Restrições de integridade
Restrições Gerais Regras adicionais especificadas por usuários ou
administradores de banco de dados que definem ou restringem alguns aspectos importantes para a corporação (regras de negócio).
Referências Bibliográficas
CONNOLLY, Thomas; BEGG, Carolyn. Database Systems – A practical approach to design, implementation and management. Ed. 4, Addison Wesley, 2005.
COURTNEY, J. F.; PARADICE, D. B.; BREWER, K. L.; GRAHAM, J. C. Database Systems for Management. Ed. 3, 2010.
DATE, C. J. An Introduction to Database Systems. Ed. 8, Pearson Education, 2004.
ELMASRI, Ramez; NAVATHE, Shamkant. Sistemas de Banco de Dados. 6ª ed. São Paulo : Pearson Addison-Wesley, 2011.
SILBERSCHATZ, A.; KORTH, H.; SUDARSHAN, S. Database System Concepts. Ed. 6, 2011.
Recommended