View
12
Download
1
Category
Preview:
Citation preview
Modelagem de Data Warehouse – Aula 10
Profa Janniele Aparecida Soares Araujo
CSI462 – Sistemas de Apoio à Decisão
2
Modelagem de Data Warehouse
● Características do Modelo Entidade-Relacionamento● Foco em aplicações transacionais● Foco no armazenamento momentâneo (não-histórico) da informação● Tende a um grande número de tabelas● Eficiente apenas para consultas simples e diretas
3
Modelagem de Data Warehouse
● Necessidades em um ambiente de Data Warehouse● Novo modelo diferente do ER tradicional● Foco em aplicações gerenciais● Análise histórica das informações● Visão ampla das informações (sumarizações, cruzamentos)● Visualizar os dados sob diferentes perspectivas (consultas complexas)
4
Modelagem de Data Warehouse
● Modelagem multidimensional● Facilita o entendimento e a visualização das informações utilizadas
pelo suporte à decisão● Fornece uma estrutura mais intuitiva para o processamento analítico.● Os dados são agrupados por assunto
5
Modelagem de Data Warehouse
● Modelagem multidimensional● Representar os tipos de dados por uma estrutura de cubo de dados● Células contêm valores● Lados definem as dimensões de análise● O cubo de dados é chamado de Hipercubo quando há mais de 3
dimensões
6
Modelagem de Data Warehouse
● Visão relacional● Volume de vendas de uma loja de instrumentos musicais por
instrumento e estado
7
Modelagem de Data Warehouse
● Visão multidimensional● Volume de vendas de uma loja de instrumentos musicais por
instrumento e estado
8
Modelagem de Data Warehouse
● Visão relacional● Volume de vendas de uma loja de instrumentos musicais por
instrumento,estado e ano
9
Modelagem de Data Warehouse
● Visão multidimensional● Volume de vendas de uma loja de instrumentos musicais por
instrumento, estado e ano
10
Modelagem de Data Warehouse
● Visão multidimensional: hipercubo
11
Modelagem de Data Warehouse
● Elementos básicos● Fato: é o assunto do negócio, sendo representado por valores
numéricos● Exemplo: vendas
● Dimensões: são elementos que participam e determinam o contexto dos fatos● Exemplos: local, ano e produto.
● Variáveis: atributos numéricos que representam os fatos (métricas ou medidas)● Exemplos: valor em reais das vendas, unidades vendidas
12
Modelagem de Data Warehouse
● Esquema Estrela (Star Schema)● Dispõe as tabelas do banco simulando um banco de dados
multidimensional● Composto por uma tabela dominante (tabela de fatos) e rodeada de
tabelas auxiliares (tabelas de dimensão)● A tabela de fatos conecta-se às demais por múltiplas junções e as
tabelas de dimensões se conectam com apenas uma junção à tabela de fatos
13
Modelagem de Data Warehouse
● Esquema Estrela (Star Schema)● Considere o seguinte cubo para gerar um esquema estrela
14
Modelagem de Data Warehouse
● Esquema Estrela (Star Schema)● Considere o seguinte cubo para gerar um esquema estrela
15
Modelagem de Data Warehouse
● Esquema Estrela (Star Schema)● Entidade central denominada fato● Entidades menores denominadas dimensões ao redor da central.
Dimensao_tempo
id_tempo (PK)diamesanodia_da_semana
Dimensao_produto
id_produto (PK)descricaoprecotipo
Dimensao_estado
id_estado (PK)nomecidade
Fato_vendas
id_tempo (FK)id_estado (FK)id_produto (FK)toneladasquantidade_vendidavalor_venda
16
Modelagem de Data Warehouse
● Esquema Estrela (Star Schema)● Exemplo de tabela de fato VENDAS resultante
id_tempo id_estado id_produto quantidade_vendida valor_venda
01 10 101 10 500
02 10 101 13 700
03 10 101 15 650
17
Modelagem de Data Warehouse
● Esquema Estrela (Star Schema)● Exemplo de tabela de dimensão PRODUTO resultante
id_produto descricao preco tipo
101 Espaguete 10 Massa
102 Hamburguer 5 Carne
103 Talharim 15 Massa
18
Modelagem de Data Warehouse
● Membros de uma dimensão● São os elementos das dimensões● Hierarquia de dimensão● Ex.: Cidade, estados e regiões formam a dimensão “Local”, assim
como ano, trimestre e mês formam a dimensão “Tempo”
19
Modelagem de Data Warehouse● Membros de uma dimensão
● A medida é o volume de venda, que é determinada pelas dimensões de tempo, produto e local
20
Modelagem de Data Warehouse
● As dimensões representam entidades que evoluem com o tempo● Exe.: um cliente pode deixar de ser solteiro e casar-se● Para tratar essas atualizações, pode-se tratar as dimensões de três
formas diferentes● De acordo com a importância de se ter informações históricas
21
Modelagem de Data Warehouse
● Tratando dimensões: estratégias de evolução da informação
1) Sobrepor o registro de dimensão com os novos valores e perdendo o histórico (o histórico não é relevante)
2) Inserção de um novo registro na mesma entidade dimensional, refletindo a “mudança de estado” (o histórico é relevante)
3) Sempre que acontecer uma mudança em um campo, substituir o valor do campo atual e mudar a data efetiva. O campo original nunca será modificado (o histórico é relevante e deseja-se analisar dados usando os status original e atual)
22
Modelagem de Data Warehouse● Tratando dimensões: estratégias de evolução da
informação
23
Modelagem de Data Warehouse
● Granularidade● Diz respeito ao nível de detalhe ou de resumo contido nas unidades
de dados existentes no data warehouse ● Alto nível de detalhes, baixo nível de granularidade● Baixo nível de detalhes, alto nível de granularidade● O nível de granularidade afeta diretamente o volume de dados
armazenado no data warehouse e ao mesmo tempo o tipo de consulta que pode ser respondida
24
Modelagem de Data Warehouse
● Granularidade
25
Modelagem de Data Warehouse
● Esquema Floco de neve (Snowflake)● Similar a uma estrela em seu design● É o resultado da decomposição de uma ou mais dimensões que
possuem hierarquias
26
Modelagem de Data Warehouse
● Esquema Floco de neve (Snowflake)
27
Modelagem de Data Warehouse
● Agregação● Cria-se novas entidades contendo dados sumarizados● Os atributos de agregação devem ser quantitativos numéricos
28
Modelagem de Data Warehouse
● Procedimento geral
1) Definir o FATO do negócio
2) Definir a GRANULARIDADE utilizada
3) Definir as DIMENSÕES do fato
4) Definir as MEDIDAS do fato
29
Modelagem de Data Warehouse
● Exemplo de Procedimento Geral● Uma rede de restaurantes tem 50 filiais localizadas em vários estados
da federação. Cada filial oferece mais de 1000 produtos diferentes nas categorias bebidas e pratos
● A diretoria da empresa deseja analisar as vendas, os custos e os lucros obtidos bem como os funcionários mais ativos
● Promoções e festivais são utilizados para atrair clientes e potencializar as vendas
30
Modelagem de Data Warehouse
● Exemplo de Procedimento Geral● A diretoria da empresa determinou que é estratégico para a tomada
de decisões analisar o movimento diário de cada produto, para que possa direcionar as promoções ou festivais de acordo com os resultados das análises realizadas
● Avaliar o movimento diário de cada produto consiste em analisar as vendas de produtos, levando em conta os preços praticados e as filiais que realizaram tais vendas
31
Modelagem de Data Warehouse
● Exemplo de Procedimento Geral
1) Definir o FATO● Qual elemento central a empresa deseja analisar???
32
Modelagem de Data Warehouse
● Exemplo de Procedimento Geral
1) Definir o FATO● Qual elemento central a empresa deseja analisar???
VENDAS
33
Modelagem de Data Warehouse
● Exemplo de Procedimento Geral
2) Definir o GRANULARIDADE● Em que nível de detalhe a empresa deseja analisar???
34
Modelagem de Data Warehouse
● Exemplo de Procedimento Geral
2) Definir o GRANULARIDADE● Em que nível de detalhe a empresa deseja analisar???
● “é estratégico para a tomada de decisões analisar o movimento diário de cada produto”
DIÁRIOAlto nível de detalhamento
Baixa granularidade
35
Modelagem de Data Warehouse
● Exemplo de Procedimento Geral
3) Definir o DIMENSÕES● Quais aspectos são relevantes para se realizar as análises que a
empresa solicita do fato???
36
Modelagem de Data Warehouse
● Exemplo de Procedimento Geral
3) Definir o DIMENSÕES● Quais aspectos são relevantes para se realizar as análises que a
empresa solicita do fato???● De forma geral, alguns fatores a se observar são O QUÊ, QUEM, QUANDO e ONDE● Pode-se ainda levar em conta outros objetivos especificados para a análise dos fatos
● O QUÊ: PRODUTO● QUEM: FUNCIONÁRIO● QUANDO: TEMPO● ONDE: LOCAL (FILIAL)● OUTROS: PROMOCÕES
37
Modelagem de Data Warehouse
● Exemplo de Procedimento Geral
4) Definir o MEDIDAS● Como o desempenho de vendas pode ser medido???
38
Modelagem de Data Warehouse
● Exemplo de Procedimento Geral
4) Definir o MEDIDAS● Como o desempenho de vendas pode ser medido???
● Quantidade vendida● Valor unitário● Total da venda● Valor da compra
39
Modelagem de Data Warehouse● Esquema Estrela (Star Schema)
● Exemplo do modelo correspondente ao procedimento geral anterior
Funcionario
id_func (PK)matriculanomecargosexocpfsalariodata_admissaodata_demissaodata_aposentadoria
Filial
id_filial (PK)cod_filialnomeenderecodidadeufregiaofaxcepgerentedata_abertura
Promocao
id_promocao (PK)cod_promocaonomepreco_praticadotipo_anunciocusto_promocaodata_inicialdata_final
Vendas
id_func (FK)id_produto (FK)id_promocao (FK)id_filial (FK)id_tempo (FK)quantidade_vendidavalor_unitariovalor_totalvalor_compra
Tempo
id_tempo (PK)dia_semanadia_mesmesanosemestreferiado
Produto
id_produto (PK)cod_produtodescricaocod_grupoGrupocod_tipoiipodata_iniciodata_final
40
Exercício
● Dada as seguintes necessidades empresariais de uma rede de supermercados responda às perguntas● Verificar o valor arrecadado por país estado e cidade● Identificar qual produto é mais vendido e rentável● Acompanhar a evolução do arrecadamento por ano, trimestre e mês● Relacionar a lucratividade dos clientes com sua idade e sexo
1)Qual será o fato?
2)Quais serão as dimensões para este fato?
3)Quais serão as medidas necessárias para atender aos requisitos?
4)Desenhe o modelo estrela correspondente.
41
Bibliografia
● Tecnologia e Projeto de Data Warehouse. Machado, F.N.R.. São Paulo, Erica, 2010.
Recommended