22
Inteligência de Negócios Profa.Denise

Inteligência de Negócios Profa.Denise - denan.com.brdenan.com.br/fam/documentos/ModeloDimensional.pdf · Estabelecem a organização dos dados, determinando possíveis consultas/cruzamentos

Embed Size (px)

Citation preview

Inteligência de Negócios

Profa.Denise

Bancos de Dados Multidimensionais

A finalidade de bases de dados multidimensionais (alguns autores chamam de dimensionais) é fornecer subsídio para realização de análises. Para tanto, sua arquitetura e até mesmo a terminologia empregada são distintas das utilizadas para bancos de dados transacionais.

Estabelecem a organização dos dados, determinando possíveis consultas/cruzamentos.

Por exemplo: região, tempo, canal de venda,...

Cada dimensão pode ainda ter seus elementos, chamados membros, organizados em diferentes níveis hierárquicos.

A dimensão tempo, por exemplo, pode possuir duas hierarquias: calendário gregoriano (com os níveis ano, mês e dia) e calendário fiscal (com os níveis ano, semana e dia).

Dimensão TEMPO é obrigatória.

São os valores a serem analisados, como médias, totais e quantidades;

Fatos: são os dados a serem agrupados, contendo os valores de cada medida para cada combinação das dimensões existentes.

O tamanho da tabela que contém os fatos merece atenção especial do analista;

Ao modelar a(s) tabela(s) de fatos (ou apenas tabela fato), deve-se ter em mente os seguintes pontos:

A chave primária é composta, sendo um elemento da chave para cada dimensão;

Cada elemento chave para a dimensão deve ser representado e descrito na “tabela dimensão” correspondente (para efetuar a junção);

Servem para armazenar, normalmente, medidas numéricas associadas a eventos de negócios.

Normalmente apresentam mais linhas do que as tabelas dimensão.

Contem dados normalmente aditivos ( soma, média, etc)

Otimiza as consultas

O grão é o menor nível da informação e é definido de acordo com as necessidades elencadas no início do projeto. Ele é determinado para cada tabela fato.

Quando falamos em menor granularidade , ou granularidade fina, significa maior detalhamento (menor sumarização) dos dados. Maior granularidade, ou granularidade grossa, significa menor detalhamento (maior sumarização).

A granularidade afeta diretamente o volume de dados armazenados, na velocidade das consultas e no nível de detalhamento da DW.

Alto nível de detalhe Menor nível de detalhe

Segunda: 10 unidades Semana: 49

Terça: 5 unidades Sumarização: Roll up

Quarta: 7 unidades

Quinta: 11 unidades

Sexta: 9 unidades

Sábado: 4 unidades

Detalhamento: Drill down

Deve haver uma “tabela dimensão” para cada dimensão do modelo, contendo:

Uma chave artificial (ou gerada) genérica;

Uma coluna de descrição genérica para a dimensão;

Colunas que permitam efetuar os filtros;

Um indicador NÍVEL que indica o nível da hierarquia a que se refere a linha da tabela.

.

Tem relação 1:N com a tabela fato

Relaciona as dimensões e fatos

Permite que o controle do histórico dos dados seja facilmente implementado.

Deve ter apenas números.

Ex: 3456798

O novo registro substitui o registro original. Só existe um registro no banco de dados

com os dados atuais.

Não mantem histórico.

Tipo 2 – Controle de Versão

Um novo registro é adicionado na tabela Dimensão.

Dois registros existem no BD (dados atuais e anterior)

Mantém histórico

Recomendado !

São armazenadas separadas no sistema .

Dimensão Tempo : ANO->MÊS->DIA

Dimensão Região : PAIS-> REGIÃO -> ESTADO->CIDADE

Valores Aditivos

Podem ser aplicadas operações como soma, subtração e média sobre estes valores. Ex. unidades_vendidas, dolares_vendidos, valor de venda.

Valores Não Aditivos

Não podem ser manipulados livremente.

Percentuais ou valores relativos

Ex. porcentagem, taxas de juro.

Uma das formas de apresentação de um banco de

dados multidimensional é através do Modelo Estrela,

apresentado por Ralph Kimball (4). No centro da estrela

encontra-se a tabela de fatos e, ao seu redor, as

dimensões.

É um modelo simples e eficiente, caracterizado por possuir uma única tabela de fatos e chaves simples nas tabelas de dimensões. Cada dimensão é representada por uma única tabela.

Os pontos positivos deste modelo são a eficiência, dada pelo reduzido número de junções nas pesquisas e pelas chaves simples, e a facilidade de definir hierarquias.

Os pontos negativos são o tamanho e a desnormalização das tabelas de dimensões.

Os Modelos Snowflake acrescentam graus de normalização às tabelas de dimensões do Modelo Estrela, eliminando redundâncias e a necessidade do indicador NÍVEL.

Próximo passo usar uma ferramenta ETL para a carga.

Usar uma ferramenta OLAP para exibir os dados .