58
ELiANE GOTHS MIORELLI UTILIZANDO A TECNOLOGIA DE DATA WAREHOUSE NA EDUCACAo stT~!I~~~ CPNSULTA J Il'<lTERNA / "{ Monografia apresentada ao Curso de P6s- Gradua~ao em Pedagogia da Gestao Empresarial , da Universidade Tuiuti do Parana. Onentadora:Prof. Olga Maria Silva Mattos. 2004

UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

  • Upload
    lytram

  • View
    213

  • Download
    0

Embed Size (px)

Citation preview

Page 1: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

ELiANE GOTHS MIORELLI

UTILIZANDO A TECNOLOGIA DE DATA WAREHOUSE NA EDUCACAo

stT~!I~~~CPNSULTA JIl'<lTERNA

/"{

Monografia apresentada ao Curso de P6s-Gradua~ao em Pedagogia da GestaoEmpresarial , da Universidade Tuiuti doParana.

Onentadora:Prof. Olga Maria Silva Mattos.

2004

Page 2: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

RESUMO

o data warehouse, literalmente traduzindo, e um "armazem de dados" . Euma base de dados carregada de forma incremental em um periodo de tempo. 0

data warehouse organiza e armazena as dados necessarios para processamento

informatizado e analftico sabre perspectivas historicas 80 lango do tempo, tendo

como principal objetivo transformar 0 dado em informac;ao. E uma arquitetura que

utiliza banco de dad os desenvolvido para analise e tamada de decis6es em bases

sumarizadas e tambem detalhadas, com a intuito de contemplar as segmentos da

empresa ou organiZ8r;ao.

a data warehouse pode revolucionar as negocios da empresa/organiz8<;ao.

Ao ser bem elaborado e implementado, e caso seja cuidadosamente direcionado

para a chamada "inteligencia de neg6cio", ele pode tornar-se uma vantagem

competitiva. Essa ferramenta est'; fazendo surgir novas conceitos de gestao da

informac;ao , tipos de consultas e analises dos neg6cios. Os principais conceitos

basicos que norteiam 85sa tecnologia serao abordados e analisados como pre-

requisitos que, direta QU indiretamente, sao necessarios para 0 desenvolvimento do

projeto.

o enfoque principal do trabalho e reunir grande parte da fundamenta9aO

te6rica referente ao assunto data warehouse, provendo 0 conhecimento minima

necessaria aqueles profissionais que nao tern referenda alguma sabre esse assunto.

Com base no que e a tecnologia de data warehouse, apresentarei alguns

estudos de casa baseados nas necessidades educacionais estruturando-os em

bases de dados conceituais visando suprir as necessidades de informa98o das

organiz8c;oes educacionais.

iii

Page 3: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

SUMARIO

RESUMO ..

USTA DE TABELAS .

USTA DE FIGURAS

USTA DE SIGLAS

INTRODUf;:Ao ...

. iii

. vii

................. vii

................ viii

. ..... ix

1. FUNDAMENTAc;:Ao TEO RICA ..

1.1 CONCEIT OS.

1.1.1 Dado x Informa9iio

1.1.2. Data Warehouse (Armazem de Dados) ..

1.1.3. Data Mart (Mercado de Dados) ..

.1

. 1

.... 1

. 1

. 3

1.1.4. Sistemas de Suporte II Decisiio (DSS-Decision Support Systems) .4

1.1.5. Inteligencia Do Neg6cio (Business Intelligence).. . .4

1.1.6. Modelagem De Dados ..

1.1.7. Banco De Dados Relacional

1.1.8. Banco De Dados Multidimensional. ...

1.1.9. Analise Multidimensional..

1.1.11.2. MOLAP (Multidimensional OLAP).

1.1.11.3. HOLAP (Hibrido OLAP) ..

1.1.11.4. WOLAP (Web OLAP) ..

1.1.12. Opera90es Olap .....

1.1.13. Modelagem Dimensional Dos Dados

. 5

........... 7

. 8

. 8

. 9

. 9

. 10

. 10

. 10

. 11

1.1.10. OLTP (Online Transaction Processing) ..

1.1.11. OLAP (Online Analytical Processing) ..

1.1.11.1. ROLAP (Relacional OLAP) .

1.1.13.1. Fatos .

. 11

........... 11

. 12

. 131.1.13.2. Dimensoes De Urn Cubo ..

iv

Page 4: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

1.1.13.3. Agrega«oes.. . 13

1.1.13.4. Tecnica star schema (esquema estrela).... . 14

1.1.13.5. Tecnicasnowf/ake (flocodeneve).. . 14

1.1.14. Metadados.. . 15

1.1.15. Ferramenta CASE (Computer Aided Software Engineering).. . 16

1.1.16. SQl (Structured Query language).. . 16

1.1.16.1. Stored procedure (sp).. . 17

1.1.17. Indexa«ao.. . 17

1.2. ASPECTOS ESTRATEGICOS PARA A CONSTRUC;;iio DE UM DATA

WAREHOUSE.

1.2.1. Planejamento ..

1.2.2. Necessidades Das Empresas ....

. 17

. 18

. 19

1.2.3. Hierarquia Classica Da Informa«ao Na Empresa 21

1.2.4. Motiva«ao Da Empresa No Mercado 22

1.2.5. Necessidades e Beneficios Para 0 Usuario .. .....22

1.2.6. Perfil Do Usuario Na Empresa Que Utiliza 0 Data Warehouse 23

1.2.7. Analise Do Ambiente legado

1.2.8. Equipe De Desenvolvedores ..

............................................. 24

.....25

1.2.9. Aspectos Da Implementa«ao Fisica (Rolap/Molap) 25

1.2.10. Performance 26

1.2.11. Seguran«a 27

2. ESTUDO DE CASO: ALGUNS EXEMPLOS.. . 28

2.1. FATORES CRiTICOS DE SUCESSO. . 28

2.2. DEFINIC;;iio DA TECNICA DE DESENVOlVIMENTO DE SISTEMAS A SER

UTILIZADA.. . ..29

2.3. VISUALIZAR AS NECESSIDADES DO USUARIO.. . 29

2.4. NOVA visiio DA INFORMAC;;iio PARA A TOMADA DE DECISOES 30

2.5. ANALISE DO NEGOCIO A SER MODELADO .... .....31

Page 5: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

2.6. ANALISE DO AMBIENTE LEGADO.. . 32

2.7. MODELAGEM DIMENSIONAL DOS DADOS.. . 33

.............. 342.7.1. Dimens5es ..

2.7.2. Fatos 35

2.7.3. Exemplo de uma analise dimensional. 35

2.7.4. Agrega~5es 37

................. 382.7.5. Metadados ..

2.7.6. Resumo das etapas para a modelagem dimensional 38

2.8. ESTUDOS DE CASOS REAIS (NECESSIDADES DO NEGOCIO E

MODELAGEM DIMENSIONAL) .. . 39

2.8.1. Data Mart Para Informa~5es Gerenciais de Matriculas de Alunos e

~-...............~

2.8.2. Data Mart Para Informa~5es Escolaridade dos Professores .41

2.8.3. Data Mart Para Informa~5es de Alunos no Ano Letivo .. . .42

ANEXOS.. . .44

SUGEST.A.O DE UMA TABELA DIMENS.A.O TEMPO DETALHADA [211 .44

FIGURAS 45

REFERENCIAS .. ...... .47

vi

Page 6: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

LlSTA DE TABELAS

1. SUGESTAO DE UMA TABELA DIMENSAO TEMPO DETALHADA .43

LlSTA DE FIGURAS

1. EXEMPLO DE UM CUBO DIMENSONAL ,., ,." ,', ,', ..,', .44

2. EXEMPLO DE UMA ESTRUTURA STAR SCHEMA .44

3. EXEMPLO DE UMA ESTRUTURA SNOW FLAKE. .45

4. EXEMPLO DE UM MODELO DE DADOS (MER) ..45

vii

Page 7: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

BI

CASE

DATA MARTS

DER

DM

DSS

DSS

DW

DWA

EIS

ER

FK

HOLAP

MER

MOLAP

OLAP

OLTP

ROLAP

SGBD

SGBDR

SOL

WOLAP

LISTA DE SIGLAS

- Business Intelligence

- Computer Aided Software Engenering

- Mercados de Dados

- Diagrama Entidade Relacionamento

- Dimensional Modeling

- Decision Support Systems

- Sistema de Apoio a Decisao

- Data Warehouse

- Administrador de Data Warehouse

- Sistema de Informa(foes Executivas

- Entity Relation

- Foreign Key

- Hibrido On Line Analytical Processing

- Modelo Entidade Relacionamento

- Multidimensional On Line Analytical Processing

- On Line Analytical Processing

- On Line Transaction Processing

- Relacional On Line Analytical Processing

- Sistema de Gerenciamento de Banco de Dados

- Sistema Gerenciador de Banco de Dados Relacional

- Structured Ouery Language

- Web On Line Analytical Processing

viii

Page 8: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

INTRODU<;:Ao

Hoje canstata-s8 frequentemente nas empresas e organiZ8<;oes publicas,

que as informac;6es estao desorganizadas, pouco integradas e de difieil acesso

pelos usuarios quando as mesmas necessitam analisa-Ias para tamar decis5es. Sao

frequentes as perguntas feitas pelos executivos das empresas e altos

administradores com relac;ao as informac;6es:

• "N6s temas montanhas de dados nesta empresa mas naD temas acesso

aos mesmas".

• "Nos queremos cruzar informact0es de todas as maneiras possiveis".

• "Apenas me mostre 0 que e importante".

Estas perguntas poderao ser respondidas mais rapidamente se a empresa

passui urn data warehouse consistente e integrado porem, nao e uma tarefa simples

o desenvolvimento de um projeto desse nivel. Para tanto, as premissas abaixo

devem ser observadas:

• De que maneira agilizar 0 processo de tomada de decisao na Empresa

utilizando a Tecnologia da Infonma~ao?

• De que forma 0 data warehouse realmente possibilita agilizar 0 processo

de tomada de decisao na Empresa?

• Quais etapas basicas urn profissional da Tecnologia da Informac;ao deve

seguir para desenvolver um projeto de data warehouse?

Atualmente, a informac;ao e 0 principal patrimonio de uma empresa ou

organiza~ao e a mesma e utilizada no processo de tomada de decisoes importantes

e estrategicas. Portanto, a infonma~ao deve ser tratada como fator primordial com

rela~ao a competitividade do mercado. No entanto, muitas empresas necessitam

integrar seus dados de forma a visualizar todo 0 escopo operacional da empresa

para que analises possam ser efetuadas de uma forma rapida, confiavel e que 0

usuario possa solicitar suas consultas as bases de dados sem necessitar de ajuda

ix

Page 9: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

do analista de informatica. A integra,ao destas bases de dados e um problema

complexo quando S8 visualizam varias tontes de informayao distribufdas na

empresa em urn mesma ambiente computacional QU em ambientes distintos.

o conceito de data warehouse surge com a finalidade de organizar a

integra<;ao das informac;oes e disponibiliz8-las atraves de varias dimens6es de

consulta, permitindo que todos as dados da empresa possam estar disponiveis em

uma (mica base para consulta e auxilio a tamada de decisao.

Quanta aD objetivo geral, enfatiza-se que nas Organiz8c;oes Educacionais,

sao necessarias varias informac;oes gerenciais e estatisticas. Para atender a estas

necessidades, a tecnologia de data warehouse possibilita a visualiza,ao e obten,ao

destas informa,oes de uma forma mais rapida. Baseado em fundamenta,ao teorica,

pretende-se sugerir modelos de dados de alguns data marts para 0 auxilio aeduc8yao. Para as objetivos especificos, foram considerados as itens abaixo

selecionados:

1) Elaborar fundamenta9ao te6rica para suportar a assunto, provendo

conhecimentos te6ricos, tecnicos e conceituais basicos referentes ao

desenvolvimento de projetos de constru,ao de data warehouse.

2) Identificar situa90es reais de necessidade de analise da informa9ao

atraves de alguns estudos de caso voltados a educa,ao que serao apresentados,

demonstrando principalmente 0 projeto do modelo de dados dimensional.

a metoda utilizado e a pesquisa bibliografica. As fontes bibliograficas

utilizadas foram Livros de Leitura Corrente, par constituirem conhecimentos tecnicos

e Publica90es Peri6dicas que proporcionam informa90es recentes e atualizadas.

Outra classifica9ao de pesquisa bibliografica utilizada e consultas a sites da Internet.

as autores William H. Inmon e Ralph Kimball nortearam a fundamenta9ao te6rica

como refen'>ncias bibliograficas principais. Para 0 detalhamento do conhecimento

adquirido atraves da pesquisa bibliografica, tambem foi utilizado 0 metodo de estudo

de caso, que permite 0 estudo de ou mais objetos de analise voltados a Educa9ao.

Page 10: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

Basicamente, 0 trabalho esta dividido em duas partes distintas:

1a Parte: Embasamento te6rico atraves de pesquisa bibliogrilfica que dara

o suporte basieD necessaria para 0 entendimento do que e a tecnologia de data

warehouse, visualizando conceitos basicos e considerac;5es necessarias para 0

desenvolvimento do projeto.

2' Parte: Inicio do desenvolvimento do trabalho onde sera proposta a analise

do negocio e modelagem dimensional em estudos de casas reais voltados aeduca<;ao.

xi

Page 11: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

1. FUNDAMENTA9AO TEORICA

1.1 CONCEITOS

1.1.1 Dado x Informa<;ao

Dado e urn registro de fatos, conceitos au instru90es para a comunic8<;ao,

recuperac;:ao e processamento par meios automaticos e apresentac;:ao na forma de

informa<;ao compreensivel para os seres humanos. Informa<;ao sao dados que os

seres humanos assimilam e validam para resolver problemas au tamar decis6es

[13].

Dados sao os componentes basicos, a partir dos quais a informa<;ao e

criad8. InformaC;:80 sao dados inseridos em urn contexto. Contexte e a SitU8C;:80que

esta sendo analisada. A partir da informa9ao vern 0 conhecimento, que permite

tomar decisoes adequadas, trazendo vantagem competitiva [18].

1.1.2. Data Warehouse (Armazem de Dados)

Data warehouse e uma colec;:ao de dados para suportar 0 gerenciamento

das necessidades de decisao, orientado a urn assunto, integrado, variante no tempo

e nao volatil [14].

Orientado par assunto: A primeira caracteristica de urn data warehouse eque ele esta orientado ao redor do principal assunto da organiza~ao como, por

exemplo, clientes, vend as, produtos e atividades. 0 alinhamento ao redor das areas

de assunto afetam 0 desenho e implementa<;aodo dado criado no data warehouse.

A area de assunto mais influente e a parte mais importante da estrutura chave [14].

Integrado: A melhor essencia do ambiente de warehouse e que dados

contidos dentro dos limites do warehouse estao integrados. A integra<;aomostra-se

em muitas diferentes maneiras: na cansistencia e padronizaC;8a de names, na forma

Page 12: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

2

consistente das variaveis, na estrutura consistente de c6digos, nos atributos fisicos

eonsistente dos dados, e assim por diante [14].

Nao Volatil: Atualiza90es - inclusao exelusao, e altera9ao - sao feitas

regularmente no ambiente operacional efe urn registro basico. Mas a manipulac;ao de

dados basieos que oeorre no data warehouse e mais simples. Tem somente tres

especies de operac;6es que ocorrem no data warehouse: a carga inicial do dado, 0

acesso ao dado e atualiz8<;ao temporal (semanal, mensa I) conforme necessidades

do neg6eio [14].

Hist6rieo: Todo dado no data warehouse Eo exato em algum momenta do

tempo e em consequencia desta informaC;8o, 0 dado criado no warehouse e dito ser

"historica". as valores hist6ricos dos dados no data warehouse sao mostrados em

varias maneiras. 0 modo mais simples e que 0 dado no data warehouse representa

os dados sobre um horizonte de tempo distante - de 5 ate 10 anos [14].

Uma colec;ao de bancos de dados integrados e orientados a assuntos

projetados para apoiar as fun90es de um Sistema de Apoio de Decisao (Decision

Support Systems); onde cada unidade de dados e importante em um momenta no

tempo. 0 data warehouse contem dados atomicos e muitas vezes sumarizados [13].

Um data warehouse nao e um produto ou mesmo um conjunto de produtos,

mas processos suportados par diversas tecnologias: ele coleta dados das varias

aplic8<;oes operacionais; integra-os em urn modele logica, par areas de neg6cio;

armazena as informac;:5es de tal maneira que possam ser recuperadas par usuarios

pouco tecnicos; e entrega essas informalfoes aos tomadores de decisao atraves de

ferramentas de facil utiliza9ao, como geradores de relat6rios e de consulta [29].

A ideia de data warehouse e integrar os dados de uma organiza9ao em uma

estrutura unica provendo qualidade e melhor acesso aos dados [6].

Base de dados analitica que permite analises e simulac;6es, para suporte as

decis6es estrategicas de media e lango prazo. Geralmente e armazenada em

Page 13: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

3

ambiente especifico, ou seja, separado do ambiente operacional. Caracteristicas:

[25].

Dadas hist6ricos: para possibilitar analises combinat6rias e simulac;oes.

Armazenam grandes quantidades de dados, podendo chegar a dezenas de anos

[25].

Sumario estatica: decorrente de atualiZ8C;8o pontual, as sumarizac;oes sao

calculadas e fixadas no momento da carga [25J.

Dados Corporativos: estrutura de dados das diversas areas da empresa

(Suprimentos, Manufatura, Vendas, Finanyas, Recursos Humanos, etc.), permitindo

as mais diversas compara~oes [25J.

Data warehouse e uma arquitetura de banco de dados com informa~oes de

can:~ter gerencial voltado para: suporte a decisao, planejamento estrategicQ, analise

do comportamento de clientes e analise da performance de vendas. Funciona como

urn provedor de informac;6es de urna empresa ou instituic;ao, pois concentra todas as

informa<;oes estrategicas e hist6ricas, extraidas dos sistemas transacionais relativos

aos clientes e produtos. A proposta principal do data warehouse e a democratiza~ao

das informac;6es para a area de negocios, atraves do facil acesso aos dados para

analise [1J.

1.1.3. Data Mart (Mercado de Dados)

Um data mart nao e uma evolu~ao de um data warehouse, mas sim parte

das estrategias deste. Um data mart e um subconjunto de dados de um data

warehouse, desenhado para suportar urna necessidade de negocio ou urna unidade

organizacional especifica. A estrategia correta e fazer 0 data mart incorporar-se aarquitetura de data warehouse, sem perder a visao de conjunto. Essa visao de

conjunto e decorrencia de um bom projeto de data warehouse [24J.

o data mart e similar ao data warehouse com algumas exce90es: [13J

• 0 data mart opera um conjunto menor de dados [13].

Page 14: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

4

• 0 data mart visualiza 0 dados com urn enfoque departamental enquanto

o data warehouse visualiza os dados com urn enfoque corporativo [13].

• 0 data mart visualiza os dados em uma base muito mais previsivel

enquanto 0 data warehouse frequentemente faz explora9ao na base de

dados [13J.

Caracteristicas comuns ao data warehouse e data mart sao: informa9ao

estrutural, fonte de informa98o e outras informa90es encontradas ao longo do

ambiente [13].

Obedece os mesmos conceitos do data warehouse, diferenciando-se

somente no conteudo, ou seja, os dados sao organizados por assunto, permitindo

maior independencia, agilidade e ganhos de performance [25J.

1.1.4. Sistemas de Suporte II Decisao (DSS-Decision Support Systems)

Urn sistema utilizado para gerenciar decis6es. Usualmente envolve a analise

de muitos dados. Como regra, nao envolve a atualiza9ao dos dados, somente efetua

consultas. Sistemas projetactos para as executivos que caracterizam-se pela analise

de tendencias [13J.

Enquanto 0 resultado de urn data warehouse e a possibilidade de auxiliar no

suporte a decis6es. urn DSS pode existir independentemente da arquitetura de data

warehouse. Alem disso. urn DSS e uma soluc;ao isolada e que n<lo inclui

necessariamente uma arquitetura, uma infra-estrutura e nem mesma ferramentas de

administra9ao ou auditoria, ao contrario de urn data warehouse, que deve incluir

todos esses componentes [24J.

1.1.5. Inteligencia Do Negocio (Business Intelligence)

Eo urn processo de coleta, transforma9ao, analise e distribui9ao de dados

para melhorar a decisao de neg6cios; sua infra-estrutura tecnol6gica e composta de

data warehouses ou data marts, ferramentas OLAP, EIS, data mining, consultas e

Page 15: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

5

relat6rios e software de visualiza<;ao dos dados; os bancos de dados sao a infra-

estrutura basica de qualquer sistema de business intelligence. Sao neles que VaG

estar armazenados os dados que serao transformados em informa<;oes competitivas

[17].

1.1.6. Modelagem De Dados

Modelagem de dados e uma atividade na qual procuramos construir uma

estrutura de dados que reflita a realidade e ao mesmo tempo seja facilmente

manuseada par computadores para que os sistemas construfdos a partir dela sejam

estaveis e sofram 0 minima de manutenyao passivel. A modelagem e dividida em

tres etapas ou niveis: Conceitual, Logico e Fisico [27].

Modele Conceitual: E desenvolvido sem levar em consideray80 nenhum

aspecto de representa<;ao logica ou fisica dos dados, seja software, hardware ou

visao particular de urn usuario. E baseado em como funciona 0 negocio do cliente e

ignora detalhes de implementa<;aoe performance [27].

Modele Logieo: E desenvolvido levando-se em considera<;8o a arquitetura

de dados suportada pelo sistema gerenciador de banco de dados. Exemplo: Em

Rede, Hierarquico, Relacional. Ha a defini<;aodas tabelas, colunas e chaves. A meta

e a redu<;ao de redundiincias para simplifica<;ao do gerenciamento e aumento da

integridade [27].

Modele Fisico: 0 mapeamento fisica leva em considerac;ao

caracteristicas de hardware e software (SGBD) e estimativas de espa<;o e tempo

(performance) [27].

o ponto de come<;o para 0 plano de migra<;aoe um modelo de dados. 0

modele de dados representa as necessidades de infonma<;ao da corpora<;ao.

Representa 0 que a corporac;ao necessita, nao necessaria mente 0 que a corpora<;ao

atualmente possui. Eo construido sem considera<;aode tecnologia [12].

Page 16: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

6

o Modelo Entidade-Relacionamento (MER) sera a tecnica de modelagem de

dados utilizada para cria,ao do Modelo Conceitual de Dados [8].

Esta tecnica foi criada por Peter Pin-Shan Chen em 1975 e e usada para

descrever 0 mundo real com alto grau de abstraC;8o, em termos de entidades

(objetos de interesse), relacionamentos (forma como as entidades estao interligadas)

e atributos (caracteristicas das entidades e relacionamentos) [8].

o MER e composto por uma representa,ao grafica, 0 chamado Diagrama

Entidade-Relacionamento (DER) e um conjunto de informa,5es escritas sobre cada

conceito representado (entidades, relacionamentos e atributos) [8].

Modelo de Dados : Estruturas de dados 16gicas, providas por um sistema

gerenciador de banco de dados utilizado para a representa,ao dos dados [13].

Entidade: Anmazena os dados de uma pessoa, lugar ou objeto de interesse

em um alto nivel de abstra,ao [13]. Todo 0 objeto, coisa que tem alguma existencia

no neg6cio, na vida real. Nao sao tabelas, sao implantadas como tabelas [21].

Relacionamentos: As a,5es ou fatos que integram as entidades no mundo

real [21].

Modelo Entidade-Relacionamento (MER): Um modelo de dados que define

entidades, 0 relacionamento entre entidades e as atributos que tern valores para

descreverem as propriedades das entidades e/ou relacionamentos [13]. Um exemplo

de um modelo MER esta demonstrado na Figura 4 do Anexo.

Diagrama de Entidade-Relacionamento (DER): Um modelo de dados de alto

nivel que demonstra, esquematicamente, todas as entidades dentro do ambito de

integra,ao e a rela,ao direta entre essas entidades [13].

Chave : Um item de dado ou combina,ao de itens de dados utilizados para

identificar ou localizar uma instancia de um registro ou algum agrupamento de dados

similares [13].

Chave Primaria : Um atributo unico utilizado para identificar um registro em

um banco de dados [13].

Page 17: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

7

Uma ou mais colunas que unicamente identificam uma linha da tabela.

Chaves primarias devem ser (micas e nao nulas [5).

Chave Estrangeira: Uma au mais colunas que referenciadas a chave

primaria de outra tabela [5).

Chave Comum: Uma au mais colunas que sao frequentemente utilizadas

para relacionar tabelas [5).

• Chaves nao sao 0 mesma que indices. Uma chave pode au nao ser urn

indice [5).

• Chaves sao definidas no projeto 16gicoenquanto indices sao definidos no

projeto fisico para garantir performance e outras raz6es [5).

1.1.7. Banco De Dados Relacional

Um Sistema Gerenciador de Banco de Dados Relacional (SGBDR) mantem

tabelas que sao compostas por colunas que descrevem linhas de dados [13).

Uma base ou banco de dados e uma cole<;ao de dados relacionados e

armazenados ( frequentemente com redundancia controlada e limitada) de acordo

com um esquema. Um banco de dados pode servir unica ou multiplas aplica<;6es

[13).

Os atuais Sistemas Gerenciadores de Bancos de Dados Relacionais

oferecem uma solur;ao poderosa e eficiente para 0 processamento de grandes

volumes de transa<;6es de uma grande variedade de aplica<;6es comerciais e

cientificas [7).

1.1.7.1. Tabelas

Tabela e uma rela<;aoque consiste em um conjunto de colunas com um

titulo e um conjunto de linhas. Coluna e uma tabela vertical onde sao selecionados

valores do mesmo dominio. Uma linha e composta de uma ou mais colunas [13).

Page 18: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

8

Em urn banco de dados relacional, todos os dados estao em tabelas. Uma

tabela mantem dados relacionados com uma classe particular de objetos (uma

entidade). Tabelas sao compostas por linhas e colunas. Existe exatamente um

conteudode dado em cada colunade cada linha [28].

1.1.8. Banco De DadosMultidimensional

Um sistema gerenciador de banco de dados especificamente projetado para

suportar varias dimensoes de dados em uma arquitetura tres camadas. Tipicamente

nao suportam Sal (Structured Query Language) diretamente e, atualmente,

suportam um volume de dados significantemente menor que um Sistema

Gerenciador De Banco De Dados Relacional. Entretanto, esse tipo de gerenciador

de banco de dados pode ser uma excelente oP9ao para uma implementa9ao

departamental se a funcionalidade que ele prove atende a demanda do uswirio

referenteas infomna90esdo neg6cio [13].

"As pessoas falam da necessidade de separar a captura dos dados do

acesso aos dadas, em termos de bases separactas, movendo informac;5es entre si,

ao menos desde 0 inicio dos anos 80", testemunha 0 especialista da IDC em data

warehouse Henry Morris. 0 que mudou fai a maturagao de varias tecnologias-chave:

agora nao e mais 56 0 banco de dado relacional; mas SGBDR multidimensional, com

features especiais para aumento de performance, como index8g8o bitmap, e novos

esquemas para organizar e representar os dadas, visando nao somente a inser9ao

nipida de novas transa90es,mas analise e consultas complexas [2].

1.1.9. Analise Multidimensional

Analise multidimensional e a habilidade em manipular dados que foram

agregados em varias categorias ou dimens6es. A proposta da analise

multidimensional e auxiliar 0 usuario a sintetizar a informa9ao da empresa atraves de

uma visao comparativa, personalizada e projetada para a analise de dados

hist6ricos [13].

Page 19: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

9

Algumas ferramentas de analise multidimensional possuem a habilidade em

acessar dados em urn sistema gerenciador de banco de dad os relacional; outras

requerem urn esquema estrela ("star schema") para facilitar 0 processamento

multidimensional [13].

A visao multidimensional e muito mais util para as analistas do que a

tradicional visao tabular utilizada nos sistemas de processamento de transa~ao.Ela

e mais natural, facil e intuitiva, permitindo a visao dos negocios da empresa em

diferentes perspectivas e, assim, transformando 0 analista num explorador da

informa9ao [6].

1.1.10. Ol TP (Online Transaction Processing)

• Processamento de aplica90es transacionais [13].

• Transa90es OlTP sao extremamente disciplinadas [13].

• 0 ambiente Ol TP e previsivel e regular em seu tamanho e forma [13].

Transa9ao Ol TP consome poucos recursos; pesquisa quantidade reduzida

de dados. Como resultado desta disciplina, 0 tempo de resposta de uma transa9ao e

bom (dois a tres segundos sao 0 normal) [13].

De maneira geral, um sistema aplicativo esta focado na precisao dos

processos operacionais [30].

1.1.11. OlAP (Online Analytical Processing)

Processamento Analitico Online e um importante metodo na arquitetura do

data warehouse na qual os dados podem ser transformados em informa9ao. OlAP e

urna categoria de tecnologia de software que permits a analistas, gerentes e

executivos a obterem perspicacia em dados de uma forma rapida, consistente e com

acesso interativo para urna grande variedade de possiveis vis6es da informa98o na

empresa. Mais suscintamente, OlAP e um conjunto de funcionalidades que tem,

como principal objetivo, facilitar a analise multidimensional [13].

Page 20: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

10

OlAP representa um conjunto de tecnologias projetadas para suportar

analise e consultas ad hoc (consultas efetuadas pelo usuario de acordo com sua

necessidade momentanea) [6].

A caracteristica principal dos sistemas OlAP e permitir uma visao conceitual

multidimensional dos dados de uma empresa [6].

As bases OlAP podem ser acessadas/manipuladas atraves de aplica,oes

personalizadas ou ainda: [4].

• via Internet/Intranet [4].

• via aplica,oes pre-definidas para se fazer analises diversas [4].

1.1.11.1. ROlAP (Relacional OlAP)

Qualquer analise multidimensional efetuada em urn sistema gerenciador de

banco de dados relacional. A base de um desenho fisico ROlAP e, tipicamente,

uma combina,ao de dados apropriadamente normalizados em uma ou mais tecnicas

star schema [13].

1.1.11.2. MOLAP (Multidimensional OlAP)

Qualquer analise multidimensional efetuada em urn sistema gerenciador de

banco de dados multidimensional [13].

MOlAP e uma ciasse de sistemas que permite a execu,ao de analises

bastante sofisticadas usando como gerenciador de dados um banco de dados

multidimensional [6].

1.1.11.3. HOlAP (Hibrido OlAP)

E um produto de OLAP hibrido que pode prover analise multidimensional

simultaneamente de dados armazenados em urn banco de dados multidimensional e

em um banco de dados relacional [17].

Page 21: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

11

1.1.11.4. WOLAP (Web OLAP)

Representa a migra,ao da tecnologia OLAP para 0 ambiente da Internet.

Tern havido urna grande divulga(fao sabre a usa de Web browsers para acesso a

OLAP, mas ainda sao poucos os sites em funcionamento com 0 uso de OLAP.

Segundo alguns institutos de pesquisa 0 OLAP baseado na Web sera a chave para

aplic8c;oes na Intranet e devera oferecer urn caminho simples e barato no acesso ao

data warehouse [17J.

1.1.12. Opera,oes Olap

Opera,oes OLAP sao as opera,oes de pesquisa e explora,ao da informa,ao

no cubo de dados. Sao elas: [21J.

Slice and Dice: Sao opera,oes de fatiamento do cuba de dados, permitindo

sua visualizac;ao em segmentos, assim como a rotac;ao do cuba buscando

novas perspectivas de visao de dados [21J.

Drill Down e Roll UP: Eo a capacidade de navega,ao aprofundando 0 nivel de

detalhamento dos dados, ou subindo este nivel de detalhe conforme a

hierarquia [21].

1.1.13. Modelagem Dimensional Dos Dados

A modelagem dimensional e a tecnica utilizada para S8 ter urna visao

multidimensional dos dadas. Nessa tecnica, os dados sao modelados em urna

estrutura dimensional conhecida par cuba. As dimens6es do cuba representam as

componentes dos negocios da empresa, tais como Ucliente", Uproduto", "fornecedor"

e "tempo". A celula resultante da intersec,ao das dimensoes e chamada de medida

e geralmente representa dados numericos como "unidades vendidas", "Iucro" e "total

de venda" [6J.

Ah§m dos componentes dimensao e medida, outro importante aspecto do

modelo multidimensional e a consolidac;ao dos dados, uma vez que para a tarefa de

Page 22: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

12

analise sao mais ut8is e significativos a agregac;ao (au sumariZ8c;ao) dos valores

indicativos dos negocios [6].

o proprio desenho do data warehouse leva a novas perspectivas de projeto.

Nao ha necessidade de modelagem na terceira forma normal. Na pratica,

redundancia de dados e bem-vinda nesse ambiente. Para muitos projetistas, e uma

maneira diferente de modelar dados [30].

Modelagem Dimensional e urn nome novo para uma tecnica antiga usada

para criar bancos de dados simples e compreensiveis. Quando um banco de dados

pode ser visualizado como um "cubo" contendo ate tres, quatro, cinco ou mais

dimensoes, as pessoas conseguem visualizar ests esse cuba em qualquer de suas

dimens6es [19].

Dimensional Modeling (OM) e uma tecnica logica de projeto muito utilizada

nos data warehouses, diferente e oposta ao entity-relation modeling (ER). 0 OM e a

(mica tecnica viavel para os bancos de dados projetados para suportar as consultas

de usuario final de um data warehouse. 0 ER e muito util na captura de transa~6es e

nas fases de administra~ao de dados da constru~ao de um data warehouse, mas

deve ser evitado para 0 usuario final [3].

1.1.13.1. Fatos

Sao as medidas basicas de informac;oes do neg6cio. Representa as

quantidades e valores dos dados que podem ser agregados sem perderem seu

significado. A tabela fato ou fact table armazena as medidas basicas objetos de

analise do negocio. 0 dado na tabela fato e composto de elementos de dados

organizados em urn n[vel estruturado. as valores destes elementos de dados podem

ser sumarizados em uma variedade de formas sem par em risco a integridade dos

dados [13].

A chave de uma tabela fato e a composi~ao das chaves das tabelas

dimensao. 0 resultado e que existir;, uma linha na tabela fato para cada combina~ao

Page 23: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

13

unica dos dominios de todas as chaves de todas as tabelas dimensao.

Caracteristicas: [13]

• Quantifica 0 dado que foi descrito nas tabelas dimensao [13].

• Chave composta de combina/f80 unica de valores das chaves das

dimensoes [13].

• Os valores da tabela fato sao somente aditivos [13].

• Sempre contem uma data [13].

1.1.13.2. Dimensoes De Um Cuba

Descrevem ou caracterizam as dados relacionados e organizados na tabeJa

fatos. As tabelas dimensao circundam a tabela fato. Representam as possiveis

formas de visualizar e consultar os dados.

• Chave deve ser unica [13].

• Permitir gerenciar numero de niveis de agrega,oes [13].

Caracteristicas: [13]

• Dimensao nao precisa ser uma hierarquia, pode ser uma combinaC;8o de

atributos [13].

(Exemplo demonstrado na Figura 1 do Anexo) [13].

1.1.13.3. Agrega,oes

Agregac;:oes sao sumariz890es de dados com 0 objetivo principal de

melhorar a performance de acesso. Geralmente amnazenadas em tabelas fatos

separadas [13].

Abstra,ao de dados que, aplicada a modelagem conceitual de dados,

permite que objetos venham a fomnar um novo objeto de mais alto nivel. Foi

proposto par J. M. Smith em 1977 [27].

Agrega,oes fornecem niveis multiplos de detalhes do fato [18].

as resultados das queries (au seus valores intermediarios) sao pre-

calculados, 0 que melhora muito a performance [18].

Page 24: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

14

As agrega,5es podem ser acumuladas atraves de agrupamentos dilerentes,

Irequentemente atraves de varias dimens5es ou combina,ao de dimens5es [18].

o unico aspecto mais importante de design de urn data warehouse e 0

assunto da granularidade. Granularidade S8 refere ao nivel de detalhe contido as

unidades de dados no data warehouse [12).

Quanto mais detalhamento ha, mais baixo sera 0 nlvel de granularidade.

Quanto menos detalhamento ha, mais alto 0 nlvel de granularidade [13].

1.1.13.4. Tecnica star schema (esquema estrela)

A tecnica star schema pre-processa as dados ern uma tabela fatos central

com tabelas de dimensao relacionadas. As chaves (micas de cada tabela dimensao

comp5em uma chave combina9ao na tabela fatos. Os beneficios desta tecnica sao

que as dados esta.o pre-processados em dimensoes conhecidas e caracterizadas

em um conjunto especifico de necessidades de inlomna,ao do negocio, tornando 0

acesso pelo usuario mais eficiente (Exemplo demonstrado na Figura 2 do Anexo)

[13].

Este modelo e composto por uma tabela com chave de multiplas partes

(dimens5es) chamadas de tabela lato e de um conjunto de tabelas pequenas

chamadas de dimens5es, que fomnam as pontas das estrela. Cada tabela de

dimensao tern uma chave prima ria simples que corresponde a urn dos componentes

da chave multipla da tabela lato. A principio parece um modelo muito simples de ser

construido, pOrl§!m a determinayao das dimens6es e do fato tern necessidade de

excelente entendimento conceitual para que se obtenha sucesso em uma

implanta,ao de data warehouse [21].

1.1.13.5. Tecnica snow flake (lioco de neve)

A tecnica snow flake e uma variante do star schema com as tabelas

dimens5es nomnalizadas (Exemplo demonstrado na Figura 3 do Anexo) [21).

Page 25: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

15

As hierarquias tern significado e importancia dentro da analise

multidimensional. No modele star, elas estao lodas em vista da desnormaliz8<;ao das

entidades, urn dos conceitos basicos de modelagem multidimensional. Urn

esquema alternativQ e a esquema snow flake, ande normalizando as hierarquias

encadeamos relacionamentos e entidades a partir das dimens6es. A utiliz8<;ao de

esquema snow flake depende da necessidade de otimiz8<;oes no projeto flsico ou

nas queries realizadas. Lembramos que sempre urn data warehouse tern como

objetivo sistemas de apaio a decisao, que necessitam das mais variadas consultas

[21],

Urn esquema snow flake e somente uma alternativa de constru~ao do

modelo de dados multidimensional .Todo modelo snow flake pode rapidamente ser

transformado em urn star, bastando para ista relacionarmos as hierarquias

diretamente as tabelas fato, desnormalizando-as completamente [21].

1.1.14. Metadados

Sao dados sobre dados. Descri~ao dos dados: estrutura, conteudo, chaves,

indices, detalhes, etc. Sem os metadados, 0 data warehouse e seus componentes

associados seriam meramente componentes nao integrados trabalhando

independentemente e com objetivos distintos [13].

Importante utilizar metadados para descrever 0 modelo dos dados e para

auxiliar na constru<fao das consultas. Dessa maneira, um analista pode executar

suas analises utilizando seus proprios termos [6].

Eo dado sobre urn determinado dado. Por exemplo: os metadados poderiam

indicar se uma base de dados existe na corporac;ao, quais atributos formam uma

determinada tabela, caracteristicas fisicas de um determinado atributo, tais como:

tamanho e formato, onde ele e utilizado, etc. As informa~6es do metadado podem

ser sobre os dados do legado, dados armazenados em data warehouse ou

informa~6es pertinentes a urn catalogo. Estas informa~6es sao armazenadas em urn

Page 26: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

16

repasit6rio que tern 0 objetivo de documentar e administrar estes metadados e

fornecer informac;oes para reuso destes dados, melhorando a qualidade e

produtividade da empresa [16J.

1.1.15. Ferramenta CASE (Computer Aided Software Engineering)

Sao ferramentas individuais que auxiliam 0 desenvolvedor de software ou

gerente de projeto durante uma ou mais fases do desenvolvimento de software (au

manutenc;ao) [10].

Uma cambinac;ao de ferramentas de software e metodologias de

desenvalvimenta estruturada [10J.

CASE pode auxiliar diretamente no projeto e suporte do desenvalvimenta de

sistemas e tambem prove gerenciamento da infonmac;ao,documentac;ao e contrale

de como desenvolver um projeto [10].

1.1.16. SQL (Structured Query Language)

Eo uma linguagem padrao de acesso aos dadas em bancos de dados

relacionais independente de fomecedor.

Uma linguagem que habilita 0 usuario a interagir diretamente com 0 sistema

gerenciador de banco de dados para recuperar e/ou modificar dados gerenciados

pelo mesma [13J.

Caracteristicas: [28]

• Eo uma farma padrao de especificar canjuntas de dados [28].

• Eo uma forma de recuperar e manipular dados em um banco de dados

relacional [28].

• Eo utilizada para todas as func;oes de bancos de dados, incluindo

administrac;aa, criac;aode esquemas e recuperac;ao [28J.

• Pode ser utilizada na fonma de "SQL embutida" em um programa de

aplicativo [28].

Page 27: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

17

1.1.16.1. Stored procedure (sp)

Stored Procedure e uma tecnica de projeto que permite que urn conjunto de

instru90es Sal sejam compiladas e armazenadas no gerenciador de banco de

dados. Sao rotinas chamadas por aplica90es cliente e sao armazenadas e

executadas no servidor. A stored procedure fornece uma significante melhora de

performance sobre 0 Sal utilizado diretamente na aplica9aO[27].

Uma stored procedure e uma cole9aO de comandos Sal anmazenados no

banco de dados e que pode ser executada pelo nome [5]1.1.17. Indexa9ao

E 0 conceito de indices de acesso. Sao estruturas de indexa9aO destinadas

a otimizar 0 acesso aos dados. E importante lembrar que em bancos de dados

relacionais, uma chave nem sempre tern urn indice associado a ela. Chaves sao

defini90es de nivel logico e os indices sao estruturas fisicas para melhorar a

performance no acesso aos dados. [27].

indice POr9aOda estrutura de anmazenamento de dados mantida para

prover acesso eficiente a um registro quando seu conteudo chave e conhecido [13].

indice Invertido : Uma estrutura de indice organizada por meio de uma chave

nao unica que aumenta a velocidade de pesquisa aos dados [13].

Indices: [5]

• Sao utilizados para melhorar a performance. (se nenhum indice edefinido a uma tabela, a tabela inteira devera ser pesquisada para

satisfazer uma condi9aOde consulta) [5].

• Proveem um mecanismo para garantir a unicidade [5].

1.2. ASPECTOS ESTRATEGICOS PARA A CONSTRU<;AO DE UM DATA

WAREHOUSE

Page 28: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

18

1.2.1. Planejamento

Urn problema serio em projetos de data warehouse e um planejamento

defeituoso. 0 fato de todos concordarem que a projeto de um data warehouse nao

se baseia em requisitos bem delimitados nao significa que os projetistas nao devam

planejar minuciosamente cad a atividade do processo. E mais, tal planejamento deve

levar em considera9aO 0 fato de se tratar de um data warehousing mais que um data

warehouse: um processo sem fim para todos os efeitos praticos. Deve ser

considerado 0 longo prazo geralmente envolvido. Nao se estara projetando uma

aplica9aOoperacional, mas sim um repositorio de informa90es gerenciais [9].

A Opera9aO do negocio tende a uma estabilidade grande. Um aplicativo

voltado para gerir essas atividades tende, portanto, a ser bastante estavel, pelo

menDS quando comparado as necessidades de infonnactao para a tamada de

decisao. E aqui que a competitividade do mercado se faz sentir. As perguntas que

as executivos precisam ver respondidas hoje para tomarem suas decis6es podem

ser substancialmente as de amanha. Desse modo, um planejamento consistente

deve preyer liberac;6es parciais de dados, em curtes intervalos, de maneira que a

usuario cedo possa interagir com 0 ambiente, facilitando 85sa mudanga inevitavel de

requisitos. Os planejadores devem identificar muito cedo os alvos do projeto e seus

beneficios [9].

Recomenda-se que a data warehouse nao comece muito ambiciosamente.

a primeiro projeto nao deve levar mais que nove meses para estar operacional e

deve atingir basicamente as areas de neg6cio mais importantes e que tragam

retorno direto e tangivel. Com 0 tempo, ele sera refinado e aumentado em sua

abrangencia [29].

Um projeto de data warehouse deve ser conduzido com enfoque diferente de

um projeto de aplica90es tradicional. A primeira etapa e identificar os objetivos da

organiza9aO, sob a optica de seus executivos. A empresa pretende crescer dentro

de seu segmento de negocio? Depois, sao identificados os processos de negocio

Page 29: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

19

diretamente relacionados com esses objetivos. A seguir, definem-se as informac;6es

que sao necessarias para suportar esses processos de decisao. Onde essas

informac;oes serao obtidas? As especific8c;oes tecnicas aparecem no final, quando

entao S8 desenham as alternativas tecnol6gicas para a sua total implementac;ao

[30].

1.2.2. Necessidades Das Empresas

No principia haviam sistemas simples de automac;ao. Entao vieram sistemas

de banco de dados e sistemas on-line. Em um tempo muito pequeno a computador

tinha achado seu modo de incorporar-se aD cotidiano das empresas. De quase

nenhum computador nos anos cinquenta para milh6es de computadores de todo

tipo e tamanho nos anos oitenta, a mundo da tecnologia explodiu al8m de qualquer

previsao a uma taxa de crescimento que parecia ser impassivel acreditar [13].

Os sistemas de computa9ao iniciais fcram projetados para processar as

tranS8c;oes diarias da corporac;8o. Decis6es imediatas eram 0 enfoque destes

sistemas pioneiros. Com 0 advento dos primeiros sistemas, veio urn subproduto de

dados. Estes dados refletiam as atividades que estavam acontecendo e cresceram

a medida que a tempo passava e de como a negocio era administrado [13].

Caso apos caso, os usuarios finais sabiam que os dados de que eles

precisavam estavam disponlveis mas dificeis de serem obtidos. Ainda, em cada

caso, 0 departamento de sistemas de informa~aodava uma ou outra justificativa do

porque de os dados nao poderem ser acessados. Usuarios finais sentiam-se

abandonados e frustrados [13].

Entao, 0 data warehouse foi criado. 0 data warehouse transferiu os dados do

ambiente transacional, armazenando-os e organizado-os de forma que 0 usuario

final poderia obter a informa<;iio pela qual tanto ansiava. Alinal, as dados estavam

disponiveis em uma base para que 0 usuario processasse suas proprias consultas

[13].

Page 30: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

20

o data warehouse representou uma troca fundamental na concep~ao de

sistemas de infonma~aoe introduziu alguns conceitos novos importantes: [13]

• Oados devem ser integrados atraves da empresa [13].

• Oados sumarizados tem um grande valor para a organiza~ao [13].

• Oados historicos sao a chave para compreender os dados ao longo do

tempo [13].

• Metadados representam um papel muito importante na infra-estrutura do

data warehouse [13].

• Muito importante manter a precisao dos dados hist6ricos com 0 passar

do tempo [13].

Alem de resolver alguns problemas muito importantes para a corpora~ao, a

cria9ao do data warehouse aliviou 0 fardo do programador de aplica~ao em tentar

transformar 0 ambiente de sistemas legado em um sistema para a tomada de

decisao. As solicitayoes dos usuarios e a manutenc;ao das aplic8c;oes, pela primeira

vez, tornaram-se gerenciaveis [13].

o objetivo basico do data warehouse deve ser adicionar valor ao neg6cio. A

medida que as regras do negocio sao incorporadas as aplica90es, exige-se rapidez

cada vez maior nas respostas. 0 ambiente de negocios e crescentemente dinamico.

Responder com rapidez ao como, quando e quanta passa a ser decisivo para a

empresa sobreviver e crescer nesse cenario [30].

As organiz8yoes hoje em dia estao enfrentando enormes press6es para

preyer informayoes de melhor qualidade para tamada de decis6es, em formatas de

f8Cil acesso e manipulac;:8o. Em poucas palavras, as empresas precisam S8 tornar

mais ageis em sua capacidade de utilizar as enormes quantidades de dados no

esfor~o de proporcionar melhor suporte ao cliente [32].

Urn data warehouse reconhece 0 valor estrategico do gerenciamento

intencional do bem corporativo de dados. A enfase no data warehouse reflete 0

reconhecimento de que a explora~ao de dados e 0 caminho para vantagem

Page 31: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

21

competitiva, novas oportunidades de neg6cios, e mel haria no servi90 ao cliente. Ela

tambem reconhece que as sistemas tradicionais de gerenciamento de base de

dados esUio geralmente assoberbados pelo enorme volume de dados que Ihes sao

confiados. Como resultado, os sistemas de extra~ao de informa~6es que trabalham

com a totalidade das bases de dados geralmente funcionam mal [32].

o data warehouse e a arquitetura associada a ele providencia 0 objetivo

para lutar contra as mais variados desafios confrontados nos sistemas de

informa~6es gerenciais de hoje [14].

Em outras palavras, 0 data warehouse permite 0 gerenciamento para

considerar resultados no contexto. Sem a arma~ao do data warehouse e sua

arquitetura associada e uma tarefa quase impassivel formar sentido para as diversos

resultados obtidos [14].

Data warehouse e entendido como uma "enabling technology"; uma

tecnologia-meio, que favorece a tamada de decisoes ao separar sistemas de

informa~6es para decisao dos dados de produ~ao. Essa divisao dos dados permite,

dizem as entusiastas, melhor alocac;ao e administraC;80 de recursos; enquanto que a

prolifera~ao de ferramentas sofisticadas de acesso possibilita combinar varias fontes

de dados de estruturas distintas e concretiza, assim, antigas promessas de gerencia

participativa e menor concentra~ao de poder decisorio [2].

1.2.3. Hierarquia Classica Da Informa~ao Na Empresa

Piramide com tres niveis: [9]

1° Nivel (Topo da Piramide) e 0 Nivel Estrategico: EIS-Sistema de

Informa~6es Executivas .

2° Nivel (Meio da Piramide) e 0 Nivel Tatico: DSS-Sistema de Suporte a

Decisao.

3° Nivel (Sase da Piramide) e 0 Nivel Operacional: Sistemas Operacionais

Page 32: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

22

o patrocinio efetivo da alta administra~ao da empresa e critico. E esse

patrocinio naD pode S8 revelar apenas na hora de assinar a cheque. A empresa

precisa fornecer as analistas do negocio, aqueles tecnicos que conhecem

profundamente a informa~ao e 0 neg6cio da empresa [9].

1.2.4. Motiva~ao Da Empresa No Mercado

o verdadeiro impulso para a utiliza~ao da tecnologia de data warehouse

come~ou quando as pessoas perceberam que as informa~6es disponiveis no data

warehouse poderiam ser utilizadas para a obten~ao de vantagem competitiva. Esta

informa9ao apoiou a habilidade da corporac;ao em atrair e manter parte do mercado,

reduzir despesas e aumentar as vendas. Estes atributos elevaram 0 data warehouse

para a vanguarda de sistemas de infonma~ao, tornando-o promissor tanto para 0

profissional tecnico da informaC;:8o quanta para 0 profissional da area de negocios

[13].

Estarnos vivendo 0 inicio da era da infonma~ao. Nela os grandes desafios

sao a integraC{8odos processos operacionais entre as empresas e 0 gerenciamento

do neg6cio atraves da analise dos fatos para identifica~ao de oportunidades [25].

1.2.5. Necessidades e Beneficios Para 0 Usuario

A necessidade principal do usuario e a transfonma~ao dos dados em

informa~6es [13].

Embora 0 seu usa ainda seja incipiente, alguns resultados positivos parecem

dernonstrar que realmente 0 data warehouse produz urn alto retorno sabre 0

investimento. A grande vantagem de um data warehouse e permitir a tomada de

decis6es baseadas em fatos. Na verdade, ele busca disponibilizar Ii organiza~ao 0

grande volume de dad as que foram e estao sendo armazenados em bases de dados

operacionais, espalhadas por toda a empresa [29].

Page 33: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

23

o principal resultado de urn data warehouse e. indiscutivelmente, a

facilidade de os gestores da empresa poderem tomar decis6es rapidas, baseados

em informa<;6esmais consistentes [29].

Levantamentos realizados junto a usuarios em ambito rnundial e local

atestam 0 sucesso dos projetos ja implantados, nos quais os primeiros resultados

apontaram para: aumento do tempo dos tomadores de decisao (decision makers)

para a analise e tamada de decisao; elimina<;ao de tarefas operacionais como

pesquisa e identifica<;iio dos dados necessarios ao processo decisorio; melhor

confiabilidade das informa<;6es devido il implanta<;iio de um elo integrador dos

dados transacionais; racionaliza<;iio do fluxo de informa<;6es da empresa;

padronizac;ao dos conceitos de negocio; democratiz8980 das informayoes sobre 0

desempenho do negocio [22].

1.2.6. Perfil Do Usuario Na Empresa Que Utiliza 0 Data Warehouse

o usuario, 0 forrnulador de perguntas, e 0 ponto mais critico nos projetos de

data warehouse. Idealmente, os usuarios devem ser membros da equipe de projeto,

desde 0 seu nascimento [9].

Cada interac;ao do data warehouse deve ter urn "Patrocinador Executivo" da

area de neg6cios da comunidade usuaria que serao as primeiros beneficiaries da

funcionalidade destas interac;oes. 0 Patrocinador Executivo e especialmente

importante para 0 data warehouse. Ele define 0 escopo e requisitos do negocio e

analisa as necessidades de informac;ao da organiza<;ao para a tomada de decisao.

EXistem, tambem, dois importantes papels adicionais na comunidade de usuarios

finais: Especialista do Assunto e Tecnico de Apoio ao Usuario [13].

a Especialista do Assunto e quem facilita a comunica<;ao entre os usuarios

finais e a equipe tecnica do data warehouse. Prove as infonna<;6es para definir 0

escopo de uma intera<;iio do data warehouse. Participa no projeto e revisiio da

aquisi<;iio e capacidade de acesso aos dados. Assiste 0 treinamento de outros

Page 34: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

24

usuarios em seus grupos funcionais. Atua como suporte a Qutros usuarios em suas

areas [13].

o Tecnico de Apoio ao Usuario prove apoio tecnico global para as usuarios

do seu departamento, grupo, linha de negocio, etc.; entende 0 ambiente tecnico de

uma area especifica do data warehouse, presta apoio como administrador de banco

de dados local e apoio tecnico aos usuarios locais [13].

Urn ingrediente essencial para 0 sucesso do ambiente do data warehouse e 0

fator humano. 0 melhor projeto e a melhor arquitetura no mundo nao sao bem

usadas S8 nao existirem pessoas capazes e preparadas para colocarem as pianos

em a~ao [14].

1.2.7. Analise Do Ambiente Legado

Situada entre 0 ambiente operacional, 0 data warehouse e 0 deposito de

dados operacionais esta a interface de integra~ao e transforma~ao dos dados. Esta

interface e 0 local onde 0 dados nao integrados do ambiente operacional sao

integrados e enviados ao data warehouse [13].

Como todo 0 data warehouse depende dos dados disponiveis nas bases de

dados operacionais da empresa, 0 primeiro passe para sua constru~ao e 0

mapeamento dessas bases, sua limpeza e sincroniza~ao com as demais camadas.

Para isso, e extremamente necessaria conciliar em urn unico ambiente a

administra~ao de todas as bases de dados operacionais que sao fonte de

alimentay80 para a data warehouse com a administrayao do data warehouse em si

[22].

Criar um data warehouse nao e uma simples questao de escolha de banco

de dados ou ferramentas, mas envolve planejamento e modelagem (aspectos que

garantem a qualidade dos dados, fator critico para 0 sucesso do projeto), escolha de

ferramentas e atualiz8980 e refinamento continuos. E, de fato, uma arquitetura

completa e que se compoe dos seguintes elementos principais: bases de dados

Page 35: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

25

operacionais, que sao as fontes primarias das informa~6es;processos de extrac;ao e

conversao de dados; bancos de dados especificos para data warehouse; recursos

de administra9ao e ferramentas de inteligencia de negocios, que facilitam 0 acesso,

manipulac;ao e analise dos dados contidos no data warehouse [24].

Urn armazem de dados e composto de tres areas funcionais distintas, cad a

uma das quais deve ser customizada para satisfazer as necessidades do negocio. aprimeiro componente e a aquisic;aode dad as, pedendo ser de sistemas legados ou

de outras fontes quaisquer. La 0 dado e identificado, copiado, formatado e

preparado para ser carregado no armazem. 0 segundo componente do armazem eo espa90 de armazenamento e 0 terceiro e a area de acesso aos dados [26].

1.2.8. Equipe De Desenvolvedores

o cresci menta do data warehouse criou a necessidade de disciplinar 0

gerenciamento do mesmo que e 0 papel do administrador do data warehouse

(DWA). 0 DWA e parte administrador de dados, parte administrador de banco de

dados, deve posicionar-se um pouco como usuario final, um pouco programador de

sistemas e muito de programador e projetista de aplica9ao [13].

o administrador do data warehouse e um disciplinador organizacional que

apareceu com 0 advento do data warehouse e dos sistemas de apoio a decisao. Ele

eo principal responsavel para 0 sucesso continuo do armazem de dados . Em suma,

o administrador do data warehouse e responsavel por um ambiente inteiro de

suporte a decisao que e 0 fator crucial para 0 sucesso da corpora9ao [13].

1.2.9. Aspectos Da Implementa9ao Fisica (Rolap/Molap)

Quanto a localizayao dos dados a serem utilizados na analise, atualmente

existem duas abordagens: [6]

• Um banco de dados multidimensional especializado [6].

• Um data warehouse implementado com a tecnologia de banco de dados

relacional, mas otimizado para a tarefa de analise: Nesse casa, as dados

Page 36: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

26

sao modelados utilizando um esquema projetado para balancear

desempenho e volume de dados. Normalmente e utilizada uma

representayao desnormalizada da conhecida par esquema estrela [6].

Sistemas OLAP que implementam a primeira abordagem sao chamados de

MOlAP (Multidimensional OLAP) e aqueles que implementam a segunda sao

chamados de ROlAP (Relacional OlAP) [6].

Sistemas ROlAP fornecem analise multidimensional de dados armazenados

em uma base de dados relacional [6].

A principal vantagem de se adotar uma solu,ao ROlAP reside na utiliza,ao

de uma tecnologia estabelecida, de arquitetura aberta e padronizada como e a

relacional, beneficiando-se da diversidade de plataformas, escalabilidade e

paralelismo de hardware [6].

MOlAP ou ROlAP? Qual escolher? Atualmente existe um grande debate

sabre essa questao e, S8 passivel, esse debate deve ser deixado para os

fornecedores. Para quem utilizara a tecnologia, 0 mais importante e entender as

negocios da empresa para entao decidir pela solu,ao que melhor atende 0 volume

de dados e as necessidades de analise da empresa [6].

Provavelmente esse debate nao tera urn vencedor. Ja se percebe que existe

uma convergencia dessas duas tecnologias. Fornecedores MOlAP tem adicionado

funcionalidade ROlAP nos seus produtos e, igualmente, fornecedores ROlAP tem

ennquecido a funcionalidade e desempenho de seus servidores [6].

1.2.10. Performance

A dura,ao de tempo desde 0 momento em que um pedido e emitido ate 0

primeiro resultado recebido [13].

A maio ria das consultas dos usuarios precisam processar rcflpida e

eficientemente. 0 administrador do data warehouse e respons8vel pela performance

Page 37: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

27

de carga de dados, criayao de indices e manutenyao de metadados, itens

importantes ao analisar a performance [13].

1.2.11. Seguranya

Proteyao dos dados em um banco de dados que gerencia os acessos com

ou sem autorizac;ao. Hil niveis diferentes de seguranya conforme 0 perfil do usuilrio

[13].

o problema de proteger as informac;6es do data warehouse e normalmente

colocado em segundo ou terceiro plano. Temos que saber quem estil acessando as

informac;oes, de onde e como S8 esta manuseando. as bancos de dados tern seus

esquemas de seguranlfa, porem eles nao conseguem resolver todos as problemas.

E necessaria procurar uma so[uc;ao que realmente consiga evitar que as intrusos e

curiosos consigam tirar proveito dessas informay6es[20].

Page 38: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

28

2. ESTUDO DE CASO: ALGUNS EXEMPLOS

De acordo com 0 embasamento te6rico apresentado, iniciarei 0

desenvolvimento das eta pas do projeto considerando aspectos essen cia is para 0

modelo dimensional e exemplos de estudos de caso voltados as necessidades de

Organiz890es Educacionais.

2.1. FATORES CRiTICOS DE SUCESSO

Prime ira mente, e de extrema importancia elencar as principais itens que

determinarao 0 sucesso do projeto. Abaixo estao alguns itens importantes:

1. E fundamental planejar 0 projeto.

2. E importante ter 0 on;amento aprovado para desenvolver 0 projeto de

acordo com 0 plano de investimento da empresa.

3. E importante que a empresa esteja disposta a modernizar-se para garantir

o crescimento e a competitividade.

4. E importante ter 0 apoio e 0 empenho dos usuarios responsaveis e suas

respectivas ger€mcias atraves de atitudes participativas e cooperativas.

5. E fundamental ressaltar a importancia das informa<;6es para a empresa e.

em especial, 0 compartilhamento das mesmas, evitando duplicidade de

dados e informa90es proprietarias.

6. E necessaria negociar urn acordo com a alta actministraqao referente aproposta de implementa<;ao do projeto.

7. E importante primeiro analisar as areas de atua<;ao mais lucrativas da

empresa.

8. E importante analisar a conten<;ao de custos.

9. E imprescindivel que as informa90es sejam precisas, consistentes e

rapidas de obter.

10. E importante ter a capacidade de adapta<;iio as necessidades de neg6cio.

Page 39: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

29

11 E necessario apresentar resultados entre as eta pas do desenvolvimento

do projeto.

Ap6s definir as fatares criticos de sucesso do projeto, devera S8 iniciada a

analise de qual tecnica de desenvolvimento de sistemas mais se integra aconstru9ao de um projeto de data warehouse.

2.2. DEFINI<;:AO DA TECNICA DE DESENVOLVIMENTO DE SISTEMAS A SER

UTILIZADA

E de extrema importancia utilizar uma tecnica para desenvolvimento de

sistemas para auxiliar no projeto do data warehouse. Sugiro a tecnica da Engenharia

da Informa9ao em virtude de os dados serem 0 enfoque principal desta tecnica e em

um data warehouse 0 objetivo principal e a transforma9ao dos dados em

informac;oes.

Como produto principal desta tecnica temos 0 modelo de entidades e

relacionamentos (MER). Um MER e va lido e confiavel quando consegue responder

as perguntas dos processos que serao par ele atendidos.

Tendo definida e assirnilada a tecnica de desenvolvimento de sistemas a ser

utilizada no projeto, e lmportante entender quais sao as necessidades do usuario,

diferenciando-as entre 0 ambiente analitico e 0 operacional.

2.3. VISUALIZAR AS NECESSIDADES DO USUARIO

o usuario e 0 fator chave para 0 sucesso do projeto. Sua participa9iio efetiva

durante todo 0 projeto e 0 requisito mais irnportante pO is ele e quem domina a area a

ser analisada e ira dirimir as duvidas do analista da informa9ao que implementara 0

projeto.

a usuario necessita de urn sistema que forneya informac;oes para que deci-

soes sejam tamadas de acordo com a analise destas informa90es. Ha a

Page 40: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

30

necessidade de entender a diferen\=8 entre as sistemas de processamento

operacional e a analftico.

Sistemas de processamento operacional sao sistemas que suportam as ope-

rac;oesdo dia a dia da empresa. Sao sistemas de processamento on-line atualizados

ao longo do dia. Exemplos: Sistema de Estoque, Sistema Contabil, Folha de Paga-

mento, etc. As informac;oes refletem 0 momenta atual [15].

Sistemas de processamento analitico disponibilizam infonmac;6es usadas

para analisar urn problema au uma situag8o. E feito par meio de comparac;oes ou

atraves da analise de padroes ou tendencias. As informac;6es refletem um instante

especifico no tempo. Exemplos: mostrar como uma marca de um produto esta sendo

vendida em diferentes estados; mostrar como uma marca especifica de urn prod uta

esta sendo vendido desde que foi introduzido nas lojas; comparar as vendas dessa

marca de produto em diferentes localidades, etc. [15].

Tendo definidas e assimiladas quais sao as necessidades do usuario, eimportante entender a mudanc;a de enfoque em um projeto de data warehouse no

que se refere as infonmac;6espara a tomada de decis6es. Durante este processo, e

fundamental a participac;ao do usuario e 0 pleno entendimento dele nesse novo

processo de analise da informac;80.

2.4. NOVA VlsAo DA INFORMA<;AO PARA A TOMADA DE DECISOES

o que buscamos quando estamos modelando sistemas de informac;ao e 0

entendimento operacional do negocio que esta sendo modelado, sem pensar na

aplic8C;80em si, sem pensar na tecnologia envolvida, mas com a visao relacional de

dados. Quando vamos executar uma modelagem multidimensional, estamos dese-

nhando soluc;6es de gestao de negocios, buscando entender como os executivos e

gestores de uma organiza98o avaliam as informac;6es para adoc;ao de estrategias e

avaliac;ao de desempenho. A mudanc;ade enfoque de "entendimento operacional do

negocio para entendimento da gestao do negocio" concentra e provoca diferenc;a

Page 41: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

31

acentuada na forma de se desenvolver um modelo de dados multidimensional. A

analise multidimensional requer urn modele de dados que permita que as dados

sejam facilmente visualizados atraves de diversas perspectivas. Mais adiante

apresentarei como aplicar a modelagem dimensional.

Abaixo cita urn exemplo de uma nova visao da informat;ao com a utiliz8C;:80

do data warehouse:

"0 data warehouse e parte fundamental da soluc;ao, que analisa 0

comportamento do cliente, informando em caso de desvio padrao. Durante testes em

um banco australiano, por exemplo, foi identificado um deposito que fugia aos

padroes do correntista. 0 banco entrou em contato com 0 cliente e descobriu que 0

deposito fora um presente de casamento - 0 valor da quitac;aode uma casa. A partir

dessa informac;ao, desenvolveu promoc;oes para aquele cliente especifico, que

conseguiu um emprestimo para acabar de montar sua casa [11]".

o passe seguinte e como analisar a area do negocio a ser modelado.

2.5. ANALISE DO NEGOCIO A SER MODELADO

Primeiramente definir os objetivos do projeto que podem ser resumidamente

descritos nos dais itens abaixo:

1. Disponibilizar as bases de dados do ambiente operacional (OLTP) para

um ambiente analitico (OLAP).

2. Permitir aos usuarios a extrac;aodos dados atraves de analise exploratoria

no ambiente OLAP.

Definir 0 escopo do projeto, observando:

• Caracterizar a problema: 0 dado deve ser representacto como informac;ao

• Definir quais processos sao mais criticos para a negocio e que precisam

de decis6es sabre ele.

o Assimilar 0 conhecimento e definic;ao da area de atuac;ao (negocio) do

cliente especifico e tomada de decisao.

Page 42: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

32

• Definir grupo gestor da informa9ao que ira participar durante todo 0

processo de desenvolvimento do projeto. 0 grupo gestor pode ser

considerado como os usuarios que dominam a area de neg6cio e que

tomam decis6es, juntamente com 0 pessoal de informatica.

Eo extremamente importante a defini9ao do escopo do projeto pois e a base

do mesmo. No escopo deve ser descnto se a implementa9ao sera em urn data

warehouse (base corporativa que atendera teda a organiz898o) au em urn ou varios

data mart's (base de informa9aopor linha de neg6cio que contem urn sub-conjunto

dos dados corporativos da organiza9ao). Recomenda-se iniciar com data mart's

integrando-os a urn data warehouse ao longo do tempo, Isto justifica-se pelos

seguintes aspectos:

o custo e bern infenor a implantar urn data warehouse de toda a

empresa;

• 0 tempo de implementa9aoe reduzido;

Mais facil assimilar a atua9ao de uma area de neg6cio especifica a

entender todo 0 processoda empresa,

Optando-se por implementar em data mart's, deve-se ter 0 cuidado de nao

esquecer a integraC;8o entre as data mart's caSa contn3rio 0 projeto e inviabilizado.

Tendo definida a area de neg6cio da empresa a ser implementada no

projeto. deve-s8 analisar enda estao as informaf):oes que alimentarao 0 data

warehouse I data mart(s). A origem destas informa90ese comumente chamada de

"Iegado".

2,6. ANALISE DOAMBIENTE LEGADO

Partindo das necessidades de informa9ao por area de neg6cio ja estarem

definidas, nesta analise deve-s8 observar 0 seguinte:

• Analisar 0 ambiente computacional da empresa.

Page 43: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

33

S8 as informac;:6es necessarias estao armazenadas nos aplicativQs

operacionais au, casa contrinio, manter as aplicativos operacionais para

que obtenham os dados que faltam. Verificar viabilidade deste tipo de

manutem;:8o para gerar a informac;:ao que falta no sistema analitico.

• Definir como integrar as varias fantes de informac;:ao, S8 houverem.

o grande fator de sucesso de projetos incrementais de data martsl data

warehouse est'; na transforma,ao, extra,ao, prepara,ao e limpeza dos dados.

Oefinir criteriosamente as necessidades, forma, fontes e as regras de mecanismos

de transfonma,ao como, por exemplo, a padroniza,ao do conteudo dos dados.

Supondo que, no ambiente operacional, a informa,ao sexo do cliente est.;, em

alguns sistemas, como "F/M" e em outros "1/2". Ao carregar esta infonma,ao no data

warehouse, deve-s8 definir urn unico padrao para conteudo do mesma dado

originario de fantes distintas.

A proxima etapa Ii a constru,ao da modelagem dimensional.

2.7. MODELAGEM DIMENSIONAL DOS DADOS

Utilizarei como tlicnica principal para a modelagem de dados dimensional 0

star schema que e a tecnica mais indicada para projetos de data warehouse.

Muito importante Ii documentar 0 modelo de dados em uma ferramenta

CASE onde definem-se as tabelas, atributos, dominios, enfim, todas as informa,5es

necessarias para garantir a plena documentay8.o do modele e facilitar a geraCfao dos

esquemas fisicos no banco de dados, principal mente em bancos de dados

relacionais.

Considere a seguinte afirmativa: "Nos vendemes produtos em varios merca-

dos enos medimos nosso desempenho ao longo do tempo".

o modele de dados rna is adequado para representar diversas rela90es entre

grandezas Ii 0 modelo dimensional. [15]

Page 44: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

34

Para melhor visualizar as dimens6es, abaixo esta representado urn "cuba"

propriamente dito com 3 dimensoes:

TEMPO

vMERCADO

Cada ponto do cubarepresenta umacombinacao de

Produto, Mercado eTempo armazenado.

PRODUTO

A seguir, definirei as conceitos basicos que norteiam a modelagem

dimensional:

2.7.1. Dimensoes

Representam as possiveis formas de visualizar as dadas. Sao as entradas

para as consultas (tempo, regiao, cliente, etc). A base para entendimento de qual-

quer neg6cio e responder as quatro perguntas fundamentais abaixo:

1. QUANDO?

2. 0 QUE?

3. ONDE?

4. QUEM?

(Periodo de tempo a que se refere a analise)

(0 principal objeto de analise)

(Localiza,ao fisica ou geografica para analise)

(Um objeto especifico e detalhado para analise: opcional)

Dimensao mascarada: E aquela dimensao com pouquissimas ocorremcias.

Exemplo: Dimensaa Tipo Cliente - Ativo ou Inativo. Nao S8 cria uma tabeJa dimen-

sao com essas ocorremcias e sim usar esta dimensao como restri980 na clausula

where da consulta. No modelo pode au nao ser representada como uma dimensao

ligada a tabela fatos.

Page 45: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

35

2.7.2. Fatos

E a tabela central que interliga as dimensoes e tern os indicadores de analise

ou metricas (quantidade, valores,etc). A tabela fato devera possuir, no minimo, as

tres primeiras dimens6es. A pergunta "QUEM?" refere-se a um nivel de analise mais

detalhado.

2.7.3. Exemplo de uma analise dimensional.

"Precisamos analisar a quantidade e valor faturado dos produtos de nossa

empresa em nossas lojas para medirmos nossa desempenho aD longo do tempo".

Partindo da premissa aeima que reflete a necessidade de informa9ao do usuario, 0

projetista do data warehouse faz 0 primeiro esbo,o da modelagem dos dados de

acordo com as 4 perguntas fundamentais:

1. QUANDO: Periodo de tempo. De acordo com a necessidade de analise do

usuario. Pode ser: dia, semana, quinzena, mes, bimestre, trimestre, se-

mestre, ana, etc.

2. 0 QUE : Produtos oferecidos pela empresa.

3. ONDE : Lojas da empresa.

4. QUEM : Opcional. No exemplo acima essa pergunta na~ se encaixaria

po is nao foi solicitada como objeto de analise. Param, case 0 usuario ne-

cessitasse saber quais as maiores clientes que efetuam compras de de-

terminados produtos, ai sim a informa<;ao Cliente S8 enquadraria na per-

gunta "quem".

Ate agora foram definidos os objetos de analise, no caso as dimensoes de

consulta. Obviamente nenhum resultado aparente sera apresentado combinando as

referidas dimensoes pois 0 que esta faltando sao os fatos ainda nao analisados no

modelo. Os fatos ou medidas sao 0 elo de liga,ao entre os varios tipos de combina-

90es de consulta entre as dimensoes. Eo que sera medido, no caso 0 faturamento e

a quantidade de produtos. Sempre sao definidos como numeros que podem ser me-

Page 46: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

36

didos, sumarizados e calculados. No exemplo, as fatos sao: quantidade de produtos

e valor falurado.

Em seguida, projelarei 0 modele de dados ulilizando a lecnica star schema,

que consiste em uma tabela cenrrar(fatos), relacionada com as dimens5es. A

estrutura final parece uma estrela, por isso a denomina,ao da tecnica. As tabelas

dimensoes sao tabelas independentes, ou seja, possuem uma (mica chave primaria

e atributos que a identificam e que sao utilizados para a consulta. Sao tabelas des-

normalizadas. A tabela fatos e uma tabela dependente das dimens5es ou seja, sua

chave primaria e a combinayao das chaves primarias das dimensoes e os atributos

para analise sao as fates ou medidas, no nossa exemplo 0 valor faturado e a

quantidade de produtos.

Obs: No exemplo abaixo da tecnica star schema, as chaves primarias de cad a tabela

estao em negrito.

DIMENSiio TEMPODIMENSiio PRODUTO

Chave_tempo

GChave_produto

Data_Venda ,/ DescricaoDia da SemanaMeg - MareaAno

FATOS VENDAS Categoria

Chave_tempoChave_produtoChave_loja

Valor Faturado I~Quantidade_ Vend idaDIMENSiio LOJA

Chave_loja

NomeEnderecoCidadeUF

Page 47: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

37

• As chaves primarias das tabelas padem ser, um numera sequencial au a propria

data da venda, codiga do praduta e codiga da laja, desde que esteja garantida a

unicidade da chave primaria em cada tabela dimensaa .2.7.4. Agrega90es

E um fatar impartante a analisar ja que a principal abjetiva de uma agrega9aa

e preyer urn aumento de performance no acesso aos dados e reduzir 0 volume de

dadas na tabela. As agrega90es (au sumariza90es) cansistem em gerar infarma90es

redundantes a partir da informa9aa de menar granularidade [15]. As agrega90es:

• Farnecem niveis multiplas de detalhe do fata [18].

Os resultados das queries (au seus valores intermedii'lrios) sao pre-

calculadas, a que melhara muita a performance [18].

• Podem ser acumuladas atraves de agrupamentos diferentes.

FreqOentemente atraves de varias dimens5es ou combinagoes de

dimensoes [18].

Numero da Loja'--- ~ Data da Transac;tlo

Numero de ClientesQuantidade de ProdutosValor das Vendas

Agregam-se varios fatos par Loja par Dia:

1[ Numero de clientes - Quantos clientes fizeram compras?

1t Quantidade de orodutos - Quantas unidades de orodutos foram vendidas?

Page 48: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

38

2.7.5. Metadados

Metadados sao dados sobre dados que podem ser entendidos como

verdadeiros documentadores dos dados que compoem um data warehouse.

Os metadados armazenam diversas informa90es sabre dados armazenados

no data warehouse. Estas informa90es sao armazenadas em urn reposit6rio que tern

como abjetivo principal documentar e administrar os metadados.

Os metadados englobam a data warehouse e mantem informac;oes sabre a

estrutura dos dadas, as fontes de dados, a transforma9ao dos dados, as rotinas de

extra9aO de dados, 0 modelo de dados, relacionamentos e demais informa90es

pertinentes a dar significado ao dado.

Recomenda-se a utiliza9aOde uma ferramenta CASE para documenta9aO dos

processos, modelos de dadas, dicionario de dadas, dominios de atributos e gerac;ao

dos esquemas fisicos no banco de dados.

2.7.6. Resumo das etapas para a modelagem dimensional.

A seguir apresentarei, resumidamente, as etapas importantes a serem

seguidas na modelagem dimensional.

1. Obter a necessidade executiva: qual 0 neg6cio objeto de gestao.

2. Entender quais sao os indicadores de valor do neg6cio definindo as

metricas de controle.

3. Descrever em urn modele de dados conceitual 0 neg6cio.

4. Se houverem modelos de relat6rios do ambiente operacional: simular.

5. Definir 0 que descreve 0 neg6cio: dimensoes.

6. Definir a organiza9ao da dimensao tempo: qual a menor unidade de

tempo.

7. Trabalhar com a conceito de hierarquia nas dimens6es de consulta: Par

exemplo uma hierarquia na dimensao tempo: Dia -> Mas -> Trimestre ->

Semestre -> Ana

8. Definir a tabela fatos.

Page 49: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

39

9. Montar 0 star schema.

A modelagem dimensional e aplicada para visualizarmos as dados

referentes as necessidades do uswirio para obtenc;aoda informac;ao em um sistema

analitico. 0 modelo de dados dimensional independe de qual banco de dados sera

implementado (ROLAP ou MOLAP).

2.8. ESTUDOS DE CASOS REAIS (NECESSIDADES DO NEGOCIO E

MODELAGEM DIMENSIONAL).

Nos estudos de caso que serao apresentados a seguir, demonstrarei

algumas necessidades basicas de analise da informac;ao sobre a area de atuac;ao

do cliente e a modelagem dimensional utilizando a tecnica star schema. Para efeito

de demonstrac;ao da modelagem de dados dimensional, as dimensoes conterao

somente informa90es principais. As mesmas poderao ser detalhadas conforme

necessidade do usuario.

Os estudos de caso que serao apresentados em seguida sao objetos de

exemplificac;ao da utilizac;aoda tecnologia de data warehouse na construc;ao de data

marts voltados a area educacinal para 0 Estado do Parana. Informac;oes detalhadas

serao incorporadas ao modele de dados de acordo com a necessidade de quem

utilizara estas informaQoes.

Page 50: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

40

2.8.1. Data Mart Para Informa90es Gerenciais de Matriculas de Alunos e Vagas

Necessidade do usuario: "Precisamos analisar a quantidade de alunos

matriculados e quantidade de vagas preenchidas e disponiveis nas escolas do

Estado para permitir consultas par data de matricula , nucleo da secretaria,

municipio e escola.

Oimensao Tempo~aMatricula

!AnoMatriculaMesMatriculaDiaMatricula

I AnoLetivo

Fates Matriculas AlunosrDataMatricula (FK)I CodigoNucleo (FK)

-_I g~~:~~~:~~~P:~~~K).-- ---

rQtdVagasDisponivellatdVagasPreenchidas LDimensao Nucleo Secreta ria ,

~djgoNucleo

NomeNucleo

Considera90es de pesquisa: As dimensoes sao os criterios desejados de consulta as

informagoes da base de dad os. Ha varias possibilidades de consulta as informagoes

na tabela fatos como, por exemplo:

• Total de vagas preenchidas e disponiveis nurn periodo de matricula

• Quantas escolas ainda tern vagas disponiveis em urn determinado municipio

• Quais sao as escolas que rna is tiveram matriculas efetuadas

• Quais sao as escolas que tern rna is vagas disponiveis

• Total de vagas preenchidas x disponiveis por municipio,nucleo,escola

• Etc (As possibilidades de consulta sao de acordo com as combina90es de uma

ou mais ou todas as dimensoes de acordo com as necessidades do usuario)

Obs: FK - Foreign Key (Chave estrangeira) sao as chaves primarias das tabelas

Dimensao que, combinadas, formam a chave primaria da tabela Fatos Matriculas

alunos.

Page 51: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

41

2.8.2. Data Mart Para Informa90es Escolaridade dos Professores

Necessidade do usuario: "Precisamos analisar a quantidade de professores e

sua respectiva escolaridade para podermos analisar a necessidade de realoca9ao

de professores de acordo com seu nivel de instrug80 por escola e municipio no ana

letivo.

DimensaoTempo

O F~sEscoiaridadeProfessores_JAnol.eliw~K)

!CodiQOMuniciPio(FK)CoIgoEscoa(FK)

llmensaoMunic~ CoIigoEscoiaridade(FK) Dimensao Escolaridade Pro!esSOf

Codigo~~ 'IOtdProlessaes --iCodigoEScolaridad~NOOIeMunlcipio 1 \OescricaoEscotaridade

IlocalEsc.aridade

DimensaoEscota

Page 52: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

42

2.8.3. Data Mart Para Infonna90es de Alunos no Ano Letivo

Necessidade do usuario: "Precisamos analisar a quantidade de alunos,

turmas, aprov898o, reprov898o, frequencia , caracteristicas da matr!cula no ana

letivo nas escolas do Estado para pennitir consultas das quantidades de alunos, p~r

idade aluno, sexo, turma, turno, nucleo da secretaria, municipio e escol8.

DimensaoMunicipioCodigoMu-;;d~o - I

IN;;;Mu;;'- -

Dimell~Tempo_ FalosEsclXaridadeProfessoresiA;;;Lei;",(fK) --,-'1Coo'igoMunicipio (FK)CodigoEscola(FK)

ICodlgoNucleo (FK)COO'goTumo(fK)

_,CochgoTurma{FK)

I

Cod,go~ade(fK)CodigoSexo(FK)

Dimensiio Nutleo Secretaria OtdTotaiMatnculas -Icoo;-;~;- -=- ~ QldTolalAbandonosNameNucleo -'IQldTotaiSemFrequencla

QldTotalComFrequencla

Dimemao Tumo ~~~::=::s__ • OtdTotalReprOlooos

IO'dAlunOSNOIOSQtdAlullOSAntlgos

i::JDimensaoSexo-0DimensaoTurma

JCodiQOTUrm-;-

rDeSCritaOTurmaSi~aTurma

Page 53: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

43

CONCLUSAO

Este trabalho forneeeu-me fundamenta9ao teoriea e embasamento sufieientes

para projetar um modelo de dados dimensional para facilitar a obten9ao de

informa90es gereneiais e estatistieas referentes a Eduea9ao. Aeredito que 0 objetivo

proposto fai amplamente atingido dando condic;6es a urn profissional, mesma nao

atuando na area de informatica, sem nenhum conhecimento em data warehouse, a

S8 familiarizar com as novos termos, planejar e desenvolver urn modelo conceitua]

para um projeto desse nivel. 0 referido trabalho demonstrou a aplieabilidade na area

edueacional e tambem pode ser aplieado para a eonstru9ao de projetos em varias

areas de atua9ao. Considera90es importantes:

• Data warehouse naD e modismo, ternaU-S8 uma necessidade para a

organiz8c;ao.

• Data warehouse naD resolve as problemas da organiz8C;8oS8 naD houver 0 fator

humano para analisar as resultados e tamar as decis6es.

• E fundamental 0 envolvimento do usuario em todo 0 proeesso (usuario que atua

na analise de informa90es para a tomada de deeisao). Sao poueos os usuarios

com este perfil.

• A tecnica mais adequada para a modelagem dimensional e a star schema.

Utilizar a modelagem dimensional.

No cenario atual onde 0$ executivos precisam tamar decis6es rapidas e

cert8iras em resposta aos diversos eventos que ocorrem a todo instante no

mercado, faz-se necessario construir todo um mecanismo de suporte H3pido e

eficiente aos processos decis6rios. 0 data warehouse e uma ferramenta apropriada

para este tipo se situa9ao. Se bem projetado, permite aos gerentes obterem

informa90es rapidas e confiilveis que Ihes servirao de suporte para a solU(iao de

seus problemas e para atingir os objetivos propostos para os negocios.

Page 54: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

ANEXOS

SUGESTAo DE UMA TABELA DIMENSAo TEMPO DETALHADA [21].

Data da Transa~iio

Indicador de ultimo dia do mesAnoQuartil (Trimestre)MesSemanaDia da SemanaDia do MesDia do QuartilDia do AnoIndicador de FeriadoSemana do MesSemana do QuartilSemana do AnaIndicador de ultima semana do mesIndicador de ultima semana do quartilMes do QuartilAna FiscalQuartil FiscalMes FiscalSemana FiscalDia da semana fiscalDia do mes fiscalDia do quartil fiscalDia do ana fiscalIndicador de ultimo dia do ana fiscalSemana do mes fiscalSemana do quartil fiscalSemana do ana fiscalIndicador de ultima seman a do mes fiscalIndicador de ultima semana do quartil fiscalIndicador de ultima semana do ana fiscalMes do quartil fiscal

44

Page 55: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

45

FIGURAS

Vendemos 1 Milhao de Reais !

Quando?

Oqu~?

Laranja

~.,.,. I~~,~

- ;.;; I~";;':"1. ~ -"

Onde?Tamate

Arroz

Regj;~oRegiaoRegiao

Chocolate

1996 1997 1998 1999

Tempo

[21] Figura 1 - Exemplo de um Cuba Dimensional

TERRITORIOCHAVE DE TERRITORIO

NOME DO TERRITORIO

MESCHAVE DE MES

NOME 00 MESANOTRIMESTRE

[21} Figura 2 - Exemplo de uma Estrutura Star Schema

Page 56: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

LlEslocagem

ChaV1l_Produl0 (FK)Chave_Tipo (FK)Chave_Categoria (FI<)Chave_Tempo (FK)

Quanlidade PerdidaQuanlidade-DanificadaPreco de CUSIO

Preco=de=venda

DalaDiaNome DiaMes -Nome Mes"", -Trimestre

[21] Figura 3 - Exemplo de urna Estrutura Snow-Flake

DreameniD des esa~numereereamenlo~mes

Q diadespesat.\5I!queneiadespna

valDrDreamenlodalaoreamenlo

mes(FK)codigotipodedespesa(FK),.r,numelooleamento(FK} "fJlnomefamiliar(FK)

Ivalordadespesalipodespna

r----3 ~olcamenioportipodedespna l~codigolipodedespesa(FK) I~mes(FK)~ numerooreamento(FK) 4

~ tipode despeu

1L-__ -+,}I'~~,~"~d~igD~b~.~'d~'-d~"~.,~,,~1

I I nomedolipo Ivalor ercadovalorrealizadoperedentualorcadopercentualrealizado

(21) Figura 4 - Exernplo de urn Modelo de Dados (MER)

46

Page 57: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

47

REFERENCIAS

[1] ASSUN<;:AO,Luis. Data Warehousing. Disponivel na Internet. http://www.luis.assuncao.eti.brlluisdwh.htm#item1. 16/11/2004.

[2] COMPUTERWORLD. Data warehouse: dep6sito de boas oportunidades. Riode Janeiro. n.173, p. 17, julho, 1996.

[3] DBMS - TOOLS & STRATEGIES FOR I.S. PROFESSIONAlS. Um Manifes-to do Dimensional Modeling. Rio de Janieiro. Ed. Mantelmedia, n. 7, p.44-50,7 novembro,1997.

[4] EXECPLAN.Disponivel na internet. http://www.execplan.com.br .16/11/2004

[5] Fast Track to Sybase - Student Guide. 1992, Sybase Inc.

[6] FIGUEIREDO, Adriana Maria C.M.. MOLAP x ROLAP: Embate de Tecnolo-gias para Data warehouse. Developer's Magazine. Rio de Janeiro: AxcelBooks do Brasil Editora Ltda. Fevereiro de 1998, nO18 p.24.

[7] FILHO, Trayahu R.Moreira. On-Line Analytical Processing Server (ServidorOLAP). Developer's Magazine. Rio de Janeiro: Axcel Books do Brasil Edi-tora Ltda. Fevereiro de 1998, n018 p.28-29.

[8] FORMA INFORMATICA LTDA. Tecnicas de Modelagem de Dados. SaoPaulo, 26 maio, 1994.

[9] GUTIERREZ, Marco Antonio. Developer's Magazine. Rio de Janeiro: AxcelBooks do Brasil Editora Ltda. Fevereiro de 1998, n018 p.7.

[10] http://osiris.sunderland.ac.uklsst/case2/welcome.htmlem 20101/2000

[11] INFORMATION WEEK. 0 Poder do Data warehouse. Sao Paulo.Ed.ltmidian.12, p. 12,20 outubro,1999.

[12] INMON, W. H. Building the Data warehouse. New York' Wiley ComputerPublishing, 1996.

[13] INMON, W. H., WELCH, J. D. e GLASSEY,Katherine L. Managing the Datawarehouse. New York: Wiley Computer Publishing, 1997.

[14] INMON, Willian H. e HACKATHORN, R. D. Using the Data warehouse.New York: J. Wiley, 1994.

[15] JAMHOUR, Edgar. Sistemas de Banco de Dados. Curitiba,Agosto de 1999.Disciplina do Curso de Especializa<;aoem Gestao da Tecnologia da Inlor-ma<;aoe Comunica<;aoda Faculdade Cat61icade Administra<;ao e Econo-mia.

[16] JORNAL BATE BYTE - CELEPAR (Companhia de Inlonmatica do Parana).Administra~ao de Metadados. Curitiba, edi<;aonO76 em junho de 1998.

Page 58: UTILIZANDO ATECNOLOGIA DEDATA WAREHOUSE …tcconline.utp.br/media/tcc/2016/08/UTILIZANDO-A-TECNOLOGIA-DE-DATA... · - Computer Aided Software Engenering - Mercados de Dados - Diagrama

48

[17J JORNAL BATE BYTE - CELEPAR (Companhia de Infonmatica do Parana).Tecnologia OlAP. Curitiba, ediyao n° 87 em junho de 1999.

JUNIOR TRONCHIN, Valsoir. Apresentayao Sybase: Data Warehousing:Aspectos Estrategicos e de Implementa9ao. Curitiba,1997.

KIMBALL, Ralph. Data warehouse Toolkit. 1.ed. Sao Paulo: Makran Books,1998. 388p.

KONDRATIUK, Edgardo Ruben. Data warehouse: Detalhes que Fazem a Di-ferenya. Developer's Magazine. Rio de Janeiro: Axcel Books do BrasilEditora Ltda. Fevereira de 1998, nO18 p.22.

MACHADO, Felipe. Modelagem de Dados Multidimensional. DBA Enge-nharia de Sistemas. Rio de Janeiro, 1999.

MANNI, Luiz Carlos & DORSA, Luiz Fernando A. Data warehouse: Gerenci-ando a Qualidade dos Dados. Developer's Magazine. Rio de Janeiro:Axcel Books do Brasil Editora Ltda. Fevereiro de 1998, nO 18 p.20.

MANZONI JR, Ralphe. A inteligencia e a Alma do Negocio. ComputerWorldBusiness Inteligence, Rio de Janeiro, n. 285, p.2, 8 maryo, 1999.

NIMER, Fernando.Analisando 0 Retorno Sobre 0 Investimento de Data ware-house. Developer's Magazine. Rio de Janeiro: Axcel Books do Brasil E-ditora Ltda. Fevereiro de 1998, nO18 p.16-17.

OLIVEIRA LEITE., Argemiro A. Informa9ao II Prova de Equivocos. Compu-terWorld Business Inteligence, Rio de Janeiro, n. 285, p.7, 8 mar90, 1999.

PALMA, Sergio. Os Componentes Funcionais de um Data warehouse. Deve-loper's Magazine. Rio de Janeiro:Axcel Books do Brasil Editora Ltda. Fe-vereiro de 1998, nO 18 p.18-19.

PORTFOLIO DE T.ECNOLOGIAS CELEPAR (Companhia de Infonmatica doParana). SQl, Indices, Modelo de Dados, Banco de Dados. Curitiba,30de junho de 1998.

Sybase System 10: Introduction to SQl- Student Guide.1993, Sybase Inc.

TAURION, Cezar. Data warehouse: Vale a Pena Gastar Milh6es Investindoem Um? Developer's Magazine. Rio de Janeiro: Axcel Books do BrasilEditora Ltda. Fevereiro de 1998, nO 18 p.10-11.

TAURION, Cezar. Data warehouse Sera Util Para a Sua Organiza<;:ao? De-veloper's Magazine. Rio de Janeiro: Axcel Books do Brasil Editora Ltda.Fevereiro de 1998, nO18 p.26-27.

VASCONCELLOS, Joao Marcos. Apresenta<;:ao Infonmix: Do Data Mart aoData warehouse, 0 Caminho para 0 Acesso as Informa4)toes Gerenci-ais Estrategicas, Curitiba,1997.

WANG, Charles B., Techno Vision II, ed. Makran Books, 1998.

[18J

[19J

[20J

[21J

[22J

[23J

[24J

[25J

[26J

[27J

[28J

[29J

[30J

[31J

[32J