IMPLEMENTAÇÃO DE SISTEMA DE INFORMAÇÃO …campeche.inf.furb.br/tccs/2000-I/2000-1heintjeingokortevf.pdf · No primeiro capítulo é apresentado o objetivo, como também a organização

UNIVERSIDADE REGIONAL DE BLUMENAU

CENTRO DE CIÊNCIAS EXATAS E NATURAIS

CURSO DE CIÊNCIAS DA COMPUTAÇÃO

(Bacharelado)

IMPLEMENTAÇÃO DE SISTEMA DE INFORMAÇÃO GERENCIAL, BASEADO EM DATA WAREHOUSE,

UTILIZANDO SEAGATE INFO.

TRABALHO DE ESTÁGIO SUPERVISIONADO SUBMETIDO À UNIVERSIDADE REGIONAL DE BLUMENAU PARA A OBTENÇÃO DOS CRÉDITOS NA

DISCIPLINA COM NOME EQUIVALENTE NO CURSO DE CIÊNCIAS DA COMPUTAÇÃO — BACHARELADO

HEINTJE INGO KORTE

BLUMENAU, JULHO/2000

2000/1-29

ii

PROTÓTIPO DE SISTEMA DE INFORMAÇÃO GERENCIAL PARA A PRODUÇÃO, UTILIZANDO TÉCNICA DE DATA

WAREHOUSE

HEINTJE INGO KORTE

ESTE TRABALHO DE ESTÁGIO SUPERVISIONADO FOI JULGADO ADEQUADO PARA OBTENÇÃO DOS CRÉDITOS NA DISCIPLINA DE ESTÁGIO

SUPERVISIONADO OBRIGATÓRIA PARA OBTENÇÃO DO TÍTULO DE:

BACHAREL EM CIÊNCIAS DA COMPUTAÇÃO

Prof. Marcel Hugo — Supervisor na FURB

Marcílio Pereira da Silva — Orientador na Empresa

Prof. José Roque Voltolini da Silva — Coordenador na FURB do Estágio Supervisionado

BANCA EXAMINADORA

iii

DEDICATÓRIA

A Deus, nosso Senhor,

por sua grandeza,

a meus pais, e a todos,

que um dia tive a alegria de conhecer,

e compartilhar momentos.

Dedico a todos que se propõe a mudar a história, visando o bem comum,

em especial ao que se baseiam nos ensinamentos de nosso Senhor Jesus Cristo.

iv

AGRADECIMENTOS

A Deus, pelas idas e vindas,

nestes anos.

A meus pais,

pela atenção, paciência e apoio que demonstraram.

Ao Sr. Marcílio Pereira da Silva,

pelos ensinamentos prestados e pelo interesse na minha formação.

Aos professores da FURB,

que a cada dia repassaram seus conhecimentos.

Ao professor Marcel Hugo,

pelo seu empenho na condução deste estágio.

Aos meus colegas de faculdade,

pelos momentos compartilhados, e pela amizade criada.

E a todos que confiaram em mim.

A todos estes, meus agradecimentos.

v

SUMÁRIO

DEDICATÓRIA........................................................................................................................iii

AGRADECIMENTOS ..............................................................................................................iv

SUMÁRIO..................................................................................................................................v

LISTA DE FIGURAS .............................................................................................................viii

RESUMO ..................................................................................................................................ix

ABSTRACT ...............................................................................................................................x

1 INTRODUÇÃO.....................................................................................................................1

1.1 OBJETIVOS........................................................................................................................3

1.2 ESTRUTURA DO TRABALHO........................................................................................3

2 INDÚSTRIA DE RELÓGIOS HERWEG S.A......................................................................4

2.1 SISTEMAS DE INFORMAÇÃO .......................................................................................4

2.2 SAPIENS – SENIOR SISTEMAS......................................................................................5

3 SISTEMAS DE INFORMAÇÃO..........................................................................................7

3.1 INTRODUÇÃO...................................................................................................................7

3.2 DEFININDO SISTEMAS DE INFORMAÇÃO.................................................................7

3.3 SISTEMAS, DADOS E USUÁRIOS .................................................................................7

3.4 VISÃO HISTÓRICA DOS SISTEMAS DE INFORMAÇÕES EXECUTIVAS. ..............9

3.4.1 FALTA DE CREDIBILIDADE DOS DADOS..............................................................11

3.4.2 PRODUTIVIDADE ........................................................................................................12

3.4.3 DOS DADOS ÀS INFORMAÇÕES ..............................................................................12

3.4.4 FASES METOLÓGICAS PARA A ELABORAÇÃO DO EIS. ....................................12

3.5 CICLO DE VIDA DE DESENVOLVIMENTO...............................................................15

4 DATA WAREHOUSE ........................................................................................................17

vi

4.1 APRESENTAÇÃO DA METODOLOGIA DE DATA WAREHOUSE..........................17

4.2 PROCESSAMENTO ANALÍTICO ON-LINE(OLAP) ...................................................18

4.2.1 OLAP VERSUS OLTP...................................................................................................18

4.3 COMPARAÇÃO ENTRE BANCOS DE DADOS OPERACIONAIS E DATA

WAREHOUSE..................................................................................................................19

4.4 DEFINIÇÃO DE DATA WAREHOUSE.........................................................................20

4.5 CARACTERÍSTICAS DOS DADOS DE UM DATA WAREHOUSE..........................21

4.6 ANÁLISE DO USO DE DATA WAREHOUSE..............................................................22

4.6.1 VANTAGENS ................................................................................................................22

4.6.2 DESVANTAGENS.........................................................................................................24

4.7 PROPOSTA DE DESENVOLVIMENTO DE DATA WAREHOUSE SEGUNDO W.H.

INMON. ............................................................................................................................25

4.8 ROTEIRO PARA PROJETO DE DATA WAREHOUSE SEGUNDO W.H. INMON. ..27

4.8.1 JUSTIFICATIVA DE CUSTOS.....................................................................................28

4.8.2 BUSCA PELOS DADOS OPERACIONAIS. ................................................................29

4.8.3 DADOS EXTERNOS / NÃO ESTRUTURADOS.........................................................35

4.8.4 INSERINDO DADOS NÃO-ESTRUTURADOS..........................................................36

4.8.5 GRANULARIDADE ......................................................................................................37

5 SEAGATE INFO 7..............................................................................................................39

5.1 INTRODUÇÃO.................................................................................................................39

5.1.1 INFO DESKTOP ............................................................................................................40

5.1.2 INFO ADMINISTRATOR .............................................................................................40

5.1.3 INFO APS.......................................................................................................................41

5.1.4 INFO SERVER ...............................................................................................................41

5.1.5 INFO OLAP AGENT .....................................................................................................41

5.1.6 INFO SENTINEL ...........................................................................................................41

vii

5.1.7 INFO WORKSHEET......................................................................................................42

6 DESENVOLVIMENTO DA PROPOSTA..........................................................................43

6.1 NECESSIDADES DA EMPRESA ...................................................................................43

6.2 APLICAÇÃO DA METODOLOGIA DE W.H.INMON .................................................43

6.3 ROTEIRO PARA PROJETO SEGUNDO W.H.INMON.................................................44

6.3.1 JUSTIFICATIVA DE CUSTOS.....................................................................................44

6.3.2 BUSCA PELOS DADOS OPERACIONAIS .................................................................44

6.3.3 GRANULARIDADE .......................................................Erro! Indicador não definido.

6.3.4 DATA WAREHOUSE E OS MODELOS DE DADOS ................................................44

6.3.5 VANTAGENS ................................................................................................................53

6.3.6 FUNCIONAMENTO DO PROTÓTIPO........................................................................53

7 CONCLUSÃO.....................................................................................................................57

7.1 SUGESTÕES E MELHORAMENTOS FUTUROS ........................................................58

8 ANEXO 1. ...........................................................................................................................59

REFERÊNCIAS BIBLIOGRÁFICAS .....................................................................................61

viii

LISTA DE FIGURAS FIGURA 1 - FLUXO DO SISTEMA DE INFORMAÇÃO DA HERWEG 5

FIGURA 2 - O NOVO CONTEXTO DE DATA WAREHOUSING 8

FIGURA 3 - O CICLO DE VIDA DE DESENVOLVIMENTO – SLDC 16

FIGURA 4 - FENÔMENO DIA 1-DIA N 27

FIGURA 5 - REPRESENTAÇÃO SIMPLIFICADA DA PASSAGEM DOS DADOS DO AMBIENTE

OPERACIONAL PARA O DATA WAREHOUSE. 29

FIGURA 6 - FALTA DE INTEGRAÇÃO DOS SISTEMAS EXISTENTES 30

FIGURA 7 - INTEGRAÇÃO DOS DADOS DOS SISTEMAS EXISTENTES PARA O DATA WAREHOUSE

31

FIGURA 8 - MÉTODOS DE VARREDURA DOS ARQUIVOS DA BASE OPERACIONAL 33

FIGURA 9 - ALTERAÇÃO DE PARÂMETROS DE TEMPO 34

FIGURA 10 - A CONDENSAÇÃO DOS DADOS É UM FATOR VITAL PARA O GERENCIAMENTO DOS

DADOS DO DATA WAREHOUSE 35

FIGURA 11 - TABELA E900CMO 44

FIGURA 12 - TABELA E205DEP 45

FIGURA 13 - TABELA E093ETG 45

FIGURA 14 - TABELA E900COP 46

FIGURA 15 - TABELA E083ORI 47

FIGURA 16 - TABELA E075PRO 48

FIGURA 17 - TABELA E070EMP 49

FIGURA 18 - TABELA E900EOQ 50

FIGURA 19 - TABELA E001TNS 51

FIGURA 20 - INFO DESKTOP 53

FIGURA 21 - INFO WORKSHEET 54

FIGURA 22 - TELA DE SELEÇÃO DE DIMENSÕES DO CUBO 55

FIGURA 23 - MODELO DE DADOS DO NÍVEL OPERACIONAL. 56

ix

RESUMO

Este estágio visa desenvolver um protótipo de sistemas de informação sobre a base de

dados contida na empresa Indústria de Relógios Herweg S.A. Os sistemas de informação

serão desenvolvidos sobre as informações geradas pela área de Produção, do Sistema

Corporativo Sapiens, desenvolvido pela Senior Sistemas Corporativos, onde utiliza-se como

Sistema Gerenciador de Banco de Dados, o Oracle Server; e como ferramenta onde serão

aplicados os conceitos do Data Warehouse, o Seagate Info 7.

x

ABSTRACT

The prototype made on my period of training was created to develop an Information

System using the database of Indústria de Relógios Herweg S.A.. This information system

will be developed based on information produced by Production department, Sapiens

Corporative System, created by Senior Sistemas Corporativos, that has as Database

Management System the Oracle Server and as tool the Seagate Info 7, where will be applied

the concepts of Data Warehouse.

1

1 INTRODUÇÃO

Durante muitos anos os Sistemas Gerenciadores de Banco de Dados foram o foco das

corporações, onde estas estavam preocupadas em guardar os dados que eram gerados por ela,

para depois poder gerar informações visando uma análise sobre seus negócios.

Surgiram então para auxiliar, o Sistema de Informações Gerenciais (SIG), que são

sistemas que juntam os dados a tal ponto que esta possa transmitir informação para tomada de

decisão (estratégica), possibilitando ao executivo ter uma visão integrada de todas as áreas da

empresa. Segundo [CRU1998], “Sistemas de Informações Gerenciais são o conjunto de

tecnologias que disponibilizam os meios necessários à operação do processo decisório em

qualquer organização por meio do processamento dos dados disponíveis”.

O processamento instantâneo (on-line) utilizado para o sistema de informação

produziam as informações, gastavam muito tempo de processamento. Também com o passar

dos anos, sentiu-se a necessidade de ter os dados já prontos para serem usados, sem a

necessidade de aplicar o conhecimento de pessoas. Para isto, muitas empresas iniciaram

projetos que se baseavam em uma nova metodologia: Data Warehouse.

Os dados presentes em sistemas contidos em empresas podem ser diferenciados

conforme o seu propósito. [IMN1997] separa os dados gerados pelos sistemas, em dados

operacionais e informacionais. Os dados operacionais são os dados armazenados por sistemas

setoriais, que recebem dados de setores como o Financeiro, Comercial ou Produção. Já os

dados informacionais, são os que são gerados a partir dos dados operacionais, e que são

agrupados em relação a determinado assunto. Os dados operacionais devem atender a

necessidade de diversos usuários, concorrentemente, com uma resposta rápida às solicitações.

Os dados informacionais atendem a um número menor de usuários, onde a preocupação maior

é quanto à complexidade na busca da informação, sendo que a informação gerada será

conseqüência de muitos dados operacionais.

Uma proposta ideal para o Data Warehouse é a implementação que permita a análise

de informações, monitorar e comparar os dados presentes, e também prever a inclusão de

dados futuros.

2

Para atuar no mercado atual, necessita-se cada vez atender rapidamente e com

qualidade, oferecendo produtos e serviços aos clientes. Para que isto seja possível, é

imprescindível dispor de controles sobre as fases de desenvolvimento, produção e vendas de

um negócio.

Com este protótipo, estar-se-á focando a fase da produção. Pelo fato da Indústria de

Relógios Herweg S.A. possuir produção diversificada, tanto em unidades de medida, horas de

produção e outros aspectos, é necessário fornecer algum modo de controlar esta fase. A partir

disto será desenvolvido um protótipo de Data Warehouse para integrar as informações. Com

este protótipo, a gerência irá usufruir destas informações para possivelmente detectar

tendências e desvios, o que auxilia nas tomadas de decisão, facilitando quanto à precisão e

velocidade de resolução. Descobrindo o porquê, tanto nas situações em que a informação

trouxer uma resposta positiva quanto negativa, a probabilidade de estar apoiado em valores

resultantes deste processo, aumenta a expectativa de acertos.

Sobre o Sistema Corporativo Sapiens, vale destacar que é um sistema desenvolvido

pela empresa Senior Sistemas de Blumenau. Este sistema propõe-se a integrar os

departamentos numa só ferramenta. Como gerenciador de banco de dados este sistema utiliza

o Oracle Server.

Para a implementação do Data Warehouse será usada a ferramenta Seagate Info 7, da

Seagate Softwares. O Seagate Info 7 é uma ferramenta de Business Intelligence que

proporciona e cada pessoa obtenha as informações necessárias para a tomada de decisões,

oferecendo uma infra-estrutura de nível empresarial, escalabilidade e gerenciamento na

entrega de consultas (queries), relatórios e cubos On Line Analitical Processing – OLAP para

toda a organização via rede, Intranet e Internet. A metodologia de especificação e a

implementação serão baseadas na metodologia proposta por Inmon ([INM1997]). A

metodologia de desenvolvimento de sistemas de informação é baseada em EIS. A

metodologia de desenvolvimento de sistemas baseou-se na análise estruturada.

3

1.1 OBJETIVOS

O objetivo principal do trabalho proposto é o desenvolvimento de um protótipo capaz

de gerar informações para análise do desempenho setorial para o sistema de produção da

empresa.

1.2 ESTRUTURA DO TRABALHO

No primeiro capítulo é apresentado o objetivo, como também a organização do

trabalho.

No segundo capítulo, é feita uma apresentação da empresa onde foi realizado o estágio.

Também é apresentado um resumo sobre os sistemas de informação utilizados atualmente

pela empresa. Outro tópico, é uma breve introdução sobre a empresa que desenvolveu o

sistema corporativo, da qual utilizaram-se os dados de nível operacional.

O terceiro capítulo apresentado conceito de sistemas de informações e um histórico

deste assunto, e o seu desenvolvimento.

No quarto capítulo é apresentado o Data Warehouse, com seus conceitos,

características, a proposta de desenvolvimento formulada por Inmon, e análises sobre suas

tecnologias.

No quinto capítulo, é explicada a ferramenta usada na implementação do protótipo.

No sexto capítulo, é descrita a implementação do protótipo proposto, com suas

principais telas, e uma análise final.

No sétimo capítulo, é apresentada a conclusão do trabalho, bem como as sugestões

para trabalhos futuros, e as referências utilizadas.

4

2 INDÚSTRIA DE RELÓGIOS HERWEG S.A.

Indústria do ramo metal-mecânico, sediada em Timbó, Santa Catarina. Fundada em

1952, por Otto Wilhelm Herweg e Alfred Rudolph, vende seus produtos para o Brasil e

exterior (Europa e Américas). Possui moderno parque industrial de 10.000m2 de área

construída, numa superfície de aproximadamente 120.000m2.

É uma empresa que produz grande parte dos componentes que fazem parte de seus

produtos finais. A produção é baseada em kanbans. A programação de produção é gerada

semanalmente, analisando-se relatórios de estoques, de onde são analisadas as quantidades

provenientes dos pedidos cadastrados pelo setor de vendas.

Produz atualmente:

a) despertadores mecânicos e à quartz;

b) relógios de parede à quartz;

c) timers de 10, 15, e 60 minutos;

d) relógios sob encomenda para uso promocional.

Importa para revenda:

a) relógios despertadores à quartz;

b) relógios de parede à quartz.

2.1 SISTEMAS DE INFORMAÇÃO

Atualmente o setor de PCP (Planejamento e Controle de Produção) da Herweg tem seu

controle totalmente baseado em planilhas, sendo que retira as necessidades de produção a

partir de relatórios do sistema Sapiens, provenientes do setor de vendas. A figura 1 descreve o

fluxo de informações no gerado no sistema Sapiens, a partir do pedido enviado gerado pelo

cliente.

Com a implantação do módulo de produção, do Sapiens, todo o controle deverá ser

passado ao sistema, e com isto, tendo um sistema de informação apoiando a implantação do

sistema, poder-se-á avaliar o desempenho da produção.

5

Figura 1 - Fluxo do Sistema de Informação da Herweg

Cliente

Vendas

PPCP

Montagem

Injetoras

Estamparia

Galvânica

Usinagem

Almoxarifado

Expedição

2.2 SAPIENS – SENIOR SISTEMAS

Em Junho de 1998, iniciou-se a implantação do sistema corporativo Sapiens,

produzido pela Senior Sistemas, sediada em Blumenau, Santa Catarina. A empresa Gestão

Sistema de Informações, também de Blumenau, Santa Catarina, é a responsável pela

implantação e treinamento na Indústria de Relógios Herweg.

O Sapiens é constituído por um conjunto de sistemas integrados de Gestão

Empresarial, totalmente voltados para a otimização de tomadas de decisões e para a

6

produtividade. Desenvolvido para ambiente Windows 9x/NT, com arquitetura

Cliente/Servidor.

Atualmente, juntamente com a elaboração deste estágio, está sendo implantado o

módulo de Produção, ao qual se está antecipando, fazendo com que já se tenha um Sistema de

Informação para este setor, a partir do momento em que este esteja em funcionamento para

uso.

7

3 SISTEMAS DE INFORMAÇÃO

3.1 INTRODUÇÃO

Pode-se citar como principais atribuições do executivo moderno o acompanhamento da

evolução da empresa como um todo, o diagnóstico das dificuldades, áreas de oportunidade e

soluções [SAL1994].

Os sistemas de informação são o meio pelo qual os executivos visualizam a empresa,

permitindo assim atingir seus objetivos. As informações geradas por estes sistemas apóiam a

organização em seu continuo processo de desenvolvimento e mudança.

3.2 DEFININDO SISTEMAS DE INFORMAÇÃO

Define-se Sistemas de Informação como o conjunto de pessoas, fatos e procedimentos,

visando proporcionar à organização o alcance de seus objetivos [SAL1994].

Para obter-se uma informação através dos dados têm-se os seguintes tópicos [apud

MEN1998]:

a) dados são os componentes básicos, a partir dos quais informação é criada;

b) informação é um conjunto de dados inseridos em um contexto;

c) contexto é a situação que está sendo analisada;

d) a partir da informação obtém-se conhecimento, que permite tomar decisões, trazendo

poder e vantagem competitiva.

Para transformar-se dados em informações é necessário um indivíduo (neste caso o

usuário do sistema), que é aquele que colocará o dado no contexto adequado. Neste momento,

o dado adquire significado, semântica, transformando-se em informação. Somente neste

instante ele tem valor para o negócio [TRO1997].

3.3 SISTEMAS, DADOS E USUÁRIOS

Há aproximadamente oito ou nove anos, tanto em virtude da flexibilização da reserva

de mercado de informática quanto em função dos efeitos de abertura da economia maior

pressão competitiva no ambiente de negócios, gerou-se maior demanda e foram

8

disponibilizados melhores recursos para utilização de sistemas de informação no nível de

tomada de decisões, apresentados no topo da pirâmide conforme figura 2 [AMA1997].

Figura 2 - O novo contexto de data warehousing

Fonte:[apud MEN1998]

Esse contexto denominou-se EIS – Executive Information Systems – e é delimitado

pelas seguintes variáveis:

a) topo da estrutura organizacional – alta gerência/executivos;

b) topo das estruturas de informações (dados consolidados);

c) ferramentas de interface gráfica amigável e intuitiva.

Todavia, o cenário de competitividade de negócios, globalização da economia e de

atualização constante das soluções de tecnologia transformou o quadro apresentado nos

parágrafos anteriores.

9

A cada dia que passa, as corporações têm que dedicar uma porção relativamente menor

de seu tempo às atividades operacionais e maior às estratégias de tomada de decisão para

viverem nesse cenário de maior competitividade. Com a diversidade e quantidade cada vez

maiores de informações para tomada de decisões, os executivos ficariam sobrecarregados se

tivessem de utilizar todas estas informações, como no contexto do EIS; dessa forma, surge,

nas organizações, a figura dos consumidores de informação (information consumers), que

apoiarão os executivos nos processos de tomada de decisão.

Mas estes resultados vêm sendo pesquisados e desenvolvidos há muito tempo como

mostra o próximo tópico.

3.4 VISÃO HISTÓRICA DOS SISTEMAS DE INFORMAÇÕES EXECUTIVAS.

No início da década de 1960, o mundo da computação consistia na criação de

aplicações individuais que eram executadas sobre arquivos mestres. As aplicações eram

caracterizadas por relatórios e programas, geralmente na linguagem de programação Cobol. O

uso dos cartões perfurados e fitas magnéticas era comum [INM1997].

Em meados da década de 1960, o crescimento dos arquivos mestres e das fitas

magnéticas explodiu e com este crescimento, surgiram enormes quantidades de dados

redundantes e seus problemas.

Por volta de 1970, presenciou-se o advento do armazenamento em disco

fundamentalmente diferente do armazenamento em fita magnética. Os dados podiam ser

acessados diretamente, sem necessidade da leitura seqüencial do arquivo. Com este

dispositivo de armazenamento de acesso direto (DASD), surgiram os softwares conhecidos

como SGBD ou sistema de gerenciamento de banco de dados. O objetivo do SGBD era o de

tornar o armazenamento e o acesso aos dados no DASD mais fáceis ao programador provendo

independência física e lógica. O SGBD se encarregava, ainda, de tarefas como

armazenamento de dados no DASD, indexação de dados, e assim por diante, surgindo a idéia

de um “banco de dados”.

Em meados da década de 1970, o processamento de transações on-line começou a ser

feito sobre banco de dados (OLTP – On Line Transaction Processing). Com um terminal e o

10

software apropriado, os técnicos descobriram que um acesso mais rápido aos dados era

possível – abrindo perspectivas totalmente novas. Com o processamento de transações on-line

de alta performance, o computador poderia ser usado para tarefas que anteriormente não eram

viáveis [INM1997].

Até o início da década de 1980, novas tecnologias – como os microcomputadores e as

L4G (Linguagens de Quarta Geração) – começaram a vir à tona. O usuário final passou a

assumir um papel do clássico processamento de dados. Com os PC e a tecnologia das L4G

surgiu a noção de que era possível utilizar os dados para outros objetivos além de atender ao

processamento de transações on-line de alta performance. Os SIG (sistemas de informações

gerenciais) também eram viáveis.

“Sistema de Informações Gerenciais é um sistema integrado homem-máquina que

provê informações para dar suporte às funções de operação, administração e tomada de

decisão na empresa” [OLI1992]. Anteriormente, os dados e a tecnologia eram utilizados

exclusivamente para direcionar decisões operacionais detalhadas [INM1997].

Conforme Binder [BIN1994], apesar de todo o desenvolvimento ocorrido na área de

informática, a atuação da mesma sobre a gerência da empresa ainda estava subutilizada. Um

dos novos recursos que surgiram para auxiliar as atividades gerenciais chama-se Sistema de

Apoio a Decisão (SAD ou DSS – Decision Support System).

Os Sistemas de Apoio a Decisão surgiram da necessidade de auxiliar os executivos em

processos semi-estruturados ou não estruturados, com a constante mudança desses processos.

Os Sistemas de Apoio a Decisão começaram a ser desenvolvidos por volta do final da

década de 1960 e no início da década de 1970, como resultado de vários fatores: progressos

tecnológicos tanto de hardware como de software, consciência cada vez mais de como dar

suporte ao processo decisório, desejo de obter melhores informações, pesquisas universitárias,

entre outros [SAL1994].

No final da década de 1970, no MIT (Massachussets Institute of Technology), surgiu o

termo Sistema de Informações Executivas (SIE).

11

Os SIE ou EIS (Executive Information System) surgiram da necessidade informacional

que os executivos possuíam, informações estas muito peculiares a cada um deles. As

necessidades informacionais de executivos podem ser supridas por um sistema de

informações, sistemas estes que são desenvolvidos em torno das necessidades ou exigências

de seus usuários.

Surgiu então, um paradigma – um único banco de dados que poderia atender

simultaneamente ao processamento de transações on-line de alta performance e o

processamento analítico, ou de Sistemas de Informação Gerencial (SIG), Sistemas de Suporte

a Decisão (SAD) ou SIE.

Pouco depois do advento das transações on-line de alta performance em massa, um

programa inócuo chamado de processamento de extração, começou a surgir. O programa de

extração é mais simples de todos os programas. Ele varre um arquivo ou banco de dados, usa

alguns critérios de seleção, e, ao encontrar dados que atendam aos critérios, transporta os

dados para um outro arquivo ou banco de dados.

Quando fora de controle, o processamento de extração produziu o que pode ser

chamado de arquitetura de desenvolvimento espontâneo – que ocorre quando uma

organização lida com todo o processo de arquitetura de hardware e software com uma postura

de simplesmente deixar acontecer [MEN1998].

Há muitos problemas associados com a arquitetura de desenvolvimento espontâneo

[MEN1998]:

a) falta de credibilidade;

b) produtividade;

c) impossibilidade de transformar dados em informações.

3.4.1 FALTA DE CREDIBILIDADE DOS DADOS

A falta de credibilidade é ocasionada principalmente por:

a) ausência de parâmetros de tempo dos dados;

b) o diferencial algorítmico dos dados;

c) os níveis de extração;

d) o problema dos dados externos;

12

e) nenhuma fonte de dados comum com a qual começar.

3.4.2 PRODUTIVIDADE

Para desenvolver qualquer tarefa (relatório, por exemplo) há necessidade de destacar

alguns requisitos que interferem na produtividade:

a) localizar e analisar os dados para o relatório;

b) compilar os dados para o relatório;

c) obter recursos humanos de programação/análise para realizar a tarefa.

3.4.3 DOS DADOS ÀS INFORMAÇÕES

Os sistemas encontrados na arquitetura de desenvolvimento espontâneo são

simplesmente inadequados à tarefa de apoio às necessidades de informações em virtude de

sua falta de integração e da diferença entre o horizonte de tempo necessário ao processamento

analítico e o horizonte de tempo disponível nas aplicações do ambiente de extração

[INM1997].

3.4.4 FASES METODOLÓGICAS PARA A ELABORAÇÃO DO EIS.

Segundo [FUR1994], a metodologia proposta para a definição do EIS é composta por

três fases:

a) fase I – planejamento;

b) fase II – projeto;

c) fase III – implementação.

A fase de planejamento tem por objetivo definir conceitualmente o sistema EIS por

meio da identificação das necessidades de informação e do estilo decisório do executivo, bem

como da estrutura básica do sistema e do protótipo preliminar de telas.

Esta fase é composta por cinco estágios:

a) estágio I – organização do projeto: neste estágio, a equipe de trabalho é treinada nas

técnicas de levantamento de dados e análise dos fatores críticos de sucesso. Uma

sessão de orientação de executivos também é realizada com o objetivo de prepara-los

13

para o processo de entrevistas. Identificar quais informações os executivos já recebem,

por meio de questionário específico, e utilizar as informações já coletadas da empresa

em projetos anteriores também são procedimentos importantes na análise da situação

atual;

b) estágio II – definição de indicadores: neste estágio, cada executivo é entrevistado

individualmente para que se possam identificar seus objetivos, fatores críticos de

sucesso e necessidades de informação e, em seguida, efetuar a documentação para

submeter os resultados à revisão. Uma sessão de planejamento deve ser conduzida

antes das entrevistas, a fim de rever os precedentes e, assim, traçar uma linha mestra de

ação. Após as entrevistas, seguem,-se sessões de documentação e apresentação aos

executivos para sua revisão e seu acompanhamento. O questionário específico

(Executive Information Survey) é utilizado nas entrevistas de acompanhamento com o

objetivo de identificar as necessidades de informação que são atendidas por meio das

fontes de informação existentes. Por fim, são feitas revisões na documentação das

entrevistas, que serão submetidas aos executivos para aprovação;

c) estágio III – análise de indicadores: o objetivo deste estágio é normalizar as

informações levantadas durante as entrevistas individuais dos executivos a fim de obter

uma lista consolidada de objetivos, fatores críticos de sucesso, problemas e

necessidades de informação. Esta lista é, então, transformada numa matriz de inter-

relacionamento entre os indicadores de desempenho e os respectivos objetos de

interesse dos executivos. Em seguida, são atribuídos pesos de importância e é

elaborado um ranking de necessidades;

d) estágio IV – consolidação de indicadores: neste estágio, é realizada uma revisão

dirigida com o grupo de executivos entrevistados para rever os objetivos, fatores

críticos de sucesso, problemas e necessidades de informação, assim como confirmada a

classificação (ranking) desses objetos. O resultado dessa revisão dirigida é a

combinação dos objetivos, fatores críticos de sucesso, problemas e necessidades de

informação num documento que serve com um workbook da sessão da revisão. Ainda

na sessão de revisão dirigida, são confirmadas as fórmulas de controle para regras de

exceções (níveis de desvio que o executivo deseja ver destados);

e) estágio V – desenvolvimento de protótipos: neste estágio, são realizadas atividades de

desenho de telas e estruturas de navegação do sistema. Um protótipo é construído para

14

que o executivo possa ter uma visão mais próxima possível do que será o sistema após

sua implementação. Ainda neste estágio são padronização os modelos de telas

(layouts), cores, botões e ícones.

Se a fase de planejamento tem como escopo a determinação das especificações do

sistema sob o enfoque das necessidades do usuário, a fase de projeto definirá a solução

técnica para implementar o projeto conceitual concebido. De um modo prático, é definida

nesta fase a arquitetura tecnológica a ser adotada, é escolhida a ferramenta de software, são

planejados os critérios de integração e transferência de dados, é modelada a base de dados do

EIS, sendo detalhados os atributos das tabelas a serem criadas e layouts de arquivos a serem

acessados ou criados.

Esta fase é composta por três estágios:

a) estágio I – decomposição de indicadores: este estágio envolve atividades de

detalhamento técnico dos indicadores e modelagem da base de dados do EIS que

suportará o atendimento das necessidades de informação classificadas (ranking) na

fase anterior, incluindo informações sobre fontes de dados, proprietários das

informações, freqüência e método proposto de atualização. Por meio dessa

especificação, identificam-se os sistemas e bases de dados que devem ser acessados

para suprir as necessidades de informação identificadas. Para cada indicador de

desempenho, são ainda estudados os níveis de detalhamento desejados (drill-down);

b) estágio II – definição da arquitetura tecnológica: fazem parte deste estágio a

determinação da localização física das bases de dados (no ambiente corporativo; numa

rede local; duplicada em microcomputadores stand-alone, etc) e a definição de

parâmetros, como investimentos necessários e instalações. Se, eventualmente, a

instalação ainda não tem a definição da ferramenta de EIS a ser adotada, é neste

estágio que tal decisão deve ser tomada, com base num estudo cuidadoso das

necessidades e da arquitetura atual das informações da empresa;

c) estágio III – planejamento da implementação: este estágio busca determinar os

recursos necessários para o desenvolvimento da aplicação do EIS. São planejados,

além do cronograma de construção do sistema, os seus demais requisitos, tais como

instalações, criação das bases de dados e realização de testes.

A fase de implementação é composta por três estágios:

15

a) estágio I – construção dos indicadores: as atividades deste estágio tem um caráter

notadamente técnico como em qualquer projeto de desenvolvimento de sistemas. São

construídas telas de consultas de acordo com o padrão estabelecido e o protótipo é

aprovado pelo executivo na fase de planejamento. Também neste estágio dá-se a

construção e a conversão de bases de dados a serem acessadas para a geração das telas,

bem como a realização de testes ajustes no sistema;

b) estágio II – instalação de hardware e software: este estágio tem por finalidade

implementar a parte física do sistema, providenciando a instalação da arquitetura

tecnológica projetada na fase anterior;

c) estágio III – treinamento e implementação: neste estágio final da metodologia, o

sistema torna-se disponível para o executivo e é incorporado ao seu cotidiano.

Realizam-se o treinamento e a orientação para uma efetiva utilização do sistema, bem

como se define o encarregado da administração do EIS. Esse encarregado será

responsável pelo acompanhamento e orientação dos executivos e, principalmente, pelo

controle diário da atualização, integridade e consistência das bases de dados do

sistema. A documentação construída ao longo do processo de desenvolvimento é

consolidada, sendo também elaborado o manual do sistema.

3.5 CICLO DE VIDA DE DESENVOLVIMENTO

Além do fato dos dados operacionais não serem integrados e o Data Warehouse

precisa, necessariamente, ser integrado, há outras diferenças entre os níveis de dados e de

processamento operacionais e o do Data Warehouse. Uma profunda diferença entre o nível

operacional e o Data Warehouse diz respeito aos ciclos de vida de desenvolvimento

subjacentes, como ilustra a figura 3 [INM1997].

16

Figura 3 - O ciclo de vida de desenvolvimento – SLDC

FONTE: [INM1997]

A figura 3 mostra que o ciclo de vida do desenvolvimento de sistemas clássico atende

ao ambiente operacional. O Data Warehouse funciona segundo um ciclo de vida muito

diferente, eventualmente chamado de ciclo de vida do desenvolvimento de sistemas analíticos

(o inverso de System Development Life Cycle – SLDC – ciclo de vida de desenvolvimento de

sistemas). O SLDC clássico é baseado em requisitos. Para desenvolver sistemas, primeiro é

necessário entender as necessidades. Posteriormente, vêm as fases de projeto e

desenvolvimento. O ciclo de vida de sistemas analíticos (como os SAD) é praticamente o

inverso, iniciam nos dados. Uma vez que os dados estejam sob controle, eles são integrados e,

em seguida, testados para que se verifique qual distorção há neles, se houver alguma. Então,

e, finalmente, os requisitos do sistema são compreendidos.

O ciclo de vida de sistemas analíticos é tipicamente baseado em dados, ao passo que o

de sistemas em nível operacional é um ciclo de vida baseado tipicamente em requisitos.

O Data Warehouse é criado com dados iniciais e bem refinados. Os dados são

pesquisados e os resultados são avaliados e as decisões são tomadas. O processo de pesquisa e

avaliação leva a uma melhor qualidade nos dados. Este processo é contínuo enquanto ocorre

sem mudanças organizacionais, tecnológicas e mercadológicas [MUE1999].

17

4 DATA WAREHOUSE

Segundo Jorge L. M. Gonçalvez [GON1997], Data Warehouse é uma nova buzzword

(conceito) reiterando uma velha promessa. Esse conceito, embora surgido recentemente,

baseia-se na aplicação de antigas idéias que somente agora puderam ser viabilizadas pela

conjunção de diferentes tecnologias, tais como: banco de dados relacionais e

multidimensionais, interface gráfica, PC, sistemas operacionais em rede, discos rígidos de

grande capacidade de armazenamento e velocidade de acesso, On Line Analitical Processing -

OLAP, entre outros.

4.1 APRESENTAÇÃO DA METODOLOGIA DE DATA WAREHOUSE

Com o novo conceito de Data Warehouse, é possível gerar informações antes

indisponíveis, afetando, direta e indiretamente, as decisões corporativas. Como resultado tem-

se um aumento de rentabilidade por executivo. No lado operacional, os dados aparecem em

formas de tabelas ou relatórios que precisam ser analisados, caso se queira transformá-los em

informação. No Data Warehouse, eles são armazenados de forma lógica e facilmente podem

ser analisados em vida quando trabalhados por ferramentas EIS – Executive Information

Systems – ou OLAP.

O Data Warehouse auxilia na criação e utilização de informações coletadas na base de

dados operacional, possibilitando retorno rápido de investimento. Do ponto de vista

comercial, a tecnologia aumenta a velocidade das respostas e maximiza os ganhos. As

corporações passam a perceber os benefícios de se trabalhar focado em processos de

negócios, mesmo que as informações estejam em fase de transferência da base operacional

para o Data Warehouse [EXP1996].

No Data Warehouse os dados são armazenados e analisados dentro de uma perspectiva

histórica. A prática de data warehousing permite que se raciocine de forma orientada ao

tempo:

a) passado – de onde se aprende e se evita repetir os erros;

b) presente – a análise dos fatos permite a correta adaptação a eles;

18

c) futuro – a previsão de tendências permite que se ganhe a batalha antes mesmo dela

ocorrer.

Segundo Valsoir Tronchim [TRO1997], no Data Warehouse os dados estão integrados

e orientados a assuntos, ou temas. Isto permite um raciocínio eficiente sobre o eixo da

cardinalidade. Pode-se pensar sobre vários problemas e questões simultaneamente, estudando-

se a relação entre elas.

Data Warehouse é a infra-estrutura que permite que se empregue o pensamento

estratégico. Sendo utilizada dentro da organização, eleva o nível de conhecimento de todos –

permitindo, através do conhecimento, a competição por manobra. A centralização e o controle

de acesso a informação são características da competição por atrito. Na competição por

adaptação e manobra, todos devem estar plenamente cientes da missão da empresa e do papel

que desempenham [TRO1997].

A prática Data Warehousing permite que se aja cedo e não tarde; que se aja de forma

pró-ativa e não reativa; que se saiba e não se suponha; que se mude e não se atrofie; que se

exceda e não se satisfaça; que se ganhe e não se perca.

4.2 PROCESSAMENTO ANALÍTICO ON-LINE(OLAP)

O termo On-line Analytical Processing - OLAP refere-se ao tipo de processamento e

ferramenta voltados para análise de dados típica do suporte à decisão, onde os dados são

apresentados através de uma visão multidimensional. Esta visão é independente de como os

dados estão armazenados.

4.2.1 OLAP VERSUS OLTP

De um ponto de vista prático, OLAP sempre envolve consultas interativas aos dados,

seguindo um caminho de análise através de múltiplos passos, como, por exemplo, aprofundar-

se sucessivamente por níveis mais baixos de detalhe de um quesito de informação específico.

OLAP envolve capacidades analíticas, incluindo a derivação de taxas, variâncias, etc., e

envolvendo medidas ou dados numéricos através de muitas dimensões, devendo suportar

modelos para previsões, análises estatísticas e de tendências[JOR1997].

19

De uma forma geral, OLAP apresenta características distintas do processamento de

transações on-line tipo OLTP.

Consultas típicas deste tipo de processamento são:

a) Quais os produtos que vendem bem?;

b) Quais os escritórios de vendas mais fracos?;

c) Qual o “ranking” dos vendedores da Região Nordeste?;

d) Qual o número e o salário médio dos funcionários de manutenção por departamento?

Neste estágio utilizou-se a tecnologia OLAP.

4.3 COMPARAÇÃO ENTRE BANCOS DE DADOS OPERACIONAIS E DATA WAREHOUSE

Na tabela 1, é realizada uma comparação entre as características presentes em bancos

de dados do nível operacional e do Data Warehouse.

20

Características

• Objetivo

• Uso

• Tipo de processamento

• Unidade de trabalho

• Número de usuários

• Tipo de usuário

• Interação do usuário

• Condições dos dados

• Volume

• Histórico

• Granularidade

• Redundância

• Características

• Estrutura

• Manutenção desejada

• Acesso a registros

• Atualização

• Integridade

• Número de índices

• Intenção dos índices

Bancos de dados Operacionais

• Operações diárias do negócio

• Operacional

• OLTP

• Inclusão, alteração, exclusão

• Milhares

• Operadores

• Somente pré-definida

• Dados operacionais

• Megabytes – gigabytes

• 60 a 90 dias

• Detalhados

• Não ocorre

• BD operacionais

• Estática

• Constante

• Dezenas

• Contínua (tempo real)

• Transação

• Poucos/simples

• Localizar um registro

Data Warehouse

• Analisar o negócio

• Informativo

• OLAP

• Carga e consulta

• Centenas

• Comunidade gerencial

• Pré-definida e ad-hoc

• Dados Analíticos

• Gigabytes – terabytes

• 5 a 10 anos.

• Detalhados e resumidos

• Ocorre

• Data Warehouse

• Variável

• Mínima

• Milhares

• Periódica (em batch)

• A cada atualização

• Muitos/complexos

• Aperfeiçoar consultas

Tabela 1 – Comparação entre Banco de Dados Operacionais e Data Warehouse.

Fonte:[ DAL1998]

4.4 DEFINIÇÃO DE DATA WAREHOUSE

A definição clássica do termo Data Warehouse foi feita por William H. Inmon em

1990 em seu livro “Building the Data Warehouse”: “Data Warehouse é um conjunto de dados

orientados a um assunto, integrados, não-voláteis, variáveis no tempo, utilizados para apoiar

decisões gerenciais”.

21

Data Warehousing, entretanto, tem outra definição. Segundo outros autores, “é o

processo pelo qual as empresas extraem sentido e significado dos seus dados através da

utilização de banco de dados especiais chamados Data Warehouses” [TRO1997].

Embora muitos utilizem ambos os termos de forma distinta, a diferença é clara. O

processo de Data Warehousing é contínuo e ininterrupto, devendo acompanhar toda a vida da

empresa. Segundo [TRO1997], muita gente diz que não compra um Data Warehouse,

constrói-se um. Na realidade, não se compra nem se constrói, pratica-se data warehousing.

De acordo com Richard Hackatborn (pioneiro no tema), o objetivo de um Data

Warehouse, é fornecer uma “imagem única da realidade do negócio” [JOR1997]. De uma

forma geral, sistemas de Data Warehouse compreendem um conjunto de programas que

extraem dados do ambiente de dados operacional da empresa, um banco de dados que os

mantém, e sistemas que fornecem estes dados aos usuários.

Sistemas de Data Warehouse revitalizam os sistemas da empresa [MEN1998], pois:

a) permitem que sistemas mais antigos continuem em operação;

b) consolidam dados inconsistentes dos sistemas mais antigos em conjuntos coerentes;

c) extraem benefícios de novas informações oriundas das operações correntes;

d) provêm ambiente para o planejamento e arquitetura de novos sistemas de cunho

operacional.

4.5 CARACTERÍSTICAS DOS DADOS DE UM DATA WAREHOUSE

O Data Warehouse, denominado de “grande depósito de informações”, ou como

define [IMN1997], é um conjunto de dados baseado em :

a) assuntos: voltado ao negócio onde este será aplicado;

b) integrado: reúne as informações nos sistemas, tanto integrados como os isolados;

c) volátil: somente tem incrementos em períodos previamente conhecidos, sendo que a

informação analisada em determinado instante, no instante seguinte será o mesmo;

d) variável: estará sempre sendo aumentado com a inclusão ao passar o tempo. Não

teremos dados totalmente atualizados, pois no instante seguinte algum dado já foi

inserido.

22

4.6 ANÁLISE DO USO DE DATA WAREHOUSE

Para avaliar as vantagens e desvantagens da utilização de um Data Warehouse foram

feitos estudos sobre vários casos de empresas que já estão utilizando ou estão no processo

inicial de construção de um Data Warehouse. Uma das fontes de pesquisa para este trabalho

foi um artigo publicado pela professora Toru Sakaguchi da Universidade de Memphis, EUA

[apud DAL1999]. Este artigo foi realizado tendo como base 456 artigos escritos entre abril de

1992 e julho de 1996, que foram analisados e comparados para extrair as principais vantagens

e desvantagens da utilização de um Data Warehouse.

4.6.1 VANTAGENS

As principais vantagens encontradas são:

a) simplicidade: A vantagem mencionada com mais freqüência sobre Data Warehouse

pode ser resumida como "simplicidade". O Data Warehouse facilita a administração da

empresa por que fornece uma imagem simples da realidade com integração de vários

dados de sistemas diferentes. O Data Warehouse permite que os sistemas operacionais

continuem em uso, transformando os dados inconsistentes dos sistemas do nível

operacional em um conjunto de dados coerentes que são informações vitais para as

empresas. As operações atuais podem ser monitoradas e comparadas com as operações

passadas, previsões de futuras operações podem ser feitas racionalmente, novos

processos podem ser inventados, e os sistemas de nível operacional podem ser

alterados para suportar estes processos. O Data Warehouse também pode armazenar

um grande número de dados históricos que auxiliam as empresas na tomada de

decisões. Oferece o benefício de ser único, com dados centralizados mas mantendo

uma estrutura de cliente/servidor. Além disso, Data Warehouse são sistemas para

empresas grandes, o que melhora a distribuição das informações internamente;

b) qualidade dos dados: a segunda vantagem mais mencionada foi a melhor qualidade dos

dados. O Data Warehouse proporciona consultas em dados de maior qualidade o que

traz maior consistência, acuracidade e documentação, além de aumentar a

produtividade dos usuários através de utilização de ferramentas OLAP e de Data

Mining;

c) acesso rápido: o Data Warehouse permite aos usuários recuperar rapidamente os dados

necessários para suas consultas, eliminando o trabalho de busca em vários sistemas de

23

nível operacional pois todos os dados estão em um único local, sendo assim o tempo

de resposta deve ser reduzido;

d) facilidade de uso: a maioria das ferramentas de consultas facilitam o acesso aos dados

pois trabalham com interfaces gráficas e comandos pré-definidos o que torna a análise

das informações armazenadas no Data Warehouse uma tarefa intuitiva para os usuários

finais;

e) separa as operações de decisão das operações de produção: como os dados do Data

Warehouse ficam separados dos dados dos sistemas de nível operacional mas são

continuamente atualizados com informações sobre as operações realizadas, os gerentes

e analistas de negócios podem fazer análises nestes dados sem sobrecarregar os

sistemas de nível operacional;

f) vantagem competitiva: o Data Warehouse auxilia o administrador a gerenciar melhor a

empresa utilizando o conhecimento incorporado, o qual possibilita a empresa ser mais

competitiva, entendendo melhor as necessidades dos clientes, e conhecendo mais

rapidamente as demandas de mercado. Esta vantagem pode compensar o grande custo

de se implantar um Data Warehouse;

g) custo de operação: o Data Warehouse oferece uma boa base para o desenvolvimento de

novos sistemas de nível operacional, além de eliminar o uso de arquivos baseados em

papéis e uma vez coberto o investimento inicial o grupo de tecnologia da informação

da empresa normalmente consome menos recursos do que antes da implantação do

Data Warehouse pois as informações ficam centralizadas e podem ser acessadas

facilmente pelos usuários finais;

h) administração do fluxo da informação: o Data Warehouse recebe uma grande

quantidade de dados de várias fontes operacionais e envia dados para várias aplicações

front-end. Para se adaptarem as mudanças nas regras de negócio das empresas, os

sistemas de nível operacional e as estruturas dos dados são constantemente

modificados. No Data Warehouse isto dificilmente ocorre pois os metadados auxiliam

na configuração dos dados para que eles atendam os novos requisitos da empresa;

i) habilita o processamento paralelo: o processamento paralelo ajuda os usuários a

realizar consultas no Data Warehouse mais rapidamente, pois suporta grandes

demandas em ambientes cliente/servidor, onde os usuários podem fazer perguntas ou

24

consultas simultâneas que exijam um processamento intensivo. Com o processamento

paralelo o Data Warehouse oferece uma melhor relação de preço/performance;

j) infra-estrutura computacional: o Data Warehouse ajuda as organizações a montar uma

infra-estrutura que pode suportar mudanças nos sistemas e na estrutura dos seus

negócios;

k) valores quantitativos: outra vantagem é que o Data Warehouse pode mostrar um

retrospecto realista da evolução da empresa pois possui medidas quantitativas que

podem ser comparadas e analisadas com períodos de vários anos;

l) segurança: o fato dos usuários do Data Warehouse não acessar diretamente as bases de

dados dos sistemas, aumenta a segurança destes dados além de diminuir o número de

acessos aos mesmos.

4.6.2 DESVANTAGENS

As principais desvantagens encontradas são:

a) complexidade de desenvolvimento: uma empresa não pode simplesmente comprar um

Data Warehouse. É necessário construir um ambiente composto de hardware e

software como banco de dados, ferramentas de extração de dados, ferramentas de

recuperação dos dados, etc. Um Data Warehouse deve atender as necessidades

específicas de uma empresa. Na construção deste ambiente específico é necessário ter

muito conhecimento das necessidades pré-definidas para a construção da estrutura,

definições e fluxo dos dados, assim como na escolha do hardware e software

necessários. O desenvolvimento de um Data Warehouse requer um senso de

antecipação sobre as necessidades futuras dos usuários assim como a previsão de

futuras alterações nas regras de negócio da empresa. Definir como aumentar o Data

Warehouse por causa da demanda de dados, tanto em volume como em complexidade

torna o seu desenvolvimento muito complexo e requer uma equipe de especialistas;

b) Tempo de desenvolvimento: como é uma tarefa complexa é natural que também seja

demorada. Estudos indicam que em média um ambiente completo de Data Warehouse

demora de dois a três anos para ficar pronto, o que pode ser muito tempo para uma

empresa que necessita de um ambiente de suporte a decisão em um curto espaço de

tempo;

25

c) alto custo de desenvolvimento e administração: um Data Warehouse pode consumir

milhares de dólares até que esteja pronto para ser utilizado e continuará a consumir

recursos durante toda sua "vida" útil, pois necessitará de constantes manutenções;

d) treinamento: uma das desvantagens é que os usuários do Data Warehouse devem ser

constantemente treinados e comunicados das mudanças no Data Warehouse. Isto se

deve ao fato de que é importante que todos estejam aptos a retirar o máximo de

informações possíveis que o Data Warehouse oferece.

4.7 PROPOSTA DE DESENVOLVIMENTO DE DATA WAREHOUSE SEGUNDO W.H. INMON.

Segundo W. H. Inmon, os Data Warehouse não são construídos de uma só vez. Em vez

disso, eles são projetados e povoados passo a passo, sendo, portanto, evolucionários e não

revolucionários. Os custos de construir um Data Warehouse de uma vez, os recursos

necessários e o transtorno causado ao ambiente, tornam imperativo que o Data Warehouse

seja construído de maneira ordenadamente iterativa, passo a passo[INM1997].

A figura 4 apresenta o processo típico de construção de um Data Warehouse. No dia

um, há um grupo de sistemas efetuando, basicamente, processamento operacional. No dia

dois, as primeiras tabelas da primeira área de interesse do Data Warehouse são povoadas.

Nesse ponto, uma certa dose de curiosidade aflora, e os usuários começam a descobrir os Data

Warehouses e o processamento analítico.

No dia três, mais áreas do Data Warehouse são povoadas e, com o maior povoamento,

surgem mais usuários. Uma vez que os usuários descobrem que há uma fonte integrada de

dados fácil de alcançar e que apresenta uma base histórica construída para a pesquisa de dados

ao longo do espectro de tempo, há mais do que curiosidade. Aproximadamente nesse

momento, o sério analista SAD é atraído para o Data Warehouse.

No dia quatro, à medida que mais áreas do Data Warehouse são povoadas, alguns dos

dados que residiam no ambiente operacional são colocados de forma apropriada no Data

Warehouse. E agora, o Data Warehouse é “descoberto” como uma fonte para o processamento

analítico. Surgem, repentinamente, todos os tipos de aplicações SAD. Na realidade, começam

a aparecer tantos usuários e tantas solicitações de processamento aliados ao grande volume de

26

dados agora residentes no Data Warehouse, que alguns usuários começam a ser afastados pelo

trabalho e pelo esforço necessários para alcançar o Data Warehouse. A competição para

chegar ao Data Warehouse torna-se um obstáculo a sua utilização.

No dia cinco, bancos de dados departamentais (datamart ou OLAP) começam a

florescer. Na opinião dos departamentos, é mais barato e mais fácil efetuar o respectivo

processamento trazendo os dados do Data Warehouse para seus próprios ambientes

departamentais de processamento. À medida que os dados são transferidos para o nível

departamental, uns poucos analistas de SAD são atraídos.

No dia seis, acontece a corrida aos sistemas departamentais. É mais barato, mais rápido

e mais fácil obter os dados departamentais do que os dados do Data Warehouse. Logo, os

usuários abandonam, gradativamente, os detalhes do Data Warehouse pelo processamento

departamental.

No dia n, a arquitetura encontra-se plenamente desenvolvida. Tudo o que resta do

conjunto original de sistemas de produção é o processamento operacional. O Data Warehouse

está pleno de dados. Há uns poucos usuários diretos do Data Warehouse. Há vários bancos

departamentais. A maior parte do processamento analítico de SAD ocorre no nível

departamental, porque é mais fácil e mais barato obter ali os dados necessários para o

processamento.

É claro que a evolução do dia um ao dia n leva um longo tempo. Normalmente, vários

anos. E, durante todo o processo de passar do dia um para o dia n, o ambiente SAD está em

funcionamento.

27

Figura 4 - Fenômeno dia 1-dia n

Fonte: [INM1997]

4.8 ROTEIRO PARA PROJETO DE DATA WAREHOUSE SEGUNDO W.H. INMON.

Existem dois importantes aspectos vinculados à construção do Data Warehouse – o

projeto de interface com os sistemas de nível operacional e o projeto do Data Warehouse

propriamente dito. De certa forma, projeto não é a descrição exata do que acontece durante a

construção do Data Warehouse, uma vez que ele é construído de modo heurístico. Primeiro, o

Data Warehouse é povoado com alguns dados. Tais dados são, então, usados e

minuciosamente examinados pelo analista de SAD. Em seguida, com base no retorno

28

proporcionado pelo usuário final, os dados são modificados e/ou outros dados são adicionados

ao Data Warehouse[INM1997].

O ciclo de retorno tem continuidade por toda a vida do Data Warehouse. É um engano

pensar que os enfoques de projeto que funcionaram no passado serão úteis na construção do

Data Warehouse. Os requisitos para a criação do Data Warehouse não podem ser conhecidos

até que ele esteja parcialmente povoado e sendo usado pelo analista de SAD. Portanto, ele não

pode ser projetado do mesmo modo pelo qual são construídos os sistemas clássicos baseados

em requisitos. Por outro lado, também constitui um engano pensar que não prever requisitos

seja uma boa idéia. A realidade se encontra em algum ponto intermediário.

4.8.1 JUSTIFICATIVA DE CUSTOS

Primeiramente, têm-se que aprovar o projeto de investimento junto aos diretores da

empresa. Um dos aspectos interessantes do Data Warehouse é que a justificativa de custos do

warehouse, normalmente, não é feita mediante um critério previamente estabelecido de

retorno sobre o investimento. Para efetuar tal análise seria necessário que os benefícios do

Data Warehouse fossem conhecidos antes da construção destes.

Na maioria dos casos, os verdadeiros benefícios do Data Warehouse não são

conhecidos ou mesmo previstos no momento da construção porque o warehouse é usado de

forma inteiramente diferente de outros dados e sistemas. A atualização do Data Warehouse

ocorre de um modo diferente do resto do processamento de informações. De fato, o analista

de SAD não pode dizer quais as possibilidades e potencialidades do Data Warehouse até que a

primeira iteração deste seja criada e esteja disponível. Então, uma vez que o analista de SAD

ponha as mãos no Data Warehouse, ele poderá começar a liberar o potencial de

processamento SAD.

Portanto, técnicas clássicas de análise de retorno sobre o investimento simplesmente

não se aplicam ao ambiente de Data Warehouse. No entanto, há a possibilidade do Data

Warehouse ser construído de forma incremental. A primeira iteração pode ser feita

rapidamente e mediante uma relativamente pequena quantia de dinheiro. Uma vez que a

primeira porção do Data Warehouse tenha sido construída e povoada, o analista pode começar

29

a explorar as possibilidades. É nesse ponto que o analista começa a justificar os custos de

desenvolvimento do warehouse.

4.8.2 BUSCA PELOS DADOS OPERACIONAIS.

No início, há dados operacionais totalmente trancados nos sistemas existentes. É

tentador pensar que a criação do Data Warehouse consiste em apenas extrair dados

operacionais e inseri-los no warehouse. Nada poderia estar mais longe da verdade.

A figura 5 mostra uma representação simples de dados do ambiente de sistemas já

existentes para o Data Warehouse. Podemos verificar que várias aplicações irão contribuir

para o Data Warehouse.

Figura 5 - Representação simplificada da passagem dos dados do ambiente operacional

para o Data Warehouse.

Fonte: [INM1997]

Por inúmeras razões , a figura 5 pode ser considerada exageradamente simplista. A

idéia de que a construção de Data Warehouse consiste meramente em um processo de

extração tem como erro básico o fato de que os dados existentes no ambiente operacional não

são integrados. A figura 6 demonstra a falta de integração comum ao ambiente dos sistemas

existentes.

30

Figura 6 - Falta de integração dos sistemas existentes

Fonte: [INM1997]

Na época da criação das aplicações existentes, a possibilidade de futura integração

destas não era considerada. Cada aplicação possuía seu conjunto único e particular de

requisitos e, durante o processo de desenvolvimento, as demais aplicações não eram levadas

em conta. Portanto, não é de admirar que alguns dos mesmos dados existiam em vários

lugares com nomes diferentes; que alguns dados sejam rotulados da mesma maneira em locais

diferentes mas que continuem sendo os mesmos dados; e que alguns dados apresentem o

mesmo nome em todos os lugares mas tenham diferentes unidades de medida, e assim por

diante. Tentar extrair dados dos diversos lugares em que eles existem é um problema muito

complexo.

Essa questão de falta de integração, é o pesadelo dos programadores responsáveis

pelos programas de extração. Há mil e um detalhes a observar na programação apenas para

extrair dados do ambiente operacional de forma concreta, conforme ilustrado na figura 7.

31

Figura 7 - Integração dos dados dos sistemas existentes para o Data Warehouse

Fonte: [INM1997]

Um exemplo simples de falta de integração é o fato de os dados não poderem ser

codificados de forma coerente, como exemplificando na codificação como “0/1”. Na

realidade, não importa como será feita de forma coerente. À medida que os dados passam para

o Data Warehouse, os diferentes valores precisam ser corretamente decodificados e

recodificados com o valor apropriado.

A transformação de campos é outra questão de integração. O mesmo campo existe em

quatro aplicações com quatro nomes diferentes. Para que os dados sejam passados

corretamente para o Data Warehouse é necessário que ocorra um rastreamento comparativo

entre os diferentes campos existentes e os campos do Data Warehouse.

Esses poucos exemplos apenas dão uma leve idéia da questão de integração e não são,

em si, complexos. Mas quando eles são multiplicados pelos milhares de arquivos e sistemas

existentes, a questão de integração se torna extremamente complexa e onerosa.

Contudo, a integração (ou falta de) dos sistemas existentes não é a única dificuldade na

passagem de dados do ambiente dos sistemas operacionais existentes para o ambiente de Data

Warehouse. Outro importante problema diz respeito ao acesso eficiente aos dados dos

sistemas existentes. Como pode o programa que varre os sistemas existentes saber se um

arquivo foi varrido anteriormente? Há uma enorme quantidade de dados no ambiente de

32

sistemas existentes e a tentativa de efetuar varreduras completar toda vez que é feita uma

varredura para o Data Warehouse é antieconômica e pouco realista.

Há três tipos de carga que podem ser feitos do ambiente operacional para o Data

Warehouse:

a) o carregamento de dados históricos;

b) o carregamento de dados de valor corrente no ambiente operacional;

c) o carregamento de alterações do Data Warehouse a partir de alterações (atualizações)

que tenham ocorrido no ambiente operacional desde a última atualização do Data

Warehouse.

Como regra, o carregamento de dados históricos representa um desafio menor, uma

vez que ele é feito com freqüência.

Da mesma forma, carregamento de dados do ambiente operacional existente também

constitui grande desafio porque precisa ser feito apenas uma vez. Em geral, o ambiente de

sistemas operacionais existentes pode ser descarregado em um arquivo seqüencial e este pode

ser descarregado no Data Warehouse sem acarretar danos ao ambiente online.

O carregamento de dados durante o processo normal – enquanto são efetuadas

alterações sobre o ambiente operacional – consiste no maior desafio ao arquiteto de dados.

Não é fácil realizar o rastreamento eficiente e o tratamento dessas alterações. A varredura de

arquivos existentes, é portanto, uma importante questão a ser enfrentada pelo arquiteto do

Data Warehouse.

Há cinco técnicas comumente usadas para limitar a quantidade de dados pesquisados,

conforme demonstrado na figura 8. A primeira técnica consiste em pesquisar dados que

apresentem marcas de tempo. Quando uma aplicação registra o momento da última alteração

ou atualização em um registro, a varredura para o Data Warehouse pode ser executada de

forma bem eficiente, porque os dados que apresentarem datas diferentes das procuradas não

precisarão ser tocados. No entanto, os dados existentes, em geral, só incidentalmente recebem

marcas de tempo.

33

Figura 8 - Métodos de varredura dos arquivos da base operacional

Fonte: [INM1997]

A segunda técnica de limitação dos dados a serem pesquisados para uma extração para

o Data Warehouse consiste em varrer um arquivo “delta”. Um arquivo delta é um arquivo

criado por uma aplicação e que contém apenas as alterações efetuadas por esta. Quando é

possível contar com um arquivo delta, o processo de varredura se torna muito eficiente uma

vez que os dados que não forem candidatos à varredura jamais serão tocados. Contudo,

poucas aplicações geram arquivos delta.

A terceira técnica consiste em varrer um arquivo de auditoria ou log. O arquivo de log

ou de auditoria contém basicamente dados do mesmo tipo dos de um arquivo delta. Todavia,

há algumas diferenças significativas. Muitas vezes, o departamento de operação protege os

arquivos de log porque eles são necessários aos processos de recuperação. O departamento de

operação não tem grande interesse em que seu arquivo de log seja utilizado com outros

propósitos. Outro obstáculo relacionado com as fitas de log consiste no fato de o formato

34

interno ser gerado para atender os objetivos de um sistema e não aos de uma determinada

aplicação. Talvez seja necessário contar com algum guru tecnológico que possa criar uma

interface para os dados contidos na fita de log. Outra falha dos arquivos de log é que,

geralmente, eles contém muitas informações além daquelas procuradas pelo desenvolvedor do

Data Warehouse. Os arquivos de auditoria apresentam muitos dos problemas relacionados

com os arquivos de log.

A quarta técnica empregada no gerenciamento da quantidade de dados pesquisada

durante a extração para o Data Warehouse consiste em modificar o código da aplicação. Essa

opção jamais é aplaudida, sobretudo quando o código da aplicação é antigo e complicado.

A última opção consiste em moldar um arquivo de imagem anterior e posterior.

Segundo esta opção, um instantâneo de um banco de dados é tirado no momento da extração.

Quando for necessário realizar outra extração, outro instantâneo é tirado. Os dois instantâneos

serão comparados serialmente entre si para que seja detectada a atividade transcorrida. Esse

método é pesado, complexo e demanda uma quantidade excessiva de recursos.

Porém, integração e performance não são as únicas discrepâncias fundamentais que

impedem que o processo de extração simples seja utilizado para construir o Data Warehouse.

Uma terceira importante dificuldade está relacionada à alteração dos parâmetros de tempo,

conforme ilustrado pela figura 9.

Figura 9 - Alteração de parâmetros de tempo

Fonte: [INM1997]

35

Os dados operacionais existentes são, quase sempre, dados de valor corrente. Dados de

valor corrente são dados cuja exatidão é válida para o momento do acesso e que podem ser

atualizados. Esses dados devem apresentar um elemento de tempo vinculado a eles. Portanto,

à medida que os dados passam do ambiente de sistemas operacionais existentes para o

ambiente de Data Warehouse, é necessário que seja feita uma significativa alteração sobre

eles.

Outra importante observação a ser feita durante a passagem dos dados do ambiente de

sistemas operacionais existentes para o ambiente de Data Warehouse é referente à

necessidade de gerenciar o volume de dados. É preciso efetuar condensação de dados; de

outro modo, o volume de dados contidos no Data Warehouse logo ficará grande demais para

ser controlado. A condensação dos dados deve ser iniciada no momento da extração. A figura

10 mostra uma forma simples de condensação dos dados do Data Warehouse.

Figura 10 - A condensação dos dados é um fator vital para o gerenciamento dos dados

do Data Warehouse

Fonte: [INM1997]

4.8.3 DADOS EXTERNOS / NÃO ESTRUTURADOS

A maioria das empresas ergue seus primeiros empreendimentos de Data Warehouse

sobre os dados cuja fonte são sistemas existentes (ou seja, sobre dados internos à corporação).

Em quase todos os casos, os dados provenientes dos sistemas existentes podem ser

36

classificados como dados internos e estruturados. Os dados têm origem no interior da empresa

e foram moldados segundo um formato regularmente encontrado.

Mas há toda uma enorme quantidade de dados que podem ser usados de forma legítima

por uma empresa e que não são gerados pelos próprios sistemas da empresa. Essa classe de

dados é chamada de dados externos e geralmente adentra a empresa em um formato não-

estruturado e imprevisível.

O Data Warehouse é o local ideal para armazenar dados externos e não-estruturados.

Quando os dados externos e não-estruturados adentram a empresa de forma indisciplinada, a

identidade da fonte de dados é perdida, e não há qualquer coordenação quanto ao uso

ordenado dos dados.

Tradicionalmente, quando os dados externos não são inseridos no Data Warehouse,

eles entram na empresa por meio do microcomputador. Não há nada de errado nisso, por estar

entrando por este nível. Mas quase sempre, quando os dados entram pelo nível do

microcomputador, isso é feito manualmente por meio de uma planilha e absolutamente não há

cuidado em, além de captar os dados, captar também as informações sobre sua fonte

[INM1997].

Um outro problema relacionado com o enfoque de simplesmente deixar acontecer,

com relação ao tratamento de dados externos, é que mais tarde é difícil reutilizar os dados.

Eles são introduzidos nos sistemas da empresa, usados uma vez e, então, desaparecem.

Mesmo umas poucas semanas depois, é difícil tornar a acessar os dados para nova utilização,

e isso é inoportuno, porque a maioria dos dados provenientes de fontes externas é bastante útil

por um longo período.

4.8.4 INSERINDO DADOS NÃO-ESTRUTURADOS

Há várias questões relacionadas ao uso e armazenamento de dados externos e não-

estruturados no Data Warehouse. Um dos problemas dos dados não-estruturados é a

freqüência de disponibilidade. Ao contrário dos dados de publicação interna, não há um

padrão real de publicação de dados externos. A freqüência de publicação é um problema sobre

o qual deve ser estabelecido monitoramento constante para garantir que os dados certos sejam

obtidos.

37

O segundo problema com os dados externos é a forma dos dados. A forma dos dados

externos é totalmente indisciplinada. Para que eles possam ser usados, e para que eles sejam

colocados no Data Warehouse, é preciso efetuar uma certa quantidade de reformatação dos

dados externos para passá-los para uma forma internamente aceitável e utilizável.

O terceiro fator que dificulta a obtenção de dados externos é a sua imprevisibilidade.

Dados externos podem vir de praticamente qualquer fonte a quase qualquer momento. A

natureza imprevisível da disponibilidade dos dados externos torna muito difícil a sua captação

consistente e completa.

Além dos dados externos que podem ser publicados em um artigo de uma revista ou

em um relatório de um consultor, há toda uma classe de dados não-estruturados que só agora

com o Data Warehouse, podem ser armazenados.

Os dois tipos mais comuns de dados não-estruturados ocorrem na forma de imagens e

voz. Os dados de imagem são armazenados como gráficos. Os dados de voz são dados

armazenados digitalmente e com a possibilidade de reconversão para um formato de voz. As

questões referentes aos dados de imagem e aos dados de voz originam-se sobretudo na

tecnologia. A tecnologia para captura e tratamento de dados de imagem e voz não é tão

madura quanto a tecnologia mais convencional. Além disso, mesmo quando imagem e voz

podem ser capturadas, seu armazenamento demanda enormes quantidades de DASD, e sua

reutilização e exibição ou audição pode ser difícil e lenta.

Contudo, há muitas possibilidades de captação de informações não-estruturadas e de

seu armazenamento em um Data Warehouse.

4.8.5 GRANULARIDADE

“A mais importante questão de projeto que o desenvolvedor do Data Warehouse

precisa enfrentar diz respeito à definição da granularidade do Data Warehouse. Quando a

granularidade de um Data Warehouse é propriamente estabelecida, os demais aspectos de

projeto e implementação fluem tranqüilamente; quando ela não é estabelecida, todos os outros

aspectos se complicam” [BAR1997].

38

Granularidade refere-se ao nível de detalhe em que as unidades de dados são mantidas

no Data Warehouse. Quanto maior o nível de detalhes, menor o nível de granularidade. Esta é

uma questão fundamental no projeto de um Data Warehouse porque afeta diretamente o

volume de dados armazenados no Data Warehouse e ao mesmo tempo, o tipo de consulta que

pode ser respondida. O volume de dados contidos no Data Warehouse é balanceado de acordo

com o nível de detalhe de uma consulta [CAM1997].

39

5 SEAGATE INFO 7

5.1 INTRODUÇÃO

Para implementar os conceitos mencionados na fundamentação exposta, foi utilizada a

ferramenta Seagate Info 7, da empresa Seagate Softwares. Os componentes da ferramenta,

descritos a seguir foram utilizados, e ao se completar a implantação do Data Warehouse,

todos serão utilizados.

O Seagate Info 7 é um software baseado na estrutura cliente-servidor: que provê

acesso seguro às informações para as pessoas de uma organização, bem como projetado a

satisfazer as demandas dos usuários e desenvolvedores, oferecendo uma interface fácil de

usar, juntamente com componentes finais muito poderosos. Seagate Info permite que usuários

criem relatórios e consultas e após isto, que possam compartilhar o resultado com outros

usuários. Cada usuário em um grupo de trabalho tem a possibilidade de acessar e usar as

informações através do Info Desktop ou do Info WebAcess. O Info Desktop tem uma

interface semelhante a interface de email, que é dividida em um número de pastas. Membros

de determinados grupos tem acesso a vários relatórios e consultas disponíveis nestas pastas. O

Seagate Info não só permite compartilhar, bem como distribuir a carga do processamento que

podem ser executadas por outras máquinas. Estas máquinas são conhecidas como Info

Servers. Com isto, os usuários podem programar a execução das tarefas, permitindo que

possam executar outras tarefas durante este processo de carga das informações[SEA1999].

Enquanto que o Info Desktop permite aos usuários uma intuitiva e poderosa interface

para a obtenção de informações de suporte à decisão que estes necessitam, o poder real do

Seagate Info encontra-se nos módulos auxiliares. O Info Administrator, Info APS, Info

Sentinel, e Info Servers conjuntamente provêm vários controles sobre o tráfego da rede,

atividade do banco de dados, usuários, máquinas etc[SEA1999].

A seguir será explicada resumidamente a função de cada componente do Seagate Info

7.

40

5.1.1 INFO DESKTOP

Segundo [SEA1999], o Info Desktop é a interface primária do usuário. Ela permite ao

usuário o acesso a um limite de ferramentas, relatórios, consultas, e programas. Ele usa uma

interface semelhante ao sistema de email, para organizar, programar, visualizar e analisar

relatórios, consultas, cubos e programas. Todos os usuários, que tiverem seus micros

conectados a uma LAN (Local Área Network) ou WAN (Wired Área Network), podem

acessar informações de grupos de trabalho para as decisões do dia-a-dia com o Info Desktop.

O administrador do sistema pode configurar cada desktop para configurar as

necessidades de cada usuário individual e o acesso aos dados, e a segurança necessária a

organização.

Uma configuração completa do Info Desktop contém:

a) View: visualização dos resultados dos relatórios;

b) Schedule: programar(escalonar) requisição de processamento das informações;

c) Query: gera consultas ad-hoc e cria relatórios a partir de consultas;

d) Report: criação de relatórios.

5.1.2 INFO ADMINISTRATOR

Conforme [SEA1999], o Info Administrator é a ferramenta de controle usada para

parametrizar o Seagate Info na empresa. O Info Administrator é utilizado para:

a) Montar o calendário de atividade da empresa e programação de execução de modelos

de acesso(relatórios, consultas, etc);

b) configurar as respostas do sistema a eventos, segurança, e funções de auditoria;

c) adicionar, modificar, e remover usuários, e associações de usuários, bem como direitos

de grupos de usuários;

d) preparar eventos para que possam ser usados como tarefas;

e) adicionar, modificar, ativar, desativar, e remover Info Servers, Info Server Groups, e

Info Servers Classes.

Para usar o Info Administrator, necessariamente deve-se estar conectado a um Info

APS. Quando conectado, o Info Administrator mostra uma caixa de diálogo contendo todos os

parâmetros de cada Info APS.

41

5.1.3 INFO APS

Segundo [SEA1999], o Aplication Process Server - Info APS, é a estrutura de

escalonamento para relatórios, consultas, cubos e programas. Tem a função de:

a) delegar tarefas aos Info Servers presentes para processamento;

b) controlar as tarefas em cada Info Server;

c) registrar os retornos dos códigos de execução.

Neste estágio somente foi utilizado um Info Server, pois notou-se que suportava o

volume de dados a ser processado.

5.1.4 INFO SERVER

Segundo [SEA1999], o Info Server é um software instalado em máquina designada a

executar as tarefas.

5.1.5 INFO OLAP AGENT

O Info Olap Agent funciona similarmente ao Info Agent (programa residente em

memória que aciona os programas necessários a execução das tarefas). Porém, diferentemente

do Info Agent, somente é utilizado quando um usuário escalona um cubo para ser executado.

Sendo um cubo escalonado, o Info APS chama o Info OLAP Agent em um Info OLAP Server

disponível. Neste ponto, o Info OLAP Agent pega o objeto do cubo e cria uma instância, que

consiste em um padrão de arquivos que definem a estrutura de dados no cubo. A partir deste

momento o cubo pode ser visualizado por outros usuários ou grupos de usuários através do

Info Desktop, ou pelo browser, sendo necessário instalar para isto o Info

WebAccess.[SEA1999]

5.1.6 INFO SENTINEL

Considerado como o “coração” da comunicação de dados pela rede. Está presente em

qualquer tipo de instalação, mesmo sendo a mínima, pois é vital para o funcionamento do

sistema.

42

O Info APS usa o Info Sentinel para permanecer em constante comunicação com o(s)

Info(s) Server(s), as máquinas que efetivamente rodam as tarefas escalonadas. O Info Sentinel

no Info Server retorna informações para o Info APS sobre:

a) o restante do trabalho que foi completado;

b) códigos de erro decorrentes dos trabalhos;

c) outras variáveis que indicam estado de atividade.

O Info APS usa estas informações para melhorar estes enfileiramentos, delegações e

funções de notificação.[SEA1999]

5.1.7 INFO WORKSHEET

Esta ferramenta é utilizada para a manipulação dos cubos gerados a partir do Info

Server. Com esta ferramenta é possível manipular as dimensões até que se chegue a visão

necessária dos dados.

43

6 DESENVOLVIMENTO DA PROPOSTA

6.1 NECESSIDADES DA EMPRESA

As necessidades da Indústria de Relógios Herweg S.A:

a) procurar por um meio que possibilite a obtenção de dados estatísticos que auxiliem na

tomada de decisão, acompanhando o processo de implantação do sistema corporativo,

verificando a eficiência destes e também a produção alcançada pela empresa, bem

como a produção dos usuários relacionados ao sistema corporativo;

b) fornecer dados concretos e de fácil compreensão para os superiores(diretoria), fazendo

com que estes verifiquem o sucesso do projeto de implantação do Data Warehouse;

c) possibilitar aos usuários uma ferramenta de fácil compreensão, e que não se limite a

ser usada somente dentro da empresa, cabendo a este sistema possibilitar que sejam

levados a campo.

6.2 APLICAÇÃO DA METODOLOGIA DE W.H.INMON

Como trata-se de uma área nova que estava sendo informatizada na empresa, através

do sistema corporativo Sapiens, os dados necessários foram gerados, não havendo dados de

outros sistemas que houvesse a necessidade de agrupar.

Com isto, foram povoadas as tabelas da área de produção, chegando a ser povoadas as

tabelas necessárias, em que se pudesse extrair informação para análise. Até esta fase,

concluiu-se os dois primeiros passos da geração do Data Warehouse, mencionado por

Inmon[INM1997], como sendo o primeiro e o segundo dia de construção do Data Warehouse.

O terceiro dia, ou dia 3, como Inmon [INM1997] coloca, já foi alcançado, com a

demonstração da utilidade do Data Warehouse para usuários do setor de Vendas da empresa.

O interesse se criou e a continuação do Data Warehouse nesta área também é certa.

Os outros dias serão conseqüência, que não será considerada no estágio, pois este está

voltado a implantar a tecnologia para que depois possa ser aprimorada em todas as áreas da

empresa.

44

6.3 ROTEIRO PARA PROJETO SEGUNDO W.H.INMON.

6.3.1 JUSTIFICATIVA DE CUSTOS

Com a conclusão do protótipo, notou-se que se torna viável o investimento,

considerando-se o valor da informação gerada. Com a informação pronta para ser utilizada,

pode-se fazer com que os tomadores de decisão gastem mais tempo aplicando os

conhecimentos contidos nos cubos, sobre os casos do dia-a-dia.

6.3.2 BUSCA PELOS DADOS OPERACIONAIS

Por se tratar de uma construção de Data Warehouse baseado em um sistema criado

recentemente, não houve a necessidade de integrar os dados não consistentes

6.3.3 DATA WAREHOUSE E OS MODELOS DE DADOS

O modelo de dados operacional encontra-se na figura 23. As descrições dos campos

das tabelas contidas na figura 23, estão assim descritas:

a) E900CMO: contém os componentes de produção envolvidos em determinada ordem

de produção. A descrição dos campos está descrita na figura 11;

Figura 11 - Tabela E900CMO

45

b) E205DEP: contém o cadastro dos depósitos. A descrição dos campos está descrita na

figura 12;

Figura 12 - Tabela E205DEP

c) E093ETG: contém o cadastro dos depósitos. A descrição dos campos está descrita na

figura 13;

Figura 13 - Tabela E093ETG

d) E900COP: contém os dados que identificam a ordem de produção.A descrição dos

campos está descrita na figura 14;

46

Figura 14 - Tabela E900COP

e) E083ORI: contém o cadastro de origens de produção. A descrição dos campos está

descrita na figura 15.

47

Figura 15 - Tabela E083ORI

f) E075PRO: contém o cadastro de produtos. A descrição dos campos está descrita na

figura 16;

48

Figura 16 - Tabela E075PRO

49

g) E070EMP: contém o cadastro de empresas. A descrição dos campos está descrita na

figura 17;

Figura 17 - Tabela E070EMP

h) E900EOQ: contém as movimentações das ordens de produção. A descrição dos

campos está descrita na figura 18;

50

Figura 18 - Tabela E900EOQ

i) E001TNS: contém o cadastro das transações. Neste estágio foram utilizadas as

transações de movimento de estoques. A descrição dos campos está descrita na figura

19.

51

Figura 19 - Tabela E001TNS

52

continuação da figura 19.

53

Os modelos de construção dos cubos encontram-se no anexo 1.

6.3.4 VANTAGENS

Segue abaixo relação de vantagens do protótipo desenvolvido:

a) possibilidade de transportar os dados gerados pelo cubo para uma estação que tenha o

Info Desktop instalado. Com isto, poder-se-á futuramente, por exemplo, se for

implementado na área de Vendas, fazer com que estes dados sejam levados para serem

analisados juntamente com os representantes e vendedores;

b) armazenamento do conhecimento referente ao modo de se analisar o andamento da

produção.

6.3.5 FUNCIONAMENTO DO PROTÓTIPO

Neste tópico serão apresentadas as telas que foram acessadas para a elaboração dos

protótipos de cubos.

Figura 20 - Info Desktop

54

Na figura 20, é apresentada a tela do Info Desktop. Como sendo a tela principal para o

acesso aos outros módulos da ferramenta. A partir desta tela foram utilizadas as seguintes

funções e telas, conforme segue abaixo:

a) Info Cube Designer: a partir desta tela foi possível a elaboração dos cubos

propriamente ditos;

b) View: para a visualização do cubo gerado. Esta função ativa o Info Worksheet, que é a

tela de manipulação do cubo;

c) Schedule: função que programa o cubo para ser executado em determinado horário..

d) Na figura 21 é apresentada a tela inicial do Info Worksheet.

Figura 21 - Info Worksheet

e) Ao pressionar sobre o botão , é possível alterar as dimensões do cubo, em relação

ao que está sendo apresentado. Existem as opções de seleção múltipla e simples dos

dados inseridos na dimensão, conforme mostra a figura 22.

55

Figura 22 - Tela de seleção de dimensões do cubo

56

Figura 23 - Modelo de dados do nível operacional.

E205DEPCODEMPCODDEP

DESDEPABRDEPDEPCPRESTNEGCODFILCTAREDSITDEPCODCCUDISXPL

E900CMOCODEMP (FK)CODORI (FK)NUMORP (FK)CODETG (FK)SEQCMP

CODCMP (FK)CODDERQTDPRVQTDRESQTDUTIQTDSERQTDRTSUNIMEDCODTNS (FK)CODDEPCODLOTCODCCUSOLCMPNUMSEP

E070EMPCODEMP

NOMEMPSIGEMPCODGRECODMPCCODPAIEANEMPVENEMPESTEMPRECEMPCPREMPPAGEMPCXBEMPCTBEMPEFIEMPPATEMPPRDEMPCUSEMPESPDEPESPPROPRDMASPRDMULTIPPEREISEMP

E001TNSCODEMP (FK)CODTNS

DESTNSDETTNSLISMODACEMANCODFCTCRICTBVENUPDVENTCFVENDEVVENFATVENACPVENICMVENIBIVENFREVENSEGVENEMBVENENCVENOUTVENLIRVENIRFVENISSVENDEPVENEBPVENMS1VENMS2VENTPTVENMOEESTEOSESTMOVESTCONESTCOCESTCOFESTPRMESTPRUESTPRRESTVMVESTTRFESTDUMESTDEPRECDECRECADCRECTPBRECASHRECHISCPRUOCCPRHENCPRTCFCPRDEVCPRAOCCPRLIRCPRIRFCPRISSCPRDEPCPRTPTCPRMOEPAGDECPAGADFPAGTPBPAGASHPAGHISCXBDECCXBTRFCXBCHEFICEOSPCPEOSCHAEOSPAGVBCCODREGFORRATCTAREDCTARCRCTAFDVCTAFCRSITTNSCODNTGVENIFUVENTNFCPRIFUCPRIBICPRTNFPAGTIRUSUGERDATGERHORGER

E900COPCODEMPCODEMP (FK)CODORI (FK)NUMORP

CODPRO (FK)CODPVPCODFILNUMPEDDTPINIDTPFIMDTRINIDTRFIMCODFAMCODROTTMPPRVSITORPROTALTSITANTULTGOPTIPORPDATGERQTDPRVQTDRE1QTDRE2QTDRE3OBSORPOBSOR2NUMPRILOTTEC

E093ETGCODEMP (FK)CODEMPCODETG

DESETGABRETGCTAREDCODCCUCODORI (FK)TIPETGUTICELPTOIQLMOVAUTCODLOCMOVGOPCTARCR

E083ORICODEMPCODORI

DESORINUMORITIPPRODEPPADBXAAGRBXAMOVRESCMPMOVPARGEROPRCTRSEPCTRLOTCTRQLDCTRRFGCTRGOPGERPEDAGRIPDAGRNBCDISNECGEREANSITCALCODPVPCNFNECINIPVPORPDERGERSOLGERAGRMOVOPDQTDBASUSAFRQUSAFIXUSAAUXMOVPRLCODREGOPDORP

E900EOQCODEMP (FK)CODEMPCODORI (FK)NUMORP (FK)CODETG (FK)SEQEOQ

NUMGOPCODPROCODDERSEQROTCODOPRCODCELTURTRBCODLOTQTDRE1QTDRE2QTDRE3QTDRFGQTDIQLDATREAHORREANUMCADQTDHRRCODUSUDATINIHORINIFIMORPNUMSEP

E075PROCODEMP (FK)CODEMPCODPRO

DESPROCPLPRODESNFVCODFAMUNIMEDUNIME2UNIME3TIPPROCODORI (FK)NUMORICODMDPCODMODCODROTCODAGECODAGPCODAGUCODAGCCODAGFCODCLFCODSTRPERIPIRECIPITEMICMCODTICCODTRDCODTSTRECICMCODROYQTDMLTQTDMINQTDMAXQTDGOPCODPR2DERPR2CODPR3DERPR3CTAREDSITPROROTPROPROSTQUSOCUSCTARCRCTAFDVCTAFCRCODSTPCODSTCTNSGENINDMISMATDIRUSUGERDATGERHORGERCODPR4DERPR4

Na figura 23, estão relacionadas as tabelas utilizadas para gerar os cubos de decisão.

57

7 CONCLUSÃO

Aplicando as técnicas do Data Warehouse, notou-se que se torna necessário:

conhecimento da base de dados de nível operacional, sendo necessário ter uma visão crítica de

como aproveitar os dados contidos nos campos, para que estes possam se tornar informações

para os tomadores de decisão; tempo de desenvolvimento disponível, e empenhado

diretamente no assunto: devido à sua complexidade, e aos vários passos que devem ser

executados até a elaboração do primeiro protótipo, que serve de base para o aperfeiçoamento

do Data Warehouse.

Com o término deste protótipo, verificou-se ser um assunto que deve ser continuado

nos vários departamentos da Indústria de Relógios Herweg S.A.

Apesar de concluído o protótipo, ficaram algumas etapas a serem realizadas para a real

utilização do que se implementou. Segue abaixo os itens que valem ser considerados:

divulgação da implementação; treinamento na ferramenta Info Worksheet, para os

funcionários, que farão uso das informações geradas; aprimoramento e alteração, a partir das

sugestões vindas dos usuários.

7.1 DIFICULDADES

A seguir estão relacionadas as dificuldades encontradas, referente ao que se propunha

o protótipo:

a) ferramenta nova no mercado: com isto, somente se obteve suporte na página da

empresa produtora do software. Também utilizou-se o suporte da empresa Soft

Consultoria;

b) atrasos no cronograma de implantação do módulo de produção: no dia 9 de Junho de

2000, foi realizado o treinamento do módulo de produção, ao qual, a partir deste

momento tornou-se possível inserir dados na base do nível operacional, para a partir

deste instante, gerar o Data Warehouse.

Encontrou-se como limitação neste protótipo, os seguintes itens como segue abaixo:

a) ficou pendente, implementar nos cubos, a opção de geração de dimensões a partir de

SQL (Structured Query Language), o que tornaria mais maleável a construção do

cubo;

58

b) como não havia dado de outro sistema a ser integrado, não ocorreu o processo de

integração.

Com a apresentação do protótipo ao coordenador do estágio, demonstrando a

funcionalidade dos cubos criados, obteve-se retorno positivo, quanto a aceitação e apoio à

implantação e continuidade, mesmo com o término do estágio.

7.2 SUGESTÕES E MELHORAMENTOS FUTUROS

A partir do que se alcançou neste estágio, sugere-se para futuros trabalhos:

a) comparação entre as diferentes soluções existentes no mercado, verificando a quais

contextos cada produto atende;

b) gerar a integração de dados de sistemas heterogêneos, analisando as dificuldades

encontradas.

59

8 ANEXO 1.

60

61

REFERÊNCIAS BIBLIOGRÁFICAS

[AMA1997] AMARAL, Antônio Jr. Desmistificando definitivamente o Data Warehouse.

Developers Magazine, Axcel. São Paulo, Fevereiro/1997, n.6, pág:14-17.

[BAR1997] BARBIERI, Carlos. Data Warehouse: revisando a tecnologia. Computerworld,

Rio de Janeiro: n.246, p.18, Março 1998.

[BIN1994] BINDER, Fábio Vinícius. Sistemas de Apoio à Decisão. São Paulo : Érica, 1994.

[CRU1998] CRUZ, Tadeu. Sistemas de informações gerenciais: tecnologia da informação e

a empresa do século XXI. São Paulo : Atlas, 1998.

[DAL1998] DAL’ALBA, Adriano. Um estudo sobre Data Warehouse. Dezembro 1998.

Endereço eletrônico: http://www.geocities.com/SiliconValley/Port/5072. Data

da consulta : Abril de 2000.

[DAL1999] DALFOVO, Oscar; GRIPA, Robson. Data Warehouse: usando a técnica de

Cubo de Decisão. Developers Magazine, Axcel. São Paulo, Abril/ 1999,

n.32, pag:12-26.

[EXP1997] EXPOCORP, Guia da. Guia da Feira Expocorp. São Paulo : Abril/1997, pág:6.

[FUR1994] FURLAN, José Davi et al. Sistemas de informação executiva – EIS –

Executive Information Systems. São Paulo : MAKRON Books, 1994.

[GON1997] GONÇALVES, Jorge Luiz Mendes. Data Warehouse é necessariamente um

megaprojeto?. Developers Magazine, Axel. Rio de Janeiro, Fevereiro/1997,

n.6, pag:12-13.

[INM1997] INMON, W.H. Como construir o Data Warehouse. Rio de Janeiro : Campus,

1997.

[JOR1997] JORNADA DE ATUALIZAÇÃO EM INFORMÁTICA. XVII Congresso da

Sociedade Brasileira de Computação; Anais. Editado por Cláudia Maria

Bauzer Medeiros. Brasília : UnB, 1997.

62

[KIM1998] KIMBALL, Ralph. Data Warehouse toolkit. São Paulo : Makron Books, 1998.

[MEN1998] MENGARDA, Mariane Terezinha. Definição de um roteiro de preparação para

implantação de um Data Warehouse. Blumenau, 1998. Trabalho de

Conclusão de Curso (Bacharelado em Ciências da Computação), FURB.

[MUE1999] MUELLER, Marcos. Protótipo de um aplicativo em Data Warehouse na área

ambiental. Blumenau, 1999. Trabalho de Conclusão de Curso (Bacharelado

em Ciências da Computação), FURB.

[OLI1992] OLIVEIRA, Djalma de Pinho Rebouças de. Sistemas de Informações Gerenciais:

estratégias, táticas, operacionais. São Paulo : Atlas, 1992.

[SAL1994] SALVADOR, Jean Hélvio. Um protótipo de sistema de informações executivas

para a área de administração de vendas. Blumenau, 1994. Trabalho de

Conclusão de Curso (Bacharelado em Ciências da Computação), FURB.

[SEA1999] Seagate Softwares. Support Documentation Library 1999. Endereço eletrônico:

http://community.seagatesoftware.com/library/default.asp. Data da consulta:

Abril de 2000.

[TRO1997] TRONCHIN, Jr. Data Warehousing uma attitude estratégica. DBMS, Rio de

Janeiro: n. 6,p.55, Outubro 1997.

Documents

IMPLEMENTAÇÃO DE SISTEMA DE INFORMAÇÃO …campeche.inf.furb.br/tccs/2000-I/2000-1heintjeingokortevf.pdf · No primeiro capítulo é apresentado o objetivo, como também a organização