44
Questões comentadas Sistemas de Informações Gerenciais para concursos

Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Embed Size (px)

Citation preview

Page 1: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Questões comentadas

Sistemas de Informações Gerenciaispara concursos

Page 2: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

Prefácio

Atualmente estamos inseridos num contexto de extrema mutabilidade, onde a concorrência setorna cada vez mais acirrada. O mercado é global e mais sensível às mudanças e o consumidortornar-se cada vez mais exigente em relação ao custo e à qualidade do produto e dos serviçosassociados.

Devido à competição exaltada e à necessidade de cultivar lucros, as empresas estão transfor-mando algumas das Tecnologias de Informação em ferramentas estratégicas para obterem su-cesso no gerenciamento dos seus negócios.

No cenário atual, onde os gerentes necessitam tomar decisões rápidas em resposta às adversida-des que ocorrem freqüentemente em seus negócios, faz-se necessário um sistema de informaçãoque dê suporte às suas decisões, levantando informações precisas, con�áveis, oportunas e rele-vantes, apresentando-as em um formato facilmente compreensível.

Dentro desse cenário, a Tecnologia de Informação assume um papel de grande importância aopermitir de forma rápida e simples a manipulação das informações necessárias ao gerenciamentointegrado dos negócios. O Data Warehouse, em especial, oferece os fundamentos e os recursosnecessários à tomada de decisão, fornecendo dados integrados e históricos a todos os níveis daorganização.

Como era de se esperar, os concursos de TI, sempre atentos ao cenário atual, cobram comfrequência tal assunto.

Este volume tem por objetivo fornecer ao candidato uma visão dos principais recursos em-pregados na extração de informação útil à tomada de decisão. Para tanto, o Grupo Handbookde TI selecionou uma série de questões comentadas em detalhes para você.

Bons estudos,

Grupo Handbook de TI

Página 1 de 42www.handbookdeti.com.br

Page 3: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

Direitos Autorais

Este material é registrado no Escritório de Direitos Autorais (EDA) da Fundação BibliotecaNacional. Todos os direitos autorais referentes a esta obra são reservados exclusivamente aosseus autores.

Os autores deste material não proíbem seu compartilhamento entre amigos e colegas próxi-mos de estudo. Contudo, a reprodução, parcial ou integral, e a disseminação deste material deforma indiscriminada através de qualquer meio, inclusive na Internet, extrapolam os limites dacolaboração. Essa prática desincentiva o lançamento de novos produtos e enfraquece a comuni-dade concurseira Handbook de TI.

A série Handbook de Questões de TI Comentadas para Concursos � Além do Gabarito é umaprodução independente e contamos com você para mantê-la sempre viva.

Grupo Handbook de TI

Página 2 de 42www.handbookdeti.com.br

Page 4: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

Canais de Comunicação

O Grupo Handbook de TI disponibiliza diversos canais de comunicação para os concurseirosde TI.

Loja Handbook de TI

Acesse a nossa loja virtual em http://www.handbookdeti.com.br

Serviço de Atendimento

Comunique-se diretamente conosco através do e-mail [email protected]

Twitter do Handbook de TI

Acompanhe de perto promoções e lançamentos de produtos pelo nosso Twitter http://twitter.com/handbookdeti

Página 3 de 42www.handbookdeti.com.br

Page 5: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

1. Assuntos relacionados: Banco de Dados,Banca: CESGRANRIOInstituição: PetrobrasCargo: Analista de Sistemas - Eng. de SoftwareAno: 2008Questão: 27

Há 3 cidades com 5 clientes cada, 2 cidades com 4 clientes cada e 10 produtos cadastradosno banco de dados. Se um cliente não compra o mesmo produto duas vezes no mesmo diae nem em dois dias seguidos, a quantidade máxima de registros na tabela VENDA, paraclientes de uma determinada cidade, em um intervalo qualquer de 30 dias, será

(a). 300

(b). 750

(c). 1500

(d). 3000

(e). 4500

Solução:

Note que um cliente não poderá comprar o mesmo produto por mais de 15 vezes em umintervalo de 30 dias, já que o intervalo mínimo entre as compras de um mesmo produto seráde 2 dias.

No caso máximo, qualquer cliente poderá realizar a compra de todos os 10 produtos, masnão poderá comprar um mesmo produto por mais de 15 vezes dentro do intervalo de 30 dias.Ou seja, um cliente poderá representar, no máximo, 150 (15x10) registros na tabela VENDA.

As cidades que possuem mais clientes, possuem cinco clientes. Logo, no máximo, essascidades poderão conter 750 (5x15x10) registros na tabela VENDA. Concluímos que a res-posta correta é a alternativa B.

A cidade que possui quatro clientes, poderá, no máximo, ser associada a 600 registros databela VENDA. Podemos também calcular a quantidade máxima de registros na tabelaVENDA da seguinte maneira: 3x5x15x10 + 2x4x15x10 = 3450. Tal cálculo seria interes-sante se quiséssemos, por exemplo, dimensionar o tamanho máximo do banco de dados.

Página 4 de 42www.handbookdeti.com.br

Page 6: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

2. Assuntos relacionados: Sistemas de Informações Gerenciais,Banca: ESAFInstituição: Secretaria do Tesouro Nacional (STN)Cargo: Analista de Finanças e Controle - Tecnologia da Informação / Desenvolvimento deSistemas de InformaçãoAno: 2008Questão: 28

O sistema de informação utilizado pelo Governo Federal para controlar e acompanhar aexecução orçamentária, patrimonial e �nanceira é denominado

(a). SIGPLAN.

(b). SISG.

(c). SIAFI.

(d). SIASG.

(e). SIAPE.

Solução:

Para identi�cação da resposta correta é necessário conhecer o signi�cado das siglas listadas.Assim, além de dizer a razão pela qual uma resposta é correta ou incorreta, o signi�cadodas siglas e o propósito do sistema por elas representados serão apresentados.

(A) INCORRETA

SIGPLAN1 é o sistema de informações gerenciais e de planejamento e contribui na ela-boração, monitoramento, avaliação e revisão dos programas do Plano Plurianual. Ele foiconcebido para apoiar a execução dos programas governamentais e é utilizado pelos órgãossetoriais, presidência da república, casa civil, ministérios e outras entidades.

Seu objetivo é o de servir como meio de comunicação e integraçao entre as pessoas respon-sáveis em executar e monitorar os programas governamentais, fornecendo as informaçõesnecessárias e em tempo.

Algumas de suas características mais importantes são:

• Acompanhamento da execução física em �tempo real�: por ele a administração públicafederal pode realizar um efetivo gerenciamento das ações governamentais, em particularno que diz respeito ao desempenho físico;

• Gestão de restrições: possibilita ao gerente a antecipação e sistematização das restri-ções, o que facilita a mobilização e a busca por soluções por parte do governo e seusparceiros;

• Integração de informações: sua base de dados contém informações sobre a execução dasações, seu gerenciamento e monitoramento, e informações orçamentárias e �nanceirassobre cada programa, sendo composta de dados provenientes de diversas fontes.

1Manual de Operação do SIGPlan, disponível em http://www.sigplan.gov.br/arquivos/Download/ManualSigplan.pdfe acessado em 25/05/2010.

Página 5 de 42www.handbookdeti.com.br

Page 7: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

(B) INCORRETA

O sistema de serviços gerais - SISG2 não é um sistema de informação, mas o sistema queorganiza as atividades de administração de edifícios públicos e imóveis residenciais, material,transporte, comunicações administrativas e documentação.

Além de ser integrado pelos órgãos e unidades da Administração Federal incumbidos es-peci�camente de executar as atividades relacionados ao sistema, os ministérios militares e oestado-maior das forças armadas poderão aplicar, no que couber, as normas pertinentes aoSISG.

O SISG compreende:

I. o órgão central, responsável pela formulação de diretrizes, orientação, planejamento ecoordenação, supervisão e controle dos assuntos relativos a Serviços Gerais;

II. os órgãos setoriais, unidades incumbidas especi�camente de atividades concernentes aoSISG, nos Ministérios e órgãos integrantes da Presidência da República;

III. os órgãos seccionais, unidades incumbidas da execução das atividades do SISG, nasautarquias e fundações públicas.

(C) CORRETA

O SIAFI3, ou sistema de integrado de administração �nanceira, é um sistema contábil quetem por �nalidade realizar todo o processamento, controle e execução �nanceira, patrimoniale contábil do governo federal brasileiro. Ele é gerido pela Secretaria do Tesouro Nacional,STN.

Ele foi projetado com o intuito de resolver os problemas de natureza administrativa quedi�cultavam a adequada gestão dos recursos públicos e a preparação do orçamento uni�cadobrasileiro. Assim, com a criação da STN, em 1986, a STN, em conjunto com o SERPRO,desenvolveu tal sistema. Após a criação do sistema, o governo federal tem uma conta únicapara gerir, de onde todas as saídas de dinheiro ocorrem com o registro de sua aplicação edo servidor público que a efetuou.

Seus principais objetivos são o de:

• prover mecanismos adequados ao controle diário da execução orçamentária, �nanceirae patrimonial aos órgãos da Administração Pública;

• fornecer meios para agilizar a programação �nanceira, otimizando a utilização dosrecursos do Tesouro Nacional, através da uni�cação dos recursos de caixa do GovernoFederal;

• permitir que a contabilidade pública seja fonte segura e tempestiva de informaçõesgerenciais destinadas a todos os níveis da Administração Pública Federal;

• padronizar métodos e rotinas de trabalho relativas à gestão dos recursos públicos, semimplicar rigidez ou restrição a essa atividade, uma vez que ele permanece sob totalcontrole do ordenador de despesa de cada unidade gestora;

2Decreto No 1.094, de 23 de março de 1994. Disponível emhttp://www.planalto.gov.br/ccivil_03/Decreto/Antigos/D1094.htm e acessado em 25/05/2010.

3Conheça o SIAFI - A História do SIAFI. Disponível emhttp://www.tesouro.fazenda.gov.br/sia�/index_conheca_sia�.asp e acessado em 25/05/2010.

Página 6 de 42www.handbookdeti.com.br

Page 8: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

• permitir o registro contábil dos balancetes dos estados e municípios e de suas supervi-sionadas;

• permitir o controle da dívida interna e externa, bem como o das transferências negoci-adas;

• integrar e compatibilizar as informações no âmbito do Governo Federal;

• permitir o acompanhamento e a avaliação do uso dos recursos públicos;

• proporcionar a transparência dos gastos do Governo Federal.

(D) INCORRETA

O Sistema Integrado de Administração de Serviços Gerais - SIASG4, é um conjunto infor-matizado de ferramentas para operacionalizar internamente o funcionamento sistêmico dasatividades inerentes ao Sistema de Serviços Gerais - SISG, quais sejam: gestão de materiais,edi�cações públicas, veículos o�ciais, comunicações administrativas, licitações e contratos,do qual o Ministério do Planejamento, Orçamento e Gestão é órgão central normativo.

(E) INCORRETA

O Sistema Integrado de Administração de Recursos Humanos, SIAPE5, é um sistema on-line, de abrangência nacional, que constitui-se, hoje, na principal ferramenta para gestão dopessoal civil do governo federal. Como ele é realizado mensalmente o pagamento de cercade um milhão e trezentos mil servidores ativos, aposentados e pensionistas em 214 órgãosda administração pública federal direta, instituições federais de ensino, ex-territórios, autar-quias, fundações e empresas públicas.

Para acesso aos dados do SIAPE, o Ministério do Planejamento, Orçamento e Gestão ide-alizou o SIAPEnet, aplicativo que possibilita ao servidor efetuar consultas, atualização eimpressão de dados extraídos diretamente do SIAPE.

4O que é SIASG. Disponível em http://www.comprasnet.gov.br/ajuda/siasg/que_e_siasg.stm e acessado em25/05/2010.

5O que é o SIAPEnet. Disponível em http://www.siapenet.gov.br/oque.htm e acessado em 25/05/2010.

Página 7 de 42www.handbookdeti.com.br

Page 9: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

3. Assuntos relacionados: Data Mining, Text Mining, Business Inteligence,Banca: FCCInstituição: TCE/CECargo: Analista de Controle Externo - Auditoria de Tecnologia da InformaçãoAno: 2008Questão: 74

É comum um determinado órgão público receber reclamações de pessoas sobre o atendimentodo serviço. As reclamações recebidas são digitadas de forma apressada em um aplicativode computador. O administrador do órgão pretende obter informações úteis para análisedas reclamações. Assim, ele solicita o apoio tecnológico para atendimento dessa demanda.A equipe então adota, acertadamente, uma solução especí�ca para tratamento de dadossemi-estruturados (o software utiliza uma ontologia de correlação de palavras e conceitos)conhecida por

(a). data mart.

(b). mining de texto.

(c). star schema.

(d). método preditivo.

(e). mining colaborativo.

Solução:

Text Mining (mineração de texto) é o nome dado às técnicas de análise e extração de dadosa partir de textos ou frases. Alguns dos objetivos da aplicação de técnicas de text miningsão a descoberta de conceitos, padrões e tendências, além da classi�cação e sumarizaçãoautomatizada de documentos.

Text Mining surgiu inspirado no Data Mining, que é uma forma de descobrir padrões embases de dados estruturadas. O Text Mining, por sua vez, procura extrair o conhecimentoútil de textos não estruturados e semi-estruturados, como artigos cientí�cos, textos simples,documentos de organizações, páginas da web etc.

Certamente, as técnicas de text mining podem ser aplicadas para solucionar o problemarelatado na questão, que se baseia na extração de informações úteis das bases de dados dereclamações sobre os serviços de atendimento. Portanto, a resposta da questão é alternativaA.

As técnicas de text minig vêm sendo utilizadas em áreas de grande relevância, como bi-omédicas, publicidade e segurança. Na área de segurança, por exemplo, os governos dealguns países vêm utilizando as técnicas para rastrear as atividades de organizações crimi-nosas, por meio da análise de mensagens trocadas pela Internet.

Já na área de publicidade, as técnicas são vastamente utilizadas pelos programas de a�liadoscomo o adwords, do Google, que seleciona os anúncios mais relevantes a serem exibidos combase no conteúdo da página Web, que é analisado usando técnicas de text mining.

Página 8 de 42www.handbookdeti.com.br

Page 10: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

4. Assuntos relacionados: Data Mining, Classi�cação de Dados, Agrupamento de Dados,Sumarização de Dados, Modelagem de Dependência entre Dados,Banca: ESAFInstituição: Agência Nacional de Águas (ANA)Cargo: Analista Administrativo - Tecnologia da Informação e Comunicação / Desenvolvi-mento de Sistemas e Administração de Banco de DadosAno: 2009Questão: 20

Para que uma empresa efetue a análise regular de dados gerados por visitantes do seu siteWeb, a �m de personalizar a propaganda para clientes individualmente, ela deve utilizar

(a). objetos distribuídos.

(b). mineração de dados.

(c). processamento analítico online (olap).

(d). diretório de informações.

(e). sistema de informação gerencial.

Solução:

Uma técnica de inteligência arti�cial que trata o problema de �ltragem de dados a partirde um repositório de informação é a mineração de dados. No contexto da Web, as técnicase modelos de mineração de dados recebem como entrada uma variedade de dados, comoformulário, estruturas de sites e textos em geral. A mineração é um processo de análise dedados publicados em sites com o intuito de procurar relações comuns (padrões), além desumarização de dados em novas formas que são compreensíveis e úteis para uma empresa.A mineração de dados pode ser empregada em empresas para ajudar a descobrir padrõese tendências referentes ao uso da Web. As etapas básicas de mineração de dados são aexploração, modelagem ou construção do conhecimento e por �m a validação dos padrõesencontrados. Existem varias técnicas de mineração de dados como: classi�cação, clustering,sumarização, modelagem de dependência. Vamos apresentar uma breve descrição sobre essastécnicas.

• Classi�cação: construção de uma função que a partir de um conhecimento previa-mente estabelecido consegue classi�car um conjunto de dados em uma ou várias classesprede�nidas;

• Clustering: utilizado para descoberta de agrupamento de dados que possuem ca-racterísticas em comum. Uma categoria ou classe é representada por um conjunto decaracterística, desta forma, ao descobrir uma coleção de dados que possuem um grau desimilaridade estão encontrando um conjunto de dados pertencente a alguma categorianão conhecida;

• Sumarização: essa técnica é utilizada para a construção de modelos que descrevemum conjunto de dados num formato facilmente interpretado;

• Modelagem de dependência: técnica responsável por encontrar dependência entrecaracterísticas de um conjunto de dados ou entre os valores deles.

Usando técnicas de mineração de dados, tais como clustering e modelagem de dependência,um usuário em particular pode estar associado a outros usuários que exibem padrões decomportamento e preferências semelhantes. Então, para esses usuários são oferecidos linksespecí�cos por pertencerem a um mesmo per�l. Uma empresa nesse caso pode ofertar pro-moções de acordo com sua preferência, isso é obtido com base em informações fornecidas

Página 9 de 42www.handbookdeti.com.br

Page 11: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

pelo agrupamento de usuários. Outro exemplo é, a partir de uma escolha de comprar deum cliente, pode-se agir da seguinte forma: �Clientes que compraram este livro tambémcomprariam...� listar os livros relacionados com o tema.

Concluindo, a mineração de dados pode ser usada como meio de oferecer um atendimentoespecializado a um cliente. Portanto, a questão correta é a letra B.

Página 10 de 42www.handbookdeti.com.br

Page 12: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

5. Assuntos relacionados: Banco de Dados, Modelo Multidimensional, Data Mart, DataWarehouse,Banca: CESGRANRIOInstituição: PetrobrasCargo: Analista de Sistemas - Eng. de SoftwareAno: 2008Questão: 28

Um datamart será montado para análise das vendas. Consultas serão feitas com base emprodutos, períodos, cidades e clientes. Assinale a a�rmação correta sobre o modelo multidi-mensional a ser gerado.

(a). É conveniente criar uma tabela para a dimensão DATA, para evitar cálculos comdatas nas consultas SQL e facilitar as consultas por intervalos semanais, mensais,anuais, e similares.

(b). Nenhum atributo da tabela PRODUTO, além da chave primária, deverá constarda tabela fato.

(c). Pelas especi�cações, CIDADE deve ser, necessariamente, uma dimensão do mo-delo.

(d). O modelo estará necessariamente no formato �oco de neve (snow�ake).

(e). QUANTIDADE é um fato não aditivo.

Solução:

Um datamart pode ser conceituado como um subconjunto dos dados de uma organizaçãoque são direcionados a propósitos bem especí�cos ou a pequenos grupos de pessoas que osutilizam como auxílio em tomadas de decisão.

Os datamarts podem ser entendidos como subconjuntos de um data warehouse. Hoje écomum que as empresas comecem a construir o seu data warehouse a partir de datamartsfocados em áreas bem especí�cas e, assim, irem expandindo até formarem o seu data wa-rehouse.

É preciso �car claro que as diferenças entre datamart e data warehouse são apenas comrelação ao tamanho e ao escopo do problema a ser resolvido. Portanto, as de�nições dosproblemas e os requisitos de dados são essencialmente os mesmos para ambos. Enquantoum datamart trata de um problema departamental ou local, um data warehouse envolve oesforço de toda a empresa para que o suporte a decisões atue em todos os níveis da orga-nização. Sabendo-se as diferenças entre escopo e tamanho, o desenvolvimento de um datawarehouse requer tempo, dados e investimentos gerenciais muito maiores que de um data-mart.

Vamos apresentar, agora, alguns conceitos importantes em relação a data warehouse. De�-nimos fato como uma coleção de itens de dados composta de medidas. Esse valor numéricoé denominado demedida. Por exemplo, caso se deseje analisar se as vendas em um determi-nado estado estão caindo, podemos de�nir um fato representando as vendas totais realizadasnas cidades de um determinado estado e analisar o resultado de suas medidas ao longo dotempo.

Os fatos podem ser aditivos, semi-aditivos e não-aditivos. Um fato é aditivo quando elepode ser agregado em todas as dimensões. Por exemplo, VENDAS pode ser agregado em

Página 11 de 42www.handbookdeti.com.br

Page 13: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

qualquer combinação das dimensões DATA, PRODUTO e CIDADE. Um fato é semi-aditivoquando ele não pode ser agregado em pelo menos uma dimensão. Por exemplo, o número deempregados é aditivo nos diferentes departamentos da empresa, mas não o é na dimensãoDATA. Um fato é não-aditivo quando não pode ser agregado em nenhuma dimensão.

Uma dimensão é uma coleção de atributos textuais que descrevem os objetos da orga-nização, e que estão altamente relacionados uns com os outros. Os atributos dimensionaissão a fonte para as restrições mais interessantes nas consultas a um DW e são virtualmentea fonte para os cabeçalhos de colunas do conjunto de respostas em SQL. Por exemplo, po-demos adotar CIDADE como uma dimensão. Para isso, criaríamos uma tabela dimensãoem que cada registro representa uma cidade e descreve outros detalhes da cidade através deseus atributos, como o estado ao qual ela pertence, por exemplo.

Um dos esquemas mais utilizados para representar um data warehouse é o esquema es-trela. Esse esquema é chamado de estrela por apresentar a tabela de fatos dominante nocentro do esquema e as tabelas de dimensões nas extremidades. O esquema estrela podeser estendido de maneira que cada uma das pontas da estrela passa a ser o centro de outrasestrelas. Por exemplo, a dimensão CIDADE poderia ser decomposta de maneira que hajaoutra tabela representando os estados e outras informações relacionadas a ele. Essa decom-posição seria basicamente um processo de normalização.

Vamos, agora, analisar as alternativas.

A alternativa (A) está correta. Ao criarmos uma tabela dimensão DATA, podemos criarum fato que represente a soma das vendas em cada um dos dias ou em cada uma das se-manas, meses ou anos. Como os valores da tabela já estão calculados, uma consulta queprecise saber a quantidade de vendas em um determinado período de tempo terá um customuito menor.

A alternativa (B) está incorreta, pois no dimensionamento de um data warehouse, somoslivres para de�nir nossos fatos. No caso especí�co, um fato que só tivesse a chave primáriada tabela PRODUTO não teria interesse nenhum para os negócios, pois, em geral, os fatosdevem estar associados a valores que tenham representatividade, como a quantidade vendidade um determinado produto, por exemplo.

O mesmo argumento dado anteriormente serve para as alternativas (C) e (D). Há algumasmodelagens que são mais interessantes que outras, dependendo do objetivo que se desejaalcançar, mas não há nenhuma restrição como as indicadas nas alternativas (C) e (D) paraa determinação de um modelo de data warehouse.

A alternativa (E) está errada, pois QUANTIDADE nem é um fato.

Página 12 de 42www.handbookdeti.com.br

Page 14: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

6. Assuntos relacionados: Banco de Dados, Modelo Relacional, Data Warehouse, ModeloMultidimensional, Data Mart, ROLAP, OLAP,Banca: CESGRANRIOInstituição: PetrobrasCargo: Analista de Sistemas - Eng. de SoftwareAno: 2008Questão: 66

A respeito de sistemas de informações gerenciais, são feitas as a�rmativas a seguir.

I - Uma das diferenças entre bancos de dados relacionais e multidimensionais diz respeitoao compromisso entre performance e escalabilidade: bancos de dados relacionais pro-porcionam consultas mais rápidas, enquanto bancos de dados multidimensionais lidammelhor com grandes quantidades de informações armazenadas.

II - ROLAP se refere a um tipo de solução OLAP que utiliza um bancos de dados relaci-onal.

III - Quando um projeto inicia por datamarts departamentais especializados que maistarde se consolidam em um data warehouse institucional, existe uma chance maior desurgirem problemas de inconsistência de metadados do que quando um data warehouseinstitucional dá origem a datamarts departamentais.

IV - Para melhoria de performance, as tabelas em data warehouses, em geral, estão nasformas normais mais altas (considerando que 5 FN é mais alta que 1 FN).

Estão corretas APENAS as a�rmativas

(a). I e II

(b). I e III

(c). I e IV

(d). II e III

(e). III e IV

Solução:

OLAP (Online Analytical Processing) é uma abordagem que possibilita viabilizar consultasem uma análise multidimensional de dados. O termo é usado em contraste com o termoOLTP (Online Transaction Processing), que é uma abordagem largamente utilizada emambientes transacionais. Em um ambiente transacional, há constante entrada de dados econsultas simples. Além disso, é exigido, em um ambiente transacional, que a resposta aousuário seja imediata. Um exemplo é quando você acessa um site de um banco: você querfazer transferências ou conferir as transações em sua conta corrente e uma demora conside-rável é inaceitável. Entretanto, enquanto as abordagens OLTP são extremamente adequadasem diversas situações, elas se mostram inadequadas, em alguns casos, ao acesso às infor-mações gerenciais como a produção de relatórios de vendas, contábeis e �nanceiros. Nesseponto, é que a abordagem OLAP é importante. Os bancos de dados que utilizam OLAPsão projetados em modelos de dados multidimensionais que possibilitam executar consultascomplexas em um tempo muito menor baseando-se, principalmente, em desnormalizações eem agregações.

Um banco de dados OLAP pode ser armazenado de várias maneiras. Em uma arquite-tura ROLAP (relacional), os dados são armazenados em banco de dados relacionais. Já em

Página 13 de 42www.handbookdeti.com.br

Page 15: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

uma arquitetura MOLAP (multidimensional), os dados são armazenados em cubos dimen-sionais, em geral em formatos proprietários, e não em banco de dados relacionais. HOLAP(híbrido) tenta combinar as vantagens de MOLAP e ROLAP, extraindo o que há de melhorde cada uma, ou seja, a alta performance do MOLAP com a melhor escalabilidade do RO-LAP. Outras siglas são utilizadas para representar arquiteturas, mas são pouco utilizadas:WOLAP (Baseado em Web), DOLAP (Desktop) e RTOLAP (Real-Time).

Vamos analisar as a�rmativas da questão:

I como já foi dito, os bancos de dados relacionais podem ser utilizados para armaze-nar bancos de dados modelados da maneira OLAP (multidimensional). As principaismotivações para esse uso é a incrível escalabilidade dos bancos de dados relacionais ea grande disponibilidade de ferramentas. Já uma arquitetura MOLAP (multidimen-sional) é construída, de forma otimizada, em estruturas de dados que possibilitam amelhoria de desempenho em consultas. Ou seja, a a�rmação está incorreta, pois a�rmajustamente o contrário;

II é verdadeira, como já explicado acima;

III é verdadeira, pois quando uma empresa guia o projeto de forma centralizada e compolíticas estabelecidas, ela diminuirá as chances de problemas de inconsistência emmetadados. Caso contrário, cada departamento terá sua forma de pensar sobre acriação de metadados e di�cultará a integração no futuro;

IV a a�rmativa está incorreta, pois um dos principais recursos utilizados em um OLAPpara aumentar o desempenho é a desnormalização das tabelas. A desnormalização éutilizada para diminuir o custo com operações de junções (joins) entre tabelas.

Página 14 de 42www.handbookdeti.com.br

Page 16: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

7. Assuntos relacionados: Data Warehouse, Banco de Dados, Data Mining, Business Inte-ligence, On-line Analytical Processing, On-Line Transaction Processing,Banca: FCCInstituição: TRT 2a RegiãoCargo: Analista Judiciário - Tecnologia da InformaçãoAno: 2008Questão: 37

No âmbito do OLAP, grá�cos de produtos são generalizações da estrutura de ...... apre-sentada por HRU (Harinarayan, Rajaraman e Ullman), na qual as dimensões podem terhierarquias associadas.

Preenche corretamente a lacuna:

(a). tabela.

(b). roll-up.

(c). data mart.

(d). hipercubo.

(e). drill-down.

Solução:

Antes de partirmos para a solução da questão, faremos uma breve revisão sobre On-lineAnalytical Processing (OLAP).

O uso da tecnologia da informação possibilitou o armazenamento de grande volume dedados em meio magnético, gerando a necessidade de recuperá-los e analisá-los. As aplica-ções On-Line Transaction Processing (OLTP) são estruturadas e repetitivas, que manipulamtransações curtas, atômicas e isoladas, atendendo apenas a manipulação de dados operaci-onais, o que não era su�ciente para apoiar o usuário na tomada de decisões estratégicas. Apartir dos requisitos dos usuários e de tecnologias existentes, foram elaborados conceitos edesenvolvidas soluções que alavancassem o processo de Business Inteligence (BI). A primeiradas soluções foi a linguagem APL, base utilizada no desenvolvimento de aplicações On-lineAnalytical Processing (OLAP).

Como o armazenamento dos dados para atender às necessidades destas aplicações não seriasolucionado por bancos de dados relacionais, novos conceitos de armazenamento de informa-ções foram implementados através de bancos de dados nomeados de Data Warehouse (DW).Além do suporte para a tomada de decisão estratégica, surgiu a necessidade de aplicação deheurística para obter informações que direcionem o futuro dos negócios, e estas estão sendoimplementadas através de ferramentas de Data Mining (DM).

A aplicação OLAP soluciona o problema de síntese, análise e consolidação de dados, poisé o processamento analítico online dos dados. Tem capacidade de visualizações das in-formações a partir de muitas perspectivas diferentes, enquanto mantém uma estrutura dedados adequada e e�ciente. A visualização é realizada em dados agregados, e não em dadosoperacionais porque a aplicação OLAP tem por �nalidade apoiar os usuários �nais a tomardecisões estratégicas. Os dados são apresentados em termos de medidas e dimensão, a maiorparte das dimensões é hierárquica.

Página 15 de 42www.handbookdeti.com.br

Page 17: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

Para melhor enfatizar a diferença entre sistemas OLPT e OLAP, consideremos o escopobancário. Neste escopo, as aplicações bancárias utilizadas diariamente no controle de con-tas correntes, na qual são efetuados saques ou depósitos pelos correntistas, compõem umexemplo típico de sistema de OLTP. O interesse destes usuários é criar, atualizar e recuperarinformações sobre registros individuais. Já para o Gerente de Conta Correntes os requisitosde uso de informações dos dados das contas têm por �nalidade a análise global de contascorrentes com diversas visões. Por exemplo, o Gerente de Contas pode requerer uma análisesobre o desempenho de contas correntes que tenham cheque especial e tenham utilizado ovalor máximo dos mesmos em um determinado período de tempo em algumas regiões. Ob-ter a resposta a esta consulta mais complexa fazendo uso de ferramentas relacionais padrão,não fornece solução requerida, pois estas ferramentas nunca pretenderam fornecer poderosasfunções de síntese, análise e consolidação de dados.

Após esta breve revisão sobre OLAP, partimos para a solução da questão.

HRU (Harinarayan, Rajaraman e Ullman) introduziram a possibilidade de gerar um cuboutilizando outros, evidenciando as relações de dependência existentes ou lattice de dependên-cias (lattice de dependências é um conjunto de todas as agregações possíveis e respectivasdependências). Em linhas gerais, as dimensões de um cubo de dados proposto por HRUconsiste em mais de um atributo. Essas dimensões são organizadas como hierarquias des-ses atributos. Um exemplo simples para melhor entendimento destas hierarquias pode serobservado na organização do tempo, levando-se em conta as dimensões: dia, semana, mês eano. Quando possuímos mais de 3 (três) dimensões, chamamos de hipercubo. Portanto aalternativa D é a CORRETA.

Somente a título de curiosidade, saiba que o enunciado desta questão foi retirado de umtrecho dá página 176 do livro Database Modeling & Design (�Product graph are a generali-zation of the hypercube lattice structure introduced by Harinarayan, Rajaraman and Ullman,where dimensions may have associated hierarchies.�).

Apenas para complementar ainda mais a solução da questão, elucidamos abaixo qualquerdúvida sobre dimensão, cubo, roll-up, data mart e drill-down (não há necessidade de explicaro signi�cado de tabela):

• dimensão: unidade de análise que agrupa dados de negócio relacionados. As dimen-sões se tornam cabeçalho de colunas e linhas, como exemplo linhas de produto, regiõesde venda ou períodos de tempo;

• cubo: trata-se de uma estrutura que armazena os dados de negócio em formato mul-tidimensional, tornando-os mais fácil de analisar;

• roll-up: a operação de roll-up permite realizar agregações ao subir na hierarquia deuma dimensão. Por exemplo, uma operação que agrega os dados subindo na hierarquiado nível cidade para o nível país;

• data mart: são Data Warehouses departamentais focados em um determinado assunto(por exemplo, um data mart de mercado poderia incluir clientes, produtos e informaçõesde venda), permitindo, assim, uma boa visão de determinados aspectos da organização,embora não contenham todas as informações da organização como um todo;

• drill-dow: a operação de drill-down é inversa à operação de roll-up, permitindo passarde um nível de menor detalhe para um nível de maior detalhe. Por exemplo, umaoperação que desagrega os dados descendo na hierarquia do nível país para o nívelcidade.

Página 16 de 42www.handbookdeti.com.br

Page 18: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

8. Assuntos relacionados: ERP,Banca: CesgranrioInstituição: BR distribuidoraCargo: Analista de Sistemas - DesenvolvimentoAno: 2008Questão: 64

Os módulos de Contas a Pagar, Contas a Receber, Faturamento e Contabilidade compõem,tipicamente, tipo de sistema

(a). CRM analítico

(b). Data Warehouse (DW)

(c). ERP

(d). ECM

(e). BSC

Solução:

Os sistemas de ERP - Enterprise Resource Planning - visam à integração entre todos os seto-res produtivos da empresa, conectando-os através de processos bem de�nidos, onde cada umtem suas responsabilidades bem delimitadas e o negócio é visto todo sob a perspectiva dosprocessos que o regem. Para atingir esse objetivo, sistemas de ERP conectam, geralmenteem uma solução única, vários módulos aplicativos das diversas áreas da empresa. Assim,um típico sistema ERP integra os módulos de contas a pagar, contas a receber e vários outros.

Como seu enfoque são os processos, o sistema também deve prever módulos de RH paraadministração de pessoal, módulos de controle de estoque e, na �loso�a mais recente, mó-dulos voltados à modelagem dos processos da empresa e integração automática desses essesmódulos de acordo com os �uxos dos processos mapeados. Os grandes desenvolvedores desoluções ERP no mercado atual são a SAP e a Oracle. Há diversas outras empresas quetambém fornecem soluções interessantes, além de opções em software livre.

De acordo com a explicação, a resposta correta à questão é a letra (C). Entretanto, paraentendermos ao menos a ideia básica dos demais itens elencados nas outras opções, vejamosde forma rápida suas de�nições:

• CRM analítico: ferramentas de CRM - Customer Relationship Management - dirigem-se ao trato das informações no relacionamento das empresas com seus clientes. Há doistipos básicos de CRM: o operacional e o analítico. O CRM operacional é voltado parao registro de toda interação entre cliente e empresa. O CRM analítico pode ser enca-rado como um subconjunto de ferramentas de BI (Business Intelligence) voltadas para aanálise dos dados coletados pelo CRM Operacional. De acordo com o documento CRMOperacional, disponível no site www.icone.com.br, A parte incluída no CRM Analíticovisa aqui aferir métricas operacionais, geralmente ligadas a custo e performance, quenada mais são do que análise de cubos para veri�car, por exemplo, hits na webstore porcampanha, vendas por hits, percentual de acerto por chamado ativo, custo/ticket médiopor chamado, etc.

• Data Warehouse (DW): o mote dos sistemas de DW é a consolidação de dadosoperacionais, geralmente extraídos de sistemas OLTP (On Line Transaction Proces-sing - sistemas de processamento online de informações) corporativos, gerando dados

Página 17 de 42www.handbookdeti.com.br

Page 19: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

analíticos que servirão de base em decisões estratégicas de negócio. Nesses sistemas, osdados são trabalhados de forma a expressar a informação necessária ao corpo diretorda empresa, agregando informação de diferentes sistemas da empresa. A manipulaçãodesses dados dá origem aos cubos, que são elementos que permitem enxergar os dadosa partir de diversas perspectivas atinentes ao negócio. A subtração de dados de umaárea especí�ca é conhecida como Data Mart. Os Data Marts dão direções sobre umdepartamento ou um produto da empresa. Em última análise, podemos considerar quea união de todos os Data Marts de uma empresa gera seu Data Warehouse.

• ECM: Enterprise Content Management é o nome dado aos sistemas que têm porvocação armazenar, em formato digital, os documentos - tanto os digitalizados depapel quanto os naturalmente eletrônicos - de uma empresa e permitir o acesso a elesde forma rápida e precisa. Estes sistemas armazenam, além dos documentos em si, osdados mais relevantes destes, de forma a tornar a pesquisa de documentos algo simplese de fácil acesso a todos que deles precisem.

• BSC: Balanced Scorecard é uma metodologia disponível e aceita no mercado desen-volvida pelos professores da Harvard Business School, Robert Kaplan e David Norton,em 1992. Os passos dessa metodologia incluem: de�nição da estratégia empresarial,gerência do negócio, gerência de serviços e gestão da qualidade; passos estes imple-mentados através de indicadores de desempenho. A ideia é, utilizando informações dosdiversos sistemas OLTP da empresa, gerar indicadores voltados não apenas aos aspec-tos �nanceiros, mas ao negócio da empresa como um todo: clientes, processos internos,�nanceiro e aprendizado e crescimento, conforme ilustra a Figura 1.

Figura 1: visão estratégica do BSC.

Página 18 de 42www.handbookdeti.com.br

Page 20: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

9. Assuntos relacionados: Data Warehouse, On-line Analytical Processing,Banca: CesgranrioInstituição: PetrobrasCargo: Analista de Sistemas - Processos de NegócioAno: 2008Questão: 27

Em um banco de dados multidimensional, os dados estão conceitualmente armazenados eorganizados em

(a). classes e objetos.

(b). cubos e hipercubos.

(c). partições e índices.

(d). consultas materializadas e sumários.

(e). estrelas e constelações.

Solução:

Com a crescente quantidade de dados disponíveis, o recurso a data warehouses torna-se cadavez mais necessário e frequente. Apesar disso, o conceito de data warehouse não tem umade�nição única. Normalmente, o termo é utilizado para se referir a uma base de dados queé mantida separada da base de dados operacional de uma organização e que está integradacom vários sistemas que permitem efetuar o processamento e análise dos dados. Uma dasde�nições mais usadas defende que a data warehouse é um conjunto de dados organizadosem torno de um determinado tópico, resultante da integração de diferentes fontes de da-dos, mantidos de forma persistente e que expressa uma perspectiva histórica desses dados.Esta separação entre a base de dados operacional e a data warehouse promove a e�ciência edesempenho de cada um dos sistemas, levando-se em conta os diferentes �ns a que se destina.

A principal função das bases de dados operacionais é a realização de transações onlinee processamento de consultas (queries), sendo esse conjunto de operações conhecido comoprocessamento de transações online (online transaction processing - OLTP). Em oposição, asdata warehouses têm por objetivo servir de suporte à análise de dados e tomada de decisões,pelo que sobre elas são realizados outros tipos de operações. Normalmente, tratam-se deoperações que manipulam grandes quantidades de dados históricos, permitindo a realizaçãode sumarizações e agregações e a gestão de informação em diferentes níveis de granulari-dade. A este tipo de operações dá-se o nome de processamento analítico online (onlineanalytical processing - OLAP). De uma forma genérica, uma data warehouse é compostapor uma tabela de fatos, onde se encontram os dados que podem ser objeto de análise, etabelas de dimensões, que armazenam os dados sobre as perspectivas segundo as quais osfatos podem ser analisados. Tanto as data warehouses como as operações OLAP são ba-seadas no modelo multidimensional, em que os dados são visualizados sob a forma de umcubo. Um cubo é de�nido por um conjunto de dimensões e de fatos. De uma forma ge-nérica, as dimensões são as perspectivas ou entidades em relação às quais os fatos se referem.

Por exemplo, uma empresa pode manter uma data warehouse de vendas como forma demanter registros sobre as suas vendas no que se refere aos itens vendidos, à �lial em queforam vendidos e à data de venda. Cada dimensão pode estar associada a uma tabela quepormenoriza a sua descrição. Quanto aos fatos, estes são medidas numéricas correspon-dentes ao principal objetivo da data warehouse, no nosso exemplo, o número de unidades

Página 19 de 42www.handbookdeti.com.br

Page 21: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

vendidas ou o volume total de vendas em dinheiro. A �m de melhor esclarecer este conceito,considere as quatro tabelas apresentadas na Figura 2, que representam a informação sobreas vendas de uma determinada organização apresentada em função do tempo (Tempo), dotipo de item vendido (Item) e da cidade (Localização) em que a venda foi feita.

Figura 2: volume de vendas em função do tempo, tipo de item e localização (�gura retirada dolivro Data Mining: Concepts and Techniques).

As tabelas acima equivalem conceitualmente ao cubo 3D da Figura 3.

Supondo que se pretendesse adicionar outra dimensão, designada como Fornecedor, à in-formação das tabelas acima, obter-se-ia um cubo 4D, o que não é trivial de representarou visualizar. Quando um cubo de dados tem mais de três dimensões ele é chamado dehipercubo e para visualizar os dados em um hipercubo é preciso recorrer a outros tipos derepresentação (modelos Star e Snow�ake).

Portanto, a alternativa B é a correta.

Página 20 de 42www.handbookdeti.com.br

Page 22: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

Figura 3: representação sob a forma de cubo 3D das tabela acima (�gura retirada do livro DataMining: Concepts and Techniques).

Página 21 de 42www.handbookdeti.com.br

Page 23: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

10. Assuntos relacionados: Banco de Dados, Modelagem Multidimensional, Modelo Relacio-nal,Banca: CesgranrioInstituição: PetrobrasCargo: Analista de Sistemas Pleno - ProcessosAno: 2006Questão: 44

Considerando os modelos multidimensionais de bancos de dados de sistemas de informaçõesgerenciais e modelos relacionais utilizados em sistemas operacionais, é correto a�rmar que:

(a). tanto modelos de sistemas operacionais quanto modelos multidimensionais apre-sentam uma visão consolidada dos dados.

(b). modelos multidimensionais usualmente possuem esquemas mais complexos que osdos modelos relacionais utilizados nos sistemas que processam transações on-line.

(c). embora bases de dados multidimensionais sejam voltadas para sistemas com menosusuários que os sistemas de processamento de transações on-line (operacionais),devem estar projetadas para que cada usuário acesse um número de linhas muitomaior, em cada uma de suas operações, do que fazem os usuários dos sistemasoperacionais.

(d). ambos os modelos visam a manter um histórico completo das operações realizadas,no mesmo nível de detalhe.

(e). a taxa de realização de transações de atualização, pelos usuários, nos sistemasoperacionais é extremamente menor do que a existente nos sistemas de informaçõesgerenciais.

Solução:

Os sistemas de bancos de dados podem ser didaticamente classi�cados de acordo com asestruturas de dados e os operadores que apresentam. Assim, tem-se os sistemas de listainvertida, os sistemas hierárquicos e os sistemas em rede (todos pré-relacionais); os sistemasrelacionais, os sistemas objeto-relacionais, os sistemas multidimensionais, os sistemas base-ados em lógica e os sistemas semi-estruturados, dentre outros.

Os sistemas relacionais baseiam-se em uma teoria formal conhecida como �modelo rela-cional�, segundo a qual os dados são representados por linhas em tabelas. Os modelosrelacionais, em geral, são utilizados em sistemas operacionais de bancos de dados (tambémconhecidos como Sistemas OLTP � Online Transactional Processing � Sistemas de Proces-samento de Transações On-line), isto é, sistemas que normalmente têm exigências estritasde desempenho, cargas de trabalho previsível, pequenas unidades de trabalho e utilizaçãoelevada em termos de quantidade de usuários (por exemplo, um banco de dados de Depar-tamento e Empregados).

Os sistemas de informações gerenciais (também conhecidos como sistemas de decisões ge-renciais ou, ainda, sistemas de apoio à decisão) são sistemas que ajudam na análise deinformações de negócio. Podem ser implementados em sistemas de bancos de dados, porexemplo, através de data warehouse, data mart, depósito de dados operacionais, processa-mento analítico on-line (OLAP), bancos de dados multidimensionais e mineração de dados.

Um banco de dados multidimensional é aquele no qual os dados estão armazenados logi-camente nas células de um array multidimensional. O OLAP (Online Analytical Processing

Página 22 de 42www.handbookdeti.com.br

Page 24: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

� Processamento Analítico On-line) é o processo interativo de criar, gerenciar, analisar e ge-rar relatórios sobre estes dados �multidimensionais�. Dada a �nalidade de apoio a decisões,normalmente os sistemas de banco de dados multidimensional têm requisitos de desempenhovariáveis, cargas de trabalho imprevisíveis, grandes unidades de trabalho e utilização irregu-lar por parte dos usuários (relativamente baixa, quando comparada à utilização de sistemasoperacionais).

Diferentemente dos bancos de dados operacionais, os bancos de dados de apoio à decisãogeralmente envolvem dados históricos detalhados, já que as decisões envolvidas normalmenteconsideram estatísticas e tendências baseadas em registros de atividades anteriores (históri-cos). Além disso, os sistemas multidimensionais buscam apresentar uma visão consolidadados dados, facilitando, desta forma, a tomada de decisões que requerem o cruzamento dediversas informações armazenadas, o que não ocorre em modelos operacionais.

A assertiva (A) está incorreta, conforme comentário �nal do parágrafo anterior.

A arquitetura de um banco de dados é composta por três níveis: interno, conceitual eexterno. Este último refere-se a visão que os usuários �nais têm do banco (por exemplo, osdados que são retornados para uma aplicação escrita em Java). Os dois primeiros níveis sãodescritos por esquemas interno (ou físico) e conceitual (ou lógico), respectivamente. Taisdescrições se dão com o uso de DDLs (Data De�nition Language � Linguagem de De�niçãode Dados). A DDL interna, que descreve o esquema interno do banco, de�ne os diversostipos de registros armazenados, especi�ca quais índice existem, como os campos armaze-nados estão representados, em que sequência física os registros estão armazenados, e assimpor diante. A DDL conceitual, por sua vez, inclui de�nições de cada um dos vários tiposde registros conceituais (as tabelas de um modelo relacional, por exemplo). Essas de�niçõestêm por �nalidade adicional, de�nir restrições de segurança e de integridade. Para atin-gir a independência física dos dados, as de�nições de DDL conceitual não devem envolverquaisquer considerações sobre a representação física ou a técnica de acesso. Assim, de�niro esquema conceitual de um modelo relacional e de um modelo multidimensional não difereem termos de complexidade. Conclui-se, portanto, pela inexatidão da sentença da letra (B).

Conforme explanado anteriormente, as bancos de dados multidimensionais possuem grandesunidades de trabalho (isto é, cada usuário acessa um número grande de linhas de dados), e,portanto, devem ser projetados visando atender satisfatoriamente tal demanda. A situaçãoé invertida quando o projeto é de bancos de dados operacionais, pois, apesar do maior nú-mero de usuários, suas unidades de trabalho são bem menores. A letra (C) está correta aoapresentar tais conceitos.

A letra (D) está incorreta, pois apenas os modelos de bancos de dados multidimensionaistêm como característica preponderante a manutenção de históricos completos e detalhadosdas operações realizadas, haja vista sua função principal de gerar relatórios com base emestatísticas de transações anteriores.

Por lidar, em geral, com dados históricos, os bancos de dados de sistemas de informaçõesgerenciais tendem a não sofrer atualizações em suas bases de dados, caracterizando-se porserem principalmente (mas, não exclusivamente) somente leitura. Assim, a letra (E) estáincorreta.

Página 23 de 42www.handbookdeti.com.br

Page 25: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

11. Assuntos relacionados: Banco de Dados, Sistemas de Informações Gerenciais, Data Wa-rehouse, Modelagem de Dados, Modelagem Multidimensional, Modelo Estrela,Banca: CesgranrioInstituição: PetrobrasCargo: Analista de Sistemas Pleno - ProcessosAno: 2006Questão: 45

Bases de dados de sistemas de informações gerenciais são projetadas, muitas vezes, em umesquema denominado estrela que:

(a). é uma arquitetura física que permite de�nir somente estruturas unidimensionaisde dados.

(b). é composta por uma tabela central, denominada de dimensão, e várias tabelasperiféricas a ela relacionadas, denominadas fatos.

(c). apresenta tabelas periféricas que se encontram desnormalizadas.

(d). faz com que a expansão e a evolução da base de dados necessite de grande atividadede manutenção.

(e). é um esquema onde o número de junções realizadas é relativamente maior que orealizado em bases de dados relacionais convencionais.

Solução:

Um datawarehouse (também conhecido como armazém de dados) é um sistema de compu-tação utilizado para armazenar informações relativas às atividades de uma organização emum banco de dados de forma consolidada. O desenho da base de dados dos datawarehousesfavorece a geração de relatórios, a análise de grandes volumes de dados, e a obtenção deinformações estratégicas que podem facilitar a tomada de decisão. Os datawarehouses são,portanto, a base dos sistemas de informações gerenciais.

A técnica de modelagem de dados utilizada para a implementação de datawarehouses éconhecida como Modelagem Multidimensional de Dados. Logo, a alternativa A está errada.

O principal objetivo da modelagem multidimensional de dados é facilitar a compreensão doestruturamento dos dados armazenados, tanto para desenvolvedores quanto para os usuáriosdo sistema. Neste tipo de modelo existem três elementos básicos: os fatos, as dimensões eas medidas.

Os Fatos são uma coleções de itens de dados compostos de dados de medidas e de con-texto. O fato re�ete a evolução dos negócios do dia-a-dia, e é representado por valoresnuméricos. Os fatos são armazenados nas chamadas �tabelas de fato�, que são as tabelascentrais dos modelos dimensionais.

As Dimensões são os elementos que participam de um fato. Elas determinam o contextode um assunto de negócios. As dimensões, normalmente, não possuem valores numéricos,sendo somente descritivas e classi�catórias dos elementos que participam de um fato. Umdatawarehouse que analisa vendas de um produto (fato) poderia ter as seguintes dimen-sões, por exemplo: tempo, localização, clientes, vendedores. Os dimensões são armazenadasnas chamadas �tabelas de dimensão�, que são as tabelas periféricas dos modelos dimensionais.

Página 24 de 42www.handbookdeti.com.br

Page 26: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

Logo, a alternativa B está errada, pois a tabelas centrais do modelo são as tabelas defatos, e não as tabelas de dimensões.

Por �m, temos as Medidas. As Medidas (ou Variáveis) são os atributos numéricos querepresentam um fato, e é sobre eles que são feitas as análises do negócio. Medidas são, porexemplo, o valor em reais das vendas e a quantidade de unidades vendidas.

Feita esta breve introdução sobre os conceitos primários do modelo multidimensional, vamosagora conhecer os dois modelos dimensionais básicos, que são o Modelo Estrela e o ModeloFloco de Neve.

No modelo estrela existe uma tabela dominante no centro do esquema, chamada tabelade fato (fact table), que possui múltiplos relacionamentos para as tabelas periféricas, cha-madas tabelas de dimensão (dimension tables).

O modelo Floco de Neve é bem semelhante ao modelo estrela. A única diferença entreeles é que, no modelo Floco de Neve, as tabelas de dimensão são normalizadas, dando ori-gem a uma hierarquia de dimensões. As �guras 4 e 5 ilustram os modelos estrela e �oco deneve, respectivamente.

Figura 4: Modelo Estrela.

Figura 5: Modelo Floco de Neve.

Um aspecto importante sobre os modelos estrela e �oco de neve é que ambos também sãofavoráveis ao desempenho nas consultas. Tal obetivo é alcançado pela menor quantidadede operações de junção que o SGBD precisa realizar para responder a consultas complexas.No modelo estrela isso é ainda mais evidente, visto que não há hierarquias de dimensões e,consequentemente, uma menor quantidade de relacionamentos entre as tabelas. Com isso,

Página 25 de 42www.handbookdeti.com.br

Page 27: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

a alternativa E também está errada.

A alternativa D está errada pelo fato de os bancos de dados desse tipo, destinam-se, pri-mordialmente a realização de consultas. Muito embora sejam necessárias cargas de dadosperiódicas e em grandes volumes, comparativamente aos bancos de dados dos sistemas tran-sacionais, os bancos de dados dos datawarehouses exigem menos manutenção.

Portanto, a resposta correta é alternativa C.

Página 26 de 42www.handbookdeti.com.br

Page 28: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

12. Assuntos relacionados: Modelagem de Negócio, Modelagem Multidimensional,Banca: CesgranrioInstituição: PetrobrasCargo: Analista de Sistemas Pleno - ProcessosAno: 2006Questão: 46

Sobre o processo de modelagem multidimensional, assinale a a�rmação INCORRETA.

(a). Busca-se obter um modelo que possibilite a realização, pelos usuários, de grandesquantidades de operações de atualização dos dados.

(b). A de�nição dos fatos em um modelo pode ser obtida através da identi�cação daresposta à pergunta �o que está sendo medido?�.

(c). A identi�cação de padrões de acesso pode levar a realização de pré-sumarizações(pré-agregação) dos dados, de forma a acelerar à realização de consultas.

(d). As dimensões, usualmente, estão relacionadas com as respostas a perguntas como:�quando?�, �o que?�, �onde?� e �quem?�.

(e). O modelo multidimensional é orientado a assuntos.

Solução:

(A) ERRADA

A modelagem multidimensional (MM) é uma técnica de projeto lógico que busca apre-sentar os dados em um padrão, para permitir a recuperação adequada e �exível dos dados.A MM supera os modelos complexos, de�nindo como o usuário terá acesso à informação.A modelagem multidimensional deve ser muito mais próxima de como os usuários pensamsobre a informação. Deve resolver quaisquer ambiguidades semânticas que estão no modelode negócio. Concluindo, a modelagem multidimensional facilita a realização de consultaspor usuários não-técnicos, acelerando o desempenho destas consultas.

(B) CORRETA

Os fatos são uma coleção de dados de medidas, normalmente representados por dadosnuméricos. Estes dados numéricos são as medições relativas ao negócio da empresa. Namodelagem multidimensional a tabela de fatos é responsável pelo armazenamento das me-didas numéricas do negócio. Cada fato representa um item, uma transação ou um eventode negócio que é utilizado na análise de uma organização.

(C) CORRETA

A modelagem multidimensional é uma forma de modelagem de dados conceitual voltadapara concepção e visualização de conjuntos de medidas que descrevem aspectos comuns deum determinado assunto. É utilizada especialmente para sumarizar e reestruturar dados,apresentando-os em visões que suportem a análise dos valores envolvidos. A modelagemmultidimensional é projetada para coletar, padronizar e sumarizar os dados gerados pelosdiversos sistemas de uma empresa com a �nalidade de disponibilizar informação a partir darealização de consultas.

Página 27 de 42www.handbookdeti.com.br

Page 29: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

(D) CORRETA

As tabelas dimensões são os elementos que participam de um fato, assunto ou negócio.As dimensões determinam um contexto de um assunto de negócios. Por exemplo, em umbanco de dados que analisa as vendas de produtos, as dimensões que participam desse fatovendas (o que?) geralmente são: Tempo (quando?), Localização (onde?), Cliente e Vende-dores (quem?). Dimensões não possuem valores numéricos, pois são descrições textuais doselementos que participam de um fato. As dimensões são possíveis formas de visualizaçãodos dados.

(E) CORRETA

A modelagem multidimensional é uma técnica de concepção e visualização de um modelode dados de um conjunto de medidas que descrevem um assunto de negócio. Sua utilizaçãoajuda na sumarização e reestruturação dos dados e apresenta visões que suportam a análisedos valores destes dados. As dimensões são elementos que participam de um assunto de ne-gócios, são os pontos de vista pelos quais serão feitas as análises dos fatos. Cada dimensãofaz parte de um fato e, normalmente, não existem valores quantitativos dentro das tabelasdas dimensões, apenas atributos descritivos (assuntos), devido ao fato que elas são usadaspara a classi�cação dos fatos.

Portanto, a resposta incorreta é alternativa A.

Página 28 de 42www.handbookdeti.com.br

Page 30: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

13. Assuntos relacionados: Data Warehouse, Modelagem Multidimensional, Modelo Estrela,Banca: CesgranrioInstituição: PetrobrasCargo: Analista de Sistemas Júnior - Processos de NegócioAno: 2008Questão: 26

A empresa passou a sortear cupons de desconto para alguns clientes, os quais dão direitoa um desconto nas compras em uma determinada data. A informação sobre que clientespossuem cupons para que datas é mantida de forma independente e consolidada no processode extração, transformação e carga, resultando em um campo, na tabela fato, indicando sea venda foi realizada com o desconto ou não. A solução parecia atender bem às demandasdos usuários do data warehouse, até que um deles tentou realizar uma consulta para saberquais clientes não haviam realizado compras, mesmo tendo um cupom de desconto para adata. Este tipo de demanda tipicamente será resolvido introduzindo, no data warehouse,uma

(a). tabela de fatos complementares (complimentary fact table).

(b). tabela de fatos sem dimensão (dimensionless fact table).

(c). tabela de fatos sem fatos (factless fact table).

(d). dimensão multivalorada (multivalued dimension).

(e). dimensão degenerada (degenerated dimension).

Solução:

A força do data warehouse dentro das empresas está na organização e na entrega de dadosque apóiem o processo de tomada de decisão. O data warehouse é a implementação físicade um modelo de apoio a decisões, que disponibiliza à empresa as informações necessáriasà tomada de decisões estratégicas. Podemos vê-lo como um repositório de dados com asseguintes características:

• baseado em assuntos: o data warehouse está organizado de maneira que descreve odesempenho dos negócios;

• integrados: os dados são organizados para fornecer uma fonte única;

• variáveis em relação ao tempo: o desempenho de negócio é medido em pontos cronoló-gicos;

• não-voláteis: sugere que os dados, uma vez inseridos no data warehouse, não devemmudar (lembre-se que o conteúdo dos bancos de dados operacionais muda cada vez queuma transação é processada);

Um data warehouse suporta análise de negócios e tomada de decisões através da integraçãode dados (planilhas e arquivos) procedentes de diversos sistemas em uma base de dadosconsolidada (onde as informações são uni�cadas e padronizadas em um mesmo local). Emoutras palavras, o data warehouse é uma base de dados projetada especi�camente para aten-der às necessidades de tomada de decisão, em vez de atender aos sistemas de processamentode transações.

Ao chegar neste ponto, a seguinte dúvida pode surgir na cabeça do leitor: como realizaro projeto lógico de um data warehouse? Bom, o projeto pode ser realizado tanto através damodelagem entidade-relacionamento quanto pela modelagem dimensional, mas aqui abor-daremos apenas a última.

Página 29 de 42www.handbookdeti.com.br

Page 31: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

A modelagem dimensional é a técnica de projeto lógico de banco de dados mais usada nodesenvolvimento de data warehouses. Um modelo dimensional é composto por uma tabelacentral com uma chave composta, denominada tabela de fatos, e um conjunto de tabelasmenores conhecidas como tabelas de dimensão, que possuem chaves simples (formadas poruma única coluna). Na verdade, a chave da tabela de fatos é uma combinação das chavesdas tabelas de dimensão. Nesta modelagem, o relacionamento das informações pode serrepresentado como um cubo. Desta forma, podemos fatiar este cubo e aprofundar em cadadimensão ou eixo para extrair mais detalhes sobre os processos internos que ocorrem naempresa, detalhes estes que seriam difícieis de serem extraídos e analisados em um modelorelacional.

Mas, neste escopo, o que seriam dimensão e tabela de fatos?

Uma dimensão é uma coleção de atributos textuais que são altamente correlacionados entresi. Em uma base de dados de varejo são comuns dimensões como produto, armazém, cli-ente, promoção e tempo. Já a tabela de fatos sintetiza o relacionamento existente entre asdiversas dimensões. Isto ocorre porque a chave da tabela de fatos é a associação das chavesprimárias das tabelas de dimensões. Geralmente este tipo de tabela possui um ou mais fatosnuméricos que ocorrem na combinação de chaves que de�ne cada registro.

No caso da empresa em questão, um projetista de data warehouse visualizaria as informa-ções presentes no enunciado como um hipercubo (cubo com mais de três dimensões, o queé impossível de desenhar gra�camente) que pode ser descrito com as seguintes dimensões:

• Tempo: usada por quase todos data warehouse. Deve ter detalhes sobre o calendáriopara que facilite pesquisas estratégicas, então a dimensão tempo não deve ter somentea data em que o produto foi vendido, mas deve conter informações como dia no mês,dia na semana, número do dia na semana, mês, número do mês no ano, ano, etc.;

• Cliente: descreve cada cliente da empresa (código do cliente, CPF, nome, cidade);

• Produto: descreve cada unidade em estoque na empresa (código produto, descrição doproduto, preço);

• Cidade: descreve cada cidade em que a empresa está presente (código cidade, estado,cep);

• Promoção: descreve as condições de promoção sob as quais um produto foi vendido(código da promoção, código do cliente sorteado, data da promoção, valor do descontopresente no cupom). Por causar mudanças nos padrões de vendas, esta dimensão échamada de causal.

Este hipercubo pode ser representado pelo Modelo Estrela (Star Schema), onde todas as ta-belas relacionam-se diretamente com a tabela de fatos, sendo assim as tabelas dimensionaisdevem conter todas as descrições que são necessária para de�nir uma classe como Produto,Tempo, Cliente, Cidade ou Promoção nela mesma, ou seja, as tabelas dimensão não sãonormalizadas no modelo estrela, então os campos contêm suas descrições repetidas em cadaregistro (obviamente, isto aumenta o tamanho das tabelas de dimensão).

O enunciado dexia claro que a �empresa passou a sortear cupons e que a informação sobreque clientes possuem cupons para que datas é mantida de forma independente e consolidadano processo de extração, transformação e carga, resultando em um campo, na tabela fato�.O que isso signi�ca? Signi�ca que já existia uma tabela de fatos com uma granularidade

Página 30 de 42www.handbookdeti.com.br

Page 32: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

primária, composta pelas chaves da dimensão Cliente, Produto, Cidade e Tempo (veja aFigura 6) e que a nova dimensão Promoção irá somente inserir uma nova chave na tabelafato existente, como podemos observar na Figura 7.

Figura 6: esquema relacional com estrutura em Estrela para o data warehouse da empresa (aindasem a promoção).

Figura 7: esquema relacional com estrutura em estrela representando a adição da quinta dimen-são (Promoção).

Assim, cada registro (linha) da tabela de fatos representará a quantidade de um produto quefoi vendida com (ou sem) desconto para um cliente especí�co, em uma determinada cidadee numa data especí�ca.

Note que um novo registro somente é inserido na tabela da fatos quando algo ocorre, po-rém, a existência de uma dimensão causal frequentemente estimula a pergunta: �o que nãoaconteceu?�. Por exemplo, quais clientes tinham o cupom desconto, válido para uma de-terminada data, e não realizaram compras? Mesmo com a dimensão causal, você não poderesponder a esta questão com a tabela de fatos que armazena o que aconteceu. Uma tabelade fatos companheira, chamada tabela de cobertura, é necessária neste caso. A diferençaentre a tabela de fatos de cobertura e a tabela de fatos primária (que contém fatos) forencea resposta. Esta diferença recebe o nome de tabela de fatos sem fatos (Factless Fact Tables).

Página 31 de 42www.handbookdeti.com.br

Page 33: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

Portanto, a alternativa C está correta. Apenas para complementar o comentário da questão,saiba que as tabelas expressas nas alternativas A e B não fazem parte do escopo de datawarehouse. Em um data warehouse, uma dimensão multivalorada (alternativa D) é umadimensão que possui atributos que podem assumir mais de uma valor simultaneamente, jáuma dimensão degenerada (alternativa E) é uma dimensão que é derivada da tabela de fatose não tem sua tabela própria dimensão (são dimensões vazias, isto é, sem atributos).

Página 32 de 42www.handbookdeti.com.br

Page 34: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

14. Assuntos relacionados: Banco de Dados, Data Warehouse, OLAP,Banca: CesgranrioInstituição: PetrobrasCargo: Analista de Sistemas Júnior - Processos de NegócioAno: 2008Questão: 48

A seguir são feitas algumas a�rmações a respeito de data warehouses e ferramentas OLAP.

I- Os usuários �nais do data warehouse, em geral, não possuem acesso à Data StagingArea.

II- Drill in, drill out, roll over e roll on são típicas operações disponibilizadas pelas fer-ramentas de consultas OLAP para navegar pela hierarquia de uma dimensão.

III- As rotinas de ETL muitas vezes originam solicitações de mudanças e melhorias nossistemas OLTP e outras fontes de dados que alimentam o data warehouse, pois têm o po-tencial de revelar inconsistências entre os diversos sistemas corporativos.

IV- Um data warehouse, em geral, deve ser projetado para fazer junções entre fatos e di-mensões através de chaves naturais, evitando chaves substitutas (surrogate keys), pois estasapenas contribuiriam para aumentar o tamanho e a complexidade do esquema sem nenhumbenefício para o usuário �nal.

Estão corretas APENAS as a�rmações

(a). I e II.

(b). I e III.

(c). II e III.

(d). II e IV.

(e). III e IV.

Solução:

Um data warehouse é um conjunto de dados baseados em assunto, integrado, não volátil evariável em relação ao tempo, de apoio às decisões gerenciais. Ou seja, data warehouse éuma cópia dos dados transacionais (dados operacionais), usados no dia a dia da empresapelas aplicações do negócio, integrados e transformados de forma que seja possível extrairinformações integradas de caráter gerenciais sobre a comparação e processos. Essas infor-mações extraídas de forma integrada são utilizadas para suporte à decisão, planejamentoestratégico, análise de comportamento de clientes, análise de desempenho de vendas, etc. Éuma das principais soluções de Business Intelligence no mercado.

As principais características marcantes de um data warehouse são:

• orientado ao assunto. Os dados devem estar organizados de acordo com os principaisassuntos da empresa, como clientes, pedidos, produtos;

• forte integração de dados. No data warehouse é adotado um padrão para dados, me-didas e formatos, ou seja, os dados são integrados sob uma única forma. Isso facilita auniformidade e o acesso;

Página 33 de 42www.handbookdeti.com.br

Page 35: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

• dados não são voláteis. No data warehouse não há necessidade de gerência de transaçãode dados. Os dados no data warehouse são inseridos uma única vez e, a partir daí,somente há leituras nesses dados (salvo, seja necessário correções);

• variante no tempo. No data warehouse existe uma nova dimensão (chave) que é otempo. Ao inserir dados no data warehouse, esses são adicionados e a chave tempo re-cebe o valor do momento da atualização. Ao atualizar os dados, esses recebem o mesmotratamento: são novamente inseridos no data warehouse com a chave do momento daatualização. Assim, é possível saber qual estado de um determinado dado há 5 anos.Então, um data warehouse é variante no tempo.

A Figura 8 mostra os elementos e o �uxo de dados em um ambiente data warehouse. Pormeio da ação dos funcionários (nível operacional), as aplicações operacionais criam dadostransacionais (armazenados em bancos de dados transacionais), como: cadastros de clientes,produtos, fornecedores, pessoal, representantes, movimentos de faturas, notas �scais, etc.Esses dados não servem para �ns de tomadas de decisões estratégicas e gerenciais. Osdados, para serem efetivamente usados para tais �ns, devem ser transformados e carregadosno data warehouse. Durante essas transformações, que são realizadas pelas ferramentasETL - Extração, Transformação e Carga, são criados resumos e agregamentos entre essesdados, que o transformam em informações de baixo nível. Por meio dos resumos, os dadospassam a ter signi�cado para os gerentes. Quando essas informações de baixo nível sãoprocessadas por aplicações OLAP, elas são transformadas em informações de mais valor.Essas informações suprem as necessidades dos executivos e gerentes, relativa à estratégia(tomada de decisões a nível corporativo) e gerenciamento do negócio (nível departamental).

Figura 8: �uxo de dados em um ambiente data warehouse.

Podemos destacar os seguintes tipos de data warehouse: Marketing, Financeiro e Compor-tamental. O Marketing avalia o desempenho comercial de um produto ou serviço a partir dediversas perspectivas diferentes. O Financeiro monitora o desempenho comercial em termos�nanceiros. E, o comportamental contém informações individuais a respeito de cada clientee seus comportamentos.

A ferramenta mais popular para exploração de um data warehouse é a Online Analyti-cal Processing OLAP ou Processo Analítico em Tempo Real. As aplicações OLAP (On-lineAnalytical Processing - Processamento Analítico em Tempo Real) são aplicações baseadasem processamento analítico e, normalmente, chamadas de aplicações sobre o negócio. Taisaplicações manipulam e analisam sob múltiplas perspectivas as informações obtidas por meiodas aplicações transacionais, ajudando executivos e gerentes a terem um retrato da situação

Página 34 de 42www.handbookdeti.com.br

Page 36: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

do negócio. Os dados sobre aplicações OLAP são chamados de dados analíticos, que sãodados operacionais otimizados para análise e não para transações.

A funcionalidade OLAP é caracterizada pela análise dinâmica e multidimensional dos da-dos consolidados da corporação. A tecnologia OLAP é implementada em um modo cli-ente/servidor multi-usuário e utiliza banco de dados multidimensional. A linguagem deconsulta é a MDX (Multidimensional Expression, um SQL para OLAP). Na OLAP, as con-sultas são ad-hoc, ou seja, são de�nidas de acordo com o interesse de quem realiza a consulta.

Existem diversas ferramentas OLAP, as quais destacamos data mining e CRM. O data mi-ning (mineração de dados) é uma classe de aplicações analíticas que procuram por padrõesescondidos nos dados do data warehouse. E, o CRM (Customer Relationship Management)utiliza o data warehouse para criar um histórico integrado sobre os clientes de forma a ofe-recer um atendimento personalizado.

Com base nas explicações anteriores, a seguir analisamos as a�rmativas:

I. A Data Staging Area (Área de Representação de Dados) realiza a ligação entre as apli-cações transacionais (OLTP) e o data warehouse. Geralmente, os dados introduzidos nodata warehouse passam pela Data Staging Area, e nesta área sofrem transformações, como�ltragem de dados (correções de erros de digitação, solução de con�itos de domínio, trata-mento de elementos ausentes ou a divisão em formatos padrão), combinação de dados devárias origens e cancelamento de dados duplicados. Essas transformações são anteriores aocarregamento dos dados no data warehouse.

Esta área não provê serviços de consulta e apresentação por ser tratar de uma área ondeexistem processos que limpam, transformam e preparam os dados para serem introduzidosno data warehouse. Ou seja, o usuário �nal (executivos e gerentes) não possui acesso a estaárea. Portanto, esta a�rmativa está correta.

II. As principais operações disponibilizadas em uma ferramenta OLAP são:

• drill-down: utilizada para solicitar uma visão mais detalhada em um conjuntos de dado.Por exemplo, em vez de ver as vendas por estado, passa a ver as vendas por cidade.Esta operação desagrega uma dimensão;

• roll-up: consista na operação inversa ao drill-down, isto é, apresenta os dados cada vezmais agrupados ou sumarizados. Esta operação agrega uma dimensão;

• drill-throught: ocorre quando o usuário passa de uma informação contida em umadimensão para uma outra. Por exemplo, inicia na dimensão do tempo e no próximopasso analisa a informação por região;

• slice: utilizada para selecionar apenas algumas dimensões ou membros de dimensões.Por exemplo, analisar somente as vendas do Estado de São Paulo, no intervalo de 1998até 2001. Esta operação faz restrição de um valor ao longo de uma dimensão;

• dice: utilizada para colocar múltiplos dados de uma dimensão sobre um eixo e múltiplosdados de outra dimensão sobre outro eixo. Ou seja, serve para modi�car a posição deuma informação, alterar linhas por colunas de maneira a facilitar a compreensão dosusuários. Esta operação faz restrição de valores em várias dimensões;

• pivot: serve para adicionar ou rearranjar as dimensões. Esta operação muda o eixo devisualização.

Página 35 de 42www.handbookdeti.com.br

Page 37: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

Como podemos veri�car, as operações Drill in, drill out, roll over e roll on não são disponi-bilizadas pelas ferramentas OLAP. Portanto, esta a�rmativa está errada.

III. O processo ETL - Extração, Transformação e Carga (Extraction, Transformation andLoading) - consiste na primeira etapa do processo de obtenção de dados de aplicações transa-cionais (OLTP) e outras fontes de dados para o data warehouse. Esse processo compreendeas atividades de extração, limpeza, transformação, carga e indexação para Data StagingArea. Algumas atividades desse processo:

• Filtragem de dados: para eliminar erros e elementos indesejados;

• Integração de dados: correlaciona dados de fontes heterogêneas com os dados do datawarehouse;

• Conversão de dados: procedimentos para transformação entre formatos e unidades;

• Condensação de dados: para reduzir o volume e/ou agilizar o processamento;

• Derivação de dados: de�ne fórmulas para produzir novos valores a partir dos existentes.

Ferramentas ETL são utilizadas para realizar essas atividades, facilitando o processamentodos dados e revelando inconsistência entre eles. Portanto, esta a�rmativa está correta.

IV. Durante o processo de integração dos dados transacionais para o data warehouse, osanalistas encontram diversas di�culdades. É comum, nesse processo, os analistas utiliza-rem artifícios como forma de superá-las. Entre eles estão a criação de chaves substitutas(surrogate keys) ou chaves sem signi�cado ou chaves não naturais. A utilização de chavessubstitutas em vez de chaves naturais (chaves primárias dos sistemas de origem dos dados) évantajoso porque livra o ambiente data warehouse de alterações operacionais. Manter umachave substituta possibilita o data warehouse ser independente de alterações nos sistemastransacionais de forma a manter a compatibilidade dos dados. Outra vantagem de chavessubstitutas é o desempenho. A utilização de chaves substitutas permite reduzir o espaçode armazenamento dos dados e a complexidade do esquema de dados. Logo esta a�rmativaestá errada.

De acordo com a análise das a�rmativas, apenas I e II estão corretas. Portanto, a al-ternativa correta é a (B).

Caso deseje aprofundar no assunto data warehouse e OLAP, sugerimos algumas referên-cias:

• http://homepages.dcc.ufmg.br/ mateus/compmovel/aula8.pdf

• http://www.ufmt.br/cacomp/Downloads/monogra�as/ProjetoDataWareHouse.pdf

• http://meusite.mackenzie.com.br/rogerio/tgi/2004ModelagemDW.pdf

Página 36 de 42www.handbookdeti.com.br

Page 38: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

15. Assuntos relacionados: Data Warehouse, Modelagem Multidimensional,Banca: CesgranrioInstituição: PetrobrasCargo: Analista de Sistemas Júnior - Processos de NegócioAno: 2008Questão: 49

O agrupamento de diversas dimensões correspondentes a indicadores com baixa cardinali-dade, gerando uma dimensão abstrata, de forma a retirar os indicadores da tabela fato, maspreservando a possibilidade de seu uso em consultas, constitui a

(a). minidimensão (minidimension).

(b). dimensão outrigger (outrigger dimension).

(c). dimensão lixo ou sucata (junk dimension).

(d). dimensão com papéis (role-playing dimension).

(e). dimensão de campo de bits (bitmap dimension).

Solução:

Na modelagem dimensional, alguns conceitos são importantes para entender o porquê decertas variações em seu processo. Vamos analisar as de�nições apresentadas na questão e,com isso, concluíremos qual é a resposta correta.

No conceito de modelagem multidimensional, se em um dimensão houverem alguns cam-pos que variam e outros não ou se é de interesse apenas acompanhar o histórico de apenasalguns campos, podemos separar estes campos numa minidimensão (minidimension). Ouseja, uma minidimensão é um subconjunto de uma dimensão grande e com alguns camposcom mudança rápida, como cliente, por exemplo. Podemos dividir a dimensão em dimensõesarti�ciais menores para controlar o seu crescimento explosivo. Os atributos demográ�coscontinuamente mutáveis de um cliente são frequentemente modelados como uma minidimen-são separada.

Uma tabela de dimensão secundária ligada a uma tabela de dimensão é conhecida comodimensão outrigger. A tabela outrigger é uma interpretação do projeto físico de uma únicatabela de dimensão lógica, que ocorre quando uma tabela de dimensão for normalizada. Essetipo de tabela é utilizado quando uma tabela de dimensão é �snow�aked�, ou seja, quandoo modelo é transformado em um modelo de �ocos-de-neve.

Dimensões lixo (junk dimensions) ou descartáveis são dimensões abstratas com a deco-di�cação de um grupo de �ags e de indicadores de baixa cardinalidade com o objetivo deremover essas �ags da tabela de fatos. Essas dimensões, em geral, são aquelas que nãoestão relacionadas diretamente com a tabela fato, ou seja, que não re�etem regras macro donegócio, como PRODUTO ou CLIENTE, por exemplo.

A utilidade das dimensões lixo constituem, principalmente, em:

• Auxílio no momento de fazer �ltros e de melhorar a pesquisa no data warehouse;

• economia de espaço na tabela fato.

Campos de pequena cardinalidade, como sexo (M, F) ou indicador de contribuinte (Sim ouNão) podem ser reunidos numa única dimensão, e podem ser utilizados pela tabela fato para�ltros e pesquisas. Concluímos que a alternativa (C) é a alternativa correta.

Página 37 de 42www.handbookdeti.com.br

Page 39: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

As dimensões com papéis (role-playing dimensions) ocorre onde uma simples tabela dedimensão física aparece várias vezes na mesma tabela de fatos. Cada um dos papéis da di-mensão é representado por uma tabela lógica separada com nomes de coluna únicos atravésde visões. Por exemplo, os itens Data de Pedido, Data da Entrega, Data do Pagamento eData da Devolução referem-se a uma única tabela de dimensão, a Dimensão Tempo.

Não podemos associar estes campos a uma única tabela, pois o SQL poderia interpretar talassociação simultânea como exigência para que todas as datas fossem iguais. Precisamos�iludir� o SQL para que ele acredite que existem quatro tabelas independentes na DimensãoTempo e isso pode ser feito através de views.

O termo bitmap dimension não é um termo comumente utilizado em modelagem multi-dimensional.

Página 38 de 42www.handbookdeti.com.br

Page 40: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

16. Assuntos relacionados: Banco de Dados, Business Inteligence, Data Warehouse, On-lineAnalytical Processing, On-Line Transaction Processing,Banca: ESAFInstituição: Secretaria do Tesouro Nacional (STN)Cargo: Analista de Finanças e Controle - Tecnologia da Informação / Desenvolvimento deSistemas de InformaçãoAno: 2008Questão: 15

Um depósito de dados organizado por assunto, não-volátil, integrado e variável em funçãodo tempo, utilizado para apoiar decisões de gerenciamento, é denominado

(a). datawarehouse.

(b). gestão do conhecimento.

(c). business Intelligence.

(d). mineração de dados.

(e). OLAP (OnLine Analytical Processing).

Solução:

Um candidato atento consegue acerta esta questão com alto grau de con�ança mesmo quenão conheça muito bem todos os termos envolvidos. Isso porque com uma boa leitura doenunciado e das alternativas, não é muito difícil de perceber que a única alternativa que trazum depósito de dados é a letra A. Para os concursos atuais, que abrangem uma vasta gamade assuntos, esse tipo de análise pode signi�car um diferencial importante na conquista deuma vaga. Fique atento!

Vamos ao comentário de cada alternativa.

(A) CORRETA

Um data warehouse (ou armazém de dados) é um sistema computacional utilizado paraarmazenar uma grande quantidade de informações relacionadas às atividades de uma orga-nização. Em geral, essas informações são obtidas a partir de vários sistemas independentese são consolidadas em uma base de dados própria, separada das bases de dados operacionaisda organização. O desenho da base de dados de um data warehouse favorece a geração derelatórios, a análise de grandes volumes de dados e a obtenção de informações agregadasque podem facilitar tomadas de decisão.

As principais características de um data warehouse que devemos manter sempre em mentesão as seguintes (justamente as que aparecem no enunciado):

• orientação a assunto: pois geralmente tomadas de decisão requerem agregação dediversas informações em função de um determinado assunto;

• integração de dados: como já dito, geralmente um data warehouse integra dadosde diversos sistemas, por exemplo de diversos setores da organização. Em geral, essaintegração possibilita visões mais amplas das informações, o que é bastante importantepara o direcionamento das decisões pela administração das organizações;

• não-volátil: a base de dados é fundamentalmente de leitura. Ou seja, os dados apenassão alterados em casos eventuais de correções ou adaptações;

Página 39 de 42www.handbookdeti.com.br

Page 41: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

• variante no tempo: um data warehouse mantém a chamada série histórica dos dados,o que é muito importante para comparações e projeções. Pode-se entender essa sériahistórica (horária, diária, semanal, etc.) como uma sequência de �fotogra�as� dasinformações (fatos) que compõem o data warehouse.

(B) ERRADA

Gestão de conhecimento não representa uma base de dados. Portanto, esta alternativadeve ser rapidamente desconsiderada. Gestão de conhecimento é uma área de estudos, quevem crescendo muito ultimamente, composta por várias técnicas e teorias que orientam comoo conhecimento de um grupo de pessoas ou instituições deve ser gerido.

(C) ERRADA

Business intelligence (BI) é um termo amplo e abstrato inventado pelo Gartner Group.Ele se refere a métodos utilizados para auxiliar as corporações a tomarem suas decisões emfunção de dados e informações obtidas por diversos sistemas de informação. Atualmente,por sua capacidade de sumarizar grandes volumes de dados, o data warehouse é o núcleo dasprincipais soluções de BI do mercado. Duas outras ferramentas que podem ser utilizadas nacomposição de uma solução de BI são: data mart e data mining. Perceba, portanto, que BInão é em si uma base de dados, e sim um conceito muito mais amplo.

(D) ERRADA

Mineração de dados (data mining) se refere a processos analíticos de exploração de grandesquantidades de informações (geralmente associadas a business intelligence) para se buscarpadrões consistentes e/ou relacionamentos entre vários tipos de dados. Perceba novamenteque não temos nesta alternativa um base de dados. Ou seja, esta alternativa também deveser prontamente descartada.

(E) ERRADA

OLAP (Online Analytical Processing) é um tipo de abordagem que viabiliza consultase�cientes em uma análise multidimensional de dados, por isso muito utilizada em imple-mentações de data warehouse. Esse termo é usado em contraste com o OLTP (Online Tran-saction Processing), que é uma abordagem largamente utilizada em ambientes transacionais.

Em um ambiente transacional, há constante entrada de dados e consultas �simples�. Alémdisso, em um ambiente transacional, quase sempre é exigido que a resposta ao usuário sejaimediata. Um bom exemplo é quando você acessa um site bancário para realizar uma trans-ferência ou conferir um extrato. Uma demora de �alguns segundos� é inaceitável. Enquantoas abordagens OLTP são extremamente adequadas em diversas situações, elas se mostraminadequadas em outras. Um exemplo típico é a situação de acesso a informações gerenciais,como a produção de relatórios de vendas, contábeis e �nanceiros. É justamente nesse tipode cenário que a abordagem OLAP é importante. Os bancos de dados que utilizam OLAPsão projetados em modelos de dados multidimensionais que possibilitam executar consultascomplexas em um tempo muito menor, baseando-se principalmente em desnormalizações eem agregações.

Um banco de dados OLAP pode ser armazenado de várias maneiras. Em uma arquite-tura ROLAP (Relacional), os dados são armazenados em bases de dados relacionais. Já em

Página 40 de 42www.handbookdeti.com.br

Page 42: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

uma arquitetura MOLAP (Multidimensional), os dados são armazenados em cubos dimen-sionais, em geral em formatos proprietários. HOLAP (Híbrido) tenta combinar as vantagensde MOLAP e ROLAP, extraindo o que há de melhor de cada abordagem, ou seja, a altaperformance do MOLAP e a melhor escalabilidade do ROLAP. Outras siglas são utilizadaspara representar arquiteturas, mas são pouco utilizadas: WOLAP (Baseado em Web), DO-LAP (Desktop) e RTOLAP (Real-Time).

De qualquer forma, OLAP por si só não representa uma base de dados, mesmo apesardesses termos serem correlacionados. É justamente por isso que esta alternativa não podeser considerada correta.

Página 41 de 42www.handbookdeti.com.br

Page 43: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Handbook de Questões de TI Comentadas para Concursos Volume questões de TI

Questão Resposta

1 B

2 C

3 B

4 B

5 A

6 D

7 D

8 C

9 B

10 C

11 C

12 A

13 C

14 B

15 C

16 A

Página 42 de 42 Handbook de TI Além do Gabarito

Page 44: Sistemas de Informações Gerenciais - Apostilasapostilando.yolasite.com/...sistemas_informacoes_gerenciais.pdf · Assuntos relacionados: Sistemas de Informações Gerenciais , Banca:

Índice Remissivo

Agrupamento de Dados, 9

Banco de Dados, 4, 11, 13, 15, 22, 24, 33, 39Business Inteligence, 8, 15, 39

Classi�cação de Dados, 9

Data Mart, 11, 13Data Mining, 8, 9, 15Data Warehouse, 11, 13, 15, 19, 24, 29, 33, 37,

39

ERP, 17

Modelagem de Dados, 24Modelagem de Dependência entre Dados, 9Modelagem de Negócio, 27Modelagem Multidimensional, 22, 24, 27, 29,

37Modelo Estrela, 24, 29Modelo Multidimensional, 11, 13Modelo Relacional, 13, 22

OLAP, 13, 33On-line Analytical Processing, 15, 19, 39On-Line Transaction Processing, 15, 39

ROLAP, 13

Sistemas de Informações Gerenciais, 5, 24Sumarização de Dados, 9

Text Mining, 8

43