17
06-06-22 1 Abordagem Abordagem Kimball Vs. Kimball Vs. Abordagem Inmon Abordagem Inmon Ana Henriques n.º 50247 Ana Henriques n.º 50247

Kimball Vs Inmon

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: Kimball Vs Inmon

10-04-23 1

Abordagem Abordagem Kimball Vs. Kimball Vs. Abordagem Abordagem

InmonInmonAna Henriques n.º 50247Ana Henriques n.º 50247

Page 2: Kimball Vs Inmon

10-04-23 2

InformaçãoInformação

Empresas (a partir da década de 90):Empresas (a partir da década de 90): Necessidade de lidar com informações de Necessidade de lidar com informações de

forma a conseguir vantagem competitiva.forma a conseguir vantagem competitiva. Aprender a colectar e processar os dados Aprender a colectar e processar os dados

gerados pelas suas operações.gerados pelas suas operações. Primeiras Propostas:Primeiras Propostas:

DSS (Decision Support Systems)DSS (Decision Support Systems) EIS (Executive Information Systems)EIS (Executive Information Systems)

Trabalhavam com dados oriundos dos sistemas Trabalhavam com dados oriundos dos sistemas transaccionais da empresa -> optimizava o processo transaccionais da empresa -> optimizava o processo operacional, mas não o de análise de dados.operacional, mas não o de análise de dados.

Page 3: Kimball Vs Inmon

10-04-23 3

Solução: Data Warehouse Solução: Data Warehouse (DW)(DW)

Definição inicial – “uma estrutura de Definição inicial – “uma estrutura de armazenamento central de dados, armazenamento central de dados, estruturada segundo um modelo Entidade-estruturada segundo um modelo Entidade-Associação (EA) e não-questionável”. Associação (EA) e não-questionável”. (Inmon, 1996)(Inmon, 1996)

Colecção de dados relacionados a alguma Colecção de dados relacionados a alguma área da empresa, organizados para dar área da empresa, organizados para dar suporte à decisão e baseados nas suporte à decisão e baseados nas necessidades de um determinado necessidades de um determinado departamento. (Inmon, 1998)departamento. (Inmon, 1998)

Fonte de dados para consulta da Fonte de dados para consulta da organização (Kimball, 1998)organização (Kimball, 1998)

Page 4: Kimball Vs Inmon

10-04-23 4

Diferentes Abordagens Data Diferentes Abordagens Data Warehouse/MartsWarehouse/Marts

Inmon:Inmon: Data Warehouses e Data Marts (DM) têm Data Warehouses e Data Marts (DM) têm

estruturas essencialmente diferentes.estruturas essencialmente diferentes. Difícil integrar um conjunto de Data Marts e Difícil integrar um conjunto de Data Marts e

mesmo que se consiga não resultará num Data mesmo que se consiga não resultará num Data Warehouse. (1998)Warehouse. (1998)

Data Mart deriva do Data Warehouse.Data Mart deriva do Data Warehouse.

Kimball:Kimball: ““O Data Warehouse é constituído pela união O Data Warehouse é constituído pela união

de todos os seus Data Marts”. (Kimball de todos os seus Data Marts”. (Kimball 1997)1997)

Page 5: Kimball Vs Inmon

10-04-23 5

Implementação de Data Implementação de Data Warehouses/MartsWarehouses/Marts

Ambos concordam que:Ambos concordam que: A solução completa é muito complexa A solução completa é muito complexa

para ser feita de uma só vez.para ser feita de uma só vez. A sustentação do projecto depende da A sustentação do projecto depende da

entrega rápida de uma solução parcial entrega rápida de uma solução parcial que:que: agrade aos utilizadores;agrade aos utilizadores; justifique o seu investimento. (Gallas, 1999) justifique o seu investimento. (Gallas, 1999)

Page 6: Kimball Vs Inmon

10-04-23 6

Implementação de Data Implementação de Data Warehouses/MartsWarehouses/Marts

Kimball:Kimball: Prévia modelagem da organização.Prévia modelagem da organização. Implementação de um Data Mart de cada Implementação de um Data Mart de cada

vez.vez. Conformados de acordo com a modelagem.Conformados de acordo com a modelagem.

Inmon:Inmon: Prévia modelagem da organização.Prévia modelagem da organização. Implementação iterativa do Data Warehouse.Implementação iterativa do Data Warehouse.

O sistema começa pequeno e evolui O sistema começa pequeno e evolui progressivamente em espaços curtos de tempo. progressivamente em espaços curtos de tempo. (Inmon, 1998)(Inmon, 1998)

Page 7: Kimball Vs Inmon

10-04-23 7

ConclusõesConclusões

A diferença de abordagem é mais A diferença de abordagem é mais relativa à terminologia utilizada do relativa à terminologia utilizada do que propriamente conceptual.que propriamente conceptual. Inmon:Inmon:

Refere-se ao Data Mart como uma colecção Refere-se ao Data Mart como uma colecção de dados derivada do Data Warehouse.de dados derivada do Data Warehouse.

Kimball:Kimball: O Data Mart é a própria unidade lógica do O Data Mart é a própria unidade lógica do

Data Warehouse.Data Warehouse. Estão a falar de coisas diferentes.Estão a falar de coisas diferentes.

Page 8: Kimball Vs Inmon

10-04-23 8

Implementação de Data Implementação de Data Warehouses/MartsWarehouses/Marts

Kimball:Kimball: Elementos Básicos de um DW :Elementos Básicos de um DW :

1.1. Fontes Operacionais de DadosFontes Operacionais de Dados2.2. Área de Retenção (Área de Retenção (Staging AreaStaging Area))3.3. Servidores de ApresentaçãoServidores de Apresentação4.4. Nível de Acesso do Utilizador FinalNível de Acesso do Utilizador Final

Ciclo de Vida Dimensional do Negócio:Ciclo de Vida Dimensional do Negócio: Planeamento e Gestão de ProjectoPlaneamento e Gestão de Projecto Definição dos Requisitos de NegócioDefinição dos Requisitos de Negócio Tracking:Tracking:

Data TrackData Track Technology TrackTechnology Track Application TrackApplication Track

InstalaçãoInstalação Melhoria e AmpliaçãoMelhoria e Ampliação

Page 9: Kimball Vs Inmon

10-04-23 9

Elementos Básicos do Data Elementos Básicos do Data Warehouse - KimballWarehouse - Kimball

Page 10: Kimball Vs Inmon

10-04-23 10

Ciclo de Vida Dimensional Ciclo de Vida Dimensional do Negócio - Kimballdo Negócio - Kimball

Page 11: Kimball Vs Inmon

10-04-23 11

Implementação de Data Implementação de Data Warehouses/MartsWarehouses/Marts

Inmon:Inmon: Recenseamento dos dadosRecenseamento dos dados Definição dos requisitosDefinição dos requisitos

Ciclo totalmente distinto da metodologia de Kimball.Ciclo totalmente distinto da metodologia de Kimball. Abordagem Top-Down centrada nos dados.Abordagem Top-Down centrada nos dados.

Actualmente:Actualmente: Introdução de uma fase de Organização Inicial do Projecto.Introdução de uma fase de Organização Inicial do Projecto.

Suaviza a excessiva dependência dos dados presente na proposta Suaviza a excessiva dependência dos dados presente na proposta inicial.inicial.

Âmbito, objectivos, áreas de assunto, abordagem e arquitectura.Âmbito, objectivos, áreas de assunto, abordagem e arquitectura. Em paralelo:Em paralelo:

Definição da Infra-Estrutura TécnicaDefinição da Infra-Estrutura Técnica Desenho PreliminarDesenho Preliminar Modelização dos DadosModelização dos Dados

As três fases anteriores convergem para a fase do Desenho As três fases anteriores convergem para a fase do Desenho Físico:Físico:

Processo iterativo de desenvolvimento do DW com um fluxo em Processo iterativo de desenvolvimento do DW com um fluxo em espiral.espiral.

Page 12: Kimball Vs Inmon

10-04-23 12

Metodologia de Metodologia de Desenvolvimento de DW - Desenvolvimento de DW -

InmonInmon

Page 13: Kimball Vs Inmon

10-04-23 13

Implementação de Data Implementação de Data Warehouses/MartsWarehouses/Marts

Inmon:Inmon: Ampliação do Modelo de Dados Corporativo:Ampliação do Modelo de Dados Corporativo:

Modelo de Dados de Alto Nível ou Diagrama Modelo de Dados de Alto Nível ou Diagrama Entidade - Associação.Entidade - Associação.

Modelo de Dados de Nível Intermédio.Modelo de Dados de Nível Intermédio. Modelo de Dados de Baixo Nível.Modelo de Dados de Baixo Nível.

O autor admite que os modelos dimensionais O autor admite que os modelos dimensionais constituem as estruturas mais adequadas ao constituem as estruturas mais adequadas ao acesso e integração dos utilizadores com os acesso e integração dos utilizadores com os conteúdos de um DW.conteúdos de um DW.

Acentua a actual convergência observada entre as Acentua a actual convergência observada entre as metodologias de Kimball e Inmon.metodologias de Kimball e Inmon.

Page 14: Kimball Vs Inmon

10-04-23 14

Operational Data Store Operational Data Store (ODS)(ODS)

Inmon:Inmon: ““uma estrutura de armazenamento dos valores uma estrutura de armazenamento dos valores

actuais dos dados, orientada a um assunto, actuais dos dados, orientada a um assunto, integrada, volátil, contendo apenas dados integrada, volátil, contendo apenas dados corporativos detalhados.corporativos detalhados.

É em essência um sistema operacional, separado do DW.É em essência um sistema operacional, separado do DW. Suporta constantes acessosSuporta constantes acessos Actualizações operacionaisActualizações operacionais

Kimball:Kimball: O ODS contém dados integrados com O ODS contém dados integrados com

granularidade mais detalhada.granularidade mais detalhada. Pode ser utilizado para suporte do nível mais baixo do Pode ser utilizado para suporte do nível mais baixo do

DW.DW. É de facto parte do DW: constitui o front page de um DW É de facto parte do DW: constitui o front page de um DW

de Kimball. (Kimball 1998, 1997b) de Kimball. (Kimball 1998, 1997b)

Page 15: Kimball Vs Inmon

10-04-23 15

Kimball Vs. Inmon Kimball Vs. Inmon (vantagens) (vantagens)

Bill InmonBill Inmon Ralph KimballRalph Kimball

Melhor definição estratégica do Melhor definição estratégica do projecto.projecto.

Infra-Estrutura mais adequada às Infra-Estrutura mais adequada às exigências de um SAD.exigências de um SAD.

DW Corporativo (DWC) modelizado DW Corporativo (DWC) modelizado segundo um modelo normalizado (EA):segundo um modelo normalizado (EA):

simplificação nos simplificação nos procedimentos de ETL;procedimentos de ETL; menor taxas de crescimento do menor taxas de crescimento do volume de dados.volume de dados.

DWC modelizados segundo modelo DWC modelizados segundo modelo desnormalizado (esquemas em desnormalizado (esquemas em galáxia):galáxia):

estrutura mais flexível, estrutura mais flexível, comportando mais facilmente as comportando mais facilmente as alterações nos sistemas fonte;alterações nos sistemas fonte; Desenvolvimento de modelos Desenvolvimento de modelos mais intuitivos e com melhor mais intuitivos e com melhor desempenho.desempenho.

Proporciona um recenseamento Proporciona um recenseamento integral dos sistemas fonte e integral dos sistemas fonte e conteúdos existentes na organização. conteúdos existentes na organização.

Abordagem Iterativa centrada nas Abordagem Iterativa centrada nas necessidades de informação.necessidades de informação.

Permite antecipar a entrega de Permite antecipar a entrega de resultados.resultados.

Desenvolve uma abordagem Desenvolve uma abordagem sistematizada e completa sobre os sistematizada e completa sobre os processos de integração.processos de integração.

Garante o maior envolvimento dos Garante o maior envolvimento dos utilizadores.utilizadores.

Metodologia mais vocacionada para Metodologia mais vocacionada para definição das componentes de back-definição das componentes de back-end.end.

Permite fasear os custos de Permite fasear os custos de investimento em infra-estrutura.investimento em infra-estrutura.

Proporciona um melhor Proporciona um melhor time to time to market market (maior ROI).(maior ROI).

Abordagem de implementação Abordagem de implementação totalmente integrada.totalmente integrada.

Page 16: Kimball Vs Inmon

10-04-23 16

Kimball Vs. Inmon Kimball Vs. Inmon (desvantagens) (desvantagens)

Bill InmonBill Inmon Ralph KimballRalph Kimball

Abordagem Top-Down centrada nos dados, Abordagem Top-Down centrada nos dados, mais morosa e dispendiosa.mais morosa e dispendiosa.

Dificuldade em definir as dimensões e Dificuldade em definir as dimensões e factos conformes (consenso nos aspectos factos conformes (consenso nos aspectos essenciais à criação de um modelo de dados essenciais à criação de um modelo de dados corporativo segundo um esquema em corporativo segundo um esquema em galáxia).galáxia).

Maiores custos iniciais em TI.Maiores custos iniciais em TI. Esquemas em galáxia do DWC -> Esquemas em galáxia do DWC -> vertiginoso crescimento do volume de vertiginoso crescimento do volume de dados armazenado.dados armazenado.

Abordagem excessivamente centrada nos Abordagem excessivamente centrada nos dados (todo o processo de desenvolvimento dados (todo o processo de desenvolvimento depende da prévia conclusão do modelo depende da prévia conclusão do modelo corporativo dos dados:corporativo dos dados:

inviabiliza o envolvimento dos inviabiliza o envolvimento dos utilizadores no projecto;utilizadores no projecto; prolonga o período de ausência de prolonga o período de ausência de resultados.resultados. relega para segundo plano a relega para segundo plano a identificação das reais necessidades de identificação das reais necessidades de informação dos utilizadores.informação dos utilizadores.

Conduz à obtenção de procedimentos de Conduz à obtenção de procedimentos de ETL, mais complexos:ETL, mais complexos:

modelos dimensionais requerem modelos dimensionais requerem operações adicionais de transformação operações adicionais de transformação e agregação dos dados dos sistemas e agregação dos dados dos sistemas operacionais (usualmente operacionais (usualmente representados em modelos representados em modelos normalizados);normalizados); alterações ao nível dos sistemas alterações ao nível dos sistemas operacionais implicam alterações em operacionais implicam alterações em procedimentos dedicados a diferentes procedimentos dedicados a diferentes esquemas em estrelas de diferentes esquemas em estrelas de diferentes granularidades.granularidades.

Modelos normalizados -> Modelos normalizados -> pior pior desempenho analítico, sendo menos desempenho analítico, sendo menos adequados e intuitivos para os SAD.adequados e intuitivos para os SAD.

Processo de desenvolvimento fragmentado:Processo de desenvolvimento fragmentado: primeiro o DWC.primeiro o DWC. depois os Data Marts – dependem depois os Data Marts – dependem dos índices de utilização verificados no dos índices de utilização verificados no DWC.DWC.

Page 17: Kimball Vs Inmon

10-04-23 17

BibliografiaBibliografia Tese Mestrado) Sistema de Apoio à Decisão para a Info Académica Tese Mestrado) Sistema de Apoio à Decisão para a Info Académica

do IST, Elsa Cardoso, 2003 (Cap. 3)do IST, Elsa Cardoso, 2003 (Cap. 3) (Livro) The Data Warehouse Lifecycle Toolkit: pratical techniques (Livro) The Data Warehouse Lifecycle Toolkit: pratical techniques

for building dimensional data warehouse , R. Kimball, Wiley 1996for building dimensional data warehouse , R. Kimball, Wiley 1996 (Livro) The Data Warehouse Lifecycle Toolkit: experts methods for (Livro) The Data Warehouse Lifecycle Toolkit: experts methods for

designing, developing, and deploying data warehouses, R. Kimball, designing, developing, and deploying data warehouses, R. Kimball, Wiley 1998Wiley 1998

(Livro) Building the data warehouse, W.H. Inmon, 3rd Edition, (Livro) Building the data warehouse, W.H. Inmon, 3rd Edition, Wiley, 2002Wiley, 2002

(Livro) Data Marts Does Not Equal Data Warehouse, 2 ed. New (Livro) Data Marts Does Not Equal Data Warehouse, 2 ed. New York: John Wiley & Sons , 1996. York: John Wiley & Sons , 1996.

(Artigo) (Artigo) Inmon vs KimballInmon vs Kimball, S. Gallas, DM Review 1999, , S. Gallas, DM Review 1999, http://www.dmreview.com/article_sub.cfm?articleID=1400http://www.dmreview.com/article_sub.cfm?articleID=1400

(Artigo) (Artigo) Differences of OpinionDifferences of Opinion, R. Kimball, M. Ross, March, 2004, , R. Kimball, M. Ross, March, 2004, cc (URL) (URL) www.dmreview.com (URL) (URL) http://www.inmoncif.com/ (URL) (URL) http://www.intelligententerprise.com/ (URL) (URL) http://www.dw-institute.com/