75
Sistemas de Apoio a Decisão (Inteligência nos Negócios - Business Inteligente) Sistemas de Informação/Ciências da Computação Aran Bey Tcholakian Morales, Dr. Eng. (Unidade 1)

Sistemas de Apoio a Decisão - aranmorales.files.wordpress.com · Sistemas de Apoio a Decisão (Inteligência nos Negócios - Business Inteligente) Sistemas de Informação/Ciências

  • Upload
    lethuan

  • View
    216

  • Download
    1

Embed Size (px)

Citation preview

Sistemas de Apoio a Decisão

(Inteligência nos Negócios - Business Inteligente)

Sistemas de Informação/Ciências da Computação

Aran Bey Tcholakian Morales, Dr. Eng.

(Unidade 1)

2

1. Inteligência nos Negócios

(BI-Business Intelligence)

1.1 Apresentação

4

Quais são os objetivos dos sistemas de informação e da tecnologia

da informação nas empresas e organizações?

O avanço da tecnologia da informação e a disseminação dos sistemas

de informação contribuem para as organizações automatizarem e

controlarem os seus processos e as suas operações.

Automatizar e controlar os processos e operações, garantem a

quantidade e a qualidade de dados que atendem às necessidades de

informação das organizações e, nesse sentido, atingir o objetivo

principal da tecnologia da informação: informar.

Apresentação

5

Por que as empresas e as organizações necessitam de informação

sobre os seus processos e as suas operações?

Os dados (dos sistemas transacionais ) são insumos para as

necessidades gerenciais de informação (e conhecimento) que dão

apoio aos processos de gestão e decisão das organizações.

De outra forma, ter dados precisos e exatos é um fator essencial para

a geração de informação (e conhecimento) que permitem melhorar

a qualidade dos processos de gestão e decisão.

Isto significa que os dados são ativos de informação (e

conhecimento).

Apresentação

6

Muitas organizações possuem projetos de informática,

representados pelos seus sistemas transacionais (sistemas de apoio

à operação), os quais dão suporte ao cotidiano da organização

(sistemas que controlam seus processos e suas operações).

Possuir projetos de informática não significa ter a informação

disponível para suprir as necessidades gerenciais de apoio aos

processos de gestão e de decisão.

Apresentação

7

Quando as organizações perceberam esse fato, começaram a

desenvolver os seus projetos de informação como complemento aos

de informática.

Desta forma, foi necessário desenvolver repositórios de dados

adequados para o processo de decisão (Data Warehouse).

Os DW levaram as organizações a ter repositórios de dados

baseado em assuntos, integrado, não volátil, variável em relação

ao tempo (repositórios de apoio aos processos de gestão e decisão

dos analistas de negócios e da gerência).

Apresentação

8

O DW é um repositório de dados que facilita a transformação dos

dados, através do processo de descoberta, em informação e

conhecimento. Em outros termos os dados são ativos de informação

e conhecimento, e os DW facilitam esta transformação.

Para que a transformação e descoberta se concretizem, surge a

necessidade de haver técnicas de análise dos dados.

As técnicas de análises de dados procuram identificar padrões,

relações e tendências que auxiliem na interpretação dos dados e na

extração de informações explícitas e informações implícitas

(conhecimento), com o objetivo de suprir as necessidades gerenciais

de apoio aos processos de gestão e de decisão das organizações.

Apresentação

9

O conceito de análise de dados engloba ferramentas de

processamento analítico (OLAP), ferramentas de análise exploratória

de dados (AED) e ferramentas de extração de conhecimento

(processo de descoberta em banco de dados – KDD/mineração de

dados), as quais possibilitam a descoberta de informações (explícitas

e implícitas) que possam ser úteis às organizações.

Apresentação

10

Pergunta de pesquisa:

Como descobrir informações e conhecimentos de fontes de dados

que possam ser úteis aos analistas de negócios da organização para

auxiliar nos processos de gestão e decisão da própria organização?

A pergunta “esconde” duas outras perguntas e uma extensão natural:

Como representar as fontes de dados que “facilitem” a descoberta de

informações e conhecimentos (para auxiliar nos processos de gestão

e decisão)?

Quais são as ferramentas e técnicas que “permitem” a descoberta de

informações e conhecimentos?

Apresentação

11

BI

Dados (OLTP e outras fontes)

Data Warehouse/Data Marts

Ferramentas OLAP

Mineração de dados - KDD

Interpretação/

Avaliação

Decisões

Análise

de dados

Análises dos

tomadores de

decisão

Fundamentação da disciplina

Dados

Informação

Conhecimento

Análise exploratória de dados

12

Apresentação

13

Pesquisa do Gartner (2012) realizada com

mais de dois mil CIOs em todo mundo

identificou as prioridades para a TI.

Apresentação

14FONTE: Estudo de Mercado: BI – Rodrigo Lanna e Alexis Frick –

http://www.stratmarket.com.br/

Apresentação

15

Das fontes de dados estruturadas da organização, podemos descobrir

ativos de informação e conhecimento que auxiliam nos processos de

gestão e decisão da própria organização.

Ao mesmo tempo, as organizações identificaram outras fontes que

poderiam ser ativos de informação e conhecimento de seu interesse.

São fontes semiestruturadas e não estruturadas com dados

provenientes de fontes internas e externas a organização: redes

sociais, blogs, manuais, e-mails, chats, GPS, sensores, arquivos de

áudio e de imagens.

Apresentação

Apresentação

picture from Big Data Integration

Apresentação

Apresentação

19

Dessa forma, além dos dados gerados pela organização, temos dados

provenientes de fora da organização. São dados com uma grande

variedade de formatos, gerados em alta velocidade e em grande

volume. A partir dessas caraterísticas, surgiu o conceito de Big Data.

O conceito Big Data pode ser resumidamente definido como uma

coleção de dados (ativos de informação e conhecimento) de extremo

volume, alta velocidade de geração e grande diversidade de

formatos.

Apresentação

Essas caraterísticas nos dados fazem necessário dispor de tecnologias

capazes de capturar, armazenar, gerenciar e analisar esses dados.

Big Data permite entender não só o perfil do consumidor com base

nos registros de seus sistemas transacionais (OLTP), como também seu

comportamento nas redes sociais, hábito de consumo, intenção de

compras, relevância e influência.

Apresentação

Volume dos dados: excede os limites físicos de ser escalável de forma

vertical (em 2012, foram gerados 1,2 zettabyte de dados; a previsão

para 2020 é 35 zettabytes)

Velocidade de geração dos dados: faz com que a captura, o

processamento e as análises dos dados tenham uma validade de

tempo menor.

Variedade dos dados: impõe desafios na integração e análise de

diferentes formatos de dados (dados estruturados, não estruturados,

imagens, vídeos, dados de sensores, etc.);

Apresentação

2012

Apresentação

Sistemas de BI e Big Data:

uma nova realidade com o mesmo objetivo

Encontrar correlações entre várias fontes diferentes de dados (48%),prever o comportamento dos clientes (46%) e prever as vendas de produtos ou serviços (40%) são os principais fatores de análisede Big Data.

29

Pergunta de pesquisa da disciplina: a extensão “natural” da pergunta

de pesquisa: como descobrir informações e conhecimento a partir de

fontes de dados semiestruturadas, não estruturadas, internas e

externas a organização .

Insights << informação << dados

Apresentação

30

A pergunta:

Como representar as fontes de dados que “facilitem” a descoberta de

informações e conhecimentos?

É estendida para:

Como capturar, armazenar e gerenciar dados com o volume,

a velocidade e a variedade com que são gerados?

Apresentação

31

A pergunta:

Quais são as ferramentas e técnicas que “permitem” a descoberta de

informações e conhecimentos?

É estendida para:

Quais são as ferramentas e técnicas que “permitem” analisar o

volume, a velocidade e a variedade de dados gerados para a

descoberta de informações e conhecimentos?

Apresentação

• As tecnologias que sustentam o Big Data, podem ser analisadas sob

as seguintes óticas:

• As tecnologias de infraestrutura, que armazenam os dados:

bancos NoSQL e NewSQL;

• As tecnologias envolvidas no processamento do grande

conjuntos de dados: Hadoop e Spark (entre outras);

• Depois da infraestrutura de armazenamento e processamento,

são necessários os componentes de análises, pois são eles que

transformam os dados em valor para o negócio;

Apresentação

NoSQLs

Google File System (GFS): sistema de arquivo distribuído entre vários servidores que dividia os arquivos em blocos (2003), para gravar grandes volumes de dados não estruturados (páginas HTML), que não cabiam em um único servidor; MapReduce: um framework que facilita extrair informação de dados armazenados no GFS, de forma paralela para aumentar a velocidade (2004).Amazon iniciou o desenvolvimento do banco de dados comercializado como Dynamo DB (2004).O Google iniciou o desenvolvimento do BigTable (2006).

O LinkedIn iniciou o projeto Voldemort criando uma base de dados não SQL para gerenciar os seus 135 milhões de usuários (2007).O Facebook baseou-se nas soluções da Amazon e do Google e desenvolveu a sua solução, que passou a ser distribuída como código aberto com o nome de Apache Cassandra (2008).O Yahoo criou o Sherpa (2009).

Apresentação

BD Relacionais NoSql/NewSql

Transações ACID: Atomicidade: a transação é executada totalmente ou não será executada; Consistência: o banco passará de uma forma consistente para outra forma consistente; Isolamento: a transação não será interferida por outra transação concorrente; Durabilidade: o que foi salvo não será perdido.

Transações BASE: BA-Basicamente Disponível, prioridade na disponibilidade dos dados (tolera falhas parciais); S-Estado Leve: o sistema não precisa ser consistente o tempo todo, isto é, a persistência não é necessariamente feita em tempo real; E – Eventualmente consistente: o sistema é consistente em momentos determinados.

Relacionado fisicamente (conceito ER). Não relacionado fisicamente.

Dificuldade em armazenar e recuperar grandes volumes de dados não estruturados (e outros tipos de dados heterogéneos).

Construído para tratar grandes volumes de dados não estruturados, escaláveis horizontalmente.

Esquema definido (tabelas, chaves, tipos de dados, relacionamentos), estrutura rígida, sem redundância de dados, normalizada.

Não tem esquema definidos (permite adicionar campos aos registros do banco livremente sem a necessidade de mudança na estrutura).

Escalabilidade vertical: mais CPU, mais memória, os dados não podem estar distribuídos.

Escalabilidade horizontal: servidores em paralelo, dados distribuídos em nodos diferentes.

No existe Sharding: uma FK não pode apontar para uma tabela que está em outro nodo.

Sharding: divide os dados horizontalmente, partes diferentes dos dados em servidores diferentes.

No existem algoritmos do tipo Map-reduce. Map-reduce: algoritmo de gerenciamento em larga escala. Organiza o processamento, aproveitando múltiplas máquinas de um cluster.

Usados em sistemas locais, corporativos; segurança da informação; consistência dos dados.

Usados em sistemas de alta escalabilidade e performance na consulta/escrita (redes sociais).

Banco de dados:

Key-value: Berkeley DB; Project Voldermort; MemcacheDB; SimpleBD

Orientadas a documentos: MongoDB, CouchDB, IBM Lotus Domino, Riak,

RavenDB

Família de colunas (bigTable): BigTable, Hbase, Cassandra (Facebook)

Orientadas a grafos: Neo4J, InfoGrid, HyperGraphDB;

Orientadas a colunas*: MonetDB, Vertica , Infobright, LucidDB

Apresentação

As tecnologias envolvidas no processamento do grande conjuntos de dados:

Hadoop e Spark (são as duas principais).

• Hadoop, é uma plataforma distribuída voltada para clusters e processamento

de grandes massas de dados. Foi inspirado pelo MapReduce e GFS;

• Spark, é uma plataforma que trabalha em memória, (e por isso muito mais

rápida no processamento que o Hadoop) e indicada para dados em stream;

Apresentação

38

BI

Fontes internas da organização e externas à organização

DW e Data Lake)

Ferramentas OLAP

Técnicas analíticas

Interpretação/

Avaliação

Decisões

Análise

de dados

Análises dos

tomadores de

decisão

Dados

Informação

Conhecimento

Análise exploratória de dados

Fundamentação da disciplina

39

A informação e o conhecimento sempre estiveram presentes nas

organizações. A sua importância e a necessidade de gestão (gestão

da informação e do conhecimento) têm aumentado devido à

percepção de bens intangíveis, os quais precisam ser gerenciados

como qualquer outro bem tangível.

Apresentação: a disciplina não é!

40

A informação e o conhecimento de interesse das organizações estão

presentes nos dados dos sistemas transacionais, nos documentos,

manuais e sites, e-mails e chat, blogs, redes sociais e outras fontes. É

o chamado conhecimento explícito, que pode ser formalizado,

sistematizado, comunicado e partilhado entre os indivíduos.

O conhecimento organizacional está também de forma tácita nos

próprios colaboradores da organização, conhecimento tácito, difícil

de ser capturado e formalizado.

A gestão do conhecimento organizacional refere-se à gestão de

todos os ativos de conhecimento da organização.

Apresentação: a disciplina não é!

41

A gestão do conhecimento não somente consiste na descoberta (que é

uma forma de aquisição). Consiste também no seguinte:

- na criação (essencial para o processo de inovação);

- na modelagem e no armazenamento (diz respeito à representação

e à integração do conhecimento que permita ser acessado e

compartilhado para a socialização do conhecimento);

- e na manipulação do conhecimento, que permite a utilização e o

reúso, assim como extrair outras informações (por elaboração de

informações já disponíveis) ou inferir outras informações novas (por

aprendizado).

Apresentação: a disciplina não é!

Apresentação: a disciplina não é!

43

Ementa

Informação e decisão. Dados, informação e conhecimento. Sistemas

transacionais e de apoio a decisão. Data Warehouse: motivação,

conceitos, definição, características e arquiteturas de

implementação. Modelo Dimensional: fatos, dimensões, medidas e

granularidade. Sistemas ETL: extração limpeza, transformação e

carga de um modelo dimensional. Área de apresentação:

características das ferramentas OLAP. Mineração de dados: processo

de descoberta do conhecimento em banco de dados. Técnicas de

mineração: agrupamentos, classificação e regras de associação.

Programa da disciplina

44

Objetivo Geral

A informação e o conhecimento são diferenciais necessários ao

processo decisório das organizações. Apenas armazenar dados já

não é o suficiente. As organizações buscam transformar os dados em

informação e em conhecimento sobre seus clientes, colaboradores,

processos e assuntos de negócio.

O objetivo da disciplina é: apresentar metodologias, técnicas,

ferramentas e elementos necessários que permitam compreender a

importância da construção de estruturas de dados que permitam a

extração e aquisição de informações e conhecimentos dessas

estruturadas para auxilio aos processos de gestão e de decisão da

organização.

Programa da disciplina

45

Objetivos Específicos

Para alcançar o objetivo geral se faz necessário:

• Construir estruturas de dados para projetos de informação:

conceitos básicos de Data Warehouse;

• Elaborar e interpretar informações: processamento analítico on-

line (OLAP) e análises exploratória de dados (AED);

• Adquirir conhecimento: processo de extração de conhecimento em

bases de dados (KDD) e técnicas de mineração de dados.

Programa da disciplina

46

Unidade 1: O processo decisório nas organizações

Carga horária: 6 horas aula

Conteúdo.

1. Informação, conhecimento e o processo decisório nas organizações.

2. Sistemas de Informação (SI): Sistema OLTP e Sistema SAG.

3. Dados, Informação e Conhecimento.

4. Inteligência nos Negócios (BI-Business Intelligence): Sistemas de BI.

5. Arquitetura de um Sistema de BI.

Programa da disciplina

47

Unidade 2: Estrutura de dados para a construção de sistema de BI

Carga horária: 24 horas aula

Conteúdo.

1. Data Warehouse (DW) DW: a memória da organização.

2. Modelo dimensional: conceitos e características. Fatos, dimensões e medidas.

Modelo Estrela.

2. ETL: Extração, limpeza, transformação e carga de dados.

Ferramentas de ETL: Pentaho Data Integration.

3. Construção de modelos dimensionais lógicos e físicos.

Ferramentas de modelagem de dados: SQL Power Architec.

SGBD: base de dados PostgreSql.

Programa da disciplina

48

Unidade 3: Extração e descoberta de informação e conhecimento

Carga horária: 30 horas aula

Conteúdo.

1. Área de apresentação de um DW: navegando e visualizando os dados da

organização com técnicas e ferramentas de processamento analítico – OLAP.

Ferramentas OLAP: Mondrian Schema Workbench, Pentaho BI Server, Saiku , Excel.

.

2. Processo de Descoberta de Conhecimento em Bancos de dados (KDD).

Mineração de Dados: Tarefas, técnicas e algoritmos.

Ferramentas de mineração de dados: RapidMiner.

Programa da disciplina

49

Formas de Avaliação:

No transcorrer do semestre teremos quatro avaliações:

1. Trabalho em grupo de pesquisa bibliográfica;

2. Prova individual de modelagem dimensional;

3. Trabalho em grupo de modelagem dimensional e análises de dados;

4. Prova individual de análises de dados (utilizando ferramentas e técnicas

de OLAP e de Mineração de Dados);

As avaliações terão o mesmo peso, e os trabalhos poderão ser feitos

em grupos de até duas pessoas.

Programa da disciplina

50

Bibliografia principal (DW e BI)

1. INMON, W. H. Como construir o Data Warehouse. Rio de Janeiro: Campus,

1997.

2. KIMBALL, R. The Data Warehouse Toolkit: guia completo para modelagem

dimensional. Rio de Janeiro: Campus, 2002.

3. LEME FILHO, Trajano. Business Intelligence no Microsoft Excel. Rio de

Janeiro: Axcel Books do Brasil, 2004.

4. Machado, F. N. Tecnologia e projeto de Data Warehouse: uma visão

multidimensional. São Paulo: Érica, 2004.

5. TURBAN, Efrain; SHARDA, Ramesh; ARONSON, Jay; KING, David. BUSINESS

INTELLIGENCE: um enfoque gerencial para a inteligência do negócio. Porto

Alegre: Bookman, 2009.

Programa da disciplina

51

Bibliografia principal (OLAP, AED e KDD)

1. THOMSEM, Erik. OLAP: construindo sistemas de informações dimensionais.

Rio de Janeiro: Campus, 2002.

2. LAPPONI, J. C. Estatística usando Excel. São Paulo: Lapponi Treinamento e

Editora, 2000.

3. TAN, P.; STEINBACH, M.; KUMAR, V. Introdução a mineração de dado. Rio

de Janeiro, Editora Ciência Moderna, 2009.

Programa da disciplina

52

Bibliografia complementar

1. BARBIERI, C. BI-Business Intelligence: modelagem e

tecnologia. Rio de Janeiro: Axcel Books do Brasil, 2001.

2. LAUDON, K. C.; LAUDON, J. P. Sistemas de informação com

Internet. 4. ed. Rio de Janeiro: LTC, 1999.

3. O’BRIAN, J. A. Sistemas de informação e as decisões gerenciais

na era da Internet. São Paulo: Saraiva, 2001.

Programa da disciplina

• DataWarehouse:

– Banco de dados: PostgreSQL;

– Modelagem: SQL Power Architect;

• ETL:

– SQLs;

– PDI (Kettle) (Pentaho )

• Análises de dados: OLAP, AED, Mineração de Dados:

– Excel;

– BiServer (Pentaho);

– RapidMiner ;

Programa da disciplina

54

BI

Dados (OLTP e outras fontes)

Data Warehouse/Data Marts

Ferramentas OLAP

Mineração de dados - KDD

Interpretação/

Avaliação

Decisões

Análise

de dados

Análises dos

tomadores de

decisão

Fundamentação da disciplina

Dados

Informação

Conhecimento

Análise exploratória de dados

55

1.2 Sistemas de Business Intelligence (BI)

56

Sistemas de informação

“ [...] é um conjunto interdependente de pessoas, estruturas

organizacionais, software, hardware, processos e métodos

Interligados com o objetivo de facilitar o planejamento e o controle

em organizações, de forma que as informações se tornem

utilizáveis na coordenação do fluxo de trabalho de uma organização

[...] ”

(LAUDON; LAUDON, 1998).

Sistemas de BI

57

Hardware Pessoas

Software Tele-Comunicações

ProcedimentosBanco de Dados

Mainframes

DW

Data Mart

DB

Transacional

Sistemas de BI

58

Sistemas de Informação

Visão operacional da TI

Visão estratégicada TI

Sistemas de apoioàs operações

(Sistemas OLTP)

Sistemas de apoioà gerência

(Sistemas SAG)

59

Características Visão operacional da TI (OLTP) Visão estratégica da TI (SAD)

Características dos sistemas

Função Monitorar e processar asfunções básicas e rotineiras do

dia a dia

Elaboração das informações que

sejam pertinentes (embasar) ao

processo decisório

Forma Baseado em transações Baseado em análises

Características dos dados

Natureza Dados atuais Dados históricos

Organização Por processo ou sistema de informação

Orientado a assuntos denegócios

Conteúdo Armazenam dados em detalhe Dados sumarizados

Modelo Modelo relacional (ER) Modelo dimensional

Sistemas de BI

60

Características Visão operacional da TI (OLTP)

Visão estratégica da TI (SAD)

Características dos usuários e responsáveis

Tipo de usuário Comunidade operacional Tomadores de decisão, analistas de negócios

Representante na empresa

Gerente ou diretor de informática

Diretor de informação, analista de negócios

Responsabilidadedo representante

Qualidade dos dados efuncionamento dos serviços

de informática

Qualidade da informação para decidir

Forma de uso Processo repetitivo, estruturado

Processo analítico, heurístico

Tipo de decisão Suporte a decisões cotidianas (diárias)

Suporte a decisões estratégicas (em longo prazo)

Sistemas de BI

61

Os sistemas de BI são a evolução dos SAG.

Os sistemas de BI são um conjunto de conceitos, metodologias e

tecnologias que, fazendo uso de fatos ou de acontecimentos e

Sistemas baseados nesses fatos, apoiam o processo de tomada de

decisão.

Conhecido também por Inteligência Empresarial, ou Inteligência nos

Negócios, o termo BI é usado como guarda-chuva.

Sistemas de BI

62

O objetivo das técnicas de BI é definir regras e técnicas para a

formação adequada dos dados da organização, visando transformá-

los em depósitos de informações e conhecimento que atendam às

necessidades dos processos de gestão e de decisão.

Em outras palavras, isso quer dizer transformar os dados em

informações e conhecimentos relevantes para suprir as necessidades

gerenciais de apoio aos processos de gestão e de decisão.

Sistemas de BI

63

Sistemas de BI

Equipe técnica que desenvolve e

oferece suporte ao BIAnalistas de negócio

64

A arquitetura de um sistema típico de BI é composta das seguintes

partes:

• Módulo ETL (back-end): componente dedicado à Extração, à

Transformação e à carga (Load) dos dados.

A extração é a parte responsável pela coleta dos dados.

A transformação unifica os formatos e faz a “limpeza” dos registros

incompletos e das inconsistências dos dados. Os dados tratados são

carregados em um repositório de dados comum.

Sistemas de BI

65

• Repositório de dados: estrutura de armazenamento de

informações como Data Warehouse e Data Marts (repositório de

dados baseados em assuntos de negócios, integrado, não volátil,

variável em relação ao tempo).

• Aplicações de front-end: são as ferramentas de análise de dados

com a possibilidade da descoberta de informações explícitas e

implícitas que pudessem ser úteis para as organizações

(ferramentas de processamento analítico (OLAP), de análise

exploratória de dados (AED) e processo de descoberta de

conhecimento em bancos de dados (KDD)).

Sistemas de BI

66

Requisitos para obter “valor do BI” para o negócio da empresa:

Tecnicamente, o valor do BI resulta de uma boa análise das

necessidades de informação (requisitos para o DW), da pertinência e

da qualidade das fontes de coleta (dados) e da qualidade das análises

e informações extraídas (análises de dados) para os analistas de

negócio.

Gerencialmente, o êxito do BI, depende da cultura analítica da

organização.

Sistemas de BI

67

1.3 Dados, Informação e Conhecimento

68

Os dados são uma entidade puramente sintática, sem significado

nem semântica (não carregam caráter informativo). No contexto

dos sistemas de informação, dados são registros de transações.

Os dados são os componentes básicos (matéria-prima) a partir dos

quais a informação é criada. O dado deve então ser trabalhado

para que se torne uma informação e seja utilizável.

Dados, Informação e Conhecimento

70

Informação são dados formatados de uma maneira inteligível e útil

ao usuário. Informar é dar forma, relevância e propósito aos dados.

Informação são dados em um contexto dotado de semântica.

Um conjunto de dados representa uma informação para uma

pessoa quando ela consegue perceber suas relações com outros

dados e/ou informações que lhe definem um contexto.

Dados, Informação e Conhecimento

A interpretação dos dados contextualizados (informação), para

estabelecer novas relações, fazer inferências, reformular significados

e tirar conclusões é o que chamamos de conhecimento.

Esta interpretação, depende de cada pessoa porque envolve fatores

intangíveis como crenças pessoais, perspectivas, insights, intuições,

vivencias e experiências anteriores sobre o assunto em questão.

Neste sentido, conhecimento é um tipo de informação mais

estruturada, com alto grau de refinamento, com valor agregado,

carregada de entendimento sobre um domínio.

71

Dados, Informação e Conhecimento

72

Exemplo: em um sistema de vendas, podemos ter o seguinte:

Informações:

Vendas por mês dos últimos anos; Crescimento das vendas;

Sazonalidade dos produtos; Total de faturamento; Lucratividade dos

produtos, etc.

Conhecimentos:

Saber o retorno das campanhas publicitárias; Identificar o perfil do

cliente para um novo produto; Saber se existe venda “conjunta”

(arroz e feijão); Identificar os clientes para uma mala direta; etc.

Dados, Informação e Conhecimento

77

Sendo assim, o conhecimento pode ser definido como estratégias

(modelos, métodos, regras, técnicas, mecanismos) usadas por uma

pessoa (ou máquina) para interpretar, analisar e responder

apropriadamente às situações de um determinado assunto.

Por esse motivo, o conhecimento deve ser adquirido de forma

construtivista, em que o processo de descoberta é guiado por

hipóteses, numa interação entre o analista do negócio e os dados.

Dados, Informação e Conhecimento

79

Dados, Informação e Conhecimento

Dados Informação Conhecimento

São simples observaçõesou fatos sobre eventos

São dados dotados de relevância (semântica) e

propósito

Informação com valoragregado e entendimentosobre o domínio

Fácil de estruturar e capturar por sistemas

Facilmente contextualizada

por sistemas

De difícil estruturação, captura e apresentação

Facilmente transferível Transferível com certa dose de esforço

De difícil transferência

Claro, apresentável Apresentação por gráficos,indicadores, índices.

De difícil apresentação ecompartilhamento

Frequentementequantificado

Exige análises, contexto emedições humanas

Inclui interpretação,reflexão e contexto

Fonte: Business Intelligence no Microsoft Excel (LEME FILHO, 2004)

80

O processo de construir um modelo para representar um conjunto de

dados com o propósito de encontrar padrões, tendências e relações

interessantes entre os dados é o principal objetivo das técnicas de

análises de dados.

Os modelos construídos têm o intuito de facilitar as análises e

as visualizações dos dados para os analistas de negócios, na procura

de informações (explícitas e implícitas) que auxiliem nos processos de

gestão e decisão da organização.

Dados, Informação e Conhecimento

81

Dados, Informação e Conhecimento

ID Sexo Cidade Idade Comprou?

1 M Floripa 25 S

2 M Criciúma 21 S

3 F Floripa 23 S

4 F Criciúma 34 S

5 F Floripa 30 N

6 M Blumenau 21 N

7 M Blumenau 20 N

8 F Blumenau 18 N

9 F Floripa 34 N

10 M Floripa 55 N

Idade

Cidade

27

Blumenau

Criciúma

Floripa

SIM NÂO Cidade

Idade

Não Sim

Floripa

SimNão

Dados, Informação e Conhecimento

Se Cidade = Blumenau então comprou = Não;

Se Cidade = Criciúma então comprou = Sim;

Se Cidade = Floripa e Idade > 27 então comprou = Não;

Se Cidade = Floripa e Idade <= 27 então comprou = Sim;

83

BI

Dados (OLTP e outras fontes)

Data Warehouse/Data Marts

Ferramentas OLAP

Mineração de dados - KDD

Interpretação/

Avaliação

Decisões

Análise

de dados

Análises dos

tomadores de

decisão

Fundamentação da disciplina

Dados

Informação

Conhecimento

Análise exploratória de dados