View
214
Download
0
Category
Preview:
Citation preview
w w w . f p 2 . c o m . b r
Business
Intelligence
Rua Tuiuti 2130, sala 302Centro - Santa Maria – RS
(55) 3026-8469
Entendendo a “Inteligência de Negócios”Ms. Fernando Prass
55 3026-8469 | w w w . f p 2 . c o m . b r
Agenda
• Apresentação
• Business Intelligence
• Data Warehouse
• Data Mining
• Ferramentas
• Por onde começar?
• Contato
55 3026-8469 | w w w . f p 2 . c o m . b r
FP2 Tecnologia
• Fábrica de software
• Consultoria e Treinamento
55 3026-8469 | w w w . f p 2 . c o m . b r
Fernando Sarturi Prass
• Bacharel em Sistemas de Informação (UNIFRA - 1999)
• Mestre em Ciência de Computação (UFSC - 2004)
– Dissertação: Estudo comparativo entre algoritmos de Análise de
Agrupamentos em Data Mining
• Atuação Profissional:
– Programador (UNIFRA), Analista de Sistema (FEESC), Gerente
de Projeto (FEESC) e Diretor (FP2 Tecnologia )
• Atuação Acadêmica:
– Professor Universitário (FACVEST, Estácio de Sá, AMF e
ULBRA ) e Coordenador de Curso de SI (AMF)
55 3026-8469 | w w w . f p 2 . c o m . b r
O Ambiente de Negócios
O modelo Pressões – Reações – Suporte de Negócios
Globalização,
demandas dos
consumidores,
regulamentações
governamentais,
mercados, etc.
Fatores do ambiente de
negócios
Pressões
OportunidadesSuporte
computadorizado
Reações daorganização
Estratégia, maior
produtividade,
novos negócios,
colaboração entre
parceiros, novos
fornecedores, novos
modelos, etc.
Decisõese suporte
Adapatado de Turban et. al. Business Intelligence. p.24.
Análise,
decisões,
previsões
Business Intelligence
55 3026-8469 | w w w . f p 2 . c o m . b r
Business Intelligence (BI)
• É um termo “guarda-chuva”
– Inclui arquiteturas, ferramentas, bancos de dados,
aplicações e metodologias;
• É uma “expressão livre”
– Pode significar coisas diferentes para pessoas diferentes
• Objetivos do BI:
– Permitir acesso interativo aos dados;
– Proporcionar a manipulação desses dados; e
– Fornecer conhecimentos para a tomada de decisões
55 3026-8469 | w w w . f p 2 . c o m . b r
Um conceito de BI
• BI é uma metodologia que permite transformar dados em informações qualificadas, gerando conhecimento para a tomada de decisões.
55 3026-8469 | w w w . f p 2 . c o m . b r
Dado > Informação > Conhecimento
Dado Informação Conhecimento
Observações documentadas,
em texto, figuras, tabelas.
Conjunto de número ou
caracteres, etc.
Resultado do agrupamento,
manipulação e/ou organização dos dados gerando
mudanças quantitativas e/ou
qualitativas.
Aquilo que foi vivenciado, utilizado ou
aprendido por alguém.
Interpretação ou modificação da
informação.
55 3026-8469 | w w w . f p 2 . c o m . b r
Histórico
• O termo BI foi criado por Gartner Group no início da
década de 1990, entretanto sua origem está nos
primeiros SIG (1970).
• Neste período os relatórios eram estatísticos,
bidimensionais e não possuíam recursos de análises.
• No início dos nos 1980 surge o conceito de “sistemas de
informações executivas” (EIS).
• Este conceito expandiu o suporte computadorizado aos
gerentes e executivos de nível superior
55 3026-8469 | w w w . f p 2 . c o m . b r
Público Alvo
• O conhecimento gerado pelo BI possui um público
alvo específico: alta gerência e diretoria
• ERPs respondem a perguntas simples:
– Qual o valor total vendido na última semana?
• BI responde a perguntas complexas:
– Qual o valor total vendido, por semana, neste ano,
excetuando-se as semanas em que houveram feriados?
– Qual a diferença entre as vendas da Páscoa deste ano
em relação a Páscoa do ano passado?Operacional
Tático
Estra-tégico
55 3026-8469 | w w w . f p 2 . c o m . b r
Vantagens do BI
• The Data Warehouse Institute publicou um estudo com
510 corporações denominado “Smart Companies in the
21 st Century”, que mostra que BI trouxe...
... economia de tempo para 61% delas
... versão única da verdade para 59% delas
... melhores estratégias e planos para 57% delas
... melhores decisões táticas para 56% delas
... processos mais eficientes para 55% delas
... economia de custos para 37% delas
55 3026-8469 | w w w . f p 2 . c o m . b r
Arquitetura e componentes do BI
Fontes de Dados
ERP
Data Warehouse
DMDM
DM
KDD
Conhecimento
info
rmaç
ão
Dado
Suporte
DecisãoETL
info
rmaç
ão
OLAP
55 3026-8469 | w w w . f p 2 . c o m . b r
Data Warehouse
• Segundo Kimball (1998), Data Warehouse é uma
coleção de dados orientados por assunto,
integrados, temporais e não voláteis, utilizados para
suportar processos de tomada de decisão (BI)
• Estes dados, em geral, estão organizados num
Modelo Dimensional , também conhecido como
Modelo/Esquema Estrela (uma espécie de banco
de dados não normalizado)
55 3026-8469 | w w w . f p 2 . c o m . b r
Modelo Dimensional
• Técnica que busca apresentar os dados numa
estrutura padronizada, mais intuitiva e com alto
desempenho de acesso. Específica para suportar
processamento analítico - OLAP;
• Evita-se a utilização da técnica de normalização;
• Cada modelo dimensional é composto de uma
tabela com múltiplas chaves (fato) e um conjunto
de outras tabelas (dimensões)
55 3026-8469 | w w w . f p 2 . c o m . b r
Exemplo de Modelo Estrela
TEMPO
ID_TEMPO: INTEGER
DATA: DATEANO: SMALLINTMES: SMALLINTDIA: SMALLINTDIA_SEMANA: SMALLINTFERIADO: CHAR(1)VESPERA_FERIADO: VARCHAR(1)TEMPORADA: VARCHAR(30)EVENTO: VARCHAR(30)
CLIENTE
ID_CLIENTE: INTEGER
NOME_CLIENTE: VARCHAR(25)ENDERECO_CLIENTE: VARCHAR(40)CIDADE_CLIENTE: VARCHAR(29)ESTADO_CLIENTE: CHAR(2)CPF_CLIENTE: CHAR(11)FONE_CLIENTE: VARCHAR(10)NUM_CLIENTE: INTEGER
LOCADORA
ID_LOCADORA: INTEGER
NOME_LOCADORA: VARCHAR(25)RUA_LOCADORA: VARCHAR(40)FONE_LOCADORA: CHAR(11)NOME_DISTRIBUIDOR: VARCHAR(25)ENDERECO_DISTRIBUIDOR: VARCHAR(45)CIDADE_DISTRIBUIDOR: VARCHAR(20)ESTADO_DISTRIBUIDOR: CHAR(2)CEP_DISTRIBUIDOR: CHAR(8)FONE_DISTRIBUIDOR: CHAR(10)
FUNCIONARIO
ID_FUNCIONARIO: INTEGER
NOME_FUNCIONARIO: VARCHAR(25)NOME_SUPERVISOR: VARCHAR(25)NOME_LOCADORA: VARCHAR(25)ENDERECO_FUNCIONARIO: VARCHAR(4)CIDADE_FUNCIONARIO: VARCHAR(20)ESTADO_FUNCIONARIO: CHAR(2)CEP_FUNCIONARIO: CHAR(8)FONE_FUNCIONARIO: CHAR(10)CPF_FUNCIONARIO: CHAR(11)INGRESSO_FUNCIONARIO: DATE
FILMES
ID_FILME: INTEGER
ID_FILME_ATUALIZACAO: INTEGERNUM_COPIA_FILME: INTEGERVALOR_PAGO: DOUBLE PRECISIONCONDICAO_GERAL: CHAR(1)NUM_FILME: INTEGERNOME_FILME: VARCHAR(25)DIRETOR_FILME: VARCHAR(25)CATEGORIA_FILME: INTEGERESTRELA_FILME: VARCHAR(25)CENSURA: CHAR(1)TAXA_ALUGUEL_FILME: DOUBLE PRECISIONDATA_FILME: DATE
ALUGUEL
ID_FILME: INTEGERID_LOCADORA: INTEGERID_CLIENTE: INTEGERID_FUNCIONARIO: INTEGERID_TEMPO_RETIRADA: INTEGERID_TEMPO_RETORNO: INTEGERNUM_ALUGUEL_FILME: INTEGER
VALOR_ALUGUEL: INTEGER
55 3026-8469 | w w w . f p 2 . c o m . b r
OLAP
• On-line Analytical Processing (OLAP) é a capacidade
para manipular e analisar um grande volume de dados
sob múltiplas perspectivas.
– Consultas ad-hoc: geradas pelos usuários finais de acordo
com suas necessidades
– Slice and Dice: possibilita a alteração da perspectiva de
visão. Troca de linhas por colunas de maneira a facilitar a
compreensão dos dados (girar o cubo).
– Drill down/up: consiste em realizar exploração em diferentes
níveis de detalhes da informação. Com drill down dividi-se um
item de resumo em seus componentes detalhados, como por
exemplo ano, semestre trimestre, mensal e diário.
55 3026-8469 | w w w . f p 2 . c o m . b r
KDD
• O Knowledge Discovery in Databases (KDD) é o
processo, não trivial, de extração de informações
implícitas, previamente desconhecidas e potencialmente
úteis, a partir dos dados armazenados em um banco de
dados (FAYYAD et al., 1996).
– Não trivial já que alguma técnica de busca ou inferência é
envolvida (não é apenas um processo de computação direta).
– Os padrões descobertos devem ser válidos com algum grau de
certeza, novos, trazer algum benefício e serem compreensíveis
(se não imediatamente então depois da interpretação).
55 3026-8469 | w w w . f p 2 . c o m . b r
Fases do KDD
Embora as fases devam ser executadas na ordem apresentada, o processo é interativo e iterativo. Interativo , pois o usuário pode, e por vezes necessita, intervir e controlar o curso das atividades. Iterativo , por ser uma sequência finita de operações em que o resultado de cada uma é dependente das anteriores.
Adaptado de Fayyad et. al. From data mining to knowledge discovery, 1996.
55 3026-8469 | w w w . f p 2 . c o m . b r
Data Mining
• Data Mining é o processo de reconhecimento de padrões
válidos ou não, existentes nos dados armazenados em
grandes bancos de dados (FAYYAD et al., 1996)
• É a exploração e análise, de forma automática ou semi-
automática, de grandes bases de dados com objetivo de
descobrir padrões e regras.
• O objetivo do processo é fornecer as corporações
informações que as possibilitem montar melhores
estratégias de marketing, vendas, suporte, melhorando
assim os seus negócios
55 3026-8469 | w w w . f p 2 . c o m . b r
Os tipo de Data Mining
ProblemaÉ bastante difícil para o usuário definir, a priori, hipóteses confirmatórias
• O usuário determina umahipótese e investiga os dados
• O sistema devolve umaresposta ao usuário,
confirmando ou não suahipótese
Confirmatório
ProblemaAssociações importantes
podem não ser detectadas em função de variáveis mal
escolhidas
• O usuário seleciona variáveis relevantes• O sistema aciona
mecanismos de associação e investiga a base de dados
Exploratório
55 3026-8469 | w w w . f p 2 . c o m . b r
Técnicas de Data Mining
• Não existe uma técnica que resolva todos os problemas de
data mining. Diferentes técnicas servem para diferentes
propósitos, cada uma oferecendo vantagens e desvantagens.
• A escolha da técnica está fortemente relacionada com o tipo de
conhecimento que se deseja extrair ou com o tipo de dado no
qual ela será aplicada.
• As mais conhecidas e usadas são:
– Árvores de Decisão;
– Regras de Indução;
– Redes Neurais;
– Análise de Agrupamentos
55 3026-8469 | w w w . f p 2 . c o m . b r
Aplicações
• Marketing: redução dos custos com o envio de
correspondências (mala direta) a partir da identificação
de grupos de clientes potenciais.
• Detecção de fraude: reclamações indevidas de seguro,
chamadas clonadas de telefones celulares, compras
fraudulentas com cartão de crédito.
• Investimento: diversas empresas têm usado técnicas
de DM para obter ganhos financeiros, especialmente no
mercado de ações e na previsão da cotação do dólar.
55 3026-8469 | w w w . f p 2 . c o m . b r
Exemplo de Caso: Interconexões
• Quando um usuário da Operadora A liga para outro da Operadora B, existe a chamada Tarifa de Interconexão.
• Hoje o custo é de cerca de R$ 0,35 por minutos.• Controlar o tempo de chamada no horário de pico é complexo e
pequenas diferenças (1 a 3 segundos) podem ocorrer.
Operadora A Operadora B
55 3026-8469 | w w w . f p 2 . c o m . b r
Ferramenta de DW - Mondrian
• Ferramenta open source para a execução de consultas OLAP em base de dados
• Disponível em http://mondrian.pentaho.com
55 3026-8469 | w w w . f p 2 . c o m . b r
Ferramenta de DM - Weka
• Ferramenta open source que contempla os principais algoritmos de Data Mining
• Disponível em www.cs.waikato.ac.nz/ml/weka
55 3026-8469 | w w w . f p 2 . c o m . b r
Business Intelligence
• Business Intelligence:
Um enfoque gerencial para
a inteligência do negócio
– Efraim Turban;
– Ramesh Sharda;
– Jay E. Aronson;
– David King
– Custo: R$ 65,00
55 3026-8469 | w w w . f p 2 . c o m . b r
Data Warehouse
• Tecnologia e Projeto de
Data Warehouse
– Felipe Nery Rodrigues
Machado
– Custo: R$ 71,00
55 3026-8469 | w w w . f p 2 . c o m . b r
Data Mining
• Data Mining with
Microsoft SQL
Server 2008
– Jamie MacLennan
– ZhaoHui Tang
– Bogdan Crivat
– Custo: U$ 41,00
55 3026-8469 | w w w . f p 2 . c o m . b r
Dados para Praticar
Portal Brasileiro de Dados Abertos www.dados.gov.br
Teradata – University Networkwww.teradatauniversitynetwork.com
55 3026-8469 | w w w . f p 2 . c o m . b r
Referências Bibliográficas
• FAYYAD, Usama; PIATETSKY-SHAPIRO, Gregory; SMYTH,
Padhraic. From data mining to knowledge discovery: An
overview. In: Advances in Knowledge Discovery and Data
Mining. England: AAAI Press/The MIT Press, 1996, p.1-34.
• KIMBALL, Ralph; REEVES, Laura; ROSS, Margy &
Thornthwaite. The Data Warehouse Lifecycle Toolkit: Expert
Methods for Designing, Developing, and Deploying Data
Warehouses. NewYork: John Wiley & sons,1998.
• TURBAN, Efraim; SHARDA, Ramesh; ARONSON, Jay; KING,
David. Business Intelligence: um enfoque gerencial para a
inteligência do negócio. Porto Alegre: Bookman, 2009.
Recommended