26
Universidade do Minho Escola de Engenharia Licenciatura em Tecnologias e Sistemas de Informação Tecnologias de Suporte à Gestão Análise dos dados recorrendo a algoritmos de Data Mining Guimarães, 2011

Tsg web mining

Embed Size (px)

Citation preview

Page 1: Tsg web mining

Universidade do Minho

Escola de Engenharia

Licenciatura em

Tecnologias e Sistemas de Informação

Tecnologias de Suporte à Gestão

Análise dos dados recorrendo a algoritmos de Data

Mining

Guimarães, 2011

Page 2: Tsg web mining

Tecnologias e Sistemas de Informação Universidade do Minho

Page 3: Tsg web mining

Tecnologias e Sistemas de Informação Universidade do Minho

I

Índice

1. Introdução .............................................................................................................................. 1

1.1. Descrição do problema ................................................................................................. 1

1.2. Objectivos ..................................................................................................................... 1

1.3. Resultados a atingir ...................................................................................................... 1

1.4. Estrutura do relatório .................................................................................................... 1

2. Criação dos modelos de previsão ........................................................................................... 2

2.1. Introdução ..................................................................................................................... 2

2.2. Modelação e avaliação .................................................................................................. 3

2.2.1. Redes neuronais ......................................................................................................... 3

2.2.2. Clustering .................................................................................................................. 9

2.2.3. Árvores de decisão .................................................................................................. 12

3. Conclusão ............................................................................................................................. 17

4. Bibliografia .......................................................................................................................... 17

Anexo I ............................................................................................................................................ 1

Criar tabela DMOnlineProduto .................................................................................................. 1

Carregar dados para a tabela DMOnlineProduto ........................................................................ 3

Alteração de dados na tabela DMOnlineProduto ....................................................................... 5

Índice de figuras

Figura 1 – Criação das vistas ........................................................................................................... 3

Figura 2 – Criação do modelo de previsão ...................................................................................... 3

Page 4: Tsg web mining

Tecnologias e Sistemas de Informação, Pós-laboral Etapa 6 Equipa 9

1

1. INTRODUÇÃO

1.1. DESCRIÇÃO DO PROBLEMA

Uma vez analisada e tratada a informação disponibilizada pela organização é necessário agora

encontrar modelos descritivos, que permitam aumentar o conhecimento acerca dos dados usados,

e modelos de previsão para suporte do processo de tomada de decisão, que conduzam a uma

melhoria do negócio.

O processo de Data Mining foi realizado através de projectos do tipo Business Intelligence

constantes no Microsoft Visual Studio 2008.

1.2. OBJECTIVOS

Produzir modelos de previsão de dados.

Analisar os modelos obtidos.

1.3. RESULTADOS A ATINGIR

Dar resposta às questões de suporte para a tomada de decisão.

1.4. ESTRUTURA DO RELATÓRIO

Este trabalho apresenta-se estruturado em cinco capítulos:

Introdução, onde é descrito o problema a tratar, a finalidade deste trabalho, os artefactos a

apresentar e a estrutura deste relatório;

Criação dos modelos de previsão, onde são desenvolvidos e analisados os modelos de

previsão de dados;

Conclusão, onde constam as considerações finais sobre o trabalho desenvolvido;

Bibliografia, onde consta o material bibliográfico consultado para suporte teórico do

trabalho.

Page 5: Tsg web mining

Tecnologias e Sistemas de Informação, Pós-laboral Etapa 6 Equipa 9

2

2. CRIAÇÃO DOS MODELOS DE PREVISÃO

2.1. INTRODUÇÃO

A descoberta de conhecimento em bases de dados é o processo que permite a identificação de

padrões ou tendências nos dados por aplicação de técnicas, métodos e algoritmos de Data

Mining, para posteriormente a interpretação desses padrões suportarem a tomada de decisão.

A metodologia de referência para projectos de Data Mining é a Cross Industry Standard Process

for Data Mining (CRISP-DM), constituída por seis fases.

Enquanto que na primeira fase desta metodologia, compreensão do negócio, faz-se o

levantamento da informação disponível sobre a situação do negócio, tratando então os objectivos

da organização em objectivos Data Mining, na fase seguinte, compreensão dos dados, faz-se a

recolha dos dados disponíveis, a análise e exploração dos mesmos e por fim a verificação da

qualidade destes; se apresentam erros, qual o seu tipo e frequência, e se há dados em falta.

A terceira fase, preparação dos dados, engloba a selecção de tabelas, atributos e registos

necessários à análise, bem como a transformação, limpeza e formatação dos dados.

Estas três fases foram já sendo executadas ao longo de todo o projecto, tendo sido agora

realizados os devidos ajuste, dando realce à conversão das tabelas numa única, neste caso em

duas, uma referente às vendas a lojas e outra às vendas online. A criação das tabelas, com a

eliminação dos campos de carácter meramente informático e dos registos duplicados e nulos, foi

realizada com instruções SQL, através do SQL Server Management Studio, exemplificadas no

Anexo I

Já na fase de modelação, são aplicadas as técnicas de modelação redes neuronais, árvores de

decisão e clustering, adiante descritas, juntamente com a avaliação dos modelos obtidos,

concluindo assim a fase de avaliação.

Na última fase, desenvolvimento, é produzido um relatório com os resultados obtidos, ficando

agora do lado da organização a monitorização, manutenção, revisão e avaliação do projecto.

Page 6: Tsg web mining

Tecnologias e Sistemas de Informação, Pós-laboral Etapa 6 Equipa 9

3

2.2. MODELAÇÃO E AVALIAÇÃO

Figura 1 – Criação das vistas

Uma vez criada a tabela com os dados referentes ao processo de venda a lojas e outra com os

dados relativos às aquisições online, foram criadas as vistas sobre estas duas tabelas,

DMLojasSimples e DMOnlineSimples, conforme Figura 1.

Figura 2 – Criação do modelo de previsão

Estamos agora aptos para criar os modelos pretendidos, tendo por base as vistas criadas, conforme

Figura 2.

2.2.1. Redes neuronais

Redes neuronais são sistemas de classificação modelados segundo os princípios do sistema

nervoso humano. O algoritmo de redes neuronais combina cada estado do atributo de entrada,

input, com cada estado possível do atributo de saída, predict, e usa os dados de treino para

calcular probabilidades. Numa segunda fase usa-se essa probabilidade para prever um resultado

baseado nos atributos de input.

Page 7: Tsg web mining

Tecnologias e Sistemas de Informação, Pós-laboral Etapa 6 Equipa 9

4

A seguir descreve-se o processo de criação de uma rede neuronal para determinar se é mais

vantajoso contratar empregados casados ou solteiros.

A primeira caixa de diálogo que surge é a de

boas vindas ao assistente de Data Mining.

De seguida surge a caixa de diálogo que

permite seleccionar o método usado na

definição da estrutura de dados. Neste caso

indica-se que se vai utilizar uma base de dados

da data warehouse.

Na caixa de diálogo seguinte selecciona-se a

técnica de Data Mining a usar, neste caso a

rede neuronal.

De seguida selecciona-se a fonte de dados a

utilizar, neste caso a vista criada sobre a tabela

das vendas às lojas, DMLojasSimples.

Page 8: Tsg web mining

Tecnologias e Sistemas de Informação, Pós-laboral Etapa 6 Equipa 9

5

Na fase seguinte selecciona-se o tipo de tabela

que vai ser utilizada para análise.

O próximo passo consiste em indicar as

colunas que se pretendem como inputs e

predict.

Na caixa de diálogo seguinte é mostrado o tipo

de dados dos campos seleccionados

anteriormente.

De seguida é indicada a percentagem de dados

a ser utilizada para teste. Neste caso optou-se

por utilizar 40%.

Page 9: Tsg web mining

Tecnologias e Sistemas de Informação, Pós-laboral Etapa 6 Equipa 9

6

Uma vez definidas as opções, inicia-se o

processamento dos dados.

Após o processamento dos dados, no separador

Mining Models encontra-se a lista com o

campo que se quer prever e os utilizados como

inputs. Aqui, é possível indicar a

utilização/remoção de atributos para a

redefinição do modelo.

No separador Mining Model Viewer procede-se à análise dos resultados. Como se pode verificar,

enquanto que na América é favorecida uma contratação de um empregado casado, excepto no

caso da América Central, tal não acontece na França, Alemanha, Austrália, onde a probabilidade

de contratação de um empregado solteiro é maior. Quando a comissão está compreendida entre

1.228,299 e 2.738,409 também é favorecido a contratação de um empregado casado.

No separador Mining Accuracy Chart, em Lift Chart observa-se a probabilidade de acerto do

modelo criado, que neste caso está acima dos 80%.

Page 10: Tsg web mining

Tecnologias e Sistemas de Informação, Pós-laboral Etapa 6 Equipa 9

7

Em Classification Matrix observa-se a matriz de classificação dos dados analisados, onde se

constata que num total de 24033 previsões, existem 334 previsões erradas, dando ao modelo uma

taxa de confiança de 98,6%.

Uma vez obtido o modelo, é possível analisar a

informação através de operações de filtragem.

Assim, se, por exemplo, se pretender analisar

qual o estado civil dos funcionários a contratar

na França, basta seleccionar em Attribute, da

área Input, o atributo Empregado Território e

associar o valor France. Observando os

resultados apresentados, contata-se que é mais

acertado contratar um funcionário solteiro do

que um casado, sobre qualquer um dos

atributos em análise.

Se o território seleccionado para a contratação

for o Canadá, então as previsões favorecem a

contratação de um empregado casado.

Page 11: Tsg web mining

Tecnologias e Sistemas de Informação, Pós-laboral Etapa 6 Equipa 9

8

Foi desenvolvida outra rede neuronal para perceber, relativamente aos produtos vendidos online,

que categoria de produtos e em que região foram vendidos, por semestre.

O processo de criação deste modelo foi

idêntico ao anteriormente descrito, sendo que a

fonte de dados é agora a vista

DMOnlineSimples.

A imagem acima apresenta os atributos

seleccionados para a construção do modelo,

bem como o seu tipo de dados.

A percentagem de dados a ser utilizada para

teste é agora de 30%.

Por fim, é atribuído o nome ao modelo de rede

neuronal criado.

Page 12: Tsg web mining

Tecnologias e Sistemas de Informação, Pós-laboral Etapa 6 Equipa 9

9

Através da avaliação do gráfico compreende-se que este modelo não tem uma percentagem de

precisão muito elevada, o que implica um elevado grau de incerteza nas previsões apresentadas.

Com a matriz de classificação pode-se

observar que apesar de haver confiança nos

dados em relação ao segundo semestre tal não

se verifica para o primeiro semestre. Num total

de 60658 previsões, existem 29919 previsões

erradas, dando ao modelo uma taxa de

confiança de 51%.

Analisando o território Noroeste da América,

os produtos da categoria roupa, bicicleta e

componentes, por esta ordem, são mais

propícios de serem adquiridos no primeiro

semestre do ano. Já os acessórios são a única

categoria de produto em que é mais provável a

sua compra no segundo semestre.

2.2.2. Clustering

A técnica Clustering agrupa casos de um conjunto de dados em clusters que contêm

características semelhantes. Tem como objectivo a detecção de padrões correlacionados nos

dados, padrões esses que podem-se não conseguir derivar logicamente por observação casual.

Este algoritmo de segmentação tenta redefinir agrupamentos na criação de clusters que

identificam diferentes tipos de previsões dependendo dos inputs seleccionados.

Page 13: Tsg web mining

Tecnologias e Sistemas de Informação, Pós-laboral Etapa 6 Equipa 9

10

A seguir descreve-se o processo de segmentação por clustering. O que se pretende analisar é a

incidência de cada promoção nas categorias dos produtos adquiridos num dado território, para

clientes loja.

Na caixa de diálogo indica-se a técnica de

Data Mining a usar, opta-se pelo algoritmo

Clustering.

Para a construção do modelo foram

seleccionadas as colunas “Cliente Territorio”,

“Produto Categoria” e “Promocao Tipo”.

Uma vez definido e processado o modelo,

pode-se visualizar o modelo de clusters através

do separador Mining Model Viewer.

Este é já o resultado da previsão onde se

observam os diferentes clusters com os dados

correspondentes aos inputs seleccionados

anteriormente. Assim, por exemplo, o Cluster

3 diz-nos que os clientes do Canadá e

Southwest adquirem roupa e acessórios, mais

roupa que acessórios, principalmente com

descontos por volume.

Page 14: Tsg web mining

Tecnologias e Sistemas de Informação, Pós-laboral Etapa 6 Equipa 9

11

No separador Mining Model Viewer

seleccionando a visualização Cluster

Characteristics do Cluster 2 pode-se observar

especificamente que a probabilidade dos

clientes do Canadá e Northeast comprarem

bicicletas sem promoção é superior que com

promoção.

Em Cluster Discrimination podem-se

comparar os atributos entre dois clusters. A

barra à direita do atributo mostra qual o cluster

que favorece, e o tamanho da barra mostra o

quão fortemente o atributo favorece esse

cluster.

É criado outro modelo onde se pretende analisar a incidência de cada promoção nas categorias

dos produtos adquiridos num dado território, para clientes online

Na análise da incidência das promoções nas

categorias de produtos num determinado

território, seleccionaram-se como inputs as

colunas acima referidas.

Nos algoritmos de segmentação não se usaram

colunas de previsão, excluindo assim a opção

de gráficos de precisão.

Page 15: Tsg web mining

Tecnologias e Sistemas de Informação, Pós-laboral Etapa 6 Equipa 9

12

Pode-se verificar que neste tipo de modelo,

clusters, existem diferentes realces na cor das

linhas de relacionamento e nos próprios

clusters, determinada pela percentagem de

dados em cada um.

No separador Cluster Profiles podem observar-

se os elementos de cada um dos clusters.

Analisando o Cluster 4, constata-se que no

território Central foram adquiridos produtos da

categoria Clothing quase sempre sem desconto

e uma pequena parte com desconto por volume

de compras.

Verifica-se que na análise das caracteristicas

do Cluster 9 a probabilidade de adquirir

produtos online sem descontos é superior a

outro tipo de promoção, sendo esta com mais

impacto nos produtos de roupa e bicicleta. O

território Southwest é onde esta probabilidade

mais se destaca.

Em Cluster Discrimination, observa-se que o

Cluster 3 apresenta-se mais favorável à

existência de clientes do Canadá e Southwest e

aquisição de acessórios.

2.2.3. Árvores de decisão

A técnica de Data Mining Árvores de Decisão é um algoritmo híbrido que integra diferentes

métodos para criação de uma árvore e suporta múltiplas tarefas de análise, incluindo regressão,

classificação e associação.

Page 16: Tsg web mining

Tecnologias e Sistemas de Informação, Pós-laboral Etapa 6 Equipa 9

13

Uma árvore de decisão integra nós, onde se encontram os atributos a classificar, ramos, que

descrevem os valores possíveis para os atributos dos nós, e folhas, que indicam as diversas

classes em que cada registo pode ser classificado.

É criado um modelo de árvores de decisão para determinar a produção de cada linha de produto a

vender nas lojas.

O objectivo desta previsão é determinar as

quantidades a produzir de cada linha de

produtos vendidas para lojas. Assim, para esta

previsão optou-se por uma árvore de decisão.

Escolheram-se três atributos de input , modelo,

sub categoria e quantidade vendida dos

produtos, e um para predict, a linha do produto

a produzir.

O visualizador do modelo apresenta a árvore de decisão resultante do processo descrito

anteriormente.

Analisando um elemento da árvore constata-se que existe quase 100% de probabilidade para a

necessidade de produção da linha T do modelo LL Touring Seat/Saddle da subcategoria Saddles.

Page 17: Tsg web mining

Tecnologias e Sistemas de Informação, Pós-laboral Etapa 6 Equipa 9

14

A rede de dependências mostra as ligações

existentes entre os vários nós da árvore de

decisão.

O separador Input Selection apresenta o output

que se pretende no modelo. Neste caso, o

atributo que foi objecto de previsão foi o

Produto Linha.

Através deste gráfico pode-se observar a probabilidade de acerto na previsão para o modelo

criado, que neste caso é de praticamente 100%, conferindo assim uma elevada confiabilidade.

A matriz de classificação apresentada tem uma

taxa de confiança de 100%, pois todos os

valores previstos correspondem com os valores

actuais. Constata-se, assim, que esta árvore de

decisão transmite segurança nas previsões.

Page 18: Tsg web mining

Tecnologias e Sistemas de Informação, Pós-laboral Etapa 6 Equipa 9

15

O objectivo desta previsão é determinar a produção de cada linha de sub categorias de produtos

para venda online. Assim, para esta previsão optou-se por uma árvore de decisão.

A imagem acima referência os atributos de

Input, categoria, linha, modelo e quantidade

vendida dos produtos, e PredictOnly, a

subcategoria dos produtos.

A rede de dependências mostra as ligações

existentes entre os vários nós da árvore de

decisão.

O visualizador do modelo apresenta a árvore de decisão resultante do processo descrito

anteriormente.

Analisando um elemento da árvore constata-se que existe 100% de probabilidade para a

necessidade de produção da subcategoria Pumps, da categoria Accessories, da linha S, do

modelo Minipump.

Page 19: Tsg web mining

Tecnologias e Sistemas de Informação, Pós-laboral Etapa 6 Equipa 9

16

Através deste gráfico pode-se observar a probabilidade de acerto do modelo criado, que neste

caso é de praticamente 100%, conferindo assim um elevado grau de confiança.

A matriz de classificação apresentada tem uma taxa de confiança de 100%, pois todos os valores

previstos correspondem com os valores actuais. Constata-se, assim, que esta árvore de decisão

transmite segurança nas previsões.

Page 20: Tsg web mining

Tecnologias e Sistemas de Informação, Pós-laboral Etapa 6 Equipa 9

17

3. CONCLUSÃO

Nesta etapa, grande parte do tempo foi investido para a criação dos modelos de previsão, com os

diversos algoritmos, tendo-nos confrontando com algumas dificuldades em conseguir uma boa

percentagem na probabilidade prevista. Dificuldade essa que foi ultrapassada com uma selecção

cuidadosa dos atributos a analisar e um esforço considerável por parte do grupo. Foi ainda

dispendido bastante tempo para análise e tratamento dos dados para a criação das flat tables.

Sobre os resultados das previsões fez-se uma análise para entender a evolução do negócio e

facultar informação para suportar a eventual tomada de decisões.

Sugere-se que se tenha algum cuidado na utilização dos modelos com um grau de confiabilidade

baixo visto que os seus resultados não são credíveis. Na análise dos modelos de Data Mining é

necessário ter atenção aos valores missing, que representam os dados que o algoritmo não

conseguiu avaliar.

Concluímos então que o projecto foi levado a cabo com sucesso e conseguimos apreender os

conceitos chave de análise dos dados recorrendo aos algoritmos de Data Mining e à metodologia

CRISP-DM.

4. BIBLIOGRAFIA

Maribel Yasmina e Isabel Ramos. Business Intelligence – Tecnologias da Informação na Gestão

de Conhecimento, FCA – Editora de Informática, Lda., 2ª Edição, Actualizada e Aumentada,

2009.

Ralph Kimball. The Datawarehouse Toolkit: Pratical Techniques for Building Dimensional Data

Warehouses, John Wiley & Sons, 1996.

Page 21: Tsg web mining

Tecnologias e Sistemas de Informação, Pós-laboral Etapa 6 Equipa 9

1

ANEXO I

CRIAR TABELA DMONLINEPRODUTO

USE [TSGDW]

GO

/****** Object: Table [dbo].[plVendasProduto] Script Date: 01/04/2011 15:57:15 ******/

SET ANSI_NULLS ON

GO

SET QUOTED_IDENTIFIER ON

GO

SET ANSI_PADDING ON

GO

CREATE TABLE [dbo].[DMOnlineProduto](

[IDAuto] [int] IDENTITY(1,1) NOT NULL,

[IDTempo] [int] NULL,

[Data] [datetime] NULL,

[Dia] [varchar](10) NULL,

[Semana] [varchar](2) NULL,

[DiaSemana] [varchar](10) NULL,

[Mes] [varchar](10) NULL,

[Trimestre] [varchar](1) NULL,

[Semestre] [varchar](1) NULL,

[Ano] [varchar](4) NULL,

[IDProduto] [int] NULL,

[NomeProduto] [nvarchar](max) NULL,

[FlagProdutoFinal] [nvarchar](max) NULL,

[TamanhoP] [nvarchar](max) NULL,

[TempoProducaoP] [int] NULL,

[SubCategoriaP] [nvarchar](max) NULL,

[CategoriaP] [nvarchar](max) NULL,

[LinhaP] [nvarchar](max) NULL,

[ClasseP] [nvarchar](max) NULL,

[EstiloP] [nvarchar](max) NULL,

[CorP] [nvarchar](max) NULL,

[ModeloP] [nvarchar](max) NULL,

[IDPromocao] [int] NULL,

[NomePromocao] [nvarchar](max) NULL,

[TipoProm] [nvarchar](max) NULL,

[CategoriaProm] [nvarchar](max) NULL,

[DiaInicioProm] [varchar](2) NULL,

[MesInicioProm] [varchar](2) NULL,

[AnoInicioProm] [varchar](4) NULL,

[DiaFimProm] [varchar](2) NULL,

[MesFimProm] [varchar](2) NULL,

Page 22: Tsg web mining

Tecnologias e Sistemas de Informação, Pós-laboral Etapa 6 Equipa 9

2

[AnoFimProm] [varchar](4) NULL,

[IDEncomenda] [int] NULL,

[DataEncomendaP] [datetime] NULL,

[DataEnvioP] [datetime] NULL,

[DataLimiteP] [datetime] NULL,

[Quantidade] [int] NULL,

[PrecoUnit] [float] NULL,

[Desconto] [float] NULL,

[TotalVenda] [float] NULL,

[NEncomenda] [int] NULL,

[NProduto] [int] NULL,

[DataEncomenda] [datetime] NULL,

[DataEnvio] [datetime] NULL,

[DataLimite] [datetime] NULL,

[IDTransporte] [int] NULL,

[TipoTransp] [nvarchar](max) NULL,

[IDClienteI] [int] NULL,

[NomeCliente] [nvarchar](max) NULL,

[ProvinciaCliente] [nvarchar](max) NULL,

[PaisCliente] [nvarchar](max) NULL,

[TerritorioCliente] [nvarchar](max) NULL,

[NDiasEntrega] [int] NULL,

[NDiasPrazo] [int] NULL,

[SubTotal] [float] NULL,

[VendaTotal] [float] NULL,

[TaxaEnvio] [float] NULL,

[Portes] [float] NULL,

[NVendasOnline] [int] NULL,

PRIMARY KEY CLUSTERED

(

[IDAuto] ASC

)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY

= OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]

) ON [PRIMARY]

GO

SET ANSI_PADDING OFF

GO

Page 23: Tsg web mining

Tecnologias e Sistemas de Informação, Pós-laboral Etapa 6 Equipa 9

3

CARREGAR DADOS PARA A TABELA DMONLINEPRODUTO

INSERT INTO [TSGDW].[dbo].[DMOnlineProduto]

([IDTempo]

,[Data]

,[Dia]

,[Semana]

,[DiaSemana]

,[Mes]

,[Trimestre]

,[Semestre]

,[Ano]

,[IDProduto]

,[NomeProduto]

,[FlagProdutoFinal]

,[TamanhoP]

,[TempoProducaoP]

,[SubCategoriaP]

,[CategoriaP]

,[LinhaP]

,[ClasseP]

,[EstiloP]

,[CorP]

,[ModeloP]

,[IDPromocao]

,[NomePromocao]

,[TipoProm]

,[CategoriaProm]

,[DiaInicioProm]

,[MesInicioProm]

,[AnoInicioProm]

,[DiaFimProm]

,[MesFimProm]

,[AnoFimProm]

,[IDEncomenda]

,[DataEncomendaP]

,[DataEnvioP]

,[DataLimiteP]

,[Quantidade]

,[PrecoUnit]

,[Desconto]

,[TotalVenda]

,[NEncomenda]

,[NProduto])

SELECT [IDTempo]

,[Data]

,[Dia]

,[Semana]

,[DiaSemana]

Page 24: Tsg web mining

Tecnologias e Sistemas de Informação, Pós-laboral Etapa 6 Equipa 9

4

,[Mes]

,[Trimestre]

,[Semestre]

,[Ano]

,[IDProduto]

,[NomeProduto]

,[FlagProdutoFinal]

,[TamanhoP]

,[TempoProducaoP]

,[SubCategoriaP]

,[CategoriaP]

,[LinhaP]

,[ClasseP]

,[EstiloP]

,[CorP]

,[ModeloP]

,[IDPromocao]

,[NomePromocao]

,[TipoProm]

,[CategoriaProm]

,[DiaInicioProm]

,[MesInicioProm]

,[AnoInicioProm]

,[DiaFimProm]

,[MesFimProm]

,[AnoFimProm]

,[IDEncomenda]

,[DataEncomendaP]

,[DataEnvioP]

,[DataLimiteP]

,[Quantidade]

,[PrecoUnit]

,[Desconto]

,[TotalVenda]

,[NEncomenda]

,[NProduto]

FROM [TSGDW].[dbo].[plVendasProduto]

GO

Page 25: Tsg web mining

Tecnologias e Sistemas de Informação, Pós-laboral Etapa 6 Equipa 9

5

ALTERAÇÃO DE DADOS NA TABELA DMONLINEPRODUTO

UPDATE [TSGDW].[dbo].[DMOnlineProduto]

SET [DataEncomenda] = (Select d.[DataEncomenda] From [TSGDW].[dbo].[plVendasOnline]

d

Where [TSGDW].[dbo].[DMOnlineProduto].[IDEncomenda] =

d.[IDEncomenda]),

[DataEnvio] = (Select d.[DataEnvio] From [TSGDW].[dbo].[plVendasOnline] d

Where [TSGDW].[dbo].[DMOnlineProduto].[IDEncomenda] =

d.[IDEncomenda]),

[DataLimite] = (Select d.[DataLimite] From [TSGDW].[dbo].[plVendasOnline] d

Where [TSGDW].[dbo].[DMOnlineProduto].[IDEncomenda] =

d.[IDEncomenda]),

[IDTransporte] = (Select d.[IDTransporte] From [TSGDW].[dbo].[plVendasOnline] d

Where [TSGDW].[dbo].[DMOnlineProduto].[IDEncomenda] =

d.[IDEncomenda]),

[TipoTransp] = (Select d.[TipoTransp] From [TSGDW].[dbo].[plVendasOnline] d

Where [TSGDW].[dbo].[DMOnlineProduto].[IDEncomenda] =

d.[IDEncomenda]),

[IDClienteI] = (Select d.[IDClienteI] From [TSGDW].[dbo].[plVendasOnline] d

Where [TSGDW].[dbo].[DMOnlineProduto].[IDEncomenda] =

d.[IDEncomenda]),

[NomeCliente] = (Select d.[NomeCliente] From [TSGDW].[dbo].[plVendasOnline] d

Where [TSGDW].[dbo].[DMOnlineProduto].[IDEncomenda] =

d.[IDEncomenda]),

[ProvinciaCliente] = (Select d.[ProvinciaCliente] From [TSGDW].[dbo].[plVendasOnline] d

Where [TSGDW].[dbo].[DMOnlineProduto].[IDEncomenda] =

d.[IDEncomenda]),

[PaisCliente] = (Select d.[PaisCliente] From [TSGDW].[dbo].[plVendasOnline] d

Where [TSGDW].[dbo].[DMOnlineProduto].[IDEncomenda] =

d.[IDEncomenda]),

[TerritorioCliente] = (Select d.[TerritorioCliente] From [TSGDW].[dbo].[plVendasOnline] d

Where [TSGDW].[dbo].[DMOnlineProduto].[IDEncomenda] =

d.[IDEncomenda]),

[NDiasEntrega] = (Select d.[NDiasEntrega] From [TSGDW].[dbo].[plVendasOnline] d

Where [TSGDW].[dbo].[DMOnlineProduto].[IDEncomenda] =

d.[IDEncomenda]),

[NDiasPrazo] = (Select d.[NDiasPrazo] From [TSGDW].[dbo].[plVendasOnline] d

Where [TSGDW].[dbo].[DMOnlineProduto].[IDEncomenda] =

d.[IDEncomenda]),

[SubTotal] = (Select d.[SubTotal] From [TSGDW].[dbo].[plVendasOnline] d

Where [TSGDW].[dbo].[DMOnlineProduto].[IDEncomenda] =

d.[IDEncomenda]),

[VendaTotal] = (Select d.[VendaTotal] From [TSGDW].[dbo].[plVendasOnline] d

Where [TSGDW].[dbo].[DMOnlineProduto].[IDEncomenda] =

d.[IDEncomenda]),

[TaxaEnvio] = (Select d.[TaxaEnvio] From [TSGDW].[dbo].[plVendasOnline] d

Where [TSGDW].[dbo].[DMOnlineProduto].[IDEncomenda] =

d.[IDEncomenda]),

Page 26: Tsg web mining

Tecnologias e Sistemas de Informação, Pós-laboral Etapa 6 Equipa 9

6

[Portes] = (Select d.[Portes] From [TSGDW].[dbo].[plVendasOnline] d

Where [TSGDW].[dbo].[DMOnlineProduto].[IDEncomenda] =

d.[IDEncomenda]),

[NVendasOnline] = (Select d.[NVendasOnline] From [TSGDW].[dbo].[plVendasOnline] d

Where [TSGDW].[dbo].[DMOnlineProduto].[IDEncomenda] =

d.[IDEncomenda])

GO