23
FACULDADES NDA – FACNET BACHARELADO EM SISTEMA DE INFORMAÇÃO SISTEMAS DISTRIUÍDOS PROFESSOR: GUSTAVO TURMA: E6 Lorena Mendonça Tavares Verônica Pereira da Silva Vinícius Magno Muniz Luiz Carlos Santana Paulo Tadeu Peres DATA MINING 3

245_Banco de Dados

Embed Size (px)

Citation preview

Page 1: 245_Banco de Dados

FACULDADES NDA – FACNETBACHARELADO EM SISTEMA DE INFORMAÇÃO

SISTEMAS DISTRIUÍDOSPROFESSOR: GUSTAVO

TURMA: E6

Lorena Mendonça TavaresVerônica Pereira da Silva

Vinícius Magno MunizLuiz Carlos SantanaPaulo Tadeu Peres

DATA MINING

Brasília2005

3

Page 2: 245_Banco de Dados

APRESENTAÇÃO

Atualmente, as organizações têm se mostrado extremamente eficientes em capturar, organizar e armazenar grandes quantidades de dados, obtidos de suas operações diárias ou pesquisas científicas, porém, ainda não usam adequadamente essa gigantesca montanha de dados para transformá-la em conhecimentos que possam ser utilizados em suas próprias atividades, sejam elas comerciais ou científicas.

A rápida taxa de inovação nas tecnologias de informática está exigindo que, cada vez mais, os profissionais estejam preparados e atualizados para conhecer e enfrentar os desafios da Tecnologia da Informação.

O conceito de Data Mining está se tornando cada vez mais popular como uma ferramenta de gerenciamento de informação, que deve revelar estruturas de conhecimento, que possam guiar decisões em condições de certeza limitada. Recentemente, tem havido um interesse crescente em desenvolver novas técnicas analíticas, especialmente projetadas para tratar questões relativas a Data Mining. No entanto, Data Mining ainda está baseado em princípios conceituais de Análise de Dados Exploratórios e de modelagem.

4

Page 3: 245_Banco de Dados

OBJETIVO

Apresentar o conceito, as principais funcionalidades, técnicas e ferramentas utilizados em Data Mining. Mostrar como essa tecnologia pode ajudar a extrair informações valiosas de grandes bases de dados e auxiliar no processo de tomada de decisão.

Demonstrar exemplos práticos que usando o processo de mineração de dados (Data Mining) de grandes bases foi capaz de levantar informações relevantes ao nível gerencial e a partir desta adiquirir a sabedoria/inteligênica.

5

Page 4: 245_Banco de Dados

ÍNDICE

INTRODUÇÃO 6

1 – Conceito de Data Mining 7

2 – Os Passos do Data Mining 7

3 – Níveis de Abstração 8

4 – Localizando Padrões 9

5 – Exemplo Prático 10

5.1 – Indução Orientada a Atributos 11

6 – Outras Técnicas 11

6.1 – Regras Caracterizadoras 12

6.2 – Regras Discriminantes 12

6.3 – Regras Associativas 12

6.4 – Regras de Evolução Temporal 13

7 – Algumas Aplicações 13

7.1 – Wal-Mart 13

7.2 – Bank of America 13

7.3 – Telecomunicações 13

7.4 – Administração em Alto Nível 14

7.5 – Medicina 14

7.6 – Vestibular PUC-RJ 14

7.7 – Governo 14

7.8 – Comércio 14

CONCLUSÃO 16

BIBLIOGRAFIA 17

ANEXO I 18

6

Page 5: 245_Banco de Dados

INTRODUÇÃO

Data Mining ou Mineração de Dados consiste em um processo analítico projetado para explorar grandes quantidades de dados (tipicamente relacionados a negócios, mercado ou pesquisas científicas), na busca de padrões consistentes e/ou relacionamentos sistemáticos entre variáveis e, então, validá-los aplicando os padrões detectados a novos subconjuntos de dados. O processo consiste basicamente em 3 etapas: exploração, construção de modelo ou definição do padrão e validação/verificação.

Data Mining é parte de um processo maior de conhecimento denominado Knowledge Discovery in Database – KDD (Descoberta de Conhecimento em Bases de Dados). Ele consiste, fundamentalmente, na estruturação do banco de dados; na seleção, preparação e pré-processamento dos dados; na transformação, adequação e redução da dimensionalidade dos dados; no processo de Data Mining; e nas análises, assimilações, interpretações e uso do conhecimento extraído do banco de dados, através do processo de Data Mining.

Talvez a definição mais importante de Data Mining tenha sido elaborada por Usama Fayyad:

"...o processo não-trivial de identificar, em dados, padrões válidos, novos, potencialmente úteis e ultimamente compreensíveis"

(Fayyad et al. 1996)

7

Page 6: 245_Banco de Dados

1 – Conceito de Data Mining

O grande volume de dados disponíveis cresce a cada dia e desafia a nossa capacidade de armazenamento, seleção e uso. Esta tecnologia com suas ferramentas permitem a "mineração" destes dados a fim de gerar um real valor do dado transformando-o em informação e conhecimento.

Esta tecnologia é formada por um conjunto de ferramentas que através do uso de algoritmos de aprendizado ou baseados em redes neurais e estatística, são capazes de explorar um grande conjunto de dados, extraindo destes conhecimento na forma de hipóteses e de regras. Diariamente as empresas acumulam diversos dados em seus bancos de dados, tornando-os verdadeiros tesouros de informação sobre os vários processos e procedimentos das funções da empresa, inclusive com dados e hábitos de seus clientes, suas histórias de sucesso e fracassos. Todos estes dados podem contribuir com a empresa, sugerindo tendências e particularidades pertinentes a ela e seu meio ambiente interno e externo, visando uma rápida ação de seus gestores.

Com a geração de informações e conhecimentos úteis para as empresas, os seus negócios podem dar mais lucratividade para as mesmas. Os recursos da Tecnologia da Informação, mais precisamente a capacidade do hardware e software disponíveis podem efetuar atividades em horas, o que tradicionalmente as pessoas levariam meses. Efetivamente o DM cumpre o papel de descoberta de conhecimentos.

Os sistemas tradicionais de processamento de transações on-line (OLTP) das empresas são ferramentas capazes de manipular dados de forma rápida, segura e efetiva em bancos de dados, mas que apresentam restrições para gerar informações com análises significativas. Estas restrições são melhores trabalhadas quando as empresas se utilizam da tecnologia de DM aliada à outras tecnologias, tais como, Knowledge Discovery in Databases (KDD), Database Marketing e Inteligência de Negócios (business intelligence).

A tecnologia Data Mining e seus recursos pode ser aplicada no funcionamento dos modelos de Sistemas de Informação Executivos, principalmente nos Sistemas de Informação Gerencial (SIG) e Estratégicos (SIE).

2 – Os Passos do Data Mining

Os passos fundamentais de uma mineração bem sucedida a partir de fontes de dados (bancos de dados, relatórios, logs de acesso, transações, etc) efetua-se uma limpeza (consistência, preenchimento de informações, remoção de ruído e redundâncias, etc). Disto nascem os repositórios organizados (Data Marts e Data Warehouses), que já são úteis de diversas maneiras. Veja na figura 01 o processo de descoberta do conhecimento a partir de uma aplicação de Data Mining.

8

Page 7: 245_Banco de Dados

FIGURA 01: Processo de Descoberta do Conhecimento em Base de Dados

Origem da figura: Site http://www.intelliwise.com/reports/i2002.htm

Mas é a partir deles que se pode selecionar algumas colunas para atravessarem o processo de mineração. Tipicamente, este processo não é o final da história: de forma interativa e frequentemente usando visualização gráfica, um analista refina e conduz o processo até que valiosos padrões apareçam. Observe que todo esse processo parece indicar uma hierarquia, algo que começa em instâncias elementares (embora volumosas) e terminam em um ponto relativamente concentrado, mas muito valioso.

Este é um conceito importante. Encontrar padrões requer que os dados brutos sejam sistematicamente "simplificados" de forma a desconsiderar aquilo que é específico e privilegiar aquilo que é genérico. Faz-se isso porque não parece haver muito conhecimento a extrair de eventos isolados. Uma loja de sua rede que tenha vendido a um cliente em particular uma quantidade impressionante de um determinado produto em uma única data pode apenas significar que esse cliente em particular procurava grande quantidade desse produto naquele exato momento. Mas isso provavelmente não indica nenhuma tendência de mercado.

Em outras palavras, não há como explorar essa informação em particular para que no futuro a empresa lucre mais. Apenas com conhecimento genérico é que isto pode ser obtido. Por essa razão devemos, em Data Mining, controlar nossa vontade de "não perder dados". Para que o processo dê certo, é necessário sim desprezar os eventos particulares para só manter aquilo que é genérico.

3 – Níveis de Abstração

Assim como um organismo vivo, as empresas recebem informação do meio ambiente e também atuam sobre ele. Durante essas atividades, é necessário distinguir vários níveis de informação. A figura 02 apresenta a tradicional pirâmide da informação,

9

Page 8: 245_Banco de Dados

onde se pode notar o natural aumento de abstração conforme subimos de nível.

FIGURA 02: Pirâmide da Informação

Origem da figura: Site http://www.intelliwise.com/reports/i2002.htm

Traduzido para uma empresa atual, esse a pirâmide da informação pode ser apresentada como na figura 03 abaixo. O fundamental a se perceber neste diagrama é a sensível redução de volume que ocorre cada vez que subimos de nível. Essa redução de volume é uma natural conseqüência do processo de abstração.

FIGURA 03: Refinamento dos dados na tomada de decisão

Origem da figura: Site http://www.intelliwise.com/reports/i2002.htm

10

Page 9: 245_Banco de Dados

Abstrair, no sentido que usamos aqui, é representar uma informação através de correspondentes simbólicos e genéricos. Este ponto é importante: como acabamos de ver, para ser genérico, é necessário "perder" um pouco dos dados, para só conservar a essência da informação. O processo de Data Mining localiza padrões através da judiciosa aplicação de processos de generalização, algo que é conhecido como indução.

4 – Localizando Padrões

Padrões são unidades de informação que se repetem, ou então são seqüências de informações que dispõe de uma estrutura que se repete. A tarefa de localizar padrões não é privilégio do Data Mining. Nosso cérebro utiliza-se de processos similares, pois muito do conhecimento que temos em nossa mente é, de certa forma, um processo que depende da localização de padrões. Por essa razão, muito do que se estuda sobre o cérebro humano também pode nos auxiliar a entender o que deve ser feito para localizar padrões. Mas o que é mesmo localizar padrões? O que é indução? Para exemplificar esses conceitos, proponho um breve exercício de uma indução de regras abstratas. Nosso objetivo é tentar obter alguma expressão genérica para a seguinte seqüência:

Seqüência original: ABCXYABCZKABDKCABCTUABEWLABCWO

Observe atentamente essa seqüência de letras e tente encontrar alguma coisa relevante. Veja algumas possibilidades:

Passo 1: A primeira etapa é perceber que existe uma seqüência de letras que se repete bastante. Encontramos as seqüências "AB" e "ABC" e observamos que elas ocorrem com freqüência superior à das outras seqüências.

Passo 2: Após determinarmos as seqüências "ABC" e "AB", verificamos que elas segmentam o padrão original em diversas unidades independentes:

"ABCXY""ABCZK""ABDKC""ABCTU""ABEWL""ABCWO"

Passo 3: Fazem-se agora induções, que geram algumas representações genéricas dessas unidades:

"ABC??" "ABD??" "ABE??" e "AB???",onde '?' representa qualquer letra

No final desse processo, toda a seqüência original foi substituída por regras genéricas indutivas que simplificou (reduziu) a informação original a algumas expressões simples. Esta explicação é um dos pontos essenciais do Data Mining, como se pode fazer para extrair certos padrões de dados brutos. Contudo, mais importante do que simplesmente obter essa redução (compressão) de informação, esse processo nos permite gerar formas de predizer futuras ocorrências de padrões. Este é exatamente o ponto onde este processo começa a mostrar o seu valor.

11

Page 10: 245_Banco de Dados

5 – Exemplo Prático

Existem muitas técnicas utilizadas pelo Data Mining, muitas delas desenvolvidas na disciplina Aprendizado de Máquina (Machine Learning, veja, por exemplo, Mitchell 1997).

Vamos observar aqui apenas um pequeno exemplo prático do que podemos utilizar com as expressões abstratas genéricas que obtivemos. Uma dessas expressões nos diz que toda vez que encontramos a seqüência "AB", podemos inferir que iremos encontrar mais três caracteres e isto completaria um "padrão". Nesta forma abstrata ainda pode ficar difícil de perceber a relevância deste resultado. Por isso vamos usar uma representação mais próxima da realidade.

Imagine que a letra 'A' esteja representando um item qualquer de um registro comercial. Por exemplo, a letra 'A' poderia significar "aquisição de pão" em uma transação de supermercado. A letra 'B' poderia, por exemplo, significar "aquisição de leite". A letra 'C' é um indicador de que o leite que foi adquirido é do tipo desnatado. É interessante notar que a obtenção de uma regra com as letras "AB" quer dizer, na prática, que toda vez que alguém comprou pão, também comprou leite. Esses dois atributos estão associados e isto foi revelado pelo processo de descoberta de padrões.

Esta associação já nos fará pensar em colocar "leite" e "pão" mais próximos um do outro no supermercado, pois assim estaríamos facilitando a aquisição conjunta desses dois produtos. Mas a coisa pode ir além disso, bastando continuar nossa exploração da indução.

5.1 – Indução Orientada a Atributos

Suponha que a letra X queira dizer "manteiga sem sal", e a letra 'Z' signifique "manteiga com sal". A letra 'T' poderia significar "margarina". Parece que poderíamos tentar unificar todas essas letras através de um único conceito, uma idéia que resuma uma característica essencial de todos esses itens. Introduzimos a letra 'V', que significaria "manteiga/margarina", ou "coisas que passamos no pão". Fizemos uma indução orientada a atributos, substituímos uma série de valores distintos (mas similares) por um nome só.

Ao fazer isso estamos perdendo um pouco das características dos dados originais. Após essa transformação, já não sabemos mais o que é manteiga e o que é margarina. Essa perda de informação é fundamental na indução e é um dos fatores que permite o aparecimento de padrões mais gerais.

Qual a vantagem de assim proceder? Basta codificar a seqüência original substituindo a letra V em todos os lugares devidos. Assim fica essa seqüência transformada:

ABCVYABCVKABDKCABCVUABEWLABCVO

Daqui, o sistema de Data Mining irá extrair, entre outras coisas, a expressão "ABCV", que irá revelar algo muito interessante:

12

Page 11: 245_Banco de Dados

A maioria dos usuários que adquiriram pão e leite desnatado também adquiriram manteiga ou margarina.

De posse desta regra, fica fácil imaginar uma disposição nas prateleiras do supermercado para incentivar ainda mais este hábito. Em linguagem mais lógica, pode-se dizer que pão e leite estão associados (implicam) na aquisição de manteiga:

Pão, Leite Þ Manteiga

O lado da esquerda desta expressão (Pão, Leite) é chamado de Antecedente, e o lado da direita de Conseqüente.

6 – Outras Técnicas

Introduzimos os exemplos anteriores apenas para dar uma idéia do tipo de pensamento que está por trás da mineração de dados. Faz-se certas induções e descobre-se alguns padrões. Vamos agora ver algumas outras técnicas que se utilizam de princípios similares.

6.1 – Regras Caracterizadoras

Obtém-se regras que caracterizam um conceito satisfeito por todos (ou pela maioria) dos exemplos disponíveis. Assim, é possível descobrir formas de sumarizar certas características que podem revelar padrões nos dados. Exemplos:

a. Sintomas de uma doença específica podem ser sumarizados por uma regra caracterizadora

b. Geração de regras que caracterizem quais os estudantes de graduação que se decidiram por prosseguir com uma carreira acadêmica (MBA, doutorado).

6.2 – Regras Discriminantes

Neste caso, o que se almeja é obter regras que discriminem (separem) um conceito alvo em relação a outros conceitos (classes contrastantes). Exemplo:

a. Para distinguir uma doença, procura-se por regras que sumarizem as características que separam esta doença das outras.

b. Tenta-se achar as regras que discriminem uma loja bem sucedida de várias outras não tão bem sucedidas.

6.3 – Regras Associativas

Nesta procura-se estabelecer regras que interliguem um conceito a outro. A utilidade deste procedimento é muito grande, conforme pode ser visto nos exemplos

13

Page 12: 245_Banco de Dados

abaixo:

a. Achar todas as regras que tenham "coca-cola dietética" como conseqüentes. Isto irá auxiliar no planejamento de lojas para vender melhor este produto (privilegiam-se os antecedentes dessas regras).

b. Achar todas as regras que tenham "iogurte" no antecedente. Isto irá auxiliar na determinação do impacto nas receitas, caso este produto seja retirado das prateleiras.

c. Achar todas as regras com "salsicha" no antecedente e "mostarda" no conseqüente. Isto irá auxiliar na obtenção de melhores regras para determinar quais os itens que devem ser vendidos em conjunto com salsichas para aumentar as vendas de mostarda.

6.4 – Regras de Evolução Temporal

Aqui a preocupação é detectar associações entre itens ao longo do tempo. Descobre-se padrões de compras após um evento inicial de aquisição. Exemplos:

a. Consumidor comprou um PC hoje, irá comprar um DVD-ROM em 6 meses. Isto permite que se faça uma oferta desse produto a todos os que estão nesta situação.

b. Um consumidor adquiriu um videocassete, em 4 meses terá muita probabilidade de comprar uma camcorder. Faz-se uma promoção especial para estes clientes.

7 – Algumas Aplicações

7.1 – Wal-Mart

Embora recente, a história do data mining já tem casos bem conhecidos. O mais divulgado é o da cadeia americana Wal-Mart, que identificou um hábito curioso dos consumidores. Há cinco anos, ao procurar eventuais relações entre o volume de vendas e os dias da semana, o software de data mining apontou que, às Sextas-feiras, as vendas de cervejas cresciam na mesma proporção que as de fraldas. Crianças bebendo cerveja? Não, uma investigação mais detalhada revelou que, ao comprar fraldas para seus bebês, os pais aproveitavam para abastecer o estoque de cerveja para o final de semana.

7.2 – Bank of America

Há quem consiga detectar fraudes, cortar gastos ou aumentar a receita da empresa. O Bank of America usou essas técnicas para selecionar entre seus 36 milhões de clientes aqueles com menor risco de dar calote num empréstimo. A partir desses relatórios, enviou cartas oferecendo linhas de crédito para os correntistas cujos filhos tivessem entre 18 e 21 anos e, portanto, precisassem de dinheiro para ajudar os filhos a

14

Page 13: 245_Banco de Dados

comprar o próprio carro, uma casa ou arcar com os gastos da faculdade. Resultado: em três anos, o banco lucrou 30 milhões de dólares.

7.3 – Telecomunicações

Atualmente, em telecomunicações, existe uma explosão nos crimes contra a telefonia celular, dentre os quais, a clonagem. Técnicas de data mining podem ser utilizadas para detectar hábitos dos usuários de celulares. Quando um telefonema for feito e considerado pelo sistema como uma excessão, o programa faz uma chamada para confirmar se foi ou não uma tentativa de fraude.

7.4 – Administração em Alto Nível

Depois do final da segunda guerra mundial a Pesquisa Operacional (P0) apareceu como ferramenta fundamental para a vitória das tropas contra as potências do eixo. Com a pesquisa operacional foi possível resolver matematicamente o problema de alocação ótima de recursos e isto vem sendo utilizado com grande sucesso em altos níveis de decisão até o presente momento. Cerca de cinqüenta anos depois, apareceu o data mining. Suas potencialidades estão longe de serem imaginadas e não seria ousado esperar que no mundo globalizado possa vir a dar seus frutos como a PO deu no passado.

7.5 – Medicina

Atualmente as técnicas de data mining são pouco usadas em medicina. No momento, o ponto que está emperrando o uso de data mining é o fato de que data mining, sendo uma nova concepção dirigida para pesquisa ainda é quase completamente desconhecida da comunidade médica. Ora, se existem dados clínicos abundantes, estes dados são frequentemente adequados a um estudo de data mining por não conterem dados que aparentemente são inúteis mas que são exatamente os que o pesquisador de data mining procura.

7.6 – Vestibular PUC-RJ

Utilizando as técnicas de data mining, um programa de obtenção de conhecimento depois de examinar milhares de alunos forneceu a seguinte regra: se o candidato é do sexo feminino, trabalha e teve aprovação com boas notas, então não efetiva matrícula. Estranho, ninguém havia pensado nisso... mas uma reflexão justifica a regra oferecida pelo programa: de acordo com os costumes do Rio de Janeiro, uma mulher em idade de vestibular, se trabalha é porque precisa, e neste caso deve ter feito inscrição para ingressar na universidade pública gratuita. Se teve boas notas provavelmente foi aprovada na universidade pública onde efetivará matrícula. Claro que há exceções: pessoas que moram em frente à PUC, pessoas mais velhas, de alto poder aquisitivo e que voltaram a estudar por outras razões que ter uma profissão, etc. Mas a grande maioria obedece à regra anunciada!

15

Page 14: 245_Banco de Dados

16

Page 15: 245_Banco de Dados

7.7 – Governo

O governo dos EUA se utiliza do data mining já há bastante tempo para identificar padrões de transferências de fundos internacionais que se parecem com lavagem de dinheiro do narcotráfico. Data mining usado para identificar fraudes.

7.8 – Comércio

Supermercados apresentam ofertas aos clientes que se cadastram, fornecendo informações importantes sobre suas vidas financeiras e preferências. A partir de então, esses dados são cruzados com suas compras mês a mês e as informações sobre compras casadas e nível de consumo são utilizadas para organizar as prateleiras de melhor forma a propiciar compras casadas, além de oferecer brindes e descontos personalizados. Esses supermercados vendem suas informações para que outras empresas façam propaganda e ofertas apropriadas paras os clientes cujos dados foram minerados.

Com dados de clientes, é possível definir hábitos de consumo e prever necessidades de outras classes sociais em outras cidades (community knowledge). Por exemplo, podemos realizar uma pesquisa como perguntar ao cliente que tipo de filmes e músicas ele gosta e, baseado nesses dados, extrapolar e classificá-lo em certa categoria de consumo e preferência. A partir daí, ofertas podem ser dirigidas a ele, pois seu perfil está enquadrado pelo data mining. Vendas cruzadas podem ser realizadas com facilidade se um banco de dados com informações sobre o passado do cliente existir. Sabendo das necessidades e gostos do cliente, novos produtos podem ser oferecidos pela empresa, mantendo a fidelidade do cliente que não precisa ir buscar o produto em outro local.

Devido a competição empresarial, clientes mudam de empresa com facilidade. O data mining pode ser usado para verificar por que os clientes trocam um empresa por outra e oferecer serviços, vantagens e ofertas que evitam essa fuga de clientes. Com o data mining, pode-se localizar que oferta fazer a que cliente para mantê-lo na empresa, ou mesmo localizar os clientes que podem sair da empresa sem representar prejuízo.

17

Page 16: 245_Banco de Dados

CONCLUSÃO

O principal objetivo desse trabalho foi expor o conceito de Data Mining e o que ele pode oferecer as empresas na tomada de decisão. É importante notar que em praticamente todos esses casos o que se deseja é descobrir padrões em volumes de dados e ressaltar que o Data Mining não é o final da atividade de descoberta de conhecimentos, mas é tão somente o início. É imprescindível dispor de analistas capacitados que saibam interagir com os sistemas de forma a conduzi-los para uma extração de padrões úteis e relevantes.

18

Page 17: 245_Banco de Dados

BIBLIOGRAFIA

Fayyad, U.M.,G.Piatetsky-Shapiro,P.Smyth.Knowledge Discovery and Data Mining: Towards a Unifying Framework. Proceeding of the Second International Conference on Knowledge Discovery and Data Mining (KDD-96), Portland, Oregon, august, 1996.

Mitchell, Tom (1997) Machine Learning. New York: McGraw-Hill. Series in Computer Science, 1997. 414p.

Machado, Sérgio Jurandyr. Data Mining e os Limites da Contabilidade Pública Gerencial. Brasília: ESAF, 2002. 42 p. Monografia não premiada, apresentada no VII Prêmio Tesouro Nacional - 2002, Tributação, Orçamentos e Sistemas de Informação sobre a Administração Financeira Pública. Disponível em: <http://www.stn.fazenda.gov.br/Premio_TN/VIIPremio/catalogo.htm#sergio_machado>. Acessado em 11/11/2005.

Data Mining, Inteligência Artificial e Data Mining. Disponível em: <http://www.utp.br/informacao/si/si_intelig%C3%AAncia%20artificial%20e%20data%20mining.htm>. Acessado em 11/11/2005.

Navega, Sérgio - Princípios Essenciais do Data Mining, Publicado nos Anais do Infoimagem 2002, Cenadem Novembro 2002. Disponível em: <http://www.intelliwise.com/reports/i2002.htm>. Acessado em 11/11/2005.

Souza, Michel - Colunista semanal. Artigo: Data Mining de, quinta-feira, 30 de outubro de 2003. Disponível em: <http://www.imasters.com.br/artigo.php?cn=1482&cc=59>. Acessado em 11/11/2005.

Entrevista exclusiva com Alessandro Zanasi. Disponível em: <http://www.planeta.coppe.ufrj.br/artigo.php?artigo=363>. Acessado em 11/11/2005.

OLIVEIRA, Aracele Garcia de e GARCIA, Denise Ferreira - Mineração da Base de Dados de um Processo Seletivo Universitário, UNIFOR/MG – Centro Universitário de Formiga, ICSAE - Instituto de Ciências Sociais Aplicadas e Exatas, Formiga – MG 6p. Disponível em: <www.dcc.ufla.br/infocomp/artigos/v3.2/art07.pdf>. Acessado em: 11/11/2005.

CARVALHO, Luís Alfredo Vidal de – Data Mining – Ed. Ciência Moderna – RJ 2005

GOLDSCHIMIDT, Ronaldo – Data Mining: Um Guia Prático – Ed. Campus

19