22
Data Mining Hênio Carlos Iessa Mota Mariana Caroline Costa Marcela Mayara Barbosa Nilton Rodrigues Pereira

Apresentação data mining

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: Apresentação data mining

Data Mining

Hênio Carlos Iessa Mota Mariana Caroline Costa Marcela Mayara Barbosa Nilton Rodrigues Pereira

Page 2: Apresentação data mining

• “Mineração de dados é a exploração e análise de

dados, por meios automáticos ou semiautomáticos, em

grandes quantidades de dados, com o objetivo de

descobrir regras ou padrões interessantes.”

Michael J. A. Berry; Gordon Linoff, “Data Mining Techiques for Marketing, Sales, and customer Support”; John Wiley & Sons, Inc., 1997.

Data Mining

Page 3: Apresentação data mining

Bancos de Dados

Limpeza (consistência, preenchimento de

informações, remoção de ruído e

redundâncias)

(Data Marts e Data Warehouses)

Um analista refina e conduz o processo até

que valiosos padrões apareçam.

Data Mining

Page 4: Apresentação data mining

Data Mining

Page 5: Apresentação data mining

Funcionalidade em Data Mining

Analise de Descritiva

Análise de Prognóstico

Funcionalidade em Data Mining

Page 6: Apresentação data mining

Funcionalidade em Data Mining

Page 7: Apresentação data mining

Técnicas de exploração de dados

• Técnicas de estatísticas

• Árvores de decisão

Técnicas de exploração de dados

Page 8: Apresentação data mining

Técnicas de exploração de dados

Árvores de decisão

Page 9: Apresentação data mining

Regras de associação

Técnicas de exploração de dados

Page 10: Apresentação data mining

Redes neurais artificiais

Técnicas de exploração de dados

Page 11: Apresentação data mining

Algoritmos Genéticos “Quanto melhor um indivíduo se adaptar ao seu

meio ambiente, maior será sua chance de sobreviver e gerar descendentes.”

(DARWIN, 1859)

Algoritmos Genéticos

Page 12: Apresentação data mining

Os Algoritmos Genéticos são uma classe de procedimentos, com passos distintos bem definidos.

Essa classe se fundamenta em analogias a conceitos biológicos já testadas à exaustão.

Cada passo distinto pode ter diversas versões diferentes.

Algoritmos Genéticos

Algoritmos Genéticos – O que são?

Page 13: Apresentação data mining

Busca e Otimização

Amplamente utilizados, com sucesso, em problemas de difícil manipulação pelas técnicas tradicionais

Eficiência X Flexibilidade

Algoritmos Genéticos

Algoritmos Genéticos – Para que servem?

Page 14: Apresentação data mining

Algoritmos Genéticos – Funcionamento Fundamental

1. Gerar População Inicial

2. Descartar uma parte dos Indivíduos menos aptos

3. Aplicar operadores de reprodução

4. Aplicar operadores de mutação

5. Se o critério de parada foi satisfeito, encerrar. Senão, voltar ao passo 2.

Algoritmos Genéticos

Page 15: Apresentação data mining

Algoritmos Genéticos - Desvantagens

Desvantagens:

Larga super produção de indivíduos;

Envolve enorme quantidade de energia e tempo;

Todo o processo parece ter pouco propósito, pois que o melhoramento das espécies depende do fator sorte

Algoritmos Genéticos

Page 16: Apresentação data mining

Algoritmos Genéticos - Vantagens

Vantagens:

Solidez e paralelismo inerente (o processo não fica preso em um local nem fica retido em soluções genéricas)

Algoritmos Genéticos

Page 17: Apresentação data mining

Algoritmos Genéticos – Aplicação

Alocação de tarefas

Configuração de sistemas complexos

Seleção de Rotas

Problemas de Otimização e de Aprendizagem de Máquina

Problemas cuja solução seja um estado final e não um caminho

Algoritmos Genéticos

Page 18: Apresentação data mining

Conclusão Data mininig é um processo que permite

compreender o comportamento dos dados

Pode ser bem aplicado em diversas áreas de negócios

Para que a mineração de dados seja bem sucedida é preciso, uma busca apropriada, analise e preparação dos dados encontrados

Data Mining

Page 19: Apresentação data mining

Exemplos Empresas de software para Data mining:

SAS http://www.sas.com

Information Havesting http://www.convex.com

Red Brick http://www.redbrick.com

Oracle http://www.oracle.com

Sybase http://www.sybase.com

Informix http://www.informix.com

IBM http://www.ibm.com

Page 20: Apresentação data mining

Ferramentas para Data Mining

Os softwares para data mining custam muito

caro (uma licença single-user pode custar

mais de 40.000 dólares).

Leia mais em: Data Mining – Novos Recursos nos Sistemas de Banco de Dados http://www.devmedia.com.br/data-mining-novos-recursos-nos-sistemas-de-banco-de-dados/5892#ixzz2Baq5JZfy

Data Mining

Page 21: Apresentação data mining

Referências Michael J. A. Berry; Gordon Linoff, “Data Mining Techiques for

Marketing, Sales, and customer Support”; John Wiley & Sons, Inc., 1997

http://www-pcc.qub.ac.uk/tec/courses/datamining

http://www.santafe.edu/~kurt

http://www.devmedia.com.br/data-mining-novos-recursos-nos-sistemas-de-banco-de-dados/5892#ixzz2Baq5JZfy

http://www.infoescola.com/informatica/data-mining/

http://amigonerd.net/trabalho/19327-data-mining

http://www.mackenzie.br/7589.html

Referências

Page 22: Apresentação data mining

ALGUMA PERGUNTA??? NÃO NÉ...

FIM