Weka – Ferramenta Livre para Mineração de Dados

Embed Size (px)

Citation preview

  1. 1. Weka Ferramenta Livre para Minerao de Dados Acadmico: Rubem Ventura
  2. 2. Agenda O que Weka? Introduo Vantagens de Weka Sistemas Operacionais O Livro da Weka Alguns Algortimos Formato .ARFF Weka Explorer
  3. 3. O que Weka?
  4. 4. O que Weka? Weka um Software livre do tipo open source para minerao de dados, desenvolvido em Java, dentro das especificaes da GPL (General Public License).
  5. 5. Introduo Desenvolvido por um grupo de pesquisadores da Universidade de Waikato, Nova Zelndia em 1993. Sigla WEKA(Waikato Environment for Knowledge Analysis) criada por Geoff Holmes . Em 1997, foi tomada a deciso de reconstruir Weka do zero em Java, incluindo implementaes de algoritmos de modelagem.
  6. 6. Introduo Em 2005, Weka recebeu o SIGKDD Data Mining e o prmio de servio de descoberta de conhecimento. Em 2006, Pentaho Corporation adquiriu a licena exclusiva para usar o Weka para business intelligence. Forma a minerao de dados e a componente de anlise preditiva da sute Pentaho de inteligncia empresarial. Verso Atual: 3.7.12
  7. 7. Introduo Seu ponto forte a tarefa de classificao, mas tambm capaz de minerar regras de associao e clusters de dados. Pode ser utilizada no modo console ou atravs da interface grfica Weka Explorer. Ao longo dos anos se consolidou como a ferramenta de data mining mais utilizada em ambiente acadmico.
  8. 8. Vantagens de Weka Software Livre. Portabilidade. Uma coleo completa de dados de pr- processamento e tcnicas de modelagem. Facilidade de utilizao com sua interfaces grficas de usurio.
  9. 9. Sistemas Operacionais Windows x86 Mac OS X Linux Link para Download http://www.cs.waikato.ac.nz/ml/weka/downloading.html
  10. 10. O Livro da Weka As caractersticas da Weka e as tcnicas nela implementadas so apresentadas no livro Data Mining: Practical Machine Learning Tools and Techniques. Os autores do livro so os idealizadores da ferramenta.
  11. 11. Alguns Algortimos Aprendizagem de mquina Classificao baseados em redes neurais Estatstica Outros
  12. 12. Formato .ARFF Um arquivo no formato .ARFF um arquivo de texto puro, composto de trs partes: Relao Atributos Dados
  13. 13. Formato .ARFF %comentrio @relation pessoa @attribute sexo {M,F} @attribute idade real @attribute doente {sim, no} @data M,17,no F,15,sim M,25,nao F,18,nao M,22,sim
  14. 14. Weka Explorer Interface grfica que permite a execuo dos algoritmos de data mining da Weka de forma interativa.
  15. 15. Weka Explorer Interface
  16. 16. Onde conseguir mais informaes? http://weka.pentaho.com/ http://www.cs.waikato.ac.nz/ml/weka/ Minerao de Dados - Conceitos, Aplicaes e Experimentos com Weka http://www.lbd.dcc.ufmg.br/colecoes/erirjes/2004/004.pdf Stio da IBM Minerao de dados com WEKA, Parte 1: Introduo e regresso http://www.ibm.com/developerworks/br/opensource/library/os-weka1/ Minerao de dados com o WEKA, Parte 2: Classificao e armazenamento em cluster http://www.ibm.com/developerworks/br/opensource/library/os-weka2/
  17. 17. Consideraes finais Weka uma ferramenta Flexvel Diversos Algortimos Permite a descoberta de conhecimento tanto via interface com o usurio quanto embutida na aplicao do desenvolvedor. Pode ser utilizada no somente para Data Mining.
  18. 18. Referncias Weka 3 - Data Mining with Open Source Machine Learning Software in Java Ian H. Witten; Eibe Frank; Mark A. Hall (2011). "Data Mining: Practical machine learning tools and techniques, 3rd Edition"
  19. 19. Obrigado =)