Download pdf - Prova_MD

Transcript
  • UNIVERSIDADE FEDERAL DE OURO PRETO

    DEPARTAMENTO DE COMPUTAO

    MINERAO DE DADOS BCC444

    Aluno: Prova de BCC444

    Professor: Luiz Merschmann Data: 01/07/2014

    Curso: Cincia da Computao Turno: Diurno Perodo: Valor: 10 Nota:Instrues: 1) A prova dever ser realizada sem qualquer tipo de consulta.2) No ser permitido o uso de calculadora.3) proibido o emprstimo de material (lpis, borracha, caneta etc.) durante a realizao da prova.4) Todo o raciocnio realizado deve ser demonstrado na prova.5) A interpretao das questes faz parte da prova.6) Todas as questes da prova tm o mesmo valor (0,625).

    QUESTES

    Marque V se a afirmao for verdadeira ou F se ela for falsa. Caso a afirmao seja marcada como falsa, reescreva-a fazendo todas as correes necessrias para que ela se torne verdadeira.

    1) ( ) Uma regra de associao representa um padro de relacionamento entre itens de dados do domnio da aplicao que ocorre com uma determinada frequncia numa base de dados.2) ( ) A regresso considerada uma tarefa preditiva. Seu objetivo prever o valor do atributo classe a partir de um conjunto de valores de atributos conhecidos (atributos preditores). O conjunto de possveis classes discreto e pr-definido.3) ( ) Algoritmos de clusterizao podem ser utilizados na etapa de pr-processamento de dados para reduo do volume de dados.4) ( ) A discretizao uma tarefa de pr-processamento que tem como objetivo colocar os valores de um atributo numa faixa de valores pr-especificada.5) ( ) A seleo de atributos tornou-se um importante tpico de pesquisa com o surgimento de bases de dados contendo muitos atributos. Nesse cenrio, Best-First uma heurstica gulosa utilizada na avaliao individual de atributos com objetivo de se definir um bom subconjunto de atributos.6) ( ) Na abordagem de seleo de atributos denominada wrapper cada atributo preditivo da base de dados avaliado individualmente de acordo com sua correlao com o atributo classe. A partir dessa avaliao seleciona-se os k atributos com as melhores avaliaes.7) ( ) Em seleo de atributos, um atributo completamente irrelevante (quando avaliado individualmente) pode contribuir para melhoria do desempenho do classificador quando utilizado em conjunto com outros atributos.8) ( ) O fator de confiana de uma regra X -> Y pode ser alto simplesmente porque o consequente da regra muito frequente na base de dados.9) ( ) O algoritmo Apriori considera a seguinte propriedade com o objetivo de diminuir o espao de busca: todo conjunto que contm um subconjunto frequente tambm frequente.10) ( ) Na estratgia do algoritmo Partition, a base de dados lida apenas duas vezes. J na estratgia do Apriori, a base de dados lida em cada uma das k iteraes.11) ( ) O ID3 um algoritmo (guloso) utilizado para construir rvores de deciso. Ele um algoritmo recursivo que utiliza uma abordagem de diviso e conquista. Para que ele possa ser utilizado, todos os atributos devem conter valores normalizados.

  • 12) ( ) A tcnica redes Bayesianas assume que o efeito do valor de um atributo sobre uma determinada classe independente dos valores dos demais atributos.13) ( ) O leave-one-out simplesmente uma n-validao cruzada, onde n o nmero de instncias da base de dados.14) ( ) A curva ROC mostra o trade-off entre a taxa de verdadeiros positivos e a taxa de falsos negativos de um classificador.15) ( ) O k-means um algoritmo de clusterizao que pertence categoria dos mtodos de particionamento. Ele cria uma decomposio hierrquica a partir de uma base de dados D com n objetos. 16) ( ) Em clusterizao, para os mtodos baseados em densidade, o tempo de processamento independe do nmero de objetos de dados da base. Ele depende somente do nmero de clulas em que o espao de objetos foi dividido.