Download pdf - Mineração de Dados no Senso Escolar

Transcript

Page 1: Mineração de Dados no Senso Escolar

Mineração de Dados do Censo Escolar

Gustavo Carvalho, Helder Santana, Thiago Silva

Page 2: Mineração de Dados no Senso Escolar

Resumo

1. O Trabalho;

2. Pré-processamento;

3. Processamento;

4. Análise;

5. Regras Geradas;

6. Conclusão;

Page 3: Mineração de Dados no Senso Escolar

Pré-processamento

● Dados heterogêneos;

● 2007 à 2011 várias semelhanças;

● Unificação das bases:○ 2009 como ponto de partida;

○ Remoção de atributos pouco participativos;

○ Problemas:

■ ID_QUADRA_ESPORTES;

■ ID_AGUA_FILTRADA;

Page 4: Mineração de Dados no Senso Escolar

Pré-processamento

● Tratamento de atributos:○ Exclusão:

■ DT_ANO_LETIVO_(INICIO & TERMINO);

■ FK_COD_LINGUA_INDIGENA;

■ ID_CONVENIADA_PP;

■ ID_DEPENDENCIAS_OUTRAS;

■ ID_ESP_MEDIO_*(Todos os 4);

■ PK_COD_ENTIDADE & FK_COD_ESTADO;

Obs.: Atributo DESC_CATEGORIA_ESCOLA_PRIVADA não foi excluído.

Page 5: Mineração de Dados no Senso Escolar

Pré-processamento

● Tratamento de atributos:○ Categorização:

■ NUM_COMP_ADMINISTRATIVOS;

■ NUM_COMP_ALUNOS;

■ NUM_COMPUTADORES;

■ NUM_FUNCIONARIOS;

■ NUM_SALAS_EXISTENTES;

■ NUM_SALAS_UTILIZADAS;

Page 6: Mineração de Dados no Senso Escolar

Processamento

● Filter “NumericToNominal”;

● Demora de gerar resultados ou loop infinito;

● Regras apenas com valores 0 ⇒

substituição de 0 por vazio;

● Redução do escopo para apenas 2011;

● Várias execuções removendo cada vez mais

atributos;

Page 7: Mineração de Dados no Senso Escolar

Análise

● Regras ordenadas pelas medidas de avaliação;

● “Qualidade” avaliada pelo conhecimento do domínio;

● Regras óbvias foram excluídas;

Page 8: Mineração de Dados no Senso Escolar

Regras GeradasID_LOCALIZACAO_DIFERENCIADA=0 ⇒ DESC_SITUACAO_FUNCIONAMENTO=1

(25301) (25301) conf:(1)

“Se a localização não for diferenciada então a escola está em funcionamento.”

Talvez escolas que não estejam em atividades não participaram do censo. Caso contrário, grande parte das escolas estão funcionando.

ID_LOCALIZACAO_DIFERENCIADA:0 - Nao se aplica1 - Area de assentamento2 - Terra indıgena3 - Area remanescente de quilombos

DESC_SITUACAO_FUNCIONAMENTO:1 - EM ATIVIDADE2 - PARALISADA3 - EXTINTA4 - EXTINTA NO ANO ANTERIOR

Page 9: Mineração de Dados no Senso Escolar

Regras Geradas

Mais sobre localização diferenciada:● ID_LIXO_COLETA_PERIODICA=1 (23731) ⇒ ID_LOCALIZACAO _DIFERENCIADA=0 (23573) conf:(0.99);● ID_EQUIP_TV=1 (24633) ⇒ ID_LOCALIZACAO_DIFERENCIADA=0 (24322) conf:(0.99) ;● ID_EQUIP_DVD=1 (24158) ⇒ ID_LOCALIZACAO_DIFERENCIADA=0 (23865) conf:(0.99);● ID_COZINHA=1 ID_EQUIP_DVD=1 (23595) ⇒ ID_LOCALIZACAO _DIFERENCIADA=0 (23308) conf:(0.99);● ID_COMPUTADORES=1 (23320) ⇒ ID_LOCALIZACAO _DIFERENCIADA=0 (23034) conf:(0.99);

Axioma da lógica clássica:

Logo, escolas em localização diferenciada aparentemente possuem deficiência nas estruturas/equipamentos citados. Entretanto, o suporte é muito baixo.

Page 10: Mineração de Dados no Senso Escolar

Regras Geradas● DESC_SITUACAO_FUNCIONAMENTO=1 (25761) ⇒ ID_AGUA _INEXISTENTE=0 ID_ESGOTO_INEXISTENTE=0

(25505) conf:(0.99);● DESC_SITUACAO_FUNCIONAMENTO=1 (25761) ⇒ ID_ENERGIA _INEXISTENTE=0 (25673) conf:(1);● ID_ENERGIA_INEXISTENTE=0 (25673) ⇒ DESC_SITUACAO _FUNCIONAMENTO=1 (25673) conf:(1);● DESC_SITUACAO_FUNCIONAMENTO=1 (25761) ⇒ ID_ENERGIA _OUTROS=0 (25687) conf:(1);● ID_ENERGIA_OUTROS=0 (25687) ⇒ DESC_SITUACAO _FUNCIONAMENTO=1 (25687) conf:(1);● DESC_SITUACAO_FUNCIONAMENTO=1 (25761) ⇒ ID_EQUIP_TV=1 (24633) conf:(0.96);● DESC_SITUACAO_FUNCIONAMENTO=1 (25761) ⇒ ID_COZINHA=1 (24630) conf:(0.96);● DESC_SITUACAO_FUNCIONAMENTO=1 (25761) ⇒ ID_EQUIP_DVD=1 (24158) conf:(0.94);

Todas as escolas em funcionamento possui água, esgoto e energia elétrica. A maioria possui cozinha, TV e DVD.

Page 11: Mineração de Dados no Senso Escolar

Regras Geradas● ID_LABORATORIO _CIENCIAS=0 (27004) ⇒ ID_SALA_LEITURA=0

(24240) conf:(0.9);○ Indica prioridade de sala de leitura sobre laboratório de ciências;

● ID_ALIMENTACAO=1 (22808) ⇒ ID_COZINHA=1 (22467) conf:(0.99);○ Refeições produzidas na própria escola;

● ID_COMPUTADORES=1 (23320) ⇒ ID_EQUIP_TV=1 (22929) conf:(0.98);○ Indica prioridade de TV sobre computadores;

● ID_LIXO_QUEIMA=0 (23420) ⇒ ID_LIXO_COLETA_PERIODICA=1 (22914) conf:(0.98);○ Se a escola não queima o lixo então possui coleta periódica.

Page 12: Mineração de Dados no Senso Escolar

Conclusão

● Mineração de dados é também tentativa e erro, o que torna o processo cíclico;

● Pouco tempo disponível, demora para gerar regras e pouca experiência dificultou a geração de regras relevantes;

● Grande maioria das escolas (do sul) possui infraestrutura básica (água, energia, esgoto…) exceto aquelas em localização diferenciada.

Page 13: Mineração de Dados no Senso Escolar

Referências1. de Vasconcelos, Lívia Maria Rocha, and Cedric Luiz de Carvalho. "Aplicação de Regras de

Associação para Mineração de Dados na Web." Brasil, Universidade Federal do Rio Grande do Sul (2004): 11-14.

2. Brusso, M. J. Access Miner: Uma proposta para a Extração de Regras de Associação Aplicada à Mineração do Uso da Web. Master’s thesis, PPGC da UFRGS, Porto Alegre - RS, 2000.

3. Data Mining na Prática: Regras de Associação. Mauro Pichiliani. 2008.4. Pang-Ning, Tan, Michael Steinbach, and Vipin Kumar. "Introduction to data mining." WP Co

(2006).5. Azevedo, Paulo J., and Alípio M. Jorge. "Comparing rule measures for predictive association

rules." Machine Learning: ECML 2007. Springer Berlin Heidelberg, 2007. 510-517.6. Mattos, Guilherme. L. M. “Medidas de interesse de regras associativas: estudo de caso com dados

de clientes de créditos bancários”. 2007.7. Bürkle, Paula Y. “Um Método de Pós-processamento de Regras de Associação com Base nas

Relações de Dependência entre os Atributos”. 2006.8. “Weka 3: Data Mining Software in Java”, http://reality.sgi.

com/employees/jam_sb/mocap/MoCapWP_v2.0.html, Dezembro 2014.

http://reality.sgi.com/employees/jam_sb/mocap/MoCapWP_v2.0.html

Recommended

senso comum. sócrates Documents

Edição especial LITERATURA - ceale.fae.ufmg.br · leitura literária deve estar presente no contexto escolar exatamente porque transborda o senso utilitarista e permite certos entendimentos Documents

Senso incomum 23 bx Documents

Senso Comum1 Documents

Senso (in)comum 7 Documents

Senso (in)comum 09 Documents

Aula 1 Introdução -Mineração de Dados · Mineração de Dados aplicada à Gestão de Negócios 1) Mineração de Dados Assuntos ultimamente tratados pela Mineração de Dados: Documents

Senso incomum Documents

Senso (in)comum 05 Documents

Os territórios da mineração sob a lógica da acumulação ... · na, Herculano Mineração, MIB Mineração Ibirité, SAFM Mineração, Empresa de Mineração Esperança, Extrativa Documents

CULTURA DIGITAL - Gestão Escolar · colaborativa , à reflexão e à ... módulo. Assim, nesta atividade espera-se do cursista maior senso crítico e responsabilidade no julgamento Documents

SEQUÊNCIA DIDÁTICA SENSO CRÍTICO E SENSO COMUM Documents

Senso (in)comum 8 Documents

MODELOS DO PENSAMENTO HUMANO - … · Bom senso Do senso comum é retirado o bom senso. Costuma-se chamar as ideias do senso comum que acabam provando ser verdadeiras, ou com mais Documents

Senso Magazine - 13th Edition Documents

Senso Catalogo Documents

Senso Incomum 12 Documents

SENSO COMUM ESTEREÓTIPOS E CLICHÊS Documents