Upload
kirsi
View
30
Download
0
Embed Size (px)
DESCRIPTION
INFERÊNCIAS SOBRE OS PERFIS DE VESTIBULANDOS DOS CURSOS DE ENGENHARIA DO CEFET-MG UTILIZANDO A FERRAMENTA WEKA DE DATAMINING. Aluna: Lúcia Salomé de Aguilar Orientador: Prof. Heitor Garcia de Carvalho, Ph.D. INTRODUÇÃO. - PowerPoint PPT Presentation
Citation preview
INFERÊNCIAS SOBRE OS PERFIS DE VESTIBULANDOS DOS CURSOS DE
ENGENHARIA DO CEFET-MG UTILIZANDO A FERRAMENTA WEKA
DE DATAMINING
Aluna: Lúcia Salomé de Aguilar
Orientador: Prof. Heitor Garcia de Carvalho, Ph.D
INTRODUÇÃO
Assim como o trabalho desenvolvido pelo bolsista PIBIC Minervino Martins Neto, este projeto avaliará dados recolhidos nos processos seletivos do CEFET-MG. Porém, a análise fatorial do conjunto de dados será substituída pela técnica de datamining com o intuito de captar bem certas informações em formato de texto e buscar padrões de dados em subconjuntos da população com cardinalidade reduzida.
O QUE É DATAMINING?
A Mineração dos Dados, denominada Datamining, é uma das etapas principais dentro do Processo de Extração de Conhecimento em Base de Dados ( KDD – Knowledge Discovery Database). Através do uso de suas técnicas e algoritmos, padrões são “descobertos” dentro de uma Base de Dados, provendo assim, recursos para que o Analista do Conhecimento possa identificar informações relevantes e inteligentes no que antes, era uma massa de Dados.
O QUE É WEKA?
WEKA (Waikato Enviroment for Knowledge Analysis) é uma ferramenta livre e disponível para download na Internet. Foi desenvolvida pela Universidade de Waikato na Nova Zelândia, sendo utilizada para Mineração de Dados.
1. Investigar os padrões implícitos nos conjuntos de dados numéricos e em variáveis textuais dos bancos de dados relativos ao vestibular dos cursos de engenharia do CEFET-MG ;
2. A partir da investigação, identificar características dos perfis dos alunos que demandam o ingresso na escola e confrontá-los com o dos aprovados;
3. Após identificar tais características, subsidiar medidas de interesse pedagógico e administrativo.
OBJETIVOS
METODOLOGIA
1. Estudo da teoria, do software e dos métodos;
2. Obtenção de dados do exame vestibular e derivados de documentos, além das respostas aos formulários de inscrição, fornecidos pelos candidatos;
3. Adaptação dos dados obtidos aos formatos eletrônicos requeridos para utilização no software de mineração de dados;
4. Crítica e depuração do banco de dados obtidos de forma a adequá–lo aos requisitos da ferramenta de datamining (WEKA);
5. Elaboração de hipóteses de pesquisa de padrões de associação (estudo da probabilidade de um item ocorrer dado que outro item esteja presente) e de clusterização (identificação das classes dentro da base de dados e agrupamento de objetos em classes semelhantes);
6. Aplicação do software de datamining;
7. Interpretação e análise crítica dos resultados;
8. Elaboração de conclusões e de relatórios de pesquisa;
2. DADOS PASSADOS PARA PLANILHA
EntrA1 EntrA2Q1 nome ProfHA ProfGAQ2 contato 34854399 32259250Q3 sexo 2 2Q4 faixa_etaria 5 7
Q5.1a curso_magist 0 0Q5.1b instituicao_magist 0 0Q5.1c conclusao_magist 0 0
Q5.2a curso_grad Licenciatura Plena em História Geografia
Q5.2b instituicao_gradFafi-BH Católica - MG
Q5.2c conclusao_grad 1985 1974
3. LISTAGEM DAS RESPOSTAS POSSIVEIS
Q2 sexo 0 Nenhum1 Feminino2 Masculino
9998 Outros9999 Branco
Q3 faixa_etaria 0 Nenhum1 18 aos 25 anos2 26 aos 30 anos3 31 aos 35 anos4 36 aos 40 anos5 41 aos 45 anos6 46 aos 50 anos7 mais de 50 anos
9998 Outros9999 Branco
4. DADOS PRONTOS PARA O WEKA PROCESSAR
se
xo
faix
a_
eta
ria
cu
rso
_g
rad
1
tip
o_
ins
titu
ica
o_
gra
d1
ins
titu
ica
o_
gra
d1
co
nc
lus
ao
_g
rad
1
cu
rso
_g
rad
2
tip
o_
ins
titu
ica
o_
gra
d2
ins
titu
ica
o_
gra
d2
co
nc
lus
ao
_g
rad
2
2 5 13 7 11 3 0 0 0 02 7 12 7 16 1 0 0 0 01 3 23 8 22 5 0 0 0 01 4 3 7 14 4 0 0 0 01 7 19 7 11 2 0 0 0 02 6 20 11 28 2 0 0 0 01 5 15 7 16 2 0 0 0 02 2 15 8 18 5 0 0 0 01 5 14 7 16 4 0 0 0 01 7 5 8 13 1 0 0 0 01 6 7 8 18 3 0 0 0 02 4 17 7 15 5 8 8 18 51 3 3 7 14 5 0 0 0 0
1. Informações sobre os perfis de alunos que demandam o ingresso nos cursos de engenharia do CEFET-MG contrastando-os com as características dos aprovados e que sejam relevantes para o seu atendimento pedagógico durante o curso;
2. Aquisição de proficiência pelo aluno bolsista em uma técnica aplicável a problemas no seu campo profissional.
RESULTADOS ESPERADOS
BIBLIOGRAFIA
OLIVEIRA, Araceli Garcia. Descoberta de Conhecimento na Base de Dados do Processo Seletivo do UNIFOR-MG. Formiga, MG: Monografia, 2004.
MONTEIRO, Mário do Socorro Jardim; ROCHA, Vanderlene Covre. Descoberta de Conhecimento na Base de Dados do Processo Seletivo Seriado da UFPA – 2004, Usando Regras de Associação. Belém, PA: Monografia, 2005.