61
BRUNA FAGUNDES RÓCIO ESTÁGIO CURRICULAR I E II Adaptação do Sistema de Busca Semântico ao Padrão XML e Automatização do Processo de Modelagem dos Objetos de Aprendizagem no ROAI para o Padrão OWL EMPRESA: UNIVERSIDADE DO ESTADO DE SANTA CATARINA SETOR: DEPARTAMENTO DE CIÊNCIAS DA COMPUTAÇÃO SUPERVISOR: MARCELO DA SILVA HOUNSELL ORIENTADOR: AVANILDE KEMCZINSKI CURSO DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS CENTRO DE CIÊNCIAS TECNOLÓGIAS - CCT UNIVERSIDADE DO ESTADO DE SANTA CATARINA – UDESC JOINVILLE SANTA CATARINA - BRASIL NOV/2012

Relatorio Final Bruna Fagundes Rocio Versao Impressao

Embed Size (px)

DESCRIPTION

Relatório de Estágio executado na Universidade do Estado de Santa Catarina

Citation preview

  • BRUNA FAGUNDES RCIO

    ESTGIO CURRICULAR I E II Adaptao do Sistema de Busca Semntico ao Padro

    XML e Automatizao do Processo de Modelagem dos

    Objetos de Aprendizagem no ROAI para o Padro OWL

    EMPRESA: UNIVERSIDADE DO ESTADO DE SANTA CATARINA

    SETOR: DEPARTAMENTO DE CINCIAS DA COMPUTAO SUPERVISOR: MARCELO DA SILVA HOUNSELL

    ORIENTADOR: AVANILDE KEMCZINSKI CURSO DE TECNOLOGIA EM ANLISE E DESENVOLVIMENTO DE

    SISTEMAS CENTRO DE CINCIAS TECNOLGIAS - CCT

    UNIVERSIDADE DO ESTADO DE SANTA CATARINA UDESC

    JOINVILLE SANTA CATARINA - BRASIL

    NOV/2012

  • APROVADO EM ........../........../..........

    _________________________________

    Professora Avanilde Kemczinski Dra. Engenharia de Produo Professor Orientador

    _________________________________

    Professor Alexandre Gonalves Silva Dr. Engenharia Eltrica

    _________________________________

    Professora Isabela Gasparini Msc. Cincia da Computao

    _________________________________

    Professor Marcelo da Silva Hounsell Dr. Engenharia de Manufatura Supervisor da CONCEDENTE

  • Carimbo da Empresa

    UNIDADE CONCEDENTE Razo Social: Universidade do Estado de Santa Catarina UDESC CGC/MF: 83.891.283/0001-36 Endereo: Rua Paulo Malschitzki, s/n Campus Universitrio Prof. Avelino Marcante Bairro: Zona Industrial Norte CEP: 89219-710 Cidade: Joinville UF: SC Fone: (47) 4009-7900 Supervisor: Marcelo da Silva Hounsell Cargo: Professor Universitrio

    ESTAGIRIO Nome : Bruna Fagundes Rcio Matrcula: 211211005 Endereo: Ronco Dgua, 344 Bairro: Itinga CEP: 89233-740 Cidade: Joinville UF: SC Fone: (47) 8866-0048 Curso de : Tecnologia em Anlise e Desenvolvimento de Sistemas

    Ttulo do Estgio: Adaptao do Sistema de Busca Semntico ao Padro XML e Automatizao do Processo de Modelagem de Objetos de Aprendizagem no ROAI para o Padro OWL Perodo: 06/08/2012 a 23/10/2012 Carga horria: 240h

    AVALIAO FINAL DO ESTGIO I e II PELO CENTRO DE CINCIAS TECNOLGICAS

    Representada pelo Professor da Disciplina: Omir Alves Junior

    CONCEITO FINAL DO ESTGIO I e II

    NOTA ETG I (Mdia do Processo)

    NOTA ETG II (Mdia do Processo)

    Rubrica do Professor da

    Disciplina

    Excelente (9,1 a 10) Muito Bom (8,1 a 9,0) Joinville Bom (7,1 a 8,0) Regular (5,0 a 7,0) Reprovado (0,0 a 4,9) ____/____/______

  • Nome do Estagirio: Bruna Fagundes Rcio

    QUADRO I

    AVALIAO NOS ASPECTOS PROFISSIONAIS Pontos QUALIDADE DO TRABALHO: Considerando o possvel.

    ENGENHOSIDADE: Capacidade de sugerir, projetar, executar modificaes ou inovaes.

    CONHECIMENTO: Demonstrado no desenvolvimento das atividades programadas.

    CUMPRIMENTO DAS TAREFAS: Considerar o volume de atividades dentro do padro razovel.

    ESPRITO INQUISITIVO: Disposio demonstrada para aprender.

    INICIATIVA: No desenvolvimento das atividades.

    SOMA

    QUADRO II

    AVALIAO DOS ASPECTOS HUMANOS Pontos ASSIDUIDADE: Cumprimento do horrio e ausncia de faltas.

    DISCIPLINA: Observncia das normas internas da Empresa.

    SOCIABILIDADE: Facilidade de se integrar com os outros no ambiente de trabalho.

    COOPERAO: Disposio para cooperar com os demais para atender as atividades.

    SENSO DE RESPONSABILIDADE: Zelo pelo material, equipamentos e bens da empresa.

    SOMA

    PONTUAO PARA O QUADRO I E II Sofrvel - 1 ponto, Regular - 2 pontos, Bom - 3 pontos, Muito Bom - 4 pontos, Excelente - 5 pontos

    LIMITES PARA CONCEITUAO AVALIAO FINAL Pontos

    De 57 a 101 SOFRVEL SOMA do Quadro I multiplicada por 7

    De 102 a 147 REGULAR SOMA do Quadro II multiplicada por 3

    De 148 a 194 BOM SOMA TOTAL

    De 195 a 240 - MUITO BOM

    De 241 a 285 EXCELENTE

    Nome da Empresa: Universidade do Estado de Santa Catarina

    Representada pelo Supervisor: Prof. Dr. Marcelo da Silva Hounsell

    CONCEITO CONFORME SOMA

    TOTAL

    Rubrica do Supervisor da Empresa

    Local: Data :

    Carimbo da Empresa

  • UDESC

    UNIVERSIDADE DO ESTADO DE SANTA CATARINA - UDESC

    CENTRO DE CINCIAS TECNOLGICAS - FEJ PLANO DE ESTGIO CURRICULAR I e II

    ESTAGIRIO Nome: Bruna Fagundes Rcio Matrcula: 211211005 Endereo (Em Jlle): Ronco Dgua, 344 Bairro: Santa Catarina CEP: 89233-740 Cidade: Joinville UF: SC Fone: (47) 8866-0048 E-mail: [email protected] Regularmente matriculado no semestre: 2012/2 Curso: Tecnologia em Anlise e Desenvolvimento de Sistemas Formatura (prevista) Semestre/Ano: 2013/2

    UNIDADE CONCEDENTE Razo Social: Universidade do Estado de Santa Catarina - UDESC CNPJ: 83.891.283/0001-36 Endereo: Rua Paulo Malschitzki, s/n Campus Universitrio Prof. Avelino Marcante Bairro: Zona Industrial Norte CEP: 89219-710 Cidade: Joinville UF: SC Fone: (47) 4009-7900 Atividade Principal: Ensino, Pesquisa e Extenso Supervisor: Marcelo da Silva Hounsell Cargo: Professor Universitrio E-mail do Supervisor: [email protected] Telefone/Ramal: 7831

    DADOS DO ESTGIO rea de atuao: Desenvolvimento de Sistemas no GPIE Departamento de atuao: Departamento de Cincias da Computao Fone: (47) 4009-7923 Ramal: Horrio do estgio: Seg Qui 18h s 22h Total de horas do Estgio: 240 Perodo: 06/08/2012 23/10/2012 Total de horas semanais: 20

    Nome do Professor Orientador: Avanilde Kemczinski Departamento: Departamento de Cincias da Computao

    Disciplina(s) simultnea(s) com o estgio Quantas: 3 Quais: DAD II Estrutura de Dados II GPR Gerencia de Projetos REC Redes de Computadores

  • OBJETIVO GERAL

    Automatizar o processo de modelagem dos objetos de aprendizagem cadastrados no ROAI1 para o padro OWL2

    ATIVIDADES OBJETIVO ESPECFICO HORAS 1. Levantamento

    2. Anlise

    3. Implementao

    4. Testes

    1.1 Levantamento das propriedades necessrias a ontologia de cada objeto

    1.2 Levantamento de projetos similares ao proposto

    2.1 Anlise e definio do local de implementao do desenvolvimento

    2.2 Anlise de impacto da implementao no ROAI

    2.3 Anlise e definio da necessidade de interface para o gerador automtico de ontologias

    3.1 Implementao do gerador automtico de ontologias para o ROAI

    4.1 Testes integrados no gerador automtico de ontologias para o ROAI

    4.2 Teste de desempenho no ROAI com o gerador automtico de ontologias

    5h

    20h

    20h

    20h

    20h

    115h

    30h

    10h

    Assinatura do Aluno Assinatura do Supervisor da Empresa

    Data: Carimbo da Empresa Data:

    Assinatura do Professor Assinatura do Membro do Assinatura do Orientador Comit de Estgio Coordenador de Estgio

    Data: Data: Data:

    1 Repositrio de Objetos de Aprendizagem para a rea de Informtica

    2 Ontology Web Language

  • CRONOGRAMA FSICO E REAL

    PERODO (20 horas) ATIVIDADES

    PR

    01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20

    1. Levantamento das propriedades ontolgicas necessrias a cada P Objeto R 2. Levantamento de projetos similares ao proposto P R 3. Anlise e definio do local de implementao do P Desenvolvimento R 4. Anlise do impacto da implementao no ROAI P R 5. Anlise e definio da necessidade de interface para o gerador P automtico de ontologias3 R 6. Implementao do gerador automtico de ontologias para o P ROAI4 R 7. Testes integrados no gerador automtico de ontologias para o P ROAI5 R 8. Teste de desempenho no ROAI com gerador automtico de P Ontologias R 9. Anlise e estudo interface XML6 P

    R 10. Migrao funo busca semntica para a interface XML7 P R

    3 Atividade 5 foi atrelada a atividade 2 em virtude da necessidade da interface depender do modelo de implementao de modelagem automtica definido

    4 Em virtude da adio de atividades e necessidade de aprofundamento nas pesquisas de projetos relacionados as atividades de desenvolvimento (6 e 10) e implementao

    ainda est em andamento 5 Em virtude da adio de atividades e necessidade de aprofundamento nas pesquisas de projetos relacionados as atividades de testes (7 e 8) ainda no foram realizadas

    6 Atividade 9 no faz parte do escopo inicial

    7 Atividade 10 no faz parte do escopo inicial

  • Aos meus pais e

    Aos meus irmos (aos que compartilho meu amor e DNA E no menos importante, aos que compartilho

    somente o meu amor e admirao)

  • AGRADECIMENTOS

    Por mais inteligentes, corajosos e fortes que possamos ser, ainda assim acredito que no seramos nada sozinhos, assim, aqui, gostaria de lembrar e agradecer algumas pessoas que contriburam, no somente a esse trabalho, mas tambm para que eu me tornasse quem eu vim a ser.

    Aos meus pais pela educao, moral e tica que me ajudaram a construir nesses vinte e quatro anos e por terem cuidado de mim em todas as vezes que precisei.

    Aos meus irmos. Aos que vi nascer e aos que ganhei com o passar

    dos anos, por mais que nossas diferenas possam ser grandes, o amor que eu sinto por vocs maior que a extenso do universo, e qualquer coisa se torna insignificante perante isso.

    A minha equipe na TOTVS (Silvia, Tati, Fer, Gil, Bortto e Karina), pessoas que tem minha admirao, carinho, respeito, que agentam a minha hiperatividade h quase trs anos e que sempre apoiaram meus sonhos.

    A professora Avanilde, por ter me apresentado a pesquisa, por ter permitido que eu viesse a ser parte do GPIE, por ter me apoiado e acredito no meu potencial, por entender meus horrios restritos... enfim, por tudo. Que um dia eu possa ser ao menos metade do que voc .

    A todos os meus professores, dos dezoito anos de vida acadmica, o meu muito obrigado. Dentre os diversos caminhos que eu testei, antes de enfim encontrar o que eu realmente procurava, eu tive oportunidade que conhecer verdadeiros mestres.

    A toda a galera da UDESC, por todos os momentos bons churrasco, papo furado, piadas e desesperadores provas, trabalhos e mais provas pra fechar bem.

    A UDESC, por ser uma instituio que incentiva e instiga a pesquisa e o conhecimento cientfico.

  • Talvez alguns nomes tenham ficado pelo caminho no texto acima, por isso, fica aqui registrado o meu muito obrigado a todos que de uma forma ou outra contriburam para que eu estivesse aqui.

    Menor que meu sonho no posso ser Lindolf Bell

  • SUMRIO 1. INTRODUO

    1.1. OBJETIVOS 1.1.1. Geral ................................................................................................................ 1 1.1.2. Especficos ...................................................................................................... 1 1.1.3. Justificativa ..................................................................................................... 2

    1.2. ORGANIZAO DO ESTUDO........................................................................... 2 2. A EMPRESA

    2.1. HISTRICO .......................................................................................................... 3 2.2. CURSOS OFERECIDOS ...................................................................................... 3 2.3. GPIE ....................................................................................................................... 4 2.4. CONSIDERAES GERAIS ............................................................................... 4

    3. DESENVOLVIMENTO 3.1. ROAI ...................................................................................................................... 6 3.2 WEB SEMNTICA ............................................................................................... 7 3.3. ONTOLOGIA ........................................................................................................ 8 3.4. BUSCA SEMNTICA COM O USO DE ONTOLOGIA NO ROAI .................. 9 3.5. CONSIDERAES GERAIS ............................................................................. 14

    4. BUSCA SEMNTICA NA INTERFACE XML ....................................................... 15 4.1 MANAKIN ........................................................................................................... 18 4.2 CONSIDERAES GERAIS .............................................................................. 24 5. AUTOMATIZAO DA MODELAGEM DE OBJETOS DE APRENDIZAGEM

    PARA O PADRO OWL .......................................................................................... 25 5.1 MODELAGEM ATUAL DE OBJETOS DE APRENDIZAGEM PARA O

    PADRO OWL .......................................................................................................... 25 5.2 LEVANTAMENTO DAS PROPRIEDADES ONTOLGICAS ........................ 26 5.3 TRABALHOS RELACIONADOS ...................................................................... 28 5.4 OAI-PMH ............................................................................................................. 29 5.5 POPULANDO ARQUIVO DE ONTOLOGIA COM A INTERFACE OAI ....... 35 5.5.1 Transformando a entrada OAI-PMH em Ontologia OWL...........................36 5.6 CONSIDERAES GERAIS .............................................................................. 38 CONSIDERAES FINAIS ......................................................................................... 39 ANEXOS ........................................................................................................................ 40 GLOSSRIO .................................................................................................................. 43 REFERNCIAS BIBLIOGRFICAS ........................................................................... 45

  • LISTA DE FIGURAS

    Figura 1. OntoROAI ..................................................................................................... 13 Figura 2. Interface de Busca Semntica ..................................................................... 14 Figura 3. Trecho do arquivo ROAI.owl ...................................................................... 15 Figura 4. Interface JSP ................................................................................................. 16 Figura 5. Interface XML ROAI ................................................................................... 17 Figura 6. Localizao de fontes responsveis por funes ........................................ 19 Figura 7. Localizao de fontes responsveis por interface ...................................... 20 Figura 8. Localizao dos arquivos de definio de estilo ......................................... 21 Figura 9. Arquivos gerados pela implementao de busca semntica na interface

    JSP .............................................................................................................................. 22 Figura 10. Nova Tela Pgina Inicial ROAI ................................................................ 23 Figura 11. Nova Tela Resultados Busca Semntica (Simples) .................................. 23 Figura 12. Requisio interface OAI ........................................................................... 33 Figura 13. Funo Harvesting no Painel de Controle do ROAI ............................... 34 Figura 14. Repositrio de Objetos Universidade de Patras ...................................... 36 Figura 15. Envio de informaes ao Transformation ................................................. 37

  • LISTA DE TABELAS

    Quadro 1. Metadados Essenciais ................................................................................... 7 Quadro 2. Definio das classes OWL dos elementos estruturais do DSpace ......... 10 Quadro 3. Definio das classes OWL dos metadados essenciais e adicionais ....... 11 Quadro 4. Classes adicionais ontologias ..................................................................... 12 Quadro 5. Propriedade URL ....................................................................................... 12 Quadro 6. Propriedade Relation ................................................................................. 12 Quadro 7. Mapeamento Cruzado Cadastro X Classes Ontolgicas ........................ 27 Quadro 8. Anlise dos aspectos relevantes dos trabalhos relacionados com foco em

    semntica e ontologia. ............................................................................................... 29

  • RESUMO

    Neste relatrio so detalhadas as atividades realizadas pela acadmica Bruna Fagundes Rcio no Grupo de Pesquisa em Informtica na Educao (GPIE) no Departamento de Cincias da Computao da Universidade do Estado de Santa Catarina UDESC, em virtude das disciplinas de Estgio Curricular Obrigatrio I e II do curso de Tecnologia em Anlise e Desenvolvimento de Sistemas. O trabalho proposto tem origem na continuidade de uma pesquisa que proporcionou ao Repositrio de Objetos de Aprendizagem para a rea de Informtica ROAI a funcionalidade de busca semntica. Sendo assim, este projeto, permitiu aos envolvidos o conhecimento do repositrio, das ferramentas envolvidas e da aplicao dos conceitos como busca semntica e ontologia.

  • 1. INTRODUO

    O ROAI Repositrio de Objetos de Aprendizagem para a rea de Informtica tem por finalidade organizar, catalogar e armazenar objetos que facilitem o processo de aprendizagem na rea de Informtica, disponvel em: http://roai.joinville.udesc.br. Esse relatrio tem o intuito de detalhar as atividades realizadas pela acadmica Bruna Fagundes Rcio nessa ferramenta no perodo entre 06/08/2012 e 23/10/2011, no Grupo de Pesquisa em Informtica na Educao do Departamento de Cincias da Computao da Universidade de Estado de Santa Catarina UDESC.

    1.1. OBJETIVOS

    1.1.1. Geral

    Automatizar o processo de modelagem dos objetos de aprendizagem cadastrados no ROAI para o padro OWL.

    1.1.2. Especficos

    Levantamento das propriedades necessrias a ontologia de cada objeto Levantamento de projetos similares ao proposto Anlise e definio do local de implementao do desenvolvimento Anlise de impacto da implementao no ROAI Anlise e definio da necessidade de interface para o gerador automtico de

    ontologias

    Implementao do gerador automtico de ontologias para o ROAI Testes integrados no gerador automtico de ontologias para o ROAI Teste de desempenho no ROAI com o gerador automtico de ontologias

  • 1.1.3. Justificativa

    Na situao atual do repositrio necessrio que cada objeto incluso seja mapeado manualmente e adicionado ao arquivo de informaes ontolgicas. No caso da excluso de um objeto tambm preciso excluir as referencias dele no mesmo arquivo. Isso, alm de ser invivel pelo esforo humano necessrio, pode ocasionar problemas com a integridade das informaes ontolgicas do objeto, pois, em um trabalho manual maior a possibilidade de ser esquecida uma das classes ou at mesmo danificar as informaes de algum outro objeto no processo de excluso. Para essa situao, foi planejada como soluo a automatizao da modelagem de objetos de aprendizagem para o padro OWL. Porm, tambm foi observado que a funo de busca semntica estava disponvel apenas para a interface conhecida como JSP e que no a padro do repositrio (ROAI). Por questes de usabilidade e manuteno, foi proposta tambm a migrao da funo de busca semntica para a interface oficial do repositrio (padro XML).

    1.2. ORGANIZAO DO ESTUDO

    O relatrio est dividido em sete captulos. O primeiro descreve os objetivos geral e especficos, alm da justificativa do trabalho.

    O segundo engloba as informaes sobre a empresa onde o estgio foi realizado, apresentando o histrico, fatos relevantes e consideraes gerais.

    O terceiro captulo apresenta a base conceitual, cujo conhecimento foi imprescindvel para a realizao do objetivo proposto.

    O quarto e quinto captulo tratam do detalhamento das tarefas desenvolvidas durante o perodo de estgio.

    O sexto captulo traz as concluses, seguidas por referncias bibliogrficas e anexos.

  • 2. A EMPRESA

    Este captulo apresenta um breve histrico do CCT - Centro de Cincias Tecnolgicas, localizado em Joinville e pertencente UDESC, abordando os seus principais cursos e consideraes gerais. apresentado o GPIE (Grupo de Pesquisa em Informtica na Educao), local de execuo do estgio, tratando de seu histrico, linhas de pesquisa e destacando projetos realizados e em desenvolvimento.

    2.1. HISTRICO

    Inicialmente denominado FEJ Faculdade de Engenharia de Joinville, foi criado em 09 de outubro de 1956 pelo governo do Estado de Santa Catarina, atravs da Lei n 1520/56 o Centro de Cincias Tecnolgicas (CCT), com apenas o curso de Engenharia de Operaes, modalidade Mecnica de Mquinas e Motores. O primeiro vestibular foi realizado em julho de 1965, com as atividades do curso tendo inicio em 1 de agosto do mesmo ano (UDESC Joinville, 2012). As atividades da FEJ eram realizadas na rua Otto Boehm, nmero 48, no centro de Joinville onde atualmente opera a Rdio Udesc FM e a Fundao Softville at 8 de maro de 1979, quando foi inaugurado o campus universitrio professor Avelino Marcante, onde as atividades passaram a ser desenvolvidas (UDESC Joinville, 2012).

    Em 1 de outubro de 1990, o governo do Estado de Santa Catarina, atravs da Lei n 8092, reconheceu a Faculdade de Engenharia de Joinville como Universidade, passando a se chamar Centro de Cincias Tecnolgicas (UDESC Joinville, 2012).

    2.2. CURSOS OFERECIDOS

    O Centro de Cincias Tecnolgicas disponibiliza atualmente nove cursos: Engenharia Civil, Engenharia Eltrica, Engenharia Mecnica, Engenharia de Produo e Sistemas, Cincia da Computao, Licenciatura em Fsica, Licenciatura em Matemtica, Licenciatura em Qumica e Tecnologia em Anlise e Desenvolvimento de Sistemas (UDESC Joinville, 2012).

  • So oferecidos seis cursos gratuitos de ps-graduao em nvel de mestrado: Computao Aplicada, Fsica, Cincia e Engenharia de Materiais, Engenharia Mecnica e Engenharia Eltrica, este ultimo nas modalidades acadmico e profissional. H tambm o curso de ps-graduao, em nvel de doutorado, em Cincia e Engenharia de Materiais (UDESC Joinville, 2012).

    O CCT tambm desenvolve e apia aes destinadas a comunidade em geral a partir de projetos de extenso, como o Informtica na Terceira Idade e Informtica para Escolas Pblicas, que promovem a incluso digital a idosos e alunos de escolas carentes municipais e estaduais da regio de Joinville. Alm disso, figuram projetos como Universidade para Idosos e Entendendo Fsica para o vestibular (UDESC Joinville, 2012).

    2.3. GPIE

    Com o nome de Sistemas de Informao e Gesto do Conhecimento o grupo foi oficializado no CNPq em 10 de Abril de 2002. Ao final do mesmo ano passou a se chamar Grupo de Pesquisa em Informtica na Educao - GPIE. Localizado no Departamento de Cincia da Computao, do Centro de Cincias Tecnolgicas, da Universidade do Estado de Santa Catarina, em Joinville, seu primeiro laboratrio, o LINE Laboratrio de Informtica na Educao foi inaugurado em dezembro de 2007 (GPIE, 2007).

    O grupo conta atualmente com cinco professores, treze alunos e sete

    colaboradores vinculados em duas linhas de pesquisa, sendo elas: (1) Ensino-Aprendizagem auxiliado por Computador e (2) Tecnologia Educacional.

    2.4. CONSIDERAES GERAIS

    Dentre os projetos de pesquisa do GPIE, o ROAI proposto por Ferlin (2009) intitulado Repositrio de Objetos de Aprendizagem para a rea de Computao e Informtica, pertencente a linha de Ensino-Aprendizagem auxiliado por Computador. Esse projeto tratou do estudo da melhor forma de implementao do repositrio e da implantao em si. Outros dois projetos que trouxeram melhorias importantes para o

  • repositrio foram o Processo de Avaliao de Objetos de Aprendizagem no ROAI utilizando Workflow, que visou aumentar a qualidade dos objetos submetidos, fazendo com que eles fossem analisados por avaliadores tcnicos e pedaggicos, antes da disponibilizao na base, proposto por Woll (2011). E por ltimo, o projeto Busca Semntica no Repositrio de Objetos de Aprendizagem para a rea de Informtica, proposto por Kochhann (2012) para qualificar os resultados nas buscas de objetos.

    Neste trabalho, a proposta trazer a busca semntica para a interface oficial do ROAI que a padro XML e agregar ao repositrio uma funo que permita a modelagem automtica dos objetos de aprendizagem para o padro OWL. Tarefa indispensvel para o funcionamento da busca semntica e que hoje feito de forma manual.

  • 3. DESENVOLVIMENTO

    Este captulo aborda os conceitos necessrios para o entendimento e justificativa do projeto.

    3.1. ROAI

    O Repositrio de Objetos de Aprendizagem para a rea de Informtica ROAI foi proposto em 2009 por Ferlin (FERLIN, 2009) como uma soluo para centralizar e catalogar objetos uteis ao processo de ensino e aprendizagem na rea de informtica. O ROAI usou como base o gerenciador de repositrios opensource DSpace (DSpace, 2012) que usa como padro de metadados o Dublin Core e como motor de busca o Apache Lucene (Apache, 2012).

    Uma das premissas do projeto era oferecer um sistema eficaz nas tarefas de catalogar e recuperar objetos e que fizesse uso do mnimo de informaes possveis, otimizando no somente organizao dos dados, como tambm no onerando o usurio no momento da incluso de um novo objeto.

    Respeitando essa premissa, Ferlin (2009) observou e identificou quais metadados eram parte da composio da maior parte dos padres. A partir da escolha do Dublin Core como padro, visando a eficincia da pesquisa dos objetos dentro do repositrio, Ferlin (2009), selecionou apenas os metadados que a maior parte dos outros padres possussem em comum e que contivessem, adequadamente, todas as informaes necessrias, no s para o armazenamento dos objetos, como tambm para sua recuperao. Os metadados resultantes dessa anlise foram denominados metadados essenciais (Kemczinski, 2010) e so apresentados no Quadro 1.

    Nome do Metadado

    Entrada (Entry) Ttulo (Title)

    Idioma (Language) Descrio (Description)

    Criador (Creator)

  • 7

    Data (Date) Formato (Format) Tamanho (Extent)

    Tipo do Recurso de Aprendizagem (Type) Direitos (Rights)

    Quadro 1. Metadados Essenciais

    O motor de busca vinculado ao gerenciador de repositrios o Lucene, desenvolvido na linguagem Java e mantido pela APACHE SOFTWARE FOUNDATION (2011), cuja caracterstica principal a obteno de qualquer informao indexada desde que esta atenda a premissa de poder ser convertida para o formato texto. No caso de objetos de tipo diferente de texto, por exemplo, vdeos, animaes e imagens a busca concentra-se nas informaes contidas no metadado do objeto. A busca por palavra-chave perde eficcia quando se trabalha com grandes volumes de dados ou palavras-chave que se referem a termos muito amplos. Por exemplo, em um repositrio de objetos de aprendizagem para a rea de informtica certamente sero encontrados muitos objetos com o termo engenharia de software, porm, boa parte desses objetos na verdade no so sobre engenharia de software, apenas tem o termo mencionado em algum momento. Ento como identificar quais objetos so realmente sobre o termo pesquisado? A web semntica foi proposta como soluo para situaes como esta e seu conceito detalhado na seo 3.2.

    3.2. WEB SEMNTICA

    A evoluo e crescimento da World Wide Web permitiu observar que os padres at ento utilizados para recuperao de informaes no so eficazes. Como relata Engehofer (2002), os meios de obteno de informao existentes hoje so limitados a buscas por palavras-chave ou sub-palavras (substrings) assim como o motor de busca do ROAI sem oferecer suporte a estruturas mais abrangentes que podem estar escondidas na informao ou que as pessoas geralmente utilizam para raciocinar e direcionar sua pesquisa.

  • 8

    Considerando o fato de que uma quantidade incalculvel de informaes relevantes por ser perdida por causa disso, foi proposto um conjunto de padres denominados Web Semntica que visam permitir que existam dados atrelados as informaes pesquisadas, de forma que seja possvel a interpretao por parte da mquina para a melhor escolha e gerenciamento dos resultados.

    Este conceito visa encontrar uma soluo para a situao citada por Berners-Lee (1998), que diz a fonte destes problemas est no fato de que a web, da maneira atual, projetada de forma que a informao seja consumida apenas por seres humanos, pois a estrutura dos dados no permite que uma aplicao interprete o seu significado, mesmo quando esta informao se origine de um banco de dados com significados bem definidos.

    Assim, Berners-Lee (2001) props a adio na web de informaes processveis por software que possam auxiliar o usurio. Com isso, uma informao processada de forma coerente por um software especializado resultaria em dados mais relevantes e precisos. Porm, a web semntica trata-se apenas do conceito, para a real otimizao das buscas necessria uma forma de identificar o relacionamento semntico entre os objetos e que este possa ser identificado por um motor de busca. E essa a funo da chamada ontologia, tornar aplicvel o conceito de web semntica em sistemas informatizados reais, como repositrios de objetos.

    3.3. ONTOLOGIA

    A definio genrica de ontologia diz que se trata de uma "especificao explcita e formal de uma conceitualizao compartilhada" (Gruber, 1993). Ou seja, a referncia a um modelo abstrato de como algo especfico deveria ser. Continuando com a definio proposta por Gruber, as ontologias teriam todos os seus conceitos e relacionamentos nomeados de forma explcita.

    Existem inmeras definies diferentes para ontologia. Porm, visando seu uso junto a mecanismos de busca e web semntica, aceita a definio de que uma ontologia a descrio formal de um domnio de discurso, cujo objetivo compartilhar a informao entre aplicativos diferentes, sendo esta informao expressada em uma linguagem passvel de raciocnio (Welty, 2003).

  • 9

    Figuram entre essas linguagens (W3C, 2012): RDF (Resource Description Framework): padro de definio e manipulao

    de metadados para ser embutido na codificao XML. o que na verdade atribui ao XML propriedade semntica, porque, por mais bem modelado e especificado que seja o arquivo, suas tags so de fcil entendimento humano, porm, no traduzveis para a mquina.

    OWL (Ontololy Web Language): considerado superior ao RDF, e baseada no formalismo de Lgica Descritiva, o que tida como sua maior vantagem, pois a lgica descritiva um campo bem fundamento, de acordo com Plisson et al. (2006).

    A linguagem padro proposta pela W3C a OWL. Por isso, foi decidido utilizar esse padro tambm na implementao de busca semntica no ROAI, pois, tratando-se de uma linguagem padronizada existe mais suporte, conhecimento disseminado e tambm uma gama maior de projeto que a usam, tornando possvel comparaes e facilitando a coleta de informaes para se obter o melhor desempenho.

    3.4. BUSCA SEMNTICA COM O USO DE ONTOLOGIA NO ROAI

    Desde a sua implantao em 2009, esse repositrio sofreu alteraes visando proporcionar um melhor uso por parte de usurios. Com a inteno de oferecer a melhor qualidade possvel para os usurios da ferramenta, foi notada a grande melhoria que uma busca semntica poderia proporcionar, listando objetos cujo contedo conivente o esperado, tendo em vista a grande quantidade de termos de duplo ou mltiplo sentido que podem ser usados como palavras chave em uma busca.

    A partir da oportunidade de melhoria identificada, Kochhann (2012) realizou um estudo e posteriormente implementou junto a outros integrantes do GPIE (GPIE, 2012) um sistema de busca semntica com o uso de ontologia no ROAI.

    Nesse estudo, foram identificados dois pontos crticos: os metadados essenciais (Kemczinski, 2010) no ofereciam dados o suficiente para a aplicao de busca semntica e o motor de busca LUCENE tambm no tinha suporte a busca semntica. Assim, um dos passos principais, foi a pesquisa por projetos repositrios similares ao ROAI, que usavam o padro de metadados Dublin Core e que oferecessem busca

  • 10

    semntica ao usurio, pois com bases em estudos j realizados e documentados o processo de implementao da nossa funcionalidade seria menos arriscado em relao a integridade dos dados j armazenados. Como resultado da pesquisa, o modelo escolhido e adaptado foi o proposto por Koutsomitropoulos et al. (2009), pois foi o que mais se assemelhou a estrutura do ROAI. O modelo proposto se centra no mapeamento entre os elementos estruturais oriundos do DSpace (Comunidade, Coleo e Itens) em OWL, representados no quadro 2.

    Classes e Subclasses Descrio

  • 11

    Formato (Format)

    Tamanho (Extent)

    Direitos (Rights)

    Metadados Adicionais (Koutsomitropoulos et al. (2009))

    Representao OWL

    Contribuinte (Contributor)

    Relao (Relation)

    Parte de (isPartOf)

    Tem parte (hasPart)

    Quadro 3. Definio das classes OWL dos metadados essenciais e adicionais.

    Contudo, a aplicao do modelo utilizado por Koutsomitropoulos et al. (2009) no foi o suficiente para suprir os objetivos propostos pelo projeto de aplicao de busca semntica, isso se deve ao fato de que as propriedades OWL so aplicadas a um objeto atravs de instncias de uma classe. Por exemplo, para atribuir o tipo a um objeto (texto, imagem, etc), necessrio criar uma instncia de alguma classe que represente os tipos. Assim, foi proposta a criao de classes OWL adicionais apresentadas no quadro 4 - que fomentaram esse mapeamento.

    Autores dos objetos de aprendizagem.

    Tipos de dados (imagem, texto, etc) dos objetos de

    aprendizagem.

    Datas de publicao dos objetos de aprendizagem. Descrio dos objetos de aprendizagem. Direitos autorais dos objetos de aprendizagem. Constante numrica nica, que identifica cada objeto. Formato do objeto (TXT, PDF, etc) Idioma do objeto de aprendizagem.

    Tamanho do objeto.

  • 12

    Quadro 4. Classes adicionais ontologias

    Alm de classes, foi criada uma propriedade adicional especificada no quadro 5 para tornar vivel o armazenamento da URI do objeto de aprendizagem no ROAI. Com essa informao agregada ao objeto possvel efetuar sua visualizao assim que for retornado pela busca semntica, configurando um melhor desempenho.

    Propriedade Descrio

    owl:DatatypeProperty

    rdf:about="http://www.semanticweb.org/ontologies/2012/4/ROAIFinal.owl#URL Armazena a URL

    de um objeto no ROAI

    Quadro 5. Propriedade URL

    Para enriquecer o relacionamento entre os objetos foi estabelecida a noo de simetria e transitividade, assim como proposta por Koutsomitropoulos el al. (2009) no quadro 6.

    Propriedade Representao OWL Descrio

    Relation

    Estabelece que a

    propriedade

    Relation simtrica e

    transitiva.

    Quadro 6. Propriedade Relation

    A propriedade relation foi utilizada para criar o relacionamento de um objeto de aprendizagem a outro. Ao assumir que esta propriedade simtrica, o motor de busca semntica pode retornar objetos de aprendizagem que esto diretamente relacionados entre si. Alm disso, ao dizer que a propriedade transitiva, o motor de busca pode retornar objetos indiretamente relacionados. A propriedade isPartOf utilizada para dizer que um determinado objeto pertence a uma determinada coleo e a hasPart, faz o caminho inverso dizendo que certa Coleo possui determinado objeto. E por fim, o metadado adicional contributor utilizado para ser possvel trazer todos os objetos de um autor em especial.

  • Essas definies e mapeamentos foram da ontologia aplicada ao ROAI e que pode ser visualizada na figura 1, onde representa um objeto qualquer

    Com toda a modelagem de dados realizada foi necessrio tambm pesquisar por uma engine que suportasse busca semntica, mas, ao mesmo tempo no prejudicasse o funcionamento do LUCENE de maneira alguma, pois, esse continuaria sendo o responsvel pelas buscasescolhido foi o HermiT. O HermiT se trata de um motor de busca que usa as classes OWL para efetuar a busca. De forma simplificada o HermiT acessa o arquivo com as classes OWL dos objetos do repositrio entrada com as informaes

    O Dspace aplicao base do ROAI uma XML e outra JSP. Por facilidade de programao, considepara a implementao do projeto, a funcionalidade de busca semntica com o uso de ontologia foi desenvolvido na interface JSP, como mostra a figura 2.

    8 Nome dado a ontologia aplicada ao ROAI

    es e mapeamentos foram a base de dados utilizada para a da ontologia aplicada ao ROAI e que pode ser visualizada na figura 1, onde

    um objeto qualquer.

    Figura 1. OntoROAI8

    Com toda a modelagem de dados realizada foi necessrio tambm pesquisar por que suportasse busca semntica, mas, ao mesmo tempo no prejudicasse o

    funcionamento do LUCENE de maneira alguma, pois, esse continuaria sendo o responsvel pelas buscas convencionais baseadas em palavras chave. Assim, o escolhido foi o HermiT. O HermiT se trata de um motor de busca que usa as classes OWL para efetuar a busca. De forma simplificada o HermiT acessa o arquivo com as classes OWL dos objetos do repositrio e faz sua seleo comparando o valor de entrada com as informaes especificadas em cada classe sobre os objetos.

    aplicao base do ROAI oferece dois tipos distintos de interface, uma XML e outra JSP. Por facilidade de programao, considerando o tempo limitado para a implementao do projeto, a funcionalidade de busca semntica com o uso de ontologia foi desenvolvido na interface JSP, como mostra a figura 2.

    Nome dado a ontologia aplicada ao ROAI

    13

    base de dados utilizada para a gerao da ontologia aplicada ao ROAI e que pode ser visualizada na figura 1, onde Thing

    Com toda a modelagem de dados realizada foi necessrio tambm pesquisar por que suportasse busca semntica, mas, ao mesmo tempo no prejudicasse o

    funcionamento do LUCENE de maneira alguma, pois, esse continuaria sendo o baseadas em palavras chave. Assim, o

    escolhido foi o HermiT. O HermiT se trata de um motor de busca que usa as classes OWL para efetuar a busca. De forma simplificada o HermiT acessa o arquivo com as

    e faz sua seleo comparando o valor de sobre os objetos.

    oferece dois tipos distintos de interface, rando o tempo limitado

    para a implementao do projeto, a funcionalidade de busca semntica com o uso de

  • 14

    Figura 2. Interface de Busca Semntica

    3.5. CONSIDERAES GERAIS

    Os conceitos utilizados para a implementao de busca semntica no ROAI foram apresentados neste capitulo. Conforme citado no final da seo 3.4, a implementao da aplicao semntica, foi realizada na interface JSP do ROAI, que conserva o mesmo layout e funes da ferramenta base: o Dspace. Nas atividades do primeiro ms de estgio, foi identificado que no possvel manter funes separadas em dois ambientes, o usurio seria onerado e o repositrio perderia parte de seu propsito que a centralizao de recursos e informaes. Assim, a equipe responsvel pela construo da funo responsvel pela automatizao da modelagem dos objetos de aprendizagem para o padro OWL, decidiu realizar o estudo e migrao da funo semntica para interface XML. Essa nova tarefa est detalhada na prxima seo.

  • 4. BUSCA SEMNTICA NA INTERFACE XML

    Inicialmente, o objetivo proposto no estgio configurava apenas na construo e implantao de um gerador automtico de ontologias para o ROAI, tendo em vista que seria necessrio inserir manualmente as classes OWL no arquivo de ontologia, alm de criar os relacionamentos entre os objetos nesse mesmo arquivo. A figura 3 apresenta exemplos de trechos de cdigos contidos no arquivo ROAI.owl9, que pode ser alterado por editores de texto, como o Notepad do Sistema Operacional Windows ou pelo prprio Proteg Software (Stanford, 2012), que uma ferramenta mantida pela Universidade de Stanford para a edio de arquivos OWL, RDF e XML Schema, na qual a ontologia aplicada ao ROAI foi modelada.

    Figura 3. Trecho do arquivo ROAI.owl

    Contudo, na etapa de anlise de local de implementao, definida no cronograma desse projeto, foi identificado que a interface JSP oferecia menos qualidade (usabilidade), alm de no ser padro do ROAI usada por padro a interface XML, isso foi definido por Ferlin (2009) na ocasio de implementao do repositrio. Sendo assim, foi realizada uma anlise para definir se era mais vivel a total migrao do

    9 Arquivo que contm a discriminao das classes ontolgicas para cada objeto armazenado no ROAI

  • ROAI para a interface JSP apresentada na figura 4 ou a implementao da busca semntica na interface XML figura 5. importante salientar tambm que, at o projeto de implementao de busca semntica no ROAI, a interface JSP no era disponibilizada para acessos ao repositrio. Sua instalao foi feita durante o processo de implantao da funo de busca semntica e sendo assim, ela mantm todas as caractersticas de uma instalao default do Dspace, ou seja, sem qualquer customizao ou adaptao de acordo com o propsito do repositrio que utiliza a ferramenta.

    Figura 4. Interface JSP

  • Figura 5. Interface XML ROAI

    Diante de uma anlise entre as duas interfaces, possvel perceber que o layout e organizao da interface XML do ROAI oferece mais usabilidade ao usurio, pois, a interface na qual Ferlin (2009) e Woll(2011) trabalharam seus projetos de pesquisa. Assim, a equipe concluiu que seria mais produtivo estudar o cdigo fonte responsvel pela interface XML, com o intuito de adicionar a essa interface a funo de busca semntica e tambm j deter o conhecimento de manipulao da interface para a parte de automatizao da modelagem dos objetos de aprendizagem para o padro OWL, pois caso contrrio, seria necessrio conhecer melhor o cdigo fonte da interface JSP, filtrar todas as alteraes feitas desde a implantao at agosto/2012, data na qual se iniciou esse projeto, e transferi-las a outra interface, o que em tese, demandaria muito mais tempo, por se tratar de um volume significantemente maior de alteraes (funcionalidades, interface e interao).

  • 4.1 MANAKIN

    A DSpace define o Manakin como uma interface de usurio baseada em web que introduz o conceito de camadas ao Dspace (Duraspace, 2012). De forma simples e direta, existe uma parte responsvel pela interface e outra pelas funes do repositrio, e elas so mantidas separadamente. Como exemplo, a figura 6 traz o local onde se localizam os fontes responsveis pelas funes do repositrio, separados em macro grupos de acordo com o propsito, ex: Administrao, Navegao. Os fontes apresentados abaixo pertencem a uma instalao do DSpace puro verso 1.7.1 a mesma utilizada no ROAI num ambiente Linux Ubuntu 11.04, o caminho completo do diretrio [diretorio]10\dspace-1.7.1-src-release\dspace-xmlui\dspace-xmlui-api\src\main\java\org\dspace\app\xmlui\aspect.

    Figura 6. Localizao de fontes responsveis por funes.

    Existem quatro temas possveis para o Manakin, o ROAI usa o default, cujos arquivos so apresentados na figura 7. Seu caminho completo [diretorio]\dspace-1.7.1-src-release\dspace-xmlui\dspace-xmlui-webapp\src\main\webapp\themes \dri2xhtml. Alm disso, para a parte de interface, tambm se faz uso de arquivo de definio de estilo, que so apresentados na figura 8 e localizados no caminho

    10 Diretrio onde os fontes do Dspace foram descompactados

  • [diretorio]\dspace-1.7.1-src-release\dspace-xmlui\dspace-xmlui-webapp\src\main \webapp\themes\Reference\lib.

    Figura 7. Localizao de fontes responsveis por interface.

    Figura 8. Localizao dos arquivos de definio de estilo.

    Para alteraes somente na interface necessrio apenas ter o conhecimento de XML, XLS e CSS (arquivos de estilo), porm, caso for preciso fazer alteraes nas funes ou criar novas, necessrio o conhecimento da linguagem Java e SQL.

  • Analisando os arquivos oriundos da implementao da funo de busca semntica na interface JSP foi concludo que o arquivo ROAI.owl, que contm as classes ontolgicas para cada objeto j apresentado na Figura 3 totalmente reaproveitado, pois as interfaces JSP e XML dividem o mesmo banco de dados. J dos arquivos apresentados abaixo na Figura 9, nenhum ser reaproveitado diretamente. O advanced.jsp o arquivo que foi modificado para apresentar em tela as entradas para a busca semntica, o results.jsp, o responsvel pela apresentao dos resultados da busca semntica e por fim, semanticResults.jsp o responsvel pela comunicao com o HermiT, passando e recebendo as informaes processadas pelo motor. Este ltimo, ser convertido para um arquivo do tipo java e ter as mesmas atribuies que tinha na funo implantada na interface JSP.

    Os fontes, tanto java quanto XML podem ser alterados em qualquer interface, de acordo com a preferncia do programador, neste projeto, faz-se uso do Geany11.

    Figura 9. Arquivos gerados pela implementao de busca semntica na interface JSP.

    A parte de interface da busca semntica, tanto simples quanto avanada e a apresentao dos dados retornados consistem em um desenvolvimento totalmente novo. As novas telas principais so apresentadas nas figuras 10 e 11.

    11 Geany trata-se de um editor de texto multiplataforma desenvolvido em GTK+

  • Figura 10. Nova Tela Pgina Inicial ROAI

    Figura 11. Nova Tela Resultados Busca Semntica (Simples)

  • Para efetuar as alteraes apresentadas nas imagens, foram alterados os arquivos site-map.xml, que possui todas as referencias dos objetos apresentados nas telas do tema padro da interface XML, e tambm o arquivo style.css, tambm correspondente ao tema, que define o estilo e posicionamento dos objetos em tela. Quanto as alteraes referente a funo de busca semntica, essas sero apenas liberadas com a automao da modelagem de objetos de aprendizagem para o padro OWL, cujo modelo adotado, apresentado e justificado no prximo captulo.

    4.2 CONSIDERAES GERAIS

    Este captulo apresentou de forma sinttica a justificativa da nova atividade relacionada ao projeto, para este estgio, referente a converso do sistema de busca semntica para o padro XML e a forma como foi realizada a atividade. Para a compreenso do Manakin e com o intuito de planejar as alteraes para um melhor resultado foram estudados a fundo o cdigo fonte da ferramenta Dspace verso 1.7.1, assim como seu manual, contido no site da aplicao (Dspace, 2012). Tambm foram pesquisados artigos cientficos que mencionam alteraes no Manakin e realizadas constantes consultas a lista do grupo de usurios do Dspace, na qual foi possvel se comunicar com administradores de repositrios Dspace based on, alm de contar com apoio do prprio suporte do time que construiu e implementou novas funes e correes na ferramenta.

    Embora esteja bem estruturado, o Manakin no entanto no possu uma documentao adequada no caso de alteraes complexas e de grande porte a nvel de fonte. Assim, para efetuar as alteraes com assertividade e qualidade (foco em usabilidade) foi realizado o estudo de fontes da aplicao, cujo estado atual concludo. Esse estudo possibilitou o conhecimento e compreenso da estrutura no apenas para as alteraes de interface, como tambm, para a implementao da modelagem automtica de objetos de aprendizagem para o padro OWL. Esse processo, no entanto, documentado no prximo captulo.

  • 5. AUTOMATIZAO DA MODELAGEM DE OBJETOS DE APRENDIZAGEM PARA O PADRO OWL

    Esse captulo documenta as atividades j realizadas em relao ao processo de automatizao da modelagem de objetos de aprendizagem para o padro OWL. Tambm so listados conceitos especficos dessa etapa do projeto e justificativas de adoo de tais conceitos

    5.1 MODELAGEM ATUAL DE OBJETOS DE APRENDIZAGEM PARA O PADRO OWL

    Atualmente, para que um objeto seja adicionado ou excludo da ontologia do ROAI necessrio fazer todo o processo manualmente. Para a ao de adio de novo objeto, observam-se os seguintes passos:

    Aps a aprovao da submisso dos objetos por parte dos avaliadores tcnicos e pedaggicos do ROAI, o administrador do sistema, com acesso ao servidor onde o repositrio est hospedado mapeia as informaes dos metadados essenciais e levanta as informaes dos metadados adicionais da busca semntica. O preenchimento da propriedade relation da ontologia feito com base nos conhecimentos e compreenso do administrador sobre o tema ao qual o objeto pertence.

    Com todas as informaes do objeto a mo, o administrador adiciona as classes OWL apresentadas no Quadro 3 (seo 3.1), referenciando o objeto recm-adicionado, no arquivo ROAI.owl, contido no servidor da aplicao. Sendo a manuteno da integridade do arquivo e das classes OWL dos objetos responsabilidade de cada usurio que o altera.

    No processo de excluso h somente um passo: O administrador do sistema, com acesso ao servidor da aplicao, deve

    localizar o arquivo ROAI.owl e eliminar todas as classes OWL que referenciam o objeto a ser eliminado, sendo responsabilidade desse administrador manter a integridade do arquivo e das classes dos outros objetos.

  • Analisando os passos citados acima conclu-se que o processo atual, alm de ser invivel para grandes quantidades de objetos, por ser totalmente manual, pode ocasionar danos a integridade do arquivo e das classes j cadastradas. Soma-se a isso o fato de que a propriedade relation preenchida com base no conhecimento do administrador, e que para manter a integridade dessa classe, necessrio que o administrador tenha a disposio profissionais (especialistas) referentes as comunidades e colees contidas no ROAI, para eventuais consultas em caso de dvidas sobre relacionamento de objetos.

    5.2 LEVANTAMENTO DAS PROPRIEDADES ONTOLGICAS

    A atividade inicial desse projeto consistiu no levantamento das propriedades ontolgicas, ou classes, necessrias a cada objetos para a busca semntica. Ou seja, foi feito um mapeamento cruzado entre as informaes contidas nos metadados j solicitadas no cadastro dos objetos de aprendizagem e as necessrias para o preenchimento das classes do arquivo de ontologia, o resultado apresentado no Quadro 7.

    Metadado (Essenciais)

    Contido no Cadastro de Objetos?

    Observao Representao OWL

    Entrada (Entry)

    Implicito ID nica do objeto

    Ttulo (Title) Sim

    Idioma (Language)

    Sim

    Descrio (Description)

    Sim

    Criador (Creator)

    No

    Data (Date) Implicita (TODAY)

    Formato (Format)

    Implicito

  • Tamanho (Extent)

    Implicito

    Direitos (Rights)

    Sim

    Metadado (Adicionados na Busca Semntica)

    Contido no Cadastro de Objetos?

    Observao Representao OWL

    Contribuinte (Contributor)

    Sim Autor

    Relao (Relation)

    No

    Parte de (isPartOf)

    N/A Informao extrada do relacionamento do objeto com coleo

    Tem parte (hasPart)

    N/A Informao extrada do relacionamento do objeto com coleo

    Quadro 7. Mapeamento Cruzado Cadastro X Classes Ontolgicas

    Como resultado, observa-se que trs, das quatro informaes adicionais podem ter sua origem no prprio cadastro de objeto de aprendizagem, no entanto, o preenchimento da classe relation de forma automtica, no se mostrou um processo simples, pois, conforme relatado na seo 5.1, at ento seu preenchimento, e o mais relevante, a origem das informaes contidas nessa classe, era um processo manual, totalmente dependente do fator humano. Assim, buscando embasamento cientfico para a implementao dessa funo no ROAI, a prxima seo trata da anlise de trabalhos similares ao proposto por esse projeto.

  • 5.3 TRABALHOS RELACIONADOS

    Visando a nova funcionalidade do ROAI (mapeamento automtico dos OAs na ontologia), figurou entre as atividades desse projeto a pesquisa por trabalhos similares e relacionados a este. A partir de um pool de projetos relacionados foi realizada uma analise listando suas tecnologias, instituies e contribuies que poderiam oferecer a automatizao da modelagem dos objetos de aprendizagem para o padro OWL. O Quadro 8 apresenta os projetos julgados relevantes pela equipe.

    Titulo / Descrio

    Padro de MD12

    Instituio

    Engine OL13 Sistema gerenciador repositrio

    Gerao ontologia

    Contribuio

    1.Squirrel - Squirrell Squirrel OWL - Automtica Apresenta uma proposta hibrida de

    busca semntica e por palavra-chave.

    2. Integrao de Metadados Dublin Core em Colees de Heranas

    Culturais utilizando

    Ontologias.

    DC14

    IMIS15 -

    CIDOC

    -

    - Apresenta um modelo para o mapeamento dos metadados na

    forma de uma ontologia.

    3.SemanticWeb enabled

    digital repositories

    IEEE LOM / DC

    Patras16 HERMIT /

    FACT++ / Pellet

    OWL / RDF

    DSPACE Automtica Utiliza as mesmas tecnologias j

    implementadas no ROAI. Refere-se ao

    trabalho que deu inicio a implementao

    semntica no ROAI. Introduz o conceito de

    OAI, que permite a integrao de

    metadados de diversas origens.

    12 Metadados

    13 Ontology Language

    14 Dublin Core

    15 Institute for the Management of Information Systems (Athenas, Grcia)

    16 University of Patras (Patras, Grcia)

  • 4.Recuperao Semntica

    de Objetos de Aprendizage

    m: Uma Abordagem Baseada em Tesauros de Propsito Genrico

    - UNICSUL17

    - OWL / RDF

    - - Introduz o conceito de Thesauros, que um tipo de referncia que

    listas palavras agrupadas de acordo

    com significado.

    5.Associao de Recursos Semnticos

    para a Anotao de Objetos de

    Aprendizagem

    IEEE LOM / DC /

    CanCore

    PUC Minas Gerais

    Prope a construo de um

    novo mecanismo de busca

    OWL - - Prope um conjunto de metadados que

    facilitam o mapeamento

    semntico. Esses metadados so

    combinados a partir dos padres existentes.

    6.GoNTogle

    No especficado

    IMIS

    Lucene / Proteg

    RDF / OWL

    / RDFS

    No especficado Automtica

    Oferece busca semntica simples e avanada, alm da busca por palavra chave. Tambm oferece busca

    combinada com informaes

    semnticas e palavras chaves.

    7.Extrao de Metadados utilizando

    uma ontologia de

    domnio

    DC UFRGS18 Jena RDF / OWL

    / RDFS

    / DAM

    L

    - Automtica Define como funciona o processo de populao da

    ontologia.

    8.Projeto BROAD:

    Busca Semntica

    por objeto de aprendizagem

    DC UFJF19 - XML / RDF

    / SCORM

    O projeto trata da construo

    de um Framework prprio para

    busca em diretrio

    distribudos

    Automtica Prope um conjunto de metadados com foco

    nos metadados educacionais.

    Quadro 8. Anlise dos aspectos relevantes dos trabalhos relacionados com foco em semntica e ontologia.

    17 Universidade Cruzeiro do Sul (So Paulo)

    18 Universidade Federal do Rio Grande do Sul

    19 Universidade Federal de Juiz de Fora

  • Os dados listados no Quadro 8 oferecem uma viso da ampla gama de possibilidade de aplicaes ao trabalho proposto. Nesta etapa, procurou-se levantar trabalhos relacionados que apresentam solues completas ou parciais para os problemas vinculados a gerao automtica da ontologia. O Quadro 8 apresenta os 5 principais aspectos analisados que so:

    Padro de metadados; Motor de busca (Engine); Linguagem da ontologia; Sistema gerenciador do repositrio e; Se implementada a gerao automtica da ontologia.

    Estes aspectos so cruciais na identificao da relao entre os trabalhos descritos no quadro 8 e a atual pesquisa, alm disso, tambm traz uma anlise da potencial contribuio que cada trabalho pode oferecer.

    A preocupao com a definio do conjunto de metadados que descrevem os objetos de aprendizagem foi um tema amplamente discutido por Kemczinski (2010) e Ferlin (2009) em referencia a sua aplicao no ROAI. Patrocinio (2009) no trabalho relacionado nmero 5 tambm apresenta uma comparao entre quatro repositrios brasileiros de OAs e seus metadados, e, soma a ela uma anlise dos padres de metadados mais utilizados e discutidos a nvel internacional. A partir desta anlise o autor props um modelo de metadados para anotao semntica de OAs. Kemczinski (2010), por sua vez, seguindo a mesma abordagem metodolgica, props os metadados utilizados atualmente pelo ROAI, baseados no padro Dublin Core, intitulados metadados essenciais. Observa-se a partir do Quadro 8 que, dentre os oito projetos listados, cinco fazem uso do Dublin Core, fomentando sua relevncia entre os diversos modelos de metadados existentes.

    Kochhann (2012) ao propor a implementao do sistema de busca semntica no ROAI com base na aplicao de uma ontologia, trouxe novamente a discusso o padro de metadados aplicado ao repositrio. Para a especificao desta ontologia, Kochhann (2012) utilizou como base a metodologia proposta por (Koutsomitropoulos et al., 2009), que fez uso dos metadados essenciais mapeados por Ferlin (2009) e das estruturas dispostas no ROAI (Comunidade e Coleo). Alm desses elementos, foram adicionados quatro novos metadados, para que fosse possvel a ontologia, inferir

  • relaes entre esses OAs. Esta ontologia foi denominada de ontoROAI. Seguindo o padro (W3C, 2012) para desenvolvimento de tecnologias, a linguagem adotada para a ontologia foi o OWL. Por ser um padro adotado pelo W3C, observa-se que entre os nove trabalhos relacionados, seis tambm utilizam o OWL. O RDF tambm um modelo com uso expressivo por ser uma extenso do XML, conforme mencionado na seo 3.3 deste trabalho. Em resumo, para a ontoROAI, os metadados essenciais juntamente com os metadados adicionais (Kochhann, 2012) mapeiam a instncia do OA. Por se tratar de um projeto que faz uso de semntica, importante mencionar que, embora a IEEE (Patrocinio, 2009) tenha definido seu modelo IEEE LOM como o padro para aplicaes semnticas, o uso do Dublin Core muito difundido pois a Open Archives Initiave (OAI), que promove integrao entre diferentes modelos de metadados o usa para tal. E, a interface promovida a partir da OAI, pode ser utilizada no somente para a coleta de dados (harvesting), como tambm para a populao de ontologias, porm, esse tema detalhado nas sees 5.4 e 5.5.

    Em relao a reasoner ou motor de inferncia a aplicao semntica incorporada ao repositrio por (Kochhann, 2012) utiliza o Hermit. Este motor responsvel por realizar a inferncia no arquivo OWL onde as classes ontolgicas dos OAs esto armazenadas e retornar os OAs selecionados de acordo com os critrios de busca. O motor de inferncia Hermit utilizado na soluo proposta por (Koutsomitropoulos et al., 2009) trabalho relacionado nmero 3. O motor de inferncia Jena (OLIVEIRA, 2009) trabalho relacionado nmero 7 apresenta uma soluo hdrica de busca semntica e por palavra chave e desta forma considerando os objetivos definidos para este projeto no se mostra aplicvel atualmente. O mesmo se aplica a soluo que faz uso combinado do Lucene e Proteg (Giannopoulos, 2010) e aplicada no GoNTogle trabalho relacionado nmero 6.

    O objetivo final reduzir a interao humana na populao da ontologia ontoROAI, automatizando o processo. Visando oferecer a melhor soluo possvel ao ROAI, a pesquisa foi fragmentada e ampliada, buscando no somente por repositrios que faam o uso de semntica e ontologia, como tambm marcadores semnticos e outras aplicaes que se disponham ao uso de ontologia. Porm, importante salientar, que os trabalhos que no apresentam solues automticas no esto alinhados aos objetivos deste projeto, por isso oferecem pouca ou nenhuma contribuio. A gerao automtica precisa compreender todas as fases do processo e a soluo aplicada por

  • (Koutsomitropoulos et al., 2009) se adqua ao objetivo este trabalho. Dessa forma, esse projeto continua baseado na metodologia proposta por Kochhann (2012). As prximas sees apresentam conceitos relacionados ao mtodo de modelagem automtica de objetos para o padro OWL implementado por Koutsomitropoulos (2009) e tambm sua adaptao ao ROAI, pois, assim como Kochhann (2012), o autor tambm tem sua aplicao na interface JSP do Dspace, alm de fazer uso do IEEE LOM combinado com o Dublin Core (DC).

    5.4 OAI-PMH

    De acordo com a documentao do Dspace (Duraspace, 2012), no modelo proposto por Koutsomitropoulos (2009), os dados necessrios a ontologia so populados automaticamente pela coleta de metadados atravs da interface OAI-PMH. OAI-PMH, segundo Garcia (2003), um protocolo da Iniciativa Open Archives (OAI), que proporciona interoperabilidade entre bibliotecas/repositrios digitais e que atravs desse protocolo possvel integrar metadados de mais de uma origem com baixo custo. Os metadados desse protocolo, seguem o padro Dublin Core, o mesmo utilizado no Dspace, que a ferramenta na qual o ROAI tem seu embasamento (plataforma). Conforme o IBICT (2012) o DSpace usa o Protocolo de comunicao da Iniciativa dos Arquivos Abertos (OAI-PMH) verso 2.0 como provedor de dados. Essa aplicao foi desenvolvida usando um software livre da OCLC, o OAICat para conseguir que os itens do DSpace estejam disponveis para serem coletados (harvested). O DSpace@MIT est registrado como um provedor de dados na Iniciativa de Arquivos Abertos. As instituies que decidam implementer o sistema podem escolher ser parte da Iniciativa ou no e registrar-se como provedores de dados na Internet (IBICT, 2012).

    Todos os fatores listados acima contriburam para a escolha do modelo de automatizao proposto por Koutsomitropoulos (2009). Porm, importante salientar que at a implementao desse projeto, a interface OAI no estava acessvel no ROAI (http://roai.joinville.udesc.br), sendo sua disponibilizao parte da nova funo.

    O acesso a interface OAI no Dspace um pouco diferente do acesso a interface XML ou JSP, no qual apenas se informa o endereo do servidor da aplicao.

  • necessrio que se faa uma requisio de informao, diretamente no navegador, assim como apresentada na figura 12.

    Figura 12. Requisio interface OAI

    Para que seja possvel compreender a ao executada na figura 12, preciso entender o funcionamento do protocolo OAI-PMH. Garcia (2003), informa que o OAI-PMH consiste de 6 verbos ou requests (Identify, ListIdentifier, ListMetadataFormats, ListSets, ListRecord, GetRecord), cada um desses verbos tem uma funo especfica:

    Identify: recupera as informaes sobre o provedor de dados ListMetadataFormats: recupera os formatos de metadados disponveis no

    repositrio

    ListSets: lista a hierarquia do repositrio ListRecord: faz a coleta de dados do repositrio ListIdentifier: retorna apenas o cabealho dos registros, pode ser

    classificado como uma verso resumida do ListRecord GetRecord: recupera um nico registro especfico

    Outro fator importante sobre o OAI-PMH, que esse protocolo introduz o conceito de harvesting, que se trata se um processo unilateral, onde periodicamente so realizadas

  • buscas em repositrios cadastrados na interface OAI, para coleta de dados que podem ser exibidos ao usurio. Essa coleta de dados pode ser total ou seletiva de acordo com os dois parmetros abaixo:

    Baseado em data: so coletados apenas metadados inclusos ou alterados depois da data de corte informada

    Baseado em conjuntos: itens so agrupados em uma estrutura opcional com o intuito de serem resgatados em uma coleta seletiva

    No Dspace, necessrio que a funo Harvesting esteja ativa para que a coleta de dados acontea. Essa funcionalidade pode ser ativada ou desativada no painel de controle, por um usurio administrador do repositrio, conforme figura 13.

    Figura 13. Funo Harvesting no Painel de Controle do ROAI

  • O conhecimento conceitual do protocolo OAI-PMH e sua relao estreita com o Dspace essencial para o entendimento de como funciona o modelo de populao automtica de ontologia concebido por Koutsomitropoulos (2009).

    5.5 POPULANDO ARQUIVO DE ONTOLOGIA COM A INTERFACE OAI

    Para a populao do arquivos de ontologia, Koutsomitropoulos (2009) aplica, numa viso simplificada, os seguintes passos:

    Configura a interface OAI-PMH do Dspace para exportar os elementos desejados dos metadados (padro Dublin Core);

    Um arquivo do tipo XLST responsvel definir as ligaes semnticas, utilizando o modelo da ontologia, as informaes do novo objeto e dos objetos j cadastrados e ontologicamente mapeados. As definies so feitas a parte de comparao entre as classes definidas no modelo.

    Um servlet faz a populao automtica do arquivo de ontologia, fazendo uso da coleta realizada pela interface OAI, passando esses dados pelo arquivo XLST e por fim liberando o arquivo de ontologia resultante para uso das funes semnticas do repositrio;

    Nos passos apresentados acima, est implicito o tratamento de comunicao e converso entre os padres LOM e Dublin Core (DC). Embora o padro utilizado no repositrio para armazenamento seja o LOM, Koutsomitropoulos (2009) faz uso do Dublin Core para as funes semnticas. Isso se deve ao fato de que, embora o LOM seja o grupo de metadados oficial para uso de semntica, o Dublin Core o padro utilizado pela proposta de Open Archives Initiave, conforme explicado na sesso 5.4, e o autor propor o uso da coleta automtica de metadados (harvesting) para a populao da ontologia. O uso da interface OAI foi definido com base na premissa definida por Koutsomitropoulos (2009): Manter intacta a modelagem interna dos dados do repositrio, empregando seu facilitador de interperabilidade (OAI-PMH).

  • 5.5.1 Transformando a entrada OAI-PMH em Ontologia OWL

    O arquivo do tipo XLST, chamado por Koutsomitropoulos (ano) de transformation, o cerne da populao automtica de ontologia. Com as entradas recebidas do servlet, o transformation importa um arquivo de ontologia que contem apenas a modelagem ou esqueleto da ontologia, ou seja, com base nele que a funo entende qual o modelo de ontologia a ser seguido. Na aplicao de Koutsomitropoulos, seria necessrio promover nesse ponto, um mapeamento entre os metadados LOM e Dublin Core, passo esse que no necessrio na implementao ao ROAI.

    Conforme a seo 3.4, observa-se que a aplicao de busca semntica do ROAI baseada na proposta de Koutsomitropoulos e no a mesma soluo, o que evidente, por exemplo, se for comparada a entrada de busca semntica do ROAI, apresentada anteriormente na figura 11, com a entrada de busca semntica do repositrio da Universidade de Patras (entidade da qual o Dr. Dimitrios Koustmitropoulos faz parte e para qual a soluo semntica foi modelada) demonstrada na figura 14, em que necessrio sempre fazer o uso da sintaxe Manchester, no formato de uma query como entrada para a busca.

    Figura 14. Repositrio de Objetos Universidade de Patras

  • No caso do ROAI, o usurio informa palavras-chaves e o motor de inferncia realizada o filtro no arquivo de ontologia, e se utilizando das relaes semnticas contidas no arquivo para a produo de resultados consistentes.

    A parte final do transformation responsvel pelo filtro de similaridade semntica, onde so comparadas as propriedades ontolgicas do novo objeto j convertidas com base no modelo, com os objetos j mapeados ontologicamente e armazenados no arquivo de ontologias, nesse ponto, a propriedade relation, que indica forte relao entre os objetos alimentada. Essa propriedade uma das mais importantes no modelo de ontologia do ROAI, sua alimentao falha pode desestruturar completamente a busca semntica, assim, esse ponto da implementao um dos que devem sofrer mais testes at o fim do desenvolvimento desse projeto.

    A figura 15, apresentada abaixo, traz o cdigo responsvel por buscar as informaes na interface OAI e envi-las a funo transformation.

    Figura 15. Envio de informaes ao Transformation

  • Por se tratar de uma funcionalidade nativa do Dspace, a busca de informaes do OAI feita de forma simples, com o uso do verbo ListRecords, j apresentado na seo 5.4. O outro parmetro, &metadataPrefix, serve para identificar o formato no qual o retorno do OAI deve ser feito. Os valores possveis so: qdc que significa Quality Dublin Core ou Dublin Core Qualificado, ou oai_dc que identifica que deve ser retornada uma verso simplificada do Dublin Core. Porm, a verso simplifica no traz todas as informaes necessrias para o mapeamento e populao do arquivo de ontologias, assim, para essa implementao feito uso do qdc.

    5.6 CONSIDERAES GERAIS

    O captulo cinco apresentou, alm dos passos para a implementao da automao do processo de modelagem automtica para o padro OWL atualmente em desenvolvimento, os motivos da escolha do modelo aplicado. A deciso foi modelada a partir do cruzamento dos dados referentes aos trabalhos relacionados versus os objetivos propostos por este trabalho. Alm disso, a soluo proposta viabiliza reuso de fontes da primeira implementao de busca semntica na interface JSP e da implementao de Koutsomitropoulos, para a parte do servlet provedor da automatizao e da funo transformation. Embora a estrutura precise ser convertida afim de ser funcional com a interface XML, em essncia, grande parte das lgicas sero reaproveitadas, fazendo assim uso de semi-componentizao. A componentizao um conceito de engenharia de software cuja premissa o reuso de componentes e funes para vrias aplicaes e/ou projetos (Sommerville, 2007). possvel concluir, dessa forma, que, alm de viabilizar melhorias para o usurio final do ROAI, este projeto tambm preza pela qualidade da aplicao e organizao, com o intuito de facilitar as futuras implantaes de funcionalidades no ROAI.

  • CONCLUSO

    Embora o projeto inicial tenha recebido outras grandes tarefas busca semntica na interface XML e tarefas relacionadas e acrescido muito em nmero de horas, a concluso, at o presente momento, que as novas metas e atividades adicionadas em meio execuo do projeto, podem oferecer ao usurio um ambiente com maior usabilidade, a partir de uma interface mais simples, intuitiva e centralizada, alm da disponibilidade da funo de busca semntica na interface do ROAI. Alm disso, o estudo de fontes e estrutura do Manakin gerou uma nova base de conhecimento que deve ser registrada para ser reaproveitada em projetos posteriores, e tambm foi essencial para o planejamento do desenvolvimento da funo de automatizao da modelagem de objetos de aprendizagem para o padro OWL.

    A funo semntica permite aos usurios resultados com maior qualidade e preciso, auxiliando o processo de ensino-aprendizagem proposto pelo uso do ROAI. A automatizao do processo de populao de ontologias tem sua importncia assegurada no quesito integridade dos dados, pois uma modelagem no consistente pode trazer grandes impactos ao usurio final, ao qual podem ser entregues informaes divergentes ou sem utilidade, forando-o ao filtro manual, muito comum nas buscas por palavras-chaves.

    O curso de Tecnologia em Anlise e Desenvolvimento de Sistemas oferece uma viso mais analtica se comparado ao curso de Bacharelado em Cincia da Computao, se aborda menos tecnologias e linguagens de programao, o foco se centra nos pontos de anlise e gerncia dos projetos. Essas caractersticas foram incorporadas ao projeto, por exemplo, foi utilizado um mtodo gil para o controle das atividades, que eram organizadas por perodos semanais e cujas dificuldades e resultados tambm eram apresentados em reunies semanais. Para o uso desse mtodo foram utilizados os conceitos abordados nas disciplinas de Engenharia de Software e Gerncia de Projeto. O processo de Engenharia Reversa se trata de um conceito tambm abordado em Engenharia de Software.

    Para a modelagem dos requisitos iniciais foram utilizados conceitos trabalhados em Introduo a Anlise. A tratativa de dificuldade encontradas no decorrer do projeto foi feita com base nos conhecimentos adquiridos em Introduo a Anlise, Engenharia

  • de Software, Fundamentos de Sistemas de Informao e Gerncia de Projetos. O uso da linguagem Java para o desenvolvimento de funes resgatou o contedo trabalhado em Linguagens de Programao II. E por fim, com o uso de ferramentas de cdigo aberto, o sistema operacional do servidor da aplicao Linux, especificamente a distribuio Ubuntu 9.04 Server, assim foram utilizados a exausto conceitos de Sistemas Operacionais para que a administrao do servidor fosse eficaz.

    Alm disso, um fator colaborativo para o desenvolvimento desse projeto, foi o perodo de agosto/2011 julho/2012 do qual eu, Bruna, fiz parte do Grupo de Pesquisa em Informtica na Educao GPIE como pesquisadora voluntaria. O projeto trabalhado foi a primeira Busca Semntica no Repositrio de Objetos de Aprendizagem, no qual a busca semntica com o uso de ontologia foi estudada e implementada. Entre as atividades desenvolvidas na poca figuraram:

    Domnio de processo de instalao, manuteno e migrao de dados do ROAI (plataforma Dspace)

    Estudo e domnio dos conceitos de web semntica e ontologia Apoio na modelagem de soluo de busca semntica para o repositrio

    Identificao das customizaes j implementadas no ROAI e seu processo de instalao em novas bases

    Criao da base de produo e testes idntica ao ambiente oficial Com a participao prvia no processo de implementao da busca semntica

    mesmo que na interface JSP no foi necessria a adaptao ao uso do ROAI e novas pesquisas sobre o conceito de busca semntica e ontologia. Porm, ainda assim, houve duas grandes dificuldades, que se mostraram praticamente durante o mesmo perodo e foram responsveis para o inchao do projeto em relao ao nmero de horas:

    ROAI usa por default a interface XML (Ferlin, 2009) e busca semntica utiliza a interface JSP (Kochhann, 2012);

    Volume baixo de projeto relacionados com os objetivos fortemente alinhados ao ROAI (busca semntica com gerao automtica de ontologia em repositrios);

    Contudo, embora o projeto tenha excedido as 240 horas iniciais e ainda continue em desenvolvimento, essas dificuldades j se encontram superadas e colaboraram para engrandecer o conhecimento da equipe sobre solues de repositrio, busca semntica, ontologias e desenvolvimento para web.

  • E alm de prover melhorias ao sistema atual, este projeto apontou caminhos para novas funes e melhorias para o repositrio.

    As intenes de projetos futuros atualmente sugerem (para cada item explicar com mais detalhe:

    Descentralizao do arquivo de ontologia: o arquivo de ontologia atual o mesmo para todo o repositrio, prope-se uma diviso por coleo e/ou comunidade se embasando no fato de que o arquivo ontolgico poder ficar com um tamanho grande o suficiente para tornar o sistema de busca lento de uma forma inaceitvel. Assim, a fragmentao dessas informaes, em arquivos separados, poderia ser uma soluo a esse possvel problema;

    Marcao semntica de documentos (apenas para arquivos de tipo texto): ferramentas como o GoNTogle (IMIS, 2012 trabalho relacionado nmero 6 da seo 5.3) tem produzidos resultados expressivos em relao a busca por objetos do tipo texto que fazem uso da marcao semntica. A proposta para o ROAI a marcao semntica automtica, onde com base nos acessos do usurio precisa ser cadastrado no ROAI o sistema constri, dinamicamente, marcadores para que na busca (semntica) os resultados sejam ainda mais eficazes.

    Opo de busca hbrida (palavra-chave com componentes semnticos): hoje a busca semntica ROAI trata o recebimento de palavras-chave para a inferncia semntica e faz uso do motor Hermit, a proposta que seja feita uma integrao que permita a informaes de palavras-chaves e termos semnticos na mesma busca e que o motor de inferncia por palavras-chave (Lucene) trabalhe integrado ao motor semntico.

    Tratamento de busca avanada (interface similar ao ANEXO A): oferecer ao usurio com conhecimento ou domnio da sintaxe Manchester, a possibilidade de modelar manualmente as prprias queries de busca, porm, a partir de uma interface grfica

    Implementao de outros motores de busca (Pellet e FACT ++): o grupo Semantic Search for Dspace (2012), do qual Koutsomitropoulos (2009) faz parte, prope o uso tambm dos motores de busca Pellet e

  • FACT ++ (Duraspace, 2012), permitindo inclusive que o usurio escolha a engine que deseja utilizar. Assim, proposto que estes outros dois motores sejam implementados no ROAI e seja analisado se h vantagens em oferecer os trs motores (Pellet, FACT++ e Hermit), ou substituir o Hermit por algum deles.

    Alm do valor agregado ao uso do ROAI na instituio UDESC Joinville, este projeto pode vir a contribuir, tambm, para que as mais de cinqentas instituies brasileiras que fazem uso da plataforma Dspace (Dspace, 2012), tenham uma opo conterrnea e na interface XML para a aplicao de busca semntica.

  • ANEXOS

  • ANEXO A:

    Fonte: Semantic Search for Dspace

  • GLOSSRIO

    Os conceitos bsicos apresentados a seguir esto baseados em diversas fontes bibliogrficas.

    CSS Cascading Style Sheets

    FACT++ Fast Classification Terminology ++

    GIMP GNU Image Manipulation Program

    GPIE Grupo de Pesquisa em Informtica na Educao

    GNU GNU is Not Unix

    GTK+ GIMP Toolkit

    IBICT Instituto Brasileiro de Informao em Cincia e Tecnologia

    IEEE

    Institute of Eletric and Eletronic Engineers

    JSP JavaServer Pages

    LOM Learning Object Metadata

    MIT

    Massachusetts Institute of Technology

    OA Objetos de Aprendizagem

    OAI Open Archives Initiative

    OAI-PMH Open Archives Initiative Protocol for Metadata Harvesting

  • OCLC Online Computer Library Center

    OWL Ontology Web Language

    RDF

    Resource Description Framework

    ROAI Repositrio de Objetos de Aprendizagem para a rea de Informtica

    UDESC Universidade do Estado de Santa Catarina

    URI Uniform Resource Identifiers

    URL Uniform Resource Locator

    W3C World Wide Web Consortium

    XLS XML Spreadsheet

    XLST eXtensible Stylesheet Language Transformations

    XML

    eXtensible Markup Language

  • REFERNCIAS BIBLIOGRFICAS

    BERNERS-LEE, T; Semantic Web Road map. A road map for the future, an architectural plan untested by anything except thought experiments. W3C, 1998.

    BERNERS-LEE, T; HENDLER, J; LASSILA, O. The Semantic Web. A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities. Scientific American, Maio 2001.

    DSPACE. Sistema Gerenciador de Repositrios Digitais DSpace. www.dspace.org, (Acesso 5 de outubro de 2012).

    DURASPACE. Suporte Dspace. Diponvel em: (acesso em 14 de outubro de 2012)

    FERLIN, J. Repositrio de objetos de aprendizagem para a rea de informtica. 2009. Universidade do Estado de Santa Catarina UDESC. Trabalho de concluso de curso.

    GARCIA, Patricia de Andrade Bueno ; SUNYE, Marcos Sfair . O PROTOCOLO OAI-PMH PARA INTEROPERABILIDADE EM BIBLIOTECAS DIGITAIS. In: I Congresso de Tecnologias para Gesto de Dados e Metadados do Cone Sul, 2003, PONTA GROSSA. ANAIS DO I CONGRESSO DE TECNOLOGIAS PARA GESTO DE DADOS E METADADOS DO CONE SUL - CONGED, 2003. v. 1.

    GIANNOPOULOS G., BIKAKIS N., DALAMAGAS T., SELLIS T.: "GoNTogle: A Tool for Semantic Annotation and Search" (Demo). In Proc. of 7th Extended Semantic Web Conference (ESWC 2010)

  • IBICT. Instituto Brasileiro de Informao em Cincia e Tecnologia. Disponvel em (Acesso 21 de outubro de 2012).

    KEMCZINSKI, A; FERLIN, J; MURAKAMI, E; HOUNSELL, M. Metadados

    Essenciais: Uma Metodologia para Catalogao de Objetos de Aprendizagem no Repositrio Digital ROAI. WIE XVI Workshop Sobre Informtica na Escola, 2010.

    KOUTSOMITROPOULOS, D; SOLOMOU, G; ALEXOPOULOS, A;

    PAPATHEODOROU, T. Semantic Web Enabled Digital Repositories. Int. Journal on Digital Libraries, 10 (4): 179-199. Springer, 2010.

    KOUTSOMITROPOULOS, D; SOLOMOU, G; ALEXOPOULOS, A;

    PAPATHEODOROU, T. Semantic Metadata Interoperability and Inference-Based Querying in Digital Repositories. Journal of Information Technology Research, 2 (4): 36-52, 2009.

    KOUTSOMITROPOULOS, D; SOLOMOU, G; PAPATHEODOROU, T. Metadata

    and Semantics in Digital Object Collections: A Case-Study on CIDOC-CRM and Dublin Core and a Prototype Implementation. Journal of Digital Information, 10 (6), 2009.

    KOUTSOMITROPOULOS, D; SOLOMOU, G; ALEXOPOULOS, A; PAPATHEODOROU, T. Semantic Metadata Interoperability and Inference-Based Querying in Digital Repositories. Journal of Information Technology Research, 2 (4): 36-52, 2009.

    KOUTSOMITROPOULOS, D; SOLOMOU, G; PAPATHEODOROU, T. Innovations in

    Information Technology, IIT 2008, International Conference, p. 233-237, 2008.

    PROTEG SOFTWARE. Disponvel em (Acesso em 7 de outubro de 2012).

  • KOCHHANN, Fbio Haertel; KEMCZINSKI, Avanilde. Busca semntica no repositrio de objetos de aprendizagem. 2012. 104 f. : TCC (graduao) - Universidade do Estado de Santa Catarina, Curso de Cincia da Computao, Joinville, 2012 .

    Semantic Search for Dspace. Disponvel em: . Acesso em 30 de outubro de 2012.

    SOMMERVILLE, Ian. Engenharia de software, 8 edio. Traduo: Selma Shin ShimizuMelnikoff, Reginaldo Arakaki, Edilson de Andrade Barbosa. Reviso tcnica: KechiKirama. So Paulo, Pearson Addison-Wesley, 2007.

    UDESC Joinville. Disponvel em (Acesso 5 de outubro de 2012)

    UDESC Joinville. Disponvel em (Acesso 7 de outubro de 2012)

    W3C. World Wide Web Consortium. Disponvel em . (Acesso 7 de outubro de 2012).

    WOLL, Filipe Ventura; KEMCZINSKI, Avanilde. Processo para avaliao de objetos de aprendizagem no roai utilizando Workflow. 2011. 98 f. : TCC (graduao) - Universidade do Estado de Santa Catarina, Curso de Cincia da Computao, Joinville, 2011.