21
InfoLab - Laboratório de Sistemas de Informação - FEUP/INESC TEC 7ª Conferência Luso-Brasileira sobre Acesso Aberto 2016 Vocabulários controlados na descrição de dados de investigação no Dendro Yulia Karimova [email protected] Faculdade de Engenharia da Universidade do Porto/ INESC TEC

Vocabulários Controlados na Descrição de Dados de Investigação no DENDRO

Embed Size (px)

Citation preview

Apresentao do PowerPoint

Vocabulrios controlados na descrio de dados de investigao no DendroYulia [email protected] de Engenharia da Universidade do Porto/ INESC TEC

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Boa tarde a todos, o meu nome Yulia e fao parte de grupo de investigadores ligados a gesto de dados de investigao na Universidade do Porto.

2

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Com aumento da reutilizao dos dados de investigao a gesto de dados cada vez mais valorizada. Metadados neste contexto tem um papel fundamental, pois dados com descrio mais detalhada so mais fceis de interpretar e reutilizar.

Mas o processo da descrio de dados exigente e demorado e pode desmotivar os investigadores na descrio de dados.

3

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016A falta de tempo, ferramentas adequadas, conhecimentos tambm complicam a descrio de dados.

Por isso importante fornecer as ferramentas que simplificam o processo de criao de metadados.

4

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Reconhecendo essas dificuldades, estamos a desenvolver a plataforma Dendro, que ajuda na organizao e documentao dos dados.

5

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016O Dendro consiste numa interface web e facilita a descrio dos dados com a utilizao de vrios esquemas de metadados existentes, por exemplo Dublin Core,

E tambm descritores criados para domnios de investigao especficos, como por exemplo Produo de Hidrognio.

6

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Os objetivos do meu trabalho sa:simplificar e normalizar a descrio de dados na plataforma Dendro.De forma a motivar o interesse dos investigadores na organizao dos seus dados. Contribuir para melhoria da qualidade dos metadados

7

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Neste contexto os vocabulrios controlados apresentam-se como uma boa ferramenta, porque podem definir o contedo admissvel para cada descritor, contribuindo assim para a simplificao de introduo de conteudo e controlo de qualidade.

8

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Colaborao com investigadores muito importante. Pois, s eles podem indicar quais descritores e quais conceitos para vocabulrios lhes faam mais sentido e quais so mais utilizveis, assim ajudando a modelar as ontologias.

9Produo de Hidrognio

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016O primeiro dos projetos selecionados como caso de estudo o pequeno grupo de investigadores de dominio de Produo de Hidrognio que partilharam os seus dados atravs de email e guardaram os nos discos externos.

10

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Durante entrevistas com investigadores foram identificados as necessidades e dificuldades deste grupo na gesto dos dados. Assim foram definidos os descritores para este domnio, criada ontologia, implementada no Dendro e realizada uma srie de experiencias da descrio de dados.

11

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Os resultados mostraram existncia dos erros sintticas e gramaticais, descrio incompleta, tal por exemplo Ovoid e Egg Reactor o mesmo tipo de reactor, mas essa descrio incompleta pode dificultar interpretao e reutilizao dos mesmos.

12

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Para diminuir os erros e ter descrio mais completa, em conjunto com os investigadores foram escolhidos os descritores para criao de vocabulrios controlados e definidos os conceitos para determinado descritor.

13

Annotation Property

hasAlternative

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Analisando vrios estudos e exemplos de ontologias com vocabulrios controlados decidiu-se modelar os atravs de Annotation Property. Foi criada has Alternative que uma das alternativas possveis para o valor de um descritor como conceito de vocabulrio controlado.

14

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Aps a implementao da ontologia, os descritores com vocabulrios controlados apaream no Dendro de forma de listas de escolhas com conceitos definidos.

Assim o investigador abrindo a lista de vocabulrios controlados, pode com facilidade escolher o conceito certo para a descrio dos seus dados.

15

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Para avaliao de qualidade de descrio, baseamos na literatura e escolhemos as mtricas mais apropriados ao nosso estudo e realizamos srie de analises: uma sem uso de vocabulrios controlados, outro com uso dos mesmos.

16

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016A comparao dos resultados de anlises mostra que a maioria dos valores aplicando as mtricas definidas subiram.

Por exemplo, o valor de qualidade de metadados de descritor Reactor Type, aplicando a mtrica Correctness passou de 28% para 100%.

17

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016No geral podemos dizer que a qualidade da descrio aps a implementao dos vocabulrios controlados melhorou.

As experincias deixaram os investigadores satisfeitos com a usabilidade da plataforma. Contudo,

18

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016os investigadores afirmaram que a utilizao de vocabulrios controlados facilitou o processo da descrio.

Utilizando praticamente a mesma quantidade de descritores tempo da tarefa da descrio diminuiu.

19

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Baseando nestes resultados podemos afirmar que os objetivos foram alcanados.

A descrio efetuada com uso de vocabulrios controlados simplificou todo o processo de criao de metadados, permitiu obter descries mais completas e corretas, sem o aumento do tempo necessrio para o efeito.

20exemplo:Expresses Regulares

Annotation Property hasRegEx hasErrorMessage

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Uma das perspetivas de trabalho futuro elaborao de expresses regulares, que tambm pode reduzir o esforo manual na introduo da informao e ajudar na qualidade de dados.

21Muito obrigada!

Dados de investigaoMetadadosDendroMotivao de investigadoresDesafios na gesto de dados de investigaoVocabulrios controladosSimplificao de processo de descrioQualidade de metadados

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Alem disto, vamos continuar colaborar e realizar mais experiencias com investigadores de outros domnios, obtendo assim mais informao que ajuda nos continuar melhorar o Dendro e essa colaborao ajuda familiarizar e aumentar interesse dos investigadores nas atividades, ligadas ao gesto de dados de investigao.

Muito obrigada.