57
VÂNIA MARA ALVES LIMA CIBELE A.CAMARGO MARQUES DOS SANTOS MARILDA LOPES GINEZ DE LARA GABRIELA PREVIDELLO ORTH ECA/USP ONTOBRAS 2015 7TH BRAZILIAN CONFERENCE ON ONTOLOGIES SEPTEMBER 8 - 11, 2015 - SAO PAULO - BRAZIL HTTP://ONTOBRAS.IME.USP.BR Tesauro: um tipo de ontologia

Tesauro: um tipo de ontologia - Instituto de Matemática e ...ontobras/wp-content/uploads/2017/04/Ontobras... · coisas ou eventos, e uma instância individual da classe, a qual é

  • Upload
    dothuy

  • View
    215

  • Download
    0

Embed Size (px)

Citation preview

V Â N I A M A R A A L V E S L I M A

C I B E L E A . C A M A R G O M A R Q U E S D O S S A N T O S

M A R I L D A L O P E S G I N E Z D E L A R A

G A B R I E L A P R E V I D E L L O O R T H

E C A / U S P

O N T O B R A S 2 0 1 57 T H B R A Z I L I A N C O N F E R E N C E O N O N T O L O G I E S

S E P T E M B E R 8 - 1 1 , 2 0 1 5 - S A O PA U L O - B R A Z I LH T T P : / / O N T O B R A S . I M E . U S P. B R

Tesauro: um tipo de ontologia

Universo conceitual

A todo e qualquer campo de conhecimento corresponde um conjunto de conceitos que lhe é próprio.

O sistema conceitual de uma área constitui-se em um parâmetro básico para a sustentação dos tesauros.

Conceitos são representados por termos descritores

No momento de estruturar os conceitos e suas diversas relações o contexto em que o termo aparece deve ser levado em conta

2

Tesauro

Uma lista de termos em que se indica a sua classificação de acordo com as ideias que eles representam.

Estrutura lógica de uma área de conhecimento específica ou geral

Estrutura semântica fortemente constituída com base nas unidades léxicas que compõe seu vocabulário

Princípios e métodos da coleta de termos

Conhecimento prévio do domínio

Observação do campo conceitual

Processo para seleção dos termos

dedução

indução

4

Fontes para seleção de termos

Fontes primárias: representadas pelo conhecimento que está expresso em linguagem natural.

Lista de pesquisas retrospectivas e perfis de interesse;

Discussões com usuários em potencial (identificar interesses e determinar possíveis pesquisas);

Reunião de documentos representativos da área específica do tesauro para discussão e eleição dos termos pelos especialistas;

Indexação de documentos pelos especialistas e pelos indexadores

5

Fontes para seleção de termos

Fontes secundárias: representadas por comunicações sintetizadas do conhecimento, apresentando uma interpretação estruturada nas representações documentárias.

Listas de descritores, esquemas de classificação, outros tesauros;

Tratados de terminologia do campo de assunto específico;

Enciclopédias, dicionários, glossários;

Sumários e índice de manuais e livros técnicos

Índices e abstracts de publicações periódicas

Índices de outros tipos de publicações na área.

6

Processo indutivo (Garantia literária)

Processo onde as hierarquias são construídas a partir dos termos coletados na literatura, até se obter máximos gêneros e mínimas espécies, que darão origem às classes gerais ou facetas principais.

Termos específicos Categorias

Método de construção contínuo

7

Processo dedutivo (Endosso do usuário)

Consulta aos especialistas no assunto para selecionar os termos que irão compor a estrutura tesauro

Justificativa é a garantia dos produtores e usuários do sistema de informação.

As espécies são incluídas a partir da definição, baseada no conhecimento das classes gerais ou facetas principais.

8

9

Dodebei (2002, p.66)

Método Hipotético Dedutivo

Documentos que entram no sistema + Perguntas dos usuários

Dodebei (2002, p.68)

TESAURO

Garantia literária

Endosso dousuário

10

Estruturação do Tesauros11

Categorização da área

Classificação dos termos nas categorias

Indicação de relações entre termos

Decisões: limitação de número de níveis hierárquicos; associação de termos restrita dentro de níveis hierárquicos criados, poli-hierarquia para termos

Categorização

Subdivisão por faceta: ação, processo, materiais, ser vivo, equipamento, propriedade, etc. (CRG)

Subdivisão por temas: considera disciplinas e áreas do conhecimento

Matemática Álgebra, Aritmética, Geometria

Classificação dos termos nas categorias

Os termos devem ser inseridos nas categorias de acordo com o campo semântico ao qual pertencem, isto é, devem ser inseridos no campo semântico que contem termos com os quais compartilham relações de significado.

Campo semântico: conjunto de unidades léxicas, ligadas por uma estrutura de relações de significado que permite precisar a significação de cada uma dessas unidades.

Relações entre os termos14

De Equivalência: fornece termos substitutivos de indexação e busca

Hierárquicas: exprimem o posicionamento de um conceito em relação a termos mais amplos ou específicos

Associativas: ocorre entre termos que não são equivalentes e tampouco forma uma hierarquia, mas são tão associados mentalmente, que essa relação deverá ser esclarecida no tesauro.

Relacionamento de equivalência15

Ocorre entre termos preferidos e não preferidos

Teoria das equações (termo preferido)

UP Equações algébricas (termo não preferido)

Onde,

Equações algébricas USE Teoria das equações

Relações hierárquicas16

Gênero/Espécie: entre uma classe ou categoria e seus membros ou espécies

Aves

TEG Papagaios

Papagaios

TGG Aves

Relações hierárquicas17

Todo/parte: entre uma parte do sistema e o sistema

Sistema cardiovascular

TEP Coração

Coração

TGP Sistema cardiovascular

Relações hierárquicas18

De Instância: entre um conceito geral, classe de coisas ou eventos, e uma instância individual da classe, a qual é frequentemente representada por um nome próprio

Regiões montanhosas

TEI Alpes

Alpes

TGI Regiões montanhosas

Relações associativas19

Ocorre entre conceitos que não estão relacionados hierarquicamente mas estão relacionados semanticamente.

Barcos

TR Navios

Navios

TR Barcos

Relações associativas20

Disciplina / objeto de estudo Silvicultura / Florestas

Operação ou Processo / Agente ou Instrumento Controle de temperatura/Termostato

Ação / Produto da ação tecelagem/roupas

Ação/alvo colheita/cultivo

Relações associativas21

Materiais / Propriedades veneno / toxicidade

Artefato /Partes instrumentos óticos/lentes

Causa/ Efeito morte/perda

Objeto / Contra-agente planta/herbicida

Relações associativas22

Conceito / Unidade de medida corrente elétrica / ampere

Nome composto / Nome que deu origem fóssil de réptil / réptil

Organismo ou substância / seus derivados mulas/burros

Coordenação e Subordinação23

S Ciências Puras (gênero maior)

C

Matemática Física Química

Aritmética

Número decimais (menor espécie)

Relacionamentos entre conceitos24

Coordenação de classes ou relacionamento sintagmático (Eixo C)

Observa-se o uso de uma característica de cada vez para a derivação de um conceito (regras da divisão lógica) resultando em classes associadas ou coordenadas: relação sintagmática

Subordinação de classes ou relacionamento paradigmático (Eixo S)

Conteúdo de uma idéia (Intensão) + o conjunto de sujeitos a que a idéia convém (Extensão)

Abrangência do termo25

O escopo do termo é restrito ao significado dentro do domínio do vocabulário controlado.

Termos homógrafos necessitam de qualificadores para esclarecer seu sentido .

Regras para o uso de qualificadores26

a) um termo composto pode ser usado no lugar de um termo simples com qualificador se ocorre em LN

a) Tolerância religiosa no lugar de Religião (Tolerância)

b) Um qualificador deve ser adicionado a cada homógrafo.

a) Manga (Fruta) Manga (Vestuário)

c) Quando um termo é usado em um sistema de busca multidisciplinar .

a) Aborto (Medicina)

b) Aborto (Crime)

Regras para o uso de qualificadores27

d) Para termos com sentido ambíguo.

Mercúrio (Planeta)

Mercúrio (Metal)

Mercúrio (Deus romano)

UM TESAURO É UM TIPO DE ONTOLOGIA ?

28

(SOUZA, TUDHOPE, ALMEIDA, 2010)

O conceito Knowledge Organization System

29

Termo adotado pela International Society ofKnowledge Organization (ISKO) (...) seufuncionamento na Web Semântica exigeformalização específica, de modo a torná-losidentificáveis e interoperáveis. LARA

De uma simples lista de termos para estruturas deduas dimensões que empregam hierarquias até asmultidimensionais, como no caso das redessemânticas com estruturas e relacionamentos maiscomplexos e completos. (CARLAN, 2010)

UM TESAURO É UM TIPO DE ONTOLOGIA ?

30

Segundo Hodge (2000) as características principais dos KOS são definidas por:

estrutura, relacionamento entre termos, função e complexidade

Lista de termos (Lista de autoridades, Glossários, Dicionários), Classificações e categorias (Cabeçalho de assunto; Esquemas de

classificação, Taxonomias e Esquemas de categorização) Lista de relacionamentos (Tesauros, Redes semânticas, Ontologia)

Segundo Hjørland (2007)

Mapas Bibliométricos, Mapas Conceituais, Hipertextos, Topic maps (ISO 13250,) Folksonomias

31

UM TESAURO É UM TIPO DE ONTOLOGIA ?

UM TESAURO É UM TIPO DE ONTOLOGIA ?

32

Na concepção das linguagens documentárias otesauro é o instrumento que possui maiorfamiliaridade e relacionamento com as ontologiaspor serem linguagens de estruturas combinatórias,de caráter especializado, constituídos por termosprovidos de suas relações semânticas quepossibilitam a representação temática do conteúdode um documento, bem como sua posteriorrecuperação.

33

Estrutura lógico-semântica.

O conjunto das noções de umdeterminado domínio seapresenta na vertical (relaçõeshierárquicas), as quais se agregamàs unidades informacionais que serelacionam horizontalmente(relações não hierárquicas).

Assim, as relações hierárquicas seapresentam como relações lógicasentre os termos, e as não-hierárquicas se associamsemanticamente.

Assim como os tesauros, as

ontologias também são

compostas a partir de um

conjunto de termos

estruturados

hierarquicamente, formando,

desta maneira, uma estrutura

de classes e subclasses.

Tesauros Ontologias

34

Limitações quanto às

possibilidades de exploração de

determinados conteúdos

informacionais; não têm

suficientemente expressividade

que permita representar

relações semânticas mais ricas

entre os conceitos.

Possibilitam descrever níveis

de relacionamentos mais

avançados e que podem ser

processados de forma

automatizada por

computadores, permitindo ao

usuário rotular os

relacionamentos.

Tesauros Ontologias

35

Domínio específico

Linguagem SKOS

Suporte na construção de ontologias de aplicação e de domínio

Origem remete a campos científicos como a Terminologia

Estabelecidos por normas internacionais

Múltiplos domínios

Linguagem OWL

Promove ponte entre domínios e é eficiente no alinhamento de tesauros (artigo ISKO);

Origem remete a subárea de Inteligência Artificial

Não existe normas de desenvolvimento consolidadas.

Tesauros Ontologias

36

Tanto as ontologias quanto os tesauros são sistemasde organização do conhecimento com distintos níveisde estrutura, a diferença se dá na especificidade dasrelações na ontologia.

UM TESAURO É UM TIPO DE ONTOLOGIA ?

Normas para Tesauro37

ONTOBRAS 2015

Normas para Tesauro38

ONTOBRAS 2015

SKOS (Simple Knowledge Organization System)

39

Ontologias que tem alcançado êxito no âmbito da Web Semântica. modelo para representar a estrutura básica e o conteúdo de

esquemas de conceitos. aplicação simples e rápida (quando a base é um tesauro já

estruturado), e em comparação com outras soluções com XML ad-hoc e topic maps.

estende-se a vocabulários controlados, classificações, cabeçalhos de assunto, taxonomias, glossários, etc.

Formalmente é uma ontologia OWL-full que permite representar qualquer tipo de sistema de organização do conhecimento mediante RDF.

Os elementos são representados por conceitos entre os quais são estabelecidas relações semânticas hierárquicas e associativas.

ONTOBRAS 2015

SKOS (Simple Knowledge Organization System)

42

Aos conceitos são associadas etiquetas em diferentes idiomas:

etiquetas de termos preferidos que são equivalentes aos descritores em um tesauro onde um mesmo conceito só pode ter uma etiqueta preferida em cada idioma;

etiquetas de termos alternativos são similares aos não-descritores e permitem enriquecer semanticamente um vocabulário definindo vários pontos de acesso a um conceito;

etiquetas com informações ocultas, que não são visíveis diretamente aos usuários, e que podem ser utilizadas para processamento de aplicações em informática.

ONTOBRAS 2015

Elementos de SKOS43

ONTOBRAS 2015

(PASTOR-SÁNCHEZ; MARTÍNEZ-MÉNDEZ, RODRÍGUEZ MUÑOZ, 2012 )

44

Pela extensão SKOS-XL é possível definir relações entre etiquetas, por exemplo, siglas ou empréstimo

linguístico.

Podem definir esquemas de conceitos e coleções. Os esquemas agrupam conceitos associados a um campo semântico

ou área do conhecimento.

As coleções permitem criar grupos de conceitos que complementamas estruturas de relações semânticas hierárquicas.

Um mesmo conceito pode ser parte de várias coleções.

SKOS possui propriedades que permitem relacionar um conceito com um ou vários esquemas

(interoperabilidade)

especificar o cabeçalho de uma estrutura hierárquica (top concept).

ONTOBRAS 2015

Interoperabilidade45

ONTOBRAS 2015

(PASTOR-SÁNCHEZ; MARTÍNEZ-MÉNDEZ, RODRÍGUEZ MUÑOZ, 2012 )

Interoperabilidade46

ONTOBRAS 2015

Interoperabilidade

ONTOBRAS 2015

47

Interoperabilidade

ONTOBRAS 2015

48

Atividades práticas49

Coleta e seleção de termos

Lista de termos

Categorização da área

Classificação dos termos nas categorias

software para mapas mentais ou mapas conceituais.

Indicação de relações entre termos

software para tesauros: Tematres, Multithes

ONTOBRAS 2015

Coleta de Termos

ONTOBRAS 2015

50

Termo Candidato

Sinônimo Definição Fonte Domínio

Ontologias Uma forma de representação do conhecimento, conjunto de tipos, propriedades e relacionamentos, por meio dos quais é possível identificar relações, significados e contextos.

GARSHOL, L. M. Metadata? Thesauri? Taxonomies? Topic maps! Making sense of it all. Journal of Information Science, v.30, n.4, 2004, p. 378-391.

Ciência da Computação

Coleta de Termos

ONTOBRAS 2015

51

Termo Candidato

Sinônimo Definição Fonte Domínio

Aprendizado computacional

Aprendizado por máquina

Conjunto de métodos que podem detectar padrões em dados automaticamente para depois usar os padrões descobertos para predizer dados futuros.

CAMPOS JUNIOR, A. R. de eCAMARINHA,D. A. M.Algoritmo K-MEANS.

http://www.ime.usp.br/~arcjr/machine/

Ciência da Computação

Coleta de Termos

ONTOBRAS 2015

52

Termo Candidato

Sinônimo Definição Fonte Domínio

Sistemasespecialistas

Sistemas especialistas são sistemas computacionais que resolvem problemas de forma similar ao modo como um especialista humano os resolveria, com capacidade de decisão específica.

SELLITTO, M. A. Inteligência artificial: uma aplicação em uma indústria de processo contínuo.Gestão e produção, v.9, n.3, p.363-376, dez. 2002.

Ciência da Computação

Lista de termos

ONTOBRAS 2015

53

Agentes inteligentesAnálise de textoAprendizado computacionalAquisição de conhecimentoCiência da computaçãoEngenharia de conhecimentoEstatística para inteligência artificialInteligência artificialLinguagem naturalOntologiasReconhecimento de caracteresReconhecimento de escritaReconhecimento de imagemReconhecimento de objetosReconhecimento de padrõesReconhecimento de textoReconhecimento de vozRedes neuraisRepresentação de conhecimentoSíntese de falaSistemas baseados em conhecimentoSistemas especialistasSistemas multiagentesSistemas tutores inteligentesTradução automática

Termos categorizados

ONTOBRAS 2015

54

Lista de termos hierarquizada

ONTOBRAS 2015

55

Ciência da computaçãoInteligência artificial

Aprendizado computacionalRepresentação de conhecimento

OntologiasSistemas multiagentes

Agentes inteligentesSistemas tutores inteligentesSistemas baseados em conhecimento

Aquisição de conhecimentoEngenharia de conhecimentoSistemas especialistas

Estatística para inteligência artificialLinguagem naturalTradução automáticaSíntese de falaAnálise de texto

Redes neuraisReconhecimento de padrões

Reconhecimento de caracteresReconhecimento de escritaReconhecimento de imagemReconhecimento de objetosReconhecimento de vozReconhecimento de texto

Tematres56

http://www.eca.usp.br/ontotesauros

http://www2.eca.usp.br/mapasconceituais/vocab/index.php

http://vocab.sibi.usp.br/pt-br/index.php

Referências57

BOCCATO, Vera R. C.; Ramalho, R. A. S.; Fujita, M. S. L. A contribuição dos tesauros na construção de ontologias como instrumento de organização e recuperação da informação em ambientes digitais. // Ibersid. (2008) 199-209. ISSN 1888-0967.

CARLAN, E. Sistemas de Organização do Conhecimento: uma reflexão no contexto da Ciência da Informação. 2010. Dissertação (Mestrado) Faculdade de Economia, Administração, Contabilidade e Ciência da Informação e Documentação, UnB, 2010.

DODEBEI, Vera. Tesauro: linguagem de representação da memória documentária. Niterói: Intertexto; Rio de Janeiro: Interciência, 2002.

Hjørland, B. Semantics and knowledge organization. ARIST v.41, n.1, p. 367-405, 2007. HODGE, G. Systems of Knowledge Organization for Digital Libraries: Beyond Traditional Authority

Files. 2000. Disponível em www.clir.org/pubs/abstract/pub91abst.html. Acessado em 10 ago 2015.

ISSO

LEISE, F. Controlled vocabularies: an introduction. The Indexer, v. 26, n. 3, p. 121-126, 2008.

PASTOR-SÁNCHEZ, J.; MARTÍNEZ-MÉNDEZ, F.;RODRÍGUEZMUÑOZ, J. Aplicación de SKOS para la interoperabilidad de vocabulários controlados en el entorno de linked open data. El profesional de la información, v. 21, n. 3, p. 245-253, mayo-junio 2012.

SOUZA R, TUDHOPE D, ALMEIDA, M. Towards a taxonomy of KOS: Dimensions for classifying Knowledge Organization Systems (an extended and revised version of a paper presented at the 2010 ISKO Conference in Rome). Disponível emhttp://mba.eci.ufmg.br/downloads/Souza_Tudhope_Almeida_-_KOS_Taxonomy.Submitted.pdf. Acessado em 10 ago 2015.

ZENG, M.L. Knowledge Organization Systems. Knowledge. Organization. v. 35, n.2-3, p.160-182, 2008