Upload
internet
View
107
Download
0
Embed Size (px)
Citation preview
Interoperabilidade Semânticano Governo Eletrônico:
Informação Legislativa e Jurídica
João LimaSenado Federal / Prodasen
Tópicos
• O Problema– Interoperabilidade Semântica
• Entidades• Assunto
• O caminho para a solução – Ranganathan
• Plano das idéias• Plano verbal• Plano notacional
Quatro Tipos de Heterogeneidade
Ouksel & Sheth (2004):• Sistema
– incompatibilidades entre hardware e sistemas operacionais• Sintática
– diferenças na codificação e representação• Estrutural
– variações nos modelos de dados, estruturas de dados e esquemas
• Semântica– Inconsistências na terminologia e significados
Problema• Cada Sistema de Informação possui
– seu próprio modelo de dados • estrutura / semântica
– sua própria forma de codificar • encoding
• Sintática– Fácil de resolver:
• XML + Unicode + encoding scheme
• Semântica / Estrutural– Não é resolvido pelo
• XML + Unicode + encoding scheme
Semantic Interoperability
• Semantic interoperability is characterized by the capability of different information systems to communicate information consistent with the intended meaning of the encoded information (as intended by the creators or maintainers of the information system).
(Patel et. al, 2005)
2 Sistemas - Mapeamento
Sistema 1Modelo A
Sistema 2Modelo BA Mapeamento B
A1 = B1A2 || A3 = B2A4 = Func(B4)
n Sistemas – Mapeamento x
Sistema 1Modelo A
Sistema 6Modelo F
Sistema 2Modelo B
Sistema 3Modelo C
Sistema 5Modelo E
Sistema 4 Modelo D
Mapeamento
A falta da interoperabilidade
• Provoca o problema dos– silos de informação
• Fontes de Informações heterogêneas que não podem ser– pesquisadas
• com precisão• com opções avançadas
– comparadas– combinadas – migradas– etc
Em suma,
• “The overall objective of semantic interoperability is to support
complex and advanced, context-sensitive query processing
over heterogeneous information resources.”
(Patel et al., 2005)
Acordo Semântico
Sistema 1Modelo A
Sistema 6Modelo F
Sistema 2Modelo B
Sistema 3Modelo C
Sistema 5Modelo E
Sistema 4 Modelo D
Modelo Comum
O caminho para a Solução
Qual é esse modelo comum?
DC ?
• Não, não é o Dublin Core• Problemas do DC
– Foco no Recurso– Estrutura flat– Não trata adequadamente os
eventos temporais– Top-Down Approach
• 15• Qualificadores
– (abandonado pelo DCC)
DC1DC2
DC.Date
1995 - The date of publication
1998 - A date associated with the creation or availability of the resource.
1999 - A date associated with an event in the life cycle of the resource.
2000 – [Qualifers] created, valid, available, issued, modified
2002 – [Qualifers] accepted, submitted, copyrighted
2006 - A point or period of time associated with an event in the lifecycle of the resource.
p
c a
e’’...
c
...v a i m
e e’
e’’e e’
...c v a i m
e’’e e’
a s c
c v a i m
e’’e e’
a s c
s’ e’ e’ s’
8 8
...
SW Cake?
• Não, não é o Semantic Web Cake.– “When Tim Berners Lee first outlined his vision of a semantic web at
WWW 7 (Brisbane, 1997), he focused on using logic to ensure which things were true and which things were not, in order that one could trust what was being shared.
– The following year at WWW8 (Toronto, 1998), this aspect of reliability was underlined. The semantic web was presented as synonymous with a web of trust.
– In the course of the next years (1999-2001) there was increasing emphasis on acronyms and on trust with respect to transactions.”
(Kim Veltman)
• “By contrast, culture faces a much larger challenge, namely, to represent changes in ways of knowing; changing meanings in different places at a given time (synchronically) and over time (diachronically). Culture is about both objects and the commentaries on them; about a cumulative body of knowledge; about collective memory and heritage.” (K. Veltman)
Core ontology?• Sim, é uma core ontology.• Comprometimento ontológico
– Vocabulário comum• “Recently, more and more projects and theoreticians
support the use of formal ontologies as common conceptual schema for information integration” (Doerr)
• Grande Economia– Reuso (não tem que começar do zero)
• Tipos de ontologia– Terminological Ontologies
• Grandes, conceitos, isA , domain-specific– Core Ontology
• Concisas, esquemas de dados, isA + outros, genérico
ISO 21127:2006 CIDOC - Conceptual Reference Model
Por que esta ontologia?• Suficientemente genérica e flexível• Foco no evento e não no recurso• Bottom-Up Approach (criação)
– Museus, Arquivos e Bibliotecas (Instituições de Memória)• Separa a discussão da terminologia da parte essencial da ontologia
– “keep the basic ontology in a manageable size.”• Trata
– Nomes, Identificadores, Títulos– Período, Evento, Atividade– Pessoa, Organização– Tipos, Objetos Físicos e Conceituais, Localidades– Obras, Expressão, Manifestação
• The CIDOC CRM is a formal ontology intended to facilitate the integration, mediation, and interchange of heterogeneous cultural heritage information.
• It was developed by interdisciplinary teams of experts, coming from fields as diverse as computer science, archaeology, museum curation, history of arts, natural history, library science, physics and philosophy, under the aegis of the International Committee for Documentation (CIDOC) of the International Council of Museums (ICOM).
• Museus – 5 % das classes/relacionamentos
ISO 21127:2006 CIDOC - Conceptual Reference Model
Como foi criada• It started bottom-up, by reengineering and
integrating the semantic contents of a multitude of database schemata and documentation structures from all kinds of museum disciplines, archives, and more recently libraries.
• Iniciou em 1996• Tamanho
– 80 classes– 128 propriedades
• Representa a semântica de centenas de esquemas
Actors Events Objects
extractedfactual knowledge
(network)
“Categorical data”(Thesauri) extentthe core ontology
Sources and
metadata
Factual BackgroundKnowledge /“Authorities”
Core Ontology/CRM
relationships,language neutral,
global
terms, multilingual, domain specific
Conceptual Reference Model - Architecture
The CIDOC CRMTop-level Entities relevant for Integration
participate in
E39 Actors
E55 Types
E28 Conceptual Objects
E18 Physical Thing
E2 Temporal Entities
E41
App
ella
tions
affect or / refer to
refer to / refine
refe
r to
/ id
entif
ie
location
atwithinE53 Places
E52 Time-Spans
Actors Events Objects
extractedfactual knowledge
(network)
“Categorical data”(Thesauri) extentthe core ontology
Sources and
metadata
Factual BackgroundKnowledge /“Authorities”
Core Ontology/CRM
relationships,language neutral,
global
terms, multilingual, domain specific
Conceptual Reference Model - Architecture
KOS - Instâncias
• KOS– Vocabulários– Classificações– Taxonomias– Authority Lists– Tesauro
• W3C SKOS – Simple Knowledge Organization Systems– Representação– Mapeamento
KOS - Instâncias
LexML Brasil:urn:lex:br:federal:lei:1990;8112
Identificador
• Um identificador é uma associação de um nome com uma coisa. (PILIN Ontology)
• Um label único que torna o recurso referenciável. (DOI Handbook)
CoisaNome B
[ Contexto 2 ]Nome A
[ Contexto 1 ]
Alias de B[ Contexto 2 ]
Identificador Persistente• Identificador gerenciado e mantido por uma entidade
– Persistência > Localização• Cria-se um nível de redirecionamento• Intermediado por um serviço de resolução
– Persistência > Referente• O referente não será trocado (reaproveitamento de ID)
• A persistência não é garantida por nenhum tipo de identificador
• Depende do– comprometimento da entidade que publica a informação na
manutenção da associação entre o recurso/coisa e a respectiva manifestação (e localização).
– política de preservação digital
Dois Pontos de Vista• (1)
– Atribuir um ID a um recurso• Óbvio• Tecnológico
• (2)– Atribuir um recurso a um ID
• Menos óbvio• Análise de conteúdo
CoisaNome
[ Contexto ]
CoisaNome
[ Contexto ]
Fonte: Paskin (2004)
Both viewpoints valid, (2) is now becoming more relevant
ISO TC 46 / SC 9Information and Documentation -
Identification and Description
• ISO 2108 International Standard Book Numbering (ISBN)• ISO 3297 International Standard Serial Number (ISSN)• ISO 3901 International Standard Recording Code (ISRC)• ISO 10444 International Standard Technical Report Number (ISRN)• ISO 10957 International Standard Music Number (ISMN)• ISO 15706 International Standard Audiovisual Number (ISAN)*• ISO 15707 International Standard Musical Work Code (ISWC)*• ISO Project 20925 Version identifier for Audiovisual Works (V-ISAN)*• ISO Project 21047 International Standard Text Code (ISTC)*
* trend towards identifiers of abstract entities
Fonte: Paskin (2004)
Iniciativas• Identificadores Genéricos
– URL– PURL– URN– Handle
• DOI (Direitos autorais)– ARK (Archival Resource Key)– PILIN
• Informação Bibliográfica– OpenURL
• Informação Legislativa e Jurídica– URN – LexML Brasil
• urn : lex : br;sao.paulo : estadual : lei : 1988-06-02;6134
• urn : lex : br : ministerio.fazenda;secretaria.receita.federal : instrucao.normativa : 1998-10-06;117
• urn : lex : br;sao.paulo;campinas : camara.municipal : projeto.lei : 2004-11-23;4903
Pattern: Complexo - Individual
• Complexo– Conjunto
• Individual– Unidade (membro)
LexML Brasil:urn:lex:br:federal:lei:1990;8112
urn:lex:br:federal:lei:1990;8112@1990-12-12;publicacao;1990-12-12urn:lex:br:federal:lei:1990;8112@1991-01-09;alteracao;1991-01-09urn:lex:br:federal:lei:1990;8112@1998-18-03;republicacao;1998-18-03
Actors Events Objects
extractedfactual knowledge
(network)
“Categorical data”(Thesauri) extentthe core ontology
Sources and
metadata
Factual BackgroundKnowledge /“Authorities”
Core Ontology/CRM
relationships,language neutral,
global
terms, multilingual, domain specific
Conceptual Reference Model - Architecture
<lexml:LexML xsi:schemaLocation="http://www.lexml.gov.br/schema/oai_lexml.xsd" xmlns:lexml="http://www.lexml.gov.br/oai_lexml" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<Item formato="text/html" idPublicador="1" tipo="conteudo"> http://www6.senado.gov.br/legislacao/ListaPublicacoes.action?id=132554 </Item>
<Item formato="text/html" idPublicador="1" tipo="metadado"> http://www6.senado.gov.br/legislacao/DetalhaDocumento.action?id=132554 </Item>
<DocumentoIndividual> urn:lex:br:federal:lei:1988-12-02;7682
</DocumentoIndividual>
<Epigrafe>Lei nº 7.682, de 02 de dezembro de 1988</Epigrafe> <Ementa>ALTERA O DECRETO-LEI 2.406, DE 5 DE JANEIRO DE 1988, E DA OUTRAS
PROVIDENCIAS.</Ementa>
<Relacionamento tipo="publicacao.oficial"> urn:lex:br:imprensa.nacional:publicacao.oficial;diario.oficial.uniao;secao.1:1988-12-05!pag1
</Relacionamento></lexml:LexML>
Assinatura do Projeto da Constituição de 1891
G. Hastoy Modelo
F27 Criação de Obra“Assinatura do Projeto da CF”
E53 Local“RJ – Palácio Itamaraty”
E52 Intervalo de Tempo“22 de Junho de 1890”
F10 Pessoa“Deodoro da Fonseca”
F10 Pessoa“Rui Barbosa”
F10 Pessoa“Manoel Deodoro da Fonseca”
F10 Pessoa“Floriano Peixoto”
F4 Manifestação Única“Original do Decreto nº 510”
F22 Expressão Autocontida“Texto do Decreto nº 510”
F14 Obra Individual“Decreto nº 510”
E22 Objeto Fabricado“Pena de Ouro”
E24 Coisa Material Fabricada“Tela com Pintura”
participou
realizou
emonde
presenciou
criou
E36 Item Visual“Imagem da Pintura”
F27 Criação de Obra“Criação da Pintura”
F10 Pessoa“Gustavo Hastoy”
realizoucriou
criou
F11 Entidade Coletiva“Museu do Senado Federal” detém
representa
suporte
suporte de
realiza
Publicaç
CIDOC / FRBRIFLA - FRBR
CIDOC – CRM
1992 1996 1998 2003 2005 2008
IFLA + CIDOCCRM + FRBR + FRAD
IFLA - FRAD
3.2 4.0 4.2
IFLA FRSAR
ISO 21127
LexML
Expression
Work
Item
Manifestation Product Type
Container Work
Individual Work
Complex Work
Conclusão
• Nível das Idéias– ISO 21127:2006 - CIDOC CRM
• Não começar do zero!• Especializar para o Governo Eletrônico
• Nível Verbal– W3C SKOS
• Por classe/assunto, criar vocabulários
• Nível Sintático– XML + UTF-8 + Encoding Schemas
• Coleta: OAI-PMH
Referências• M. Patel, T. Koch, M.Doerr, C. Tsinaraki, Semantic Interoperability in Digital Library
Systems, Report of DELOS2 Network of Excellence in Digital Libraries, 2005.• Doerr M., Semantic Problems of Thesaurus Mapping. Journal of Digital
Information, Special Issue on Networked Knowledge Organization Systems, Volume 1, issue 8, April 2001.
• Doerr, M. Semantic problems of thesaurus mapping. In: Journal of Digital information, Volume 1 Issue 8. Article No. 52, 2001-03-26.
• Doerr, M. The CIDOC conceptual reference module: an ontological approach to semantic interoperability of metadata. AI Magazine. 2003
• Veltman, K. Towards a Cultural Semantic Web: From Substance to Relations.• Veltman, K. Towards a Semantic Web for Culture. Journal of Digital Information,
Vol. 4, No. 4. (15 March 2004) • Ouksel A.M. and Sheth A. (1999) Semantic Interoperability in Global Information
Systems, ACM SIGMOD Record, Vol 28(1) March 1999, pp 5-12.