Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João...

Preview:

Citation preview

Interoperabilidade Semânticano Governo Eletrônico:

Informação Legislativa e Jurídica

João LimaSenado Federal / Prodasen

joaolima@senado.gov.br

Tópicos

• O Problema– Interoperabilidade Semântica

• Entidades• Assunto

• O caminho para a solução – Ranganathan

• Plano das idéias• Plano verbal• Plano notacional

Quatro Tipos de Heterogeneidade

Ouksel & Sheth (2004):• Sistema

– incompatibilidades entre hardware e sistemas operacionais• Sintática

– diferenças na codificação e representação• Estrutural

– variações nos modelos de dados, estruturas de dados e esquemas

• Semântica– Inconsistências na terminologia e significados

Problema• Cada Sistema de Informação possui

– seu próprio modelo de dados • estrutura / semântica

– sua própria forma de codificar • encoding

• Sintática– Fácil de resolver:

• XML + Unicode + encoding scheme

• Semântica / Estrutural– Não é resolvido pelo

• XML + Unicode + encoding scheme

Semantic Interoperability

• Semantic interoperability is characterized by the capability of different information systems to communicate information consistent with the intended meaning of the encoded information (as intended by the creators or maintainers of the information system).

(Patel et. al, 2005)

2 Sistemas - Mapeamento

Sistema 1Modelo A

Sistema 2Modelo BA Mapeamento B

A1 = B1A2 || A3 = B2A4 = Func(B4)

n Sistemas – Mapeamento x

Sistema 1Modelo A

Sistema 6Modelo F

Sistema 2Modelo B

Sistema 3Modelo C

Sistema 5Modelo E

Sistema 4 Modelo D

Mapeamento

A falta da interoperabilidade

• Provoca o problema dos– silos de informação

• Fontes de Informações heterogêneas que não podem ser– pesquisadas

• com precisão• com opções avançadas

– comparadas– combinadas – migradas– etc

Em suma,

• “The overall objective of semantic interoperability is to support

complex and advanced, context-sensitive query processing

over heterogeneous information resources.”

(Patel et al., 2005)

Acordo Semântico

Sistema 1Modelo A

Sistema 6Modelo F

Sistema 2Modelo B

Sistema 3Modelo C

Sistema 5Modelo E

Sistema 4 Modelo D

Modelo Comum

O caminho para a Solução

Qual é esse modelo comum?

DC ?

• Não, não é o Dublin Core• Problemas do DC

– Foco no Recurso– Estrutura flat– Não trata adequadamente os

eventos temporais– Top-Down Approach

• 15• Qualificadores

– (abandonado pelo DCC)

DC1DC2

DC.Date

1995 - The date of publication

1998 - A date associated with the creation or availability of the resource.

1999 - A date associated with an event in the life cycle of the resource.

2000 – [Qualifers] created, valid, available, issued, modified

2002 – [Qualifers] accepted, submitted, copyrighted

2006 - A point or period of time associated with an event in the lifecycle of the resource.

p

c a

e’’...

c

...v a i m

e e’

e’’e e’

...c v a i m

e’’e e’

a s c

c v a i m

e’’e e’

a s c

s’ e’ e’ s’

8 8

...

SW Cake?

• Não, não é o Semantic Web Cake.– “When Tim Berners Lee first outlined his vision of a semantic web at

WWW 7 (Brisbane, 1997), he focused on using logic to ensure which things were true and which things were not, in order that one could trust what was being shared.

– The following year at WWW8 (Toronto, 1998), this aspect of reliability was underlined. The semantic web was presented as synonymous with a web of trust.

– In the course of the next years (1999-2001) there was increasing emphasis on acronyms and on trust with respect to transactions.”

(Kim Veltman)

• “By contrast, culture faces a much larger challenge, namely, to represent changes in ways of knowing; changing meanings in different places at a given time (synchronically) and over time (diachronically). Culture is about both objects and the commentaries on them; about a cumulative body of knowledge; about collective memory and heritage.” (K. Veltman)

Core ontology?• Sim, é uma core ontology.• Comprometimento ontológico

– Vocabulário comum• “Recently, more and more projects and theoreticians

support the use of formal ontologies as common conceptual schema for information integration” (Doerr)

• Grande Economia– Reuso (não tem que começar do zero)

• Tipos de ontologia– Terminological Ontologies

• Grandes, conceitos, isA , domain-specific– Core Ontology

• Concisas, esquemas de dados, isA + outros, genérico

ISO 21127:2006 CIDOC - Conceptual Reference Model

Por que esta ontologia?• Suficientemente genérica e flexível• Foco no evento e não no recurso• Bottom-Up Approach (criação)

– Museus, Arquivos e Bibliotecas (Instituições de Memória)• Separa a discussão da terminologia da parte essencial da ontologia

– “keep the basic ontology in a manageable size.”• Trata

– Nomes, Identificadores, Títulos– Período, Evento, Atividade– Pessoa, Organização– Tipos, Objetos Físicos e Conceituais, Localidades– Obras, Expressão, Manifestação

• The CIDOC CRM is a formal ontology intended to facilitate the integration, mediation, and interchange of heterogeneous cultural heritage information.

• It was developed by interdisciplinary teams of experts, coming from fields as diverse as computer science, archaeology, museum curation, history of arts, natural history, library science, physics and philosophy, under the aegis of the International Committee for Documentation (CIDOC) of the International Council of Museums (ICOM).

• Museus – 5 % das classes/relacionamentos

ISO 21127:2006 CIDOC - Conceptual Reference Model

Como foi criada• It started bottom-up, by reengineering and

integrating the semantic contents of a multitude of database schemata and documentation structures from all kinds of museum disciplines, archives, and more recently libraries.

• Iniciou em 1996• Tamanho

– 80 classes– 128 propriedades

• Representa a semântica de centenas de esquemas

Actors Events Objects

extractedfactual knowledge

(network)

“Categorical data”(Thesauri) extentthe core ontology

Sources and

metadata

Factual BackgroundKnowledge /“Authorities”

Core Ontology/CRM

relationships,language neutral,

global

terms, multilingual, domain specific

Conceptual Reference Model - Architecture

The CIDOC CRMTop-level Entities relevant for Integration

participate in

E39 Actors

E55 Types

E28 Conceptual Objects

E18 Physical Thing

E2 Temporal Entities

E41

App

ella

tions

affect or / refer to

refer to / refine

refe

r to

/ id

entif

ie

location

atwithinE53 Places

E52 Time-Spans

Actors Events Objects

extractedfactual knowledge

(network)

“Categorical data”(Thesauri) extentthe core ontology

Sources and

metadata

Factual BackgroundKnowledge /“Authorities”

Core Ontology/CRM

relationships,language neutral,

global

terms, multilingual, domain specific

Conceptual Reference Model - Architecture

KOS - Instâncias

• KOS– Vocabulários– Classificações– Taxonomias– Authority Lists– Tesauro

• W3C SKOS – Simple Knowledge Organization Systems– Representação– Mapeamento

KOS - Instâncias

LexML Brasil:urn:lex:br:federal:lei:1990;8112

Identificador

• Um identificador é uma associação de um nome com uma coisa. (PILIN Ontology)

• Um label único que torna o recurso referenciável. (DOI Handbook)

CoisaNome B

[ Contexto 2 ]Nome A

[ Contexto 1 ]

Alias de B[ Contexto 2 ]

Identificador Persistente• Identificador gerenciado e mantido por uma entidade

– Persistência > Localização• Cria-se um nível de redirecionamento• Intermediado por um serviço de resolução

– Persistência > Referente• O referente não será trocado (reaproveitamento de ID)

• A persistência não é garantida por nenhum tipo de identificador

• Depende do– comprometimento da entidade que publica a informação na

manutenção da associação entre o recurso/coisa e a respectiva manifestação (e localização).

– política de preservação digital

Dois Pontos de Vista• (1)

– Atribuir um ID a um recurso• Óbvio• Tecnológico

• (2)– Atribuir um recurso a um ID

• Menos óbvio• Análise de conteúdo

CoisaNome

[ Contexto ]

CoisaNome

[ Contexto ]

Fonte: Paskin (2004)

Both viewpoints valid, (2) is now becoming more relevant

ISO TC 46 / SC 9Information and Documentation -

Identification and Description

• ISO 2108 International Standard Book Numbering (ISBN)• ISO 3297 International Standard Serial Number (ISSN)• ISO 3901 International Standard Recording Code (ISRC)• ISO 10444 International Standard Technical Report Number (ISRN)• ISO 10957 International Standard Music Number (ISMN)• ISO 15706 International Standard Audiovisual Number (ISAN)*• ISO 15707 International Standard Musical Work Code (ISWC)*• ISO Project 20925 Version identifier for Audiovisual Works (V-ISAN)*• ISO Project 21047 International Standard Text Code (ISTC)*

* trend towards identifiers of abstract entities

Fonte: Paskin (2004)

Iniciativas• Identificadores Genéricos

– URL– PURL– URN– Handle

• DOI (Direitos autorais)– ARK (Archival Resource Key)– PILIN

• Informação Bibliográfica– OpenURL

• Informação Legislativa e Jurídica– URN – LexML Brasil

• urn : lex : br;sao.paulo : estadual : lei : 1988-06-02;6134

• urn : lex : br : ministerio.fazenda;secretaria.receita.federal : instrucao.normativa : 1998-10-06;117

• urn : lex : br;sao.paulo;campinas : camara.municipal : projeto.lei : 2004-11-23;4903

Pattern: Complexo - Individual

• Complexo– Conjunto

• Individual– Unidade (membro)

LexML Brasil:urn:lex:br:federal:lei:1990;8112

urn:lex:br:federal:lei:1990;8112@1990-12-12;publicacao;1990-12-12urn:lex:br:federal:lei:1990;8112@1991-01-09;alteracao;1991-01-09urn:lex:br:federal:lei:1990;8112@1998-18-03;republicacao;1998-18-03

Actors Events Objects

extractedfactual knowledge

(network)

“Categorical data”(Thesauri) extentthe core ontology

Sources and

metadata

Factual BackgroundKnowledge /“Authorities”

Core Ontology/CRM

relationships,language neutral,

global

terms, multilingual, domain specific

Conceptual Reference Model - Architecture

<lexml:LexML xsi:schemaLocation="http://www.lexml.gov.br/schema/oai_lexml.xsd" xmlns:lexml="http://www.lexml.gov.br/oai_lexml" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">

<Item formato="text/html" idPublicador="1" tipo="conteudo"> http://www6.senado.gov.br/legislacao/ListaPublicacoes.action?id=132554 </Item>

<Item formato="text/html" idPublicador="1" tipo="metadado"> http://www6.senado.gov.br/legislacao/DetalhaDocumento.action?id=132554 </Item>

<DocumentoIndividual> urn:lex:br:federal:lei:1988-12-02;7682

</DocumentoIndividual>

<Epigrafe>Lei nº 7.682, de 02 de dezembro de 1988</Epigrafe> <Ementa>ALTERA O DECRETO-LEI 2.406, DE 5 DE JANEIRO DE 1988, E DA OUTRAS

PROVIDENCIAS.</Ementa>

<Relacionamento tipo="publicacao.oficial"> urn:lex:br:imprensa.nacional:publicacao.oficial;diario.oficial.uniao;secao.1:1988-12-05!pag1

</Relacionamento></lexml:LexML>

Assinatura do Projeto da Constituição de 1891

G. Hastoy Modelo

F27 Criação de Obra“Assinatura do Projeto da CF”

E53 Local“RJ – Palácio Itamaraty”

E52 Intervalo de Tempo“22 de Junho de 1890”

F10 Pessoa“Deodoro da Fonseca”

F10 Pessoa“Rui Barbosa”

F10 Pessoa“Manoel Deodoro da Fonseca”

F10 Pessoa“Floriano Peixoto”

F4 Manifestação Única“Original do Decreto nº 510”

F22 Expressão Autocontida“Texto do Decreto nº 510”

F14 Obra Individual“Decreto nº 510”

E22 Objeto Fabricado“Pena de Ouro”

E24 Coisa Material Fabricada“Tela com Pintura”

participou

realizou

emonde

presenciou

criou

E36 Item Visual“Imagem da Pintura”

F27 Criação de Obra“Criação da Pintura”

F10 Pessoa“Gustavo Hastoy”

realizoucriou

criou

F11 Entidade Coletiva“Museu do Senado Federal” detém

representa

suporte

suporte de

realiza

Publicaç

CIDOC / FRBRIFLA - FRBR

CIDOC – CRM

1992 1996 1998 2003 2005 2008

IFLA + CIDOCCRM + FRBR + FRAD

IFLA - FRAD

3.2 4.0 4.2

IFLA FRSAR

ISO 21127

LexML

Expression

Work

Item

Manifestation Product Type

Container Work

Individual Work

Complex Work

Conclusão

• Nível das Idéias– ISO 21127:2006 - CIDOC CRM

• Não começar do zero!• Especializar para o Governo Eletrônico

• Nível Verbal– W3C SKOS

• Por classe/assunto, criar vocabulários

• Nível Sintático– XML + UTF-8 + Encoding Schemas

• Coleta: OAI-PMH

Referências• M. Patel, T. Koch, M.Doerr, C. Tsinaraki, Semantic Interoperability in Digital Library

Systems, Report of DELOS2 Network of Excellence in Digital Libraries, 2005.• Doerr M., Semantic Problems of Thesaurus Mapping. Journal of Digital

Information, Special Issue on Networked Knowledge Organization Systems, Volume 1, issue 8, April 2001.

• Doerr, M. Semantic problems of thesaurus mapping. In: Journal of Digital information, Volume 1 Issue 8. Article No. 52, 2001-03-26.

• Doerr, M. The CIDOC conceptual reference module: an ontological approach to semantic interoperability of metadata. AI Magazine. 2003

• Veltman, K. Towards a Cultural Semantic Web: From Substance to Relations.• Veltman, K. Towards a Semantic Web for Culture. Journal of Digital Information,

Vol. 4, No. 4. (15 March 2004) • Ouksel A.M. and Sheth A. (1999) Semantic Interoperability in Global Information

Systems, ACM SIGMOD Record, Vol 28(1) March 1999, pp 5-12.

Recommended