41
Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen [email protected]

Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen [email protected]

Embed Size (px)

Citation preview

Page 1: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

Interoperabilidade Semânticano Governo Eletrônico:

Informação Legislativa e Jurídica

João LimaSenado Federal / Prodasen

[email protected]

Page 2: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

Tópicos

• O Problema– Interoperabilidade Semântica

• Entidades• Assunto

• O caminho para a solução – Ranganathan

• Plano das idéias• Plano verbal• Plano notacional

Page 3: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

Quatro Tipos de Heterogeneidade

Ouksel & Sheth (2004):• Sistema

– incompatibilidades entre hardware e sistemas operacionais• Sintática

– diferenças na codificação e representação• Estrutural

– variações nos modelos de dados, estruturas de dados e esquemas

• Semântica– Inconsistências na terminologia e significados

Page 4: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

Problema• Cada Sistema de Informação possui

– seu próprio modelo de dados • estrutura / semântica

– sua própria forma de codificar • encoding

• Sintática– Fácil de resolver:

• XML + Unicode + encoding scheme

• Semântica / Estrutural– Não é resolvido pelo

• XML + Unicode + encoding scheme

Page 5: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

Semantic Interoperability

• Semantic interoperability is characterized by the capability of different information systems to communicate information consistent with the intended meaning of the encoded information (as intended by the creators or maintainers of the information system).

(Patel et. al, 2005)

Page 6: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

2 Sistemas - Mapeamento

Sistema 1Modelo A

Sistema 2Modelo BA Mapeamento B

A1 = B1A2 || A3 = B2A4 = Func(B4)

Page 7: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

n Sistemas – Mapeamento x

Sistema 1Modelo A

Sistema 6Modelo F

Sistema 2Modelo B

Sistema 3Modelo C

Sistema 5Modelo E

Sistema 4 Modelo D

Mapeamento

Page 8: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

A falta da interoperabilidade

• Provoca o problema dos– silos de informação

• Fontes de Informações heterogêneas que não podem ser– pesquisadas

• com precisão• com opções avançadas

– comparadas– combinadas – migradas– etc

Page 9: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

Em suma,

• “The overall objective of semantic interoperability is to support

complex and advanced, context-sensitive query processing

over heterogeneous information resources.”

(Patel et al., 2005)

Page 10: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

Acordo Semântico

Sistema 1Modelo A

Sistema 6Modelo F

Sistema 2Modelo B

Sistema 3Modelo C

Sistema 5Modelo E

Sistema 4 Modelo D

Modelo Comum

Page 11: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

O caminho para a Solução

Qual é esse modelo comum?

Page 12: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

DC ?

• Não, não é o Dublin Core• Problemas do DC

– Foco no Recurso– Estrutura flat– Não trata adequadamente os

eventos temporais– Top-Down Approach

• 15• Qualificadores

– (abandonado pelo DCC)

DC1DC2

Page 13: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

DC.Date

1995 - The date of publication

1998 - A date associated with the creation or availability of the resource.

1999 - A date associated with an event in the life cycle of the resource.

2000 – [Qualifers] created, valid, available, issued, modified

2002 – [Qualifers] accepted, submitted, copyrighted

2006 - A point or period of time associated with an event in the lifecycle of the resource.

p

c a

e’’...

c

...v a i m

e e’

e’’e e’

...c v a i m

e’’e e’

a s c

c v a i m

e’’e e’

a s c

s’ e’ e’ s’

8 8

...

Page 14: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

SW Cake?

• Não, não é o Semantic Web Cake.– “When Tim Berners Lee first outlined his vision of a semantic web at

WWW 7 (Brisbane, 1997), he focused on using logic to ensure which things were true and which things were not, in order that one could trust what was being shared.

– The following year at WWW8 (Toronto, 1998), this aspect of reliability was underlined. The semantic web was presented as synonymous with a web of trust.

– In the course of the next years (1999-2001) there was increasing emphasis on acronyms and on trust with respect to transactions.”

(Kim Veltman)

Page 15: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

• “By contrast, culture faces a much larger challenge, namely, to represent changes in ways of knowing; changing meanings in different places at a given time (synchronically) and over time (diachronically). Culture is about both objects and the commentaries on them; about a cumulative body of knowledge; about collective memory and heritage.” (K. Veltman)

Page 16: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br
Page 17: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

Core ontology?• Sim, é uma core ontology.• Comprometimento ontológico

– Vocabulário comum• “Recently, more and more projects and theoreticians

support the use of formal ontologies as common conceptual schema for information integration” (Doerr)

• Grande Economia– Reuso (não tem que começar do zero)

• Tipos de ontologia– Terminological Ontologies

• Grandes, conceitos, isA , domain-specific– Core Ontology

• Concisas, esquemas de dados, isA + outros, genérico

Page 18: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

ISO 21127:2006 CIDOC - Conceptual Reference Model

Page 19: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

Por que esta ontologia?• Suficientemente genérica e flexível• Foco no evento e não no recurso• Bottom-Up Approach (criação)

– Museus, Arquivos e Bibliotecas (Instituições de Memória)• Separa a discussão da terminologia da parte essencial da ontologia

– “keep the basic ontology in a manageable size.”• Trata

– Nomes, Identificadores, Títulos– Período, Evento, Atividade– Pessoa, Organização– Tipos, Objetos Físicos e Conceituais, Localidades– Obras, Expressão, Manifestação

Page 20: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

• The CIDOC CRM is a formal ontology intended to facilitate the integration, mediation, and interchange of heterogeneous cultural heritage information.

• It was developed by interdisciplinary teams of experts, coming from fields as diverse as computer science, archaeology, museum curation, history of arts, natural history, library science, physics and philosophy, under the aegis of the International Committee for Documentation (CIDOC) of the International Council of Museums (ICOM).

• Museus – 5 % das classes/relacionamentos

ISO 21127:2006 CIDOC - Conceptual Reference Model

Page 21: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

Como foi criada• It started bottom-up, by reengineering and

integrating the semantic contents of a multitude of database schemata and documentation structures from all kinds of museum disciplines, archives, and more recently libraries.

• Iniciou em 1996• Tamanho

– 80 classes– 128 propriedades

• Representa a semântica de centenas de esquemas

Page 22: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

Actors Events Objects

extractedfactual knowledge

(network)

“Categorical data”(Thesauri) extentthe core ontology

Sources and

metadata

Factual BackgroundKnowledge /“Authorities”

Core Ontology/CRM

relationships,language neutral,

global

terms, multilingual, domain specific

Conceptual Reference Model - Architecture

Page 23: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

The CIDOC CRMTop-level Entities relevant for Integration

participate in

E39 Actors

E55 Types

E28 Conceptual Objects

E18 Physical Thing

E2 Temporal Entities

E41

App

ella

tions

affect or / refer to

refer to / refine

refe

r to

/ id

entif

ie

location

atwithinE53 Places

E52 Time-Spans

Page 24: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

Actors Events Objects

extractedfactual knowledge

(network)

“Categorical data”(Thesauri) extentthe core ontology

Sources and

metadata

Factual BackgroundKnowledge /“Authorities”

Core Ontology/CRM

relationships,language neutral,

global

terms, multilingual, domain specific

Conceptual Reference Model - Architecture

Page 25: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

KOS - Instâncias

• KOS– Vocabulários– Classificações– Taxonomias– Authority Lists– Tesauro

• W3C SKOS – Simple Knowledge Organization Systems– Representação– Mapeamento

Page 26: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

KOS - Instâncias

LexML Brasil:urn:lex:br:federal:lei:1990;8112

Page 27: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

Identificador

• Um identificador é uma associação de um nome com uma coisa. (PILIN Ontology)

• Um label único que torna o recurso referenciável. (DOI Handbook)

CoisaNome B

[ Contexto 2 ]Nome A

[ Contexto 1 ]

Alias de B[ Contexto 2 ]

Page 28: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

Identificador Persistente• Identificador gerenciado e mantido por uma entidade

– Persistência > Localização• Cria-se um nível de redirecionamento• Intermediado por um serviço de resolução

– Persistência > Referente• O referente não será trocado (reaproveitamento de ID)

• A persistência não é garantida por nenhum tipo de identificador

• Depende do– comprometimento da entidade que publica a informação na

manutenção da associação entre o recurso/coisa e a respectiva manifestação (e localização).

– política de preservação digital

Page 29: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

Dois Pontos de Vista• (1)

– Atribuir um ID a um recurso• Óbvio• Tecnológico

• (2)– Atribuir um recurso a um ID

• Menos óbvio• Análise de conteúdo

CoisaNome

[ Contexto ]

CoisaNome

[ Contexto ]

Fonte: Paskin (2004)

Both viewpoints valid, (2) is now becoming more relevant

Page 30: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

ISO TC 46 / SC 9Information and Documentation -

Identification and Description

• ISO 2108 International Standard Book Numbering (ISBN)• ISO 3297 International Standard Serial Number (ISSN)• ISO 3901 International Standard Recording Code (ISRC)• ISO 10444 International Standard Technical Report Number (ISRN)• ISO 10957 International Standard Music Number (ISMN)• ISO 15706 International Standard Audiovisual Number (ISAN)*• ISO 15707 International Standard Musical Work Code (ISWC)*• ISO Project 20925 Version identifier for Audiovisual Works (V-ISAN)*• ISO Project 21047 International Standard Text Code (ISTC)*

* trend towards identifiers of abstract entities

Fonte: Paskin (2004)

Page 31: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

Iniciativas• Identificadores Genéricos

– URL– PURL– URN– Handle

• DOI (Direitos autorais)– ARK (Archival Resource Key)– PILIN

• Informação Bibliográfica– OpenURL

• Informação Legislativa e Jurídica– URN – LexML Brasil

Page 32: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

• urn : lex : br;sao.paulo : estadual : lei : 1988-06-02;6134

• urn : lex : br : ministerio.fazenda;secretaria.receita.federal : instrucao.normativa : 1998-10-06;117

• urn : lex : br;sao.paulo;campinas : camara.municipal : projeto.lei : 2004-11-23;4903

Page 33: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

Pattern: Complexo - Individual

• Complexo– Conjunto

• Individual– Unidade (membro)

LexML Brasil:urn:lex:br:federal:lei:1990;8112

urn:lex:br:federal:lei:1990;8112@1990-12-12;publicacao;1990-12-12urn:lex:br:federal:lei:1990;8112@1991-01-09;alteracao;1991-01-09urn:lex:br:federal:lei:1990;8112@1998-18-03;republicacao;1998-18-03

Page 34: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

Actors Events Objects

extractedfactual knowledge

(network)

“Categorical data”(Thesauri) extentthe core ontology

Sources and

metadata

Factual BackgroundKnowledge /“Authorities”

Core Ontology/CRM

relationships,language neutral,

global

terms, multilingual, domain specific

Conceptual Reference Model - Architecture

Page 35: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

<lexml:LexML xsi:schemaLocation="http://www.lexml.gov.br/schema/oai_lexml.xsd" xmlns:lexml="http://www.lexml.gov.br/oai_lexml" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">

<Item formato="text/html" idPublicador="1" tipo="conteudo"> http://www6.senado.gov.br/legislacao/ListaPublicacoes.action?id=132554 </Item>

<Item formato="text/html" idPublicador="1" tipo="metadado"> http://www6.senado.gov.br/legislacao/DetalhaDocumento.action?id=132554 </Item>

<DocumentoIndividual> urn:lex:br:federal:lei:1988-12-02;7682

</DocumentoIndividual>

<Epigrafe>Lei nº 7.682, de 02 de dezembro de 1988</Epigrafe> <Ementa>ALTERA O DECRETO-LEI 2.406, DE 5 DE JANEIRO DE 1988, E DA OUTRAS

PROVIDENCIAS.</Ementa>

<Relacionamento tipo="publicacao.oficial"> urn:lex:br:imprensa.nacional:publicacao.oficial;diario.oficial.uniao;secao.1:1988-12-05!pag1

</Relacionamento></lexml:LexML>

Page 36: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

Assinatura do Projeto da Constituição de 1891

G. Hastoy Modelo

Page 37: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

F27 Criação de Obra“Assinatura do Projeto da CF”

E53 Local“RJ – Palácio Itamaraty”

E52 Intervalo de Tempo“22 de Junho de 1890”

F10 Pessoa“Deodoro da Fonseca”

F10 Pessoa“Rui Barbosa”

F10 Pessoa“Manoel Deodoro da Fonseca”

F10 Pessoa“Floriano Peixoto”

F4 Manifestação Única“Original do Decreto nº 510”

F22 Expressão Autocontida“Texto do Decreto nº 510”

F14 Obra Individual“Decreto nº 510”

E22 Objeto Fabricado“Pena de Ouro”

E24 Coisa Material Fabricada“Tela com Pintura”

participou

realizou

emonde

presenciou

criou

E36 Item Visual“Imagem da Pintura”

F27 Criação de Obra“Criação da Pintura”

F10 Pessoa“Gustavo Hastoy”

realizoucriou

criou

F11 Entidade Coletiva“Museu do Senado Federal” detém

representa

suporte

suporte de

realiza

Publicaç

Page 38: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

CIDOC / FRBRIFLA - FRBR

CIDOC – CRM

1992 1996 1998 2003 2005 2008

IFLA + CIDOCCRM + FRBR + FRAD

IFLA - FRAD

3.2 4.0 4.2

IFLA FRSAR

ISO 21127

LexML

Page 39: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

Expression

Work

Item

Manifestation Product Type

Container Work

Individual Work

Complex Work

Page 40: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

Conclusão

• Nível das Idéias– ISO 21127:2006 - CIDOC CRM

• Não começar do zero!• Especializar para o Governo Eletrônico

• Nível Verbal– W3C SKOS

• Por classe/assunto, criar vocabulários

• Nível Sintático– XML + UTF-8 + Encoding Schemas

• Coleta: OAI-PMH

Page 41: Interoperabilidade Semântica no Governo Eletrônico: Informação Legislativa e Jurídica João Lima Senado Federal / Prodasen joaolima@senado.gov.br

Referências• M. Patel, T. Koch, M.Doerr, C. Tsinaraki, Semantic Interoperability in Digital Library

Systems, Report of DELOS2 Network of Excellence in Digital Libraries, 2005.• Doerr M., Semantic Problems of Thesaurus Mapping. Journal of Digital

Information, Special Issue on Networked Knowledge Organization Systems, Volume 1, issue 8, April 2001.

• Doerr, M. Semantic problems of thesaurus mapping. In: Journal of Digital information, Volume 1 Issue 8. Article No. 52, 2001-03-26.

• Doerr, M. The CIDOC conceptual reference module: an ontological approach to semantic interoperability of metadata. AI Magazine. 2003

• Veltman, K. Towards a Cultural Semantic Web: From Substance to Relations.• Veltman, K. Towards a Semantic Web for Culture. Journal of Digital Information,

Vol. 4, No. 4. (15 March 2004) • Ouksel A.M. and Sheth A. (1999) Semantic Interoperability in Global Information

Systems, ACM SIGMOD Record, Vol 28(1) March 1999, pp 5-12.