171
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA INFORMAÇÃO MESTRADO EM CIÊNCIA DA INFORMAÇÃO UNIVERSIDADE FEDERAL FLUMINENSE INSTITUTO DE ARTE E COMUNICAÇÃO SOCIAL DURVAL VIEIRA PEREIRA MODELAGEM E REPRESENTAÇÃO SEMÂNTICA DE DADOS GOVERNAMENTAIS ABERTOS DA PREVIDÊNCIA SOCIAL BRASILEIRA Niterói 2014

modelagem e representação semântica de dados governamentais

Embed Size (px)

Citation preview

Page 1: modelagem e representação semântica de dados governamentais

PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA INFORMAÇÃO

MESTRADO EM CIÊNCIA DA INFORMAÇÃO

UNIVERSIDADE FEDERAL FLUMINENSE

INSTITUTO DE ARTE E COMUNICAÇÃO SOCIAL

DURVAL VIEIRA PEREIRA

MODELAGEM E REPRESENTAÇÃO SEMÂNTICA DE DADOS

GOVERNAMENTAIS ABERTOS DA PREVIDÊNCIA SOCIAL BRASIL EIRA

Niterói

2014

Page 2: modelagem e representação semântica de dados governamentais

DURVAL VIEIRA PEREIRA

MODELAGEM E REPRESENTAÇÃO SEMÂNTICA DE DADOS

GOVERNAMENTAIS ABERTOS DA PREVIDÊNCIA SOCIAL BRASIL EIRA

Dissertação de Mestrado apresentada como requisito parcial para obtenção do título de Mestre em Ciência da Informação do Programa de Pós-Graduação em Ciência da Informação da Universidade Federal Fluminense.

Orientador: Profº. Drº. Carlos Henrique Marcondes

NITERÓI 2014

Page 3: modelagem e representação semântica de dados governamentais

Pereira, Durval Vieira P436 Modelagem e representação semântica de dados governamentais abertos da Previdência Social brasileira / Durval Vieira Pereira. – 2014. 168 f. : il.

Orientador: Carlos Henrique Marcondes. Dissertação (Mestrado em Ciência da Informação) – Universidade

Federal Fluminense, Departamento de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2014.

1. Modelagem conceitual. 2. Dados governamentais abertos. 3. Web Semântica. 4. Acidente do trabalho. 5. Previdência Social. I. Marcondes, Carlos Henrique. II. Universidade Federal Fluminense. Departamento de Ciência da Informação. Programa de Pós-Graduação em Ciência da Informação. III. Título.

CDD 025.48

Page 4: modelagem e representação semântica de dados governamentais

DURVAL VIEIRA PEREIRA

MODELAGEM E REPRESENTAÇÃO SEMÂNTICA DE DADOS

GOVERNAMENTAIS ABERTOS DA PREVIDÊNCIA SOCIAL BRASIL EIRA

Dissertação de Mestrado apresentada como requisito parcial para obtenção do título de Mestre em Ciência da Informação do Programa de Pós-Graduação em Ciência da Informação da Universidade Federal Fluminense.

Aprovada em:________________________________________.

Banca examinadora:

________________________________________ Prof.º Dr. Carlos Henrique Marcondes – Orientador Universidade Federal Fluminense – UFF ________________________________________ Prof.º Dr. Cláudio José Silva Ribeiro – Membro Titular Universidade Federal do Estado do Rio de Janeiro - UNIRIO ________________________________________ Prof.ª Drª Maria Luiza de Almeida Campos – Membro Titular Universidade Federal Fluminense - UFF ________________________________________ Prof.ª Drª Regina de Barros Cianconi – Membro Titular Universidade Federal Fluminense - UFF ________________________________________ Prof.ª Drª Sandra Lúcia Rebel Gomes – Suplente Universidade Federal Fluminense – UFF ________________________________________ Prof.º Dr. Marcos Luiz Cavalcanti de Miranda – Suplente Universidade Federal do Estado do Rio de Janeiro - UNIRIO

Niterói 2014

Page 5: modelagem e representação semântica de dados governamentais

Dedico este trabalho a todos que estiveram comigo durante esta jornada e que com paciência me

ajudaram a continuar.

Page 6: modelagem e representação semântica de dados governamentais

DEDICATÓRIA

Ao meu orientador Marcondes, pela acolhida, pelos ensinamentos, pelo exemplo de

profissional e por me mostrar um caminho de estudo.

Aos meus pais por terem criado um ambiente favorável à minha formação.

Aos membros da banca pela disponibilidade e importantes contribuições teórico-

metodológicas.

Ao professor Cláudio J. S. Ribeiro pelas parcerias e discussões que tanto contribuíram para o

resultado aqui alcançado.

À Suzana Huguenin por me levar sempre a progredir na vida acadêmica. À Daniele Achilles e

Fabiana Vilar pelo incentivo, pelas risadas e pelas ajudas em momentos cruciais. Ao Fabiano

Cataldo pelo companheirismo e palavras de sabedoria.

Aos funcionários do PPGCI/UFF, principalmente da secretaria Vitor e Luciana, pelo apoio

sempre eficiente.

À Dataprev pelo incentivo dado no início da pesquisa;

Page 7: modelagem e representação semântica de dados governamentais

“Information is a relationship” (BARLOW, 1994)

Page 8: modelagem e representação semântica de dados governamentais

RESUMO

Objetiva propor um modelo conceitual dos dados sobre acidentes do trabalho para publicação dos dados governamentais mantidos pela Previdência Social. Busca na literatura modelos conceituais ou vocabulários sobre acidentes do trabalho, analisa o Vocabulário Controlado do Governo Eletrônico (VCGE), o modelo de publicações de dados sobre acidentes do trabalho publicado pela Dataprev e o tesauro e a taxonomia da Organização Internacional do Trabalho (OIT). Identifica a ausência de um modelo conceitual dos dados da Previdência Social para publicação em formato aberto e utiliza as tecnologias de Web Semântica, de forma a torná-las compartilháveis, acessíveis e reutilizáveis. Seleciona e analisa definições de acidente do trabalho e identifica conceitos e relacionamentos. Classifica os conceitos encontrados de acordo com as ontologias UFO-B e DUL. Utiliza o modelo Entidade-Relacionamento para auxiliar na elaboração de um modelo que consiga representar o domínio sobre acidente do trabalho. Constata a necessidade da elaboração de um vocabulário específico para descrever os conceitos sobre acidentes do trabalho como forma de enriquecer a representação dos dados analisados. Representa uma amostra dos dados em RDF, utilizando o modelo conceitual e o vocabulário proposto. Conclui que a elaboração do modelo conceitual e a descrição em RDF pareceram adequadas para organizar e fornecer um nível mínimo de semântica aos dados sobre acidente do trabalho da Previdência Social brasileira. Palavras-chave: Modelagem conceitual. Dados governamentais abertos. Web Semântica. Acidente do trabalho. Previdência social.

Page 9: modelagem e representação semântica de dados governamentais

ABSTRACT This project studies the conceptualization model about occupational accidents at Social Security for open government data. It conducts research literature to identify conceptual models or vocabulary about workplace accidents from the analysis of E-Government Controlled Vocabulary (VCGE from the Portuguese language), the occupational accident model published by Dataprev and also the taxonomy and thesaurus of International Labour Organization (ILO). It identifies the absence of a conceptual model for Social Security data for publication in an open format using Web Semantics technologies, to make this data sharable, affordable and reusable. It selects and discusses the definitions of occupational accidents by identifying concepts and relationships. It classifies the concepts found in accordance with ontologies UFO-B and DUL. It uses the Entity-Relationship model to assist in developing a model that can represent the domain of occupational accident. It notes the need to develop a specific vocabulary to describe the concepts of occupational accidents as a way to enhance the representation of the data analyzed. It represents part of the data in RDF using the proposed conceptual model and vocabulary. It concludes that the development of the conceptual model and description in RDF seemed appropriate to organize and provide a minimum level of semantic data on occupational accident at Brazilian Social Security. Keywords: Conceptual modeling. Open Government Data. Semantic Web. Occupational accident. Social Security.

Page 10: modelagem e representação semântica de dados governamentais

LISTA DE FIGURAS

Figura 1 Modelo de construção do conceito.................................................................. 33

Figura 2 Triângulo do conceito...................................................................................... 34

Figura 3 Exemplo de Diagrama ER............................................................................... 44

Figura 4 Evolução da Web............................................................................................. 49

Figura 5 Arquitetura da Web Semântica........................................................................ 49

Figura 6 URI na representação de um recurso............................................................... 51

Figura 7 Dados em XML sobre acidente do trabalho.................................................... 52

Figura 8 Grafo de triplas (sujeito, predicado e objeto).................................................. 55

Figura 9 Expressividade semântica de instrumentos de representação do

conhecimento...................................................................................................

60

Figura 10 Taxonomia das categorias básicas da DOLCE................................................ 62

Figura 11 Visão parcial da Ontologia DUL..................................................................... 63

Figura 12 Fragmento da UFO-B: Objetos e Eventos....................................................... 64

Figura 13 Evolução da Web Semântica com os Dados Abertos Interligados................. 71

Figura 14 Classificação de dados publicados.................................................................. 72

Figura 15 Esquema para classificar bases de dados publicados na WEB....................... 72

Figura 16 Estrutura de LOD das bases de dados do Governo Brasileiro........................ 73

Figura 17 Diagrama da nuvem de LOD........................................................................... 73

Figura 18 Página eletrônica do Ligado nos Políticos...................................................... 74

Figura 19 Arquitetura para plataforma tecnológica de governo eletrônico..................... 81

Figura 20 Portal da Transparência do Governo Federal do Brasil.................................. 87

Figura 21 Aplicativo utilizando dados do Data.gov........................................................ 98

Figura 22 Aplicativo utilizando dados do Data.gov.uk................................................... 99

Figura 23 Aplicativo utilizando dados do Data.gov.br.................................................... 102

Figura 24 Previdência social no VCGE........................................................................... 106

Figura 25 Descrição temática dos dados de acidente do trabalho publicados no Portal

Dados.gov.br...................................................................................................

109

Figura 26 Modelo de domínio sobre acidentes do trabalho, publicado pela Dataprev.... 111

Figura 27 Termos “Previdência Social” e “Acidente do trabalho” no tesauro da OIT.... 113

Figura 28 Termos “Previdência Social” e “Acidente do trabalho” na taxonomia da

OIT...................................................................................................................

114

Figura 29 Proposta de diagrama ER da definição 1 sobre acidente do trabalho.............. 117

Page 11: modelagem e representação semântica de dados governamentais

11

Figura 30 Proposta de diagrama ER da definição 2 sobre acidente do trabalho.............. 118

Figura 31 Proposta de diagrama ER da definição 3 sobre acidente do trabalho.............. 120

Figura 32 Proposta de diagrama ER da definição 4 sobre acidente do trabalho.............. 122

Figura 33 Proposta de diagrama ER da definição 5 sobre acidente do trabalho.............. 124

Figura 34 Proposta de diagrama ER sobre acidente do trabalho aliados aos dados da

Previdência Social...........................................................................................

129

Figura 35 Proposta de diagrama ER dos dados publicados pela Dataprev...................... 134

Figura 36 XML de acidentes do trabalho ocorridos na cidade do Rio de Janeiro........... 134

Figura 37 Representação dos dados selecionados em RDF............................................. 143

Page 12: modelagem e representação semântica de dados governamentais

LISTA DE QUADROS

Quadro 1 Análise da definição 1 sobre acidente do trabalho.......................................... 117

Quadro 2 Análise da definição 2 sobre acidente do trabalho.......................................... 118

Quadro 3 Análise da definição 3 sobre acidente do trabalho.......................................... 119

Quadro 4 Análise da definição 4 sobre acidente do trabalho.......................................... 120

Quadro 5 Análise da definição 5 sobre acidente do trabalho.......................................... 123

Quadro 6 Relações utilizadas nas representações........................................................... 125

Quadro 7 Termos sobre acidente do trabalho aliados aos dados da Previdência

Social...............................................................................................................

127

Quadro 8 Classe do objeto............................................................................................... 136

Quadro 9 Propriedades do objeto.................................................................................... 137

Quadro 10 Atributos.......................................................................................................... 138

Quadro 11 Triplas de RDF propostas com base no diagrama ER..................................... 142

Quadro 12 Triplas de RDF propostas utilizando URIs..................................................... 142

Page 13: modelagem e representação semântica de dados governamentais

LISTA DE SIGLAS

AEAT - Anuário estatístico de acidentes do trabalho

AEPS - Anuário Estatístico da Previdência Social

ARPANET - Advanced Research Project Agency Network

BDTD - Biblioteca Digital de Teses e Dissertações

BFO - Basic Formal Ontology

BRAPCI - Base de Dados Referencial de Artigos de Periódicos em Ciência da Informação

CAT - Comunicação de Acidente do Trabalho

CBO - Classificação Brasileira de Ocupações

CEGE - Comitê Executivo do Governo Eletrônico

CERN - European Organization for Nuclear Research

CGU - Controladoria-Geral da União

CID - Classificação Internacional de Doenças

CNAE - Classificação Nacional de Atividades Econômicas

CSV - Comma-Separeted Values

DATAPREV - Empresa de Tecnologias e Informação da Previdência Social

DGA - Dados Governamentais Abertos

DnS - Descriptions and Situations

DOLCE - Descriptive Ontology for Linguistics and Cognitive Engineering

DTD - Document Type Definition

DUL - DOLCE+DnS Ultralite

EDM - Europeana Data Model

EIA - Energy Information Administration

e-PING - Padrões de Interoperabilidade de Governo Eletrônico

HTML - HyperText Markup Language

INDRA - Infraestrutura Nacional de Dados Abertos

INSS - Instituto Nacional de Seguro Social

LAG - Lista de Assuntos do Governo

LAI - Lei de Acesso a Informação

LOD - Linked Open Data

LOV - Linked Open Vocabularies

LPO - Lógica de Primeira Ordem

NE - Notas de Escopo

Page 14: modelagem e representação semântica de dados governamentais

NPR - National Performance Review

OCDE - Organização para Cooperação e Desenvolvimento Econômico

OIT - Organização Internacional do Trabalho

ONG - Organizações Não Governamentais

OWL - Web Ontology Language

PDF - Portable Document Format

PNAD - Pesquisa Nacional por Amostra de Domicílios

RDF - Resource Description Framework

RDFS - Resource Description Framework Schema

SGML - Standard Generalized Markup Language

SISP - Sistema de Administração dos Recursos de Informação e Informática

SKOS - Simple Knowledge Organisation Systems

SLTI - Secretaria de Logística em Tecnologia de Informação

SRI - Sistemas de Recuperação da Informação

TIC - Tecnologias de Informação e Comunicação

TSE - Tribunal Superior Eleitoral

UF - Unidades Federativas

UFO - Unified Foundational Ontology

UML - Unified Modeling Language

URI - Uniform Resource Identifier VCGE - Vocabulário Controlado do Governo Eletrônico

WWW - World Wide Web

XML - eXtensible Markup Language

Page 15: modelagem e representação semântica de dados governamentais

SUMÁRIO 1 INTRODUÇÃO ............................................................................................... 14

1.1 MOTIVAÇÃO DA PESQUISA........................................................................ 15

1.2 RECORTE ESCOLHIDO................................................................................. 19

1.3 QUESTÕES A SEREM RESPONDIDAS........................................................ 21

1.4 ORGANIZAÇÃO DA PESQUISA................................................................... 22

2 OBJETIVOS .................................................................................................... 23

2.1 OBJETIVO GERAL.......................................................................................... 23

2.2 OBJETIVOS ESPECÍFICOS............................................................................ 23

3 ESCOPO E PROCEDIMENTOS METODOLÓGICOS ............................ 24

3.1 ESCOPO............................................................................................................ 24

3.2 METODOLOGIA.............................................................................................. 24

4 MARCO TEÓRICO ........................................................................................ 29

4. 1 REPRESENTAÇÃO DO CONHECIMENTO.................................................. 29

4.1.1 Uma visão acerca do conceito......................................................................... 30

4.1.2 Teoria do conceito............................................................................................ 32

4.1.3 Modelagem conceitual..................................................................................... 38

4.1.4 Modelo Entidade-Relacionamento................................................................. 42

4.2 WEB SEMANTICA E SUAS TECNOLOGIAS.............................................. 47

4.2.1 Identificando recursos com URI.................................................................... 51

4.2.2 XML e a descrição de dados........................................................................... 52

4.2.3 RDF como linguagem de representação de dados........................................ 54

4.2.4 Ontologia e acidente do trabalho como evento............................................. 56

4.2.5 OWL como ontologia para Web Semântica.................................................. 67

4.2.6 Dados Abertos Interligados............................................................................ 70

4.3 ASPECTOS LEGAIS SOBRE ACESSO À INFORMAÇÃO PLÚBICA........ 74

4.4 UM OLHAR SOBRE O GOVERNO ELETRÔNICO..................................... 78

4.4.1 Accountability................................................................................................... 84

4.4.2 Transparência em ações públicas................................................................... 86

4.5 DADOS GOVERNAMENTAIS ABERTOS.................................................... 89

4.5.1 Iniciativas estrangeiras de dados governamentais abertos.......................... 96

4.5.2 Iniciativas nacionais de dados governamentais abertos............................... 99

Page 16: modelagem e representação semântica de dados governamentais

16

5 INSTRUMENTOS DE REPRESENTAÇÃO DA INFORMAÇÃO

SOBRE ACIDENTES DO TRABALHO ......................................................

104

5.1 ACIDENTE DO TRABALHO NO VCGE....................................................... 104

5.2 ACIDENTE DO TRABALHO NO MODELO DE PUBLICAÇÕES DE

DADOS PUBLICADOS PELA DATAPREV..................................................

110

5.3 ACIDENTES DO TRABALHO NO TESAURO E NA TAXONOMIA DA

OIT....................................................................................................................

112

6 EM BUSCA DE UM MODELO A PARTIR DAS DEFINIÇÕES

SOBRE ACIDENTE DO TRABALHO .........................................................

116

6.1 ANÁLISE DAS DEFINIÇÕES ACERCA DE ACIDENTES DO

TRABALHO.....................................................................................................

116

6.2 MODELO CONCEITUAL SOBRE ACIDENTE DO TRABALHO

ASSOCIADO AOS DADOS DA PREVIDÊNCIA SOCIAL...........................

126

7 ELABORAÇÃO E REUSO DE VOCABULÁRIOS: A QUESTÃO

SOBRE ACIDENTE DO TRABALHO ........................................................

132

7.1 SELEÇÃO DOS DADOS PUBLICADOS PELA DATAPREV...................... 132

7.2 ELABORAÇÃO DO VOCABULÁRIO SOBRE ACIDENTE DO

TRABALHO.....................................................................................................

135

8 DESCRIÇÃO DOS DADOS SOBRE ACIDENTE DO TRABALHO EM

RDF...................................................................................................................

140

9 CONSIDERAÇÕES FINAIS E EXPECTATIVAS ...................................... 144

REFERÊNCIAS.............................................................................................. 147

Page 17: modelagem e representação semântica de dados governamentais

14

1 INTRODUÇÃO

No cenário atual, os governos têm se preocupado em adotar medidas que servem de

elo entre os serviços por eles oferecidos e os cidadãos. São investidos diversos recursos na

criação e no aprimoramento de práticas de gestão pública com o objetivo de melhorar a

qualidade do atendimento, tornando os serviços e as informações disponíveis on-line para o

cidadão. Essas iniciativas aliadas às Tecnologias de Informação e Comunicação (TIC)

propiciaram a implantação de um novo modelo de gestão pública chamada governo

eletrônico1.

A Organização para Cooperação e Desenvolvimento Econômico (OCDE) define, de

forma geral, o governo eletrônico como sendo o uso de tecnologias de informação e

comunicação, em particular a Internet, enquanto ferramenta para levar a um melhor governo.

(OCDE, 2003 apud ALONSO; FERNEDA; BRAGA; 2011).

No Brasil, as iniciativas voltadas para o governo eletrônico intensificaram-se nos anos

90, em consequência do esgotamento do modelo de gestão burocrática. Diniz et al. (2009)

afirma que a ideia de governo eletrônico, em alguns casos, está vinculada à modernização da

administração pública e na melhoria da eficiência dos processos operacionais e

administrativos e, em outros casos, é associada a prestação de serviços públicos eletrônicos.

Entretanto, a visão de que a população é apenas consumidora passiva de serviços e

informações disponibilizadas pelo Governo já não atende a realidade da sociedade em geral.

Os cidadãos assumiram uma preocupação com a transparência, controle social e participação

efetiva nas decisões relacionadas às ações governamentais. (AGUNE, GREGORIO FILHO,

BOLLIGER, 2010; DINIZ, 2010; DINIZ et al., 2009).

Diante do exposto, pode-se dizer que o governo eletrônico possui três vertentes: a

primeira é modernizar os processos operacionais da gestão pública, a segunda é fornecer

serviços públicos aos cidadãos e a terceira é oferecer infraestrutura para habilitar a população

a recuperar e reutilizar dados fornecidos pelo Governo. (BREITMAN et al., 2009).

É sobre essa terceira vertente do governo eletrônico que recai um dos aspectos do

objeto de estudo: os dados governamentais abertos.

1 Governo eletrônico também é conhecido como: e-gov, e-governo, governo digital, governo virtual, Estado virtual, governança eletrônica. (DINIZ et al., 2009, p. 25)

Page 18: modelagem e representação semântica de dados governamentais

15

O W3C (2009, p. 39) define dados governamentais abertos (DGA) como sendo a

publicação de informações do setor público “em formato bruto aberto, de maneira a torná-los

acessíveis a todos e permitir sua reutilização, como a criação de mashups2 de dados”.

Os dados governamentais abertos buscam a publicação na Web de informações do

setor público em formato bruto e aberto, legíveis não somente por pessoas, mas também

inteligíveis por máquinas, de modo a permitir sua reutilização em novas aplicações digitais

desenvolvidas pela sociedade.

1.1 MOTIVAÇÃO DA PESQUISA

A Ciência da Informação e a Tecnologia da Informação possuem uma relação de

proximidade entre si. Desde o seu objeto de estudo, passando pelo motivo de seu surgimento,

até o resultado final de seu objetivo, a Ciência da Informação, como também a Tecnologia da

Informação, tem um caminho científico pautado na otimização de fluxos de comunicação e na

organização, recuperação e disseminação da informação.

Com base no tema aqui proposto, buscou-se na literatura da área o momento da

inserção do Estado (interferência política e análise de informações governamentais) e da

tecnologia (estudo e utilização) na Ciência da Informação. Nos textos de Burke (2007),

Capurro (2003), Costa (1999), Fernandes (2006), Freire (2006), Freitas (2003), González de

Gómez (2002), Hjørland (1998), Marteleto (2009), Saracevic (1996) e Wersig (1993) o

Estado e a tecnologia aparecem, de forma explícita ou subtendida, ligados ao surgimento da

Ciência da Informação.

Surgida principalmente com cunho bélico, a relação entre o Estado e as tecnologias

não parece incluída na Ciência da Informação, porém se destaca como parte de sua formação.

Contribuindo, ainda nos dias presentes, para o desenvolvimento deste campo do

conhecimento, principalmente, no que tange a organização e recuperação da informação.

É lícito dizer que na visão de muitos teóricos da área, dentre eles Hjørland (1998), o

objetivo primordial da Ciência da Informação é a organização e recuperação da informação.

Em outras palavras, ela foi criada com este propósito e continua tendo-o como principal fim

almejado. Por essa razão, tantas pesquisas na Ciência da Informação ligadas à área

tecnológica.

2 Mashup é definido pelo W3C (2009, p. 39) como sendo “a mistura de dados de dois ou mais aplicativos ou fontes de dados diferentes, produzindo pontos de vista comparativos das informações combinadas”.

Page 19: modelagem e representação semântica de dados governamentais

16

A iniciativa dos dados governamentais abertos pode colaborar para o desenvolvimento

tecnológico, buscando, por exemplo, formas eficazes de publicação de dados na Web. E pode

contribuir também para o aspecto social da Ciência da Informação. Organizar os dados

governamentais e facilitar sua recuperação e sua utilização é um dos objetivos da abertura dos

dados governamentais, que vai ao encontro de uma das visões sobre o objeto da Ciência da

Informação que “é ajudar as pessoas (ou mais amplamente: atores) que estão confusas com a

situação do uso do conhecimento (e que ficarão mais confusas por causa do modelo de

sociedade pós-moderna).” (WERSIG, 1993, p. 230, tradução nossa).

Birdsall (2005) chama a atenção para a participação crítica que o profissional da

informação, em especial o bibliotecário, deve ter perante seu papel político na defesa ao

acesso cidadão ao conhecimento, frente ao ambiente de telecomunicações.

A confluência entre a pesquisa e a prática em uma economia política da Biblioteconomia pode fortalecer a profissão bibliotecária para a defesa crítica e para o papel político que deve desempenhar na criação de um novo ambiente de telecomunicações que garanta o acesso da cidadania ao conhecimento. (BIRDSALL, 2005, p. 9).

São escassos os estudos elaborados por profissionais da informação referentes à

publicação de dados governamentais abertos, talvez por eles não se identificarem com esse

processo de publicação. Deveria ser observada por esses profissionais a questão da seleção e

organização desses dados e para quem e com qual objetivo estariam sendo publicados. Isso é

uma peça da participação crítica frente aos aspectos políticos, levantados por Birdsall (2005)

e, ao mesmo tempo, poderia contribuir para que o processo de publicação dos dados

ampliasse seu caráter social, afinal esse é o propósito da iniciativa dos dados governamentais

abertos.

O Estado, por sua vez, não deve somente disponibilizar os dados governamentais, faz-

se necessário também proporcionar que esses dados cheguem aos cidadãos e sejam

compreendidos. (VAZ; RIBEIRO; MATHEUS, 2010). Democratizar a informação envolve

mais que somente programas para facilitar e aumentar o acesso à informação. “É necessário

que o indivíduo tenha condições de elaborar este insumo recebido, transformando-o em

conhecimento esclarecedor e libertador, em benefício próprio e da sociedade onde vive”.

(BARRETO, 1994, p. 5).

Acredita-se que a publicação dos dados governamentais abertos pode beneficiar as

organizações do setor público ou não (por exemplo: empresas privadas, estatísticos,

Organizações Não Governamentais - ONGs - e Hackers). Uma vez que utilizam as

Page 20: modelagem e representação semântica de dados governamentais

17

tecnologias da Web Semântica para a interligação dos dados de outros órgãos para prover

valor agregado a seus próprios dados, melhorando, desta forma, a usabilidade, visibilidade e

valor desses dados.

Trabalhar com dados governamentais abertos possibilita tornar os cidadãos mais

informados, criar eleitores conscientes de seu poder, permitindo-os supervisionar o Governo

através da transparência pública. Além de promover o uso e reutilização das informações do

Governo, criando serviços mais eficientes e amigáveis à população.

Como é afirmado no Manual... (2011, p. 11)

Dados abertos, especialmente os governamentais, são um ótimo recurso ainda muito pouco explorado. Muitos indivíduos e organizações coletam uma ampla gama de diferentes tipos de dados para executar suas tarefas. O governo é particularmente importante nesse contexto, tanto por causa da quantidade e da centralidade dos dados que coleta quanto pelo fato de que tais dados são públicos.

Outro aspecto importante é que a maioria das informações disponibilizadas hoje pelo

Governo está publicada em formatos proprietários ou com tecnologia que restringe seu

acesso. A mera publicação na Web de dados governamentais não os torna acessíveis e/ou

abertos. Isso acarreta, por exemplo, incompatibilidade de equipamentos para uma pessoa que

usa um equipamento móvel ou um computador antigo, ou a falta de informações para alguém

que usa um computador sem o software proprietário necessário, e barreira de acessibilidade

para pessoas com deficiência. (W3C, 2009).

Chen (1990, p. 1) afirma que “conforme nos movemos para uma sociedade cada vez

mais orientada para a informação, a determinação de como organizar os dados para

maximizar sua utilidade torna-se um problema muito importante”.

Por essa razão, é necessário possibilitar o reuso, ou seja, desagregar, reprocessar e

reaplicar esses dados, permitindo novas interpretações e aplicações. Pensando nessa

necessidade, o Governo Brasileiro desenvolveu o Portal Brasileiro de Dados Abertos3 para

fomentar a publicação de dados governamentais e, ao mesmo tempo, possibilitar a

recuperação e reutilização desses dados por cidadãos interessados.

Todavia, percebe-se a dificuldade em se publicar os dados seguindo os princípios dos

dados governamentais abertos. Em 4 de março de 2014, o portal apresentava apenas 112

(cento e doze) conjuntos de dados publicados, um número pequeno para a quantidade de

órgãos públicos e as informações que geram. Ademais, os conjuntos de dados abertos estavam

3 Disponível em: <http://dados.gov.br/>. Acesso em: 19 abr. 2013.

Page 21: modelagem e representação semântica de dados governamentais

18

publicados nos seguintes formatos: xls; pdf; xml; csv; zip+cvs; HTML; zip+txt; zip+sas;

zip+xls e json. Dentre estes, os formatos pdf. e zip, por exemplo, não são considerados

formatos adequados para publicação de dados abertos. Não apresentando nenhum conjunto de

dados em formato Resource Description Framework (RDF), formato recomendado pela

proposta de dados abertos interligados. (BENNETT; HARVEY, 2009; BERNERS-LEE,

2009). Contudo, sabe-se que o Ministério do Planejamento4 e o Tribunal de Contas do Estado

de São Paulo5, publicaram conjuntos de dados em formato RDF. Porém, esses dados não são

mostrados junto com os outros formatos existentes e nem facilmente recuperados no portal

dados.gov.br.

Segundo Berners-Lee (2009), o padrão RDF conecta melhor que qualquer outro

modelo, pois utiliza URIs e assim permite ligação de coisas e conceitos; possibilita que os

sistemas independentes possam ser interligados; ocasiona a interoperabilidade; e admite a

representação dos dados utilizando diferentes vocabulários.

O RDF é fundamental para o estabelecimento do primeiro nível de “semântica”

inteligível por programas, pois embora a eXtensible Markup Language (XML) permita aos

usuários adicionar estrutura arbitrária aos seus documentos, não diz nada sobre o que as

estruturas significam. Significados são expressos pelo RDF, que codifica em conjuntos de

triplas, sendo cada tripla composta por um sujeito, verbo e objeto de uma frase elementar.

(BERNERS-LEE; HENDLER; LASSILA, 2001).

Desta maneira, a publicação de dados governamentais abertos deve-se basear na Web

Semântica, pois assim os dados receberão significados definidos, com metadados em formato

padronizado, possibilitando a compreensão por pessoas e por computadores. A Web

Semântica, idealizada por Tim Berners-Lee, visa melhorar a interação entre as páginas

(autodescritivas) na Web com os programas.

Souza e Alvarenga (2004, p. 134) afirmam ainda que

O projeto da Web Semântica, em sua essência, é a criação e implantação de padrões (Standards) tecnológicos para permitir este panorama, que não somente facilite as trocas de informações entre agentes pessoais, mas principalmente estabeleça uma língua franca para o compartilhamento mais significativo de dados entre dispositivos e sistemas de informação de uma maneira geral.

As tecnologias da Web Semântica proporcionam o compartilhamento e reutilização de

dados de diferentes aplicações, oferecendo tecnologias que descrevam, modelem e permitam 4 Disponível em: <http://www.siop.planejamento.gov.br>. Acesso em: 5 mar. 2014. 5 Disponível em: <http://portaldocidadao.tce.sp.gov.br>. Acesso em: 5 mar. 2014.

Page 22: modelagem e representação semântica de dados governamentais

19

consultas a esses dados. Entretanto, faz necessária a curadoria desses dados para fins de

recuperação e reuso e, neste caso, são os modelos que dão estrutura e significado aos dados.

Esses fatores evidenciam a necessidade de modelos conceituais e consequentemente da

modelagem das relações conceituais. (SALES; SAYÃO; MOTTA, 2012).

Corroborando esse pensamento, Maia e Alvarenga (2013, p. 2) afirmam que com a

Web Semântica “surge a necessidade da modelagem conceitual, onde se busca ferramentas

para os processos de classificação e relacionamento entre os documentos visando a uma maior

eficiência na representação e recuperação do conhecimento”.

Méndez e Greenberg (2012, p. 237) também concordam que são os vocabulários a

base da semântica dos dados ligados. Para as autoras, os vocabulários baseados em linguagens

de domínio, disciplina ou comunidade, ajudam a resolver problemas relacionados à

sobrecarga de informações digitais, bem como auxilia em sua recuperação.

A capacidade de vincular vocabulários diferentes para representação de registros de

dados fornece uma infra-estrutura que permite uma recuperação de informação mais eficaz,

além de facilitar o seu reuso.

Diante disso, a modelagem conceitual pode ser utilizada como forma de se obter

resultados baseados em estruturas conceituais coerentes, elaboradas a partir de definições

específicas de um dado domínio. Le Moigne (1977, p. 34) afirma que “modelar é conceber,

para um objeto, um modelo que permita conhecê-lo, compreendê-lo, interpretá-lo e auxilie na

antecipação do comportamento dele”.

Logo, precisa-se, na publicação de dados governamentais abertos, de vocabulários e

representações semânticas dos domínios contemplados pelo Estado. E para isso se faz uso de

modelos que possibilitarão a organização e representação dos conceitos e das relações

existentes entre eles, que serão utilizados em ontologias para atribuição de semântica a esses

dados publicados.

1.2 RECORTE ESCOLHIDO

Acompanhando o processo de desenvolvimento tecnológico, político e social

internacional, o Brasil já começou a apresentar suas iniciativas em publicação de dados

governamentais em formato aberto. Um dos setores públicos interessados nesta temática é a

Previdência Social, que visa coletar dados sobre a vida profissional dos cidadãos, buscando

conhecer o perfil do trabalhador. A Previdência Social brasileira pode ser considerada “um

patrimônio do trabalhador e sua família. Transformou-se, ao longo das últimas oito décadas,

Page 23: modelagem e representação semântica de dados governamentais

20

em um complexo e abrangente sistema de proteção social, com significativa cobertura de

riscos sociais”. (BRASIL, 2009, p. 7).

A Previdência Social é um dos setores do Governo que mais coleta e organiza dados

sociais. (RIBEIRO, C., 2008). A disseminação dessas informações tratadas também precisa de

uma atenção especial. Assim, é necessário buscar alternativas para que estes dados, cada vez

mais, sejam estudados e reutilizados pela sociedade.

Atualmente, a Previdência Social possui mais de 1.400 agências, pagando

mensalmente 30 milhões de benefícios, atendendo presencialmente a um público de mais de 4

milhões de pessoas/mês, envolvendo cerca de 40 mil servidores. (DATAPREV, 2013). Esses

números geram uma grande quantidade de dados, que estão armazenados em ambientes

tecnológicos heterogêneos e que, com frequência, são utilizados na divulgação de

informações, proporcionando um ambiente favorável para o desenvolvimento de trabalhos

que pesquisem o tratamento e a disseminação destas informações. (RIBEIRO, C., 2008).

Além disso, após um ano da implantação da Lei de Acesso a Informação, a

Controladoria-Geral da União (CGU) informou que a Previdência Social é o segundo órgão

com maior número de demandas de solicitação de informações, ficando atrás apenas da

Superintendência de Seguros Privados. (BATIMARCHI, 2013). Comprovando, dessa

maneira, o interesse do cidadão pelas informações previdenciárias.

A delimitação do tema tem como campo empírico da pesquisa o domínio de dados da

Previdência Social brasileira, tendo em vista o grande volume, a complexidade e o impacto

que estas informações podem exercer em toda a sociedade. Como afirma Ribeiro (2001, p. 3)

“o grande volume e a imensa diversidade de informações na Previdência Social Brasileira

emolduram o cenário fértil para o estudo do comportamento destas informações”.

No caso deste trabalho, o recorte da pesquisa recairá sobre dados estatísticos sobre

acidentes do trabalho, do Ministério da Previdência Social, geridos pela Empresa de

Tecnologias e Informação da Previdência Social (Dataprev). Acidente do trabalho é acidente

que “ocorre pelo exercício do trabalho a serviço da empresa ou pelo exercício do trabalho aos

segurados empregados, trabalhadores avulsos e segurados especiais”. (HORVATH JÚNIOR,

2009, p. 6)

Essa escolha se deve em função desses dados fazerem parte da primeira experiência

com a publicação de dados abertos realizada pela Dataprev, guardiã e gestora dos dados da

Previdência Social brasileira. (DATAPREV, 2012).

A Dataprev deu início à publicação dos dados governamentais abertos de acidentes do

trabalho a partir dos dados estatísticos disponíveis no Anuário Estatístico de Acidente do

Page 24: modelagem e representação semântica de dados governamentais

21

Trabalho (2010). A publicação de dados governamentais abertos envolvendo dados

estatísticos é importante, pois a reutilização desses dados no desenvolvimento de aplicativos

ou outros serviços facilita a compreensão desses dados pelo usuário. Pois, como afirma Senra

(1999), o importante nos dados estatísticos é a informação que eles representam e não o dado

em si.

A estatística revela e mostra pouco a pouco que a população tem suas regularidades próprias: seu número de mortos, seu número de doenças, suas regularidades de acidentes. A estatística mostra igualmente que a população apresenta características próprias em seu conjunto e que esses fenômenos são irredutíveis aos da família: as grandes epidemias, as expansões endêmicas, a espiral do trabalho e da riqueza. A estatística mostra igualmente que, por seus deslocamentos, por suas maneiras de fazer, por sua atividade, a população tem seus efeitos econômicos específicos. A estatística, permitindo quantificar os fenômenos próprios à população, revela uma especificidade irredutível ao pequeno quadro da família. (FOUCAULT, 2003).

Assim, dados estatísticos estão repletos de poderes. Poder de quem o criou (quais as

informações que foram selecionadas a serem quantificadas?), poder da metodologia escolhida

para coleta e representação dos dados e poder de quem trabalhou essa informação (estatística

é a representação quantificável de determinadas informações).

1.3 QUESTÕES A SEREM RESPONDIDAS

Nessa perspectiva, cabe-nos investigar as seguintes questões:

� Como elaborar um modelo conceitual de acidente do trabalho no domínio

da Previdência Social brasileira?

� Como instrumentos de representação da informação, que contemplam a

temática sobre acidente do trabalho, representam este domínio?

� Como representar a proposta do modelo conceitual de acidente do trabalho

utilizando tecnologias da Web Semântica para a publicação dos dados

governamentais abertos da Previdência Social?

Page 25: modelagem e representação semântica de dados governamentais

22

1.4 ORGANIZAÇÃO DA PESQUISA

Além desta introdução, o trabalho apresenta a seguinte organização, dividida em

seções.

A seção 2 apresenta os objetivos gerais e os específicos da pesquisa.

A seção 3 é mostra o escopo e a metodologia empregada para responder as questões da

pesquisa e, consequentemente, alcançar os objetivos.

A seção 4 faz referência ao marco teórico da pesquisa, no qual se investigará: a) a

questão do conceito na representação da informação, aprofundando-se na Teoria do Conceito

de Dalhberg (1978, 1981, 1983), na modelagem conceitual (LE MOIGNE, 1977) e no modelo

Entidade-Relacionamento de Chen (1976); b) a Web Semântica e suas tecnologias: URI,

XML, RDF, Ontologia, OWL e dados abertos interligados; c) os aspectos legais sobre acesso

à informação pública; d) o governo eletrônico no Brasil, privilegiando aspectos sobre

accountability e transparência pública; e) e, por fim, dados governamentais abertos, ilustrados

com algumas iniciativas estrangeiras e nacionais.

A seção 5 apresenta modelos ou instrumentos de representação da informação que

contemplem o universo sobre acidente do trabalho. São apresentados o Vocabulário

Controlado do Governo Eletrônico (VCGE), o modelo de publicações de dados sobre

acidentes do trabalho elaborado pela Dataprev e o tesauro e a taxonomia da Organização

Internacional do trabalho (OIT).

Já a seção 6 faz o relato da elaboração, por meio de definições sobre acidentes do

trabalho, de uma proposta de modelo conceitual na área de acidente do trabalho da

Previdência Social brasileira.

A seguir, a seção 7 mostra como o modelo conceitual pode se constituir num

vocabulário específico para descrever acidentes do trabalho.

A seção 8 revela o processo de conversão do diagrama ER em triplas de RDF,

integrando o vocabulário proposto na seção 7, e sua aplicação em uma faixa de dados

selecionada dentro do conjunto de dados publicados pela Dataprev;

As considerações finais indicadam algumas reflexões sobre os trabalhos, contribuições

e possíveis extensões ao presente trabalho.

Page 26: modelagem e representação semântica de dados governamentais

23

2 OBJETIVOS

2.1 OBJETIVO GERAL

� Propor um modelo conceitual dos dados sobre acidentes do trabalho para

publicação dos dados governamentais mantidos pela Previdência Social.

2.2 OBJETIVOS ESPECÍFICOS

� Representar o conhecimento sobre acidente do trabalho, no âmbito da

Previdência Social brasileira, identificando as entidades presentes e os

relacionamentos existentes;

� Propor um vocabulário sobre acidentes do trabalho, utilizando o modelo

conceitual elaborado;

� Codificar em RDF uma amostra dos dados publicados pela Previdência Social

sobre acidente do trabalho.

Page 27: modelagem e representação semântica de dados governamentais

24

3 ESCOPO E PROCEDIMENTOS METODOLÓGICOS

Metodologia significa, “na origem do termo, estudo dos caminhos, dos instrumentos

usados para se fazer ciência”. (DEMO, 1995, p. 11). Desta forma, mostra-se, agora, as

escolhas feitas para a construção da pesquisa.

3.1 ESCOPO

O campo empírico para aplicação do modelo conceitual proposto é dos dados

estatísticos mantidos pelo Ministério da Previdência Social. A temática será limitada aos

dados sobre acidente do trabalho e a abrangência cobrirá o período entre 2002 a 2009. A

temática e a abrangência foram definidas com base nos dados, atualmente, trabalhados pela

Dataprev para publicação dos dados governamentais abertos, utilizando como fonte principal

o Anuário Estatístico de Acidente do Trabalho, auxiliado pelo Anuário Estatístico da

Previdência Social, ambos publicados pelo Ministério da Previdência Social.

3.2 METODOLOGIA

De acordo com Gil (2002) e Marconi e Lakatos (1992; 2003), a pesquisa pode ser

classificada de acordo com diferentes aspectos, como: de acordo com a natureza da pesquisa,

a forma de abordagem do problema e os objetivos almejados.

Observando esta pesquisa do ponto de vista de sua natureza, pode-se classificá-la

como pesquisa aplicada, pois tem como objetivo reunir e elaborar informações para

“contribuir para fins práticos, visando à solução mais ou menos imediata do problema

encontrado na realidade.” (BARROS; LEHFELD, 2000, p. 78).

Sob a ótica da forma de abordagem do problema, ela é classificada como qualitativa,

pois “trabalha com o universo dos significados, dos motivos, das aspirações, das crenças, dos

valores e das atitudes”. (MINAYO, 2002, p. 21). Em outras palavras, a pesquisa qualitativa

trata e interpreta conjuntos de materiais disponíveis utilizando “processos hermenêuticos a

partir do que busca extrair dos discursos a expressão da subjetividade do sujeito informante

ou a percepção obtida pela participação do pesquisador em processos de coleta com

envolvimento direto ou com observação”. (SOUZA, 2003, p. 29).

Esta pesquisa pode ser classificada segundo seus objetivos como pesquisa

exploratória, pois busca proporcionar maior familiaridade com o problema, com vistas a

Page 28: modelagem e representação semântica de dados governamentais

25

torná-lo mais explícito ou a constituir hipóteses. Utilizando-se, na maioria dos casos, de

levantamento bibliográfico e análise de exemplos que estimulem a compreensão do objeto

estudado. (GIL, 2002).

Os procedimentos metodológicos foram divididos da seguinte forma:

� Pesquisa bibliográfica

Para fundamentação do marco-teórico, apresentado na seção quatro, buscou-se

levantar os autores de Ciência da Informação e áreas afins a esta pesquisa, com análises de

citação e de conteúdo para identificação e escolha dos conceitos a serem utilizados.

Foram pesquisados os termos: “conceito”, “modelagem conceitual”, “modelo

entidade-relacionamento”, “Web Semântica”, “governo eletrônico” e “dados governamentais

abertos”6. A pesquisa foi realizada nas seguintes bases de dados: Portal Capes7, Biblioteca

Digital de Teses e Dissertações (BDTD)8, Base de Dados Referencial de Artigos de

Periódicos em Ciência da Informação (BRAPCI)9, CitesserX10, Google Acadêmico11. As

bases de dados foram selecionadas por disponibilizarem relevante produção científica em

Ciência da Informação e demais áreas envolvidas neste estudo.

� Identificação de modelos ou vocabulários sobre acidentes do trabalho

Pesquisou-se por modelos ou vocabulários existentes que pudessem representar ou

serem utilizados na elaboração de um modelo conceitual sobre acidente do trabalho no

domínio da Previdência Social. Observou-se o Vocabulário Controlado do Governo

Eletrônico (VCGE)12, o modelo de publicações de dados sobre acidentes do trabalho

publicado pela Dataprev13 e o tesauro e a taxonomia da Organização Internacional do

Trabalho (OIT)14.

6 Os termos foram pesquisados também com suas variações linguísticas (sinônimos) e abreviações e também em outros idiomas (inglês, espanhol e francês). 7 Disponível em: <http://www.periodicos.capes.gov.br/>. Acesso em: 6 abr. 2013. 8 Disponível em: <http://bdtd.ibict.br/>. Acesso em: 6 abr. 2013. 9 Disponível em: <http://www.brapci.ufpr.br/>. Acesso em: 6 abr. 2013. 10 Disponível em: <http://citeseerx.ist.psu.edu/index;jsessionid=19C845A95BBA6034A1D095B5D465E7D9>. Acesso em: 6 abr. 2013. 11 Disponível em: < http://scholar.google.com.br/>. Acesso em: 6 abr. 2013. 12 Disponível em: <http://vocab.e.gov.br/2011/03/vcge>. Acesso em: 6 abr. 2013. 13 Disponível em: <http://api.dataprev.gov.br/doc/dadosDisp.htm>. Acesso em: 6 abr. 2013. 14 Disponível em: <http://www.ilo.org/thesaurus/defaultes.asp>. Acesso em: 6 abr. 2013.

Page 29: modelagem e representação semântica de dados governamentais

26

Para essa atividade, foi necessário observar cada instrumento de representação

levando-se em consideração a estrutura e as informações dos dados publicados pela Dataprev,

a relação entre acidente do trabalho e os benefícios previdenciários brasileiros e outras

questões particulares a cada instrumento estudado.

Esta metodologia, utilizada na seção cinco, busca conhecimentos para responder uma

questão proposta neste trabalho: “Como instrumentos de representação da informação que

contemplam a temática sobre acidente do trabalho representam este domínio?”

� Elaboração de um modelo conceitual sobre acidente do trabalho

A seção seis buscará, por meio de definições sobre acidentes do trabalho, identificar

conceitos e suas relações de modo a se propor um modelo conceitual sobre este tipo de

acidente. Para que tal resultado seja conquistado, seguiram-se os seguintes passos

metodológicos:

a. Na coleta e seleção das definições buscou-se por autores representativos e/ou por

fontes de referência legais que definissem acidente do trabalho. Deste modo, foram

identificadas quatro fontes:

i. Brasil (1991) que regulamenta a Lei n. 8.213, publicada em 24 de julho de

1991, que dispõe sobre os planos de benefícios da Previdência Social. No

artigo décimo nono da referida Lei é definido o acidente do trabalho.

ii. Anuário Estatístico da Previdência Social (2012) que é uma publicação oficial

da Previdência Social que reúne dados estatísticos referentes às atividades

desenvolvidas no ano 2011. Nesta publicação, o quarto capítulo é dedicado

exclusivamente aos acidentes do trabalho, apresentando sua definição.

iii. Organización Internacional del Trabajo (2011) que em seu tesauro define e

classifica acidente do trabalho.

iv. Horvath Júnior (2009), que publicou o “Dicionário analítico de Previdência

Social”, único dicionário especializado localizado que define acidente do

trabalho.

b. Classificação das definições e identificação dos termos com base na Teoria do

Conceito, desenvolvida por Dahlberg (1978a, 1981, 1983). De acordo com Dahlberg

(1983) as definições serão classificadas em: definição genérica, definição partitiva e

definição funcional. Esta classificação mostra as características de uma definição.

Page 30: modelagem e representação semântica de dados governamentais

27

Ademais, esta classificação auxiliou no estabelecimento das relações existentes entre

os termos encontrados;

c. Classificação dos termos identificados de acordo com as categorias das ontologias

Unified Foundational Ontology for perdurants (UFO-B) e da DOLCE15+DnS16

Ultralite (DUL), verificando semelhanças e diferenças, contribuindo para a

identificação dos elementos (objeto ou relação) do modelo a ser construído;

d. Classificação dos termos de acordo com o modelo de Entidade-Relacionamento,

desenvolvido por Chen (1976)17. Esta classificação possibilitará obter uma visão de

como os elementos estão interligados, possibilitando também uma representação

gráfica;

e. Elaboração de um diagrama de Entidade-Relacionamento para cada definição

analisada; e

f. Apresentação, ao final, de um modelo consolidado, abrangendo a área de acidente do

trabalho no domínio da Previdência Social.

Esta metodologia busca responder a pergunta: “como elaborar um modelo conceitual

de acidente do trabalho no domínio da Previdência Social brasileira?”. Procurando atingir o

objetivo geral deste estudo.

� Elaboração de um vocabulário sobre acidente do trabalho

Esta parte do trabalho, presente na seção 7, apresenta o vocabulário proposto, que

seguiu os passos abaixo:

a. Escolha dos conceitos do modelo conceitual a serem utilizados na elaboração do

vocabulário. Não serão contemplados todos os conceitos neste momento, apenas

aqueles relacionados diretamente aos dados já publicados pela Previdência Social;

b. Busca por vocabulários já existentes que possam contemplar essas entidades,

relacionamentos e atributos;

c. Criação de URIs fictícios para os conceitos a serem criados; 15 Descriptive Ontology for Linguistic and Cognitive Engineering. 16 Descriptions and situations. 17 A escolha do Modelo Entidade-Relacionamento é justificada pela sua proximidade com o RDF, padrão indicado para descrição de dados na Web Semântica. Chen (2002) ao falar dos possíveis usos e relações do modelo Entidade-Relacionamento o associa ao RDF, afirmando que existem algumas semelhanças e diferenças entre RDF e do modelo ER. Entretanto, o RDF, já é considerado um membro da família da modelagem Entidade-Relacionamento, em que os dados estruturados como gráficos rotulados podem ser trocados através de documentos XML. (W3C, 1999).

Page 31: modelagem e representação semântica de dados governamentais

28

d. Definição de um nome (namespace) para o vocabulário;

e. Descrição dos conceitos que farão parte do vocabulário proposto;

f. Divisão do vocabulário em classes (entidades), propriedade (relacionamentos) e

elementos (atributos).

� Codificação em RDF de uma amostra dos dados publicados pela Previdência

Social sobre acidente do trabalho

Esta é a parte prática da pesquisa a ser mostrada na seção 8 da dissertação, na qual será

realizada a conversão das entidades e relacionamentos do modelo proposto em triplas de

RDF, tecnologia recomendada pela W3C para descrição de dados na Web Semântica. Será

escolhida uma parte dos dados já publicados pela Dataprev sobre acidente do trabalho para

implementação do RDF.

Seguiram-se os seguintes passos:

a) Definição das triplas RDF com base no modelo conceitual proposto.

b) Representação das triplas RDF em quadros, baseados na criação de tabelas para

descrição de banco de dados lógicos (XU; LEE; KIM, 2010) para descrever as

entidades e relações e convertê-las para triplas RDF;

c) Substituição dos elementos do quadro por suas respectivas URI, de acordo com o

vocabulário proposto;

d) Implementação das triplas RDF nos dados selecionados em um modelo gráfico

RDF/XML.

Pretende-se, com isso, responder a última questão apresentada neste trabalho: “como

representar a proposta do modelo conceitual de acidente do trabalho utilizando tecnologias da

Web Semântica para a publicação dos dados governamentais abertos da Previdência Social?”.

E atender ao objetivo específico de propor um esquema, em RDF, para publicação dos dados

sobre acidente do trabalho.

Page 32: modelagem e representação semântica de dados governamentais

29

4 MARCO TEÓRICO

Para melhor entendimento do trabalho que se pretende desenvolver e para facilitar o

agrupamento da bibliografia recolhida através da pesquisa bibliográfica, decidiu-se elaborar o

referencial teórico, que busca fornecer um panorama sobre alguns conteúdos, julgados

imprescindíveis para a compreensão da pesquisa. Desde modo, foram estudados os seguintes

assuntos: conceito (teoria e modelos), Web Semântica e dados governamentais abertos e seus,

respectivos, assuntos correlatos.

4.1 REPRESENTAÇÃO DO CONHECIMENTO

A Ciência da Informação é um campo de estudo cujos esforços estão direcionados ao

entendimento sobre as vertentes que envolvem a produção, circulação e uso da informação.

Pesquisas, nesta área, buscam fornecer teorias e instrumentos que auxiliam no

armazenamento, recuperação e disseminação da informação.

Alvarenga (2001) afirma que a criação, a disponibilização e o aperfeiçoamento das

tecnologias da informação interferiram diretamente nos sistemas de representação e

recuperação de informações documentais. Estes sistemas tradicionais foram obrigados a

expandir sua forma de representação, indo além dos catálogos referenciais em fichas,

alcançando as bases de dados online. De acordo ainda com esta autora, essas mudanças nos

sistemas de representação acarretaram o interesse de diferentes áreas no estudo deste campo,

destacando a Linguística e a Ciência da Computação, com seus estudos sobre bases de dados.

Davis, Shrobe e Szolovits (1993) estabelecem o conceito de representação do

conhecimento a partir de cinco definições concebidas com base em sua utilização: (1) a

representação do conhecimento é fundamentalmente um substituto para aquilo que representa;

(2) é uma aproximação imperfeita da realidade, selecionando o que e como observar o ser ou

objeto representado; (3) é uma teoria fragmentária de raciocínio inteligente expresso em

termos de três componentes: (a) concepção fundamental da representação do raciocínio

inteligente, (b) o conjunto de inferências que as sanções de representação, e (c) o conjunto de

inferências que ele recomenda; (4) é um meio para a computação pragmaticamente eficiente,

isto é, o ambiente em que o pensamento computacional é realizado, contribuindo para

organizar as informações de forma a facilitar a tomada das inferências recomendadas; e (5) é

um meio de expressão humana, isto é, uma linguagem em que se diz algo sobre o mundo.

Page 33: modelagem e representação semântica de dados governamentais

30

Neste estudo, nota-se um entrosamento entre a Ciência da Informação e a Ciência da

Computação na representação de dados. Maia e Alvarenga (2013, p. 2) comentam que existe

uma preocupação recíproca entre ambas as áreas citadas, no que se refere “ao aspecto da

representação, organização intelectual, busca e recuperação da informação em sistemas

específicos”. As autoras acrescentam ainda que os “sistemas de recuperação da informação

(SRI) são estudos realizados na base estrutural da CI e, ao mesmo tempo, também participam

de um contexto de estudo da CC [Ciência da Computação]”. (Maia, Alvarenga, 2013, p. 2)

Campos (2004) analisa os mecanismos de representação do conhecimento sob a ótica

de diferentes áreas,

No âmbito da Ciência da Computação, eles servem para auxiliar a implementação de estruturas computáveis. No âmbito da ciência da informação, possibilitam a elaboração de linguagens documentárias verbais e notacionais, visando à recuperação de informação e à organização dos conteúdos informacionais de documentos. No âmbito da terminologia, esses mesmos mecanismos permitem a sistematização dos conceitos e, conseqüentemente, a elaboração de definições consistentes. (CAMPOS, 2004, p. 23).

Desta forma, percebe-se que a representação da informação pode ser estudada com

focos diversos, de acordo com o contexto e com os objetivos propostos. Logo, “pode-se dizer

que a representação dos objetos pelos indivíduos está diretamente ligada ao modo como cada

um percebe o mundo e interage com ele”. (LEITE, BORNIA, 2006, p. 2).

Na visão da Ciência da Informação, Novellino (1996, p. 38) considera que “a principal

característica do processo de representação da informação é a substituição de uma entidade

lingüística longa e complexa - o texto do documento - por sua descrição abreviada”. Em

outras palavras, a autora está se referindo diretamente ao processo de representação temática

de um documento. Este processo que envolve dois processos: “análise conceitual e tradução”

(LANCASTER, 1993, p. 8). Neste momento, chega-se ao Conceito, elemento tão importante

na representação do conhecimento, que será visto com mais detalhes na subseção a seguir.

4.1.1 Uma visão acerca do conceito

Há diversas abordagens de diferentes áreas do conhecimento que se debruçam sobre o

estudo do conceito. Estes estudos podem variar ainda dentro da mesma área de acordo com a

corrente teórico-epistemológica adotada. (FRANCELIN; KOBASHI, 2011, p. 208).

Page 34: modelagem e representação semântica de dados governamentais

31

Na Ciência da Informação, são recorrentes os estudos que discutem a relação entre a

linguagem (representação) e as coisas (mundo real). Compreender as ligações entre o mundo

real, os conceitos e sua representação gráfica é necessário no processo de representação.

Na época de Aristóteles existia a preocupação de se unir o domínio das palavras ao

domínio das coisas. Ao estudar as obras de Aristóteles, Figueiredo (2000, p. 11) considera que

os conceitos têm uma realidade mental, em outras palavras, é o modo como os homens

organizam mentalmente as coisas existentes, agrupando-as de acordo com conceitos

estabelecidos e nomeando-as com uma palavra, em um determinado contexto.

Um conceito é uma rede de padrões de inferências, associações e relacionamentos que são predicados ou ditos de outra forma trazidos em cena através do ato da categorização [...] a cristalização ou formalização do pensamento inferencial, nascida da percepção sensorial, condicionada pela operação do cérebro humano e delineada pela experiência humana. Ela repousa na fundamentação de todo pensamento, mas ela é pragmática e instrumental. É permanente e efêmera. Permanente porque sem ela, a cognição é impossível; efêmera porque ela pode ser rejeitada quando sua utilidade é esgotada. (SHERA, 1957 apud ALVARENGA, 2001, p. 33).

Alvarenga (2001, p. 33) complementa a ideia de Shera (1957) afirmando que os

conceitos “ou padrões se constituem na matéria do qual as classificações são feitas. Os

conceitos podem se referir às coisas concretas e abstratas. Os conceitos e a formação de

conceitos são o material para a construção das classificações bibliográficas”.

Eugen Wüester, ao elaborar a Teoria Geral da Terminologia, definiu conceito como “a

unidade de pensamento, constituído de características que refletem as propriedades

significativas atribuídas a um objeto, ou a uma classe de objetos”. (CAMPOS, 2001, p. 71).

Todavia, outra definição clássica de conceito é a estabelecida por Dahlberg (1978c),

que define conceito como sendo “a unidade de conhecimento que surge da síntese dos

predicados necessários relacionados com determinado objeto e que, por meio de sinais

lingüísticos, pode ser comunicado”. (Dahlberg, 1978c, p. 12). A Teoria do Conceito será vista

com mais detalhes na próxima seção sobre a Teoria do Conceito.

A “compilação de enunciados verdadeiros” (DAHLBERG, 1978a, p. 102), já estava

presente no pensamento de Aristóteles, que se valia dos conceitos para verificar a validade das

proposições. As relações entre as palavras, dispostas da seguinte maneira sujeito-verbo-

predicado são chamadas de proposições. (FIGUEIREDO, 2000, p. 12). Sendo que o sujeito e

o predicado são os objetos concretos ou abstratos e o verbo é a relação existe entre eles. Está

Page 35: modelagem e representação semântica de dados governamentais

32

lógica foi também apropriada pela área da Ciência da Computação, quando elaboraram a

tripla de RDF, melhor explicado na seção 4.2.3.

Para se verificar a veracidade de uma proposição se recorre a dois tipos de processos:

verificação empírica e análise conceitual. Na verificação empírica, os objetos são vistos

diretamente para se confrontar a afirmativa. Já na análise conceitual, analisa-se o conceito do

sujeito e verifica-se se é compatível com o conceito do predicado. Assim, a verificação

empírica precisa do sujeito individual, pois é necessária a observação direta, já a análise

conceitual “é um processo que nos permite declarar se uma proposição é verdadeira ou falsa,

independentemente dos sujeitos individuais a que se aplica o seu predicado”. (FIGUEIREDO,

2000, p. 13).

Os conceitos são importantes para identificar, classificar e organizar os objetos. Reunir

por conceitos, de acordo com características comuns, facilitar a organização semântica dos

objetos. Desta forma, pode-se dizer que “a organização conceitual é necessária a qualquer

sistema adequado que objetive a recuperação da informação”. (FROHMANN, 1983 apud

MOTTA, 1987, p. 30).

A seguir será mostrado a Teoria do Conceito de Dahlberg, a modelagem conceitual de

Le Moigne e o modelo Entidade-Relacionamento de Chen. A expectativa é proporcionar uma

visão de como o conceito se constitui e contribui para a representação do conhecimento, de

acordo com essas teorias.

4.1.2 Teoria do conceito

A Teoria do Conceito foi elaborada por Ingetraut Dahlberg nos anos 70. Desde então

tem sido referência para diversos estudos na área de representação do conhecimento,

principalmente, com vistas à recuperação.

Baseado nos princípios da Teoria do Conceito é possível estabelecer relações e

determinar, no plano verbal, o que se denomina termo. (CAMPOS, 2001, p. 87). Exatamente

por estes benefícios trazidos à área de representação do conhecimento, que a Teoria do

Conceito é muito utilizada para a elaboração de tesauros.

De acordo com Alvarenga (2001) a Teoria do Conceito teve grande influência do

pensamento de Aristóteles. Esta autora referencia o ato da cognição humana e a fatoração do

conceito em categorias, como exemplos de contribuições para a evolução do pensamento

filosófico e científico. Ela adiciona ainda que para Aristóteles,

Page 36: modelagem e representação semântica de dados governamentais

33

[...] saber seria ter muitos conceitos e conhecer significava três coisas”: 1. formar conceitos, ou seja, constituir em nossa mente um conjunto de notas características para cada uma das essências que se realizam na substância individual.; 2. aplicar esses conceitos que formamos a cada coisa individual, colocar cada coisa individual sob um conceito. Chegar à natureza; contemplar a substância; olha-la e voltar para dentro de nós mesmos para procurar no arsenal de conceitos aquele que se ajustasse a uma singular substância; e formular um juízo; 3. embaralhar entre si esses diversos juízos, em forma de raciocínios que nos permitissem chegar à conclusão acerca de substâncias que não temos presentes. (ALVARENGA, 2001, p. 7-8)

Como visto na seção anterior, em sua Teoria do Conceito, Dahlberg (1978) define

conceito como sendo uma unidade de conhecimento. O processo para formação de um

conceito é formado por três etapas constituída por três elementos (ver figura 1): A) o item de

referência ou referente (objeto real ou abstrato se pretende conceituar,); B) as características

(declarações ou proposições verdadeiras acerca do referente); e C) a forma verbal

(expressão/termo utilizada para representar o referente).

FIGURA 1 - Modelo de construção do conceito.

Fonte: DAHLBERG (1978b)

Ao observar estas etapas, percebe-se que o conceito é constituído de três elementos: o

referente, as características e a forma verbal. Formando o Triângulo do Conceito (figura 2),

desenvolvido por Dahlberg (1978b).

Page 37: modelagem e representação semântica de dados governamentais

34

FIGURA 2 - Triângulo do conceito

Fonte: Dahlberg (1978b) Deve-se ficar claro que o processo de formação do conceito se inicia com a escolha do

referente, que possui suas características relevantes analisadas de acordo com um determinado

domínio. Termos graficamente iguais poderão ter diferentes conceitos se observados em áreas

do saber diferentes, uma vez que as características relevantes se alteram de campo para campo

do conhecimento. (DAHLBERG, 1978a).

Dahlberg (1978a) chama de análise do conceito a identificação das características dos

conceitos, obtidas a partir da formulação de enunciados verdadeiros sobre os objetos

(referentes). Identificar as características dos conceitos se faz importante, pois elas exercem as

funções de: “ordenação classificatória dos conceitos e respectivos índices; definição dos

conceitos; formação dos nomes dos conceitos”. (DAHLBERG, 1978a, p. 104).

Na Teoria do Conceito as características são divididas em duas espécies: as

“características essenciais”, que são as necessárias para se definir conceitos gerais; e as

“características acidentais”, que são as adicionais ou possíveis de estarem presentes nos

conceitos. A identificação das características é importante para “determinar a ordem dos

conceitos”. (DAHLBERG, 1978a, p. 104).

Ademais, as características são importantes na identificação dos relacionamentos, pois

“sempre que diferentes conceitos possuem características idênticas deve-se admitir que entre

eles existam relações”. (DAHLBERG, 1978a, p. 104).

Os conceitos se relacionam entre si formando um “sistema de conceito terminológico,

pois são representações mentais das relações que ocorrem entre os objetos na realidade

empírica”. (CAMPOS, 2001b, p. 77). Para Wuester (1981) as relações, tratadas em um nível

conceitual, podem ser classificadas em relações lógicas e ontológicas.

A experiência mostra como é difícil para um grande número de pessoas distinguir as duas espécies de relação (lógica e ontológica). Contudo, um abismo intransponível separa muito bem estas duas categorias de relações

Page 38: modelagem e representação semântica de dados governamentais

35

conceituais. [...] As relações ontológicas nascem do fato de elevarem-se a um nível de abstração as relações que existem na realidade entre os indivíduos (relações ônticas) fazendo-se destas relações individuais (por assim dizer destes indivíduos de relações) conceitos de relação (por exemplo, acima, abaixo). (WUESTER, 1981, p. 97 apud CAMPOS, 2001b, p. 78).

Dahlberg (1978a) utiliza as relações lógicas para estabelecer possíveis comparações

entre os conceitos, de modo a conseguir organizá-los. Esta autora apresenta ainda outros

relacionamentos, a saber:

� Relações hierárquicas ou de gênero e espécie – ocorrem quando dois conceitos

diferentes possuem características idênticas e um deles possui uma característica a

mais que o outro;

� Relações partitivas – ocorrem quando existe um todo e suas partes;

� Relações de oposição – ocorrem quando um conceito se opõe a outro, por

contradição ou contrariedade; e

� Relações funcionais – ocorrem com conceitos que expressam processo, mostrando

as funções do objeto.

A Teoria do Conceito ainda trabalha com o sentido da intensão e extensão do conceito.

Dahlberg (1978a, p. 105) explica que a intensão do conceito é a soma total das suas

características, além da “soma total dos respectivos conceitos genéricos das diferenças

específicas”. Já a extensão do conceito seria a soma total dos conceitos mais específicos que o

conceito possui, bem como a soma dos conceitos para os quais a intensão verdadeira, ou seja,

características em comum que também se encontram na intensão do mesmo conceito.

Nas definições estão as características do conceito, delimitando estas características

(intensão), é possível determinar os conceitos que possam ser relacionados ao conceito em

análise por possuírem características semelhantes, determinando sua totalidade ou o número

de conceitos que este conceito abarca (extensão). (FELBER, 1984 apud CAMPOS, 2001b, p.

76).

A necessidade de estudos sobre as definições se faz cada vez maior. A pergunta “o que

é...?” desperta o interesse das pessoas desde a infância. A curiosidade ou a necessidade de se

saber o que é determinado objeto (concreto ou abstrato) persegue o homem ao longo da vida e

em todos os períodos históricos. Desta forma, definir algo é uma tarefa difícil que envolve

Page 39: modelagem e representação semântica de dados governamentais

36

diversos elementos como: o assunto, o público-alvo, o profissional ou o estudioso responsável

pela definição, finalidade da definição dentre outros.

No meio acadêmico as definições sempre se mostraram fundamentais, por serem

“pressupostos indispensáveis na argumentação e nas comunicações verbais e que constituem

elementos necessários na construção de sistemas científicos”. (DAHLBERG, 1978a, p. 106).

Ainda neste pensamento, Viegas (2007, p. 73) afirma que “a ciência também tem seus

instrumentos – como a definição e a classificação – e exigências rituais – como a

argumentação”. Logo, pode-se inferir que na definição encontram-se elementos capazes de

contribuir para estudos relacionados à Organização do Conhecimento.

Nas palavras de Japiassú e Marcondes (2001, p. 49) definir, do ponto de vista lógico,

“significa determinar a ‘compreensão’ que caracteriza um conceito”. De acordo com estes

autores, para Aristóteles, a definição é a fórmula que exprime a essência de uma coisa,

composta do gênero (próximo) e das diferenças (específicas).

Definição “é uma locução que exprime o que uma coisa é ou qual o significado de um

termo” (VIEGAS, 2007, p. 75). Já para Dahlberg (1978a, p. 106) a definição é como uma

“delimitação ou fixação do conteúdo de um conceito (conteúdo do conceito = intensão, ou

conjunto de características ou atributos)”.

Isto posto, percebe-se a importância da definição não somente como instrumento de

argumentação científica, mas também como forma de delimitação de campos de estudos. Nos

quais as características, presentes nas definições dos conceitos, especificam as fronteiras

semânticas de determinadas áreas do conhecimento.

Sob essa vertente, na literatura sobre critérios para elaboração de ontologias e

estruturas taxonômicas aparecem estudos de Welty e Guarino (2001), Smith e Kumar (2004) e

Guizzardi (2005). Todavia, Marcondes (2014) ao estudar diversas metodologias para

desenvolvimento de ontologias, constatou que, apesar desses estudos mencionarem a

necessidade de se criar um primeiro glossário com termos potencialmente relevantes, para se

chegar a uma refinada lista de termos e seus sentidos (FERNANDEZ; GÓMEZ-PÉREZ;

JURISTO, 1997, p. 37), o processo de coleta e identificação dos termos para composição do

glossário não é explicado.

Acredita-se que nas definições possam estar os elementos necessários para a coleta e

identificação dos termos. A Teoria do Conceito de Dahlberg (1978a) e, em especial seus

estudos acerca de definições conceituais (DAHLBERG, 1983) podem oferecer a base teórica

necessária para a identificação e organização dos termos.

Page 40: modelagem e representação semântica de dados governamentais

37

Por essa razão, as definições são imprescindíveis na fase de conceituação de

ontologias, pois são elas que irão “determinar ou fixar os limites de um conceito ou idéia”

(DAHLBERG, 1978a, p. 106). São esses limites que demarcarão os conceitos, identificando-

os.

Há diferentes maneiras de classificar as definições. Pelo prisma filosófico, há a

definição nominal, que explica o sentido de uma palavra pelo recurso a outras palavras ou à

etimologia. E também existe a definição real que é aquela que indica a natureza do objeto ou

da coisa a ser definida. Já do ponto de vista científico, as definições são operatórias ou

empíricas, na qual os conceitos que elas descrevem são definidos por experimentações

repetíveis; não são absolutas, pois estão ligadas ao conjunto do pano de fundo teórico da

experimentação. (JAPIASSÚ; MARCONDES, 2001, p. 49).

Dahlberg (1978a, p. 106) tenta esclarecer a diferença entre definição nominal e real

dizendo que “a definição nominal procura fixar o uso de determinada palavra enquanto que a

definição real tem por finalidade apresentar o conhecimento contido em determinado

conceito”. Assim sendo, a definição nominal fixa o sentido de uma palavra, e a definição real

busca distinguir o conceito de outros com características idênticas. Entretanto, é valido

lembrar que nem sempre é fácil “saber se estamos fazendo uma definição real ou uma

definição nominal. Noutros casos efetuamos as duas ao mesmo tempo”. (DAHLBERG,

1978a, p. 106).

Alguns anos depois de seus primeiros estudos, Dahlberg (1983) amplia sua visão sobre

as definições incluindo a definição ostensiva aos outros tipos de definições já estudados por

ela: nominal e real, este último também chamado agora de definição conceitual. A definição

ostensiva seria quando o definiens (expressão verbal utilizada para definir algo) é elaborado

com base no referente nomeado pelo definiendum (termo definido). Neste presente trabalho,

as definições nominais e reais ou conceituais são as que terão maior relevância, pois essas

permitem a compatibilização no plano linguístico e no plano semântico, respectivamente.

(CAMPOS, 2010, p. 231).

Dahlberg (1983) se utiliza da Teoria do Conceito para afirmar que o que compõem a

definição de um conceito são suas características relevantes. São, justamente, as

características presentes na definição que possibilitarão a classificação destas definições em:

definição genérica, definição partitiva e definição funcional. Campos (2010) explica que a

definição genérica permite identificar a categoria do conceito, a partitiva, os componentes do conceito definido, e a funcional insere o conceito como

Page 41: modelagem e representação semântica de dados governamentais

38

elemento integrador no contexto analisado, ou seja, ela permite que se identifique, na definição, a função/finalidade fornecida a base para se estabelecer os sistemas terminológicos. (CAMPOS, 2010, p. 231)

Em analogia, pode-se observar que Le Moigne (1990, p. 79) já apontava que para se

compreender um fenômeno é necessário observar três dimensões: “A definição de um objeto

faz-se por triangulação: pondera um definição funcional (o que o objeto faz), uma definição

ontológica (o que o objeto é) e uma definição genética (o que o objeto devém)”. Tanto

Dahlberg, quanto Le Moigne trabalham com princípios parecidos para classificar as

definições.

Campos (2010) buscou desenvolver uma proposta de definição adequada para a

construção de ontologias de domínio consistente. Assim, a autora parte da hipótese que é

necessário estabelecer padrões para enunciados definitórios que atendam as especificidades de

cada domínio. Desta forma, propõe elementos que deveriam compor a descrição de um

determinado objeto (conceito), dentre eles são citados a presença de características que

“indicam o gênero próximo e a diferença específica do conceito em análise, seus componentes

(caso o conceito seja objeto concreto ou abstrato) ou suas etapas (caso seja um processo ou

atividade) e, por fim, a finalidade de aplicação no contexto no qual será aplicado”.

(CAMPOS, 2010, p. 222).

Principalmente pela necessidade de definições bem fundamentadas para a elaboração

de ontologias, o interesse pelos estudos sobre definição tem aumentado. Entretanto, há a

necessidade de maior aprofundamento nesta temática para que se consigam realmente padrões

definitórios capazes de contribuir para a elucidação de um conceito.

Acredita-se que as categorias de definição apresentadas por Dahlberg (1983), poderão

contribuir para análise das definições acerca de acidentes do trabalho. A identificação dos

termos e das características/atributos, presentes nos enunciados analisados, auxiliarão a

modelização do domínio a ser desenvolvida.

4.1.3 Modelagem conceitual

Diante de um mundo cada vez mais complexo, no qual “qualquer conhecimento opera

por seleção de dados significativos e rejeição de dados não significativos” (MORIN, 2006, p.

10), os modelos podem ser utilizados para representarem, de forma simplificada, a realidade

que se pretende compreender.

Page 42: modelagem e representação semântica de dados governamentais

39

Dito de outra forma, modelo é uma aproximação de uma determinada realidade, “que,

de acordo com a sua função utilitária e por meio do seu modo de expressão, sua estrutura e

suas igualdades e desigualdades em relação ao seu original, tenta comunicar algo sobre o

real”. (SAYÃO, 2001, p. 82). Funcionam, desta forma, como analogias que reformulam o

conhecimento sobre certos aspectos do mundo real, “que podem ser reaplicados a novos

conjuntos de observações e, nesse sentido, são necessários por constituírem uma ponte entre

níveis da observação e do teórico”. (DODEBEI, 2002, p. 20).

Capra (1986 apud SAYÃO, 2001, p. 82-83) afirma que todas as teorias e modelos

científicos são aproximações da verdadeira natureza das coisas e é isto que constitui o método

científico. E acrescenta que a compreensão aproximada da natureza pode ajudar a descrever

grupos selecionados de fenômenos, negligenciando outros que se mostrem menos relevantes,

em dado momento.

Desta forma, os modelos podem ser considerados como “aproximações seletivas que,

pela eliminação de detalhes acidentais, permitem o aparecimento de alguns aspectos

fundamentais relevantes ou interessantes do mundo real sob alguma forma generalizada”.

(SAYÃO, 2001, p. 83).

Le Moigne (1977, p. 34) afirma que “modelar é conceber, para um objeto, um modelo

que permita conhecê-lo, compreendê-lo, interpretá-lo e auxilie na antecipação do

comportamento dele”. Em outras palavras, “o objetivo da modelagem de conhecimento é

elaborar uma conceituação da porção do mundo em estudo”. (CAMPOS, 2010, p. 223).

Stachowiak (1972 apud Sayão 2001, p. 84) apresenta três características básicas dos

modelos:

a) característica de mapeamento – modelos sempre modelam alguma coisa, ou seja, são representações de “originais” (ou “protótipos”), naturais ou artificiais, que, por sua vez, também podem ser modelados. b) característica de redução – modelos geralmente não mapeiam todos os atributos do original que eles representam, mas unicamente aqueles que são relevantes para quem modela. c) característica de pragmatismo – modelos não são em si pertencentes à mesma classe que seus originais. Eles sempre cumprem suas funções de substituição orientados unicamente para objetivos dependentes de operações mentais ou factuais, dentro de uma faixa limitada de tempo.

Ao estabelecer a Teoria do Sistema Geral, conhecida também como Teoria da

Modelização, Le Moigne (1977, p. 23) afirma que “conhecer é modelizar, ou seja, o processo

de conhecer equivale à construção de modelos do mundo/domínio a ser construído que

permitem descrever e fornecer explicações sobre os fenômenos que observamos”.

Mylopoulos (1992, p. 3, tradução nossa) define modelagem conceitual como

Page 43: modelagem e representação semântica de dados governamentais

40

a atividade de descrever formalmente alguns aspectos do mundo físico e social que nos rodeia, para fins de compreensão e comunicação. [...] Modelagem conceitual tem uma vantagem sobre a linguagem natural ou notações diagramáticas na medida em que se baseia em uma notação formal que permite "capturar a semântica da aplicação." [...] Modelagem conceitual suporta estruturação e instalações de inferências que são psicologicamente fundamentadas. [...] A adequação de uma notação de modelagem conceitual repousa sobre a sua contribuição para a construção de modelos da realidade que promovem um entendimento comum da realidade que envolve seus usuários humanos.

Apesar do aumento do interesse pela modelagem conceitual nas últimas décadas,

principalmente em função do advento da Web Semântica, esta área de estudo é resultado de

pesquisas produzidas na década de 50, quando ocorreram as primeiras iniciativas para

especificação de modelos de dados. (ALMEIDA; OLIVERRA; COELHO, 2010). De acordo

com estes autores, a modelagem conceitual teve sua origem nos modelos de dados semânticos

para banco de dados.

Na visão de Sayão (2001) um modelo pode servir para diversos propósitos, mas serve

fundamentalmente para comunicar algo sobre o objeto da modelagem, com o objetivo de

gerar um entendimento mais completo sobre a realidade. Para que tal objetivo seja

conquistado, é preciso que o modelador possua uma visão clara e sem ambiguidades do ser ou

objeto modelado, além de exigir uma correta seleção dos elementos do universo do discurso

que comporão a visão a ser representada.

Ao estudar diversas pesquisas, Sayão (2001) compila como as principais funções dos

modelos: a) Função aquisitiva, na qual a informação pode ser definida, coletada e ordenada;

b) Função organizacional, que permite a otimização da extração de informações a partir do

modelo; c) Função lógica, que explica como ocorre um fenômeno; d) Função normativa, a

qual permite comparar fenômenos a outros similares; e) Função sistemática, através da qual a

realidade é descrita como conjunto de sistemas interligados; f) Função construtiva, na qual

teorias e leis são construídas; e g) Função de parentesco, que promovem a comunicação das

idéias cientificas.

A modelagem conceitual se constitui em uma etapa importante nos processos ligados a

tecnologias de informação que envolvem a construção de modelos de representação.

(CAMPOS; SOUZA; CAMPOS, 2003, p. 15). Faz-se necessário utilizar ferramentas

semânticas, como, por exemplo, as ontologias, para a elaboração de “modelos conceituais

consistentes e também para a formação de ‘classificacionistas’, como denominava

Page 44: modelagem e representação semântica de dados governamentais

41

Ranganathan, ou dito de outra forma, de modelizadores, que são aqueles que elaboram

classificações e não somente as usam”. (CAMPOS; CAMPOS, 2012, p. 4).

As ontologias de referência ou de alto nível são utilizadas para modelagem conceitual

por conterem conceitos genéricos, passíveis de utilização em diversos domínios (ALMEIDA;

OLIVERRA; COELHO, 2010). São exemplos de ontologias de referência: Basic Formal

Ontology (BFO) (GRENON; SMITH; GOLDBERG, 2004, p. 41); Descriptive Ontology for

Linguistics and Cognitive Engineering (DOLCE) (MASOLO et al. 2003); Unified

Foundational Ontology (UFO) (GUIZZARDI; WAGNER, 2004), dentre outras.

Talvez por essa razão, em estudos ontologia e modelagem conceitual apareçam como

sinônimos:

Em modelagem conceitual e áreas afins (ex. Modelagem organizacional), o termo [ontologia] é usado de acordo com sua definição original em filosofia, a saber, como uma referência a um sistema formal e filosoficamente bem-fundamentado de categorias que pode ser usado para articular conceituações e modelos em domínios específicos do conhecimento. Em contraste, nas outras áreas supracitadas, o termo ontologia tem sido usado como: (i) artefato concreto de engenharia, projetado com um propósito específico e sem prestar nenhuma ou quase nenhuma atenção aspectos teóricos de fundamentação; (ii) modelo de um domínio específico do conhecimento (ex., biologia molecular, finanças, logística, doenças infecciosas ) expresso em uma linguagem de representação do conhecimento (ex., RDF, OWL, F-Log ic) ou modelagem conceitual (ex., UML, EER, ORM)”. (GUIZZARDI et al., 2009, p. 1, grifo nosso)

Entretanto, são instrumentos distintos de representação, “(i) modelos conceituais são

artefatos produzidos com o objetivo de representar uma determinada porção da realidade

segundo uma determinada conceituação; (ii) Ontologias de Fundamentação descrevem as

categorias que são usadas para a construção dessas conceituações”. (GUIZZARDI et al.,

2009, p. 1). Ainda de acordo esse autor, uma linguagem adequada de modelagem conceitual

deveria possuir princípios de modelagem que refletissem as categorias conceituais definidas

em uma ontologia de fundamentação, permitindo testar e validar um modelo conceitual. Desta

forma, “a partir da noção de cada tipo de elemento, que a estruturação do domínio seja

construída de forma a evitar proposições errôneas, aferindo qualidade à modelagem

conceitual realizada e respectiva a representação do conhecimento”. (CAMPOS; CAMPOS;

MEDEIROS, 2011, p. 142).

Percebe-se assim a modelagem conceitual diretamente ligada ao conceito de

representação do conhecimento. Modelos conceituais são representações que descrevem a

Page 45: modelagem e representação semântica de dados governamentais

42

organização e, portanto, são mais simples de compreender por usuários leigos em Informática,

pois não envolvem detalhes de implementação de base de dados. (HEUSSER, 1998, p. 8).

A elaboração de um instrumento de representação do conhecimento baseado na

modelagem conceitual possui sua estrutura constituída por relacionamentos entre os seres ou

objetos de um determinado contexto. Os grupos de relações são mostrados por Campos

(2004): Relação categorial (reúne os objetos por sua natureza, ou seja, entidades, processos,

entre outros); Relação hierárquica (verifica a ordem de precedência de objetos de mesma

natureza); Relação partitiva (analisa como o objeto é constituído, ou seja, quais são suas

partes e elementos); Relações entre categorias (verificar como objetos de natureza diferente se

relacionam, representado de forma mais consistente); e Relação de equivalência (verificar, no

âmbito da Língua, a forma de expressar os conceitos).

Portanto, ao utilizar a modelagem conceitual para propor uma melhoria na semântica

de dados abertos publicados pelo Ministério da Previdência Social, pode-se estar também

contribuindo para que outros estudos busquem modelos para seus respectivos domínios dentro

do Governo Brasileiro.

4.1.4 Modelo Entidade-Relacionamento

O modelo Entidade-Relacionamento ou modelo E-R foi desenvolvido por Peter Chen

(1976) e se propunha a ser um modelo unificado para os dados, possibilitando a especificação

da estrutura lógica geral do banco de dados. O modelo Entidade-Relacionamento possui

princípios diretamente ligados aos denominados modelos de dados para construção de

sistemas de informação. Potter (1998, p. 53 apud CAMPOS, 2001b, p. 99) explica que, no

final da década de 50, os estudos sobre processamento de dados automatizados constataram

que faltava formalismo que expressassem a estrutura lógica dos dados do sistema. Este

formalismo foi definido como modelo de dados. Desta forma, “os modelos de dados podem

ser caracterizados como modelos que representam objetos (entidades) e relações em um dado

domínio”. (CAMPOS, 2001b, p. 100).

Heuser (1998, p. 5) explica que há vários níveis de abstração para modelização

(descrição) de um banco de dados. Por um lado, um modelo de dados com o objetivo de

explicar a um usuário qual é a organização de um banco de dados, em geral, não apresenta

detalhes sobre a representação em meio físico das informações. Por outro lado, um modelo de

dados utilizado por um técnico para otimizar a performance de acesso ao banco de dados

Page 46: modelagem e representação semântica de dados governamentais

43

conterá mais detalhes de como as informações estão organizadas internamente e, assim, será

menos abstrato.

Na modelagem de dados uma das técnicas mais difundidas e utilizadas é a abordagem

entidade-relacionamento. (Heusser, 1998, p. 11). No início dos anos 70, já havia surgido o

Modelo Relacional, criado por Edgar Frank Codd, que foi o primeiro modelo de dados

descrito teoricamente. (CONNOLY; BEGG, 1999). Já no meado da mesma década, quando

Chen (1976) apresentou o modelo Entidade-Relacionamento, muitos autores da época não

reconheceram a importância do novo modelo, porém com o passar do tempo ficaram claras as

contribuições e as inovações que a proposta de Chen havia trazido para a Ciência da

Computação (CHEN, 2002), tornando seu artigo de 1976 um dos mais importantes da área até

os dias atuais. (LAPLANTE, 1996).

Chen (2002, p. 2) analisa o momento histórico da elaboração do modelo Entidade-

relacionamento e conclui que ele foi o resultado de duas forças – força proveniente da

indústria e do mundo acadêmico – que demandavam uma evolução nos modelos de dados

existentes.

No modelo Entidade-Relacionamento os principais elementos são a entidade, o

relacionamento e o atributo. Chen (1976, p. 10) esclarece que uma entidade é ‘algo’ que pode

ser claramente identificado. Uma pessoa específica, uma empresa ou um evento são exemplos

de uma entidade. Um relacionamento é uma associação entre entidades. Já o atributo é o dado

associado a cada ocorrência e entidade ou de um relacionamento. Assim, os atributos são as

propriedades das entidades.

Dahlberg (1978a, p. 102) ao explicar análise do conceito, realizada utilizando

enunciados verdadeiros, afirma que um “atributo predicável do objeto que, no nível de

conceito, se chama característica”. Assim como Chen (1976), Dahlberg (1978a) utiliza os

atributos para explicitar as características do objeto, que na Teoria do Conceito formará o

conceito e no modelo E-R, caracterizará as entidades.

Para Heuser (1998, p. 12) uma entidade é o “conjunto de objetos da realidade

modelada sobre os quais deseja-se manter informações no banco de dados”. Entretanto,

grupos diferentes de pessoas podem determinar entidades e relacionamentos diferentes. A

solução dada por Chen (1976) para este impasse é considerar o contexto analisado e decidir os

resultados entre os participantes da modelização.

A cardinalidade presente em um modelo Entidade-Relacionamento é o “número

(mínimo, máximo) de ocorrências de entidades associadas a uma ocorrência da entidade em

questão através do relacionamento”. (HEUSER, 1998, p. 15).

Page 47: modelagem e representação semântica de dados governamentais

44

Heuser (1998, p. 15) ainda explica que a cardinalidade é importante para fins de

projeto de banco de dados, pois determina quantas “ocorrências de uma entidade podem estar

associadas a uma determinada ocorrência através do relacionamento”.

Desta forma, a cardinalidade máxima indica a quantidade máxima de ocorrências de

entidades que podem estar associadas a uma ocorrência da outra entidade (1 ou n). Por sua

vez, a cardinalidade mínima especifica se a participação de todas as ocorrências das entidades

no relacionamento é obrigatória (1) ou opcional (0).

As informações cardinalidade de relacionamento também se expressam, por exemplo,

o "1" ou "N" nas linhas entre os tipos de entidade e tipos de relacionamento indicando o limite

superior das entidades desse tipo entidade participante em que os relacionamentos. (CHEN,

1976).

Estes elementos são arranjados de forma a deixar claro o que representam e seu papel

em um determinado modelo. Desta forma, o modelo Entidade-relacionamento é representado

graficamente como um diagrama Entidade-Relacionamento ou, simplesmente, diagrama ER.

O diagrama Entidade-Relacionamento é uma das principais técnicas na modelagem

Entidade-Relacionamento, pois padroniza a entidade e o relacionamento em formas gráficas

convencionalizadas. A figura 3 mostra um exemplo de diagrama Entidade-Relacionamento

típico.

A entidade é representada como retângulo, o relacionamento, em forma de losango,

ligado por linhas aos retângulos (entidades). Os atributos são representados como pequenos

círculos.

FIGURA 3 - Exemplo de Diagrama ER.

Fonte: O autor.

Na Figura 3 acima, nota-se os seguintes elementos:

� “Acidente do trabalho” e “Lesão corporal” como entidades, representadas por um

retângulo;

� O verbo “causa” como relacionamento entre as entidades, representado por um

losango;

Page 48: modelagem e representação semântica de dados governamentais

45

� “Local” e “Data” são atributos da entidade “Acidente do trabalho”, representados

por um pequeno círculo ligado diretamente à entidade a que se corresponde.

Ainda é apresentada na figura 3 a cardinalidade. Para se chegar a cardinalidade deve-

se observar o relacionamento (Causa) entre as entidades (Acidente do trabalho e Lesão

corporal). Para tal pode se considerar as seguintes questões:

� Um acidente do trabalho pode não causar lesão corporal?

� Uma lesão corporal pode ser causada por mais de um acidente do trabalho?

� Determinado acidente do trabalho pode causar mais de uma lesão corporal?

� Pode existe, no âmbito da Previdência Social, alguma lesão corporal não causada

por acidente do trabalho?

No exemplo aqui mostrado, a cardinalidade (1,n) faz referência a “Acidente do

trabalho”, já a cardinalidade (1,1) faz referência a “Lesão corporal”. Assim, pode-se dizer

que:

� uma ocorrência de “acidente do trabalho” pode causar uma ou muitas ocorrências

de “lesões corporais”. Por esse motivo, a cardinalidade de “Acidente do trabalho”

é (1,n);

� uma ocorrência de “Lesão corporal” está associada a apenas uma ocorrência de

“Acidente do trabalho” (cada lesão corporal é conseqüência de apenas um acidente

do trabalho). Por essa razão, a cardinalidade de “Lesão corporal é (1,1).

A necessidade de se estudar o modelo Entidade-Relacionamento e seu diagrama surgiu

a partir da necessidade de representar graficamente os conceitos identificados para a

elaboração do modelo a ser proposto. Como representar, em forma gráfica, os conceitos de

forma a serem facilmente compreensíveis pelo leitor e que possibilite uma futura

representação em RDF? Esta foi a pergunta que direcionou os estudos ao modelo Entidade-

Relacionamento.

Campos (2004), ao analisar algumas teorias e metodologias, verificou que a área da

Ciência da Informação não possui modelos para a elaboração de representações gráficas,

apesar de ser a área responsável por desenvolver teorias consagradas sobre o conceito e suas

relações.

Page 49: modelagem e representação semântica de dados governamentais

46

Tanto na teoria da classificação facetada quanto na teoria do conceito, não é apresentado nenhum modelo para expressar graficamente as relações conceituais. Acreditamos que isso se deva ao fato de que essas teorias têm por objetivo a elaboração de linguagens documentárias que, apesar de possuírem uma parte sistemática, não têm os conceitos representados em forma gráfica, mas em forma de uma lista endentada de termos, com uma notação que, de certa forma, deixa evidentes os grupos de termos afins. (CAMPOS, 2004, p. 31)

Por esta razão, buscou-se na Ciência da Computação o modelo ER como

conhecimento a ser aplicado na representação dos conceitos. Essa escolha se deve ao fato do

modelo ER ser um dos modelos com maior capacidade semântica, por apresentar aspectos

semânticos que se referem à tentativa de representar o significado dos dados e por possuir

uma relativa simplicidade e clareza gráfica. (SILBERSCHATZ; KORTH; SUDARSHAN,

1999, p. 21-34).

Ratificando estas idéias, Campos (2001b, p. 100-101) afirma que a “popularidade da

modelagem entidade-relacionamento para projetar base de dados mais complexas é dada por

sua simplicidade de conceitos e a crença muito difundida em entidades e relacionamentos

como conceitos naturais de modelagem”.

Desta maneira, com apoio das ontologias de fundamentação, que ainda serão vistas,

foram identificados nas definições sobre acidentes do trabalho as entidades, os

relacionamentos e os atributos, representando-os graficamente em diagrama ER.

Outro ponto que levou a escolha do modelo ER, foi sua proximidade com o RDF,

padrão indicado para descrição de dados na Web Semântica. Chen (2002) ao falar dos

possíveis usos e relações do modelo Entidade-Relacionamento, associa-o ao RDF, afirmando

que existem algumas semelhanças e diferenças entre RDF e do modelo ER. Entretanto, o

RDF, já é considerado um membro da família da modelagem Entidade-Relacionamento, em

que os dados estruturados como gráficos rotulados podem ser trocados através de documentos

XML. (W3C, 1999).

Decidiu-se trabalhar no diagrama ER apenas com relacionamento binário, ou seja,

quando o relacionamento “conecta apenas duas entidades” (LIMA, 2008, p. 76). Esta escolha

se justifica pela dificuldade de se converter relações ternárias em RDF e da identificação da

cardinalidade presente no relacionamento.

Acredita-se que o modelo ER seja capaz de representar os conceitos existentes no

campo de acidentes do trabalho da Previdência Social brasileira. Diante desta representação

Page 50: modelagem e representação semântica de dados governamentais

47

realizada, pode-se verificar a organização do campo, como também utilizar esta organização

para outras representações, como, por exemplo, em RDF.

4.2 WEB SEMANTICA E SUAS TECNOLOGIAS

A Web surgiu no laboratório do European Organization for Nuclear Research, mais

conhecido como CERN. Berners-Lee (1989) escreveu um artigo que antevia a Web, no qual

tratava sobre gerenciamento de informações, que apresentava uma ideia de conjuntos de

documentos de hipertexto interligados e acessíveis pela Internet.

Existe uma confusão entre Internet e Worl Wide Web (WWW). Pode-se considerar que

a Internet surgiu em 1969, quando o pesquisador Leonard Kleinrock estabeleceu a primeira

comunicação entre dois computadores conectados a então denominada Advanced Research

Project Agency Network (ARPANET), enviando uma mensagem de um computador

localizado na Universidade da Califórnia para outro localizado no Instituto de Pesquisa de

Stanford. (RAMALHO; OUCHI, 2011). Por sua vez, a WWW é um de seus serviços. A

Internet adquire sua face atual com o surgimento do hipertexto e da Web, a “teia global”,

criados por Tim Berners-Lee no CERN, em 1989. A Web transforma a Internet num

gigantesco sistema de informações em escala mundial. (GREENBERG, 2003; MARCONDES

et al., 2008).

Em 30 de abril de 2013, em comemoração aos 20 anos do surgimento da Web, Cailliau

(2013), que atuou para viabilizar o projeto da Web, disse na página do CERN que a grande

escolha, na época, era entre fazer WWW disponível, livre de royalties, e mantê-lo como

propriedade intelectual do CERN. Foi quando decidiram pela disponibilização do WWW para

se tornar a grande rede de comunicação e informação que se conhece atualmente.

A Web tradicional é denominada por Breitman (2005) de Web Sintática, na qual os

computadores fazem apenas a apresentação da informação, enquanto o processo de

interpretação fica a cargo dos seres humanos, já que isso exige um grande esforço para

avaliar, classificar e selecionar informações e conhecimentos de interesse. (PICKLER, 2007).

Em contra partida a Web Sintática, surge a Web Semântica, que busca mecanismos

que possibilite às máquinas “compreenderem” o significado das páginas eletrônicas, criando

um ambiente no qual os computadores possam processar e relacionar conteúdos provenientes

de várias fontes. Para que isso se torne possível, é necessário estruturar os dados contidos

nessas páginas de forma que o próprio sistema identifique seu assunto e conteúdo e para isso

seria preciso embutir semântica na estrutura dos dados. (BREITMAN, 2005).

Page 51: modelagem e representação semântica de dados governamentais

48

Miller e Swick (2003) previam que a Web Semântica iria permitir que as pessoas

pudessem escrever (ou gerar) arquivos que explicassem - a uma máquina - a relação entre

diferentes conjuntos de dados. Entretanto, atribuir semântica aos dados é uma tarefa

complexa, na qual diversos pesquisadores têm se dedicado ao estudo.

A semântica das informações precisa ser convencionada com antecedência, de modo que todas as partes envolvidas tenham um entendimento comum do significado dos dados trocados. No nível internacional, isso pode ser uma questão complexa, visto que alguns conceitos legais podem diferir de um país para outro. O objetivo final é ser capaz de interpretar os dados de maneira uniforme entre as diferentes organizações e plataformas envolvidas na troca de dados. Para isso, seria útil publicar na Web os nomes e definições dos elementos usados no momento em formato partilhável e referenciável, independentemente do grau de apoio que se obteve. (W3C, 2008, p. 58)

A Web Semântica pode ser entendida como sendo uma extensão da Web atual

(BERNERS-LEE; HENDLER; LASSILA, 2011), na qual a informação ganha sentidos bem

definidos, permitindo uma melhor cooperação entre pessoas e computadores na realização de

suas tarefas. Isso é baseado na ideia de se ter, na Web, dados definidos e ligados de modo que

consigam ser usados em buscas, gerando respostas mais eficazes, na automação, na integração

e no reuso com várias aplicações. (MILLER; SWICK, 2003).

Pickler (2007) complementa a definição de Web Semântica ao afirmar que ela foi uma

tentativa de se melhorar (ou mesmo otimizar) as pesquisas realizadas na Web. Servindo como

uma nova ferramenta inteligente de busca de informações no ciberespaço, acrescentando

semântica ao atual formato de representação de dados, trabalhando com associação e dedução.

Sob essa perspectiva, a tarefa de verificar o assunto do documento ficaria a cargo das

máquinas, poupando tempo e trabalho a quem realizasse uma busca.

Na figura 4, é mostrada uma representação da evolução da Web. semântica das

conexões das informações (eixo vertical do gráfico). A linha pontilhada mostra conceitos e

aplicações Web, que foram criados a partir da evolução da semântica das conexões das

informações. Dentre as tecnologias utilizadas na infraestrutura dessa evolução se encontram

as da Web Semântica.

Deve-se ficar atento para o fato que, a Web Semântica, chamada por alguns autores de

Web 3.0, trata sobre a colocação de itens de dados na Web, não servindo apenas como uma

Web de documentos, mas também de dados. “A tecnologia de dados da Web Semântica terá

muitas aplicações, todas interconectadas. Pela primeira vez haverá um formato comum de

Page 52: modelagem e representação semântica de dados governamentais

49

dados para todos os aplicativos, permitindo que os bancos de dados e as páginas da Web

troquem arquivos”. (BERNERS-LEE, 2007, p. 3).

FIGURA 4 - Evolução da Web.

Fonte: Spivack (2007)

A Web Semântica, no contexto dos dados ligados, oferece uma infra-estrutura (figura

5) que permite páginas Web, bancos de dados, serviços, programas, dispositivos pessoais e

até mesmo eletrodomésticos tanto consumir, como produzir dados a serem disponibilizados.

Agentes de software podem usar essas informações para procurar, filtrar e preparar

informações em novos formatos de forma a ajudar os usuários da Web. (MILLER; SWICK,

2003).

FIGURA 5 - Arquitetura da Web Semântica.

Fonte: Greenberg; Sutton; Campbell (2003).

Page 53: modelagem e representação semântica de dados governamentais

50

Abaixo segue a descrição da figura 5 de acordo com Greenberg, Sutton, Campbell

(2003, p. 16):

• URIs e Unicode. URIs (identificadores de recursos uniforme) são identificadores únicos para os recursos de todos os tipos de esquemas para pessoas. Um componente importante da camada de base, URIs são metadados e funcionam como o ISBN.

• XML + NS + XMLschema. Extensible Markup Language (XML) e,

mais recentemente, os XML esquema facilitam a criação, o uso e a interoperabilidade sintática de vocabulários de metadados. NS (namespaces), que são identificados por meio de URIs, garantem a interoperabilidade semântica entre vocabulários de metadados.

• RDF e RDFschema. A família RDF suporta ainda a

interoperabilidade a nível semântico. Desenvolvimentos RDF compreendem a base da linguagem Web, para que os agentes possam fazer inferências lógicas, baseadas em metadados, para executar tarefas.

• Ontology vocabulary. A camada de ontologia representa artéria

central de metadados da Web Semântica, onde descrições simples de esquemas classificatórios complexos devem ser criados e registrados para que os agentes inteligentes possam interpretar dados, fazer inferências, e executar tarefas.

• Logic. Um agente pode tirar uma conclusão lógica (ou razão) no

processo de completar uma tarefa com base no que são, essencialmente, "fatos" prestados a partir de metadados semanticamente codificada. Outros tipos de lógica também pode ser aplicável na Web Semântica.

• Proof and Trust. As duas últimas camadas horizontais construídas

fora da camada de lógica, sendo uma prova de validação da "evidência" decorrente da atividade lógica inferencial e confiança relacionadas com a integridade da prova, que pode ser rastreada através das outras camadas do diagrama de Berners-Lee. A funcionalidade destas duas camadas é altamente dependente da criação de metadados precisos e confiáveis.

• Digital Signature. As assinaturas digitais correm verticalmente desde

a família RDF até a camada de prova e apoia a noção de confiança. Pesquisas na área de assinaturas digitais podem ajudar a validar a integridade dos metadados que um agente vai usar para o raciocínio e conclusão da tarefa.

Neste trabalho se dará ênfase à linguagem XML, ao RDF e às ontologias, por serem as

tecnologias escolhidas para serem aplicadas na pesquisa em questão. Porém, não se poderia

deixar de fazer uma breve explanação sobre URI, justamente por estar na base da Web

Semântica.

Page 54: modelagem e representação semântica de dados governamentais

51

4.2.1 Identificando recursos com URI

Uniform Resource Identifier ou simplesmente URIs são utilizados para identificar

recursos, sendo fundamentais para a implementação da Web Semântica. Usando uma

convenção de nomenclatura global, impulsionam os benefícios da Web. URIs têm escopo

global e são interpretadas de forma consistente em contextos específicos. Associando uma

URI com um recurso significa que qualquer pessoa pode se associar a ele, referindo-se a ele

ou recuperar uma representação sobre ele. (SHADBOLT; HALL; BERNERS-LEE, 2006, p.

97).

Ainda de acordo com esses autores, as URIs sustentam a Web Semântica, pois

permitem que as máquinas processem os dados diretamente. Desta forma, a Web Semântica

muda a ênfase passando dos documentos para os dados.

De acordo com Thompson (2010), no final da década de 1990, o conceito de recurso

sofreu uma generalização, passando a ser utilizado a algo identificado, ou seja, pessoas,

livros, documentos eletrônicos ou até mesmo relações abstratas, por exemplo, podem ser

considerados recursos. Este fato foi muito importante para a Web Semântica, pois já não

havia limites para se considerar um recurso.

FIGURA 6 - URI na representação de um recurso.

Fonte: Thompson (2010)

Na figura 6, pode-se perceber uma URI identificando um recurso (cidade), descrito por

outro recurso (documento com informações sobe Oaxaca), que, por sua vez, é representado

Page 55: modelagem e representação semântica de dados governamentais

52

por metadados. Logo, a URI ganha destaque no universo da Web Semântica, pois permite a

interação com representações do recurso através da Web.

4.2.2 XML e a descrição de dados

De acordo com Leocadio (2011, p. 53), a Web Semântica também é conhecida como

Web dos dados e nesse sentido duas tecnologias se apresentam como catalisadoras: eXtensible

Markup Language (XML) e Resource Description Framework (RDF). Resumidamente, a

XML trata da sintaxe enquanto o RDF trata da semântica dos dados.

Davis (2004 apud FURGERI, 2006, p. 226) define linguagem de marcação como

“uma forma de descrever a estrutura lógica ou semântica de um documento e fornecer

instruções a computadores sobre como apresentar o conteúdo de um arquivo”. Percebe-se, por

esta definição, que a linguagem de marcação é caracterizada por delimitar um dado,

classificando-o dentro do contexto representado. Contribuindo, dessa forma, para “tornar a

comunicação livre de formatos proprietários, uma vez que elas representam padrões abertos e

podem ser usadas livremente”. (FURGERI, 2006, p. 227)

Dziekaniak e Kirinus (2004, p. 30) definem XML como a representação textual do

dado. Explicam ainda que, a XML é formada por um composto básico chamado “element, isto

é, o texto limitado entre delimitadores (tags) < >...</> (incluindo os próprios delimitadores)

tal como pessoa, nome, idade e e-mail. É possível associar atributos a elementos. Um atributo

é definido como um par (nome, valor)”. Na figura 7, pode-se observar uma representação de

dados sobre acidentes do trabalho em XML.

FIGURA 7 - Dados em XML sobre acidente do trabalho <?xml version="1.0"?> <acidentes_de_trabalho> <registro> < municipio uf =" AP" cod_ibge =" 160027">LARANJAL DO JARI </ municipio > <quantidade> < sem_cat >42</ sem_cat > <com_cat> < tipicos >4</ tipicos > < trajeto >3</ trajeto > < doenca >0</ doenca > </ com_cat > < obitos >0</ obitos > </quantidade> </registro> </acidentes_de_trabalho>

Fonte: Dataprev (2013)

Ao analisar especificamente a linguagem XML, Dziekaniak e Kirinus (2004, p. 30)

afirmam que essa linguagem de marcação deve respeitar duas restrições: “tags devem estar

Page 56: modelagem e representação semântica de dados governamentais

53

corretamente aninhadas e atributos devem ser únicos”. Assim, de acordo com esses autores, se

um documento atende a essas restrições, o documento estará bem formado, sendo possível

organizá-lo segundo uma estrutura de árvore e representá-lo via XML na Web.

A XML é um formato amplamente utilizado para troca de dados, pois “possibilita que

se mantenha a estrutura dos dados em operações diferentes. O modo como os arquivos XML

são construídos permite aos desenvolvedores escrever parte da documentação dentro dos

dados, sem interferir na sua leitura”. (MANUAL..., 2011, p. 36).

A linguagem XML foi desenvolvida na Sun, fornecedora de softwares e equipamentos

na área de Tecnologia da Informação. Furgeri (2006, p. 229) explica que

Assim como o HTML, o XML foi definido como um padrão de marcação para ser utilizado na Internet, constituindo-se uma versão simplificada da Standard Generalized Markup Language (SGML), cujo objetivo principal foi fornecer aos desenvolvedores da Web uma maneira de definir e criar seus próprios marcadores e atributos em vez de estarem restritos ao esquema de marcação da HTML. O próprio significado da XML sugere essa característica, pois é uma linguagem de marcação extensível.

A XML Schema é uma evolução do Document Type Definition (DTD) e são exemplos

de padrões de marcação surgidos a partir da XML, que permite a criação de tags específicas

para determinada área. Entretanto, para que o documento seja compreendido em diferentes

contextos é necessário que se obedeça algumas regras, que serão definidas pela XML Schema.

É este último que definirá os padrões deveram ser seguidos para que o documento seja

considerado válido. (FURGERI, 2006, p. 230).

Ao mencionar sobre as aplicações da XML em Ciência da Informação, Furgeri (2006,

p. 234) afirma que a linguagem XML pode ser usada na melhoria da recuperação da

informação no ambiente Web, uma vez que a HTML, que não fornece um modo adequado

para descrever os conteúdos do texto, o significado fica perdido e os resultados de busca nem

sempre satisfatórios. O mesmo autor afirma ainda que, a linguagem XML pode ser usada na

criação de ontologias entre comunidades. Pois, um documento poderá expressar o sentido de

seu conteúdo se o autor e o leitor estiverem de acordo com o significado dos termos

utilizados, isto é, devem ser elaborados a partir do mesmo Schema.

Miller e Swick (2003, p. 9) consideram que o XML fornece uma base sintática

interoperável sobre a qual as línguas para representar as relações e os significados são

construídos. Já o RDF fornece um meio poderoso de expressar e representar essas relações e

significados.

Page 57: modelagem e representação semântica de dados governamentais

54

4.2.3 RDF como linguagem de representação de dados

Em 1997, o W3C definiu a primeira especificação Resource Description Framework

(RDF). RDF fornece uma linguagem de representação baseada em triplas simples, mas

poderosas para interligar URIs. Em função disso, tornou-se uma recomendação da W3C em

1999, preocupada, naquele momento, com a conscientização da necessidade de especificar os

recursos e promover a sua implantação generalizada para melhorar a funcionalidade da Web e

interoperabilidade. “A Web original tomou hipertexto e fez funcionar em escala global, a

visão para RDF era fornecer uma representação do conhecimento minimalista para a Web”.

(SHADBOLT; HALL; BERNERS-LEE, 2006, p. 96).

Senso e Hípola (2007, p. 3) relatam que o RDF foi criado como “um formato que iria

conseguir a compatibilidade entre os diferentes sistemas de metadados, proporcionando assim

uma arquitetura genérica para a meta-informação. Para isso, decidiu usar XML como um

sistema de comunicação”.

De acordo com Hjelm (2001 apud SENSO; HÍPOLA, 2007, p. 3), RDF é um formato

que tem a sua origem em dois ramos recentes da Documentação. Por um lado são metadados,

como um sistema que, além de servir como um modelo de metadados é capaz de conectar

sistemas em conjunto e, por outro lado, a representação do conhecimento, agora incorporada

no conceito de Web Semântica.

A capacidade que tem o RDF para representar metadados, em formato legível por

máquina, facilita a interoperabilidade entre diversas aplicações, proporcionando um

mecanismo perfeito para o intercâmbio de informação através da Web. É usado em projeto

dados abertos interligados (LOD, sigla em inglês de Linked Open Data), da União Européia,

oferecendo oportunidade para a interoperabilidade e o processamento automático de dados

governamentais. (MANUAL..., 2013, p. 37). Interoperabilidade pode ser entendida como a

“capacidade de bases de dados trocarem e compartilharem documentos, consultas e serviços,

usando diferentes plataformas de hardware, estrutura de dados e interfaces”. (ALVES;

SOUZA, 2007, p. 23).

Na visão de Brickey e Guha (2000 apud SENSO; HÍPOLA, 2007, p. 4), o RDF pode

ser aplicado em diferentes áreas: como a recuperação de informação (proporcionando

melhores serviços aos motores de busca); a catalogação em bibliotecas digitais (especificando

também relações de conteúdos disponíveis em um determinado site da Web); os agentes

inteligentes (facilitando o intercâmbio de conhecimento).

Page 58: modelagem e representação semântica de dados governamentais

55

RDF é utilizado como uma representação de informações na Web. Elaborada a partir

da XML, tem como objetivo principal prover intercâmbio de informações entre aplicações

mantendo seu significado. O RDF permite criar declarações sobre esses objetos por meio de

propriedades que representam um relacionamento entre recursos.

Furgeri (2006, p. 237) apresenta aos benefícios trazidos pela utilização do RDF:

� RDF resolve o problema da diversidade na representação da informação que ocorre em XML, criando ligações únicas entre recursos e estabelecendo vocabulários por meio de namespaces18. A RDF elimina o problema da limitação do tamanho da estrutura enfrentada pela XML, criando ponteiros que unem documentos com estruturas menores.

� RDF é mais indicada para a criação de metadados, pois um recurso é referenciado a um objeto por meio de um predicado com significado próprio. A ordem com que as declarações são realizadas não importa, diferente do que ocorre na XML.

� RDF elimina o problema da representação da informação em forma de árvore, criando uma estrutura mais flexível em forma de grafos, possibilitando a formação de uma cadeia de informações e estabelecendo uma rede de conhecimento.

O RDF é considerado por autores como Berners-Lee, Hendler e Lassila (2001) como a

possibilidade de se criar um primeiro nível de semântica nos dados publicados na Web.

Criando-se um vocabulário controlado para descrever um domínio do conhecimento, fato que

torna possível a qualquer organização publicar informações de maneira semântica. Com isso,

agentes de software podem agir de maneira automática e inteligente sobre recursos Web,

inferindo sobre o significado dos elementos. (Furgeri, 2006, p. 237-238).

A descrição de um recurso é representada como uma série de triplas com “sujeito-

predicado-objeto” (ARAÚJO, SOUZA, 2011) ou, com outra nomenclatura, “recurso-

propriedade-valor” (FURGERI, 2006). Klyne e Carroll (2004 apud ARAÚJO, SOUZA, 2011)

explicam que o sujeito é o URI que serve para identificação do recurso descrito. Já o objeto é

o valor literal, como uma string, número ou data, ou ainda o URI de outro recurso que está

relacionado ao sujeito. Por sua vez, o predicado é um algum vocabulário, que indica o tipo de

relação que existe ente o sujeito e o objeto.

FIGURA 8 - Grafo de triplas (sujeito, predicado e objeto)

Fonte: O Autor.

18 Namespace pode ser entendido como um mecanismo para identificar os elementos da XML. Trata-se de um prefixo associado à marcação que permite torná-la exclusiva. (MARCHAL, 2000 apud FURGERI, 2006).

Sujeito Acidente do trabalho

Objeto Lesão corporal

Predicado

Causa

Page 59: modelagem e representação semântica de dados governamentais

56

Furgeri (2006) e Baptista e Machado (2001) afirmam que com o RDF Schema (RDFS)

é possível definir os termos (as triplas) que serão usados nas declarações dos documentos

RDF, uma maneira de criar um vocabulário controlado, permitindo estabelecer relações e

restrições entre os recursos. Essas relações são utilizadas para interligar termos por meio de

namespaces, estabelecendo significado entre eles por meio de associações. O Simple

Knowledge Organisation Systems (SKOS) é um exemplo de vocabulário baseado em RDF

para representação de tesauros e outros tipos similares de sistemas de organização de

conhecimento. (MILES, 2005 apud FURGERI, 2006, p. 237-238).

4.2.4 Ontologia e acidente do trabalho como evento

Berners-Lee (1989) já previa a evolução de uma Web que consistia na passagem de

uma Web com grande parte de documentos compreensíveis apenas por pessoas para uma

extensão dessa Web, que permitiria a manipulação de dados e informações compreensíveis

por computadores. A Web Semântica é uma rede de informações derivada de dados, que por

meio de uma semântica, permite que máquinas “interpretem” esses dados. (SHADBOLT;

HALL; BERNERS-LEE, 2006, p. 96).

Um dos grandes desafios na época de surgimento da Web Semântica era como atribuir

sentido aos dados de forma a serem compreensíveis por máquinas. Entretanto, esse obstáculo

tem sido transposto pela adoção de concepções comuns referidas como ontologias.

(SHADBOLT; HALL; BERNERS-LEE, 2006, p. 96). De acordo com esses autores, desde

2001, o argumento em favor do uso de ontologias vem gerando numerosas iniciativas em prol

do desenvolvimento de ontologias para utilização em diversas áreas do conhecimento, sendo

realizadas pesquisas em diversos grupos. Essas comunidades desenvolvem padrões de

linguagem que podem ser implantados na Web.

Para Gruber (2009) o termo "Ontologia" vem do campo da Filosofia que se preocupa

com o estudo do Ser ou existência. Na Filosofia, pode-se falar de uma Ontologia como uma

teoria sobre a natureza da existência. Entretanto, para esse autor, a ontologia, na Ciência da

Computação e na Ciência da Informação, é um termo técnico que indica um artefato que é

projetado para uma finalidade, que é permitir a modelagem de conhecimento sobre algum

domínio, real ou imaginária.

O termo ontologia foi cunhado no século 17 pelos filósofos Rudolf Göckel, em sua

obra Lexicon philosophicum e por Jacob Lorhard, em sua obra Ogdoas Scholastica. O termo

Ontologia, entretanto, foi popularizado no círculo filosófico somente no século 18 pela

Page 60: modelagem e representação semântica de dados governamentais

57

publicação, em 1730, da Philosophia prima sive Ontologia de Christian Wolff.

(GUIZZARDI, 2005).

De acordo com Smith (2004 apud GUIZZARDI, 2005), o termo “ontologia” na

Ciência da Computação e na Ciência da Informação apareceu pela primeira vez em 1967, em

um trabalho de fundamentos de modelagem de dados escrito por S. H. Mealy, na passagem

que distingue três reinos diferentes na área de processamento de dados, a saber: a) o próprio

mundo real; b) idéias sobre o que existe nas mentes dos homens; c) símbolos sobre papel ou

outro meio de armazenamento.

Gruber (1995) define uma ontologia como sendo uma especificação de uma

conceituação19. Já Guarino (1998) acrescenta dizendo que a ontologia é uma especificação

parcial e explícita que tenta uma aproximação com a estrutura de mundo definida na

conceituação. Guizzardi (2000) baseado nas idéias de Guarino (1998) resume que a ontologia

é um

artefato computacional composto de um vocabulário de conceitos, suas definições e suas possíveis propriedades, um modelo gráfico mostrando todas as possíveis relações entre os conceitos e relações, representando de maneira clara e não ambígua o conhecimento do domínio. (GUIZZARDI, 2000, p. 39).

Guizzardi (2005, p. 70-71) explica que ao surgir a Web Semântica, as ontologias

foram chamadas a desempenhar um papel fundamental no entrelaçamento de símbolos

compreensíveis pelos humanos e processáveis por máquina. A ideia é que, em primeiro lugar,

as ontologias representando conceituações compartilhadas da realidade são construídas e

especificadas em uma linguagem compreensível por máquina. Em seguida, as especificações

formais, que podem ser utilizadas como domínios semânticos, através da definição de

semântica formal e do mundo real, fornecendo sentido aos símbolos sintáticos apresentados

em recursos da Web.

Diante da necessidade de se utilizar ontologias na organização de dados na Web,

percebe-se, cada vez mais, o interesse de diferentes áreas do conhecimento sobre esse assunto.

Por essa razão, Almeida e Bax (2003) levantam uma grande quantidade de tipologias de

ontologias, isso se deve ao fato das ontologias não apresentarem uma única estrutura.

19 Alguns autores preferem traduzir o termo “conceptualization” para “conceitualização”, porém essa palavra não existe na língua portuguesa. De acordo com Higuchi (2012) o termo mais próximo em português seria “conceituação”, que não corresponde ao sentido utilizado na área de representação do conhecimento. Já “conceitualização” é amplamente adotado para se referir a uma visão abstrata e simplificada do mundo que se deseja representar, considerando as entidades e relacionamentos.

Page 61: modelagem e representação semântica de dados governamentais

58

Entretanto, pode-se identificar características e componentes básicos, que podem ser

classificados em tipos bem definidos.

Uschold e Gruninger (1996) classificaram as ontologias pelo grau de formalismo:

altamente informal, semi-informal, semi-formal e rigorosamente formal. Já Guarino (1997;

1998) faz uma classificação das ontologias com base em seu conteúdo. Guizzardi (2000;

2005) explica estas classificações da seguinte maneira:

� ontologias genéricas: descrevem conceitos bastante gerais, tais como, espaço, tempo, matéria, objeto, evento, ação, etc., que são independentes de um problema ou domínio particular;

� ontologias de domínio: expressam conceituações de domínios particulares, descrevendo o vocabulário relacionado a um domínio genérico, tal como Medicina e Direito.

� ontologias de tarefas: expressam conceituações sobre a resolução de problemas, independentemente do domínio em que ocorram, isto é, descrevem o vocabulário relacionado a uma atividade ou tarefa genérica, tal como, diagnose ou vendas;

� ontologias de aplicação: descrevem conceitos dependentes do domínio e da tarefa particulares. Estes conceitos freqüentemente correspondem a papéis desempenhados por entidades do domínio quando da realização de uma certa atividade;

� ontologias de representação: explicam as conceituações que fundamentam os formalismos de representação de conhecimento.

Assim sendo, Guizzardi (2000, p. 39-40) sintetiza que as ontologias de domínio, o tipo

mais desenvolvido, são construídas para serem utilizadas em um micro-mundo. As ontologias

genéricas procuram construir teorias básicas do mundo, de caráter bastante abstrato,

aplicáveis a qualquer domínio (conhecimento de senso comum). Já as ontologias de

representação procuram tornar claros os compromissos ontológicos de representação

embutidos em formalismos de representação de conhecimento. E por sua vez, as ontologias de

tarefa procuram facilitar a integração dos conhecimentos de tarefa e domínio em uma

abordagem mais uniforme e consistente, tendo como base o uso de ontologias.

McGuinness (2003) cita algumas possíveis utilizações para ontologias. Uma delas

seria sua utilização para os tipos simples de verificação de consistência. Se ontologias contêm

informações sobre as propriedades e restrições de valor sobre as propriedades, pode se fazer a

verificação em sua aplicação em determinado domínio. As ontologias podem ser ainda

capazes de fornecer suporte de interoperabilidade, pois diferentes usuários/aplicações estão

usando o mesmo conjunto de termos. Utilizando uma taxonomia se reconhece quando um

aplicativo está usando um termo que é mais geral ou mais específico que outro. Já com

ontologias, que são mais expressivas que taxonomias, é possível ter uma definição

Page 62: modelagem e representação semântica de dados governamentais

59

operacional completa de como um termo refere-se a outros e, assim, usar axiomas de

igualdade ou mapeamentos para expressar um termo precisamente igual a outro,

possibilitando uma interoperabilidade mais "inteligente".

Essa linguagem também pode contribuir para o estabelecimento dos domínios e

ranges, conceitos herdados do RDF. Esta representação em RDF “é reconhecida pela

linguagem XML, o que possibilita que a ontologia seja implementada em ambiente Web”.

(Dziekaniak, 2010, p. 181)

Guizzardi (2000, p. 41) divide os benefícios provenientes da utilização da ontologia

em três áreas:

� Comunicação: ontologias são ferramentas úteis para ajudar as pessoas a se comunicarem, sob várias formas, acerca de um determinado conhecimento. Em primeiro lugar, elas podem ajudar as pessoas a raciocinar e a entender o domínio do conhecimento e, portanto, atuam como uma referência para a obtenção do consenso numa comunidade profissional sobre o vocabulário técnico a ser usado nas suas interações. Além disso, ontologias constituem um excelente guia no processo de elicitação de conhecimento das diversas fontes.

� Formalização: devido à natureza formal da notação usada, a especificação do domínio elimina contradições e inconsistências envolvendo as restrições, resultando, portanto, em uma especificação não ambígua. Um outro ponto a ser destacado é que, já que uma notação formal é usada, a especificação formalizada pode ser automaticamente verificada e validada, se um provador automático de teoremas existe para aquela notação. Com um mecanismo de inferência, é também possível derivar novos conhecimentos de forma automática, a partir da base de conhecimento já presente na ontologia. Por fim, esta característica torna possível a obtenção de um processo de geração de infraestruturas computacionais de maneira sistemática e idealmente automática.

� Representação do conhecimento e reuso: A ontologia forma um vocabulário de consenso e representa o conhecimento do domínio de forma explícita no seu mais alto nível de abstração, possuindo um potencial enorme de reuso. O conhecimento formalizado na camada de domínio pode ser especializado em diferentes aplicações, servindo diferentes propósitos, por diferentes equipes de desenvolvimento, em diferentes pontos do tempo.

As ontologias também apresentam problemas. Guizzardi (2000) se baseou em O’Leary

(1997) e Falbo (1998) para mostrar os obstáculos que existem para se aproveitar plenamente

das vantagens apresentadas anteriormente. Diante disto, para esses autores:

(i) a escolha de uma ontologia é um processo político, já que nenhuma ontologia pode ser totalmente adequada a todos os indivíduos ou grupos. (ii) Ontologias não são necessariamente estacionárias, i.e., necessitam evoluir. Poucos trabalhos têm enfocado a evolução de ontologias. (iii) Estender

Page 63: modelagem e representação semântica de dados governamentais

60

ontologias não é um processo direto. Ontologias são, geralmente, estruturadas de maneira precisa e, como resultado, são particularmente vulneráveis a questões de extensão, dado o forte relacionamento entre complexidade e precisão das definições. (iv) A noção de bibliotecas de ontologias sugere uma relativa independência entre diferentes ontologias. A interface entre elas constitui, portanto, um impedimento, especialmente porque cada uma delas é desenvolvida no contexto de um processo político. Ontologias desenvolvidas independentemente podem não se integrar efetivamente com outras por vários motivos, desde similaridade de vocabulário até visões conflitantes do mundo. (GUIZZARDI, 2000, p. 41-42)

Vários estudos têm buscado soluções para esses problemas. Uma dessas abordagens

trata sobre a semântica axiomática, que é uma abordagem bastante específica e definida no

âmbito das linguagens e padrões da Web Semântica, em particular o RDFS. Segundo Fikes e

McGuinness (2001 apud ALMEIDA; SOUZA, 2011, p. 36), o objetivo da semântica

axiomática é proporcionar a tradução de descrições RDFS para lógica, ou seja, estabelecer

regras para mapear RDFS em Lógica de Primeira Ordem (LPO), com o objetivo de

proporcionar capacidade de inferências automáticas à linguagem de representação

considerada.

Embora alguns autores considerem taxonomias e ontologias nomes novos para antigos

sistemas de classificação, elas guardam muitas semelhanças e mantêm na classificação sua

base comum, mas talvez não sejam exatamente a mesma coisa. (GOMES, 2009, p. 76).

Vickery (1997) também apresenta algumas similaridades entre os tesauros e as taxonomias

com as ontologias. Entretanto, no contexto da Web Semântica, os tesauros parecem não ser

adequados para representação dos dados devido à ausência de flexibilidade (PICKLER, 2007,

p. 77), característica esta presente nas ontologias. A expressividade semântica de instrumentos

de representação do conhecimento pode ser observada na figura 9.

FIGURA 9 - Expressividade semântica de instrumentos de representação do conhecimento.

Fonte: Almeida; Souza, (2011, p. 45)

Page 64: modelagem e representação semântica de dados governamentais

61

Logo, as similaridades levantadas por Vickery (1997) estão presentes na forma de

elaboração da estrutura desses instrumentos, que demanda a organização de conceitos em

processos que incluem categorização e classificação de conceitos, definição das relações entre

esses conceitos e tratamento da terminologia empregada nos conceitos e relações da estrutura.

(SILVA; SOUZA; ALMEIDA, 2008, p. 61).

Portanto, como lembra Campos (2006; 2010) não se deve reduzir o conceito de

ontologia a somente como um vocabulário controlado. Pois uma ontologia possui afirmação

“terminológica, possui um conjunto básico de conceitos e relações, e assertivas aplicadas aos

conceitos e relações, que constituem um conjunto de axiomas, diferentemente de instrumentos

de controle terminológico como os tesauros”. (CAMPOS, 2006, p. 2).

� Ontologias de Fundamentação utilizadas na representação de eventos

As ontologias de fundamentação são sistemas de categorias filosoficamente bem

fundamentadas e independentes de domínio, que têm sido utilizadas com sucesso para

melhorar a qualidade de linguagens de modelagem e modelos conceituais (GUIZZARDI et

al., 2009). Em outras palavras, são ontologias genéricas que permitem modelar ontologias de

domínio, simplificando sua modelagem, aumentando sua elegibilidade e seu reuso. (SILVA,

2011, p. 1)

Almeida, Oliverra e Coelho (2010, p. 33) afirmam que “uma alternativa para verificar

possíveis deficiências de uma modelagem é comparar a linguagem utilizada na modelagem a

um padrão, a uma ontologia bem fundamentada, que são baseadas em ontologias filosóficas e

ontologias de alto nível”.

Deste modo, as ontologias de fundamentação permitem que a construção de uma teoria sobre o domínio possibilite testar e validar um modelo conceitual. Assim, ao diferenciar os tipos de elementos que compõem um domínio e permitir sua representação, a ontologia de fundamentação explicita conceitos a partir de sua tipologia, estabelecendo sua posição em uma cadeia de elementos. Isto permite, a partir da noção de cada tipo de elemento, que a estruturação do domínio seja construída de forma a evitar proposições errôneas, aferindo qualidade à modelagem conceitual realizada e respectiva a representação do conhecimento em um domínio. (CAMPOS; CAMPOS; MEDEIROS, 2011, p. 142)

Para este trabalho, será observado nas ontologias de fundamentação Descriptive

Ontology for Linguistic and Cognitive Engineering (DOLCE) e Unified Foundational

Ontology (UFO), como a categoria de eventos é representada. A escolha destas ontologias se

Page 65: modelagem e representação semântica de dados governamentais

62

legitima em função da importância que elas possuem tanto no uso de modelagens de

ontologias de domínio, quanto pelo interesse de estudiosos sobre elas.

A DOLCE é uma ontologia de fundamentação desenvolvida por um grupo de pesquisa

liderado por Nicola Guarino. A pesquisa que deu origem a DOLCE fez parte do projeto

WonderWeb, no qual o primeiro módulo criado foi o da Foundational Ontologies Libary.

(GUIZZARDI et al., 2009).

Esta ontologia é classificada por pesquisadores em ontologia de particulares. A

distinção fundamental entre universais e particulares se faz em relação de instanciação, na

qual particulares são entidades que não possuem instâncias e universais são entidades que as

possuem. (GANGEMI et al., 2002; MASOLO et al., 2003). Em outras palavras, particulares

são indivíduos que existem no tempo e no espaço.

Baseada no comportamento do objeto ao longo do tempo, a DOLCE trabalha as

categorias de endurantes (endurant) e perdurantes (perdurant). No primeiro, o objeto e suas

partes estão presentes em todo o tempo, já no segundo acumulam partes temporais, ou seja,

estão parcialmente presentes (GANGEMI et al., 2002, p. 225). Logo, os eventos seriam os

perdurantes.

Na figura 10, pode ser observada a estrutura da DOLCE, na qual a divisão entre

endurantes e perdurantes se mostra bem clara.

FIGURA 10 - Taxonomia das categorias básicas da DOLCE.

Fonte: Gangemi et al. (2002, p. 226)

Page 66: modelagem e representação semântica de dados governamentais

63

A DOLCE foi utilizada como uma espécie de matriz para a elaboração da Ontologia

DUL Ontology, que é uma combinação da DOLCE e DOLCE DnS (Descriptions and

Situations), apresentada de forma mais intuitiva e simples. Para fins desta pesquisa, buscou-se

compreender a ontologia DUL, pois ela trata de questões intrínsecas aos eventos, como:

identificação dos participantes do evento, levantamento das entidades e das situações

envolvidas. Percebe-se a seguir, na figura 11, a presença de seis classes principais,

subordinadas a Entity, são elas: Agent, Object, Event, informatioEntity, Abstract e Quality.

FIGURA 11 - Visão parcial da Ontologia DUL.

Fonte: Higuchi (2012, p. 102)

Event é definido na ontologia DUL como qualquer processo físico, social ou mental,

evento ou estado. Na visão dos desenvolvedores da DUL os eventos estão relacionados a

situações observáveis, podendo ter diferentes pontos de vista em um mesmo período de

tempo. Isto acarreta a classificação de entidades de um mesmo evento de formas diferentes,

pois será baseada nos critérios do modelador. Para a W3C (2005) isto gera uma discussão,

porque os realistas irão continuar defendendo a ideia de que os acontecimentos na realidade

não são alterados pela forma como são representados, enquanto os construtivistas irão

defender a ideia de que, qualquer que seja "verdadeira realidade", não pode ser modelado sem

a carga teórica de como observar e descrever. Por esta razão, na ontologia DUL são

permitidos os dois eventos, em conjunto com a descrição, de modo a codificar a modelagem

precisa, independentemente da posição (se houver) escolhido pelo modelador.

Outra ontologia de fundamentação aqui observada é a UFO, que “tem sido aplicada

com sucesso para avaliar, (re)projetar e integrar os modelos de linguagens de modelagem

conceitual, bem como para prover semântica de mundo real (real-world semantics) para seus

elementos de modelagem”. (GUIZZARDI; FALBO; GUIZZARDI, 2008, p. 244).

A UFO é desenvolvida na tese de doutorado de Guizzardi (2005) utilizando teorias

provenientes de ontologias formais, lógica filosófica, filosofia da linguagem, linguística e

Page 67: modelagem e representação semântica de dados governamentais

64

psicologia cognitiva. (GUIZZARDI; FALBO; GUIZZARDI, 2008, p. 244). Ela busca

diminuir algumas limitações encontradas em outras ontologias de fundamentação, como a

própria DOLCE, vista anteriormente. A UFO é dividida em: UFO-A (Ontology of

Endurants), destinada a modelização de objetos (endurantes); UFO-B (Ontology of

Perdurants), que busca sistematizar conceitos como estados, processos, eventos, relações

temporais; e UFO-C (Ontology of Social and Intentional Entities), fundamentada na UFO-A e

UFO-B para sistematizar conceitos sociais, como plano, ação, objetivo, agente,

intencionalidade, comprometimento e compromisso.

Para fins de estudo desta pesquisa, será dada ênfase a UFO-B que trata

especificamente de eventos. A UFO-B define eventos como “indivíduos compostos de partes

temporais. Eles acontecem no tempo no sentido de se estenderem no tempo acumulando

partes temporais”. (GUIZZARDI; FALBO; GUIZZARDI, 2008, p. 246). Cada participação

de um evento é um evento que pode ser atômico (sem sub-partes) ou complexos (composto de

outros eventos), mas que existe em função de outro evento. Isto pode ser observado na figura

12, a seguir.

FIGURA 12 - Fragmento da UFO-B: Objetos e Eventos.

Fonte: Guizzardi; Falbo; Guizzardi (2008, p. 246).

Conforme mostrado também na figura 12, a UFO-B ainda diferencia “Eventos” de

“Objetos” considerando suas relações com o tempo. Objetos estão presentes em qualquer

instante do tempo que estiverem presentes. Já os Eventos (ou ocorrências) são indivíduos

compostos de partes temporais, ou seja, estendem-se no tempo acumulando partes temporais.

(GUIZZARDI; FALBO; GUIZZARDI, 2008, p. 246).

Percebe-se que a modelagem de eventos é uma tarefa difícil e desafiadora, uma vez

que envolve relações entre outros eventos e interpretações do mesmo evento por diferentes

seres humanos (profissionais preocupados com a representação e organização do

conhecimento).

Page 68: modelagem e representação semântica de dados governamentais

65

Tanto a DOLCE, com a DUL, quanto a UFO, com a UFO-B, dedicam-se ao

desenvolvimento de partes da ontologia exclusivas a eventos.

Tanto na UFO-B, quanto na DUL, o agente ou participante parecem relacionados ao

objeto. No entanto, na UFO-B, o “Participante concreto” (termo utilizado por Guizzardi)

também se relaciona direto com o evento. Já na Dul, o “Agent” é uma subclasse de “Object” e

não se relaciona diretamente com o evento. No caso do acidente do trabalho, o “participante

concreto” ou “agent”, que, especificamente neste trabalho é “paciente”, pois é ele quem sofre

o acidente, sendo parte fundamental do evento.

De forma análoga, pode se afirmar que muitas semelhanças existem nessas

representações acerca de eventos. Categorias como agentes, local e tempo são exemplos de

similaridades.

Scherp et al. (2009, p. 3-4) utilizam como base a ontologia DUL, para elaborarem uma

ontologia chamada Event-Model-F, que visa apresentar um modelo formal de eventos. Para a

elaboração da Event-Model-F, esses autores identificaram, previamente, requisitos funcionais

presentes em qualquer evento independente do domínio. Desta forma, eles sintetizaram estes

requisitos funcionais em seis aspectos:

� Participação em eventos de objetos: representa participação de agentes, ou seja,

objetos vivos e não-vivos, como pessoas, animais e outros objetos materiais em

eventos e os papéis que desempenham em eventos.

� Duração temporal de eventos: Como os eventos se desenrolam ao longo do

tempo, a sua duração temporal precisa de ser modelada. Isto pode ser realizado

usando representações absolutas ou relativas dos pontos em determinado tempo.

� Extensão espacial dos objetos: Objetos se desenrolam ao longo do espaço.

Assim, sua extensão espacial precisa ser também modelada usando

posicionamento absoluto ou relativo.

� Relações estruturais entre eventos: são considerados três tipos, a saber:

o Relação mereológica deve ser apoiada em como os eventos são

constituídos (eventos simples ou compostos).

o Relação causal requer a modelagem de causas e efeitos e deve apoiar a

integração e uso de diferentes teorias causais.

o Relação de correlação refere-se a dois eventos que têm uma causa

comum.

Page 69: modelagem e representação semântica de dados governamentais

66

� Documentos de apoio para o evento e objetos: esta exigência compreende a

anotação de eventos e seus objetos participantes com informações arbitrárias, tais

como dados de sensores e dados de mídia. Ele fornece suporte documental que um

determinado evento aconteceu ou objeto existe.

� Interpretações de eventos: relações entre eventos, tais como causalidade e

correlação pode ser questão de subjetividade e interpretação. O modelo de evento

deve apoiar tais interpretações diferentes do evento, isto é, oferecer diferentes

pontos de vista contextuais para as mesmas ocorrências no mundo real.

Assim como Scherp et al (2009), após analisar diversas ontologias que envolviam a

representação de eventos, Higuchi (2012, p. 108) notou que aspectos pareciam ser inerentes a

todo evento. A saber:

� Aspecto constitutivo – o quê ou quem participa;

� Aspecto temporal – data, período, duração;

� Aspecto espacial – área geográfica, região, lugar relativo, localização;

� Aspecto estrutural – mereologia, causalidade, correlação; e

� Aspecto evidencial – documentação produzida.

Apesar das semelhanças estruturais entre as ontologias, “não existe uma ontologia

genericamente aceita para modelagem. Conceitos e relações em ontologias distintas podem

levar a resultados diferentes na avaliação de um mesmo modelo conceitual.” (ALMEIDA;

OLIVERRA; COELHO, 2010, p. 44).

A UFO-B e DUL usam modelos de classes, que é um dos diagramas que constam da

metodologia Unified Modeling Language (UML), para elaboração de sua representação. Na

modelagem conceitual aqui proposta, será utilizado o Modelo Entidade-Relacionamento

convencional, que é um modelo de diagrama de classes tradicional no campo da Ciência da

Computação. Espera-se, a partir dele, chegar à elaboração de um RDF capaz de descrever os

dados sobre acidente do trabalho.

� Acidente do trabalho como evento

De acordo com o dicionário elaborado pelo Instituto Antônio Houaiss (2009), acidente

é “(1) acontecimento casual, fortuito, inesperado; ocorrência; (2) qualquer acontecimento,

Page 70: modelagem e representação semântica de dados governamentais

67

desagradável ou infeliz, que envolva dano, perda, sofrimento ou morte”. Com base nestas

definições, pode-se afirmar que qualquer acidente é um evento, ou seja, fato, ação, processo,

que em geral, acomete algum agente e/ou paciente, em determinado espaço e tempo.

Todos os acidentes do trabalho acontecem em datas e espaços delimitados, mas sua

principal característica é a participação do trabalhador como personagem/ator/indivíduo que

sofre determinado mal. Logo, partindo-se do pensamento que “eventos são entidades

ontologicamente dependentes no sentido de, para existirem, dependem existencialmente de

seus participantes” (GUIZZARDI; FALBO; GUIZZARDI, 2008, p. 246), pode-se afirmar que

acidente do trabalho é um evento.

No âmbito das ontologias, muitos estudiosos preferem organizar, separando os objetos

estáticos dos eventos. Isto ocorre muito em função das características peculiares existentes

tanto nos objetos estáticos, quanto nos eventos. Eventos são entidades classificadas em uma

ontologia formal, que são difíceis de tratar em sistemas de base de dados. Para descrever as

ocorrências de ações e mudanças no mundo real, modeladores de representação de

conhecimento têm que considerar que os objetos e as propriedades são estáticos, mas os

eventos são dinâmicos (KANEIWA; IWAZUME; FUKUDA, 20, p. 1).

Assim sendo, estudar acidente do trabalho a partir de ontologias de fundamentação,

que buscam representar eventos, pode ser a chave para se conseguir identificar características

comuns a qualquer evento, que contribuiriam para a elaboração de um modelo acerca do

acidente do trabalho.

4.2.5 OWL como linguagem para representar ontologias para Web Semântica

De forma resumida, a Web Ontology Language (OWL) é uma ontologia recomendada

pela W3C para representar explicitamente o significado dos termos e seus relacionamentos

em vocabulários a serem utilizados na Web. A OWL destina-se a ser usada quando a

informação contida nos documentos necessita de ser processada por aplicações de máquinas e

não somente compreensíveis por seres humanos.

No guia sobre OWL escrito por Smith, Welty, e McGuinness (2004), a OWL é

definida como uma linguagem para definir e instanciar ontologias da Web. Uma ontologia

OWL pode incluir descrições de classes, propriedades e suas instâncias. Dada tal ontologia, a

semântica formal OWL especifica como derivar suas consequências lógicas, ou seja, fatos que

não estão presentes na ontologia, mas que são vinculados pela semântica. Esses vínculos

Page 71: modelagem e representação semântica de dados governamentais

68

podem ser baseados em um único documento ou vários documentos distribuídos que foram

combinados usando os mecanismos definidos pela OWL.

A OWL é uma revisão da DAML+OIL Web Ontology Language incorporando lições

aprendidas de design e aplicação da DAML + OIL. (MCGUINNESS; HARMELEN, 2004). A

OWL tem mais facilidades para expressar significado, pois tem mais construções que

incorporam pressupostos semântico-ontológicos que RDF e RDFS. Ou seja, consegue

especificar com mais precisão o significado pretendido.

Apesar do RDF Schema também ser considerado um vocabulário capaz de fornecer

semântica aos dados, ele apresenta algumas diferenças da linguagem OWL. De acordo com

McGuinness e Harmelen (2004) o RDF Schema é um vocabulário para descrever

propriedades e classes de recursos RDF, com uma semântica de generalização, ou seja,

hierarquias de tais propriedades e classes. Enquanto que, a OWL adiciona mais vocabulário

para descrever propriedades e classes. Dentre algumas diferenças, podem ser citadas: relações

entre classes, cardinalidade, descrição mais rica de propriedades, características das

propriedades e classes enumeradas.

Logo, a OWL atende melhor os anseios da Web Semântica, que é aprimorar a Web, de

tal forma que seja dado um significado explícito à informação, tornando mais fácil para

máquinas processar e integrar, automaticamente, informações disponíveis na Web.

(MCGUINNESS; HARMELEN, 2004).

Pode-se dizer que a Web Semântica tem a necessidade de um grupo de instrumentos e

linguagens de descrição e de organização (estrutural e semântica) dos dados. Ela se apóia na

capacidade da XML para definir esquemas de marcação personalizados, na descrição do RDF

para representar dados com um primeiro nível de semântica. Entretanto, a Web Semântica

necessita de um nível maior de semântica dos dados descritos, por esta razão uma linguagem

de ontologia se torna indispensável para descrever formalmente o significado da terminologia

utilizada em documentos da Web. Neste argumento que a W3C se sustenta para justificar a

utilização da OWL. (MCGUINNESS; HARMELEN, 2004).

De acordo com a McGuinness e Harmelen (2004) a OWL fornece três sublinguagens,

em escala de expressividade, projetadas para uso por comunidades específicas de

implementadores e usuários.

� OWL Lite auxilia aos usuários que necessitam principalmente de uma hierarquia de

classificação e restrições simples. Apresenta valores de cardinalidade de 0 ou 1.

Oferece um caminho de migração rápida para tesauros e outras taxonomias.

Page 72: modelagem e representação semântica de dados governamentais

69

� OWL DL ajuda aos usuários que querem a expressividade máxima, mantendo a

integralidade (todas as conclusões são garantidas serem computáveis) e decidibilidade

(todas as computações terminarão em um tempo finito) computacional. Ela é o

somatório de todas as construções da linguagem OWL, mas estas construções somente

podem ser sob certas restrições. OWL DL é assim chamado devido à sua

correspondência com as lógicas de descrição, um campo de pesquisa que estuda as

lógicas que formam a base formal da OWL.

� OWL Full é destinada a usuários que desejam máxima expressividade e a liberdade

sintática do RDF sem garantias computacionais. Permite uma ontologia para aumentar

o significado do vocabulário pré-definido (RDF ou OWL).

Cabe aos usuários que utilizarão a OWL considerar qual o tipo de sublinguagem da

OWL se adapta melhor às suas necessidades em determinado momento. McGuinness e

Harmelen (2004) esclarecem, por exemplo, que a escolha entre OWL Lite e OWL DL

depende da medida em que os usuários precisam de construções mais expressivas, neste caso

fornecidas pela OWL DL.

Alguns cuidados devem ser tomados quando um usuário deseja migrar um documento

RDF para OWL. Quando a expressividade da OWL DL ou OWL Lite for considerada

apropriada, algumas precauções devem ser tomadas para garantir que o documento original

RDF está em conformidade com as restrições adicionais impostas por OWL DL e OWL Lite.

Entre outros, cada URI que é usado como um nome de classe deve ser explicitamente

declarado como sendo do tipo owl: Class (e da mesma forma para as propriedades), cada

indivíduo deve ser afirmado pertencer a pelo menos uma classe (mesmo que apenas owl:

Thing), o URI é usado para classes, propriedades e indivíduos devem ser separados

mutuamente. (MCGUINNESS; HARMELEN, 2004).

Por ser capaz de organizar, semanticamente, informações na Web, a linguagem OWL

pode ser utilizada por ferramentas automatizadas da Web para aperfeiçoar os serviços de

recuperação de informações, além de contribuir para o gerenciamento do conhecimento.

Ademais, a OWL reduz esforços na elaboração de novas linguagens, pois permite

reuso de outras ontologias já desenvolvidas. Desta forma, a OWL consegue uma unificação do

conhecimento e a formação de consensos sobre certos conceitos, que “tem levado à uma

integração maior de usuários dentro domínios específicos do conhecimento”. (LIMA;

CARVALHO, 2005, p. 21).

Page 73: modelagem e representação semântica de dados governamentais

70

Diante da recomendação da W3C para seu uso nas tecnologias geradas no contexto da

Web Semântica, a OWL tem conseguido um papel de destaque na elaboração de linguagens

semânticas para a Web, com vista a otimizar a recuperação das informações.

4.2.6 Dados Abertos Interligados

O conceito e a aplicação de Linked Open Data (LOD) ou Dados Abertos Interligados

tem despertado interesse em organizações de pesquisa em saúde, governo e educação.

(MÉNDEZ, GREENBERG, 2012).

No final da década de 80, Berners-Lee (1989) já se preocupava com a interligação dos

dados, afirmando que se deveria trabalhar em direção a um sistema universal de informação

ligada, no qual generalidade e portabilidade sejam mais importantes que técnicas gráficas

extravagantes e instalações super complexas.

Entretanto, o termo “Dados Abertos Interligados” só foi cunhado no século XXI, por

Berners-Lee (2006) e se refere a um estilo para se publicar e interligar dados estruturados na

Web. Ideia essa defendida por Berners-Lee (2006) ao afirmar que com os Dados Abertos

Interligados o valor e a utilidade dos dados aumentarão, uma vez que estarão ligados a outros

dados provenientes de diferentes fontes.

A Web Semântica permite que as máquinas extraiam significados de dados

estruturados, que podem ser transformados quando publicados utilizando os Dados Abertos

Interligados. Este último é um passo fundamental para a implementação da Web Semântica.

(MÉNDEZ; GREENBERG, 2012).

Bizer, Cyganiak e Heath (2007) apontam como sendo os princípios básicos dos Dados

Abertos Interligados: (1) utilizar o modelo de dados RDF para publicar dados estruturados na

Web; (2) utilizar links RDF para interligar dados a partir de fontes de dados diferentes.

Aplicando esses princípios é possível se chegar à criação de um espaço comum de dados na

Web, um espaço onde as pessoas e as organizações podem publicar e consumir dados de

acordo com seus interesses.

Se na Web Sintática o que une os documentos são os links de hipertexto entre as

páginas HTML, na Web Semântica o que une os dados são as ligações em RDF. Uma ligação

utilizando o RDF afirma que uma parte do dado tem algum tipo de relação com uma parte de

outro dado. Essas relações podem ser de diferentes tipos. Por exemplo, uma ligação RDF que

conecte dados sobre um autor e suas obras que estão dispersas em bibliotecas, arquivos e

museus. (SANTOS NETO et al., 2013).

Page 74: modelagem e representação semântica de dados governamentais

71

A Web Semântica é mais que somente disponibilizar dados na Web, é sobre fazer

ligações (links), para que pessoas e máquinas possam explorar esse conjunto de dados. Com

os Dados Abertos Interligados, quando se tem essas ligações, pode-se encontrar outros dados

relacionados. (Berners-Lee, 2006). Neste contexto, os Dados Abertos Interligados, podem ser

utilizados para descreverem um conjunto de práticas para publicar, compartilhar e conectar

dados estruturados na Web de forma a aumentar o seu valor e uso. (ARAÚJO, SOUZA, 2011;

BIZER; HEATH; BERNERS-LEE, 2009)

Nesse processo de se realizar interligações semânticas entre os dados, os vocabulários

em suas várias formas (tesauro, taxonomia, ontologia e outros) têm papel de destaque,

fornecendo sentido aos dados. Esses vocabulários podem ainda ter seu aproveitamento

melhorado e ganhar mais força se aplicados em RDF/SKOS. (MÉNDEZ, GREENBERG,

2012) e o formato básico para Dados Abertos Interligados é RDF/XML (Berners-Lee, 2006).

Na figura 13 é mostrada a evolução da Web com a utilização dos Dados Abertos Interligados.

FIGURA 13 - Evolução da Web Semântica com os Dados Abertos Interligados.

Fonte: MÉNDEZ, GREENBERG, 2012.

Quando os dados disponíveis na Web são vinculados é possível, a partir de um

determinado dado, encontrar outro. Diferentemente da Web de hipertextos com referências a

documentos escritos em HTML tem-se referência a documentos escritos em RDF. Em um

artigo sobre Dados Abertos Interligados escrito por Tim Berners-Lee, em 2006, ele propôs um

ranking que serve de guia para classificar dados que estão publicados na Web:

Page 75: modelagem e representação semântica de dados governamentais

72

Figura 14 - Classificação de dados publicados.

Dado publicado, em qualquer formato, com licenciamento livre

Dado publicado em uma estrutura que permita a leitura por máquinas (por exemplo, uma planilha eletrônica ao invés de uma imagem digitalizada)

Igual ao item anterior (duas estrelas) adicionado o formato não proprietário (por exemplo, CSV ao invés de Excel)

Todos os acima, porém usando os padrões W3C (RDF e SPARQL)

Todos os acima adicionando a vinculação de seus dados aos dados de outras fontes para identificação de contexto (linked data).

Fonte: Leocádio (2011, p. 56)

Na figura 15, pode se compreender melhor como a classificação em cinco estrelas feita

por Berners-Lee é associada às tecnologias.

FIGURA 15 - Esquema para classificar bases de dados publicados na WEB.

Fonte: 5 Stars Open Data20.

Na revisão de seu texto em 2010, Berners-Lee (2006) comenta que foi solicitado a

utilizar os Dados Abertos Interligados para dados governamentais, devendo existir metadados

sobre os dados publicados pelo Governo e disponibilizados em grandes catálogos. De acordo

com Berners-Lee (2006) qualquer conjunto de Dados Abertos (ou mesmo conjunto de dados

que não são, mas que deveriam ser abertos) podem ser registrados no ckan.net21. Esse autor

afirma que os conjuntos de dados do governo do Reino Unido e dos EUA são registrados,

respectivamente, no data.gov.uk e data.gov. E que outros países devem seguir o mesmo

caminho.

No Brasil, existe uma iniciativa da Secretaria de Logística em tecnologia de

Informação (SLTI) do Ministério do Planejamento, que se propõe a integrar, utilizando a

20 Legenda: OL: Open Licence (livre de licenças); RE: machine-REadable (tratável por computador); OF: Open Format (formato não proprietário); URI: identificado por URI; LD: Linked Data (dados interligados). Disponível em: http://5stardata.info/. Acesso em: 4 mar. 2014. 21 CKAN é uma ferramenta (software) para sistema de gerenciamento de conteúdo que torna os dados acessíveis, visando simplificar a publicação, o compartilhamento, a recuperação e o uso de dados. CKAN é destinado a editores de dados (governos, empresas e organizações nacionais e regionais) que querem fazer os seus dados abertos e disponíveis. (CKAN, 2011)

Page 76: modelagem e representação semântica de dados governamentais

73

infraestrutura dos Dados Abertos Interligados, as bases de dados do Governo Federal. A

figura 16 mostra a iniciativa modelada.

FIGURA 16 - Estrutura de LOD das bases de dados do Governo Brasileiro.

Fonte: Chaves (2011)

Conseguindo desenvolver uma estrutura de dados interligados, o Governo brasileiro

poderá ampliar sua participação na estrutura de dados mundiais (figura 17). Desta forma,

possibilitará conexões entre dados e informações em escala internacional, permitindo

reutilizações, correlações e aplicações ainda não vislumbradas pelos gestores dos dados.

FIGURA 17 – Diagrama da nuvem de LOD

Fonte: Cyganiak; Anja Jentzsch (2011)

Apesar do ritmo lento do uso dos Dados Abertos Interligados na publicação de dados

governamentais abertos, é possível identificar alguns exemplos de uso. Como, por exemplo, a

página “Ligado nos Políticos” (figura 18), que tem como objetivo fornecer dados de políticos

brasileiros usando os conceitos de Dados Ligados e Dados Governamentais Abertos.

Page 77: modelagem e representação semântica de dados governamentais

74

Coletando dados públicos de fontes, como: órgãos públicos (Tribunal Superior Eleitoral

(TSE), Câmara dos Deputados e Senado Federal do Brasil) e Organizações Não

Governamentais (ONGs) e iniciativas populares (Políticos Brasileiros, Ficha Limpa e

Excelências).

FIGURA 18 - Página eletrônica do Ligado nos Políticos.

Fonte: LIGADO... (2010) 4.3 ASPECTOS LEGAIS SOBRE ACESSO À INFORMAÇÃO PÚBICA

Existem Leis brasileiras que garantem o acesso à informação pública. Nesta pesquisa,

parte-se do pressuposto que o acesso às informações governamentais é “uma prerrogativa de

todo cidadão, e as possibilidades de reutilizá-la, recombiná-la e dar a ela novos significados é

uma ampliação necessária deste direito”. (MAZONI, 2011, p. 7)

A seguir serão elencados aspectos legais que influenciaram para a abertura dos dados

públicos.

A carta magna do Brasil, a Constituição da República federativa do Brasil, publicada

em 1988, previa o acesso às informações. Segundo o inciso XXXIII do artigo 5 da

Constituição Federal do Brasil de 1998:

XXXIII - todos têm direito a receber dos órgãos públicos informações de seu interesse particular, ou de interesse coletivo ou geral, que serão prestados no prazo da lei, sob pena de responsabilidade, ressalvas aquelas cujo sigilo seja imprescindível à segurança da sociedade e do Estado. (BRASIL, 1988)

Page 78: modelagem e representação semântica de dados governamentais

75

A Lei Complementar n. 101, conhecida como Lei de responsabilidade Fiscal,

sancionada em 4 de maio de 2000, estabelece normas de finanças públicas voltadas para a

responsabilidade na gestão fiscal e dá outras providências que envolvem a accountability e a

transparência de informações fiscal públicas. Foi acrescentada pela Lei Complementar n. 131,

de 27 de maio de 2009, E no capítulo IX, intitulado como “Da Transparência, Controle e

Fiscalização”, são apresentadas obrigações que possibilitam à sociedade controlar as ações do

Governo.

Art. 48. São instrumentos de transparência da gestão fiscal, aos quais será dada ampla divulgação, inclusive em meios eletrônicos de acesso público: os planos, orçamentos e leis de diretrizes orçamentárias; as prestações de contas e o respectivo parecer prévio; o Relatório Resumido da Execução Orçamentária e o Relatório de Gestão Fiscal; e as versões simplificadas desses documentos. [...]

Parágrafo único. A transparência será assegurada também mediante: [...]

II – liberação ao pleno conhecimento e acompanhamento da

sociedade, em tempo real, de informações pormenorizadas sobre a execução orçamentária e financeira, em meios eletrônicos de acesso público; [...] (BRASIL, 2009a)

Considerado por Batista et al. (2011, p. 1) e Ribeiro e Almeida (2011, p. 2568) o

marco brasileiro para o início da iniciativa de dados governamentais abertos foi a publicação

do Decreto n. 6.932, de 11 de agosto de 2009, que “dispõe sobre a simplificação do

atendimento público prestado ao cidadão, ratifica a dispensa do reconhecimento de firma em

documentos produzidos no Brasil, institui a “Carta de Serviços ao Cidadão” e dá outras

providências”. Menciona também a questão do uso de tecnologias para simplificar o

atendimento ao cidadão, além de criar condições propícias ao compartilhamento de

informações.

Art. 1o Os órgãos e entidades do Poder Executivo Federal observarão as seguintes diretrizes nas relações entre si e com o cidadão: [...]

II - compartilhamento de informações, nos termos da lei; [...] VI - aplicação de soluções tecnológicas que visem a simplificar

processos e procedimentos de atendimento ao cidadão e a propiciar melhores condições para o compartilhamento das informações; [...]

Art. 4o No âmbito da administração pública federal, os órgãos e

entidades gestores de base de dados oficial colocarão à disposição dos órgãos e entidades públicos interessados as orientações para acesso às

Page 79: modelagem e representação semântica de dados governamentais

76

informações constantes dessas bases de dados, observadas as disposições legais aplicáveis e as diretrizes, orientações e procedimentos estabelecidos pelo Comitê Executivo do Governo Eletrônico, criado pelo Decreto de 18 de outubro de 2000. [...] (BRASIL, 2009b)

A Lei de n. 12.527, denominada Lei de Acesso a Informação (LAI), sancionada em

novembro de 2011. Entretanto, como lembra Jardim (2012), a Lei “entrou em vigor no dia 16

de maio de 2012, quando foi regulamentada pelo Poder Executivo Federal. Desde então tem

sido objeto de regulamentação em outros Poderes da União, bem como nos estados e

municípios”.

Cabe destacar parte do capítulo 8 da Lei de Acesso à Informação, pois trata do dever

de promover acesso à informação, inclusive em meio digital e disponibilizando serviços ma

Internet:

Art. 8o É dever dos órgãos e entidades públicas promover, independentemente de requerimentos, a divulgação em local de fácil acesso, no âmbito de suas competências, de informações de interesse coletivo ou geral por eles produzidas ou custodiadas. [...]

§ 2o Para cumprimento do disposto no caput, os órgãos e entidades

públicas deverão utilizar todos os meios e instrumentos legítimos de que dispuserem, sendo obrigatória a divulgação em sítios oficiais da rede mundial de computadores (internet).

§ 3o Os sítios de que trata o § 2o deverão, na forma de regulamento,

atender, entre outros, aos seguintes requisitos: I - conter ferramenta de pesquisa de conteúdo que permita o acesso à

informação de forma objetiva, transparente, clara e em linguagem de fácil compreensão;

II - possibilitar a gravação de relatórios em diversos formatos eletrônicos, inclusive abertos e não proprietários, tais como planilhas e texto, de modo a facilitar a análise das informações;

III - possibilitar o acesso automatizado por sistemas externos em formatos abertos, estruturados e legíveis por máquina;

IV - divulgar em detalhes os formatos utilizados para estruturação da informação;

V - garantir a autenticidade e a integridade das informações disponíveis para acesso;

VI - manter atualizadas as informações disponíveis para acesso; VII - indicar local e instruções que permitam ao interessado

comunicar-se, por via eletrônica ou telefônica, com o órgão ou entidade detentora do sítio; [...] (BRASIL, 2011a)

Um ponto importante trazido a tona por essa Lei foi a diferenciação entre

Transparência Ativa, referente à “divulgação espontânea, proativa, de informações, pelo

Estado, pelos meios disponíveis” (VIEIRA, 2012 apud JARDIM, 2012, p. 19), e

Page 80: modelagem e representação semântica de dados governamentais

77

Transparência Passiva, que é o “sistema para receber uma informação ou solicitação de

informação e providenciar uma resposta” (BATIMARCHI, 2013, p. 3). Entretanto, a

aplicação desses conceitos ainda enfrenta desafios para sua consolidação.

Jardim (2012) enfatiza que diante da complexidade existente no Brasil é possível

estimar os obstáculos à implantação da Lei de Acesso à Informação em todos os Poderes

Executivo, Legislativo e Judiciário. Pois para este autor, a questão dessa Lei vai além do

âmbito jurídico, tratando-se de um processo associado “a uma cultura política que vem sendo

dinamizada, nas últimas décadas, em meio às contradições que envolvem tradições

autoritárias e uma agenda democratizante nas relações Estado e Sociedade”. (JARDIM, 2012,

p. 19).

Angélico (2012, p. 14) ao analisar a Lei de Acesso à Informação aponta outro desafio

a ser enfrentado pelo Governo com a liberação de suas informações. Segundo o autor a

utilização das informações governamentais pelo setor privado, que buscam nestas

informações vantagens competitivas no mercado, sem disponibilizarem seus resultados e

conclusões para um grupo mais amplo da sociedade. Isso poderia aumentar ainda mais a

desigualdade no acesso e tratamento das informações governamentais.

Em 15 de setembro de 2011, foi instituído o Plano de Ação Nacional sobre Governo

aberto. O artigo 1 diz que este Plano é destinado a promover ações e medidas que visem ao

incremento da transparência e do acesso à informação pública, à melhoria na prestação de

serviços públicos e ao fortalecimento da integridade pública. Para que seu objetivo seja

alcançado ele estabelece critérios:

I - aumento da disponibilidade de informações acerca de atividades governamentais, incluindo dados sobre gastos e desempenho das ações e programas;

II - fomento à participação social nos processos decisórios; III - estímulo ao uso de novas tecnologias na gestão e prestação de

serviços públicos, que devem fomentar a inovação, fortalecer a governança pública e aumentar a transparência e a participação social; e

IV - incremento dos processos de transparência e de acesso a informações públicas, e da utilização de tecnologias que apoiem esses processos. (BRASIL, 2011b)

Pode-se concluir que o acesso à informação está presente nas discussões do Estado.

Associar a legislação, que oficializa o direito do cidadão de acesso à informação, à publicação

de dados governamentais abertos, aplicação de obrigações legislativas, podem contribuir para

que no futuro se crie uma democracia participativa, na qual a população se sinta parte da

nação, interagindo com o Estado em suas decisões.

Page 81: modelagem e representação semântica de dados governamentais

78

4.4 UM OLHAR SOBRE O GOVERNO ELETRÔNICO

A utilização das tecnologias de informação e comunicação (TIC) pelo Estado no

provendo de produtos e serviços aos cidadãos geraram profundas mudanças na relação entre o

Estado e a população (FREY, 2007; 2000) e a formação de uma rede composta por atores

sociais (CASTELLS, 1999), que “envolvidos na gestão da coisa pública”. (FREY, 2007).

Segundo Garcia et al. (2003), “esta nova arquitetura dos espaços governamentais,

descentralizada e flexível, possibilita a elaboração de redes horizontais entre os atores,

permitindo que o e-gov se contraponha à cultura do governo centralizador e opressor”.

Os Estados Unidos é um dos países pioneiros na área de governo eletrônico. De

acordo com Matheus (2009, p. 3), em 1993, o presidente Bill Clinton promoveu uma

reformada administração pública. Esse programa teve o nome de National Performance

Review (NPR) e foi inspirado na obra de Osborne e Gaebler22. Os resultados com esse

programa superaram as expectativas do Governo americano, conseguindo alcançar grande

parte de seus objetivos.

Gontijo (2002, p. 183) e Ribeiro (2011, p. 164) apontam como iniciativas precursoras

de implantação do governo eletrônico no Brasil, o Programa Sociedade da Informação, com o

objetivo de “viabilizar a nova geração da Internet e suas aplicações em benefício da sociedade

brasileira” (BRASIL, 1999), o Programa Brasil Transparente, que visa “a promoção da

transparência e do acesso à informação” (CONTROLADORIA-GERAL DA UNIÃO, 2013a)

e o projeto do governo [email protected], o qual almejava a universalização do acesso à Internet,

dos serviços e das normas e padrões para prestação de serviços. (CHAHIN, 2004, p. 35).

Prado et al. (2011) estabelece uma evolução do governo eletrônico no Brasil diferente

da apresentada anteriormente. Apoiado em outros estudos, ele traça classificações diferentes:

a primeira classificação é dividida em três estágios: o primeiro (1970-1992) focou a gestão

interna, o segundo (1993-1998) teve como objetivo a prestação de serviços e informações ao

cidadão, e o terceiro (a partir de 1999) focou a prestação de serviços via Internet. (DINIZ,

2005 apud PRADO et al., 2011, p. 8). Já a segunda classificação divide a evolução do

governo eletrônico em quatro estágios: início (1950-1960), centralização (1960-1980),

terceirização (1980-1990) e governo eletrônico, propriamente dito, a partir de 1990.

(REINHARD; DIAS, 2005 apud PRADO et al., 2011, p. 8).

22 Para maiores informações consultar: OSBORNE, D.; GAEBLER, T. Reinventando o governo: como o espírito empreendedor esta transformando o setor público. 7. ed. Brasília, DF: MH Comunicação, 1995.

Page 82: modelagem e representação semântica de dados governamentais

79

O Observatório do Governo Eletrônico fornece como marco inicial do governo

eletrônico no Brasil a instituição do Sistema de Administração dos Recursos de Informação e

Informática (SISP) do Governo Federal, em 21 de janeiro de 1994. Com o objetivo de orientar

e administrar o processo de planejamento coordenação e normalização relativa aos recursos

de informação e informática da Administração Pública Federal. (GOVERNO..., 2007). Logo

no ano seguinte, maio de 1999, foi elaborado o projeto do Portal Rede Governo, apesar das

agências governamentais já possuírem páginas eletrônicas desde 1993. O Portal só entrou em

operação em 2000, sob a responsabilidade da Câmara Técnica da Rede Governo. Com a

criação do e-gov em outubro de 2000, a responsabilidade administrativa e operacionais foram

transferidas para a secretaria-executiva do Comitê Executivo do Governo Eletrônico (CEGE).

(CHAHIN et al., 2004, p. 34; SIMÃO; RODRIGUES, 2005, p. 81).

De acordo com Marcondes e Jardim (2003), Pacheco, Kern e Steil (2007) e Santos

(2012), e o governo eletrônico representa um construto, cuja definição unívoca não existe. A

seguir são apresentadas algumas definições de governo eletrônico:

O termo governo eletrônico tem foco no uso das novas tecnologias de informação e comunicação [TIC] aplicadas a um amplo arco das funções de governo e, em especial, deste para com a sociedade. (RUEDIGER, 2002, p. 1, sic.)

Podemos chamar de governo eletrônico o conjunto de serviços e acesso a informações que o governo oferece aos diferentes atores da sociedade civil por meios eletrônicos. (FERRER, 2003, p. 1)

Governo Eletrônico ou Administração Pública Eletrônica nada mais é do que o uso das Tecnologias da Informação e Comunicações (TIC) por parte da Administração Pública tanto em seu funcionamento externo quanto na troca e prestação de informações e serviços com empresas, outros governos e a população. Trata-se, em suma, de informatizar a Administração Pública” (GOVERNO..., 2007, p. 1).

Governo Eletrônico tem como princípio a utilização das modernas tecnologias de informação e comunicação (TICs) para democratizar o acesso à informação, ampliar discussões e dinamizar a prestação de serviços públicos com foco na eficiência e efetividade das funções governamentais. (BRASIL, 2013c, p. 1).

Se no passado, o conceito de governo eletrônico era associado à modernização da

infraestrutura tecnológica dos órgãos do Estado. Percebe-se que agora os conceitos de

cidadania e democratização da informação pública aparecem com recorrência nas definições

de governo eletrônico apresentadas anteriormente.

Page 83: modelagem e representação semântica de dados governamentais

80

Chahin et al. (2004, p. 12) afirma que a implantação do governo eletrônico visa uma

reforma administrativa, com o objetivo de contribuir para

� Melhoria da qualidade e inovação nos serviços prestados ao cidadão; � Transparência e acesso à informação pela sociedade; � Reestruturação organizacional, com o realinhamento de estruturas e processos; � Ampliação da autonomia das instituições e dos gerentes, acompanhada da

flexibilidade de procedimentos e de normas, aplicada à gestão; � Planejamento, avaliação e controle da ação governamental, com base nos

resultados esperados, na elaboração de indicadores de desempenho e na identificação da clientela-alvo;

� Fortalecimento da capacidade de formulação e controle sobre as políticas públicas; � Redução de custos; � Qualificação e mudança de perfil do servidor público.

Para Jardim (2000, p. 4) o governo eletrônico pode ampliar a efetividade dos governos

em quatro aspectos, a saber:

� Será mais fácil para a sociedade ter suas perspectivas consideradas pelos governos

na (re)definição de políticas públicas; � A sociedade poderá obter melhores serviços das organizações governamentais, por

exemplo, através de atividades desenvolvidas on-line; � A sociedade contará com serviços mais integrados porque as diferentes

organizações serão capazes de se comunicar mais efetivamente entre si; � A sociedade será melhor informada porque poderá obter informação atualizada e

compreensível sobre o governo, leis, regulamentos, políticas e serviços.

Da implantação até hoje, muitas pesquisas sobre governo eletrônico contribuíram para

o desenvolvimento de metodologias, técnicas e equipamentos necessários para a

modernização da administração pública e a melhoria da eficiência dos processos operacionais

e administrativos, associados a prestação de serviços públicos eletrônicos.

O Relatório do Desenvolvimento Humano (2013) com o tema: “A ascensão do Sul:

progresso humano num mundo diversificado” debruça-se sobre a evolução da geopolítica dos

tempos atuais, analisando as questões e tendências emergentes, bem como os novos atores que

moldam o panorama do desenvolvimento. De acordo com esse relatório, o governo eletrônico

possui papel fundamental no desenvolvimento das nações, pois “legitimidade da governação

internacional, no futuro, dependerá da capacidade das instituições para interagir com as redes

e comunidades de cidadãos”. (NAÇÕES UNIDAS, 2013, p. 13, sic)

Diante dos resultados observados, pode-se dizer que os recursos do governo eletrônico

conseguiram, ao longo dos anos, permitir que cidadãos acessassem informações e serviços

oferecidos pelo Governo. Buscando ampliar a abertura de dados e a promoção da

Page 84: modelagem e representação semântica de dados governamentais

81

transparência aos cidadãos, permitindo ainda melhorar as operações internas e entre governos.

(W3C, 2009).

O desenvolvimento da tecnologia e, consequentemente, da Web ofereceu ao Governo

melhores oportunidades de atingir suas metas no fornecimento de informações e serviços e ao

mesmo tempo atender às demandas por cada vez mais contribuições e interações. (W3C,

2009, p. 13).

Pacheco (2003 apud PACHECO; KERN, 2003) ao estudar os projetos de Governo

Eletrônico como fonte de informações para sistemas de informação governamental,

apresentam uma representação piramidal (19) referente à uma plataforma tecnológica para a

gestão da informação para Ciência, Tecnologia e Inovação.

FIGURA 19 - Arquitetura para plataforma tecnológica de governo eletrônico.

Fonte: Pacheco (2003 apud PACHECO, KERN, 2003)

Esses autores explicam que:

� Unidades de informação, base da pirâmide: são as classes, tipos ou sub-domínios fundamentais da informação pertinente ao domínio da plataforma.

� Fontes e sistemas de informação, segunda camada: inclui os repositórios de cada unidade de informação e os respectivos sistemas de informação para captura, tratamento e armazenagem.

� Portais e serviços web, terceira camada: constitui-se dos instrumentos de apresentação de informações na web. Assenta-se sobre os sistemas de informações e as unidades de informação definidas nas camadas inferiores.

� Sistemas de conhecimento, topo da pirâmide: são instrumentos projetados para gerar novos conhecimentos a partir das unidades de informação, sistemas de informação e portais Web. Incluem técnicas de descoberta de conhecimento como mineração de dados, estatística e reconhecimento de padrões. (PACHECO, 2003 apud PACHECO; KERN, 2003, p. 4)

Page 85: modelagem e representação semântica de dados governamentais

82

Todavia, existem desafios que os Governos, e especificamente o Brasil, precisam

superar para que todas as potencialidades do governo eletrônico sejam alcançadas.

De acordo com o relatório United Nations E-Government Survey 2012 (UNITED

NATIONS, 2012), que apresenta uma avaliação da situação mundial do setor de governo

eletrônico, o Brasil ocupa a posição de número 59, melhorando sua colocação em relação a

2010, no qual ocupava a colocação de número 61. Sua melhora se deve, dentre outros fatores,

a maior participação dos cidadãos em discussões políticas, como na época do Rio + 20, em

que foram disponibilizados questionários eletrônicos para a interação da população. Porém, a

falta de ampliação de serviços eletrônicos e a deficiência de infraestrutura de

telecomunicações, que compromete o atendimento a parte da população, contribuiu para que o

Brasil não tivesse um resultado melhor na avaliação das Nações Unidas.

O relatório (UNITED NATIONS, 2012) destaca também a iniciativas de dados abertos

que contribuem para a cooperação entre Estado e sociedade civil na elaboração de novos

produtos e serviços. Assim, ele faz algumas recomendações para o governo eletrônico

envolvendo a iniciativa dos dados governamentais abertos:

1. Certificar que as estratégias para a publicação de dados governamentais abertos estão alinhadas com outras políticas relevantes, especialmente, com a atual estratégia de governo eletrônico e estratégias para o desenvolvimento nacional;

2. Reconhecer que as iniciativas de dados governamentais abertos são processos que requerem compromisso contínuo e participação de diversos colaboradores;

3. Considerar uma abordagem de parceria entre o Governo às iniciativas de dados governamentais abertos, ou seja: a) fortalecimento da comunicação, coordenação e cooperação dentro de diferentes setores e níveis de governo e, b) a centralização do ponto de prestação de serviços de entrada para um único portal onde os cidadãos e outros atores sociais possam acessar todas as informações e serviços oferecidos pelo Governo, independentemente, de qual autoridade do Governo lhes fornece. (UNITED NATIONS, 2012).

Divulgado em 2012, a Pesquisa Nacional por Amostra de Domicílios (PNAD) (IBGE,

2012), investiga dados sobre a população, migração, educação, emprego, família, domicílios e

rendimento. Segundo essa pesquisa, em 2011, 46,5% da população de 10 anos ou mais de

idade declararam ter usado a Internet nos últimos três meses da época da pesquisa. Houve um

aumento de 14,7% em relação a 2009. Porém, o Brasil não conseguiu disponibilizar o serviço

de Internet a maioria da população. Esse fator compromete a efetividade do governo

eletrônico e seu desenvolvimento.

Page 86: modelagem e representação semântica de dados governamentais

83

Mesmo com avanços, o Brasil ainda tem o desafio no que tange a democratização do

acesso a informação. Para isso, o Estado tem desenvolvido ações para o avanço no acesso a

informação. São exemplos a Lei de Acesso a Informação (BRASIL, 2011) e o Plano Nacional

de Banda Larga, que visa reduzir o preço para utilização dos serviços e aumento da cobertura

e da velocidade (BRASIL, 2010).

Entretanto, existem outras barreiras relacionadas ao governo eletrônico que o Estado

precisa enfrentar. Habermas (2002, p. 144) chama atenção para outro obstáculo relacionado

com a participação cidadã na relação do Estado com a sociedade civil. Para esse autor, “os

grupos de opinião pública criados na Internet continuam segmentados, separados uns dos

outros como comunidade aldeãs globais”.

Outro desafio vem do governo e seu papel e contribuição para a sociedade. De modo

geral, os governos têm procurado, usado e aplicado tecnologias bem depois dessas tecnologias

e os processos correspondentes terem sido testados e provados no setor privado. Os governos,

que são os grandes inovadores e às vezes são a fonte financeira para o setor privado, “não

conseguem se adaptar rapidamente ao papel de inovador, o que os coloca muito atrás do que é

considerado como norma e ambiente tecnológico corrente.” (W3C, 2009, p. 14).

Um último entrave é a necessidade de se quebrar os “silos” corporativos dos vários

órgãos e agências dos governos para melhorar atender às necessidades dos cidadãos.

(CHAHIN et al., 2004, p. xvi). Nesse caso, os dados governamentais abertos podem

contribuir para a abertura desses “silos” e a interligação entre eles.

Chahin et al. (2004) antevê a questão dos dados governamentais abertos ao associar os

benefícios do governo eletrônico à transparência pública.

Desta forma, coloca-se a perspectiva de generalização da diretriz de transparência por meio da criação de canais integrados de acesso do cidadão e de entidades da sociedade civil a informações, a procedimentos administrativos, ao processo decisório e aos bancos de dados governamentais. Por outro lado, a oferta de informações ao cidadão com a qualidade, atualização e abrangência pressupõe a produção contínua de conteúdo e sua formatação e modulação para público amplo e diversificado, o que requer a revisão dos mecanismos convencionais de comunicação da administração pública. (CHAHIN et al., 2004, p. 104, grifo nosso).

Os dados governamentais abertos podem contribuir para facilitar o desenvolvimento

de produtos e serviços que colaboram para integração entre os cidadãos e os dados

salvaguardados nos bancos de dados governamentais.

Page 87: modelagem e representação semântica de dados governamentais

84

4.4.1 Accountability

Ao longo de 2010, foram publicados pela WikiLeaks23 diversos documentos do

governo dos Estados Unidos, ditos confidenciais, com forte repercussão mundial. O impacto

da liberação desses documentos foi tão grande que um dos membros do parlamento norueguês

indicou o WikiLeaks para o Nobel da Paz, porque a organização teria ajudado a ‘redesenhar o

mapa da liberdade de informação’. (ROBERTS, 2011 apud ANGÉLICO, 2012, p. 45).

A democratização do Estado tem sido amplamente discutida (GONZÁLEZ DE

GÓMEZ; LIMA, 2010). Isso se deve a necessidade de se “enfrentar as contradições

estruturais que se expressam pela corrupção, pela baixa densidade dos processos eleitorais na

vida cotidiana, pela escalada da violência e pela extensão da pobreza, mesmo em países do

centro capitalismo”. (FILGUEIRAS, 2011a, p. 87)

Como declara Sant’ana (2009, p. 38) exercer plenamente a cidadania requer

comprometimento do cidadão no acompanhamento crítico dos rumos definidos pelo poder

público e com a forma com que os recursos públicos são utilizados.

Neste contexto, surge a noção de accountability como forma de controle dos cidadãos

sobre as ações governamentais.

O conceito de accountability, enquanto ideia normativa informada, surgiu em meio às

propostas de reformas liberais das décadas de 1980 e 1990. (FOWDLE, 2006 apud

FILGUEIRAS, 2011b, p. 6). Filgueiras (2011a; 2011b) analisa accountability sobre duas

vertentes, uma voltada para prestação de contas; e a outra direcionada ao caráter normativo,

que é o Estado fazer o que deve ser feito.

Accountability é um conceito fortemente relacionado ao universo político

administrativo anglo-saxão. (JARDIM, 2000). Campos (1990) tentou buscar uma tradução ou

versão desse termo para o português, porém ela chegou a conclusão que isso não seria

possível. “Ao longo dos anos fui entendendo que faltava aos brasileiros não precisamente a

palavra, ausente tanto na linguagem comum como nos dicionários. Na verdade, o que nos

falta é o próprio conceito, razão pela qual não dispomos da palavra em nosso vocabulário”.

(CAMPOS, 1990, p. 34). Pinho e Sacramento (2009) escrevem um texto retomando a busca

pela tradução do termo descrito no texto clássico de Campos (1990). Eles concluíram que se

23 WikiLeaks é uma organização de mídia sem fins lucrativos, criada em 2007. O objetivo é relatar e publicar informações importantes, além de também desenvolver e adaptar tecnologias para apoiar essas atividades. Fornecem formas seguras, garantindo o anonimato das fontes que fornecem o vazamento de informações para jornalistas e demais interessados. (WIKILEAKS, 2013, tradução nossa).

Page 88: modelagem e representação semântica de dados governamentais

85

esta mais perto da resposta do que quando Campos se defrontou com o problema, mas ainda

muito longe de construir uma verdadeira cultura de accountability. (PINHO;

SACRAMENTO, 2009, p. 1344).

A accountability é um modo de disponibilização de informações das contas públicas

para o cidadão, que pode analisar e criticar o andamento das políticas públicas e o emprego do

erário. A accountability remete à obrigação do Estado de veicular links sobre as contas

públicas nos sites. (BANDEIRA, 2005, p. 12)

Já para Matheus (2009, p. 6), accountability é um meio de promoção para que o Brasil

tenha a participação cidadã necessária para o controle social. Passando a questionar os

gestores públicos sobre seus atos, por meio da prestação de contas e definições dos objetos de

ações.

O conceito de accountability envolve duas partes: a primeira delega responsabilidade

para que a segunda proceda à gestão dos recursos; ao mesmo tempo, gera a obrigação daquele

que administra os recursos de prestar contas de sua gestão, demonstrando o bom uso desses

recursos. (AKUTSU, PINHO, 2002, p. 371).

Tradicionalmente, existe uma “ausência de accountability na relação entre os

governantes e a sociedade”. (AKUTSU, PINHO, 2002, p. 371). Percebe-se que, em muitos

casos, há um distanciamento entre os atores envolvidos no processo de accountability, faltam

informações divulgadas e faltam também cobranças para a divulgação dessas informações.

A efetividade dos mecanismos de accountability dependeria do grau de acesso do

cidadão à informação governamental. [...] Cabe, portanto, ao Estado, produzir meios que

estimulem os governantes a, publicarem, justificarem o curso de suas ações, relacionando as

políticas adotadas com os efeitos que produzem ou esperam produzir. (JARDIM, 1999, p. 57).

Pois, quando maior a possibilidade dos cidadãos poderem discernir se os governantes estão

agindo em função do interesse da coletividade e sancioná-los apropriadamente, mais

accountable é o governo. (JARDIM, 2000, p. 5).

As demandas por accountability reforçaram a criação de outro princípio para a

democratização do Estado: o princípio da transparência. (FILGUEIRAS, 2011a; 2011b).

Alguns autores trabalham com transparência e accountability como sinônimos, porém

Vaz, Ribeiro e Matheus (2010) esclarecem que o conceito de accountability vai além da

prestação de contas e da publicidade das ações governamentais, referindo-se também a uma

atuação de controle sobre a Administração Pública que possa gerar incentivos ou sanções que

ocorram caso o agente público cumpra ou descumpra determinada obrigação.

Page 89: modelagem e representação semântica de dados governamentais

86

Ou seja, a accountability, em uma concepção normativamente informada pelas reformas liberais, é aprimorada com a ampliação da transparência, tendo em vista uma questão de retorno do investimento realizado pelos cidadãos na ação pública dos agentes. A transparência maximiza a accountability por permitir a redução da assimetria de informação entre principal e agent, garantindo um sistema de responsabilização derivado da abertura dos segredos de Estado. A transparência, para a teoria da agência, reforça a accountability nos contornos da economia da informação, sendo o cidadão visto como um consumidor de bens públicos, no mesmo patamar das relações de mercado. (FILGUEIRAS, 2011b, p. 8).

4.4.2 Transparência em ações pública

Um dos grandes resultados alcançados com o governo eletrônico foi sua contribuição

para a transparência pública. O governo eletrônico é uma poderosa ferramenta de reforma

administrativa do Estado, uma vez que facilita a transparência, a eficiência na entrega de

serviços públicos, a luta contra a corrupção e a individualização do atendimento aos cidadãos.

(CHAHIN et al., 2004, p. xvi).

Todavia, os dados publicados são publicados “de forma parcial e por caminhos

extremamente burocratizados e pouco transparentes”. (AGUNE; GREGORIO FILHO;

BOLLIGER; 2010, p. 3). González de Gómez (2002, p. 36) afirma que a “transparência”, no

domínio das relações Estado-sociedade, dependerá de outras condições, tais como a

convergência dos sistemas e serviços de comunicação e informação pública. Essa

convergência dos sistemas e serviços governamentais poderia ser otimizada se os dados

estivem sido publicados em formato bruto e aberto.

No âmbito dos governos democráticos, a transparência pode ser útil para muitos fins.

Transparência é central para a boa governança e pré-requisito essencial para a accountability entre os estados e cidadão. Basicamente, governança transparente significa uma abertura do sistema de governança através e processos e procedimentos claros e fácil acesso á informação pública por parte dos cidadãos, estimulando a consciência ética, no serviço público através do compartilhamento de informações, o que em última instância assegura accountability para o desempenho dos indivíduos e organizações que são responsáveis por recursos públicos ou ocupam cargos públicos. (SUK KIM et al., 2005 apud ANGÉLICO, 2012, p. 25).

O conceito de transparência pública pode ser entendido como meio de fornecer

informações à sociedade, que de acordo com sua capacidade crítica, pode inferir e participar

mais efetivamente do campo político. (GONZÁLEZ DE GOMEZ, 2002).

Page 90: modelagem e representação semântica de dados governamentais

87

No Brasil, o principal resultado referente à transparência pública foi o

desenvolvimento do Portal da Transparência do Governo Federal. Essa iniciativa da

Controladoria-Geral da União (CGU) foi lançada em novembro de 2004, para assegurar a boa

e correta aplicação dos recursos públicos. O objetivo é aumentar a transparência da gestão

pública, permitindo que o cidadão acompanhe como o dinheiro público está sendo utilizado e

ajude a fiscalizar. (CONTROLADORIA-GERAL DA UNIÃO, 2013b).

FIGURA 20 - Portal da Transparência do Governo Federal do Brasil.

Fonte: Portal da Transparência do Governo Federal (2013)

Busca-se a transparência não como um atributo dos conteúdos de valor informacional

oferecidos pelo Estado. Todavia, como resultante das condições de geração, tratamento e uso

das informações adequadas para permitir a passagem do nível caótico, para o nível de

informação organizada, que produza sentido para um cidadão ou grupo social. (GONZÁLEZ

DE GOMEZ, 2002, p. 36).

Entretanto, concorda-se com Jardim (1999) que, no decorrer do texto, afirma que

sempre teremos a relação transparência/opacidade, pois a ação de tornar pública determinadas

informações é um processo repleto de valores, no qual julgamos o que deve ser público ou

não (seleção).

Também é esclarecido por Jardim (1999, p. 72-73) que a opacidade informacional do

Estado pode ser entendida como a ausência (total ou quase total) de interação informacional

entre o Estado e a sociedade, na qual a massa de excluídos supera em muito a de cidadãos-

incluídos. Constitui um território estratégico na produção de hegemonia e de exclusão de

classes sociais não dominantes. Logo, constituindo-se em uma estratégia de poder.

Já Zugman (2006, p. 10) comenta que essa “opacidade leva a uma relação entre os

cidadãos e seu governo marcada pela enorme assimetria de informações e poderes”.

Page 91: modelagem e representação semântica de dados governamentais

88

Quer isto dizer que o campo político exerce de facto um efeito de censura ao limitar o universo daquilo que é pensável politicamente, ao espaço finito dos discursos suceptíveis de serem produzidos ou reproduzidos nos limites da problemática política como espaço das tomadas de posição efectivamente realizadas no campo, quer dizer, sociologicamente possíveis dadas as leis que regem a entrada no campo. (BOURDIEU, 1989, p. 165, sic)

Assim a transparência pode, por um lado, ser uma alternativa para que os cidadãos

tenham um conhecimento sobre assuntos e ações políticas do Estado, promovendo uma maior

participação social. Já por outro lado, a transparência, em virtude de sua publicidade, pode ser

utilizada para legitimar, oficializar algo como verdade. “A passagem do implícito ao explícito,

da impressão subjetiva à expressão objectiva, à manifestação pública num discurso ou num

acto público constitui por si um acto de instituição e representa por isso uma forma de

oficialização, de legitimação”. (BOURDIEU, 1989, p. 165).

Silva (2001) ao discutir a ideia de esfera pública proposta por Habermas, afirma que

este autor também associa o conceito de transparência ao de publicidade. Silva (2001)

defende ainda, que na visão de Habermas, o Estado é influenciado pela esfera pública,

deixando de ser um produtor de opacidade e passando a ser um potencial produtor de

transparência.

Como conseqüência da definição constitucional da esfera pública e das suas funções, a publicidade tornou-se o princípio organizacional dos procedimentos dos próprios órgãos do Estado; neste sentido, fala-se na sua “publicidade” [por outro lado, a relação entre esta noção de publicidade (transparência) e a prática parlamentar e judicial é enfatizada.] O carácter público das deliberações parlamentares garantia à opinião pública a sua influência; assegurava a relação entre representantes e eleitores como partes do mesmo público. E, por volta da mesma altura, também os procedimentos legais nos tribunais começam a ser tornados públicos (HABERMAS, 1962 apud SILVA, 2001, p. 127)

Ribeiro, M. (2008) e Matheus (2009) apresentam o conceito de transparência sob dois

aspectos. O primeiro associa o conceito de transparência como sinônimo de publicidade, já o

segundo, a transparência vai além dos dados disponibilizados, pensando na transparência

relacionada com o acesso aos dados, inclusão digital e disponibilidade dos dados,

especialmente em relação à freqüência e atualização das informações contidas em portais e

sites governamentais. O segundo aspecto vai ao encontro dos objetivos dos dados

governamentais abertos.

Apesar de ainda não se falar na publicação de dados governamentais abertos, Matheus

(2009, p. 16) afirma que o verdadeiro significado de transparência é a

Page 92: modelagem e representação semântica de dados governamentais

89

abertura do fornecimento de informações, de acesso livre e universal, de constante atualização, postadas em um único canal de comunicação e interação com o cidadão e com ferramenta de busca para ajudar a encontrar a temática que queira rapidamente.

Cabe lembrar, que dados governamentais abertos não devem ser postos como

sinônimo de transparência, porém pode contribuir para a ampliação da transparência

governamental, em outras palavras, “uma política de dados abertos teria o poder de

potencializar as possibilidades de transparência através da Internet”. (DINIZ, 2010 apud

VAZ, RIBEIRO, MATHEUS, 2010, p. 53).

Assim, os dados governamentais abertos podem ser considerados como recurso de

transparência, promovendo o acesso à dados públicos sem restrições tecnológicas, podendo

ser reutilizados e tendo uma estrutura que facilite sua recuperação e utilização.

4.5 DADOS GOVERNAMENTAIS ABERTOS

Percebe-se que a Web é, muitas vezes, o primeiro local de busca por informações, que

vão desde notícias, até pesquisas sobre doenças. Além disso, muitos relacionamentos

humanos – amorosos, amizades, profissionais – são criados e mantidos na Web, via redes

sociais. Essas são tendências importantes que estão abrindo novas oportunidades para que

governos e cidadãos interajam. Cada vez mais, o meio-padrão usado pelo governo para

transmitir sua mensagem e oferecer serviços públicos é a Web. (W3C, 2009, p. 25).

Talvez um dos grandes motivos para o sucesso da Web seja o caráter participativo dos

usuários em inovar, que proporciona a possibilidade de criar e disseminar informação de

maneira ágil. A Web é transformadora porque permite que qualquer pessoa seja um editor.

Isso muda profundamente as relações de poder na esfera pública. (W3C, 2009, p. 26).

Habermas (1992, p. 435-436 apud LUBENOW, 2010, p. 236) afirma que a esfera

pública “constitui uma estrutura normativa capaz de diferenciar entre competências e papéis.

[...] pode ser descrita como uma rede adequada para a comunicação de conteúdos tomadas de

posição e opiniões”. Complementando essa conceituação Lima e Gonçalves (2011) afirmam

que

A esfera pública é o termo utilizado para designar espaços de cooperação entre agentes e atores que, a partir de canais específicos de comunicação, integram habilidades, conhecimentos e técnicas, resultando no fortalecimento de competências e maximização de resultados. Com isso há o compartilhamento e a discussão de opiniões e a criação de entendimento mútuo. Essa idéia de espaço ou ambiente de discussão para os agentes

Page 93: modelagem e representação semântica de dados governamentais

90

participantes torna-se importante pelo fato de que os próprios agentes possuem a oportunidade. (LIMA; GONÇALVES, 2011, p. 1645)

Atualmente, percebe-se que os ambientes de discussão estão abrigados,

principalmente, na Web, basta verificar a influência que as redes sociais possuem na

repercussão de determinados assuntos. Twiter24, Crowdsourcing25 e Crowdfunding26 são

exemplos de novas maneiras dos cidadãos se manifestarem e interagirem com o Governo.

Deixam de ser passivos e apenas receptadores de informações, passando a ter uma postura

ativa, mas participativa, buscando uma interação colaborativa entre os usuários da Web em

prol de um objetivo determinado. Como lembra Habermas (2003, p. 33) “a formação

democrática da opinião e da vontade depende de opiniões públicas informais que idealmente

se formam em estruturas de uma esfera pública política não desvirtuada pelo poder”.

Vale destacar que é utilizado o conceito de Governo se referindo “não apenas ao

conjunto de pessoas que exerce o poder político e determina a orientação política de uma

determinada sociedade. Diz respeito, também, ao complexo de órgãos que institucionalmente

têm o exercício do poder”. (LEVI, 1993 apud JARDIM, 1995, p. 65).

A Open Definition (2013) aborda sobre o conhecimento aberto, no qual engloba,

dentre outros aspectos, os dados, sejam eles científicos, históricos, geográficos ou outros

quaisquer, além de informações governamentais e administrativas. Assim, “dado aberto é um

dado que pode ser livremente utilizado, reutilizado e redistribuído por qualquer um”.

(MANUAL..., 2011, p. 13).

Pode-se dizer que um dos benefícios – ou consequência – de se associar dados abertos

às informações públicas é a interoperabilidade, proporcionada pelos padrões provenientes dos

princípios dos dados abertos.

Miranda (2011, p. 65) chama a atenção para a importância da interoperabilidade

semântica, que pode ser entendida como a “habilidade de dois sistemas se comunicarem,

24 O Twitter apresenta-se como uma proposta para troca de informações e divulgação de notícias em poucas palavras. É um forte aliado para a disseminação da informação no ambiente online, ou seja, na internet. Utilizando estes serviços os usuários podem publicar notícias ou compartilhar informações através de vários equipamentos que possibilitem uma conexão, entre estes o celular, e assim não precisando necessariamente do computador. (PAUXIS, SILVA, 2011) 25 Crowdsourcing é um modelo de produção que utiliza a inteligência e os conhecimentos coletivos e voluntários espalhados pela Internet para resolver problemas, criar conteúdo e soluções ou desenvolver novas tecnologias como também para gerar fluxo de informação. (WIKIPEDIA, 2013b). 26 Crowdfunding, traduzido para o português como Financiamento coletivo ou Financiamento colaborativo, é a obtenção de capital para iniciativas de interesse coletivo através da agregação de múltiplas fontes de financiamento, em geral pessoas físicas interessadas na iniciativa. O termo é muitas vezes usado para descrever especificamente ações na Internet com o objetivo de arrecadar dinheiro para artistas, jornalismo cidadão, pequenos negócios e start-ups, campanhas políticas, iniciativas de software livre, filantropia e ajuda a regiões atingidas por desastres, entre outros. (WIKIPEDIA, 2013a).

Page 94: modelagem e representação semântica de dados governamentais

91

tendo entre eles a mesma interpretação e, portanto, as mesmas implicações lógicas sobre as

informações trocadas”. Para este mesmo autor, o movimento criado pela publicação de dados

governamentais abertos pretende utilizar padrões de arquivo ou comunicação que promovam

interoperabilidade semântica entre sistemas, permitindo interpretações automatizadas por

máquina e agregação de valor às informações apresentadas a sociedade.

Com relação a questão da interoperabilidade, o Governo Brasileiro publicou a Portaria

n. 5, em 14 de julho de 2005, que institucionaliza os Padrões de Interoperabilidade de

Governo Eletrônico (e-PING), no âmbito do Sistema de Administração dos Recursos de

Informação e Informática (SISP), cria sua Coordenação, definindo a competência de seus

integrantes e a forma de atualização das versões do Documento. O e-PING visa integrar as

operações

entre equipamentos, programas e sistemas de informática, visando o pleno aproveitamento dos potenciais de intercâmbio de dados e informações no âmbito da Administração Pública Federal direta, autárquica e fundacional, o avanço na constituição da infra-estrutura para o desenvolvimento do Governo Eletrônico e a racionalização de custos. (BRASIL, 2005, p. 1)

Utilizando o pensamento de Pastori (1993 apud JARDIM, 1995, p. 62), administração

pública pode ser definida como “conjunto de atividades diretamente destinadas à execução

concreta das tarefas ou consideradas de interesse público ou comum numa coletividade ou

numa organização estatal”. Jardim (1995; 1999) complementa a ideia de administração

pública afirmando que sua atividade corresponde tanto às ações governamentais relacionadas

com os poderes de decisão e comando e aquelas de auxílio imediato ao exercício do Governo,

quanto aos empreendimentos voltados para a consecução de objetivos públicos, definidos por

Lei e atos do Governo.

Miranda (2011), Ribeiro e Almeida (2011) e Batista et al. (2012) apontam a

publicação do Memorandum on Transparency and Open Government, pelo presidente dos

EUA, Barack Obama (2009) como ação motivadora para a ampliação de esforços para a

publicação de dados governamentais abertos. Esse documento estabelece as diretrizes do

Governo Norte-Americano, abrangendo desde as questões sobre gestão interna da informação,

indo até a publicação dos dados do Governo para a sociedade civil. (OBAMA, 2009). A partir

de então a abertura de dados governamentais passou a ser uma prática que, cada vez mais, é

adotada por diversos países.

O Manual... (2011, p. 4) define dados governamentais abertos como

Page 95: modelagem e representação semântica de dados governamentais

92

dados produzidos pelo governo e colocados à disposição das pessoas de forma a tornar possível não apenas sua leitura e acompanhamento, mas também sua reutilização em novos projetos, sítios e aplicativos; seu cruzamento com outros dados de diferentes fontes; e sua disposição em visualizações interessantes e esclarecedoras.

Para o W3C (2010 apud VAZ; RIBEIRO; MATHEUS, 2010, p. 49) os Dados

governamentais abertos podem ser definidos como “a publicação e disseminação das

informações do setor público na Web, compartilhados em formato bruto e aberto,

compreensíveis logicamente, de modo a permitir sua reutilização em aplicações digitais

desenvolvidas pela sociedade”.

Já Batista et al. (2012, p. 2) afirma que Dados Governamentais Abertos são

“entendidos como o esforço para a publicação e disseminação das informações do setor

público na Web, permitindo a reutilização e a integração destes dados”.

Diante das definições apresentadas acima, pode-se que a questão chave dos dados

governamentais abertos é a abertura dos dados para sua reutilização pelos cidadãos. Pois,

apenas a troca de documentos entre organismos do setor público no âmbito das suas

atividades de serviço público não constitui reutilização. (VALENTIN RUIZ; BUENESTADO

DEL PESO, 2012).

Diversos estudos apontam os benefícios provenientes da adoção dos dados

governamentais abertos (BERNERS-LEE, 2009; DINIZ, 2009; MANUAL..., 2011). O W3C

(2009, p. 41-43) aponta como as principais vantagens dos dados governamentais abertos, os

seguintes pontos:

• Reutilização: quando as informações são coletadas à disposição na Web

com uso dos padrões abertos apropriados, elas podem ser usadas várias vezes de maneiras novas, imprevistas e imaginativas, capazes de aumentar muito o valor dos dados por seu reuso e combinação, com maior automação e interoperabilidade melhor.

• Buscas melhoradas na Web: muitos sistemas ainda impedem a busca de informações necessárias, pois mesmo disponíveis, não estão indexadas de maneira adequada para sua recuperação. A utilização das tecnologias da Web Semântica contribuirá para a estruturação e recuperação dessas informações públicas;

• Integração dos dados: possibilidade de interligar, melhorar e compartilhar esses dados, o que produz uma grande melhoria na integração de dados entre sistemas díspares e o florescimento de novos serviços.

Com base nos conceitos elaborados pelo grupo defensor dos princípios para dados

governamentais abertos, o W3C (2009) amplia os benefícios já listados, acrescentando que os

Page 96: modelagem e representação semântica de dados governamentais

93

dados governamentais abertos promovem o aumento do discurso civil, a melhoria do bem-

estar público e o uso mais eficiente dos recursos públicos. E alerta para que a publicação seja

eficaz é necessário identificar os dados que alguém controla, representar esses dados de uma

maneira que as pessoas possam utilizá-los e expor os dados para o mundo amplo.

DAVIES (2010, p. 3) e Eaves (2010 apud PEREIRA, 2012, p. 22) descrevem cinco

maneiras para utilização dos dados abertos. Sendo:

1. Data to fact – relacionada à busca, pesquisa e apresentação dos dados; 2. Data to information – forma na qual os dados foram analisados e

interpretados, comumente utilizada em trabalhos acadêmicos para construção de análise e relatórios;

3. Data to interface – dados em formato mais interativo como gráficos, mapas, tabelas, entre outros;

4. Data to data – dados são mais complexos por estarem agregados uns aos outros;

5. Data to service – é a utilização dos dados para provimento de serviços, como prestação de atendimento e serviço público ao cidadão de maneira on-line pela gestão pública.

Já os efeitos dos dados governamentais abertos sobre as políticas públicas são

apontadas pelo W3C (2009, p. 40) como sendo os seguintes:

• Inclusão: fornecer dados em formatos padronizados abertos e

acessíveis permite que qualquer pessoa use numerosas ferramentas de software para adaptá-los às suas necessidades;

• Transparência: informações do setor público abertos e livremente acessíveis melhoram a transparência, pois partes interessadas podem usar essas informações da maneira mais adequada ao seu propósito, obtendo uma ideia melhor do trabalho do governo e adaptando-os às suas necessidades específicas;

• Responsabilidade: os conjuntos apropriados de dados abertos, devidamente ligados, podem oferecer vários pontos de vista sobre o desempenho do governo ao tentar atingir suas metas públicas.

Um grupo de especialistas, o OpenGovData (2007), desenvolveu os oito princípios dos

dados governamentais abertos, que nortearam diversos trabalhos posteriores sobre este tema,

como Agune, Gregório Filho, Bolliger (2010); Diniz (2010); Manual... (2011); Vaz, Ribeiro,

Matheus (2010). Estes princípios são:

1. Completos. Todos os dados públicos estão disponíveis. Dado público é o dado que não está sujeito a limitações válidas de privacidade, segurança ou controle de acesso. 2. Primários. Os dados são apresentados tais como os coletados na fonte, com o maior nível de granularidade e sem agregação ou modificação.

Page 97: modelagem e representação semântica de dados governamentais

94

3. Atuais. Os dados são disponibilizados tão rapidamente quanto necessário à preservação do seu valor. 4. Acessíveis. Os dados são disponibilizados para maior alcance possível de usuários e para o maior conjunto possível de finalidades. 5. Compreensíveis por máquinas. Os dados são razoavelmente estruturados de modo a possibilitar processamento automatizado. 6. Não discriminatórios. Os dados são disponíveis para todos, sem exigência de requerimento ou cadastro. 7. Não proprietários. Os dados são disponíveis em formato sobre o qual nenhuma entidade detenha controle exclusivo. 8. Livres de licença. Os dados não estão sujeitos a nenhuma restrição de direito autoral, patente, propriedade intelectual ou segredo industrial. Restrições sensatas relacionadas à privacidade, segurança e privilégios de acesso são permitidas. (VAZ, RIBEIRO, MATHEUS, 2010, p. 47)

Ainda existem três leis dos dados governamentais abertos estabelecidas por Eaves

(2009, p. 1, tradução nossa), que determinam que

Se o dado não for encontrado e indexado na Web, ele não existe; Se não estiver aberto e disponível em formato compreensível por máquina, ele não pode ser aproveitado; Se algum dispositivo legal não permitir sua replicação, ele é inútil.

Tanto nos princípios estabelecidos pelo grupo OpenGovData, quanto nas leis de

Eaves, a Web Semântica apresenta soluções para acessibilidade, compreensão por máquinas,

busca precisa e rápida. Ao fornecer significados às páginas na Web, de modo que a linguagem

seja compreendida por máquina, capturando, processando e relacionando dados de diferentes

fontes, a Web Semântica viabiliza que a publicação dos dados governamentais abertos seja

encontrada por quem a reutilize, dando outra utilidade àqueles dados.

Deve-se especificar que os dados governamentais a serem publicados em formato

aberto são aqueles que não contêm informações sobre indivíduos específicos ou restrições de

segurança nacional. Logo, os dados em questão se referem aos dados públicos, que estão ou

que deveriam estar liberados para a sociedade, tendo potencial para se tornarem abertos,

garantindo sua reutilização. (MANUAL... 2011, p. 16).

Ainda sobre essa questão, Thaney (2010) e Ribeiro e Almeida (2011) utilizam as

idéias de Auer et al. (2007), Gray et al. (2009) e Davies (2010) para chamar a atenção sobre

os aspectos ligados às questões de licença e autorização para acesso aos dados e aos

conteúdos oriundos do âmbito governamental. Pois se deve observar a diferença legal

existente entre os conteúdos individuais de uma base de dados (privacidade no conteúdo de

cada um dos campos de dados) e a coleção de conteúdos da base (privacidade global da base

de dados).

Page 98: modelagem e representação semântica de dados governamentais

95

Berners-Lee (2009) conclui que os dados governamentais devem ser publicados de

forma aberta por três motivos: “aumentar a consciência cidadã das funções do governo para

permitir maior responsabilidade; contribuir com informações valiosas sobre o mundo; e

permitir que o governo, o país e o mundo funcionem com mais eficiência”.

Todavia, Gurstein (2011 apud RODRIGUES, 2012) acredita que a publicação de

dados governamentais abertos não será um objetivo fácil a ser conquistado. Esse autor levanta

obstáculos que os dados governamentais abertos deverão enfrentar até sua efetiva

implementação. Os principais pontos sinalizados são: a infraestrutura básica para acesso à

Internet pelo cidadão; ferramentas que são a disponibilidade dos dados em meios específicos e

não universalmente; dados que precisam de software específico para sua utilização; conteúdo

dos dados ser de difícil compreensão pelos usuários, principalmente aqueles com deficiência

ou baixa escolaridade e interpretação dos dados que necessitam de especialistas na área para

serem utilizados e compreendidos. (PEREIRA, 2012, p. 24).

Diante dos desafios apresentados, Dodds (2010, p. 13) recomenda que se deve

continuar permitindo o acesso abertos aos dados e incentivar que outras pessoas os reutilizem,

para alcançar, fora do espaço dos órgãos públicos, projetos, aplicações e organizações

criativas e inovadoras. Porém, não pode haver dúvidas que a intenção básica primeira dos

dados governamentais abertos é a reutilização.

Frente aos obstáculos para implementação das iniciativas para publicação de dados

abertos, algumas países se uniram, no espírito de colaboração multi-colaboradores, formando

um comitê de governos e organizações da sociedade civil, para supervisionar o andamento da

publicação de dados governamentais abertos. A parceria para Governo Aberto oficialmente

foi criada em 20 de setembro de 2011, quando os oito governos fundadores (Brasil, Indonésia,

México, Noruega, Filipinas, África do Sul, Reino Unido, Estados Unidos) aprovaram uma

Declaração de Governo Aberto, e anunciou seus planos de ação nacionais. Atualmente, são 47

governos membros da Open Government Partnership, que é uma iniciativa multilateral que

visa assegurar compromissos concretos dos governos para promover a transparência, capacitar

os cidadãos, combater a corrupção e aproveitar novas tecnologias para fortalecer a

governança. (OPEN GOVERNMENT PARTNERSHIP, 2012).

As primeiras iniciativas de dados governamentais abertos conhecidas por parte do

setor público são os portais de dados abertos do governo dos Estados Unidos27 e do Reino

Unido28. Nestes portais são indexadas milhares de séries de dados em formato bruto para

27 Disponível em: <http://www.data.gov/>. Acesso em: 1 maio 2013. 28 Disponível em: <http://data.gov.uk/>. Acesso em: 1 maio 2013.

Page 99: modelagem e representação semântica de dados governamentais

96

serem utilizadas pela sociedade, lançados em maio de 2009 e setembro de 2009,

respectivamente. Em seguida, Canadá29, Austrália30 e Nova Zelândia31 começaram a publicar

dados segundo as diretrizes dos dados governamentais abertos, seguindo os passos dos

Estados Unidos e Reino Unido. (MIRANDA, 2011, p. 67-68).

Embora milhares de datasets tenham sido publicados nesses portais, houve pouca

participação da sociedade na utilização dos dados publicados. Em função disso, os Governos

dos Estados Unidos e do Canadá, começaram a promover campeonatos de elaboração de

aplicações, com prêmios para os mais úteis, estimulando o uso desses dados. (MIRANDA,

2011, p. 68).

Percebe-se assim que, além de publicar é necessário motivar a utilização dos dados,

criando, no futuro, um hábito parceria entre Estado e Governo na elaboração de ferramentas e

serviços.

Serão apontadas a seguir algumas iniciativas estrangeiras e nacionais de dados

governamentais abertos.

4.5.1 Iniciativas estrangeiras de dados governamentais abertos

Foram analisados os portais das primeiras iniciativas de dados governamentais

abertos. Desta forma, analisou-se portal norte-americano e do Reino Unido.

DATA.GOV

Criado em 2009, o portal Data.gov é uma ação efetiva do memorando sobre

transparência e governo aberto escrito por Obama (2009). Seu propósito é aumentar o acesso

do público aos dados gerados pelo Poder Executivo do Governo Federal, fornecendo

descrições dos conjuntos de dados governamentais, informações sobre como acessar as bases

de dados e ferramentas que alavancam conjuntos de dados do Governo.

O portal do Data.gov (UNITED STATES, 2013) apresenta como seu objetivo

melhorar o acesso aos dados federais e expandir o uso criativo desses dados para além das

paredes de Governo, incentivando ideias inovadoras (por exemplo, as aplicações Web). Além

de tornar o governo mais transparente.

29 Disponível em: <http://www.open.gc.ca/index-eng.asp>. Acesso em: 1 maio 2013. 30 Disponível em: <http://data.gov.au/>. Acesso em: 1 maio 2013. 31 Disponível em: <https://data.govt.nz/>. Acesso em: 1 maio 2013.

Page 100: modelagem e representação semântica de dados governamentais

97

Data.gov utiliza-se de feedback, comentários e recomendações por parte do público e,

portanto, incentiva as pessoas a sugerirem conjuntos de dados que eles gostariam que fossem

publicados. Ademais, os conjuntos de dados já publicados podem ser avaliados e comentados,

sugerindo outras formas de melhorar sua disponibilização.

Em 1 de maio de 2013, o portal do Data.gov possuía 373.029 conjuntos de dados

brutos e geoespaciais, 1.209 ferramentas de dados, 349 aplicativos, 137 aplicativos móveis e

172 agências e subagências. E os dados são organizados em comunidades: agricultura,

negócios (EUA), cidades, consumidores, países, desenvolvedores, educação, energia, ética,

saúde, lei, industria, oceano, pesquisa, restauração do Golfo do México, Segurança, Estados e

cadeia de fornecimento sustentável.

O portal apresenta uma parte exclusiva para a Web Semântica, o Governo dos EUA

está na vanguarda das tecnologias da Web Semântica associada ao dados governamentais.

Para este fim, Data.gov está hospedando um conjunto de RDF, contendo triplas criadas pela

conversão de uma série de conjuntos de dados Data.gov para este formato, fazendo mais de

6,4 bilhões tripas de dados governamentais abertos disponíveis para a comunidade. (UNITED

STATES, 2013).

De acordo com o portal, o esquema de URI escolhido é muito simples e projetado para

permitir aos cidadãos explorarem e ampliarem os usos desses dados. Os líderes da

comunidade Data.gov, trabalham para uma nova codificação de conjuntos de dados

convertidos de Comma-Separated Values – CSV (e outros formatos) para RDF. Buscando

determinar o melhor esquema para se criar URI persistente e diferenciado, para junto com

comunidades internacionais e com W3C promover padrões internacionais de publicações de

dados do governo de forma persistentes (metadados) na Web. (UNITET STATES, 2013).

Como exemplo de utilização dos dados disponíveis no Data.gov, pode-se citar o

“Data.gov Mashathon 2010: na energy mashup”32. Ele combinou os dados da Energy

Information Administration (EIA), publicados no Data.gov, com dados de OpenEI.org, o

Censo dos EUA e SmartGrid.gov. O resultado deste mashup é comparar a variação no uso

residencial de energia de 7 cidades com população em torno de meio milhão de pessoas. Foi

possível analisar as diferentes tarifas de energia elétrica, os níveis de renda média, os

incentivos relacionados com a energia e os tipos de programas que estão sendo

32 Disponível em: <http://en.openei.org/apps/mashathon2010/>. Acesso em: 1 maio 2013.

Page 101: modelagem e representação semântica de dados governamentais

98

implementadas pelo Smart Grid33. Com isso, cidades de todo o país estão fazendo a transição

para um novo mercado de energia de forma unificada.

FIGURA 21 - Aplicativo utilizando dados do Data.gov

Fonte: OpenEi34.

DATA.GOV.UK

O Governo do Reino Unido disponibilizou em 2009 o portal que disponibiliza os

dados públicos para ajudar os cidadãos a entenderem como o governo funciona e como as

políticas são feitas. Alguns desses dados já estavam disponíveis, mas o portal Data.gov.uk

reúne esses dados de forma unificada, possibilitando que sejam pesquisáveis em um website.

(DATA.GOV.UK, 2013).

Ramos Simón et al. (2012) afirma que o portal de dados abertos do Reino Unido

funciona também como um catalisador para outras instituições publicarem seus dados,

aumentando, desta forma, o número de dados disponível. Os dados então englobam o

Governo Central, Governos Regionais e autoridades locais, servindo como um elemento

fundamental na política de transparência do Governo. Este autor chama a atenção que não é

informação pública destinada ao público em geral, mas é destinado a um público capaz de

analisá-la e criar aplicativos que oferecem uma utilidade para o cidadão.

Em 1 maio de 2013 existiam 9.399 conjuntos de dados disponíveis, de todos os

departamentos do Governo central e uma série de outros organismos do setor público e das

autoridades locais.

33 Smart Grid é uma rede elétrica que utiliza tecnologia de informação e comunicação para reunir e agir de acordo com informações, tais como informações sobre o comportamento de fornecedores e consumidores, de forma automatizada para melhorar a eficiência, confiabilidade, economia e sustentabilidade da produção e distribuição de energia elétrica. (WIKIPÉDIA, 2013c). 34 Disponível em: <Disponível em: http://en.openei.org/apps/mashathon2010/>. Acesso em 1 maio 2013.

Page 102: modelagem e representação semântica de dados governamentais

99

O Data.gov.uk disponibiliza seus dados em 49 formatos diferentes, dos quais podem

ser destacados o CSV e RDF. Porém também disponibiliza 632 conjuntos de dados em

Portable Document Format (PDF), formato não indicado para publicação de dados abertos,

pois inviabiliza a reutilização dos dados contidos no documento.

A organização dos dados para sua recuperação é realizada por meio de tags. Estas

somam 50 assuntos utilizados para descreverem os dados. E assim, como o Data.gov, o

Data.gov.uk também utiliza ferramentas da Web 2.0 para promover a participação dos

cidadãos, podendo postar comentários sobre os dados publicados, solicitar outros dados e

sugerir melhorias.

FIGURA 22 - Aplicativo utilizando dados do Data.gov.uk

Fonte: Travel’s checklist35.

Ramos Simon et al.(2012) realizou uma pesquisa comparativa em portais de dados

abertos dos Governos Europeus. Pesquisou os portais do Governo da Alemanha, Áustria,

Bélgica, Dinamarca, Espanha, França, Grécia, Itália, Portugal e reino Unido. E concluiu que

apenas o Reino Unido trabalhava com as tecnologias de dados abertos interligados, tendo

como colaborados o Tim Berners-Lee, além de outros parceiros técnicos envolvidos no

projeto até o momento.

4.5.2 Iniciativas nacionais de dados governamentais abertos

Diante das iniciativas estrangeiras sobre publicação dos dados governamentais abertos,

o Brasil é o pioneiro nas discussões sobre dados abertos na América Latina (Mazoni, 2011, p.

9), abrindo espaço para discussões sobre dados abertos e reutilização.

35 Disponível em: <http://www.travelschecklist.com/>. Acesso em 1 maio 2013.

Page 103: modelagem e representação semântica de dados governamentais

100

A principal iniciativa de dados governamentais abertos do Brasil é o Portal Brasileiro

de Dados Abertos ou dados.gov.br, como é citado em diversas pesquisas, é a ferramenta

disponibilizada pelo Governo Brasileiro para que os cidadãos possam encontrar e utilizar os

dados públicos. O portal também tem o objetivo de promover a interlocução entre atores da

sociedade e com o Governo para pensar a melhor utilização dos dados em prol de uma

sociedade melhor. (DADOS.GOV.BR, 2013).

O projeto dados.gov (como era chamado), iniciado em 2009 tem o objetivo principal

de criar um catálogo aberto de informações, cujo objetivo é aprimorar a gestão pública e

facilitar o acompanhamento pela sociedade das ações governamentais em suas comunidades.

(FRANZOSI et al., 2011, p. 27).

Franzosi et al. (2011, p. 27) afirma que o dados.gov.br é um catálogo de dados

organizado em árvores temáticas. Segundo este autor, ao acessar os portais de dados abertos

norte americano, do Reino Unido, da Alemanha e do Canadá não se tem a possibilidade de

acesso aos dados por diferentes árvores temáticas, tão pouco uma abordagem top-down, de

grandes assuntos até os itens primários de acesso aos dados.

Esta organização em árvores utiliza como base o Vocabulário Controlado do Governo

Eletrônico (VCGE). Franzosi et al. (2011, p. 39, grifo nosso) declara que “a busca semântica é

realizada sobre o repositório de metadados usando uma ontologia de domínio de Serviços

Públicos de Administração Federal que foi construída a partir do Vocabulário Controlado do

Governo Aberto Eletrônico (VCGE)”. Este ponto de vista será questionado na próxima seção

desta pesquisa.

Além do portal dados.gov.br, que serve como compilador dos dados abertos

publicados. Este portal indica nove outras iniciativas nacionais:

� Portal da Câmara Municipal de São Paulo36 – que disponibiliza dados sobre

atividade legislativa, acervo de processos digitalizados da atividade legislativa,

recursos humanos e orçamento. Apesar de ter alguns dados disponibilizados em

XML, muitos estão em formato proprietário, contrariando os princípios de dados

abertos.

� Governo Aberto SP37 – iniciativa do Governo do Estado de São Paulo, busca

estimular a criação de novos serviços eletrônicos, a promoção da transparência e a

melhoria de qualidade das informações de interesse da sociedade. Verificou- se

36 Disponível em: <http://www.camara.sp.gov.br/index.php?option=com_wrapper&view=wrapper&Item id=219>. Acesso em 1 maio 2013. 37 Disponível em: <http://www.governoaberto.sp.gov.br/view/index.php>. Acesso em: 1 maio 2013.

Page 104: modelagem e representação semântica de dados governamentais

101

que apesar de informar que possui 358 bases de dados cadastradas, muitas

apresentam seu conteúdo em formatos fechados. Algumas inclusive, solicitando

senha para acesso aos dados. Logo, precisa ser reformulada para que os dados

sejam realmente publicados seguindo os princípios de dados governamentais

abertos. Um diferencial positivo do portal foi a possibilidade de postar comentários

sobre as bases de dados.

� Portal de dados abertos do Tribunal de Contas dos Municípios do Estado do

Ceará38 – além de fornecer uma espécie de tutorial sobre como utilizar os dados,

ainda oferece os dados disponibilizados em formatos XML, JSON, CSV e HTML.

� Dados abertos do Governo de Pernambuco39 – Organiza os dados por assuntos,

classificados em: cultura, Economia, educação, Habitação, lazer, meio ambiente,

saúde, segurança, sociedade, trabalho, transporte e turismo. E os formatos

disponíveis são CSV e XML. Apresenta busca simples e detalhada para pesquisa.

� Alagoas em Dados e Informações40 – classifica os dados em grupos: saúde;

educação, cultura e esporte, indicadores; trabalho; infraestrutura; demografia. E

utiliza a pesquisa por palavras-chave: IBGE; DATASUS; saúde; agropecuária;

INEP; indicadores; Educação-básica; agricultura; trabalho; MTE; emprego-formal;

infraestrutura; demografia; vacinas; comércio-exterior; MDIC; habitação,

demográficos; finanças-públicas e educação-especial. Nota-se que a escolha por

palavras chaves não segue um critério que padronize a utilização, facilitando assim

a recuperação dos dados. Fornece os dados em formato XLS, CSV e XML.

� Dados abertos da Assembleia de Minas41 – apresenta algumas limitações

especificadas no próprio portal: (a) nem todos objetos são expostos como recursos

e por isso não é possível acessá-los diretamente; (b) as representações dos recursos

não são interconectadas, não é possível navegar por uma lista de objetos até chegar

a um objeto da lista diretamente. Muitas vezes, apenas as chaves são listadas; (c)

muitos objetos são acessados através de URLs de pesquisa, identificadas por

verbos como "consulta". Os dados são disponibilizados em formato txt, CML e

JSON.

38 Disponível em: <http://api.tcm.ce.gov.br/>. Acesso em: 1 maio 2013. 39 Disponível em: <http://www.dadosabertos.pe.gov.br/PortalDadosAbertos/public/pages/telaInicial. jsf.>. Acesso em: 1 maio 2013. 40 Disponível em: <http://catalogo.seplande.al.gov.br/>. Acesso em: 1 maio 2013. 41 Disponível em:< http://dadosabertos.almg.gov.br/ws/ajuda/sobre>. Acesso em: 1 maio 2013.

Page 105: modelagem e representação semântica de dados governamentais

102

� Rio Datamine42 – Página indisponível durante o período de pesquisado de 12 fev.

2013 a 17 jun. 2013.

� Rio ideias43 – Página promocional de concurso de aplicações utilizando dados do

governo da cidade do Rio de Janeiro.

� Portal de Dados Abertos da Secretaria de Segurança Pública do Estado do

Rio Grande do Sul44 – apresenta dados sobre violência contra a mulher e

indicadores abertos por município, entre os anos de 2002 a 2012. Os dados podem

ser acessados em formato CSV e XML. Porém, não é possível realizar pesquisas e

nem possui uma classificação temática dos dados.

Miranda (2011, p. 67) sinaliza para o pioneirismo da Dataprev na publicação de dados

governamentais abertos. De acordo com este autor, a Dataprev trabalhou em um projeto piloto

para a publicação de dados abertos da Previdência, estimando a publicação de no mínimo um

Dataset até o final de 2010.

A Dataprev disponibilizou dados sobre acidentes do trabalho publicados no Anuário

Estatístico de Acidentes do Trabalho, publicado entre os anos de 2002 a 2009. E a partir

desses dados foi criado pela Dataprev um aplicativo que uniu os dados publicados e o Google

Maps, identificando os números ou o tipo acidente por cidade mostrada no mapa.

FIGURA 23 - Aplicativo utilizando dados do Data.gov.br

Fonte: Dataprev45.

Nota-se que há uma falta de padronização dos formatos de publicação nas iniciativas

estrangeiras e brasileiras. Percebe-se que em alguns casos nem utilizam os formatos indicados

pela W3C para serem classificados como dados governamentais abertos. Precisa-se incentivar

42 Disponível em: <http://riodatamine.com.br/>. Acesso em: 1 maio 2013. 43 Disponível em: <http://ideias.rioapps.com.br/landing>. Acesso em: 1 maio 2013. 44 Disponível em: <http://www.ssp.rs.gov.br/?model=conteudo&menu=196&pg=1>. Acesso em: 1 maio 2013. 45 Disponível em: <http://api.dataprev.gov.br/doc/visualizacao-mapa.html>. Acesso em: 1 maio 2013.

Page 106: modelagem e representação semântica de dados governamentais

103

a utilização de padrões de formatos e critérios para publicação dos dados, levando-se em

consideração os princípios de dados governamentais abertos.

Page 107: modelagem e representação semântica de dados governamentais

104

5 INSTRUMENTOS DE REPRESENTAÇÃO DA INFORMAÇÃO SOBRE

ACIDENTES DO TRABALHO

Como visto anteriormente no referencial teórico, precisa-se incorporar a prática de

reutilização sistemática dos dados governamentais, de forma a facilitar a comunicação e a

recuperação de informação pela sociedade. No caso aqui apresentado, buscou-se vocabulários

ou representações da informação que descrevessem a temática sobre acidente do trabalho no

domínio da Previdência Social brasileira, com o propósito de reutilizar suas estruturas e

conceitos para publicação dos dados do Ministério da Previdência Social, salvaguardados e

geridos pela Dataprev.

Assim, foram localizados os seguintes instrumentos:

� Vocabulário Controlado do Governo Eletrônico (VCGE): elaborado pelo

Governo Brasileiro para ser o formato Padrão de Metadados do Governo

Eletrônico (e-PMG). Foi escolhido para análise por ser o vocabulário indicado

pelo plano de ação para Infraestrutura Nacional de Dados Abertos (INDA) para

descrição semântica dos dados do Governo publicados no portal dados.gov.br,

sobre dados governamentais abertos.

� Modelo de publicações de dados sobre acidentes do trabalho: publicado pela

Dataprev, que foi escolhido por ser o modelo preliminar que norteou a publicação

de dados abertos sobre acidentes do trabalho realizada pela Dataprev e também o

modelo que despertou o interesse pela pesquisa aqui submetida;

� Tesauro e a taxonomia da Organização Internacional do Trabalho (OIT) :

elaborados pela agência das Nações Unidas, que tem por missão promover

oportunidades para que homens e mulheres possam ter acesso a um trabalho

decente e produtivo, em condições de liberdade, equidade, segurança e dignidade.

Foram selecionados para análise por serem instrumentos de representação do

conhecimento do principal órgão internacional sobre o domínio do trabalho.

5.1 ACIDENTE DO TRABALHO NO VCGE

O VCGE é uma evolução da Lista de Assuntos do Governo (LAG) em março de 2004.

É um esquema para ser utilizado no elemento assunto.categoria (subject.category) do Padrão

de Metadados do Governo Eletrônico (e-PMG). Para os gerentes de sítios e portais

Page 108: modelagem e representação semântica de dados governamentais

105

governamentais, os termos retirados do VCGE tornarão mais direta a apresentação dos

serviços disponibilizados em uma estrutura de diretório baseada em seus indexadores.

(VOCABULÁRIO..., 2011).

O vocabulário estudado apresenta as relações genéricas e específicas entre os termos,

caracterizando uma taxonomia. De acordo com Moreiro González (2011, p. 51) a taxonomia

“serve para ordenar informação em uma hierarquia [...] em forma de árvore que estabelece

relação entre os objetos de generalização-especialização”. Apesar do Vocabulário (2011)

afirmar que no seu processo de construção utilizaram os princípios de um tesauro, o VCGE se

aproxima mais de uma taxonomia do que de um tesauro, pois este último abrange uma

quantidade maior de relações (GOMES, 1990), como, por exemplo, a partitiva e associativa,

não utilizada no VCGE.

De acordo com o Vocabulário... (2011) o público-alvo do VCGE é o cidadão. O

esquema tem por objetivo ser intuitivo para os cidadãos que buscam, nas páginas

governamentais on-line, assuntos do seu interesse. Por essa razão, descrevem a metodologia

do VCGE da seguinte forma:

� prefere a linguagem do leigo ao jargão do serviço público ou termos

técnicos; � não supõe que o cidadão tenha conhecimento prévio das

responsabilidades de cada nível ou órgão governamental. Procura ser independente da estrutura governamental, devendo sobreviver às mudanças de estruturas e organogramas;

� o uso comum é mais importante do que a precisão acadêmica, quando se está escolhendo nomes ou posições relativas aos cabeçalhos. (VOCABULÁRIO..., 2011)

Conforme observado no primeiro item listado anteriormente, pode-se inferir que o

VCGE utilizou a “linguagem do leigo”, ou seja, linguagem livre e preocupada com o uso

comum mais que com a “precisão acadêmica”. (VOCABULÁRIO..., 2011). No entanto, surgiu

aqui uma primeira inquietação: a precisão de vocabulários controlados estudada em estudos

acadêmicos não vem justamente para fornecer teorias e métodos para uma maior precisão na

descrição dos termos e, consequentemente, melhorar a recuperação da informação?

Vislumbra-se que a utilização do vocabulário pode ir além de um mapa para

navegação em páginas eletrônicas do setor público brasileiro. Seu uso pode ser estendido a

outros propósitos, como por exemplo: ser utilizado pelo Estado para representação do

domínio – mapa conceitual – de cada setor público, mostrando sua trajetória ao longo do

tempo, ou pode ser usada pelos cidadãos para descrição, recuperação e reutilização de

Page 109: modelagem e representação semântica de dados governamentais

106

informações governamentais, atendendo assim a organização necessária para a publicação dos

dados abertos.

Ao analisar a classe referente à Previdência Social esquematizada no VCGE (Figura

24), percebe-se que a representação feita da respectiva área não corresponde a sua

abrangência temática. Termos importantes para entendimento da Previdência Social não

estavam contemplados no vocabulário.

FIGURA 24 - Previdência social no VCGE46

Fonte: VOCABULÁRIO... (2011)

Um exemplo, da falta de cobertura constatada anteriormente, é que se um cidadão

necessitar buscar por uma espécie de pensão ao qual se beneficia, não encontrará representada

esta pensão a qual procura, pois o termo “Pensão” não é classificado pelo VCGE. Estão

ausentes da classe do VGCE sobre Previdência Social as pensões mantidas, atualmente, pelo

Ministério da Previdência Social (ANUÁRIO..., 2012). Pensões estas, a saber:

� Pensão especial à pessoas atingidas pela hanseníase

� Pensão especial aos dependentes de vítimas fatais por contaminação na

hemodiálise - Caruaru-PE

� Pensão especial mensal vitalícia

� Pensão especial vitalícia

� Pensão mensal vitalícia do dependente do seringueiro

46 Disponível em: <http://vocab.e.gov.br/2011/03/vcge#previdencia-social>. Acesso em: 5 mar. 2014.

Page 110: modelagem e representação semântica de dados governamentais

107

� Pensão mensal vitalícia do seringueiro

� Pensão mensal vitalícia por síndrome de talidomida

� Pensão por morte (EX-SASSE)

� Pensão por morte de ex-combatente

� Pensão por morte por acidente de trabalho

� Pensão por morte previdenciária

Outro ponto relevante é que a Previdência Social está subordinada a classe de

“Pessoas, família e sociedade”. Entretanto, outras áreas como “Saúde”, “Trabalho” e

“Educação” apesar de estarem conceitualmente ligadas aos direitos e benefícios da pessoa e

da sociedade, encontram-se em classes independentes.

De acordo com Campos e Gomes (2008, p. 5) a “categorização é um processo que

requer pensar o domínio de forma dedutiva, ou seja, determinar as classes de maior

abrangência dentro da temática escolhida”. Desta maneira, não ficaram claros os princípios

utilizados para a realização da categorização da classe de assunto da Previdência Social dentro

do domínio do Governo Eletrônico.

A estrutura organizacional do Governo Eletrônico classifica, no mesmo nível

hierárquico, a Previdência Social, Saúde, Trabalho e Educação dentro de Ministérios

(BRASIL, 2013b). Assim, poderia ser revista a categorização aplicada no VCGE, de forma a

“analisar o domínio a partir de recortes conceituais que permitem determinar a identidade dos

conceitos (categorias) que fazem parte deste domínio”. (CAMPOS; GOMES, 2008, p. 5).

Ainda sobre este ponto, foi explicitado que o foco na elaboração do vocabulário foi

facilitar seu uso pelos cidadãos (VOCABULÁRIO..., 2011), acredita-se que quando mais

evidentes os termos, mas fácil será sua localização e utilização. Dar destaque a algumas áreas

em detrimento a outras com o mesmo nível hierárquico faz o vocabulário perder a

consistência entre as relações.

Ademais, foram encontradas inconsistências conceituais, referentes ao postulado da

monorreferencialidade, no qual, a denominação de uma unidade de conhecimento – conceito

(DAHLBERG, 1978), “é um termo o qual guarda com ele uma relação unívoca, isto é, para

cada conceito existe apenas uma denominação e cada denominação vale apenas para um

conceito”. (GOMES, 1990, p. 19).

Nesta direção, foi possível observar os termos “Previdência do regime estatutário” e

“Previdência do servidor” como termos diferentes, porém possuindo uma relação de

equivalência. Previdência do regime estatutário possui como finalidade “garantir os direitos e

Page 111: modelagem e representação semântica de dados governamentais

108

benefícios previdenciários dos servidores” (MARANHÃO, 2012, p. 4) e Previdência do

servidor é a previdência “obrigatória aos servidores públicos federais, estaduais, municipais e

do Distrito Federal” (BRASIL, 2013a, p. 1). Observou-se ainda que o termo “Previdência do

regime estatutário” não é facilmente encontrado em seu domínio da Previdência Social, sendo

mais recorrente o termo “Previdência do servidor”.

A relação de equivalência não está expressa pelo vocabulário analisado, apesar de

estar descrito na metodologia de elaboração do VCGE. Logo, conforme observado, no

parágrafo anterior, há dois termos diferentes para representar um único conceito e perde-se

assim o controle linguístico dos termos que é um dos princípios básicos de qualquer

vocabulário controlado. Embora na linguagem natural não existam sinônimos perfeitos, deve-

se buscar na linguagem especializada o controle de sinônimos ou quase-sinônimos. (GOMES,

1990, p. 47)

Conforme mencionado por Moreiro González (2011, p. 53) uma das características das

taxonomias é não incluírem definições para os termos, somente as relações hierárquicas. O

VCGE não possui definições para os termos, embora na aba de sugestões seja solicitada a

colaboração dos usuários do vocabulário para ajudarem a comporem as notas de escopo (NE)

com definições dos termos. Além disso, as definições constam na metodologia como uma das

etapas de elaboração do vocabulário em questão. Nota-se, então, o desejo de tornar o VCGE

ainda mais específico e com relações mais bem definidas. Como afirma Gomes (1990, p. 25)

a definição “fornece as características do conceito que vão permitir seu agrupamento e indicar

as relações. É ela que vai dar segurança ao organizador do tesauro para estabelecer as

relações”.

Cabe destacar que o termo “Acidente de trabalho” não é encontrado no VCGE. Os

dados atualmente publicados no portal dados.gov.br pela Dataprev, está indexada com o

termo “Segurança do trabalho”. Este termo dentro do VCGE é subordinado ao termo

“Legislações trabalhistas”, que por sua vez é termo específico do termo “Trabalho”.

Entretanto, os dados ali publicados tratam sobre assuntos ligados a temáticas diferentes das de

legislações, sem mencionar que Previdência Social não foi relacionada aos dados (vide figura

25).

Page 112: modelagem e representação semântica de dados governamentais

109

FIGURA 25 - Descrição temática dos dados de acidente do trabalho publicados no Portal dados.gov.br.

Fonte: Portal dados.gov.br47

Ao se deparar com o VCGE, percebeu-se pontos que o tornaram um vocabulário

inconsistente, principalmente para o uso ao qual se pretendia utilizá-lo, ou seja, na ligação

semântica entre os dados publicados pela Dataprev.

O Plano de ação para Infraestrutura Nacional de Dados Abertos (INDA) prevê a

prospecção de ontologias e vocabulários existentes a serem reutilizados para publicação de

dados governamentais abertos. O portal dados.gov.br funciona como um catálogo coletivo,

recolhendo dados dos mais diversos órgãos públicos. Desta forma, os “dados do catálogo

serão classificados e agrupados conforme os temas (assuntos) constantes no Vocabulário

Controlado de Governo Eletrônico (VCGE)” (BRASIL, 2012).

Em 2012 começou um esforço do Governo para reavaliar o VCGE e aumentar sua

utilização por parte dos Órgãos Públicos. Em dezembro de 2013, foi disponibilizado, apenas

em formato .pdf, uma nova versão (2.0.2) do VGCE. Em outubro de 2013, o Governo abriu a

nova versão à consulta pública e as considerações acima elencadas foram enviadas para

análise.

A versão 2.0.2 do VCGE pretende ser um vocabulário especializado, “sendo os

vocabulários especializados maiores que o VCGE, esperamos que cada termo dos

vocabulários especializados de alto nível encontre um termo no VCGE, mesmo que

agrupado”. (BRASIL, 2013d, p. 8).

Desta forma, a classe da Previdência Social foi reduzida para:

47 Disponível em: <http://dados.gov.br/dataset/anuario-estatistico-de-acidentes-de-trabalho>. Acesso em: 2 jun. 2013.

Page 113: modelagem e representação semântica de dados governamentais

110

Previdência Social

◦ Previdência Básica

◦ Previdência Complementar

◦ Outros em Previdência. (BRASIL, 2013d, p. 15).

A classe sobre Previdência Social foi arranjada no mesmo nível hierárquico que as

outras classes, como: Trabalho, Educação e Meio Ambiente. Entretanto, ele se tornou ainda

mais geral. Criando uma dependência de vocabulários especializados para que os dados

produzidos pelo Governo consigam uma eficaz indexação nas bases de dados. Em outras

palavras, o VCGE parece ter se tornado um vocabulário para interligar pequenos vocabulários

elaborados pelos Órgãos Governamentais.

Diante do observado, apesar de existir expectativa e determinação do INDA para se

utilizar o VCGE para organização semântica dos dados publicados, percebe-se que o

cumprimento desta tarefa será árdua, sem o auxílio de outros vocabulários específicos.

5.2 ACIDENTE DO TRABALHO NO MODELO DE PUBLICAÇÕES DE DADOS

PUBLICADOS PELA DATAPREV

A Dataprev, decidida a cooperar com o movimento de publicação de dados

governamentais abertos no Brasil, definiu que sua primeira iniciativa seria sobre a publicação

dos dados apresentados no Anuário Estatístico de Acidente do Trabalho. Batista et al. (2011)

e Ribeiro e Almeida (2011) explicam que apesar destes dados já serem disponibilizados na

Base de dados históricos da Previdência Social48, com tecnologia que permite a extração de

consultas pela Internet, este padrão de publicação foge aos princípios de dados

governamentais abertos, principalmente, no que se refere à reutilização dos dados.

De acordo com Anuário Estatístico de Acidente do Trabalho (2010), ele contém dados

referentes aos acidentes do trabalho, registrados ou caracterizados administrativamente como

tal pelo INSS no processo de concessão de benefício. Constituindo-se, dessa forma, em um

importante conjunto de dados para tomadas de decisões e para diagnóstico sobre determinadas

condições de trabalho impostas aos empregados.

Ademais, a Dataprev lida, em sua maioria, com dados particulares, ou seja, dados

privados, que identificariam os indivíduos, violando assim o princípio de confidencialidade

48 Disponível em: <http://www3.dataprev.gov.br/infologo/>. Acesso em: 2 jun. 2013.

Page 114: modelagem e representação semântica de dados governamentais

111

dos dados. Por se tratar de um passo inicial da Dataprev na publicação de dados

governamentais abertos, os dados sobre acidentes do trabalho serviriam para consolidar o

processo de publicação, além de servirem para o reuso dos cidadãos, algo não possível até

então.

Nesta primeira fase, foram selecionados dados disponibilizadas na Seção I, subseção

D do Anuário (2010), conteúdo que trata de Comunicação de Acidente de Trabalho (CAT),

suas consequências, por localização geográfica das ocorrências (município) e seus respectivos

quantitativos. Estas informações são originadas nos registros dos benefícios de natureza

acidentária concedidos pelo Instituto Nacional de Segurança Social – INSS. (DATAPREV,

2013). A figura 26 mostra o modelo proposto pela Dataprev para representação da publicação

dos dados.

FIGURA 26 - Modelo de domínio sobre acidentes do trabalho, publicado pela Dataprev.

Fonte: Dataprev (2013)

Percebe-se, que se trata de um protótipo, pois não contempla todo o universo de dados

a ser coberto pela publicação dos dados. Sendo útil para um uso imediato de representação de

uma ação realizada, mas não podendo ser utilizada para planejamento e organização

semântica dos dados a serem ainda publicados. Entretanto, esse modelo possui grande

importância para esta pesquisa, pois foi por meio dele que se conseguiu enxergar a

necessidade de se propor um modelo que contemplasse outras relações.

O Anuário Estatístico de Acidentes do Trabalho (2010) possui uma relação direta com

o Anuário Estatístico da Previdência Social (2011), principalmente no que tange a concessão

de benefícios em função de acidentes do trabalho. Portanto, falta ao modelo representar esses

benefícios, bem como os códigos de classificação utilizados para identificar ou agregar outras

informações aos acidentes, como: Classificação Brasileira de Ocupações (CBO),

Page 115: modelagem e representação semântica de dados governamentais

112

Classificação Nacional de Atividades Econômicas (CNAE) e Classificação Internacional de

Doenças (CID).

Por fim, o modelo proposto pela Dataprev precisa ser aprimorado, para que as futuras

publicações consigam abranger uma maior gama de dados organizados com o máximo de

semântica possível.

5.3 ACIDENTES DO TRABALHO NO TESAURO E NA TAXONOMIA DA OIT

A OIT surgiu 1919, como parte do Tratado de Versalhes, que pôs fim à Primeira

Guerra Mundial. Sua importância para o estudo sobre acidentes do trabalho se refere ao fato

da OIT ser a responsável pela formulação e aplicação das normas internacionais do trabalho

(convenções e recomendações). O Brasil está entre os membros fundadores da OIT e participa

da Conferência Internacional do Trabalho desde sua primeira reunião. Entretanto, somente na

década de 1950 que a OIT passou a ter uma representação no Brasil, promovendo as Normas

Internacionais do Trabalho, do emprego, da melhoria das condições do trabalho e da

ampliação da proteção social. (ORGANIZAÇÃO INTERNACIONAL DO TRABALHO,

2013).

O tesauro da OIT está na 6ª edição, datada de 2008, e reúne mais de 4.000 termos

relacionados com a área do trabalho. Cada termo possui seu equivalente nas línguas inglesa,

francesa e espanhol.

Os termos do tesauro são estruturados em 19 categorias principais, a saber: (1)

Relações internacionais; (2) Política social, proteção social e segurança social; (3)

Desenvolvimento econômico; (4) Direito, direitos humanos, governo e política; (5) Ciências

sociais, cultura, humanidades e arte; (6) Educação e formação; (7) Desenvolvimento rural,

agricultura, silvicultura e pesca; (8) Atividades econômicas; (9) Comércio; (10) Transportes;

(11) Finanças; (12) Administração; (13) Trabalho e emprego; (14) População, relações raciais

e de migração; (15) Saúde e seguridade; (16) Ciências ambientais; (17) Ciências da Terra;

(18) Pesquisa e Ciência; e (19) Informação e Ciência da Informação. (ORGANIZACIÓN

INTERNACIONAL DEL TRABAJO, 2011).

Page 116: modelagem e representação semântica de dados governamentais

113

FIGURA 27 - Termos “Previdência Social” e “Acidente do trabalho” no tesauro da OIT.

Fonte: Organización Internacional del Trabajo (2011)

Percebe-se na figura 27, que o termo “acidente do trabalho” é subordinado ao termo

“Acidente”, que é termo específico de “Segurança”. Já o termo “Previdência social” é

subordinado ao termo “Proteção social”. Na versão 2.0.2 do VCGE (BRASIL, 2003),

“Previdência social” e “Proteção social” não são subordinados, sendo organizados no mesmo

renque, ou seja, no mesmo nível hierárquico.

Observa-se ainda que, ambos os termos possuem o termo “benefício por acidente do

trabalho”49 em suas relações. Sendo termo relacionado à “Acidente do trabalho” e termo

específico do termo “Previdência Social”. Logo, a interligação entre previdência social e

acidentes do trabalho é dada pelo benefício, do mesmo modo que o modelo aqui proposto

sobre acidente do trabalho pretende trabalhar.

Por sua vez, a taxonomia da OIT foi projetada pela Biblioteca da OIT como uma

ferramenta para recuperação de informação no site da OIT. Assim, sua estrutura espelha o

programa de trabalho da OIT e é usado por departamentos e escritórios de campo para

descrever o conteúdo de suas páginas Web e fazer pesquisas no site da OIT. Os 400 termos

cobertos pela taxonomia são agrupados em 25 grupos temáticos: (a) Trabalho; (b) Condições

de trabalho; (c) Relações trabalhistas; (d) Direito do trabalho; (e) Proteção social; (f)

Educação; (g) Desenvolvimento econômico e social; (h) Economia; (i) Finanças; (j) Setores

econômicos; (k) Comércio internacional; (l) Direitos humanos; (m) Cooperação internacional;

49 Tradução livre de: “prestaciones por accidentes de trabajo”.

Page 117: modelagem e representação semântica de dados governamentais

114

(n) Governo e administração pública; (o) Sociedade; (p) População; (q) Saúde; (r) Meio

ambiente; (s) Tecnologia; (t) administração; (u) Estatísticas; (w) Recursos de informação; (x)

Países e zonas; e (z) OIT. (ORGANIZACIÓN INTERNACIONAL DEL TRABAJO, 2013).

A diferença entre a Taxonomia e o tesauro desenvolvidos pela OIT é a sua finalidade.

Enquanto a taxonomia busca facilitar a recuperação da informação a partir da página

eletrônica da OIT, o tesauro cobre uma gama maior de temas, não se limitando ao trabalho da

OIT.

FIGURA 28 - Termos “Previdência Social” e “Acidente do trabalho” no taxonomia da OIT.

Fonte: Organización Internacional del Trabajo (2013)

Nota-se na figura 28, que na taxonomia o termo “Previdência Social” continua

subordinado ao termo “Proteção social”, assim como no tesauro. Entretanto, o termo

“Acidente de trabalho” é subordinado ao termo “Saúde e segurança no trabalho”, que é termo

específico de “Assistência Médica”, diferentemente da representação no tesauro, quando

“Acidente do trabalho” estava subordinado a “Acidente”. Por ser uma taxonomia, que

trabalha com hierarquias, os termos não encontram um termo em comum que faça relação

entre Previdência Social e Acidente do trabalho.

Page 118: modelagem e representação semântica de dados governamentais

115

Analisar os instrumentos de representação do conhecimento elaborados pela OIT

contribuiu para notar que a relação entre Previdência Social e Acidente do Trabalho se dá

através dos benefícios concedidos. Relações não encontradas no modelo preliminar proposto

pela Dataprev e nem no VCGE. Entretanto, vislumbrado pelo modelo proposto nessa

pesquisa.

No decorrer desta seção, verificou-se que os modelos existentes não representam a

estrutura e as informações contidas nos dados sobre acidentes do trabalho, de forma a lhe

proporcionar uma semântica para recuperação e reutilização dos dados publicados.

Page 119: modelagem e representação semântica de dados governamentais

116

6 EM BUSCA DE UM MODELO A PARTIR DAS DEFINIÇÕES SOBR E ACIDENTE

DO TRABALHO

Nesta seção, foi proposto um modelo conceitual sobre acidentes do trabalho, por meio

de definições sobre acidentes do trabalho, identificar conceitos, aí existentes, e suas relações.

A Teoria do Conceito elaborada por Dahlberg e seus trabalhos sobre definições já utilizavam

as definições como fonte de estudo na área de representação do conhecimento.

Para cumprir tal tarefa, buscou-se observar nas ontologias de fundamentação DOLCE

e UFO como os eventos eram tratados. No caso da DOLCE, privilegiou-se a DUL, que é uma

ontologia baseada na DOLCE, adaptada para descrição de eventos. O objetivo com isto é

identificar elementos comuns sobre a descrição de eventos em ontologias de alto nível. Os

elementos encontrados serviram para auxiliar na categorização dos conceitos.

Acredita-se também que, o modelo E-R, de Chen, pode auxiliar na elaboração de um

modelo que consiga representar o domínio sobre acidente do trabalho, podendo ser utilizado

para representar os dados da Previdência Social.

6.1 ANÁLISE DAS DEFINIÇÕES ACERCA DE ACIDENTES DO TRABALHO

Pretendeu-se aqui utilizar teorias e critérios já apresentados neste trabalho, para

observar definições acerca de acidentes do trabalho. Desta maneira, almejou-se determinar a

que categorias e quais relações existem entre as categorias contidas nas definições, buscando

localizar elementos capazes de representar o domínio estudado.

Acredita-se que utilizando os termos e as relações identificados nas definições, pode-

se elaborar um modelo que represente graficamente o domínio em questão.

Nas definições analisadas a seguir foi utilizada a Teoria do Conceito de DAHLBERG

(1978) para classificação das definições e identificação dos termos, sendo estes palavra ou

expressão que tenha sempre um único referente na realidade; os termos identificados desta

maneira nas definições estão marcados com “<” e “>”. Também classificou-se os termos

identificados de acordo com as categorias das ontologias Unified Foundational Ontology for

perdurants (UFO-B) e da DOLCE+DnS Ultralite (DUL). E a partir disso, classificou-se os

termos de acordo com o modelo de Entidade-Relacionamento, desenvolvido por Chen (1976),

a fim de elaborar um diagrama Entidade-Relacionamento para o domínio estudado.

A seguir, são apresentados quadros com as definições selecionadas e análises

realizadas das definições de acidentes do trabalho.

Page 120: modelagem e representação semântica de dados governamentais

117

QUADRO 1 - Análise da definição 1 sobre acidente do trabalho.

Definição 1 <Acidente do trabalho>: Os <acidentes> <ocorridos> <no curso do trabalho> ou <com relação ao trabalho> que <causem> <lesões> <mortais ou não mortais>. (OIT, 2011)

Classificação da definição (Dahlberg)

Definição genérica

Conceitos retirados da definição

Categoria da UFO-B

Categoria da DUL

Categoria E-R

Observação

Acidente do trabalho

Evento Evento E

acidentes Evento Evento E Categoria superior a acidente do trabalho

no curso do trabalho

Situação Situação E Relaciona o participante ao evento

com relação ao trabalho

Situação Situação E Relaciona o participante ao evento

lesões Evento Evento E Relação entre eventos. “Lesões” possui subcategorias: “Lesões mortais” e “lesões não-mortais”

ocorre R Relação associativa causem R Relação causal Fonte: O Autor.

FIGURA 29 - Proposta de diagrama ER da definição 1 sobre acidente do trabalho50.

Fonte: O autor.

A definição encontrada na OIT (2011) utiliza de forma clara o acidente do trabalho

como tipo de acidente relacionado ao trabalho. Já os seus efeitos foram reduzidas a duas

espécies, os acidentes que causem lesões mortais ou não mortais.

50 Neste momento, por se tratar de um diagrama ER para identificação das entidades, relações e atributos presentes nas definições sobre acidentes do trabalho, não houve preocupação com a cardinalidade presente no diagrama.

Page 121: modelagem e representação semântica de dados governamentais

118

QUADRO 2 - Análise da definição 2 sobre acidente do trabalho. Definição 2 <Acidente do trabalho> é o que <ocorre> <pelo exercício do trabalho> <a

serviço da empresa>, ou <pelo exercício do trabalho> do <segurado especial>, <provocando> <lesão corporal> (evento) ou <perturbação funcional> (evento), de caráter <temporário> (atributo) ou <permanente> (atributo). (BRASIL, 1991)

Classificação da definição (Dahlberg)

Definição genérica

Conceitos retirados da definição

Categoria da UFO-B

Categoria da DUL

Categoria E-R

Observação

Acidente do trabalho

Evento Evento E

pelo exercício do trabalho

Situação Situação E Relaciona o participante ao evento

a serviço da empresa

Situação Situação E Relaciona o participante ao evento

segurado especial

Objeto Objeto / Agente

E O objeto é quem sofre o acidente do trabalho

lesão corporal Evento Evento E Relação entre eventos perturbação funcional

Evento Evento E Relação entre eventos. “Perturbação funcional” possui subcategorias: “Perturbação funcional permanente” e “Perturbação funcional temporário”

ocorre R Relação associativa provocando R Relação causal Fonte: O Autor.

FIGURA 30 - Proposta de diagrama ER da definição 2 sobre acidente do trabalho.

Fonte: O Autor.

Acidente do trabalho definido no art. 19 da Lei n. 8.213/91 (BRASIL, 1991) apresenta

uma definição genérica do que é considerado acidente do trabalho para fins de assistência e

previdência social brasileira. Ao se aplicar os critérios escolhidos para a análise da definição,

pôde-se perceber que aparece o trabalhador (segurado especial), o contexto para que seja

caracterizado como acidente do trabalho (exercício do trabalho a serviço da empresa, ou pelo

exercício do trabalho), além de seus efeitos (lesão corporal ou perturbação funcional).

Page 122: modelagem e representação semântica de dados governamentais

119

A relação entre os eventos foi marcada, principalmente, pela relação de causa. Que

reflete os efeitos provocados pelo acidente do trabalho.

Em comparação com a definição 1, percebe-se uma correlação de similaridade entre as

entidades “pelo exercício do trabalho” e “no curso do trabalho”, além de “a serviço da

empresa” e “com relação ao trabalho”. A definição 2 amplia os efeitos do acidente do

trabalho, apresentando a questão da perturbação funcional, não mencionado na definição 1.

Desenvolvendo melhor isto, acredita-se que as entidades apresentadas na definição 1 “lesões

mortais” e “lesões não-mortais”, correspondam, respectivamente, na definição 2, à “morte” e

“perturbações funcionais”.

QUADRO 3 - Análise da definição 3 sobre acidente do trabalho. Definição 3 <Acidente do trabalho> é o que <ocorre> <pelo exercício do trabalho> <a

serviço da empresa> ou <pelo exercício do trabalho> dos <segurados especiais>, <provocando> <lesão corporal> ou <perturbação funcional>, <permanente> ou <temporária>, que <cause> a <morte>, a <perda ou a redução da capacidade para o trabalho>. (Anuário Estatístico da Previdência Social, 2012, p. 507)

Classificação da definição (Dahlberg)

Definição genérica

Conceitos retirados da definição

Categoria da UFO-B

Categoria da DUL

Categoria E-R

Observação

Acidente do trabalho

Evento Evento E

pelo exercício do trabalho a serviço da empresa

Situação Situação E Relaciona o participante ao evento

a serviço da empresa

Situação Situação E Relaciona o participante ao evento

segurado especial

Objeto Objeto / Agente

E O objeto é quem sofre o acidente do trabalho

lesão corporal

Evento Evento E Relação entre eventos

perturbação funcional

Evento Evento E Relação entre eventos. “Perturbação funcional” possui subcategorias: “Perturbação funcional permanente” e “Perturbação funcional temporário”

morte Evento Evento E Relação causal entre eventos, “lesão corporal” e “morte”

redução da capacidade para o

Evento Evento E Relação causal entre eventos, “Perturbação funcional” e “redução da capacidade para o trabalho”

Page 123: modelagem e representação semântica de dados governamentais

120

trabalho perda da capacidade para o trabalho

Evento Evento E Relação causal entre eventos, “Perturbação funcional” e “perda da capacidade para o trabalho”

ocorre R Relação associativa provocando R Relação causal cause R Relação causal

Fonte: O Autor.

FIGURA 31 - Proposta de diagrama ER da definição 3 sobre acidente do trabalho.

Fonte: O Autor.

A definição encontrada no Anuário Estatístico da Previdência Social (2012, p. 507)

não difere muito da encontrada na Lei n. 8.213/91 (BRASIL, 1991). A principal diferença é o

acréscimo dos efeitos do acidente do trabalho (a perda ou a redução da capacidade para o

trabalho).

Na figura 31, foi representado como os termos foram apresentados na terceira

definição analisada. No entanto, adiante será verificada a relação entre as entidades

“Perturbação funcional permanente” e “Perda da capacidade para o trabalho” e também

“Perturbação funcional temporária” e “Redução da capacidade para o trabalho”.

QUADRO 4 - Análise da definição 4 sobre acidente do trabalho. Definição 4 <Acidente do trabalho>: Seu conceito legal é encontrado no <art. 19 da Lei

n. 8.213/91>. É o que <ocorre> <pelo exercício do trabalho> <a serviço da empresa> ou <pelo exercício do trabalho> aos <segurados empregados>, <trabalhadores avulsos> e <segurados especiais>. <É o> <acidente> que <acarreta> <lesão corporal> ou <perturbação funcional> capaz de <gerar> <morte>, a <perda ou a redução>, <permanente ou temporária>, da <capacidade laborativa>. O <acidente do trabalho> <é classificado> em <acidente típico>, <de trajeto> ou <atípico>, <doença profissional (ergopatia)> ou <doença do trabalho (mesopatia)>. Os elementos para a existência do acidente do trabalho são: nexo causal (comprovado ou presumido) e lesividade (ou dano/atingimento à capacidade laborativa)”. (HORVATH JÚNIOR, 2009, p. 6)

Classificação Definição genérica

Page 124: modelagem e representação semântica de dados governamentais

121

da definição (Dahlberg) Conceitos retirados da definição

Categoria da UFO-B

Categoria da DUL

Categoria E-R

Observação

Acidente do trabalho

Evento Evento E

art. 19 da Lei n. 8.213/91

Objeto Objeto / Objeto social

E Documento regulamenta o acidente do trabalho

pelo exercício do trabalho

Situação Situação E Relaciona o participante ao evento

a serviço da empresa

Situação Situação E Relaciona o participante ao evento

segurados empregados

Objeto Objeto / Agente

E O objeto é quem sofre o acidente do trabalho

trabalhadores avulsos

Objeto Objeto / Agente

E O objeto é quem sofre o acidente do trabalho

segurados especiais

Objeto Objeto / Agente

E O objeto é quem sofre o acidente do trabalho

acidente Evento Evento E Categoria superior a acidente do trabalho

lesão corporal

Evento Evento E Relação entre eventos

perturbação funcional

Evento Evento E Relação entre eventos. “Perturbação funcional” possui subcategorias: “Perturbação funcional permanente” e “Perturbação funcional temporário”

capacidade laborativa

A Atributo do trabalhador

acidente típico

Evento Evento E Tipos de acidentes do trabalho

acidente atípico

Evento Evento E Tipos de acidentes do trabalho

Acidente de trajeto

Evento Evento E Tipos de acidentes do trabalho

doença profissional

Evento Evento E Sinônimo: ergopatia

doença do trabalho

Evento Evento E Sinônimo: mesopatia

ocorre R Relação associativa provocando R Relação causal É o R Relação gênero/espécie Acarreta R Relação causal Gerar R Relação causal É classificado R Relação gênero/espécie

Fonte: O autor.

Page 125: modelagem e representação semântica de dados governamentais

122

FIGURA 32 - Proposta de diagrama ER da definição 4 sobre acidente do trabalho.

Fonte: O Autor.

A única obra de referência especializada em Previdência Social, que foi localizada, foi

a que apresentou a definição mais complexa sobre acidente do trabalho, pois apresenta o

documento que o regulamenta, seu paciente, ou seja, o trabalhador, especificando-os em:

segurados empregados, trabalhadores avulsos e segurados especiais.

Essa definição mostrou ainda o contexto para que se caracterize como acidente do

trabalho, seus efeitos, além de sua classificação em: acidente do trabalho típico, acidente do

trabalho atípico e acidente do trabalho de trajeto.

Ademais, foi definição que se localizou um atributo de forma clara. O atributo dos

trabalhadores, “capacidade laborativa”, foi apresentado na definição como característica do

trabalhador atingida pela perturbação funcional. Outro atributo aparece na entidade

“Legislação”, especificada pelo atributo “Art. 19 da Lei n. 8.213/91”.

Na parte final da definição aparecem os termos “nexo causal” e “lesividade”. Estes

não foram incluídos no quadro de análise, por serem considerados repetitivos. “Nexo causal”

corresponde à relação de causa do acidente do trabalho e “lesividade” às lesões.

A classificação da tipologia de Dahlberg auxiliou na identificação das definições. Ao

se trabalhar com definições gerais, acredita-se que as ontologias de fundamentação tenham

sido uma escolha apropriada. Apesar do acidente do trabalho ser um evento, não se trabalhou

com eventos específicos e sim com uma visão geral.

Diante do apresentado até aqui e utilizando a proposta de Campos (2010), na qual a

autora sugere um padrão para enunciados definitórios que atendam as especificidades de cada

domínio, propõe-se, para fins de estudo nesta pesquisa, uma definição para acidente do

trabalho:

Page 126: modelagem e representação semântica de dados governamentais

123

Com base nesta definição, pôde-se elaborar um modelo unificado com as

características encontradas nas outras definições estudadas sobre acidente do trabalho.

QUADRO 5 - Análise da definição 5 sobre acidente do trabalho.

Definição 5 <Acidente do trabalho>: <acidente> <sofrido> pelos <segurados empregados>, <trabalhadores avulsos> e <segurados especiais> <no exercício do trabalho> <a serviço da empresa>, que <cause> <lesão corporal> ou <perturbação funcional>, capaz de <gerar> <morte>, <perda> ou a <redução>, <permanente> ou <temporária>, da <capacidade laborativa>, <regulamentado> por <art. 19 da Lei n. 8.213/91>. <Classificados> em <acidente típico>, <acidente de trajeto> e <acidente atípico>, que <cause> <doença profissional> ou <doença do trabalho>. (O Autor)

Classificação da definição (Dahlberg)

Definição genérica

Conceitos retirados da definição

Categoria da UFO-B

Categoria da DUL

Categoria E-R

Observação

Acidente do trabalho

Evento Evento E

acidente Evento Evento E Categoria superior a acidente do trabalho

segurados empregados

Objeto Objeto / Agente

E O objeto é quem sofre o acidente do trabalho

trabalhadores avulsos

Objeto Objeto / Agente

E O objeto é quem sofre o acidente do trabalho

segurados especiais

Objeto Objeto / Agente

E O objeto é quem sofre o acidente do trabalho

pelo exercício do trabalho

Situação Situação E Relaciona o participante ao evento

a serviço da empresa

Situação Situação E Relaciona o participante ao evento

lesão corporal Evento Evento E Relação entre eventos perturbação funcional

Evento Evento E Relação entre eventos

morte Evento Evento E Relação causal entre eventos: “lesão

Acidente do trabalho: acidente sofrido pelos segurados empregados, trabalhadores

avulsos e segurados especiais no exercício do trabalho a serviço da empresa, que

cause lesão corporal ou perturbação funcional, capaz de gerar morte, a perda ou a

redução, permanente ou temporária, da capacidade laborativa, regulamentado por art.

19 da Lei n. 8.213/91. Classificados em acidente típico, acidente de trajeto e acidente

atípico, que cause doença profissional ou doença do trabalho.

Page 127: modelagem e representação semântica de dados governamentais

124

corporal” e “morte” redução da capacidade para o trabalho

Evento Evento E Relação causal entre eventos: “Perturbação funcional” e “redução da capacidade para o trabalho”

perda da capacidade para o trabalho

Evento Evento E Relação causal entre eventos: “Perturbação funcional” e “perda da capacidade para o trabalho”. Que possui subcategorias: “Incapacidade permanente da capacidade para o trabalho” ou “Incapacidade temporária da capacidade para o trabalho”

art. 19 da Lei n. 8.213/91

Objeto Objeto / Objeto social

E Documento regulamenta o acidente do trabalho

capacidade laborativa

A Atributo do trabalhador

acidente típico Evento Evento E Tipos de acidentes do trabalho acidente atípico

Evento Evento E Tipos de acidentes do trabalho

acidente de trajeto

Evento Evento E Tipos de acidentes do trabalho

doença profissional

Evento Evento E Sinônimo: ergopatia

doença do trabalho

Evento Evento E Sinônimo: mesopatia

sofrido R Relação associativa Cause R Relação causal gerar R Relação causal regulamentado R Relação associativa classificados R Relação gênero/espécie

Fonte: O autor.

FIGURA 33 - Proposta de diagrama ER da definição 5 sobre acidente do trabalho.

Fonte: O Autor.

Page 128: modelagem e representação semântica de dados governamentais

125

Percebem-se algumas mudanças em relação aos outros modelos apresentados

anteriormente nesta seção. Realizou-se um ajuste terminológico nos termos “Redução da

capacidade para o trabalho”, “Perda da capacidade para o trabalho”, “Incapacidade temporária

da capacidade para o trabalho” e “Incapacidade permanente da capacidade para o trabalho”.

Nesses termos a expressão “para o trabalho”, foi substituída por “laborativa”. A alteração foi

para que a relação entre esta entidade e o atributo “Capacidade laborativa” dos trabalhadores

ficasse clara.

Já na definição 1 foi utilizado o termo “lesões mortais”, porém nas definições 3 e 4 foi

empregado o termo “morte”. Ambas, se referem às lesões que levaram a óbito. Seguindo a

mesma lógica do parágrafo anterior, optou-se pelo termo “morte”, por ser a mais encontrada

nas definições.

Nas figuras 30, 31 e 32, as características “temporário” e permanente”, eram atribuídas

à “Perturbação funcional”, formando as subcategorias “Perturbação funcional temporária” e

“Perturbação funcional permanente”. No entanto, esta questão de temporalidade, está ligada a

“Perda da capacidade laborativa”, efeito da “Perturbação funcional”. Em outras palavras, o

que é temporário é a “Perda da capacidade laborativa”, que leva ao empregado a interromper

suas atividades profissionais. De acordo com o Anuário Estatístico de acidente do Trabalho

(2012), a incapacidade temporária da capacidade laborativa é “a interrupção do exercício

laboral durante o período de tratamento psicofísico-social por ocasião do acidente do

trabalho” (ANUÁRIO..., 2013). E a incapacidade permanente da capacidade laborativa refere-

se aos trabalhadores “que ficaram permanentemente incapacitados para o exercício laboral”

(ANUÁRIO..., 2013). Assim sendo, “Incapacidade permanente da capacidade laborativa” e

“Incapacidade temporária da capacidade laborativa” foram atribuídas à “Perda da capacidade

laborativa”, e não à “Perturbação funcional”.

Cabe esclarecer que desde o primeiro modelo aqui apresentado, os verbos utilizados

para representar as relações foram alterados por outros com maior simplicidade ou com o

objetivo de uniformizar os tipos de relações.

QUADRO 6 - Relações utilizadas nas representações.

Relações utilizadas nas representações

Tipo de relação Relações encontradas nas definições e substituídas

Regulamentado_por; Sofre; Ocorrem_no_contexto

Relação associativa Regulamentado; Sofrido; Ocorrem

Causa; Relação causal Causem; Provocando; Cause; Acarreta; Gera.

É_um; Do_tipo Relação gênero/espécie É; Classificados Fonte: O autor.

Page 129: modelagem e representação semântica de dados governamentais

126

Mesmo com um modelo conceitual sobre acidente do trabalho proposto, sentiu-se falta

da inclusão de outros elementos, não apresentados nas definições estudadas. No âmbito na

Previdência Social, o acidente do trabalho é utilizado para provimento de benefícios aos

trabalhadores acidentados. Esta relação ficou clara, quando se observou outros modelos de

representação sobre acidentes do trabalho na seção 5 desta pesquisa. A relação entre acidente

do trabalho e Previdência ficou clara tanto no tesauro, quanto na taxonomia da OIT. Por esta

razão, buscou-se as entidades complementares para a elaboração do modelo proposto.

6.2 MODELO CONCEITUAL SOBRE ACIDENTE DO TRABALHO ASSOCIADO AOS DADOS DA PREVIDÊNCIA SOCIAL

Conforme observado, o modelo elaborado cobre a área de acidente do trabalho.

Entretanto, o acidente do trabalho e seus efeitos para o trabalhador e a documentação

produzida com o evento implicam diretamente no fazer da Previdência Social, principalmente

no que tange a questão da assistência social.

Alguns benefícios e atividades concedidos pela Previdência Social provêm justamente

da ocorrência de acidentes do trabalho. A importância do acidente do trabalho para a

Previdência Social é comprovada pelas publicações exclusivas que são produzidas por este

Ministério governamental: o Anuário Estatístico de Acidentes do Trabalho (AEAT) e um

capítulo dedicado ao acidente do trabalho no Anuário Estatístico da Previdência Social

(AEPS).

Cabe interligar o modelo proposto sobre acidente do trabalho, mostrado anteriormente,

aos dados da Previdência Social já publicados e outros que se pretende publicar.

Ao analisar os dados publicados se percebe que, o Ministério da Previdência Social ao

mesmo tempo em que se preocupa em tornar esses dados públicos, também não se esquece de

preservar aspectos legais envolvendo privacidade e confidencialidade de determinadas

informações. Por esta razão, os dados são os mais gerais possíveis para a não identificação

individual dos envolvidos nos eventos. Por exemplo, para os trabalhadores que sofreram os

acidentes são classificados por sexo e não por algum número de cadastro que o identifique.

Percebe-se que os dados publicados no portal dados.gov.br, coletados do Anuário

estatístico sobre acidente do trabalho, e também na edição impressa do Anuário estatístico da

Previdência Social, são organizados de forma a possibilitar quantificação dos acidentes do

trabalho ocorridos no Brasil, contabilizados anualmente e associados a códigos que agregam

valores a estes dados publicados, como: Classificação Internacional de Doenças (CID);

Page 130: modelagem e representação semântica de dados governamentais

127

Classificação Brasileira de Ocupações (CBO) e Classificação Nacional de atividades

Econômicas (CNAE). Também são mensurados os benefícios concedidos, separados por tipo,

como data e localização identificadas.

Desta forma, coletaram-se os termos do Anuário estatístico de acidente do trabalho

(2012) e Anuário estatístico da Previdência Social (2011), os termos que associassem os

dados publicados ao acidente do trabalho. Os tempos selecionados estão descritos no quadro

abaixo:

QUADRO 7 - Termos sobre acidente do trabalho aliados aos dados da Previdência Social. Fontes Anuário estatístico de acidente do trabalho (2013)

Anuário estatístico da Previdência Social (2011) Conceitos Categoria

da UFO-B Categoria da DUL

Categoria E-R

Observação

Acidente do trabalho com Cat

Objeto Objeto / Objeto social

E Acidente registrado (documento)

Acidente do trabalho sem CAT

Objeto Objeto / Objeto social

E Acidente não registrado

Ano Intervalo temporal

A Atributo da entidade “Acidente do trabalho”. Ano que ocorreu o acidente do trabalho

Aposentadoria por invalidez

Objeto Objeto / Objeto social

E Benefício concedido ao trabalhador em caso de comprovação de perda permanente da capacidade laborativa

Assistência médica

Objeto Objeto / Objeto social

E Benefício concedido ao trabalhador em caso de lesão corporal

Auxílio doença por acidente do trabalho

Objeto Objeto / Objeto social

E Benefício concedido ao trabalhador em caso de interrupção por mais de 15 dias das atividades do trabalho em função da perda da capacidade laborativa

Auxílio-acidente por acidente do trabalho

Objeto Objeto / Objeto social

E Benefício concedido ao trabalhador em caso de redução da capacidade do trabalho

CBO A Atributo que identifica a ocupação do trabalhador

CID A Atributo dos acidentes, que identifica a doença/lesão causada

CNAE A Atributo que identifica a atividade econômica do empregador

Incapacidade permanente parcial

Evento Evento E Sequela definitiva que implique em redução da capacidade laboral do trabalhador

Page 131: modelagem e representação semântica de dados governamentais

128

Incapacidade permanente total

Evento Evento E Incapacidade permanente e total para o exercício de qualquer atividade laborativa

Incapacidade temporária por mais de 15 dias

Evento Evento E Interrupção por mais de 15 dias das atividades do trabalho em função da perda da capacidade laborativa

Incapacidade temporária por menos de 15 dias

Evento Evento E Interrupção por até 15 dias das atividades do trabalho em função da perda da capacidade laborativa

Mês Intervalo temporal

A Atributo da entidade “Acidente do trabalho”. Mês que ocorreu o acidente do trabalho

Município Lugar A Atributo da entidade “Acidente do trabalho”. Cidade em que ocorreu o acidente do trabalho

Parte do corpo atingida

A Atributo dos acidentes, que identifica a parte do corpo do trabalhador lesionado em função do acidente

Pensão por morte

Objeto Objeto / Objeto social

E Benefício concedido ao dependente do trabalhador em caso de sua morte

Região geográfica

Lugar A Atributo da entidade “Acidente do trabalho”. Região geográfica brasileira na qual ocorreu o acidente do trabalho

Sexo A Atributo que identifica o sexo do trabalhador

UF Lugar A Atributo da entidade “Acidente do trabalho”. Estado brasileiro no qual ocorreu o acidente do trabalho

Fonte: O autor.

Na figura 34, pode ser observado o mesmo modelo realizado na subseção anterior,

acrescido de atributos e de outras entidades e relações presentes nos dados da Previdência

Social, publicados pela Dataprev, e também presentes na seção IV do Anuário estatístico da

Previdência Social, sobre acidente do trabalho.

Page 132: modelagem e representação semântica de dados governamentais

129

FIGURA 34 - Proposta de diagrama ER sobre acidente do trabalho aliados aos dados da Previdência Social

Fonte: O Autor.

Tanto no Anuário estatístico de acidente do trabalho, quanto no Anuário estatístico da

Previdência Social, os dados, em sua maioria, são classificados principalmente por duas

características, tempo e local. O tempo é subdividido em mês e ano, já o espaço em

município, Unidades Federativas do Brasil (UF) e regiões geográficas do Brasil. Assim, a

entidade “Acidente do trabalho” recebeu os atributos de mês, ano, município, UF e região

geográfica.

Para a Previdência Social é de imensa importância a Comunicação de Acidentes do

Trabalho (CAT) ao Instituto Nacional de Seguro Social (INSS). De acordo com o art. 22 da

Lei n. 8.213/91, é obrigação legal da empresa comunicar ao INSS a ocorrência de acidente do

trabalho. No entanto alguns acidentes não são cadastrados no INSS, gerando o indicador

Acidentes do trabalho sem CAT. Por esta razão foi acrescida à entidade “Acidente do

trabalho” a relação de “registrado”, associada às entidades “Acidente do trabalho com CAT” e

“Acidente do trabalho sem CAT”.

As entidades “a serviço da empresa” e “no exercício do trabalho” tratam sobre o

contexto em que o trabalhador este envolvido para que se caracterize um acidente do trabalho.

Page 133: modelagem e representação semântica de dados governamentais

130

É neste contexto que o empregador (empresa) aparece. Conhecer o ramo econômico em que a

empresa se classifica, facilita conhecer quais áreas são mais sujeitas a acidentes do trabalho.

Assim, a “CNAE” aparece como atributo das entidades em questão.

Nas entidades dos tipos de trabalhadores que sofreram algum tipo de acidente, a saber:

“Segurado especial”; “Segurado empregado”; e “Trabalhador avulso” foram incluídos os

atributos “sexo” e “CBO”. A Previdência Social distingue os trabalhadores apenas por sexo,

para que não acha possibilidade de sua identificação. A CBO identifica as ocupações dos

trabalhadores e é utilizada para agrupar e/ou mostrar as ocupações mais perigosas, que

necessitam de um cuidado específico.

Os atributos “CID” e “parte do corpo atingida” são aplicados aos tipos de acidentes do

trabalho: “acidente do trabalho típico”, “Acidente do trabalho de trajeto” e “Acidente do

trabalho atípico”, neste último, foram atribuídos aos seus efeitos, que são as doenças:

“Doença profissional” e “Doença do trabalho”. O “CID” e “parte do corpo atingida” são

utilizados para qualificar o acidente ou seu efeito, no caso do acidente atípico. São estes

atributos que possibilitarão associar o acidente a alguma doença ou sequela psicofísico-social.

Cabe esclarecer que “Doença do trabalho” se refere diretamente ao ambiente laboral, ou seja,

aos riscos ambientais que o trabalhador é exposto e o nexo causal não é presumido. Já a

“Doença profissional” é resultante da execução das tarefas ou atividades profissionais, os

trabalhadores que exercem atividades rotineiras e repetitivas são candidatos a desenvolverem

algum tipo de lesão. Neste caso, o nexo causal é presumido. (HORVATH JÚNIOR, 2009, p.

73).

A entidade “Morte” foi ligada ao benefício “Pensão por morte”, como seu efeito. E a

entidade “Redução da capacidade laborativa” recebeu a ligação com a entidade “Auxílio-

acidente do trabalho”, que é outro benefício decorrente de tal consequência da lesão. A

“Redução da capacidade laborativa” é a diminuição da capacidade laborativa decorrente das

sequelas irreversíveis, mesmo estando a vítima capacitada para exercer alguma atividade

laboral.

A entidade “Perda da capacidade laborativa” foi a que apresentou maior quantidade de

entidades relacionadas à Previdência Social. A entidade “Perda da capacidade do trabalho”

pode ser classificada em “Incapacidade temporária da capacidade laborativa” e “Incapacidade

permanente da capacidade laborativa”. A entidade “Incapacidade temporária da capacidade

laborativa” pode ser dividida em “Incapacidade temporária por menos de 15 dias” ou

“Incapacidade temporária por mais de 15 dias”, que é relacionado ao “Auxílio doença por

acidente do trabalho”. Após um período de tratamento, se o trabalhador for diagnosticado com

Page 134: modelagem e representação semântica de dados governamentais

131

alguma doença ou seqüela que implique na perda total e permanente de sua capacidade

laborativa, este trabalhador é aposentado por invalidez.

Já a entidade “Incapacidade permanente da capacidade laborativa” pode ser

classificada em “Incapacidade permanente parcial” e “Incapacidade permanente total”, esta

última tem como efeito o benefício da “Aposentadoria por invalidez”.

Por fim, apresenta-se um modelo E-R sobre acidente do trabalho associado aos dados

publicados pela Previdência Social. Espera-se que este modelo possa ser utilizado para

atribuir semântica aos dados publicados, de forma a contribuir para sua recuperação e,

principalmente, seu reuso.

Page 135: modelagem e representação semântica de dados governamentais

132

7 ELABORAÇÃO E REUSO DE VOCABULÁRIOS: A QUESTÃO SOBRE ACIDENTE DO TRABALHO Ao selecionar os dados a serem representados em RDF, verificou-se que, a partir do

modelo proposto, seria necessária a elaboração de um vocabulário específico para descrever

os conceitos sobre acidentes do trabalho como forma de enriquecer a representação dos dados

da Previdência em RDF. Fato este justificado na seção 5, na qual foram analisados

instrumentos de representação da informação que abordassem a área de acidente do trabalho,

não encontrando nenhum instrumento que pudesse ser reutilizado.

Desta forma, baseados no modelo conceitual proposto na seção anterior e apresentado

com base no Europeana Data Model (EDM), será proposto um vocabulário sobre acidente do

trabalho, buscando sempre que possível a reutilização de outros vocabulários para descrição

dos dados.

Dentre muitos vocabulários existentes, o EDM vem sendo utilizado tanto para

descrição de dados na Web, quanto como referência para elaboração de novos vocabulários.

A Europeana oferece acesso a conteúdos digitais provenientes de bibliotecas, museus,

arquivos e coleções áudio-visuais de toda a Europa. (FREIRE; CHARLES; CHAMBERS,

2012, p. 1). De acordo com esses autores, o Europeana Data Model consiste numa

infraestrutura aberta para representação de dados, que se baseia na web semântica, e que

permite representar as necessidades de informação dos vários domínios das organizações. No

documento Definition of the Europeana Data Model elements (2012) é definido que a EDM é

a especificação formal das classes e propriedades que poderiam ser utilizados na Europeana.

7.1 SELEÇÃO DOS DADOS PUBLICADOS PELA DATAPREV

Conforme mostrado na introdução deste trabalho, a Dataprev publicou uma primeira

parte dos dados sobre acidentes do trabalho. Foram selecionados dados estatísticos

provenientes do Anuário Estatístico de Acidentes do Trabalho. Esta publicação ficou restrita

aos dados da Seção I subseção D do referido Anuário, conteúdo que trata de Comunicação de

Acidente de Trabalho (CAT), suas consequências, por localização geográfica das ocorrências

(município) e seus respectivos quantitativos.

Assim, foram descritos os seguintes dados:

Page 136: modelagem e representação semântica de dados governamentais

133

1. Ano de ocorrência do acidente do trabalho;

2. Dados sobre o município, onde o acidente do trabalho ocorreu. Estes dados incluem as

seguintes informações:

I. Código da cidade, fornecido pelo IBGE;

II. Nome do Município;

III. Unidade da Federação, a qual pertence o município.

3. Quantidades de acidentes. Divididos por tipo, causas e registro:

I. Acidente do Trabalho do tipo Típico;

II. Acidente do Trabalho do tipo Trajeto;

III. Acidente do Trabalho causou Doença do Trabalho;

IV. Acidente do Trabalho causou Morte;

V. Acidente do Trabalho registrado sem CAT.

As informações sobre os acidentes do trabalho típico, de trajeto, que causaram doença

do trabalho ou morte foram o conjunto de dados sobre acidentes do trabalho com

Comunicação de Acidente do Trabalho (CAT). Estes dados são importantes para a

Previdência Social brasileira, pois são neles que surge a origem dos benefícios de natureza

acidentária concedidos pelo INSS.

Buscaram-se os dados acima descritos no diagrama ER proposto na figura 34.

Todavia, como o modelo proposto pretende atender a um conjunto de dados maiores, ele

apresenta classes e subclasses, além de relações não necessárias, neste momento, para

descrição dos dados propostos a serem descritos em RDF.

Diante deste fato, decidiu-se por recortar o modelo da figura 34, sintetizando sua

representação. Abaixo, na figura 35, pode-se observar como ficou o diagrama ER apenas dos

dados já publicados pela Dataprev.

Page 137: modelagem e representação semântica de dados governamentais

134

FIGURA 35 - Proposta de diagrama ER dos dados publicados pela Dataprev51.

Fonte: O Autor.

Os dados são disponibilizados nos formatos XML, JSON ou CSV. Decidiu-se

trabalhar com o formato XML, por ser o recomendado pela W3C para ser utilizado junto ao

RDF no aperfeiçoamento de tecnologias da Web Semântica.

FIGURA 36 - XML de acidentes do trabalho ocorridos na cidade do Rio de Janeiro.

<acidentes_de_trabalho> <registro> <municipio cod_ibge=" 330000 " uf=" RJ"> RIO DE JANEIRO</municipio> <quantidade> <sem_cat> 9</sem_cat> <com_cat> <tipicos> 17</tipicos> <trajeto> 17</trajeto> <doenca> 0</doenca> </com_cat> <obitos> 0</obitos> </quantidade> </registro> </acidentes_de_trabalho>

Fonte: Dataprev (2012) Conforme observado na figura 36, foram selecionados os dados referentes a acidente

do trabalho ocorridas no ano de 2009, último ano disponibilizado. Dentre os dados estatísticos

de todas as cidades, optou-se pelos dados de apenas uma cidade, já que o processo seria o

mesmo para todas. A cidade escolhida foi o Rio de Janeiro.

51 Para fim de aplicação do modelo, foi inserido a cardinalidade apenas no diagrama da figura 35.

Page 138: modelagem e representação semântica de dados governamentais

135

7.2 ELABORAÇÃO DO VOCABULÁRIO SOBRE ACIDENTE DO TRABALHO

Seguindo o diagrama ER (figura 35), foram criados esquemas para que os dados

preservem e demonstrem a semântica original das informações contidas. Buscou-se construir

um vocabulário a ser usado para dar significado às triplas RFD para publicação de dados

governamentais abertos, utilizando os moldes dos vocabulários encontrados no portal do no

Linked Open Vocabularies (LOV)52.

A partir das classes definidas, realizou-se uma pesquisa no LOV, com o objetivo de

verificar se haveria alguma classe, já existente em ontologias (vocabulários), que

representassem as classes sobre acidente do trabalho. Tal ação visava fazer o reuso de alguns

vocabulários, já existentes e consolidados, para a interligação dos dados, atendendo um dos

princípios do Linked Data. Além de fornecer um formalismo semântico maior a proposta aqui

apresentada. Entretanto, o resultado foi negativo, não encontrando nenhuma classe capaz de

atender aos significados no domínio aqui estudado.

Utilizando o modelo do EDM foi criado um quadro com as informações para

elaboração de um vocabulário a ser utilizado neste trabalho.

Antevendo, como todo vocabulário precisa possuir um URI para suas classes, além da

necessidade de descrição destas classes em RDF, foi criado um URI fictício, utilizado apenas

para exemplificação neste trabalho. Para sua elaboração foi gerado um recurso eletrônico

(“http://example.org/”) e após a barra deste endereço a classe a ser descrita. Foi dado o

prefixo “acitra” para representar o namespace do Vocabulário de Acidente do Trabalho,

também em caráter de experimentação.

Cabe lembrar, que se trata de um recorte do modelo principal proposto. Por essa razão,

apenas alguns elementos serão descritos no vocabulário neste momento. Para uma

organização que facilite o entendimento, o vocabulário será dividido em classes; propriedades

e atributos.

52 Disponível em: <http://lov.okfn.org/dataset/lov/>. Acesso em: 6 jul. 2014. LOV foi criado para ser um compilador de ontologias (vocabulários). Seu objetivo é fornecer acesso a diversos vocabulários, tornando explícitas as representações entre as entidades (objetos). Fornecendo, ainda, métricas sobre como os vocabulários são usados na nuvem de Linked data, ajudando a melhorar a sua compreensão, visibilidade e reusabilidade. (VANDENBUSSCHE, [2014?]).

Page 139: modelagem e representação semântica de dados governamentais

136

QUADRO 8 - Classe do objeto.

Classe acitra:acidenteTrabalho53

Namespace Acitra

URI http://example.org/acidenteTrabalho

Label acidenteTrabalho

Definição Acidente que ocorre pelo exercício do trabalho a serviço da empresa ou pelo exercício do trabalho dos segurados especiais, provocando lesão corporal ou perturbação

Classe acitra:acidenteTrabalhoTípico

Namespace Acitra

URI http://example.org/acidenteTrabalhoTípico

Label acidenteTrabalhoTípico

Definição Acidente decorrente da característica da atividade profissional de risco desempenhada pelo acidentado

Classe acitra:acidenteTrabalhoTrajeto

Namespace Acitra

URI http://example.org/acidenteTrabalhoTrajeto

Label acidenteTrabalhoTrajeto

Definição Acidente que cause a morte ou produza lesões corporais e ocorra no percurso direto entre o lugar de trabalho e a residência, o lugar no que o trabalhador geralmente almoça ou recebe sua remuneração

Classe acitra:doençaTrabalho

Namespace Acitra

URI http://example.org/doençaTrabalho

Label doençaTrabalho

Definição Doença relacionada diretamente ao ambiente laboral, ou seja, aos riscos ambientais ao que o trabalhador é exposto

Classe acitra:morte

Namespace Acitra

URI http://example.org/morte

Label Morte

53 Para construção nos nomes das classes foram retiradas as preposições entre os substantivos. Permaneceram apenas as que acarretassem alteração de sentido entre as classes, como no exemplo: “acidenteTrabalhoComCAT” e “acidenteTrabalhoSemCAT”.

Page 140: modelagem e representação semântica de dados governamentais

137

Definição Corresponde a quantidade de segurados que faleceram em função do acidente do trabalho.

Classe acitra:acidenteTrabalhoSemCAT

Namespace Acitra

URI http://example.org/acidenteTrabalhoSemCAT

Label acidenteTrabalhoSemCAT

Definição Acidente cuja Comunicação de Acidentes do Trabalho (CAT) não foi cadastrada no INSS.

Classe acitra:acidenteTrabalhoComCAT

Namespace Acitra

URI http://example.org/acidenteTrabalhoComCAT

Label acidenteTrabalhoComCAT

Definição Acidente cuja Comunicação de Acidentes do Trabalho (CAT) foi cadastrada no INSS.

Fonte: O Autor. Um segundo passo, foi buscar, também no LOV, ontologias ou vocabulários capazes

de representar as relações mostradas no diagrama ER (figura 35). Pesquisou-se por

propriedades do objeto (owl:ObjectProperty) com significados iguais ao que se propunha no

modelo ER.

Foram encontrados resultados satisfatórios, que evitou a criação ou utilização de

propriedades do objeto ficcionais. Assim, os termos utilizados para representarem as relações

foram substituídos por termos de vocabulários já existentes. O termo “Do_Tipo” foi

substituído pelo termo “Type”, do vocabulário Dublin Core. Já o termo “Causa” foi

substituído pelo termo “Cause”, Schema.Org. E, o termo “hasDocumentation”, do

vocabulário Poder Vocabulary substituiu o termo “Registrado”. Desta forma, abaixo são

descritas as propriedades do objeto.

QUADRO 9 - Propriedades do objeto.

Propriedade dc:type

Namespace dc/elements

URI http://purl.org/dc/elements/1.1/type

Label Type

Page 141: modelagem e representação semântica de dados governamentais

138

Definição Termos que descrevem categorias gerais, funções, gêneros ou níveis de agregação de conteúdo54.

Propriedade dc:cause

Namespace schema.org

URI http://schema.org/cause

Label Cause

Definição Uma causa subjacente. Mais especificamente, um dos agente(s) é responsável pelo processo fisiopatológico que, eventualmente, resulta na ocorrência55.

Propriedade poder:hasDocumentation

Namespace Poder

URI http://dev.poderopedia.com/vocb/hasDocumentation

Label hasDocumentation

Definição Associa um agente com a documentação relacionada56.

Fonte: O Autor

Os últimos elementos do diagrama ER (figura 35) a serem descrito no vocabulário são

os atributos. No caso apresentado, a única classe a apresentar atributos é a classe “Acidente do

trabalho”. Assim como ocorreu com as propriedades do objeto, sendo pesquisado no LOV os

“Objectdata”, que correspondessem aos atributos selecionados nesta pesquisa. Assim,

também foram encontrados vocabulários possíveis de serem reutilizados, não sendo

necessária a sua criação.

O atributo “ano” foi substituído pelo atributo “Date”, do vocabulário Dublin Core. O

“Município” foi substituído por “City”, do vocabulário Place, e deste mesmo vocabulário,

“State” substituiu “UF”. A seguir, pode se verificar estes atributos e sua descrição.

QUADRO 10 - Atributos.

Elemento dc:date

Namespace dc/elements

URI http://purl.org/dc/elements/1.1/date

54 Pertence ao vocabulário DC – Dublin Core Metadata Set. Seus elementos são amplos e genéricos, utilizáveis para descrever uma ampla gama de recursos. (DUBLIN CORE METADATA INITIATIVE, 2012) 55 Proveniente do vocabulário Schema.org, utilizado nos motores de busca do alguns motores de busca na Web: Bing, Google, Yahoo! e Yandex, que dependem de marcação schema.org para melhorar a exibição de resultados de pesquisa. (SCHEMA.ORG, [2014?]). 56 Retirado do Poder Vocabulary, que é um vocabulário utilizado para expressar informações acerca de pessoas e suas relações com organizações e empresas. (PODER, [2014?]).

Page 142: modelagem e representação semântica de dados governamentais

139

Label Date

Definição Representa o ano em que ocorreu o acidente do trabalho.

Domínio acitra:acidenteTrabalho

Range xsd57:datetime

Elemento places:City

Namespace Places

URI http://purl.org/ontology/places#City

Label City

Definição Representa o município (cidade brasileira) na qual ocorreu o acidente do trabalho.

Domínio acitra:acidenteTrabalho

Range name:nome58.

Elemento places:State

Namespace Places

URI http://purl.org/ontology/places#State

Label State

Definição Representa a Unidade Federativa (Estado brasileiro) na qual ocorreu o acidente do trabalho.

Domínio acitra:acidenteTrabalho

Range name:uf

Fonte: O Autor

Assim sendo, consegue-se mostrar, com os exemplos acima, que é possível se chegar a

um vocabulário partindo de um modelo conceitual. Espera-se, no futuro, transformar todo o

modelo conceitual proposto em um vocabulário consistente e formalizado de forma a

conseguir sua publicação, visando sua reutilização.

8 DESCRIÇÃO DOS DADOS SOBRE ACIDENTE DO TRABALHO EM RDF

57 XSD (XML Schema Definition) é um arquivo que contém definições na linguagem XML Schema e é utilizado para descreve a estrutura de um documento XML. As declarações de atributos podem ser de variadas formas, as principais são: “name”: especifica o nome do atributo; “type”: especifica o tipo de dados do atributo; e “use”: especifica a utilização do atributo (requerido, opcional ou proibido). (SPERBERG-MCQUEEN; THOMPSON, 2010). 58 Retirado de Places Ontology, vocabulário para descrever os locais de interesse geográfico. (PLACES..., [2014?].

Page 143: modelagem e representação semântica de dados governamentais

140

O objetivo desta seção é conseguir utilizar o diagrama E-R proposto para descrição

dos dados sobre acidentes do trabalho, no âmbito da Previdência Social brasileira, publicados

pela Dataprev.

Para tal tarefa, foram selecionados os dados já publicados em XML, visto na seção

7.1, e o vocabulário elaborado a partir do modelo conceitual proposto, exposto na seção 7.2.

Com a definição das classes, das relações (propriedades do objeto) e dos atributos

(propriedade de dados), buscou-se a partir do diagrama ER (figura 35) estabelecer statements,

que são “uma espécie de declaração de um recurso contendo um nome, uma propriedade e um

valor agregado a ela” (NOLETO; BRITO, 2003, p. 114), formando a tripla RDF (sujeito,

predicado e objeto), conseguindo representar a interligação entre o recurso, suas propriedades

e seus valores.

Apesar de se perceber algumas semelhanças entre o modelo ER e o RDF, a relação

entre eles não é fácil, quando se pretende migrar de um modelo para o outro. Chen (2002) e

Berners-Lee (1998) apontam semelhanças e diferenças, porém não apresentam uma

metodologia para que os dois modelos possam trabalhar de forma cooperativa.

Berners-Lee (1998) se perguntou se o modelo RDF seria um modelo de entidade-

relacionamento. Este autor responde que sim e que não. A resposta é sim, pois o RDF serve

como base para a modelagem ER, mas, a resposta também é não, porque o RDF é usado para

outras finalidades, tornando-se mais geral que o modelo ER.

O RDF é um modelo de entidades e relações (nós). Berners-Lee (1998) explica que o

modelo RDF é basicamente uma abertura do modelo ER para se trabalhar na Web. Para este

autor, o modelo ER envolve entidades, e para cada entidade, há um conjunto de relações e o

modelo RDF é o mesmo pensamento. A exceção fica a cargo dos relacionamentos que são

identificados, no RDF, por um URI. Para o autor citado, muitos conceitos envolvidos na

modelagem ER estão diretamente direcionados ao modelo de Web Semântica.

Buscou-se na literatura da área da Ciência da Computação experiências na associação

do modelo ER e RDF para descrição de dados. Foram encontrados trabalhos, como dos

autores Teorey, Yang e Fry (1986) e Borgida, Casanova e Laender (2009), que trabalham com

tabelas para representar o modelo ER, com o objetivo de preservar a capacidade de capturar e

distinguir todos os estados válidos do diagrama conceitual. Para estes autores, as tabelas

funcionariam como pequenos bancos de dados lógicos, capazes de transformar ou mapear um

diagrama (ou esquema) conceitual do domínio da aplicação em um esquema de modelo de

dados lógicos. Diante do exposto, “o uso de um esquema conceitual, em particular os

Page 144: modelagem e representação semântica de dados governamentais

141

diagramas de Entidade Relacionamento, como um passo preliminar para projeto de banco de

dados lógico”. (BORGIDA, CASANOVA E LAENDER, 2009, p. 1646).

Essa metodologia de representar o diagrama conceitual em tabelas, para se obter um

esquema lógico de dados, poderia ser empregada para descrição de elementos RDF? Os

pesquisadores Xu, Lee e Kim (2010) utilizam o diagrama ER para armazenar dados RDF em

tabelas relacionais distintas. Os autores acreditam que com essa abordagem facilitaria a

pesquisa e a atualização de quaisquer recursos em bases relacionais.

Nesse mesmo artigo, Xu, Lee e Kim (2010) buscam descrever RDFS em um diagrama

ER. Segundo os autores, o esquema de RDFS pode ser descrito por um diagrama ER, pois o

diagrama apresenta relações de dados RDF usando dados de próprio esquema.

Para alcançar este objetivo, os referidos autores converteram todas as classes de

entidades e as propriedades das relações entre duas entidades para RDF/RDFS. Isto foi

possível, pois criaram tabelas para os esquemas: uma tabela para armazenar as entidades

(tabela de Classes) e os relacionamentos (tabela de propriedades do objeto).

Rambayon (2012) ao avaliar os resultados de Xu, Lee e Kim (2010), afirma que o

conhecimento trazido, pela experiência dos autores, prova o poder da modelagem ER e sua

eficácia em modelagem bancos de dados. E que a correlação entidade-relacionamento e RDF

aumenta a eficiência para a recuperação de informações. E conclui que, um diagrama ER,

como o exibido por Xu, Lee e Kim (2010), não precisa ser utilizado apenas para o projeto

conceitual, mas também para transformar elementos existentes de um banco de dados.

Neste estudo, acredita-se que a mesma metodologia utilizada por Xu, Lee e Kim

(2010), pode ser aplicada para ter resultados inversos, ou seja, a partir de um diagrama ER se

chegar a descrições em RDF.

Vale lembrar que, “o objetivo da modelagem conceitual é obter uma descrição

abstrata, independente de implementação em computador, dos dados que serão armazenados

no banco de dados”. (HEUSSER,1998, p. 11). Desta maneira, deve-se deixar claro que este

trabalho está na fase de abstração, ou seja, certos detalhes são deliberadamente omitidos do

modelo. E a escolha dos detalhes/características para omitir é feita considerando-se tanto a

aplicação pretendida da abstração e também seus usuários (SMITH; SMITH, 1977, p. 105).

No caso específico deste estudo, a abstração também se deve ao fato da representação dos

dados sobre acidentes do trabalho ser uma experiência, na qual se verificará uma

possibilidade de modelagem e aplicação do modelo nos dados.

Buscou-se nas entidades e relacionamentos estudados no decorrer do trabalho, para a

criação das sentenças ou triplas RDF, conforme quadro 20.

Page 145: modelagem e representação semântica de dados governamentais

142

QUADRO 11 - Triplas de RDF propostas com base no diagrama ER

Sujeito Predicado Objeto Acidente do trabalho Do_tipo Acidente do trabalho típico Acidente do trabalho Do_tipo Acidente do trabalho de trajeto Acidente do trabalho Causa Doença do trabalho Acidente do trabalho Causa Morte Acidente do trabalho Registrado Acidente do trabalho sem CAT Acidente do trabalho Registrado Acidente do trabalho com CAT Fonte: O Autor.

A Web Semântica se diferencia da web tradicional por se preocupar mais com seus

endereços, ou seja, tornando seus endereços permanentes, utilizando para tal tarefa os URIs.

Como lembra Noleto e Brito (2003, p. 114) “todos os recursos devem estar nomeados e

identificados por um URI”, isto permite a identificação dos recursos. Por esta razão, será

repetida a quadro 20, mostrado acima, substituindo os termos por seus respectivos URIs (vide

vocabulário proposto na seção anterior).

QUADRO 12 - Triplas de RDF propostas utilizando URIs.

Sujeito Predicado Objeto http://example.org/acidenteTrabalho http://purl.org/dc/elements/1.1/type http://example.org/acidenteTrabalhoTípico

http://example.org/acidenteTrabalho http://purl.org/dc/elements/1.1/type http://example.org/acidenteTrabalhoTrajeto http://example.org/acidenteTrabalho http://schema.org/cause http://example.org/doençaTrabalho http://example.org/acidenteTrabalho http://schema.org/cause http://example.org/morte http://example.org/acidenteTrabalho http://dev.poderopedia.com/vocb/hasDocumentation http://example.org/acidenteTrabalhoSem CAT http://example.org/acidenteTrabalho http://dev.poderopedia.com/vocb/hasDocumentation http://example.org/acidenteTrabalhoComCAT

Fonte: O Autor. Apesar da tabela 12 mostrar como ficariam as sentenças (statements) RDF, para se

construir e disponibilizar os dados sobre acidentes do trabalho em RDF, faz-se necessário que

estes estejam em forma textual. Seguindo as recomendações do W3C (2009), o RDF será

expresso textualmente na linguagem RDF/XML, que possibilita a descrição do RDF em

formato XML.

Page 146: modelagem e representação semântica de dados governamentais

143

FIGURA 37 - Representação dos dados selecionados em RDF59

Fonte: O autor.

Conseguindo-se aplicar as triplas RDF geradas à faixa dos dados sobre acidentes do

trabalho, publicados pela Dataprev, torna-se mais fácil a representação de todo o conjunto de

dados também em RDF. Basta se desenvolver uma tabela das triplas e armazená-las no banco

de dados relacional, onde os dados sobre acidente do trabalho estão disponibilizados.

Conclui-se que, se os dados são ofertados nos formatos XML, JSON ou CSV, eles

também poderão ser disponibilizados em RDF, obtendo um nível semântico não permitido

pelos outros formatos atualmente utilizados.

59 RDF validado pelo W3C RDF validation service. Disponível em: <http://www.w3.org/RDF/Validator/>. Acesso em: 28 abr. 2014.

<?xml version="1.0"?> < rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax- ns" xmlns:acid=“http://example.org/“ xmlns:dc="http://purl.org/dc/elements/1.1 “ xmlns:vocb="http://dev.poderopedia.com/vo cab/schema" xmlns:schema=" schema.org" xmlns:place=" http://purl.org/ontology/pl aces#" >

<RDF:DescriptionRdf:about=" http://example.org/acidenteTrabalho " > <dc:date> 2009 </dc:date> <place:city> 330000 “Rio de Janeiro” </place:city> <place:state> RJ</place:state> <acid:acidenteTrabalhoSemCAT> 9</acid:/acidenteTrabalhoSemCAT> <acid:acidenteTrabalhoComCAT> 34</acid:/acidenteTrabalhoComCAT> <acid:acidenteTrabalhoTípico> 17</acid:acidenteTrabalhoTípico> <acid:acidenteTrabalhoTrajeto> 17</acid:acidenteTrabalhoTrajeto> <acid:doençaTrabalho> 0</acid:doençaTrabalho> <acid:morte> 0</acid:morte>

</rdf:Description> </rdf:RDF> <?Xml Version=“1.0 ”?>

Page 147: modelagem e representação semântica de dados governamentais

144

9 CONSIDERAÇÕES FINAIS E EXPECTATIVAS

Recentemente, no dia 23 de abril de 2014, o Senado Federal brasileiro aprovou a Lei

n. 12.965, sancionada pela presidente Dilma Rousseff. Essa Lei, popularmente conhecida com

Marco Civil da Internet, é a lei que regula o uso da Internet no Brasil. A Lei que entrará em

vigor no final do mês de junho de 2014, trata de temas como neutralidade, privacidade,

retenção de dados, impondo direitos e obrigações de responsabilidade civil aos usuários e

provedores.

Nota-se então, a preocupação e interferência direta do Governo na gestão dos dados,

serviços e ações ocorridas no ambiente virtual. Almejando, na proposta da Lei n. 12.965,

desenvolver mecanismos de governança multiparticipativa, transparente, colaborativa,

buscando a participação de setores sociais: empresas, sociedade civil e comunidade

acadêmica.

Diante do mencionado, estudos sobre publicação de dados governamentais abertos,

como o apresentado nesta dissertação, podem contribuir para que os serviços oferecidos pelo

Governo sejam aproveitados de forma integrada, visando agilizar processos e estabelecer uma

comunicação eficaz entre os diversos setores da sociedade.

O presente estudo se propôs a oferecer uma pequena contribuição para que o Governo

Eletrônico, em destaque o portal dados.gov.br, tenha uma alternativa para publicação de

dados governamentais abertos, neste caso dados da Previdência Social. Com vista, a colaborar

para a publicidade e disseminação de dados e informações públicos, de forma aberta e

estruturada. Para que no futuro, a sociedade possa reutilizar esses dados, utilizando

tecnologias, padrões e formatos abertos e livres, promovendo a inovação e a difusão de

aplicativos para Internet.

Este trabalho teve como objetivo propor um modelo conceitual dos dados sobre

acidentes do trabalho para publicação dos dados governamentais abertos, mantidos pela

Previdência Social. O resultado da seção seis conseguiu atender a este objetivo. Entretanto,

cabe ressaltar que o modelo aqui proposto é uma visão dentre várias possibilidades de

modelos.

Com os resultados do capítulo sete, utilizando a descrição em RDF, proveniente do

modelo conceitual proposto, para descrever parte dos dados sobre acidentes do trabalho já

disponibilizados pela Dataprev, é atendido o último objetivo específico. Todavia, mais

Page 148: modelagem e representação semântica de dados governamentais

145

importante que o cumprimento deste objetivo é poder contribuir com possibilidades viáveis

para que uma parte dos dados públicos seja mais bem utilizada.

Espera-se que este trabalho possa contribuir com idéias ou práticas para que a

publicação desses e de outros dados seja realizada, utilizando princípios dos dados

governamentais abertos. De tal forma a possibilitar a criação, pela própria sociedade, de

novos serviços e informações que contribuirão para a construção de uma cidadania, na qual os

cidadãos terão maior acesso às informações e, consequentemente, a construção de uma

sociedade mais justa, participativa e com maiores oportunidades.

O estudo da literatura mostrou que apesar do Brasil apresentar algumas experiências

com a utilização dos dados públicos para aplicativos a partir de ligações entre dados

governamentais, é pequena a participação da sociedade neste processo. A discussão sobre as

teorias e práticas necessárias para a publicação, de forma aberta, dos dados, não conseguiu

impulsionar os resultados.

O que se nota ainda é a existência de leis que garantem o acesso às informações

públicas, mas estas informações são disseminadas de forma dispersa e com baixa utilização

pela sociedade. Elas ainda são recursos pouco explorados, devido à dificuldade de busca,

processamento e reutilização.

A população que é produtora de dados, também é consumidora. Por esta razão, o

Estado, e, aqui em especial, a Previdência Social, precisa aprimorar os serviços já existentes e

ao mesmo tempo elaborar outros novos, que contribuam para uma relação de simbiose entre

ela e a sociedade. A publicação destes dados de forma aberta possibilitará a criação, por parte

da própria sociedade, de novos serviços e informações que contribuirão para a construção de

uma cidadania, no qual os cidadãos terão maior acesso às informações e, consequentemente, a

construção de uma sociedade mais participativa e consciente.

Todavia, muitos desafios ainda precisam ser vencidos, como: ausência de vocabulários

controlados e de modelos conceituais, inexpressiva cooperação entre as áreas públicas para

compartilhamento de experiências, falta de semântica entre os dados e ineficaz divulgação dos

dados já publicados.

Contra esse panorama, a Dataprev tem o papel de apoiar a evolução dos assuntos

pertinentes à Previdência Social, por meio do uso de tecnologias e informações. Tanto a

metodologia apresentada, quanto os resultados podem instrumentalizar e apoiar os projetos

em curso na Dataprev, especialmente nas ações ligadas ao trabalho de publicação de dados

governamentais abertos (projeto INDA).

Page 149: modelagem e representação semântica de dados governamentais

146

Durante a análise do VCGE, ele acabou sofrendo uma revisão, na qual se pode

participar enviando para análise os apontamentos aqui levantados sobre o vocabulário. O

resultado de poder contribuir com sugestões para a melhoria do vocabulário (projeto ePING)

indicado pelo Governo (projeto INDA) para indexação de dados públicos, colabora para a

efetividade desta pesquisa.

Espera-se em trabalhos futuros conseguir expandir a utilização do modelo conceitual,

de forma a testá-lo na publicação de todos os dados sobre Previdência Social, coletando dados

tanto do Anuário Estatístico de Acidentes do Trabalho, quanto do Anuário estatístico da

Previdência Social. Com isto, será possível reavaliá-lo e adequá-lo as mudanças necessárias

para que se consiga representar de forma consistente os dados descritos.

Por fim, no contexto apresentado neste trabalho, a elaboração do modelo conceitual e

a descrição em RDF pareceu adequado para organizar e fornecer um nível mínimo de

semântica aos dados sobre acidente do trabalho da Previdência Social brasileira, com vista a

promover a organização e facilitar a recuperação e reuso desses dados.

Page 150: modelagem e representação semântica de dados governamentais

147

REFERÊNCIAS

AGUNE, R. M.; GREGORIO FILHO, Á. S.; BOLLIGER, S. P. Governo aberto SP: disponibilização de bases de dados e informações em formato aberto. In: CONGRESSO CONSADE DE GESTÃO PÚBLICA, 3., 2010, Brasília. Anais... Brasília: [s.n.], 2010. Disponível em: <http://www.escoladegoverno.pr.gov.br/arquivos/File/Material_%20 CONSAD/paineis_III_congresso_consad/painel_13/governo_aberto_sp_disponibilizacao_de_bases_de_dados_e_informacoes_em_formato_aberto.pdf>. Acesso em: 28 jun. 2011. ALMEIDA, M. B.; BAX, M. P. Uma visão geral sobre ontologias: pesquisa sobre definições, tipos, aplicações, métodos de avaliação e de construção. Ci. Inf. , Brasília, v. 32, n. 3, p. 7-30, set. dez. 2003. Disponível em: <http://www.scielo.br/ pdf/ci/v32n3/19019>. Acesso em: 13 maio 2012. ALMEIDA, M. B.; OLIVERRA, V. N. P.; COELHO, K. C. Estudos exploratório sobre ontologias aplicadas a modelos de sistemas de informação: perspectivas de pesquisa em Ciência da Informação. Enc. Bibli. R. Eletr. Bibliotecon. Ci. Inf., Florianópolis, v. 15, n. 30, p. 32-56, 2010. Disponível em: <https://periodicos.ufsc.br/index.php/eb/article/view/10987>. Acesso em: 11 jun. 2013. ALONSO, L. B. N.; FERNEDA, E.; BRAGA, L. V. Governo eletrônico e políticas públicas: análise sobre o uso da certificação digital no Brasil. Inf. & Soc.: Est., João Pessoa, v. 21, n. 2, p. 13-24, maio/ago. 2011. ALVARENGA, L. A Teoria do Conceito revisitada em conexão com ontologias e metadados no contexto das bibliotecas tradicionais e digitais. DataGramaZero, v. 2, n. 6, dez. 2001. Disponível em: <http://www.dgz.org.br/dez01/Art_05.htm>. Acesso em: 5 ago. 2013. ALVES, M. D. R.; SOUZA, M. I. F. Estudo de correspondência de elementos metadados: Dublin Core e MARC 21. Revista Digital de Biblioteconomia e Ciência da Informação, Campinas, v. 4, n. 2, p. 20-38, jan./jun. 2007. Disponível em: <http://www.brapci.ufpr.br/documento.php?dd0=0000007463&dd1=46dea>. Acesso em: 13 maio de 2012. ANGÉLICO, F. Lei de acesso à informação pública e seus possíveis desdobramentos à accountability democrática no Brasil. 2012. Dissertação (Mestrado em Administração Pública e Governo) - Escola de Administração de Empresas de São Paulo da Fundação Getúlio Vargas, São Paulo, 2012. ANUÁRIO estatístico da previdência social: AEPS 2011. Brasília, v. 19, 2012. ANUÁRIO estatístico da previdência social: AEPS 2012. Brasília, v. 20, 2013. Disponível em: <http://www.previdencia.gov.br/estatisticas/aeps-2012-anuario-estatistico-da-previdencia-social-2012/>. Acesso em: 5 mar. 2014. ANUÁRIO estatístico de acidentes do trabalho: AEAT 2010. Brasília, v. 1, 2011. ARAÚJO, L. R.; SOUZA, J. F. Aumentando a transparência do governo por meio da transformação de dados governamentais abertos em dados ligados. Revista Eletrônica de

Page 151: modelagem e representação semântica de dados governamentais

148

Sistemas de Informação, v. 10, n. 1, p. 1-15, 2011. Disponível em: <http://revistas.facecla.com.br/index.php/reinfo/article/view/880>. Acesso em: 5 mar. 2012. AUER, S. et. al. DBpedia: a nucleus for a Web of open data. The Semantic Web, Lecture Notes in Computer Science, v. 4825, p. 722-735, 2007. Disponível em: <http://www.cis.upenn.edu/~zives/research/dbpedia.pdf>. Acesso em: 24 abr. 2013. BARLOW, J. P. A taxonomy of information. Bulletin of the American Society for Information Science, v. 20, n. 5, p. 13-17, 1994. BANDEIRA, A. A. Informação e exercício da accountability. In: CINFORM - ENCONTRO BRASILEIRO DE CIÊNCIA DA INFORMAÇÃO, 6., 2005, Salvador. Anais... Salvador: UFBA, 2005. BAPTISTA, A. A.; MACHADO, A. B. Um gato preto num quarto escuro – falando sobre metadados. Revista de Biblioteconomia de Brasília, v. 25, n. 1, p. 77-90, 2001. Disponível em: <http://www.brapci.ufpr.br/documento.php?dd0=000000851 4&dd1=707be>. Acesso em: 15 jun. 2012. BARRETO, A. de A. A questão da informação. São Paulo em Perspectiva, v. 8, n. 4, p. 3-8, 1994. Disponível em: <http://aldoibct.bighost.com.br/quest/quest2. pdf>. Acesso em: 2 jun. 2012. BARROS, A. J. S.; LEHFELD, N. A. S. Fundamentos de metodologia: um guia para a iniciação científica. 2. ed. São Paulo: Makron Books, 2000. BATIMARCHI, S. Um ano da Lei de Acesso à Informação. Information Management, a. 7, n. 35, abr. 2013. BATISTA, A. I. et al. Ações de Governo Eletrônico: o projeto de publicação de dados abertos da Previdência Social pela Dataprev. In: CONFERÊNCIA WEB W3C BRASIL, 3., 2011, Rio de Janeiro. Anais... Rio de Janeiro: W3C, 2011. BENNETT, D.; HARVEY, A. Publishing open government data. 2009. Disponivel em: <http://www.w3.org/TR/2009/WD-gov-data-20090908/>. Acesso em: 15 jun. 2011. BERNERS-LEE, T. Information management: a proposal. 1989. Disponível em: <http://www.w3.org/History/1989/proposal.html>. Acesso em: 15 jun. 2011. BERNERS-LEE, T. Linked Data. 2006. Disponível em: <http://www.w3.org/DesignIssues/LinkedData.html>. Acesso em: 22 abr. 2012. BERNERS-LEE, T. Putting government data online. 2009. Disponivel em: <http://www.w3.org/DesignIssues/GovData.html>. Acesso em: 11 jul. 2012. BERNERS-LEE, T. Qual o futuro da Web, segundo Tim Berners-Lee. Entrevistador: Peter Moon. 2011. Disponível em: <http://peter-moon.blogspot.com.br/ 2011/04/qual-e-o-futuro-da-web-segundo-tim.html>. Acesso em: 5 abr. 2013.

Page 152: modelagem e representação semântica de dados governamentais

149

BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The Semantic Web: a new form of Web content that is meaningful to computers will unleash a revolution of new possibilities. 2001. Disponível em: <http://www-sop.inria.fr/acacia/cours/essi2006/ Scientific %20American_%20Feature%20Article_%20The%20Semantic%20 Web_%20May%202001.pdf>. Acesso em: 13 mar. 2012. BERNERS-LEE. T. Relational databases on the Semantic Web. 1998. Disponível em: <http://www.w3.org/DesignIssues/RDB-RDF.html>. Acesso em: 2 mar. 2014. BIRDSALL, W. F. Uma economia política da biblioteconomia? Perspectivas em Ciência da Informação, Belo Horizonte, v. 10, n. 1, n. 1, jan./jun. 2005. BIZER, C.; CYGANIAK, R.; HEATH, T. How to publish Linked data on the Web. 2007. Disponível em: <http://wifo5-03.informatik.uni-mannheim.de/bizer/pub/LinkedDataTutorial/>. Acesso em: 22 abr. 2012. BIZER, C.; HEATH, T.; BERNES-LEE, T. Linked data – the story so far. Preprint to special issue on linked data. Internacional Journal on Semantic Web and Information Siystems (IJSWIS). 2009. Disponível em: <http://www.dagstuhl.de/ Materials/Files/09/09271/09271.BizerChristian.Slides.pdf>. Acesso em: 13 maio 2012. BORGIDA. A.; CASANOVA, M. A.; LAENDER, A. H. F. Logical database design: from conceptual to logical schema. In: LIU, L.; Özsu, T. (Ed.). Encycopedia of database systems. New York: Springer, 2009. p. 1645-1649. BRASIL. Constituição (1988). Constituição da República Federativa do Brasil. Brasília: Senado Federal, 1988. Disponível em: <http://www.senado.gov.br/ legislacao/const/con1988/CON1988_05.10.1988/CON1988.pdf>. Acesso em: 15 fev. 2013. BRASIL. Decreto de 15 de setembro de 2011. Institui o Plano de Ação Nacional sobre Governo Aberto e dá outras providências. Diário Oficial [da] República Federativa do Brasil, Brasília, DF, 16 set. 2011b. Disponível em: <http://www.planalto.gov.br/ccivil_03/_ato2011-2014/2011/dsn/dsn13117.htm>. Acesso em: 1 maio 2013. BRASIL. Decreto nº 3.294, de 15.12.1999. Institui o Programa Sociedade da Informação e dá outras providências. Diário Oficial [da] República Federativa do Brasil, Brasília, DF, 16 dez. 1999. Disponível em: <http://egov.wikidot.com/ decsocinfoa>. Acesso em: 21 abr. 2013. BRASIL. Decreto nº 6.932, de 11 agosto de 2009. Dispõe sobre a simplificação do atendimento público prestado ao cidadão, ratifica a dispensa do reconhecimento de firma em documentos produzidos no Brasil, institui a “Carta de Serviços ao Cidadão” e dá outras providências. Diário Oficial [da] República Federativa do Brasil, Brasília, DF, 12 ago. 2009b. Disponível em: http://www.planalto.gov.br/ccivil_03/_ato2007-2010/2009/decreto/d6932.htm. Acesso em: 1 maio 2013. BRASIL. Decreto nº 7.175, de 12 de maio de 2010. Institui o Programa Nacional de Banda Larga - PNBL. Diário Oficial [da] República Federativa do Brasil, Brasília, DF, 15 maio 2010. Disponível em: <https://www.planalto.gov.br/ccivil_03/ _ato2007-2010/2010/decreto/d7175.htm>. Acesso em: 4 fev. 2013.

Page 153: modelagem e representação semântica de dados governamentais

150

BRASIL. Lei Complementar nº 101, de 4 de maio de 2000. Estabelece normas de finanças públicas voltadas para a responsabilidade na gestão fiscal e dá outras providências. Diário Oficial [da] República Federativa do Brasil, Brasília, DF, 5 maio 2000. Disponível em: <http://www.planalto.gov.br/ccivil_03/leis/lcp/lcp101. htm>. Acesso em: 1 maio 2013. BRASIL. Lei Complementar nº 131, de 27 de maio de 2009. Acrescenta dispositivos à Lei Complementar no 101, de 4 de maio de 2000, que estabelece normas de finanças públicas voltadas para a responsabilidade na gestão fiscal e dá outras providências, a fim de determinar a disponibilização, em tempo real, de informações pormenorizadas sobre a execução orçamentária e financeira da União, dos Estados, do Distrito Federal e dos Municípios. Diário Oficial [da] República Federativa do Brasil, Brasília, DF, 28 maio 2009a. Disponível em: <http://www.planalto.gov.br/ccivil_03/leis/lcp/lcp131.htm>. Acesso em: 1 maio 2013. BRASIL. Lei nº 12.527, de 18 de novembro de 2011. Regula o acesso a informações previsto no inciso XXXIII do art. 5o, no inciso II do § 3o do art. 37 e no § 2o do art. 216 da Constituição Federal; altera a Lei no 8.112, de 11 de dezembro de 1990; revoga a Lei no 11.111, de 5 de maio de 2005, e dispositivos da Lei no8.159, de 8 de janeiro de 1991; e dá outras providências. Diário Oficial [da] República Federativa do Brasil, Brasília, DF, 18 nov. 2011a. Disponível em: <http://www.planalto.gov.br/ccivil_03/_ato2011-2014/2011/lei/l12527.htm>. Acesso em: 1 maio 2013. BRASIL. Lei nº 8.213, de 24 de julho de 1991. Dispõe sobre os Planos de Benefícios da Previdência Social e dá outras providências. Diário Oficial [da] República Federativa do Brasil, Brasília, DF, 24 jul. 1991. Disponível em: <http://www.planalto.gov.br/ ccivil_03/leis/L8213cons.htm>. Acesso em: 14 out. 2012. BRASIL. Ministério do Planejamento, Orçamento e Gestão. Gov.br. 2013c. Portal do governo eletrônico. Disponível em: <http://www.governoeletronico.gov.br/o-gov.br>. Acesso em: 23 abr. 2013. BRASIL. Ministério do Planejamento, Orçamento e Gestão. Secretaria de Logística e Tecnologia da Informação. VCGE Voabulário de Governo Eletrônico. Brasília: MP, SLTI, 2013d. BRASIL. Brasil.gov.br: serviços. 2013a. Disponível em: <http://www.brasil.gov.br/para/ servicos/aposentadoria/previdencia-do-servidor>. Acesso em: 22 jul. 2013. BRASIL. Controladoria-Geral da União. Estrutura organizacional do Governo Federal. 2013b. Disponível em: <http://www.cgu.gov.br/publicacoes/prestacaocontaspresidente/2010/ Arquivos/1.01.pdf>. Acesso em: 22 jul. 2013. BRASIL. Portaria n. 5, de 14 de julho de 2005. 2005. Disponível em: <http://www.governoeletronico.gov.br/o-gov.br/legislacao/portaria-no-05-de-14-de-julho-de-2005>. Acesso em: 24 abr. 2013. BREITMAN, K. et al. Dados Governamentais Abertos. In: ______. Publicação de dados governamentais em padrão Linked Data. 2009. Disponível em: <http://www.w3c.br/cursos/dados-abertos/curso/Parte-1-Modulo-2-Open%20Government%20Data.pdf>. Acesso em: 13 maio 2011.

Page 154: modelagem e representação semântica de dados governamentais

151

BREITMAN, K. Web Semântica: a Internet do futuro. Rio de Janeiro: LTC, 2005. BURKE, C. História da Ciência da Informação. Annual Review of Information Science and Technology, University of Maryland, Baltimore Countly, v. 41, p. 3-53, 2007. Tradução livre de: Cavalcanti, H. C.; Gouveia Junior, M.; Queiroz, M. O. de. CAMPOS, A. M. Accountability: quando poderemos traduzi-la para o português? Revista de Administração Pública, Rio de Janeiro, v. 24, n. 2, p. 30-50, fev./abr. 1990. Disponível em: <http://ebape.fgv.br/sites/ebape.fgv.br/files/ rap8_0.pdf>. Acesso em: 22 fev. 2013. CAMPOS, M. L. A. A organização de unidades do conhecimento em hiperdocumentos: o modelo conceitual como um espaço comunicacional para a realização da autoria. 2001b. Tese (Doutorado em Ciência da Informação) – Instituto Brasileiro de Informação em Ciência e Tecnologia. Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2001. CAMPOS, M. L. A. Integração de ontologias: o domínio da Bioinformática e a problemática da compatibilização terminológica. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 7., 2006, Marília). Anais... Marília: ANCIB, 2006. Disponível em: <http://portalppgci.marilia.unesp.br/index.php>. Acesso em: 24 set. 2012. CAMPOS, M. L. A. Linguagem documentária: teorias que fundamentam sua elaboração. Niterói: EdUFF, 2001a. CAMPOS, M. L. A. Modelização de domínios de conhecimento: uma investigação de princípios fundamentais. Ci. Inf. , Brasília, v. 33, n. 1, p. 22-32, jan./abr. 2004. Disponível em: <http://revista.ibict.br/ciinf/index.php/ciinf/article/view/56>. Acesso em: 11 jun. 2013. CAMPOS, M. L. A.; CAMPOS, L. M. A Organização do Conhecimento e suas teorias de representação: a ontologia de fundamentação como um modelo teórico para a representação de domínios. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 12., 2011, Brasília). Anais... Brasília: ANCIB, 2011. CAMPOS, M. L. A.; CAMPOS, L. M.; MEDEIROS, J. S. A representação de domínios de conhecimento e uma teoria de representação: a ontologia de fundamentação. Inf. Inf. , Londrina, v. 16, n. esp., p. 140-164, jan./jun. 2011. CAMPOS, M. L. A.; GOMES, H. E. Taxonomia e Classificação: o príncipio de Categorização. DataGramaZero: revista de Ciência da Informação, v. 9, n. 4, ago. 2008. Disponível em: <http://www.dgz.org.br/ago08/ F_I_art.htm>. Acesso em: 13 jan. 2013. CAMPOS, M. L. A.; SOUZA, R. F.; CAMPOS, M. L. M. Organização de unidades de conhecimento em hiperdocumentos: o modelo conceitual como espaço comunicacional para a realização da autoria. Ci. Inf. , Brasília, v. 32, n. 2, p. 7-16, maio/ago. 2003. Disponível em: <http://www.scielo.br/scielo.php?pid=S0100-19652003000200002&script=sci_arttext>. Acesso em: 13 maio 2013. CAPURRO, Rafael. Epistemologia e Ciência da Informação. 2003. Disponível em: <http://www.capurro.de/enancib_p.htm>. Acesso em: 12 mar. 2012.

Page 155: modelagem e representação semântica de dados governamentais

152

CASTELLS, M. A sociedade em rede. São Paulo: Paz e Terra, 1999. CHAHIN, A. et al. E-Gov.br: a próxima revolução brasileira: eficiência, qualidade e democracia: o governo eletrônico no Brasil e no mundo.. São Paulo: Prentice-hall, 2004. CHAVES, M. B. F. Apresentação sobre ações de Governo para Dados Abertos. 2011. Apresentado originalmente no IV Congresso Internacional Software Livre e Comércio Eletrônico, realizado em 2011, na cidade de Brasília. Disponível em: <http://www.w3c.br/conferenciaegov/06_COI-PR_Mirian.pdf>. Acesso em: 4 maio 2013. CHEN, P. Modelagem de dados. New York: Mcgraw Hill / Makron Books,1990. CHEN, P. P. Entity-Relationship modeling: historical events, future trends, and lessons learned. In: SOFTWARE pioneers: contributions to software engineering. 2002. Disponível em: <http://www.csc.lsu.edu/~chen/pdf/Chen_Pioneers.pdf>. Acesso em: 28 out. 2013. CHEN, P. P. The Entity-Relationship Model - toward a unified view of data. ACM Transactions on Database Systems, v. 1, n. 1. Mar. 1976. CKAN. 2013. Disponível em: <http://ckan.org/>. Acesso em: 26 maio 2013. CONNOLY. T.; BEGG, C. Database systems: a pratical approach to design, implementation, and management. New York: Addison-Wesley, 1999. CONTROLADORIA-GERAL DA UNIÃO. Programa Brasil Transparente. 2013a. Disponível em: <http://www.cgu.gov.br/PrevencaodaCorrupcao/BrasilTransparen te/OPrograma/index.asp>. Acesso em: 21 abr. 2013. CONTROLADORIA-GERAL DA UNIÃO. Programa Brasil Transparente. 2013b. Disponível em: <http://www.portaltransparencia.gov.br/>. Acesso em: 21 abr. 2013.

COSTA, I. T. M. Informação, trabalho e tempo livre: políticas de informação para o século XXI. Ci. Inf. , Brasília, v. 28, n. 2, p. 136-138, maio/ago 1999. Disponível em: <http://www.scielo.br/scielo.php?pid=S0100-19651999000200005&script= sci_arttext>. Acesso em: 14 maio 2012.

CYGANIAK, R.; JENTZSCH, A. The Linking Open Data cloud diagram. 2011. Disponível em: <http://lod-cloud.net/>. Acesso em: 24 abr. 2014.

DADOS.GOV.BR. 2013. Disponível em: <http://dados.gov.br/>. Acesso em: 1 maio 2013.

DAHLBERG, I. A referent-oriented analytical concept theory os inter concept. International classification, Frankfurt, v. 5, n. 3, p. 142-150, 1978b. DAHLBERG, I. Conceptual definitions for interconcept. International Classification, v. 8, n. 1, p. 16-22, 1981. DAHLBERG, I. Fundamentos teóricos-conceituais da classificação. R. Bibliotecon., Brasília, DF, v. 6, n. 1, jan./jun. 1978c.

Page 156: modelagem e representação semântica de dados governamentais

153

DAHLBERG, I. Teoria do conceito. Ci. Inf. , Rio de Janeiro, v. 7, n. 2, p. 101-107, 1978a. Disponível em: <http://revista.ibict.br/ciinf/index.php/ciinf/article/viewFile/1680/1286>. Acesso em: 11 ago. 2013. DAHLBERG, I. Terminological definitions: characteristics and demands. In: PROBLÈMES de la définition et de la synonymie en terminologie. Québec: GIRSTERM, 1983. p. 13-51.

DATA.GOV.UK. 2013. Disponível em: <http://data.gov.uk/>. Acesso em: 1 maio 2013.

DATAPREV. A virada da previdência social: como acabaram as filas nas portas das agências. Brasília: Dataprev, 2013.

DATAPREV. Dados abertos. 2012. Disponível em: <http://api.dataprev.gov.br/ revidencia/ anuario/2003/acidentes-do-trabalho.xml>. Acesso em: 15 jan. 2013. DATAPREV. Dados abertos. 2013. Disponível em: <http://api.dataprev.gov.br/doc/index.html>. Acesso em: 7 abr. 2013. DAVIES, T. Open data, democracy and public sector reform. A look at open government data use from data.gov.uk. 2010. Disponível em: <http://practicalparticipation.co.uk/odi/report/ wp-content/uploads/2010/08/How-is-open-government-data-being-used-in-practice.pdf>. Acesso em: 20 abr. 2013. DAVIS, R.; SHROBE, H.; SZOLOVITS, P. What is knowledge representation? AI Magazine, v. 14, n. 1, p. 17-33, Spring 1993. Disponível em: <http://www.aaai.org/ojs/index.php/aimagazine/article/view/1029/947>. Aceso em: 22 jan. 2013. DEMO, P. Metodologia científica em Ciências Sociais. 3. ed. rev e ampl. São Paulo: Atlas, 1995. DINIZ, E. H. et al. O governo eletrônico no Brasil: perspectiva histórica a partir de um modelo estruturado de análise. Revista de administração pública, Rio de Janeiro, v. 43, n. 1, p. 23-48, jan./fev. 2009. Disponível em: <http://www.scielo.br/ pdf/rap/v43n1/ a03v43n1.pdf>. Acesso em: 28 jun. 2011. DINIZ, V. A crise do governo eletrônico ou a prevalência dos monólogos simultâneos. Informática pública , a. 11, n. 1, p. 15-22, 2009. Disponível em: <http://www.ip.pbh.gov.br/ ANO11_N1_PDF/a_crise_do_governo_eletronico. pdf>. Acesso em: 28 jun. 2011. DINIZ, V. Como conseguir dados governamentais abertos. In: CONGRESSO CONSADE DE GESTÃO PÚBLICA, 3., 2010, Brasília. Anais... Brasília: [s.n.], 2010. Disponível em: <http://www.escoladegoverno.pr.gov.br/arquivos/File/ Material_%20CONSAD/paineis_III_congresso_consad/painel_13/como_conseguir_dados_governamentais_abertos.pdf>. Acesso em: 19 abr. 2012. DODDS, L. Rights statements on the Web of Data. Nodalities: the magazine of the Semantic Web, v. 9, p. 13-14, 2010.

Page 157: modelagem e representação semântica de dados governamentais

154

DODEBEI, V. L. D. Tesauro: linguagem de representação da memória documentária. Niterói: Intertexto; Rio de Janeiro: Interciência, 2002. DUBLIN CORE METADATA INITIATIVE. DCMI metadata terms. 2012. Disponível em: <http://dublincore.org/documents/2012/06/14/dcmi-terms/?v=elements#>. Acesso em: 2 mar. 2014. DZIEKANIAK, G. V. Desenvolvimento de uma ontologia sobre componentes de ontologias. Perspectivas em Ciência da Informação, v. 15, n. 1, p. 173-184, jan./abr. 2010. Disponível em: <http://www.scielo.br/scielo.php?pid=S1413-99362010000100010&script=sci_arttext>. acesso em: 13 maio 2012. DZIEKANIAK, G. V.; KIRINUS, J. B. Web Semântica. Enc. Bibli.: E. Eletr. Bibliotecon. Ci. Inf., Florianópolis, n. 18, p. 20-39, jul./dez. 2004. Disponível em: <http://www.periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2004v9n18p20>. Acesso em: 13 maio 2012. EUROPEANA. Definition of the Europeana Data Model elements: version 5.2.3. 2012. Disponível em: <http://pro.europeana.eu/documents/900548/bb6b51df-ad11-4a78-8d8a-44cc41810f22>. Acesso em: 10 mar 2013 FALBO, R. A. Integração de conhecimento em um ambiente de Engenharia de Software. 1998. Tese (Doutorado em Informática) - Engenharia de Sistemas e Computação, COPPE, Universidade Federal do Rio de Janeiro. FEIGENBAUM, L. et al. The Semantic Web in action: corporate applications are well under way, and consumer uses are emerging. Scientific American, Dec. 2007. Disponível em: <http://thefigtrees.net/lee/sw/sciam/semantic-web-in-action>. Acesso em: 15 jun. 2011. FERNANDES, A. G.; AFONSO, J. R. R. e-Governo no Brasil: experiências e perspectivas. Revista do BNDES, Rio de Janeiro, v. 8, n. 5, p. 21-64, 2001. FERNANDES, G. C. Quatro visões no campo da Ciência da Informação. 2006. Trabalho apresentado à banca avaliadora do concurso para Professor Adjunto 1 DE, do Departamento de Ciência da Informação da Universidade Federal da Universidade Federal de Santa Catarina, como requisito parcial para aprovação. FERNANDEZ, M.; GÓMEZ-PÉREZ, A.; JURISTO, N. Methontology: from ontological art towards ontological engineering. AAAI Technical Report SS-97-06, 1997. FERRER, F. A importância do governo eletrônico no Brasil. 2003. Disponível em: <http://www.florenciaferrer.com.br/detalhes.php?artg=105>. Acesso em: 20 abr. 2013. FHOHMANN, B. A documentação rediviva: prolegômenos a uma (outra) filosofia da informação. Morpheus: Revista Eletrônica em Ciências Humanas, Rio de Janeiro, v. 9, n. 14, p. 227-249, 2012. Disponível em: <http://www.unirio.br/ orpheusonline/numero14-2012/artigos/ frohmannn _pt.pdf>. Acesso em: 14 out. 2012.

Page 158: modelagem e representação semântica de dados governamentais

155

FILGUEIRAS, F. Além da transparência, accountability e política da publicidade. Lua Nova, São Paulo, n. 84, p. 84-94, 2011a. Disponível em: <http://www.scielo.br/pdf/ln/n84/a04n84.pdf>. Acesso em: 22 jul. 2012. FILGUEIRAS, F. Transparência, publicidade e accountability. In: TEXTO para discussão n. 1. Belo Horizonte: Centro de Referência do Interesse Público, 2011b. Disponívem em: <http://democraciaejustica.org/cienciapolitica3/sites/ default/files/transparencia_publicidade_e_accountability.pdf>. Acesso em: 22 jul. 2012. FOUCAULT, M. A governamentabilidade. In: ______. Ditos e escritos. Rio de Janeiro: Forense Universitária, 2003. v. 4. FRANCELIN, M. M.; KOBASHI, N. Y. Concepções sobre o conceito na organização da informação e do conhecimento. Ci. Inf. , Brasília, DF, v. 40, n. 2, p. 207-228, maio/ago., 2011. FRANZOSI, E. M. et al. Rede de informações pública e aberta DadosGov – um modelo aberto para troca de informações. In: CONGRESSO INTERNACIONAL SOFTWARE LIVRE E COMÉRCIO ELETRÔNICO, 4., 2011, Brasília. Dados abertos para a democracia na era digital. Brasília: Fundação Alexandre de Gusmão, 2011. p. 21-51. FREIRE, G. H. Ciência da Informação: temática, histórias e fundamentos. Perspec. Ci. Inf., Belo Horizonte, v. 11, n. 1, p. 6-19, jan./abr. 2006. FREITAS, L. S. Sentidos da história e história dos sentidos da Ciência da Informação: um esboço arqueológico. Morpheus, Rio de Janeiro, a. 2, n. 2, 2003. FREIRE, N.; CHARLES, V.; CHAMBERS, S. Análise do Europeana Data Model no contexto das bibliotecas e de conteúdos de texto integral. In: CONGRESSO NACIONAL DE BIBLIOTECÁRIOS, ARQUIVISTAS E DOCUMENTALISTAS, 11, 2012, Lisboa. Actas… Lisboa: Fundação Calouste Gulbenkian, 2012. FREY, K. Governança eletrônica: uma experiência de cidades européias e algumas lições para países em desenvolvimento. Informática pública , Belo Horizonte, v. 2, p. 31-48, maio 2000. Disponível em: <http://www.egov.ufsc.br/ portal/ sites/default/files/anexos/19407-19408-1-PB.pdf>. Acesso em: 4 jan. 2013. FREY, K. Governança urbana e participação pública. RAC-Eletrônica, v. 1, n. 1, p. 136-150, jan./abr. 2007. Disponível em: <http://www.anpad.org.br/periodicos/ arq_pdf/a_629.pdf>. Acesso em: 3 jan. 2013. FURGERI, S. O papel das linguagens de marcação para a Ciência da Informação. Transinformação, Campinas, v. 18, n. 3, p. 225-239, set./dez. 2006. Disponível em: <http://www.brapci.ufpr.br/documento.php?dd0=0000000445&dd1 =d1f32>. Acesso em: 13 maio 2012. GAILLIAU, R. Twenty years of a free and open WWW. 2013. Disponível em: <http://home.web.cern.ch/cern-people/opinion/2013/04/twenty-years-free-and-open-www>. Acesso em: 30 abr. 2013.

Page 159: modelagem e representação semântica de dados governamentais

156

GANGEMI, A. et al. Sweetening Ontologies with DOLCE. In: KNOWLEDGE engineering and knowledge management: ontologies and the semantic web, v. 2473, p. 223-233, 2002. Disponível em: <http://www.loa.istc.cnr.it/Papers/DOLCE-EKAW.pdf>. Acesso em: 24 out. 2013. GARCIA. T. et al. A democracia na era do governo eletrônico. In. Simpósio Internacional de propriedade intelectual, informação e ética, 2003, Florianópolis. Anais... Florianópolis: UFSC, 2003. Disponível em: <http://egov.ufsc.br/portal/ sites/ default/files/anexos/29552-29568-1-PB.pdf>. Acesso em: 17 abr. 2013. GOMES, H.E.(Coord.). Manual de elaboração de tesauros monolíngües. Brasília: Programa Nacional de Bibliotecas das Instituições de Ensino Superior, 1990. GOMES, H. E. Tendências da pesquisa em organização do conhecimento. Pesq. Bras. Ci. Inf. , Brasília, v. 2, n. 1, p. 60-88, jan./dez. 2009. GONTIJO, M. Analise da proposta brasileira de e-governo como expressão de uma política de informação a partir do conceito de regime de informação. Perspect. Cien. Inf., Belo Horizonte, v. 7, n. 2, p. 179-188, jul./dez. 2002. Disponível em: <http://portaldeperiodicos.eci.ufmg.br/index.php/pci/article/ download/406/217>. Acesso em: 2 dez. 2012. GONZÁLEZ DE GOMEZ, M. N. Novos cenários políticos para a informação. Ci. Inf. Brasília, v. 31, n. 1, p. 27-40, jan./abr. 2002. GONZÁLEZ DE GÓMEZ, M. N.; LIMA, C. R. M. de (org.). Informação e democracia: a reflexão contemporânea da ética e da política. Brasília: IBICT, 2010. GOVERNO eletrônico: observatório do Governo eletrônico. 2007. Disponível em: <http://egov.wikidot.com/start>. Acesso em: 19 abr. 2013. GRAY, J. et. al. Unlocking the Potential of Aid Information. 2009. Disponível em http://www. unlockingaid.info/wp-content/uploads/2010/02/UnlockingAid Information.pdf. Acessado em: 13 de junho de 2011. GREENBERG, J. The Web Semantic: more than a vision. Bulletin of the American Society for Information Science and Technology, v. 29, n. 4, p. 6-7, Apr./May 2003. Disponível em: <http://www.asis.org/Bulletin/Apr-03/BulletinAprMay03.pdf>. Acesso em: 16 set. 2012. GREENBERG, J.; SUTTON, S.; CAMPBELL, G. Metadata: a fundamental component of the Semantic Web. Bulletin of the American Society for Information Science and Technology, v. 29, n. 4, p. 16-18, Apr./May 2003. Disponível em: <http://www.asis.org/Bulletin/Apr-03/BulletinAprMay03.pdf>. Acesso em: 16 set. 2012. GRENON, P.; SMITH, B.; GOLDBERG, L. Biodynamic ontology; applying BFO in the biomedical domain. 2004. Disponível em: <http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.64.5717>. Avesso em: 22 abr. 2013.

Page 160: modelagem e representação semântica de dados governamentais

157

GRUBER, T. R. Ontology. In: Ling Liu; Özsu, M. T. (ed.). Encyclopedia of Database Systems. New York: Springer-Verlag, 2009. Disponível em: <http://tomgruber.org/writing/ontology-definition-2007.htm>. Acesso em: 1 maio 2013. GRUBER, T. R. Toward Principles for the Design of Ontologies Used for Knowledge Sharing. International Journal Human-Computer Studies, v. 43, n. 5-6, p. 907-928, 1995. Disponível em: <http://tomgruber.org/writing/onto-design.pdf>. Acesso em: 4 maio 2013. GUARINO, N. Formal ontology and information systems. In: FIRST INTERNATIONAL CONFERENCE (FOIS), 1., 1998, Trento, Italy. Proceedings… Amsterdam: IOS Press, 1998. p. 3-15. Disponível em: <http://www.loa.istc.cnr.it/ Papers/FOIS98.pdf>. Acesso em: 5 abr. 2013. GUARINO, N. Understanding, building and using ontologies. Journal Humancomputer Studies, v. 45, n. 2-3, fev.mar. 1997. Disponível em: <http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.29.2610>. Acesso em: 27 maio 2012. GUIZZARDI, G. et al. Ontologias de fundamentação e modelagem conceitual. Disponível em: <http://nemo.inf.ufes.br/files/ontologias_de_ fundamentacao_e_modelagem_conceitual_ 2009. pdf>. Acesso em: 5 abr. 2013. GUIZZARDI, G. Uma abordagem metodológica de desenvolvimento para e com reuso, baseada em ontologias formais de domínio. 2000. Dissertação de Mestrado, Universidade Federal do Espirito Santo, Departamento de Informática, LabES (Laboratorio de Engenharia de Software)/LPRM (Laboratorio de Pesquisas em Redes e Multimidia). Disponível em: <http://www.loa.istc.cnr.it/ Guizzardi/MSc.htm>. Acesso em: 4 maio 2013. GUIZZARDI, G.; FALBO, R. A.; GUIZZARDI, R. S. S. A importância de ontologias de fundamentação para a engenharia de ontologias de domínio: o caso do domínio de processos de software. IEEE Latin America Transactions, v. 6, n. 3, July 2008. Disponível em: <http://www.ewh.ieee.org/reg/9/etrans/ieee/issues/vol06/vol6issue3July2008/6TLA3_03Guizzardi.pdf>. Acesso em: 22 out. 2013. GUIZZARDI, G.; WAGNER, G. A Unified Foundations Ontology and some applications of it in Business modeling. 2004. Disponível em: <http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.142.9372>. Acesso em: 22 abr. 2013. HABERMAS, J. A inclusão do outro: estudos de teoria e política. São Paulo: Loyola, 2002. HABERMAS, J. Direito e democracia: entre faticidade e validade. 2. Ed. Rio de Janeiro: Tempo Brasileiro, 2003. v. 2. HEUSSER, C. A. Projeto de banco de dados. Porto Alegre: Sagra, 1998. HJØRLAND, B. Fundamentals of Knowledge Organization. In: FRÍAS, José Antonio; TRAVIESO, Críspulo (Ed.). Trends in Knowledge Organization Research. Salamanca: Ediciones Universidad de Salamanca, 2003. p.83-116.

Page 161: modelagem e representação semântica de dados governamentais

158

HJØRLAND, B. Theory and metatheory of Informacion Science: a new interpretation. Journal of documentation, v. 54, n. 5, p. 606-621, dez. 1998. HORVATH JÚNIOR, M. Dicionário analítico da Previdência Social. São Paulo: Atlas, 2009. IBGE. Síntese e indicadores sociais. Rio de Janeiro: IBGE, 2012. 293 p. (Estudos e pesquisas. Informação demográfica e socioeconômica; 29). Disponível em: <ftp://ftp.ibge.gov.br/Indicadores_Sociais/Sintese_de_ Indicadores_Sociais_2012/SIS_2012.pdf>. Acesso em: 24 abr. 2013. INSTITUTO ANTÔNIO HOUAISS. Dicionário eletrônico de Língua Portuguesa. 3. Ed. Rio de Janeiro: Objetiva, 2009. JACOB, E. K. Ontologies and the Semantic Web. Bulletin of the American Society for Information Science and Technology, v. 29, n. 4, p. 16-18, Apr./May 2003. Disponível em: <http://www.asis.org/Bulletin/Apr-03/BulletinAprMay03.pdf>. Acesso em: 16 set. 2012. JAPIASSÚ, H.; MARCONDES, D. Dicionário básico de Filosofia. 3. ed. rev. ampl. Rio de Janeiro: Zahar, 2001. JARDIM, J. M. A Lei de Acesso à Informação Pública: dimensões político-informacionais. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 13., 2012, Rio de Janeiro). Anais... Rio de Janeiro: ANCIB, 2012. Disponível em: <http://obgi.files.wordpress.com/2012/10/jardim-xiii-enancib.pdf>. Acesso em: 1 maio 2013. JARDIM, J. M. Capacidade governativa, informação e governo eletrônico. DataGramaZero, Rio de Janeiro, v. 1, n. 5, out. 2000. Disponível em: <http://www.dgz.org.br/out00/Art_01.htm>. Acesso em 6 jan. 2010. JARDIM, J. M. Sistemas e políticas públicas de arquivos no Brasil. Niterói: EdUFF, 1995. JARDIM, J. M. Transparência e opacidade do Estado no Brasil: usos e desusos da informação governamental. Niterói: EdUFF, 1999. KANEIWA, K.; IWAZUME, M.; FUKUDA, K. An upper ontology for event classifications and relations. IN: AI'07 Proceedings of the 20th Australian joint conference on Advances in artificial intelligence . Berlin: Springer-Verlag, 2007. Disponível em: <http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.108.9174>. Acesso em: 12 set. 2013. LAENDER, A. H. F.; FLYNN, D. J., A semantic comparison of modelling capabilities of the ER and NIAM models. In: ELMASRI, R.; KOURAMAJIAN, V.; THALHEIM, B., (Eds.). Entity-Relationship Approach - ER'93, Springer-Verlag, p. 242-256, 1994. LANCASTER, F. W. Indexação e resumos: teoria e prática. Brasília: Briquet de Lemos, 1993. LAPLANTE, P. Great papers in Computer Science. New York: West Publishing, 1996.

Page 162: modelagem e representação semântica de dados governamentais

159

LE MOIGNE, J. A teoria do sistema geral: teoria da modelizacao.Trado: Jorge Pinheiro. Instituto Piaget, Lisboa, 1977. LEITE, M. S. A.; BORNIA, A. C. Modelagem: abordagens que consideram a complexidade do sistema. In: Encontro Nacional de Engenharia de Produção, 26., 2006, Fortaleza. Anais... Fortaleza: ABEPRO, 2006. Disponível em: <http://www.abepro.org.br/biblioteca/ENEGEP2006_TR460314_7155.pdf>. acesso em: 11 dez. 2013. LEOCADIO, J, M. Segurança eletrônica na Web Semântica. In: CONGRESSO INTERNACIONAL SOFTWARE LIVRE E COMÉRCIO ELETRÔNICO, 4., 2011, Brasília. Dados abertos para a democracia na era digital. Brasília: Fundação Alexandre de Gusmão, 2011. p. 7-9. LIGADO nos políticos. 2010. Disponível em: <http://ligadonospoliticos.com.br/? pag=home>. Acesso em: 26 maio 2013. LIMA, C. R. M. de; GONÇALVES, M. A reinvenção da esfera pública: os discursos em rede, reconhecimento e política deliberativa. In. ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 12., 2011, Brasília). Anais... Brasília: ANCIB, 2011. p. 1643-1656. LIMA, J. A. O. Modelo genérico de relacionamentos na organização da informação legislativa e jurídica. 2008. Tese (Doutorado em Ciência da Informação) – Universidade de Brasília, Brasília, 2008. LIMA, J. C.; CARVALHO, C. L. Ontologias - OWL (Web Ontology Language). Technical Report - RT-INF_004-05 - Relatório Técnico. 2005. Disponível em: <http://www.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_004-05.pdf>. Acesso em: 3 mar. 2014. LUBENOW, J. A. Esfera pública e democracia deliberativa em Habermas: modelo teórico e discursos críticos. Kriterion , Belo Horizonte, n. 121, p. 227-258, jun. 2010. Disponível em: <http://www.scielo.br/scielo.php?pid=S0100-512X2010000100012&script=sci_arttext>. Acesso em: 25 maio 2012. MAIA, R. M. C. S.; ALVARENGA, L. Interconexões entre a teoria da classificação facetada (TCF) de Ranganathan e o Modelo Entidade-Relacionamento (MER) de Peter Chen. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 14., 2013, Florianópolis. Anais... Brasília: ANCIB, 2013. Disponível em: < http://enancib.sites.ufsc.br/index.php/enancib2013/XIVenancib/paper/viewFile/441/135>. Acesso em: 10 dez. 2013. MANUAL dos dados abertos: governo. 2011. Disponível em: <http://www.w3c.br/pub/ Materiais/ PublicacoesW3C/Manual_Dados_Abertos_ WEB.pdf>. Acesso em: 24 ago. 2011. MARANHÃO. Ministério Público. Procuradoria Geral de Justiça. Coordenadoria de Orçamento e Finanças. [Plano plurianual 2012-2015]. 2012. Disponível em: <http://www.mp.ma.gov.br/arquivos/arquivos_site_antigo/Noticia6885A6285.pdf>. Acesso em: 22 jul. 2013.

Page 163: modelagem e representação semântica de dados governamentais

160

MARCONDES, C. H. Definições conceituais como subsídio à modelagem de domínios e organização do conhecimento. 2014. Projeto de pesquisa submetido ao Programa Institucional de Bolsas de Iniciação Científica PIBIC – UFF 2014. MARCONDES, C. H. Documento: suas relações com informação e conhecimento. In: I Congresso ISKO Espanha e Portugal, 2013, Porto, Portugal. I Congresso ISKO Espanha e Portugal, XI Conreso ISKO España, Informação e/ou Conhecimento: as duas faces de Jano. Porto: Faculdade de Letras da Univ. do Porto, CETAC.MEDIA, ISKO, 2013. v. I. p. 800-816. MARCONDES, C. H. et al. Ontologias como novas bases de conhecimento. Perspectivas em Ciência da Informação, v. 13, n. 3, p. 20-39, set./dez. 2008. MARCONDES, C. H.; CAMPOS, M. L. A. Ontologia e Web Semântica: o espaço da pesquisa em Ciência da Informação. Pontode Acesso, Salvador, v. 2, n. 1, p. 107-136, jun./jul. 2008. Disponível em: <http://www.portalseer.ufba.br/index.php/ revistaici/article/viewArticle/2669>. Acesso em: 13 maio 2012. MARCONDES, C. H.; JARDIM, J. M. Políticas de informação governamental: a construção de governo eletrônico na administração federal do Brasil. DataGramaZero – Revista de Ciência da Informação, v. 4, n. 2, abr. 2003. Disponível em: <http://www.dgz.org.br/abr03/Art_04.htm>. Acesso em: 9 mar. 2012. MARCONI, M. A.; LOKATOS, E. M. Fundamentos da metodologia do trabalho científico. 5. ed. São Paulo: Atlas, 2003. MARCONI, M. A.; LOKATOS, E. M. Metodologia do trabalho científico. 2. ed. São Paulo: Atlas, 1992. MARKUS, M. L. Toward a theory of knowledge reuse: types of knowledge reuse situations and factors in reuse success. Journal of Management Information Systems, 18, 1 (Summer): 57-93, 2001. Disponível em: <http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.85.7939>. Acesso em 12 abr. 2013. MARTELETO, R. M. A pesquisa em Ciência da Informação no Brasil: marcos institucionais, cenários e perspectivas. Perspectivas em Ciência da Informação. V. 14, n. especial, p. 19-40, 2009. Disponível em: <http://portaldeperiodicos.eci.ufmg.br/index.php/pci/article/view/ 915/605>. Acesso em: 29 jun. 2012. MASOLO, C. et al. Ontology library . Laboratory for applied ontology – ISTC – CNR. Trento, 2003. Disponível em: <http://wonderweb.semanticweb.gorg/deliverables/documents/D18.pdf>. Acesso em: 11 nov. 2011. MASOLO, C. et al. WonderWeb library of foundational ontologies; preliminary report . 2003. Disponível em: <http://www.loa.istc.cnr.it/Papers/ WonderWebD17V2.0.pdf>. Acesso em: 22 abr. 2013.

Page 164: modelagem e representação semântica de dados governamentais

161

MATHEUS, R. Consultas públicas online e open government. 2009. Disponível em: <http://www.gpopai.usp.br/cursos/index.php/Usu%C3%A1rio_ Discuss%C3%A3o:Ricardomatheus>. Acesso em: 27 dez. 2012. MAZONI, M. V. F. O papel dos dados abertos para seguir construindo um novo Brasil. In: CONGRESSO INTERNACIONAL SOFTWARE LIVRE E COMÉRCIO ELETRÔNICO, 4., 2011, Brasília. Dados abertos para a democracia na era digital. Brasília: Fundação Alexandre de Gusmão, 2011. p. 7-9. MCGUINNESS, D. L. Ontologies come of age. In: FENSEL, D. et al. (ed.). Spinning the Semantic Web: bringing the World Wide Web to its full potential. Massachusetts: MIT Press, 2003. Disponível em: <http://www-ksl.stanford.edu/people/dlm/papers/ontologies-come-of-age-mit-press-(with-citation).htm>. Acesso em: 11 set. 2012. MCGUINNESS; D. L.; HARMELEN, F. (Ed.). OWL : Web Ontology Language overview. 2004. Disponível em: <http://www.w3.org/TR/owl-features/>. Acesso em: 2 fev. 2014. MÉNDEZ, E.; GREENBERG, J. Linked Data for Open vocabularies and HIVE’s Global Framework. El Profesional de la Información, v. 21, n.3, p. 236-244, 2012. Disponível em: <http://dx.doi.org/10.3145/epi.2012.may.03>. Acesso em: 21 abr.2013. MILLER, E.; SWICK, R. An overview of W3C Semantic Web activity. Bulletin of the American Society for Information Science and Technology, v. 29, n. 4, p. 8-11, Apr./May 2003. Disponível em: <http://www.asis.org/Bulletin/Apr-03/BulletinAprMay03.pdf>. Acesso em: 16 set. 2012. MINAYO, M. C. de S. (org.). Pesquisa social: teoria, método e criatividade. 20. Ed. Petrópolis: Vozes, 2002. MIRANDA, C. M. C. A disseminação de dados governamentais abertos como serviço público – os dados abertos governamentais e a experiência brasileira. In: CONGRESSO INTERNACIONAL SOFTWARE LIVRE E COMÉRCIO ELETRÔNICO, 4., 2011, Brasília. Dados abertos para a democracia na era digital. Brasília: Fundação Alexandre de Gusmão, 2011. p. 63-73. MOREIRA, M. A. Mapas conceituais e aprendizagem significativa. 1997. Disponível em: <http://www.if.ufrgs.br/~moreira/mapasport.pdf>. Acesso em: 5 set. 2013. MOREIRO GONZÁLEZ, J. A. Linguagens documentárias e vocabulários semânticos para Web: elementos conceituais. Salvador: EdUFBA, 2011. MORIN, E. Introdução ao pensamento complexo. Porto Alegre: Sulina, 2006. MOTTA, D. F. Método relacional como nova abordagem para construção de tesauros. Rio de Janeiro: [s.n.], 1987. Disponível em: <http://www.conexaorio.com/biti/dilza/index.htm>. Acesso em: 02 jan 2014. MYLOPOULOS, J. Conceptual modeling and Telos. In: LOUCOPOULOS, P.; ZICARI, R. (Ed.). Conceptual modeling, databases, and CASE. [S.l.]: Wiley, 1992. Disponível em:

Page 165: modelagem e representação semântica de dados governamentais

162

<http://citeseerx.ist.psu.edu/viewdoc/summary? doi=10.1.1.83.3647>. Acesso em: 5 jan. 2013. NAÇÕES UNIDAS. Programa das Nações Unidas para o Desenvolvimento. Relatório de desenvolvimento Humano 2013: A Ascensão do Sul: progresso humano num mundo diversificado. New York: Programa Das Nações Unidas para o desenvolvimento, 2013. Disponível em: <http://hdr.undp.org/en/media/ HDR13%20Summary%20PT%20WEB.pdf>. Acesso em: 23/04/2013. NOLETO, D. A.; BRITO, P. F. RDF e RDF Schema na representação de páginas do portal CEULP/ULBRA. In: ENCONTRO DE ESTUDANTES DE INFORMÁTICA DO TOCANTINS, 5, 2003, Palmas. Anais... [Palmas: s.n.], 2003. p. 113-122. NOVELLINO, M. S. F. Instrumentos e metodologias de representação da informação. Inf. Inf. , Londrina, v. 1, n. 2, p. 37-45, jul./dez. 1996. Disponível em: <http://www.uel.br/revistas/uel/index.php/informacao/article/viewFile/1603/1358>. Acesso em: 24 fev. 2014. O’LEARY, D. E. Impediments in the use of explicit ontologies for KBS development. Int. J. Human-Computer Studies, v. 46, n. 2/3, 1997. Disponível em: <https://msbfile03.usc.edu/digitalmeasures/doleary/intellcont/ impediments%20to%20ontologies-1.pdf>. Acesso em: 4 maio 2013. OBAMA, B. Memorandum on Transparency and Open Government. 2009. Disponível em: <http://www.whitehouse.gov/the_press_office/ TransparencyandOpenGovernment>. Acesso: 11 nov. 2011. OPEN DEFINITION. 2013. Disponível em: <http://opendefinition.org/okd/ portugues-brasileiro/>. Acesso em: 24 abr. 2013. OPEN GOVERNMENT PARTNERSHIP. About. 2012. Disponível em: <http://www.opengovpartnership.org/about>. Acesso em: 1 maio 2013. OPENGOVDATA. 8 principles of open government data. 2007. Disponível em: <http://www.opengovdata.org/ home/8principles>. Acesso em: 15 jun. 2011. ORGANIZAÇÃO INTERNACIONAL DO TRABALHO. Escritório no Brasil. Organização Internacional do trabalho: promovendo o trabalho decente. 2013. Disponível em: <http://www.oit.org.br/>. Acesso em: 2 jun. 2013. ORGANIZACIÓN INTERNACIONAL DEL TRABAJO. La taxonomia OIT. 2013. Disponível em: <http://www.ilo.org/public/spanish/support/lib/tools/ taxonomy.htm>. Acesso em: 2 jun. 2013. ORGANIZACIÓN INTERNACIONAL DEL TRABAJO. Tesauro OIT. 2011. Disponível em: <http://www.ilo.org/public/spanish/support/lib/tools/ aboutthes.htm>. Acesso em: 2 jun. 2013. PACHECO, R. C. S.; KERN, V. M. Arquitetura conceitual e resultados da integração de sistemas de informação e gestão da ciência e tecnologia. DataGramaZero – Revista de

Page 166: modelagem e representação semântica de dados governamentais

163

Ciência da Informação, v. 4, n. 2, abr. 2003. Disponível em: <http://www.dgz.org.br/abr03/Art_03.htm>. Acesso em: 13 maio 2012. PACHECO, R. C. S.; KERN, V. M.; STEIL, A. V. Aplicações de arquitetura conceitual em plataformas E-Gov: da gestão da informação pública à construção da sociedade do conhecimento. PondodeAcesso, Salvador, v. 1, n. 1, p. 71-87, jun. 2007. Disponível em: <http://periodicos.ufpb.br/ojs/index.php/pbcib/article/ view/6994>. Acesso em: 25 jun. 2012. PAUXIS, D.; SILVA, W. O Twitter como disseminador de informação. DataGramaZero, v. 12, n. 6, dez. 2011. Disponível em: <http://www.dgz.org.br/dez11/ Ind_com.htm>. Acesso em: 24 abr. 2013. PEREIRA, C. R. Elementos para construção de um modelo de análise de iniciativas de publicação de dados governamentais abertos. São Paulo, 2012. Trabalho de Conclusão de Curso (Graduação em Gestão de Políticas Públicas) – Universidade de São Paulo, 2012. PICKLER, M. E. V. Web Semântica: ontologias como ferramentas de representação do conhecimento. Perspectivas em Ciência da Informação, v. 12, n. 1, p. 65-83, jan./abr. 2007. Disponível em: <http://www.scielo.br/pdf/pci/v12n1/ 05.pdf>. acesso em: 5 abr. 2013. PINHO, J. A. G.; SACRAMENTO, A. R. S. Accountability: já podemos traduzi-la para o português. RAP, Rio de Janeiro, v. 43, n. 6, p. 1343-1368, nov./dez. 2009. Disponível em: <http://www.scielo.br/pdf/rap/v43n6/06.pdf>. Acesso em: 22 fev. 2013. PLACES ontology. [2014?]. Disponível em: <http://purl.org/ontology/places#>. Acesso em: 3 mar. 2014. PODER Vocabulary. [2014?]. Disponível em: <http://dev.poderopedia.com/vocab/schema>. Acesso em: 2 mar. 2014. PRADO, E. P. V. et al. Iniciativas de governo eletrônico: análise das relações entre nível de governo e características dos projetos em casos de sucesso. Revista Eletrônica de Sistemas de Informação, v. 10, n. 1, 2011. Disponível em: <http://revistas.facecla.com.br/index.php/reinfo/article/view/793>. Acesso em: 30 nov. 2012. RAMALHO, R. A. S.; OUCHI, M. T. Tecnologias semânticas: novas perspectivas para representação de recursos informacionais. Inf. Inf. , Londrina, v. 16, n. 3, p. 60-75, jan./jun. 2011. RAMBAYON, A. Storing RDF data efficiently with E-R modeling. 2012. Disponível em: <http://misclassblog.com/database-design-and-development/storing-rdf-data-efficiently-with-e-r-modeling/>. Acesso em: 2 mar. 2014. RAMOS SIMÓN, L. F. et al. De La reutilización de información del sector público a los portales de datos abiertos en Europa. BID : textos universittaris de biblioteconomia i documentación, Barcelona, n. 29, p. 1-36, dic. 2012. Disponível em: <http://www.ub.edu/bid/29/ramos2.htm>. Acesso em: 4 mar. 2013. RIBEIRO, C. J. S. Diretrizes para o projeto de portais de informação: uma proposta interdisciplinar baseada na Análise de Domínio e Arquitetura da Informação. 2008. 283 f.

Page 167: modelagem e representação semântica de dados governamentais

164

Tese (Doutorado em Ciência da Informação) – Universidade Federal Fluminense, Niterói, 2008. RIBEIRO, C. J. S. Em busca da organização do conhecimento: a gestão da informação nas bases de dados da Previdência Social brasileira com o uso da abordagem de análise de domínio. 2001. 162 f. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal do Rio de Janeiro, Rio de janeiro, 2001. RIBEIRO, C. J. S.; ALMEIDA, R. F. Dados Abertos Governamentais (Open Government Data): instrumento para exercício de cidadania pela sociedade. In. ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 12., 2011, Brasília). Anais... Brasília: ANCIB, 2011. p. 2568-2580. RIBEIRO, C. P. P. et al. Difusão da informação na administração pública. TransInformação, Campinas, v. 23, n. 2, p. 159-171, maio/ago 2011. Disponível em: <http://periodicos.puc-campinas.edu.br/seer/index.php/transinfo/article/ view/474/454>. Acesso em: 12 jan. 2013. RIBEIRO, M. M. O uso das tecnologias de informação e comunicação como ferramentas de combate à corrupção: Comprasnet e o Portal da Transparência. 2008. 3. Concurso de monografias da GCU – Controladoria-Geral da União. Disponível em: <http://www.esaf.fazenda.gov.br/esafsite/premios/CGU/ Monografias_2008/Manuella_Maia_Ribeiro_-_2_Lugar_-_U.pdf>. Acesso em: 12 fev. 2013. RODRIGUES, G. Dados governamentais abertos no Brasil: surgimento, expansão e perspectivas. São Paulo, 2012. Trabalho de Conclusão de Curso (Graduação em Gestão de Políticas Públicas) - Escola de Artes, Ciências e Humanidades da Universidade de São Paulo, 2012. RUEDIGER, M. A. Governo eletrônico ou governança eletrônica: conceitos alternativos no uso das tecnologias de informação para o provimento de acesso cívico aos mecanismos de governo e reforma do Estado. XVI Concurso de ensayos y monografias Del CLAD sobre reforma Del estado y modernización de la administración pública “gobierno electrónico”. Caracas, 2002. Disponível em: <http://www.egov.ufsc.br/portal/sites/default/files/anexos/29564-29580-1-PB.pdf>. Acesso em: 24 abr. 2012. SALES,L. F.; SAYÃO, L. F.; MOTTA, D. F. Modelagem de relações conceituais para a área nuclear. In. SEMINÁRIO DE PESQUISA EM ONTOLOGIAS DO BRASIL, 5, 2012, Recife). Anais... Recife: UFPE, 2012. SANT’ANA, R. C. G. Tecnologia e gestão pública municipal: mensuração da interação com a sociedade. São Paulo: Cultura Acadêmica, 2009. SANTOS NETO, A. et al. Tecnologias de dados abertos para interligar bibliotecas, arquivos e museus: um caso machadiano. Transinformação, Campinas, v. 25, n. 1, 2013. Disponível em: <https://www.puc-campinas.edu.br/periodicocientifico>. Acesso em: 26 maio 2013. SANTOS, P. M. Teoria e prática de governo aberto: lei de acesso à informação nos executivos municipais da região sul. Florianópolis: Fundação Boiteux, 2012.

Page 168: modelagem e representação semântica de dados governamentais

165

SARACEVIC, T. Ciência da Informação: origem, evolução e relações. Perspec. Ci. Inf., Belo Horizonte, v. 1, n. 1, p. 41-62, jan./jun. 1996. SAYÃO, L. F. Modelos teóricos em Ciência da Informação – abstração e método científico. Ci. Inf. , Brasília, v. 30, n. 1, p. 82-91, jan./abr. 2001. Disponível em: <http://revista.ibict.br/ciinf/index.php/ciinf/article/view/228/203>. Acesso em: 22 maio 2013. SCHEMA.ORG. [2014?]. Disponível em: <http://schema.org/>. Acesso em: 2 mar. 2014. SCHERP, A. et al. F-A modelo f events based on the foundational ontology DOLCE+DnS Ultralite . 2009. Disponível em: <http://west.uni-koblenz.de/Research/ontologies/events/event-model-f-kcap.pdf>. Acesso em: 2 dez. 2013. SENRA, N. C. Informação estatística: política, regulação, coordenação. Ci. Inf. , Brasília, v. 28, n. 2, maio/ago. 1999. Disponível em: <http://www.scielo.br/ cielo.php? script=sci_arttext&pid=S0100-19651999000200004>. Acesso em: 17 jan. 2013. SENSO, J. A.; HÍPOLA, P. Creación de directorios de recursos Web con LDAP y RDF. 2007. Disponível em: <http://eprints.rclis.org/17347/1/senso-hipola-v1.0.pdf>. Acesso em: 18 abr. 2012. SHADBOLT, N.; HALL, W.; BERNERS-LEE, T. The Semantic Web revisited. IEEE Intelligent Systems, p. 96-101, May/Jun. 2006. Disponível em: <http://eprints.soton.ac.uk/262614/1/Semantic_Web_Revisted.pdf>. Acesso em: 01 abr. 2012. SILBERSCHATZ, A. ; KORTH, H. ; SUDARSHAN, S. Sistemas de bancos de dados. 3.ed. São Paulo: Makron Books, 1999. SILVA, D. L. da; SOUZA, R. R.; ALMEIDA, M. B. Comparação de metodologias para construção de ontologias e vocabulários controlados. Ci. Inf. , Brasília, v. 37, n. 3, p. 60-75, set./dez, 2008. Disponível em: <http://www.scielo.br/pdf/ci/v37n3/ v37n3a05. pdf>. Acesso em: 5 abr. 2013. SILVA, F. C. Habermas e a esfera pública: reconstruindo a história de uma idéia. Sociologia, problemas e práticas, n. 35, p. 117-138, 2001. Disponível em: <http://www.scielo.gpeari.mctes.pt/scielo.php?pid=S0873-65292001000100006&script=sci_arttext>. Acesso em: 21 jan. 2013. SILVA, T. L. DOLCE X UFO : comparativo entre ontologias de fundamentação. 2011. Disponível em: <http://greco.ppgi.ufrj.br/academico/moodledata/81/moddata/assignment/264/96/TrabalhoFinal_v1.3.pdf>. Acesso em: 22 out. 2013. SIMÃO, J. B., RODRIGUES, G. Acessibilidade às informações públicas: uma avaliação do portal de serviços de serviço e informações do governo federal. Ci. Inf. , Brasília, v. 34, n. 2, p. 81-92, maio/ago. 2005. Disponível em: <http://www.scielo.br/pdf/ci/v34n2/28558.pdf>. Acesso em: 25 mar. 2013.

Page 169: modelagem e representação semântica de dados governamentais

166

SMITH, B.; KUMAR, A. Revisiting UMLS Semantic Network. In: FIESCHI, M. et al. (Eds.). MEDINFO 2014, Amsterdam: IOS Press, 2004. Disponivel em: <http://ontology.buffalo.edu/medo/UMLS_SN.pdf>. Acesso em: 20 mar. 2014. SMITH, J. M.; SMITH, D. C. P. Database abstractions: aggregation and generalization. ACM Transactions on database systems, v. 2, n. 2, p. 105-133, Jun. 1977. SMITH, M. K.; WELTY, C.; MCGUINNESS, D. L. OWL : Web Ontology Language Guide. 2004. Disponível em: <http://www.w3.org/TR/2004/REC-owl-guide-20040210/>. Acesso em: 2 fev. 2014. SOBRAL, F. C. F.; CAMPOS, M. L. A. Modelaem conceitual como instrumento de comunicação no processo de submissão de artigos de periódico eletrônico. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 14., 2013, Florianópolis. Anais... Brasília: ANCIB, 2013. Disponível em: <http://enancib.sites.ufsc.br/index.php/enancib2013/XIVenancib/paper/viewFile/348/322>. Acesso em: 10 dez. 2013. SOUZA, F. C. S. As possibilidades pedagógicas no ensino de metodologia da pesquisa científica em Ciência da Informação e os objetos deste campo científico: aproximações durkheimianas. Enc. Bibli.: Eletr. Bibliotecon. Ci. Inf., Florianópplis, n. 16, jul./dez., 2003. Disponível em: <http://eprints.rclis.org/8591/>. Acesso em: 24 mar. 2012. SOUZA, R. R.; ALVARENGA, L. A Web Semântica e suas contribuições para a Ciência da Informação. Ci. Inf . Brasília, v. 33, n. 1, p. 132-141, jan./abr. 2004. SPERBERG-MCQUEEN, C. M.; THOMPSON, H. XML Schema. 2010. Disponível em: <http://www.w3.org/XML/Schema>. Acesso em: 2 mar. 2014. TAUILE. J. R. Uma introdução à economia política da informação. Ensaios FEE, Porto Alegre, v. 2, n. 2, p. 89-108, 1981. Disponível em: <http://revistas.fee.tche.br/ndex.php/ensaios/article/viewArticle/135>. Acesso em: 02 set. 2012. TEOREY, T. J.; YANG, D.; FRY, J. A logical design methodology for relational databases using the extended Entity-Relationship Model. Computing surveys, v. 18, n. 2, p. 197-222. Jun. 1986. THANEY, K. Sharing data on the Web. Nodalities: the magazine of the Semantic Web, v. 9, p. 7-8, 2010. THOMPSON, H. S. What’s a URI and why does it matter?. 2010. Disponível em: <http://www.ltg.ed.ac.uk/~ht/WhatAreURIs/>. Acesso em: 5 mar. 2014. UNITED NATIONS. Department of Economic and Social Affairs. United Nations E-Government 2012: E-Government for the people. Ney York: United Nations, 2012. Disponível em: <http://unpan1.un.org/intradoc/groups/public/documents/ un/unpan048065.pdf>.Acesso em: 21 abr. 2013.

Page 170: modelagem e representação semântica de dados governamentais

167

UNITED STATES. Data.gov. 2013. Disponível em: <http://www.data.gov/about>. Acesso em: 1 maio 2013. USCHOLD, M.; GRÜNINGER, M. Ontologies: principles, methods, and applications. Knownledge Enginnering Review, v. 1, p. 96-137, 1996. Disponível em: <http://citeseerx.ist.psu.edu/viewdoc/summary? doi=10.1.1.111.5903>. Aceso em: 14 jan. 2012. VALENTÍN RUIZ, F. J.; BUENESTADO DEL PESO, R. Aproximación al panorama actual de la reutilización de la información del sector público. BID : textos universittaris de biblioteconomia i documentación, Barcelona, n. 29, p. 1-36, dic. 2012. Disponível em: < http://www.ub.edu/bid/29/valentin2.htm>. Acesso em: 4 mar. 2013. VANDENBUSSCHE, P.-Y. Linked Open Vocabularies (LOV). [2014?]. Disponível em: <http://lov.okfn.org/dataset/lov/index.html>. Acesso em: 2 mar. 2014. VAZ, J. C.; RIBEIRO, M. M.; MATHEUS, R. Dados governamentais abertos e seus impactos sobre os conceitos e práticas de transparência no Brasil. Cadernos PPG-AU/UFBA, v. 9, ed. esp., p. 45-62, 2010. Disponível em: <http://www.portalseer. ufba.br/index.php/ppgau/article/view/5111>. Acesso em: 28 jun. 2011. VIEGAS, W. Fundamentos lógicos da metodologia científica. Brasília: UNB, 2007. W3C. Escritório Brasil. Melhorando o acesso ao governo com melhor uso da Web. São Paulo: W3C, 2009. Disponível em: <http://www.w3c.br/divulgacao/pdf/ gov-web.pdf>. Acesso em: 28 jun. 2011. W3C. Event. In: DUL ssn. 2005. Disponível em: <http://www.w3.org/2005/Incubator/ssn/wiki/DUL_ssn#Event>. Acesso em: 15 dez. 2013. W3C. SKOS Simple Knowledge Organization System: reference. 2009. Disponível em: <http://www.w3.org/TR/2009/REC-skos-reference-20090818/>. Acesso em: 2 jun. 2013. W3C. The Cambridge comunique: w3c note 7 October 1999. 1999. Disponível em: <http://www.w3.org/TR/schema-arch>. Acesso em: 2 fev. 2014. WELTY, C.; GUARINO, N. Supporting ontological analysis of taxonomic relationships. Data & Knowledge Engineering, v. 39, p. 51-74, 2001. WERSIG, G. Information Science: the study of postmodern knowledge usage. Information Processing & Management, v. 29, n. 2, p. 229-239, 1993. WIKILEAKS. What is WikiLeaks?. 2013. Disponível em: <http://wikileaks.org/About.html>. Acesso em: 01 maio 2013. WIKIPÉDIA. Crowdfunding . 2013a. Disponível em: <http://pt.wikipedia.org/wiki/ Financiamento_coletivo>. Acesso em: 24 abr. 2013. WIKIPÉDIA. Crowdsourcing. 2013b. Disponível em: <http://pt.wikipedia.org/wiki/ Crowdsourcing>. Acesso em: 24 abr. 2013.

Page 171: modelagem e representação semântica de dados governamentais

168

WIKIPÉDIA. Smart Grid . 2013c. Disponível em: <http://en.wikipedia.org/wiki/ Smart_grid>. Acesso em: 1 maio 2013. XU, L.; LEE, S. W.; KIM, S. E-R Model based RDF data storage in RDB. In: IEEE International Conference on Computer Science and Information Technology (ICCSIT) (3rd., 2010, Chengdu). Proceedings… 2010. v. 9. Disponível em: <http://ieeexplore.ieee.org/xpl/mostRecentIssue.jsp?punumber=5550976>. Acesso em: 2 mar. 2014. ZILLER, J.; MANTOVANI, C. M. C. A.; SOUZA, R. R. Apontamentos para o futuro dos sistemas de recuperação de informação. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 8, 2007, Salvador. Anais... Salvador: ANCIB, 2012. ZUGMAN, F. Governo eletrônico. São Paulo: Livro Pronto, 2006.