18
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL INSTITUTO DE INFORMÁTICA PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO ALEXANDRE LORENZATTI Análise de modelos para a representação de conhecimento visual Trabalho Individual I TI-xxx Profa. Dra. Mara Abel Orientador Prof. Dr. Claiton Scherer Co-orientador Porto Alegre, dezembro de 2008

Análise de modelos para a representação de conhecimento visual filecomo uma relação entre seu detentor e uma proposição, como por exemplo “Alexandre sabe que o Rio Grande

Embed Size (px)

Citation preview

Page 1: Análise de modelos para a representação de conhecimento visual filecomo uma relação entre seu detentor e uma proposição, como por exemplo “Alexandre sabe que o Rio Grande

UNIVERSIDADE FEDERAL DO RIO GRANDE DO SULINSTITUTO DE INFORMÁTICA

PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO

ALEXANDRE LORENZATTI

Análise de modelos para a representação deconhecimento visual

Trabalho Individual ITI-xxx

Profa. Dra. Mara AbelOrientador

Prof. Dr. Claiton SchererCo-orientador

Porto Alegre, dezembro de 2008

Page 2: Análise de modelos para a representação de conhecimento visual filecomo uma relação entre seu detentor e uma proposição, como por exemplo “Alexandre sabe que o Rio Grande

SUMÁRIO

LISTA DE FIGURAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

LISTA DE TABELAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

RESUMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

ABSTRACT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2 MODELOS DE REPRESENTAÇÃO DE CONHECIMENTO VISUAL . . 92.1 Uma Abordagem Baseada em Ontologia para Representação de Conhe-

cimento Visual: Anotação e Interpretação de Imagens . . . . . . . . . . 92.2 Ancoramento Simbólico para Interpretação Semântica de Imagens: de

Dados Imagísticos a Semânticos . . . . . . . . . . . . . . . . . . . . . . . 112.3 Construtos Ontológicos para Representação Simbólica de Conhecimento

Visual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122.4 Uma Ontologia de Formatos para a Classificação de Pássaros . . . . . . 13

3 COMPARAÇÃO ENTRE MODELOS . . . . . . . . . . . . . . . . . . . 153.1 Características . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153.2 Comparativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

4 CONCLUSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

Page 3: Análise de modelos para a representação de conhecimento visual filecomo uma relação entre seu detentor e uma proposição, como por exemplo “Alexandre sabe que o Rio Grande

LISTA DE FIGURAS

2.1 K-graph da interpretação de um ambiente diagenético. (Extraída de(SILVA et al., 2004)) . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.2 K-graph de um pacote visual. (Extraída de (SILVA et al., 2004)) . . . 102.3 Ontologia de conceitos visuais referentes à geometria. (Extraída de

(MAILLOT; THONNAT; BOUCHER, 2004)) . . . . . . . . . . . . . 112.4 Comunicação entre níveis de descrição das imagens. (Adaptada de

(MAILLOT; THONNAT; BOUCHER, 2004)) . . . . . . . . . . . . . 122.5 Níveis do modelo de representação de conhecimento. (Extraída de

(SANTIN, 2008)) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132.6 Ontologia de formato de pássaros com elementos pictóricos. (Ex-

traída de (LIU et al., 2007)) . . . . . . . . . . . . . . . . . . . . . . 14

Page 4: Análise de modelos para a representação de conhecimento visual filecomo uma relação entre seu detentor e uma proposição, como por exemplo “Alexandre sabe que o Rio Grande

LISTA DE TABELAS

3.1 Comparativo entre modelos . . . . . . . . . . . . . . . . . . . . . . 16

Page 5: Análise de modelos para a representação de conhecimento visual filecomo uma relação entre seu detentor e uma proposição, como por exemplo “Alexandre sabe que o Rio Grande

RESUMO

A representação do conhecimento visual é um problema ainda em aberto. Diferentesabordagens utilizam modelos de representação de conhecimento visual para representar oconteúdo de imagens. Neste trabalho, primeiramente apresenta-se uma breve discussão arespeito do conceito de conhecimento e sua representação. Diferentes modelos de repre-sentação são descritos de acordo com suas formas de representar o conhecimento visual.Ao final, são apresentadas as principais características em comum aos modelos, assimcomo os modelos são comparados através dessas.

Palavras-chave: Conhecimento visual, modelos de conhecimento.

Page 6: Análise de modelos para a representação de conhecimento visual filecomo uma relação entre seu detentor e uma proposição, como por exemplo “Alexandre sabe que o Rio Grande

ABSTRACT

Analysis of models to represent visual knowledge

Visual knowledge representation is still an open problem. There are different ap-proaches using knowledge models to represent visual content from images. In this work,a brief discussion about the knowledge concept and representation of knowledge is given.Different models are described according to their form in representing visual knowledge.At the end, the main common characteristics are presented and the models are comparedover them.

Keywords: Visual knowledge, knowledge models.

Page 7: Análise de modelos para a representação de conhecimento visual filecomo uma relação entre seu detentor e uma proposição, como por exemplo “Alexandre sabe que o Rio Grande

7

1 INTRODUÇÃO

A representação de conhecimento através de modelos é motivada pela necessidade deinterligar informações do nível simbólico com o nível conceitual, ou seja, o nível onde osconceitos residem.

Conceito é definido como uma idéia ou noção geral. Conceitualizar é o ato ou poderde formar noções, idéias ou conceitos na mente (DALGISH, 2001). Uma conceitualiza-ção é uma visão simplificada e abstrata do mundo, que desejamos explicitá-la por algummotivo (GRUBER, 1993). O conhecimento formalmente representado é baseado em umaconceitualização.

Brachman e Levesque, (BRACHMAN; LEVESQUE, 2004) definem conhecimentocomo uma relação entre seu detentor e uma proposição, como por exemplo “Alexandresabe que o Rio Grande do Sul é um estado” onde o detentor é Alexandre e a proposição éo Rio Grande do Sul é um estado. O que é relevante é a natureza da proposição, o que sepode falar sobre ela, ou seja, se ela é verdadeira ou falsa, correta ou errada.

O conceito de representação é filosoficamente semelhante ao conceito de conheci-mento. A representação é uma relação entre dois domínios onde o primeiro remete aosegundo. Usualmente, o primeiro domínio é algo mais concreto que o segundo. Por exem-plo, uma placa de trânsito no formato de um triângulo remete à idéia de dar a preferênciade passagem para outros veículos. A representação é feita através símbolos formais, ouseja, um caracter ou um conjunto de caracteres provenientes de um alfabeto (BRACH-MAN; LEVESQUE, 2004). Segundo Brachman e Levesque a representação é feita dessamaneira pois assume-se ser mais fácil manipular símbolos do que aquilo que eles repre-sentam. No exemplo citado anteriormente pode-se representar a proposição o Rio Grandedo Sul é um estado por P, assim temos Alexandre sabe que P, ou ainda, Alexandre sabeque é verdade que P. A representação de conhecimento é um campo de estudo cujo ob-jetivo é a utilização de símbolos formais para representar uma coleção de proposições ecriar representações para novas proposições.

Para que um sistema inteligente possa raciocinar, primeiramente deve ser possível queele formule e represente as idéias envolvidas. Assim, torna-se necessária uma linguagemque possua sintaxe, semântica e pragmática bem definidas. Raciocínio é a manipula-ção formal de símbolos que representam uma coleção de proposições. Percebe-se que autilização de símbolos é mais acessível que a utilização de proposições pois, podemosmanipulá-los computacionalmente para construir novas proposições (BRACHMAN; LE-VESQUE, 2004).

Uma imagem é uma função bidimensional f(x,y), onde x e y são coordenadas espaciaise o valor da função f em quaisquer coordenadas (x,y) representa a intensidade da imagemnaquele ponto (GONZALEZ; WOODS, 2007). O conteúdo de uma imagem pode repre-sentar diferentes conceitos e conceitualizações. Porém, uma imagem representa conceitos

Page 8: Análise de modelos para a representação de conhecimento visual filecomo uma relação entre seu detentor e uma proposição, como por exemplo “Alexandre sabe que o Rio Grande

8

de forma não simbólica.A proposta deste trabalho é a análise de diferentes modelos de representação de co-

nhecimento visual para que seja proposto um modelo híbrido na área da EstratigrafiaSedimentar. Esse modelo híbrido será constituído por construtos simbólicos e pictóricosbuscando a representação das conceitualizações difíceis de serem formalizadas.

Page 9: Análise de modelos para a representação de conhecimento visual filecomo uma relação entre seu detentor e uma proposição, como por exemplo “Alexandre sabe que o Rio Grande

9

2 MODELOS DE REPRESENTAÇÃO DE CONHECIMENTOVISUAL

Abordagens existentes para a interpretação semântica de imagens apresentam dife-rentes formas de organizar o conhecimento empregado no processo de interpretação. Aseguir, são apresentados modelos de representação de conhecimento visual empregadosno processo de interpretação semântica de imagens.

2.1 Uma Abordagem Baseada em Ontologia para Representação deConhecimento Visual: Anotação e Interpretação de Imagens

A anotação de imagens guiada por ontologias permite a descrição semântica de ob-jetos visuais presentes em imagens (SILVA et al., 2004). A proposta desse trabalho é aanotação conceitual de imagens realizada em dois níveis. Esse modelo de representaçãode conhecimento visual foi aplicado na área da geologia, mais especificamente na Petro-grafia Sedimentar, onde muitas decisões são tomadas com base no conhecimento visual.

No primeiro nível, o usuário identifica e faz a ligação entre objetos visuais observadose conceitos atômicos. Esses conceitos estão contidos em uma ontologia de domínio esão facilmente identificados por um novato da área de aplicação. Os conceitos contidosna ontologia são construtos necessários para a construção de pacotes visuais e grafos deconhecimento, constituintes do segundo nível.

Figura 2.1: K-graph da interpretação de um ambiente diagenético. (Extraída de (SILVAet al., 2004))

O segundo nível apresenta descrições mais abstratas dos objetos observados, tais como

Page 10: Análise de modelos para a representação de conhecimento visual filecomo uma relação entre seu detentor e uma proposição, como por exemplo “Alexandre sabe que o Rio Grande

10

agregações visuais (padrões visuais). O conhecimento descrito no primeiro nível servecomo base para criação do conhecimento mais abstrato, que é o que dará suporte ao de-senvolvimento de tarefas de raciocínio. Os conceitos desse nível são organizados empacotes visuais, um novo conceito de modelagem de conhecimento visual criado por(ABEL, 2001). Os pacotes visuais representam organizações e padrões criados sobreo conhecimento visual que residem na mente do especialista. Assim, eles representamo conhecimento tácito, difícil de ser externalizado e formalizado, que um especialistadetém.

Figura 2.2: K-graph de um pacote visual. (Extraída de (SILVA et al., 2004))

O conhecimento identificado através de pacotes visuais, associado à interpretaçõesde níveis mais abstratos, é formalizado através de grafos de conhecimento, do inglêsknowledge graphs, (K-graphs). A figura 2.1 apresenta um K-graph onde o nó raiz re-presenta a hipótese de interpretação de um ambiente sedimentar. Seus nós folhas repre-sentam pacotes visuais, identificados por especialistas como evidências da presença deum ambiente sedimentar. O valor entre parênteses indica o peso de cada pacote visual,ou seja, o grau de importância daquele pacote para corroborar a hipótese. Caso identi-ficados e a soma dos pesos seja superior a um determinado limite, no caso 6, então oambiente sedimentar em hipótese é confirmado. O K-graph apresentado na figura 2.2é um detalhamento do pacote visual Iron Oxide. Seus nós folhas representam atributosvisuais identificados pelos especialistas durante a descrição de estruturas sedimentares.Combinados logicamente, esses atributos apontam as evidências necessárias para indicara presença do pacote visual, dando suporte à interpretação do ambiente sedimentar emhipótese.

Page 11: Análise de modelos para a representação de conhecimento visual filecomo uma relação entre seu detentor e uma proposição, como por exemplo “Alexandre sabe que o Rio Grande

11

2.2 Ancoramento Simbólico para Interpretação Semântica de Ima-gens: de Dados Imagísticos a Semânticos

Ancoramento Simbólico (Symbol grounding) é um problema existente no processo deinterpretação semântica de imagens. Esse problema consiste na dificuldade de relacionardados numéricos de uma imagem com dados semânticos que representam e dão signifi-cado ao conteúdo da imagem. O trabalho de (HUDELOT; MAILLOT; THONNAT, 2005)apresenta uma abordagem que realiza a ligação entre esses dados através de um conjuntode níveis.

A abordagem apresentada divide o processo de interpretação de imagens em três ní-veis, low level que trata do processamento algorítmico de imagens através da extração deinformações de pixels e outras informações numéricas (índices de saturação, ruído, brilhoe etc) e da descrição dessas informações através de uma ontologia de imagem. Visuallevel descreve simbolicamente os conceitos visuais da cena e faz a ligação entre o lowlevel e o semantic level. Esse último atribui significado ao conteúdo da cena através deontologias de domínio, específicas ao problema. A ligação realizada entre os níveis dedescrição da imagem é feita através de duas ontologias, apresentadas na seqüência.

A ontologia de conceitos de imagem descreve os dados extraídos pelos algoritmosde processamento. Ela descreve os dados numéricos extraídos das imagens através deconceitos como, tamanho (área, comprimento, . . . ), formato (excentricidade, compacity),cor (cor média, vetores de coerência de cor), entre outros. A descrição dos dados deprocessamento através dessa ontologia faz com que se reduza o “degrau” existente entreo nível de informação da imagem e o nível visual.

Figura 2.3: Ontologia de conceitos visuais referentes à geometria. (Extraída de (MAIL-LOT; THONNAT; BOUCHER, 2004))

A ontologia que realiza a ligação entre os dados extraídos diretamente das imagense os dados semânticos, utilizada nessa abordagem, foi proposta por (MAILLOT; THON-NAT; BOUCHER, 2004). Ela é independente de domínio e estabelece o vocabuláriocomumente utilizado por humanos na descrição visual de objetos e cenas. Seu objetivoé descrever os conceitos vindos do nível inferior através de conceitos visuais elevendo onível de abstração. Os conceitos dessa ontologia estão divididos em três porções. Con-ceitos espaciais que descrevem objetos através de conceitos como formato (arredondado,quadrado, retangular, . . . ), localização, tamanho, entre outros, indicando características

Page 12: Análise de modelos para a representação de conhecimento visual filecomo uma relação entre seu detentor e uma proposição, como por exemplo “Alexandre sabe que o Rio Grande

12

de espacialidade dos objetos. Conceitos de cor, como brilho e saturação e conceitos detextura como granulação e orientação representam as outras duas porções na quais a on-tologia está organizada. A figura 2.3, apresenta uma porção da ontologia referente àconceitos geométricos.

A figura 2.4, extraída de (HUDELOT; MAILLOT; THONNAT, 2005), apresenta alocalização de cada ontologia nos níveis e a forma com que ambas realizam a interligaçãodos níveis de descrição do conhecimento visual. O exemplo apresentado descreve umalaranja contida na imagem.

Figura 2.4: Comunicação entre níveis de descrição das imagens. (Adaptada de (MAIL-LOT; THONNAT; BOUCHER, 2004))

2.3 Construtos Ontológicos para Representação Simbólica de Co-nhecimento Visual

A qualidade de uma rocha, como reservatório de petróleo, é afetada pelos processosdiagenéticos que modificam a porosidade e permeabilidade dos sedimentos. A análise pe-trográfica permite a compreensão de aspectos importantes que influenciam a qualidade deum reservatório. Esses aspectos são observados em imagens capturadas de rochas extraí-das de reservatórios. A automatização do processo de análise desses aspectos é motivadapela redução da quantidade de tempo empregada nessa tarefa e pela formalização de ummétodo subjetivo, ou seja, que envolve conhecimento visual e tácito.

A abordagem apresentada por (SANTIN, 2008), aplicada no domínio descrito acima,divide o processo de interpretação de imagens em três níveis independentes que podemser utilizados de forma isolada. O nível de processamento trata as imagens com granu-laridade de informação ao nível de pixel. Nesse nível, os elementos das imagens sãoextraídos através de algoritmos de processamento que segmentam a imagem, ou atravésde segmentação manual. As informações extraídas nesse nível são mapeadas para primi-tivas identificadas no nível seguinte, descrito abaixo.

Page 13: Análise de modelos para a representação de conhecimento visual filecomo uma relação entre seu detentor e uma proposição, como por exemplo “Alexandre sabe que o Rio Grande

13

O nível visual realiza a distinção dos elementos que compõem a imagem entre objetosprincipais, fundo da imagem e contornos. Nesse nível, também representam-se os rela-cionamentos topológicos entre os objetos. As primitivas de representação presentes nessenível associam os elementos extraídos de imagens através da seleção feita pela atençãovisual.

No nível semântico, atribui-se significado aos objetos identificados no nível visual,através da utilização de uma ontologia de domínio da área da Petrografia Sedimentar.

O mapeamento entre os níveis garante a identidade dos objetos de cada um dos níveis,assim pode-se partir de um objeto do nível semântico e encontrar seu correspondente nonível de processamento de imagem. Esse mapeamento é realizado através de tabelas queassociam as primitivas de cada nível. A figura 2.5 apresenta os níveis do modelo assimcomo o mapeamento entre as objetos.

Figura 2.5: Níveis do modelo de representação de conhecimento. (Extraída de (SANTIN,2008))

2.4 Uma Ontologia de Formatos para a Classificação de Pássaros

Situado no domínio da ornitologia, (LIU et al., 2007) tem como objetivo de pesquisaa classificação de pássaros através de características visuais. A abordagem apresenta umframework constituído por duas ontologias, uma de domínio e outra de conteúdo visual.

A ontologia de domínio contém conhecimento obtido a partir de especialistas. Assimcomo outras ontologias de domínio, ela é responsável pelo conhecimento compartilhadoe provém informações semânticas utilizadas na classificação de pássaros. Essa ontologia

Page 14: Análise de modelos para a representação de conhecimento visual filecomo uma relação entre seu detentor e uma proposição, como por exemplo “Alexandre sabe que o Rio Grande

14

foi construída a partir de uma base de informações presente no domínio.A ontologia de conhecimento visual é organizada de acordo com características visu-

ais como formato do corpo, bico e asas. Os conceitos visuais da ontologia foram obtidosatravés de generalizações dos formatos originais dos pássaros. Assim, pássaros com o for-mato do corpo semelhante foram organizados através de especializações de um formatocompartilhado. A figura 2.6 apresenta a ontologia criada para representar o conhecimentovisual aplicado na classificação de pássaros. Os formatos presentes à direita da figuraforam obtidos através do processamento e clusterização de diferentes imagens, captura-dos através de fotografias dos animais. Com a clusterização das imagens, foram obtidosformatos geréricos que representam diferentes espécies de pássaros.

Figura 2.6: Ontologia de formato de pássaros com elementos pictóricos. (Extraída de(LIU et al., 2007))

Ambas ontologias apresentadas capturam diferentes aspectos do domínio. A ontolo-gia de domínio captura o conhecimento dos especialistas da área enquanto que a ontologiade formatos captura as características visuais dos animais. No entanto, ambas ontologiascompartilham conceitos em comum. Os conceitos comuns entre ambas ontologias sãomapeados entre si, relacionando assim o conhecimento de domínio ao conhecimento vi-sual capturado.

Page 15: Análise de modelos para a representação de conhecimento visual filecomo uma relação entre seu detentor e uma proposição, como por exemplo “Alexandre sabe que o Rio Grande

15

3 COMPARAÇÃO ENTRE MODELOS

Este capítulo apresenta uma análise das características dos modelos descritos anteri-ormente, comparando-os por meio dessas.

3.1 Características

Ao analisar os modelos de representação de conhecimento visual descritos no capítulo2 observou-se um conjunto de características em comum, descritas na seqüência.

Observou-se que os modelos apresentados são divididos em níveis de representaçãoonde as informações são agrupadas de acordo com o grau de abstração. Os níveis possuí-dos pelos modelos são geralmente, nível da imagem (não presente em todos os modelos),onde as informações das imagens são tratadas ao nível de pixel e conceitos atômicos. Umnível onde as imagens são descritas através de conceitos visuais e um nível onde onde oconteúdo da imagem recebe significado através da utilização de ontologias de domínio.

A comunicação estabelecida entre os níveis dos modelos é feita de duas maneirasdiferentes. Na maioria dos modelos ela é realizada através da descrição de conceitos maisconcretos por meio de conceitos mais abstratos, provenientes das ontologias, levandoinformações do nível da imagem ao nível semântico. A outra forma de comunicaçãoconsiste no mapeamento direto entre conceitos com a utilização de tabelas.

Dentre os modelos analisados, apenas um apresenta elementos pictóricos agregadosao seu conteúdo. Os outros modelos apresentam apenas conteúdo textual.

Três dos quatro modelos analisados foram construídos com aplicação direta sobre umdomínio, tornando-os assim, modelos dependentes de domínio. O modelo construído semaplicação direta sobre um domínio possui construtos genéricos, utilizados na descrição deelementos visuais e cenas de quaisquer domínios.

Dos modelos analisados, dois deles apresentam processamento simbólico de informa-ções, enquanto que outros dois, além disso, apresentam processamento de imagens.

Na seção a seguir, os modelos são comparados por meio dessas características.

3.2 Comparativo

A seguir, os modelos são comparados sobre a visão das características elencadas naseção anterior.

Os modelos comparados (SILVA et al., 2004), (HUDELOT; MAILLOT; THONNAT,2005), (SANTIN, 2008) e (LIU et al., 2007) serão referenciados, a partir deste momento,por Silva, Hudelot, Santin e Liu, respectivamente.

Os modelos propostos por Silva e Liu apresentam apenas dois níveis mais abstratos de

Page 16: Análise de modelos para a representação de conhecimento visual filecomo uma relação entre seu detentor e uma proposição, como por exemplo “Alexandre sabe que o Rio Grande

16

representação, os níveis visual e semântico. As propostas de Hudelot e Santin, no entanto,apresentam modelos onde o conteúdo extraído das imagens é representado ao longo detrês níveis, partindo do nível da imagem até o nível semântico.

A abordagem apresentada por Santin realiza a comunicação entre os níveis de formadiferente do restante das abordagens. Nessa abordagem a comunicação é realizada atra-vés de tabelas de mapeamento, que relacionam os conceitos existentes em cada um dosníveis. No restante das abordagens, a comunicação entre níveis é feita por meio da cor-respondência entre os conceitos das ontologias.

Dentre os modelos analisados, apenas o modelo proposto por Liu apresenta conteúdohíbrido, ou seja, o conteúdo utilizado no modelo para descrever o conhecimento visual étextual e pictórico. Entretanto, o conteúdo dos outros modelos é representado apenas deforma textual.

A dependência de domínio está relacionada à aplicação do modelo proposto. Apenaso modelo apresentado por Hudelot é genérico e descreve conhecimento visual indepen-dentemente de domínio. Essa independência é proporcionada pela ontologia de conceitosvisuais apresentada.

Os modelos de Silva e Liu realizam o processamento simbólico das informações con-tidas em seus modelos, enquanto que os modelos propostos por Hudelot e Santin tambémapresentam processamento de imagens.

A tabela 3.1 sintetiza o comparativo entre os modelos.

Tabela 3.1: Comparativo entre modelosSilva Hudelot Santin Liu

Quantidade de níveis 2 3 3 2Níveis possuídos Visual e Semântico Imagem, Visual e Semântico Imagem, Visual e Semântico Visual e Semântico

Comunicação entre os níveis Ontologias Ontologias Tabelas OntologiasConteúdo híbrido Não Não Não Sim

Dependência de domínio Sim Não Sim SimRepresentação Textual Textual Textual Textual + PictóricoProcessamento Simbólico Imagem + Simbólico Imagem + Simbólico Simbólico

Page 17: Análise de modelos para a representação de conhecimento visual filecomo uma relação entre seu detentor e uma proposição, como por exemplo “Alexandre sabe que o Rio Grande

17

4 CONCLUSÃO

Neste trabalho foram apresentados quatro modelos diferentes para a representaçãode conhecimento visual. Esses modelos foram comparados através de características emcomum identificadas.

A representação do conhecimento visual através de níveis divide o problema de ex-tração de conteúdo de imagens em problemas mais simples. Essa divisão faz com que oconteúdo da imagem seja descrito, ao longo dos níveis, por conceitos com maior nível deabstração e significado.

A independência de domínio do modelo de representação de conhecimento visualproporciona maior flexibilidade na aplicação do modelo e na descrição do conteúdo deimagens. No entanto, a dependência de domínio proporciona maior precisão, em relaçãoà semântica da descrição realizada.

A proposta de um modelo híbrido (textual e pictórico) de representação de conheci-mento visual é interessante e se destaca entre as outras abordagens em decorrência dacorrespondência entre o conteúdo da imagem que está sendo descrito e do elemento pic-tórico contido no modelo. Além disso, os elementos pictóricos conseguem representaro conhecimento tácito, de difícil formalização, onde os modelos que possuem conteúdopuramente textual não conseguem representar por completo.

Page 18: Análise de modelos para a representação de conhecimento visual filecomo uma relação entre seu detentor e uma proposição, como por exemplo “Alexandre sabe que o Rio Grande

18

REFERÊNCIAS

ABEL, M. Estudo da Perícia em Petrografia Sedimentar e sua Importância para aEngenharia do Conhecimento. 2001. Tese (Doutorado em Ciência da Computação) —Universidade Federal do Rio Grande do Sul.

BRACHMAN, R. J.; LEVESQUE, H. J. Knowledge Representation and Reasoning.[S.l.]: Morgan Kaufmann, 2004. 381p.

DALGISH, G. M. (Ed.). Random House Websters easy english dictionary. [S.l.]: Ran-dom House, 2001.

GONZALEZ, R. C.; WOODS, R. E. Digital image Processing. 3.ed. [S.l.]: Prentice Hall,2007. 954p.

GRUBER, T. R. A translation approach to portable ontology specifications. KnowledgeAcquisition, [S.l.], v.5, p.199–220, 1993.

HUDELOT, C.; MAILLOT, N.; THONNAT, M. Symbol Grounding for Semantic ImageInterpretation: from image data to semantics. International Conference on ComputerVision Workshops, Los Alamitos, CA, USA, v.0, p.1875, 2005.

LIU, Y.; ZHANG, J.; TJONDRONEGORO, D.; GEVE, S. A Shape Ontology Frameworkfor Bird Classification. Digital Image Computing Techniques and Applications, 9thBiennial Conference of the Australian Pattern Recognition Society on, [S.l.], p.478–484, Dec. 2007.

MAILLOT, N.; THONNAT, M.; BOUCHER, A. Towards ontology-based cognitive vi-sion. Machine Vision and Applications, [S.l.], v.16, p.33–40, 2004.

SANTIN, C. E. Construtos ontológicos para representação simbólica de conheci-mento visual. 2008. Dissertação (Mestrado em Ciência da Computação) — UniversidadeFederal do Rio Grande do Sul.

SILVA, L. A. L.; MASTELLA, L. S.; ABEL, M.; GALLANTE, R. M.; ROS, L. F. D. AnOntology-Based Approach for Visual Knowledge: image annotation and interpretation.In: WORKSHOP ON ONTOLOGIES AND THEIR APPLICATIONS, IN XVII BRA-ZILIAN SYMPOSIUM ON ARTIFICIAL INTELLIGENCE (SBIA), 2004, São Luis,Brazil. Anais. . . [S.l.: s.n.], 2004.