30
11/09/2018 1 Onde estamos

Visualização de Busca - marilia.unesp.br · 03/05/2017 1 Visualização de Resultados de Busca Introdução A busca por informação é um processo impreciso; O usuário de um sistema

Embed Size (px)

Citation preview

11/09/2018

1

Onde estamos

11/09/2018

2

Para onde vamos

Interface de Resultados de busca

11/09/2018

3

Introdução

� A busca por informação é um processo impreciso;

� O usuário de um sistema de recuperação de informação geralmente possui apenas uma vaga noção de como recuperar a informação (documentos) que necessita;

� A interface pode ajudar o usuário na tarefa de expressar a sua necessidade de informação, entender os resultados da busca e selecionar os documentos relevantes.

Introdução

� A qualidade de um sistema, na maioria das vezes, é avaliado pela sua interface;

� Se bem concebidos, os sistemas eficazes geram sentimentos positivos em seus usuários.

� Quando um sistema é bem projetado, a interface quase desaparece, permitindo que os usuários se concentrar em seu trabalho, realizando-o de maneira prazerosa.

11/09/2018

4

Introdução

� A representação visual pode comunicar certos tipos de informação muito mais rapidamente do que qualquer outro método;

� Porém, a visualização de informações abstratas é inerentemente difícil;

◦ a língua é o principal meio de comunicação de ideias abstratas;

Visualização de Informação

11/09/2018

5

Visualização de Informação

� Área da ciência que tem por objetivo o estudo das principais formas de representações gráficas para apresentação de informações, a fim de contribuir para o melhor entendimento delas, bem como ajudar a percepção do usuário na dedução de novos conhecimentos baseado no que está sendo apresentado (FREITAS et al., 2001).

� Para que seja possível a construção de representações visuais, a Visualização de Informação trabalha em parceria com as ferramentas computacionais, que se configuram como facilitadoras dos processos de visualização.

� Mazza (2009) explica que embora a visualização não dependa necessariamente de computadores para cumprir seu papel, as ferramentas computacionais potencializam o uso de visualizações.

Modelos de visualização de informação

11/09/2018

6

Modelos de visualização de informação

� Bifocal Display

◦ Itens informacionais são colocados em três áreas diferentes, sendo a central a que apresenta a informação em destaque, enquanto as outras informações do contexto geral são figuradas nas laterais da região focal.

� Perspective Wall

◦ o espaço de informação é colocado em uma "parede", com os “muros” laterais contendo a informação não destacada no momento (contexto).

Modelos de visualização de informação

11/09/2018

7

Modelos de visualização de informação

Bifocal Display Concept: video from 1982

https://www.google.com/culturalinstitute/exhibit/QQ-RRh0A

11/09/2018

8

Modelos de visualização de informação

� ConeTree

◦ Utiliza uma representação de informações hierárquica na qual o nó raiz de uma árvore é localizado no ápice e suas ramificações são apresentadas logo abaixo.

◦ O objetivo é apresentar uma estrutura na qual uma hierarquia inteira (ou um grande parte dela) seja visível sem necessidade de scrolling, e permita a supressão ou exibição de nós durante a navegação.

◦ Com recursos de rotação, animação e zoom, a representação oferece acesso rápido às informações com boa orientação para visualização.

11/09/2018

9

Esquema básico da técnica cone tree, com as ramificações dispostas na basede um cone, com nodo principal no topo.

11/09/2018

10

3D conetree

3D conetree horizontal

Modelos de visualização de informação

� Treemaps

◦ A estrutura representada em subdivisões sucessivas. Cada uma dessas subdivisões representa um diretório, e que por sua vez, também possui outras subdivisões.

◦ Essa técnica, também conhecida como space-filling, foi o pioneiro de diversas outras abordagens similares (CushionTreeMaps, Information Slices e a interface do Sunburst).

Esquema básico da técnica treemaps.

11/09/2018

11

À esquerda um example de representação em árvore, onde um número é associado a cada folha;

Os nós internos representam a soma dos valores dos nós-filho;

À direita a representação da árvore utilizando treemap;

(MAZZA, 2009, p.84)

Treemap da preferência de refrigerantes (soft drink) em um pequeno grupo de pessoas.

11/09/2018

12

Utilização de um HD

https://www.jam-software.com/treesize_free/tree_map.shtml

11/09/2018

13

Treemap dos votos por município e estado nas eleições presidenciais norte-americanas de 2012

https://www.treemap.com/datasets/uselections

Bilionários do mundo (Forbes) https://www.treemap.com/datasets/billionaires/

11/09/2018

14

Modelos de visualização de informação

� HyperbolicTree

◦ Apresenta hierarquias através de uma visualização radial disposta em um plano hiperbólico.

◦ Apresenta ainda aspectos de construção conhecidos como espinha de peixe através da indicação de um nodo de interesse, que é exibido no centro da interface enquanto o contexto é mantido no restante do diagrama.

Esquema básico da técnica hyperbolic tree

11/09/2018

15

11/09/2018

16

Modelos de visualização de informação

� Representação Hierárquica◦ Os elementos se apresentam em diferentes níveis, ramificações

ou agrupamentos, que descendem de um nó raiz – é uma representação comum de dados que tem em sua própria natureza uma visualização hierárquica, como por exemplo, uma visualização de estruturas complexas de diretórios de arquivos de um HD.

◦ No caso da visualização de dados multidimensionais, onde não estão definidas de forma explícita as relações hierárquicas, as representações hierárquicas se utilizam de aplicações de técnicas de agrupamento.

◦ Este é o caso de técnicas estatísticas de clustering que através de um processo interativo são agrupados diferentes elementos em função de sua similaridade, formando assim grupos em diferentes níveis hierárquicos.

11/09/2018

17

Modelos de visualização de informação

� Representação em Rede◦ Diferentes elementos (documentos, termos, etc.) são

apresentados em forma de nós ou vértices, de maneira que a estrutura se encontra definida pelas relações ou arcos de proximidade de cada nó em forma de teia, não possuindo uma relação de hierarquia.

◦ O problema ao representar dados multidimensionais desta forma é que o número de nós e vértices pode chegar a tal tamanho que seria incompreensível o grafo resultante.

◦ É necessário, portanto, o emprego de técnicas de redução de relações a fim de que a interface final seja compreensível e útil para a visualização, sem perder ou distorcer a realidade estrutural da rede. Uma destas técnicas de redução é o método de escalonamento de rede Pathfinder, apresentando redes denominadas Pathfinder ou PFNETs.

Representação em Pathfinder

11/09/2018

18

Um exemplo de grafo (rede) para representar uma rede social.

11/09/2018

19

Modelos de visualização de informação

� Diagrama de Dispersão◦ Agrupamento de pontos e sua dispersão;

◦ Estes pontos estariam distribuídos em um espaço visual bi ou tridimensional, e distanciados um dos outros através das dissimilaridades e distâncias especificadas em uma matriz de similaridade.

◦ Observando o padrão de disposição dos pontos é possível concluir relação entre as variáveis envolvidas no problema

11/09/2018

20

Modelos de visualização de informação

� Mapas◦ Se fundamentam na ideia de utilizar da metáfora de mapas

geográficos para a visualização de espaços de informação;

◦ O objetivo da utilização de qualquer tipo de metáfora visual em um desenho de interface é fazer visível para o usuário a estrutura e relação de um determinado conjunto de dados.

◦ A utilização deste tipo de metáfora para visualização de espaços de informação complexos e abstratos permite uma visão diferente do conjunto de dados que na maioria dos casos enriquecerá a imagem mental prévia que o usuário possua.

◦ Dentre todas as técnicas possíveis para gerar este tipo de mapa, vale ressaltar o modelo de mapas auto-organizáveis ou SOM (Self-Organizing Map) (KOHONEN, 1989). O SOM são aplicações de Redes Neurais Artificiais (RNA) para organização e classificação automática da informação.

Modelos de visualização de informação

� Cartografia temática

◦ Proporciona uma visão global dos assuntos tratados em uma coleção de documentos e evidencia relações entre esses assuntos, possui uma navegação simples, possibilitando a localização de informações.

◦ É um método para organizar automaticamente coleções de documentos textuais e gerar mapas visuais dos assuntos tratados a fim de facilitar a mineração de conhecimento e recuperação da informação.

◦ Os documentos estão agrupados em pontos do mapa, de acordo com a similaridade de conteúdo. Os documentos agrupados em cada ponto são listados, e o seu conteúdo pode ser consultado clicando nos pontos visíveis no nível de menor zoom do mapa.

11/09/2018

21

Análise de co-ocorrência baseado no WebSOM

http://users.ics.aalto.fi/krista/papers/lagus99aire.pdf

Cartografia Temática

A cor indica a densidade ou a tendência de agrupamento dos documentos,• o amarelo indica maior densidade de

documentos. • As áreas em vermelho indicam as áreas de

menor densidade. • As palavras no mapa representam os tópicos

ou assuntos e indicam o contexto dos grupos de documentos.

Essa visualização é efetiva para o usuário que deseja explorar a coleção de documentos, conhecer os tópicos mais discutidos, tópicos relacionados e os documentos que tratam de cada tópico.

Ao clicar em uma palavra serão obtidos os documentos localizados na região selecionada.

Visão geral Primeiro zoom Segundo zoom

O WEBSOM é aplicável a qualquer tipo de coleção de documentos textuais.

É especialmente adequado para tarefas de exploração nas quais os usuários não conhecem

muito bem o domínio ou têm apenas uma ideia limitada do conteúdo do banco de dados de texto completo que está sendo examinado.

Com o WEBSOM, os documentos são organizados de acordo com seu conteúdo. Os mapas ajudam na exploração, fornecendo uma visão geral do espaço de informações.

LAGUS et al, 1999

11/09/2018

22

Níveis da interface WEBSOM:(1) o mapa inteiro(2) o mapa ampliado(3) o nó do mapa (4) a visão do documento

A movimentação entre os níveis ou áreas vizinhas no mesmo nível é feito por cliques do mouse nas imagens ou nos links do documento.

Uma vez que uma área interessante no mapa tenha sido encontrada, explorar os documentos relacionados nas áreas vizinhas é simples.

Modelos de visualização de informação

� Distorção Visual

Aplicação da visão olho de peixe (FisheyeView) com a ferramenta “aiSee”

11/09/2018

23

Modelos de visualização de informação

� Nuvem de tags (tag clouds)

� http://www.exocortex.org/netviz/

� http://moebio.com/research/lifeuniverse/?utm_source=buffer&utm_campaign=Buffer&utm_content=buffer97813&utm_medium=twitter

� http://philogb.github.io/page/temperature-anomalies

11/09/2018

24

Visualização de Resultados de Busca

Visualização de Resultados de Busca

11/09/2018

25

Visualização de Resultados de Busca

� A interface utilizada em sistema de recuperação de informação mudou muito pouco desde a década de 1950, apesar de existir muitas interfaces alternativas sendo propostas e desenvolvidas por vários pesquisadores.

� Os usuários fornecem uma lista de palavras-chave e é apresentada lista de páginas que contêm as palavras-chave;

� Os usuário se veem diante da tarefa de verificar cada um dos documentos (links) para obter as informações que procuram.

Visualização de Resultados de Busca

� As desvantagens das interfaces (textuais) baseadas em uma lista de (links a) documentos são:◦ O usuário precisa verificar sequencialmente uma longa lista de

resultados;

◦ O usuário não é informado o motivo pelo qual um determinado documento foi recuperado;

◦ Da mesma forma, o usuário não é informado da relação entre um determinado documento com a sua busca;

◦ Não são apresentadas similaridades entre documentos;

◦ São apresentados aos usuários apenas um pequeno fragmento do documento.

(HOBBS; PFITZNER;POWERS, ?)

11/09/2018

26

Visualização de Resultados de Busca

SearchMe

Visualização de Resultados de busca

� Clustering (Grokker)

◦ Executava as buscas nas principais ferramentas de busca e agrupa seus resultados, apresentando os grupos de forma visual.

◦ A empresa Groxis, desenvolvedora do sistema, enfatizava que é o Grokker uma ferramenta que facilita uma abordagem holística para entender informações complexas e desconectadas, permitindo a descoberta de relações inicialmente não conhecidas.

◦ Embora tenha recebido diversos prêmios de indústria dos Estados Unidos, a Groxis, fundada em 2001, encerrou suas atividades em março de 2009.

◦ Grokker foi projetado ser um meta-buscador que apresenta os resultados de busca de uma forma visual e intuitiva.

11/09/2018

27

Visualização de Resultados de busca

� Clustering (Grokker)

Visualização de Resultados de busca

� Clustering (Grokker)

11/09/2018

28

Visualização de Resultados de busca

� Clustering (Grokker)

Digital Vaults

11/09/2018

29

Visualização de Resultados de busca

� Ontologia como interface

VOWL

documentoTermos de Indexação

tétanoclostidium

tetanidoença

bacterianavacinação

doença infecciosa

doc1 0,6 0,3 0,5 0,8 -doc2 0,3 0,8 0,3 - 0,3doc3 0,9 0,2 - 0,8 -doc4 0,2 - 0,6 - 0,8

11/09/2018

30

Referências

Referências

FREITAS, C. M. D. S.; CHUBACHI, O. M.; LUZZARDI, P. R. G.; CAVA R. A. Introdução à Visualização de Informações. RITA – Revista de Informática Teórica e Aplicada, Instituto de Informática, v. 8, p.143-158, 2001.

HOBBS, V.; PFITZNER, D.; POWERS, D. A Survey of InformationRetrieval Interfaces. 2002.

LAGUS, K; HONKELA, T; KASKI, S; KOHONEN, T. WEBSOM for Textual Data Mining. Artificial Intelligence Review, n.13, 1999.

MAZZA, R. Introduction to information visualization. New York, NY: Springer, 2009.

SHAW, Debora. The Human-computer Interface for Information Retrieval. Annual Review of Information Science andTechnology, n.26, 1991.

SHNEIDERMAN, B.; PLAISANT, C.; COHEN, M.; JACOBS, S.; ELMQVIST, N.; DIAKOPOULOS, N. Designing the User Interface: Strategies for Effective Human-Computer Interaction. 6a. ed, Person, 2016.