47
UNIVERSIDADE CATÓLICA DE PELOTAS ESCOLA DE INFORMÁTICA PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA Estudo e desenvolvimento de uma Ferramenta de Visualização de Informações adaptável para Sistemas de Monitoramento por Edécio Fernando Iepsen Trabalho Individual I TI-2006/2-004 Orientador: Prof. Dr. Paulo Roberto Gomes Luzzardi Co-orientador: Prof. Dr. Stanley Loh Pelotas, dezembro de 2006

Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

  • Upload
    lylien

  • View
    218

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

UNIVERSIDADE CATÓLICA DE PELOTAS ESCOLA DE INFORMÁTICA

PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA

Estudo e desenvolvimento de uma Ferramenta de Visualização de Informações adaptável para

Sistemas de Monitoramento

por Edécio Fernando Iepsen

Trabalho Individual I TI-2006/2-004

Orientador: Prof. Dr. Paulo Roberto Gomes Luzzardi

Co-orientador: Prof. Dr. Stanley Loh

Pelotas, dezembro de 2006

Page 2: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

AGRADECIMENTOS

Agradeço a Deus pelo maravilhoso presente da vida e por Jesus Cristo meu Senhor

e Salvador.

A minha mãe, Leonídia, pelo incentivo e confiança em todos os momentos da

minha vida e toda a minha família, meu padastro Wersino, meu irmão Eduardo e minha

irmã Elenice.

A minha namorada Delair, pelos momentos compartilhados.

Ao meu orientador Prof. Dr. Paulo Roberto Gomes Luzzardi, pelo auxílio na

realização deste trabalho e pelo apoio e amizade no decorrer de todas as etapas do

mestrado.

Ao meu co-orientador Prof. Dr. Stanley Loh, pelas importantes contribuições no

desenvolvimento deste trabalho.

A todos os meus amigos e amigas do mestrado (Verlani, Rosaura, Cristiano,

Eduardo, Rogério, João, Conrado, Vanessa, Diego); das instituições de ensino em que atuo

ou atuei: Senac Pelotas (Paulo Ricardo, Mário Capanema, Cléber, Daniele, Maristela...),

Senac Porto Alegre (Franz, Ivonei, Cristiane, Miguel, Isabel...), Santa Margarida (Adriana,

Tiago, Luciane, Renato...), UCPel (Boaventura, Hugo, Cláudia...) e Colégio Objetivo

(Cláudia, Rosali...). Pessoas muito importantes em diversos momentos de minha vida, que

me oportunizaram o desafio do ensinar e compartilharam experiências nesta fascinante arte

do viver e ser feliz.

2

Page 3: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

SUMÁRIO

LISTA DE FIGURAS ........................................................................................................... 5

LISTA DE ABREVIATURAS.............................................................................................. 6

LISTA DE TABELAS .......................................................................................................... 7

RESUMO .............................................................................................................................. 8

ABSTRACT ............................................................................................................................ 9

1. Introdução.................................................................................................................... 10

1.1 Motivação.............................................................................................................. 10

1.2 Contexto ................................................................................................................ 12

1.3 Objetivos ............................................................................................................... 13

1.3.1 Objetivos Gerais........................................................................................... 13

1.3.2 Objetivos Específicos................................................................................... 13

1.4 Organização do texto............................................................................................. 13

2. Visualização de Informações....................................................................................... 14

2.1 Técnicas de Visualização de Informações............................................................. 16

2.1.1 Foco + Contexto........................................................................................... 17

2.1.2 Overview + Detail........................................................................................ 18

2.1.3 Cone tree ...................................................................................................... 19

2.1.4 Landscapes (Paisagens) ............................................................................... 20

2.1.5 Browser hiperbólico..................................................................................... 20

2.1.6 Coordenadas Paralelas ................................................................................. 21

2.1.7 Glyphs .......................................................................................................... 22

2.1.8 Table Lens .................................................................................................... 23

2.2 Sistemas de Monitoramento .................................................................................. 24

2.2.1 CIRC (Control Interact Radial Circle)........................................................ 24

2.2.2 Lifelines........................................................................................................ 25

2.2.3 Chat Circles ................................................................................................. 26

2.2.4 TimeMines.................................................................................................... 27

3. Visual Data Mining ..................................................................................................... 29

3.1 Paradigma da Exploração Visual de Dados .......................................................... 30

Page 4: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

4. Ferramenta de Visualização de Informações Proposta................................................ 31

4.1 Tipos de Dados...................................................................................................... 32

4.2 Metodologia de Desenvolvimento......................................................................... 33

4.3 Técnica Utilizada pela Ferramenta........................................................................ 34

4.4 Recursos ................................................................................................................ 35

4.5 Referência.............................................................................................................. 35

4.6 Funcionamento ...................................................................................................... 36

5. Estudo de Caso ............................................................................................................ 40

6. Conclusões e futuros trabalhos .................................................................................... 45

7. Referências Bibliográficas........................................................................................... 46

4

Page 5: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

LISTA DE FIGURAS Figura 1: Processo de Visualização de Informações ........................................................... 10

Figura 2: Gráficos: Ferramenta visual amplamente utilizada.............................................. 11

Figura 3: Mapa representando a incidência de determinada doença no Mundo ................. 14

Figura 4: Classificação das áreas de Visualização de Dados .............................................. 15

Figura 5: Tipos de gráficos do Microsoft Excel .................................................................. 16

Figura 6: Fisheye Menus: Exemplo da técnica foco+contexto .......................................... 18

Figura 7: Overview + Detail – Recurso do Macromedia Fireworks ................................... 19

Figura 8: Cone Tree: representação de estruturas hierárquicas........................................... 19

Figura 9: www.kartoo.com: representação visual do resultado de buscas na Web ............. 20

Figura 10: Inxight StarTree: Exploração das relações hierárquicas em um contexto ........ 21

Figura 11: Coordenadas Paralelas: identificação das relações entre os dados .................... 22

Figura 12: VisEd: Resultados a partir de ícones representativos ....................................... 22

Figura 13: Inxight TableLens: Descoberta de relacionamentos e tendências a partir de

dados tabulares .................................................................................................................... 23

Figura 14: CIRC de monitoramento de acessos ao ENSINET............................................ 25

Figura 15: Lifelines: Visualização de dados de tratamentos de pacientes........................... 26

Figura 16: Interface gráfica do Chat Circles ....................................................................... 27

Figura 17: TimeMines: identificação de palavras em destaque em períodos de tempo ...... 28

Figura 18: Estrutura de tabelas no modelo mestre/detalhe.................................................. 31

Figura 19: Exemplo de Uso da Técnica das Coordenadas Paralelas................................... 34

Figura 20: Processo de Exportação de Tabelas para XML no Microsoft Access................ 37

Figura 21: Conteúdo do Arquivo XML Gerado pela Exportação ....................................... 37

Figura 22: Diagrama de funcionamento da ferramenta de Visualização de Informações... 39

Figura 23: Formulário Web inicial para indicação das tabelas, relacionamentos e

configurações do sistema..................................................................................................... 40

Figura 24: Uso da ferramenta em um tradicional sistema de controle de vendas ............... 42

Figura 25: Hierarquia faz com os produtos do grupo sejam exibidos ................................. 43

Figura 26: Destacar exibe a linha do item em cor diferente................................................ 43

5

Page 6: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

LISTA DE ABREVIATURAS CIRC Control Interact Radial Circle

PHP Hypertext Preprocessor

XML Extensible Markup Language

SGBDs Sistemas Gerenciadores de Bancos de Dados

W3C World Wide Web Consortium

JPEG Joint Photographic Experts Group

PNG Portable Network Graphics

GIF Graphics Interchange Format

TIFF Tagged Image File Format

6

Page 7: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

LISTA DE TABELAS

Tabela 1 - Atributos da Tabela Produtos do Estudo de Caso ............................................. 41

Tabela 2 - Atributos da Tabela Vendas do Estudo de Caso ............................................... 41

7

Page 8: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

RESUMO

A Visualização de Informações é uma área da computação gráfica que procura

representar informações graficamente, permitindo com isso uma melhor compreensão de

um grande volume de informações, geralmente obtidas a partir da mineração de dados em

enormes bancos de dados, textos, hiperdocumentos, etc. Permite também identificar

padrões ou ainda detectar novas informações até então imperceptíveis devido a sua forma

de representação. A representação visual gerada deve permitir a interação do usuário –

sendo este o sujeito da operação. O presente trabalho descreve esta área da computação

gráfica, fazendo uma análise das ferramentas de Visualização de Informações em geral,

enfatizando os sistemas de monitoramento – que são utilizados para a identificação de

padrões de comportamento e que servem de apoio para a tomada de decisões estratégicas

em uma instituição. Ao final, é apresentada uma ferramenta para visual data mining

executada na Web para relacionar, através da técnica das Coordenadas Paralelas, o

desempenho de sistemas baseados em banco de dados relacionais do tipo mestre/detalhe,

amplamente utilizado em sistemas de monitoramento. O diferencial desta ferramenta, além

de rodar diretamente na Web, é a sua capacidade de se adaptar a diversos sistemas, a partir

dos arquivos mestre/detalhe exportados pelo usuário no formato XML.

Palavras-Chave: Visualização de Informações, Técnicas de Visualização de Informações,

Mineração de Dados, Visual Data Mining

8

Page 9: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

TITLE: “Study and development of an Adaptable Information Visualization Tool for Monitoring Systems”

ABSTRACT Abstract: Information visualization is a field of graphic computing which aims to represent

information in graphic mode, allowing better understanding of a great amount of

information obtained usually from data mining in large databases, texts, hyperdocuments,

etc. It also allows identifying standards or even detecting new information which was not

previously able to be detected due to its way of representation. The generated visualization

must allow interaction with the user – being users the subjects of the operation. The

present study describes this field of graphic computing, analyzing general information

visualization tools with emphasis on monitoring systems – which are used for the

identification of behavior standards, and serve as support for strategic decision making in

a given institution. In the end, a tool for visual data mining is presented, executed on Web

for relating, through of the Parallel Cordinate technique, the performance of systems

based on relational databases of master/detail type, widely used in monitoring systems.

The differential of this tolls, besides running directly on Web, is its capacity to adapt to

several systems, from the master/detail archives exported by the uses in XML format.

Keywords: Information Visualization, Information Visualization Techniques, Data Mining,

Visual Data Mining

9

Page 10: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

1. Introdução

1.1 Motivação

Diversas são as expressões que fazem parte da nossa cultura e que são ditas

naturalmente sem maiores considerações. Uma delas é “uma imagem vale por mil

palavras”. E não é preciso descrever muito para exemplificar o que esta expressão quer

dizer. Pode-se escrever linhas e linhas sobre a beleza de uma paisagem, mas dificilmente se

transmite a mesma sensação produzida por uma imagem exibindo o local. O mesmo vale

para informações cadastrais, principalmente de gigantescas bases de dados. Pode-se tomar

como exemplo um sistema que acompanha as internações e tratamentos de pacientes de um

hospital. Verificar em quais períodos do ano determinadas doenças são mais freqüentes é

muito mais complexa de ser realizada a partir da análise cadastral dos dados do que a partir

de um gráfico que relacione estes dados. Com base nesta informação medidas preventivas

poderiam ser tomadas. Enfim, o objetivo principal da área de Visualização de Informações

é o de facilitar a compreensão dos dados de um determinado sistema através de

representações visuais geradas a partir de um conjunto de dados, conforme ilustra a Figura

1.

Figura 1: Processo de Visualização de Informações

Vale destacar que uma das principais características desta área é de que, as

ferramentas desenvolvidas para a visualização de informações, devem permitir a interação

do usuário sobre as representações geradas por estes. Para que seja ele, usuário, o sujeito

da análise. A ferramenta apenas exibe uma representação visual, para que a partir dela, seja

explorada a imensa capacidade de percepção visual humana.

Se a falta de informações, ou a dificuldade em obtê-las, era um dos principais

problemas enfrentados há algum tempo, hoje convive-se com um problema oposto: o

10

Page 11: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

excesso de informações dificulta a localização daquilo que realmente se precisa, ou muitas

vezes, impõe-se longas análises para a obtenção dos resultados almejados. Uma pesquisa

no Google, por exemplo, retorna centenas ou, por vezes, milhares de indicações de

páginas, mas em geral, não se utiliza mais de dois ou três links. Uma pesquisa sobre o

WebSearch [4] indicou que apenas 15% dos usuários acessam mais que uma página

resultante de uma consulta. Formas de visualizar e agrupar melhor os resultados de

pesquisas na web estão sendo desenvolvidas, como, por exemplo, o programa kartoo

(www.kartoo.com), descrito na seção 2.1.4.

Outro exemplo presente no nosso dia-a-dia é a geração de gráficos em planilhas

de cálculos, como exemplificado na Figura 2 que compara “locações” e “desocupações” de

imóveis de uma determinada imobiliária. A análise do gráfico facilita em muito a

percepção de informações do tipo: quais meses do ano apresentaram melhores resultados?

Quais os meses em que as desocupações superaram as locações? Quais os meses com o

menor número de locações?

Figura 2: Gráficos: Ferramenta visual amplamente utilizada

Além do exemplo citado acima, pode-se destacar vários outros campos onde a

área de visualização de informações pode ser útil para auxiliar na obtenção de

representações que facilitem a análise e compreensão dos dados.

A constatação de padrões ou de características visuais, presentes em imagens,

contribui de forma muito mais significativa para o processo de compreensão do que a

simples observação dos dados em sua forma bruta. A construção de uma representação ou

metáfora visual que possibilite essa observação pode ser conseguida organizando os dados

segundo algum critério e apresentando-os de forma gráfica. Em geral, visualizações

11

Page 12: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

acabam possibilitando a recuperação de informações relevantes e a construção de novos

conhecimentos [7].

1.2 Contexto

A área da Visualização de Informações é uma área da computação que

procura representar informações de modo gráfico, permitindo com isso uma melhor

compreensão de um grande volume de informações textuais ou a visualização das

informações obtidas a partir da mineração em grandes bancos de dados, etc. Permite

também identificar padrões ou ainda detectar novas informações até então

imperceptíveis devido a sua forma visual de representação.

O trabalho a ser realizado pretende apresentar uma revisão bibliográfica do

estado da arte na área de visualização de informações, descrevendo as principais

técnicas de visualização com maior ênfase às técnicas de monitoramento de sistemas.

Também irá descrever sobre Visual Data Mining, técnica que une recursos de

Mineração de Dados com Visualização de Informações.

A utilização de ferramentas para Visualização de Informações para sistemas

de monitoramento é adequada para permitir acompanhamento e avaliação da dinâmica

das interações que ocorrem nos respectivos sistemas.

Este trabalho pretende ainda realizar um estudo para analisar a viabilidade da

implementação de algumas técnicas de Visualização de Informações para uso em

dispositivos móveis, através da linguagem Java / J2ME. Em seguida pretende-se

implementar um protótipo da técnica de Coordenadas Paralelas para desktop, via web,

utilizando a linguagem PHP.

Para avaliação da ferramenta Web desenvolvida será submetida uma base de

dados de um sistema de controle de estoque para realização de testes e validação do

protótipo. Os resultados serão apresentados e analisados no final deste trabalho.

12

Page 13: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

1.3 Objetivos

1.3.1 Objetivos Gerais

Desenvolver uma ferramenta visual adaptável a diversos sistemas de

monitoramentos, utilizando uma técnica de Visualização de Informações conhecida

como “Coordenadas Paralelas”.

1.3.2 Objetivos Específicos

1. Aprofundar os conhecimentos na área de Visualização de Informações,

compreendendo as principais técnicas e ferramentas utilizadas atualmente;

2. Estudar os recursos de Mineração de Dados necessários para a organização das

informações a serem submetidas a ferramenta para que possa ser gerada uma

representação visual eficiente.

3. Elaborar um protótipo de uma ferramenta para visualização de informações para

sistemas de monitoramento, via web, utilizando a técnica das Coordenadas

Paralelas.

4. Estudar a viabilidade da implementação das técnicas de Visualização de

Informações para geração de representações visuais em dispositivos móveis.

1.4 Organização do texto

Este trabalho está organizado da seguinte forma: No capítulo 1 é descrito uma

introdução sobre o assunto. No capítulo 2 é realizada uma apresentação da área de

Visualização de Informações, bem como, sua classificação. Ainda neste capítulo, são

destacadas técnicas de visualização de informações e apresentadas ferramentas de

monitoração de sistemas. O capítulo 3 descreve Visual Data Mining e os recursos que uma

ferramenta de visualização de informações deve possuir. Em seguida, capítulo 4, é

apresentada a ferramenta Web desenvolvida através da técnica das Coordenadas Paralelas

para acompanhar o desempenho de sistemas de monitoramento organizados no formato

“mestre/detalhe” de bancos de dados relacionais. O capítulo 5 mostra um caso de uso da

ferramenta aplicado a um sistema de controle de vendas de produtos de um supermercado.

E, no capítulo 6, são feitos comentários finais e indicações sobre trabalhos futuros.

13

Page 14: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

2. Visualização de Informações

A visualização de informações é uma área da computação gráfica, que tem por

objetivo a geração de imagens que facilitem a compreensão humana sobre determinado

assunto.

Combinando aspectos de computação gráfica, interfaces homem-máquina e

mineração de dados [2] [1] [10], a visualização de informações permite a apresentação de

dados de forma gráfica de modo que o usuário possa utilizar sua percepção visual para

melhor analisar e compreender as informações [3] [12] [23].

No mundo atual, em que convive-se com excesso de informações e grande

competitividade, o uso de ferramentas que auxiliem o homem no entendimento de dados

sobre uma área é de extrema utilidade. Sabe-se que a capacidade humana de lidar com

informações visuais é muito maior do que com dados textuais. Observe o exemplo da

Figura 3. Nela é apresentado um mapa indicando os locais onde a incidência de

determinada doença é maior, sendo que as cores mais intensas representam os países mais

afetados. A representação visual gerada torna muito mais fácil a compreensão e

assimilação do que seria apresentado em um texto sobre o assunto.

Figura 3: Mapa representando a incidência de determinada doença no Mundo

Resumidamente, as técnicas de visualização de informações procuram representar

graficamente dados de um determinado domínio de aplicação de modo que a representação

visual gerada explore a capacidade de percepção do homem e este, a partir das relações

14

Page 15: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

espaciais exibidas, interprete e compreenda as informações apresentadas e, finalmente,

deduza novos conhecimentos [7].

A visualização de informações é uma sub-área da visualização de dados, que por

sua vez é uma sub-área da computação gráfica. Segundo Luzzardi [28], na mesma

hierarquia de classificação da visualização de informações encontram-se a visualização

científica e a visualização de software. A Figura 4 ilustra esta classificação.

Figura 4: Classificação das áreas de Visualização de Dados A Computação Gráfica é a parte da computação destinada a geração, análise e

exibição de imagens em geral. Ela pode possuir uma infinidade de aplicações para

diferentes áreas. Desde a própria informática ao produzir interfaces gráficas para diversos

aplicativos, sistemas operacionais e sites da internet, quanto para produzir animações e

jogos. Também está presente em áreas como, por exemplo, cinema sendo utilizada para a

produção de efeitos especiais, retoques nas imagens de filmes e animações.

Já a área de Visualização de Dados relaciona técnicas para produzir imagens para

uma melhor compreensão dos usuários sobre estas imagens. Quando esses dados

correspondem a medidas associadas a objetos físicos, fenômenos ou posições num domínio

espacial, costuma-se referir a esse conjunto de técnicas como Visualização de Dados

Científicos, ou simplesmente Visualização Científica, enquanto a Visualização de

Informações trata dados abstratos como relacionamentos ou informações inferidas a partir

dos dados mensurados [7].

A visualização de software é uma área particular da computação que auxilia o

programador a analisar e entender a estrutura e o funcionamento de grandes programas, em

um nível maior de abstração do que quando comparado a uma simples leitura do código

fonte [11].

15

Page 16: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

2.1 Técnicas de Visualização de Informações

As técnicas de visualização de informações já desenvolvidas utilizam

representações ou metáforas visuais para exibir graficamente dados que geralmente não

possuem representação direta, óbvia e natural. Em diversas técnicas, freqüentemente, os

autores buscam inspiração em objetos do mundo real (ou geométricos), para mapear o

conjunto de informações. As técnicas de visualização podem utilizar representações visuais

1D, 2D ou 3D, não necessariamente de acordo com a dimensão do espaço de informação

[16].

Neste capítulo pretende-se apresentar técnicas de visualização de informações,

bem como, as ferramentas utilizadas para gerá-las. Assim como no processo da criação de

um gráfico em programas de planilhas eletrônicas, onde são apresentados diversos

formatos para a criação de um gráfico (Figura 5), sendo que a adequação do subtipo do

gráfico depende de vários fatores, a construção de ferramentas para visualização de

informações segue a mesma lógica. Há ferramentas mais ou menos adequadas para

representar determinados tipos de informações.

Figura 5: Tipos de gráficos do Microsoft Excel

A construção de sistemas para visualização de informações pode, portanto, se

tornar muito complexa em virtude: a) da necessidade de criação de uma metáfora visual

que permita codificar visualmente o conjunto de informações com o grau de fidelidade

necessário à aplicação; b) dos mecanismos de interação necessários para manipular os

16

Page 17: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

freqüentemente volumosos e/ou complexos conjuntos de dados, e c) da freqüente

necessidade de implementar algoritmos geométricos complexos tanto para a criação da

representação visual como para sua manipulação. Estes aspectos levam, diretamente, a

questões de projeto de interfaces gráficas e avaliação de usabilidade, inerentes ao contexto

de interação homem-computador. Além disto, é cada vez mais necessária a integração com

sistemas de mineração de dados [12], já que a busca em facilitar o entendimento dos dados

passa pelo reconhecimento de padrões, estruturas e outras informações ocultas no próprio

conjunto de dados [7].

As técnicas de Visualização de Informações apresentadas a seguir contemplam a

representação de conjuntos de dados semelhantes aos utilizados para o desenvolvimento da

ferramenta proposta neste trabalho. Uma vez que inúmeras são as técnicas de

representação visual que poderiam ser destacadas neste tópico.

2.1.1 Foco + Contexto

É uma técnica que permite exibir um conjunto de informações ao usuário, onde

ele pode destacar a parte de seu interesse – geralmente ampliando a informação

selecionada [21]. Este tipo de técnica proporciona uma visão geral dos dados (contexto) e o

detalhamento do que é importante (foco) para o usuário do sistema (Figura 6). As técnicas

do tipo foco+contexto são também conhecidas como Fisheye, por justamente simular um

olho de peixe.

17

Page 18: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

Figura 6: Fisheye Menus: Exemplo da técnica foco+contexto 1

2.1.2 Overview + Detail

Esta técnica é bastante semelhante a apresentada anteriormente, contudo, nesta

forma de visualização, a região selecionada pelo usuário é exibida em um quadro, onde são

apresentados maiores detalhes das informações contidas na região destacada, conforme

ilustra a figura 7.

Em geral, as ferramentas de visualização que utilizam esta técnica, permitem

identificar o local visualizado em destaque (detail) da representação maior (overview), por

regiões sombreadas ou quadros com espessas linhas de referência com cores destacadas da

imagem. Esta abordagem é amplamente utilizada em ferramentas gráficas de manipulação

de imagens e animações.

1 Disponível em http://www.cs.umd.edu/hcil/fisheyemenu/fisheyemenu-demo.shtml (acesso

em Junho/2006)

18

Page 19: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

Figura 7: Overview + Detail – Recurso do Macromedia Fireworks

2.1.3 Cone tree

A técnica Cone Tree (Figura 8) é utilizada para representar de forma

tridimensional as informações hierárquicas de um sistema. O retângulo superior representa

o elemento raiz da estrutura e todos os seus filhos são dispostos abaixo deste guardando a

relação subordinada, fácil de interpretar pela forma como é apresentada a relação [20].

Figura 8: Cone Tree: representação de estruturas hierárquicas

19

Page 20: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

2.1.4 Landscapes (Paisagens)

Este tipo de técnica de visualização faz uso de paisagens (landscapes) para a

representação das inter-relações de grupos de dados contendo imagens metafóricas

relacionadas. Esta proposta tem sido utilizada, entre outras aplicações, para indicar a

similaridade e o relacionamento entre documentos de texto com base em palavras chaves.

Uma ferramenta que utiliza esta técnica é o kartoo , um site de metabusca na web

(figura 9). Nele, ao posicionar o mouse sobre cada representação, linhas ligando as

imagens apresentadas sobre a paisagem indicam as relações que os documentos possuem

entre si. Caso os documentos não tenham relações uns com os outros, a linha não é exibida.

Figura 9: www.kartoo.com: representação visual do resultado de buscas na Web

2.1.5 Browser hiperbólico

Nesta modalidade de Visualização de Informações um grafo representa a estrutura

e o relacionamento entre os objetos. Os grafos são modelos matemáticos amplamente

utilizados em visualização de informações, que são formados por estruturas simples que

consistem de um conjunto de vértices e um conjunto de arestas. Os vértices representam as

informações identificadas em uma estrutura e os vértices indicam as relações entre estas

informações.

20

Page 21: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

Muitas das ferramentas de visualização combinam duas ou mais técnicas para

ampliar os recursos de apresentação das informações e interação com o usuário, como é o

caso da Hyperbolic Tree Magnifind, utilizada no software de navegação da Inxight

(www.inxight.com), exemplificado na figura 10. Nele um grafo indica a relação entre as

palavras-chaves identificadas em uma consulta.

Figura 10: Inxight StarTree: Exploração das relações hierárquicas em um contexto

2.1.6 Coordenadas Paralelas

A técnica de Coordenadas Paralelas proposta por Inselberg [13] permite relacionar

informações entre si adicionando a estas relações indicações temporais em que ocorreram

os dados exibidos na representação visual. Observe a ilustração apresentada na figura 11,

onde várias informações sobre alunos são relacionadas.

De modo geral, Coordenadas Paralelas são adequadas para mineração de dados

com várias dimensões, pois permitem transformar a busca por relações entre variáveis de

um problema em um processo mais intuitivo de reconhecimento de padrões 2D. A técnica

enfatiza, principalmente, relações entre eixos adjacentes e conjuntos de dados que possuem

padrões similares [11].

21

Page 22: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

Figura 11: Coordenadas Paralelas: identificação das relações entre os dados

2.1.7 Glyphs

Glyphs são técnicas de visualização de informações bastante utilizadas para

representar tabelas de resultados, onde ícones identificam a classificação de determinadas

informações em uma tabela. A variação das imagens representativas, bem como, suas

cores, dimensões são facilmente associadas ao que elas procuram descrever (Figura 12).

Figura 12: VisEd: Resultados a partir de ícones representativos

Um dos primeiros trabalhos sobre esse tema foi apresentado por Chernoff [9],

onde os atributos visuais dos ícones são explorados de uma forma bastante particular.

22

Page 23: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

Chernoff observou que os seres humanos são muito sensíveis a uma grande variedade de

expressões faciais. Ele então sugeriu a utilização de ícones representando faces, onde

algumas características como o tamanho dos olhos, a altura da sobrancelha e a forma da

boca pudessem ser associados a cada atributo da informação. Chernoff aplicou sua técnica

para estudar exemplos geológicos, com cada face cobrindo dezoito atributos. Sua técnica

ficou conhecida como Chernoff Faces.

2.1.8 Table Lens

A técnica Table Lens [19] é uma forma efetiva para o entendimento de dados

numéricos e categóricos multidimensionais. Essa técnica permite a visualização de uma

tabela onde os dados de interesse aparecem expandidos e os demais itens, de forma

compactada (Figura 13). As linhas da tabela são vistas como linhas de pixels. A técnica

possibilita interação do usuário para focalizar linhas ou colunas, o que causa a ampliação

das mesmas enquanto mantém compactado o contexto ao seu redor.

Figura 13: Inxight TableLens: Descoberta de relacionamentos e tendências a partir de dados tabulares

23

Page 24: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

2.2 Sistemas de Monitoramento

Os sistemas de monitoramento verificam e acompanham as atividades que

ocorrem em um sistema, fornecendo aos seus administradores características do sistema,

como a freqüência de determinados acontecimentos. Servem de base para análises e

tomadas de decisão a respeito das ações a serem tomadas para a manutenção e ou

melhorias do mesmo.

Diversas são as ferramentas que realizam controle sobre tarefas de

monitoramento. Se enquadram neste grupo os sistemas de controle de ensino à distância e

acompanhamento médico de pacientes, descritos a seguir, nos exemplos de sistemas de

monitoramento. Estas atividades tendem a gerar um volume muito grande de registros nas

bases de dados que a controlam, sendo que o desenvolvimento de ferramentas de

visualização podem ser muito úteis para a identificação de padrões e a percepção de

anomalias no comportamento dos agentes destes sistemas.

Ainda como exemplos de sistemas de monitoramento pode-se citar os sistemas de

controle de venda de passagens de um terminal rodoviário, de hospedagens de um hotel ou

de compra/venda de moedas estrangeiras de uma casa de câmbio. No sistema de controle

de passagens de um terminal rodoviário de uma grande cidade, considerando que a emissão

de um bilhete de passagem gera um novo registro, no final de um dia serão milhares de

registros adicionados à base de dados. As tarefas de análises dos dados de sistemas como

este, são áreas férteis para o desenvolvimento de ferramentas de visualização de

informações. Respostas para perguntas como, por exemplo, quais os períodos em que

ocorrem as maiores taxas de vendas de passagens do tipo Golden Class (um tipo especial

de ônibus), podem ser melhor compreendidas se analisadas com o auxílio de ferramentas

de representação visual e interativa dos resultados.

Como ferramentas de visualização de sistemas de monitoramento são

apresentadas as ferramentas CIRC [8], LifeLines [18], Chat Circles [26] e TimeMines [24]

descritos a seguir.

2.2.1 CIRC (Control Interact Radial Circle)

Esta ferramenta de visualização [8] que está em fase de desenvolvimento, permite

acompanhar e avaliar a dinâmica das interações que possam ocorrer no sistema ENSINET,

24

Page 25: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

que é um sistema de ensino a distância da UCPel – Universidade Católica de Pelotas. É

uma ferramenta baseada na Web que mostra os monitoramentos dos diversos objetos do

sistema em um gráfico de círculo sub-dividido em setores. No centro é exibido um ícone

informando sobre qual agente está focada a visualização e ao redor cada setor representa a

freqüência de acesso de um objeto. As cores são utilizadas para indicar uma classificação

dos objetos por um determinado assunto.

A figura 14 mostra a exibição simultânea de vários círculos utilizados para

acompanhar a evolução no tempo da freqüência de acesso de um objeto. A ferramenta

possui mecanismos interativos que permitem ao usuário refinar a visualização corrente. A

seleção de um setor através do mouse cria uma nova janela de exibição onde o foco passa a

ser o objeto selecionado.

Figura 14: CIRC de monitoramento de acessos ao ENSINET

2.2.2 Lifelines

Lifelines [18] é uma ferramenta de visualização de informações que faz o

acompanhamento do registro de atendimentos e tratamentos médicos realizados por

pacientes. O sistema exibe um ambiente onde podem ser visualizadas informações sobre o

histórico de um paciente (Figura 15). Registros de atendimentos, problemas de saúde,

hospitalizações e medicamentos são representados como uma linha horizontal, onde ícones

representam eventos, como por exemplo, consultas e exames. Recursos e filtros do

25

Page 26: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

programa permitem ao usuário focar em partes da imagem de seu interesse, revelando

maiores detalhes.

A ferramenta LifeLines permite reduzir as chances de esquecimento da análise de

alguma informação sobre a saúde do paciente, além de facilitar a percepção de anomalias e

tendências de doenças das pessoas cadastradas. Com a ação do mouse e opções de menus,

o usuário pode ampliar a linha do tempo de análise dos tratamentos e diagnósticos obtidos.

Figura 15: Lifelines: Visualização de dados de tratamentos de pacientes

2.2.3 Chat Circles

O Chat Circles [26] é uma interface gráfica para conversações simultâneas que

usa formas abstratas para representar as identidades e atividades de seus participantes. O

objetivo desta ferramenta é usar gráficos para conduzir a dinâmica das conversas, assim

como para revelar o padrão de atividades que surgem através da interação entre os

usuários.

Cada participante é representado por um círculo colorido na tela onde sua palavra

é exibida (Figura 16). O círculo cresce e se ilumina com cada mensagem e “desbota” e

26

Page 27: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

diminui nos períodos de silêncio, não desaparecendo completamente enquanto o

participante estiver conectado no chat.

Figura 16: Interface gráfica do Chat Circles

2.2.4 TimeMines

O sistema TimeMines [24] é uma ferramenta que gera automaticamente uma linha

do tempo de palavras que se relacionam, a partir da análise de textos com tags que

identificam as datas em que elas ocorreram. TimeMines detecta, classifica e agrupa

características semânticas das palavras baseadas em suas propriedades estatísticas de

ocorrência em um texto.

No gráfico exibido pelo TimeMines (Figura 17) ao posicionar sobre uma palavra

destacada, outras palavras que se relacionam com a palavra em destaque são apresentadas,

permitindo identificar seus relacionamentos.

27

Page 28: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

Figura 17: TimeMines: identificação de palavras em destaque em períodos de tempo

28

Page 29: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

3. Visual Data Mining

Para gerar uma visualização das informações a partir de um grande volume de

dados é necessário, inicialmente, selecionar e organizar estes dados de forma que eles

possam transmitir concisamente uma informação. Não basta simplesmente transformar

dados textuais em representações gráficas. A visual data mining consiste na junção das

técnicas de Mineração de Dados com as técnicas de Visualização de Informações.

A área de Mineração de Dados, ou Descoberta do Conhecimento em bases de

dados, consiste em um processo não-trivial de identificar, em bases de dados, padrões que

sejam válidos, novos, potencialmente úteis e compreensíveis ao usuário. Diversas são as

técnicas e ferramentas inteligentes e automáticas utilizadas para auxiliar pessoas a analisar

grandes volumes de dados para garimpar conhecimento útil [15].

Dentre as técnicas de mineração de dados a serem utilizadas para a preparação dos

dados submetidos a uma ferramenta de visualização de informações podemos destacar: a)

classificação: tem por objetivo alocar elementos em classes pré-existentes; b) clustering:

identifica grupos e avalia as similaridades existentes entre eles; c) análise de séries

temporais: que procura encontrar padrões na repetição seguida de valores.

Para a mineração de dados ser efetiva, é importante incluir o usuário no processo

de exploração de dados e combinar flexibilidade, criatividade e conhecimento geral do

homem com a capacidade de armazenagem e o enorme poder computacional dos

computadores de hoje. A idéia básica da visual data mining é apresentar os dados de

alguma forma visual, permitir ao usuário obter uma visão dos dados, tirar conclusões e

interagir diretamente com os dados [14].

Portanto, a utilização da visual data mining tem como principal objetivo integrar o

usuário no processo de exploração de dados, aplicando as suas habilidades de percepção

das características das informações apresentadas graficamente. Cabe ao usuário interagir

com a ferramenta visual para obter dela as evidências de que um determinado padrão ou de

que uma nova informação possa ser descoberta.

29

Page 30: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

3.1 Paradigma da Exploração Visual de Dados

Segundo Keim [14], em seu artigo “Information Visualization and Visual Data

Mining”, a exploração visual de dados geralmente segue um processo de três etapas:

Overview, zoom and filter e details-on-demand (que também é chamado Information

Seeking Mantra).

A tecnologia de visualização pode ser usada em todas as etapas do processo de

exploração de dados, visto que a ferramenta de visual data mining deve: a) exibir uma

visão geral dos dados e permitir ao usuário investigar detalhes que possam ser úteis para a

descoberta de novas informações; b) interagir com a ferramenta para ampliar ou reduzir a

visualização dos dados e definir filtros que possam facilitar a análise e exploração dos

dados; c) ocultar ou ampliar as informações sobre o conjunto de dados apresentados na

representação visual.

30

Page 31: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

4. Ferramenta de Visualização de Informações Proposta

Inúmeras aplicações que utilizam banco de dados estão organizadas no formato

“mestre/detalhe”. Neles, há uma tabela principal e uma tabela relacionada a ela que

armazena interações do sistema sobre estes dados. A ferramenta Web de visualização de

informações desenvolvida é genérica para estes sistemas e está disponível para uso no

endereço eletrônico www.edecio.com.br/visinfo.

A idéia do desenvolvimento desta ferramenta surgiu a partir da observação de que

a estrutura das tabelas de aplicativos como controles de estoque, controles acadêmicos,

consultórios médicos, hospitais, etc. possuem uma estrutura semelhante: tem-se produtos e

vendas destes produtos; tem-se pacientes e consultas realizadas por estes pacientes no

decorrer de um intervalo de tempo. Ou seja, para uma tabela “mestre” há uma tabela

“detalhe” com indicações de ocorrências na tabela “mestre”.

Observe os modelos típicos de estruturação destes tipos de tabelas na figura 18,

que apresenta o relacionamento entre a tabela Veículos (mestre) e a tabela Locações

(detalhe) de um tradicional sistema de controle de locações de veículos de uma Auto-

Locadora.

Figura 18: Estrutura de tabelas no modelo mestre/detalhe

Muitas instituições têm nos sistemas que utilizam tabelas estruturadas no modelo

“mestre/detalhe” as informações que são o foco principal das suas atividades. Desenvolver

uma ferramenta visual que possa facilitar a análise dos dados destes sistemas pode

significar, em alguns casos, a percepção do desempenho da própria instituição.

31

Page 32: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

4.1 Tipos de Dados

Uma das características de maior destaque da ferramenta proposta é o fato dela ser

adaptável aos dados a serem submetidos pelo usuário, ampliando em muito a sua

utilização. Estes dados devem ser estruturados oriundos de Sistemas Gerenciadores de

Bancos de Dados que permitam a sua exportação no formato XML (recurso disponível na

maioria dos SGBDs atuais).

Para um correto funcionamento da ferramenta proposta os dados necessitam estar

organizados e possuir algumas características de estruturação e conteúdo, descritas a

seguir:

Tabela Principal:

• Deve possuir, no mínimo, um atributo (campo) a ser utilizado para exibição da

listagem dos dados, a partir do qual os dados serão agrupados e também sobre

o qual podem ser definidos filtros;

• Atributo que estabelece o relacionamento com a tabela das interações (chave

estrangeira), sendo eles do mesmo tipo;

Tabela de Monitoramentos:

• Atributo que estabelece o relacionamento com a tabela principal, sendo do

mesmo tipo de dado;

• Atributo que indica a data de ocorrência do evento a ser analisado, que será

exibido no eixo temporal da representação visual;

• Um ou mais atributos do tipo numéricos sobre os quais serão realizados os

cálculos a serem representados na ferramenta. Estes atributos são

recomendados, porém não obrigatórios, visto que o cálculo básico de

contagem de ocorrências das interações pode ser exibido, a partir dos dois

atributos indicados acima.

32

Page 33: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

4.2 Metodologia de Desenvolvimento

Para construir uma nova ferramenta de Visualização de Informações, segundo

Ferreira e Nascimento [11], deve-se utilizar uma metodologia que contemple as seguintes

etapas:

• Estudo do problema e dos dados a serem visualizados

• Construção de visualizações

• Definição dos mecanismos de interação

• Implementação de um sistema protótipo

• Avaliação das visualizações

Etapas estas, cuidadosamente observadas no desenvolvimento da ferramenta

proposta. Na primeira etapa, como a característica da ferramenta é de ser adaptável a um

amplo conjunto de dados, o estudo foi realizado a partir da estruturação das bases de dados

a serem submetidas à ferramenta.

Justamente o fato de a ferramenta ser desenvolvida para utilização em qualquer

sistema de monitoramento, onde dados com variações temporais e agrupamentos em níveis

hierárquicos podem ser analisados, fez com que a construção de visualizações ficassem

restritas as técnicas que oportunizassem este tipo de exibição dos dados, sendo escolhida a

técnica das Coordenadas Paralelas.

Sobre os mecanismos de interação disponíveis, a ferramenta proposta dispõem de

filtros, seleção para comparação de itens, exibição/ocultação de dados de forma hierárquica

– detalhados no capítulo 5. Resta ainda a ser feito a avaliação das visualizações geradas

pela ferramenta, onde pretende-se estimular a utilização da ferramenta, disponível na Web,

por empresas dos diversos sistemas que trabalham com banco de dados organizados no

modelo “mestre/detalhe”. A partir desta avaliação novos mecanismos de interação podem

ser adicionados à ferramenta.

Além do conhecimento dessa metodologia, para desenvolver uma ferramenta de

Visualização de Informações, é necessário ter o domínio de uma linguagem de

programação com suporte à construção de interfaces gráficas (como é o caso do PHP, Java,

C/C++), ótimos conhecimentos de estruturas de dados avançadas e de algoritmos,

conhecimento de OpenGL e de XML e de conceitos e técnicas de avaliação de usabilidade

da área de Interação Homem-Computador [11].

33

Page 34: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

4.3 Técnica Utilizada pela Ferramenta

O tipo de técnica de Visualização de Informações mais adequado para a

representação dos dados estruturados no formato mestre/detalhe é o das Coordenadas

Paralelas, onde os grupos de registros da tabela mestre são representados em linhas do

tempo, enquanto que, os valores obtidos na tabela detalhe (dos monitoramentos) são

representados nas “coordenadas paralelas” da técnica.

Observe a representação visual exibida na figura 19, onde as locações de filmes

agrupados por gênero são demonstradas. Com a técnica das Coordenadas Paralelas pode-

se:

• Utilizar a coluna inicial para exibir os grupos da tabela principal;

• Fazer com que cada coluna da representação visual contenha um período a ser

analisado, no exemplo, os meses do ano;

• Demonstrar pelo local em que as linhas percorrem estas colunas o valor

aproximado de locações do grupo em cada um dos meses;

• Exibir após a coluna final a faixa de valores representada.

Figura 19: Exemplo de Uso da Técnica das Coordenadas Paralelas

34

Page 35: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

4.4 Recursos

A ferramenta proposta esta sendo desenvolvida para a Web através da linguagem

PHP, com suporte as bases de dados no formato XML. Os dados são convertidos para uma

base de dados em MySQL, tradicionalmente utilizado em conjunto com a linguagem PHP.

O formato XML, que significa eXtensible Markup Language é uma especificação

criada pela W3C, desenvolvida especialmente para documentos da Web, que pretende ser

uma linguagem universal para a troca de informações de forma estruturada através da

Internet. Permite que os programadores transportem dados de um servidor para outro da

rede de forma transparente e organizada [6].

A linguagem PHP, de Hypertext Preprocessor (pré-processador de hipertexto), é

uma linguagem de programação open source, mundialmente utilizada, sendo que suas

aplicações principais são o desenvolvimento de sites dinâmicos para o ambiente web [22].

Possui suporte a criação e manipulação de imagens em vários formatos, tais como JPEG,

PNG, GIF e TIFF. Esta funcionalidade está disponível no PHP mediante a presença da

biblioteca de imagens GD (disponível para download em http://www.boutell.com/gd/).

O banco de dados MySQL é um sistema de gerenciamento de banco de dados

relacionais que permite a criação e manipulação de tabelas através de comandos SQL e é

amplamente utilizado na internet, estando disponível na maioria dos servidores Web [25].

4.5 Referência

A ferramenta tem como referência o paradigma do processo de construção da

visualização e interação com o usuário em três etapas (visão geral, zoom & filtro e detalhe

por demanda) da visual data mining proposta por Keim [14], descrito no capítulo anterior.

Primeiramente a ferramenta exibe uma visão geral dos dados obtidos a partir da

tabela principal e da tabela de monitoramentos. Os registros da tabela principal são

agrupados a partir da hierarquia selecionada pelo usuário no formulário inicial da

ferramenta.

35

Page 36: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

Após a indicação das tabelas, relacionamentos, atributos de agrupamento, filtro e

de controle do eixo temporal, a ferramenta exibe uma representação visual com os valores

default do sistema. A partir desta representação, permite ao usuário ampliar e restringir

(filtrar) a visualização dos registros “clicando” sobre eles. Ainda nesta etapa, Keim sugere

a especificação de filtros para melhor visualizar os dados sobre os quais o usuário pode

identificar a incidência de prováveis padrões ou a descoberta de novas informações. Para

isso, através do formulário exibido no frame superior da ferramenta, o usuário pode definir

filtros selecionando os dados do seu interesse.

Detalhes por demanda, indicado na 3ª etapa do processo de visual data mining, é

um método usado no estágio da transformação de dados para ampliar um pequeno conjunto

de objetos, revelando mais informações sobre eles [16]. Para esta etapa a ferramenta

permite a seleção entre duas formas de destacar os itens apresentados no formulário:

visualização da hierarquia ou destacar o item selecionado. Através da escolha do modo de

seleção dos dados, permite ao usuário ampliar o detalhamento dos itens a serem

apresentados ou então destacar um item, comparando o seu desempenho com todos os

demais, ou ainda, relacionando dois ou mais itens específicos.

4.6 Funcionamento

Para utilizar a ferramenta o usuário deve inicialmente exportar sua base de dados

para o formato XML, conforme ilustra a figura 20, onde uma base de dados do Microsoft

Access é exportada para este formato. Observe o conteúdo do arquivo XML gerado na

figura 21.

Em seguida, ele precisa acessar o site da ferramenta, www.edecio.com.br/visinfo,

e selecionar estes arquivos XML, mestre e detalhe, para serem enviados para a ferramenta.

A partir deste ponto, o sistema identifica a estrutura das tabelas e submete esta estrutura

para que o usuário indique os atributos que definem o relacionamento entre a tabela

principal e a tabela de monitoramentos. Após, o usuário deve fazer a seleção da hierarquia

dos atributos da tabela principal em que ele quer que os dados fiquem organizados (podem

ser definidos até quatro atributos). Ou seja, qual o grupo principal será inicialmente

exibido pela ferramenta e quais os subgrupos estarão subordinados a ele.

36

Page 37: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

Figura 20: Processo de Exportação de Tabelas para XML no Microsoft Access

Figura 21: Conteúdo do Arquivo XML Gerado pela Exportação

37

Page 38: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

A ferramenta, a seguir, gera uma visualização padrão com todos os dados sendo

exibidos, agrupados pelo primeiro nível de hierarquia indicado pelo usuário, totalizados

pela contagem dos registros, com as cores indicativas de desempenho (+/-), com as datas

totalizadas por intervalo de ano e abrangendo todo o período de tempo constante nas

tabelas importadas, ou seja, as configurações default do sistema.

A partir desta primeira visualização o sistema fica no aguardo de interações do

usuário, permitindo as seguintes especificações:

• filtros para a seleção de registros conforme a hierarquia dos atributos indicado pelo

usuário na tabela principal;

• filtros pelo campo data definido na tabela dos monitoramentos, para a composição

do eixo temporal;

• modificações na configuração da exibição das cores das coordenadas, fazendo com

que as coordenadas possam ser exibidas com cores indicativas de crescimento ou

decrescimento no período;

• clique sobre um item exibido no gráfico fazendo com que a linha do mesmo seja

destacada (caso esteja configurado Seleção: Destacar) ou para ser ampliada ou

reduzida a hierarquia dos itens exibidos (Seleção: Hierarquia);

• seleção do tipo de cálculo a ser representado no gráfico. Inicialmente a ferramenta

exibe as coordenadas do gráfico a partir da contagem dos registros da tabela de

monitoramentos que ocorreram em cada um dos períodos apresentados. O usuário

pode trocar para soma e média, informando em seguida qual o campo deverá

somado.

• seleção do período de exibição de tempo no eixo temporal. Podem ser selecionadas

as opções: ano, mês, quinzena, semana e dia.

A figura 22 ilustra as etapas, bem como, as interações possíveis dos usuários na

utilização da ferramenta de visualização desenvolvida.

38

Page 39: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

Figura 22: Diagrama de funcionamento da ferramenta de Visualização de Informações

39

Page 40: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

5. Estudo de Caso

Para uma melhor compreensão das características da ferramenta de visualização

desenvolvida será apresentado um exemplo de uso da ferramenta aplicada a um sistema

real. O sistema contém as tabelas Produtos e Vendas, que realizam o controle das vendas

de um determinado supermercado. As tabelas estão inicialmente armazenadas no Microsoft

Access e são exportadas para “produtos.xml” e “vendas.xml”. A figura 23 exibe o

formulário preenchido com as tabelas, relacionamentos e parâmetros iniciais do sistema.

Figura 23: Formulário Web inicial para indicação das tabelas, relacionamentos e configurações do sistema

As tabelas de produtos e de vendas contém os atributos indicados nas tabelas 1 e 2

(formato do Microsoft Access).

40

Page 41: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

Produtos

Código Número

Descricao Texto

Genero Texto

Peso Número

Validade Data/Hora

Quantidade Número

Preco Moeda

Tabela 1: Atributos da tabela Produtos

Vendas

Numero Número

CodPro Texto

Quant Texto

Preço Número

DtMov Data/Hora

Tabela 2: Atributos da tabela Vendas

A partir do preenchimento do formulário com a indicação da tabela de

“produtos.xml” como tabela mestre e a tabela de “vendas.xml” como sendo a tabela dos

monitoramentos a ferramenta gera uma visualização inicial sobre a qual o usuário poderá

interagir (figura 24).

41

Page 42: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

Figura 24: Uso da ferramenta em um tradicional sistema de controle de vendas

O gráfico inicialmente apresentado, conforme ilustra a figura 24, exibe os grupos

de produtos classificados conforme a estrutura do arquivo XML de produtos. No eixo

temporal, os dados da tabela de monitoramentos (vendas.xml) são totalizados e agrupados

inicialmente pelos anos que constam nesta tabela. Dentre as várias opções que podem ser

configuradas pelo usuário, podem-se destacar:

• Cores: permitem ao usuário indicar a forma de uso das cores no gráfico. Ele

pode optar por utilizar cores diferentes para cada item apresentado ou cores

indicativas de acréscimo (+) ou decréscimo (-) nas interações da tabela

detalhe. As cores diferentes permitem acompanhar melhor o desempenho de

um item ou de um grupo de itens no decorrer do período visualizado. Já as

cores indicativas servem para que o usuário tenha uma visão geral do

desempenho dos itens de um período para outro. Por exemplo, se do ano de

2002 para o ano de 2003 prevalecer a cor verde sobre a cor vermelha, é sinal

de que houve uma melhora geral nas vendas dos produtos neste período.

42

Page 43: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

• Seleção: serve para definir se a seleção de um item no gráfico fará a

ferramenta ampliar ou reduzir o nível de detalhamento dos itens apresentados

ou destacar este item em comparação aos demais. As figuras 25 e 26

relacionam os dois tipos de interação do gráfico disponíveis neste item. Caso

Hierarquia esteja selecionado, um clique sobre Alimentos faz com que os

produtos do grupo Alimentos fossem apresentados. Porém, se Destacar estiver

selecionado, clicar sobre um item modifica a cor deste item, destacando-o dos

demais. O usuário pode destacar/relacionar quantos produtos ele desejar,

sendo que a ferramenta, neste caso, exibe cada item de um cor diferente.

Figura 25: Hierarquia faz com os produtos do grupo sejam exibidos

Figura 26: Destacar exibe a linha do item em cor diferente

43

Page 44: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

• Cálculo: indica o tipo de cálculo a ser aplicado sobre os itens da tabela

detalhe. O usuário pode selecionar entre Somar, Contar ou Calcular o valor

médio. No caso da soma ou média é necessário também indicar o campo

sobre o qual será realizado o cálculo. Dependendo do sistema a ser analisado,

pode ser mais interessante para o usuário saber quantas vezes um determinado

produto foi vendido, ou então o montante total de vendas, ou ainda, efetuar o

cálculo sobre o número médio de vendas dos itens em comparação aos

demais.

• Exibir: permite ao usuário selecionar o intervalo de tempo a ser exibido no

gráfico. O usuário pode selecionar entre Ano, Mês, Quinzena, Semana e

Dia. Serve também para ampliar a análise sobre os dados relacionados com o

período de tempo em que as interações ocorrem. Possibilita ao usuário checar

indicações do tipo: quais os meses em que determinados produtos têm

acréscimo de venda, semanas em que o movimento de vendas no geral

aumenta ou diminui, etc.

44

Page 45: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

6. Conclusões e futuros trabalhos

A área de visualização de informações apresenta um campo que permite o

desenvolvimento de diversas ferramentas a serem utilizadas para facilitar a compreensão

dos mais variados assuntos. Este artigo fez a descrição dos conceitos utilizados nesta área

da ciência bem como de técnicas e ferramentas utilizadas para suas representações. Fez

também a apresentação de uma ferramenta Web criada para a visualização das informações

geradas por sistemas de bancos de dados relacionais do tipo “mestre/detalhe”.

O grande diferencial da ferramenta é o fato de que ela inicialmente solicita os

dados, no formato XML, a serem enviados para a análise, fazendo com que a ferramenta

possa ser utilizada para os mais diversos sistemas de monitoramentos. Como, por exemplo,

para sistemas de controle de internações de pacientes em um hospital. Informações como:

quais os períodos de maior internação, quais os grupos de pacientes que mais realizam

consultas, ou então, se forem relacionados os dados dos médicos com as internações, outro

conjunto importante de informações poderiam ser obtidas através da ferramenta.

Um estudo de caso foi apresentado, onde os dados de um sistema de controle de

vendas de um supermercado foram submetidos ao software para representação. Diversas

são as percepções que puderam ser obtidas com a ferramenta, tais como: qual o

desempenho geral da venda de produtos de um ano para outro, quais os grupos de produtos

que apresentaram crescimento no período analisado, quais os produtos em queda de venda,

etc.

O passo seguinte a apresentação deste artigo será a realização das devidas análises

de desempenho da ferramenta apresentada, buscando a realização de adequações e

aperfeiçoamentos. Para tanto serão submetidos dados de outros sistemas e realizadas

pesquisas com os administradores das instituições com os dados submetidos a ferramenta

para colher sugestões e análises.

Na seqüência, serão realizados estudos para verificar a viabilidade do uso desta

ferramenta de visualização de informações em dispositivos móveis. Tarefa esta que

inicialmente se parece bastante complexa, visto que a capacidade de processamento e

tamanho da tela destes dispositivos é muito reduzida.

45

Page 46: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

7. Referências Bibliográficas [1] Agrawal, R.; Data mining: the quest perspective. In: EDBT SUMMER SCHOOL, 1995, Gubbio, Italy. Available in: <http://www.almaden.ibm.com/cs/quest>. Access in: 10 april 2002.

[2] Agrawal, R.; Imielinski, T.; Database mining: a performance perspective. IEEE Transactions on Knowledge and Data Engineering, New York, v. 5, n. 6, p. 914-925, Dec. 1993.

[3] Ahlberg, C.; Shneiderman, B.; Visual Information Seeking: Tight Coupling of Dynamic Query Filters with Starfield Displays. In ACM Conference on Human Factors in Computing Systems, pages 313–317, 479–480, 1994

[4] Almeida, R. Q.; WebSearch. Instituto Agronômico de Campinas. 2004. Unicamp: Campinas – São Paulo.

[5] Card, S.K.; Mackinlay, J.D.; Shneiderman, B.; Information Visualization. In: Readings in Information Visualization - Using Visualization to Think. San Francisco, Morgan Kaufmann Publications, 1999. pp. 1-34.

[6] Castro, E.; XML para a World Wide Web. Campus, Campus, São Paulo, 2001

[7] Cava, R. A.; Chubachi, O. M.; Freitas, C. M.; Luzzardi, P. R. G. Introdução à Visualização de Informações, 2001. UFRGS: Revista RITA, Porto Alegre.

[8] Cava, R. A.; Luzzardi, P. R. G.; Baltar, M. G. Afonso, F. A. Duarte, G. D.; Ferramenta de Visualização de Monitoramentos (CIRC Control Interact Radial Circle). UCPel – Pelotas, 2005.

[9] Chernoff, H.; The use of faces to represent points in k-dimensional space graphically. Journal of the American Statistical Association 68, pages 361–368. 1973

[10] Fayyad, U.; et al. (Ed.). Advances in Knowledge Discovery and Data Mining. Cambridge: MIT Press, 1996.

[11] Ferreira, C. B. R.; Nascimento, H. A. D.; Visualização de Informações – Uma Abordagem Prática, Congresso SBC, 2005 – São Leopoldo. RS, Brasil.

[12] Gershon, N.; Eick, S.; Information Visualization. IEEE Computer Graphics and Applications, Los Alamitos, v. 17, n. 4, p. 29-31, July/Aug. 1997.

[13] Inselberg, A.; Multidimensional detective. In IEEE Symposium on Information Visualization (InfoVis ’97), pages 100–107, Washington - Brussels - Tokyo. IEEE. October. 1997.

[14] Keim, D. A.; Information Visualization and Visual Data Mining. Ieee Transactions On Visualization And Computer Graphics, Vol. 7, No. 1, January-March 2002

46

Page 47: Estudo e desenvolvimento de uma Ferramenta de Visualização ...ppginf.ucpel.tche.br/TI-arquivos/2006/EdecioIepsen/PPGINF-UCPel-TI... · E não é preciso descrever muito para exemplificar

[15] Loh, S.; Garin, R. S.; Web Intelligence – Inteligência Artificial para Descoberta de Conhecimento na Web. 2001, www.inf.unisinos.br

[16] Luzzardi, P. R. G.; Critérios de Avaliação de Técnicas de Visualização de Informações Hierárquicas. Tese de Doutorado, 2003. UFRGS: Porto Alegre.

[17] Muchow, J. W.; Core J2ME Tecnologia & MIDP, Pearson Makron Books, São Paulo, 2004

[18] Plaisant, C.; Shneiderman, B.; LifeLines: Using Visualization to Enhance Navigation and Analysis of Patient Records. Revised version appeared in 1998 American Medical Informatics Association Annual Fall Symposium (Orlando, Nov. 9-11, 1998).

[19] Rao, R.; Card, S. K.; (1994). The table lens: Merging graphical and symbolic representation in an interactive focus + context visualization for tabular information. In Proceedings of ACM Conference on Human Factors in Software, pages 318–322. ACM-Press.

[20] Robertson, G.; Card, S.; Mackinlay, J.; Cone Trees: Animated 3D Visualizations of Hierarchical Information. Proceedings of ACM CHI´91 ,1991, pp. 189-194.

[21] Shneiderman, B. The eyes have it: a task by data type taxonomy for information visualizations. Proceedings of IEEE Symposium on Visual Languages, Boulder, CO, September 3-6, 1996. pp. 336-343.

[22] Soares, W. PHP 5: Conceitos, Programação e Integração com Banco de Dados. Editora Érica, São Paulo, 2004.

[23] Spence, R. Information Visualization. ACM Press and Addison-Wesley, 2001.

[24] Swan, R.; Jensen, D.; TimeMines: Constructing Timelines with Statistical Models of Word Usage; Department of Computer Science, University of Massachusetts - Amherst, Massachusetts USA.

[25] Thomson, L.; Welling, L.; PHP e MySQL: Desenvolvimento Web. Elsevier, Rio de Janeiro, 2005.

[26] Viegas, F.; Donath, J.; Chat Circles. Computing System, New York: NY, USA. ACM Press new York, NY, USA, 1999.

Agradecimentos: Este trabalho conta com o apoio do CNPq, FAPERGS, UCPel e SENAC.

47