Joel Amaro Ferreira Oliveira
Visualization of Information: a Study Case
Dissertação de Mestrado
Mestrado em Engenharia de Gestão e Sistemas de
Informação
Trabalho efetuado sob a orientação do
Professor Doutor Jorge Vaz de Oliveira e Sá
Mês [de submissão da dissertação] de 201X
ii
DECLARAÇÃO
Nome: Joel Amaro Ferreira Oliveira
Endereço eletrónico: [email protected] Telefone: 913781800
Bilhete de Identidade/Cartão do Cidadão: 14574015
Título da dissertação: Visualization of Information: a Study Case
Orientador/a/es:
Professor Doutor Jorge Vaz de Oliveira e Sá
Ano de conclusão: 2018
Mestrado em Engenharia de Gestão e Sistemas de Informação
É AUTORIZADA A REPRODUÇÃO INTEGRAL DESTA DISSERTAÇÃO APENAS PARA EFEITOS
DE INVESTIGAÇÃO, MEDIANTE DECLARAÇÃO ESCRITA DO INTERESSADO, QUE A TAL SE
COMPROMETE.
Universidade do Minho, _____/_____/_________
Assinatura:
iii
v
RESUMO
Vivemos numa sociedade caracterizada pela elevada capacidade de produzir e armazenar
enormes quantidades de dados, uma sociedade que nos pressiona para observar, processar e
criar conhecimento sobre estes mesmo dado, quer para as nossas atividades pessoais quer
para as profissionais. Vivemos naquilo a que podemos chamar de uma sociedade de
informação pressionada e sofredora de uma ansiedade por informação, onde o buraco negro
entre a informação e o conhecimento está a alastrar-se, principalmente devido ao grande
volume de dados e à incapacidade de absorver a informação relevante para os nossos
diferentes objetivos.
Existe sem sobra de dúvida um grande volume de dados, e é fundamental que organizações
se dediquem a estudar forma de os analisar, procurando identificar possíveis padrões,
propriedades particulares, relações, etc. entre dados. A necessidade de conseguir ter um
controlo sobre os dados, de saber o que precisamos, do que queremos dos dados e
posteriormente, conseguir fazer com que os dados nos digam aquilo que precisamos, irá ser
mais do que uma vantagem competitiva, revelando-se um fator fulcral para a sobrevivência
de uma organização.
Existem diferentes formas de analisar conjuntos de dados, e a Visualização de Informação
destaca-se como uma área que procura estabelecer parâmetros que permitam ao
visualizador, a melhor e mais rápida perceção da informação necessária extrair de uma
determinada representação gráfica.
Quando procuramos comprar ou vender algo, somos inundados com informações, que
acabam por nos fazer perder a noção do que realmente queremos saber e/ou o que realmente
interessa e nos ajudará a cumprir os nossos objetivos.
O presente projeto visa aplicar as melhores técnicas de Visualização de informação, com vista
o auxilio da tomada de decisão, para o mercado português de compra e venda de veículos
usados.
Palavras-Chave: Visualização de Informação, Visualização Analítica, Sistemas de Apoio à
Decisão, Mercado de Carros Usados.
vii
ABSTRACT
Nowadays, we live in a society characterized by the high capacity of producing and storing
enormous amounts of data, a society that presses us to observe, process and create
knowledge about these same data, for our personal’s activities and also for our professional’s
activities. We live in what we can call a society of information that is under pressure and
suffering an anxiety for information, where the black hole between information and
knowledge is spreading, mainly due to the large volume of data and the inability to absorb the
relevant information four our different goals.
There is no doubt that exists a huge volume of data, and it is crucial that the organizations
devote themselves to studying ways of analyzing them, trying to identify possible patterns,
particular properties, relationships, and others, between data. The necessity of having control
over the data, knowing what we need, what we want from the data, and then getting the data
to tell us what we need will be more than a competitive advantage, proving itself to be a factor
for the survival of an organization.
There are different ways of analyzing data sets, and the information of visualization stands
out as an area that looks to establish parameters that allows the viewer, the best and quickest
perception of the information needed to extract from a graphic representation.
When we are looking to buy or sell something, we are flooded with information that makes
us lose the real sense of what we really want to know and/or what really matters and what
will help us to achieve our goals.
This project aims to apply the best information visualization techniques, with the purpose of
assisting decision making, for the Portuguese market of purchase and sale of used vehicles.
Keywords: Information of Visualization, Analytical Visualization, Decision Support Systems,
Secondhand Car Market.
ix
ÍNDICE
Resumo ....................................................................................................................................... v
Abstract .................................................................................................................................... vii
Lista de Figuras .......................................................................................................................... xi
Lista de Tabelas ........................................................................................................................ xiii
Lista de Abreviaturas, Siglas e Acrónimos ................................................................................. xv
1. Introdução ........................................................................................................................... 1
1.1 Contextualização do Problema .................................................................................. 1
1.2 Objetivos e resultados esperados .............................................................................. 2
1.3 Estrutura do relatório ................................................................................................. 3
2. Estado da arte ..................................................................................................................... 5
2.1 Enquadramento geral................................................................................................. 5
2.1.1 Análise Exploratória ............................................................................................... 9
2.1.2 Análise Confirmativa ............................................................................................ 10
2.1.3 Apresentação ....................................................................................................... 10
2.1.4 Infográfico ............................................................................................................ 11
2.2 Diferença entre Scientific Visualization, Information Visualization e Analytic
Visualization .......................................................................................................................... 12
2.2.1 Visualização Analítica ........................................................................................... 13
2.3 Visualização de Informação nos dias de hoje .......................................................... 14
2.4 Enquadramento da VI em contexto mundial ........................................................... 16
2.5 Business intelligence / Data Intelligence ................................................................. 16
2.6 Sistemas de Apoio à Decisão .................................................................................... 17
2.7 Compreensão do negócio ........................................................................................ 17
3. Abordagem metodológica ................................................................................................ 19
3.1 Metodologia DSR ...................................................................................................... 19
3.1.1 Identificação do problema e motivação .............................................................. 20
3.1.2 Definição de objetivos de uma solução ............................................................... 20
3.1.3 Design e Conceção ............................................................................................... 20
x
3.1.4 Demonstração ...................................................................................................... 21
3.1.5 Avaliação .............................................................................................................. 21
3.1.6 Comunicação ........................................................................................................ 21
4. Ferramentas a utilizar ....................................................................................................... 23
5. Lista de riscos .................................................................................................................... 25
6. Planeamento ..................................................................................................................... 27
7. Conclusão .......................................................................................................................... 29
Bibliografia ............................................................................................................................... 31
Anexo I – Plano do Projeto ....................................................................................................... 33
xi
LISTA DE FIGURAS
Figura 1 - Evolução volume de dados. Fonte (Reinsel, Gantz, & Rydning, 2017) ...................... 6
Figura 2 - Dos dados à sabedoria.
Fonte(https://breakthroughanalysis.com/2014/08/14/attensity-nlp-and-data-
contextualization/) ..................................................................................................................... 7
Figura 3 - Representação visual da invasão do exército de Napoleão à Rússia em 1812,
produzida por Charles J.Minard (http://www.sfu.ca/media-lab/DCM/) ................................... 8
Figura 4 - Mapa dos Estados Unidos da América, que mostra o número de mortes por cancro
da população masculina entre 1970 e 1994, subdivido entre países. Fonte
(https://www.sciencedirect.com/science/article/pii/S1877584509000057) ........................... 9
Figura 5 - Imagem que compara os mercado de ações Italiano, Mibtel, com o americano Dow
Jones.Fonte:(Mazza, 2009)....................................................................................................... 10
Figura 6 - Representação do mapa do metro de Londres, desenvolvido por Henry Beck em
1933. Fonte (http://amodern.net/article/henry-c-beck-material-culture-and-the-london-
tube-map-of-1933/) ................................................................................................................. 11
Figura 7 -Infográfico (http://www.cofacecentraleurope.com)................................................ 12
Figura 8 - Âmbito da Visualização Analítica. Fonte(http://www.vismaster.eu/news/visual-
analytics-scope-and-challenges/) ............................................................................................. 13
Figura 9 - Perceção da informação pelos sentidos segundo Tor Nørretranders. Fonte
(Nørretranders, 1991) ............................................................................................................... 15
Figura 10 - Fases DSR Adaptado de.(Peffers et al., 2007) ........................................................ 19
Quando aplicável.
xiii
LISTA DE TABELAS
Tabela 1 - Lista de Riscos e Plano de Contingências ................................................................ 25
Tabela 2 - Planeamento ........................................................................................................... 27
xv
LISTA DE ABREVIATURAS, SIGLAS E ACRÓNIMOS
AR – Action Research
BI – Business Intelligence
DSR – Design Science Research
IOE – Internet of Everything
IOT – Internet Of Things
SI – Sistemas de Informação
TI – Tecnologias de Informação
VA – Visualização Analítica
VC – Visualização Científica
VI – Visualização de Informação
1
1. INTRODUÇÃO
1.1 Contextualização do Problema
A visualização é um termo que está intrinsecamente ligado ao ser humano, como uma
construção mental, ou seja, é algo que não pode ser impresso ou representado no ecrã de um
computador.
Pensemos, por exemplo, num manual de instruções que, na maior parte das vezes, vem
acompanhado de representações visuais sobre as instruções de montagem/utilização de um
produto. Imaginemos o exemplo de um manual de instruções de uma peça de mobília que
compramos e temos agora de a montar. Ora o facto de termos representações visuais que nos
elucidem sobre os passos que devemos seguir, quer para saber por que parte devemos
começar, quer para saber quais ferramentas utilizar, permitem-nos uma melhor perceção
daquilo que é preciso fazer para alcançar o resultado final. Agora imaginemos o mesmo
manual de instruções que, em vez de possuir representações, seria todo em relatado em
prosa, ou até mesmo teríamos uma linha de apoio cuja função seria explicar os passos aos
utilizadores. Isto seria uma coisa impraticável.
Por conseguinte, poderá ser um fator decisivo para o sucesso ou insucesso do objetivo do
manual, que é o de transmitir informação útil para que o utilizador, possa adquirir
conhecimento de forma a proceder à montagem do equipamento.
Podemos, então, aqui ver um dos principais impactos de uma representação visual de
excelência e, perceber o quão importante a visualização de informação é, como aliado para a
transmissão de informação e conhecimento.
Quando temos dados e precisamos que os mesmos expressem conceitos, ideias e
propriedades intrínsecas aos dados, o uso de representações visuais oferece-nos uma
ferramenta de comunicação muito válida.
De facto, somos informados por dados que provêm de inúmeras fontes, porém o grande
desafio passa por ter a capacidade de analisar esses mesmos dados, e perceber de que forma
os devemos analisar para tirar o máximo proveito para os objetivos individuais e
organizacionais.
2
A informação, propriamente dita, tão valiosa e fundamental para o nosso dia-a-dia, é
processada e obtida neste contínuo e constante fluxo de dados, a que estamos ativa ou,
passivamente sujeitos. Porém são necessários métodos efetivos que nos permitem “navegar”
pela informação e assim, dar suporte às nossas decisões.
Há inúmeras situações em que usamos representações visuais para entender uma enorme
quantidade de dados, isto deve-se à nossa capacidade de perceção. Uma representação é, na
grande maioria dos casos, mais efetiva do que um texto sendo que, a versão gráfica tem a
vantagem de usar as propriedades gráficas, que são rapidamente e efetivamente processadas
pela perceção visual e cognitiva humana gerando um significado.
Uma correta visualização de dados pode permitir ao ser humano, perceber a existência de
relações entre um ou mais grupos de dados, perceber os valores máximos e mínimos,
identificar grupos, tendências, falhas ou outros valores interessantes que de outra forma, não
teríamos perceção dos mesmos (Mazza, 2009).
Como tal, representações visuais permitem-nos perceber sistemas complexos, servem de
suporte à tomada de decisão e possibilitam encontrar informação que, de outra forma,
continuaria escondida nos dados.
Citando o autor, Edward Tufte “Excellence in statistical graphics consists of complex ideas
communicated with clarity, precision, and efficiency”(Tufte & Schmieg, 1985).
Assim, é necessário dar ao utilizador, numa imagem, o máximo de dados que possa processar
no menor tempo possível, usando o menor espaço possível.
Posto isto, a presente dissertação procura usar a área de VI, tendo em vista os principais
objetivos da mesma, para elaborar um conjunto de representações que, enquadradas num
determinado ambiente organizacional, transmita as informações necessárias ao utilizador, no
menor tempo possível.
1.2 Objetivos e resultados esperados
O principal objetivo desta dissertação passa pelo desenvolvimento de representações visuais,
capazes de permitir aos autores de um mercado típico, o de automóveis usados, o acesso aos
dados relevantes, permitindo receber informação pertinente, para criar conhecimento, de
forma a suportar todo o processo de tomada de decisão.
3
O negócio automóvel, é um negócio que envolve inúmeros fatores discriminativos que, por
sua vez, poderão influenciar totalmente a tomada de decisão sobre a compra/venda de um
veículo. Por exemplo, procurar perceber qual a relação de oferta/procura que poderá ser mais
benéfica para o utilizador, usando as diferentes áreas geográficas do país, para perceber onde
será mais vantajoso fazer o negócio e, ainda, perceber as tendências, os padrões de compra e
venda de veículos ou como variam os preços e porquê, poderão ser dados fundamentais para
o sucesso de um stand automóvel.
Recorrendo às melhores práticas e técnicas de visualização de informação, procurar-se-á
entender as necessidades do negócio e, consequentemente, desenvolver diferentes tipos de
representações visuais, com finalidades diferentes, que irão influenciar positivamente as
tomadas de posição dos atores neste mercado.
Após uma investigação mais aprofundada ao mercado de compra e venda de automóveis em
Portugal, e consequentemente ter percebido o desafio que o domínio deste negócio
representa, acredita-se que este projeto irá contribuir e, ser um ponto de referência para
futuras investigações nas áreas adjacentes à presente investigação.
1.3 Estrutura do relatório
O presente documento está composto por uma introdução ao projeto em si,
contextualizando-o, indicando as principais motivações para o desenvolvimento do mesmo e,
também, quais os objetivos e resultados esperados.
Posteriormente, será apresentada uma revisão do estado da arte, onde se poderá constatar
todo o levantamento de informação existente e trabalhos desenvolvidos dentro das áreas de
intervenção deste tema de dissertação.
Na seção seguinte encontramos dois capítulos: lista de riscos e planeamento do projeto. A
lista de riscos, é onde é feita uma análise aos fatores, que podem influenciar o sucesso ou
insucesso do projeto, classificando-os e elaborando planos de ação para os mesmos; O
planeamento do projeto é onde estão explicitas as datas de entregas anteriormente definidas,
assim como, algumas metas estabelecidas de forma a atingir, com sucesso, o que foi planeado.
Finalmente, como último capítulo, temos a bibliografia do projeto onde poderá ser consultado
todas as referências que foram utilizadas ao longo do desenvolvimento do projeto.
5
2. ESTADO DA ARTE
Este capítulo é composto pelo estudo de conceitos, disciplinas, metodologias e solução que
orientam a temática da investigação.
Para o desenvolvimento deste ponto, a recolha de conceitos e de conteúdo foi realizada,
recorrendo à Internet, onde caso um determinado artigo ou publicação desejada não estivesse
disponível, procurou-se pelo mesmo conteúdo na sua versão física.
De facto, para a revisão do estado da arte foram realizadas pesquisas em bases de dados que
contêm artigos científicos, nomeadamente o “Google Scholar” e “Research Gate”, para a
pesquisa relacionada com tecnologia e Visualização de Informação.
Procurou-se realizar a pesquisa de todos os temas abordados na língua portuguesa e,
também, em língua inglesa, sendo isto aplicável para todos os conceitos.
Portanto, nesta seção podemos esperar um levantamento da informação existente em todas
as áreas envolventes ao tema em foco, de forma a fornecer suporte científico adequado.
2.1 Enquadramento geral
A sociedade da informação é, uma sociedade que testemunha e contribui para um
crescimento exponencial da quantidade de dados e informação que necessita de ser
processada e tratada diariamente.
Todas as diferentes áreas da indústria, dos serviços, da comunicação entre outros, contribuem
ativamente para a produção de quantidades abismais de dados, principalmente mais
recentemente com o aparecimento do conceito de IOT (Internet Of Things), ou ainda mais
atual, IOE (Internet of Everything), onde estão a ser recolhidos dados de incontáveis sensores.
Esta realidade, levou a que o volume existente de dados crescesse a um ritmo muito superior
aquele da capacidade existente para processar, analisar e a capacidade de tomada de decisão.
A seguinte figura 1, representa o ritmo deste crescimento:
6
Figura 1 - Evolução volume de dados. Fonte (Reinsel, Gantz, & Rydning, 2017)
Na Figura 1. podemos ver uma estimativa feita para o crescimento exponencial até ao ano de
2025, com os números a chegaram aos 163 Zettabytes de dados gerados, com um crescimento
previsto de 60%, dos quais 80% serão de dados não estruturados (Reinsel et al., 2017).
Este crescente volume de dados disponíveis tem revelado ser um problema, tanto para as
organizações como para os indivíduos.
De um ponto de vista organizacional, o excesso de dados não tratados aumenta os níveis de
ineficiência, contribuindo para que tempo e dinheiro sejam desperdiçados e
consequentemente, oportunidades de negócio passem despercebidas. Quanto ao indivíduo,
podemos ver consequências negativas na incapacidade de processar e filtrar a quantidade de
informação, no aumento de nível de stress pela “inundação” de nova informação, não
sabendo que informações usar, como apoio à tomada de decisão num determinado tema.
Em 2005 no artigo de (Hallowell, 2005) o tema foi abordado e identifica alguns destes
problemas:
• O aumento do tempo necessário para tomada de decisões;
• Dificuldade na identificação de relações entre pormenores e visão holística;
• Aumento dos erros de análise;
• Tornar-se demasiado seletivo, ignorando a grande quantidade de informação por
incapacidade de análise de elevados volumes de dados.
7
Desta forma, é crucial lidar com os dados no sentido de os transformar em informação útil.
Para tal, é fundamental fazer a distinção entre conceitos-chave, que muitas vezes são
confundidos, sendo eles: dados, informação, conhecimento e sabedoria. Em inglês, temos o
conceito de hierarquia DIKW – Data, Information, Knowledge e Wisdom, que retrata a
distinção entre os mesmos.
Segundo Ackoff (Ackoff, 1989) e, tendo em vista o contexto de Sistemas de Informação, dados
são considerados registos de eventos, que são recolhidos num espaço temporal e desprovidos
de qualquer contexto. Relativamente à informação, esta é representada por um conjunto de
dados, aos quais foram atribuídos um contexto e uma organização. Quanto ao processo de
interiorização da informação e que, eventualmente poderá despoletar num processo de
tomada de decisão, é denominado de conhecimento. Por último, a sabedoria poderá ser
entendida como a capacidade de utilizar o conhecimento, através de processos de
introspeção, reflexão e contemplação adicionais ao conhecimento.
Figura 2 - Dos dados à sabedoria. Fonte(https://breakthroughanalysis.com/2014/08/14/attensity-nlp-and-data-contextualization/)
Como podemos ver na Figura 2, é possível perceber a relação entre os quatro conceitos, e
entender que, conforme avançamos na hierarquia e à medida que vai aumentando
consequentemente a contextualização, maior será o grau de compreensão sobre o tema em
estudo.
Apenas quando a informação é devidamente contextualizada é que conseguimos produzir
conhecimento e sabedoria da mesma.
8
É no processo de passagem entre os diferentes níveis da hierarquia DIKW, que os atuais
Sistemas de Informação (SI) assumem um papel fundamental para o processamento dos
dados e auxílio na análise dos mesmos. De facto, os dados contidos na maioria das aplicações,
se não foram tratados e analisados não apresentam qualquer valor por si mesmos. Para
assumirem o valor que as organizações pretendem dos mesmos, têm que ser tratados para
que seja possível extrair a informação neles contida. Sem isto, é impossível chegar ao
conhecimento e sabedoria que poderão suportar um processo de decisão.
Visualização de informação é uma área de estudo que visa potenciar a análise e compreensão
de um conjunto de dados, através de representações gráficas, geralmente interativas (Freitas,
Chubachi, Luzzardi, & Cava, 2001).
As técnicas de visualização baseiam-se em representações visuais e em mecanismos de
interação que possam possibilitar ao utilizador manipular a representação de modo, a obter
uma melhor compreensão do conjunto de dados representados.
É necessário que uma imagem consiga dar ao utilizador o máximo de dados possíveis, de
forma a que estes sejam processados facilmente, usando o menor espaço possível.
Com o intuito de validar a aplicabilidade da visualização de informação em diferentes áreas,
podemos analisar, nos pontos a seguir, a sua aplicabilidade nas áreas de análises exploratórias
e análises confirmativas, onde serão apresentados exemplos da sua aplicabilidade e da
importância do seu papel.
Figura 3 - Representação visual da invasão do exército de Napoleão à Rússia em 1812, produzida por Charles J.Minard (http://www.sfu.ca/media-lab/DCM/)
9
Na Figura 3 podemos ver um exemplo perfeito do conceito apresentado por Edward Tufte,
em que explica aquilo que considera ser a excelência numa representação visual, afirmando
mesmo ser “o melhor gráfico estatístico jamais desenhado”(Tufte & Schmieg, 1985).
2.1.1 Análise Exploratória
A análise exploratória de dados é uma das aplicações que mais beneficia das representações
visuais e da capacidade de analisar através da perceção visual e do sistema cognitivo humano,
tendo sido usada historicamente, para identificar propriedades, relações, regularidades ou
padrões.
Um cartógrafo francês, Jacques Bertin, desenvolveu um estudo onde define todos os
elementos básicos, a ter em conta, no desenvolvimento de representações visuais, intitulado
de “The visual means of resolving logical problems”, estudo este, onde diversas técnicas
sugeridas pelo cartógrafo ainda hoje são aplicadas (Bertin, 1981).
Figura 4 - Mapa dos Estados Unidos da América, que mostra o número de mortes por cancro da população masculina entre 1970 e 1994, subdivido entre países. Fonte (https://www.sciencedirect.com/science/article/pii/S1877584509000057)
Embora a Figura 4 não forneça a explicação pelo número elevado de mortes em determinados
estados, em comparação com outros, esta pode sugerir a necessidade de realizar estudos
epidemiológicos em determinadas regiões, com o intuito de procurar as possíveis causas que
aumentam o risco de cancro.
10
Efetivamente, num estudo realizado sobre cancro dos pulmões, recorrendo a análises deste
tipo, conclui-se que as zonas costeiras tinham um elevado número de mortes por cancro dos
pulmões e, após outras investigações, aperceberam-se que se devia a um composto químico
inalado pelos trabalhadores que trabalhavam nos portos durante a segunda guerra mundial.
2.1.2 Análise Confirmativa
Representações visuais também podem servir de suporte para análises confirmativas em
relações estruturais entre conjuntos de dados, de forma a confirmar ou infirmar hipóteses nos
dados.
Figura 5 - Imagem que compara os mercado de ações Italiano, Mibtel, com o americano Dow Jones.Fonte:(Mazza, 2009)
Na Figura 5 podemos analisar as flutuações nos mercados de ações, e averiguar que as
flutuações nos diferentes mercados acontecem em intervalos de tempo similares, e seguem
a mesma tendência de evolução, levando a afirmar que estes dois mercados, são igualmente
influenciados pelos mesmos eventos, despoletando esta sincronia.
Poderíamos chegar a esta conclusão por outros meios, como por exemplo, através de cálculos
matemáticos que certamente seriam menos expressivos e intuitos que esta imagem.
2.1.3 Apresentação
11
Figura 6 - Representação do mapa do metro de Londres, desenvolvido por Henry Beck em 1933. Fonte (http://amodern.net/article/henry-c-beck-material-culture-and-the-london-tube-map-of-1933/)
Na Figura 6 podemos ver um exemplo de Apresentação. Neste tipo de demonstrações
destaca-se a sua capacidade de perceção e persuasão que transmite ao utilizador.
Desta forma, um utilizador consegue visualizar qual o percurso do metro de Londres,
identificando facilmente quais as linhas que precisa de percorrer para chegar ao seu destino.
2.1.4 Infográfico
Infográficos são representações visuais de conjuntos de gráficos, nomeadamente ilustrações,
símbolos, mapas, diagramas, etc. em que todos juntos e com a ajuda da linguagem verbal
transmitem informação.(Meirelles, 2013)
12
Figura 7 -Infográfico (http://www.cofacecentraleurope.com)
Na Figura 7 podemos ver um exemplo de um infográfico, que ilustra uma perspetiva global
sobre uma possível reviravolta económica devido à instabilidade politica existente. É possível
visualizar e absorver muita informação deste infográfico.
2.2 Diferença entre Scientific Visualization, Information Visualization e
Analytic Visualization
Visualização Científica – uso de representações visuais de dados científicos, tipicamente
baseados em atributos físicos, de forma a amplificar a cognição (Card, Mackinlay, &
Shneiderman, 1999).
13
Visualização de Informação – uso de representações visuais de dados abstratos, não físicos,
com o objetivo de amplificar a capacidade de cognição (Freitas et al., 2001).
Visualização Analítica – uso de representações visuais para a atribuição de significado e
raciocínio analítico (J. J. Thomas & K. A. Cook, 2006)
2.2.1 Visualização Analítica
A visualização analítica está, especialmente, preocupada com a atribuição de um significado
e raciocínio analítico através de interfaces gráficas.
Definida por James J. Trompas e Kristin A.Cook como a “ciência do raciocínio analítico através
de interfaces visuais”. Esta área surge através do desenvolvimento das áreas de VI e VC, e
procura focar-se no pensamento analítico, através do recurso a interfaces gráficas sendo
resultado de várias áreas de investigação (J. J. Thomas & K. A. Cook, 2006).
Podemos ver as áreas que estão intrinsecamente ligadas à área de visualização analítica na
Figura 8.
Com isto, a visualização analítica tenta combinar as vantagens da capacidade cognitiva e
perceção humana, o poder de processamento dos computadores, análise geoespacial,
processos de gestão de Informação e descoberta de conhecimento.
Figura 8 - Âmbito da Visualização Analítica. Fonte(http://www.vismaster.eu/news/visual-analytics-scope-and-challenges/)
Os problemas levantados são relacionados com o dimensionamento, complexidade, perceção
e necessidade de análise e síntese. A área de visualização analítica procura obter avanços
científicos e tecnológicos no raciocínio analítico, interação, transformações de dados e
representações para computação e visualização de relatórios analíticos.
14
Alguns dos temas com impacto na VA, são já um tema aprofundado em outras áreas. Por
exemplo, na área da Psicologia e ciências cognitivas estuda-se quais os elementos visuais de
maior impacto na visualização de Informação, como por exemplo, a cor – matriz, a saturação,
o brilho, a textura, orientação. Temos também técnicas, como por exemplo, gráficos de linha,
Scatter Pilots, grifos e ícones, visualização volumétrica, diagramas de fluxo, entre outros.
A forma de utilização destas técnicas é um tema bastante explorado e aprofundado em
diversos livros de Stephen Few que, de uma forma bastante prática, procura dar uma visão
geral sobre todos os temas envolvidos na VA e de que forma estes podem ajudar a criar
impacto. É fundamental ter em mente que, mais do que apresentar os dados é necessário que
estes sejam entendidos e percebidos.
Segundo Stephen Few, esta é uma das grandes problemáticas da área de Business Intelligence:
“o que a indústria de BI tem ignorado e o facto que a inteligência reside nos seres humanos,
é que a informação apenas se torna valiosa quando é percebida e não apenas disponibilizada”
(Few, 2009).
Este problema também é apontado no livro de Stephen Few – Information Dashboard Design
(Few, 2006) onde, são apresentados exemplos de várias organizações cuja área de atuação é
no desenvolvimento de software de BI (Business Intelligence) e, como estes, que são
considerados exemplos de portfólio, falham nos mais elementares conceitos de VA. Neste
livro são abordados os impactos e a importância dos Dashboards, como forma eficaz de
transmitir informação de uma forma simplificada, porém, quando os recursos tecnológicos ao
dispor não são utilizados eficazmente, o esforço para o desenvolver traduz-se num
desperdício de recursos financeiros e de recursos humanos.
2.3 Visualização de Informação nos dias de hoje
David McCandless, defende que poderá existir uma solução fácil para o problema do excesso
de informação, e essa solução passa por utilizar mais os nossos olhos (McCandless, 2010).
Desta forma, é-nos possível ver quais as ligações e padrões existentes e, posteriormente,
concentrar-nos na informação que é relevante.
Tor Nørretranders em “The user illusion: Cutting consciousness down to size”, ilustra a
importância da perceção visual, onde estratifica e associa a quantidade de informação que
pode ser absorvida por cada um dos nossos sentidos.
15
Tor Nørretranders, como podemos ver na Figura 9, defende que a visão é o nosso sentido mais
rápido e tem aproximadamente a mesma largura de banda de uma rede de computadores,
seguida pelo tato que, tem aproximadamente a velocidade de uma porta USB, depois o a
audição e o olfato, que têm a mesma taxa de transferência de um disco rígido. Por último,
aparece o paladar, sendo o sentido com menor capacidade e tem uma taxa de transferência
de uma pequena máquina calculadora. Assume também que de toda esta informação que nos
chega pelos sentidos, apenas 0,7 por cento é, de facto, a quantidade que estamos conscientes
(Nørretranders, 1991).
Grande parte da nossa perceção é muitas vezes inconsciente e, é o olho humano, o principal
responsável pela perceção, pois é extremamente sensível a variações de cor, formas e padrão.
Figura 9 - Perceção da informação pelos sentidos segundo Tor Nørretranders. Fonte (Nørretranders, 1991)
Na área de VI, as questões que têm sido alvo de maior estudo são as da criação de
visualizações para determinados topos de dados e o desenvolvimento de técnicas de
interação com os dados através de visualizações e interfaces gráficas, correspondendo ao que
é, a fase exploratória de uma nova disciplina.
Basicamente, antes de ser possível construir sistemas genéricos que possam ser usados para
vários conjuntos de dados é fundamental sistematizar quais as características de um sistema
de VI, devendo ser identificados os tipos de dados a visualizar, quais os tipos de mapas e quais
as formas de interação. Isto tudo sem esquecer qual será o nosso público-alvo.
16
Como o tipo de informação que pode ser tido em conta no âmbito da VI é vasto, a solução
muitas vezes adotada passa por dividir o problema pelas suas subáreas e pelo
desenvolvimento de técnicas próprias para cada uma delas.
2.4 Enquadramento da VI em contexto mundial
A VI é uma temática que tem vindo a conquistar o seu espaço e, a sua importância tem vindo
a ser reconhecida mundialmente.
Existem, de facto, inúmeros projetos de renome mundial, tais como o DATAVIVA ou DATAUSA
do MIT MediaLab, que desenvolveram estas duas plataformas online onde podem ser
consultados uma série de representações gráficas interativas que, permitem ao utilizador
adquirir informação acerca das diferentes áreas económicas dos respetivos países. Também
de ressalvar as três principais conferências mundiais, nomeadamente a EuroVis para a zona
Europeia, a PacificVis na zona Ásia Pacífico, a VisWeek no continente americano, sendo
apoiados pela IEEE(Institute of Electrical and Electronics Engineers), onde são realizadas
anualmente e debatem os mais variados temas da Visualização de Informação e da
Visualização Analítica, sendo dos principais meios pelos quais trabalhos com maior relevância,
são realizados com elevado contributo para o estudo da área.
2.5 Business intelligence / Data Intelligence
O termo Business Intelligence (BI) surge, por intermédio de uma consultora na área das
Tecnologias de Informação, a “Gartner Group”.
Uma definição para BI é apresenta por Moss que defende o conceito como sendo uma
arquitetura e uma coleção de aplicações de apoio à decisão, que permitem um acesso
facilitado à informação de negócio (Moss & Atre, 2003).
Quanto a Negash, BI é uma combinação dos dados operacionais da organização com as
ferramentas analíticas, no intuito de apresentar informação que permita otimizar a tomada
de decisão dos gestores, podendo criar oportunidades para vantagens estratégicas e
competitivas à organização (Negash, 2004).
17
O conceito tem vindo a evoluir, e é Turban que define BI como sendo um “guarda-chuva” que
tem a particularidade de combinar uma série de arquiteturas, bases de dados, ferramentas de
análise de dados, aplicações e metodologias (Turban, Sharda, & Delen, 2011).
Turban considera a área de BI como um aliado fulcral para os gestores das organizações,
permitindo que a tomada de decisão seja efetuada com o apoio de informação relevante, de
qualidade e atual, e não, em decisões baseadas na intuição.
A adoção de BI pelas organizações tem vindo a crescer a uma velocidade tremenda, sendo
inclusive difícil encontrar uma organização com provas dadas de sucesso no mercado que não
tenha utilizado BI como mecanismo impulsionadora do sucesso (Chaudhuri, Dayal, &
Narasayya, 2011).
Resumindo e explicando, de uma forma simplista, BI é algo que engloba a recolha dos dados
operacionais das organizações, que posteriormente são armazenados em repositórios criados
par ao efeito e através da utilização de ferramentas de análise, transformação e exploração
de dados, obtendo informação útil para a tomada de decisão dos gestores
Porém BI é mais do que a simples junção de ferramentas que permitem o armazenamento,
tratamento, transformação e visualização dos dados, pois a verdadeira importância do BI
resida na combinação do processo de entrega de informação, com a capacidade das pessoas
em identificar as reais necessidades da organização, podendo desta forma serva a
organização, criando valor.
2.6 Sistemas de Apoio à Decisão
Os Sistemas de Apoio à Decisão(SAD) é um termo que descrevem qualquer sistema que
suporte a tomada de decisão numa organização, mas sendo que existem inúmero autores que
tendem a ajustar a definição consoante o público alvo (Aronson, Liang, & Turban, 2005).
2.7 Compreensão do negócio
O mercado de compra e venda de automóveis engloba inúmeras variáveis que podem
influenciar fortemente o preço de um veículo e, aí reside a dúvida, o fator mais importante
para os vendedores que se regem pela lei da oferta e da procura.
18
Uma empresa que comercialize veículos (stand), gostaria de saber quais as tendências nas
regiões onde tem lojas, de forma a perceber quais serão os investimentos que terão um maior
retorno financeiro.
Toda esta informação concentrada num único ecrã, ou numa folha A4, é o que qualquer gestor
idealiza. Porém, estamos a falar de dar a capacidade de análise do mercado, não só aos
gestores, mas também aos vendedores. Cada um com as suas necessidades principais saciadas
num único ponto.
Para tal, é fundamental ter uma perceção de quais as variáveis discriminativas existentes no
negócio, que peso estas assumem e quais as necessidades do público-alvo.
O preço de um veículo pode variar a partir do momento em que falamos da perspetiva de
alguém que queira comprar ou que queira vender, e depois ainda o facto de poder ser
comprado ou vendido a um stand ou a um particular. Portanto é importante analisar também
qual a distribuição geográfica existente dos diferentes veículos, assim como a variação de
preços entre regiões. Se possível, perceber qual a frequência com que são vendidos
determinados veículos, em determinadas zonas.
19
3. ABORDAGEM METODOLÓGICA
Após uma investigação, conclui-se que as duas metodologias mais utilizadas para o
desenvolvimento de investigações estruturadas para a obtenção de conhecimento são a
Design Science Research(DSR) e a Action Research(AR).
A metodologia escolhida foi o DSR, visto ter uma forte componente, que é o da Comunicação,
que pesou na decisão, pois este é um requisito para este projeto.
A DSR sugerida por (Peffers, Tuunanen, Rothenberger, & Chatterjee, 2007) é uma abordagem
metodológica ao processo de investigação cientifica, denominada por Design Science
Research.
Na Figura 10 podemos ver a arquitetura geral da metodologia, sendo que esta possui 6 fases,
nomeadamente: a identificação do problema e respetiva motivação, definição dos objetivos
de uma eventual solução, design e conceção do artefacto, demonstração, avaliação e
posteriormente a comunicação.
De facto, a metodologia baseia-se em diversas iterações que podem fazer com que as fases
desenvolvidas possam ser reavaliadas.
Figura 10 - Fases DSR Adaptado de.(Peffers et al., 2007)
3.1 Metodologia DSR
Tal como já foi explicado, a metodologia de investigação utilizada será a DSR, como guião de
referência, mas de forma personalizada dado que eventualmente, em algumas situações
20
poderá se procurar adaptar a metodologia, de acordo com as necessidades do projeto. A
utilização desta metodologia, passa pelo intuito de ajudar à gestão e agilização da execução
do projeto.
3.1.1 Identificação do problema e motivação
Segundo (Peffers et al., 2007) a metodologia inicia-se com a identificação de um problema e
motivação de resolução sobre o mesmo. Ora com o intuito de identificar e delimitar
corretamente o problema mitigando a existência de lacunas na sua identificação. Ao justificar
o valor da solução duas consequências estão inerentes a este trabalho, nomeadamente o de
motivar o investigador e o publico da investigação a procurar a solução e aceitar os resultados
que ajudam a perceber o raciocínio que levou à compreensão do problema por parte do
investigador.
3.1.2 Definição de objetivos de uma solução
Esta fase permite concluir quais são os objetivos de uma solução a partir da definição de um
problema e conhecer o que é possível e viável. Os objetivos podem ser quantitativos, nos
casos em que a solução desejável, que se pretende alcançar, seja melhor que as atuais, ou
qualitativa onde se espera uma descrição de como é esperado que aquilo que vá ser
desenvolvido traga vantagens relativamente ao, até então, desenvolvido.
Os recursos necessários para definir os objetivos incluem o conhecimento do estado dos
problemas e as atuais soluções, caso existam, e, também, a sua eficácia (Peffers et al., 2007).
3.1.3 Design e Conceção
É nesta etapa que são desenvolvidos os artefactos que poderão ser potenciais construções,
métodos, modelos etc.
Conceitualmente, um artefacto de pesquisa pode ser qualquer objeto desenhado onde uma
contribuição para a investigação é incorporada no design. Aqui, encontramos tarefas como
determinar as funcionalidades dos artefactos desejados e a sua arquitetura e, de seguida, criar
o artefacto real.
De forma, a que seja possível chegar à conceção e desenvolvimento, é necessário incluir o
conhecimento teórico para assim conceber a solução (Peffers et al., 2007).
21
3.1.4 Demonstração
Esta fase tem como objetivo demonstrar a capacidade e utilização do artefacto para resolver
uma ou mais instâncias do problema. Isto traduz-se na sua utilização, em experiências,
simulação, estudos de caso, ou outra atividade que seja considerada apropriada. Os recursos
necessários para a demonstração incluem o conhecimento efetivo de como utilizar o artefacto
para resolver o problema (Peffers et al., 2007).
3.1.5 Avaliação
É nesta fase que é feita uma observação e medição, com o objetivo de quantificar a viabilidade
da solução apresentada. É esperado uma comparação de valores esperados, com os valores
obtidos, logo será pertinente possuir um domínio de métricas.
Deseja-se que, no final desta etapa, os investigadores sejam capazes de decidir se o projeto
deverá voltar para a terceira fase, a de design e conceção, com o intuito de melhorar a eficácia
do artefacto, ou se devem partir para a fase de comunicação e propor melhorias para projetos
futuros.
3.1.6 Comunicação
A Comunicação é a ultima etapa, e tem como objetivo a transmissão dos resultados obtidos,
assim como, o artefacto e suas vantagens e utilidades. É uma parte importante, pois servirá
como ponto de partida para ajudar outros investigadores a desenvolver trabalhos na área,
fazendo com que a mesma vá evoluindo.
23
4. FERRAMENTAS A UTILIZAR
Para a aplicação das diferentes técnicas de visualização serão utilizadas as seguintes
ferramentas:
• Power BI
• Tableau
• Qlick View
Com o objetivo de procurar explorar as diferentes ferramentas disponíveis no mercado e mais
utilizadas pelas organizações, estas foram as ferramentas escolhidas.
Com a execução deste projeto pretende-se, também, fazer uma avaliação às ferramentas, de
forma a tecer algumas considerações sobre o seu desempenho neste caso de estudo.
25
5. LISTA DE RISCOS
Tabela 1 - Lista de Riscos e Plano de Contingências
Identificação do
Risco
Probabilidade
[1-5]
Impacto
[1-5]
Seriedade
[P*I]
Plano de
contingência
Problemas com
as ferramentas
selecionadas
5 5 25 Procurar auxílio
junto da
comunidade
online.
Excessivo
tempo na
realização das
tarefas
4 4 16 Procurar aliar ao
planeamento,
baselines
existentes de
projetos
anteriores, e
adicionar uma
margem de erro
à execução de
cada tarefa.
Dificuldade no
acesso aos
dados
4 4 16 Procurar outra
fonte de dados
nas diferentes
fontes
identificadas ou
em última
instância
alteração do
foco.
27
6. PLANEAMENTO
Neste ponto está representado todo o planeamento do projeto, desde a entrega da pré-
dissertação (22/01/2018) até à data de apresentação final do projeto (Julho de 2018).
Podemos consultar nas imagens a seguir todas as atividades presentes no projeto que, se
seguidas com rigor, permitirão o alcance do resultado pretendido.
Após uma revisão do estado da arte relativa às áreas em foco e sobre trabalho já realizados,
onde foi utilizado o Design Science Research para auxiliar todo o processo de investigação,
proceder-se-á ao desenvolvimento de um documento final para a dissertação, que refletirá
todo o trabalho realizado e resultados obtidos, assim como considerações pertinentes.
Tabela 2 - Planeamento
Tarefas
1. Perceção do negócio
1.1 Determinar objetivos do negócio
2.Perceção dos dados
2.1 Recolher dados
2.2 Descrever dados
2.3 Explorar os dados
2.4 Verificar a qualidade dos dados
3.Preparação dos dados
3.1 Selecionar os dados
3.2 Limpar os dados
3.3 Construir dados
4. Preparação do ambiente de desenvolvimento
4.1 Instalar Ferramentas
4.2 Avaliação do software obtido
5.Modelação
5.1 Selecionar técnicas de modelação
5.2 Selecionar técnicas de visualização
28
5.3 Maquete das representações
pretendidas
6. Avaliação dos resultados obtidos
7. Escrita do artigo científico
8. Escrita/Revisão do projeto de dissertação
9.Entrega da dissertação
10.Escrita do relatório do projeto
11. Defesa da dissertação
29
7. CONCLUSÃO
Este projeto de dissertação visa encontrar uma solução que satisfaça as necessidades
encontradas no mercado de transação de veículos usados em contexto português,
nomeadamente a de procurar fornecer um único ponto de contacto, de forma a que o público-
alvo possa visualizar um conjunto de excelência de representações visuais.
Como base de sustentação ao que se pretendeu desenvolver, foi efetuada uma revisão
literária relacionada com Visualização de Informação, Business Intelligence, Visualização
Analítica, entre outros. De ressalvar que acabaram por surgir inúmeras áreas ligadas à
visualização de informação, cuja importância no projeto se mostrou cada vez mais pertinente,
revelando a complexidade da área e mostrando também a sua concordância com tantas
outras.
Foram selecionadas ferramentas que posteriormente serão usadas para desenvolver o
artefacto deste projeto.
31
BIBLIOGRAFIA
Ackoff, R. L. (1989). From data to wisdom. Journal of applied systems analysis, 16(1), 3–9.
Aronson, J. E., Liang, T.-P., & Turban, E. (2005). Decision support systems and intelligent
systems. Pearson Prentice-Hall.
Bertin, J. (1981). Graphics and Graphic Information Processing. Walter de Gruyter.
Card, S. K., Mackinlay, J. D., & Shneiderman, B. (1999). Readings in Information
Visualization: Using Vision to Think. Morgan Kaufmann.
Chaudhuri, S., Dayal, U., & Narasayya, V. (2011). An overview of business intelligence
technology. Communications of the ACM, 54(8), 88–98.
Few, S. (2006). Information Dashboard Design: The Effective Visual Communication of Data.
O’Reilly Media, Inc.
Few, S. (2009). Now You See It: Simple Visualization Techniques for Quantitative Analysis (1st
ed.). USA: Analytics Press.
Freitas, C. M. D. S., Chubachi, O. M., Luzzardi, P. R. G., & Cava, R. A. (2001). Introdução à
visualização de informações. Obtido de http://www.lume.ufrgs.br/handle/10183/19398
Hallowell, E. (2005, Janeiro 1). Overloaded Circuits: Why Smart People Underperform. Obtido
21 de Janeiro de 2018, de https://hbr.org/2005/01/overloaded-circuits-why-smart-people-
underperform
J. J. Thomas, & K. A. Cook. (2006). A visual analytics agenda. IEEE Computer Graphics and
Applications, 26(1), 10–13. https://doi.org/10.1109/MCG.2006.5
Mazza, R. (2009). Introduction to Information Visualization. Springer Science & Business
Media.
McCandless, D. (2010). The beauty of data visualization. Obtido de
https://www.ted.com/talks/david_mccandless_the_beauty_of_data_visualization
Meirelles, I. (2013). Design for Information: An Introduction to the Histories, Theories, and
Best Practices Behind Effective Information Visualizations. Rockport Publishers.
Moss, L. T., & Atre, S. (2003). Business intelligence roadmap: the complete project lifecycle
for decision-support applications. Addison-Wesley Professional.
Negash, S. (2004). Business intelligence. The communications of the Association for
Information Systems, 13(1), 54.
Peffers, K., Tuunanen, T., Rothenberger, M. A., & Chatterjee, S. (2007). A design science
research methodology for information systems research. Journal of management information
32
systems, 24(3), 45–77.
Reinsel, D., Gantz, J., & Rydning, J. (2017). Data age 2025: The evolution of data to life-critical
don’t focus on big data. Focus on the Data That’s Big Sponsored by Seagate The Evolution of
Data to Life-Critical Don’t Focus on Big Data.
Tufte, E. R., & Schmieg, G. M. (1985). The Visual Display of Quantitative Information.
American Journal of Physics, 53(11), 1117–1118. https://doi.org/10.1119/1.14057
Turban, E., Sharda, R., & Delen, D. (2011). Decision support and business intelligence systems.
Pearson Education India.
33
ANEXO I – PLANO DO PROJETO