15
Intercom – Sociedade Brasileira de Estudos Interdisciplinares da Comunicação XXXIII Congresso Brasileiro de Ciências da Comunicação – Caxias do Sul, RS – 2 a 6 de setembro de 2010 1 Visualizações de Dados na Infografia Jornalística e seu uso na Copa do Mundo pela Gazeta do Povo 1 Matias Sebastião PERUYERA 2 Gustavo Guilherme da Matta Caetano LOPES 3 Faculdade Internacional de Curitiba – FACINTER, Curitiba, PR RESUMO Leitores de jornalismo esportivo são, possivelmente, os mais sedentos por novas análises e novos usos para dados estatísticos. As novas tecnologias de Player Tracking geram dados precisos de movimentação de jogadores em campo, que abrem novas possibilidades de análise, dados que, na Copa do Mundo 2010, foram disponibilizados pela Fifa em seu site. A infografia jornalística está, cada vez mais, usando recursos de programação para transformar grandes volumes de dados em gráficos comprensíveis. Neste artigo será analisado o uso desses dados pela equipe de Infografia do jornal Gazeta do Povo, de Curitiba - PR; assim como as possíveis mudanças no método de trabalho, tanto dos repórteres como dos infografistas, que este tipo de fonte de informação acarreta. PALAVRAS-CHAVE Infografia, base de dados, esportes A TECNOLOGIA E OS DADOS DISPONIBILIZADOS PELA FIFA A tecnologia de Player Tracking utiliza câmeras de vídeo de alta definição para gerar imagens que serão processadas por um computador. No caso da empresa Stats, que presta o serviço para a Fifa, são usadas três câmeras para filmar o campo e uma câmera extra para detectar outros movimentos, como substituição de jogadores. As três câmeras são usadas para gerar um único vídeo, no qual o movimento de cada jogador é rastreado. A partir do caminho percorrido por cada jogador, são obtidos dados como a velocidade, a distância percorrida, as partes do campo nas quais houve mais movimentação, entre quais jogadores houve mais passes, etc. Em até quinze minutos depois de cada jogo, a Fifa disponibiliza os dados computados pelo sistema, em planilhas em formato PDF. 1 Trabalho apresentado no DT1 - Jornalismo, da Intercom Júnior – VI Jornada de Iniciação Científica em Comunicação, evento componente do XXXIII Congresso Brasileiro de Ciências da Comunicação. 2 Estudante de Graduação, 4º período do Curso de Comunicação Social - Jornalismo da Facinter. e-mail: [email protected] 3 Orientador do trabalho, Coordenador do Curso de Com. Social da Facinter. e-mail:[email protected]

Visualizações de Dados na Infografia Jornalística e seu ... · Mostra entre quais jogadores houve maior número de passes, o rendimento de cada um, e também qual ... Com a decisão

  • Upload
    lamque

  • View
    218

  • Download
    0

Embed Size (px)

Citation preview

Intercom – Sociedade Brasileira de Estudos Interdisciplinares da Comunicação XXXIII Congresso Brasileiro de Ciências da Comunicação – Caxias do Sul, RS – 2 a 6 de setembro de 2010

1

Visualizações de Dados na Infografia Jornalística e seu uso na Copa do Mundo pela Gazeta do Povo1

Matias Sebastião PERUYERA2

Gustavo Guilherme da Matta Caetano LOPES3

Faculdade Internacional de Curitiba – FACINTER, Curitiba, PR RESUMO Leitores de jornalismo esportivo são, possivelmente, os mais sedentos por novas análises e novos usos para dados estatísticos. As novas tecnologias de Player Tracking geram dados precisos de movimentação de jogadores em campo, que abrem novas possibilidades de análise, dados que, na Copa do Mundo 2010, foram disponibilizados pela Fifa em seu site. A infografia jornalística está, cada vez mais, usando recursos de programação para transformar grandes volumes de dados em gráficos comprensíveis. Neste artigo será analisado o uso desses dados pela equipe de Infografia do jornal Gazeta do Povo, de Curitiba - PR; assim como as possíveis mudanças no método de trabalho, tanto dos repórteres como dos infografistas, que este tipo de fonte de informação acarreta.

PALAVRAS-CHAVE Infografia, base de dados, esportes A TECNOLOGIA E OS DADOS DISPONIBILIZADOS PELA FIFA

A tecnologia de Player Tracking utiliza câmeras de vídeo de alta definição para

gerar imagens que serão processadas por um computador.

No caso da empresa Stats, que presta o serviço para a Fifa, são usadas três

câmeras para filmar o campo e uma câmera extra para detectar outros movimentos,

como substituição de jogadores. As três câmeras são usadas para gerar um único vídeo,

no qual o movimento de cada jogador é rastreado. A partir do caminho percorrido por

cada jogador, são obtidos dados como a velocidade, a distância percorrida, as partes do

campo nas quais houve mais movimentação, entre quais jogadores houve mais passes,

etc.

Em até quinze minutos depois de cada jogo, a Fifa disponibiliza os dados

computados pelo sistema, em planilhas em formato PDF.

1 Trabalho apresentado no DT1 - Jornalismo, da Intercom Júnior – VI Jornada de Iniciação Científica em Comunicação, evento componente do XXXIII Congresso Brasileiro de Ciências da Comunicação. 2 Estudante de Graduação, 4º período do Curso de Comunicação Social - Jornalismo da Facinter. e-mail: [email protected] 3 Orientador do trabalho, Coordenador do Curso de Com. Social da Facinter. e-mail:[email protected]

Intercom – Sociedade Brasileira de Estudos Interdisciplinares da Comunicação XXXIII Congresso Brasileiro de Ciências da Comunicação – Caxias do Sul, RS – 2 a 6 de setembro de 2010

2

INFOGRAFIA OU VISUALIZAÇÃO?

Tomemos a definição de infografia4 dada por Luiz Costa Pereira Junior:

O infográfico é a informação jornalística em linguagem gráfica. Não é ilustração. É arte estatística, imagem informativa, notícia visual, a expressão iconográfica de fatos, a explicação do funcionamento de algo ou a conceituação de um objeto. (PEREIRA JUNIOR, 2006, p 125)

Dentro das várias definições de Pereira Junior, podemos destacar as que mais se

relacionam com os gráficos da Copa da Gazeta do Povo: “arte estatística”, por serem

gráficos gerados completamente a partir de estatísticas; e “expressão iconográfica de

fatos”, por ser o “iconográfico” o único modo de apresentar os “fatos”.

Neste caso, os “fatos” são os dados gerados pelos sistemas de Player Tracking, que

precisam ser interpretados ou passar por alguma “tradução”, no caso para uma

linguagem gráfica, para serem entendidos. Para o resultado dessa “tradução” usaremos o

termo usado por Ben Fry: visualização.

O termo visualização define bem as expressões gráficas de dados que não somente

ficariam mais fáceis de entender graficamente, mas seriam impossíveis de serem

compreendidos de outra maneira. Como é o caso dos dados gerados pelos sistemas de

Player Tracking.

As visualizações têm várias vantagens, como afirmam Unwin, Theus e

Hofmann:

Visualização de dados é boa para limpeza dos dados, para explorá-los, para identificar tendências e agrupamentos, para encontrar padrões locais, para avaliar modelos de representação de gráficos e para apresentar resultados. (UNWIN, THEUS E HOFMANN, 2006, p 2)

Para a realização desse tipo de gráficos, o ideal seria contar com os dados brutos, o

que possibilitaria maiores possibilidades de análise e descoberta de fatos que

merecessem ser mostrados. A Fifa disponibiliza somente o número de passes entre os

jogadores, e números previamente editados, possivelmente já editados pelo software de

Player Tracking. O que não impede novas interpretações, já que esses números são

suficientemente brutos e permitem que sejam analisados e “explorados”.

4 Será usado o termo infografia para designar a combinação de textos e gráficos com fins informativos, jornalísticos ou não.

Intercom – Sociedade Brasileira de Estudos Interdisciplinares da Comunicação XXXIII Congresso Brasileiro de Ciências da Comunicação – Caxias do Sul, RS – 2 a 6 de setembro de 2010

3

DEFININDO PADRÕES

José Manuel de Pablos, em suas conclusões sobre o que ele chama de “mecânica

infográfica”, afirma que “Existe un fenómeno comunicativo, cada vez más valioso, de

selección mecánica de prototipos de infografías, según una colección de modelos ya

existentes y editados anteriormente.” (DE PABLOS, 1999, p 160)

É comum em departamentos de infografia de jornais ou revistas já ter gráficos

preparados, com padrões definidos por infografistas ou por quem cuidou do projeto

gráfico da infografia. É o caso dos gráficos estatísticos mais comuns, como o de pizza

ou de barras. Todavia, estas formas básicas não são suficientes para conjuntos de dados

com características peculiares. Como afirma Ben Fry: “A tool that has generic uses will

produce only generic displays, which can be disappointing if the displays do not suit

your data set. Data can take many interesting forms that require unique types of display

and interaction…” (FRY, 2008, p vii)

Para a escolha destes “unique types of display”, foi feita uma pesquisa sobre

quais dados seriam disponibilizados pela Fifa, e o que poderia ser feito com eles. Foram

poucos os dados que poderiam ser visualizados através de gráficos “comuns”; a maioria

dos dados solicitou – ou permitiu – visualizações específicas, derivadas de tipos de

gráficos já conhecidos, como veremos a seguir.

Os diversos tipos de gráficos foram agrupados em infográficos maiores, que

foram concebidos como dashboards (termo inglês para painel de automóvel, em

referência a ter todas as informações reunidas em um único lugar), reunindo todas as

informações estatísticas do jogo, servindo de apoio às matérias (Fig.1). Para cada tipo

de informação foi selecionado um tipo de gráfico adequado aos dados disponíveis, que

servisse para evidenciar os fatos nele contidos.

PRINCIPAIS TIPOS DE GRÁFICOS UTILIZADOS Mapa de passes

Permite analisar o desempenho da equipe como um todo. Mostra entre quais

jogadores houve maior número de passes, o rendimento de cada um, e também qual

parte do campo foi mais usada, o que pode ser interpretado para analisar a estratégia do

técnico. (Fig. 2)

Intercom – Sociedade Brasileira de Estudos Interdisciplinares da Comunicação XXXIII Congresso Brasileiro de Ciências da Comunicação – Caxias do Sul, RS – 2 a 6 de setembro de 2010

4

Fig. 1: Infográfico publicado na Gazeta do Povo, no dia 29 de junho de 2010.

Intercom – Sociedade Brasileira de Estudos Interdisciplinares da Comunicação XXXIII Congresso Brasileiro de Ciências da Comunicação – Caxias do Sul, RS – 2 a 6 de setembro de 2010

5

Fig. 2: Mapa de passes, o principal gráfico do "Dashboard"

O modelo do gráfico foi baseado nos produzidos pelo infografista espanhol

Chiqui Esteban, que trabalhou no Jornal Público e no site lainformacion.com, ambos

espanhóis. Ele cita como inspiração um gráfico publicado pelo jornal austríaco Der

Standard durante a Copa do Mundo de 2006. Para a elaboração desses gráficos, quando

não havia a possibilidade de usar estatísticas fornecidas por empresas de Player

Tracking, ele próprio anotava as informações ao assistir a partida na televisão.

Podemos rastrear vários tipos de gráficos dos quais o mapa de passes se

apropria. O primeiro é o que Yves Deforge chama de “sociograma” (Fig. 3), um gráfico

criado para expressar relações (DEFORGE, 1991, p 137). Ele parte de uma tabela de

Intercom – Sociedade Brasileira de Estudos Interdisciplinares da Comunicação XXXIII Congresso Brasileiro de Ciências da Comunicação – Caxias do Sul, RS – 2 a 6 de setembro de 2010

6

relações, assim como o mapa de passes, que parte de uma versão simplificada dos dados

da Fifa. No exemplo mostrado por Deforge, vemos ainda que os elementos que se

relacionam estão organizados em círculo; no mapa de passes, cada jogador é

representado na posição aproximada que joga dentro do campo.

Fig. 3: Sociograma expressando relações entre 12 pessoas.

Exemplo retirado do livro "Imagen Didáctica".

A espessura das linhas é diretamente proporcional ao número de passes trocado

entre dois jogadores. Um antecedente é o famoso gráfico das tropas de Napoleão

durante a invasão à Rússia (Fig. 4), feito em 1869 pelo francês Charles Minard e

apontado por Tufte como “possivelmente o melhor gráfico estatístico jamais

desenhado” (TUFTE, 2001). Nele, a espessura das linhas representa a quantidade de

soldados vivos.

Intercom – Sociedade Brasileira de Estudos Interdisciplinares da Comunicação XXXIII Congresso Brasileiro de Ciências da Comunicação – Caxias do Sul, RS – 2 a 6 de setembro de 2010

7

Fig. 4: Mapa elaborado por Charles Minard.

Com a decisão de representar os jogadores em suas posições, as linhas mais

grossas se sobrepõem às mais finas; para contornar esse problema, as linhas têm um

efeito de transparência, para que todas possam ser visualizadas.

Finalmente, o rendimento de cada jogador é representado pelo tamanho do

círculo. Deve-se tomar o cuidado de considerar que o que deve ser proporcional ao

número representado é a área do círculo, e não seu diâmetro. Também foi usado um

código de cores para mostrar os jogadores substituídos.

Heat Maps

Os mapas de calor, também disponibilizados pela Fifa, mostram em que lugares

do campo cada jogador ficou, e podem ser usados para comparar dois jogadores (Fig.

5).

Estes mapas se enquadram no que Jacques Bertin chamou de “mapas para ver”

(BERTIN, 1986, p 147), ou seja, que permite, ao contrário dos “mapas para ler”,

perceber instantaneamente a presença dos jogadores no campo. A representação

também obedece às recomendações de Bertin, no que ele chama de “implantação

zonal”, através de círculos de diversos tamanhos que geram uma mancha com contornos

mais ou menos definidos, dependendo do caso.

Intercom – Sociedade Brasileira de Estudos Interdisciplinares da Comunicação XXXIII Congresso Brasileiro de Ciências da Comunicação – Caxias do Sul, RS – 2 a 6 de setembro de 2010

8

Fig. 5: Mapa de calor de quatro jogadores brasileiros.

Mapa de Concentração do jogo

Analisa em qual parte do campo se concentrou a posse de bola. Possui

características comuns a um gráfico de pizza, já que representa como um total foi

distribuído (Fig. 6).

Fig. 6: Mapa de concentração do jogo.

Origem dos ataques

É, em essência, um gráfico de barras, apesar de terem forma de setas. Mostra de

qual lado o time atacou mais. As setas reforçam a ideia da direção do ataque (Fig. 7).

Fig. 7: Mapa de origem dos ataques. A seta que representa o maior número tem destaque em outra cor.

Intercom – Sociedade Brasileira de Estudos Interdisciplinares da Comunicação XXXIII Congresso Brasileiro de Ciências da Comunicação – Caxias do Sul, RS – 2 a 6 de setembro de 2010

9

O CAMPINHO E OS PRINCÍPIOS DE DESIGN

Nos três gráficos citados acima, temos o uso da figura do campo de futebol

como “grid”. Podemos justificar sua presença citando dois princípios fundamentais do

design compilados por Lidwell, Holden e Butler: affordance e mimicry5.

Affordance é uma propriedade do design em que as características físicas do

objeto influenciam o modo que é usado. A forma da maçaneta de uma porta, por

exemplo, informa –ou deveria– se ela deve ser empurrada ou puxada.

Mimicry é o ato de copiar funções de objetos familiares para se aproveitar de suas

affordances. Os autores a dividem em vários tipos, sendo a mais próxima desta situação

a surface mimicry:

Surface mimicry is defined as making a design look like something else. When a design mimcs the surface aspects of a familiar object, the design implies (by its familiar appearance) the way it will function or can be used. An example is the use of computer software icons that are designed to look like folders and documents. (LIDWELL, HOLDEN e BUTLER, 2003, p 132)

A figura do campo de futebol se encaixa nesta definição. Com tantos gráficos

abstratos que não são dos tipos mais conhecidos, se faz necessário uma figura

reconhecível, que imite algo real, como o campo. Temos então uma affordance, que

ensina como o gráfico deve ser lido e faz com que o leitor ligue diretamente os fatos

presentes no gráfico à posição deles no campo.

O campo de futebol cumpriria também a função de um grid6. Sobre grids, Tufte fala:

“the grid should usually be muted or completely suppressed so that its presence is only

implicit” (TUFTE, 2001, p112). Mas considerando sua importância como affordance

para que o leitor comprendesse a abstração dos gráficos, foi necessário dar mais

protagonismo ao campo de futebol, ao invés de relegá-lo à função de grid.

5 Manteve-se o inglês affordance por ser usado em inglês em áreas como Psicologia e Desenho Industrial. O termo mimicry pode ser traduzido como “mimetismo”. 6 Neste contexto, elemento gráfico que serve de guia para os elementos acima dele, como a quadrícula de um mapa ou o pentagrama em uma partitura.

Intercom – Sociedade Brasileira de Estudos Interdisciplinares da Comunicação XXXIII Congresso Brasileiro de Ciências da Comunicação – Caxias do Sul, RS – 2 a 6 de setembro de 2010

10

COMPARAÇÃO ENTRE TIMES

Um gráfico do tipo que Peltzer define como “gráficos polares” e nos quais “as

proporções são iguais, ao mesmo tempo que se exprimem as diferenças entre elas”

(PELTZER, 1991, p 129). Podem ser vistos também em vários games7 de futebol.

JOGADOR POR JOGADOR

Tabela que mostra estatísticas: chutes a gol, total de chutes, faltas sofridas e

cometidas, tempo que ficou em campo, passes certos e total de passes dados, e um

gráfico de barra para a porcentagem de passes bem-sucedidos.

DADOS GERAIS

Tabelas simples, com dados que somente podem ser comparados entre os times,

como cartões recebidos, faltas sofridas e cometidas etc.

A ELABORAÇÃO DO MAPA DE PASSES

A elaboração manual do mapa de passes, considerando a etapa de cálculo das

proporções das linhas e superfície dos círculos e o desenho no computador, seria

extremamente demorada, especialmente considerando o pouco tempo entre a liberação

dos dados pela Fifa e o fechamento da edição do jornal. Era necessário encontrar algum

meio de automatizar a tarefa.

Para isso, foi escolhida a linguagem de programação “Processing” criada por

Ben Fry e Casey Reas in 2001. Foi concebida inicialmente “para servir como um

rascunho de software e para ensinar fundamentos de programação em um contexto

visual”, mas evoluiu rapidamente “para uma ferramenta para criar também trabalhos

profissionais e bem finalizados”. O software é gratuito e livre, e tem suporte a vários

formatos de arquivos, inclusive arquivos de gráficos vetoriais, formato necessário para

edição posterior.

O primeiro passo foi estabelecer quais dados eram necessários. Para cada

jogador é necessário o número de passes que trocou com os outros e duas coordenadas

para determinar sua posição no campo.

7 Jogos eletrônicos.

Intercom – Sociedade Brasileira de Estudos Interdisciplinares da Comunicação XXXIII Congresso Brasileiro de Ciências da Comunicação – Caxias do Sul, RS – 2 a 6 de setembro de 2010

11

A Fifa fornece uma planilha com o número de passes feitos por cada jogador

(Fig. 8). Essa tabela é copiada para uma planilha do Excel, onde os números são

somados para saber o total de passes trocados entre dois jogadores, independente de

quem passou para quem. Também é calculado o rendimento de cada jogador (a partir do

número de passes recebidos e feitos).

Um programa escrito em Processing (Fig. 9) importa os dados gerados pelo

Excel e gera o gráfico, em formato PDF. O número de passes é representado pela

espessura das linhas entre os jogadores, e o rendimento do jogador é representado

através do tamanho do círculo. O número dentro do círculo mostra o total de passes

realizados. Códigos de cores adicionais indicam se o jogador foi substituído.

Esse arquivo PDF passa por ajustes finais em um software de desenho vetorial

(Macromedia Freehand) a fim de otimizar as cores para o processo de impressão.

Intercom – Sociedade Brasileira de Estudos Interdisciplinares da Comunicação XXXIII Congresso Brasileiro de Ciências da Comunicação – Caxias do Sul, RS – 2 a 6 de setembro de 2010

12

Fig. 8: Planilha disponibilizada pela Fifa em seu site. Inclui o número de passes entre os jogadores,

dados de concentração de posse de bola, entre outros dados.

Intercom – Sociedade Brasileira de Estudos Interdisciplinares da Comunicação XXXIII Congresso Brasileiro de Ciências da Comunicação – Caxias do Sul, RS – 2 a 6 de setembro de 2010

13

Fig. 9: Janela do ambiente de programação Processing, com o código escrito para gerar o mapa de

passes a partir dos dados editados em planilha eletrônica.

Intercom – Sociedade Brasileira de Estudos Interdisciplinares da Comunicação XXXIII Congresso Brasileiro de Ciências da Comunicação – Caxias do Sul, RS – 2 a 6 de setembro de 2010

14

CONSIDERAÇÕES FINAIS

A quantidade de dados disponível graças ao Player Tracking permite gerar

visualizações gráficas que resumem melhor os dados que os números brutos. Todas

essas representações têm qualidade suficiente para continuarem a ser usadas e inclusive

tornar-se um padrão a ser seguido por diversos meios. O próximo passo é que sejam

usadas pelos jornalistas (e/ou leitores) como fonte de informação e análise.

No que se refere a método de trabalho, os jornalistas/infografistas devem pensar,

mais do que em evidenciar dados, em projetar interfaces para que estes, quando existam,

se revelem por si. Nesses casos, não se trabalha com dados que existem, então deve ser

previsto que tipos de dados podem surgir; e a “interface” deve estar preparada para eles.

O resultado obtido pela Gazeta do Povo é um exemplo das vantagens que o

jornalismo tem quando é liberado o acesso a dados mais brutos ao invés de dados pré-

editados, como os que encontramos em releases. Essa atitude, afim à filosofia do open

data, pode e deve ser explorada por outras áreas, como órgãos governamentais, que

poderiam disponibilizar dados de gastos públicos ou estatísticas de população, ao invés

de somente divulgar em releases os números por eles considerados principais. Mais do

que disponibilizar os dados, deveriam facilitar o acesso a eles – de certa maneira, o que

a Fifa fez com os dados do Player Tracking, e estimular sua reinterpretação.

Intercom – Sociedade Brasileira de Estudos Interdisciplinares da Comunicação XXXIII Congresso Brasileiro de Ciências da Comunicação – Caxias do Sul, RS – 2 a 6 de setembro de 2010

15

REFERÊNCIAS

BERTIN, Jacques. A neográfica e o tratamento gráfico da informação. Curitiba, PR: Editora da Universidade Federal do Paraná, 1986. BEGELMAN, Grigory; KELLER, Philipp; SMADJA, Frank. Automated Tag Clustering: Improving search and exploration in the tag space. Escócia, 2006. Disponível em: <http://www.pui.ch/phred/automated_tag_clustering/>. Acesso: 10/12/2009. DE PABLOS, José Manuel. Infoperiodismo: El periodista como creador de infografía. Madri, Espanha: Editora Síntesis, 1999. DEFORGE, Yves et al. Imagen Didáctica. Barcelona, Espanha: Ediciones Ceac, 1991. FRY, Ben. Visualizing Data. Sebastopol, USA: O’Reilly Media, 2008. LIDWELL, William; HOLDEN, Kritina; BUTLER, Jill. Universal Principles of Design. Gloucester, EUA: Editora Rockport, 2003. PELTZER, Gonzalo. Jornalismo iconográfico. Lisboa, Portugal: Editora Planeta, 1991. PEREIRA JUNIOR, Luis Costa. Guia para a edição jornalística. Petrópolis, RJ: Editora Vozes, 2006. TUFTE, Edward. The Visual Display of Quantitative Information. Connecticut: Graphic Press, 2001. UNWIN, A.R., THEUS, M., HOFMANN, H., Graphics of Large Datasets - Visualizing a Million . Springer, 2006.