#VEM Coleta de dados relacionais

Preview:

Citation preview

COLETA DE

nas mídias sociais

Marcelo alves

COLETA DE

nas mídias sociais

instrutor

• Doutorando pelo PPGCOM/UFF;• Estuda comunicação política em rede;• Sócio-diretor da Vértice Inteligência;• Pesquisador do laboratório de mídia e democracia (LAMIDE/UFF), orientado por Afonso de Albuquerque;• Publica textos no blog www.marceloalves.org

N = 532 fan-pagesA = 8.654 arestas

Rede antipetista na eleição de 2014

COLETA DE

nas mídias sociais

c

Quais objetos ou temas de

pesquisa dos alunos para

coleta de dados?

COLETA DE

nas mídias sociais

O que você vai aprender

• O básico da concepção teórica da análise de redes;• Processos de coletas de dados relacionais;• Leitura da documentação da Graph API do Facebook• Métodos de construções de queries;• Funcionamento e prática com Facepager;• Extrair dados das pesquisas dos alunos;• Tratamento e manipulação de dados relacionais;• Importar dados no Gephi.

COLETA DE

nas mídias sociais

c

CONCEITOS TEÓRICOS GERAIS

(prometo ser breve)

COLETA DE

nas mídias sociais

Lógicas da comunicação política em massa e em rede - Klinger e Svensson (2014)

COLETA DE

nas mídias sociais

Lógicas da comunicação política em massa e em rede - Klinger e Svensson (2014)

• Lógicas de rede não estão tomando o lugar da lógica de massa;• As plataformas de mídias sociais seguem outras regras do jogo;• A mídia de massa e o conteúdo jornalístico continuam sendo uma das principais fontes de informação;• As duas lógicas não são estáticas, mas estão em evolução

COLETA DE

nas mídias sociais

Sistemas midiáticos híbridos – Chadwick (2013)

• “O sistema midiático híbrido é baseado em conflito e cooperação entre lógicas novas e antigas; mas também possui considerável grau de interdependência entre estas lógicas” (Chadwick, 2013, p. 207)• Convergência midiática – ambos os sistemas estão entrelaçados • Partidos, imprensa e movimentos sociais tradicionais estão se adaptando às lógicas de rede

“Conteúdo nas plataformas de mídias sociais nem sempre é gerado pelo usuário, mas frequentemente envolve referências aos meios de massa. A mídia tradicional também busca aprender distribuições

virais como uma base de um novo modelo de negócios. Usuários de mídia diversificaram suas dietas noticiosas e começam a navegar em sistemas midiáticos híbridos. No entanto, a sobreposição não

torna as lógicas midiáticas indistinguíveis, porque são modus operandi muitos distintos. É tarefa dos estudos empíricos distinguir e medir as lógicas de massa e de rede em casos específicos” (Klinger e

Svensson, 2014, p. 12).

COLETA DE

nas mídias sociais

Repertórios digitais em redes e hibridismo organizacional (Chadwick, 2007)

Duas tendências paralelas 1) Organizações políticas tradicionais estão adotando e modificando seletivamente características de movimentos sociais;Quatro repertórios principais: (a) mobilizando formas online de ação dos cidadãos; (b) articulando ligações entre diferentes grupos; fundindo discurso políticos e subculturais e (d) aproveitando-se de redes sedimentárias.

“Há sinais crescentes de que organizações tradicionais, mais hierárquicas, menos inovadoras –como grupos de interesse e partidos – estão começando a se adaptar e adotar repertórios digitais em

rede” (Chadwick, 2007, p. 286)

2) Novas formas organizacionais que só podem existir na internet estão surgindo.“Organizações ainda mais radicais estão surgindo, como o MoveOn, que mistura repertórios ou

rapidamente troca de um conjunto de ações para outras. Quando se trata de ação coletiva potencializada pela internet, a imitação é parte da inovação. O conceito que melhor da conta deste

resultado é a hibridez organizacional”

COLETA DE

nas mídias sociais

O ciclo de informação política – Chadwick (2011)

Ciclo noticioso = período do dia previsível no qual se produzem as notícias, o tempo para selecionar, apurar, escrever, editar, compilar e apresentar material jornalístico. • Fenômeno explorado pelos autores de sociologia do jornalismo e da comunicação sobre os ciclos produtivos das redações e a noticiabilidade• Construção da notícia é um processo rigidamente controlado e envolve negociações entre a elite política e midiática

Ciclo de informação política = bricolagem entre lógicas de massa e de rede na produção de informação política.• Maior número e maior diversidade de atores• Estruturas temporais mais rápidas e complexas• Inclui participantes que tangenciam as elites políticas e midiáticas• Diversificação das fontes de informação•Deslocamento do jornalismo, ou do jornalismo liberal, como balizador da produção de informação.

COLETA DE

nas mídias sociais

O que temos até aqui?

• Uma série de mudanças tecnológicas, sociais e organizacionais na comunicação política.• As elites perdem a exclusividade do acesso e do controle de meios de criação de informação.• Diversos repertórios de expressão política surgem para além das burocracias partidárias e jornalísticas.• Tudo isso está em permanente movimento e relacionamento.

A delimitação dos corpus de pesquisa em meios de massa é bastante simples. As notícias publicadas no jornal X ou as peças publicitárias televisivas durante o período eleitoral. O objeto

é a cobertura da imprensa ou propagandas políticas oficiais.Frequentemente, os estudos mais recentes escolhem um ator e dedicam-se apenas a ele, por exemplo, a produção da Mídia Ninja. Porém, essa abordagem perde as dinâmicas relacionais

criadas em torno daquele agente e todas as negociações com os demais envolvidos.

COLETA DE

nas mídias sociais

c

Contudo, num ambiente midiático híbrido, com surgimento de blogs,

lideranças de opinião nativas digitais e uma infinidade de outros

fenômenos, Como delimitar o corpus de

pesquisa?

COLETA DE

nas mídias sociais

Esfera pública em rede (Benkler et al. 2013, p. 04) – conceito provisório

• A esfera pública em rede é uma arena alternativa para o discurso e debate público, uma arena que é menos dominada pelas grandes organizações midiáticas, menos sujeita ao controle do governo e mais aberta a participação ampla.

• A esfera pública em rede é manifesta como um ecossistema complexo de canais de comunicação que coletivamente oferecem um ambiente que conduz a expressão política e a criação de diversas formas organizacionais.

• Uma série de estudos já evidenciou que elites políticas e midiáticas continuam dominando o centro das esferas públicas em rede (Soon e Cho, 2011; Asserhofer e Maireder, 2012; Kocks, 2016 . No entanto, aceitam a abertura para ações de indivíduos não organizados.

COLETA DE

nas mídias sociais

O que são redes sociais? (WASSERMAN e FAUST, 1994)

• A diferença fundamental entre análise de redes e análise estatística é a inclusão de conceitos e de informações sobre os relacionamentos entre as unidades de análise do estudo.• Em vez de focar nos atributos das unidades individualmente, estuda as características como emergentes do processo de relacionamento social.• O conceito de redes enfatiza que cada indivíduo tem ligações com outros indivíduos;• As Redes Sociais referem-se a um conjunto de atores e as relações entre eles;• Modelar a estrutura e buscar compreender sua influência no grupo

COLETA DE

nas mídias sociais

Componentes básicos da análise de redes

cator

claços

cclusters

crede

Componente individual

Ligações entre atores

Subconjuntos identificados pela densidade

Totalidade de atores e ligações da amostra

COLETA DE

nas mídias sociais

c

O que são dados relacionais?Duas informações distintas

Atributos dos atoresArestas de saída e chegada

COLETA DE

nas mídias sociais

Métodos digitais – Richard Rogers (2004)

• A web como fonte de dados;• Virada computacional nas ciências sociais;• Rastros gerados espontaneamente• Análises de hiperlinks• Blogosferas políticas • Repercussão no Twitter• Comunidades no Facebook

COLETA DE

nas mídias sociais

Dois tipo s de redes na internet (recuero, 2009)

• Redes associativas ou de filiação – possuem ligações mais estáveis, duradouras. Gera o efeito de filiação a um grupo. Exemplo: seguir páginas e fazer amizades;

• Redes emergentes – são compostas por ligações circunstanciais, criadas a partir de ações comunicativas ad hoc. Exemplo: menções, retuítes, compartilhamentos.

COLETA DE

nas mídias sociais

c

O que são APIs?Application

programming interface

COLETA DE

nas mídias sociais

Políticas de cessão de dados da facebook graph api

• As políticas de cessão de dados de cada plataforma são documentadas nas APIs;• APIs são tanto documentos técnicos, quanto reflexos das diretrizes empresariais de fornecimento de dados;• APIs são modificadas frequentemente, de acordo com as necessidades e interesses mercadológicos das organizações;• As documentações mostram quais requisições são possíveis (queries), em qual volume (rate limit) e com quais parâmetros.

Versionamento das apis do facebook

COLETA DE

nas mídias sociais

Vamos praticar?

https://developers.facebook.com/tools/explorer/

COLETA DE

nas mídias sociais

COLETA DE

nas mídias sociais

Como construir uma query? Orientação a id

• {id} + fields = {campos}• Retorno em Javascript Object Notation (JSON)• JSON é exibido na tela e convertido para tabulação

• Construindo query no navegador• https://graph.facebook.com/v2.6/ + id / {requisição} ?access_token= {token de acesso}https://graph.facebook.com/v2.6/dilmarousseff/likes?access_token=EAACEdEose0cBAErGN0ycFbkfEzlhW8o0whxulUmELq3y0bZBVh0sxbNUtUvddkuF0vQmoz9zlUln9QG9oRypH75VEEI2HI39HlsN6rYA9vZCXWYvaVTkPRN585mUqS07AeCW9HHVOvo5wIiGDgfTtu8jNioAof51U4v1n5YQYZBr0tChVsQiblwFj6KOhkZD

Aplicativos acadêmicos

COLETA DE

nas mídias sociais

cQual ferramenta

utilizar?

COLETA DE

nas mídias sociais

Diferenças nas apis de facebook e twitter

COLETA DE

nas mídias sociais

Técnicas de amostragem em métodos digitais (rieder, 2012)

• População – volume completo de usuários e publicações de uma determinada plataforma.Geralmente, é adquirido a partir da compra do banco de dados da empresa. Estudo utilizandodados populacionais = (Freelon et al., 2016);• Amostra aleatória: forma mais utilizada para garantir representatividade dos dados digitais. Noentanto, como não se sabe a população, há uma série de problemas derivados;• Amostra por tópicos: queries por palavras-chave e hashtags. É o método mais comum no Twitter. Todavia, não funciona no Facebook desde a descontinuidade da Graph API 1.0 em 2015.• Amostrar por marcações: compilada a partir de marcadores geográficos ou linguísticos oferecidos pela API. • Amostra por atores: seleciona determinados canais para coleta de dados. Frequentemente utilizado para estudo de campanhas eleitorais, focando nos candidatos ou partidos. • Amostra por grafos: Examina relações entre uma série de agentes e faz seleções baseado no resultado. Minha dissertação e tese. • Amostra manual: utilizada para projetos qualitaitivos, geralmente são amostras de conveniência.

COLETA DE

nas mídias sociais

Adaptando os métodos para coleta relacional no Facebook (cf. BRUNS E BURGESS, 2014)

• A API do Facebook não permite a coleta de dados por palavras-chave ou por hashtags.Método mais utilizado no Twitter, esta é uma das principais razões porque o Facebook éplataforma pouco utilizada em pesquisas de métodos digitais.• No entanto, o Facebook é a plataforma mais utilizada pela elite político-midiática e peloscidadãos comuns. Não estudar o Facebook é ignorar a ferramenta de mídias sociais queconcentra maior público.• Assim, surge a questão, como realizar desenhos de pesquisa especificamente para oFacebook?• A estratégia mais comum é focar em poucos atores, como as fan-pages de candidatosdurante períodos eleitorais. Embora viável do ponto de vista metodológico, essa opçãoignora todas as dinâmicas relacionais que acontecem em torno daqueles candidatos.• É isso que pretendo captar com meus projetos.• Para tanto, aposto no método de amostragem por grafos e bola de neve.

COLETA DE

nas mídias sociais

Facepager - Till Keyling e jakob junger

• Ferramenta desenvolvida para a dissertação;• Código aberto;• Programando em Python 2.7;• Introduz boa parte dos conceitos de data mining, como query, datamunging, data storage, log de processos...• É uma interface para se comunicar com a API e fazer o trabalhopesado;• Alto grau de liberdade para os usuários operarem as requisições;• Funciona com Facebook e Twitter;

Vamos praticar?

retorno

metadados

Json key

Sistemaquery

COLETA DE

nas mídias sociais

Etapas do mapeamento de fan-pages (BRUNS, 2007; ADAM et al., 2015)

• Lista de nós-sementes;• Nós-sementes devem ser temáticos e homogêneos.• Bola de neve – crawling com 1 ou 2 graus de profundidade;• Limpeza do resultado;• Manipulação de dados – lista de nós e arestas;• Importação no Gephi;• Categorização dos atores

Como montar uma lista de sementes?

COLETA DE

nas mídias sociais

A função search

Notação: /search ? type= {user, page, event, group, place} & q={palavra+chave} & fields=

search?type=page&q=dilma+rousseff&fields=id,name,link,description,category

Fazer testes de acordo com as pesquisas dos alunos

COLETA DE

nas mídias sociais

A função user like

Notação: id ? fields = likes {aninhamento de parâmetros}

dilmarousseff?fields=likes{name, category, id, link, about}

Fazer testes de acordo com as pesquisas dos alunos

COLETA DE

nas mídias sociais

Documentação das fan-pages

Query<user>/likes?fields=name,username,about,talking_about_count,fan_count,category,link,bio,description,emails,location,new_like_count,start_info,website,id

JSON keysname

idusernamecategory

aboutbio

descriptionfan_count

talking_about_count

emails.0website

linklocation.city

location.statelocation.longitudelocation.latitude

COLETA DE

nas mídias sociais

cPrática de

mapeamento de fan-pages

COLETA DE

nas mídias sociais

TRATAMENTO DE DADOS

Filtros para limpeza de logs;Preparação das listas de nós e arestas

ArestasFunçao PROC (=PROC(B684;$A$3:$A$506;$E$3:$E$506)Criar source e target

Nós – Eliminar duplicatas

COLETA DE

nas mídias sociais

Meso level - a Documentação das publicações

Querycomments.limit(1).summary(true),likes.limit(1).summary(true),picture,story,from,to,description,source,link,created_time,message,type,id,status_type,name,story_tags,caption, reactions.limit(1).summary(true), shares

namefrom.namefrom.categoryfrom.idto.data.*.idto.data.*.namestory_tagssharedposts.dataposts.datastorylinkcaption

message_tagsmessagestatus_typetypeshares.countcreated_timeupdated_timereactions.summary.total_countlikes.summary.total_countcomments.summary.total_countshares.count

COLETA DE

nas mídias sociais

Fluxo de comuinicação entre as páginas

EndpointsLinks – referentes aos links compartilhados nas publicações. Sóregistrando quando a postagem é de tipo LINK;Caption – referente ao domónio do link;Message_tags – perfis marcados na mensagem (similar a @mention);Status_type – identificar compartilhamentos e links;Story_tags – fluxo de compartilhamentoTo – Perfis mencionadosWith_tags – Com quem estou.

COLETA DE

nas mídias sociais

c

Prática de fluxos de

publicações

COLETA DE

nas mídias sociais

ReferênciasADAM, Silke et al. Identifying and Analyzing Hyperlink Issue Networks, In: VOWE ,Gerhard, HENN, Philipp.Political Communication in the Online World (Orgs), Routledge: New York, London, p. 233-247, 2015.ALVES, Marcelo. Coleta de dados nas mídias sociais. In: SILVA, Tarcízio; STABILE, Max (orgs.), Monitoramento ePesquisa emMídias Sociais: metodologias, aplicações e inovações, Uva Limão, 2016.BENKLER, Yochai. Political Freedom part 2: Emergence of the networked public sphere. The Wealth ofNetworks: How Social Production TransformsMarkets and Freedom, 2006.BRUNS, Axel. Methodologies for mapping the political blogosphere: An exploration using the IssueCrawlerresearch tool. First Monday, v. 12, n. 5, 2007.CHADWICK, Andrew. Digital network repertoires and organizational hybridity. Political Communication, v. 24, n.3, p. 283-301, 2007.CHADWICK, Andrew. The political information cycle in a hybrid news system: The British prime minister and the“Bullygate” affair. The International Journal of Press/Politics, v. 16, n. 1, p. 3-29, 2011.CHADWICK, Andrew. The hybrid media system: Politics and power. Oxford University Press, 2013.FREELON, Deen; MCILWAIN, Charlton D.; CLARK, Meredith D. Beyond the hashtags:# Ferguson,#Blacklivesmatter, and the online struggle for offline justice. 2016.KLINGER, Ulrike; SVENSSON, Jakob. The emergence of network media logic in political communication: Atheoretical approach. Newmedia & society, v. 17, n. 8, p. 1241-1257, 2015.RECUERO, Raquel. Redes sociais na internet. Sulina, 2009.RIEDER, Bernhard. The refraction chamber: Twitter as sphere and network. First Monday, v. 17, n. 11, 2012.ROGERS, Richard. Information politics on theWeb. MIT Press, 2004.WASSERMAN, Stanley; FAUST, Katherine. Social network analysis: Methods and applications. Cambridgeuniversity press, 1994.

COLETA DE

nas mídias sociais

Obrigado!

marceloalves.ufsj@hotmail.com

Recommended