Transcript
Page 1: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Extração de dados da Plataforma Lattes: análise da rede de colaboração científica dos professores do

PPGCC – UFLA

Miguel Thiago Alvarenga Thiago Bellotti Furtado

Programa de Pós-Graduação em Ciência da Computação – PPGCC Estudos Avançados em Mineração WEB e Aplicações - PCC519

1 [email protected][email protected] 11 de setembro de 2014

Page 2: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

1. Contexto

2. Objetivo

3. Ferramentas

4. Análises das redes

5. Referencial Teórico

Sumário

2 11 de setembro de 2014 [email protected][email protected]

Page 3: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Contexto

3 11 de setembro de 2014 [email protected][email protected]

• “Rede é uma abstração que permite codificar algum tipo de relacionamento entre pares de objetos” (Figueiredo, 2013).

• Vários tipos de formações de redes

• Como entender seu comportamento?

• Entender sua topologia.

• Influências nos processos e funcionalidades

• Modelos Matemáticos • Capturar aspectos topológicos

Page 4: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Objetivo

4 11 de setembro de 2014 [email protected][email protected]

Coletar informações científicas dos professores do Programa de Pós Graduação do Departamento de Ciência da Computação – PPGC na Plataforma Lattes, gerando uma rede de relacionamento para análise de interatividade.

Page 5: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Ferramentas

5 11 de setembro de 2014 [email protected][email protected]

2 ferramentas foram utilizadas:

• ScriptLattes: • Linguagem Python (Open Source); • Coletar dados automatizada no Lattes; • Grafos, Representação Espacial e Gráficos; • Saída em HTML para análise dos resultados; • Arquivos de configuração (.conf e .list); • Base de dados em .gdf e .txt; • http://scriptlattes.sourceforge.net/; • Versão 8.09 (não gera xml).

Page 6: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Ferramentas

6 11 de setembro de 2014 [email protected][email protected]

• Gephi: • Versão 0.8.2; • Linguagem Java; • Análise de Redes; • Funções para analisar a topologia da rede; • https://gephi.github.io/

Page 7: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Ferramentas

7 11 de setembro de 2014 [email protected][email protected]

• ScriptLattes:

Arquivo .list

Id Lattes Nome Autor (vértices)

1 - Configurar o arquivo .list informando os dados do autor

Page 8: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Ferramentas

8 11 de setembro de 2014 [email protected][email protected]

• ScriptLattes:

Arquivo .config

2 - Configurar o arquivo .config informando os dados a serem coletados

Page 9: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Ferramentas

9 11 de setembro de 2014 [email protected][email protected]

• ScriptLattes:

2 - Execução

$ cd <nome_diretorio_scriptLattes> $ ./scriptLattes.py ./exemplo/teste-03.config

- Index.html - Teste-03.gdf - .css - .txt

Page 10: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Ferramentas

10 11 de setembro de 2014 [email protected][email protected]

• ScriptLattes: 3 - Resultados

Page 11: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Ferramentas

11 11 de setembro de 2014 [email protected][email protected]

• Gephi: • Dados coletados pelo ScriptLattes importados no Gephi

Page 12: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Análise da Rede

12 11 de setembro de 2014 [email protected][email protected]

Distribuição de Grau: 0.899 • Conexões entre os nós da rede

Page 13: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Análise da Rede

13 11 de setembro de 2014 [email protected][email protected]

Caminhos e Distância: Sequência de vértice sem repetição onde exista uma aresta Quão separados estão os dois nós mais distantes

Page 14: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Análise da Rede

14 11 de setembro de 2014 [email protected][email protected]

Colaboração Produção Bibliográfica

Page 15: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Análise da Rede

15 11 de setembro de 2014 [email protected][email protected]

Artigo em Periódico Livros

Page 16: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Análise da Rede

16 11 de setembro de 2014 [email protected][email protected]

Trabalho em congresso Capítulo de Livro

Page 17: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Análise da Rede

17 11 de setembro de 2014 [email protected][email protected]

Excentricidade Centralidade

Page 18: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Análise da Rede

18 11 de setembro de 2014 [email protected][email protected]

Centralidade de intermediação: Frequência que um nó aparece em caminhos mais curtos entre nós

da rede.

Page 19: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Análise da Rede

19 11 de setembro de 2014 [email protected][email protected]

Centralidade de proximidade: Distância média de um determinado nó inicial para todos os demais

nós da rede.

Page 20: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Análise da Rede

20 11 de setembro de 2014 [email protected][email protected]

Excentricidade: Distância de um determinado nó inicial até o nó mais distante dele

na rede.

Page 21: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Análise da Rede

21 11 de setembro de 2014 [email protected][email protected]

Coeficiente de Clusterização: 0,000 (triangulação = 0) Indica como os nós estão inseridos em sua vizinhança Qual a chance de dois vértices que se conectam estarem

conectado a outro

Page 22: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Análise da Rede

22 11 de setembro de 2014 [email protected][email protected]

Densidade da rede: 0,11 Mede quanto que uma rede está próxima de ser completa.

Page 23: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Análise da Rede

23 11 de setembro de 2014 [email protected][email protected]

HITS: Calcula dois valores distintos para cada nó: Authirity e Hub; Authirity: mede o quanto são valiosas as informações armazenada

naquele nó; Hub: mede a qualidade das conexões deste nó.

Page 24: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Análise da Rede

24 11 de setembro de 2014 [email protected][email protected]

PageRank: Classifica as “páginas” dos nós de acordo com a frequência com

que um usuário, seguindo ligações de maneira não aleatória, chega à “página” do nó.

Page 25: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

Referências Bibliográficas

25 11 de setembro de 2014 [email protected][email protected]

Mena-Chalco, J. P; Cesar Junior, R. M. ScriptLattes: an open-source knowledge extraction system from the Lattes platform. Journal of the Brazilian Computer Society, 15(4), 31-39. Recuperado em 10 de setembro de 2014, de http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0104-65002009000400004&lng=pt&tlng=en. 10.1007/BF03194511.

ScriptLattes: uma ferramenta para extração e visualização de conhecimento a partir de Currículo Lattes. Disponível em <http://scriptlattes.sourceforge.net/>

Gephi: makes graphs handy. Disponível em <https://gephi.github.io/users/download/>

Figueiredo, D. R. Introdução a Redes Complexas. Em: de Souza, A.F., Jr. Meira, W. (editores), Atualizações em Informática 2011, PUC-Rio, Cap. 7, pp 303--358, 2011

Page 26: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

26 11 de setembro de 2014

Dúvidas?

Obrigado!

[email protected][email protected]

Page 27: Extração de dados da Plataforma Lattes: análise da  rede de colaboração científica dos professores do  PPGCC – UFLA

27 11 de setembro de 2014

Obrigado!

[email protected][email protected]

1. Dados de 2010 a 2014 2. Gerar 3 redes:

1. Somente professores DCC 2. Todos professores Mestrado 3. Todos professores DCC

3. Gerar rede UFOP do mestrado