27
Extração de dados da Plataforma Lattes: análise da rede de colaboração científica dos professores do PPGCC – UFLA Miguel Thiago Alvarenga Thiago Bellotti Furtado Programa de Pós-Graduação em Ciência da Computação – PPGCC Estudos Avançados em Mineração WEB e Aplicações - PCC519 1 [email protected][email protected] 14/06/22

Apresentação UFLA LATTES

Embed Size (px)

DESCRIPTION

Scriptlattes aplicado a UFLA

Citation preview

Page 1: Apresentação UFLA LATTES

Extração de dados da Plataforma Lattes: análise da rede de colaboração científica dos professores do PPGCC –

UFLA

Miguel Thiago AlvarengaThiago Bellotti Furtado

Programa de Pós-Graduação em Ciência da Computação – PPGCCEstudos Avançados em Mineração WEB e Aplicações - PCC519

[email protected][email protected] de abril de 2023

Page 2: Apresentação UFLA LATTES

1. Contexto

2. Objetivo

3. Ferramentas

4. Análises das redes

5. Referencial Teórico

Sumário

219 de abril de 2023 [email protected][email protected]

Page 3: Apresentação UFLA LATTES

Contexto

319 de abril de 2023 [email protected][email protected]

• “Rede é uma abstração que permite codificar algum tipo de relacionamento entre pares de objetos” (Figueiredo, 2013).

• Vários tipos de formações de redes

• Como entender seu comportamento?

• Entender sua topologia.

• Influências nos processos e funcionalidades

• Modelos Matemáticos• Capturar aspectos topológicos

Page 4: Apresentação UFLA LATTES

Objetivo

419 de abril de 2023 [email protected][email protected]

Coletar informações científicas dos professores do Programa de Pós Graduação do Departamento de Ciência da Computação – PPGC na Plataforma Lattes, gerando uma rede de relacionamento para análise de interatividade.

Page 5: Apresentação UFLA LATTES

Ferramentas

519 de abril de 2023 [email protected][email protected]

2 ferramentas foram utilizadas:

• ScriptLattes:• Linguagem Python (Open Source);• Coletar dados automatizada no Lattes;• Grafos, Representação Espacial e Gráficos;• Saída em HTML para análise dos resultados;• Arquivos de configuração (.conf e .list);• Base de dados em .gdf e .txt;• http://scriptlattes.sourceforge.net/;• Versão 8.09 (não gera xml).

Page 6: Apresentação UFLA LATTES

Ferramentas

619 de abril de 2023 [email protected][email protected]

• Gephi:• Versão 0.8.2;• Linguagem Java;• Análise de Redes;• Funções para analisar a topologia da rede;• https://gephi.github.io/

Page 7: Apresentação UFLA LATTES

Ferramentas

719 de abril de 2023 [email protected][email protected]

• ScriptLattes:

Arquivo .list

Id Lattes Nome Autor (vértices)

1 - Configurar o arquivo .list informando os dados do autor

Page 8: Apresentação UFLA LATTES

Ferramentas

819 de abril de 2023 [email protected][email protected]

• ScriptLattes:

Arquivo .config

2 - Configurar o arquivo .config informando os dados a serem coletados

Page 9: Apresentação UFLA LATTES

Ferramentas

919 de abril de 2023 [email protected][email protected]

• ScriptLattes:

2 - Execução

$ cd <nome_diretorio_scriptLattes> $ ./scriptLattes.py ./exemplo/teste-03.config

- Index.html- Teste-03.gdf- .css- .txt

Page 10: Apresentação UFLA LATTES

Ferramentas

1019 de abril de 2023 [email protected][email protected]

• ScriptLattes:3 - Resultados

Page 11: Apresentação UFLA LATTES

Ferramentas

1119 de abril de 2023 [email protected][email protected]

• Gephi:• Dados coletados pelo ScriptLattes importados no Gephi

Page 12: Apresentação UFLA LATTES

Análise da Rede

1219 de abril de 2023 [email protected][email protected]

Distribuição de Grau: 0.899• Conexões entre os nós da rede

Page 13: Apresentação UFLA LATTES

Análise da Rede

1319 de abril de 2023 [email protected][email protected]

Caminhos e Distância:Sequência de vértice sem repetição onde exista uma aresta Quão separados estão os dois nós mais distantes

Page 14: Apresentação UFLA LATTES

Análise da Rede

1419 de abril de 2023 [email protected][email protected]

Colaboração Produção Bibliográfica

Page 15: Apresentação UFLA LATTES

Análise da Rede

1519 de abril de 2023 [email protected][email protected]

Artigo em Periódico Livros

Page 16: Apresentação UFLA LATTES

Análise da Rede

1619 de abril de 2023 [email protected][email protected]

Trabalho em congresso Capítulo de Livro

Page 17: Apresentação UFLA LATTES

Análise da Rede

1719 de abril de 2023 [email protected][email protected]

Excentricidade Centralidade

Page 18: Apresentação UFLA LATTES

Análise da Rede

1819 de abril de 2023 [email protected][email protected]

Centralidade de intermediação:Frequência que um nó aparece em caminhos mais curtos entre nós

da rede.

Page 19: Apresentação UFLA LATTES

Análise da Rede

1919 de abril de 2023 [email protected][email protected]

Centralidade de proximidade:Distância média de um determinado nó inicial para todos os

demais nós da rede.

Page 20: Apresentação UFLA LATTES

Análise da Rede

2019 de abril de 2023 [email protected][email protected]

Excentricidade:Distância de um determinado nó inicial até o nó mais distante dele

na rede.

Page 21: Apresentação UFLA LATTES

Análise da Rede

2119 de abril de 2023 [email protected][email protected]

Coeficiente de Clusterização: 0,000 (triangulação = 0) Indica como os nós estão inseridos em sua vizinhança Qual a chance de dois vértices que se conectam estarem

conectados a outro

Page 22: Apresentação UFLA LATTES

Análise da Rede

2219 de abril de 2023 [email protected][email protected]

Densidade da rede: 0,11 Mede quanto que uma rede está próxima de ser completa.

Page 23: Apresentação UFLA LATTES

Análise da Rede

2319 de abril de 2023 [email protected][email protected]

HITS: Calcula dois valores distintos para cada nó: Authirity e Hub; Authirity: mede o quanto são valiosas as informações

armazenada naquele nó; Hub: mede a qualidade das conexões deste nó.

Page 24: Apresentação UFLA LATTES

Análise da Rede

2419 de abril de 2023 [email protected][email protected]

PageRank: Classifica as “páginas” dos nós de acordo com a frequência com

que um usuário, seguindo ligações de maneira não aleatória, chega à “página” do nó.

Page 25: Apresentação UFLA LATTES

Referências Bibliográficas

2519 de abril de 2023 [email protected][email protected]

Mena-Chalco, J. P; Cesar Junior, R. M. ScriptLattes: an open-source knowledge extraction system from the Lattes platform. Journal of the Brazilian Computer Society, 15(4), 31-39. Recuperado em 10 de setembro de 2014, de http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0104-65002009000400004&lng=pt&tlng=en. 10.1007/BF03194511.

ScriptLattes: uma ferramenta para extração e visualização de conhecimento a partir de Currículo Lattes. Disponível em <http://scriptlattes.sourceforge.net/>

Gephi: makes graphs handy. Disponível em <https://gephi.github.io/users/download/>

Figueiredo, D. R. Introdução a Redes Complexas. Em: de Souza, A.F., Jr. Meira, W. (editores), Atualizações em Informática 2011, PUC-Rio, Cap. 7, pp 303--358, 2011

Page 26: Apresentação UFLA LATTES

2619 de abril de 2023

Dúvidas?

Obrigado!

[email protected][email protected]

Page 27: Apresentação UFLA LATTES

2719 de abril de 2023

Obrigado!

[email protected][email protected]

1. Dados de 2010 a 20142. Gerar 3 redes:

1. Somente professores DCC 2. Todos professores Mestrado3. Todos professores DCC

3. Gerar rede UFOP do mestrado