Upload
doankhanh
View
215
Download
0
Embed Size (px)
Citation preview
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁPR
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CAMPUS CURITIBA
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E INFORMÁTICA INDUSTRIAL - CPGEI
JOEL CARLOS VIEIRA REINHARDT
MODELO COMPUTACIONAL PARA FORMAÇÃO DE EQUIPES BASEADO NAS REDES EGOCÊNTRICAS
DE LÍDERES DE PROJETO
DISSERTAÇÃO DE MESTRADO
CURITIBA MAIO 2008
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial
DISSERTAÇÃO apresentada à UTFPR
para obtenção do grau de
MESTRE EM CIÊNCIAS
por
JOEL CARLOS VIEIRA REINHARDT
MODELO COMPUTACIONAL PARA FORMAÇÃO DE
EQUIPES BASEADO NAS REDES SOCIAIS
EGOCÊNTRICAS DE LÍDERES DE PROJETO
Banca Examinadora:
Presidente e Orientador:
Prof. Dr. CÉSAR AUGUSTO TACLA UTFPR
Examinadores:
Prof. Dr.GUSTAVO A. GIMÉNEZ LUGO UTFPR
Prof. Dr. EDSON E. SCALABRIN PUC-PR
Curitiba, 13 de maio de 2008.
JOEL CARLOS VIEIRA REINHARDT
MODELO COMPUTACIONAL PARA FORMAÇÃO DE EQUIPES BASEADO NAS
REDES SOCIAIS EGOCÊNTRICAS DOS LÍDERES DE PROJETO
Dissertação apresentada ao Programa de Pós-
Graduação em Engenharia Elétrica e Informática
Industrial do Centro Federal de Educação Tecnológica
do Paraná, como requisito parcial para a obtenção do
grau de “Mestre em Ciências” – Área de
Concentração: Informática Industrial.
Orientador: Prof. Dr.César Augusto Tacla
Curitiba
Maio 2008
Ficha catalográfica elaborada pela Biblioteca da UTFPR – Campus Curitiba
R369m Reinhardt, Joel Carlos Vieira Modelo computacional para formação de equipes baseado nas redes egocên- tricas de lideres de projeto / Joel Carlos Vieira Reinhardt. Curitiba. UTFPR 2008 X, 79 p. : il. ; 30 cm Orientador: Prof. Dr. César Augusto Tacla Dissertação (Mestrado) – Universidade Tecnológica Federal do Paraná. Pro- grama de Pós-Graduação em Engenharia Elétrica e Informática Industrial. Cu- ritiba, 2008 Bibliografia: P. 75 – 79 1. Sistemas de identificação. 2. Sistemas multiagentes. 3. Grupos de trabalho - Formação. 4. Estrutura social. I. Tacla, César Augusto, orient. II. Universida- de Tecnológica Federal do Paraná. Programa de Pós-Graduação em Engenha- ria Elétrica e Informática Industrial. III. Título. CDD: 003.1
AGRADECIMENTOS
A Deus, que sempre me guiou por Seus caminhos e
deu-me forças para vencer as dificuldades e seguir em frente.
À minha esposa Luciane, que teve paciência e voluntariamente assumiu muitas tarefas
que me cabiam, para que eu dedicasse todo o tempo às tarefas do mestrado.
A filha Luíza que está por vir, e com ela sonhos a se realizar.
Aos meus familiares que compreenderam
minha ausência, incentivando e torcendo pelo meu êxito.
Em especial Dr. Nancy, Dr. Dalmo, Msc. Denise e Dr. Cláudio,
que já trilharam o caminho da pesquisa e me deram o exemplo a
trilhar mostrando as dificuldades e conquistas deste caminho.
Ao Eng°. Ricardo Lamberti de Faria que
sempre apoiou o desenvolvimento de seus funcionários.
Ao Prof. Dr. Mário Sérgio Texeira de Freitas pelo suporte, exemplo e incentivo.
Aos profissionais que colaboraram com seu conhecimento, apoio e idéias:
Prof. Msc Fabio Calliari, Prof. Robison Cris Brito, Prof. Msc Ademir Roberto Freddo.
Aos colegas e amigos que me incentivaram, colaboraram e compreenderam.
Msc Águeda Bodnar, Prof. Msc Adrien Sanches, Prof. Msc Maurício Taques,
Profª. Msc Bárbara Taques, Eng. Adrianus Bassoi, Eng. Anselmo Almeida.
Ao Prof. Dr. Gustavo A. Giménez Lugo por compartilhar da vontade de evoluir
constantemente, auxiliar a compreender os a“gentes” em suas particularidades e,
por demonstrar, que apenas superaremos os obstáculos se dermos os primeiros passos.
Ao Prof. Dr. César Augusto Tacla pelo exemplo, por orientar,
compartilhar conhecimentos, iluminar caminhos obscuros
e confiar no espírito científico que norteia a experiência humana.
Aos cientistas da área de inteligência artificial, sistemas multiagentes, sociologia,
psicologia, redes sociais, teoria do caos e dinâmica não linear que,
como gigantes, sustentam em seus ombros
o desenvolvimento científico em nossa área de pesquisa.
SUMÁRIO
LISTA DE FIGURAS......................................................................................................... vii
LISTA DE TABELAS........................................................................................................ viii
LISTA DE ABREVIATURAS E SIGLAS........................................................................ ix
RESUMO............................................................................................................................. x
ABSTRACT.......................................................................................................................... xi
1 INTRODUÇÃO................................................................................................................ 1
1.1 DESCRIÇÂO DO PROBLEMA................................................................................ 1
1.2 MOTIVAÇÕES.......................................................................................................... 3
1.3 OBJETIVOS............................................................................................................... 3
1.3.1 Objetivos Específicos.......................................................................................... 4
1.4 JUSTIFICATIVA........................................................................................................ 5
1.5 ESTRUTURA DA DISSERTAÇÃO.......................................................................... 6
2 FUNDAMENTAÇÃO TEÓRICA.................................................................................. 7
2.1 REDES SOCIAIS....................................................................................................... 7
2.1.1 Representação de Redes Sociais ......................................................................... 8
2.1.2 Abordagem Egocêntrica...................................................................................... 9
2.1.3 Abordagem Sociocêntrica.................................................................................... 10
2.2 ANÁLISE DE REDES SOCIAIS ............................................................................. 10
2.2.1 Conceitos fundamentais da Análise de Redes Sociais......................................... 11
2.2.2 Aspectos Sociais da Análise de Redes Sociais..................................................... 15
2.2.3 Tipos de Ligações Sociais.................................................................................... 17
2.2.4 Análise de Redes Sociais com Relações Múltiplas ............................................. 19
2.2.5 Propriedades Estruturais para a Análise de Redes ............................................... 19
2.3 TRABALHOS RELACIONADOS ........................................................................... 22
2.4 CONCLUSÃO............................................................................................................ 27
3 MODELO COMPUTACIONAL PROPOSTO ............................................................ 29
3.1 OBJETO DA PROPOSTA DO MODELO COMPUTACIONAL............................. 29
3.1.1 Modelo Computacional ....................................................................................... 31
3.2 MATERIAIS E INFRA-ESTRUTURA ..................................................................... 33
3.2.1 Meios Computacionais ....................................................................................... 33
3.2.2 Coleta de Informações.. ....................................................................................... 34
3.2.3 Processo de Extração de Informações ................................................................. 34
3.2.3.1 Validade da Plataforma Lattes...................................................................... 35
3.3 CONSTRUÇÃO DAS REDES EGOCÊNTRICAS .................................................. 36
3.3.1 Relação Co-autoria.............................................................................................. 37
3.3.2 Relação Orientador-Orientado ............................................................................. 38
3.3.3 Representação da Rede Social Egocêntrica ......................................................... 39
3.4 PROCESSO DE IDENTIFICAÇÃO DOS PESQUISADORES ............................... 40
3.4.1 Método de Cálculo do Fator de Proximidade Individual .................................... 41
3.4.2 Método de Cálculo do Fator de Proximidade Social .......................................... 48
3.4.3 Valor de Corte para Identificação dos Pesquisadores.......................................... 49
3.5 JUSTIFICATIVAS PARA O MODELO COMPUTACIONAL PROPOSTO .......... 51
3.6 CONCLUSÕES ......................................................................................................... 52
4 RESULTADOS DO ESTUDO DE CASO .................................................................... 53
4.1 ESTUDO DE CASO .................................................................................................. 53
4.1.1 Discussão sobre os Grupos de Pesquisa............................................................... 59
4.2 LIMITAÇÕES DO MODELO COMPUTACIONAL PROPOSTO ......................... 60
4.2.1 Dificuldades Encontradas no Decorrer do Trabalho ........................................... 62
4.3 CONCLUSÕES ......................................................................................................... 63
5 CONCLUSÕES ............................................................................................................... 64
5.1 RECAPITULAÇÃO DOS OBJETIVOS DO TRABALHO ..................................... 64
5.2 CONTRIBUIÇÕES ESPERADAS ............................................................................ 65
5.3 CONCLUSÕES ......................................................................................................... 66
5.4 TRABALHOS FUTUROS ........................................................................................ 68
ANEXO 1 – PLANILHA DE IDENTIFICAÇÃO DE INDIVÍDUOS DO GRUPO
DE PESQUISA ................................................................................................................... 71
ANEXO 2 – MATRIZES RELACIONAIS UTILIZADAS PARA O CÁLCULO DO
FATOR DE PROXIMIDADE INDIVIDUAL ................................................................. 72
ANEXO 3 – TABELA COM O CÁLCULO DO FATOR DE PROXIMIDADE
INDIVIDUAL E O HISTOGRAMA COM A EVOLUÇÃO NA REDE SOCIAL..... 73
ANEXO 4 – GRÁFICO EM FORMA DE RADAR ........................................................ 74
REFERÊNCIAS BIBLIOGRÁFICAS.............................................................................. 75
LISTA DE FIGURAS
1 Sociograma de Moreno ou Grafo em Estrela................................................................ 10
2 Comunidade, Grupo e Equipe....................................................................................... 14
3 Gráfico que mostra a região onde a busca por redes sociais é possível, limitada pelo
grau e homofilia e pelo número de dimensões sociais consideradas ............................ 17
4 Etapas do Modelo Computacional................................................................................. 30
5 Estruturas Funcionais para Extração de Informações ................................................... 31
6 Fases de Extração de Informação do Currículo Lattes.................................................. 35
7 Esquema do Processo de Identificação de Pesquisadores ............................................ 41
8 Esquema do Cálculo do Fator de Proximidade Individual............................................ 42
9 Gráfico em Radar da Rede Egocêntrica de um Pesquisador ........................................ 48
10 Gráficos de Evolução do Fator de Proximidade Social divididos pelos Papéis no
Grupo de Pesquisa ........................................................................................................ 50
11 Gráficos da Porcentagem de Identificação dos Indivíduos Pertencentes
aos Grupos de Pesquisa com pelo menos um Integrante do CPGEI da
UTFPR........................................................................................................................... 56
LISTA DE TABELAS
1 Matriz Relacional de um Pesquisador........................................................................... 44
2 Fator de Proximidade Individual de um Pesquisador................................................... 47
3 Resultados de Identificação de Pesquisadores utilizando apenas informações dos
pesquisadores do CPGEI/UTFPR ................................................................................
54
4 Resultados de Identificação de Pesquisadores utilizando informações de todos os
grupos de pesquisa que possuam pelo menos um integrante do CPGEI/UTFPR ........
57
5 Proporção de Identificação em Relação ao Papel no Grupo de Pesquisa ..................... 58
6 Resultados de Identificação de Pesquisadores através da Abordagem de Comparação
de Contexto ...................................................................................................................
59
LISTA DE ABREVIATURAS E SIGLAS
CPGEI - Programa de Pós-graduação em Energia Elétrica e Informática Industrial
UTFPR - Universidade Tecnológica Federal do Paraná
CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico
RESUMO
Dentro da área de Sistemas Colaborativos, esta dissertação se enquadra no tema de
formação de equipes de projeto. É proposto um modelo computacional fundamentado na
teoria de redes sociais para a formação de equipes de pesquisa baseado nas redes sociais
egocêntricas de líderes de projeto, considerando as múltiplas relações sociais e o dinamismo
ao longo do tempo para calcular um fator de proximidade relacional utilizado para identificar
integrantes pertencentes a um grupo.
Para verificar a viabilidade de realização e a qualidade dos resultados fornecidos pelo
modelo computacional caso fosse utilizado em uma ferramenta de auxílio à formação de
equipes, fez-se um estudo de caso. Neste estudo, foram extraídas informações dos currículos
Lattes e do diretório de grupos de pesquisa do CNPq com o objetivo de representar as redes
egocêntricas e valorar as relações para identificar os indivíduos dos grupos de pesquisa. Os
experimentos foram realizados em 22 grupos de pesquisa do CPGEI – Curso de Pós-
Graduação em Engenharia Elétrica e Informática Industrial da Universidade Tecnológica
Federal do Paraná.
Como conclusão geral do trabalho, verificou-se que o modelo pode ser realizado
computacionalmente e apresenta resultados qualitativos satisfatórios.
Palavras-chave: Redes Sociais, CSCW.
ABSTRACT
TITLE: COMPUTACIONAL MODEL TO TEAM FORMATION BASED IN THE SOCIAL NETWORK OF TEAM LEADER
This dissertation has the issue of Project Team Formation, in the area of collaborated
systems. In this work is proposed a computational model based in network theory to team
formation based in the egocentric network of team leader, considering multiples social
relations and the temporal dynamics to calculate a relational proximity factor used to identify
possible persons that could belongs to a team.
This computational model was verified in a case study. In this case study, social
network’s information was recovered in curriculum documents available in platform Lattes, in
the subdirectory of research groups of CNPq. This information was used to construct the
representation of egocentrics network and valuated this social relations to identify actors that
could belongs to a research group. In this case study, 22 research groups in CPGEI/UTFPR –
Curso de Pós Graduação em Engenharia Elétrica e Informática Industrial da Universidade
Tecnológica Federal do Paraná – were analyzed.
As conclusion of this work was possible verify that this computational model can be
implemented and produce satisfactory qualitative results.
Key words: CSCW, Social Network.
CAPÍTULO 1
INTRODUÇÃO
Neste primeiro capítulo é discutido o problema a ser explorado na pesquisa, o objetivo
geral e os específicos. Em seguida, apresentam-se as justificativas com as contribuições
esperadas e a estrutura geral do trabalho.
1.1 DESCRIÇÃO DO PROBLEMA
O estudo da formação de equipes é fundamental para uma série de disciplinas,
incluindo o planejamento e o aprendizado em sistemas multiagentes, sistemas sociais
artificiais e inteligência artificial distribuída. A construção de organizações efetivas nas
sociedades reais ou artificiais é dependente de estruturas sociais que permitem a formação
eficiente de equipes para a execução de tarefas complexas (GASTON; SIMMONS,
DesJARDINS, 2004).
Aspectos individuais devem ser considerados na formação de equipes de pesquisa, já
que as necessidades de cada integrante tendem a ser diferentes. O líder de projeto deve buscar
a formação de uma equipe de pesquisa de forma personalizada, onde cada pesquisador possa
maximizar os benefícios do trabalho colaborativo (como a utilização da rede de contatos dos
pesquisadores para a indicação de amigos de amigos, a aquisição de conhecimento, de
recursos financeiros e materiais e a obtenção de prestígio ou popularidade). O estudo da
formação de equipes, além de proporcionar um modelo para a compreensão dos aspectos
individuais dos líderes de projeto, fornece parâmetros que podem ser usados como um
conjunto de restrições para identificar os requisitos para a formação de uma equipe de
pesquisa, tais como, por exemplo, experiências, papel no grupo, gênero do pesquisador,
localização geográfica e instituição onde atua. (OUNNAS, DAVIS, MILLARD, 2007).
Um problema comum em organizações é identificar pessoas ou competências que
atendam às necessidades de uma equipe de pesquisa ou projeto autogerenciável, tanto no meio
acadêmico quanto na indústria (ENEMBRECK et al., 2006). Hahn e co-autores (2006)
descrevem a importância das relações sociais na formação de equipes de projeto para o
desenvolvimento de software livre. Neste estudo foi possível evidenciar que a pré-existência
de relações entre os participantes aumenta as chances de engajamento destes no projeto.
Também foi possível evidenciar que o engajamento de novos indivíduos com experiência foi
favorecido quando estes indivíduos já possuíam relações pré-existentes com outras pessoas
envolvidas no projeto. Já no caso onde os participantes não possuíam relacionamentos pré-
existentes, apenas os indivíduos com pouca experiência tendem a se engajar no projeto.
Gaston e DesJardins (2005) demonstram que a rede social existente entre os
indivíduos de uma organização pode ter um impacto significante no desempenho
organizacional, pois a sua estrutura define o fluxo de informações, recursos, deveres e direitos
e influencia diretamente no processo de formação de times para a execução de determinadas
tarefas. Assim, torna-se necessário o estudo da identificação de estruturas sociais eficientes,
em particular, com técnicas de aprendizado organizacional descentralizadas baseadas em
adaptação local da rede social.
A importância do estudo de formação de equipes surge da necessidade de unir
indivíduos com diferentes idéias, habilidades e recursos, estimulando a criatividade pelo
aumento da diversidade de forma a resolver problemas antigos e inspirar um novo
pensamento, levando em conta a habilidade da maioria dos integrantes em trabalhar e
compartilhar conhecimento com antigos colegas. Também se deve considerar o tamanho da
equipe que deve ser grande o suficiente para promover a especialização e divisão efetiva do
trabalho entre os integrantes, porém pequena o suficiente para arcar com os custos de
coordenação (GUIMERÀ et al., 2005). Os processos de busca de informações e colaboração
no ambiente de trabalho demonstra que os relacionamentos sociais são um forte fator na
determinação de quem colabora com quem (McDONALD, 2003).
A problemática desta dissertação é a análise de redes sociais para determinar os
parâmetros da rede social egocêntrica do líder de projeto que possam ser utilizados na
valoração de relações sociais para orientar a indicação de pesquisadores com o objetivo de
formação de uma equipe de pesquisa. O problema deve considerar a determinação da rede
social egocêntrica dos pesquisadores levando em consideração os aspectos das múltiplas
relações analisadas (co-autoria, relações orientador-orientado), aspectos temporais (quando
ocorreu determinada relação) e características individuais (cidade onde reside, área de
pesquisa, instituição onde atua, etc.).
1.2 MOTIVAÇÕES
Em trabalhos anteriores realizados no grupo de pesquisa MEMENTO/CPGEI, buscou-
se identificar automaticamente comunidades, grupos e equipes pela extração de informações
de documentos eletrônicos manipulados por membros de uma organização (BORTOLI,
TACLA, 2006; TACLA et al., 2006) e de currículos da plataforma Lattes (ENEMBRECK et
al., 2007). Nestes trabalhos comprovou-se que a partir da extração de palavras relevantes de
documentos e do emprego de técnicas baseadas em freqüência de palavras é possível
identificar comunidades e equipes potenciais com grau de sucesso bastante satisfatório.
Porém, as representações ad-hoc utilizadas para a representação das comunidades e equipes
não permitem análises detalhadas como permitem as redes sociais. O aspecto temporal das
ligações interpessoais foi abordado nestes trabalhos de forma superficial.
Portanto, uma das motivações deste trabalho é dotar os anteriores de uma
fundamentação teórica em redes sociais que permitem representar comunidades e equipes
formalmente e analisá-las em função de diversos parâmetros, tais como, as relações existentes
entre os membros, a intensidade de cada relação e o efeito da composição de múltiplas
relações, o efeito do aspecto temporal na intensidade destas relações e a identificação de
padrões de comportamento que possam auxiliar na formação de equipes. Além disso, a
extração de informações baseada unicamente em palavras relevantes pode ser melhorada com
a coleta de outras evidências de relações interpessoais, tais como, co-autoria de trabalhos e
orientações de alunos para o caso de identificação de uma comunidade de professores
pesquisadores.
Os aspectos apresentados acima motivaram o estudo de formação de equipes de
pesquisa buscando uma abordagem inovadora por meio da utilização de múltiplas relações
analisadas durante o decorrer de um determinado período de tempo.
1.3 OBJETIVOS
Esse estudo pretende, como objetivo geral, identificar os parâmetros da rede social
egocêntrica de líderes de projeto para a formação de equipes, considerando diferentes tipos de
relações sociais e as alterações destas relações no decorrer do tempo.
1.3.1 Objetivos Específicos
Os objetivos específicos deste trabalho são:
1. Pesquisar na Plataforma Lattes informações sobre os pesquisadores e construir
a rede social egocêntrica destes pesquisadores e dos líderes de projeto.
2. Criar um modelo computacional que considere as múltiplas relações sociais e o
dinamismo destas relações com o passar do tempo, para analisar a rede social
egocêntrica do líder de projeto e a cadeia de recomendações formada pelos
demais integrantes.
3. Utilizar estas informações para identificar os pesquisadores que compõem os
grupos de pesquisa analisados.
4. Validar o método proposto na dissertação através de um estudo de caso
realizado com as equipes de pesquisa do CPGEI da UTFPR.
Como parte das contribuições esperadas desta dissertação, o modelo computacional
proposto deve responder a diversas perguntas que permitam projetar um sistema que auxilie a
formação de equipes utilizando informações sobre as relações sociais e atributos dos
indivíduos:
1. Como construir uma representação manipulável computacionalmente das
diversas redes sociais das comunidades pesquisadas às quais pertence o
indivíduo, de forma a se aproximar da visão do próprio pesquisador?
2. Como pode ser relacionada a valoração dos relacionamentos, pela freqüência
de ocorrência e a temporalidade, com a rede social de um usuário?
3. Como utilizar a composição de relacionamentos e a rede social do usuário para
localizar pessoas que possuam conhecimentos, reputação e experiências em um
certo domínio?
4. Como construir a rede social egocêntrica em relação ao contexto acadêmico de
um usuário sem a intervenção da sua parte?
5. Como pode o usuário ter sua privacidade preservada sem inviabilizar a partilha
de informações sobre diferentes recursos (currículos, rede de contatos, área de
atuação, etc.)?
6. Quais as contribuições deste método para CSCW (Computer Supported
Collaborative Work – Trabalho Colaborativo Suportado por Computador)?
1.4 JUSTIFICATIVA
A pesquisa realizada por Whuchty, Jones e Uzzi (2007) sobre a produção científica em
artigos e patentes nas últimas cinco décadas mostrou que equipes de pesquisa superam os
pesquisadores solitários na produção de conhecimento em praticamente todos os campos.
Porém, as equipes de pesquisa devem lidar com perdas ocasionadas pela própria rede social e
pelas atividades de coordenação, podendo isto causar perda de eficiência a ponto de
possuírem desempenho inferior a pesquisadores solitários. A compreensão destes aspectos
possui grande relevância social por contribuírem com a formação de equipes de pesquisa
com maior eficiência para o desenvolvimento de conhecimento científico.
A análise da rede social egocêntrica dos pesquisadores, proposta neste trabalho, possui
grande relevância acadêmica por se diferenciar na de análise de redes sociais ao assumir a
existência de relações múltiplas e heterogêneas produzindo diversas redes sociais de acordo
com cada relação considerada e a época de sua ocorrência e por propor a utilização de
parâmetros para construir uma representação da rede social através da combinação de relações
considerando o dinamismo da rede social com o passar do tempo. Assim este trabalho se
diferencia dos demais estudos de redes sociais que utilizam o retrato de um ponto específico
de tempo, ou a agregação de todas as relações existentes em um determinado período de
tempo (TANTIPATHANANANDH, WOLF, KEMPE, 2007). Estas abordagens produzem a
perda de informações sobre tendências das redes sociais dinâmicas, as mudanças que estão
ocorrendo e as possíveis causas que podem estar entre as propriedades observadas.
A abordagem utilizada para identificar os pesquisadores que formam os grupos de
pesquisa analisados representa uma mudança metodológica em relação à abordagem
tradicional, partindo da análise da rede social formada por apenas um tipo de relacionamento,
independente do indivíduo (ou seja, os relacionamentos homogêneos), para a análise da rede
social com múltiplos relacionamentos de forma dependente do indivíduo e de seu papel social
(os relacionamentos heterogêneos). O argumento para tal diferenciação é o fato de que redes
sociais múltiplas e heterogêneas são onipresentes no mundo real e usualmente afetam as
atividades sociais das pessoas e os papéis que desempenham. Com isto espera-se que a
utilização desta abordagem para a identificação de grupos baseada em um algoritmo para a
mensuração de múltiplos relacionamentos proporcione uma expansão na análise de redes
sociais com o potencial de novas aplicações.
A compreensão deste mecanismo de formação de equipes pode auxiliar na escolha de
uma equipe de pesquisa, com conhecimentos e experiências em determinadas áreas
estabelecidas pelo projeto de pesquisa, possibilitando localizar pessoas que possuam os
conhecimentos necessários e que podem ser descobertas (e eventualmente reputadas) através
de Redes Sociais (cadeia de recomendações) partindo da rede social egocêntrica do líder de
projeto.
1.5 ESTRUTURA DA DISSERTAÇÃO
Esta dissertação está organizada em cinco capítulos. No Capítulo 2 faz-se uma revisão
da literatura sobre fundamentos de redes sociais e a sua análise, e um levantamento sobre as
publicações mais recentes relacionadas com a proposta deste trabalho de dissertação. O
Capítulo 3 descreve em detalhes o modelo computacional proposto e suas justificativas. No
Capítulo 4 relatam-se os resultados obtidos e a análise destes resultados. E, finalmente, o
Capítulo 5 as conclusões do trabalho e as propostas para trabalhos futuros.
CAPÍTULO 2
FUNDAMENTAÇÃO TEÓRICA
Este capítulo traz a fundamentação teórica utilizada na construção deste trabalho de
pesquisa. A base teórica conduz a uma linha de raciocínio que facilita o entendimento da
proposta de um modelo computacional para construir a rede social egocêntrica dos
pesquisadores e identificar os prováveis pesquisadores que formam a equipe de pesquisa
analisada. Na seção 2.1 são apresentados alguns conceitos de redes sociais para formalizar os
aspectos da disciplina necessários ao entendimento dos objetivos enunciados no Capítulo 1. A
seção 2.2 apresenta sucintamente alguns métodos de análise de redes sociais.
Foram também investigadas as novas técnicas de formação de equipes implementadas
com o conhecimento obtido por meio da análise de redes sociais, quais níveis de
implementação atingiram e, também, sobre as formas adotadas para formalizar o uso e o
conhecimento adquirido no desenvolvimento destes modelos. É traçado na seção 2.3 um
panorama dos avanços na construção de sistemas computacionais que utilizam redes sociais
para realizar a identificação de grupos, recomendação de indivíduos e mecanismos de
construção de equipes e sistemas colaborativos. Para melhor compreensão desses temas,
bibliografia relevante adicional será sugerida.
2.1 REDES SOCIAIS
Uma rede social pode ser definida como um conjunto de indivíduos e as relações que
mantêm juntos estes indivíduos (SCOTT, 2000). Estes indivíduos podem ser elementos ou
subconjuntos, como pesquisadores, grupos de pesquisa, universidades ou países.
As redes sociais vêm sendo amplamente utilizadas como uma ferramenta quantitativa
em ciência social para a compreensão de como indivíduos ou organizações se relacionam
(SAID et al., 2008). O desenvolvimento no campo de redes sociais se iniciou por volta de
1930, com diversos grupos trabalhando de forma independente em diferentes áreas. Por volta
da década de 30 e, ao final desta década, existiam duas linhas de pesquisa para redes sociais
(SCOTT, 2000). A primeira foi desenvolvida pelo grupo da universidade de Harvard com o
objetivo de encontrar subgrupos de pessoas em grandes grupos. A abordagem sociocêntrica
foi derivada desta linha de pesquisa. A segunda linha de pesquisa foi desenvolvida pelo grupo
de antropologistas da universidade de Manchester e abriu caminho para o estudo de
comunidades partindo do ponto de vista do indivíduo, chegando ao desenvolvimento da
abordagem egocêntrica.
Combinando informações relacionais com os atributos dos indivíduos em um panorama
social, foi possível enriquecer a percepção social em relação à abordagem sociológica
tradicional. As duas principais abordagens para o estudo de redes sociais são a sociocêntrica e
a egocêntrica. A abordagem sociocêntrica é usada para estudar as redes sociais onde os limites
são claramente especificados, através da quantificação das relações entre os participantes
deste grupo definido. O foco desta abordagem é a medição de padrões de interação e como
estes padrões surgem. Já abordagem egocêntrica ganhou popularidade por focar os indivíduos,
os grupos e as comunidades. Nesta abordagem são estudadas as relações do ponto de vista do
indivíduo, sendo possível avaliar os aspectos da rede social individual (CHUNG, HOSSAIN,
DAVIS, 2005).
2.1.1 Representações de Redes Sociais
As relações das redes sociais podem ser representadas de diversas maneiras como
gráficos, matrizes ou grafos de relacionamento. Os gráficos podem ser usados na análise de
uma determinada relação em particular (como o número de ligações de cada indivíduo da rede
social). As matrizes representam os relacionamentos entre os indivíduos através da valoração
de cada relação. Um caso particular de matrizes são as chamadas matrizes relacionais, onde os
indivíduos são dispostos em linhas e colunas e o valor da relação social entre dois indivíduos
compõem os elementos da matriz. Estas matrizes são indicadas na análise de padrões de
interação, equivalência estrutural e análise de blocos. Os grafos ou sociogramas permitem
representar relações dirigidas ou não, sendo comum a utilização de grafos valorados, sendo
esta a estrutura matemática básica utilizada para visualização das redes sociais. Os grafos são
indicados na análise de centralidade, prestígio, intermediação, coesão de subgrupos e métodos
de análise de díades e tríades dentro das redes sociais.
Outro método de representação é a notação algébrica que pode ser usada para o estudo
de relações múltiplas. Esta notação utiliza técnicas algébricas para comparar e contrastar
medições de relações ou para produzir uma composição de relações (WASSERMAN,
FAUST, 1994). Pode-se desta forma representar os indivíduos não pesquisadores de um grupo
de pesquisa como o conjunto de indivíduos do grupo de pesquisa menos o subconjunto dos
pesquisadores.
2.1.2 Abordagem Egocêntrica
Uma rede egocêntrica, ou local, consiste na rede social focada em um determinado
indivíduo (chamado de ego), os demais indivíduos com que possui ligações (chamados de
alters) e a medição das ligações sociais entre o ego e os alters, e nas ligações entre os alters
(WASSERMAN, FAUST, 1994).
Apesar de muitas análises de redes sociais buscarem um completo exame da rede social
em larga escala (onde todas as conexões entre os membros da rede são visíveis), a abordagem
egocêntrica busca uma visão mais restrita. Usando técnicas de análise de redes sociais
egocêntricas é possível entender como os indivíduos se relacionam, os papéis individuais e os
tipos de interações que se desenvolvem com os demais em sua volta (FISCHER, 2005).
Porém admite-se que as redes egocêntricas são ligadas umas as outras através de associações
das sobreposições das relações sociais, o que forma uma concatenação de redes sociais. Logo,
alterações nas redes egocêntricas produzem transformações que se propagam por toda a rede
social, afetando a análise sociocêntrica.
Neste trabalho de dissertação, apenas as ligações diretas entre o indivíduo central (ego)
e os membros de sua rede de contato (alters) são consideradas. Esta simplificação da
abordagem egocêntrica reduz a complexidade computacional do modelo proposto, sendo a
perda de informação causada por esta simplificação minimizada devido à sobreposição das
diversas redes egocêntricas e o uso da cadeia de recomendações no processo de identificação
dos indivíduos. Este tipo de rede egocêntrica simplificada é conhecido como grafo em estrela,
ou sociograma de Moreno, que é indicado para a identificação de líderes ou indivíduos
isolados, podendo ainda ser usada para a determinação da cadeia de recomendações (SCOTT,
2000). O sociograma de Moreno é ilustrado pela Figura 1, onde os diversos indivíduos da rede
egocêntrica estão ligados ao indivíduo central por uma determinada relação social
representada pelas linhas.
Figura 1: Sociograma de Moreno ou Grafo em Estrela onde são representados o indivíduo
central, os demais indivíduos da rede social egocêntrica e as suas ligações sociais
representadas pelas linhas.
2.1.3 Abordagem Sociocêntrica
O foco da análise sociocêntrica é mensurar padrões estruturais de interações e como
estes padrões surgem (como a concentração de poder ou recursos em determinado grupo). No
estudo de redes sociais através da abordagem sociocêntrica, os atores são facilmente
reconhecidos ou determinados, pois o foco desta análise são redes sociais onde os limites são
previamente conhecidos. Em muitos casos esta análise é a mais aplicada devido a sua
capacidade de fornecer informações sobre toda a rede social. A forma mais comum de
obtenção de informações sobre as relações sociais é a construção de matrizes relacionais onde
cada indivíduo da lista de linhas é questionado sobre sua relação com os demais nas colunas.
No entanto, no caso de grandes redes sociais seria cansativo buscar em uma enorme lista de
indivíduos quais são conhecidos. No caso da impossibilidade de obtenção de informações por
outros métodos, o mais indicado seria a utilização da abordagem egocêntrica (CHUNG,
HOSSSAIN, DAVIS, 2005).
�
�
�
�
� �
��
�
�
�
�
�
�
�
�
� �
��
�
�
�
�
2.2 ANÁLISE DE REDES SOCIAIS
Como já visto na seção anterior, uma rede social é basicamente um conjunto de
indivíduos e as relações que mantêm juntos estes indivíduos. Estes indivíduos podem ser
elementos ou unidades, como pesquisadores, grupos de pesquisa, universidades ou países.
Estes indivíduos formam uma rede social através de trocas de recursos entre eles. Os recursos
podem ser informações, e-mails, mercadorias, documentos, serviços, suporte social ou
financeiro. As trocas de recursos são consideradas evidências da existência de relações
sociais. A intensidade de uma relação social pode variar de fraca a forte, dependendo do
número ou do tipo de recurso compartilhado, da freqüência com que este compartilhamento
ocorre e da intimidade relacionada com estas trocas (CHUNG, HOSSAIN, DAVIS, 2005). O
estudo destas relações sociais, como surgem, como se concentram em determinado grupo,
como desaparecem e qual a influência que causam em toda a rede social é um campo de
estudo da análise de redes sociais.
2.2.1 Conceitos fundamentais da Análise de Redes Sociais
A análise de redes sociais (também conhecida como teoria de redes sociais), surgiu
como uma importante técnica e um tópico de estudo na sociologia moderna, antropologia,
psicologia social e teoria organizacional. A análise de redes sociais se concentra em entender
as ligações entre as entidades sociais e as implicações destas ligações (SAID et al., 2008).
Segundo Wasserman e Faust (1994), existem diversos conceitos fundamentais para
análise e discussão de redes sociais. Estes conceitos são: ator, relacionamento, díade, tríade,
subgrupos, grupos, relações e rede social. A seguir são definidos os conceitos chaves e
apresentados os diferentes níveis de análise de redes sociais.
Ator: A análise de redes sociais está baseada em entender as ligações entre as
entidades sociais e as implicações destas ligações. Estas entidades sociais são chamadas de
atores. Atores são indivíduos discretos agrupados ou unidades de coletividades sociais
(CHUNG, HOSSAIN, DAVIS, 2005). Exemplos de atores são os pesquisadores de um grupo
de pesquisa, os grupos de pesquisa de uma universidade e as universidades no sistema
científico mundial. O uso do termo ator não implica que esta entidade possua vontade própria
ou a habilidade de atuar. Muitas aplicações de redes sociais focam a coletividade de atores
que são todos do mesmo tipo, como os pesquisadores de um centro de pesquisa. Pode-se
chamar esta coletividade de monomodal. No entanto, alguns métodos permitem o estudo de
atores conceitualmente de diferentes tipos, ou de diferentes grupos, como a participação dos
pesquisadores em congressos científicos. Tantos os pesquisadores como os congressos são
atores de tipos diferentes em uma mesma rede social. Pode-se chamar esta de rede social de
bi-modal.
Ligações Sociais: Os atores são ligados a outros atores por ligações sociais. Existem
diversos tipos de ligações sociais. A definição de ligação social é a ligação estabelecida entre
um par de atores. Alguns dos exemplos de ligações mais comumente utilizados na análise de
redes sociais são:
• Avaliação de um ator por outro (como por exemplo, expressando amizade, respeito,
credibilidade ou ligação).
• Relações formais (como autoridade e hierarquia).
• Relacionamentos biológicos (como descendência, gênero).
• Interações comportamentais (como comunicar, enviar mensagens e co-autoria).
• Associação ou afiliação (como participação em eventos sociais ou pertencer a um
clube social).
• Transferência de recursos materiais (como transações econômicas, empréstimos, etc).
• Movimentações entre locais ou sociais (como migrações e modificação da posição ou
grupo social).
• Conexões físicas (como estradas, pontes, linhas telefônicas ligando dois pontos).
Díade: É o relacionamento que estabelece uma ligação entre dois atores. Esta ligação
é uma propriedade de um par e não de apenas um ator em particular. A análise da rede social
entre pares utiliza as díades como unidade de análise. A análise das díades consiste no par de
atores envolvidos e a probabilidade de existir uma ligação entre eles, desta relação ser
recíproca ou não, ou se tipos específicos de múltiplos relacionamentos tendem a ocorrer em
conjunto ou não.
Em nosso estudo de caso, a construção da rede egocêntrica de pesquisadores é
realizada atribuindo um valor para mensurar as diversas díades formadas entre o líder de
projeto e os demais pesquisadores.
Tríade: Os relacionamentos entre subgrupos de atores também devem ser estudados
através de métodos de análise que utilizam tríades como elemento unitário de análise. As
tríades são subconjuntos de três atores e as possíveis ligações entre eles. Um interesse
particular na análise de tríades são as relações de transitividade (se o ator i “gosta” do ator j
que “gosta” do ator k, então o ator i “gosta” do ator k), e de balanceamento (quando os atores
i e j gostam um do outro, eles concordam de forma similar em relação ao ator k. Caso eles não
gostem um do outro, eles discordam em relação ao ator k).
Subgrupo: Qualquer subconjunto formado por atores e pelas ligações entre eles pode
ser definido como um subgrupo. Localizar e estudar subgrupos usando critérios específicos
tem sido considerado um importante assunto na análise de redes sociais (WASSERMAN,
FAUST, 1994).
Grupo: A análise de redes sociais não deve simplesmente se concentrar em díades,
tríades ou subgrupos, mas na habilidade de modelar os relacionamentos entre sistemas de
atores. Um sistema consiste das ligações entre os membros de um grupo. A noção de grupo
possui diversas definições em ciências sociais. Para o nosso propósito de análise de redes
sociais, um grupo é um conjunto de atores que possuem ligações sociais que podem ser
mensuradas. Também se pode argumentar, por critérios teóricos, empíricos ou conceituais,
que os atores de um grupo pertencem a um conjunto interligado, ou seja, de forma mais
concreta um grupo consiste em um conjunto finito de atores com os quais são realizadas
medições das ligações na rede social. A restrição para um conjunto finito é um requisito
analítico. A concepção de um grupo infinito de atores e as extensas ligações entre eles traria
grande dificuldade de análise das informações desta rede social. A definição do grupo social
como finito proporcionou a abertura de novas áreas de estudo para a análise de redes sociais,
como a especificação das fronteiras de uma rede social, amostragem de informações a serem
coletadas e a definição do grupo a ser estudado.
Relação: A coleção de ligações sociais de um tipo específico entre os membros de um
grupo é chamada de relação. Por exemplo, o conjunto formado pelos professores orientadores
e seus alunos orientados nos cursos de pós-graduação no nível de mestrado e doutorado, e o
conjunto de co-autorias entre os pesquisadores em diversos artigos científicos publicados.
É importante perceber que uma relação se refere a um conjunto de ligações sociais,
que possuem um determinado tipo de medição, entre um par de um conjunto específico de
atores.
Rede Social: Uma rede social consiste em um ou mais conjuntos finitos de atores e as
relações entre os atores. A presença de uma relação entre os atores é um aspecto definitivo na
definição de uma rede social.
Ainda podem-se acrescentar as noções de comunidade, grupo e equipe, conforme a
Figura 2, levando em consideração os relacionamentos de cooperação (SCHLICHTER,
KOCH, XU, 1998):
Figura 2: Comunidade, Grupo e Equipe.
Comunidade: Pode ser definida como o conjunto de atores que partilham algo, mas
não necessariamente conhecem uns aos outros ou interagem entre si. Por exemplo, a
comunidade científica brasileira é composta por pesquisadores das mais diversas áreas que
possuem em comum o trabalho de promover o desenvolvimento científico e tecnológico.
Grupo: O grupo pode ser caracterizado como um conjunto de atores que conhecem
uns aos outros. Porém não existe necessariamente uma cooperação entre os elementos do
grupo, sendo as interações caracterizadas como fracas, pois não existem necessariamente
tarefas conjuntas com um objetivo em comum. O grupo de pesquisa do CPGEI é um exemplo,
pois neste grupo existem diversos pesquisadores trabalhando em diferentes projetos de
pesquisa.
Equipe: Uma equipe é um conjunto de atores que se conhecem mutuamente e
cooperam para atingir um objetivo em comum, podendo existir o compartilhamento de algum
artefato no qual estão trabalhando. Uma equipe de pesquisa trabalha em conjunto para atingir
Comunidade
Grupo
Equipe
Comunidade
Grupo
Equipe
os objetivos do projeto de pesquisa e compartilham recursos como laboratórios, softwares,
rede de computadores, documentos, livros e outros artefatos.
Segundo Wasserman e Faust (1994), estes termos compõem o vocabulário específico
usado na análise de redes sociais e serão utilizados no decorrer deste trabalho.
2.2.2 Aspectos Sociais da Análise de Redes Sociais
Uma informação coletada de uma rede social consiste de pelo menos uma variável
mensurável em um conjunto de atores. As necessidades que motivam um determinado estudo
de uma rede social normalmente determinam quais variáveis medir, e freqüentemente qual
técnica é a mais apropriada para esta medição (WASSERMAN, FAUST, 1994). Por exemplo,
no caso da análise da rede social de um grupo de pesquisadores seria difícil utilizar técnicas
de observação devido à característica distribuída destes grupos, logo o mais indicado é utilizar
arquivos pessoais, publicações, descrições de trabalhos científicos, e-mail, ligações
telefônicas e outras informações sobre tais grupos.
A natureza destas informações também determina qual o método analítico mais
apropriado para o seu estudo. Logo, o entendimento da natureza destas variáveis é importante
para a sua análise. Segundo Wasserman e Faust (1994), estas variáveis podem ser
classificadas em dois tipos: estruturais e de composição ou atributo. As variáveis
estruturais são as variáveis que são valoradas entre dois pares de atores, como a relação de co-
autoria entre pesquisadores que pode ser valorada pela freqüência de ocorrência, ou a relação
comercial entre dois países que pode ser valorada pela quantidade de trocas monetárias nas
exportações e importações. Já as variáveis de composição ou variáveis de atributo dos atores
descrevem características relativas ao comportamento ou padrões sociais de cada indivíduo,
como o gênero, instituição a qual pertence, a sua localização, o nível de graduação de um
determinado pesquisador, o número de pesquisadores ou o número de grupos de pesquisa em
um centro de pesquisa.
Alguns aspectos selecionados e descritos por Cummings e Kiesler (2007), são
considerados importantes nesta dissertação para a análise da rede social de uma equipe de
pesquisa:
Familiaridade: A familiaridade define o nível de interação que dois atores tiveram
entre si no passado. Uma grande familiaridade reduz as incertezas sobre como o outro ator irá
se comportar no futuro. Pesquisadores que tiveram a experiência de trabalhar junto no
passado devem estar familiarizados com o estilo de trabalho, hábitos e preferências uns dos
outros, e em resultado disto deverá ser mais confortável trabalhar novamente em conjunto no
futuro, estando a familiaridade relacionada com o grau de convivência dos pesquisadores no
meio acadêmico.
Proximidade Geográfica: A proximidade geográfica é definida como a distância
física entre dois atores. Quando um par de atores se localiza geograficamente perto um do
outro, eles possuem maior oportunidade para se encontrar, realizar comunicações espontâneas
e interagir informalmente. Em contraste, quando estes atores estão longe um do outro, como
no caso de pesquisadores que atuam em diferentes universidades, eles possuem poucas
chances de realizar um trabalho conjunto e terão mais dificuldade em manter uma rotina de
comunicações e coordenação para suportar uma relação de trabalho cooperativo do que dois
atores que trabalham no mesmo espaço físico.
Homofilia: A homofilia é definida como a similaridade entre dois indivíduos. Os
atores preferem se relacionar com outros atores que são similares a eles em características
como idade, religião, nível de educação. No contexto de um grupo de pesquisa a homofilia em
relação às idéias e experiências proporcionam a formação de equipes orientadas a objetivos
comuns. Em um centro de pesquisa, dois pesquisadores que compartilham a mesma área de
pesquisa freqüentemente possuem experiências e objetivos similares. Por outro lado,
pesquisadores em diferentes áreas de pesquisa possuem poucas experiências em comum, o
que reduz a probabilidade de um trabalho em conjunto no futuro.
No entanto o alto grau de homofilia dificulta a entrada de novos integrantes no grupo
de pesquisa, fazendo com que apenas indivíduos em grupos pequenos se agrupem. Ou seja, os
indivíduos com alto grau de homofilia tendem a manter relações apenas com outros atores
mais próximos e parecidos com eles próprios. Um grupo de pesquisadores experientes que
escolhem trabalhar em conjunto sem permitir a entrada de pesquisadores novatos na sua
equipe de pesquisa é um exemplo de um grupo que apresenta um alto grau de homofilia. Com
isto este grupo está reduzindo a diversidade da equipe, considerado por Guimèra et al. (2005)
como um fator que contribui para o desempenho das equipes. Com o aumento da homofilia
também aumenta a dificuldade de identificar os indivíduos. Apesar dos grupos serem
facilmente identificados, o mesmo não ocorre com os indivíduos passam a apresentar
atributos muito próximos (WATTS, 2003). No entanto a natureza multidimensional da
identidade social de cada indivíduo, onde os indivíduos classificam suas relações em
diferentes categorias e subcategorias, permite a identificação destes indivíduos. No caso do
grau de homofilia ser zero, ocorre a condição de Kleinberg, onde os indivíduos mantêm
relações com diferentes grupos com a mesma facilidade. Segundo Watts (2003), esta condição
favorece a diversidade das equipes e facilita a identificação de indivíduos. A Figura 3 mostra
a região onde é possível realizar a busca por redes sociais em relação ao grau de homofilia e
as diversas dimensões sociais em que uma relação pode ser classificada.
Figura 3: Gráfico que mostra a região onde a busca utilizando redes sociais é possível,
limitada pelo grau de homofilia e pelo número de dimensões sociais consideradas (WATTS,
2003).
A condição de Kleinberg é encontrada no ponto de intersecção dos dois eixos, e a
melhor condição para se pesquisar uma rede social ocorre quando utilizamos entre duas e três
dimensões sociais (WATTS, 2003). Este fato favorece a análise de redes sociais através do
uso de relações múltiplas, que levam em consideração mais de uma dimensão social.
2.2.3 Tipos de Ligações Sociais
Uma das maiores dificuldades no estudo de redes sociais é a seleção das relações
adequadas às necessidades de estudo, limitadas dentro da rede social analisada e com
possibilidade de serem observadas e mensuradas através das informações disponíveis
(SCOTT, 2000).
Uma estratégia comum no estudo de pequenas redes sociais tem sido a identificação
dos membros de um grupo em particular e as várias conexões entre eles. Porém ao se definir
uma relação de proximidade e realizar uma entrevista com os membros do grupo, surgirão
diferentes respostas sobre o conceito “mais próximo”. Isto causa uma dificuldade em definir
os limites da rede social, uma vez que para alguns indivíduos o conceito de proximidade pode
ser bastante amplo, enquanto que outros definem proximidade com uma percepção bem rígida
e clara. Assim os limites da rede social variam de pessoa para pessoa. Logo, ao se definir o
conceito de proximidade através de conceitos como freqüência de ocorrência ou tipo de
relacionamento, impõem-se de forma artificial aos integrantes do grupo analisado os limites
de sua rede social e a classificação de proximidade.
Outro aspecto das ligações sociais é o fato de que elas podem estar associadas a
diversos papéis sociais. Um papel é definido por um conjunto de atributos, como o nome do
papel e identificação; um conjunto de objetivos, sendo que cada objetivo é associado a uma
árvore de decisão, com uma descrição hierárquica das alternativas para atingir o objetivo
(XIAOQIN, HAIPING, BHAVESH, 2007). Por exemplo, na relação professor-aluno existem
dois indivíduos desempenhando diferentes papéis, com objetivos individuais distintos, porém
eles podem desempenhar um mesmo papel em outro ambiente, como no caso de participação
em uma comemoração familiar onde os dois indivíduos desempenham o papel de convidados
e possuem uma relação de “conhecidos” (MORI, SUGIYAMA, MATSUO, 2005).
Ainda existe a dificuldade de algumas variáveis apresentarem a forma binária,
limitando os métodos de medição das ligações em uma rede social. Estas variáveis indicam
apenas a presença ou ausência de uma determinada relação e limitam a análise de alguns
aspectos sociais, como por exemplo, a determinação da proximidade de dois atores. Estas
variáveis binárias podem ser convertidas em medições utilizando coeficientes de correlação. É
possível, por exemplo, atribuir pesos a cada tipo de grupo social e com isto comparar a
relação de “conhecer” entre o indivíduo e um membro de sua família com um companheiro de
trabalho. Apesar da dificuldade em valorar esta relação, pode-se afirmar que o indivíduo
conhece mais os membros de sua família que os seus colegas de trabalho devido à intensidade
e os tipos de relacionamentos existentes nestes grupos, o período de tempo com que se
relacionam e a quantidade de recursos que compartilharam. Porém com esta conversão de
dados realizam-se suposições sobre as relações da rede social, sem garantia de sucesso
(SCOTT, 2000). Seria inviável utilizar estas informações para afirmar o quão próximos são
dois pesquisadores, uma vez que a distância entre os pesquisadores depende diretamente do
coeficiente de correlação, sendo imprópria a comparação de duas díades distintas com uma
relação de proximidade medida desta forma. Porém pode-se construir uma composição de
relações utilizando fatores de correlação para mensurar relações binárias, que pode ser
utilizada como um ponto de partida qualitativo para comparar a intensidade das relações
sociais de um mesmo indivíduo em relação aos membros de sua rede egocêntrica.
2.2.4 Análise de Redes Sociais com Relações Múltiplas
Em uma rede social do mundo real existem diversas relações sociais que podem ser
evidenciadas e mensuradas. Existindo o interesse em se analisar mais de uma relação social
surge a necessidade de realizar a análise com relações múltiplas. Segundo Wasserman e Faust
(1994), muitos procedimentos padrões utilizados para a análise de redes sociais não se
aplicam às redes com relações múltiplas (como centralidade e identificação de subgrupos
coesos). Alguns métodos foram desenvolvidos especificamente para o uso na análise de
relações múltiplas, como a álgebra relacional e alguns modelos estatísticos. No entanto ainda
existe a necessidade de desenvolvimento de métodos para a obtenção de boas medições da
associação de relações ou de propriedades multi-relacionais.
Segundo Matsuo et al. (2006), existem diversas formas de reduzir as múltiplas matrizes
relacionais para apenas uma matriz utilizando álgebra relacional, como soma, média, máximo
ou multiplicação de cada elemento correspondente das matrizes. Porém, dependendo da
necessidade da análise deve-se aplicar o método adequado. No caso da necessidade de
identificação de um pesquisador importante em determinado assunto, é indicada a análise da
centralidade do pesquisador na rede social utilizando apenas a relação de citações ou
publicações. Para pesquisar a credibilidade de um indivíduo o uso da freqüência de
relacionamentos explícitos é recomendado. Logo, a integração de redes sociais com relações
múltiplas deve ser realizada dependendo do propósito da análise, sendo possível, em alguns
casos, a análise de cada relação pode compor um panorama que facilite a compreensão dos
padrões sociais estudados.
2.2.5 Propriedades Estruturais para a Análise de Redes Sociais
As informações obtidas da rede social devem ser armazenadas de forma a permitir a
extração de atributos dos atores e informações relacionais utilizadas para a análise da rede
social e a construção de uma descrição estatística. A seguir descrevem-se algumas medições
comuns realizadas na análise das propriedades estruturais das redes sociais utilizando tais
informações.
Densidade: A densidade basicamente representa o número atual de ligações em uma
rede social em relação ao número total possível com a utilização de todos os nós. Uma rede
social com a máxima densidade recebe o valor 1,0 (o que significa que todos os nós estão
conectados uns com os outros). Uma rede social com densidade próxima de 0,0 indica que ela
possui poucas ligações. Para um grafo não direcional, a densidade (D) é definida por
(WASSERMAN, FAUST, 1994):
( )( )1
2
−⋅
⋅=
NNtL
D (1)
onde:
• N é o número de nós da rede analisada, sendo N>1,
• Lt é o número total de ligações entre os nós
A densidade pode ser utilizada para a identificação de grupos em comunidades.
Quanto maior o número de ligações entre os elementos, maior é a coesão de tal grupo. As
métricas relacionadas com este aspecto são a centralidade e a centralização.
Centralidade: Muitas redes sociais possuem atores em posição central. Nesta posição,
estes atores possuem um melhor acesso às informações e melhor oportunidade em divulgar
informações. Sobre este ponto de vista individual a centralidade caracteriza a abordagem
egocêntrica, já que se concentra no indivíduo.
Centralidade Local e Centralidade Global: Enquanto a centralidade local mede o
número ou proporção de ligações de um nó em particular, a centralidade global está
relacionada com a medição da distância entre os nós. Assim, um nó que fica a uma curta
distância de outros nós é dito próximo a estes nós. Com isto surge o conceito de
“proximidade”. A centralidade local pode ser relacionada a capacidade do indivíduo em se
relacionar com os demais membros da rede, sendo associada a noção de popularidade do ator.
Freeman (apud SCOTT, 2000) propôs a medição de centralidade relativa para medir a
centralidade de um determinado nó em relação à centralidade global da rede social Esta
contribuição permite a análise da centralidade local relativa de um nó que pode ser facilmente
comparada com outros nós da mesma rede social. Segundo Freeman (apud WASSERMAN,
FAUST, 1994), em termos matemáticos o grau de centralidade local relativa (ci) de um nó é
dado por:
( )11
−=� =
N
Lc
N
j ij
i (2)
onde:
• Lij = 1 se existe uma ligação entre os nós i e j, e Lij = 0 caso não existe tal
ligação.
• N é o número de nós da rede analisada
Porém, deve-se diferenciar a centralidade local relativa no caso de relações
direcionais, com o cálculo da centralidade local relativa de entrada e de saída do nó i.
Segundo Freeman (apud WASSERMAN, FAUST, 1994), a centralidade global de um
nó (Cgi) pode ser definida por:
� == N
j jii nndistCg1
),( (3)
onde:
• dist(ni,nj) é a distância entre os nós ni e nj,
• N é o número de nós da rede analisada
Centralização: Uma rede social é considerada com grande centralização quando
existe uma região claramente definida entre o centro e a periferia da rede social. Nesta
situação as informações fluem com facilidade, porém dependem da região central para
transmitir tais informações (SAID et al., 2008). Para medir a centralização em uma rede social
se precisa observar diferenças nos valores de centralidade entre os nós mais centrais e os
demais nós. Assim para chegar no valor de centralização (CG) é calculada a média entre soma
das distâncias e a soma das distâncias máximas possíveis na rede social analisada. Conforme
Freeman (apud WASSERMAN, FAUST, 1994), pode-se definir a centralização como:
( )( ) ( )21
)(1
−⋅−
−= � =
NN
NLNLMAXCG
N
i ii (4)
onde:
• MAX(NLi) é o número máximo de atores ligados diretamente a um
determinado ator i.
• NLi é o número de atores na rede social que são diretamente ligados
com o ator i.
• N é o número total de atores.
A centralização e densidade não são apenas medidas importantes na análise de redes
sociais, mas são complementares. A densidade informa o nível de conectividade da rede. Já a
centralização informa a extensão com a qual a conectividade é focada ao redor de um nó em
particular, ajudando a identificar uma estrutura central a partir da medição de quão coesa ou
integrada é a estrutura em torno do seu ponto mais central.
2.3 TRABALHOS RELACIONADOS
Uma das áreas de pesquisa em redes sociais são os mecanismos dinâmicos de formação
e identificação de equipes. Foi possível verificar que existem diferentes tipos de abordagens
para entender o fenômeno de formação de equipes e outras correlatas para identificar grupos e
comunidades, construir representações das redes sociais e reputar indivíduos para
compartilhamento de informações. Nesta seção são abordados os aspectos relacionados com à
implementação destes sistemas no mundo real.
No trabalho de Guimerà et al. (2005) foi desenvolvido um modelo para a construção de
times com indivíduos criativos, no qual a escolha dos membros da equipe foi controlada por
três parâmetros: o número de membros do time (m), a probabilidade de seleção dos novos
membros entre os indivíduos da rede social (p) e a propensão dos novos membros em escolher
antigos colaboradores (q). O modelo prediz a existência de duas fases durante a formação das
equipes, que são determinadas pelos valores dos parâmetros. Na primeira fase, existe um
grande agrupamento conectado a uma considerável proporção de outros indivíduos da
comunidade; na segunda fase existe a formação de diversos agrupamentos menores isolados.
Neste estudo foram analisadas informações de grupos científicos e artísticos onde os
integrantes tiveram a experiência de grande pressão com a especialização, diferenciação,
internacionalização e comercialização de suas atividades. O trabalho considera que a
eficiência de uma equipe é proporcional a sua diversidade e expertise, com isto os parâmetros
p e q devem ser relacionados com o desempenho da equipe, devendo existir um valor ótimo
para estes parâmetros e para o número de integrantes da equipe (m), como mostra a evolução
das equipes analisadas no período de 113 anos.
O trabalho de Cai et al. (2005) analisa as dificuldades na identificação de comunidades
ocultas em redes sociais heterogêneas, por exemplo, redes formadas por diversos tipos de
atores. A abordagem adotada representa uma grande mudança na análise de redes sociais, com
a adoção de múltiplas redes sociais construídas através de diversas relações dependentes dos
integrantes e orientada a uma determinada finalidade de investigação. A idéia básica do
algoritmo utilizado é encontrar uma combinação de relacionamentos que busca tornar a
medida do relacionamento entre os indivíduos dentro da comunidade o mais intenso possível
e ao mesmo tempo tornar o mais fraco possível o relacionamento entre as comunidades, com
o objetivo de agrupar estes indivíduos para identificar as comunidades. A valoração destas
relações pode ser tanto linear como não linear. Considerando que em aplicações no mundo
real é quase impossível um usuário conseguir informações suficientes, as técnicas não lineares
tendem a serem instáveis podendo produzir agrupamentos falsos com números elevados de
integrantes. Assim este trabalho utilizou apenas técnicas lineares de agrupamento.
O trabalho de Long, Zhang e Yu (2007) propõe um modelo que busca identificar
agrupamentos de estruturas para cada tipo de informação sobre os indivíduos e as interações
entre os diferentes tipos de indivíduos. Estas estruturas são formadas pela composição de três
tipos de informações: os atributos relacionados aos indivíduos, as relações homogêneas entre
indivíduos de tipos iguais e as relações heterogêneas entre indivíduos diferentes. Neste
modelo é proposto um algoritmo parametrizado para construir agrupamentos relacionais
rígidos e suaves em um grande número de famílias de distribuições exponenciais, como a
distribuição normal, distribuição de Bernoulli e distribuição de Poisson. Segundo o trabalho, o
algoritmo proposto pode ser aplicado a várias estruturas de informações relacionais
unificando algoritmos de agrupamento.
Berg-Wolf e Saia (2006) propuseram uma plataforma para a análise de comunidades em
redes sociais dinâmicas, tornando explícito o uso de mudanças temporais. As comunidades
tendem a se envolver gradualmente com o tempo em oposição ao comportamento de
construção e destruição espontânea. Sempre que uma informação sobre eventos sociais está
disponível é desejável usar esta informação temporal não apenas para identificar comunidades
com uma alta similaridade intracomunitária, mas também observar sua persistência e
desenvolvimento.
Nesta proposta pressupõe-se que cada indivíduo tem suas ações monitoradas em
intervalos regulares de tempo. Assim, dada uma população X = {x1, ..., x2}, define-se um
grupo como um subconjunto Xg ⊆ . Assume-se que a informação de entrada é o conjunto de
partições P1, P2, ..., Pt de X, sendo uma partição para cada intervalo de tempo. Cada partição
Pi é um conjunto disjunto de grupos. O índice da partição a qual g pertence é denominado por
P(g), assim se iPg ∈ , então P(g) = i. Dados dois grupos, g e h, um conjunto de medições de
similaridade entre g e h dado por sim(g,h) e um limite de transição dado por �, dois grupos
são similares se sim(g,h) � �, sendo esta definição independente de qualquer forma específica
de medição de similaridade. Além da similaridade o trabalho considera algumas propriedades
críticas como a conectividade dos grupos, a conectividade individual (que determinam e
afetam a estrutura da rede social), o conjunto de grupos críticos (que possuem determinada
informação ou característica que pode afetar toda a comunidade) e conjunto de indivíduos
críticos (que possuem a capacidade de afetar um grande número de indivíduos).
O trabalho de Tantipathnanandh, Berger-Wolf e Kemp (2007) propõem uma plataforma
e algoritmos baseados em programação dinâmica, busca exaustiva, máxima identificação e
grade heurística para identificar comunidades em redes sociais dinâmicas, ou seja, que
mudam com o passar do tempo. Neste trabalho os indivíduos são observados em intervalos
discretos de tempo, onde interações sociais ou as afiliações dos indivíduos são observadas na
forma de diversos subgrafos individuais completos. O método de identificação utiliza as
ferramentas de análise do trabalho anterior e considera que os métodos tradicionais de
identificação de comunidades são casos particulares onde é considerado apenas um intervalo
de tempo.
Enembreck et al. (2006) propõem um sistema baseado na extração de informações
textuais para a identificação de equipes de pesquisa. A busca é iniciada pelo currículo do
pesquisador disponível na plataforma Lattes, onde são obtidos os artigos e outros textos
escritos pelo indivíduo analisado. O sistema compara a descrição do projeto de pesquisa com
estas informações textuais e obtém um grau de similaridade. Os experimentos foram
realizados em 3 grupos de pesquisa com 22 professores, onde foram coletados os currículos
Lattes destes pesquisadores e comparados com 52 projetos de dissertação de mestrado escritos
pelos alunos da instituição pesquisada. Os resultados apresentados mostram a identificação de
aproximadamente 20% dos professores orientadores, porém foram identificados 75% dos
líderes de projeto, mostrando que existe grande similaridade contextual entre os diferentes
trabalhos analisados e os currículos dos líderes de projeto. Neste trabalho os autores discutem
a impossibilidade do uso desta técnica para identifica os orientadores dos projetos devido à
intersecção das diferentes áreas de pesquisa de um mesmo grupo de projeto. A técnica
também falha ao se pesquisar projetos inovadores, pois os pesquisadores ainda não possuem
uma importante produção científica relacionada com a nova área de pesquisa.
Um trabalho similar foi apresentado por Mori et al. (2006) para recuperar informações
relacionais calculando o grau de similaridade entre contextos coletivos encontrados nos
documentos disponíveis. O método proposto busca agrupar indivíduos em pares de acordo
com a similaridade do contexto dos documentos disponíveis na web e identifica através deste
agrupamento as palavras significativas para caracterizar os relacionamentos. Os experimentos
foram realizados em um conjunto de 143 atores de destaque, composto por políticos e
instituições geopolíticas (como prefeituras, cidades e países). O estudo mostra que os
resultados dependem do tamanho dos documentos analisados, existindo um tamanho ótimo
para tal análise que depende da estrutura da linguagem natural. A adoção de documentos
maiores acarreta a adição de ruído na análise, reduzindo o desempenho do sistema pelo
cálculo de similaridade entre contextos irrelevantes.
Matsuo et al. (2003) propuseram um sistema que busca informações na web para
construir a rede social dos participantes de uma conferência. O sistema utiliza o coeficiente de
Jaccard para analisar os conteúdos dos documentos de dois participantes e comparar com um
valor empírico de corte. Os participantes são rotulados com termos como co-autor, membro
do grupo de projeto, membro do laboratório de pesquisa, co-participante de conferência. O
estudo foi realizado em 470 indivíduos que participaram da conferência da Japanese Society
of Artificial Inteligence (JSAI2002), que foram manualmente rotulados. Os resultados
demonstram uma dificuldade no reconhecimento dos pesquisadores e conferencistas, sendo
apenas 12,5% dos pesquisadores e 42,1% dos conferencistas reconhecidos, porém o sistema
reconheceu 96,2% dos co-autores e 87,0% dos integrantes de laboratórios. Esta dificuldade foi
atribuída à existência de outras relações que não podem ser inferidas a partir dos documentos
pesquisados na web, como os pesquisadores de grupos que ainda não produziram artigos
científicos ou conferencistas que participaram de trabalhos há mais de dez anos.
Mori, Sugiyama e Matsuo (2005) desenvolveram um sistema para compartilhamento de
informações usando redes sociais. Para isto eles utilizam o conceito de centralidade calculada
através de medições como proximidade, grau de relacionamento e intermediação, obtidas a
partir de informações recuperadas da web, como e-mail, e pelo ajuste manual do usuário para
construir a representação da rede social através de grafos, identificar as pessoas do seu
relacionamento e efetuar indicações de amigos de amigos. O sistema foi testado em uma
página comunitária na web, destinada à comunidade acadêmica, onde os usuários podem
manusear sua rede social e definir o grau de acesso dos indivíduos de sua rede preservando a
privacidade e confidencialidade dos documentos disponibilizados. Desta forma o sistema
pode atuar como uma ferramenta para a disseminação e compartilhamento de informações de
acordo com políticas de privacidade definidas pelo usuário.
Um trabalho similar dedicado à troca de conhecimento em uma comunidade utilizando
um sistema multiagentes chamado de COMUNET foi apresentado por Giménez-Lugo (2004),
onde a rede social egocêntrica do usuário é construída pelos agentes de software através de
informações obtidas nas mensagens de e-mail. Esta rede social serve de referência para obter
uma aproximação da visão das relações entre os conhecimentos do usuário e seus contatos. A
rede social evidenciada pode ser manuseada pelo usuário para explicitar estruturas
organizacionais como grupos e papéis sociais dos indivíduos de sua rede de contatos segundo
a sua visão subjetiva. Os documentos disponibilizados pelo usuário são classificados
manualmente como secretos, medianamente privados e públicos de acordo com a política de
privacidade do usuário. O sistema foi testado com seis indivíduos de um grupo de pesquisa
distribuídos geograficamente entre três cidades e permitiu o uso da visão sócio-organizacional
subjetiva da rede de contatos dos usuários como um filtro social para compartilhar ou reservar
informações de acordo com o papel e posição social do contato.
O trabalho de McDonald (2003) avalia os sistemas de recomendação e colaboração que
utilizam a abordagem de redes sociais. Segundo este trabalho, os usuários possuem diversos
sentimentos sobre o uso de redes sociais como ferramenta para buscar a colaboração de outros
indivíduos. A análise de redes sociais deriva de uma perspectiva analítica e descritiva
enquanto a sua aplicação em grupos é orientada em uma direção ligeiramente prescritiva.
Assim, alguns aspectos devem ser considerados ao utilizar a análise de redes sociais como
ferramenta de auxílio no funcionamento e formação de grupos. Ao se incorporar redes sociais
a sistemas de recomendação tem-se um conflito na percepção dos usuários que esperam
encontrar os indivíduos com maior expertise, mas acreditam que o sistema fornece apenas os
indivíduos da rede social com quem eles podem facilmente interagir. Apesar destes sistemas
atualmente iniciarem a busca pela expertise, os usuários continuam acreditando que a busca
inicia pela rede social. Outro aspecto é o caso onde os usuários procuram interferir na análise
da rede social, por acreditarem que isto otimiza a identificação dos melhores indivíduos. O
pior caso ocorre quando o sistema fornece apenas a recomendação de um indivíduo para
assumir uma determinada posição, impedindo o usuário de escolher. Assim, os usuários
buscam respostas no sistema quando os indivíduos recomendados diferem da visão de suas
próprias redes sociais. Isto naturalmente lida com os métodos de parametrização das relações
sociais e técnicas de identificação, porém os usuários necessitam que o sistema argumente e
auxilie nestas escolhas, sem substituir a forma natural dos usuários em recomendar
indivíduos. Outro aspecto importante é o fato de que os usuários possuem uma maior
percepção de sua rede social egocêntrica, e não aceitam com facilidade a recomendação de
indivíduos que não pertençam a esta rede, mas que foram agregado pela cadeia de
recomendações. Deve-se também considerar o fato das redes sociais serem dinâmicas. A
coleta de informações para a análise da rede social normalmente é realizada em um espaço de
tempo definido e para ter sucesso os sistemas de recomendação devem lidar com o dinamismo
da rede social.
A construção da rede social não pode ser considerada uma tarefa simples. Os métodos
tradicionais de aquisição de informações e valoração das ligações sociais de uma rede
consomem um tempo enorme e possuem problemas de escalabilidade. E ainda não se pode
considerar que os métodos de construção das redes sociais de grandes grupos são melhores
que a construção de uma rede social, com maior precisão, do ponto de vista individual.
2.4 CONCLUSÃO
Neste capítulo buscou-se detalhar os conhecimentos necessários à consecução dos
objetivos deste trabalho de dissertação de mestrado, descritos no Capítulo 1.
Foram apresentados os conceitos de redes sociais relevantes para a compreensão do
problema de identificação da influência da rede social egocêntrica dos líderes de projeto na
formação das equipes de pesquisa e para identificar algumas ferramentas de análise de redes
sociais existentes. A ferramenta de álgebra relacional para a análise de redes sociais com
relações múltiplas será utilizada como referência na concepção do modelo proposto que
partirá do uso de redes sociais egocêntricas. Esta abordagem será detalhada no próximo
capítulo. Como bibliografia complementar os seguintes livros são sugeridos: Six Degrees –
The Science of a Connected Age de Watts (2003), para um melhor entendimento de redes
sociais; Social Network Analysis – Methods and Applications de Wasserman e Faust (1994);
Social Network Analysis – a handbook de Scott (2000), Exploring Social Network Analysis
with Pajek de Nooy, Mrvar e Batagelj (2005) para a compreensão das técnicas de análise de
redes sociais e Reputation in Artificial Societies – Social Beliefs for Social Order de Conte e
Paolucci (2002) para a discussão de temas como reputação, prestígio, dignidade,
honorabilidade, fama e demais conceitos que afetam a cooperação entre indivíduos.
Também foi incluída neste capítulo uma breve apresentação das pesquisas em redes
sociais relativas aos mecanismos de formação de equipes. Foi possível verificar que existem
diferentes tipos de abordagens para entender o fenômeno de formação de uma equipe, a
identificação de grupos ou comunidades, o uso da representação das redes sociais para o
compartilhamento de informações e os aspectos relacionados com a implementação destes
sistemas no mundo real. A proposta desta dissertação de mestrado está relacionada com o
trabalho de Cai et al. (2005) por utilizar uma combinação de múltiplas relações utilizando
técnicas lineares, com o trabalho de Berg-Wolf e Saia (2006) por considerar parâmetros para
valorar os relacionamentos segundo a dinâmica temporal das redes sociais, com o trabalho de
Enembreck et al. (2006) por utilizar a plataforma Lattes como fonte de pesquisa e com
Giménez-Lugo (2004) por propor o uso de um filtro social para a política de privacidade.
Outros trabalhos como de Matsuo et al. (2003), Mori, Sugiyama e Matsuo (2005), também
utilizaram a comunidade acadêmica e grupos de pesquisa para testar suas propostas.
Porém este trabalho de dissertação difere do trabalho de Cai et al. (2005), pois
enquanto este utiliza métodos de regressão linear para determinar os pesos da matriz que
melhor identifica a comunidade pesquisada, o modelo proposto utiliza um valor de corte
empírico para realizar a identificação a partir da composição das relações. Além disto o
modelo computacional proposto neste trabalho de dissertação prevê o uso da abordagem
egocêntrica limitada ao sociograma de Moreno, e a composição das relações múltiplas
considerando a dinâmica temporal das redes sociais através da utilização de parâmetros para
valorar as relações de acordo com o tipo e o período de ocorrência, possibilitando o uso tanto
de relações que podem ser mensuradas quanto relações de caráter binário. Porém são
desconsideradas as influências comportamentais que podem afetar a dinâmica social com o
passar do tempo, como modismos, influências geopolíticas, econômicas, etc. As
características deste modelo computacional serão abordadas em detalhe no próximo capítulo.
CAPÍTULO 3
MODELO COMPUTACIONAL PROPOSTO
Apresenta-se neste capítulo a proposta do modelo computacional, baseado nos
conceitos apresentados no Capítulo 2 e nas características das informações disponibilizadas
no estudo de caso. Busca-se enfatizar as restrições e premissas do sistema que influenciam sua
concepção e os aspectos que tornam a proposta original. A seção 3.2 faz uma breve descrição
dos recursos utilizados nos experimentos. O modelo computacional proposto possui duas
fases: a primeira fase é relativa à construção das redes egocêntricas dos pesquisadores, sendo
detalhada na seção 3.3. A segunda fase, apresentada na seção 3.4, é relativa à identificação
dos pesquisadores. Na seção 3.5 são apresentadas as justificativas das escolhas tomadas na
construção do modelo proposto.
3.1 OBJETO DA PROPOSTA DO MODELO COMPUTACIONAL
O modelo computacional proposto fundamenta-se na utilização dos aspectos sociais
(relacionados a uma determinada necessidade de análise) para a identificação de relações
sociais que possam ser evidenciadas nas informações disponíveis sobre os indivíduos da
comunidade pesquisada. Para facilitar o processo de identificação dos atores das redes sociais
analisadas, estas relações devem pertencer entre duas ou três diferentes dimensões sociais
relacionadas com o tipo de grupo que se deseja identificar (WATTS, DODDS, NEWMAN,
2002). As relações sociais escolhidas, com possibilidade de serem evidenciada e mensuradas
quanto à existência, ocorrência e temporalidade, produzem um valor qualitativo individual,
proporcional a combinação destas relações. Este valor qualitativo produzido a partir das
múltiplas relações escolhidas considerando o dinamismo da rede social com o tempo é
utilizado para a análise da rede social segundo a necessidade do usuário.
No estudo de caso, o tratamento das informações incompletas sobre os pesquisadores a
serem representados requer a proposta de um modelo computacional capaz de representar a
rede egocêntrica de cada pesquisador com o objetivo de identificar os possíveis indivíduos
para compor uma equipe de pesquisa.
São utilizados os currículos disponíveis na plataforma Lattes para a extração de
informações sobre os pesquisadores, sendo esta fase um dos objetivos específicos deste
trabalho. A obtenção e processamento de informações relacionais sem a intervenção do
usuário é um dos desafios na análise de redes sociais. A análise de grandes redes sociais
através do auxílio ou entrevista do usuário é limitada por aspectos relativos à fadiga gerada
pela construção manual de longas listas de indivíduos e as ligações existentes entre eles e o
usuário (CHUNG, HOSSSAIN, DAVIS, 2005).
O modelo computacional proposto funciona em duas etapas, conforme ilustrado pela
Figura 4. Na primeira etapa realiza-se a extração de informações sobre os pesquisadores e a
construção das redes sociais egocêntricas. Na segunda etapa são analisados os grupos de
pesquisa encontrados na comunidade pesquisada e é realizada a identificação dos
pesquisadores na equipe de pesquisa de acordo com a rede social egocêntrica do líder de
projeto e a cadeia de recomendações formada pelos demais pesquisadores destes grupos. A
seguir é detalhado o modelo computacional proposto.
Figura 4: Etapas do Modelo Computacional.
3.1.1 Modelo Computacional
O modelo computacional tem como entrada para a sua primeira etapa de
funcionamento o grupo de pesquisadores que serão analisados e as informações disponíveis
sobre os mesmos na plataforma Lattes e no diretório de grupos de pesquisa do CNPq. O
diretório de grupos de pesquisa contém para cada grupo a área de pesquisa, a lista de nomes
dos integrantes e o papel que cada um desempenha no grupo. A coleta destas informações
pode ser iniciada pelo currículo Lattes de qualquer pesquisador do grupo de pesquisa que se
queira analisar. A Figura 5 detalha as principais estruturas funcionais do modelo proposto,
entrada e saída da fase de construção das redes egocêntricas.
Figura 5: Estruturas Funcionais para Extração de Informações.
A partir dos currículos Lattes dos pesquisadores contidos nos grupos pesquisados
extraem-se informações para construir as matrizes relacionais com os valores da freqüência de
ocorrência ou a existência das relações analisadas, de acordo com o período de tempo em que
ocorreu a relação. Os elementos destas matrizes são utilizados para o cálculo do fator de
proximidade individual. Este fator é calculado a partir da composição das diferentes relações
evidenciadas no currículo Lattes obtida através do uso de coeficientes de correlação e médias
ponderadas, sendo este processo descrito em detalhes na seção 3.3.5. Este valor preliminar é
normalizado para cada indivíduo, sendo assim calculado um fator proporcional ao conceito de
proximidade relacional entre o ator central e os elementos de sua rede social. Com o cálculo
do fator de proximidade individual é possível representar a variação deste fator ao redor da
Entrada:Nome do Pesquisador
Busca porcurrículos Máquina de
Busca
Web / Plataforma Lattes
Identificaçãoda rede social
Valoraçãodas relaçõesSociais por
co-ocorrência
Saída:Relação daRede EgocêntricaCom os valoresdas relações
Entrada:Nome do Pesquisador
Busca porcurrículos Máquina de
Busca
Web / Plataforma Lattes
Identificaçãoda rede social
Valoraçãodas relaçõesSociais por
co-ocorrência
Saída:Relação daRede EgocêntricaCom os valoresdas relações
rede egocêntrica do elemento central em um gráfico em forma de radar, conforme
demonstrado na Figura 6.
Na segunda etapa de operação, são calculados os fatores de proximidade social dos
integrantes dos grupos de projeto, obtidos da plataforma Lattes, e é definido o valor de corte
empírico que será utilizado para a identificação dos pesquisadores na rede egocêntrica do líder
de projeto e dos demais pesquisadores do grupo de pesquisa.
A partir dos valores do fator de proximidade individual calcula-se o fator de
proximidade social, em relação à equipe de pesquisa. Este novo fator é obtido pela média
ponderada entre os fatores de proximidade individuais dos pesquisadores candidatos em
relação ao líder de pesquisa e aos demais pesquisadores que compõem o grupo de pesquisa.
Os pesos são definidos empiricamente de acordo com o papel que cada indivíduo desempenha
no grupo. Com a diferenciação entre os pesos dos pesquisadores e líder de projeto utilizados
nesta média ponderada é possível considerar a cadeia de recomendações dos demais
pesquisadores, permanecendo como aspecto principal para tomada de decisão o fator de
proximidade da rede social egocêntrica do líder de projeto. A contribuição dos demais
integrantes dos grupos de pesquisa, que atuam no papel de estudantes ou técnicos, foi
desprezada devido a pouca experiência profissional destes indivíduos no trabalho científico e
ao aspecto do aprendizado ser o principal fator de engajamento destes indivíduos. O fator de
proximidade social será detalhado na seção 3.3.6.
Com o valor do coeficiente de proximidade social classificamos os pesquisadores em
três categorias: identificado, evidenciado e não evidenciado.
Um integrante é considerado identificado quando o fator de proximidade social (em
relação à equipe) é maior que o valor de corte definido. No caso de falha no processo de
identificação, porém o integrante possui um fator de proximidade em relação a algum
pesquisador (ou seja, se o fator de proximidade com a equipe é diferente de zero), este
integrante é considerado apenas como evidenciado. Caso o fator de proximidade social seja
nulo, o indivíduo é considerado não evidenciado.
Os fatores de proximidade individual e social podem ser utilizados para outras
finalidades que necessitem informações sobre o grau de proximidade relacional entre os
indivíduos. Por exemplo, pode-se adotar como estratégia para restringir o uso das informações
deste modelo computacional de acordo com a política de privacidade dos grupos de pesquisa
que ao receber uma requisição de um usuário em relação a um pesquisador verifica-se qual o
fator de proximidade do usuário em relação ao indivíduo pesquisado e disponibiliza-se esta
informação, levando em consideração o papel que o usuário solicitante desempenha na visão
organizacional subjetiva do pesquisador consultado. A proposta de um filtro social foi
realizada no trabalho de Giménez-Lugo (2004), porém este trabalho de dissertação difere
deste pelo uso do fator de proximidade individual, por não possuir intervenção do usuário
para explicitar a rede social, por utilizar apenas a plataforma Lattes como fonte para construir
a rede social ao invés da utilização de documentos disponíveis na Internet e por não utilizar
uma explicitação formal dos papéis sociais e estrutura organizacional.
No caso do uso deste mesmo modelo computacional para o auxílio na construção de
uma nova equipe de pesquisa este processo ocorre de forma interativa e dinâmica, com um
novo cálculo a partir de cada alteração do conjunto de membros da equipe. Este novo cálculo
torna-se necessário para atualizar a cadeia de recomendações com as contribuições dos novos
membros. Um software com estas características pode ser utilizado por uma comunidade para
a identificação de pesquisadores com experiência, reputação e conhecimento apropriado a um
determinado projeto de pesquisa a partir do uso de informações da rede social do líder de
projeto.
3.2 MATERIAIS E INFRA-ESTRUTURA
Para validar o modelo computacional proposto foram necessários alguns meios
computacionais e uma coleta de dados com a finalidade de obter material para a realização de
experimentos para validação do modelo computacional.
3.2.1 Meios Computacionais
Os experimentos foram realizados manualmente com o auxílio de planilhas eletrônicas
para tabulação das informações extraídas dos currículos Lattes. Também foram utilizados
recursos para acesso à Internet de forma a acessar a Plataforma Lattes do CNPq.
A análise foi realizada através de um programa de planilha eletrônica, onde as
matrizes relacionais foram construídas para o cálculo do fator de proximidade individual. Da
mesma forma foram construídas matrizes relacionais com os integrantes dos grupos de
pesquisa do CPGEI da UTFPR, e foi calculado o fator de proximidade social. Com estes
fatores calculados foi construída uma tabela com os integrantes separados pelo papel que
possuem no grupo de pesquisa para o cálculo do valor de corte utilizado na identificação dos
pesquisadores. Foram utilizados gráficos em forma de radar para representar as redes
egocêntricas, desprezando as demais ligações entre os indivíduos da rede egocêntrica.
3.2.2 Coleta de Informações
Para a realização do estudo de caso com o objetivo de validar o modelo computacional
proposto, foram coletadas informações sobre os pesquisadores do CPGEI da UTFPR
disponíveis na plataforma Lattes de forma manual, para identificar aspectos e relações sociais
entre os integrantes dos grupos de pesquisa e os líderes de projeto.
Não foram analisadas as redes sociais dos alunos de mestrado, doutorado e pós-
doutorado ou bolsistas de iniciação científica, pois se considera que devido a pouca
experiência deste conjunto de indivíduos no meio científico a sua contribuição na cadeia de
recomendações para um novo integrante à equipe de projeto é pequena e pode ser desprezada.
Para a coleta de informação é considerado o período de cinco anos por ser o valor
médio para conclusão de um trabalho de doutorado. A contribuição de relações anteriores a
este período foi considerada desprezível em relação ao aspecto de familiaridade, utilizado
neste trabalho como um aspecto contribuinte para o fator de proximidade entre os
pesquisadores.
3.2.3 Processo de Extração de Informações
São descritas abaixo as fases de extração de informação para a construção da rede
egocêntrica de cada pesquisador representado no modelo proposto, conforme mostrados na
Figura 6:
• As informações disponibilizadas pelos pesquisadores na Plataforma Lattes são
armazenadas em forma de arquivos tipo “.txt”, e transferidas para a planilha
eletrônica onde são indexadas e processadas de acordo com o tipo de
informação e período em que ocorreu;
• Na primeira etapa, as experiências e relações do pesquisador são identificadas
e representadas através de uma matriz relacional onde estão explicitadas as
informações de ocorrência de relações binárias, ou da freqüência de ocorrência
ou intensidade das demais relações;
• A matriz relacional é tratada para computar uma composição entre as múltiplas
relações considerando o tipo de relacionamento e o período de ocorrência,
obtendo o fator de proximidade individual entre o pesquisador e os
participantes de sua rede social. Esta matriz é utilizada para a construção dos
gráficos em forma de radar que representam a rede egocêntrica, conforme a
Figura 9.
• Na segunda etapa, os pesquisadores dos grupos de pesquisa analisados são
listados em uma tabela de acordo com o papel que desempenha no grupo. A
seguir é calculado o fator de proximidade social.
• Ao terminar a construção de todos os grupos de pesquisa, a informação de
todos os integrantes dos grupos são armazenadas em outra tabela separados
pelo papel, para o cálculo do valor de corte de identificação dos pesquisadores.
• Ao final é construída uma tabela que divulga a porcentagem de identificação
em cada grupo de pesquisa.
Figura 6: Etapas de Extração de Informação do Currículo Lattes.
3.2.3.1 Validade da Plataforma Lattes
Desde a criação da Internet faz parte do senso comum a possibilidade de utilizar as
informações disponibilizadas nesta mídia e em meios similares. No entanto, quando realmente
Cesar Augusto TaclaDOUTORTACLA, C. A.
relação:
2003 2004 2005 2006 2007 2003 2004 2005 2006 2007 2003 2004 2005 2006 2007 2003 2004 2005 2006 2007AVILA, B. C. 1 1Banaszewski, Roni Fábio 1Baptista, Rafael de Pauli 1BARTHÈS, Jean-paul 6 3Bettez, Fiori Angelo Rosot 1BORTOLI, E. M. 1 1 1 1Brancaleone, Fernando 1BRITO, R. C. 1 1CALIARI, F. M. 1 1 1 1 1Camargo, Fernando Guedes 1Correa, Edgar Fernando 1ENEMBRECK, Fabrício 1 1 3 1FREDDO, A. 1 1 1 1Gavron, Terezinha 1Gazzoni, Joacir 1GIMÉNEZ-LUGO, G. A. 2 2HUBNER, J. F. 1Lazzari, Rômulo de 1LUGO, G. G. 1PARAISO, E. C. 1Paulo, Marco Antônio Sales de 1RAMOS, M. P. 1REINHARDT, J. C. V. 1 1 1Santos, Nei Roberto dos 1SCALABRIN, E. 1 1WOZNIAK-GIMENEZ, A. B. 1Yamamoto, Anderson Seiti 1
ORIENTADOR INICIAÇÃO CIENTÍFICAORIENTADOR-DOUTORANDOORIENTADOR-MESTRANDOCO-AUTORIA
Rede Egocêntricaindicação para o projeto
Cesar Augusto Tacla relação: 2003 2004 2005 2006 2007 co-autoria mestrado doutorado iniciação soma Méd Pond. sem indicação DOUTOR peso: 1 2 3 4 5 2 3 4 1 2,947TACLA, C. A.
co-autoria mestrado doutorado iniciação Média Pond Média Arit DistFREDDO, A. 0,600 0,000 0,600 0,000 0,360 0,122 0,878CALIARI, F. M. 0,533 0,800 0,000 0,000 0,347 0,118 0,882ENEMBRECK, Fabrício 1,400 0,000 0,000 0,000 0,280 0,095 0,905REINHARDT, J. C. V. 0,000 0,800 0,000 0,000 0,240 0,081 0,919GIMÉNEZ-LUGO, G. A. 1,200 0,000 0,000 0,000 0,240 0,081 0,919BORTOLI, E. M. 0,267 0,600 0,000 0,000 0,233 0,079 0,921BRITO, R. C. 0,333 0,333 0,000 0,000 0,167 0,057 0,943BARTHÈS, Jean-paul 0,800 0,000 0,000 0,000 0,160 0,054 0,946AVILA, B. C. 0,600 0,000 0,000 0,000 0,120 0,041 0,959SCALABRIN, E. 0,600 0,000 0,000 0,000 0,120 0,041 0,959Banaszewski, Roni Fábio 0,000 0,333 0,000 0,000 0,100 0,034 0,966HUBNER, J. F. 0,267 0,000 0,000 0,000 0,053 0,018 0,982LUGO, G. G. 0,267 0,000 0,000 0,000 0,053 0,018 0,982RAMOS, M. P. 0,267 0,000 0,000 0,000 0,053 0,018 0,982WOZNIAK-GIMENEZ, A. B. 0,267 0,000 0,000 0,000 0,053 0,018 0,982Bettez, Fiori Angelo Rosot 0,000 0,000 0,000 0,333 0,033 0,011 0,989Brancaleone, Fernando 0,000 0,000 0,000 0,333 0,033 0,011 0,989Camargo, Fernando Guedes 0,000 0,000 0,000 0,333 0,033 0,011 0,989Correa, Edgar Fernando 0,000 0,000 0,000 0,333 0,033 0,011 0,989Gavron, Terezinha 0,000 0,000 0,000 0,333 0,033 0,011 0,989Gazzoni, Joacir 0,000 0,000 0,000 0,333 0,033 0,011 0,989Yamamoto, Anderson Seiti 0,000 0,000 0,000 0,333 0,033 0,011 0,989Baptista, Rafael de Pauli 0,000 0,000 0,000 0,267 0,027 0,009 0,991Lazzari, Rômulo de 0,000 0,000 0,000 0,267 0,027 0,009 0,991PARAISO, E. C. 0,133 0,000 0,000 0,000 0,027 0,009 0,991Paulo, Marco Antônio Sales de 0,000 0,000 0,000 0,267 0,027 0,009 0,991Santos, Nei Roberto dos 0,000 0,000 0,000 0,267 0,027 0,009 0,991
0 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,000
0,000 0,020 0,040 0,060 0,080 0,100 0,120 0,140
FREDD O, A.
C ALI ARI , F. M.
ENEMBREC K, Fabríc io
REI NHARD T, J. C. V.
GIMÉNEZ-LUGO, G. A.
BOR TOLI, E. M.
BRI TO, R. C .
BAR THÈS, Jean-paul
AVI LA, B. C.
SCA LAB RIN, E.
Banaszewski, Roni Fábio
HUBNE R, J . F.
LUGO, G. G.
RAMOS, M. P.
WOZNIAK -GIMENEZ, A . B.
Bettez, Fiori Angelo Rosot
Branc aleone, Fernando
Camargo, Fernando Guedes
Correa, Edgar Fernando
Gavron, Terezinha
Gazzoni, Joac ir
Yamamoto, Anderson Seiti
B aptista, R af ael de P auli
Lazz ari, Rômulo de
PARAI SO, E. C .
Paulo, Marc o Antônio Sales de
Santos, Nei Robert o dos
Cesar Augusto Tacla
0,820
0,840
0,860
0,880
0,900
0,920
0,940
0,960
0,980
1,0001
23
4
5
6
7
8
9
10
11
1213
1415
16
17
18
19
20
21
22
23
24
2526
Cesar Augusto TaclaDOUTORTACLA, C. A.
relação:
2003 2004 2005 2006 2007 2003 2004 2005 2006 2007 2003 2004 2005 2006 2007 2003 2004 2005 2006 2007AVILA, B. C. 1 1Banaszewski, Roni Fábio 1Baptista, Rafael de Pauli 1BARTHÈS, Jean-paul 6 3Bettez, Fiori Angelo Rosot 1BORTOLI, E. M. 1 1 1 1Brancaleone, Fernando 1BRITO, R. C. 1 1CALIARI, F. M. 1 1 1 1 1Camargo, Fernando Guedes 1Correa, Edgar Fernando 1ENEMBRECK, Fabrício 1 1 3 1FREDDO, A. 1 1 1 1Gavron, Terezinha 1Gazzoni, Joacir 1GIMÉNEZ-LUGO, G. A. 2 2HUBNER, J. F. 1Lazzari, Rômulo de 1LUGO, G. G. 1PARAISO, E. C. 1Paulo, Marco Antônio Sales de 1RAMOS, M. P. 1REINHARDT, J. C. V. 1 1 1Santos, Nei Roberto dos 1SCALABRIN, E. 1 1WOZNIAK-GIMENEZ, A. B. 1Yamamoto, Anderson Seiti 1
ORIENTADOR INICIAÇÃO CIENTÍFICAORIENTADOR-DOUTORANDOORIENTADOR-MESTRANDOCO-AUTORIA
Rede Egocêntricaindicação para o projeto
Cesar Augusto Tacla relação: 2003 2004 2005 2006 2007 co-autoria mestrado doutorado iniciação soma Méd Pond. sem indicação DOUTOR peso: 1 2 3 4 5 2 3 4 1 2,947TACLA, C. A.
co-autoria mestrado doutorado iniciação Média Pond Média Arit DistFREDDO, A. 0,600 0,000 0,600 0,000 0,360 0,122 0,878CALIARI, F. M. 0,533 0,800 0,000 0,000 0,347 0,118 0,882ENEMBRECK, Fabrício 1,400 0,000 0,000 0,000 0,280 0,095 0,905REINHARDT, J. C. V. 0,000 0,800 0,000 0,000 0,240 0,081 0,919GIMÉNEZ-LUGO, G. A. 1,200 0,000 0,000 0,000 0,240 0,081 0,919BORTOLI, E. M. 0,267 0,600 0,000 0,000 0,233 0,079 0,921BRITO, R. C. 0,333 0,333 0,000 0,000 0,167 0,057 0,943BARTHÈS, Jean-paul 0,800 0,000 0,000 0,000 0,160 0,054 0,946AVILA, B. C. 0,600 0,000 0,000 0,000 0,120 0,041 0,959SCALABRIN, E. 0,600 0,000 0,000 0,000 0,120 0,041 0,959Banaszewski, Roni Fábio 0,000 0,333 0,000 0,000 0,100 0,034 0,966HUBNER, J. F. 0,267 0,000 0,000 0,000 0,053 0,018 0,982LUGO, G. G. 0,267 0,000 0,000 0,000 0,053 0,018 0,982RAMOS, M. P. 0,267 0,000 0,000 0,000 0,053 0,018 0,982WOZNIAK-GIMENEZ, A. B. 0,267 0,000 0,000 0,000 0,053 0,018 0,982Bettez, Fiori Angelo Rosot 0,000 0,000 0,000 0,333 0,033 0,011 0,989Brancaleone, Fernando 0,000 0,000 0,000 0,333 0,033 0,011 0,989Camargo, Fernando Guedes 0,000 0,000 0,000 0,333 0,033 0,011 0,989Correa, Edgar Fernando 0,000 0,000 0,000 0,333 0,033 0,011 0,989Gavron, Terezinha 0,000 0,000 0,000 0,333 0,033 0,011 0,989Gazzoni, Joacir 0,000 0,000 0,000 0,333 0,033 0,011 0,989Yamamoto, Anderson Seiti 0,000 0,000 0,000 0,333 0,033 0,011 0,989Baptista, Rafael de Pauli 0,000 0,000 0,000 0,267 0,027 0,009 0,991Lazzari, Rômulo de 0,000 0,000 0,000 0,267 0,027 0,009 0,991PARAISO, E. C. 0,133 0,000 0,000 0,000 0,027 0,009 0,991Paulo, Marco Antônio Sales de 0,000 0,000 0,000 0,267 0,027 0,009 0,991Santos, Nei Roberto dos 0,000 0,000 0,000 0,267 0,027 0,009 0,991
0 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,000
0,000 0,020 0,040 0,060 0,080 0,100 0,120 0,140
FREDD O, A.
C ALI ARI , F. M.
ENEMBREC K, Fabríc io
REI NHARD T, J. C. V.
GIMÉNEZ-LUGO, G. A.
BOR TOLI, E. M.
BRI TO, R. C .
BAR THÈS, Jean-paul
AVI LA, B. C.
SCA LAB RIN, E.
Banaszewski, Roni Fábio
HUBNE R, J . F.
LUGO, G. G.
RAMOS, M. P.
WOZNIAK -GIMENEZ, A . B.
Bettez, Fiori Angelo Rosot
Branc aleone, Fernando
Camargo, Fernando Guedes
Correa, Edgar Fernando
Gavron, Terezinha
Gazzoni, Joac ir
Yamamoto, Anderson Seiti
B aptista, R af ael de P auli
Lazz ari, Rômulo de
PARAI SO, E. C .
Paulo, Marc o Antônio Sales de
Santos, Nei Robert o dos
Cesar Augusto Tacla
0,820
0,840
0,860
0,880
0,900
0,920
0,940
0,960
0,980
1,0001
23
4
5
6
7
8
9
10
11
1213
1415
16
17
18
19
20
21
22
23
24
2526
parte-se a procura de informações neste meio, percebe-se que se obtém apenas de listas de
informações obtidas a partir de ferramentas de busca não muito eficientes (GIMÉNEZ-
LUGO, 2004).
A Plataforma Lattes é uma importante fonte de informação na forma semi-estruturada
sobre pessoas em diversas áreas de conhecimento disponível em um único sistema de
informação utilizado pelo Conselho Nacional de Desenvolvimento Científico e Tecnológico
(CNPq). (PLATAFORMA LATTES, 1999). Pode-se considerar a Plataforma Lattes como um
meio representativo da comunidade científica brasileira, uma vez que o CNPq requisita o
registro do currículo de todos os pesquisadores, estudantes (graduandos, mestrandos e
doutorandos) e pesquisadores convidados que utilizem bolsas de incentivo a pesquisa ou
outros fundos subsidiados pelo CNPq, sendo este registro obrigatório para todos os
pesquisadores e estudantes que participam de grupos de pesquisa no Brasil (ENEMBRECK et
al., 2006).
Devido à disponibilidade e confiabilidade das informações sobre os pesquisadores e
sobre os grupos de pesquisa, foi escolhida a Plataforma Lattes como meio para obter as
informações necessárias para o estudo de caso que analisará a rede social egocêntrica dos
integrantes dos grupos de pesquisa contendo pelo menos um pesquisador do CPGEI da
UTFPR.
3.3 CONSTRUÇÃO DAS REDES EGOCÊNTRICAS
Para se construir as redes egocêntricas foi necessário definir quais relações sociais
podem ser evidenciadas e como calcular a intensidade destas ligações sociais entre os
indivíduos. A escolha destas relações depende dos aspectos sociais relacionados com a
necessidade de aplicação do modelo computacional proposto e da disponibilidade de
documentos onde estas relações possam ser evidenciadas. No caso de estudo deste trabalho de
dissertação, admite-se que para os cientistas, pesquisadores engajados em um projeto de
pesquisa as ligações sociais podem ser mensuradas pelo nível de esforço para o
compartilhamento intelectual (CUMMINGS, KIESLER, 2007). Com isto infere-se que
pesquisadores com ligações fortes trabalham e publicam juntos, enquanto ligações fracas
ocorrem em pesquisadores que trabalham em uma mesma área, porém não necessariamente
trabalham ou publicam juntos.
Para o estudo de caso foram escolhidas as relações sociais que possuem aspectos
sociais que aumentam a probabilidade de dois pesquisadores trabalharem juntos como a
familiaridade, a proximidade geográfica e homofilia. As relações escolhidas devido a estes
aspectos e a facilidade de evidenciar nos documentos da plataforma Lattes foram as de co-
autoria em trabalhos científicos e as relações de orientador-orientado. Na seção a seguir estas
relações sociais são detalhadas.
3.3.1 Relação Co-Autoria
Uma das relações escolhidas neste trabalho é a de co-autoria em trabalhos científicos.
Define-se como co-autoria qualquer forma de ligação entre dois pesquisadores para a
elaboração e divulgação de trabalhos científicos como a publicação de artigos científicos,
periódicos, livros, co-participação em eventos científicos ou em outras atividades culturais.
Esta relação é valorada de acordo com a freqüência de ocorrência e o período de tempo em
que ocorreu, sendo estas medições proporcionais ao resultado do trabalho científico realizado
em conjunto, estando assim ligada ao aspecto social de familiaridade. Estas medições são
utilizadas para identificar padrões em uma rede social entre os autores e co-autores,
proporcionando entendimento de como um autor trabalha e lida com seus colegas. Estes
comportamentos são considerados como um fator que influencia o processo de formação de
uma equipe de pesquisa.
No trabalho de Said et al. (2008), a relação de co-autoria foi classificada em quatro
tipos básicos: solitária, empreendedora, mentor e laboratorial. Pode-se ainda estender esta
classificação acrescentando a co-autoria de prestígio.
O autor solitário é o que não possui nenhum tipo de co-autor. A autoria solitária é
pouco freqüente, e os poucos casos encontrados foram desconsiderados por não estarem
relacionados a nenhum aspecto social contribuinte à formação de equipes. A relação de co-
autoria empreendedora ocorre quando o autor principal procura indivíduos de grupos que
representam especialidades necessárias a um artigo em particular, podendo este tipo de
relação de co-autoria não mais ocorrer no futuro. Este tipo de relação de co-autoria está
relacionado ao aspecto social de homofilia, já que os pesquisadores são orientados a objetivos
comuns. Na relação de co-autoria de mentor o autor principal tende a publicar com seus
colegas de menor experiência, alunos e outros novos associados, estando este tipo de co-
autoria relacionada com os aspectos sociais de familiaridade e proximidade. Após adquirirem
experiência em publicações estes co-autores tendem a publicar com outros colegas, tornando
este tipo de relação de co-autoria mais fraca com o tempo. Na relação de co-autoria
laboratorial o autor principal publica com os demais integrantes do laboratório onde realiza as
pesquisas, estando este tipo de co-autoria relacionada com o aspecto social de proximidade.
Neste tipo de co-autoria é comum encontrar a maioria ou todos os membros do laboratório
presentes como co-autores dos artigos publicados. Este tipo de relação de co-autoria foi
encontrado em nosso estudo de caso no grupo de pesquisa de tecnologia em saúde. Já a co-
autoria de prestígio ocorre entre os co-autores e um autor cujo prestígio, reputação,
popularidade e reconhecimento na comunidade científica auxilia na aceitação do trabalho.
Este tipo de co-autoria pode ser evidenciado entre os líderes de projeto, coordenadores de
curso, reitores e outros pesquisadores com reconhecimento na comunidade científica ou com
importante posição social e outros autores que efetivamente trabalharam no projeto de
pesquisa.
A identificação de grupos através da relação de co-autoria ser analisada através da
técnica de diagrama em blocos, ou por grafos. Porém, este trabalho de dissertação se
diferencia ao utilizar uma abordagem distinta concentrada na utilização de relações múltiplas
considerando a temporalidade para o cálculo de um fator qualitativo de proximidade
(individual e social) para a valoração das redes egocêntricas dos pesquisadores e a sua
identificação nos grupos de pesquisa.
3.3.2 Relação Orientador-Orientado
A relação de orientador–orientado é considerada neste trabalho como uma das mais
coesas relações no meio acadêmico por possuir a capacidade de promover novas relações,
como a relação de co-autoria, e possuir duração de um a cinco anos. Este tipo de relação está
relacionado aos aspectos sociais de familiaridade, homofilia e proximidade. É classificada
como uma relação heterogênea, pois existe uma diferenciação entre os papéis sociais de
orientador e orientado, uma vez que os orientadores possuem o poder de avaliar o
desempenho dos seus orientados e qualquer pedido de auxílio na pesquisa ou em outras
atividades acadêmicas é considerada obrigatória para os orientados devido a esta
diferenciação de poder (BIAGGIO, GREENE, 1995).
Podem-se distinguir quatro tipos de orientações: a de iniciação científica, mestrado,
doutorado e pós-doutorado. A relação de orientação de iniciação científica é a mais fraca
dentre as relações de orientação, ocorrendo com os alunos de graduação que buscam conhecer
o meio científico e colaboram com pequenas pesquisas e tarefas rotineiras da equipe de
pesquisa. Esta relação na maioria dos casos dura apenas um ano e possui pouca ou nenhuma
produção científica. A orientação de mestrado já possui maior intensidade, podendo durar de
dois a três anos, sendo o mestrando responsável por construir um trabalho de pesquisa em
uma determinada área do conhecimento. A relação de orientação de doutorado é a mais
intensa, podendo durar até cinco anos, e proporciona a produção de um trabalho inédito de
pesquisa, com diversos artigos relacionados. A relação de pós-doutorado dura em média um
ano e busca o aperfeiçoamento em determinada área inovadora do conhecimento, relacionada
à área de pesquisa do pós-doutorando. Pelo seu nível de especialização, classifica-se esta
relação de orientação em conjunto com a relação de doutorado.
No estudo de caso as relações de orientador-orientado são caracterizadas como
variáveis binárias, uma vez que se verifica apenas a existência desta relação no decorrer dos
anos. Utilizam-se coeficientes de correlação para diferenciar as relações de orientador-
orientado de acordo com o tipo e época de ocorrência, obtendo desta forma um valor
proporcional à intensidade das relações. Estes coeficientes de correlação são empíricos e
escolhidos de acordo com as características de intensidade discutidos nesta seção. Evita-se a
inconsistência causada pelo uso de coeficientes de correlação através da utilização desta
informação apenas para a construção da rede social egocêntrica. Seria inviável utilizar este
tipo de medição para comparar duas díades distintas de orientador-orientado, uma vez que o
conceito de intensidade de relação é intangível e dependente da visão social subjetiva de cada
indivíduo.
3.3.3 Representação da Rede Social Egocêntrica
O modelo computacional proposto neste trabalho utiliza as técnicas de álgebra
relacional para a análise de redes sociais egocêntricas dinâmicas com o tempo e com
múltiplas relações. A construção da rede social egocêntrica de um pesquisador é realizada
através do conjunto dos pesquisadores pertencentes ao mesmo grupo de projeto e as relações
entre eles e o pesquisador analisado.
Conforme mostra a Figura 2, o modelo computacional proposto possui as seguintes
estruturas para a extração de informações para a construção da rede social egocêntrica dos
pesquisadores:
• uma máquina de busca na Plataforma Lattes para obter as informações
relacionais sobre o pesquisador a ser representado, os grupos de projeto e os
membros destes grupos,
• um mecanismo de extração de informação para identificar informações
relacionais sobre a rede social dos pesquisadores,
• um método para armazenar o valor das ligações sociais evidenciadas e calcular
a composição destas relações para construir a matriz relacional da rede
egocêntrica do pesquisador representado.
3.4 PROCESSO DE IDENTIFICAÇÃO DOS PESQUISADORES
No processo de identificação dos pesquisadores que serão indicados para a formação da
equipe de pesquisa, o modelo proposto leva em consideração na tomada de decisão também a
indicação dos demais agentes consultados. A Figura 7 descreve este processo de cadeia de
recomendações considerado no processo de identificação, onde os indivíduos da rede
egocêntrica do pesquisador líder indicam outros pesquisadores de suas redes egocêntricas para
a formação da equipe de pesquisa. Percebe-se que não existe um consenso, uma vez que cada
pesquisador expressa o seu ponto de vista sobre os demais pesquisadores indicados, porém o
valor do fator de proximidade social é obtido pela média ponderada de todas as indicações,
sendo proporcional ao número de indicações positivas e ao fator de proximidade individual
relativo a cada indivíduo que realizou a indicação. Apesar das redes egocêntricas serem
construídas a partir da visão central de cada indivíduo, isto não significa que ela seja formada
de apenas pesquisadores que não participam da rede egocêntrica do pesquisador líder. Na
verdade foi possível evidenciar no estudo de caso que a maioria dos pesquisadores indicados
faz parte da rede egocêntrica do líder de projeto.
Figura 7: Esquema do Processo de Identificação de Pesquisadores.
3.4.1 Método de Cálculo do Fator de Proximidade Individual
O fator de proximidade individual está relacionado com o ator analisado e cada
indivíduo de sua rede egocêntrica, e é valorado pela média ponderada entre as relações
medidas, normalizada pelo número de integrantes da rede egocêntrica. Cada peso é
proporcional à contribuição de cada relação para o fator de proximidade entre os indivíduos,
considerando o período em que ocorreu a relação e os fatores sociais propostos de
familiaridade, proximidade geográfica e homofilia.
Ao ser calculada a média ponderada destas relações de orientador-orientado e co-
autoria no decorrer do tempo, utiliza-se este valor para construir uma composição entre as
múltiplas relações de co-autoria (métrica) e orientador-orientado (binárias). A normalização
destes valores ao final destas médias produz um valor proporcional à relação entre os dois
atores analisados, porém somente pode ser utilizado como referência para o ponto de vista do
ator pesquisado em relação aos atores com que se relaciona, proporcionando uma noção
qualitativa da relação. Este mesmo método não poderia ser utilizado para uma análise
sociocêntrica, já que os valores das relações são afetados pela densidade da rede egocêntrica
Ator 1: Líder de Pesquisa
Ator 2: Pesquisador
Ator 3:Pesquisador
Ator 4:Pesquisador
Ator 2a:Estudante
Ator 2b:Pesquisador
Ator 1: Líder de PesquisaAtor 1: Líder de Pesquisa
Ator 2: PesquisadorAtor 2: Pesquisador
Ator 3:PesquisadorAtor 3:Pesquisador
Ator 4:PesquisadorAtor 4:Pesquisador
Ator 2a:EstudanteAtor 2a:Estudante
Ator 2b:PesquisadorAtor 2b:Pesquisador
de cada ator. Na Figura 8 está esquematizado o processo de extração das informações no
currículo Lattes para posterior cálculo do valor de cada tipo de relação, considerando a
freqüência de ocorrência e o ano em que ocorreu. Após isto é calculado o valor do nível de
proximidade utilizado para construir a rede egocêntrica do pesquisador analisado.
Figura 8: Esquema do Cálculo do Fator de Proximidade Individual
Uma típica rede social no mundo real contém relações múltiplas. Cada relação pode ser
modelada por um grafo diferente que irá refletir cada relacionamento por um diferente ponto
de vista. Para o problema de identificação de pesquisadores, estas diferentes relações
produzem diferentes resultados de identificação dos pesquisadores dos grupos de pesquisa.
Logo, a identificação dos atores de uma rede social é dependente das informações utilizadas
(CAI et al., 2005). Porém seria impossível obter na plataforma Lattes todas as informações
sobre as relações das redes sociais do mundo real. Logo, na extração de informação sobre o
pesquisador através da Plataforma Lattes, buscam-se informações relacionadas com os
aspectos sociais que levam o pesquisador a se afiliar a uma determinada equipe de pesquisa.
Entre estes aspectos foram escolhidos os aspectos de familiaridade, proximidade geográfica e
homofilia.
A familiaridade é inferida através das relações de co-autoria, pois se pode afirmar que
quando existem diversos trabalhos em co-autoria os autores trabalham juntos e compartilham
idéias, recursos e experiências. A relação de co-autoria é evidenciada pela publicação de
artigos científicos, periódicos, jornais e revistas, livros ou capítulos de livros, participação em
eventos, produção técnica de software e produtos, trabalhos técnicos e culturais. Estas
CurrículoLattes
Lista deCo-autores
por ano
Lista deorientadosMestradopor ano
Lista deorientadosDoutorado
por ano
Lista deorientados
Iniciação Científicapor ano
Cálculo da média ponderadaPor ano de ocorrência
Cálculo da média ponderadaTipo de Relação
Cálculo da média ponderadaPor ano de ocorrência
Cálculo da média ponderadaPor ano de ocorrência
Cálculo da média ponderadaPor ano de ocorrência
Lista daRede Egocêntrica
com a relação valoração
CurrículoLattes
Lista deCo-autores
por ano
Lista deorientadosMestradopor ano
Lista deorientadosDoutorado
por ano
Lista deorientados
Iniciação Científicapor ano
Cálculo da média ponderadaPor ano de ocorrência
Cálculo da média ponderadaTipo de Relação
Cálculo da média ponderadaPor ano de ocorrência
Cálculo da média ponderadaPor ano de ocorrência
Cálculo da média ponderadaPor ano de ocorrência
Lista daRede Egocêntrica
com a relação valoração
relações são valoradas pela freqüência de ocorrência e armazenadas de acordo com o período
de ocorrência.
A proximidade geográfica é inferida pela informação da cidade onde o pesquisador
reside e pela instituição onde atua, considerando a época em que esta relação ocorreu. Apesar
da proximidade geográfica estar relacionada com a relação de orientador-orientado, a medição
desta informação em outras relações de atributo dos indivíduos como “atuação na instituição”
ou “residência” é binária, e pode ser utilizada como filtro durante a etapa final do processo de
escolha dos indivíduos.
A homofilia é inferida pela área de pesquisa, e pelas relações de orientador e orientado
em iniciação científica, mestrado, doutorado e pós-doutorado. Estas relações são binárias,
sendo armazenada a sua ocorrência de acordo com o ano. Porém, enquanto as medições das
relações de orientador-orientado também são utilizadas para determinar o fator de
proximidade individual entre o pesquisador e os integrantes de sua rede egocêntrica, sendo
que a área de atuação é utilizada apenas como filtro ao final do processo de escolha do
pesquisador pelo líder de projeto.
Em geral, existem três tipos de informações relacionais que podem ser extraídas dos
currículos Lattes: atributos dos atores, relacionamentos homogêneos que ocorrem entre
atores de mesmo tipo, relacionamentos heterogêneos, entre atores de tipos diferentes. No
caso da publicação de artigos científicos, a instituição a qual o pesquisador pertence é uma
informação de atributo do ator, a relação de co-autoria entre os autores é uma informação
relacional homogênea, já a relação entre os artigos e seus autores é uma informação relacional
heterogênea. Da mesma forma a relação entre orientador-orientado é heterogênea. Esta
diferenciação entre os tipos de informações relacionais apresenta um desafio para as técnicas
tradicionais de identificação de grupos. Uma solução intuitiva seria considerar todas as
informações relacionais como pertencentes a um único tipo de informação e realizar a
identificação dos membros da equipe de forma isolada. Porém isto ocasiona uma perda de
informação sobre os relacionamentos e a sua estrutura, dificulta a identificação de propagação
de influências, ou atores ocultos que podem ter influência direta ou indireta (através do
encadeamento de relações), ou os usuários podem não estar interessados nas estruturas ocultas
de cada ator individualmente, mas nos padrões de interações envolvendo diferentes tipos de
atores (LONG, ZHANG, YU, 2007).
Após serem coletadas informações sobre cada relação escolhida é construída uma
matriz relacional com os valores de cada relação em função do tipo, da intensidade e do ano
de ocorrência. A Tabela 1 mostra um exemplo desta tabela onde na primeira coluna estão os
pesquisadores que pertencem à rede social egocêntrica do pesquisador analisado, na segunda
coluna encontra-se a relação de co-autoria nos cinco anos, nas demais colunas se repetem as
relações de orientador-orientado, para o mesmo período. Por questões de privacidade o nome
dos pesquisadores foi substituído por um código numérico.
Tabela 1: Matriz Relacional de um Pesquisador Ator:
357789089DOUTOR
relação:
Pesquisador 2003 2004 2005 2006 2007 2003 2004 2005 2006 2007 2003 2004 2005 2006 2007 2003 2004 2005 2006 20071478390 1 13789209 16100028 18410847 6 3
10721666 113032485 1 1 1 115343304 117654123 1 119964942 1 1 1 1 122275761 124586580 126897399 1 1 3 129208218 1 1 1 131519037 133829856 136140675 2 238451494 140762313 143073132 145383951 147694770 150005589 152316408 1 1 154627227 156938046 1 159248865 161559684 1
ORIENT-INICIAÇÃO CIENTÍFICAORIENTADOR-DOUTORANDOORIENTADOR-MESTRANDOCO-AUTORIA
Para cada indivíduo (m), as relações de co-autoria são mensuradas através da
freqüência de ocorrência, e é realizada uma média ponderada atribuindo empiricamente um
peso a cada ano de ocorrência destas relações. Assim a relação de co-autoria pode ser
expressa por:
( )�
� �
=
= =⋅
=K
j j
K
j
n
i ji
ca
rcaR
m
1
1 1
β
β (5)
onde:
• Rca é o valor da relação de co-autoria do indivíduo m,
• rcai é a variável binária de ocorrência da co-autoria i,
• n é o número máximo de co-autorias realizadas em um mesmo período,
• �j é o peso atribuído ao período j, com j = 1, ...,K
• K é o número total de períodos analisados.
Para cada indivíduo (m), as relações de orientador-orientado são mensuradas através
da média ponderada entre os anos de ocorrência e os pesos atribuídos a cada ano. Estas
relações podem ser expressas por:
( )�
�
=
=⋅
= K
j j
K
j jj
dr
rdrR
m
1
1
θ
θ (6)
( )�
�
=
=⋅
= K
j j
K
j jj
ms
rmsR
m
1
1
γ
γ (7)
( )�
�
=
=⋅
= K
j j
K
j jj
ic
ricR
m
1
1
δ
δ (8)
onde:
• Rdr, Rms, Ric são respectivamente os valores para as relações de orientador-orientado
para doutorandos, mestrandos e estudantes com bolsas de iniciação científica do
indivíduo m,
• rdrj , rmsj e ricj são as variáveis binárias de ocorrência das relações escolhidas para o
estudo de caso de orientador-orientado, sendo rdrj = rmsj = ricj = 1, caso exista a
relação e rdrj = rmsj = ricj = 0 caso contrário.
• �j, �j e �j são os pesos atribuídos para cada uma das relações no período j,
com j = 1, ...,K.
• K é o número total de anos analisados.
O valor do fator de proximidade individual bruto é dado pela média ponderada entre
estas relações. Cada peso é proporcional à contribuição de cada relação para os aspectos
sociais de familiaridade, proximidade geográfica e homofilia. O valor do fator de proximidade
individual bruto entre os atores pode ser expresso por:
( ) ( ) ( ) ( )( )caicmsdr
camicmmsmdrmm
RcaRicRmsRdrP
αααααααα
+++⋅+⋅+⋅+⋅
= (9)
onde:
• Pm é o fator de proximidade individual bruto, entre o indivíduo m e os elementos de
sua rede egocêntrica,
• �ca, �ic, �ms, �dr são os pesos atribuídos a cada uma das relações escolhidas para o
estudo de caso
Como a importância de cada indivíduo em uma rede egocêntrica depende da visão
subjetiva, o valor do fator de proximidade individual bruto deve ser normalizado para
transparecer a visão individual de cada indivíduo analisado. Assim, o fator de proximidade
individual pode ser expresso por:
� =
=N
i i
mm
P
PP
1
(10)
onde:
• |Pm| é o fator de proximidade individual do pesquisador m,
• Pi é o fator de proximidade individual bruto do ator i,
• N é o número máximo de agentes na rede egocêntrica.
Com os valores do fator de proximidade individual calculados, é possível se construir
uma tabela com os valores da relação de proximidade da rede social egocêntrica. O gráfico
em histograma permite evidenciar os diferentes pontos de vista que o agente possui de cada
agente de sua rede egocêntrica. A Tabela 2 mostra os valores do fator de proximidade
individual do nosso exemplo, com o histograma ao lado, correspondendo a representação
gráfica dos valores do fator de proximidade já normalizados.
Tabela 2: Fator de Proximidade Individual de um Pesquisador Rede Egocêntrica
357789089 relação: 2003 2004 2005 2006 2007 mestrado doutorado iniciação soma Méd Pond.DOUTOR peso: 1 2 3 4 5 3 4 1 2,947
co-autoria mestrado doutorado iniciação P |P|
1478390 0,600 0,000 0,600 0,000 0,360 0,122
3789209 0,533 0,800 0,000 0,000 0,347 0,118
6100028 1,400 0,000 0,000 0,000 0,280 0,095
8410847 0,000 0,800 0,000 0,000 0,240 0,081
10721666 1,200 0,000 0,000 0,000 0,240 0,081
13032485 0,267 0,600 0,000 0,000 0,233 0,079
15343304 0,333 0,333 0,000 0,000 0,167 0,057
17654123 0,800 0,000 0,000 0,000 0,160 0,054
19964942 0,600 0,000 0,000 0,000 0,120 0,041
22275761 0,600 0,000 0,000 0,000 0,120 0,041
24586580 0,000 0,333 0,000 0,000 0,100 0,034
26897399 0,267 0,000 0,000 0,000 0,053 0,018
29208218 0,267 0,000 0,000 0,000 0,053 0,018
31519037 0,267 0,000 0,000 0,000 0,053 0,018
33829856 0,267 0,000 0,000 0,000 0,053 0,018
36140675 0,000 0,000 0,000 0,333 0,033 0,011
38451494 0,000 0,000 0,000 0,333 0,033 0,011
40762313 0,000 0,000 0,000 0,333 0,033 0,011
43073132 0,000 0,000 0,000 0,333 0,033 0,011
45383951 0,000 0,000 0,000 0,333 0,033 0,011
47694770 0,000 0,000 0,000 0,333 0,033 0,011
50005589 0,000 0,000 0,000 0,333 0,033 0,011
52316408 0,000 0,000 0,000 0,267 0,027 0,009
54627227 0,000 0,000 0,000 0,267 0,027 0,009
56938046 0,133 0,000 0,000 0,000 0,027 0,009
59248865 0,000 0,000 0,000 0,267 0,027 0,009
61559684 0,000 0,000 0,000 0,267 0,027 0,009
0,000 0,020 0,040 0,060 0,080 0,100 0,120 0,140
1478390
3789209
6100028
8410847
10721666
13032485
15343304
17654123
19964942
22275761
24586580
26897399
29208218
31519037
33829856
36140675
38451494
40762313
43073132
45383951
47694770
50005589
52316408
54627227
56938046
59248865
61559684
Com os fatores de proximidade individuais já calculados é possível construir um
gráfico em radar para representar a rede egocêntrica do agente pesquisado. A Figura 9 mostra
o gráfico em radar da rede egocêntrica do pesquisador do representado na Tabela 2 com a
forma típica de caracol.
Figura 9: Gráfico em Radar da Rede Egocêntrica de um Pesquisador.
3.4.2 Método de Cálculo do Fator de Proximidade Social
O fator de proximidade social é calculado a partir da média ponderada entre os fatores
de proximidade individuais dos pesquisadores candidatos em relação ao líder de pesquisa e
aos demais pesquisadores que compõem o grupo de pesquisa. Os pesos são definidos
empiricamente de acordo com o papel que cada indivíduo desempenha no grupo. Pode-se
matematicamente expressar o fator de proximidade social como:
357789089
0,820
0,840
0,860
0,880
0,900
0,920
0,940
0,960
0,980
1,000
12
3
4
5
6
7
8
9
10
11
1213
1415
16
17
18
19
20
21
22
23
24
2526
�
�
=
=⋅
=N
j j
N
j jj
m
PPG
1
1
ρ
ρ (10)
onde:
• |PGm| é o fator de proximidade social do pesquisador m,
• Pj é o fator de proximidade individual do ator j,
• � j é o peso atribuído ao papel no grupo analisado do ator j ,
• N é o número máximo de agentes na rede egocêntrica.
Este fator está relacionado com a importância do indivíduo em relação ao grupo de
projeto segundo a rede egocêntrica de cada pesquisador e líder de projeto do grupo analisado.
Com a diferenciação entre os pesos dos pesquisadores e líder de projeto utilizados
nesta média ponderada é possível considerar a cadeia de recomendações dos demais
pesquisadores, permanecendo como aspecto principal para tomada de decisão o fator de
proximidade da rede social egocêntrica do líder de projeto. A contribuição dos demais
integrantes dos grupos de pesquisa, que atuam no papel de estudantes ou técnicos, foi
desprezada devido a pouca experiência profissional destes indivíduos no trabalho científico e
ao aspecto do aprendizado ser o principal fator de engajamento destes indivíduos.
3.4.3 Valor de Corte para Identificação dos Pesquisadores
Para a identificação dos pesquisadores pertencentes às equipes de pesquisa foi adotado
um valor de corte empírico de 0,02 que demonstrou ser um valor de corte que proporcionou
bons resultados na maioria dos grupos de pesquisa do CPGEI/ UTFPR. Como trabalho futuro
propomos o estudo para a determinação de um valor de corte calculado através de um método
que busca encontrar o mínimo valor do fator de proximidade social necessário para um
indivíduo ser convidado para entrar na equipe de pesquisa. Como mostra a Figura 10, os
gráficos de evolução no estudo de caso do fator de proximidade social de cada pesquisador
em função do seu papel no grupo de pesquisa possuem uma curva aproximadamente contínua,
sem uma inflexão considerável que possa ser considerada um valor de corte possível. Logo,
não foi possível desta forma determinar no ambiente do estudo de caso um valor de corte para
a identificação dos indivíduos pertencentes aos grupos de projeto.
Gráfico de Evolução do Fator de Proximidade Social para o Papel de Pesquisadores
00,10,20,30,40,50,6
1 7 13 19 25 31 37 43 49 55 61 67 73 79 85 91 97 103 109 115 121 127
Pesquisadores
Fato
r de
Pro
xim
idad
e S
ocia
l
Gráfico de Evolução do Fator de Proximidade Social para o Papel de Líder de Projeto
0
0,2
0,4
0,6
0,8
1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
Líderes de Projeto
Fato
r de
Pro
xim
idad
e S
ocia
l
Gráfico de Evolução do Fator de Proximidade Social para o Papel de Estudante
00,10,20,30,40,50,6
1 10 19 28 37 46 55 64 73 82 91 100 109 118 127 136 145 154 163 172 181 190 199
Estudantes
Fato
r de
Pro
xim
idad
e S
ocia
l
Figura 10: Gráficos de Evolução do Fator de Proximidade Social em relação aos diversos
papéis no Grupo de Pesquisa
3.5 JUSTIFICATIVAS PARA O MODELO COMPUTACIONAL PROPOSTO
O uso dos princípios de análise de redes sociais orienta a utilização das informações
contidas nos documentos disponíveis para escolher e valorar relacionamentos sociais
relacionados com determinados comportamentos ou que identificam determinados indivíduos.
A abordagem egocêntrica foi utilizada devido à explicitação das relações entre os
indivíduos e os demais integrantes diretamente ligados a ele, sendo a análise deste tipo de
simplificação das redes egocêntricas, conhecida como sociograma de Moreno, ideais para a
identificação dos líderes e da cadeia de recomendações da rede social (SCOTT, 2000). Esta
abordagem proporciona o tratamento das relações sobre o ponto de vista individual de cada
ator, sendo natural a diferença entre os fatores de proximidade individual. Em uma abordagem
sociocêntrica seria possível identificar a formação de grupos, a centralidade de determinado
indivíduo ou a seu grau de intermediação, sendo possível o estudo da evolução da equipe e
identificação de estruturas sociais. Porém não é possível verificar com esta abordagem como a
visão subjetiva de sua rede social influencia na construção de sua equipe de pesquisa, que é o
objetivo deste trabalho de dissertação.
O uso de um método linear para a construção da representação egocêntrica é apoiado
pelo trabalho de Cai et al. (2005). A idéia básica do algoritmo utilizado é encontrar uma
combinação de relacionamentos que busca tornar a medida do relacionamento entre os
indivíduos dentro da comunidade do centro de pesquisa o mais intenso possível em relação
aos aspectos sociais escolhidos, com o objetivo de agrupar estes indivíduos para identificar as
comunidades. A valoração destas relações pode ser tanto linear como não linear. Segundo Cai
et al. (2005), em sendo impossível um usuário conseguir todas as informações relacionadas
com um indivíduo, as técnicas não lineares tendem a ser instáveis podendo produzir
agrupamentos falsos com números elevados de integrantes. Assim este trabalho utilizou
apenas técnicas lineares de agrupamento comparando o fator de proximidade social (calculado
através de sucessivas médias ponderadas) com um valor de corte. O fator de proximidade
social é uma média ponderada dos fatores de proximidade individuais em relação ao líder de
projeto e aos demais pesquisadores do grupo de pesquisa. Com isto este fator considera não
apenas a rede egocêntrica do líder de projeto, mas também a indicação por parte dos demais
pesquisadores de forma a usar a cadeia de recomendações dos pesquisadores, mas
considerando o fator de proximidade em relação ao líder de projeto como fator principal na
decisão.
A identificação dos integrantes dos grupos de pesquisa a partir do uso do fator de
proximidade social é realizada devido ao objetivo deste trabalho de verificar a influência das
redes sociais na formação destes grupos. Este objetivo não seria possível se fosse adotada a
abordagem de propor uma equipe de pesquisa e compará-la com o grupo de projeto, uma vez
que o valor empírico de corte limitaria esta análise, além da combinação dos diferentes
indivíduos com grau de proximidade social aproximado produzirem um número enorme de
agrupamentos possíveis. O uso de um valor de corte empírico é utilizado em diversos
trabalhos como Matsuo et al. (2003), Berg-Wolf e Saia (2006).
Desta forma foi possível construir um modelo computacional de fácil compreensão e
baixa complexidade computacional com a capacidade de lidar com relações múltiplas
considerando o dinamismo temporal.
3.6 CONCLUSÕES
Buscou-se neste capítulo propor um modelo computacional capaz de identificar
indivíduos através da representação da rede egocêntrica do líder de projeto e demais
integrantes da rede social. O modelo proposto utiliza técnicas de álgebra relacional para a
obtenção de um fator de proximidade social a partir do cálculo das médias ponderadas das
relações em função do tipo e do período em que ocorreu. Este fator possui característica
qualitativa, e é comparado com um valor de corte empírico para identificar os integrantes dos
grupos de pesquisa. Nos anexos podem ser encontradas as planilhas utilizadas para o
experimento com um grupo de projeto, como a matriz relacional do líder de projeto, tabela de
cálculo do fator de proximidade individual e o gráfico em forma de radar do sociograma de
Moreno deste indivíduo.
No próximo capítulo serão detalhados os resultados do estudo de caso e discutidos os
principais aspectos relacionados com os experimentos como o ambiente e domínio as
limitações do modelo computacional proposto.
CAPÍTULO 4
RESULTADOS DO ESTUDO DE CASO
Neste capítulo são mostrados os principais resultados obtidos com a aplicação do
modelo computacional proposto no estudo de caso. Na seção 4.1 é descrito o ambiente em que
foi realizado o estudo de caso. A seguir são discutidas as limitações do modelo computacional
proposto, na seção 4.2.
4.1 ESTUDO DE CASO
Inicialmente foram analisados 22 grupos de projeto registrados no diretório de grupos
do CNPq e que possuem a participação de pelo menos um pesquisador do CPGEI da UFTPR.
Primeiramente foram analisadas apenas as redes egocêntricas dos pesquisadores pertencentes
ao CPGEI durante o experimento da identificação das equipes de projeto. Desta forma foi
possível evidenciar apenas 53,1% dos participantes, ou seja, aproximadamente metade dos
indivíduos destes grupos possuíam alguma relação de co-autoria ou orientador-orientado.
Entre estes indivíduos apenas 27,0% dos pesquisadores possuíam um fator de proximidade
social superior ao valor de corte, sendo assim identificados como indivíduos pertencentes aos
grupos de pesquisa. Estes indivíduos identificados foram comparados com as listas dos grupos
de pesquisa divulgadas pela plataforma Lattes para confirmar os resultados.
A Tabela 3 descreve melhor a evolução destes resultados considerando apenas as
informações dos pesquisadores do CPGEI da UTFPR, e mostra os percentuais de
identificação dos indivíduos, de identificações falhas com fator de proximidade social menor
que o valor de corte para identificação, e o percentual de indivíduos não evidenciados pelas
relações utilizadas nos experimentos preliminares do estudo de caso.
valo
res
tota
lizad
os o
btid
os:
357
27,0
26,1
53,1
43,5
Gru
po d
e P
roje
toN
úmer
o T
otal
de
In
tegr
ante
s
Indi
vídu
os
Iden
tific
ados
(%)
Indi
vídu
os c
om F
ator
de
Pro
xim
idad
e G
loba
l Inf
erio
r (%
)
Tot
al In
diví
duos
E
vide
ncia
dos
(%)
Indi
vídu
os N
ão
Evi
denc
iado
s (%
)
LME
- La
bora
tóri
o de
Mic
roel
etrô
nica
da
UT
FPR
5
0,0
100,
010
0,0
0,0
Gru
po d
e P
esqu
isas
em
Eng
enha
ria
Bio
méd
ica
3
0,0
66,7
66,7
33,3
Gru
po d
e P
esqu
isa
em C
omun
icaç
ões
- GP
qCom
6
0,0
33,3
33,3
66,7
Eng
enha
ria
Bio
méd
ica
e Fí
sica
Méd
ica
27
0,0
14,8
14,8
85,2
Gru
po d
e E
stud
os e
Pes
quis
as e
m E
nsin
o de
Fís
ica
14
0,0
0,0
0,0
100,
0G
rupo
de
Pes
quis
a em
Aná
lise
e P
roce
ssam
ento
de
Ene
rgia
9
0,0
0,0
0,0
100,
0B
iom
atem
átic
a
20,
00,
00,
032
,0G
rupo
de
Tec
nolo
gia
em S
aúde
40
5,0
15,0
20,0
80,0
Man
ufat
ura
Inte
grad
a
119,
19,
118
,281
,8C
entr
o de
Pes
quis
as e
m M
ater
iais
- C
PqM
38
18,4
0,0
18,4
81,6
Rad
iaçõ
es Io
niza
ntes
e F
ísic
a N
ucle
ar
2532
,056
,088
,012
,0E
ngen
hari
a B
iom
édic
a 9
33,3
22,2
55,6
44,4
Tel
emát
ica
26
42,3
15,4
57,7
42,3
ME
ME
NT
O
944
,433
,377
,822
,2D
ispo
sitiv
os F
otôn
icos
e A
plic
açõe
s
3345
,527
,372
,727
,3U
ltra-
som
15
46,7
40,0
86,7
13,3
Ele
troc
irur
gia
5
60,0
40,0
100,
00,
0B
iote
lem
etri
a
2560
,08,
068
,032
,0G
rupo
de
Est
udos
e P
esqu
isa
em S
inai
s e
Imag
ens
21
61,9
28,6
90,5
9,5
Info
rmát
ica
Indu
stri
al
3482
,411
,894
,15,
9
Tab
ela
3:R
esul
tado
sda
Iden
tific
ação
de P
esqu
isad
ores
utili
zand
oap
enas
info
rmaç
ões
dos
pesq
uisa
dore
sdo
CPG
EI/U
TFP
R
Com o objetivo de melhorar estes resultados, o experimento foi expandido
considerando as redes egocêntricas de todos os indivíduos dos grupos de pesquisa que
possuam pelo menos um integrante pertencente ao CPGEI da UTFPR. Desta forma o processo
de construção do fator de proximidade social recebeu a contribuição de todos os indivíduos
relacionados com o líder de projeto, melhorando a cadeia de recomendações e proporcionando
melhores resultados. Assim foram analisadas 122 redes egocêntricas dos pesquisadores e
líderes de projeto, em uma comunidade de 362 indivíduos (considerando os estudantes), em
23 grupos de pesquisa, com um total de 67620 ligações sociais estudadas quanto à existência,
freqüência e ocorrência, sendo calculados 3386 fatores de proximidade individual para a
construção das redes egocêntricas. O grupo de Tecnologia em Saúde não foi considerado
devido ao tipo de relação de co-autoria possuir o caráter de laboratorial, tornando a sua
análise difícil de ser realizada manualmente já que cada trabalho possui em média cinco co-
autores que se combinam entre os 19 participantes com mais de 150 trabalhos publicados nos
últimos anos. Assim apenas a análise deste grupo contabilizaria aproximadamente 9500
relações de co-autoria. Porém o tipo laboratorial de relação de co-autoria torna o grupo coeso
devido a elevada freqüência de ocorrência dos relacionamentos, favorecendo a identificação
do grupo de pesquisa pelo modelo computacional proposto.
Para este estudo de caso foi escolhido o valor empírico de 0,02 para ser utilizado
como valor de corte para a identificação de pesquisadores na comunidade analisada. A
escolha deste valor foi baseada no estudo de alguns grupos de pesquisa, onde foi possível
perceber que a maioria dos indivíduos possuía um valor do fator de proximidade social
próximo ao valor escolhido. Assim os resultados de identificação dos integrantes das equipes
de pesquisa foram de 74,0%. Com este trabalho foi possível evidenciar 85,0% dos indivíduos
estudados através do uso de informações da rede egocêntrica do líder de projeto e da cadeia
de recomendações dos pesquisadores que compõe esta rede. No entanto 15,0% dos integrantes
das equipes de projeto não foram evidenciados, ou seja, não possuíam nenhuma relação de co-
autoria ou orientador-orientado, e 12,1% dos indivíduos apesar de serem evidenciados
apresentaram um fator de proximidade social inferior ao valor de corte. A Figura 11 mostra o
gráfico com o percentual de identificação dos indivíduos dos grupos de pesquisa analisados
no estudo de caso.
0,0 10,0 20,0 30,0 40,0 50,0 60,0 70,0 80,0 90,0 100,0
Dispositivos Fotônicos e Aplicações
Grupo de Pesquisa em Análise e Processamento de Energia
Engenharia Biomédica
Telemática
Biotelemetria
Centro de Pesquisas em Materiais - CPqM
Eletrocirurgia
Ultra-som
MEMENTO
Grupo de Pesquisa em Comunicações - GPqCom
Grupo de Estudos e Pesquisas em Ensino de Física
Linha de pesquisa Instrumentação e automação de processos industriais
Radiações Ionizantes e Física Nuclear
Engenharia Biomédica e Física Médica
Biomatemática
Grupo de Pesquisas em Engenharia Biomédica
Manufatura Integrada
LME - Laboratório de Microeletrônica da UTFPR
Grupo de Estudos e Pesquisa em Sinais e Imagens
Informática Industrial
Linha de pesquisa Scheduling em refinarias
Linha de pesquisa Sistemas Híbridos de Controle
Linha de pesquisa Sistemas Inteligentes de Controle
Figura 11: Gráficos da Porcentagem de Identificação dos Indivíduos Pertencentes
aos Grupos de Pesquisa com pelo menos um Integrante do CPGEI da UTFPR.
A Tabela 4 mostra os percentuais de identificação dos indivíduos, de identificações
falhas com fator de proximidade social menor que o valor de corte para identificação, e o
percentual de indivíduos não evidenciados pelas relações utilizadas nos experimentos do
estudo de caso.
valo
res
tota
lizad
os o
btid
os:
362
74,0
12,1
85,0
15,0
Gru
po d
e P
roje
toN
úmer
o T
otal
de
In
tegr
ante
s
Indi
vídu
os
Iden
tific
ados
(%)
Indi
vídu
os c
om F
ator
de
Pro
xim
idad
e G
loba
l Inf
erio
r (%
)
Tot
al In
diví
duos
E
vide
ncia
dos
(%)
Indi
vídu
os N
ão
Evi
denc
iado
s (%
)
Dis
posi
tivos
Fot
ônic
os e
Apl
icaç
ões
36
50,0
25,0
75,0
25,0
Gru
po d
e P
esqu
isa
em A
nális
e e
Pro
cess
amen
to d
e E
nerg
ia
1050
,00,
050
,050
,0E
ngen
hari
a B
iom
édic
a 11
54,5
9,1
63,6
36,4
Tel
emát
ica
26
57,7
23,1
80,8
19,2
Bio
tele
met
ria
25
60,0
8,0
68,0
32,0
Cen
tro
de P
esqu
isas
em
Mat
eria
is -
CP
qM
4065
,07,
572
,527
,5E
letr
ocir
urgi
a
666
,733
,310
0,0
0,0
Ultr
a-so
m
1566
,720
,086
,713
,3M
EM
EN
TO
9
66,7
11,1
77,8
22,2
Gru
po d
e P
esqu
isa
em C
omun
icaç
ões
- GP
qCom
7
71,4
14,3
85,7
14,3
Gru
po d
e E
stud
os e
Pes
quis
as e
m E
nsin
o de
Fís
ica
14
71,4
14,3
85,7
14,3
Linh
a de
pes
quis
a In
stru
men
taçã
o e
auto
maç
ão d
e pr
oces
sos
indu
stri
ais
771
,428
,610
0,0
0,0
Rad
iaçõ
es Io
niza
ntes
e F
ísic
a N
ucle
ar
2572
,020
,092
,08,
0E
ngen
hari
a B
iom
édic
a e
Físi
ca M
édic
a
2875
,07,
182
,117
,9B
iom
atem
átic
a
475
,025
,075
,025
,0G
rupo
de
Pes
quis
as e
m E
ngen
hari
a B
iom
édic
a
580
,00,
080
,020
,0M
anuf
atur
a In
tegr
ada
11
81,8
9,1
90,9
9,1
LME
- La
bora
tóri
o de
Mic
roel
etrô
nica
da
UT
FPR
6
83,3
16,7
100,
00,
0G
rupo
de
Est
udos
e P
esqu
isa
em S
inai
s e
Imag
ens
23
91,3
0,0
91,3
8,7
Info
rmát
ica
Indu
stri
al
3691
,75,
697
,22,
8Li
nha
de p
esqu
isa
Sch
edul
ing
em r
efin
aria
s10
100,
00,
010
0,0
0,0
Linh
a de
pes
quis
a S
iste
mas
Híb
rido
s de
Con
trol
e5
100,
00,
010
0,0
0,0
Linh
a de
pes
quis
a S
iste
mas
Inte
ligen
tes
de C
ontr
ole
310
0,0
0,0
100,
00,
0
Tab
ela
4:R
esul
tado
sda
Iden
tific
ação
de P
esqu
isad
ores
utili
zand
oin
form
açõe
sde
todo
sos
pesq
uisa
dore
sdo
s gr
upos
de p
esqu
isa
que
poss
uam
pelo
men
osum
inte
gran
tedo
CPG
EI/
UT
FPR
Em relação aos papéis que os integrantes dos grupos de pesquisa desempenham, foi
possível identificar 89,7% dos integrantes no papel de líderes de projeto, 89,6% dos
integrantes no papel de pesquisadores e 82,8% dos integrantes no papel de estudantes,
utilizando o valor de corte de 0,02 para o nível de proximidade social. Porém o método
utilizado não evidenciou alguns dos integrantes das equipes de pesquisa, sendo 3,2% dos
indivíduos no papel de líderes de projeto, 24,2% de pesquisadores e 13,8% dos estudantes,
conforme a Tabela 5.
Tabela 5: Proporção de Identificação em Relação ao Papel no Grupo de Pesquisa
Líderes Pesquisadores Estudantes
% de identificação 86,66% 67,18% 70,93%
% de identificação (descartando os não evidenciados)
89,65% 89,58% 82,75%
% pesquisadores não evidenciados: 3,22% 24,21% 13,79%
A dificuldade em identificar os líderes de projeto com o fator de proximidade social
indica que em alguns grupos o líder publica pouco com os integrantes de seu grupo, e possui
poucos orientados dentro destes grupos. Já os pesquisadores com pouca experiência, ou no
final de carreira, não são evidenciados pelo modelo proposto devido às relações escolhidas,
pois possuem um número reduzido de publicação nos últimos cinco anos. O mesmo ocorre
com os estudantes que ainda possuem um pequeno número de publicações, apesar de
possuírem relações de orientador-orientado.
Estes valores podem ser comparados com os resultado obtidos com o trabalho de
Enembreck et al. (2006) que buscou a identificação dos pesquisadores de grupos de pesquisa
utilizando a análise de contexto do currículo Lattes dos pesquisadores com o resumo das
dissertações de mestrado da instituição pesquisada, e com os currículos dos integrantes do
grupo de pesquisa. A Tabela 6 mostra os resultados desta pesquisa, para a identificação de
pesquisadores em relação ao projeto de pesquisa e em relação ao grupo de pesquisa. Na
segunda etapa foram retirados os trabalhos inovadores, pois estes trabalhos não tinham
relação com o currículo Lattes dos pesquisadores, e por isto prejudicava a identificação. Na
conclusão os autores comentam que o baixo valor para identificação do pesquisador em
relação ao projeto se deve à sobreposição entre as áreas de atuação dos pesquisadores, que por
participam do mesmo grupo de pesquisa possuem conceitos semelhantes no currículo Lattes.
Também foram comentadas algumas limitações que causaram erros, como o uso de tradutores
inglês-português, a escolha de apenas 20 artigos para compor a base de aprendizado para
comparação dos conteúdos, e a limitação de 500 palavras retiradas do resumo das dissertações
de mestrado. Neste trabalho os pesquisadores podem ter o papel dentro dos grupos de
pesquisa como líderes de projeto ou pesquisadores, sendo os alunos descartados.
Tabela 6: Resultados de Identificação de Pesquisadores através da Abordagem de Comparação de Contexto
em relação ao grupo em relação ao projeto
% identificação 75,00% 19,23%
% identificação ( retirando os trabalhos inovadores)
88,63% 22,72%
Pesquisadores
Os resultados obtidos pelo modelo computacional proposto se aproximam dos
resultados alcançados pela análise de contextos no trabalho de Enembreck et al. (2006) para a
identificação de pesquisadores nos grupos de pesquisa. Porém, o estudo de caso deste trabalho
de dissertação se diferencia por ser realizado em uma comunidade maior, com atores atuando
em três papéis no grupo de pesquisa. Apesar da análise de contexto também produzir bons
resultados, este método é limitado quanto às informações sobre a estrutura social da
comunidade pesquisada e a percepção da dinâmica social com o passar do tempo. Mas a
dificuldade de obtenção das informações relacionais através de textos com informações pouco
estruturadas orienta a utilização da análise de contextos como uma etapa inicial da análise da
rede social da comunidade pesquisada.
4.1.1 Discussão sobre os Grupos de Pesquisa
Os resultados de identificação variam com os grupos analisados. Os motivos que
levaram a esta diferença estão relacionados às características internas destes grupos. Alguns
grupos de pesquisa possuíam características próprias que dificultaram a identificação a partir
do fator de proximidade social. Assim existem algumas hipóteses para este caso:
1. O grupo de projeto está mal formado e deve ser alterado de acordo com as
indicações de proximidade obtidas através da rede egocêntrica do líder de
projeto. Considerando isto, este grupo deve ser descartado da análise.
Considera-se um grupo de pesquisa como mal formado quando outras relações
como prestígio, força política e posição social foram importantes no momento
da escolha dos integrantes.
2. O líder de projeto utiliza outros fatores, não abordados pelo modelo proposto,
para a escolha dos integrantes da equipe de pesquisa. Logo, o modelo deve ser
melhorado buscando a valoração de outros relacionamentos possíveis de
evidenciar, ou pela estratificação das relações analisada em diversos subtipos.
3. Os grupos são formados em sua maioria por pesquisadores com pouca
experiência ou em final de carreira e estudantes. Devido o pequeno número de
publicações realizadas nos últimos cinco anos e ao pequeno número de
orientações, poucos indivíduos são identificados pelas relações escolhidas no
estudo de caso.
4. Existe a falta de profissionais capacitados para a função, ou a falta de incentivo
para favorecer o engajamento nos grupos de pesquisa, sendo estes aspectos
relativos às diretrizes do centro de pesquisa. Assim, indivíduos sem nenhuma
publicação científica passam a integrar os grupos de projeto e não são
reconhecidos pelas relações escolhidas no estudo de caso.
A maioria dos líderes de projeto possui o maior índice de proximidade social no grupo
de pesquisa, o que pode ser considerado proporcional ao trabalho de liderança realizado por
estes atores nos grupos de pesquisa. Porém, alguns grupos possuem líderes com baixo fator de
proximidade social, e ainda existem grupos com líderes não evidenciados. Nestes casos estão
os novos grupos de pesquisa, que ainda não publicaram nenhum trabalho, ou os casos onde o
líder possui um papel de prestígio na instituição.
4.2 LIMITAÇÕES DO MODELO COMPUTACIONAL PROPOSTO
Neste trabalho de dissertação são examinadas as relações existentes entre os
integrantes de equipes de pesquisa e por sua própria natureza estas relações são colaborativas,
ou seja, estas relações estão ligadas ao trabalho em conjunto na equipe de pesquisa. Apesar
disto existem diversas relações que poderiam ser utilizadas para melhorar os resultados.
Devido às limitações do trabalho manual na realização dos experimentos, foi impossível
acrescentar mais relações ao estudo, ou mesmo obter informações sobre um período maior de
tempo. Isto limitou a identificação de pesquisadores que apesar de terem uma vasta
experiência científica, publicaram pouco nos últimos cinco anos. Como já comentado na
apresentação do modelo computacional, a escolha das relações sociais é determinante no
sucesso da análise. Relações que não podem ser evidenciadas nos documentos, ou a
indisponibilidade destes documentos, limitam o modelo proposto. Neste ponto a abordagem
por análise da similaridade de contextos, apresentada no trabalho de Enembreck et al. (2006)
não é limitada.
Apesar do modelo poder ser estendido para a aplicação na formação de equipes,
através da proposta de uma lista de candidatos à equipe de pesquisa criada através da
composição das múltiplas relações considerando o dinamismo no tempo e os atributos de cada
indivíduo, os experimentos foram limitados à identificação de grupos já existentes. Os
resultados do experimento não podem ser relacionados aos mecanismos que determinam
como os membros de grupos de projeto escolhem uns aos outros para compor um grupo de
pesquisadores. Esta análise também não está relacionada com a probabilidade de existirem
outros relacionamentos que promovam a decisão de pesquisadores em se afiliar a um projeto
de pesquisa em preferência a outro, como no caso dos melhores pesquisadores escolherem
trabalhar uns aos outros, se isolando dos demais pesquisadores. Com a impossibilidade de
conhecer, ou evidenciar nas relações analisadas, outros casos onde pesquisadores experientes
não foram convidados para compor uma equipe de pesquisa, ou pesquisadores que decidiram
não participar de determinado projeto de pesquisa, não se pode com este trabalho de
dissertação discutir sobre a o processo de seleção de pesquisadores para a formação de
equipes de pesquisa. Como as informações do estudo de caso foram obtidas em um
determinado ponto do tempo, os resultados deste trabalho estão limitados aos projetos de
pesquisa onde os pesquisadores já foram selecionados, limitando a discussão da probabilidade
deles continuarem a colaborar com estes projetos no futuro apenas com as informações deste
estudo de caso. Este estudo é limitado pela inexistência do histórico da evolução dos grupos
de pesquisa com o tempo já que não existe no currículo Lattes informações disponíveis sobre
a entrada ou saída de membros nos grupos de pesquisa.
4.2.1 Dificuldades Encontradas no Decorrer do Trabalho
No decorrer desse trabalho algumas dificuldades foram vencidas facilmente, pois
houve um alerta dos colegas nesses pontos, outras foram mais difíceis de contornar por serem
desconhecidas. Assim, é importante deixar registrado as dificuldades que foram encontradas e
algumas dicas para facilitar os trabalhos futuros:
• A primeira dificuldade foi como valorar corretamente as relações. No estudo de caso
foi possível verificar nos primeiros experimentos que a influência do erro causado por
pequenas falhas na valoração das relações pode ser considerada desprezível em grupos
onde o líder possui uma grande rede egocêntrica, porém pode ter um caráter decisivo
em redes pequenas. Isto ocorre devido à utilização do fator de proximidade social que
utiliza a cadeia de recomendações para o seu cálculo com a contribuição do fator de
proximidade individual que é normalizado para cada indivíduo.
• Outro problema é como identificar indivíduos que são levemente evidenciados pelas
relações escolhidas, como os estudantes, ou pesquisadores que integram a pouco
tempo um grupo de pesquisa do estudo de caso. Uma vez que estes estão começando a
sua carreira como pesquisadores e não possuem ainda uma vasta experiência ou co-
autorias que possam evidenciar sua proximidade com o grupo de pesquisa estes
indivíduos não são identificados. Uma solução trivial seria a escolha de outras relações
que possam evidenciar estes indivíduos. Outra possibilidade é uma abordagem
diferenciada pelo papel que o indivíduo desempenha no grupo de pesquisa, como o
caso de utilizar valores de corte diferenciados para a identificação de um determinado
papel social. Esta abordagem não foi realizada no estudo de caso devido a dificuldade
de refazer o experimento manualmente no tempo disponível.
• Um dos problemas encontrados durante os testes foi a determinação dos pesos para
diferenciar as relações quanto ao tipo e período em que ocorreu. Durante os
experimentos iniciais optou-se por pesos distribuídos de forma linear, uma vez que o
resultado final nos testes realizados foi satisfatório, já que a contribuição da cadeia de
recomendações dos demais integrantes da rede egocêntrica minimiza os erros. Porém,
em grupos de pesquisa onde a rede egocêntrica é pequena, estes pesos possuem grande
influência na decisão final.
• Pode existir uma dificuldade na identificação dos indivíduos nos documentos
analisados para a coleta de informações. No estudo de caso, algumas pesquisadoras,
estudantes ou líderes de projeto trocam de nome após o casamento, ocorrendo uma
interrupção na seqüência de informações obtidas através de um determinado nome em
citações durante a extração de informação na plataforma Lattes. Também existe o caso
onde o pesquisador utiliza diversos nomes em citações, ou casos onde existem
homônimos, como pais e filhos diferenciados apenas por abreviações como “Jr.” ou
“Filho”. Estes casos podem causar erros durante a coleta de informações, sendo
necessário o desenvolvimento de uma estrutura computacional confiável para extração
de informação. O uso de um maior número de critérios para a identificação (como a
instituição onde o pesquisador atua e sua área de pesquisa) contribuem para a redução
do erro na captação de informações.
4.3 CONCLUSÕES
Neste capítulo foram apresentados os principais resultados obtidos com o estudo de
caso nos grupos de pesquisa com os pesquisadores do CPGEI da UTFPR e a análise mais
detalhada destes resultados.
A análise foi realizada comparando as proporções entre os indivíduos identificados, os
indivíduos evidenciados e os não evidenciados. Foram citados alguns possíveis motivos que
impediram uma melhor identificação dos indivíduos. Também foi realizada uma breve
discussão sobre as dificuldades encontradas durante a execução do experimento.
No próximo capítulo a avaliação do modelo será sumarizada e serão apresentadas as
conclusões gerais do trabalho e propostas de trabalhos futuros.
CAPÍTULO 5
CONCLUSÕES
Este capítulo é o fechamento deste trabalho de dissertação de mestrado. Nas seções 5.1
e 5.2 são recapitulados os objetivos gerais do trabalho e as principais contribuições da
proposta. A seguir, a seção 5.3 sumariza, qualitativamente, os resultados apresentados no
Capítulo 4, enumerando elementos que possibilitem determinar a validade da abordagem. As
seções seguintes trazem as conclusões gerais do trabalho e sugestões para a continuidade
desta pesquisa.
5.1 RECAPITULAÇÃO DOS OBJETIVOS DO TRABALHO
Este trabalho de dissertação de mestrado teve como objetivo principal verificar a
influência da rede social egocêntrica de líderes de projeto na formação de equipes de
pesquisa, considerando diferentes tipos de relações sociais e as alterações destas relações no
decorrer do tempo.
Nos experimentos realizados foi possível comprovar que a maioria dos indivíduos
identificados pertence à rede social do líder de projeto, ou foram recomendados por outro
pesquisador que pertence a esta rede social. Assim, pode-se concluir que a representação da
rede social egocêntrica do líder de projeto através dos sociogramas de Moreno contribui para
a compreensão do processo de formação de equipes.
O modelo computacional proposto considera as múltiplas relações e o dinamismo
temporal da rede social, cumprindo o objetivo para o estudo de caso de construir a rede
egocêntrica do líder de projeto e sua cadeia de recomendações utilizada para identificar os
indivíduos que pertencem aos grupos de pesquisa analisados.
As informações extraídas da Plataforma Lattes sobre os indivíduos analisados foram
suficientes para construir as redes sociais egocêntricas e facilitar a identificação dos
indivíduos. Logo, os experimentos realizados comprovaram a validade do modelo
computacional através do estudo de caso realizado com as equipes de pesquisa do CPGEI da
UTFPR.
5.2 CONTRIBUIÇÕES ESPERADAS
Como parte das contribuições desta dissertação, o modelo computacional proposto
deve responder a diversas perguntas, realizadas na seção 1.2.1 do Capítulo 1, para o projeto de
um sistema que pode ser utilizado como meio auxiliar para a formação de equipes através da
extração de informações sobre as relações sociais e os atributos dos indivíduos:
1. Para se construir uma representação única das diversas redes sociais formadas pelas
múltiplas relações de forma a se aproximar da visão do próprio indivíduo, deve-se
utilizar uma composição de relações pertencentes a dimensões sociais distintas e
considerar nesta composição o dinamismo da rede social em função do tempo.
2. A valoração dos relacionamentos através da freqüência e da época de ocorrência pode
ser relacionada com a rede social do usuário através da composição destes
relacionamentos, permitindo uma visão limitada e subjetiva da contribuição para a
ocorrência de um determinado comportamento. Porém a determinação da
probabilidade de ocorrência deste comportamento somente pode ser realizada através
da análise da contribuição dos demais atores da rede social analisada. O modelo
proposto e os testes realizados no estudo de caso demonstram que a identificação de
um determinado pesquisador depende não apenas da vontade do líder de projeto, mas
também da indicação por outros membros da rede social do líder e de fatores
individuais como área de pesquisa, localização geográfica e interesses pessoais do
próprio pesquisador investigado.
3. No modelo proposto a valoração das múltiplas relações é realizada pela composição
destas relações através de duas médias ponderadas, uma para produzir a redução da
intensidade da relação com o passar do tempo, e outra para atribuir um valor
diferenciado para cada tipo de relação. Ao ser realizada a normalização destas médias
é possível se aproximar da visão subjetiva do indivíduo em relação aos demais
indivíduos analisados. Logo, para identificar pessoas que possuam conhecimento,
reputação e experiências em um certo domínio deve-se selecionar as relações sociais
envolvidas com estes aspectos. O modelo computacional proposto pode ser aplicado
ao mesmo ambiente do estudo de caso para construir uma visão individual do líder de
projeto ao reputar um determinado pesquisador de sua rede de relacionamento. Entre
as relações que poderiam ser utilizadas estão: a de existência de patentes científicas,
número de publicações em periódicos, número de livros publicados, número de
participação em projetos de pesquisa ou consultorias para renomadas instituições de
pesquisa e o número de anos em que atua em determinada instituição.
4. Para promover o compartilhamento das informações relacionadas às equipes sem
prejudicar aspectos relacionados com a privacidade de cada usuário, no modelo
propõem a utilização do fator de proximidade individual como um filtro social para
restrição de acesso. Desta forma, as informações disponibilizadas já são do
conhecimento do usuário uma vez que ele participa da rede social que está
pesquisando.
5. A busca por informações em documentos disponíveis permite a construção de uma
visão da rede social do usuário sem o seu prévio conhecimento nem intervenção. As
limitações do modelo computacional proposto, sob este aspecto, estão limitadas à
possibilidade de identificação das relações ligadas às necessidades da análise
requisitada pelo usuário nestes documentos, e à credibilidade de tais documentos.
6. O modelo computacional proposto difere dos demais trabalhos relacionados pela
adoção de uma composição de múltiplas relações sociais para realizar a análise de
redes egocêntricas simplificadas considerando o seu dinamismo em função do tempo.
Outra contribuição é a simplicidade computacional do modelo proposto, que se
acredita ser linear.
5.3 CONCLUSÕES
Como conclusão geral, os resultados obtidos no estudo de caso demonstram que o
modelo computacional proposto possui os mecanismos necessários para identificar os
pesquisadores que formam uma equipe de pesquisa utilizando técnicas lineares para o cálculo
de um fator qualitativo proporcional à composição das relações sociais, ligadas aos de
aspectos sociais relacionados à formação de uma equipe de pesquisa, e à dinâmica temporal
destas relações.
Os valores escolhidos como pesos para diferenciar as relações quanto ao tipo e à época
de ocorrência produziram resultados satisfatórios, porém estes pesos devem ser testados em
outros ambientes e domínios, e ajustados se necessário.
A estratégia do modelo computacional em utilizar aspectos sociais para a identificação
das relações mais apropriadas para o estudo de caso facilitou o trabalho de extração de
informações e foi importante para os resultados de identificação de indivíduos do estudo de
caso. As relações de co-autoria e orientador-orientado, apesar de serem relacionadas ao
trabalho colaborativo nos grupos de pesquisa, pertencem a dimensões sociais diferentes.
Enquanto as relações de co-autoria estão relacionadas com o trabalho em grupo e podem ser
classificadas como relações homogêneas, as relações de orientador-orientado possuem um
caráter fortemente ligado aos papéis sociais que os indivíduos desempenham e aos objetivos
de obtenção de conhecimento, sendo classificadas como heterogêneas. Esta diferenciação
promove o processo de identificação dos atores das redes sociais analisadas, pois estas
relações devem pertencer a duas diferentes dimensões sociais relacionadas com o tipo de
grupo que se deseja identificar, conforme o previsto por Watts (2003).
O uso dos princípios de análise de redes sociais orientou a correta identificação e
utilização das informações contidas nos documentos disponíveis para definir as relações
sociais relacionadas com a necessidade do usuário, como mapear determinados
comportamentos ou identificar determinados indivíduos. Os sociogramas de Moreno, apesar
de serem uma limitação da abordagem egocêntrica por desprezar as ligações entre os atores
alters, explicitaram as relações entre os indivíduos e os demais integrantes diretamente
ligados a ele, sendo estas informações suficientes para a determinação da cadeia de
recomendações conforme descrito por Scott (2000). A sobreposição dos diversos sociogramas
de Moreno utilizados no estudo de caso através do uso das cadeias de recomendação e do
fator de proximidade individual foi suficiente para a identificação de indivíduos.
O modelo computacional proposto possui complexidade computacional O(n), e
acredita-se ser linear. Infelizmente os experimentos realizados não são suficientes para
comprovar esta linearidade. Com o uso da composição das relações sociais foi possível no
estudo de caso utilizar apenas quatro tipos de parâmetros separados por cinco períodos de
ocorrência. Apesar disto, este número pequeno de parâmetros foram suficientes para obter os
resultados esperados.
O período de ocorrência das relações sociais foi utilizado para diferenciar as relações
entre os indivíduos. Desta forma foi possível no estudo de caso retirar do processo de
identificação os pesquisadores que, apesar de terem uma vasta experiência, não estão mais
ativos no presente por motivos diversos como estar no final de carreira ou por ter acabado de
retornar do doutorado. Esta análise desta dinâmica da rede social proporcionou novos
resultados, diferentes da análise estática de redes sociais que leva em consideração apenas a
intensidade dos relacionamentos ou freqüência de ocorrência. Assim o modelo computacional
proposto realiza uma análise que considera também o dinamismo temporal da rede social.
Porém a escolha dos pesos utilizados na composição das relações em relação ao tempo
produz um efeito artificial que se acredita ser diferente da percepção temporal individual. Isto
produz uma diferença entre a percepção do modelo e dos indivíduos, o que proporciona um
efeito benéfico ao relembrar antigos contatos que, devido às atividades cotidianas dos
usuários haviam sido esquecidos. De outra forma, sem a análise da dinâmica temporal da rede
social os resultados em determinados domínios seriam pouco úteis, como no caso da
formação de uma equipe de pesquisa onde a análise estática poderia produzir uma lista com
nomes de antigos colegas que não estão mais na instituição, mas que realizaram um enorme
trabalho de pesquisa no passado.
Ao considerar na análise a dinâmica temporal da rede social, o modelo computacional
proposto pode ser utilizado para a construção de ferramentas para CSCW (Computer
Supported Collaborative Work – Trabalho Colaborativo Suportado por Computador), na área
de formação de equipes. Porém, ao se disponibilizar o modelo computacional proposto para
uma comunidade, este modelo passará a ter influência na tomada de decisão ao auxiliar os
processos de escolha de uma equipe, com conhecimentos e experiências em determinadas
áreas estabelecidas pelo usuário. Isto modificará os procedimentos e regras utilizadas
atualmente por esta comunidade na localização de pessoas que possuam os conhecimentos
necessários e que podem ser eventualmente reputadas através das redes sociais (cadeia de
recomendações).
5.4 TRABALHOS FUTUROS
Além do atendimento ao objetivo proposto, este trabalho de dissertação gerou alguns
questionamentos interessantes. Devido à impossibilidade de se esgotar o estudo de redes
sociais, sugere-se alguns tópicos para estudos futuros buscando o aprofundamento dessa
pesquisa com foco na pesquisa dos processos internos de tomada de decisão e construção de
estruturas organizacionais favorecendo o entendimento das relações sociais de forma a
otimizar a formação de equipes de alto desempenho. Mais especificamente segue abaixo os
seguintes tópicos:
• Outras relações e atributos devem ser levados em consideração para a
identificação dos pesquisadores, como a instituição em que trabalha, a posição
social que possui nesta instituição, a classificação do pesquisador junto às
instituições de pesquisa.
• As relações de co-autoria devem ser diferenciadas em relação ao tipo de
trabalho executado, pois os periódicos e livros são considerados pelos
pesquisadores como publicações de maior importância em relação aos artigos
apresentados em congressos.
• Uma análise temporal da evolução das equipes pode explicitar os mecanismos
utilizados pelos líderes na escolha de indivíduos e a identificação de fatores de
sucesso e fracasso para a formação de equipes. O estudo de caso foi limitado a
identificar os grupos de pesquisa já formados, porém uma análise futura de
como estes grupos evoluem com o tempo pode trazer uma melhor
compreensão de como a lista de candidatos obtida através do modelo
computacional proposto pode ser utilizada para auxiliar no processo de
formação de equipes.
• Outro aspecto relevante ao sucesso das equipes é a diversidade de
conhecimento entre os indivíduos. Um estudo mais aprofundado deste aspecto
é importante para a compreensão de como os mecanismos de formação de
equipes consideram este aspecto e como isto influencia no sucesso desta
equipe.
• O estudo da homofilia e da afinidade possui importância relevante para
determinar como estes aspectos sociais contribuem para o sucesso ou o
fracasso de uma equipe, pois estão relacionados com a aceitação de novas
idéias e conceitos.
• Apesar de enriquecer o modelo proposto, ao se utilizar um coeficiente de
correlação para valorar informações com característica binária pode-se
produzir erros. Assim torna-se importante o estudo de métodos para determinar
a relação entre os benefícios da análise de relações múltiplas com característica
binária em relação aos prejuízos da perda de informação devido aos
coeficientes de correlação.
• A proposta de um método para o cálculo do valor de corte para o fator de
proximidade social no processo de identificação dos indivíduos que compõem
uma equipe pode descartar a necessidade da análise de grupos pré-existentes e
melhorar a eficiência do modelo computacional proposto em novas áreas de
aplicação.
• A reputação e o prestígio são importantes aspectos sociais. Assim torna-se
importante estudar o uso do método proposto para valorar estes aspectos
sociais com o uso de relações múltiplas considerando o dinamismo da rede
social com o tempo.
• O estudo de métodos para determinar a eficiência de uma equipe é de grande
valia para a melhoria do processo de formação de uma equipe.
Vale ressaltar que o modelo computacional proposto neste trabalho de dissertação se
concentrou no estudo de caso para a analise da influência da rede social do líder de projeto na
formação da equipe de pesquisa, mas poderia ser estendido para uma aplicação prática como
meio auxiliar para a decisão da escolha de indivíduos para integrar novas equipes, como uma
ferramenta CSCW (Computer Supported Collaborative Work – Trabalho Colaborativo
Suportado por Computador) ou para a aplicação em outros domínios e ambientes onde
múltiplas relações, considerando o dinamismo temporal, podem ser combinadas para uma
determinada finalidade. Uma destas aplicações seria o uso do modelo proposto para a
negociação de bandas em redes de comunicação ou a escolha de empresas para compor a
cadeia produtiva de determinado produto em relacionamentos empresariais de parceria.
ANEXO 1
PLANILHA DE IDENTIFICAÇÃO DE INDIVÍDUOS DO GRUPO DE PESQUISA
MEMENTO Total de Participantes do Projeto 9 %Status do grupo: certificado pela instituição Participantes Identificados 6 66,7Ano de formação: 2004 Participantes Não Evidenciados 2 22,2Data da última atualização: 18/09/2007 11:17 Participantes Apenas Evidenciados 2 22,2
Total Participandes da Rede Social 8 88,9
Pesos da cadeia de recomendações:
1,000 1,000 0,800 0,800
Fator de Proximidade Social
n. Papel Participantes 357789089 36140675 37849280 384514941 Líder 36140675 0,103 0,081 0,000 0,000 0,0272 Líder 357789089 0,039 0,000 0,021 0,015 0,0083 Pesquisador 38451494 0,060 0,018 0,042 0,000 0,0004 Pesquisador 37849280 0,000 0,000 0,000 0,000 0,0005 Estudante 19964942 0,201 0,118 0,084 0,000 0,0006 Estudante 29208218 0,164 0,122 0,042 0,000 0,0007 Estudante 17654123 0,157 0,057 0,100 0,000 0,0008 Estudante 18270753 0,011 0,011 0,000 0,000 0,0009 Estudante 19283063 0,000 0,000 0,000 0,000 0,000
rede egocêntrica evidenciada
Tabela de Fatores de Proximidade Individual
ANEXO 2
MATRIZES RELACIONAIS UTILIZADAS PARA O CÁLCULO DO FATOR DE
PROXIMIDADE INDIVIDUAL
Ator:
357789089DOUTOR
relação:
Pesquisador 2003 2004 2005 2006 2007 2003 2004 2005 2006 2007 2003 2004 2005 2006 2007 2003 2004 2005 2006 20071478390 1 13789209 16100028 18410847 6 3
10721666 113032485 1 1 1 115343304 117654123 1 119964942 1 1 1 1 122275761 124586580 126897399 1 1 3 129208218 1 1 1 131519037 133829856 136140675 2 238451494 140762313 143073132 145383951 147694770 118270753 152316408 1 1 154627227 156938046 1 159248865 161559684 1
ORIENT-INICIAÇÃO CIENTÍFICAORIENTADOR-DOUTORANDOORIENTADOR-MESTRANDOCO-AUTORIA
ANEXO 3
TABELA COM O CÁLCULO DO FATOR DE PROXIMIDADE INDIVIDUAL E O
HISTOGRAMA COM A EVOLUÇÃO NA REDE SOCIAL
Rede Egocêntrica
357789089 relação: 2003 2004 2005 2006 2007 mestrado doutorado iniciação soma Méd Pond.DOUTOR peso: 1 2 3 4 5 3 4 1 2,947
co-autoria mestrado doutorado iniciação P |P|
1478390 0,600 0,000 0,600 0,000 0,360 0,122
3789209 0,533 0,800 0,000 0,000 0,347 0,118
6100028 1,400 0,000 0,000 0,000 0,280 0,095
8410847 0,000 0,800 0,000 0,000 0,240 0,081
10721666 1,200 0,000 0,000 0,000 0,240 0,081
13032485 0,267 0,600 0,000 0,000 0,233 0,079
15343304 0,333 0,333 0,000 0,000 0,167 0,057
17654123 0,800 0,000 0,000 0,000 0,160 0,054
19964942 0,600 0,000 0,000 0,000 0,120 0,041
22275761 0,600 0,000 0,000 0,000 0,120 0,041
24586580 0,000 0,333 0,000 0,000 0,100 0,034
26897399 0,267 0,000 0,000 0,000 0,053 0,018
29208218 0,267 0,000 0,000 0,000 0,053 0,018
31519037 0,267 0,000 0,000 0,000 0,053 0,018
33829856 0,267 0,000 0,000 0,000 0,053 0,018
36140675 0,000 0,000 0,000 0,333 0,033 0,011
38451494 0,000 0,000 0,000 0,333 0,033 0,011
40762313 0,000 0,000 0,000 0,333 0,033 0,011
43073132 0,000 0,000 0,000 0,333 0,033 0,011
45383951 0,000 0,000 0,000 0,333 0,033 0,011
47694770 0,000 0,000 0,000 0,333 0,033 0,011
18270753 0,000 0,000 0,000 0,333 0,033 0,011
52316408 0,000 0,000 0,000 0,267 0,027 0,009
54627227 0,000 0,000 0,000 0,267 0,027 0,009
56938046 0,133 0,000 0,000 0,000 0,027 0,009
59248865 0,000 0,000 0,000 0,267 0,027 0,009
61559684 0,000 0,000 0,000 0,267 0,027 0,009
0,000 0,020 0,040 0,060 0,080 0,100 0,120 0,140
1478390
3789209
6100028
8410847
10721666
13032485
15343304
17654123
19964942
22275761
24586580
26897399
29208218
31519037
33829856
36140675
38451494
40762313
43073132
45383951
47694770
18270753
52316408
54627227
56938046
59248865
61559684
ANEXO 4
GRÁFICO EM FORMA DE RADAR
357789089
0,820
0,840
0,860
0,880
0,900
0,920
0,940
0,960
0,980
1,000
12
3
4
5
6
7
8
9
10
11
1213
1415
16
17
18
19
20
21
22
23
24
2526
REFERÊNCIAS BIBLIOGRÁFICAS
BIAGGIO, M.; GREENE, B. Overlapping/Dual Relationship In: RAVE, E. J., LARSEN, C.
C. Ethical Decision Making in Therapy: Feminist Perspectives, Guilford press, 1995.
cap.6, p.92. Disponível em : <http://books.google.com/books?hl=pt-BR&lr=&id=
hZfU4rebmbAC&oi=fnd&pg=PA88&dq=%22social+network%22+%22professor-student
+relationship%22+&ots=XGJxe9z1G7&sig=XQgyFXrirvle6Aa-cNs2TPWzRp8> Acesso
em: 24 mar. 2008.
BERGER-WOLF, T. Y.; SAIA, J. A framework for analysis of dynamic social networks. In:
Procedings KDD’06, 2006. p.523-528.
BORTOLI, E. M. ; TACLA, C. A. . Percepção de Contextos de Atividade para Identificação
de Comunidades Potenciais. In: Simpósio Brasileiro de Sistemas Colaborativos, 2006,
Natal. Anais do Simpósio Brasileiro de Sistemas Colaborativos, 2006.
CAI, D.; SHAO, Z.; HE, X.; YAN, X.; HAN, J. Mining Hidden Community in
Heterogeneous Social Networks. 2005. Disponível em: < http://data.isi.edu/conferences/
linkkdd-05/ Download/Papers/linkkdd05-09.pdf> Acesso em: 10 mar. 2008.
CHUNG, K. K.; HOSSAIN, L.; DAVIS, J. Exploring Sociocentric and Egocentric
Approaches for Social Network Anaysis. International Conference on Knowledge
Management Asia Pacific. Victoria University, Wellington, New Zealand, nov.. 2005.
p.27-29.
CONTE, R.; PAOLUCCI, M. Reputation in Artificial Societies: social beliefs for social
order. Massachusetts, USA. Kluwer Academics Publishers. 2002.
CUMMINGS, J. N.; KIESLER, S. Who works with whom? Collaborative tie strength in
distributed interdisciplinary projects. In: Third International Conference on e-Social
Science, Arbour, Michigan 2007 Disponível em: <http://ess.si.umich.edu/
papers/paper196.pdf>. Acesso em: 10 mar. 2008.
ENEMBRECK, F.; SCALABRIN, E. ; TACLA, C. A. ; AVILA, B. C. . Automatic
Identification of Teams based on Textual Information Retrieval. Lecture Notes in
Computer Science, v. 4402, p. 1-10, 2007.
ENEMBRECK, F.; SCALABRIN, E. E., Tacla, C. A.; Ávila, B. C. Automatic Identification
of Teams Base don Textual Information Retrival. Procedings of the 10th International
Conference on Computer Supported Cooperative Work in Design (CSCWD 2006).
Southeast University, Nanjing, China, 2006.
FISCHER, D. Using Egocentric Networks to Understand Communication. IEEE Internet
Computing. Set.2005. v.9 p.20 – 28.
FREEMAN, L. C. Centrality in social networks: I. Concept Clarification. Social Networks.
Cap.1 p.215-239, 1979. apud WASSERMAN, S.; FAUST, K. Social Network Analysis:
Methods and Applications. Nova York: Cambridge University Press. 1994.
GASTON, M. E.; DesJARDINS, M. Social Network and Multi-agent Organizacional
Performance. 2005 Disponível em: <http://citeseer.ist.psu.edu/749853.html> Acesso em:
10 mar. 2008.
GASTON, M. E.; SIMMONS, J.; DesJARDINS, M. Adapting Network Structure for Efficient
Team Formation. In Proceedings of the AAAI-2004 Fall Symposium on Learning in
Multi-agent Systems. Washington, D.C., 2004.
GIMÉNEZ LUGO, G. A. UM MODELO DE SISTEMAS MULTIAGENTES PARA
PARTILHA DE CONHECIMENTO UTILIZANDO REDES SOCIAIS
COMUNITÁRIAS. TESE (Doutorado) – Escola Politécnica da Universidade de São
Paulo, Departamento de Engenharia de Computação e Sistemas Digitais. São Paulo, 2004
GUIMERÀ, R.; UZZI, B.; SPIRO, J.; AMARAL, L. A. N. Team Assembly Mechanisms
Determine Collaboration Network Structure and Team Performance. Science. V.308.
p.697-702. abr.2005.
HAHN, J.; MOON, J. Y.; ZHANG, C. Impact of social ties on open source project team
formation. IFIP International Federation for Information Processing. V.203, p.307-
317, Springer Boston, 2006. Disponível em: <http://www.springerlink.com/content/
m651251187257773/>. Acesso em: 08 mar. 2008.
LONG, B.; ZHANG, Z.; YU, P. S. A Probabilistic Framework for Relational Clustering. In:
Conference on Knowledge Discovery in Data. Proceedings of the 13th ACM SIGKDD
international conference on Knowledge discovery and data mining. Califórnia, EUA,
2007. p. 470-479. Disponível em: < http://portal.acm.org/citation.cfm?id=1281192.
1281244> Acesso : 19.mar.2008
MATSUO, Y.; HAMASAKI, M.; NAKAMURA, Y.; TAKEDA, H.; MORI, J.;
BOLLEGALA, D.; ISHIZUKA, M. Spinning Multiple Social Networks for Semantic Web.
American Association for Artificial Inteligence AAAI, 2006. Disponível em : <
http://ymatsuo.com/papers/aaai06.pdf> Acesso : 19.mar.2008.
MATSUO, Y.; HASIDA, K.; TOMOBE, H.; ISHIZUKA, M. Mining Social Network of
Conference Participants form the Web. International Conference on Web Intelligence
(WI’03), 2003
McDONALD, D. W. Recommending Collaboration with Social Networks: A Comparative
Evaluation. In: Recommender Systems and Social Computing. CHI, 2003 V.5, p.593 -600.
MORI, J.; SUGIYAMA, T.; MATSUO, Y. Real-world Oriented Information Sharing Using
Social Networks. In: Conference on Supporting Group Work . Proceedings of the 2005
international ACM SIGGROUP conference on Supporting group work. Flórida, EUA,
2005. p.81-84. Disponível em :< http://portal.acm.org/citation.cfm?id=1099203. 1099215>
Acesso : 19.mar.2008.
MORI, J.; TSUJISHITA, T.; MATSUO, Y. ISHIZUKA, M. Extration Relations in Social
Networks form the Web using Similarity between Collective Contexts. In: Lecture Notes
in Computer Science. Springer . 2006 v. 4273/2006. Disponível em :< http://www.
springerlink.com/ content/9ln113238441631w/ > Acesso : 19.mar.2008.
NOOY, W.; MRVAR, A.; BATAGELJ, V. Exploratory Social Network Analysis with
Pajek. Cambridge University press, New York, U.S.A. 2005.
OUNNAS, A.; DAVIS, H.C.;MILLARD, D.E. Semantic Modeling for Group Formation. In:
Workshop on Personalisation in E-Learning Environments at Individual and Group
Level (PING) at the 11th International Conference on User Modeling UM2007, Corfu,
Greece. 2007.
PLATAFORMA LATTES, 1999. Disponível em http: <//lattes.cnpq.br/>. Acesso em: 08 mar.
2008.
SAID, Y. H.; WEGMAN, E. J.; SHARABATI, W. K.; RIGSBY, J. T. Social Network of
Author-coauthor Relationships. Computacional Statistics & Data Analysis. v.52, p.2177-
2184. jan. 2008.
SCHLICHTER, J.H.; KOCH, M.; XU, C. Awareness – the common link between groupware
and community support systems. In: Kyoto Meeting on Social Interaction and
Communityware. Community Computing and Support Systems. Springer, 1998. p. 77-
93. Disponível em: < http://www.springerlink.com/content/6vt83br7ylnhgaxk/>. Acesso
em: 7 mar. 2008.
SCOTT, John. Social Network Analysis, a handbook. Londres: SAGE publications, 2° Ed.,
2000. cap. 2, p.9-21.
TACLA, C. A. ; GIMÉNEZ-LUGO, G. A. ; RAMOS, M. P. ; ENEMBRECK, Fabrício .
Social Nets in Knowledge Sharing. In: International Symposium on the Management of
Industrial and Corporate Knowledge (ISMICK06), 2006, Stellenbosch. The
Proceedings of the 11th International Symposium on the Management of Industrial and
Corporate Knowledge. Stellenbosch, 2006.
TANTIPATHANANANDH, C.; WOLF, T. B.; KEMPE, D. A Framework for Community
Identification in Dynamic Social Networks. In: Conference on Knowledge Discovery in
Data. Proceedings of the 13th ACM SIGKDD international conference on Knowledge
discovery and data mining, Califórnia, EUA, 2007. p.717-726. Disponível em: < http://
portal.acm.org/citation.cfm?id=1281192.1281269> Acesso : 19.mar.2008
WASSERMAN, S.; FAUST, K. Social Network Analysis: Methods and Applications.
Nova York: Cambridge University Press. 1994.
WATTS, D. J.; DODDS, P. S.; NEWMAN, M. E. J. Identify and search in social networks.
Science, V. 296, p.1302-1305. 2002.
WATTS, D. J. Six Degrees: the science of a connected age. W. W. Norton & Company,
New York, USA, 2003.
WUCHTY, S.; JONES, B. F.; UZZI, B. The Increasing Dominante of Teams in Production of
Knowledge. Science. V.316. p.1036-1039. mai.2007.
XIAOQIN, Z.; HAIPING, X.; BHAVESH S. An Integrated Role-Based Approach for
Modeling, Designing and Implementing Multi-Agent Systems. JBCS – Journal of the
Brazilian Computer Society, 2007. Disponível em :
<http://www.cis.umassd.edu/~hxu/ Papers/UMD/ JBCS-July-2007.pdf > Acesso :
19.mar.2008
RESUMO:
Dentro da área Sistemas Colaborativos, esta dissertação se enquadra no tema de
formação de equipes de projeto. É proposto um modelo computacional, fundamentado na
teoria de redes sociais, para a formação de equipes de pesquisa baseado nas redes sociais
egocêntricas de líderes de projeto, considerando as múltiplas relações sociais e o
dinamismo ao longo do tempo para calcular um fator relacional utilizado para identificar
integrantes pertencentes a uma equipe.
Para verificar a viabilidade de realização e a qualidade dos resultados fornecidos
pelo modelo computacional a ser utilizado em uma ferramenta de auxílio à formação de
equipes, fez-se um estudo de caso. Neste estudo, foram extraídas informações dos
currículos Lattes e do diretório de grupos de pesquisa do CNPq com o objetivo de
representar as redes egocêntricas e valorar as relações para identificar os indivíduos de
grupos de pesquisa. Os experimentos foram realizados em 23 grupos de pesquisa onde
participam pesquisadores do CPGEI – Curso de Pós-Graduação em Engenharia Elétrica e
Informática Industrial da Universidade Tecnológica Federal do Paraná.
Como conclusão geral do trabalho, verificou-se que o modelo pode ser realizado
computacionalmente e apresenta resultados qualitativos satisfatórios.
PALAVRAS-CHAVE
Redes Sociais, CSCW
ÁREA/SUB-ÁREA DE CONHECIMENTO
10300007 - Ciências da Computação
10301011 - Computabilidade e Modelos de Computação
10303049 - Sistemas de Informação
2008
Nº: 475
Livros Grátis( http://www.livrosgratis.com.br )
Milhares de Livros para Download: Baixar livros de AdministraçãoBaixar livros de AgronomiaBaixar livros de ArquiteturaBaixar livros de ArtesBaixar livros de AstronomiaBaixar livros de Biologia GeralBaixar livros de Ciência da ComputaçãoBaixar livros de Ciência da InformaçãoBaixar livros de Ciência PolíticaBaixar livros de Ciências da SaúdeBaixar livros de ComunicaçãoBaixar livros do Conselho Nacional de Educação - CNEBaixar livros de Defesa civilBaixar livros de DireitoBaixar livros de Direitos humanosBaixar livros de EconomiaBaixar livros de Economia DomésticaBaixar livros de EducaçãoBaixar livros de Educação - TrânsitoBaixar livros de Educação FísicaBaixar livros de Engenharia AeroespacialBaixar livros de FarmáciaBaixar livros de FilosofiaBaixar livros de FísicaBaixar livros de GeociênciasBaixar livros de GeografiaBaixar livros de HistóriaBaixar livros de Línguas
Baixar livros de LiteraturaBaixar livros de Literatura de CordelBaixar livros de Literatura InfantilBaixar livros de MatemáticaBaixar livros de MedicinaBaixar livros de Medicina VeterináriaBaixar livros de Meio AmbienteBaixar livros de MeteorologiaBaixar Monografias e TCCBaixar livros MultidisciplinarBaixar livros de MúsicaBaixar livros de PsicologiaBaixar livros de QuímicaBaixar livros de Saúde ColetivaBaixar livros de Serviço SocialBaixar livros de SociologiaBaixar livros de TeologiaBaixar livros de TrabalhoBaixar livros de Turismo