97
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ PR UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CAMPUS CURITIBA PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E INFORMÁTICA INDUSTRIAL - CPGEI JOEL CARLOS VIEIRA REINHARDT MODELO COMPUTACIONAL PARA FORMAÇÃO DE EQUIPES BASEADO NAS REDES EGOCÊNTRICAS DE LÍDERES DE PROJETO DISSERTAÇÃO DE MESTRADO CURITIBA MAIO 2008

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ …livros01.livrosgratis.com.br/cp155547.pdf · a formação de uma equipe de pesquisa de forma personalizada, onde cada pesquisador possa

Embed Size (px)

Citation preview

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁPR

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CAMPUS CURITIBA

PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E INFORMÁTICA INDUSTRIAL - CPGEI

JOEL CARLOS VIEIRA REINHARDT

MODELO COMPUTACIONAL PARA FORMAÇÃO DE EQUIPES BASEADO NAS REDES EGOCÊNTRICAS

DE LÍDERES DE PROJETO

DISSERTAÇÃO DE MESTRADO

CURITIBA MAIO 2008

Livros Grátis

http://www.livrosgratis.com.br

Milhares de livros grátis para download.

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial

DISSERTAÇÃO apresentada à UTFPR

para obtenção do grau de

MESTRE EM CIÊNCIAS

por

JOEL CARLOS VIEIRA REINHARDT

MODELO COMPUTACIONAL PARA FORMAÇÃO DE

EQUIPES BASEADO NAS REDES SOCIAIS

EGOCÊNTRICAS DE LÍDERES DE PROJETO

Banca Examinadora:

Presidente e Orientador:

Prof. Dr. CÉSAR AUGUSTO TACLA UTFPR

Examinadores:

Prof. Dr.GUSTAVO A. GIMÉNEZ LUGO UTFPR

Prof. Dr. EDSON E. SCALABRIN PUC-PR

Curitiba, 13 de maio de 2008.

JOEL CARLOS VIEIRA REINHARDT

MODELO COMPUTACIONAL PARA FORMAÇÃO DE EQUIPES BASEADO NAS

REDES SOCIAIS EGOCÊNTRICAS DOS LÍDERES DE PROJETO

Dissertação apresentada ao Programa de Pós-

Graduação em Engenharia Elétrica e Informática

Industrial do Centro Federal de Educação Tecnológica

do Paraná, como requisito parcial para a obtenção do

grau de “Mestre em Ciências” – Área de

Concentração: Informática Industrial.

Orientador: Prof. Dr.César Augusto Tacla

Curitiba

Maio 2008

Ficha catalográfica elaborada pela Biblioteca da UTFPR – Campus Curitiba

R369m Reinhardt, Joel Carlos Vieira Modelo computacional para formação de equipes baseado nas redes egocên- tricas de lideres de projeto / Joel Carlos Vieira Reinhardt. Curitiba. UTFPR 2008 X, 79 p. : il. ; 30 cm Orientador: Prof. Dr. César Augusto Tacla Dissertação (Mestrado) – Universidade Tecnológica Federal do Paraná. Pro- grama de Pós-Graduação em Engenharia Elétrica e Informática Industrial. Cu- ritiba, 2008 Bibliografia: P. 75 – 79 1. Sistemas de identificação. 2. Sistemas multiagentes. 3. Grupos de trabalho - Formação. 4. Estrutura social. I. Tacla, César Augusto, orient. II. Universida- de Tecnológica Federal do Paraná. Programa de Pós-Graduação em Engenha- ria Elétrica e Informática Industrial. III. Título. CDD: 003.1

AGRADECIMENTOS

A Deus, que sempre me guiou por Seus caminhos e

deu-me forças para vencer as dificuldades e seguir em frente.

À minha esposa Luciane, que teve paciência e voluntariamente assumiu muitas tarefas

que me cabiam, para que eu dedicasse todo o tempo às tarefas do mestrado.

A filha Luíza que está por vir, e com ela sonhos a se realizar.

Aos meus familiares que compreenderam

minha ausência, incentivando e torcendo pelo meu êxito.

Em especial Dr. Nancy, Dr. Dalmo, Msc. Denise e Dr. Cláudio,

que já trilharam o caminho da pesquisa e me deram o exemplo a

trilhar mostrando as dificuldades e conquistas deste caminho.

Ao Eng°. Ricardo Lamberti de Faria que

sempre apoiou o desenvolvimento de seus funcionários.

Ao Prof. Dr. Mário Sérgio Texeira de Freitas pelo suporte, exemplo e incentivo.

Aos profissionais que colaboraram com seu conhecimento, apoio e idéias:

Prof. Msc Fabio Calliari, Prof. Robison Cris Brito, Prof. Msc Ademir Roberto Freddo.

Aos colegas e amigos que me incentivaram, colaboraram e compreenderam.

Msc Águeda Bodnar, Prof. Msc Adrien Sanches, Prof. Msc Maurício Taques,

Profª. Msc Bárbara Taques, Eng. Adrianus Bassoi, Eng. Anselmo Almeida.

Ao Prof. Dr. Gustavo A. Giménez Lugo por compartilhar da vontade de evoluir

constantemente, auxiliar a compreender os a“gentes” em suas particularidades e,

por demonstrar, que apenas superaremos os obstáculos se dermos os primeiros passos.

Ao Prof. Dr. César Augusto Tacla pelo exemplo, por orientar,

compartilhar conhecimentos, iluminar caminhos obscuros

e confiar no espírito científico que norteia a experiência humana.

Aos cientistas da área de inteligência artificial, sistemas multiagentes, sociologia,

psicologia, redes sociais, teoria do caos e dinâmica não linear que,

como gigantes, sustentam em seus ombros

o desenvolvimento científico em nossa área de pesquisa.

SUMÁRIO

LISTA DE FIGURAS......................................................................................................... vii

LISTA DE TABELAS........................................................................................................ viii

LISTA DE ABREVIATURAS E SIGLAS........................................................................ ix

RESUMO............................................................................................................................. x

ABSTRACT.......................................................................................................................... xi

1 INTRODUÇÃO................................................................................................................ 1

1.1 DESCRIÇÂO DO PROBLEMA................................................................................ 1

1.2 MOTIVAÇÕES.......................................................................................................... 3

1.3 OBJETIVOS............................................................................................................... 3

1.3.1 Objetivos Específicos.......................................................................................... 4

1.4 JUSTIFICATIVA........................................................................................................ 5

1.5 ESTRUTURA DA DISSERTAÇÃO.......................................................................... 6

2 FUNDAMENTAÇÃO TEÓRICA.................................................................................. 7

2.1 REDES SOCIAIS....................................................................................................... 7

2.1.1 Representação de Redes Sociais ......................................................................... 8

2.1.2 Abordagem Egocêntrica...................................................................................... 9

2.1.3 Abordagem Sociocêntrica.................................................................................... 10

2.2 ANÁLISE DE REDES SOCIAIS ............................................................................. 10

2.2.1 Conceitos fundamentais da Análise de Redes Sociais......................................... 11

2.2.2 Aspectos Sociais da Análise de Redes Sociais..................................................... 15

2.2.3 Tipos de Ligações Sociais.................................................................................... 17

2.2.4 Análise de Redes Sociais com Relações Múltiplas ............................................. 19

2.2.5 Propriedades Estruturais para a Análise de Redes ............................................... 19

2.3 TRABALHOS RELACIONADOS ........................................................................... 22

2.4 CONCLUSÃO............................................................................................................ 27

3 MODELO COMPUTACIONAL PROPOSTO ............................................................ 29

3.1 OBJETO DA PROPOSTA DO MODELO COMPUTACIONAL............................. 29

3.1.1 Modelo Computacional ....................................................................................... 31

3.2 MATERIAIS E INFRA-ESTRUTURA ..................................................................... 33

3.2.1 Meios Computacionais ....................................................................................... 33

3.2.2 Coleta de Informações.. ....................................................................................... 34

3.2.3 Processo de Extração de Informações ................................................................. 34

3.2.3.1 Validade da Plataforma Lattes...................................................................... 35

3.3 CONSTRUÇÃO DAS REDES EGOCÊNTRICAS .................................................. 36

3.3.1 Relação Co-autoria.............................................................................................. 37

3.3.2 Relação Orientador-Orientado ............................................................................. 38

3.3.3 Representação da Rede Social Egocêntrica ......................................................... 39

3.4 PROCESSO DE IDENTIFICAÇÃO DOS PESQUISADORES ............................... 40

3.4.1 Método de Cálculo do Fator de Proximidade Individual .................................... 41

3.4.2 Método de Cálculo do Fator de Proximidade Social .......................................... 48

3.4.3 Valor de Corte para Identificação dos Pesquisadores.......................................... 49

3.5 JUSTIFICATIVAS PARA O MODELO COMPUTACIONAL PROPOSTO .......... 51

3.6 CONCLUSÕES ......................................................................................................... 52

4 RESULTADOS DO ESTUDO DE CASO .................................................................... 53

4.1 ESTUDO DE CASO .................................................................................................. 53

4.1.1 Discussão sobre os Grupos de Pesquisa............................................................... 59

4.2 LIMITAÇÕES DO MODELO COMPUTACIONAL PROPOSTO ......................... 60

4.2.1 Dificuldades Encontradas no Decorrer do Trabalho ........................................... 62

4.3 CONCLUSÕES ......................................................................................................... 63

5 CONCLUSÕES ............................................................................................................... 64

5.1 RECAPITULAÇÃO DOS OBJETIVOS DO TRABALHO ..................................... 64

5.2 CONTRIBUIÇÕES ESPERADAS ............................................................................ 65

5.3 CONCLUSÕES ......................................................................................................... 66

5.4 TRABALHOS FUTUROS ........................................................................................ 68

ANEXO 1 – PLANILHA DE IDENTIFICAÇÃO DE INDIVÍDUOS DO GRUPO

DE PESQUISA ................................................................................................................... 71

ANEXO 2 – MATRIZES RELACIONAIS UTILIZADAS PARA O CÁLCULO DO

FATOR DE PROXIMIDADE INDIVIDUAL ................................................................. 72

ANEXO 3 – TABELA COM O CÁLCULO DO FATOR DE PROXIMIDADE

INDIVIDUAL E O HISTOGRAMA COM A EVOLUÇÃO NA REDE SOCIAL..... 73

ANEXO 4 – GRÁFICO EM FORMA DE RADAR ........................................................ 74

REFERÊNCIAS BIBLIOGRÁFICAS.............................................................................. 75

LISTA DE FIGURAS

1 Sociograma de Moreno ou Grafo em Estrela................................................................ 10

2 Comunidade, Grupo e Equipe....................................................................................... 14

3 Gráfico que mostra a região onde a busca por redes sociais é possível, limitada pelo

grau e homofilia e pelo número de dimensões sociais consideradas ............................ 17

4 Etapas do Modelo Computacional................................................................................. 30

5 Estruturas Funcionais para Extração de Informações ................................................... 31

6 Fases de Extração de Informação do Currículo Lattes.................................................. 35

7 Esquema do Processo de Identificação de Pesquisadores ............................................ 41

8 Esquema do Cálculo do Fator de Proximidade Individual............................................ 42

9 Gráfico em Radar da Rede Egocêntrica de um Pesquisador ........................................ 48

10 Gráficos de Evolução do Fator de Proximidade Social divididos pelos Papéis no

Grupo de Pesquisa ........................................................................................................ 50

11 Gráficos da Porcentagem de Identificação dos Indivíduos Pertencentes

aos Grupos de Pesquisa com pelo menos um Integrante do CPGEI da

UTFPR........................................................................................................................... 56

LISTA DE TABELAS

1 Matriz Relacional de um Pesquisador........................................................................... 44

2 Fator de Proximidade Individual de um Pesquisador................................................... 47

3 Resultados de Identificação de Pesquisadores utilizando apenas informações dos

pesquisadores do CPGEI/UTFPR ................................................................................

54

4 Resultados de Identificação de Pesquisadores utilizando informações de todos os

grupos de pesquisa que possuam pelo menos um integrante do CPGEI/UTFPR ........

57

5 Proporção de Identificação em Relação ao Papel no Grupo de Pesquisa ..................... 58

6 Resultados de Identificação de Pesquisadores através da Abordagem de Comparação

de Contexto ...................................................................................................................

59

LISTA DE ABREVIATURAS E SIGLAS

CPGEI - Programa de Pós-graduação em Energia Elétrica e Informática Industrial

UTFPR - Universidade Tecnológica Federal do Paraná

CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico

RESUMO

Dentro da área de Sistemas Colaborativos, esta dissertação se enquadra no tema de

formação de equipes de projeto. É proposto um modelo computacional fundamentado na

teoria de redes sociais para a formação de equipes de pesquisa baseado nas redes sociais

egocêntricas de líderes de projeto, considerando as múltiplas relações sociais e o dinamismo

ao longo do tempo para calcular um fator de proximidade relacional utilizado para identificar

integrantes pertencentes a um grupo.

Para verificar a viabilidade de realização e a qualidade dos resultados fornecidos pelo

modelo computacional caso fosse utilizado em uma ferramenta de auxílio à formação de

equipes, fez-se um estudo de caso. Neste estudo, foram extraídas informações dos currículos

Lattes e do diretório de grupos de pesquisa do CNPq com o objetivo de representar as redes

egocêntricas e valorar as relações para identificar os indivíduos dos grupos de pesquisa. Os

experimentos foram realizados em 22 grupos de pesquisa do CPGEI – Curso de Pós-

Graduação em Engenharia Elétrica e Informática Industrial da Universidade Tecnológica

Federal do Paraná.

Como conclusão geral do trabalho, verificou-se que o modelo pode ser realizado

computacionalmente e apresenta resultados qualitativos satisfatórios.

Palavras-chave: Redes Sociais, CSCW.

ABSTRACT

TITLE: COMPUTACIONAL MODEL TO TEAM FORMATION BASED IN THE SOCIAL NETWORK OF TEAM LEADER

This dissertation has the issue of Project Team Formation, in the area of collaborated

systems. In this work is proposed a computational model based in network theory to team

formation based in the egocentric network of team leader, considering multiples social

relations and the temporal dynamics to calculate a relational proximity factor used to identify

possible persons that could belongs to a team.

This computational model was verified in a case study. In this case study, social

network’s information was recovered in curriculum documents available in platform Lattes, in

the subdirectory of research groups of CNPq. This information was used to construct the

representation of egocentrics network and valuated this social relations to identify actors that

could belongs to a research group. In this case study, 22 research groups in CPGEI/UTFPR –

Curso de Pós Graduação em Engenharia Elétrica e Informática Industrial da Universidade

Tecnológica Federal do Paraná – were analyzed.

As conclusion of this work was possible verify that this computational model can be

implemented and produce satisfactory qualitative results.

Key words: CSCW, Social Network.

CAPÍTULO 1

INTRODUÇÃO

Neste primeiro capítulo é discutido o problema a ser explorado na pesquisa, o objetivo

geral e os específicos. Em seguida, apresentam-se as justificativas com as contribuições

esperadas e a estrutura geral do trabalho.

1.1 DESCRIÇÃO DO PROBLEMA

O estudo da formação de equipes é fundamental para uma série de disciplinas,

incluindo o planejamento e o aprendizado em sistemas multiagentes, sistemas sociais

artificiais e inteligência artificial distribuída. A construção de organizações efetivas nas

sociedades reais ou artificiais é dependente de estruturas sociais que permitem a formação

eficiente de equipes para a execução de tarefas complexas (GASTON; SIMMONS,

DesJARDINS, 2004).

Aspectos individuais devem ser considerados na formação de equipes de pesquisa, já

que as necessidades de cada integrante tendem a ser diferentes. O líder de projeto deve buscar

a formação de uma equipe de pesquisa de forma personalizada, onde cada pesquisador possa

maximizar os benefícios do trabalho colaborativo (como a utilização da rede de contatos dos

pesquisadores para a indicação de amigos de amigos, a aquisição de conhecimento, de

recursos financeiros e materiais e a obtenção de prestígio ou popularidade). O estudo da

formação de equipes, além de proporcionar um modelo para a compreensão dos aspectos

individuais dos líderes de projeto, fornece parâmetros que podem ser usados como um

conjunto de restrições para identificar os requisitos para a formação de uma equipe de

pesquisa, tais como, por exemplo, experiências, papel no grupo, gênero do pesquisador,

localização geográfica e instituição onde atua. (OUNNAS, DAVIS, MILLARD, 2007).

Um problema comum em organizações é identificar pessoas ou competências que

atendam às necessidades de uma equipe de pesquisa ou projeto autogerenciável, tanto no meio

acadêmico quanto na indústria (ENEMBRECK et al., 2006). Hahn e co-autores (2006)

descrevem a importância das relações sociais na formação de equipes de projeto para o

desenvolvimento de software livre. Neste estudo foi possível evidenciar que a pré-existência

de relações entre os participantes aumenta as chances de engajamento destes no projeto.

Também foi possível evidenciar que o engajamento de novos indivíduos com experiência foi

favorecido quando estes indivíduos já possuíam relações pré-existentes com outras pessoas

envolvidas no projeto. Já no caso onde os participantes não possuíam relacionamentos pré-

existentes, apenas os indivíduos com pouca experiência tendem a se engajar no projeto.

Gaston e DesJardins (2005) demonstram que a rede social existente entre os

indivíduos de uma organização pode ter um impacto significante no desempenho

organizacional, pois a sua estrutura define o fluxo de informações, recursos, deveres e direitos

e influencia diretamente no processo de formação de times para a execução de determinadas

tarefas. Assim, torna-se necessário o estudo da identificação de estruturas sociais eficientes,

em particular, com técnicas de aprendizado organizacional descentralizadas baseadas em

adaptação local da rede social.

A importância do estudo de formação de equipes surge da necessidade de unir

indivíduos com diferentes idéias, habilidades e recursos, estimulando a criatividade pelo

aumento da diversidade de forma a resolver problemas antigos e inspirar um novo

pensamento, levando em conta a habilidade da maioria dos integrantes em trabalhar e

compartilhar conhecimento com antigos colegas. Também se deve considerar o tamanho da

equipe que deve ser grande o suficiente para promover a especialização e divisão efetiva do

trabalho entre os integrantes, porém pequena o suficiente para arcar com os custos de

coordenação (GUIMERÀ et al., 2005). Os processos de busca de informações e colaboração

no ambiente de trabalho demonstra que os relacionamentos sociais são um forte fator na

determinação de quem colabora com quem (McDONALD, 2003).

A problemática desta dissertação é a análise de redes sociais para determinar os

parâmetros da rede social egocêntrica do líder de projeto que possam ser utilizados na

valoração de relações sociais para orientar a indicação de pesquisadores com o objetivo de

formação de uma equipe de pesquisa. O problema deve considerar a determinação da rede

social egocêntrica dos pesquisadores levando em consideração os aspectos das múltiplas

relações analisadas (co-autoria, relações orientador-orientado), aspectos temporais (quando

ocorreu determinada relação) e características individuais (cidade onde reside, área de

pesquisa, instituição onde atua, etc.).

1.2 MOTIVAÇÕES

Em trabalhos anteriores realizados no grupo de pesquisa MEMENTO/CPGEI, buscou-

se identificar automaticamente comunidades, grupos e equipes pela extração de informações

de documentos eletrônicos manipulados por membros de uma organização (BORTOLI,

TACLA, 2006; TACLA et al., 2006) e de currículos da plataforma Lattes (ENEMBRECK et

al., 2007). Nestes trabalhos comprovou-se que a partir da extração de palavras relevantes de

documentos e do emprego de técnicas baseadas em freqüência de palavras é possível

identificar comunidades e equipes potenciais com grau de sucesso bastante satisfatório.

Porém, as representações ad-hoc utilizadas para a representação das comunidades e equipes

não permitem análises detalhadas como permitem as redes sociais. O aspecto temporal das

ligações interpessoais foi abordado nestes trabalhos de forma superficial.

Portanto, uma das motivações deste trabalho é dotar os anteriores de uma

fundamentação teórica em redes sociais que permitem representar comunidades e equipes

formalmente e analisá-las em função de diversos parâmetros, tais como, as relações existentes

entre os membros, a intensidade de cada relação e o efeito da composição de múltiplas

relações, o efeito do aspecto temporal na intensidade destas relações e a identificação de

padrões de comportamento que possam auxiliar na formação de equipes. Além disso, a

extração de informações baseada unicamente em palavras relevantes pode ser melhorada com

a coleta de outras evidências de relações interpessoais, tais como, co-autoria de trabalhos e

orientações de alunos para o caso de identificação de uma comunidade de professores

pesquisadores.

Os aspectos apresentados acima motivaram o estudo de formação de equipes de

pesquisa buscando uma abordagem inovadora por meio da utilização de múltiplas relações

analisadas durante o decorrer de um determinado período de tempo.

1.3 OBJETIVOS

Esse estudo pretende, como objetivo geral, identificar os parâmetros da rede social

egocêntrica de líderes de projeto para a formação de equipes, considerando diferentes tipos de

relações sociais e as alterações destas relações no decorrer do tempo.

1.3.1 Objetivos Específicos

Os objetivos específicos deste trabalho são:

1. Pesquisar na Plataforma Lattes informações sobre os pesquisadores e construir

a rede social egocêntrica destes pesquisadores e dos líderes de projeto.

2. Criar um modelo computacional que considere as múltiplas relações sociais e o

dinamismo destas relações com o passar do tempo, para analisar a rede social

egocêntrica do líder de projeto e a cadeia de recomendações formada pelos

demais integrantes.

3. Utilizar estas informações para identificar os pesquisadores que compõem os

grupos de pesquisa analisados.

4. Validar o método proposto na dissertação através de um estudo de caso

realizado com as equipes de pesquisa do CPGEI da UTFPR.

Como parte das contribuições esperadas desta dissertação, o modelo computacional

proposto deve responder a diversas perguntas que permitam projetar um sistema que auxilie a

formação de equipes utilizando informações sobre as relações sociais e atributos dos

indivíduos:

1. Como construir uma representação manipulável computacionalmente das

diversas redes sociais das comunidades pesquisadas às quais pertence o

indivíduo, de forma a se aproximar da visão do próprio pesquisador?

2. Como pode ser relacionada a valoração dos relacionamentos, pela freqüência

de ocorrência e a temporalidade, com a rede social de um usuário?

3. Como utilizar a composição de relacionamentos e a rede social do usuário para

localizar pessoas que possuam conhecimentos, reputação e experiências em um

certo domínio?

4. Como construir a rede social egocêntrica em relação ao contexto acadêmico de

um usuário sem a intervenção da sua parte?

5. Como pode o usuário ter sua privacidade preservada sem inviabilizar a partilha

de informações sobre diferentes recursos (currículos, rede de contatos, área de

atuação, etc.)?

6. Quais as contribuições deste método para CSCW (Computer Supported

Collaborative Work – Trabalho Colaborativo Suportado por Computador)?

1.4 JUSTIFICATIVA

A pesquisa realizada por Whuchty, Jones e Uzzi (2007) sobre a produção científica em

artigos e patentes nas últimas cinco décadas mostrou que equipes de pesquisa superam os

pesquisadores solitários na produção de conhecimento em praticamente todos os campos.

Porém, as equipes de pesquisa devem lidar com perdas ocasionadas pela própria rede social e

pelas atividades de coordenação, podendo isto causar perda de eficiência a ponto de

possuírem desempenho inferior a pesquisadores solitários. A compreensão destes aspectos

possui grande relevância social por contribuírem com a formação de equipes de pesquisa

com maior eficiência para o desenvolvimento de conhecimento científico.

A análise da rede social egocêntrica dos pesquisadores, proposta neste trabalho, possui

grande relevância acadêmica por se diferenciar na de análise de redes sociais ao assumir a

existência de relações múltiplas e heterogêneas produzindo diversas redes sociais de acordo

com cada relação considerada e a época de sua ocorrência e por propor a utilização de

parâmetros para construir uma representação da rede social através da combinação de relações

considerando o dinamismo da rede social com o passar do tempo. Assim este trabalho se

diferencia dos demais estudos de redes sociais que utilizam o retrato de um ponto específico

de tempo, ou a agregação de todas as relações existentes em um determinado período de

tempo (TANTIPATHANANANDH, WOLF, KEMPE, 2007). Estas abordagens produzem a

perda de informações sobre tendências das redes sociais dinâmicas, as mudanças que estão

ocorrendo e as possíveis causas que podem estar entre as propriedades observadas.

A abordagem utilizada para identificar os pesquisadores que formam os grupos de

pesquisa analisados representa uma mudança metodológica em relação à abordagem

tradicional, partindo da análise da rede social formada por apenas um tipo de relacionamento,

independente do indivíduo (ou seja, os relacionamentos homogêneos), para a análise da rede

social com múltiplos relacionamentos de forma dependente do indivíduo e de seu papel social

(os relacionamentos heterogêneos). O argumento para tal diferenciação é o fato de que redes

sociais múltiplas e heterogêneas são onipresentes no mundo real e usualmente afetam as

atividades sociais das pessoas e os papéis que desempenham. Com isto espera-se que a

utilização desta abordagem para a identificação de grupos baseada em um algoritmo para a

mensuração de múltiplos relacionamentos proporcione uma expansão na análise de redes

sociais com o potencial de novas aplicações.

A compreensão deste mecanismo de formação de equipes pode auxiliar na escolha de

uma equipe de pesquisa, com conhecimentos e experiências em determinadas áreas

estabelecidas pelo projeto de pesquisa, possibilitando localizar pessoas que possuam os

conhecimentos necessários e que podem ser descobertas (e eventualmente reputadas) através

de Redes Sociais (cadeia de recomendações) partindo da rede social egocêntrica do líder de

projeto.

1.5 ESTRUTURA DA DISSERTAÇÃO

Esta dissertação está organizada em cinco capítulos. No Capítulo 2 faz-se uma revisão

da literatura sobre fundamentos de redes sociais e a sua análise, e um levantamento sobre as

publicações mais recentes relacionadas com a proposta deste trabalho de dissertação. O

Capítulo 3 descreve em detalhes o modelo computacional proposto e suas justificativas. No

Capítulo 4 relatam-se os resultados obtidos e a análise destes resultados. E, finalmente, o

Capítulo 5 as conclusões do trabalho e as propostas para trabalhos futuros.

CAPÍTULO 2

FUNDAMENTAÇÃO TEÓRICA

Este capítulo traz a fundamentação teórica utilizada na construção deste trabalho de

pesquisa. A base teórica conduz a uma linha de raciocínio que facilita o entendimento da

proposta de um modelo computacional para construir a rede social egocêntrica dos

pesquisadores e identificar os prováveis pesquisadores que formam a equipe de pesquisa

analisada. Na seção 2.1 são apresentados alguns conceitos de redes sociais para formalizar os

aspectos da disciplina necessários ao entendimento dos objetivos enunciados no Capítulo 1. A

seção 2.2 apresenta sucintamente alguns métodos de análise de redes sociais.

Foram também investigadas as novas técnicas de formação de equipes implementadas

com o conhecimento obtido por meio da análise de redes sociais, quais níveis de

implementação atingiram e, também, sobre as formas adotadas para formalizar o uso e o

conhecimento adquirido no desenvolvimento destes modelos. É traçado na seção 2.3 um

panorama dos avanços na construção de sistemas computacionais que utilizam redes sociais

para realizar a identificação de grupos, recomendação de indivíduos e mecanismos de

construção de equipes e sistemas colaborativos. Para melhor compreensão desses temas,

bibliografia relevante adicional será sugerida.

2.1 REDES SOCIAIS

Uma rede social pode ser definida como um conjunto de indivíduos e as relações que

mantêm juntos estes indivíduos (SCOTT, 2000). Estes indivíduos podem ser elementos ou

subconjuntos, como pesquisadores, grupos de pesquisa, universidades ou países.

As redes sociais vêm sendo amplamente utilizadas como uma ferramenta quantitativa

em ciência social para a compreensão de como indivíduos ou organizações se relacionam

(SAID et al., 2008). O desenvolvimento no campo de redes sociais se iniciou por volta de

1930, com diversos grupos trabalhando de forma independente em diferentes áreas. Por volta

da década de 30 e, ao final desta década, existiam duas linhas de pesquisa para redes sociais

(SCOTT, 2000). A primeira foi desenvolvida pelo grupo da universidade de Harvard com o

objetivo de encontrar subgrupos de pessoas em grandes grupos. A abordagem sociocêntrica

foi derivada desta linha de pesquisa. A segunda linha de pesquisa foi desenvolvida pelo grupo

de antropologistas da universidade de Manchester e abriu caminho para o estudo de

comunidades partindo do ponto de vista do indivíduo, chegando ao desenvolvimento da

abordagem egocêntrica.

Combinando informações relacionais com os atributos dos indivíduos em um panorama

social, foi possível enriquecer a percepção social em relação à abordagem sociológica

tradicional. As duas principais abordagens para o estudo de redes sociais são a sociocêntrica e

a egocêntrica. A abordagem sociocêntrica é usada para estudar as redes sociais onde os limites

são claramente especificados, através da quantificação das relações entre os participantes

deste grupo definido. O foco desta abordagem é a medição de padrões de interação e como

estes padrões surgem. Já abordagem egocêntrica ganhou popularidade por focar os indivíduos,

os grupos e as comunidades. Nesta abordagem são estudadas as relações do ponto de vista do

indivíduo, sendo possível avaliar os aspectos da rede social individual (CHUNG, HOSSAIN,

DAVIS, 2005).

2.1.1 Representações de Redes Sociais

As relações das redes sociais podem ser representadas de diversas maneiras como

gráficos, matrizes ou grafos de relacionamento. Os gráficos podem ser usados na análise de

uma determinada relação em particular (como o número de ligações de cada indivíduo da rede

social). As matrizes representam os relacionamentos entre os indivíduos através da valoração

de cada relação. Um caso particular de matrizes são as chamadas matrizes relacionais, onde os

indivíduos são dispostos em linhas e colunas e o valor da relação social entre dois indivíduos

compõem os elementos da matriz. Estas matrizes são indicadas na análise de padrões de

interação, equivalência estrutural e análise de blocos. Os grafos ou sociogramas permitem

representar relações dirigidas ou não, sendo comum a utilização de grafos valorados, sendo

esta a estrutura matemática básica utilizada para visualização das redes sociais. Os grafos são

indicados na análise de centralidade, prestígio, intermediação, coesão de subgrupos e métodos

de análise de díades e tríades dentro das redes sociais.

Outro método de representação é a notação algébrica que pode ser usada para o estudo

de relações múltiplas. Esta notação utiliza técnicas algébricas para comparar e contrastar

medições de relações ou para produzir uma composição de relações (WASSERMAN,

FAUST, 1994). Pode-se desta forma representar os indivíduos não pesquisadores de um grupo

de pesquisa como o conjunto de indivíduos do grupo de pesquisa menos o subconjunto dos

pesquisadores.

2.1.2 Abordagem Egocêntrica

Uma rede egocêntrica, ou local, consiste na rede social focada em um determinado

indivíduo (chamado de ego), os demais indivíduos com que possui ligações (chamados de

alters) e a medição das ligações sociais entre o ego e os alters, e nas ligações entre os alters

(WASSERMAN, FAUST, 1994).

Apesar de muitas análises de redes sociais buscarem um completo exame da rede social

em larga escala (onde todas as conexões entre os membros da rede são visíveis), a abordagem

egocêntrica busca uma visão mais restrita. Usando técnicas de análise de redes sociais

egocêntricas é possível entender como os indivíduos se relacionam, os papéis individuais e os

tipos de interações que se desenvolvem com os demais em sua volta (FISCHER, 2005).

Porém admite-se que as redes egocêntricas são ligadas umas as outras através de associações

das sobreposições das relações sociais, o que forma uma concatenação de redes sociais. Logo,

alterações nas redes egocêntricas produzem transformações que se propagam por toda a rede

social, afetando a análise sociocêntrica.

Neste trabalho de dissertação, apenas as ligações diretas entre o indivíduo central (ego)

e os membros de sua rede de contato (alters) são consideradas. Esta simplificação da

abordagem egocêntrica reduz a complexidade computacional do modelo proposto, sendo a

perda de informação causada por esta simplificação minimizada devido à sobreposição das

diversas redes egocêntricas e o uso da cadeia de recomendações no processo de identificação

dos indivíduos. Este tipo de rede egocêntrica simplificada é conhecido como grafo em estrela,

ou sociograma de Moreno, que é indicado para a identificação de líderes ou indivíduos

isolados, podendo ainda ser usada para a determinação da cadeia de recomendações (SCOTT,

2000). O sociograma de Moreno é ilustrado pela Figura 1, onde os diversos indivíduos da rede

egocêntrica estão ligados ao indivíduo central por uma determinada relação social

representada pelas linhas.

Figura 1: Sociograma de Moreno ou Grafo em Estrela onde são representados o indivíduo

central, os demais indivíduos da rede social egocêntrica e as suas ligações sociais

representadas pelas linhas.

2.1.3 Abordagem Sociocêntrica

O foco da análise sociocêntrica é mensurar padrões estruturais de interações e como

estes padrões surgem (como a concentração de poder ou recursos em determinado grupo). No

estudo de redes sociais através da abordagem sociocêntrica, os atores são facilmente

reconhecidos ou determinados, pois o foco desta análise são redes sociais onde os limites são

previamente conhecidos. Em muitos casos esta análise é a mais aplicada devido a sua

capacidade de fornecer informações sobre toda a rede social. A forma mais comum de

obtenção de informações sobre as relações sociais é a construção de matrizes relacionais onde

cada indivíduo da lista de linhas é questionado sobre sua relação com os demais nas colunas.

No entanto, no caso de grandes redes sociais seria cansativo buscar em uma enorme lista de

indivíduos quais são conhecidos. No caso da impossibilidade de obtenção de informações por

outros métodos, o mais indicado seria a utilização da abordagem egocêntrica (CHUNG,

HOSSSAIN, DAVIS, 2005).

� �

��

� �

��

2.2 ANÁLISE DE REDES SOCIAIS

Como já visto na seção anterior, uma rede social é basicamente um conjunto de

indivíduos e as relações que mantêm juntos estes indivíduos. Estes indivíduos podem ser

elementos ou unidades, como pesquisadores, grupos de pesquisa, universidades ou países.

Estes indivíduos formam uma rede social através de trocas de recursos entre eles. Os recursos

podem ser informações, e-mails, mercadorias, documentos, serviços, suporte social ou

financeiro. As trocas de recursos são consideradas evidências da existência de relações

sociais. A intensidade de uma relação social pode variar de fraca a forte, dependendo do

número ou do tipo de recurso compartilhado, da freqüência com que este compartilhamento

ocorre e da intimidade relacionada com estas trocas (CHUNG, HOSSAIN, DAVIS, 2005). O

estudo destas relações sociais, como surgem, como se concentram em determinado grupo,

como desaparecem e qual a influência que causam em toda a rede social é um campo de

estudo da análise de redes sociais.

2.2.1 Conceitos fundamentais da Análise de Redes Sociais

A análise de redes sociais (também conhecida como teoria de redes sociais), surgiu

como uma importante técnica e um tópico de estudo na sociologia moderna, antropologia,

psicologia social e teoria organizacional. A análise de redes sociais se concentra em entender

as ligações entre as entidades sociais e as implicações destas ligações (SAID et al., 2008).

Segundo Wasserman e Faust (1994), existem diversos conceitos fundamentais para

análise e discussão de redes sociais. Estes conceitos são: ator, relacionamento, díade, tríade,

subgrupos, grupos, relações e rede social. A seguir são definidos os conceitos chaves e

apresentados os diferentes níveis de análise de redes sociais.

Ator: A análise de redes sociais está baseada em entender as ligações entre as

entidades sociais e as implicações destas ligações. Estas entidades sociais são chamadas de

atores. Atores são indivíduos discretos agrupados ou unidades de coletividades sociais

(CHUNG, HOSSAIN, DAVIS, 2005). Exemplos de atores são os pesquisadores de um grupo

de pesquisa, os grupos de pesquisa de uma universidade e as universidades no sistema

científico mundial. O uso do termo ator não implica que esta entidade possua vontade própria

ou a habilidade de atuar. Muitas aplicações de redes sociais focam a coletividade de atores

que são todos do mesmo tipo, como os pesquisadores de um centro de pesquisa. Pode-se

chamar esta coletividade de monomodal. No entanto, alguns métodos permitem o estudo de

atores conceitualmente de diferentes tipos, ou de diferentes grupos, como a participação dos

pesquisadores em congressos científicos. Tantos os pesquisadores como os congressos são

atores de tipos diferentes em uma mesma rede social. Pode-se chamar esta de rede social de

bi-modal.

Ligações Sociais: Os atores são ligados a outros atores por ligações sociais. Existem

diversos tipos de ligações sociais. A definição de ligação social é a ligação estabelecida entre

um par de atores. Alguns dos exemplos de ligações mais comumente utilizados na análise de

redes sociais são:

• Avaliação de um ator por outro (como por exemplo, expressando amizade, respeito,

credibilidade ou ligação).

• Relações formais (como autoridade e hierarquia).

• Relacionamentos biológicos (como descendência, gênero).

• Interações comportamentais (como comunicar, enviar mensagens e co-autoria).

• Associação ou afiliação (como participação em eventos sociais ou pertencer a um

clube social).

• Transferência de recursos materiais (como transações econômicas, empréstimos, etc).

• Movimentações entre locais ou sociais (como migrações e modificação da posição ou

grupo social).

• Conexões físicas (como estradas, pontes, linhas telefônicas ligando dois pontos).

Díade: É o relacionamento que estabelece uma ligação entre dois atores. Esta ligação

é uma propriedade de um par e não de apenas um ator em particular. A análise da rede social

entre pares utiliza as díades como unidade de análise. A análise das díades consiste no par de

atores envolvidos e a probabilidade de existir uma ligação entre eles, desta relação ser

recíproca ou não, ou se tipos específicos de múltiplos relacionamentos tendem a ocorrer em

conjunto ou não.

Em nosso estudo de caso, a construção da rede egocêntrica de pesquisadores é

realizada atribuindo um valor para mensurar as diversas díades formadas entre o líder de

projeto e os demais pesquisadores.

Tríade: Os relacionamentos entre subgrupos de atores também devem ser estudados

através de métodos de análise que utilizam tríades como elemento unitário de análise. As

tríades são subconjuntos de três atores e as possíveis ligações entre eles. Um interesse

particular na análise de tríades são as relações de transitividade (se o ator i “gosta” do ator j

que “gosta” do ator k, então o ator i “gosta” do ator k), e de balanceamento (quando os atores

i e j gostam um do outro, eles concordam de forma similar em relação ao ator k. Caso eles não

gostem um do outro, eles discordam em relação ao ator k).

Subgrupo: Qualquer subconjunto formado por atores e pelas ligações entre eles pode

ser definido como um subgrupo. Localizar e estudar subgrupos usando critérios específicos

tem sido considerado um importante assunto na análise de redes sociais (WASSERMAN,

FAUST, 1994).

Grupo: A análise de redes sociais não deve simplesmente se concentrar em díades,

tríades ou subgrupos, mas na habilidade de modelar os relacionamentos entre sistemas de

atores. Um sistema consiste das ligações entre os membros de um grupo. A noção de grupo

possui diversas definições em ciências sociais. Para o nosso propósito de análise de redes

sociais, um grupo é um conjunto de atores que possuem ligações sociais que podem ser

mensuradas. Também se pode argumentar, por critérios teóricos, empíricos ou conceituais,

que os atores de um grupo pertencem a um conjunto interligado, ou seja, de forma mais

concreta um grupo consiste em um conjunto finito de atores com os quais são realizadas

medições das ligações na rede social. A restrição para um conjunto finito é um requisito

analítico. A concepção de um grupo infinito de atores e as extensas ligações entre eles traria

grande dificuldade de análise das informações desta rede social. A definição do grupo social

como finito proporcionou a abertura de novas áreas de estudo para a análise de redes sociais,

como a especificação das fronteiras de uma rede social, amostragem de informações a serem

coletadas e a definição do grupo a ser estudado.

Relação: A coleção de ligações sociais de um tipo específico entre os membros de um

grupo é chamada de relação. Por exemplo, o conjunto formado pelos professores orientadores

e seus alunos orientados nos cursos de pós-graduação no nível de mestrado e doutorado, e o

conjunto de co-autorias entre os pesquisadores em diversos artigos científicos publicados.

É importante perceber que uma relação se refere a um conjunto de ligações sociais,

que possuem um determinado tipo de medição, entre um par de um conjunto específico de

atores.

Rede Social: Uma rede social consiste em um ou mais conjuntos finitos de atores e as

relações entre os atores. A presença de uma relação entre os atores é um aspecto definitivo na

definição de uma rede social.

Ainda podem-se acrescentar as noções de comunidade, grupo e equipe, conforme a

Figura 2, levando em consideração os relacionamentos de cooperação (SCHLICHTER,

KOCH, XU, 1998):

Figura 2: Comunidade, Grupo e Equipe.

Comunidade: Pode ser definida como o conjunto de atores que partilham algo, mas

não necessariamente conhecem uns aos outros ou interagem entre si. Por exemplo, a

comunidade científica brasileira é composta por pesquisadores das mais diversas áreas que

possuem em comum o trabalho de promover o desenvolvimento científico e tecnológico.

Grupo: O grupo pode ser caracterizado como um conjunto de atores que conhecem

uns aos outros. Porém não existe necessariamente uma cooperação entre os elementos do

grupo, sendo as interações caracterizadas como fracas, pois não existem necessariamente

tarefas conjuntas com um objetivo em comum. O grupo de pesquisa do CPGEI é um exemplo,

pois neste grupo existem diversos pesquisadores trabalhando em diferentes projetos de

pesquisa.

Equipe: Uma equipe é um conjunto de atores que se conhecem mutuamente e

cooperam para atingir um objetivo em comum, podendo existir o compartilhamento de algum

artefato no qual estão trabalhando. Uma equipe de pesquisa trabalha em conjunto para atingir

Comunidade

Grupo

Equipe

Comunidade

Grupo

Equipe

os objetivos do projeto de pesquisa e compartilham recursos como laboratórios, softwares,

rede de computadores, documentos, livros e outros artefatos.

Segundo Wasserman e Faust (1994), estes termos compõem o vocabulário específico

usado na análise de redes sociais e serão utilizados no decorrer deste trabalho.

2.2.2 Aspectos Sociais da Análise de Redes Sociais

Uma informação coletada de uma rede social consiste de pelo menos uma variável

mensurável em um conjunto de atores. As necessidades que motivam um determinado estudo

de uma rede social normalmente determinam quais variáveis medir, e freqüentemente qual

técnica é a mais apropriada para esta medição (WASSERMAN, FAUST, 1994). Por exemplo,

no caso da análise da rede social de um grupo de pesquisadores seria difícil utilizar técnicas

de observação devido à característica distribuída destes grupos, logo o mais indicado é utilizar

arquivos pessoais, publicações, descrições de trabalhos científicos, e-mail, ligações

telefônicas e outras informações sobre tais grupos.

A natureza destas informações também determina qual o método analítico mais

apropriado para o seu estudo. Logo, o entendimento da natureza destas variáveis é importante

para a sua análise. Segundo Wasserman e Faust (1994), estas variáveis podem ser

classificadas em dois tipos: estruturais e de composição ou atributo. As variáveis

estruturais são as variáveis que são valoradas entre dois pares de atores, como a relação de co-

autoria entre pesquisadores que pode ser valorada pela freqüência de ocorrência, ou a relação

comercial entre dois países que pode ser valorada pela quantidade de trocas monetárias nas

exportações e importações. Já as variáveis de composição ou variáveis de atributo dos atores

descrevem características relativas ao comportamento ou padrões sociais de cada indivíduo,

como o gênero, instituição a qual pertence, a sua localização, o nível de graduação de um

determinado pesquisador, o número de pesquisadores ou o número de grupos de pesquisa em

um centro de pesquisa.

Alguns aspectos selecionados e descritos por Cummings e Kiesler (2007), são

considerados importantes nesta dissertação para a análise da rede social de uma equipe de

pesquisa:

Familiaridade: A familiaridade define o nível de interação que dois atores tiveram

entre si no passado. Uma grande familiaridade reduz as incertezas sobre como o outro ator irá

se comportar no futuro. Pesquisadores que tiveram a experiência de trabalhar junto no

passado devem estar familiarizados com o estilo de trabalho, hábitos e preferências uns dos

outros, e em resultado disto deverá ser mais confortável trabalhar novamente em conjunto no

futuro, estando a familiaridade relacionada com o grau de convivência dos pesquisadores no

meio acadêmico.

Proximidade Geográfica: A proximidade geográfica é definida como a distância

física entre dois atores. Quando um par de atores se localiza geograficamente perto um do

outro, eles possuem maior oportunidade para se encontrar, realizar comunicações espontâneas

e interagir informalmente. Em contraste, quando estes atores estão longe um do outro, como

no caso de pesquisadores que atuam em diferentes universidades, eles possuem poucas

chances de realizar um trabalho conjunto e terão mais dificuldade em manter uma rotina de

comunicações e coordenação para suportar uma relação de trabalho cooperativo do que dois

atores que trabalham no mesmo espaço físico.

Homofilia: A homofilia é definida como a similaridade entre dois indivíduos. Os

atores preferem se relacionar com outros atores que são similares a eles em características

como idade, religião, nível de educação. No contexto de um grupo de pesquisa a homofilia em

relação às idéias e experiências proporcionam a formação de equipes orientadas a objetivos

comuns. Em um centro de pesquisa, dois pesquisadores que compartilham a mesma área de

pesquisa freqüentemente possuem experiências e objetivos similares. Por outro lado,

pesquisadores em diferentes áreas de pesquisa possuem poucas experiências em comum, o

que reduz a probabilidade de um trabalho em conjunto no futuro.

No entanto o alto grau de homofilia dificulta a entrada de novos integrantes no grupo

de pesquisa, fazendo com que apenas indivíduos em grupos pequenos se agrupem. Ou seja, os

indivíduos com alto grau de homofilia tendem a manter relações apenas com outros atores

mais próximos e parecidos com eles próprios. Um grupo de pesquisadores experientes que

escolhem trabalhar em conjunto sem permitir a entrada de pesquisadores novatos na sua

equipe de pesquisa é um exemplo de um grupo que apresenta um alto grau de homofilia. Com

isto este grupo está reduzindo a diversidade da equipe, considerado por Guimèra et al. (2005)

como um fator que contribui para o desempenho das equipes. Com o aumento da homofilia

também aumenta a dificuldade de identificar os indivíduos. Apesar dos grupos serem

facilmente identificados, o mesmo não ocorre com os indivíduos passam a apresentar

atributos muito próximos (WATTS, 2003). No entanto a natureza multidimensional da

identidade social de cada indivíduo, onde os indivíduos classificam suas relações em

diferentes categorias e subcategorias, permite a identificação destes indivíduos. No caso do

grau de homofilia ser zero, ocorre a condição de Kleinberg, onde os indivíduos mantêm

relações com diferentes grupos com a mesma facilidade. Segundo Watts (2003), esta condição

favorece a diversidade das equipes e facilita a identificação de indivíduos. A Figura 3 mostra

a região onde é possível realizar a busca por redes sociais em relação ao grau de homofilia e

as diversas dimensões sociais em que uma relação pode ser classificada.

Figura 3: Gráfico que mostra a região onde a busca utilizando redes sociais é possível,

limitada pelo grau de homofilia e pelo número de dimensões sociais consideradas (WATTS,

2003).

A condição de Kleinberg é encontrada no ponto de intersecção dos dois eixos, e a

melhor condição para se pesquisar uma rede social ocorre quando utilizamos entre duas e três

dimensões sociais (WATTS, 2003). Este fato favorece a análise de redes sociais através do

uso de relações múltiplas, que levam em consideração mais de uma dimensão social.

2.2.3 Tipos de Ligações Sociais

Uma das maiores dificuldades no estudo de redes sociais é a seleção das relações

adequadas às necessidades de estudo, limitadas dentro da rede social analisada e com

possibilidade de serem observadas e mensuradas através das informações disponíveis

(SCOTT, 2000).

Uma estratégia comum no estudo de pequenas redes sociais tem sido a identificação

dos membros de um grupo em particular e as várias conexões entre eles. Porém ao se definir

uma relação de proximidade e realizar uma entrevista com os membros do grupo, surgirão

diferentes respostas sobre o conceito “mais próximo”. Isto causa uma dificuldade em definir

os limites da rede social, uma vez que para alguns indivíduos o conceito de proximidade pode

ser bastante amplo, enquanto que outros definem proximidade com uma percepção bem rígida

e clara. Assim os limites da rede social variam de pessoa para pessoa. Logo, ao se definir o

conceito de proximidade através de conceitos como freqüência de ocorrência ou tipo de

relacionamento, impõem-se de forma artificial aos integrantes do grupo analisado os limites

de sua rede social e a classificação de proximidade.

Outro aspecto das ligações sociais é o fato de que elas podem estar associadas a

diversos papéis sociais. Um papel é definido por um conjunto de atributos, como o nome do

papel e identificação; um conjunto de objetivos, sendo que cada objetivo é associado a uma

árvore de decisão, com uma descrição hierárquica das alternativas para atingir o objetivo

(XIAOQIN, HAIPING, BHAVESH, 2007). Por exemplo, na relação professor-aluno existem

dois indivíduos desempenhando diferentes papéis, com objetivos individuais distintos, porém

eles podem desempenhar um mesmo papel em outro ambiente, como no caso de participação

em uma comemoração familiar onde os dois indivíduos desempenham o papel de convidados

e possuem uma relação de “conhecidos” (MORI, SUGIYAMA, MATSUO, 2005).

Ainda existe a dificuldade de algumas variáveis apresentarem a forma binária,

limitando os métodos de medição das ligações em uma rede social. Estas variáveis indicam

apenas a presença ou ausência de uma determinada relação e limitam a análise de alguns

aspectos sociais, como por exemplo, a determinação da proximidade de dois atores. Estas

variáveis binárias podem ser convertidas em medições utilizando coeficientes de correlação. É

possível, por exemplo, atribuir pesos a cada tipo de grupo social e com isto comparar a

relação de “conhecer” entre o indivíduo e um membro de sua família com um companheiro de

trabalho. Apesar da dificuldade em valorar esta relação, pode-se afirmar que o indivíduo

conhece mais os membros de sua família que os seus colegas de trabalho devido à intensidade

e os tipos de relacionamentos existentes nestes grupos, o período de tempo com que se

relacionam e a quantidade de recursos que compartilharam. Porém com esta conversão de

dados realizam-se suposições sobre as relações da rede social, sem garantia de sucesso

(SCOTT, 2000). Seria inviável utilizar estas informações para afirmar o quão próximos são

dois pesquisadores, uma vez que a distância entre os pesquisadores depende diretamente do

coeficiente de correlação, sendo imprópria a comparação de duas díades distintas com uma

relação de proximidade medida desta forma. Porém pode-se construir uma composição de

relações utilizando fatores de correlação para mensurar relações binárias, que pode ser

utilizada como um ponto de partida qualitativo para comparar a intensidade das relações

sociais de um mesmo indivíduo em relação aos membros de sua rede egocêntrica.

2.2.4 Análise de Redes Sociais com Relações Múltiplas

Em uma rede social do mundo real existem diversas relações sociais que podem ser

evidenciadas e mensuradas. Existindo o interesse em se analisar mais de uma relação social

surge a necessidade de realizar a análise com relações múltiplas. Segundo Wasserman e Faust

(1994), muitos procedimentos padrões utilizados para a análise de redes sociais não se

aplicam às redes com relações múltiplas (como centralidade e identificação de subgrupos

coesos). Alguns métodos foram desenvolvidos especificamente para o uso na análise de

relações múltiplas, como a álgebra relacional e alguns modelos estatísticos. No entanto ainda

existe a necessidade de desenvolvimento de métodos para a obtenção de boas medições da

associação de relações ou de propriedades multi-relacionais.

Segundo Matsuo et al. (2006), existem diversas formas de reduzir as múltiplas matrizes

relacionais para apenas uma matriz utilizando álgebra relacional, como soma, média, máximo

ou multiplicação de cada elemento correspondente das matrizes. Porém, dependendo da

necessidade da análise deve-se aplicar o método adequado. No caso da necessidade de

identificação de um pesquisador importante em determinado assunto, é indicada a análise da

centralidade do pesquisador na rede social utilizando apenas a relação de citações ou

publicações. Para pesquisar a credibilidade de um indivíduo o uso da freqüência de

relacionamentos explícitos é recomendado. Logo, a integração de redes sociais com relações

múltiplas deve ser realizada dependendo do propósito da análise, sendo possível, em alguns

casos, a análise de cada relação pode compor um panorama que facilite a compreensão dos

padrões sociais estudados.

2.2.5 Propriedades Estruturais para a Análise de Redes Sociais

As informações obtidas da rede social devem ser armazenadas de forma a permitir a

extração de atributos dos atores e informações relacionais utilizadas para a análise da rede

social e a construção de uma descrição estatística. A seguir descrevem-se algumas medições

comuns realizadas na análise das propriedades estruturais das redes sociais utilizando tais

informações.

Densidade: A densidade basicamente representa o número atual de ligações em uma

rede social em relação ao número total possível com a utilização de todos os nós. Uma rede

social com a máxima densidade recebe o valor 1,0 (o que significa que todos os nós estão

conectados uns com os outros). Uma rede social com densidade próxima de 0,0 indica que ela

possui poucas ligações. Para um grafo não direcional, a densidade (D) é definida por

(WASSERMAN, FAUST, 1994):

( )( )1

2

−⋅

⋅=

NNtL

D (1)

onde:

• N é o número de nós da rede analisada, sendo N>1,

• Lt é o número total de ligações entre os nós

A densidade pode ser utilizada para a identificação de grupos em comunidades.

Quanto maior o número de ligações entre os elementos, maior é a coesão de tal grupo. As

métricas relacionadas com este aspecto são a centralidade e a centralização.

Centralidade: Muitas redes sociais possuem atores em posição central. Nesta posição,

estes atores possuem um melhor acesso às informações e melhor oportunidade em divulgar

informações. Sobre este ponto de vista individual a centralidade caracteriza a abordagem

egocêntrica, já que se concentra no indivíduo.

Centralidade Local e Centralidade Global: Enquanto a centralidade local mede o

número ou proporção de ligações de um nó em particular, a centralidade global está

relacionada com a medição da distância entre os nós. Assim, um nó que fica a uma curta

distância de outros nós é dito próximo a estes nós. Com isto surge o conceito de

“proximidade”. A centralidade local pode ser relacionada a capacidade do indivíduo em se

relacionar com os demais membros da rede, sendo associada a noção de popularidade do ator.

Freeman (apud SCOTT, 2000) propôs a medição de centralidade relativa para medir a

centralidade de um determinado nó em relação à centralidade global da rede social Esta

contribuição permite a análise da centralidade local relativa de um nó que pode ser facilmente

comparada com outros nós da mesma rede social. Segundo Freeman (apud WASSERMAN,

FAUST, 1994), em termos matemáticos o grau de centralidade local relativa (ci) de um nó é

dado por:

( )11

−=� =

N

Lc

N

j ij

i (2)

onde:

• Lij = 1 se existe uma ligação entre os nós i e j, e Lij = 0 caso não existe tal

ligação.

• N é o número de nós da rede analisada

Porém, deve-se diferenciar a centralidade local relativa no caso de relações

direcionais, com o cálculo da centralidade local relativa de entrada e de saída do nó i.

Segundo Freeman (apud WASSERMAN, FAUST, 1994), a centralidade global de um

nó (Cgi) pode ser definida por:

� == N

j jii nndistCg1

),( (3)

onde:

• dist(ni,nj) é a distância entre os nós ni e nj,

• N é o número de nós da rede analisada

Centralização: Uma rede social é considerada com grande centralização quando

existe uma região claramente definida entre o centro e a periferia da rede social. Nesta

situação as informações fluem com facilidade, porém dependem da região central para

transmitir tais informações (SAID et al., 2008). Para medir a centralização em uma rede social

se precisa observar diferenças nos valores de centralidade entre os nós mais centrais e os

demais nós. Assim para chegar no valor de centralização (CG) é calculada a média entre soma

das distâncias e a soma das distâncias máximas possíveis na rede social analisada. Conforme

Freeman (apud WASSERMAN, FAUST, 1994), pode-se definir a centralização como:

( )( ) ( )21

)(1

−⋅−

−= � =

NN

NLNLMAXCG

N

i ii (4)

onde:

• MAX(NLi) é o número máximo de atores ligados diretamente a um

determinado ator i.

• NLi é o número de atores na rede social que são diretamente ligados

com o ator i.

• N é o número total de atores.

A centralização e densidade não são apenas medidas importantes na análise de redes

sociais, mas são complementares. A densidade informa o nível de conectividade da rede. Já a

centralização informa a extensão com a qual a conectividade é focada ao redor de um nó em

particular, ajudando a identificar uma estrutura central a partir da medição de quão coesa ou

integrada é a estrutura em torno do seu ponto mais central.

2.3 TRABALHOS RELACIONADOS

Uma das áreas de pesquisa em redes sociais são os mecanismos dinâmicos de formação

e identificação de equipes. Foi possível verificar que existem diferentes tipos de abordagens

para entender o fenômeno de formação de equipes e outras correlatas para identificar grupos e

comunidades, construir representações das redes sociais e reputar indivíduos para

compartilhamento de informações. Nesta seção são abordados os aspectos relacionados com à

implementação destes sistemas no mundo real.

No trabalho de Guimerà et al. (2005) foi desenvolvido um modelo para a construção de

times com indivíduos criativos, no qual a escolha dos membros da equipe foi controlada por

três parâmetros: o número de membros do time (m), a probabilidade de seleção dos novos

membros entre os indivíduos da rede social (p) e a propensão dos novos membros em escolher

antigos colaboradores (q). O modelo prediz a existência de duas fases durante a formação das

equipes, que são determinadas pelos valores dos parâmetros. Na primeira fase, existe um

grande agrupamento conectado a uma considerável proporção de outros indivíduos da

comunidade; na segunda fase existe a formação de diversos agrupamentos menores isolados.

Neste estudo foram analisadas informações de grupos científicos e artísticos onde os

integrantes tiveram a experiência de grande pressão com a especialização, diferenciação,

internacionalização e comercialização de suas atividades. O trabalho considera que a

eficiência de uma equipe é proporcional a sua diversidade e expertise, com isto os parâmetros

p e q devem ser relacionados com o desempenho da equipe, devendo existir um valor ótimo

para estes parâmetros e para o número de integrantes da equipe (m), como mostra a evolução

das equipes analisadas no período de 113 anos.

O trabalho de Cai et al. (2005) analisa as dificuldades na identificação de comunidades

ocultas em redes sociais heterogêneas, por exemplo, redes formadas por diversos tipos de

atores. A abordagem adotada representa uma grande mudança na análise de redes sociais, com

a adoção de múltiplas redes sociais construídas através de diversas relações dependentes dos

integrantes e orientada a uma determinada finalidade de investigação. A idéia básica do

algoritmo utilizado é encontrar uma combinação de relacionamentos que busca tornar a

medida do relacionamento entre os indivíduos dentro da comunidade o mais intenso possível

e ao mesmo tempo tornar o mais fraco possível o relacionamento entre as comunidades, com

o objetivo de agrupar estes indivíduos para identificar as comunidades. A valoração destas

relações pode ser tanto linear como não linear. Considerando que em aplicações no mundo

real é quase impossível um usuário conseguir informações suficientes, as técnicas não lineares

tendem a serem instáveis podendo produzir agrupamentos falsos com números elevados de

integrantes. Assim este trabalho utilizou apenas técnicas lineares de agrupamento.

O trabalho de Long, Zhang e Yu (2007) propõe um modelo que busca identificar

agrupamentos de estruturas para cada tipo de informação sobre os indivíduos e as interações

entre os diferentes tipos de indivíduos. Estas estruturas são formadas pela composição de três

tipos de informações: os atributos relacionados aos indivíduos, as relações homogêneas entre

indivíduos de tipos iguais e as relações heterogêneas entre indivíduos diferentes. Neste

modelo é proposto um algoritmo parametrizado para construir agrupamentos relacionais

rígidos e suaves em um grande número de famílias de distribuições exponenciais, como a

distribuição normal, distribuição de Bernoulli e distribuição de Poisson. Segundo o trabalho, o

algoritmo proposto pode ser aplicado a várias estruturas de informações relacionais

unificando algoritmos de agrupamento.

Berg-Wolf e Saia (2006) propuseram uma plataforma para a análise de comunidades em

redes sociais dinâmicas, tornando explícito o uso de mudanças temporais. As comunidades

tendem a se envolver gradualmente com o tempo em oposição ao comportamento de

construção e destruição espontânea. Sempre que uma informação sobre eventos sociais está

disponível é desejável usar esta informação temporal não apenas para identificar comunidades

com uma alta similaridade intracomunitária, mas também observar sua persistência e

desenvolvimento.

Nesta proposta pressupõe-se que cada indivíduo tem suas ações monitoradas em

intervalos regulares de tempo. Assim, dada uma população X = {x1, ..., x2}, define-se um

grupo como um subconjunto Xg ⊆ . Assume-se que a informação de entrada é o conjunto de

partições P1, P2, ..., Pt de X, sendo uma partição para cada intervalo de tempo. Cada partição

Pi é um conjunto disjunto de grupos. O índice da partição a qual g pertence é denominado por

P(g), assim se iPg ∈ , então P(g) = i. Dados dois grupos, g e h, um conjunto de medições de

similaridade entre g e h dado por sim(g,h) e um limite de transição dado por �, dois grupos

são similares se sim(g,h) � �, sendo esta definição independente de qualquer forma específica

de medição de similaridade. Além da similaridade o trabalho considera algumas propriedades

críticas como a conectividade dos grupos, a conectividade individual (que determinam e

afetam a estrutura da rede social), o conjunto de grupos críticos (que possuem determinada

informação ou característica que pode afetar toda a comunidade) e conjunto de indivíduos

críticos (que possuem a capacidade de afetar um grande número de indivíduos).

O trabalho de Tantipathnanandh, Berger-Wolf e Kemp (2007) propõem uma plataforma

e algoritmos baseados em programação dinâmica, busca exaustiva, máxima identificação e

grade heurística para identificar comunidades em redes sociais dinâmicas, ou seja, que

mudam com o passar do tempo. Neste trabalho os indivíduos são observados em intervalos

discretos de tempo, onde interações sociais ou as afiliações dos indivíduos são observadas na

forma de diversos subgrafos individuais completos. O método de identificação utiliza as

ferramentas de análise do trabalho anterior e considera que os métodos tradicionais de

identificação de comunidades são casos particulares onde é considerado apenas um intervalo

de tempo.

Enembreck et al. (2006) propõem um sistema baseado na extração de informações

textuais para a identificação de equipes de pesquisa. A busca é iniciada pelo currículo do

pesquisador disponível na plataforma Lattes, onde são obtidos os artigos e outros textos

escritos pelo indivíduo analisado. O sistema compara a descrição do projeto de pesquisa com

estas informações textuais e obtém um grau de similaridade. Os experimentos foram

realizados em 3 grupos de pesquisa com 22 professores, onde foram coletados os currículos

Lattes destes pesquisadores e comparados com 52 projetos de dissertação de mestrado escritos

pelos alunos da instituição pesquisada. Os resultados apresentados mostram a identificação de

aproximadamente 20% dos professores orientadores, porém foram identificados 75% dos

líderes de projeto, mostrando que existe grande similaridade contextual entre os diferentes

trabalhos analisados e os currículos dos líderes de projeto. Neste trabalho os autores discutem

a impossibilidade do uso desta técnica para identifica os orientadores dos projetos devido à

intersecção das diferentes áreas de pesquisa de um mesmo grupo de projeto. A técnica

também falha ao se pesquisar projetos inovadores, pois os pesquisadores ainda não possuem

uma importante produção científica relacionada com a nova área de pesquisa.

Um trabalho similar foi apresentado por Mori et al. (2006) para recuperar informações

relacionais calculando o grau de similaridade entre contextos coletivos encontrados nos

documentos disponíveis. O método proposto busca agrupar indivíduos em pares de acordo

com a similaridade do contexto dos documentos disponíveis na web e identifica através deste

agrupamento as palavras significativas para caracterizar os relacionamentos. Os experimentos

foram realizados em um conjunto de 143 atores de destaque, composto por políticos e

instituições geopolíticas (como prefeituras, cidades e países). O estudo mostra que os

resultados dependem do tamanho dos documentos analisados, existindo um tamanho ótimo

para tal análise que depende da estrutura da linguagem natural. A adoção de documentos

maiores acarreta a adição de ruído na análise, reduzindo o desempenho do sistema pelo

cálculo de similaridade entre contextos irrelevantes.

Matsuo et al. (2003) propuseram um sistema que busca informações na web para

construir a rede social dos participantes de uma conferência. O sistema utiliza o coeficiente de

Jaccard para analisar os conteúdos dos documentos de dois participantes e comparar com um

valor empírico de corte. Os participantes são rotulados com termos como co-autor, membro

do grupo de projeto, membro do laboratório de pesquisa, co-participante de conferência. O

estudo foi realizado em 470 indivíduos que participaram da conferência da Japanese Society

of Artificial Inteligence (JSAI2002), que foram manualmente rotulados. Os resultados

demonstram uma dificuldade no reconhecimento dos pesquisadores e conferencistas, sendo

apenas 12,5% dos pesquisadores e 42,1% dos conferencistas reconhecidos, porém o sistema

reconheceu 96,2% dos co-autores e 87,0% dos integrantes de laboratórios. Esta dificuldade foi

atribuída à existência de outras relações que não podem ser inferidas a partir dos documentos

pesquisados na web, como os pesquisadores de grupos que ainda não produziram artigos

científicos ou conferencistas que participaram de trabalhos há mais de dez anos.

Mori, Sugiyama e Matsuo (2005) desenvolveram um sistema para compartilhamento de

informações usando redes sociais. Para isto eles utilizam o conceito de centralidade calculada

através de medições como proximidade, grau de relacionamento e intermediação, obtidas a

partir de informações recuperadas da web, como e-mail, e pelo ajuste manual do usuário para

construir a representação da rede social através de grafos, identificar as pessoas do seu

relacionamento e efetuar indicações de amigos de amigos. O sistema foi testado em uma

página comunitária na web, destinada à comunidade acadêmica, onde os usuários podem

manusear sua rede social e definir o grau de acesso dos indivíduos de sua rede preservando a

privacidade e confidencialidade dos documentos disponibilizados. Desta forma o sistema

pode atuar como uma ferramenta para a disseminação e compartilhamento de informações de

acordo com políticas de privacidade definidas pelo usuário.

Um trabalho similar dedicado à troca de conhecimento em uma comunidade utilizando

um sistema multiagentes chamado de COMUNET foi apresentado por Giménez-Lugo (2004),

onde a rede social egocêntrica do usuário é construída pelos agentes de software através de

informações obtidas nas mensagens de e-mail. Esta rede social serve de referência para obter

uma aproximação da visão das relações entre os conhecimentos do usuário e seus contatos. A

rede social evidenciada pode ser manuseada pelo usuário para explicitar estruturas

organizacionais como grupos e papéis sociais dos indivíduos de sua rede de contatos segundo

a sua visão subjetiva. Os documentos disponibilizados pelo usuário são classificados

manualmente como secretos, medianamente privados e públicos de acordo com a política de

privacidade do usuário. O sistema foi testado com seis indivíduos de um grupo de pesquisa

distribuídos geograficamente entre três cidades e permitiu o uso da visão sócio-organizacional

subjetiva da rede de contatos dos usuários como um filtro social para compartilhar ou reservar

informações de acordo com o papel e posição social do contato.

O trabalho de McDonald (2003) avalia os sistemas de recomendação e colaboração que

utilizam a abordagem de redes sociais. Segundo este trabalho, os usuários possuem diversos

sentimentos sobre o uso de redes sociais como ferramenta para buscar a colaboração de outros

indivíduos. A análise de redes sociais deriva de uma perspectiva analítica e descritiva

enquanto a sua aplicação em grupos é orientada em uma direção ligeiramente prescritiva.

Assim, alguns aspectos devem ser considerados ao utilizar a análise de redes sociais como

ferramenta de auxílio no funcionamento e formação de grupos. Ao se incorporar redes sociais

a sistemas de recomendação tem-se um conflito na percepção dos usuários que esperam

encontrar os indivíduos com maior expertise, mas acreditam que o sistema fornece apenas os

indivíduos da rede social com quem eles podem facilmente interagir. Apesar destes sistemas

atualmente iniciarem a busca pela expertise, os usuários continuam acreditando que a busca

inicia pela rede social. Outro aspecto é o caso onde os usuários procuram interferir na análise

da rede social, por acreditarem que isto otimiza a identificação dos melhores indivíduos. O

pior caso ocorre quando o sistema fornece apenas a recomendação de um indivíduo para

assumir uma determinada posição, impedindo o usuário de escolher. Assim, os usuários

buscam respostas no sistema quando os indivíduos recomendados diferem da visão de suas

próprias redes sociais. Isto naturalmente lida com os métodos de parametrização das relações

sociais e técnicas de identificação, porém os usuários necessitam que o sistema argumente e

auxilie nestas escolhas, sem substituir a forma natural dos usuários em recomendar

indivíduos. Outro aspecto importante é o fato de que os usuários possuem uma maior

percepção de sua rede social egocêntrica, e não aceitam com facilidade a recomendação de

indivíduos que não pertençam a esta rede, mas que foram agregado pela cadeia de

recomendações. Deve-se também considerar o fato das redes sociais serem dinâmicas. A

coleta de informações para a análise da rede social normalmente é realizada em um espaço de

tempo definido e para ter sucesso os sistemas de recomendação devem lidar com o dinamismo

da rede social.

A construção da rede social não pode ser considerada uma tarefa simples. Os métodos

tradicionais de aquisição de informações e valoração das ligações sociais de uma rede

consomem um tempo enorme e possuem problemas de escalabilidade. E ainda não se pode

considerar que os métodos de construção das redes sociais de grandes grupos são melhores

que a construção de uma rede social, com maior precisão, do ponto de vista individual.

2.4 CONCLUSÃO

Neste capítulo buscou-se detalhar os conhecimentos necessários à consecução dos

objetivos deste trabalho de dissertação de mestrado, descritos no Capítulo 1.

Foram apresentados os conceitos de redes sociais relevantes para a compreensão do

problema de identificação da influência da rede social egocêntrica dos líderes de projeto na

formação das equipes de pesquisa e para identificar algumas ferramentas de análise de redes

sociais existentes. A ferramenta de álgebra relacional para a análise de redes sociais com

relações múltiplas será utilizada como referência na concepção do modelo proposto que

partirá do uso de redes sociais egocêntricas. Esta abordagem será detalhada no próximo

capítulo. Como bibliografia complementar os seguintes livros são sugeridos: Six Degrees –

The Science of a Connected Age de Watts (2003), para um melhor entendimento de redes

sociais; Social Network Analysis – Methods and Applications de Wasserman e Faust (1994);

Social Network Analysis – a handbook de Scott (2000), Exploring Social Network Analysis

with Pajek de Nooy, Mrvar e Batagelj (2005) para a compreensão das técnicas de análise de

redes sociais e Reputation in Artificial Societies – Social Beliefs for Social Order de Conte e

Paolucci (2002) para a discussão de temas como reputação, prestígio, dignidade,

honorabilidade, fama e demais conceitos que afetam a cooperação entre indivíduos.

Também foi incluída neste capítulo uma breve apresentação das pesquisas em redes

sociais relativas aos mecanismos de formação de equipes. Foi possível verificar que existem

diferentes tipos de abordagens para entender o fenômeno de formação de uma equipe, a

identificação de grupos ou comunidades, o uso da representação das redes sociais para o

compartilhamento de informações e os aspectos relacionados com a implementação destes

sistemas no mundo real. A proposta desta dissertação de mestrado está relacionada com o

trabalho de Cai et al. (2005) por utilizar uma combinação de múltiplas relações utilizando

técnicas lineares, com o trabalho de Berg-Wolf e Saia (2006) por considerar parâmetros para

valorar os relacionamentos segundo a dinâmica temporal das redes sociais, com o trabalho de

Enembreck et al. (2006) por utilizar a plataforma Lattes como fonte de pesquisa e com

Giménez-Lugo (2004) por propor o uso de um filtro social para a política de privacidade.

Outros trabalhos como de Matsuo et al. (2003), Mori, Sugiyama e Matsuo (2005), também

utilizaram a comunidade acadêmica e grupos de pesquisa para testar suas propostas.

Porém este trabalho de dissertação difere do trabalho de Cai et al. (2005), pois

enquanto este utiliza métodos de regressão linear para determinar os pesos da matriz que

melhor identifica a comunidade pesquisada, o modelo proposto utiliza um valor de corte

empírico para realizar a identificação a partir da composição das relações. Além disto o

modelo computacional proposto neste trabalho de dissertação prevê o uso da abordagem

egocêntrica limitada ao sociograma de Moreno, e a composição das relações múltiplas

considerando a dinâmica temporal das redes sociais através da utilização de parâmetros para

valorar as relações de acordo com o tipo e o período de ocorrência, possibilitando o uso tanto

de relações que podem ser mensuradas quanto relações de caráter binário. Porém são

desconsideradas as influências comportamentais que podem afetar a dinâmica social com o

passar do tempo, como modismos, influências geopolíticas, econômicas, etc. As

características deste modelo computacional serão abordadas em detalhe no próximo capítulo.

CAPÍTULO 3

MODELO COMPUTACIONAL PROPOSTO

Apresenta-se neste capítulo a proposta do modelo computacional, baseado nos

conceitos apresentados no Capítulo 2 e nas características das informações disponibilizadas

no estudo de caso. Busca-se enfatizar as restrições e premissas do sistema que influenciam sua

concepção e os aspectos que tornam a proposta original. A seção 3.2 faz uma breve descrição

dos recursos utilizados nos experimentos. O modelo computacional proposto possui duas

fases: a primeira fase é relativa à construção das redes egocêntricas dos pesquisadores, sendo

detalhada na seção 3.3. A segunda fase, apresentada na seção 3.4, é relativa à identificação

dos pesquisadores. Na seção 3.5 são apresentadas as justificativas das escolhas tomadas na

construção do modelo proposto.

3.1 OBJETO DA PROPOSTA DO MODELO COMPUTACIONAL

O modelo computacional proposto fundamenta-se na utilização dos aspectos sociais

(relacionados a uma determinada necessidade de análise) para a identificação de relações

sociais que possam ser evidenciadas nas informações disponíveis sobre os indivíduos da

comunidade pesquisada. Para facilitar o processo de identificação dos atores das redes sociais

analisadas, estas relações devem pertencer entre duas ou três diferentes dimensões sociais

relacionadas com o tipo de grupo que se deseja identificar (WATTS, DODDS, NEWMAN,

2002). As relações sociais escolhidas, com possibilidade de serem evidenciada e mensuradas

quanto à existência, ocorrência e temporalidade, produzem um valor qualitativo individual,

proporcional a combinação destas relações. Este valor qualitativo produzido a partir das

múltiplas relações escolhidas considerando o dinamismo da rede social com o tempo é

utilizado para a análise da rede social segundo a necessidade do usuário.

No estudo de caso, o tratamento das informações incompletas sobre os pesquisadores a

serem representados requer a proposta de um modelo computacional capaz de representar a

rede egocêntrica de cada pesquisador com o objetivo de identificar os possíveis indivíduos

para compor uma equipe de pesquisa.

São utilizados os currículos disponíveis na plataforma Lattes para a extração de

informações sobre os pesquisadores, sendo esta fase um dos objetivos específicos deste

trabalho. A obtenção e processamento de informações relacionais sem a intervenção do

usuário é um dos desafios na análise de redes sociais. A análise de grandes redes sociais

através do auxílio ou entrevista do usuário é limitada por aspectos relativos à fadiga gerada

pela construção manual de longas listas de indivíduos e as ligações existentes entre eles e o

usuário (CHUNG, HOSSSAIN, DAVIS, 2005).

O modelo computacional proposto funciona em duas etapas, conforme ilustrado pela

Figura 4. Na primeira etapa realiza-se a extração de informações sobre os pesquisadores e a

construção das redes sociais egocêntricas. Na segunda etapa são analisados os grupos de

pesquisa encontrados na comunidade pesquisada e é realizada a identificação dos

pesquisadores na equipe de pesquisa de acordo com a rede social egocêntrica do líder de

projeto e a cadeia de recomendações formada pelos demais pesquisadores destes grupos. A

seguir é detalhado o modelo computacional proposto.

Figura 4: Etapas do Modelo Computacional.

3.1.1 Modelo Computacional

O modelo computacional tem como entrada para a sua primeira etapa de

funcionamento o grupo de pesquisadores que serão analisados e as informações disponíveis

sobre os mesmos na plataforma Lattes e no diretório de grupos de pesquisa do CNPq. O

diretório de grupos de pesquisa contém para cada grupo a área de pesquisa, a lista de nomes

dos integrantes e o papel que cada um desempenha no grupo. A coleta destas informações

pode ser iniciada pelo currículo Lattes de qualquer pesquisador do grupo de pesquisa que se

queira analisar. A Figura 5 detalha as principais estruturas funcionais do modelo proposto,

entrada e saída da fase de construção das redes egocêntricas.

Figura 5: Estruturas Funcionais para Extração de Informações.

A partir dos currículos Lattes dos pesquisadores contidos nos grupos pesquisados

extraem-se informações para construir as matrizes relacionais com os valores da freqüência de

ocorrência ou a existência das relações analisadas, de acordo com o período de tempo em que

ocorreu a relação. Os elementos destas matrizes são utilizados para o cálculo do fator de

proximidade individual. Este fator é calculado a partir da composição das diferentes relações

evidenciadas no currículo Lattes obtida através do uso de coeficientes de correlação e médias

ponderadas, sendo este processo descrito em detalhes na seção 3.3.5. Este valor preliminar é

normalizado para cada indivíduo, sendo assim calculado um fator proporcional ao conceito de

proximidade relacional entre o ator central e os elementos de sua rede social. Com o cálculo

do fator de proximidade individual é possível representar a variação deste fator ao redor da

Entrada:Nome do Pesquisador

Busca porcurrículos Máquina de

Busca

Web / Plataforma Lattes

Identificaçãoda rede social

Valoraçãodas relaçõesSociais por

co-ocorrência

Saída:Relação daRede EgocêntricaCom os valoresdas relações

Entrada:Nome do Pesquisador

Busca porcurrículos Máquina de

Busca

Web / Plataforma Lattes

Identificaçãoda rede social

Valoraçãodas relaçõesSociais por

co-ocorrência

Saída:Relação daRede EgocêntricaCom os valoresdas relações

rede egocêntrica do elemento central em um gráfico em forma de radar, conforme

demonstrado na Figura 6.

Na segunda etapa de operação, são calculados os fatores de proximidade social dos

integrantes dos grupos de projeto, obtidos da plataforma Lattes, e é definido o valor de corte

empírico que será utilizado para a identificação dos pesquisadores na rede egocêntrica do líder

de projeto e dos demais pesquisadores do grupo de pesquisa.

A partir dos valores do fator de proximidade individual calcula-se o fator de

proximidade social, em relação à equipe de pesquisa. Este novo fator é obtido pela média

ponderada entre os fatores de proximidade individuais dos pesquisadores candidatos em

relação ao líder de pesquisa e aos demais pesquisadores que compõem o grupo de pesquisa.

Os pesos são definidos empiricamente de acordo com o papel que cada indivíduo desempenha

no grupo. Com a diferenciação entre os pesos dos pesquisadores e líder de projeto utilizados

nesta média ponderada é possível considerar a cadeia de recomendações dos demais

pesquisadores, permanecendo como aspecto principal para tomada de decisão o fator de

proximidade da rede social egocêntrica do líder de projeto. A contribuição dos demais

integrantes dos grupos de pesquisa, que atuam no papel de estudantes ou técnicos, foi

desprezada devido a pouca experiência profissional destes indivíduos no trabalho científico e

ao aspecto do aprendizado ser o principal fator de engajamento destes indivíduos. O fator de

proximidade social será detalhado na seção 3.3.6.

Com o valor do coeficiente de proximidade social classificamos os pesquisadores em

três categorias: identificado, evidenciado e não evidenciado.

Um integrante é considerado identificado quando o fator de proximidade social (em

relação à equipe) é maior que o valor de corte definido. No caso de falha no processo de

identificação, porém o integrante possui um fator de proximidade em relação a algum

pesquisador (ou seja, se o fator de proximidade com a equipe é diferente de zero), este

integrante é considerado apenas como evidenciado. Caso o fator de proximidade social seja

nulo, o indivíduo é considerado não evidenciado.

Os fatores de proximidade individual e social podem ser utilizados para outras

finalidades que necessitem informações sobre o grau de proximidade relacional entre os

indivíduos. Por exemplo, pode-se adotar como estratégia para restringir o uso das informações

deste modelo computacional de acordo com a política de privacidade dos grupos de pesquisa

que ao receber uma requisição de um usuário em relação a um pesquisador verifica-se qual o

fator de proximidade do usuário em relação ao indivíduo pesquisado e disponibiliza-se esta

informação, levando em consideração o papel que o usuário solicitante desempenha na visão

organizacional subjetiva do pesquisador consultado. A proposta de um filtro social foi

realizada no trabalho de Giménez-Lugo (2004), porém este trabalho de dissertação difere

deste pelo uso do fator de proximidade individual, por não possuir intervenção do usuário

para explicitar a rede social, por utilizar apenas a plataforma Lattes como fonte para construir

a rede social ao invés da utilização de documentos disponíveis na Internet e por não utilizar

uma explicitação formal dos papéis sociais e estrutura organizacional.

No caso do uso deste mesmo modelo computacional para o auxílio na construção de

uma nova equipe de pesquisa este processo ocorre de forma interativa e dinâmica, com um

novo cálculo a partir de cada alteração do conjunto de membros da equipe. Este novo cálculo

torna-se necessário para atualizar a cadeia de recomendações com as contribuições dos novos

membros. Um software com estas características pode ser utilizado por uma comunidade para

a identificação de pesquisadores com experiência, reputação e conhecimento apropriado a um

determinado projeto de pesquisa a partir do uso de informações da rede social do líder de

projeto.

3.2 MATERIAIS E INFRA-ESTRUTURA

Para validar o modelo computacional proposto foram necessários alguns meios

computacionais e uma coleta de dados com a finalidade de obter material para a realização de

experimentos para validação do modelo computacional.

3.2.1 Meios Computacionais

Os experimentos foram realizados manualmente com o auxílio de planilhas eletrônicas

para tabulação das informações extraídas dos currículos Lattes. Também foram utilizados

recursos para acesso à Internet de forma a acessar a Plataforma Lattes do CNPq.

A análise foi realizada através de um programa de planilha eletrônica, onde as

matrizes relacionais foram construídas para o cálculo do fator de proximidade individual. Da

mesma forma foram construídas matrizes relacionais com os integrantes dos grupos de

pesquisa do CPGEI da UTFPR, e foi calculado o fator de proximidade social. Com estes

fatores calculados foi construída uma tabela com os integrantes separados pelo papel que

possuem no grupo de pesquisa para o cálculo do valor de corte utilizado na identificação dos

pesquisadores. Foram utilizados gráficos em forma de radar para representar as redes

egocêntricas, desprezando as demais ligações entre os indivíduos da rede egocêntrica.

3.2.2 Coleta de Informações

Para a realização do estudo de caso com o objetivo de validar o modelo computacional

proposto, foram coletadas informações sobre os pesquisadores do CPGEI da UTFPR

disponíveis na plataforma Lattes de forma manual, para identificar aspectos e relações sociais

entre os integrantes dos grupos de pesquisa e os líderes de projeto.

Não foram analisadas as redes sociais dos alunos de mestrado, doutorado e pós-

doutorado ou bolsistas de iniciação científica, pois se considera que devido a pouca

experiência deste conjunto de indivíduos no meio científico a sua contribuição na cadeia de

recomendações para um novo integrante à equipe de projeto é pequena e pode ser desprezada.

Para a coleta de informação é considerado o período de cinco anos por ser o valor

médio para conclusão de um trabalho de doutorado. A contribuição de relações anteriores a

este período foi considerada desprezível em relação ao aspecto de familiaridade, utilizado

neste trabalho como um aspecto contribuinte para o fator de proximidade entre os

pesquisadores.

3.2.3 Processo de Extração de Informações

São descritas abaixo as fases de extração de informação para a construção da rede

egocêntrica de cada pesquisador representado no modelo proposto, conforme mostrados na

Figura 6:

• As informações disponibilizadas pelos pesquisadores na Plataforma Lattes são

armazenadas em forma de arquivos tipo “.txt”, e transferidas para a planilha

eletrônica onde são indexadas e processadas de acordo com o tipo de

informação e período em que ocorreu;

• Na primeira etapa, as experiências e relações do pesquisador são identificadas

e representadas através de uma matriz relacional onde estão explicitadas as

informações de ocorrência de relações binárias, ou da freqüência de ocorrência

ou intensidade das demais relações;

• A matriz relacional é tratada para computar uma composição entre as múltiplas

relações considerando o tipo de relacionamento e o período de ocorrência,

obtendo o fator de proximidade individual entre o pesquisador e os

participantes de sua rede social. Esta matriz é utilizada para a construção dos

gráficos em forma de radar que representam a rede egocêntrica, conforme a

Figura 9.

• Na segunda etapa, os pesquisadores dos grupos de pesquisa analisados são

listados em uma tabela de acordo com o papel que desempenha no grupo. A

seguir é calculado o fator de proximidade social.

• Ao terminar a construção de todos os grupos de pesquisa, a informação de

todos os integrantes dos grupos são armazenadas em outra tabela separados

pelo papel, para o cálculo do valor de corte de identificação dos pesquisadores.

• Ao final é construída uma tabela que divulga a porcentagem de identificação

em cada grupo de pesquisa.

Figura 6: Etapas de Extração de Informação do Currículo Lattes.

3.2.3.1 Validade da Plataforma Lattes

Desde a criação da Internet faz parte do senso comum a possibilidade de utilizar as

informações disponibilizadas nesta mídia e em meios similares. No entanto, quando realmente

Cesar Augusto TaclaDOUTORTACLA, C. A.

relação:

2003 2004 2005 2006 2007 2003 2004 2005 2006 2007 2003 2004 2005 2006 2007 2003 2004 2005 2006 2007AVILA, B. C. 1 1Banaszewski, Roni Fábio 1Baptista, Rafael de Pauli 1BARTHÈS, Jean-paul 6 3Bettez, Fiori Angelo Rosot 1BORTOLI, E. M. 1 1 1 1Brancaleone, Fernando 1BRITO, R. C. 1 1CALIARI, F. M. 1 1 1 1 1Camargo, Fernando Guedes 1Correa, Edgar Fernando 1ENEMBRECK, Fabrício 1 1 3 1FREDDO, A. 1 1 1 1Gavron, Terezinha 1Gazzoni, Joacir 1GIMÉNEZ-LUGO, G. A. 2 2HUBNER, J. F. 1Lazzari, Rômulo de 1LUGO, G. G. 1PARAISO, E. C. 1Paulo, Marco Antônio Sales de 1RAMOS, M. P. 1REINHARDT, J. C. V. 1 1 1Santos, Nei Roberto dos 1SCALABRIN, E. 1 1WOZNIAK-GIMENEZ, A. B. 1Yamamoto, Anderson Seiti 1

ORIENTADOR INICIAÇÃO CIENTÍFICAORIENTADOR-DOUTORANDOORIENTADOR-MESTRANDOCO-AUTORIA

Rede Egocêntricaindicação para o projeto

Cesar Augusto Tacla relação: 2003 2004 2005 2006 2007 co-autoria mestrado doutorado iniciação soma Méd Pond. sem indicação DOUTOR peso: 1 2 3 4 5 2 3 4 1 2,947TACLA, C. A.

co-autoria mestrado doutorado iniciação Média Pond Média Arit DistFREDDO, A. 0,600 0,000 0,600 0,000 0,360 0,122 0,878CALIARI, F. M. 0,533 0,800 0,000 0,000 0,347 0,118 0,882ENEMBRECK, Fabrício 1,400 0,000 0,000 0,000 0,280 0,095 0,905REINHARDT, J. C. V. 0,000 0,800 0,000 0,000 0,240 0,081 0,919GIMÉNEZ-LUGO, G. A. 1,200 0,000 0,000 0,000 0,240 0,081 0,919BORTOLI, E. M. 0,267 0,600 0,000 0,000 0,233 0,079 0,921BRITO, R. C. 0,333 0,333 0,000 0,000 0,167 0,057 0,943BARTHÈS, Jean-paul 0,800 0,000 0,000 0,000 0,160 0,054 0,946AVILA, B. C. 0,600 0,000 0,000 0,000 0,120 0,041 0,959SCALABRIN, E. 0,600 0,000 0,000 0,000 0,120 0,041 0,959Banaszewski, Roni Fábio 0,000 0,333 0,000 0,000 0,100 0,034 0,966HUBNER, J. F. 0,267 0,000 0,000 0,000 0,053 0,018 0,982LUGO, G. G. 0,267 0,000 0,000 0,000 0,053 0,018 0,982RAMOS, M. P. 0,267 0,000 0,000 0,000 0,053 0,018 0,982WOZNIAK-GIMENEZ, A. B. 0,267 0,000 0,000 0,000 0,053 0,018 0,982Bettez, Fiori Angelo Rosot 0,000 0,000 0,000 0,333 0,033 0,011 0,989Brancaleone, Fernando 0,000 0,000 0,000 0,333 0,033 0,011 0,989Camargo, Fernando Guedes 0,000 0,000 0,000 0,333 0,033 0,011 0,989Correa, Edgar Fernando 0,000 0,000 0,000 0,333 0,033 0,011 0,989Gavron, Terezinha 0,000 0,000 0,000 0,333 0,033 0,011 0,989Gazzoni, Joacir 0,000 0,000 0,000 0,333 0,033 0,011 0,989Yamamoto, Anderson Seiti 0,000 0,000 0,000 0,333 0,033 0,011 0,989Baptista, Rafael de Pauli 0,000 0,000 0,000 0,267 0,027 0,009 0,991Lazzari, Rômulo de 0,000 0,000 0,000 0,267 0,027 0,009 0,991PARAISO, E. C. 0,133 0,000 0,000 0,000 0,027 0,009 0,991Paulo, Marco Antônio Sales de 0,000 0,000 0,000 0,267 0,027 0,009 0,991Santos, Nei Roberto dos 0,000 0,000 0,000 0,267 0,027 0,009 0,991

0 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,000

0,000 0,020 0,040 0,060 0,080 0,100 0,120 0,140

FREDD O, A.

C ALI ARI , F. M.

ENEMBREC K, Fabríc io

REI NHARD T, J. C. V.

GIMÉNEZ-LUGO, G. A.

BOR TOLI, E. M.

BRI TO, R. C .

BAR THÈS, Jean-paul

AVI LA, B. C.

SCA LAB RIN, E.

Banaszewski, Roni Fábio

HUBNE R, J . F.

LUGO, G. G.

RAMOS, M. P.

WOZNIAK -GIMENEZ, A . B.

Bettez, Fiori Angelo Rosot

Branc aleone, Fernando

Camargo, Fernando Guedes

Correa, Edgar Fernando

Gavron, Terezinha

Gazzoni, Joac ir

Yamamoto, Anderson Seiti

B aptista, R af ael de P auli

Lazz ari, Rômulo de

PARAI SO, E. C .

Paulo, Marc o Antônio Sales de

Santos, Nei Robert o dos

Cesar Augusto Tacla

0,820

0,840

0,860

0,880

0,900

0,920

0,940

0,960

0,980

1,0001

23

4

5

6

7

8

9

10

11

1213

1415

16

17

18

19

20

21

22

23

24

2526

Cesar Augusto TaclaDOUTORTACLA, C. A.

relação:

2003 2004 2005 2006 2007 2003 2004 2005 2006 2007 2003 2004 2005 2006 2007 2003 2004 2005 2006 2007AVILA, B. C. 1 1Banaszewski, Roni Fábio 1Baptista, Rafael de Pauli 1BARTHÈS, Jean-paul 6 3Bettez, Fiori Angelo Rosot 1BORTOLI, E. M. 1 1 1 1Brancaleone, Fernando 1BRITO, R. C. 1 1CALIARI, F. M. 1 1 1 1 1Camargo, Fernando Guedes 1Correa, Edgar Fernando 1ENEMBRECK, Fabrício 1 1 3 1FREDDO, A. 1 1 1 1Gavron, Terezinha 1Gazzoni, Joacir 1GIMÉNEZ-LUGO, G. A. 2 2HUBNER, J. F. 1Lazzari, Rômulo de 1LUGO, G. G. 1PARAISO, E. C. 1Paulo, Marco Antônio Sales de 1RAMOS, M. P. 1REINHARDT, J. C. V. 1 1 1Santos, Nei Roberto dos 1SCALABRIN, E. 1 1WOZNIAK-GIMENEZ, A. B. 1Yamamoto, Anderson Seiti 1

ORIENTADOR INICIAÇÃO CIENTÍFICAORIENTADOR-DOUTORANDOORIENTADOR-MESTRANDOCO-AUTORIA

Rede Egocêntricaindicação para o projeto

Cesar Augusto Tacla relação: 2003 2004 2005 2006 2007 co-autoria mestrado doutorado iniciação soma Méd Pond. sem indicação DOUTOR peso: 1 2 3 4 5 2 3 4 1 2,947TACLA, C. A.

co-autoria mestrado doutorado iniciação Média Pond Média Arit DistFREDDO, A. 0,600 0,000 0,600 0,000 0,360 0,122 0,878CALIARI, F. M. 0,533 0,800 0,000 0,000 0,347 0,118 0,882ENEMBRECK, Fabrício 1,400 0,000 0,000 0,000 0,280 0,095 0,905REINHARDT, J. C. V. 0,000 0,800 0,000 0,000 0,240 0,081 0,919GIMÉNEZ-LUGO, G. A. 1,200 0,000 0,000 0,000 0,240 0,081 0,919BORTOLI, E. M. 0,267 0,600 0,000 0,000 0,233 0,079 0,921BRITO, R. C. 0,333 0,333 0,000 0,000 0,167 0,057 0,943BARTHÈS, Jean-paul 0,800 0,000 0,000 0,000 0,160 0,054 0,946AVILA, B. C. 0,600 0,000 0,000 0,000 0,120 0,041 0,959SCALABRIN, E. 0,600 0,000 0,000 0,000 0,120 0,041 0,959Banaszewski, Roni Fábio 0,000 0,333 0,000 0,000 0,100 0,034 0,966HUBNER, J. F. 0,267 0,000 0,000 0,000 0,053 0,018 0,982LUGO, G. G. 0,267 0,000 0,000 0,000 0,053 0,018 0,982RAMOS, M. P. 0,267 0,000 0,000 0,000 0,053 0,018 0,982WOZNIAK-GIMENEZ, A. B. 0,267 0,000 0,000 0,000 0,053 0,018 0,982Bettez, Fiori Angelo Rosot 0,000 0,000 0,000 0,333 0,033 0,011 0,989Brancaleone, Fernando 0,000 0,000 0,000 0,333 0,033 0,011 0,989Camargo, Fernando Guedes 0,000 0,000 0,000 0,333 0,033 0,011 0,989Correa, Edgar Fernando 0,000 0,000 0,000 0,333 0,033 0,011 0,989Gavron, Terezinha 0,000 0,000 0,000 0,333 0,033 0,011 0,989Gazzoni, Joacir 0,000 0,000 0,000 0,333 0,033 0,011 0,989Yamamoto, Anderson Seiti 0,000 0,000 0,000 0,333 0,033 0,011 0,989Baptista, Rafael de Pauli 0,000 0,000 0,000 0,267 0,027 0,009 0,991Lazzari, Rômulo de 0,000 0,000 0,000 0,267 0,027 0,009 0,991PARAISO, E. C. 0,133 0,000 0,000 0,000 0,027 0,009 0,991Paulo, Marco Antônio Sales de 0,000 0,000 0,000 0,267 0,027 0,009 0,991Santos, Nei Roberto dos 0,000 0,000 0,000 0,267 0,027 0,009 0,991

0 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,0000 0,000 0,000 0,000 0,000 0,000 0,000 1,000

0,000 0,020 0,040 0,060 0,080 0,100 0,120 0,140

FREDD O, A.

C ALI ARI , F. M.

ENEMBREC K, Fabríc io

REI NHARD T, J. C. V.

GIMÉNEZ-LUGO, G. A.

BOR TOLI, E. M.

BRI TO, R. C .

BAR THÈS, Jean-paul

AVI LA, B. C.

SCA LAB RIN, E.

Banaszewski, Roni Fábio

HUBNE R, J . F.

LUGO, G. G.

RAMOS, M. P.

WOZNIAK -GIMENEZ, A . B.

Bettez, Fiori Angelo Rosot

Branc aleone, Fernando

Camargo, Fernando Guedes

Correa, Edgar Fernando

Gavron, Terezinha

Gazzoni, Joac ir

Yamamoto, Anderson Seiti

B aptista, R af ael de P auli

Lazz ari, Rômulo de

PARAI SO, E. C .

Paulo, Marc o Antônio Sales de

Santos, Nei Robert o dos

Cesar Augusto Tacla

0,820

0,840

0,860

0,880

0,900

0,920

0,940

0,960

0,980

1,0001

23

4

5

6

7

8

9

10

11

1213

1415

16

17

18

19

20

21

22

23

24

2526

parte-se a procura de informações neste meio, percebe-se que se obtém apenas de listas de

informações obtidas a partir de ferramentas de busca não muito eficientes (GIMÉNEZ-

LUGO, 2004).

A Plataforma Lattes é uma importante fonte de informação na forma semi-estruturada

sobre pessoas em diversas áreas de conhecimento disponível em um único sistema de

informação utilizado pelo Conselho Nacional de Desenvolvimento Científico e Tecnológico

(CNPq). (PLATAFORMA LATTES, 1999). Pode-se considerar a Plataforma Lattes como um

meio representativo da comunidade científica brasileira, uma vez que o CNPq requisita o

registro do currículo de todos os pesquisadores, estudantes (graduandos, mestrandos e

doutorandos) e pesquisadores convidados que utilizem bolsas de incentivo a pesquisa ou

outros fundos subsidiados pelo CNPq, sendo este registro obrigatório para todos os

pesquisadores e estudantes que participam de grupos de pesquisa no Brasil (ENEMBRECK et

al., 2006).

Devido à disponibilidade e confiabilidade das informações sobre os pesquisadores e

sobre os grupos de pesquisa, foi escolhida a Plataforma Lattes como meio para obter as

informações necessárias para o estudo de caso que analisará a rede social egocêntrica dos

integrantes dos grupos de pesquisa contendo pelo menos um pesquisador do CPGEI da

UTFPR.

3.3 CONSTRUÇÃO DAS REDES EGOCÊNTRICAS

Para se construir as redes egocêntricas foi necessário definir quais relações sociais

podem ser evidenciadas e como calcular a intensidade destas ligações sociais entre os

indivíduos. A escolha destas relações depende dos aspectos sociais relacionados com a

necessidade de aplicação do modelo computacional proposto e da disponibilidade de

documentos onde estas relações possam ser evidenciadas. No caso de estudo deste trabalho de

dissertação, admite-se que para os cientistas, pesquisadores engajados em um projeto de

pesquisa as ligações sociais podem ser mensuradas pelo nível de esforço para o

compartilhamento intelectual (CUMMINGS, KIESLER, 2007). Com isto infere-se que

pesquisadores com ligações fortes trabalham e publicam juntos, enquanto ligações fracas

ocorrem em pesquisadores que trabalham em uma mesma área, porém não necessariamente

trabalham ou publicam juntos.

Para o estudo de caso foram escolhidas as relações sociais que possuem aspectos

sociais que aumentam a probabilidade de dois pesquisadores trabalharem juntos como a

familiaridade, a proximidade geográfica e homofilia. As relações escolhidas devido a estes

aspectos e a facilidade de evidenciar nos documentos da plataforma Lattes foram as de co-

autoria em trabalhos científicos e as relações de orientador-orientado. Na seção a seguir estas

relações sociais são detalhadas.

3.3.1 Relação Co-Autoria

Uma das relações escolhidas neste trabalho é a de co-autoria em trabalhos científicos.

Define-se como co-autoria qualquer forma de ligação entre dois pesquisadores para a

elaboração e divulgação de trabalhos científicos como a publicação de artigos científicos,

periódicos, livros, co-participação em eventos científicos ou em outras atividades culturais.

Esta relação é valorada de acordo com a freqüência de ocorrência e o período de tempo em

que ocorreu, sendo estas medições proporcionais ao resultado do trabalho científico realizado

em conjunto, estando assim ligada ao aspecto social de familiaridade. Estas medições são

utilizadas para identificar padrões em uma rede social entre os autores e co-autores,

proporcionando entendimento de como um autor trabalha e lida com seus colegas. Estes

comportamentos são considerados como um fator que influencia o processo de formação de

uma equipe de pesquisa.

No trabalho de Said et al. (2008), a relação de co-autoria foi classificada em quatro

tipos básicos: solitária, empreendedora, mentor e laboratorial. Pode-se ainda estender esta

classificação acrescentando a co-autoria de prestígio.

O autor solitário é o que não possui nenhum tipo de co-autor. A autoria solitária é

pouco freqüente, e os poucos casos encontrados foram desconsiderados por não estarem

relacionados a nenhum aspecto social contribuinte à formação de equipes. A relação de co-

autoria empreendedora ocorre quando o autor principal procura indivíduos de grupos que

representam especialidades necessárias a um artigo em particular, podendo este tipo de

relação de co-autoria não mais ocorrer no futuro. Este tipo de relação de co-autoria está

relacionado ao aspecto social de homofilia, já que os pesquisadores são orientados a objetivos

comuns. Na relação de co-autoria de mentor o autor principal tende a publicar com seus

colegas de menor experiência, alunos e outros novos associados, estando este tipo de co-

autoria relacionada com os aspectos sociais de familiaridade e proximidade. Após adquirirem

experiência em publicações estes co-autores tendem a publicar com outros colegas, tornando

este tipo de relação de co-autoria mais fraca com o tempo. Na relação de co-autoria

laboratorial o autor principal publica com os demais integrantes do laboratório onde realiza as

pesquisas, estando este tipo de co-autoria relacionada com o aspecto social de proximidade.

Neste tipo de co-autoria é comum encontrar a maioria ou todos os membros do laboratório

presentes como co-autores dos artigos publicados. Este tipo de relação de co-autoria foi

encontrado em nosso estudo de caso no grupo de pesquisa de tecnologia em saúde. Já a co-

autoria de prestígio ocorre entre os co-autores e um autor cujo prestígio, reputação,

popularidade e reconhecimento na comunidade científica auxilia na aceitação do trabalho.

Este tipo de co-autoria pode ser evidenciado entre os líderes de projeto, coordenadores de

curso, reitores e outros pesquisadores com reconhecimento na comunidade científica ou com

importante posição social e outros autores que efetivamente trabalharam no projeto de

pesquisa.

A identificação de grupos através da relação de co-autoria ser analisada através da

técnica de diagrama em blocos, ou por grafos. Porém, este trabalho de dissertação se

diferencia ao utilizar uma abordagem distinta concentrada na utilização de relações múltiplas

considerando a temporalidade para o cálculo de um fator qualitativo de proximidade

(individual e social) para a valoração das redes egocêntricas dos pesquisadores e a sua

identificação nos grupos de pesquisa.

3.3.2 Relação Orientador-Orientado

A relação de orientador–orientado é considerada neste trabalho como uma das mais

coesas relações no meio acadêmico por possuir a capacidade de promover novas relações,

como a relação de co-autoria, e possuir duração de um a cinco anos. Este tipo de relação está

relacionado aos aspectos sociais de familiaridade, homofilia e proximidade. É classificada

como uma relação heterogênea, pois existe uma diferenciação entre os papéis sociais de

orientador e orientado, uma vez que os orientadores possuem o poder de avaliar o

desempenho dos seus orientados e qualquer pedido de auxílio na pesquisa ou em outras

atividades acadêmicas é considerada obrigatória para os orientados devido a esta

diferenciação de poder (BIAGGIO, GREENE, 1995).

Podem-se distinguir quatro tipos de orientações: a de iniciação científica, mestrado,

doutorado e pós-doutorado. A relação de orientação de iniciação científica é a mais fraca

dentre as relações de orientação, ocorrendo com os alunos de graduação que buscam conhecer

o meio científico e colaboram com pequenas pesquisas e tarefas rotineiras da equipe de

pesquisa. Esta relação na maioria dos casos dura apenas um ano e possui pouca ou nenhuma

produção científica. A orientação de mestrado já possui maior intensidade, podendo durar de

dois a três anos, sendo o mestrando responsável por construir um trabalho de pesquisa em

uma determinada área do conhecimento. A relação de orientação de doutorado é a mais

intensa, podendo durar até cinco anos, e proporciona a produção de um trabalho inédito de

pesquisa, com diversos artigos relacionados. A relação de pós-doutorado dura em média um

ano e busca o aperfeiçoamento em determinada área inovadora do conhecimento, relacionada

à área de pesquisa do pós-doutorando. Pelo seu nível de especialização, classifica-se esta

relação de orientação em conjunto com a relação de doutorado.

No estudo de caso as relações de orientador-orientado são caracterizadas como

variáveis binárias, uma vez que se verifica apenas a existência desta relação no decorrer dos

anos. Utilizam-se coeficientes de correlação para diferenciar as relações de orientador-

orientado de acordo com o tipo e época de ocorrência, obtendo desta forma um valor

proporcional à intensidade das relações. Estes coeficientes de correlação são empíricos e

escolhidos de acordo com as características de intensidade discutidos nesta seção. Evita-se a

inconsistência causada pelo uso de coeficientes de correlação através da utilização desta

informação apenas para a construção da rede social egocêntrica. Seria inviável utilizar este

tipo de medição para comparar duas díades distintas de orientador-orientado, uma vez que o

conceito de intensidade de relação é intangível e dependente da visão social subjetiva de cada

indivíduo.

3.3.3 Representação da Rede Social Egocêntrica

O modelo computacional proposto neste trabalho utiliza as técnicas de álgebra

relacional para a análise de redes sociais egocêntricas dinâmicas com o tempo e com

múltiplas relações. A construção da rede social egocêntrica de um pesquisador é realizada

através do conjunto dos pesquisadores pertencentes ao mesmo grupo de projeto e as relações

entre eles e o pesquisador analisado.

Conforme mostra a Figura 2, o modelo computacional proposto possui as seguintes

estruturas para a extração de informações para a construção da rede social egocêntrica dos

pesquisadores:

• uma máquina de busca na Plataforma Lattes para obter as informações

relacionais sobre o pesquisador a ser representado, os grupos de projeto e os

membros destes grupos,

• um mecanismo de extração de informação para identificar informações

relacionais sobre a rede social dos pesquisadores,

• um método para armazenar o valor das ligações sociais evidenciadas e calcular

a composição destas relações para construir a matriz relacional da rede

egocêntrica do pesquisador representado.

3.4 PROCESSO DE IDENTIFICAÇÃO DOS PESQUISADORES

No processo de identificação dos pesquisadores que serão indicados para a formação da

equipe de pesquisa, o modelo proposto leva em consideração na tomada de decisão também a

indicação dos demais agentes consultados. A Figura 7 descreve este processo de cadeia de

recomendações considerado no processo de identificação, onde os indivíduos da rede

egocêntrica do pesquisador líder indicam outros pesquisadores de suas redes egocêntricas para

a formação da equipe de pesquisa. Percebe-se que não existe um consenso, uma vez que cada

pesquisador expressa o seu ponto de vista sobre os demais pesquisadores indicados, porém o

valor do fator de proximidade social é obtido pela média ponderada de todas as indicações,

sendo proporcional ao número de indicações positivas e ao fator de proximidade individual

relativo a cada indivíduo que realizou a indicação. Apesar das redes egocêntricas serem

construídas a partir da visão central de cada indivíduo, isto não significa que ela seja formada

de apenas pesquisadores que não participam da rede egocêntrica do pesquisador líder. Na

verdade foi possível evidenciar no estudo de caso que a maioria dos pesquisadores indicados

faz parte da rede egocêntrica do líder de projeto.

Figura 7: Esquema do Processo de Identificação de Pesquisadores.

3.4.1 Método de Cálculo do Fator de Proximidade Individual

O fator de proximidade individual está relacionado com o ator analisado e cada

indivíduo de sua rede egocêntrica, e é valorado pela média ponderada entre as relações

medidas, normalizada pelo número de integrantes da rede egocêntrica. Cada peso é

proporcional à contribuição de cada relação para o fator de proximidade entre os indivíduos,

considerando o período em que ocorreu a relação e os fatores sociais propostos de

familiaridade, proximidade geográfica e homofilia.

Ao ser calculada a média ponderada destas relações de orientador-orientado e co-

autoria no decorrer do tempo, utiliza-se este valor para construir uma composição entre as

múltiplas relações de co-autoria (métrica) e orientador-orientado (binárias). A normalização

destes valores ao final destas médias produz um valor proporcional à relação entre os dois

atores analisados, porém somente pode ser utilizado como referência para o ponto de vista do

ator pesquisado em relação aos atores com que se relaciona, proporcionando uma noção

qualitativa da relação. Este mesmo método não poderia ser utilizado para uma análise

sociocêntrica, já que os valores das relações são afetados pela densidade da rede egocêntrica

Ator 1: Líder de Pesquisa

Ator 2: Pesquisador

Ator 3:Pesquisador

Ator 4:Pesquisador

Ator 2a:Estudante

Ator 2b:Pesquisador

Ator 1: Líder de PesquisaAtor 1: Líder de Pesquisa

Ator 2: PesquisadorAtor 2: Pesquisador

Ator 3:PesquisadorAtor 3:Pesquisador

Ator 4:PesquisadorAtor 4:Pesquisador

Ator 2a:EstudanteAtor 2a:Estudante

Ator 2b:PesquisadorAtor 2b:Pesquisador

de cada ator. Na Figura 8 está esquematizado o processo de extração das informações no

currículo Lattes para posterior cálculo do valor de cada tipo de relação, considerando a

freqüência de ocorrência e o ano em que ocorreu. Após isto é calculado o valor do nível de

proximidade utilizado para construir a rede egocêntrica do pesquisador analisado.

Figura 8: Esquema do Cálculo do Fator de Proximidade Individual

Uma típica rede social no mundo real contém relações múltiplas. Cada relação pode ser

modelada por um grafo diferente que irá refletir cada relacionamento por um diferente ponto

de vista. Para o problema de identificação de pesquisadores, estas diferentes relações

produzem diferentes resultados de identificação dos pesquisadores dos grupos de pesquisa.

Logo, a identificação dos atores de uma rede social é dependente das informações utilizadas

(CAI et al., 2005). Porém seria impossível obter na plataforma Lattes todas as informações

sobre as relações das redes sociais do mundo real. Logo, na extração de informação sobre o

pesquisador através da Plataforma Lattes, buscam-se informações relacionadas com os

aspectos sociais que levam o pesquisador a se afiliar a uma determinada equipe de pesquisa.

Entre estes aspectos foram escolhidos os aspectos de familiaridade, proximidade geográfica e

homofilia.

A familiaridade é inferida através das relações de co-autoria, pois se pode afirmar que

quando existem diversos trabalhos em co-autoria os autores trabalham juntos e compartilham

idéias, recursos e experiências. A relação de co-autoria é evidenciada pela publicação de

artigos científicos, periódicos, jornais e revistas, livros ou capítulos de livros, participação em

eventos, produção técnica de software e produtos, trabalhos técnicos e culturais. Estas

CurrículoLattes

Lista deCo-autores

por ano

Lista deorientadosMestradopor ano

Lista deorientadosDoutorado

por ano

Lista deorientados

Iniciação Científicapor ano

Cálculo da média ponderadaPor ano de ocorrência

Cálculo da média ponderadaTipo de Relação

Cálculo da média ponderadaPor ano de ocorrência

Cálculo da média ponderadaPor ano de ocorrência

Cálculo da média ponderadaPor ano de ocorrência

Lista daRede Egocêntrica

com a relação valoração

CurrículoLattes

Lista deCo-autores

por ano

Lista deorientadosMestradopor ano

Lista deorientadosDoutorado

por ano

Lista deorientados

Iniciação Científicapor ano

Cálculo da média ponderadaPor ano de ocorrência

Cálculo da média ponderadaTipo de Relação

Cálculo da média ponderadaPor ano de ocorrência

Cálculo da média ponderadaPor ano de ocorrência

Cálculo da média ponderadaPor ano de ocorrência

Lista daRede Egocêntrica

com a relação valoração

relações são valoradas pela freqüência de ocorrência e armazenadas de acordo com o período

de ocorrência.

A proximidade geográfica é inferida pela informação da cidade onde o pesquisador

reside e pela instituição onde atua, considerando a época em que esta relação ocorreu. Apesar

da proximidade geográfica estar relacionada com a relação de orientador-orientado, a medição

desta informação em outras relações de atributo dos indivíduos como “atuação na instituição”

ou “residência” é binária, e pode ser utilizada como filtro durante a etapa final do processo de

escolha dos indivíduos.

A homofilia é inferida pela área de pesquisa, e pelas relações de orientador e orientado

em iniciação científica, mestrado, doutorado e pós-doutorado. Estas relações são binárias,

sendo armazenada a sua ocorrência de acordo com o ano. Porém, enquanto as medições das

relações de orientador-orientado também são utilizadas para determinar o fator de

proximidade individual entre o pesquisador e os integrantes de sua rede egocêntrica, sendo

que a área de atuação é utilizada apenas como filtro ao final do processo de escolha do

pesquisador pelo líder de projeto.

Em geral, existem três tipos de informações relacionais que podem ser extraídas dos

currículos Lattes: atributos dos atores, relacionamentos homogêneos que ocorrem entre

atores de mesmo tipo, relacionamentos heterogêneos, entre atores de tipos diferentes. No

caso da publicação de artigos científicos, a instituição a qual o pesquisador pertence é uma

informação de atributo do ator, a relação de co-autoria entre os autores é uma informação

relacional homogênea, já a relação entre os artigos e seus autores é uma informação relacional

heterogênea. Da mesma forma a relação entre orientador-orientado é heterogênea. Esta

diferenciação entre os tipos de informações relacionais apresenta um desafio para as técnicas

tradicionais de identificação de grupos. Uma solução intuitiva seria considerar todas as

informações relacionais como pertencentes a um único tipo de informação e realizar a

identificação dos membros da equipe de forma isolada. Porém isto ocasiona uma perda de

informação sobre os relacionamentos e a sua estrutura, dificulta a identificação de propagação

de influências, ou atores ocultos que podem ter influência direta ou indireta (através do

encadeamento de relações), ou os usuários podem não estar interessados nas estruturas ocultas

de cada ator individualmente, mas nos padrões de interações envolvendo diferentes tipos de

atores (LONG, ZHANG, YU, 2007).

Após serem coletadas informações sobre cada relação escolhida é construída uma

matriz relacional com os valores de cada relação em função do tipo, da intensidade e do ano

de ocorrência. A Tabela 1 mostra um exemplo desta tabela onde na primeira coluna estão os

pesquisadores que pertencem à rede social egocêntrica do pesquisador analisado, na segunda

coluna encontra-se a relação de co-autoria nos cinco anos, nas demais colunas se repetem as

relações de orientador-orientado, para o mesmo período. Por questões de privacidade o nome

dos pesquisadores foi substituído por um código numérico.

Tabela 1: Matriz Relacional de um Pesquisador Ator:

357789089DOUTOR

relação:

Pesquisador 2003 2004 2005 2006 2007 2003 2004 2005 2006 2007 2003 2004 2005 2006 2007 2003 2004 2005 2006 20071478390 1 13789209 16100028 18410847 6 3

10721666 113032485 1 1 1 115343304 117654123 1 119964942 1 1 1 1 122275761 124586580 126897399 1 1 3 129208218 1 1 1 131519037 133829856 136140675 2 238451494 140762313 143073132 145383951 147694770 150005589 152316408 1 1 154627227 156938046 1 159248865 161559684 1

ORIENT-INICIAÇÃO CIENTÍFICAORIENTADOR-DOUTORANDOORIENTADOR-MESTRANDOCO-AUTORIA

Para cada indivíduo (m), as relações de co-autoria são mensuradas através da

freqüência de ocorrência, e é realizada uma média ponderada atribuindo empiricamente um

peso a cada ano de ocorrência destas relações. Assim a relação de co-autoria pode ser

expressa por:

( )�

� �

=

= =⋅

=K

j j

K

j

n

i ji

ca

rcaR

m

1

1 1

β

β (5)

onde:

• Rca é o valor da relação de co-autoria do indivíduo m,

• rcai é a variável binária de ocorrência da co-autoria i,

• n é o número máximo de co-autorias realizadas em um mesmo período,

• �j é o peso atribuído ao período j, com j = 1, ...,K

• K é o número total de períodos analisados.

Para cada indivíduo (m), as relações de orientador-orientado são mensuradas através

da média ponderada entre os anos de ocorrência e os pesos atribuídos a cada ano. Estas

relações podem ser expressas por:

( )�

=

=⋅

= K

j j

K

j jj

dr

rdrR

m

1

1

θ

θ (6)

( )�

=

=⋅

= K

j j

K

j jj

ms

rmsR

m

1

1

γ

γ (7)

( )�

=

=⋅

= K

j j

K

j jj

ic

ricR

m

1

1

δ

δ (8)

onde:

• Rdr, Rms, Ric são respectivamente os valores para as relações de orientador-orientado

para doutorandos, mestrandos e estudantes com bolsas de iniciação científica do

indivíduo m,

• rdrj , rmsj e ricj são as variáveis binárias de ocorrência das relações escolhidas para o

estudo de caso de orientador-orientado, sendo rdrj = rmsj = ricj = 1, caso exista a

relação e rdrj = rmsj = ricj = 0 caso contrário.

• �j, �j e �j são os pesos atribuídos para cada uma das relações no período j,

com j = 1, ...,K.

• K é o número total de anos analisados.

O valor do fator de proximidade individual bruto é dado pela média ponderada entre

estas relações. Cada peso é proporcional à contribuição de cada relação para os aspectos

sociais de familiaridade, proximidade geográfica e homofilia. O valor do fator de proximidade

individual bruto entre os atores pode ser expresso por:

( ) ( ) ( ) ( )( )caicmsdr

camicmmsmdrmm

RcaRicRmsRdrP

αααααααα

+++⋅+⋅+⋅+⋅

= (9)

onde:

• Pm é o fator de proximidade individual bruto, entre o indivíduo m e os elementos de

sua rede egocêntrica,

• �ca, �ic, �ms, �dr são os pesos atribuídos a cada uma das relações escolhidas para o

estudo de caso

Como a importância de cada indivíduo em uma rede egocêntrica depende da visão

subjetiva, o valor do fator de proximidade individual bruto deve ser normalizado para

transparecer a visão individual de cada indivíduo analisado. Assim, o fator de proximidade

individual pode ser expresso por:

� =

=N

i i

mm

P

PP

1

(10)

onde:

• |Pm| é o fator de proximidade individual do pesquisador m,

• Pi é o fator de proximidade individual bruto do ator i,

• N é o número máximo de agentes na rede egocêntrica.

Com os valores do fator de proximidade individual calculados, é possível se construir

uma tabela com os valores da relação de proximidade da rede social egocêntrica. O gráfico

em histograma permite evidenciar os diferentes pontos de vista que o agente possui de cada

agente de sua rede egocêntrica. A Tabela 2 mostra os valores do fator de proximidade

individual do nosso exemplo, com o histograma ao lado, correspondendo a representação

gráfica dos valores do fator de proximidade já normalizados.

Tabela 2: Fator de Proximidade Individual de um Pesquisador Rede Egocêntrica

357789089 relação: 2003 2004 2005 2006 2007 mestrado doutorado iniciação soma Méd Pond.DOUTOR peso: 1 2 3 4 5 3 4 1 2,947

co-autoria mestrado doutorado iniciação P |P|

1478390 0,600 0,000 0,600 0,000 0,360 0,122

3789209 0,533 0,800 0,000 0,000 0,347 0,118

6100028 1,400 0,000 0,000 0,000 0,280 0,095

8410847 0,000 0,800 0,000 0,000 0,240 0,081

10721666 1,200 0,000 0,000 0,000 0,240 0,081

13032485 0,267 0,600 0,000 0,000 0,233 0,079

15343304 0,333 0,333 0,000 0,000 0,167 0,057

17654123 0,800 0,000 0,000 0,000 0,160 0,054

19964942 0,600 0,000 0,000 0,000 0,120 0,041

22275761 0,600 0,000 0,000 0,000 0,120 0,041

24586580 0,000 0,333 0,000 0,000 0,100 0,034

26897399 0,267 0,000 0,000 0,000 0,053 0,018

29208218 0,267 0,000 0,000 0,000 0,053 0,018

31519037 0,267 0,000 0,000 0,000 0,053 0,018

33829856 0,267 0,000 0,000 0,000 0,053 0,018

36140675 0,000 0,000 0,000 0,333 0,033 0,011

38451494 0,000 0,000 0,000 0,333 0,033 0,011

40762313 0,000 0,000 0,000 0,333 0,033 0,011

43073132 0,000 0,000 0,000 0,333 0,033 0,011

45383951 0,000 0,000 0,000 0,333 0,033 0,011

47694770 0,000 0,000 0,000 0,333 0,033 0,011

50005589 0,000 0,000 0,000 0,333 0,033 0,011

52316408 0,000 0,000 0,000 0,267 0,027 0,009

54627227 0,000 0,000 0,000 0,267 0,027 0,009

56938046 0,133 0,000 0,000 0,000 0,027 0,009

59248865 0,000 0,000 0,000 0,267 0,027 0,009

61559684 0,000 0,000 0,000 0,267 0,027 0,009

0,000 0,020 0,040 0,060 0,080 0,100 0,120 0,140

1478390

3789209

6100028

8410847

10721666

13032485

15343304

17654123

19964942

22275761

24586580

26897399

29208218

31519037

33829856

36140675

38451494

40762313

43073132

45383951

47694770

50005589

52316408

54627227

56938046

59248865

61559684

Com os fatores de proximidade individuais já calculados é possível construir um

gráfico em radar para representar a rede egocêntrica do agente pesquisado. A Figura 9 mostra

o gráfico em radar da rede egocêntrica do pesquisador do representado na Tabela 2 com a

forma típica de caracol.

Figura 9: Gráfico em Radar da Rede Egocêntrica de um Pesquisador.

3.4.2 Método de Cálculo do Fator de Proximidade Social

O fator de proximidade social é calculado a partir da média ponderada entre os fatores

de proximidade individuais dos pesquisadores candidatos em relação ao líder de pesquisa e

aos demais pesquisadores que compõem o grupo de pesquisa. Os pesos são definidos

empiricamente de acordo com o papel que cada indivíduo desempenha no grupo. Pode-se

matematicamente expressar o fator de proximidade social como:

357789089

0,820

0,840

0,860

0,880

0,900

0,920

0,940

0,960

0,980

1,000

12

3

4

5

6

7

8

9

10

11

1213

1415

16

17

18

19

20

21

22

23

24

2526

=

=⋅

=N

j j

N

j jj

m

PPG

1

1

ρ

ρ (10)

onde:

• |PGm| é o fator de proximidade social do pesquisador m,

• Pj é o fator de proximidade individual do ator j,

• � j é o peso atribuído ao papel no grupo analisado do ator j ,

• N é o número máximo de agentes na rede egocêntrica.

Este fator está relacionado com a importância do indivíduo em relação ao grupo de

projeto segundo a rede egocêntrica de cada pesquisador e líder de projeto do grupo analisado.

Com a diferenciação entre os pesos dos pesquisadores e líder de projeto utilizados

nesta média ponderada é possível considerar a cadeia de recomendações dos demais

pesquisadores, permanecendo como aspecto principal para tomada de decisão o fator de

proximidade da rede social egocêntrica do líder de projeto. A contribuição dos demais

integrantes dos grupos de pesquisa, que atuam no papel de estudantes ou técnicos, foi

desprezada devido a pouca experiência profissional destes indivíduos no trabalho científico e

ao aspecto do aprendizado ser o principal fator de engajamento destes indivíduos.

3.4.3 Valor de Corte para Identificação dos Pesquisadores

Para a identificação dos pesquisadores pertencentes às equipes de pesquisa foi adotado

um valor de corte empírico de 0,02 que demonstrou ser um valor de corte que proporcionou

bons resultados na maioria dos grupos de pesquisa do CPGEI/ UTFPR. Como trabalho futuro

propomos o estudo para a determinação de um valor de corte calculado através de um método

que busca encontrar o mínimo valor do fator de proximidade social necessário para um

indivíduo ser convidado para entrar na equipe de pesquisa. Como mostra a Figura 10, os

gráficos de evolução no estudo de caso do fator de proximidade social de cada pesquisador

em função do seu papel no grupo de pesquisa possuem uma curva aproximadamente contínua,

sem uma inflexão considerável que possa ser considerada um valor de corte possível. Logo,

não foi possível desta forma determinar no ambiente do estudo de caso um valor de corte para

a identificação dos indivíduos pertencentes aos grupos de projeto.

Gráfico de Evolução do Fator de Proximidade Social para o Papel de Pesquisadores

00,10,20,30,40,50,6

1 7 13 19 25 31 37 43 49 55 61 67 73 79 85 91 97 103 109 115 121 127

Pesquisadores

Fato

r de

Pro

xim

idad

e S

ocia

l

Gráfico de Evolução do Fator de Proximidade Social para o Papel de Líder de Projeto

0

0,2

0,4

0,6

0,8

1

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

Líderes de Projeto

Fato

r de

Pro

xim

idad

e S

ocia

l

Gráfico de Evolução do Fator de Proximidade Social para o Papel de Estudante

00,10,20,30,40,50,6

1 10 19 28 37 46 55 64 73 82 91 100 109 118 127 136 145 154 163 172 181 190 199

Estudantes

Fato

r de

Pro

xim

idad

e S

ocia

l

Figura 10: Gráficos de Evolução do Fator de Proximidade Social em relação aos diversos

papéis no Grupo de Pesquisa

3.5 JUSTIFICATIVAS PARA O MODELO COMPUTACIONAL PROPOSTO

O uso dos princípios de análise de redes sociais orienta a utilização das informações

contidas nos documentos disponíveis para escolher e valorar relacionamentos sociais

relacionados com determinados comportamentos ou que identificam determinados indivíduos.

A abordagem egocêntrica foi utilizada devido à explicitação das relações entre os

indivíduos e os demais integrantes diretamente ligados a ele, sendo a análise deste tipo de

simplificação das redes egocêntricas, conhecida como sociograma de Moreno, ideais para a

identificação dos líderes e da cadeia de recomendações da rede social (SCOTT, 2000). Esta

abordagem proporciona o tratamento das relações sobre o ponto de vista individual de cada

ator, sendo natural a diferença entre os fatores de proximidade individual. Em uma abordagem

sociocêntrica seria possível identificar a formação de grupos, a centralidade de determinado

indivíduo ou a seu grau de intermediação, sendo possível o estudo da evolução da equipe e

identificação de estruturas sociais. Porém não é possível verificar com esta abordagem como a

visão subjetiva de sua rede social influencia na construção de sua equipe de pesquisa, que é o

objetivo deste trabalho de dissertação.

O uso de um método linear para a construção da representação egocêntrica é apoiado

pelo trabalho de Cai et al. (2005). A idéia básica do algoritmo utilizado é encontrar uma

combinação de relacionamentos que busca tornar a medida do relacionamento entre os

indivíduos dentro da comunidade do centro de pesquisa o mais intenso possível em relação

aos aspectos sociais escolhidos, com o objetivo de agrupar estes indivíduos para identificar as

comunidades. A valoração destas relações pode ser tanto linear como não linear. Segundo Cai

et al. (2005), em sendo impossível um usuário conseguir todas as informações relacionadas

com um indivíduo, as técnicas não lineares tendem a ser instáveis podendo produzir

agrupamentos falsos com números elevados de integrantes. Assim este trabalho utilizou

apenas técnicas lineares de agrupamento comparando o fator de proximidade social (calculado

através de sucessivas médias ponderadas) com um valor de corte. O fator de proximidade

social é uma média ponderada dos fatores de proximidade individuais em relação ao líder de

projeto e aos demais pesquisadores do grupo de pesquisa. Com isto este fator considera não

apenas a rede egocêntrica do líder de projeto, mas também a indicação por parte dos demais

pesquisadores de forma a usar a cadeia de recomendações dos pesquisadores, mas

considerando o fator de proximidade em relação ao líder de projeto como fator principal na

decisão.

A identificação dos integrantes dos grupos de pesquisa a partir do uso do fator de

proximidade social é realizada devido ao objetivo deste trabalho de verificar a influência das

redes sociais na formação destes grupos. Este objetivo não seria possível se fosse adotada a

abordagem de propor uma equipe de pesquisa e compará-la com o grupo de projeto, uma vez

que o valor empírico de corte limitaria esta análise, além da combinação dos diferentes

indivíduos com grau de proximidade social aproximado produzirem um número enorme de

agrupamentos possíveis. O uso de um valor de corte empírico é utilizado em diversos

trabalhos como Matsuo et al. (2003), Berg-Wolf e Saia (2006).

Desta forma foi possível construir um modelo computacional de fácil compreensão e

baixa complexidade computacional com a capacidade de lidar com relações múltiplas

considerando o dinamismo temporal.

3.6 CONCLUSÕES

Buscou-se neste capítulo propor um modelo computacional capaz de identificar

indivíduos através da representação da rede egocêntrica do líder de projeto e demais

integrantes da rede social. O modelo proposto utiliza técnicas de álgebra relacional para a

obtenção de um fator de proximidade social a partir do cálculo das médias ponderadas das

relações em função do tipo e do período em que ocorreu. Este fator possui característica

qualitativa, e é comparado com um valor de corte empírico para identificar os integrantes dos

grupos de pesquisa. Nos anexos podem ser encontradas as planilhas utilizadas para o

experimento com um grupo de projeto, como a matriz relacional do líder de projeto, tabela de

cálculo do fator de proximidade individual e o gráfico em forma de radar do sociograma de

Moreno deste indivíduo.

No próximo capítulo serão detalhados os resultados do estudo de caso e discutidos os

principais aspectos relacionados com os experimentos como o ambiente e domínio as

limitações do modelo computacional proposto.

CAPÍTULO 4

RESULTADOS DO ESTUDO DE CASO

Neste capítulo são mostrados os principais resultados obtidos com a aplicação do

modelo computacional proposto no estudo de caso. Na seção 4.1 é descrito o ambiente em que

foi realizado o estudo de caso. A seguir são discutidas as limitações do modelo computacional

proposto, na seção 4.2.

4.1 ESTUDO DE CASO

Inicialmente foram analisados 22 grupos de projeto registrados no diretório de grupos

do CNPq e que possuem a participação de pelo menos um pesquisador do CPGEI da UFTPR.

Primeiramente foram analisadas apenas as redes egocêntricas dos pesquisadores pertencentes

ao CPGEI durante o experimento da identificação das equipes de projeto. Desta forma foi

possível evidenciar apenas 53,1% dos participantes, ou seja, aproximadamente metade dos

indivíduos destes grupos possuíam alguma relação de co-autoria ou orientador-orientado.

Entre estes indivíduos apenas 27,0% dos pesquisadores possuíam um fator de proximidade

social superior ao valor de corte, sendo assim identificados como indivíduos pertencentes aos

grupos de pesquisa. Estes indivíduos identificados foram comparados com as listas dos grupos

de pesquisa divulgadas pela plataforma Lattes para confirmar os resultados.

A Tabela 3 descreve melhor a evolução destes resultados considerando apenas as

informações dos pesquisadores do CPGEI da UTFPR, e mostra os percentuais de

identificação dos indivíduos, de identificações falhas com fator de proximidade social menor

que o valor de corte para identificação, e o percentual de indivíduos não evidenciados pelas

relações utilizadas nos experimentos preliminares do estudo de caso.

valo

res

tota

lizad

os o

btid

os:

357

27,0

26,1

53,1

43,5

Gru

po d

e P

roje

toN

úmer

o T

otal

de

In

tegr

ante

s

Indi

vídu

os

Iden

tific

ados

(%)

Indi

vídu

os c

om F

ator

de

Pro

xim

idad

e G

loba

l Inf

erio

r (%

)

Tot

al In

diví

duos

E

vide

ncia

dos

(%)

Indi

vídu

os N

ão

Evi

denc

iado

s (%

)

LME

- La

bora

tóri

o de

Mic

roel

etrô

nica

da

UT

FPR

5

0,0

100,

010

0,0

0,0

Gru

po d

e P

esqu

isas

em

Eng

enha

ria

Bio

méd

ica

3

0,0

66,7

66,7

33,3

Gru

po d

e P

esqu

isa

em C

omun

icaç

ões

- GP

qCom

6

0,0

33,3

33,3

66,7

Eng

enha

ria

Bio

méd

ica

e Fí

sica

Méd

ica

27

0,0

14,8

14,8

85,2

Gru

po d

e E

stud

os e

Pes

quis

as e

m E

nsin

o de

Fís

ica

14

0,0

0,0

0,0

100,

0G

rupo

de

Pes

quis

a em

Aná

lise

e P

roce

ssam

ento

de

Ene

rgia

9

0,0

0,0

0,0

100,

0B

iom

atem

átic

a

20,

00,

00,

032

,0G

rupo

de

Tec

nolo

gia

em S

aúde

40

5,0

15,0

20,0

80,0

Man

ufat

ura

Inte

grad

a

119,

19,

118

,281

,8C

entr

o de

Pes

quis

as e

m M

ater

iais

- C

PqM

38

18,4

0,0

18,4

81,6

Rad

iaçõ

es Io

niza

ntes

e F

ísic

a N

ucle

ar

2532

,056

,088

,012

,0E

ngen

hari

a B

iom

édic

a 9

33,3

22,2

55,6

44,4

Tel

emát

ica

26

42,3

15,4

57,7

42,3

ME

ME

NT

O

944

,433

,377

,822

,2D

ispo

sitiv

os F

otôn

icos

e A

plic

açõe

s

3345

,527

,372

,727

,3U

ltra-

som

15

46,7

40,0

86,7

13,3

Ele

troc

irur

gia

5

60,0

40,0

100,

00,

0B

iote

lem

etri

a

2560

,08,

068

,032

,0G

rupo

de

Est

udos

e P

esqu

isa

em S

inai

s e

Imag

ens

21

61,9

28,6

90,5

9,5

Info

rmát

ica

Indu

stri

al

3482

,411

,894

,15,

9

Tab

ela

3:R

esul

tado

sda

Iden

tific

ação

de P

esqu

isad

ores

utili

zand

oap

enas

info

rmaç

ões

dos

pesq

uisa

dore

sdo

CPG

EI/U

TFP

R

Com o objetivo de melhorar estes resultados, o experimento foi expandido

considerando as redes egocêntricas de todos os indivíduos dos grupos de pesquisa que

possuam pelo menos um integrante pertencente ao CPGEI da UTFPR. Desta forma o processo

de construção do fator de proximidade social recebeu a contribuição de todos os indivíduos

relacionados com o líder de projeto, melhorando a cadeia de recomendações e proporcionando

melhores resultados. Assim foram analisadas 122 redes egocêntricas dos pesquisadores e

líderes de projeto, em uma comunidade de 362 indivíduos (considerando os estudantes), em

23 grupos de pesquisa, com um total de 67620 ligações sociais estudadas quanto à existência,

freqüência e ocorrência, sendo calculados 3386 fatores de proximidade individual para a

construção das redes egocêntricas. O grupo de Tecnologia em Saúde não foi considerado

devido ao tipo de relação de co-autoria possuir o caráter de laboratorial, tornando a sua

análise difícil de ser realizada manualmente já que cada trabalho possui em média cinco co-

autores que se combinam entre os 19 participantes com mais de 150 trabalhos publicados nos

últimos anos. Assim apenas a análise deste grupo contabilizaria aproximadamente 9500

relações de co-autoria. Porém o tipo laboratorial de relação de co-autoria torna o grupo coeso

devido a elevada freqüência de ocorrência dos relacionamentos, favorecendo a identificação

do grupo de pesquisa pelo modelo computacional proposto.

Para este estudo de caso foi escolhido o valor empírico de 0,02 para ser utilizado

como valor de corte para a identificação de pesquisadores na comunidade analisada. A

escolha deste valor foi baseada no estudo de alguns grupos de pesquisa, onde foi possível

perceber que a maioria dos indivíduos possuía um valor do fator de proximidade social

próximo ao valor escolhido. Assim os resultados de identificação dos integrantes das equipes

de pesquisa foram de 74,0%. Com este trabalho foi possível evidenciar 85,0% dos indivíduos

estudados através do uso de informações da rede egocêntrica do líder de projeto e da cadeia

de recomendações dos pesquisadores que compõe esta rede. No entanto 15,0% dos integrantes

das equipes de projeto não foram evidenciados, ou seja, não possuíam nenhuma relação de co-

autoria ou orientador-orientado, e 12,1% dos indivíduos apesar de serem evidenciados

apresentaram um fator de proximidade social inferior ao valor de corte. A Figura 11 mostra o

gráfico com o percentual de identificação dos indivíduos dos grupos de pesquisa analisados

no estudo de caso.

0,0 10,0 20,0 30,0 40,0 50,0 60,0 70,0 80,0 90,0 100,0

Dispositivos Fotônicos e Aplicações

Grupo de Pesquisa em Análise e Processamento de Energia

Engenharia Biomédica

Telemática

Biotelemetria

Centro de Pesquisas em Materiais - CPqM

Eletrocirurgia

Ultra-som

MEMENTO

Grupo de Pesquisa em Comunicações - GPqCom

Grupo de Estudos e Pesquisas em Ensino de Física

Linha de pesquisa Instrumentação e automação de processos industriais

Radiações Ionizantes e Física Nuclear

Engenharia Biomédica e Física Médica

Biomatemática

Grupo de Pesquisas em Engenharia Biomédica

Manufatura Integrada

LME - Laboratório de Microeletrônica da UTFPR

Grupo de Estudos e Pesquisa em Sinais e Imagens

Informática Industrial

Linha de pesquisa Scheduling em refinarias

Linha de pesquisa Sistemas Híbridos de Controle

Linha de pesquisa Sistemas Inteligentes de Controle

Figura 11: Gráficos da Porcentagem de Identificação dos Indivíduos Pertencentes

aos Grupos de Pesquisa com pelo menos um Integrante do CPGEI da UTFPR.

A Tabela 4 mostra os percentuais de identificação dos indivíduos, de identificações

falhas com fator de proximidade social menor que o valor de corte para identificação, e o

percentual de indivíduos não evidenciados pelas relações utilizadas nos experimentos do

estudo de caso.

valo

res

tota

lizad

os o

btid

os:

362

74,0

12,1

85,0

15,0

Gru

po d

e P

roje

toN

úmer

o T

otal

de

In

tegr

ante

s

Indi

vídu

os

Iden

tific

ados

(%)

Indi

vídu

os c

om F

ator

de

Pro

xim

idad

e G

loba

l Inf

erio

r (%

)

Tot

al In

diví

duos

E

vide

ncia

dos

(%)

Indi

vídu

os N

ão

Evi

denc

iado

s (%

)

Dis

posi

tivos

Fot

ônic

os e

Apl

icaç

ões

36

50,0

25,0

75,0

25,0

Gru

po d

e P

esqu

isa

em A

nális

e e

Pro

cess

amen

to d

e E

nerg

ia

1050

,00,

050

,050

,0E

ngen

hari

a B

iom

édic

a 11

54,5

9,1

63,6

36,4

Tel

emát

ica

26

57,7

23,1

80,8

19,2

Bio

tele

met

ria

25

60,0

8,0

68,0

32,0

Cen

tro

de P

esqu

isas

em

Mat

eria

is -

CP

qM

4065

,07,

572

,527

,5E

letr

ocir

urgi

a

666

,733

,310

0,0

0,0

Ultr

a-so

m

1566

,720

,086

,713

,3M

EM

EN

TO

9

66,7

11,1

77,8

22,2

Gru

po d

e P

esqu

isa

em C

omun

icaç

ões

- GP

qCom

7

71,4

14,3

85,7

14,3

Gru

po d

e E

stud

os e

Pes

quis

as e

m E

nsin

o de

Fís

ica

14

71,4

14,3

85,7

14,3

Linh

a de

pes

quis

a In

stru

men

taçã

o e

auto

maç

ão d

e pr

oces

sos

indu

stri

ais

771

,428

,610

0,0

0,0

Rad

iaçõ

es Io

niza

ntes

e F

ísic

a N

ucle

ar

2572

,020

,092

,08,

0E

ngen

hari

a B

iom

édic

a e

Físi

ca M

édic

a

2875

,07,

182

,117

,9B

iom

atem

átic

a

475

,025

,075

,025

,0G

rupo

de

Pes

quis

as e

m E

ngen

hari

a B

iom

édic

a

580

,00,

080

,020

,0M

anuf

atur

a In

tegr

ada

11

81,8

9,1

90,9

9,1

LME

- La

bora

tóri

o de

Mic

roel

etrô

nica

da

UT

FPR

6

83,3

16,7

100,

00,

0G

rupo

de

Est

udos

e P

esqu

isa

em S

inai

s e

Imag

ens

23

91,3

0,0

91,3

8,7

Info

rmát

ica

Indu

stri

al

3691

,75,

697

,22,

8Li

nha

de p

esqu

isa

Sch

edul

ing

em r

efin

aria

s10

100,

00,

010

0,0

0,0

Linh

a de

pes

quis

a S

iste

mas

Híb

rido

s de

Con

trol

e5

100,

00,

010

0,0

0,0

Linh

a de

pes

quis

a S

iste

mas

Inte

ligen

tes

de C

ontr

ole

310

0,0

0,0

100,

00,

0

Tab

ela

4:R

esul

tado

sda

Iden

tific

ação

de P

esqu

isad

ores

utili

zand

oin

form

açõe

sde

todo

sos

pesq

uisa

dore

sdo

s gr

upos

de p

esqu

isa

que

poss

uam

pelo

men

osum

inte

gran

tedo

CPG

EI/

UT

FPR

Em relação aos papéis que os integrantes dos grupos de pesquisa desempenham, foi

possível identificar 89,7% dos integrantes no papel de líderes de projeto, 89,6% dos

integrantes no papel de pesquisadores e 82,8% dos integrantes no papel de estudantes,

utilizando o valor de corte de 0,02 para o nível de proximidade social. Porém o método

utilizado não evidenciou alguns dos integrantes das equipes de pesquisa, sendo 3,2% dos

indivíduos no papel de líderes de projeto, 24,2% de pesquisadores e 13,8% dos estudantes,

conforme a Tabela 5.

Tabela 5: Proporção de Identificação em Relação ao Papel no Grupo de Pesquisa

Líderes Pesquisadores Estudantes

% de identificação 86,66% 67,18% 70,93%

% de identificação (descartando os não evidenciados)

89,65% 89,58% 82,75%

% pesquisadores não evidenciados: 3,22% 24,21% 13,79%

A dificuldade em identificar os líderes de projeto com o fator de proximidade social

indica que em alguns grupos o líder publica pouco com os integrantes de seu grupo, e possui

poucos orientados dentro destes grupos. Já os pesquisadores com pouca experiência, ou no

final de carreira, não são evidenciados pelo modelo proposto devido às relações escolhidas,

pois possuem um número reduzido de publicação nos últimos cinco anos. O mesmo ocorre

com os estudantes que ainda possuem um pequeno número de publicações, apesar de

possuírem relações de orientador-orientado.

Estes valores podem ser comparados com os resultado obtidos com o trabalho de

Enembreck et al. (2006) que buscou a identificação dos pesquisadores de grupos de pesquisa

utilizando a análise de contexto do currículo Lattes dos pesquisadores com o resumo das

dissertações de mestrado da instituição pesquisada, e com os currículos dos integrantes do

grupo de pesquisa. A Tabela 6 mostra os resultados desta pesquisa, para a identificação de

pesquisadores em relação ao projeto de pesquisa e em relação ao grupo de pesquisa. Na

segunda etapa foram retirados os trabalhos inovadores, pois estes trabalhos não tinham

relação com o currículo Lattes dos pesquisadores, e por isto prejudicava a identificação. Na

conclusão os autores comentam que o baixo valor para identificação do pesquisador em

relação ao projeto se deve à sobreposição entre as áreas de atuação dos pesquisadores, que por

participam do mesmo grupo de pesquisa possuem conceitos semelhantes no currículo Lattes.

Também foram comentadas algumas limitações que causaram erros, como o uso de tradutores

inglês-português, a escolha de apenas 20 artigos para compor a base de aprendizado para

comparação dos conteúdos, e a limitação de 500 palavras retiradas do resumo das dissertações

de mestrado. Neste trabalho os pesquisadores podem ter o papel dentro dos grupos de

pesquisa como líderes de projeto ou pesquisadores, sendo os alunos descartados.

Tabela 6: Resultados de Identificação de Pesquisadores através da Abordagem de Comparação de Contexto

em relação ao grupo em relação ao projeto

% identificação 75,00% 19,23%

% identificação ( retirando os trabalhos inovadores)

88,63% 22,72%

Pesquisadores

Os resultados obtidos pelo modelo computacional proposto se aproximam dos

resultados alcançados pela análise de contextos no trabalho de Enembreck et al. (2006) para a

identificação de pesquisadores nos grupos de pesquisa. Porém, o estudo de caso deste trabalho

de dissertação se diferencia por ser realizado em uma comunidade maior, com atores atuando

em três papéis no grupo de pesquisa. Apesar da análise de contexto também produzir bons

resultados, este método é limitado quanto às informações sobre a estrutura social da

comunidade pesquisada e a percepção da dinâmica social com o passar do tempo. Mas a

dificuldade de obtenção das informações relacionais através de textos com informações pouco

estruturadas orienta a utilização da análise de contextos como uma etapa inicial da análise da

rede social da comunidade pesquisada.

4.1.1 Discussão sobre os Grupos de Pesquisa

Os resultados de identificação variam com os grupos analisados. Os motivos que

levaram a esta diferença estão relacionados às características internas destes grupos. Alguns

grupos de pesquisa possuíam características próprias que dificultaram a identificação a partir

do fator de proximidade social. Assim existem algumas hipóteses para este caso:

1. O grupo de projeto está mal formado e deve ser alterado de acordo com as

indicações de proximidade obtidas através da rede egocêntrica do líder de

projeto. Considerando isto, este grupo deve ser descartado da análise.

Considera-se um grupo de pesquisa como mal formado quando outras relações

como prestígio, força política e posição social foram importantes no momento

da escolha dos integrantes.

2. O líder de projeto utiliza outros fatores, não abordados pelo modelo proposto,

para a escolha dos integrantes da equipe de pesquisa. Logo, o modelo deve ser

melhorado buscando a valoração de outros relacionamentos possíveis de

evidenciar, ou pela estratificação das relações analisada em diversos subtipos.

3. Os grupos são formados em sua maioria por pesquisadores com pouca

experiência ou em final de carreira e estudantes. Devido o pequeno número de

publicações realizadas nos últimos cinco anos e ao pequeno número de

orientações, poucos indivíduos são identificados pelas relações escolhidas no

estudo de caso.

4. Existe a falta de profissionais capacitados para a função, ou a falta de incentivo

para favorecer o engajamento nos grupos de pesquisa, sendo estes aspectos

relativos às diretrizes do centro de pesquisa. Assim, indivíduos sem nenhuma

publicação científica passam a integrar os grupos de projeto e não são

reconhecidos pelas relações escolhidas no estudo de caso.

A maioria dos líderes de projeto possui o maior índice de proximidade social no grupo

de pesquisa, o que pode ser considerado proporcional ao trabalho de liderança realizado por

estes atores nos grupos de pesquisa. Porém, alguns grupos possuem líderes com baixo fator de

proximidade social, e ainda existem grupos com líderes não evidenciados. Nestes casos estão

os novos grupos de pesquisa, que ainda não publicaram nenhum trabalho, ou os casos onde o

líder possui um papel de prestígio na instituição.

4.2 LIMITAÇÕES DO MODELO COMPUTACIONAL PROPOSTO

Neste trabalho de dissertação são examinadas as relações existentes entre os

integrantes de equipes de pesquisa e por sua própria natureza estas relações são colaborativas,

ou seja, estas relações estão ligadas ao trabalho em conjunto na equipe de pesquisa. Apesar

disto existem diversas relações que poderiam ser utilizadas para melhorar os resultados.

Devido às limitações do trabalho manual na realização dos experimentos, foi impossível

acrescentar mais relações ao estudo, ou mesmo obter informações sobre um período maior de

tempo. Isto limitou a identificação de pesquisadores que apesar de terem uma vasta

experiência científica, publicaram pouco nos últimos cinco anos. Como já comentado na

apresentação do modelo computacional, a escolha das relações sociais é determinante no

sucesso da análise. Relações que não podem ser evidenciadas nos documentos, ou a

indisponibilidade destes documentos, limitam o modelo proposto. Neste ponto a abordagem

por análise da similaridade de contextos, apresentada no trabalho de Enembreck et al. (2006)

não é limitada.

Apesar do modelo poder ser estendido para a aplicação na formação de equipes,

através da proposta de uma lista de candidatos à equipe de pesquisa criada através da

composição das múltiplas relações considerando o dinamismo no tempo e os atributos de cada

indivíduo, os experimentos foram limitados à identificação de grupos já existentes. Os

resultados do experimento não podem ser relacionados aos mecanismos que determinam

como os membros de grupos de projeto escolhem uns aos outros para compor um grupo de

pesquisadores. Esta análise também não está relacionada com a probabilidade de existirem

outros relacionamentos que promovam a decisão de pesquisadores em se afiliar a um projeto

de pesquisa em preferência a outro, como no caso dos melhores pesquisadores escolherem

trabalhar uns aos outros, se isolando dos demais pesquisadores. Com a impossibilidade de

conhecer, ou evidenciar nas relações analisadas, outros casos onde pesquisadores experientes

não foram convidados para compor uma equipe de pesquisa, ou pesquisadores que decidiram

não participar de determinado projeto de pesquisa, não se pode com este trabalho de

dissertação discutir sobre a o processo de seleção de pesquisadores para a formação de

equipes de pesquisa. Como as informações do estudo de caso foram obtidas em um

determinado ponto do tempo, os resultados deste trabalho estão limitados aos projetos de

pesquisa onde os pesquisadores já foram selecionados, limitando a discussão da probabilidade

deles continuarem a colaborar com estes projetos no futuro apenas com as informações deste

estudo de caso. Este estudo é limitado pela inexistência do histórico da evolução dos grupos

de pesquisa com o tempo já que não existe no currículo Lattes informações disponíveis sobre

a entrada ou saída de membros nos grupos de pesquisa.

4.2.1 Dificuldades Encontradas no Decorrer do Trabalho

No decorrer desse trabalho algumas dificuldades foram vencidas facilmente, pois

houve um alerta dos colegas nesses pontos, outras foram mais difíceis de contornar por serem

desconhecidas. Assim, é importante deixar registrado as dificuldades que foram encontradas e

algumas dicas para facilitar os trabalhos futuros:

• A primeira dificuldade foi como valorar corretamente as relações. No estudo de caso

foi possível verificar nos primeiros experimentos que a influência do erro causado por

pequenas falhas na valoração das relações pode ser considerada desprezível em grupos

onde o líder possui uma grande rede egocêntrica, porém pode ter um caráter decisivo

em redes pequenas. Isto ocorre devido à utilização do fator de proximidade social que

utiliza a cadeia de recomendações para o seu cálculo com a contribuição do fator de

proximidade individual que é normalizado para cada indivíduo.

• Outro problema é como identificar indivíduos que são levemente evidenciados pelas

relações escolhidas, como os estudantes, ou pesquisadores que integram a pouco

tempo um grupo de pesquisa do estudo de caso. Uma vez que estes estão começando a

sua carreira como pesquisadores e não possuem ainda uma vasta experiência ou co-

autorias que possam evidenciar sua proximidade com o grupo de pesquisa estes

indivíduos não são identificados. Uma solução trivial seria a escolha de outras relações

que possam evidenciar estes indivíduos. Outra possibilidade é uma abordagem

diferenciada pelo papel que o indivíduo desempenha no grupo de pesquisa, como o

caso de utilizar valores de corte diferenciados para a identificação de um determinado

papel social. Esta abordagem não foi realizada no estudo de caso devido a dificuldade

de refazer o experimento manualmente no tempo disponível.

• Um dos problemas encontrados durante os testes foi a determinação dos pesos para

diferenciar as relações quanto ao tipo e período em que ocorreu. Durante os

experimentos iniciais optou-se por pesos distribuídos de forma linear, uma vez que o

resultado final nos testes realizados foi satisfatório, já que a contribuição da cadeia de

recomendações dos demais integrantes da rede egocêntrica minimiza os erros. Porém,

em grupos de pesquisa onde a rede egocêntrica é pequena, estes pesos possuem grande

influência na decisão final.

• Pode existir uma dificuldade na identificação dos indivíduos nos documentos

analisados para a coleta de informações. No estudo de caso, algumas pesquisadoras,

estudantes ou líderes de projeto trocam de nome após o casamento, ocorrendo uma

interrupção na seqüência de informações obtidas através de um determinado nome em

citações durante a extração de informação na plataforma Lattes. Também existe o caso

onde o pesquisador utiliza diversos nomes em citações, ou casos onde existem

homônimos, como pais e filhos diferenciados apenas por abreviações como “Jr.” ou

“Filho”. Estes casos podem causar erros durante a coleta de informações, sendo

necessário o desenvolvimento de uma estrutura computacional confiável para extração

de informação. O uso de um maior número de critérios para a identificação (como a

instituição onde o pesquisador atua e sua área de pesquisa) contribuem para a redução

do erro na captação de informações.

4.3 CONCLUSÕES

Neste capítulo foram apresentados os principais resultados obtidos com o estudo de

caso nos grupos de pesquisa com os pesquisadores do CPGEI da UTFPR e a análise mais

detalhada destes resultados.

A análise foi realizada comparando as proporções entre os indivíduos identificados, os

indivíduos evidenciados e os não evidenciados. Foram citados alguns possíveis motivos que

impediram uma melhor identificação dos indivíduos. Também foi realizada uma breve

discussão sobre as dificuldades encontradas durante a execução do experimento.

No próximo capítulo a avaliação do modelo será sumarizada e serão apresentadas as

conclusões gerais do trabalho e propostas de trabalhos futuros.

CAPÍTULO 5

CONCLUSÕES

Este capítulo é o fechamento deste trabalho de dissertação de mestrado. Nas seções 5.1

e 5.2 são recapitulados os objetivos gerais do trabalho e as principais contribuições da

proposta. A seguir, a seção 5.3 sumariza, qualitativamente, os resultados apresentados no

Capítulo 4, enumerando elementos que possibilitem determinar a validade da abordagem. As

seções seguintes trazem as conclusões gerais do trabalho e sugestões para a continuidade

desta pesquisa.

5.1 RECAPITULAÇÃO DOS OBJETIVOS DO TRABALHO

Este trabalho de dissertação de mestrado teve como objetivo principal verificar a

influência da rede social egocêntrica de líderes de projeto na formação de equipes de

pesquisa, considerando diferentes tipos de relações sociais e as alterações destas relações no

decorrer do tempo.

Nos experimentos realizados foi possível comprovar que a maioria dos indivíduos

identificados pertence à rede social do líder de projeto, ou foram recomendados por outro

pesquisador que pertence a esta rede social. Assim, pode-se concluir que a representação da

rede social egocêntrica do líder de projeto através dos sociogramas de Moreno contribui para

a compreensão do processo de formação de equipes.

O modelo computacional proposto considera as múltiplas relações e o dinamismo

temporal da rede social, cumprindo o objetivo para o estudo de caso de construir a rede

egocêntrica do líder de projeto e sua cadeia de recomendações utilizada para identificar os

indivíduos que pertencem aos grupos de pesquisa analisados.

As informações extraídas da Plataforma Lattes sobre os indivíduos analisados foram

suficientes para construir as redes sociais egocêntricas e facilitar a identificação dos

indivíduos. Logo, os experimentos realizados comprovaram a validade do modelo

computacional através do estudo de caso realizado com as equipes de pesquisa do CPGEI da

UTFPR.

5.2 CONTRIBUIÇÕES ESPERADAS

Como parte das contribuições desta dissertação, o modelo computacional proposto

deve responder a diversas perguntas, realizadas na seção 1.2.1 do Capítulo 1, para o projeto de

um sistema que pode ser utilizado como meio auxiliar para a formação de equipes através da

extração de informações sobre as relações sociais e os atributos dos indivíduos:

1. Para se construir uma representação única das diversas redes sociais formadas pelas

múltiplas relações de forma a se aproximar da visão do próprio indivíduo, deve-se

utilizar uma composição de relações pertencentes a dimensões sociais distintas e

considerar nesta composição o dinamismo da rede social em função do tempo.

2. A valoração dos relacionamentos através da freqüência e da época de ocorrência pode

ser relacionada com a rede social do usuário através da composição destes

relacionamentos, permitindo uma visão limitada e subjetiva da contribuição para a

ocorrência de um determinado comportamento. Porém a determinação da

probabilidade de ocorrência deste comportamento somente pode ser realizada através

da análise da contribuição dos demais atores da rede social analisada. O modelo

proposto e os testes realizados no estudo de caso demonstram que a identificação de

um determinado pesquisador depende não apenas da vontade do líder de projeto, mas

também da indicação por outros membros da rede social do líder e de fatores

individuais como área de pesquisa, localização geográfica e interesses pessoais do

próprio pesquisador investigado.

3. No modelo proposto a valoração das múltiplas relações é realizada pela composição

destas relações através de duas médias ponderadas, uma para produzir a redução da

intensidade da relação com o passar do tempo, e outra para atribuir um valor

diferenciado para cada tipo de relação. Ao ser realizada a normalização destas médias

é possível se aproximar da visão subjetiva do indivíduo em relação aos demais

indivíduos analisados. Logo, para identificar pessoas que possuam conhecimento,

reputação e experiências em um certo domínio deve-se selecionar as relações sociais

envolvidas com estes aspectos. O modelo computacional proposto pode ser aplicado

ao mesmo ambiente do estudo de caso para construir uma visão individual do líder de

projeto ao reputar um determinado pesquisador de sua rede de relacionamento. Entre

as relações que poderiam ser utilizadas estão: a de existência de patentes científicas,

número de publicações em periódicos, número de livros publicados, número de

participação em projetos de pesquisa ou consultorias para renomadas instituições de

pesquisa e o número de anos em que atua em determinada instituição.

4. Para promover o compartilhamento das informações relacionadas às equipes sem

prejudicar aspectos relacionados com a privacidade de cada usuário, no modelo

propõem a utilização do fator de proximidade individual como um filtro social para

restrição de acesso. Desta forma, as informações disponibilizadas já são do

conhecimento do usuário uma vez que ele participa da rede social que está

pesquisando.

5. A busca por informações em documentos disponíveis permite a construção de uma

visão da rede social do usuário sem o seu prévio conhecimento nem intervenção. As

limitações do modelo computacional proposto, sob este aspecto, estão limitadas à

possibilidade de identificação das relações ligadas às necessidades da análise

requisitada pelo usuário nestes documentos, e à credibilidade de tais documentos.

6. O modelo computacional proposto difere dos demais trabalhos relacionados pela

adoção de uma composição de múltiplas relações sociais para realizar a análise de

redes egocêntricas simplificadas considerando o seu dinamismo em função do tempo.

Outra contribuição é a simplicidade computacional do modelo proposto, que se

acredita ser linear.

5.3 CONCLUSÕES

Como conclusão geral, os resultados obtidos no estudo de caso demonstram que o

modelo computacional proposto possui os mecanismos necessários para identificar os

pesquisadores que formam uma equipe de pesquisa utilizando técnicas lineares para o cálculo

de um fator qualitativo proporcional à composição das relações sociais, ligadas aos de

aspectos sociais relacionados à formação de uma equipe de pesquisa, e à dinâmica temporal

destas relações.

Os valores escolhidos como pesos para diferenciar as relações quanto ao tipo e à época

de ocorrência produziram resultados satisfatórios, porém estes pesos devem ser testados em

outros ambientes e domínios, e ajustados se necessário.

A estratégia do modelo computacional em utilizar aspectos sociais para a identificação

das relações mais apropriadas para o estudo de caso facilitou o trabalho de extração de

informações e foi importante para os resultados de identificação de indivíduos do estudo de

caso. As relações de co-autoria e orientador-orientado, apesar de serem relacionadas ao

trabalho colaborativo nos grupos de pesquisa, pertencem a dimensões sociais diferentes.

Enquanto as relações de co-autoria estão relacionadas com o trabalho em grupo e podem ser

classificadas como relações homogêneas, as relações de orientador-orientado possuem um

caráter fortemente ligado aos papéis sociais que os indivíduos desempenham e aos objetivos

de obtenção de conhecimento, sendo classificadas como heterogêneas. Esta diferenciação

promove o processo de identificação dos atores das redes sociais analisadas, pois estas

relações devem pertencer a duas diferentes dimensões sociais relacionadas com o tipo de

grupo que se deseja identificar, conforme o previsto por Watts (2003).

O uso dos princípios de análise de redes sociais orientou a correta identificação e

utilização das informações contidas nos documentos disponíveis para definir as relações

sociais relacionadas com a necessidade do usuário, como mapear determinados

comportamentos ou identificar determinados indivíduos. Os sociogramas de Moreno, apesar

de serem uma limitação da abordagem egocêntrica por desprezar as ligações entre os atores

alters, explicitaram as relações entre os indivíduos e os demais integrantes diretamente

ligados a ele, sendo estas informações suficientes para a determinação da cadeia de

recomendações conforme descrito por Scott (2000). A sobreposição dos diversos sociogramas

de Moreno utilizados no estudo de caso através do uso das cadeias de recomendação e do

fator de proximidade individual foi suficiente para a identificação de indivíduos.

O modelo computacional proposto possui complexidade computacional O(n), e

acredita-se ser linear. Infelizmente os experimentos realizados não são suficientes para

comprovar esta linearidade. Com o uso da composição das relações sociais foi possível no

estudo de caso utilizar apenas quatro tipos de parâmetros separados por cinco períodos de

ocorrência. Apesar disto, este número pequeno de parâmetros foram suficientes para obter os

resultados esperados.

O período de ocorrência das relações sociais foi utilizado para diferenciar as relações

entre os indivíduos. Desta forma foi possível no estudo de caso retirar do processo de

identificação os pesquisadores que, apesar de terem uma vasta experiência, não estão mais

ativos no presente por motivos diversos como estar no final de carreira ou por ter acabado de

retornar do doutorado. Esta análise desta dinâmica da rede social proporcionou novos

resultados, diferentes da análise estática de redes sociais que leva em consideração apenas a

intensidade dos relacionamentos ou freqüência de ocorrência. Assim o modelo computacional

proposto realiza uma análise que considera também o dinamismo temporal da rede social.

Porém a escolha dos pesos utilizados na composição das relações em relação ao tempo

produz um efeito artificial que se acredita ser diferente da percepção temporal individual. Isto

produz uma diferença entre a percepção do modelo e dos indivíduos, o que proporciona um

efeito benéfico ao relembrar antigos contatos que, devido às atividades cotidianas dos

usuários haviam sido esquecidos. De outra forma, sem a análise da dinâmica temporal da rede

social os resultados em determinados domínios seriam pouco úteis, como no caso da

formação de uma equipe de pesquisa onde a análise estática poderia produzir uma lista com

nomes de antigos colegas que não estão mais na instituição, mas que realizaram um enorme

trabalho de pesquisa no passado.

Ao considerar na análise a dinâmica temporal da rede social, o modelo computacional

proposto pode ser utilizado para a construção de ferramentas para CSCW (Computer

Supported Collaborative Work – Trabalho Colaborativo Suportado por Computador), na área

de formação de equipes. Porém, ao se disponibilizar o modelo computacional proposto para

uma comunidade, este modelo passará a ter influência na tomada de decisão ao auxiliar os

processos de escolha de uma equipe, com conhecimentos e experiências em determinadas

áreas estabelecidas pelo usuário. Isto modificará os procedimentos e regras utilizadas

atualmente por esta comunidade na localização de pessoas que possuam os conhecimentos

necessários e que podem ser eventualmente reputadas através das redes sociais (cadeia de

recomendações).

5.4 TRABALHOS FUTUROS

Além do atendimento ao objetivo proposto, este trabalho de dissertação gerou alguns

questionamentos interessantes. Devido à impossibilidade de se esgotar o estudo de redes

sociais, sugere-se alguns tópicos para estudos futuros buscando o aprofundamento dessa

pesquisa com foco na pesquisa dos processos internos de tomada de decisão e construção de

estruturas organizacionais favorecendo o entendimento das relações sociais de forma a

otimizar a formação de equipes de alto desempenho. Mais especificamente segue abaixo os

seguintes tópicos:

• Outras relações e atributos devem ser levados em consideração para a

identificação dos pesquisadores, como a instituição em que trabalha, a posição

social que possui nesta instituição, a classificação do pesquisador junto às

instituições de pesquisa.

• As relações de co-autoria devem ser diferenciadas em relação ao tipo de

trabalho executado, pois os periódicos e livros são considerados pelos

pesquisadores como publicações de maior importância em relação aos artigos

apresentados em congressos.

• Uma análise temporal da evolução das equipes pode explicitar os mecanismos

utilizados pelos líderes na escolha de indivíduos e a identificação de fatores de

sucesso e fracasso para a formação de equipes. O estudo de caso foi limitado a

identificar os grupos de pesquisa já formados, porém uma análise futura de

como estes grupos evoluem com o tempo pode trazer uma melhor

compreensão de como a lista de candidatos obtida através do modelo

computacional proposto pode ser utilizada para auxiliar no processo de

formação de equipes.

• Outro aspecto relevante ao sucesso das equipes é a diversidade de

conhecimento entre os indivíduos. Um estudo mais aprofundado deste aspecto

é importante para a compreensão de como os mecanismos de formação de

equipes consideram este aspecto e como isto influencia no sucesso desta

equipe.

• O estudo da homofilia e da afinidade possui importância relevante para

determinar como estes aspectos sociais contribuem para o sucesso ou o

fracasso de uma equipe, pois estão relacionados com a aceitação de novas

idéias e conceitos.

• Apesar de enriquecer o modelo proposto, ao se utilizar um coeficiente de

correlação para valorar informações com característica binária pode-se

produzir erros. Assim torna-se importante o estudo de métodos para determinar

a relação entre os benefícios da análise de relações múltiplas com característica

binária em relação aos prejuízos da perda de informação devido aos

coeficientes de correlação.

• A proposta de um método para o cálculo do valor de corte para o fator de

proximidade social no processo de identificação dos indivíduos que compõem

uma equipe pode descartar a necessidade da análise de grupos pré-existentes e

melhorar a eficiência do modelo computacional proposto em novas áreas de

aplicação.

• A reputação e o prestígio são importantes aspectos sociais. Assim torna-se

importante estudar o uso do método proposto para valorar estes aspectos

sociais com o uso de relações múltiplas considerando o dinamismo da rede

social com o tempo.

• O estudo de métodos para determinar a eficiência de uma equipe é de grande

valia para a melhoria do processo de formação de uma equipe.

Vale ressaltar que o modelo computacional proposto neste trabalho de dissertação se

concentrou no estudo de caso para a analise da influência da rede social do líder de projeto na

formação da equipe de pesquisa, mas poderia ser estendido para uma aplicação prática como

meio auxiliar para a decisão da escolha de indivíduos para integrar novas equipes, como uma

ferramenta CSCW (Computer Supported Collaborative Work – Trabalho Colaborativo

Suportado por Computador) ou para a aplicação em outros domínios e ambientes onde

múltiplas relações, considerando o dinamismo temporal, podem ser combinadas para uma

determinada finalidade. Uma destas aplicações seria o uso do modelo proposto para a

negociação de bandas em redes de comunicação ou a escolha de empresas para compor a

cadeia produtiva de determinado produto em relacionamentos empresariais de parceria.

ANEXO 1

PLANILHA DE IDENTIFICAÇÃO DE INDIVÍDUOS DO GRUPO DE PESQUISA

MEMENTO Total de Participantes do Projeto 9 %Status do grupo: certificado pela instituição Participantes Identificados 6 66,7Ano de formação: 2004 Participantes Não Evidenciados 2 22,2Data da última atualização: 18/09/2007 11:17 Participantes Apenas Evidenciados 2 22,2

Total Participandes da Rede Social 8 88,9

Pesos da cadeia de recomendações:

1,000 1,000 0,800 0,800

Fator de Proximidade Social

n. Papel Participantes 357789089 36140675 37849280 384514941 Líder 36140675 0,103 0,081 0,000 0,000 0,0272 Líder 357789089 0,039 0,000 0,021 0,015 0,0083 Pesquisador 38451494 0,060 0,018 0,042 0,000 0,0004 Pesquisador 37849280 0,000 0,000 0,000 0,000 0,0005 Estudante 19964942 0,201 0,118 0,084 0,000 0,0006 Estudante 29208218 0,164 0,122 0,042 0,000 0,0007 Estudante 17654123 0,157 0,057 0,100 0,000 0,0008 Estudante 18270753 0,011 0,011 0,000 0,000 0,0009 Estudante 19283063 0,000 0,000 0,000 0,000 0,000

rede egocêntrica evidenciada

Tabela de Fatores de Proximidade Individual

ANEXO 2

MATRIZES RELACIONAIS UTILIZADAS PARA O CÁLCULO DO FATOR DE

PROXIMIDADE INDIVIDUAL

Ator:

357789089DOUTOR

relação:

Pesquisador 2003 2004 2005 2006 2007 2003 2004 2005 2006 2007 2003 2004 2005 2006 2007 2003 2004 2005 2006 20071478390 1 13789209 16100028 18410847 6 3

10721666 113032485 1 1 1 115343304 117654123 1 119964942 1 1 1 1 122275761 124586580 126897399 1 1 3 129208218 1 1 1 131519037 133829856 136140675 2 238451494 140762313 143073132 145383951 147694770 118270753 152316408 1 1 154627227 156938046 1 159248865 161559684 1

ORIENT-INICIAÇÃO CIENTÍFICAORIENTADOR-DOUTORANDOORIENTADOR-MESTRANDOCO-AUTORIA

ANEXO 3

TABELA COM O CÁLCULO DO FATOR DE PROXIMIDADE INDIVIDUAL E O

HISTOGRAMA COM A EVOLUÇÃO NA REDE SOCIAL

Rede Egocêntrica

357789089 relação: 2003 2004 2005 2006 2007 mestrado doutorado iniciação soma Méd Pond.DOUTOR peso: 1 2 3 4 5 3 4 1 2,947

co-autoria mestrado doutorado iniciação P |P|

1478390 0,600 0,000 0,600 0,000 0,360 0,122

3789209 0,533 0,800 0,000 0,000 0,347 0,118

6100028 1,400 0,000 0,000 0,000 0,280 0,095

8410847 0,000 0,800 0,000 0,000 0,240 0,081

10721666 1,200 0,000 0,000 0,000 0,240 0,081

13032485 0,267 0,600 0,000 0,000 0,233 0,079

15343304 0,333 0,333 0,000 0,000 0,167 0,057

17654123 0,800 0,000 0,000 0,000 0,160 0,054

19964942 0,600 0,000 0,000 0,000 0,120 0,041

22275761 0,600 0,000 0,000 0,000 0,120 0,041

24586580 0,000 0,333 0,000 0,000 0,100 0,034

26897399 0,267 0,000 0,000 0,000 0,053 0,018

29208218 0,267 0,000 0,000 0,000 0,053 0,018

31519037 0,267 0,000 0,000 0,000 0,053 0,018

33829856 0,267 0,000 0,000 0,000 0,053 0,018

36140675 0,000 0,000 0,000 0,333 0,033 0,011

38451494 0,000 0,000 0,000 0,333 0,033 0,011

40762313 0,000 0,000 0,000 0,333 0,033 0,011

43073132 0,000 0,000 0,000 0,333 0,033 0,011

45383951 0,000 0,000 0,000 0,333 0,033 0,011

47694770 0,000 0,000 0,000 0,333 0,033 0,011

18270753 0,000 0,000 0,000 0,333 0,033 0,011

52316408 0,000 0,000 0,000 0,267 0,027 0,009

54627227 0,000 0,000 0,000 0,267 0,027 0,009

56938046 0,133 0,000 0,000 0,000 0,027 0,009

59248865 0,000 0,000 0,000 0,267 0,027 0,009

61559684 0,000 0,000 0,000 0,267 0,027 0,009

0,000 0,020 0,040 0,060 0,080 0,100 0,120 0,140

1478390

3789209

6100028

8410847

10721666

13032485

15343304

17654123

19964942

22275761

24586580

26897399

29208218

31519037

33829856

36140675

38451494

40762313

43073132

45383951

47694770

18270753

52316408

54627227

56938046

59248865

61559684

ANEXO 4

GRÁFICO EM FORMA DE RADAR

357789089

0,820

0,840

0,860

0,880

0,900

0,920

0,940

0,960

0,980

1,000

12

3

4

5

6

7

8

9

10

11

1213

1415

16

17

18

19

20

21

22

23

24

2526

REFERÊNCIAS BIBLIOGRÁFICAS

BIAGGIO, M.; GREENE, B. Overlapping/Dual Relationship In: RAVE, E. J., LARSEN, C.

C. Ethical Decision Making in Therapy: Feminist Perspectives, Guilford press, 1995.

cap.6, p.92. Disponível em : <http://books.google.com/books?hl=pt-BR&lr=&id=

hZfU4rebmbAC&oi=fnd&pg=PA88&dq=%22social+network%22+%22professor-student

+relationship%22+&ots=XGJxe9z1G7&sig=XQgyFXrirvle6Aa-cNs2TPWzRp8> Acesso

em: 24 mar. 2008.

BERGER-WOLF, T. Y.; SAIA, J. A framework for analysis of dynamic social networks. In:

Procedings KDD’06, 2006. p.523-528.

BORTOLI, E. M. ; TACLA, C. A. . Percepção de Contextos de Atividade para Identificação

de Comunidades Potenciais. In: Simpósio Brasileiro de Sistemas Colaborativos, 2006,

Natal. Anais do Simpósio Brasileiro de Sistemas Colaborativos, 2006.

CAI, D.; SHAO, Z.; HE, X.; YAN, X.; HAN, J. Mining Hidden Community in

Heterogeneous Social Networks. 2005. Disponível em: < http://data.isi.edu/conferences/

linkkdd-05/ Download/Papers/linkkdd05-09.pdf> Acesso em: 10 mar. 2008.

CHUNG, K. K.; HOSSAIN, L.; DAVIS, J. Exploring Sociocentric and Egocentric

Approaches for Social Network Anaysis. International Conference on Knowledge

Management Asia Pacific. Victoria University, Wellington, New Zealand, nov.. 2005.

p.27-29.

CONTE, R.; PAOLUCCI, M. Reputation in Artificial Societies: social beliefs for social

order. Massachusetts, USA. Kluwer Academics Publishers. 2002.

CUMMINGS, J. N.; KIESLER, S. Who works with whom? Collaborative tie strength in

distributed interdisciplinary projects. In: Third International Conference on e-Social

Science, Arbour, Michigan 2007 Disponível em: <http://ess.si.umich.edu/

papers/paper196.pdf>. Acesso em: 10 mar. 2008.

ENEMBRECK, F.; SCALABRIN, E. ; TACLA, C. A. ; AVILA, B. C. . Automatic

Identification of Teams based on Textual Information Retrieval. Lecture Notes in

Computer Science, v. 4402, p. 1-10, 2007.

ENEMBRECK, F.; SCALABRIN, E. E., Tacla, C. A.; Ávila, B. C. Automatic Identification

of Teams Base don Textual Information Retrival. Procedings of the 10th International

Conference on Computer Supported Cooperative Work in Design (CSCWD 2006).

Southeast University, Nanjing, China, 2006.

FISCHER, D. Using Egocentric Networks to Understand Communication. IEEE Internet

Computing. Set.2005. v.9 p.20 – 28.

FREEMAN, L. C. Centrality in social networks: I. Concept Clarification. Social Networks.

Cap.1 p.215-239, 1979. apud WASSERMAN, S.; FAUST, K. Social Network Analysis:

Methods and Applications. Nova York: Cambridge University Press. 1994.

GASTON, M. E.; DesJARDINS, M. Social Network and Multi-agent Organizacional

Performance. 2005 Disponível em: <http://citeseer.ist.psu.edu/749853.html> Acesso em:

10 mar. 2008.

GASTON, M. E.; SIMMONS, J.; DesJARDINS, M. Adapting Network Structure for Efficient

Team Formation. In Proceedings of the AAAI-2004 Fall Symposium on Learning in

Multi-agent Systems. Washington, D.C., 2004.

GIMÉNEZ LUGO, G. A. UM MODELO DE SISTEMAS MULTIAGENTES PARA

PARTILHA DE CONHECIMENTO UTILIZANDO REDES SOCIAIS

COMUNITÁRIAS. TESE (Doutorado) – Escola Politécnica da Universidade de São

Paulo, Departamento de Engenharia de Computação e Sistemas Digitais. São Paulo, 2004

GUIMERÀ, R.; UZZI, B.; SPIRO, J.; AMARAL, L. A. N. Team Assembly Mechanisms

Determine Collaboration Network Structure and Team Performance. Science. V.308.

p.697-702. abr.2005.

HAHN, J.; MOON, J. Y.; ZHANG, C. Impact of social ties on open source project team

formation. IFIP International Federation for Information Processing. V.203, p.307-

317, Springer Boston, 2006. Disponível em: <http://www.springerlink.com/content/

m651251187257773/>. Acesso em: 08 mar. 2008.

LONG, B.; ZHANG, Z.; YU, P. S. A Probabilistic Framework for Relational Clustering. In:

Conference on Knowledge Discovery in Data. Proceedings of the 13th ACM SIGKDD

international conference on Knowledge discovery and data mining. Califórnia, EUA,

2007. p. 470-479. Disponível em: < http://portal.acm.org/citation.cfm?id=1281192.

1281244> Acesso : 19.mar.2008

MATSUO, Y.; HAMASAKI, M.; NAKAMURA, Y.; TAKEDA, H.; MORI, J.;

BOLLEGALA, D.; ISHIZUKA, M. Spinning Multiple Social Networks for Semantic Web.

American Association for Artificial Inteligence AAAI, 2006. Disponível em : <

http://ymatsuo.com/papers/aaai06.pdf> Acesso : 19.mar.2008.

MATSUO, Y.; HASIDA, K.; TOMOBE, H.; ISHIZUKA, M. Mining Social Network of

Conference Participants form the Web. International Conference on Web Intelligence

(WI’03), 2003

McDONALD, D. W. Recommending Collaboration with Social Networks: A Comparative

Evaluation. In: Recommender Systems and Social Computing. CHI, 2003 V.5, p.593 -600.

MORI, J.; SUGIYAMA, T.; MATSUO, Y. Real-world Oriented Information Sharing Using

Social Networks. In: Conference on Supporting Group Work . Proceedings of the 2005

international ACM SIGGROUP conference on Supporting group work. Flórida, EUA,

2005. p.81-84. Disponível em :< http://portal.acm.org/citation.cfm?id=1099203. 1099215>

Acesso : 19.mar.2008.

MORI, J.; TSUJISHITA, T.; MATSUO, Y. ISHIZUKA, M. Extration Relations in Social

Networks form the Web using Similarity between Collective Contexts. In: Lecture Notes

in Computer Science. Springer . 2006 v. 4273/2006. Disponível em :< http://www.

springerlink.com/ content/9ln113238441631w/ > Acesso : 19.mar.2008.

NOOY, W.; MRVAR, A.; BATAGELJ, V. Exploratory Social Network Analysis with

Pajek. Cambridge University press, New York, U.S.A. 2005.

OUNNAS, A.; DAVIS, H.C.;MILLARD, D.E. Semantic Modeling for Group Formation. In:

Workshop on Personalisation in E-Learning Environments at Individual and Group

Level (PING) at the 11th International Conference on User Modeling UM2007, Corfu,

Greece. 2007.

PLATAFORMA LATTES, 1999. Disponível em http: <//lattes.cnpq.br/>. Acesso em: 08 mar.

2008.

SAID, Y. H.; WEGMAN, E. J.; SHARABATI, W. K.; RIGSBY, J. T. Social Network of

Author-coauthor Relationships. Computacional Statistics & Data Analysis. v.52, p.2177-

2184. jan. 2008.

SCHLICHTER, J.H.; KOCH, M.; XU, C. Awareness – the common link between groupware

and community support systems. In: Kyoto Meeting on Social Interaction and

Communityware. Community Computing and Support Systems. Springer, 1998. p. 77-

93. Disponível em: < http://www.springerlink.com/content/6vt83br7ylnhgaxk/>. Acesso

em: 7 mar. 2008.

SCOTT, John. Social Network Analysis, a handbook. Londres: SAGE publications, 2° Ed.,

2000. cap. 2, p.9-21.

TACLA, C. A. ; GIMÉNEZ-LUGO, G. A. ; RAMOS, M. P. ; ENEMBRECK, Fabrício .

Social Nets in Knowledge Sharing. In: International Symposium on the Management of

Industrial and Corporate Knowledge (ISMICK06), 2006, Stellenbosch. The

Proceedings of the 11th International Symposium on the Management of Industrial and

Corporate Knowledge. Stellenbosch, 2006.

TANTIPATHANANANDH, C.; WOLF, T. B.; KEMPE, D. A Framework for Community

Identification in Dynamic Social Networks. In: Conference on Knowledge Discovery in

Data. Proceedings of the 13th ACM SIGKDD international conference on Knowledge

discovery and data mining, Califórnia, EUA, 2007. p.717-726. Disponível em: < http://

portal.acm.org/citation.cfm?id=1281192.1281269> Acesso : 19.mar.2008

WASSERMAN, S.; FAUST, K. Social Network Analysis: Methods and Applications.

Nova York: Cambridge University Press. 1994.

WATTS, D. J.; DODDS, P. S.; NEWMAN, M. E. J. Identify and search in social networks.

Science, V. 296, p.1302-1305. 2002.

WATTS, D. J. Six Degrees: the science of a connected age. W. W. Norton & Company,

New York, USA, 2003.

WUCHTY, S.; JONES, B. F.; UZZI, B. The Increasing Dominante of Teams in Production of

Knowledge. Science. V.316. p.1036-1039. mai.2007.

XIAOQIN, Z.; HAIPING, X.; BHAVESH S. An Integrated Role-Based Approach for

Modeling, Designing and Implementing Multi-Agent Systems. JBCS – Journal of the

Brazilian Computer Society, 2007. Disponível em :

<http://www.cis.umassd.edu/~hxu/ Papers/UMD/ JBCS-July-2007.pdf > Acesso :

19.mar.2008

RESUMO:

Dentro da área Sistemas Colaborativos, esta dissertação se enquadra no tema de

formação de equipes de projeto. É proposto um modelo computacional, fundamentado na

teoria de redes sociais, para a formação de equipes de pesquisa baseado nas redes sociais

egocêntricas de líderes de projeto, considerando as múltiplas relações sociais e o

dinamismo ao longo do tempo para calcular um fator relacional utilizado para identificar

integrantes pertencentes a uma equipe.

Para verificar a viabilidade de realização e a qualidade dos resultados fornecidos

pelo modelo computacional a ser utilizado em uma ferramenta de auxílio à formação de

equipes, fez-se um estudo de caso. Neste estudo, foram extraídas informações dos

currículos Lattes e do diretório de grupos de pesquisa do CNPq com o objetivo de

representar as redes egocêntricas e valorar as relações para identificar os indivíduos de

grupos de pesquisa. Os experimentos foram realizados em 23 grupos de pesquisa onde

participam pesquisadores do CPGEI – Curso de Pós-Graduação em Engenharia Elétrica e

Informática Industrial da Universidade Tecnológica Federal do Paraná.

Como conclusão geral do trabalho, verificou-se que o modelo pode ser realizado

computacionalmente e apresenta resultados qualitativos satisfatórios.

PALAVRAS-CHAVE

Redes Sociais, CSCW

ÁREA/SUB-ÁREA DE CONHECIMENTO

10300007 - Ciências da Computação

10301011 - Computabilidade e Modelos de Computação

10303049 - Sistemas de Informação

2008

Nº: 475

Livros Grátis( http://www.livrosgratis.com.br )

Milhares de Livros para Download: Baixar livros de AdministraçãoBaixar livros de AgronomiaBaixar livros de ArquiteturaBaixar livros de ArtesBaixar livros de AstronomiaBaixar livros de Biologia GeralBaixar livros de Ciência da ComputaçãoBaixar livros de Ciência da InformaçãoBaixar livros de Ciência PolíticaBaixar livros de Ciências da SaúdeBaixar livros de ComunicaçãoBaixar livros do Conselho Nacional de Educação - CNEBaixar livros de Defesa civilBaixar livros de DireitoBaixar livros de Direitos humanosBaixar livros de EconomiaBaixar livros de Economia DomésticaBaixar livros de EducaçãoBaixar livros de Educação - TrânsitoBaixar livros de Educação FísicaBaixar livros de Engenharia AeroespacialBaixar livros de FarmáciaBaixar livros de FilosofiaBaixar livros de FísicaBaixar livros de GeociênciasBaixar livros de GeografiaBaixar livros de HistóriaBaixar livros de Línguas

Baixar livros de LiteraturaBaixar livros de Literatura de CordelBaixar livros de Literatura InfantilBaixar livros de MatemáticaBaixar livros de MedicinaBaixar livros de Medicina VeterináriaBaixar livros de Meio AmbienteBaixar livros de MeteorologiaBaixar Monografias e TCCBaixar livros MultidisciplinarBaixar livros de MúsicaBaixar livros de PsicologiaBaixar livros de QuímicaBaixar livros de Saúde ColetivaBaixar livros de Serviço SocialBaixar livros de SociologiaBaixar livros de TeologiaBaixar livros de TrabalhoBaixar livros de Turismo