15
A UTILIZAÇÃO DE MINERAÇÃO TEXTUAL E REDES SEMÂNTICAS PARA IDENTIFICAÇÃO DE TENDÊNCIAS EM SEGURANÇA E DEFESA Carla Cristina Passos Cruz 1 Jéssica Leite dos Santos 2 Vinícius Ricardo Ferreira Janick 3 RESUMO O presente artigo parte do pressuposto que softwares de redes semânticas e mineração textual podem ser úteis para o levantamento e tratamento de dados e informações em pesquisas da área de Segurança e Defesa. Tal pressuposto surgiu em meio aos debates e projetos realizados pelo grupo Arranjos Metodológicos para Cenários em Defesa e Segurança, bem como da experiência com o projeto PROSPECTA, ambos realizados no Laboratório de Simulações e Cenários (LSC), da Escola de Guerra Naval (EGN). O presente trabalho tem como objetivo explorar os benefícios da utilização dos citados softwares para a identificação de tendências em pesquisas na área de Segurança e Defesa. Justifica-se este esforço pois, dada a grande quantidade de informação disponível para análise, a automatização do processo de identificação daquilo que é potencialmente relevante ajuda a poupar recursos importantes, dentre outros, financeiros, tempo, e disponibilidade de recursos humanos, acelerando resultados sem que haja prejuízo em qualidade. A metodologia utilizada neste trabalho combina uma revisão bibliográfica sobre redes semânticas, mineração de textos e tendências em segurança e defesa, com o experimento empírico da aplicação prática de algumas técnicas de mineração de texto no já referido PROSPECTA. Dado que este trabalho faz parte de um esforço ainda em andamento, espera-se apresentar à comunidade o andamento das discussões sobre o tema no âmbito do grupo de Arranjos Metodológicos do LSC, colhendo assim as contribuições pertinentes, ao mesmo tempo que contribui e estimula o debate sobre a utilização de ferramentas automatizadas em estudos de segurança e defesa. Palavras-chave: Mineração textual; Redes Semânticas; Tendências. 1 Mestranda em Ciências Computacionais, Universidade do Estado do Rio de Janeiro (UERJ). 2 Mestranda em Estudos Marítimos, Programa de Pós-Graduação em Estudos Marítimos/ Escola de Guerra Naval (PPGEM/EGN); advogada; pesquisadora do Laboratório de Simulações e Cenários no grupo Arranjos Metodológicos. 3 Mestre em estudos Marítimos, PPGEM/EGN; Pesquisador da Fundação de Estudos do Mar; Líder do grupo de Arranjos Metodológicos do Laboratório de Simulações e Cenários.

A UTILIZAÇÃO DE MINERAÇÃO TEXTUAL E REDES SEMÂNTICAS … · de 2019, que deveria tratar a mineração de texto e Redes Semânticas como uma das vertentes de sua pesquisa. Esse

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: A UTILIZAÇÃO DE MINERAÇÃO TEXTUAL E REDES SEMÂNTICAS … · de 2019, que deveria tratar a mineração de texto e Redes Semânticas como uma das vertentes de sua pesquisa. Esse

A UTILIZAÇÃO DE MINERAÇÃO TEXTUAL E REDES SEMÂNTICAS PARA

IDENTIFICAÇÃO DE TENDÊNCIAS EM SEGURANÇA E DEFESA

Carla Cristina Passos Cruz1

Jéssica Leite dos Santos2

Vinícius Ricardo Ferreira Janick3

RESUMO

O presente artigo parte do pressuposto que softwares de redes semânticas e

mineração textual podem ser úteis para o levantamento e tratamento de dados e

informações em pesquisas da área de Segurança e Defesa. Tal pressuposto surgiu em meio

aos debates e projetos realizados pelo grupo Arranjos Metodológicos para Cenários em

Defesa e Segurança, bem como da experiência com o projeto PROSPECTA, ambos

realizados no Laboratório de Simulações e Cenários (LSC), da Escola de Guerra Naval

(EGN). O presente trabalho tem como objetivo explorar os benefícios da utilização dos

citados softwares para a identificação de tendências em pesquisas na área de Segurança e

Defesa. Justifica-se este esforço pois, dada a grande quantidade de informação disponível

para análise, a automatização do processo de identificação daquilo que é potencialmente

relevante ajuda a poupar recursos importantes, dentre outros, financeiros, tempo, e

disponibilidade de recursos humanos, acelerando resultados sem que haja prejuízo em

qualidade. A metodologia utilizada neste trabalho combina uma revisão bibliográfica

sobre redes semânticas, mineração de textos e tendências em segurança e defesa, com o

experimento empírico da aplicação prática de algumas técnicas de mineração de texto no

já referido PROSPECTA. Dado que este trabalho faz parte de um esforço ainda em

andamento, espera-se apresentar à comunidade o andamento das discussões sobre o tema

no âmbito do grupo de Arranjos Metodológicos do LSC, colhendo assim as contribuições

pertinentes, ao mesmo tempo que contribui e estimula o debate sobre a utilização de

ferramentas automatizadas em estudos de segurança e defesa.

Palavras-chave: Mineração textual; Redes Semânticas; Tendências.

1 Mestranda em Ciências Computacionais, Universidade do Estado do Rio de Janeiro (UERJ). 2 Mestranda em Estudos Marítimos, Programa de Pós-Graduação em Estudos Marítimos/ Escola de Guerra Naval (PPGEM/EGN); advogada; pesquisadora do Laboratório de Simulações e Cenários no grupo Arranjos Metodológicos. 3 Mestre em estudos Marítimos, PPGEM/EGN; Pesquisador da Fundação de Estudos do Mar; Líder do grupo de Arranjos Metodológicos do Laboratório de Simulações e Cenários.

Page 2: A UTILIZAÇÃO DE MINERAÇÃO TEXTUAL E REDES SEMÂNTICAS … · de 2019, que deveria tratar a mineração de texto e Redes Semânticas como uma das vertentes de sua pesquisa. Esse

1. INTRODUÇÃO

O presente artigo tem como propósito expor o andamento das pesquisas do grupo

de Arranjos Metodológicos do Laboratório de Simulações e Cenários (LSC) a respeito da

utilização de ferramentas automatizadas para coletar informações específicas dentro de

grandes quantidades de dados.

A demanda por essas ferramentas automatizadas surgiu durante a primeira

pesquisa do grupo, intitulado “Cenários prospectivos e academia – uma revisão

sistemática da literatura”. O trabalho foi apresentado no ENABED 2018. Nele buscou-se

identificar como ferramentas prospectivas eram utilizados em trabalhos acadêmicos. A

princípio nosso banco de dados foi o banco de teses e dissertações da CAPES, onde foram

selecionados trabalhos pertencentes à Área de Ciência Política e Relações Internacionais.

Contudo, dado que a intenção do grupo era a de expandir esse recorte, abarcando também

outros tipos de publicações, e de outras áreas, a quantidade de dados para análise

aumentaria vertiginosamente. Isso forçou o grupo a se debruçar sobre a possibilidade de

utilizar ferramentas automatizadas de mineração de dados e redes semânticas para

auxiliar a análise.

Posteriormente o grupo também foi demandado pelo projeto PROSPECTA, uma

pesquisa do LSC em parceria com a Fundação de Estudos do Mar (FEMAR), que tem

como objetivo fazer um benchmarking de métodos prospectivos utilizados para

Segurança e Defesa em todo o mundo. Após a fase exploratória o projeto contava com

um banco de cerca de 460 documentos estratégicos que utilizavam, de alguma maneira,

cenários prospectivos como base do planejamento.

Nesse contexto o grupo de Arranjos Metodológicos concluiu, no início desse ano

de 2019, que deveria tratar a mineração de texto e Redes Semânticas como uma das

vertentes de sua pesquisa. Esse breve artigo é uma descrição dos resultados que o grupo

alcançou nesse primeiro ano de pesquisas.

A pesquisa foi feita com base em revisão bibliográfica, testes práticos e debates

nas reuniões presenciais de grupo. De forma resumida, o produto mais relevante deste

primeiro ano de pesquisas foi a inserção dos pesquisadores do grupo nesse tema, novo

para todos, e a experiência com as fases do processo de mineração e construção de redes

Page 3: A UTILIZAÇÃO DE MINERAÇÃO TEXTUAL E REDES SEMÂNTICAS … · de 2019, que deveria tratar a mineração de texto e Redes Semânticas como uma das vertentes de sua pesquisa. Esse

de um software específico, o KH Coder4, disponibilizado gratuitamente pelo

desenvolvedor do programa. Essa experiência permitiu constatar que o processo para

mineração e para a organização dos dados em Redes Semânticas é mais complexo do que

pode parecer em um primeiro momento. Grande parte dessa complexidade é devida às

fases iniciais, especialmente a de “limpeza” dos documentos a serem analisados, que

demanda trabalho manual intensivo. Por outro lado, uma vez que essa limpeza tenha sido

feita, da maneira correta, o resultado apresentado pelo software diminui

consideravelmente erros humanos de interpretação, por conta de limitações cognitivas e

da incapacidade humana de interpretar e analisar grandes quantidades de dados em

relativamente pouco tempo.

É importante também frisar que todo esse trabalho está em fase inicial, portanto,

não se desenvolveu nenhuma proposta concreta de método ou modelo para a utilização

de ferramentas automatizadas de mineração textual. Sendo assim, além do objetivo de

apresentar o andamento das discussões do grupo, esperamos colher críticas e sugestões

que possam contribuir com a direção da pesquisa, bem como conhecer outros grupos ou

pesquisadores que tenham familiaridade com ferramentas dessa natureza.

2. ALGUNS CONCEITOS RELEVANTES

Em primeiro lugar, em se tratando de uma pesquisa em métodos para estudos

prospectivos, é interessante definir o que aqui neste trabalho se considera uma tendência.

Considera-se, dentro do grupo de Arranjos Metodológicos, que uma tendência é um

movimento já consolidado, suficientemente visível e aceito, para que sua continuidade

seja admitida dentro do recorte temporal definido para um determinado estudo

prospectivo, assim como definido por Elaine Marcial (2011, p. 88) que define tendências

como “evento cuja perspectiva de direção e sentido é suficientemente consolidada e

visível para se admitir sua permanência no período futuro considerado”. Há de se destacar

ainda as chamadas “sementes de futuro”, isto é, fatos ou sinais com potencial para se

tornarem relevantes no futuro, mas com pouca ou nenhuma influência no presente

(MARCIAL, 2011).

4 O software pode ser encontrado no endereço https://khcoder.net/en/

Page 4: A UTILIZAÇÃO DE MINERAÇÃO TEXTUAL E REDES SEMÂNTICAS … · de 2019, que deveria tratar a mineração de texto e Redes Semânticas como uma das vertentes de sua pesquisa. Esse

No que tange à Mineração Textual, é valido contextualizar brevemente o

surgimento dessa prática. De acordo com pesquisas realizadas, 80% dos dados gerados

são não-estruturados, ou seja, em formato de textos, imagens, vídeos e/ou áudios e destes,

80% estão no formato de texto (TAN, 1999; CHEN, 2001). Assim, surge a necessidade

de aplicação de técnicas que possibilitem a extração de informações, análise e resultados,

isto é, que transformem os dados textuais em formato numérico. Nesse contexto, surge a

Mineração de Textos (do inglês, Text Mining), área derivada da Mineração de Dados

baseada em passos do processo KDT (Knowledge Discovery in Text), que consiste em um

conjunto de procedimentos para extrair e recuperar dados textuais considerados

relevantes como Coleta, Pré-Processamento, Extração de Informação e Análise dos

Resultados de dados não-estruturados (DIXON, 1997).

A mineração de Texto envolve diversas áreas do conhecimento, como

Aprendizado de Máquina (AM) (MENDONÇA; DRUMMOND; SANDRI, 2011),

Processamento de Linguagem Natural (PLN), Estatística Inferencial (MINGOTI, 2013),

Inteligência Computacional (IC), Recuperação da Informação (RI), Ciência Cognitiva,

Mineração de Dados e Web Mining (CARRILHO JUNIOR, 2007), que podem ser usadas

em conjunto ou separadamente de forma a viabilizar o esquema de processamento

computacional (MACHADO et al., 2010). Além disso, pode utilizar inúmeras técnicas de

forma conjunta ou não, como a Sumarização, Classificação, Categorização e

Agrupamento (esta última a mais usual).

Sua aplicação pode ser encontrada e usada para as mais diversas finalidades como:

a) em sistemas de análise de sentimentos, seja para captação de comentários positivos ou

negativos de um determinado produto ou empresa, ou até mesmo de algum acontecimento

nas redes sociais; b) na pesquisa de opinião ajuda na percepção dos clientes sobre a

empresa ou produto, na inteligência competitiva, extração de informações em contratos,

suporte e atendimento ao cliente; c) armazenamento e recuperação de textos dos mais

diversos tipos; d) geração automática de resumos e/ou palavras-chave com o intuito de

agilizar o contexto do texto; dentre outros.

Analisando suas áreas de aplicações, percebe-se o quão importante e influente a

Mineração de Textos pode ser. Sferra e Corrêa (2003) disseram que a Mineração de Dados

é usada tanto para descrever características do passado como para predizer tendências

Page 5: A UTILIZAÇÃO DE MINERAÇÃO TEXTUAL E REDES SEMÂNTICAS … · de 2019, que deveria tratar a mineração de texto e Redes Semânticas como uma das vertentes de sua pesquisa. Esse

para o futuro. Como área derivada, pode-se dizer o mesmo em relação à Mineração de

Textos.

Por fim, sobre as Redes Semânticas, de acordo com Fadigas et al (2009), A teoria

das Redes Complexas surgiu do interesse em se analisar a rede de relacionamentos entre

atores de um determinado estudo. O avanço das técnicas e métodos desenvolvidos para

trabalhar com Redes Complexas permitiram que estas fossem aplicadas a uma vasta gama

de contextos, dentre eles o da análise da relação entre palavras, sendo isso o que se

conhece por Redes Semânticas. A utilização desta ferramenta permite inferir informações

sobre textos e artigos a partir de uma imagem estruturada em rede das relações entre as

palavras destes textos, vide o exemplo na Figura 1.

Figura 1 - Exemplo de Rede Complexa aplicada a estudos no campo da matemática

Fonte: FADIGAS et al, 2009, p. 175.

A Figura 1 demonstra a relação entre dois artigos da área matemática. Através da

aplicação de técnicas de Redes Semânticas apenas em seus títulos5, os autores puderam

inferir que o conceito de “Educação Matemática” é o elo de ligação entre os dois temas.

5 “Educação na Educação Matemática: os pressupostos Filosóficos e Psicológicos de Educação Presentes na Educação Matemática” e “A pesquisa em Educação Matemática: Realidade e Perspectiva. A Fenomenologia”.

Page 6: A UTILIZAÇÃO DE MINERAÇÃO TEXTUAL E REDES SEMÂNTICAS … · de 2019, que deveria tratar a mineração de texto e Redes Semânticas como uma das vertentes de sua pesquisa. Esse

Na medida em que outros estudos vão sendo inseridos na rede, pontos centrais de interesse

tendem a se destacar, assim como o termo “educação matemática”.

3. O PROCESSO DE MINERAÇÃO TEXTUAL E REDES SEMÂNTICAS

APLICADO À IDENTIFICAÇÃO DE TENDÊNCIAS

Antes de qualquer esforço, é imprescindível definir os limites do estudo em

questão. Isso auxilia na hora de buscar fontes e documentos de interesse. A seleção dos

documentos de interesse precisa ser feita manualmente e, quanto maior os limites do

estudo, maiores as chances de documentos importantes passarem despercebidos, ou o

inverso, de documentos de pouca relevância serem incluídos.

Uma vez que os documentos e fontes de interesse tenham sido coletados, passa-

se para a fase de limpeza. Esta fase é primordial para a qualidade do resultado final, e

consiste em tratar o texto, de modo a transformar o documento em algo que o Software

seja capaz de interpretar. Geralmente este tratamento engloba ações como eliminar

caracteres especiais, além de converter para um formato que o software reconheça.

Cada Software demanda um tratamento específico, por exemplo, o KH Coder

demanda que os caracteres “\”, “<”, “>” e “|” sejam excluídos dos textos analisados, bem

como caracteres não latinos listados na ISO 8859-1. Além disso, o programa só é capaz

de interpretar dados de documentos nos formatos “.txt”, “.csv”, “.xls” e “.xlsx”, ficando

excluídos documentos em formatos tradicionais como “.pdf”, “.doc” e “.docx”.

Além dessas questões de ordem mais técnica, ainda precisa-se lidar com questões

de semântica. Tome-se como exemplo termos compostos de duas ou mais palavras

distintas, mas quando juntas ganham um novo significado. Considerando novamente a

Figura 1, o termo “Educação Matemática” é formado por duas palavras de significados

distintos (“Educação” e “Matemática”) que, quando juntos, ganham um novo significado.

A solução encontrada pelo autor foi substituir todas as ocorrências de “Educação

Matemática” pelo aglutinado “educaçãomatemática”, de modo que o programa pode ser

capaz de identificar essa especificidade.

No caso da pesquisa em Segurança e Defesa, um termo muito comum é “Estados

Unidos”, formado por duas palavras com significados únicos que, quando juntas ganham

Page 7: A UTILIZAÇÃO DE MINERAÇÃO TEXTUAL E REDES SEMÂNTICAS … · de 2019, que deveria tratar a mineração de texto e Redes Semânticas como uma das vertentes de sua pesquisa. Esse

uma terceira significação. No caso específico do termo “Estados Unidos” é preciso atentar

ainda para o fato de que ele também pode ser referido pela sigla “EUA” ou “USA”. O

ideal é que todos os termos com um mesmo significado sejam substituídos pela mesma

palavra ou sigla. Esse é um trabalho que pode ser feito manualmente, contudo, com o

conhecimento específico em programação, é possível criar rotinas que automatizam esse

processo.

Posteriormente é preciso calibrar o software que se pretende utilizar para

interpretar o texto. A calibragem do programa diz respeito a que tipo de informação se

deseja filtrar em determinado documento. Utilizando novamente como exemplo o

software KH Coder, uma vez que o texto que se deseja analisar tenha sido devidamente

tratado, o Software disponibiliza uma série de ferramentas com objetivos distintos. As

Figuras 2 e 36 abaixo demonstram respectivamente as ferramentas “Word Frequency

List”, que retorna uma lista de frequência de palavras usadas no documento, e “Co-

ocurrence Network”, uma rede de palavras semelhante ao exemplo da Figura 1.

6 As figuras 1 e 2 foram elaboradas para fins de exemplo. Utilizou-se como dados para análise as publicações do Boletim Geocorrente do primeiro semestre de 2018.

Page 8: A UTILIZAÇÃO DE MINERAÇÃO TEXTUAL E REDES SEMÂNTICAS … · de 2019, que deveria tratar a mineração de texto e Redes Semânticas como uma das vertentes de sua pesquisa. Esse

Figura 2 – Exemplo de Lista de Frequência de Palavras gerado no KH Coder

Fonte - Elaborado pelo autor

Page 9: A UTILIZAÇÃO DE MINERAÇÃO TEXTUAL E REDES SEMÂNTICAS … · de 2019, que deveria tratar a mineração de texto e Redes Semânticas como uma das vertentes de sua pesquisa. Esse

Ambas as figuras foram propositalmente elaboradas sem que o Software fosse

devidamente calibrado. Desse modo é possível evidenciar mais facilmente a importância

de uma calibragem precisa. Como se pode perceber, a Word Frequency List (Figura 2)

apresenta uma série de palavras sem significado intrínseco, e que, portanto, não

contribuem para a interpretação dos dados. É o caso, por exemplo, de termos como “ser”,

“ter”, “não”, dentre outros. A mesma limitação pode ser observada na Co-ocurrence

Network (Figura 3).

Figura 3 – Exemplo de Rede de Co-ocorrência gerado no KH Coder

Fonte - elaborado pelo autor

No caso da Co-ocurrence Network (Figura 3), é possível perceber ainda a

importância do um tratamento de texto bem elaborado. Pode-se observar que termos

Page 10: A UTILIZAÇÃO DE MINERAÇÃO TEXTUAL E REDES SEMÂNTICAS … · de 2019, que deveria tratar a mineração de texto e Redes Semânticas como uma das vertentes de sua pesquisa. Esse

compostos por mais de uma palavra – “Estados Unidos”, “Coreia do Norte” ou “Coreia

do Sul” – são interpretados separadamente.

Como pode ser observado na Figura 4, a calibragem correta do Software demanda

conhecimentos diversos, relacionados com classe gramatical de palavras, distância

euclidiana, índice de Jaccard, coeficiente de aglomeração, dentre outros. Estes critérios

passam mensagens visuais que, sem o conhecimento adequado, podem passar

despercebidas, ou ser incorretamente interpretadas.

Figura 4 - Opções para geração de Co-Ocurrence Network

Fonte – Elaborado pelo autor

Page 11: A UTILIZAÇÃO DE MINERAÇÃO TEXTUAL E REDES SEMÂNTICAS … · de 2019, que deveria tratar a mineração de texto e Redes Semânticas como uma das vertentes de sua pesquisa. Esse

O esforço de calibragem do Software e do tratamento de texto de fato demandam,

inicialmente, um grande nível de dedicação. Contudo, uma vez que uma estrutura

eficiente para contornar estes desafios tenha sido desenvolvida, ela não precisa ser refeita

a cada estudo, mas apenas administrada e adaptada, de modo que, após um primeiro

esforço, a aplicação de Softwares de Redes Semânticas tem potencial para gerar

resultados robustos com esforços relativamente pequenos.

A Figura 5 demonstra o resultado de uma calibragem um pouco mais atenta – mas

não exaustiva – feita com os mesmos documentos das Figuras 2 e 3.

Figura 5 - Exemplo de rede de co-ocorrência após calibragem

Fonte - elaborado pelo autor

Page 12: A UTILIZAÇÃO DE MINERAÇÃO TEXTUAL E REDES SEMÂNTICAS … · de 2019, que deveria tratar a mineração de texto e Redes Semânticas como uma das vertentes de sua pesquisa. Esse

A Rede resultante desta nova calibragem sugere, por exemplo, o “governo

Trump”. Percebe-se que este tema tem ligações com outros como “acordo com a Rússia”,

“Crise de Governo”, “Relações políticas com a Índia”, e a “presença Chinesa” em uma

alguma área não visível na rede. O cluster verde permite inferir outro tema de potencial

importância: uma “base da marinha próximo a alguma ilha”, que possui ligações com os

temas já identificados “governo Trump” e “presença chinesa”.

Como ficou evidente, algumas informações não estão completas, como no caso da

indefinição do tema “presença chinesa”. Com relação a esse problema, é possível

contorna-lo facilmente com o KH Coder. O Software permite verificar de maneira

detalhada os usos de determinados termos. Sendo assim, ao clicar no termo “presença”, é

possível visualizar todas as ocorrências do termo, como pode ser observado na Figura 6.

Figura 6 - Lista de ocorrências de termos no KH Coder

Fonte - elaborado pelo autor

Page 13: A UTILIZAÇÃO DE MINERAÇÃO TEXTUAL E REDES SEMÂNTICAS … · de 2019, que deveria tratar a mineração de texto e Redes Semânticas como uma das vertentes de sua pesquisa. Esse

4. CONSIDERAÇÕES FINAIS

Com base em tudo que foi apresentado até o momento, parece adequado

considerar Softwares de Redes de Semânticas como instrumentos de grande potencial

para pesquisas qualitativas, não somente em defesa e RI, mas em qualquer pesquisa em

que a quantidade de informação seja muito grande, desde que seja dada a devida atenção

às suas limitações e desafios.

Dentre essas limitações e desafios destaca-se, em primeiro lugar, que se trata de

uma ferramenta que demanda um esforço inicial grande e uma equipe multidisciplinar e

qualificada para que seu potencial seja amplamente aproveitado. Levando em conta a

experiência que o grupo teve nesse primeiro ano de pesquisas, deparou-se com a

demanda, além do habito da pesquisa bibliográfica, de capacidades em programação, para

automatizar processos mecânicos e repetitivos, e de especialistas na área que se

desenvolve o estudo, com capacidade para interpretar as redes. A experiência também

sugere que especialidades com grande potencial para auxiliar são os da área de

matemática e estatística, para auxiliar na composição das Rede Complexas; da área de

letras, para auxiliar com parte semântica; e biblioteconomia, para sistematizar a busca por

fontes e documentos.

Por fim, é preciso compreender que os resultados gerados não devem ser tomados

como absolutos, mas apenas como pontos de referência para posterior aprofundamento.

As Redes Semânticas permitem identificar potenciais pontos centrais de interesse, mas

não disponibilizam todas as respostas sobre estes temas.

Page 14: A UTILIZAÇÃO DE MINERAÇÃO TEXTUAL E REDES SEMÂNTICAS … · de 2019, que deveria tratar a mineração de texto e Redes Semânticas como uma das vertentes de sua pesquisa. Esse

REFERÊNCIAS:

FADIGAS, Inácio et al. Análise de redes semânticas baseada em títulos de artigos

de periódicos científicos: o caso dos periódicos de divulgação em educação

matemática. Educação Matemática Pesquisa, v. 11, n° 1, pp. 167-193. São Paulo. 2009.

CARRILHO JUNIOR, João Ribeiro. Desenvolvimento de uma Metodologia para

Mineração de Textos. 2007. 96f. Dissertação (Mestrado em Engenharia Elétrica) -

Pontifícia Universidade Católica do Rio de Janeiro, Rio de Janeiro, 2007. Disponível

em: https://www.maxwell.vrac.puc-

rio.br/Busca_etds.php?strSecao=resultado&nrSeq=11675@1. Acesso em: 07 ago. 2019.

CHEN, Hsinchun. Knowledge management systems: a text mining perspective.

Arizona: Knowledge Computing Corporation, 2001.

DIXON, Mark. An Overview of Document Mining Technology, 1997. Disponível

em:

http://citeseerx.ist.psu.edu/viewdoc/download;jsessionid=6B148E1215673D6A30D053

5B7D70EA71?doi=10.1.1.56.5351&rep=rep1&type=pdf. Acesso em: 09 ago. 2019.

MACHADO, Aydano P. et al. Mineração de texto em redes sociais aplicada à educação

a distância. Colabor@ - Revista Digital da CVA-RICESU, v. 6, n. 23, jul. 2010.

Disponível em: http://pead.ucpel.tche.br/revistas/index.php/colabora/article/view/132.

Acesso em: 07 ago. 2019.

MARCIAL, Elaine Coutinho. Análise Estratégica: estudos de futuro no contexto da

inteligência competitiva. Brasília: Thesarus Editora, 2011.

MENDONÇA, Jonas Henrique; DRUMMOND, Isabela Neves; SANDRI, Sandra

Aparecida. Técnicas Baseadas em Redes Neurais Artificiais e Lógica Difusa para

Mineração de Textos. In: 10° Brazilian Congress on Computacional Intelligence, 10,

2011, Fortaleza, CE. Anais [...], Fortaleza: ABRICOM, 2011. Disponível em:

http://abricom.org.br/wp-content/uploads/2016/03/st_27.5.pdf. Acesso em: 05 ago.

2019.

MINGOTI, Sueli Aparecida. Análise de Dados Através de Métodos de Estatística

Multivariada: Uma Aborgadem Aplicada. 2 ed. Belo Horizonte: UFMG, 2013.

SFERRA, Heloisa Helena; CORRÊA, Ângela M. C. Jorge. Conceitos e aplicações de

Data Mining. Revista de ciência & tecnologia, v. 11, n. 22, 2003. Disponível em:

http://www.unimep.br/phpg/editora/revistaspdf/rct22art02.pdf. Acesso em: 10 ago.

2019.

Page 15: A UTILIZAÇÃO DE MINERAÇÃO TEXTUAL E REDES SEMÂNTICAS … · de 2019, que deveria tratar a mineração de texto e Redes Semânticas como uma das vertentes de sua pesquisa. Esse

TAN, Ah-Hwee. Text Mining: The state of the art and the challenges. Singapore:

Nanyang Technological University, 1999. Kent Ridge Digital Labs. Disponível em:

http://www3.ntu.edu.sg/home/asahtan/papers/tm_pakdd99.pdf. Acesso em: 10 ago.