Fique Sabendo: um Sistema de Disseminação Seletiva da ... · geração automática de grafos conceituais a partir de textos. A ... conjunto de atividades ... seleção somente quando

Fique Sabendo: um Sistema de Disseminação Seletiva da

Informação para Apoio à Aprendizagem

Walber A. R. Beltrame1, Davidson Cury

2, Crediné Silva Menezes

2

1Departamento de Sistemas de Informação – Faculdade Vitoriana de Tecnologia (FVT)

Av. N. Sª. da Penha, 1800 – Vitória – Espírito Santo – Brasil

2Departamento de Informática – Universidade Federal do Espírito Santo (UFES)

Av. Fernando Ferrari, 514 – Vitória – Espírito Santo – Brasil

{walberbeltrame}@favi.br, {dede, credine}@inf.ufes.br

Abstract. This article proposes construction system of selective dissemination

of information based on analysis of multiple discourses through the automatic

generation of conceptual graphs from texts. The proposed model is motivated

by the Cross-Document Structure Theory, recently proposed in area of

Natural Language Processing and aims to establish correlations between

discourses of semantic nature. This article report that dissemination systems

can go beyond the role of spreading information and be a mechanism

promoting continued interaction, aimed at building new content, therefore,

building new knowledge.

Resumo. Este artigo propõe a construção de um sistema de disseminação

seletiva da informação baseado em análise de múltiplos discursos por meio da

geração automática de grafos conceituais a partir de textos. A proposta é

motivada por Cross-Document Structure Theory, difundido recentemente na

área de Processamento de Língua Natural e que visa estabelecer correlações

de natureza semântica entre discursos. O mérito deste trabalho é evidenciar

que um sistema de disseminação pode ir além do papel de propagar

informação e ser um mecanismo promotor da interação continuada, voltado à

construção de novos conteúdos, logo, de novos conhecimentos.

1. Introdução

Um sistema de disseminação seletiva da informação é um tipo de sistema de informação

que visa canalizar novas produções intelectuais, provenientes de quaisquer fontes, para

ambientes onde há alta probabilidade de interesse. Esse conceito origina-se da

proposição de Luhn (1961), que sistematiza serviços de notificação de acordo com

perfis. O serviço estabelecido tornou-se comum em bibliotecas digitais, voltados à

produção de listas de títulos e à distribuição de resumos das novas aquisições. Com a

evolução das tecnologias, o recurso consolidou-se como padrão de sistemática capaz de

divulgar atualizações entre diferentes plataformas e sítios de conteúdo [Almeida 2008].

Em publicações recentes – citam-se [Almeida 2008], [Morales-del-Castillo et al.

2009], [Kansa e Bissell 2010] e [Eirão 2011] – são referenciados sistemas de

disseminação seletiva da informação baseados em marcação de dados sobre textos

(modelos de meta-dados), de forma que o tratamento da informação manifesta-se entre

computação de dados semi-estruturados e inferência sobre meta-modelos.

____________________________________________________________________________________________________ Anais do 23º Simpósio Brasileiro de Informática na Educação (SBIE 2012), ISSN 2316-6533 Rio de Janeiro, 26-30 de Novembro de 2012

Essas tecnologias de disseminação baseadas em marcação semântica de dados

estão presentes em Ambientes Virtuais de Aprendizagem, como o Moodle1, TelEduc

2,

Redu3, entre outros, por meio da tecnologia RSS

4. Observa-se que esse aparato é

oferecido como mais uma opção de acesso aos conteúdos, dentre as ferramentas de

pesquisa, de recomendação e de envio de textos de forma personalizada.

No entanto, basta ao estudante somente o acesso à informação? Como se utilizar

dessas técnicas de disseminação de modo a estimular a socialização e a cooperação

voltadas à aprendizagem? Os objetivos desse artigo são propor uma discussão sobre o

assunto, realizar uma avaliação de sistemas relevantes e apresentar uma arquitetura de

sistema de disseminação que se atende à necessidade de interações continuadas. A

justificativa para a proposta é a possibilidade de uso das técnicas de seleção de conteúdo

para estímulo à aprendizagem cooperativa em ambientes virtuais.

O artigo está organizado da seguinte forma: na próxima seção é feita uma

revisão sobre sistemas de disseminação seletiva e uma avaliação subjetiva de sistemas

relevantes. Na seção seguinte é referenciada a teoria base para solução, a Cross-

Document Structure Theory. Na seção subsequente são expostos os artefatos gerados na

concepção de um sistema de disseminação seletiva, denominado de Fique Sabendo,

baseado no modelo proposto. Por fim, as considerações finais são apresentadas.

2. Disseminação Seletiva da Informação

Segundo Souto (2008), o conceito “disseminação seletiva da informação” pode ser

definido como um serviço que se utiliza de perfis (individuais ou de grupo) explícitos

ou implícitos para submeter periodicamente (ou disponibilizar acesso a) um pacote de

informações resultantes de seleção, realizada por ação humana ou por tecnologia.

O funcionamento padrão dos sistemas de disseminação pode ser descrito como

conjunto de atividades sequenciais e cíclicas [Luhn 1961]: (i) Percorrer as fontes

produtoras da informação (cadastradas de alguma forma) ou varrer a base de dados que

contenham as novas informações submetidas; (ii) Indexar as informações, por meio de

descritores, no repositório de dados; (ii) Estabelecer ou recuperar os perfis de interesse;

(iii) Selecionar por meio de pesquisa ou de critérios pré-definidos os documentos

relevantes aos perfis; (iv) Apresentar (disseminar) os resultados da seleção; (v) Permitir

avaliação dos resultados e retroalimentar o sistema para melhoria contínua dos perfis.

2.1. Formas de representação do conteúdo

Para Lancaster (2004), a definição de formatos para estruturar conteúdos baseia-se na

escolha de atributos específicos (descritores) que tornem possível a correspondência

com os perfis de interesse. As formas de obtenção dos descritores são: (i) Os descritores

são fornecidos pelos produtores do conteúdo, previamente acordados com os sistemas

de disseminação e formalizados em modelo estrutural; (ii) Os índices são extraídos do

dado original, desde que os sistemas de disseminação conheçam o formato do dado e

1 http://www.moodle.org/

2 http://www.teleduc.org.br/

3 http://www.redu.com.br/

4 http://feed2.w3.org/docs/rss2.html

23º Simpósio Brasileiro de Informática na Educação (SBIE 2012) _____________________________________________________________________________________________________

_____________________________________________________________________________________________________ @CBIE 2012, Rio de Janeiro-RJ

possuam algoritmos de conversão; (iii) Os atributos são gerados por meio de inferência,

utilizando-se de algoritmos de classificação ou de organização de dados (cluster).

2.2. Formas de representação do interesse

A representação do interesse (necessidade da informação) é o fator de maior relevância

em sistemas de disseminação, uma vez que é o principal critério para se determinar o

que deve ser selecionado e, posteriormente, disseminado. De Souto (2008), o interesse

se apresenta sobre as óticas: (i) Interesse externo: os sistemas restringem as opções de

interesse para os elementos contidos nos formatos de representação de conteúdo, de

forma organizada por temas e por classes. É a forma mais simples, em que se guardam

somente informações de quais categorias serão escolhidas; (ii) Interesse explícito: os

atributos (conjunto de dados que representa um interesse) são informados pelo usuário,

que é consciente das necessidades que possui e as tornam explícitas, facilitando o

trabalho dos sistemas quanto aos critérios que devem ser avaliados; (iii) Interesse

implícito: os atributos podem ser inferidos por meio da percepção de que o usuário

possui uma necessidade, mas não a manifesta. Sistemas que lidam com interesse

implícito devem possuir modelos de dados (conhecidos como modelos do usuário), em

que são manipuladas as informações necessárias para a inferência, por exemplo,

histórico das solicitações, opções feitas no sistema e os próprios dados do usuário

(nome, endereço, sexo, idade, profissão, qualificações e outros).

2.3. Formas de seleção da informação

A seleção da informação é realizada basicamente pela comparação entre a representação

do conteúdo e a do interesse. Essa comparação pode ser exata, selecionando somente os

documentos que satisfaçam o interesse, ou parcial, selecionando também conteúdos

similares ao interesse. Os sistemas parciais baseiam-se na subjetividade do que é de

interesse ou não. Outra forma de seleção é aquela que observa as relações entre os

próprios documentos, principalmente nos de conteúdo associativo (hipertexto). Nesse

formato de seleção, outros documentos, além daqueles que satisfazem a consulta, são

selecionados por possuírem alguma correlação notória. Outro meio de seleção de

documentos é o centrado no perfil de grupo de usuários, ao que se designou seleção

social, em que a relevância de um recurso condiz com quantos outros interesses

similares existem. Para alguns sistemas é comum seleção baseada em indicações de

conteúdo, num processo de construção coletiva de perfis comunitários [Primo 2007].

2.4. Formas de apresentação dos resultados

Em relação à apresentação dos resultados, os sistemas podem adotar estratégias

assíncronas, disponibilizando a informação em momento mais adequado, visto que a

necessidade do usuário poderá não ser imediata, por exemplo, exibir o resultado da

seleção somente quando o usuário estiver em determinado diálogo do sistema. Outra

questão relacionada é definir qual protocolo será utilizado, dentre as várias

possibilidades, por exemplo, serviços de mensagem eletrônica (e-mail) e comunicação

móvel. As limitações a superar são quanto à adaptação do conteúdo às diferentes

interfaces sem prejuízo da informação original. Os sistemas podem agregar à solução

mecanismos de pré-visualização dos documentos selecionados, a fim de evitar que os

usuários acessem informações indesejadas. Assim, o desafio é saber quais informações

são mais relevantes na pré-visualização.



2.5. Avaliação de sistemas relevantes

A verificação dos critérios, neste trabalho, é subjetiva e analítica, realizada por meio de

leitura e de interpretação dos textos publicados. A intenção é expor de modo organizado

como as formas anteriores são abordadas, dado que são citados por [Almeida 2008],

[Morales-del-Castillo et al. 2009], [Kansa e Bissell 2010] e [Eirão 2011].

2.5.1. MySDI

Em Ferreira e Silva (2001) é proposta uma arquitetura genérica para serviços de

disseminação. O modelo estrutura-se em quatro camadas – do usuário, da informação,

da classificação e de filtragem. São elaborados agentes de software que se interagem,

para estabelecer coordenação entre níveis. Na camada de classificação são utilizadas

máquinas de inferência, para geração de índices. O perfil de interesse é constituído por

interações (navegação) em sítios de conteúdo marcados por temas: cada ação do usuário

alimenta o sistema de forma positiva ou negativa quanto à temática de interesse. A

seleção de conteúdo é feita por mecanismos de consulta vetorial, mas existe um módulo

de verificação de correspondência entre perfis, que é utilizado como elemento de

cálculo de similaridade.

2.5.2. SemCast

Proposta de [Papaemanouil et al. 2004] para sistema baseado em difusão altamente

distribuída e para fluxos de grande volume de dados. Propõe uma abordagem semântica

para filtragem de conteúdo. Canais menores de interesse são gerados dinamicamente e

correlacionados na forma de topologia de rede, sendo que descritores são previamente

estabelecidos. O interesse é do tipo externo, dirigido pelo mapeamento semântico. Não

é relatado formalmente no texto como mudanças de interesse são tratadas, mas se

conclui que a abordagem é do tipo simples, visto que o tipo de interesse é externo (não

evolutivo). O tipo de seleção é a exata – o interesse é expresso pela assinatura de canais.

2.5.3. SABiO

Sistema de disseminação seletiva [Bax et al. 2004] voltado a bibliotecas, organizado em

três agentes de software: de captura, de interface e de notificação. Os descritores são

fornecidos, basicamente expressos como dados específicos sobre livros e publicações. O

fomento dos dados é estrutural, em banco de dados relacional. O tipo de interesse é

explícito, em que o usuário informa parâmetros de consultas (do tipo booleano). A

abordagem é simples, visto que nenhum mecanismo evolutivo é proposto. O tipo de

seleção é a exata, feito com rotinas para consulta a banco de dados relacional. Não é

dito se existem formas de comunicação para interoperabilidade. São discutidas as

principais telas do sistema de forma superficial.

2.5.4. G-ToPSS

Proposta de [Petrovic et al. 2005], baseada em difusão altamente distribuída e voltada à

escalabilidade de padrões anotados semanticamente da Web Syndication (tecnologia que

define formatos de marcação XML / RSS, acrônimo para RDF Site Summary, Really

Simple Syndication ou Rich Site Summary). Os índices são fornecidos pelo mapeamento

semântico. O tipo de interesse é externo e a abordagem é simples. O tipo de seleção é a

exata – o interesse é expresso pela assinatura de canais.



2.5.5. Desafios a superar

O preposto de que os sistemas atuais de disseminação não são rigorosos para as

necessidades de interação e de cooperação é válido. Ainda que sejam poucos os

sistemas avaliados, verifica-se que há generalização dessa corrente [Eirão 2011].

Esses tipos de sistemas, usualmente baseados em Web Syndication, se

popularizaram e estão presentes em grande parte dos Gerenciadores de Conteúdo,

Portais Web e Ambientes Virtuais de Aprendizagem [Eirão 2011]. A partir disso, este

artigo sugere algumas reflexões:

Dependendo do interesse do usuário, haverá uma grande quantidade de

informação selecionada e uma possível sobrecarga. Como esses sistemas devem

lidar para que o usuário sinta-se confortável ao lidar com um grande volume? As

atuais tecnologias observam isso?

Na seleção de dados provenientes de diversas fontes, é comum duplicidade de

conteúdo. Ao apresentar essa duplicidade ao usuário, não poderia o sistema

gerar desgastes e insatisfação? Como lidar com informações que lidam do

mesmo assunto de maneira que o usuário se interesse na leitura?

No atual cenário de sistemas voltados à cooperação e na coletividade entre as

pessoas, qual é o amparo técnico que permitam às pessoas se conectarem em

rede, criando vínculos sociais expressivos? No projeto de sistemas, além do

mapeamento das informações e dos interesses do usuário, como prover esse

encontro entre pessoas? Essa prática é comum em sistemas Web e nos sistemas

de disseminação de conteúdo? Como disseminar “pessoas”?

Sistemas que lidam com meta-dados têm a capacidade de inferência e poderiam

ser projetados para responder a essas perguntas. Porém, grande parte das produções na

Web realiza-se por meio de textos livres ou hipertextos, como publicações em Blogs,

respostas em Fóruns, discussões em Chats. Aliar técnicas de Processamento de Língua

Natural a meta-dados pode ser uma alternativa, discutida nos próximos tópicos.

3. Cross-Document Structure Theory

O modelo Cross-Document Structure Theory [Radev 2000], ou CST, propõe uma

metodologia para representação de relações entre textos. No modelo original foram

propostas 24 relações. Para a Língua Portuguesa do Brasil, o conjunto de relações foi

refinado para 14 relações e classificados em subcategorias de relações [Jorge 2010]:

Identity (sentenças idênticas), Equivalence (sentenças de mesmo conteúdo, mas

expressas diferentemente), Summary (uma das sentenças apresenta o conteúdo

compactado da outra), Subsumption (uma sentença possui informações adicionais),

Overlap (duas sentenças possuem informações adicionais), Historical Background (uma

sentença é um fato histórico de outra), Follow-Up (uma sentença possui um fato futuro

de outra), Elaboration (uma sentença detalha informação de outra), Contradiction

(possuem informações contrárias), Citation (uma das sentenças cita outra), Attribution

(uma das sentenças atribui autoria de outra), Modality (uma das sentenças apresenta a

autoria, mas de outro modo), Indirect speech (uma das sentenças é escrita em discurso

direto), Traslation (traduções em outra língua). A ideia central deste artigo é se utilizar

dessas relações para melhorar a seleção de documentos e para estimular à interação, de

acordo com as reflexões traçadas na seção anterior, ainda que parcialmente, dado que a

identificação automática das relações é complexa e nem sempre atende a todos os casos.



3.1. Identificação automática das relações

O método voltado à classificação automática CST, detalhado em [Zhang et al. 2004],

opera sobre um conjunto de processamentos sequenciais, tendo como pré-requisitos:

construção de coleções manualmente anotadas5 e treinamento de classificadores não

lineares. Nos trabalhos de [Murakami et al. 2009] e [Murakami et al. 2010] adicionou-se

ao processo outras técnicas de análise do discurso, como alinhamento estrutural. Cada

relação foi tratada por classificadores diferenciados e máquinas vetoriais.

Para o Português do Brasil, encontram-se os trabalhos de [Maziero et al. 2010] e

[Maziero 2012], que correspondem à reprodução dos métodos de [Zhang et al. 2004]

para as relações descritas em [Jorge 2010], por meio de classificadores e de casamento

de padrões a partir da definição de regras. Todavia, a necessidade de bases anotadas é

um fator que reduz a aplicabilidade do método, visto que a tarefa de classificação

manual exige esforços de especialistas. Aliado a isso, a subjetividade conceitual das

relações podem ocasionar ruídos indesejáveis [Afantenos et al. 2004].

Diante disso, este artigo baseou-se na geração de grafos conceituais a partir de

texto [Kowata et al. 2010], de forma a servirem como diretriz para a visão lógica dos

documentos de um Modelo Vetorial [Salton 1975]. A ideia central é se utilizar de uma

solução independente de base anotada. Parte-se do princípio que de um texto é possível

gerar um grafo conceitual, que é um conjunto de proposições do tipo “conceitos –

relação – conceitos”, ou “sujeitos – relação – predicados”, denominado de tripla

conceitual. As triplas são indexadas vetorialmente contemplando possíveis correlações,

por meio de expansão dos termos (palavras) provenientes de tesauro. Por exemplo, a

tripla conceitual {“Mário”, “é”, “feliz”} é indexada também na forma {“Mário”, “é”,

“alegre”}, para a correlação identidade. A identificação das correlações se estabelece

quando há correspondência entre os vetores nos três espaços, ou, no campo vetorial

(conjunto de espaços). A similaridade entre triplas pode ser calculada pela multiplicação

dos cossenos [Salton 1975]:

;

= vetor de termos dos sujeitos da tripla n;

= vetor de termos da relação da tripla n;

= vetor de termos predicados da tripla n.

A identificação das correlações entre textos é realizada quando, dado um novo

documento e gerado o grafo conceitual, para cada tripla formada realiza-se consulta

vetorial à coleção indexada. O resultado pode ser guardado em listas ordenadas pelo

valor de similaridade (cosseno) entre as triplas.

4. Novas Propostas para Informática na Educação

Em Radev (2000), a CST é utilizada para se gerar resumos de multidocumentos. Além

disso, é definido operador para eliminar informações duplicadas, exibir informações de

eventos ocorridos em ordem cronológica, exibir dados contraditórios, atribuir autoria de

textos, dentro outros usos da técnica [Jorge 2010] [Maziero 2012].

5 A anotação de coleções ou de bases (corpus) é o processo de adicionar novas informações em textos

(adicionar etiquetas), seja por humanos (anotadores) ou por sistemas treinados (anotação automática). A

anotação serve como insumo para alimentar métodos de aprendizado, buscar por fenômenos linguísticos,

gerar estatísticas ou testar teorias linguísticas.



Por iniciativa deste artigo, citam-se outras finalidades que o modelo potencializa

para Informática na Educação:

Aproximação social e estímulo à interação: nem sempre todos os participantes

dos sistemas se conhecem ou se interagem. Assim, um desafio é criar condições

para que os participantes com objetivos ou interesses afins possam se relacionar

(o que se designa de aproximação social). Alguns sistemas desenvolveram

funcionalidades de comparação entre perfis para identificar afinidades e fazer

sugestões de contato. A identificação de correlações entre os conteúdos também

pode ser utilizada, por exemplo, quando duas ou mais pessoas comentam sobre

um mesmo assunto em páginas pessoais, se as informações forem confrontadas

automaticamente pelo ambiente, a exibição de que novo conteúdo publicado

possui correlação semântica poderia induzir os autores a um diálogo de opiniões;

Interação em Tutores Inteligentes: tutores inteligentes é um tipo de sistema para

auxílio à educação que modela propostas pedagógicas aliadas a domínios de

conhecimento para inferir sobre o modo de compreensão do aluno, adaptando

individualmente o ensino às necessidades [Vanlehn 1988]. De acordo com a

concepção clássica de tutores inteligentes, considera-se somente a interação de

um aluno por máquina, o que é um fator limitante na apropriação desses

ambientes. Portanto, pode-se utilizar dos conceitos de correlação semântica entre

documentos produzidos pelos alunos para relacionar interesses em comum, não

mais individualizados, e propor atividades de forma colaborativa;

Mediação em Arquiteturas Pedagógicas: define-se Arquitetura Pedagógica como

combinação de estratégias, de dinâmicas de grupo, de softwares educacionais e

de ferramentas de cooperação voltada à aprendizagem [Carvalho et al. 2005].

Desse modo, identificar correlações semânticas pode ser usado como mediação

tecnológica para novas propostas de Arquiteturas Pedagógicas, por exemplo, ao

identificar semelhanças e contradições entre textos, acionariam interfaces para

discussões e debates entre alunos.

5. Sistema Fique Sabendo

Do pressuposto que existem demandas por tecnologias de disseminação no campo

educacional e que essas potencializam práticas pedagógicas que se afastam da prática

transmissiva e repetitiva, este trabalho propõe uma arquitetura de software que seja

capaz de prover novos meios de socialização, por meio da identificação automática de

correlações entre textos, a partir das interações dos estudantes com o ambiente.

O propósito é que essas correlações sejam apresentadas aos participantes e eles

possam aproveitá-las para conhecer outros usuários, saber sobre o que eles pensam

sobre o assunto selecionado, logo, promover discussões, debates e trocas de ideias.

Destaca-se, desse modo, a promoção da cooperação por meio do estímulo à interação,

além da formação de vínculos e de reciprocidade afetiva entre os sujeitos, a fim de

alavancar a participação ativa e a interatividade, facilitando a participação social.

A Arquitetura Conceitual (Figura 1) baseia-se: dada uma interface de autoria, o

sistema estabelece as triplas conceituais da produção e realiza a identificação das

correlações. A partir disso, estabelece quais são os interesses do participante. Dos

termos selecionados, recuperam-se os documentos com as correlações mapeadas,

exibindo o contato dos autores dos textos e estimulando o usuário a novas interações.



Figura 1. Arquitetura Conceitual da proposta

5.1. Protótipo Computacional para Apoio à Aprendizagem

O protótipo (Figura 2) é composto por interface de captação de conteúdo (1), em que os

usuários submetem textos que refletem algo que se queira disseminar, por exemplo, uma

opinião, um fato ou algo novo produzido por outras fontes de informação. O texto

produzido será base para a composição do interesse do usuário (2), o que posteriormente

fará com que sejam selecionados outros textos, de diferentes autores (3), em que as

correlações semânticas foram estabelecidas pelo sistema (4). Pelas limitações do tesauro

utilizado [Dias-Da-Silva et al. 2008], inicialmente foram tratadas somente relações de

Identidade (Identity), Semelhança (Equivalence) e de Contradição (Contradiction).

O conjunto de documentos selecionados forma uma rede de ligações para outros

documentos, em que é possível se trafegar entre os diferentes conteúdos. Cada rede de

correlação semântica pode ser instanciada na forma de canais de interesse, sendo

possível instanciar os resultados em arquivo no formato de marcação da Web

Syndication. Logo, os conteúdos e os usuários são disseminados seletivamente.

Figura 2. Interface geral do sistema

6. Considerações finais

A apropriação deste modelo em Ambientes Virtuais de Aprendizagem corrobora com a

ideia de que sistemas de disseminação seletiva podem ser usados para interações além

das simples atividades de comunicação. Ao ponto que atendem ao requisito de acesso

personalizado ou de propagação de conteúdos, os sistemas de disseminação podem

oferecer novos meios facilitadores dos processos de interação e de cooperação.



Alinhar esse aporte telemático às diretrizes pedagógicas abertas é um desafio,

que vem sendo estudado por diferentes propostas [Carvalho et al. 2005] e será um novo

horizonte para futuros trabalhos, por exemplo, em paralelo a este artigo está sendo

realizado uma experimentação do protótipo como Arquitetura Pedagógica voltado a

diálogos entre grupos de estudantes. Um dos pontos a serem explorados será avaliação

do protótipo desenvolvido e de indicadores de que o sistema auxilia nos processos de

aprendizagem cooperativa.

Objetiva-se que, nessa ferramenta, as atividades pressuponham a construção do

pensar, interpretar, relacionar e comparar informações, proporcionando situações que

privilegiem interações significativas para a construção de conhecimento, afastando-se

das práticas de isolamento intelectual e ao encontro dos elementos sociais de interação,

segundo a perspectiva de Piaget (1973). Destacam-se, desse modo, a contribuição e o

potencial do modelo apresentado por este trabalho, de acordo com esses objetivos.

7. Referências

Afantenos, S. D., Doura, I., Kapellou, E., Karkaletsis, V. (2004) Exploiting Cross-

Document Relations for Multi-document Evolving Summarization. SETN.

Almeida, R. L. D. (2008) Disseminação de Conteúdo na Web: A tecnologia RSS como

Proposta para Comunicação Científica. Brasília: Universidade de Brasília,.

Dissertação de Mestrado.

Bax, M., Alvarenga, L., Parreiras, F. S., Brandão, W. C. (2004) Sistema Automático De

Disseminação Seletiva. São Paulo: IFLA.

Carvalho, M. J. S.; Nevado, R. A.; Menezes, C. S., (2005) Arquiteturas Pedagógicas

para Educação a Distância: Concepções e Suporte Telemático. Minas Gerais:

Simpósio Brasileiro de Informática na Educação.

Dias-Da-Silva, B. C.; Felippo, A. D.; Nunes, M. D. G. V., (2008) The Automatic

Mapping of Princeton WordNet Lexical-Conceptual Relations onto the Brazilian

Portuguese WordNet Database. LREC.

Eirão, T. G. A, (2011) Disseminação Seletiva da Informação e a Tecnologia RSS nas

bibliotecas de Tribunais em Brasília. Brasília: Universidade de Brasília. Dissertação

de Mestrado.

Ferreira, J., Silva, A., (2001) MySDI: A Generic Architecture to Develop SDI

Personalised Services (How to Deliver the Right Information to the Right User?).

Setubal: ICEIS.

Jorge, M. L. D. R. C., (2010) Sumarização automática multidocumento: seleção de

conteúdo com base no modelo CST (Cross-Document Structure Theory). São Paulo:

Universidade de São Paulo. Dissertação de Mestrado.

Kansa, E. C., Bissell, A., (2010) Web Syndication Approaches for Sharing Primary

Data in "Small Science" Domains. Data Science Journal.

Kowata, J. H., Cury, D., Boeres, M. C. S., (2010) Uma Abordagem para Construção

Automática de Mapas Conceituais a partir de textos em Língua Portuguesa (Brasil).

João Pessoa: Simpósio Brasileiro de Informática na Educação.



Lancaster, F. W., (2004) Indexação e Resumos: Teoria e Prática. São Paulo: Briquet de

Lemos.

Luhn, H. P., (1961) Selective dissemination of new scientific information with the AID

of electronic processing equipment. New York: American Documentation.

Maziero, E.G., Jorge, M.L.C, Pardo, T.A.S., (2010) Identifying Multidocument

Relations. Portugal: International Workshop on Natural Language Processing and

Cogntive Science.

Maziero, E. G., (2012) Identificação automática de relações multidocumento. São

Paulo: Universidade de São Paulo. Dissertação de Mestrado.

Morales-del-Castillo, J. M., Pedraza-Jiménez, R., Ruíz, A. A., Peis, E., Herrera-Viedma,

E. A., (2009) Semantic Model of Selective Dissemination of Information for Digital

Libraries. New York: Information Technology and Libraries.

Murakami, K., Nichols, E., Matsuyoshi, S., Sumida, A., Masuda, S., Inui, K., (2009)

Statement map: assisting information credibility analysis by visualizing arguments.

WICOW.

Murakami, K., Nichols, E., Mizuno, J., Watanabe, Y., Goto, H., Ohki, M., (2010)

Automatic Classification of Semantic Relations between Facts and Opinions.

Beijing: Internacional Workshop on NLP Chanllenges.

Papaemanouil, O., Çetintemel, U., (2004) SemCast: Semantic Multicast for Content-

based Data Dissemination. ICDE.

Petrovic, M.; Liu, H.; Jacobsen, H.-A., (2005) G-ToPSS: Fast Filtering of Graph-based

Metadata. IW3C2.

Piaget, J., (1973) Estudos Sociológicos. Rio de Janeiro: Forense.

Primo, A., (2007) Interação mediada por computador: comunicação, cibercultura,

cognição. São Paulo: Sulina.

Radev, D. R., (2000) A common theory of information fusion from multiple text

sources step one: cross-document structure. Hong Kong: ACL SIGDIAL Workshop

on Discourse and Dialogue.

Salton, G., Wong, A., Yang, C. S., (1975) Vector Space Model for Automatic Indexing.

ACM.

Souto, L. F., (2008) Mediação em Serviços de Disseminação Seletiva de Informações

no Ambiente de Bibliotecas Digitais Federadas. São Paulo: Universidade de São

Paulo. Tese de Doutorado.

Vanlehn, K. Student modeling. In: Polson, M. C.; Richardson, J. J., (1988) Foundations

of intelligent tutoring systems. Routledge. p. 55 -78.

Zhang, Z.; Radev, D. R., (2004) Learning cross-document structural relationships using

both labeled and unlabeled data. Hainan Island: IJC-NLP.



Documents

Fique Sabendo: um Sistema de Disseminação Seletiva da ... · geração automática de grafos conceituais a partir de textos. A ... conjunto de atividades ... seleção somente quando