44
1 CHAMADA UNIVERSAL MCTI/CNPq 01/2016 Título da Pesquisa Da Doença de Parkinson a cuidados básicos em Pediatria: acessibilidade textual e terminológica para leitores brasileiros de baixa escolaridade Proponente: Profa. Dra. Maria José Bocorny Finatto (PPG-Letras-UFRGS) Em 23 de fevereiro de 2016 Esta proposta tem 02 partes – o Projeto de Pesquisa (Parte 1) e o Plano de Atividades dos bolsistas solicitados (Parte 2) PARTE 1 - PROJETO a) Identificação da proposta Título: Da Doença de Parkinson a cuidados básicos em Pediatria: acessibilidade textual e terminológica para leitores brasileiros de baixa escolaridade From Parkinson's disease to preventive health care in Pediatrics: textual and terminological accessibility for brazilian users with little schooling Observação importante: parte desta proposta integrou um projeto específico sobre Doença de Parkinson submetido no Edital de Ciências Humanas e Sociais de 2015. Como aquela proposta teve mérito reconhecido, mas NÃO atingiu nota para ser contemplada com auxílio, tampouco foi apresentada a qualquer órgão de fomento, está sendo aqui, EM PARTE, aproveitada. Duração prevista da pesquisa: 36 meses. PROPONENTE/RESPONSÁVEL: Profa. Dra. Maria José Bocorny Finatto (UFRGS) Consultor médico: Prof. Dr. Danilo Blank (Faculdade de Medicina da UFRGS, PPG Ensino na Saúde-UFRGS) - CRM: 7316-RS ÁREAS IMPLICADAS: Linguística de Corpus; Terminologia; Terminologia de Perspectiva Textual; Estudos do Texto e do Discurso; Processamento da Linguagem Natural (PLN), Popularização de Temas em Saúde/Medicina. EQUIPE - COLABORADORES DE PESQUISA: 1) UFRGS/Instituto de Letras: Prof. Dra. Maria José Bocorny Finatto (responsável e coordenadora). Bolsista PQ-CNPq. Professor Associado 4. Autora e coautora de livros sobre

CHAMADA UNIVERSAL MCTI/CNPq 01/2016 Título da Pesquisa … · CHAMADA UNIVERSAL MCTI/CNPq 01/2016 Título da Pesquisa Da Doença de Parkinson a cuidados básicos em Pediatria: acessibilidade

  • Upload
    vandan

  • View
    212

  • Download
    0

Embed Size (px)

Citation preview

1

CHAMADA UNIVERSAL MCTI/CNPq 01/2016

Título da Pesquisa

Da Doença de Parkinson a cuidados básicos em Pediatria: acessibilidade textual e

terminológica para leitores brasileiros de baixa escolaridade

Proponente: Profa. Dra. Maria José Bocorny Finatto (PPG-Letras-UFRGS)

Em 23 de fevereiro de 2016

Esta proposta tem 02 partes – o Projeto de Pesquisa (Parte 1) e o Plano de Atividades

dos bolsistas solicitados (Parte 2)

PARTE 1 - PROJETO

a) Identificação da proposta

Título: Da Doença de Parkinson a cuidados básicos em Pediatria: acessibilidade textual e

terminológica para leitores brasileiros de baixa escolaridade

From Parkinson's disease to preventive health care in Pediatrics: textual and

terminological accessibility for brazilian users with little schooling

Observação importante: parte desta proposta integrou um projeto específico sobre Doença

de Parkinson submetido no Edital de Ciências Humanas e Sociais de 2015. Como aquela

proposta teve mérito reconhecido, mas NÃO atingiu nota para ser contemplada com auxílio,

tampouco foi apresentada a qualquer órgão de fomento, está sendo aqui, EM PARTE,

aproveitada.

Duração prevista da pesquisa: 36 meses. PROPONENTE/RESPONSÁVEL: Profa. Dra. Maria José Bocorny Finatto (UFRGS)

Consultor médico: Prof. Dr. Danilo Blank (Faculdade de Medicina da UFRGS, PPG Ensino

na Saúde-UFRGS) - CRM: 7316-RS

ÁREAS IMPLICADAS: Linguística de Corpus; Terminologia; Terminologia de Perspectiva

Textual; Estudos do Texto e do Discurso; Processamento da Linguagem Natural (PLN),

Popularização de Temas em Saúde/Medicina.

EQUIPE - COLABORADORES DE PESQUISA:

1) UFRGS/Instituto de Letras: Prof. Dra. Maria José Bocorny Finatto (responsável e

coordenadora). Bolsista PQ-CNPq. Professor Associado 4. Autora e coautora de livros sobre

2

Terminologia e estudo de linguagens técnico-científicas, orientadora de mestrado e de

doutorado junto ao PPG-Letras-UFRGS (CAPES, conceito 6). Autora e coautora de

glossários e de dicionários em diferentes áreas do conhecimento (Direito Ambiental, Gestão

Ambiental, Química, Linguística, Penumopatias Ocupacionais, Pediatria, membro do Grupo

TERMISUL desde 1993. Coordena e participa de projetos internacionais da área de

Processamento de Linguagem Natural (PLN).

2) UFRGS/Faculdade de Medicina: Prof. Dr. Danilo Blank, CRM: 7316-RS (colaborador,

pesquisador). Médico Pediatra. Professor Associado 3. Estudioso e pesquisador de

terminologias médicas. Coordenador do Curso de Pós-Graduação em Ensino na Saúde -

Mestrado Profissional da Faculdade de Medicina da Universidade Federal do Rio Grande do

Sul. Membro do Departamento Científico de Segurança da Sociedade Brasileira de Pediatria

(SBP). Diretor de Publicações da SBP. Instrutor da Residência Médica em Pediatria do

Hospital de Clínicas de Porto Alegre.

3) UFRGS/Instituto de Informática: Profa. Dra. Aline Villavicencio (colaborador,

pesquisador de Processamento da Linguagem Natural - PLN). Professor Adjunto. Bolsista

PQ-CNPq. Coordena o projeto Samsung SRBR Textual Simplification of Complex

Expressions. Tem experiência na área de Ciência da Computação, com ênfase em PLN,

atuando principalmente nos seguintes temas: modelos computacionais de aquisição de

linguagem, corpora, machine learning, métodos estatísticos, linguística computacional.

Membro do Board do Special Interest Group on the Lexicon, da Association for

Computational Linguistics, co-responsável por vários eventos na área bem como co-editora

de números especiais de periódicos como o Computational Linguistics. Membro do comitê de

programa de vários eventos internacionais.

4) Discentes - Pós-Graduandos do UFRGS/Programa de Pós-Graduação em Letras:

Bianca Pasqualini e Aline Evers (mestres em Letras pela UFRGS, doutorandas em Estudos

da Linguagem). Giselle Fetter (graduada em Letras pela UNISINOS, mestranda). As três

alunas do PPG-Letras-UFRGS fazem pesquisa relacionada ao tema da acessibilidade para

leigos, padrões de complexidade textual.

3

b) Qualificação do principal problema a ser abordado

Parte I – PROPOSTA DA PESQUISA

SÍNTESE DA PROPOSTA: Com apoio computacional, partindo da descrição e de análises

linguísticas e terminológicas de um corpus especialmente reunido de textos disponíveis em

português do Brasil sobre as temáticas de Saúde envolvidas, Doença de Parkinson (em

Neurologia) e Cuidados com a Criança (em Pediatria), objetiva-se a produção de uma

"Cartilha de Redação de Textos Facilitados para Leigos”. Essa cartilha, em formato

eletrônico e disponível gratuitamente on-line, será uma ferramenta de apoio à escrita dirigida

para profissionais de Saúde brasileiros, redatores técnicos e gestores de informação

institucional em área Saúde Pública. Propõe-se como uma das metas do projeto auxiliar a

promover a acessibilidade textual para públicos leigos de baixa escolaridade e letramento.

Como protótipo de leitor leigo, considera-se um cidadão adulto, com idade entre 25 e 50 anos,

trabalhador das classes socioeconômicas C e D, de menor letramento e pouco hábito de

leitura. Sua escolaridade é restrita, equivalente ao Ensino Fundamental completo. A proposta

é socialmente relevante e está situada nas linhas de pesquisas desenvolvidas pela proponente e

pelos dois pesquisadores da equipe junto à UFRGS. A originalidade e o potencial de inovação

da proposta residem na metodologia, baseada em recursos de Processamento de Linguagem

Natural, Linguística de Corpus, Terminologia, Estudos do Texto Especializado, Estatística

Lexical, Lexicologia e Mineração de Dados, com o aporte do conhecimentos de Educação em

Saúde. Também é original pelo tipo de produto a ser criado a partir da pesquisa, uma

ferramenta on-line específica de auxílio à escrita, e pelo tratamento de dois temas em

contraste, Doença de Parkinson (em Neurologia) e Cuidados com a Criança (em Pediatria).

Essa dupla temática funcionará como um tertio comparationis para embasar o desenho e a

implementação de uma cartilha on-line que seja versátil e adaptável pelo usuário, cujos dados,

instruções e recursos provêem do exame do corpus reunido. Com ajustes básicos, a ideia é

atender necessidade redacionais em diferentes temáticas da área de Saúde, tanto em um plano

genérico do domínio médico quanto no plano específico de suas subáreas ou de assuntos

pontuais.

Parte II – QUADRO DO PROBLEMA DE PESQUISA ESPECÍFICO

Atualmente, no Brasil, dada a grande acessibilidade do cidadão à Internet, facilitou-se

a sua informação relacionada a diferentes temas de Saúde Pública em português. Encontrar

alguma informação sobre um dado tópico em sites brasileiros e mesmo portugueses,

4

inlcuindo-se páginas pessoais, redes sociais e blogs, não é mais um problema. Pelo contrário,

há realmente muita informação, de diferentes procedências, de pessoas físicas e jurídicas, de

fontes científico-acadêmicas, de profissionais de Saúde, de empresas de comunicação e

jornais, de associações civis, além de informações em enclopédias on-line, dicionários e

glossários e obras afins sobre temas variados de Medicina. Nesse cenário digital, muitos

desses materiais identificam-se como “para leigos”.

Assim, entre nós e em âmbito internacional, multiplicam-se também fontes de

informações produzidas por leigos e dirigidas para leigos, a título de compartilhamento de

informações. Hoje, há tanta informação na áre de Saúde disponível, ao alcance de um clique,

que os profissionais de Saúde já alertam para os perigos de interpretações equivocadas,

autodiagnósticos e de tratamentos “caseiros”, originados pelo “Dr. Google”.

Nesse contexto, conforme Araújo (2009) já apontava, embora pareça haver muito

dado, uma informação realmente qualificada, ponderada, organizada e confiável ainda precisa

ser buscada com afinco. Por isso, os documentalistas, cientistas da Informação ou

pesquisadores de Biblioteconomia afirmam que dado não é o mesmo que informação. Um

mero dado seria, por exemplo, uma informação bruta, a indicação de ocorrência de uma

palavra ou de uma dada asserção em um acervo. A informação, po sua vez, é uma informação

situada no espaço-tempo e em um dado contexto, com alguma confiabilidade, usabilidade e

procedência verificável.

Por outro lado, embora haja excesso de dados e de informações para leigos em

ciências ou temas de Saúde, parece que muitos brasileiros não conseguem compreender o que

lhes é oferecido – o que pode aumentar o risco de equívocos no uso da informação. Conforme

já relatou Motta-Roth (2011 e 2009), em uma pesquisa do Ministério de Ciência e Tecnologia

do Brasil de 2006, 85% de uma amostra de 2.004 entrevistados em todo o Brasil, pessoas de

diferentes camadas sociais, maiores do que 16 anos, afirmavam não compreenderem textos

sobre ciência. Apesar dessa dificuldade, via de regra confirmada em pesquisas do Programme

for International Student Assessment - PISA1 e do INAF (Indicador de Alfabetismo

Funcional), seguimos consultando a Internet.

O INAF, conforme Pasqualini (2012, p. 54-56), é um programa de pesquisa

empreendido pela Ação Educativa e pelo Instituto Paulo Montenegro desde 2001 (RIBEIRO,

1Para mais detalhes sobre o PISA(a) e sobre os resultados do PISA 2012 (b): http://portal.inep.gov.br/pisa-programa-internacional-de-avaliacao-de-alunos http://download.inep.gov.br/acoes_internacionais/pisa/resultados/2014/relatorio_nacional_pisa_2012_resultados_brasileiros.pdf

5

FONSECA, 2010). Esse indicador subdivide em quatro categorias os níveis de proficiência de

leitura: analfabetismo (incapacidade de realizar tarefas simples de leitura), alfabetismo em

nível rudimentar (capacidade de localizar informações em textos curtos e familiares),

alfabetismo em nível básico (capacidade de ler e compreender textos de média extensão e

localizar informações fazendo algumas inferências) e alfabetismo em nível pleno (capacidade

de ler textos longos e relacionar suas partes, comparar informações e fazer inferências e

sínteses). Analfabetismo e alfabetismo rudimentar são tidos como índices de analfabetismo

funcional, enquanto as categorias de alfabetismo básico e pleno são consideradas índices de

alfabetismo funcional. Desde 2005, os testes cognitivos aplicados aos entrevistados do INAF

passaram a envolver também a resolução de operações matemáticas (para a avaliar

“numeramento”), além de leitura e escrita (para a avaliação de “letramento”) (RIBEIRO,

FONSECA, 2010).

De acordo com alguns resultados recentes do INAF, o analfabetismo funcional no

Brasil diminuiu de 39 para 27% entre 2001 e 2010; felizmente, o índice de alfabetismo

funcional aumentou de 60 para 73% no mesmo período. Um dado alarmante foi o de que 59%

dos indivíduos que têm da 5ª à 8ª série do Ensino Fundamental e 57% dos indivíduos que

cursaram o Ensino Médio, em 2010, foram considerados alfabetizados apenas em nível

básico. O índice de letramento do Ensino Superior, conforme Ribeiro e Fonseca (2010), ficou

composto por 62% de indivíduos em nível pleno e 34% em nível básico, o que revela que o

universo dos alunos de cursos de graduação também não seria homogêneo no que diz respeito

aos seus níveis de proficiência de leitura.

Todos esses dados sobre a nossa população leitora, seja interagindo com textos

impressos ou textos em formato digital, na Internet, tornam-se relevantes na avaliação do que

poderia ser a complexidade de um texto sobre temas de Saúde para diferentes perfis de

leitores e para o nosso perfil de leitor de menor escolaridade. A despeito de um quadro melhor

ou pior de dificuldades de compreeensão, os brasileiros, mesmo os mais humildes, seguem

acessando muito a Internet, hoje especialmente via telefones celulares e smartphones.

Nessa movimentação de acessos, alguns temas geram, sazonalmente, mais demanda

de informação do que outros, provocando “ondas” ou curvas de acesso e de consultas a

diferentes tipos de fontes (Google, Wikipedia, Jornais on-line, Facebook, etc.). Essas curvas

de buscas por temas ou por palavras-chave e por diferentes fontes ao longo de anos ou ao

longo de outros períodos de tempo podem ser verificadas em ferramentas embutidas em

diferentes motores de busca, como na ferramenta Google Trends, conforme se ilustra na

Figura 1 a seguir:

6

Figura 1- Interesse temporal de acessos no Brasil pela expressão Mal de Parkinson,

acesso ao Google Trends em 30/10/2015.

Temas como microcefalia, dengue, vacinação infantil, câncer de mama, diabetes,

as DSTs, a segurança infantil, tuberculose, câncer de próstata e hanseníase, entre muitos

outros, geralmente associados a riscos de epidemias, a campanhas governamentais sazonais

ou a menções na grande mídia televisiva ou impressa, especialmente a TV aberta, tendem a

gerar mais ou menos interesse. Cada tema de Saúde buscado corresponde, naturalmente, a um

problema de impactos diferentes, à maior ou menor sucesso de atendimento do cidadão

brasileiro junto ao sistema de saúde público e a perfis de acesso de informação também

diferentes, geográfica e temporalmente distribuídos em termos de maior ou menor interesse

do público brasileiro em geral.

Nesse cenário de buscas e de uma miríade de conteúdos que são oferecidos sob a

forma de textos escritos, vídeos e imagens, em fontes particulares e institucionais idôneas, em

fontes sem autoria creditada e até mesmo em redes sociais, temos materiais produzidos por

leigos para leigos, mas também os gerados por especialistas para especialistas, especialmente

no segmento dos registros da pesquisa acadêmica. Há também muitos materiais de autoria de

especialistas em Saúde especialmente dirigidos para o público leigo. Esse, em especial, é o

material textual a que esta pesquisa se dedicará, objetivando contribuir para sua produção,

qualificação e usabilidade.

Assim, em síntese, entre vários tipos de conteúdos para leigos, disponíveis na Internet,

em português do Brasil, podem ser destacados:

a) materiais produzidos por especialistas para leigos. Há inúmeros sites e blogs de

profissionais médicos devidamente identificados, como o que vemos, por exemplo, em:

7

<http://www.leandrominozzo.com.br/blog/f-e-r-r-i-t-i-n-a-para-entender-de-vez>. Nesse blog,

um profissional médico presta esclarecimentos básicos para o leigo curioso sobre o tema

“Ferritina alta no exame de sangue”, alertando para a importância de uma consulta médica –

em consultório - para um informação realmente adequada.

b) materiais produzidos por leigos para leigos. Nesse segmento, temos os sites com

conteúdos produzidos pela própria comunidade leiga, que se oferecem hoje, também em

abundância. Nesse âmbito, vemos blogs pessoais e os sites de compartilhamento de

informações de associações de doentes, familiares e/ou cuidadores de portadores de alguma

enfermidade ou condição clínica e, ainda, sites e blogs de assuntos variados, semelhantes a

uma revista semanal. Um exemplo de blog sobre o mesmo tema de saúde antes citado,

“Ferritina no sangue”, mas não assinado por um profissional de Saúde, vemos em

<http://belezaesaude.com/ferritina/>. Este é um site centrado em temas de beleza e de saúde

para público feminino, no qual não encontramos (acesso em 26/10/15) identificação de um

profissional responsável pelas informações oferecidas.

Esses dois tipos de fontes, em cotejo, conforme acreditamos, podem nos ajudar a

depreender uma proposta de formulação adequada para os textos produzidos por profissionais

de Saúde dirigidos para leigos de menor escolaridade. Afinal, o texto do segmento “de leigo

para leigo”, em tese, salvaguardadas todas as restrições de natureza conceitual ou científica –

e até mesmo relativas à escrita em Norma Culta, especialmente o material produzido por

associações civis de pacientes, pode conter o que esse público público imagina ser

conveniente em termos de forma de conteúdo para si mesmo.

Não obstante, em caso de tópicos de informação relacionados a doenças, condições ou

deficiências que tendem a afetar menores faixas populacionais ou a grupos humanos mais

específicos e que sejam de menor visibilidade para veículos de comunicação, a quantidade de

informação oferecida no formato “de leigo para leigo” e também “de especialista para

especialista” é ainda, proporcionalmente à informação sobre doenças de maior impacto, muito

menor, mas não menos necessária ou importante. Esses materiais textuais escritos, mais

escassos em número, sobre temáticas mais pontuais também podem ser boas fontes de cotejo

para o nosso corpus sobre Doença de Parkinson (DP) e Cuidados com a Criança (CC) em

Pediatria .

Uma relativa carência de informações em português, em assuntos específicos, é o que

ocorre, por exemplo, no caso do tema das Pneumopatias Ocupacionais (PO), temática médica

a que nos dedicamos recentemente (FINATTO, LOPES, CIULLA, 2015; Projeto de Pesquisa

PQ-2013-2015, Processo307562/2012-3; FINATTO, EVERS, PASQUALINI, 2013). Essa

8

carência de fontes para pesquisa já experienciamos desde 2011, quando produzimos um

glossário brasileiro de termos sobre as PO (BLANK, FINATTO, GOLDNADEL e

TIETBOEHL FILHO, 2012) em um projeto terminológico internacional (consultas so

glossário em:

http://www.oqlf.gouv.qc.ca/ressources/bibliotheque/dictionnaires/panlatin_pneumopathies201

30124.pdf>)

Recentemente, em agosto de 2015, verificamos que a quantidade de sites em

português do tipo blog especialmente dedicados a antender questões de leigos sobre PO

correspondia a apenas 23 fontes. Apenas essas 23 eram devidamente avalizadas por alguma

associação civil ou continham a menção de autoria ou colaboração de profissional de Saúde

ou grupo de prestação de serviço de Saúde. Essas fontes deveriam ser especialmente úteis

para informação de trabalhadores interessados, sobretudo para aqueles potencialmente

expostos às PO. Infelizmente, conforme verificamos em um estudo amostral (FINATTO,

2016, no prelo), a maioria exibia textos pouco acessíveis, em termos de inteligibilidade, para

trabalhadores brasileiros das áreas mais expostas a riscos de PO, tal como os empregados de

marmorias, pedreiras e mineração ou seus familiares. Alguns representariam dificuldades de

compreensão até mesmo para audiências de escolaridade universitária.

A partir dessa nossas experiências em particular e do tanto que já se tem produzido e

registrado, em diferentes frentes, nos Estudos de Letras/Linguística sobre o tema dos

problemas da linguagem científica acessível para leigos (como se vê, por exemplo, em

estudos sobre texto e discurso com MOTTA-ROTH, 2011; MOTTA-ROTH, 2009; MOTTA-

ROTH, GIERING, 2009; ou, muito recentemente, em trabalhos específicos sobre

terminologias médicas para leigos como a pesquisa de GALDIANO, 2016 ou mesmo

trabalhos específicos sobre a divulgação em Medicina, como o de SANTIAGO, 2007), tendo

em mente um quadro de altas demandas por informações acessíveis e confiáveis, queremos

voltar nossa atenção, nesta proposta de pesquisa, para o que corresponde à seguinte pergunta:

Como qualificar os materiais textuais escritos por redatores especialistas para garantir

acessibilidade de leigos de pouca escolaridade?

Como diferencial da nossa pesquisa, ainda que obras de referência, e especialmente as

terminológicas, sejam recursos muito importantes para auxiliar leitores leigos em temas de

Saúde, frisamos, não buscaremos criar ou oferecer mais um glossário ou dicionário

específicos sobre DP ou sobre os CC. A ideia é, em uma outra direção, contribuir para que se

produzam “todos de texto escrito convencionais” com boa compreensibilidade para os leitores

de menor escolaridade e pouco hábito de leitura.

9

Naturalmente, bem sabemos que glossários e dicionários são insumos de referência

muito importantes, recursos envolvidos nesse processo de produção. Entre os “todos de texto

escrito”, com os quais buscamos contribuir, verbetes de dicionários para públicos

especialistas e também para leigos, dicionários comuns e dicionários especializados,

enciclopédias e bases de dados terminológicas e suas definições tendem a ser aproveitados,

principalmente em propostas de reescrita, de glosas ou de “traduções em linguagem leiga” de

terminologias. Entretanto, reiteramos, não nos restringiremos apenas às terminologias dos

textos, pois não só elas podem atrapalhar a compreensão do nosso leitor leigo. Esta nossa

proposta, assim, envolve examinar textos previamente produzidos e, a partir desse exame,

mediante diferente cotejos e testagens, propor diretrizes para um modus discendi bem

sucedido. Alcançar esse modus discendi implica o reconhecimento de todo um vocabulário

simples e complexo, abrangendo de elementos lexicais até elementos gramaticais.

II. 1 – Alguns Problemas específicos no tema da Doença de Parkinson

Especialmente no que tange à informação sobre a Doença de Parkinson (DP),

também conhecida como mal de Parkinson, algumas vezes denominada de parkinsionismo

ou até mesmo chamada de paralisia agitante, vemos alguns problemas de dificuldade de

acesso por parte de leitores de menor escolaridade que nos propomos a descrever e a

enfrentar.

Sobre a DP, como ocorre em outros temas, há muitas fontes em português na Internet

e ainda muito mais fontes em línguas como o inglês, o francês, o espanhol e o alemão. Essa

profusão de fontes, talvez se deva a uma tendência de envelhecimento da população mundial

e também da população brasileira, aliada ao fato de que a DP tende a acometer mais a

população acima da faixa dos 50 anos de idade.

Assim, o acesso e o compartilhamento de informações sobre a DP tem gerado, ao seu

redor, inclusive, diversas associações de pacientes/portadores da doença/de familiares e

cuidadores no exterior e no Brasil. Essas associações, em geral, são formadas por pessoas

comuns, portadores da doença, seus familiares e cuidadores, sem formação em Ciências da

Saúde. O foco dos textos escritos oferecidos por ONGs de pacientes parece ser a difusão de

informações diversas sobre a doença, incluindo divulgação sobre achados científicos

publicados em revistas científicas nacionais e internacionais, sobre direitos dos doentes e

informações sobre seu atendimento em serviços públicos de saúde.

Como referência de uma grande associação nacional de portadores da DP, talvez a

mais antiga e a mais bem organizada associação do gênero, temos a Associação Brasil

10

Parkinson (http://www.parkinson.org.br). Ela existe como sociedade filantrópica desde 1985

e oferece um site bastante abastecido em termos de quantidade e variedade de textos e de

informações em vários formatos, contando inclusive com apoio de um laboratório

farmacêutico multinacional. Nos EUA e também na Europa e Japão, há vários sites de

associações de pacientes de DP. No Reino Unido, por exemplo, temos a renomada associação

Parkinson’s UK, cujo site, um verdadeiro monumento em termos que quantidade, diversidade

e qualidade informações, pode ser visto em <ww.parkinsons.org.uk>.

Além do movimento social coletivo em torno da DP no Brasil, multiplicam-se os

blogs individuais de relatos de pacientes e suas páginas em redes sociais como o Facebook.

São textos produzidos em diferentes pontos do nosso país, com postagens de relatos semanais

– até diários - sobre a vida de uma pessoa que se expõe publicamente para relatar o seu

enfretamento pessoal dessa doença.

Desse modo, para um público geral do Brasil, interessado sobre o tema da DP e sobre

seus diferentes problemas associados, há bastante informação disponível em sites privados,

sites institucionais e mesmo em blogs institucionais e privados e em páginas de redes sociais

como o Facebook ou Instagram. Afinal, conforme informa, em 2015, o blog do Ministério da

Saúde do Brasil, só no nosso país, estima-se que cerca de 200 mil pessoas sofram com a DP,

número que se multiplica quando pensarmos em termos de familiares e de cuidadores desses

pacientes.

II. 2 Experimentos iniciais com textos sobre DP

Em uma busca com a ferramenta Webcorp (http://www.webcorp.org.uk), recurso

especialmente desenvolvido para a pesquisa de informação linguística escrita na Internet, o

qual toma a web como corpus (ferramenta descrita em BEVILACQUA, 2011), em 26/10/15,

encontramos 52 indicações de páginas brasileiras com a expressão de busca PARKINSON.

Nessa busca inicial e aleatória, havia alguns sites repetidos, visto que a ocorrência é trazida

por frequência da expressão em páginas de texto e não por sites. Assim dos 52 retornos,

verificamos, como fontes, 38 sites diferentes. O site que nos ofereceu mais ocorrências – em

tese, com mais informação - relacionada à palavra de busca, foi o da Associação Parkinson

Carioca (91 frases com a palavra PARKINSON).

Assim, no total, nessa pesquisa preliminar por sites brasileiros, obtivemos 675

contextos para PARKINSON. Desses 38 sites, tivemos:

• 11 sites de revistas de revistas semanais, jornais diários e agências de notícias

• 12 sites comerciais que trazem informaçõe sobre temas de saúde para leigos;

11

• 01 site de uma grande empresa privada de tratamentos/equipamentos médicos;

• 02 sites de empresas privadas de serviços de saúde;

• 01 site da Associação Brasileira de Geriatria;

• 01 site do Ministério da Saúde do Brasil;

• 02 site de grandes hospitais: Hospital Sírio-Libanês e Hospital Albert Einstein, ambos

de São Paulo - SP;

• 03 sites de Associações de portadores/pacientes/familiares: a) Associação Parkinson

Carioca Amigos e Portadores da Doença de Parkinson; b) Associação Bahiana de

Parkinson e Alzheimer - ABaPaz; c) APPP - Associação Paranaense dos Portadores de

Parkinsonismo.

• 02 sites de blogs de variedades, atividades de lazer

• 03 sites acadêmicos, de publicações de universidades federais brasileiras.

Entretanto, a despeito de uma oferta maior ou menor – ou, ainda, melhor ou pior em

termos de qualidade, confiabilidade e de acessibilidade de compreeensão de leitura dos textos

escritos oferecidos para um público leigo, esses tenderiam, aparentemente, conforme

verificamos, grosso modo, a proporcionar um aproveitamento, em tese, dificultoso para o

nosso perfil de leitor leigo – tendo-se em vista apenas a informação textual escrita das fontes.

Como protótipo de leitor leigo, vale repetir, temos um cidadão adulto, com idade entre 25 e

50 anos, trabalhador das classes socioeconômicas C e D, com escolaridade restrita,

equivalente ao Ensino Fundamental completo.

Diferentes dificuldades da compreensão de leitura desse cidadão, o que, naturalmente,

pretendemos testar empiricamente, já stão descritas em diferentes pesquisas (AMORIM,

20111 entre outras), pesquisas sobre letramento e compreensão de textos relacionadas ao

INAF2. Entre vários fatores, a dificuldade de compreensão de leitura também pode ser

agravada pela própria formulação do texto, pouco planejado em termos de acessibilidade para

diferentes tipos de leitores. Esse pouco planejamento parece ser denunciado pelo uso de uma

linguagem excessivamente técnica ou erudita, de terminologias sem maiores

contextualizações e/ou uma conformação de sintaxe frasal e textual complexas.

2Um exemplo de pesquisa relatada encontra-se em : http://www.acaoeducativa.org.br/index.php/educacao/50-educacao-de-jovens-e-adultos/10004473-ipm-e-acao-educativa-mostram-evolucao-do-alfabetismo-funcional-na-ultima-decada , acesso em 02/11/2015. Conforme se lê nesta fonte: “Criado em 2001, o Inaf Brasil é realizado por meio de entrevista e teste cognitivo aplicado a partir de amostra nacional de 2.000 pessoas, representativa de brasileiros e brasileiras entre 15 e 64 anos de idade, residentes em zonas urbanas e rurais de todas as regiões do país. Para essa edição, o período de campo ocorreu entre dezembro de 2011 e abril de 2012.”

12

Um exemplo de um problema ilustrativo dessa ordem, justamente em um texto

institucional, para leigos, é o que vemos abaixo. Destacamos um trecho sobre Doença de

Parkinson (DP) no Blog da Saúde do Ministério da Saúde do Brasil, grifando alguns pontos

que nos parecem problemáticos quanto ao vocabulário, construções e terminologia:

Fonte: <http://www.blog.saude.gov.br/34589-doenca-de-parkinson> acesso em 26/10/15

A Doença de Parkinson (DP), descrita por James Parkinson em 1817, é uma das doenças neurológicas mais comuns e intrigantes dos dias de hoje. Tem distribuição universal e atinge todos os grupos étnicos e classes socioeconômicas. Estima-se uma prevalência de 100 a 200 casos por 100.000 habitantes. Ela é causada pela deterioração de neurônios dopaminérgicos da substância negra cerebral e também pelo comprometimento de outras regiões, como o núcleo dorsal do vago, sistema olfatório e alguns neurônios periféricos. Fatores genéticos também devem ser considerados, principalmente em casos precoces (antes dos 50 anos), que são mais raros.

Potencial dificuldade semelhante para nosso perfil de leitor leigo de pouca

escolaridade encontramos também em um blog produzido por leigos, para leigos. É o caso de

uma fonte que traz textos sobre variedades e “assuntos femininos”, conforme vemos abaixo:

Fonte: http://www.mulherdeclasse.com.br/o%20que%20e%20parkinson.htm, acesso em

26/10/15.

Mulher de Classe A doença de Parkinson é uma afecção neurodegenerativa que se manifesta clinicamente através dos seguintes sintomas: tremor de repouso, rigidez muscular, lentidão de movimentos e alterações da marcha e do equilíbrio. A doença desenvolve-se quando neurônios de certa área do cérebro denominada substância negra morrem ou tornam-se não funcionantes.

É a esse tipo de problema e a seus congêneres, relacionado com a promoção de mais

ACESSIBILIDADE TEXTUAL PARA PÚBLICOS LEIGOS DE BAIXA ESCOLARIDADE

E LETRAMENTO que esta pesquisa pretende se dedicar. Nosso enfoque, frisamos, será

textual e terminológico (FINATTO, 2004; KRIEGER, 2008; PEARSON, 1998), conjungando

princípios da Linguística de Corpus (BERBER SARDINHA, 2004) e estudos do texto

técnico-científico (CIAPUSCIO, 2003), além de pesquisas sobre popularização e

acessibilidade de temas de ciências no âmbito dos Estudos da Linguagem (MOTTA-ROTH,

2011; MOTTA-ROTH & GIERING, 2009). Visamos, conforme já mencionado, empreender

uma descrição linguístico-textual e terminológica de textos problemáticos e de textos bem

sucedidos sobre o tema da DP e temas de CC dirigidos para públicos leigos, considerando-se

a promoção de sua acessibilidade por parte de leitores de baixa escolaridade e de pouco hábito

13

de leitura. A descrição empreendida, realizada com apoio computacional – via técnicas de

PLN e de recursos de Linguística de Corpus, deverá resultar na elaboração de um guia de

apoio para a elaboração desse tipo de texto, um recurso em formato computacional, a ser

utilizado por Profissionais de Sáude e também por redatores ou por especialistas que atuem

junto a associações de leigos, especialmente ONGs, que produzem textos de divulgação para

leigos. Esse guia terá o formato de uma cartilha on-line à qual se juntam dados de um acervo

de textos especialmente reunido.

O recurso on-line a ser produzido, em tese, poderá ser aproveitado, em linhas gerais,

especialmente por profissionais médicos na formulação de textos para leigos e também por

instituições governamentais e não governamentais ocupadas com a divulgação de temas de

Saúde Pública.

A esse propósito, vale lembrar aqui que a nossa proposta de pesquisa pretende

aproveitar os resultados e indicativos do importante trabalho de LIMA (2013), desenvolvido

na FALE da UFMG, sob orientação da Profa. Dra. Adriana S. Pagano (LETRAS-UFMG).

Nele a autora trouxe importantes indicações para a formulação de cartilhas para brasileiros

sobre o tema da anemia falciforme. Essas indicações, obtidas a partir da descrição linguística

com base em corpus e de técnicas de Linguística de Corpus, utilizou textos especializados,

textos técnicos e textos para leigos. Esse trabalho teve um impacto e repercussões positivas,

entre a mídia e os profissionais de Saúde, ao mesmo tempo em que revelou uma série de

problemas de inadequação desses textos produzidos por profissionais de Saúde do Brasil, que

foram comparados com textos similares em inglês norte-americano (para mais detalhes sobre

a repercussão do trabalho de LIMA (2013), ver

http://www.nupad.medicina.ufmg.br/?p=5220). Outros recursos e trajetórias a ser

aproveitados, no âmbito dos recursos computacionais de PLN para apoio à escrita

simplificada em português, os quais são uma referência nacional e internacional no âmbito

dos estudos sobre Complexidade Textual, são os sistemas SIMPLIFICA e o FACILITA,

desenvolvidos pelo projeto PorSimples do Núcleo Interinstitucional de Linguística

Computacional da USP de São Carlos-SP (NILC) (ALUÍSIO, 2010 e ALUÍSIO et. al, 2010).

Também será aproveitado, no que te tange a funcionalidades e proposta para a auxílio à

escrita, o sistema SciPO (FELTRIM, 2004), também do NILC. Esses recursos que inspiram

para a nossa futura Cartilha on-line serão detalhados mais adiante.

14

II. 3 Experimentos iniciais com textos sobre Cuidados com a Criança (CC) em Pediatria

- “Conversando com o Pediatra”

Para não repetirmos o que já destacamos para o tema da DP, em diferentes de textos

oferecidos por vários tipos sites de especialistas e de leigos-para-leigos, apresentamos, por

exemplo, o que se oferece, em Pediatria, considerando apenas o site da Sociedade Brasileira

de Pediatria (SBP). Essa delimitação vale aqui como a ilustração de uma situação prototípica

em termos do que nos interessará descrever e subsidiar com a nossa pesquisa e também com a

ferramenta computacional de auxílio à escrita, a Cartilha de apoio à escrita, que temos em

mente.

A SBPD, nossa maior referência em termos de qualidade científica de conteúdos,

oferece vários tipos de textos para leigos. Um desses materiais é a coleção que se chama

“Para a Família”. É uma série de publicações ilustradas, produzidas pela Editora Manole de

SP, cujo acesso se dá mediante compra

(http://www.sbp.com.br/publicacoes/publicacoes_categoria/para-a-familia/).

Há também links para textos publicados em jornais

(http://www.sbp.com.br/publicacoes/publicacoes_categoria/jornalisticas/) e os textos dos

diferentes departamentos científicos da SBP. Um exemplo desses textos de departamentos são

os materiais do Departamento de Segurança, que oferece em seus conteúdos gerais, textos do

tipo “Segurança: informações para os pais”. Nesse segmento sobre Segurança infantil temos,

por exemplo, entre vários temas, um texto sobre o uso de andador para bebês

(http://www.sbp.com.br/departamentos-cientificos/andador-perigoso-e-desnecessario/) cujo

título é Andador: perigoso e desnecessário.

Um pouco além desses textos de departamentos, destacaremos aqui apenas os textos

produzidos pela SBP do segmento “Conversando com o Pediatra”. Afinal, são materiais

produzidos por membros dos diversos departamentos científicos da SBP, todos dirigidos

especificamente a pais/familiares. Assim, em tese, devem ser de compreensão fácil para

leigos, além do fato de que estão todos disponíveis para acesso imediato e grátis on-line.

Esse material gratuito se encontra em

http://www.conversandocomopediatra.com.br/website/index.php.

Os materiais do “Conversando…” encontram-se indexados, para o consulente, pela

idade da criança. Entre eles, vemos um texto, também do Departamento de Segurança, cujo

título é Intoxicações exógenas. Apenas pelo título, conforme deve ser fácil perceber, já se

instauraria alguma dificuldade para o nosso leitor de menor escolaridade, especialmente por

uma palavra como exógenas.

15

Abaixo, reproduzimos um texto do “Conversando com o Pediatra” produzido pelo

Departamento Científico de Neonatologia. É um texto sobre um tema, infelizmente, muito

atual e noticiado nas mídias do Brasil – e que nos aponta para um cenário trágico - a

microcefalia.

Nesse texto, que vale aqui apenas como um exemplo pontual, confirmamos boas

práticas redacionais da SBP na tentativa de promover acessibilidade, como as explicações

entre parênteses ou glosas, mas também, algumas escolhas pouco felizes, tais como frases

longas, texto longo, palavras pouco familiares para um leitor adulto de menor escolaridade

(como transcorrer e robustos) e a manutenção de expressões complexas (como curvas

específicas e nascido a termo). No texto, ressaltamos apenas algumas palavras/expressões em

amarelo e, em vermelho, as frases mais longas:

O que é microcefalia e o quanto devemos nos preocupar? Departamento Científico de Neonatologia Microcefalia é nome que se dá quando a cabeça de uma pessoa apresenta tamanho menor do que o esperado para a idade. Pode resultar de problemas ocorridos no nascimento ou no transcorrer dos dois primeiros anos de vida (problemas que impeçam o crescimento normal do sistema nervoso central), ou ainda resultar de processos intra-uterinos e ser congênita (que é quando o bebê já nasce com a cabeça pequena). Estamos vivendo uma situação na região Nordeste do nosso país (predominantemente em Pernambuco) em que muitos bebês estão nascendo microcefálicos, situação que vem gerando muitas dúvidas no meio leigo e no meio médico. Existem várias causas para a microcefalia congênita, as quais estão sendo investigadas pelos órgãos competentes em âmbito nacional a fim de esclarecer esse momento atual. Essas causas podem ser biológicas, genéticas, ambientais, químicas ou físicas, podendo estar relacionadas a doenças ou problemas ocorridos na gestação, portanto é muito importante a realização das consultas pré-natais. Alguns exemplos: transtornos genéticos, uso de substâncias tóxicas como cigarro, álcool, drogas ilícitas, cosméticos inadequados para gestantes, exposição a radiação, medicamentos sem ciência do médico, infecções e motivos desconhecidos. No momento, a suspeita é de que os casos que estão ocorrendo de modo epidêmico no nosso país sejam consequência de infecções nas gestantes, estando em investigação rubéola, toxoplasmose, citomegalovírus, parvo vírus, herpes vírus e, devido ao relato de manchas vermelhas no corpo de algumas mães de bebês afetados, doenças transmitidas pelo mosquito Aedes Aegypti como Dengue, Chikungunya e Zika. Não existem dados robustos na literatura médica que relacionem Zika com microcefalia, mas, devido ao grande número de casos dessa infecção nessa região do país, tornou-se um importante suspeito. Assim, está sendo fortemente recomendado que as gestantes se protejam de mosquitos, especialmente durante os primeiros 4 meses – período de formação dos órgãos do futuro bebê. Isso deve ocorrer em todo o país, tendo em vista que casos de Zika estão começando a aparecer nacionalmente, devido ao vetor (mosquito) e deslocamento de pessoas (viajantes). O Ministério da Saúde está orientando que, até que se esclareçam as causas do aumento da incidência dos casos de microcefalia na região Nordeste, as mulheres que planejam engravidar devem conversar com a equipe de saúde de sua confiança. Nessa consulta, devem avaliar as informações e riscos de sua gravidez para tomar a sua decisão. O atendimento das crianças que nasceram com microcefalia vem sendo realizado nos serviços de atenção básica do Sistema Único de Saúde em nível local. Crianças com essa condição devem ser investigadas e monitorizadas pelo pediatra quanto ao crescimento e desenvolvimento, com seguimento multiprofissional e multi-especialidades se houver detecção de atrasos, com a finalidade de minimizar qualquer potencial dano decorrente do crescimento insuficiente do cérebro.

16

Está sendo amplamente divulgada a informação de que o tamanho do perímetro cefálico dos recém-nascidos menor ou igual a 33 cm configura uma situação de microcefalia, o que é verdade se o bebê for nascido a termo (>37 semanas). Assim, mães de bebês prematuros não devem considerar essa informação, visto que essa população especial de bebês vai apresentar tamanhos de cabeça proporcionais a sua idade gestacional, sendo necessário o uso de curvas específicas para interpretar esses dados – o seu pediatra está ciente dessas curvas e esclarecerá possíveis dúvidas quanto a isso.

Além de um evidente contraponto com o que vimos em textos sobre a DP, na seção

anterior, um outro motivo que nos levou à escolha desses textos da SBP de espcialistas para

leigos, é o fato de que, por intermédio do Prof. Danilo Blank, colega e pesquisador deste

Projeto e membro ativo da SBP, a Profa. Dra. Rita Silveira (docente da UFRGS),

responsável, na SBP, pelos textos da série “Conversando...”, não só nos autorizou o uso para

a pesquisa de todo material ali publicado, como ficou satisfeita com a possibilidade de que

aqueles textos sejam objeto de avaliação crítica por especialistas fora do meio médico.

II. 4 Avanços esperados em relação ao estado da arte e efetividade da metodologia

proposta

Em relação ao estado da arte, considerando a bibliografia sobre o tema no âmbito dos

estudos da Linguagens, pensamos que o trabalho de Lima (2013), antes citado é um bom

contraponto para o que queremos oferecer e desenvolver ao logo de 36 meses de pesquisa.

Assim como esse trabalho de Lima, também lidaremos com corpora e com os referenciais

teóricos e metodológicos da Linguística de Corpus (LC) (conforme introduzida no Brasil por

BERBER SARDINHA, 2004). Entretanto, como um ponto distintivo e novo, combinaremos à

LC o Processamento de Linguagem Natural (PLN), em uma parceria em Letras-Linguística e

Ciência da Computação que nos parece em desde bastante tempo a ainda hoje muito

promissora e necessária (FINATTO, 2011; FINATTO, LOPES, CIULLA, 2015). Além disso,

lidaremos com does domínios em contraste, a DP e os CC em Pediatria.

Quanto ao estado da arte em PLN, colocamo-nos em relação ao que já produziu o

Projeto PorSimples, especialmente no que se refere à ferramenta SIMPLIFICA3 – um

simplificador automático de textos apresentado. Esse sistema é reconhecido nacional e

internacionalmente como um recurso importante da pesquisa de PLN com o português do

Brasil. Em relação a esse recurso tão reconhecido, queremos marcar que, modestamente,

pretendemos dar pelo menos um passo além da pós-edição que ele oferece. Nossa ideia é,

3http://www.nilc.icmc.usp.br/nilc/index.php/tools-and-resources,atualmente,em23/02/15,comproblemasdefuncionamento/acesso.

17

assim, contribuir para a qualificação de um produto como esse, aprofundando a sua

concepção dos diferentes tipos de simplificação, lexical e gramatical. Para tanto, imaginamos

o aporte de um dicionário e de um corpus de português escrito “simples” ou “facilitado”,

associado aos trabalhos de Finatto, Evers e Pasqualini (2013), Evers (2013) e à tese de B.

Pasqualini atualmente em andamento junto ao PPG-Letras-UFRGS. Afinal, a ideia, com a

nossa Cartilha on-line, é subisidar a escrita e a avaliação dessa escrita científica/especializada

para leigos, integrando-se, a um simplificador, as funcionalidades de apoio à escrita

semelhantes a que vemos, por exemplo na ferramenta SciPO (Scientific Portuguese) proposta

por Feltrim (2004), disponível em http://www.nilc.icmc.usp.br/ scipo. O SciPO é, aindahoje,

a única ferramenta de PLN do gênero disponível gratuitamente em português e que

auxilia tambémnaestruturaçãoretóricade textoscientíficosemportuguês.Osistema

SciPo foi criado para auxiliar escritores nativos e iniciantes na escrita de textos científicos e

traz sugestões de organização de texto e de estruturas de frases oriundas de um corpus. Para o

desenho e implementação desse recurso, esparmos contar com a expertise da colega

pesquisadora de PLN, a Profa. Dra. Aline Villavicencio e de seus orientandos. Além disso,

esperamos aproveitar as indicações do recente trabalho de Torres (2015), também em PLN,

que apresenta uma ferramenta de apoio à escrita acadêmica especialmente desenvolvida para

o uso de hispanofalantes que precisam escrever textos no Brasil. A proposta de Torres

proveita elementos do SciPO para um novo cenário de escrita que prevê erros

comumentecometidosporredatorespela interferênciadesua línguamaternasobreo

português.

Com relação à efetividade da metodologia proposta, conforme pretendemos explicitar

mais adiante, na seção c, Referenciais e metodologia, acreditamos que o método de

selecionar, reunir corpora, descrevê-los e analisá-los, para que eles mesmos subsidiem a

nossa ferramenta, tende a ter alto potencial de sucesso. A nosso método, em linhas gerais,

parte da descrição dos usos de linguagem, mas também se apoiará na testagem de algumas

propostas com uma amostra de leitores leigos de acordo com o nosso perfil estabelecido.

c) Referenciais teóricos e metodologia a ser empregada

Parte III – Referenciais teóricos

III.1 Conceitos envolvidos e planejamento computacional geral da Cartilha

Conforme já afirmamos em trabalho recente (FINATTO et. al, 2015b), um livro

bastante singelo sobre o tema da Leitura, há diversas abordagens relacionadas à leitura e à

18

sua compreensão. O mesmo ocorre em relação ao que se entende por complexidade textual e

inteligibilidade textual. Esses são temas que vêm sendo tratados de longuíssima data por

diferentes âmbitos de pesquisa (na Psicologia da Educação, por exemplo, por DALE, CHAL,

1948, em Linguística e também em Processamento de Linguagem Natural/Computação com

FLESCH, 1949).

Nesses âmbitos diversos, conceitos como os de legibilidade e de apreensibilidade, às

vezes são utilizados por certos autores com sentido semelhante ou muito diferente. Diremos

aqui, todavia, que complexidade textual, na sua acepção mais geral, diz respeito ao nível de

dificuldade de um texto, considerando a dificuldade lexical (comumente medida pela

frequência e pela extensão das palavras) e a dificuldade advinda do tamanho da sentença (a

partir do cálculo do número de palavras que a formam). Entretanto, o caráter um tanto

formulista desta concepção simples cede espaço a outros pontos de vista, que admitem que a

complexidade textual não é uma característica facilmente mensurável somente com fórmulas

matemáticas, e que deve levar em conta outros componentes linguísticos e discursivos.

Para Dubay (2004), por exemplo, a inteligibilidade é o que torna alguns textos mais

simples de ler do que outros. O termo legibilidade, por outro lado, compreenderia as

características físicas do texto, como o tamanho, o tipo e a cor de letras, o espaçamento, o

alinhamento de parágrafos e elementos da formatação textual, como a diagramação (SILVA,

1985). Já o termo apreensibilidade (tradução para a forma inglesa readability) refere-se à

fácil leitura, compreensão, velocidade da leitura e apreensão de um texto, fatores relacionados

com a forma de escrita (prolixa ou sucinta) e com o vocabulário utilizado (DUBAY, 2004).

Conforme já mencionamos, tendo em mente a complexidade dessas noções e suas

implicações, esta pesquisa propõe responder, no âmbito dos estudos de Linguística

Aplicada/Linguística de Corpus, Terminologia e de Processamento de Linguagem Natural, a

seguinte questão: como tornar linguisticamente mais acessível, para o cidadão brasileiro,

adulto, de pouca escolaridade4 e pouco hábito de leitura, a formulação textual escrita de

materiais informativos sobre temas de Saúde Pública considerando seu oferecimento na

Internet?

Como materiais textuais informativos para análise, serão tomados apenas textos

escritos em português brasileiro sobre os temas de (1) Doença de Parkinson (DP) e (2)

4Para especificar ainda mais esse perfil de leitor de pouca escolaridade, é possível considerar um indivíduo adulto com mais de 25 anos de idade, com filhos, trabalhador(a) do segmento comercial ou de serviços, interessado(a) por conteúdos da Internet, que tenha perfil ativo no Facebook, e que tenha apenas o Ensino Fundamental Completo. Esse sujeito imaginado pode ter o Ensino Médio em curso ou o frequentar de modo intermitente, isto é, com interrupções.

19

Cuidados com a Criança (CC). Serão tratados materiais da autoria de grupos institucionais ou

de pessoas com formação em Ciências da Saúde, textos dirigidos para leigos (pessoas sem

qualquer formação em Ciências da Saúde) disponíveis para acesso livre na Internet

apresentados em sites ou blogs. A partir desse perfil genérico de fontes textuais, buscar-se-á a

compilação, descrição e compartilhamento de um corpus específico, especialmente reunido

para a pesquisa, visando-se uma identificação, linguisticamente empreendida, de boas e más

práticas de redação em função de um perfil também específico de leitor leigo interessado em

obter informações sobre a DP e sobre os CC.

A partir da identificação das melhores alternativas para a elaboração textual

(considerando-se aspectos terminológicos, discursivos, textuais, frasais e vocabulares), textos-

protótipos serão submetidas a testes com usuários-leitores. Assim, combinando-se a descrição

e análise com apoio computacional dos textos disponíveis reunidos e esses testes, como um

dos resultados da pesquisa, será proposto o desenho básico, para implementação, de uma

"Cartilha de Redação de Textos Facilitados para Leigos” especialmente para o uso de

profissionais de Saúde, redatores técnicos e gestores de informação institucional em temas de

Saúde Pública.

A compilação, descrição, análise dos corpora e testagem de propostas de elaboração

com leitores serão feitas de acordo com o estado da arte, mediadas pela indicações da

literatura especializada. Essa literatura, restrita à produzida no âmbito dos Estudos da

Linguagem/Linguística Aplicada (como, por exemplo LIMA, 2013 e LIBERATO,

FULGÊNCIO, 2007) e à literatura da pesquisa do Processamento Computacional de Textos

em PLN, trata de temas diretamente relacionados à promoção de acessibilidade textual e da

facilitação de leitura em termos de características textuais e lexical-terminológicas de textos

escritos para determinados perfis de leitores.

Quanto à parte mais computacional dessa literatura, de PLN, cabe destacar, no âmbito

nacional, os trabalhos já citados do Projeto PorSimples (veja-se, por exemplo, CANDIDO

JR., A., MAZIERO, E., GASPERIN, C., PARDO, T., SPECIA, L., & ALUISIO, S., 2009,

disponível em http://delivery.acm.org/10.1145/1610000/1609848/p34-

candido.pdf?ip=187.107.59.77&id=1609848&acc=OPEN&key=4D4702B0C3E38B35%2E4

D4702B0C3E38B35%2E4D4702B0C3E38B35%2E6D218144511F3437&CFID=560137543

&CFTOKEN=25042310&__acm__=1447244380_f3c3c8b7671d6962feca9aaeabaf8d54)

desenvolvidos por pesquisadores do ICMC - Instituto de Ciências Matemáticas e de

Computação da USP de São Carlos-SP junto ao NILC - Núcleo Interinstitucional de

Linguística Computacional.

20

Esses trabalhos descrevem a construção de ferramentas automáticas para a

simplificação de textos em português brasileiro para leitores de menor escolaridade ou com

algum tipo de déficit de leitura. Essa simplificação, automática, baseada em padrões de

corpora textuais e de dicionários computacionais, dá-se no plano vocabular e sintático dos

textos-fonte, que são transformados em versões mais simples. A lógica de funcionamento

dessas ferramentas de simplificação textual seria a mesma de uma “tradução intralinguística”,

nos moldes do que refere, por exemplo, Umberto Eco (ECO, 2007, p. 12), além de tantos

outros autores da área dos estudos de Tradução.

O grupo do NILC do ICMC da USP de São Carlos produziu ferramentas nacional e

internacionalmente reconhecidas na pesquisa de PLN com o português do Brasil, tais como o

sistema SIMPLIFICA e o sistema FACILITA EDUCACIONAL (descrito em WATANABE,

UZÊDA, FORTES, PARDO & ALUÍSIO, 2009), disponíveis em

http://www.nilc.icmc.usp.br/nilc/index.php/tools-and-resources. Um bom material

informativo da iniciativa Simplificaça ̃o Textual do Português para Inclusão e Acessibilidade

digital (CASELI, H. PEREIRA, T.; ALUÍSIO, S.M, 2008) pode ser conferido em

http://www.nilc.icmc.usp.br/nilc/download/NILC_TR_08_10.pdf .

O Projeto PorSimples, assim, conforme também já referimos, é uma referência

internacionalmente reconhecida no âmbito da simplificação ou readability assessment para o

português do Brasil, salientando-se que seu desenvolvimento, hoje um tanto em estado de

congelamento por uma série de problemas técnicos, contou com o patrocínio da Microsoft

Research Foundation (mais detalhes em

http://research.microsoft.com/enus/um/redmond/events/ersymposium2010/slides/aluisio.pdf) .

Para uma referência de trabalho internacional de PLN sobre o tema da

simplificação/acessibilidade, vale como exemplo o trabalho de Saggion e colaboradores

(SAGGION et al., 2013)

Obtida esta nossa descrição - linguística e computacional - de um material textual

especialmente reunido sobre a DP e os CC, a mesma subsidiará uma proposta de elaboração

ou de reelaboração desse tipo de texto, tornando-o mais acessível para esse perfil de leitor em

termos de facilitar a sua compreeensão de leitura. Para a composição dos corpora sobre DP,

deteremo-nos em materiais produzidos por especialistas para especialistas, mas também

aproveitaremos os materiais de leigos para leigos, no segmento associado a grupos de

pacientes ou a ONGs de compartilhamento de informações como o do grupo Parkinson

Brasil, já citado na seção Parte II, item II.1. Para os materiais sobre os CC em Pediatria,

21

privilegiaremos os materiais da SBP citados no item II.2, com destaque para o segmento

“Conversando com o Pediatra”. Conforme julgamos importante esclarecer, interessa-nos

uma amostra qualificada de textos e não apenas uma quantidade o maior possível de corpus,

isso porque, conforme colocamos em Finatto (2016, no prelo) e vimos em trabalhos recentes

de PLN, a dimensão ideal do corpus é estabelecida pela natureza do trabalho e pelos objetivos

que se queira alcançar, de modo que é possível confiabilidade com grandes e pequenas

amostras de dados. Isso é o que nos mostra, recentemente, o trabalho dos pesquisadores de

PLN Lopes, Fernandes e Vieira (2016). O desenho de um corpus, conforme explicou D. Biber

(BIBER, 1988 e 1995), é uma tarefa de grande ponderação, não havendo, neste momento,

como anteciparmos, exatamente, qual será a sua composição em termos de número de textos e

dimensões em termos de types/tokens, mas confiamos que é possível um trabalho com

amostras de diferentes dimensões em função de um enfoque matemático e estatístico

específico.

A proposta de elaboração/escrita/reescrita será apresentada sob a forma de uma

Cartilha on-line, que funciona como uma ferramenta de auxílio à escrita, com uma primeira

parte de interface nos moldes do sistema SciPo , com tópicos modelares para preenchimento

pelo usuário, e outra nos moldes do sistema SIMPLIFICA - vide Figuras 2, 3 e 4 a seguir.

Esse tópicos, na primeira parte, para o caso de se ter que escrever um texto sobre o

tema de uma dada doença, por exemplo a DP, podem ser ORIGEM DA DOENÇA, TERMOS

CIENTÍFICOS BÁSICOS RELACIONADOS, SINTOMAS, TRATAMENTOS,

PREVENÇÃO, OBSERVAÇÕES IMPORTANTES PARA PACIENTES E

FAMILIARES/CUIDADORES. Nesta parte INICIAL, o usuário poderá selecionar, de

antemão, dois domínios ou temas, a DP ou os CC em Pediatria e a opção OUTROS.

Na segunda parte da nossa Cartilha, uma parte de CRÍTICA AUTOMÁTICA, o

redator, ao concluir ou salvar o seu texto, teria acesso ao uso de um dicionário de palavras ou

expressões ou de frases e construções mais simples para aquelas automaticamente detectadas

como mais complexas. A seguir a Figura 2 ilustra o esquema básico de abertura do SciPO que

imaginaos aproveitar – na parte 1. Para a parte 2 - de crítica de simplificação do texto gerado,

conforme o sistema SIMPLIFICA, temos as Figuras 3 e 4.

22

Figura 2 – O sistema Scipo em ação, visão geral da estrutura do documento a produzir

Figura 3- Sistema SIMPLIFICA e substitutição de palavra complexa por uma simples.

23

Figura 4 – o Sistema SIMPLIFICA, interface de simplificação sintática, oração relativa

Essa Cartilha, assim imaginada, será implementada por um técnico em Informática

bolsista do Projeto aqui proposto e ficará hospedadaem servidor da UFRGS. Também será

necessária a prestação de serviços de terceiros. A prestação de serviço será supervisionada

pela coordenadora do Projeto com acompanhamento da Profa. Dra. Aline Villavicencio,

pesquisadoea de Ciência da Computação, familiarizada com a arquitetura computacional

desse tipo de recurso de PLN. Além dessas funcionalidades diretas de auxílio à redação,

conterá um material instrucional com exemplos de escrita e um glossário didático da

terminologia geral de ciências e das expressões técnicas e/ou científicas específicas mais

frequentes advindas do corpus textual reunido em DP e em CC.

A ideia básica é que nossos usuários possam aproveitar as indicações da Cartilha, na

parte instrucional, e as sugestões de exemplos e de dados dos corpora, ao elaborarem seus

textos para um público de menor escolaridade e pouco hábito de leitura. A partir dos temas da

DP e dos CC, espera-se, ainda que a mesma metodologia que subsidiar a Cartilha possa ser

útil, com as devidas adaptações, para a elaboração de textos sobre outros temas de

Saúde/Medicina.

Esta proposta de pesquisa baseia-se, fundamentamente, nos apontamentos do nosso

trabalho recentemente publicado sobre o bom potencial da parceria entre pesquisas

linguísticas e computacionais (FINATTO, LOPES, CIULLA, 2015a) em torno do tratamento

e descrição de determinados tipos de textos, especialmente os textos de temática científica.

Nesse trabalho destacamos o PLN, em suas especificidades, em cooperação com a Linguística

de Corpus e os estudos de gêneros textuais e discursivos.

24

III. 2 - Marcos teórico-metodológicos

Nossa contribuição de pesquisa dar-se-á, basicamente, pela produção, descrição e

análise de características de um corpus de referência5 sobre DP e sobre as CC . Esse corpus,

uma vez reunido e estudado, poderá ser compartilhado para outras finalidades de pesquisa e

deverá ser contrastado com outros de caráter diferenciado e distinto, como um corpus de

textos jornalísticos que tratem apenas sobre Futebol ou de textos de Literatura Brasileira do

século XXI. Esse corpus sobre a DP e os CC, basicamente, subsidiará a busca do objetivo a

que propusemos, de acordo com a nossa questão de pesquisa apresentada na Parte II.

Nesse sentido de nuclearidade de um corpus para estudo, seguiremos os princípios

teóricos e os métodos da Linguística de Corpus, tal como introduzida no Brasil por Berber

Sardinha em 2004 (BERBER SARDINHA, 2004), conjugados aos estudos de Terminologia

(KRIEGER, FINATTO, 2004; BARROS, 2004) de perspectiva descritiva subsidiados por

estudos Corpora na Terminologia (TAGNIN, BEVILACQUA, 2013). A parte terminológica

da pesquisa será, entretanto, ampla, pois integrará diferentes aspectos discursivos,

gramaticais, lexicais e aspectos da vulgarização e popularização de linguagens científicas.

Somando-se a essas orientações teórica, teremos também como suporte as pesquisas

relacionadas pré-existentes e os princípios da área do Processamento da Linguagem

Natural - PLN (conforme apresentado, por exemplo, em VIEIRA; STRUBE DE LIMA,

2001). Para trabalhos recentes sobre o tema da complexidade/simplificação com português,

boas fontes sobre classificação automática de textos são apontadas, por exemplo, por

CURTO, MAMEDE e BAPTISTA ( 2014).

Além disso, considerando os tipo de ferramentas computacionais já existentes no

Brasil para a tarefa de simplificação automática de textos, como temos em mente um trabalho

eminentemente prático de orientações para um guia didático de escrita de textos acessíveis,

aproveitaremos os indicativos e resultados de técnicas de simplificação e e categorização

(clusterização) de documentos por features gramaticais e lexicais. Ademais, imaginamos

poder oferecer esse Guia sob a forma de um recurso suplemntar à Cartilha, disponível online,

aproveitando a expertise em PLN na nossa colega de pesquisa, a Profa. Dra. Aline

Villavicencio do grupo de PLN da UFRGS.

5Seguindo-se a terminologia de Linguística de Corpus, este seria, na verdade, um corpus de estudo. Um corpus de referência é um corpus, pelo menos 5 vezes maior, que se toma para contrastes com o corpus reunido (dito corpus de estudo), e que não contenha o material do primeiro.

25

Embora possa parecer que propor e oferecer “apenas” mais um corpus do português

do Brasil, para abastecer um goldstandard de padrões de vocabulário e de estruturas

gramaticais de texto, ainda que estejamos a oferecer um descrição linguística acoplada a esse

corpus, seja uma tarefa simples, podemos assegurar que o empreendimento não é nada trivial.

Além disso, ainda carecemos, no âmbito da Linguística Aplicada, de ponderações sistemáticas

sobre o que seria um português simples ou facilitado, tanto pela dimensão lexical quanto pela

dimensão gramatical ou textual.

A esse propósito, naturalmente, vemos implicadas em nossas orientações teóricas e

metodológicas várias questões sobre Leitura e Letramento, visto que também prevemos

uma parte da investigação com testagens de propostas de escrita do texto sobre DP com

usuários-leitores do perfil em foco. É sobre esses pontos que tratamos a seguir, muito

brevemente, por questões de espaço.

III .2 – a) Leitura e Letramento

Dos anos 1980 em diante, vários modelos teóricos foram propostos a fim de

representar o ato da leitura como um processo interativo entre leitor e texto em um

determinado momento e em uma determinada circunstância. Alguns deles dão ênfase maior

ao texto, como, por exemplo, o modelo inicial de compreensão textual de Kintsch e Van Dijk

(1978), expandido posteriormente para incluir modelos situacionais de dimensões textuais

indexáveis mentalmente pelo leitor através de seu conhecimento de mundo (VAN DIJK e

KINTSCH, 1983). Outros, como, por exemplo, Anderson e Pearson (1984), McNamara et al.

(1996) e, mais recentemente, Best et al. (2005), propõem modelos de leitura como uma

atividade dinâmica entre leitor, texto e contexto sociocultural de leitura. Há também propostas

mais fluidas como a de Judith Davidson e Koppenhaver (1993), que sugere uma teoria de

leitura a partir das obras de Mikhail Bakthin.

No Brasil, conforme registramos em Finatto et al. (2015b), do legado de trabalhos

fundadores sobre Leitura, tais como o de Mário Perini, Antonio Neis (1982) e Ângela

Kleiman (vários anos e obras), Mary Kato (1982), além dos trabalhos pioneiros de Averbuck,

Appel e Silveira Hessel (1983), Leffa (1996) entre tantos outros, produzidos especialmente

nos anos 80 e 90, temos hoje um vasto e multifacetado alicerce de estudos sobre o tema da

Leitura e do Letramento. Esse corpo de conhecimentos possibilita-nos hoje distinguir

especificidades das noções de leitura, alfabetização, letramento, competência textual,

competência lexical (ou vocabular) e competência leitora. Isso sem mencionarmos os

26

inúmeros trabalhos sobre o tema da Leitura na área da Educação, Ensino de Língua

Portuguesa e de Línguas Estrangeiras ou de Psicolinguística.

III. 2 - b) Técnicas de simplificação textual e questões conexas

Já há bastante tempo, Mason e Kendall (1979), a partir de dois experimentos com 22

adultos e 60 crianças de 9 a 12 anos, relataram que dividir sentenças resultava em melhor

compreensão para leitores menos proficientes.

Conforme vemos hoje, o simples recurso a uma divisão de sentenças, como uma

técnica básica para facilitar a compreensão de leitura, é bastante reconhecido e reproduzido

em diferentes âmbitos. Outro técnica bastante reconhecida, alem do encurtamento de frases, é

a troca de uma dada palavra complexa por um sinônimo seu, em tese, mais simples, partindo-

se a troca de um dicionário de referência especialmente modelado. Esse dicionário, grosso

modo, é comparável a uma grande lista de palavras baseada em itens de maior frequência e

distribuição opostos tais itens a outros menos usuais, como se poderia verificar, por exemplo,

no par RESIDÊNCIA (complexo)=>CASA (simples).

Esse ponto é importante porque esses procedimentos e técnicas – com variações,

naturalmente – tornaram-se quase um “universal de simplificação textual” a que a maioria dos

pesquisadores (linguistas e informatas) tendeu a aderir. No entanto, é necessário cautela ao

universalizarem-se práticas de estudos realizados em contextos e em conjunturas gerais e

específicas. Por outro lado, somente a partir de revisões das pesquisas sobre leitura,

leiturabilidade e legibilidade da década de 1980, medidas matemáticas de

simplificação/complexidade – como o índice Flesch, passou-se a mencionar o letramento

como habilidade de leitura e escrita. Esse novo conceito tendeu a popularizar-se, entre

pesquisadores, na metade dos anos 1990 (PEARSON, 2009).

O que está implicado na adoção do termo letramento é a noção de leitura como uma

atividade intimamente associada com a escrita. Na França, sob influência da obra de Paulo

Freire, a palavra illetrisme foi adotada para referir-se à situação de falantes nativos do francês

que não adquiriram proficiência suficiente de leitura e escrita (JEANTHEAU, 2008). Há aqui

uma diferença clara entre “iletramento” e “analfabetismo”, sendo que analfabetismo refere-se

ao caso de pessoas que nunca aprenderam a decodificar nenhum código escrito.

No Brasil, também sob a influência da obra pedagógica de Paulo Freire, de cunho

profundamente sociológico, a abordagem ao letramento tem sido bastante conduzida,

especialmente no âmbito da Linguística Aplicada, e também já se menciona o letramento

27

científico (como, por exemplo em MOTTA-ROTH & GIERING, 2009). Ler, na visão de

Freire, é ler o mundo, decifrá-lo para além do código escrito. A capacidade de decodificação

garante apenas alfabetismo, mas não letramento. Decifrar o código escrito é consequência de

um movimento interpretativo interno do leitor, que é sujeito no mundo. Aprender a ler, para

Freire, é aprender a ser livre (ver, por exemplo, Freire, 2008; Freire e Macedo, 1990).

Assim, de um lado temos estudos centrados na capacidade humana de leitura e na

prospecção de competências de determinados grupos de leitores (especialmente de sujeitos

em processo de escolarização formal), de outro, há estudos centrados em características

textuais associadas a maiores ou menores competências de leitura. No entanto, em que pese o

muito que já foi pesquisado, ainda não temos meios totalmente confiáveis para estabelecer,

categoricamente, o quão complexo um texto ou tipo de texto é para um determinado perfil de

leitor de acordo com seu nível de proficiência de leitura em língua materna. Ainda assim,

contamos com estudos que nos apontam todo um quadro sobre a qualidade de compreensão

leitura do brasileiro e sobre quais textos seriam os mais lidos ou preferidos (como o que

vemos em AMORIM, 2011).

Tendo em mente esse quadro teórico diversificado, à guisa de uma delimitação de

fontes e de orientações, para a nossa etapa de testagem com leitores, que envolverá propostas

de formulação de textos sobre a DP, buscaremos amparo em trabalhos sobre testes ou

procedimentos para facilitar a compreensão de leitura, com destaque para o trabalho de

LIBERATO e FULGÊNCIO (1998 e 2007).

Assim, mesmo reconhecendo as importantes contribuições de estudos nacionais e

internacionais de Psicolinguística e Leitura ou de Ensino de Leitura e Escrita (como os

trabalhos de KLEIMAN ou de AMORIM antes citados, por exemplo), por uma questão

metodológica, imporemo-nos essa restrição aos trabalhos de LIBERATO e FULGÊNCIO. O

trabalho aqui proposto, portanto, não se configurará como uma investigação de

Leitura/Letramento, mas, sim, como um trabalho de Linguística de Corpus, impulsionado por

nossas experiências sobre o texto técnico-científico e complexidade textual em Terminologia.

Será um trabalho dedicado ao estudo/descrição estrutural de textos especializados sobre os

temas da Doença de Parkinson e dos Cuidados com a Criança em Pediatria que foram escritos

para leitores leigos.

Tendo em mente o objetivo de concretizar a nossa Cartilha on-line, avançaremos no

tema da Leitura limitados pelas referências das duas obras antes citadas. Além disso,

destacamos que já realizamos algumas experiência com testes de compreensão de leitura, com

28

trechos de diferentes tipos de textos (textos de jornal, bulas de remédios, etc.) com diferentes

tipos de leitores, apresentado o desenho básico nosso teste em Finatto et. al. (2015), um nosso

livro sobre Leitura, do qual pretendemos aproveitar alguns segmentos. Outro aspecto digno de

nota é a nossa parceria de uma pesquisa em andamento com os autores de um estudo sobre o

tema da compreeensão de palavras e complexidade de textos em francês (TODIRASCU et al.,

2013). Essa parceria dá-se pela tese em andamento de Bianca Pasqualini junto ao PPG-Letras-

UFRGS.

Parte IV – Procedimentos/Etapas/Indicadores/Cronograma

A parte de descrição linguística, dos textos dos corpora e a produção e/ou seleção dos

materiais textuais para testagem – com profissionais de Saúde e com o nosso público leitor -

em seus diferentes passos, terá o acompanhamento do nosso médico consultor e pesquisador

de terminologias de Medicina, Prof. Dr. Danilo Blank (FAMED, UFRGS), profissional que

tem nos assessorado já há alguns anos em diferentes pesquisas com a linguagem médica.

Partindo das testagens com uma amostra de potenciais usuários-leitores, com o perfil de

letramento antes citado, pretendemos oferecer uma metodologia para subsidiar a elaboração

ou reescrita de textos de divulgação sobre DP e sobre os CC para leigos.

Para tanto, conforme já referido, tomaremos como perfil de leigo a testar uma amostra

de leitores composta por adultos, com mais de 25 anos de idade, trabalhadores de menor

escolaridade, com Ensino Fundamental Completo e/ou Ensino Médio incompleto, pouco

hábito de leitura. Essas pessoas, previamente contactadas e selecionadas, conforme

planejamos, farão seus testes de compreensão de leitura dos nossos textos sobre DP e sobre

CC a partir da colocação dos materiais dos testes em um site na internet.

Importante: O desenho e a implementação do recurso on-line, isto é, da Cartilha, em

suas interfaces e bases de dados, será objeto de uma tarefa contínua, a partir da aprovação do

presente projeto de pesquisa, sob supervisão da coordenação e da pesquisadorea de PLN,

desde o momento que se tenha um amostra, ainda que pequena, dos textos dos corpora de DP

e de CC, visto que temos os modelos de partida antes citados (vide seção III.1 ) dos sistemas

Scipo e do SIMPLIFICA

Todo o material gerado pela pesquisa, em suas diferentes etapas, inclusive o corpus

reunido, será apresentado em eventos acadêmicos e divulgado em um website especialmente

29

construído, abrigado em servidor da UFRGS, à semelhança do que já temos feito do site do

Projeto TEXTECC (http://www.ufrgs.br/textecc/).

IV. 1) Procedimentos, etapas e INDICADORES

A compilação e análise de um acervo de textos sobre DP e sobre CC especialmente

escritos para leigos brasileiros e a consequente realização da nossa Cartilha on-line serão

realizados em termos dos seguintes procedimentos e etapas (também apresentados no

CRONOGRAMA):

1) Revisão da literatura científica médica e popularizada sobre a DP e sobre os CC disponível

em português. Seleção, reunião e tratamento linguístico e computacional de um corpus textual

específico sobre esses temas dirigido para leitores leigos brasileiros em Medicina/Ciências da

Saúde em dois temas.

Para o tema da DP, a ênfase será para textos publicados em sites e em blogs de:

i) profissionais de Saúde (médicos);

ii) associações civis de pacientes/portadores/cuidadores;

iv) instituições governamentais de Promoção de Saúde;

v) hospitais públicos e privados;

vi) pacientes/portadores;

vii) empresas de produção de informação em Saúde para leigos, desde que tenham

respaldo/assessoria de profissionais médicos devidamente identificados.

Para o tema dos CC em Pediatria, a ênfase será para:

a) textos de médicos para leigos disponíveis no site da SBP.

Indicadores desta tarefa/etapa: fichamento por escrito da literatura revisada, seleção inicial

de documentos para o corpus – composição de amostras por temas e por tipos de fontes.

2) Levantamento de características macroestruturais dos gêneros textuais/discursivos e de

tipos de textos envolvidos nos corpora de amostras reunido, por temas (DP ou CC), com base

na bibliografia disponível sobre acessibilidade e simplificação textual no âmbito dos Estudos

da Linguagem (especialmente FULGÊNCIO e LIBERATO, 1992 e 2007 e LIMA 2013) e do

Processamento da Linguagem Natural (PLN), especialmente com base nas pesquisas do

Projeto PorSimples do NILC-USP de São Carlos- SP (AMÂNCIO e ALUÍSIO 2012e 2011;

SCARTON e ALUÍSIO, 2010). Contraste com os resultados do Projeto PorPopular (Edital

Universal 14-2012, CNPq, Proc. 476556/2012-0), pesquisa que se dedicou ao estudo de

30

padrões lexicais e frasais de jornais populares destinados para leitores de menor escolaridade

(FINATTO, 2011; FINATTO, EVERS, PASQUALINI, 2013).

Indicadores desta tarefa/etapa: registro por escrito - para futura publicação - das

características dos textos da amostra coletada – contraponto com padrões de textos de jornais

populares do Projeto PorPopular e com textos sobre Pneumopatias Ocupacionais (PO).

Registro de características lexicais e frasais, ampliação e ajustes do universo de itens das

amostras de textos por temas e por tipos de fontes.

3) Levantamento estatístico, com apoio computacional, de características sintáticas

(aproveitando indicações gerais, por exemplo, do sistema computacional de BARLACCHI,

TONELLI, 2013 e de ALUISIO, 2010) e lexicais (com apoio, entre outros, do trabalho de

BEST, ROWE, OZURU, MCNAMARA, 2005) dos textos dos corpora sobre DP e sobre CC

reunido por tipos de fontes. Observação e registro de aspectos tais como:

- palavras e expressões multipalavra (construções, locuções, fraseologias) mais recorrentes

em diferentes segmentos do corpus

- padrões de frases (tipologias de períodos e número de palavras por frase)

- presença/ausência de paráfrases explicativas

- presença de encadeadores frasais e oracionais

- presença de terminologias

- número de palavras por texto e suas respectivas frequências brutas e ponderadas

- contraste do corpus de estudo – em DP e em CC - com padrões textos especializados,

especialmente artigos científicos.

Indicadores desta tarefa/etapa: registro por escrito - para futura publicação - das

características verificadas.

4) Levantamento, na bibliografia especializada sobre Psicolinguística e sobre Leitura, sobre as

características do processo de compreensão de leitura do público leigo em foco e sobre

estratégias de simplificação textual mais recomendadas para esse tipo de leitor;

Indicadores desta tarefa/etapa: fichamento e registro por escrito - para futura publicação -

das características e estratégias verificadas na bibliografia da área e das aplicáveis ao nosso

caso/proposta.

5) Levantamento, junto a profissionais de Saúde e junto a profissionais médicos associados à

nossa Faculdade de Medicina (FAMED-UFRGS), com apoio do médico Prof. Dr. Danilo

31

Blank, sobre as informações mais relevantes a serem oferecidas sobre a DP e sobre CC para

um público leigo;

Indicadores desta tarefa/etapa: registro por escrito - para futura publicação - das

impressões e orientações dos profissionais contactados sobre tipos de tópicos mais relevantes

a serem apresentados para leitores de baixa escolaridade.

6) Levantamento e avaliação de boas e de más práticas de redação de materiais de divulgação

para leigos de acordo com as bibliografias sobre o tema da facilitação de leitura e da

inteligibilidade e legibilidade textuais e também com apoio da experiência do Dr. Danilo

Blank – em cotejo com informações da etapa anterior;

Indicadores desta tarefa/etapa: registro por escrito - para futura publicação - das

avaliações, registro de um quadro de aspectos positivos e negativos.

7) Descrição de características lexicais, terminológicas e sintáticas (positivas e negativas) do

corpus reunido em português sobre DP e sobre CC em função das necessidades de

compreensão do perfil de leitor em foco. Levantamento e seleção de dados dos corpora e dos

testes para aproveitamento computacional na estrutura de interfaces da Cartilha on-line;

Indicadores desta tarefa/etapa: registro por escrito - para futura publicação - das

avaliações, registro de um quadro de aspectos positivos e negativos por temas tratados.

8) Geração de versões simplificadas/reecritas/melhoradas adequadas (em tese) para o público

leitor, partindo-se das características sistematizadas de textos problemáticos e de textos bem-

sucedidos presentes no corpus sobre DP e CC. Planejamento e implementação de um teste de

compreensão de leitura dos textos gerados;

Indicadores desta tarefa/etapa: registro por escrito - para futura publicação – dos textos-

modelo para futura testagem com leitores e profissionais de Saúde; formatação final do teste a

ser aplicado.

9) testagens de compreensão de leitura com uma amostra usuários com o perfil de leitor em

foco;

Indicadores desta tarefa/etapa: registro por escrito - para futura publicação – dos testes

aplicados e tabulação de resultados por temas e tipos de textos.

32

10) Elaboração de um quadro de orientações e de dados a serem incorporados à estrutura

computacional e às interfaces para o ususário da Cartilha on-line. Elaboração e testagem

inicial e implementação do desenho da Cartilha (parte 1 e parte 2);

Indicadores desta tarefa/etapa: registro por escrito - para futura implementação do desenho

computacional do site da pesquisa e do site da Cartilha e de suas interfaces. Implementação

inicial da estrutura computacional. Testes iniciais de usabilidade das estruturas

computacionais de apoio à escrita com profissionais de Saúde.

11) Submissão do desenho da Cartilha (versão rascunho) a críticas de profissionais médicos

indicados pelo Prof. Dr. Danilo Blank;

Indicadores desta tarefa/etapa: registro por escrito - para futura publicação – dos testes

aplicados e tabulação de resultados por tipos de redatores de textos para leigos, temas e tipos

de textos.

12) Disponibilização dos corpora e dos materiais da pesquisa e seus registros, incluindo

desenho da Cartilha, em site especialmente devolvido para registro da pesquisa, planejado

como uma extensão dos materiais do Projeto Textecc ( veja em: http://www.ufrgs.br/textecc/)

Indicadores desta tarefa/etapa: upolads parciais para o site da pesquisa, de materiais

gerados para compartilhamento à medida que forem sendo gerados. Publicação da versão beta

da Cartilha on-line.

IV.2 - Cronograma

Cronograma (36 meses)

Procedimentos Meses (um bimestre por coluna) ANO 1 1-2 3-4 5-6 7-8 9-10 11-12 1) X X X 2) X X X X X X 3) X X X X 4) X X X X 5) X X X 6) X X X 7) X X X X X 8) X X X 9) X X 10) X X X 11) X X 12) X X X X X

33

Elaboração e Submissão de artigo sobre a pesquisa

X X X X

Elaboração de relatório parcial

X X

Procedimentos Meses (um bimestre por coluna) ANO 2 1-2 3-4 5-6 7-8 9-10 11-12 1) X X 2) X X 3) X X X X 4) X X X 5) X X X X 6) X X X X 7) X X X X X X 8) X X X X 9) X X X 10) X X X 11) X X X 12) X X X X X X Elaboração e Submissão de artigo sobre a pesquisa

X X X X X

Elaboração de relatório parcial

X X X

Procedimentos Meses (um bimestre por coluna) ANO 3 1-2 3-4 5-6 7-8 9-10 11-12 1) X X 2) X X 3) X X X X 4) X X 5) X X X X 6) X X X X 7) X X X X X X 8) X X X 9) X X X 10) X X X X X X 11) X X X 12) X X X X X X Elaboração e X X X X X

34

Submissão de artigo sobre a pesquisa Elaboração de relatório final

X X X

PARTE V – Colaborações pré-existentes, impactos esperados, orçamento e referências

V.a) Colaborações ou parcerias já estabelecidas com outros centros de pesquisa na área

Esta proposta de pesquisa parte de todo um histórico de investigações, com apoio do

CNPq e de outros órgãos de fomento, e de publicações conjuntas sobre o tema do tratamento,

com apoio computacional, da linguagem e das terminologias médicas. Essas investigações (e

a produção bibliográfica associada, disponível no CV Lattes da proponente) foram produzidas

pela proponente/coordenadora desta proposta em parceria com os membros da equipe desta

pesquisa e de pesquisadores de outros centros nacionais e internacionais. Entre essas

iniciativas, destacamos as atuais PROJETOS DE PESQUISA em andamento:

1) Rich Text Analysis through Enhanced Tools based on Lexical Resources

Descrição: PROGRAMA CAPES STIC-AMSUD 2013 - The main goal of the project is to

create a framework to integrate the resources and capabilities of each group, to achieve an

enhanced approach to syntactico-semantic analysis of Spanish and Portuguese. Coordenação

no Brasil: Maria José B. Finatto e Helena Caseli (UFSCar) pesquisadora associada: Aline

Villavicencio (UFRGS). Tem a participação de núcleos de pesquisa e de investigadores

da França (dois laboratórios de PLN em Paris) e da America do Sul (um laboratório de

PLN no Uruguai e outro na Argentina). Vigência prorrogada até julho de 2015.

2) Pneumopatias Ocupacionais: padrões da linguagem médica para leigos e especialistas

Descrição: Projeto de pesquisa em Bolsa de Produtividade CNPq 2013-2016.

Estudo de padrões da linguagem médica em português no que tange ao emprego de

terminologias, de construções recorrentes e recursos de textualização. Com a participação,

como consultor, do Prof. Dar. Danilo Blank (FAMED-UFRGS).

3) Recuperação da informação em representação do conhecimento em bases de textos

científicos de Linguística e de Medicina: padrões e processamento automático da

linguagem

35

Descrição: Projeto de Pesquisa contemplado pelo PROGRAMA DOC-FIX, FAPERGS-

CAPES, em 2012, Edital 09/2012 - DOCFIX, para envolvimento e fixação de BOLSISTA

RECÉM-DOUTORADO. Pesquisa interdisciplinar. Integra dois grandes campos de

conhecimento, os Estudos da Linguagem e a Ciência da Computação. Nesses campos,

destaca, respectivamente, os Estudos sobre Textos Especializados/Terminologia e o

Processamento da Linguagem Natural (PLN)/Recuperação da Informação. O ponto de

chegada da investigação será a melhoria das técnicas de Recuperação de Informação e da

representação de conhecimento mediante o emprego de técnicas e de ferramentas PLN,

associadas a recursos e conhecimentos dos estudos linguísticos sobre Terminologia,

Linguística de Corpus, Linguística das Linguagens Especializadas e Tradução de textos

técnico-científicos. Vigência: até 30 de outubro de 2016.

Além desses PROJETOS, cabe destacar um background de parceria entre o Projeto

PorPopular (coordenado pela proponente) e o Projeto PorSimples (coordenado pela Profa.

Sandra Aluísio do NILC-USP) em torno da caracterização de um português popular escrito,

tal como realizado em textos de jornais populares consumidos por públicos de menor

letramento e pouco hábito de leitura, como são os jornais Diário Gaúcho e Massa! (de

Salvador-BA). Uma amostra dessa cooperação pode ser conferida, por exemplo, no seguinte

trabalho: FINATTO, M. J. B.; SCARTON, C. E. ; ROCHA, A. ; ALUISIO, S. M. .

Características do jornalismo popular: avaliação da inteligibilidade e auxílio à descrição do

gênero. In: VIII Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana,

2011, Cuiabá - MT. Anais do STIL 2011. Cuiabá: Sociedade Brasileira de Computação, 2011.

v. 01. p. 30-39.

V.b) Contribuições científicas e impactos da pesquisa

As principais contribuições desta pesquisa dirigem-se, justamente, para o público

leitor leigo em foco, o qual, em tese, poderá contar com melhores condições de acessibilidade

a textos sobre o tema da DP e dos CC. Em paralelo, pretende-se beneficiar, com o suporte

concreto de uma Cartilha on-line, aqueles profissionais de Saúde, redatores técnicos e

gestores de sites institucionais e privados sobre temáticas de Saúde que necessitam

comunicar-se, por escrito, na Internet, com público leigo brasileiro de menor letramento e

pouco hábito de leitura. O primeiro grupo beneficiado com o trabalho será justamente a

Sociedade Brasileira de Pediatria (SBP), dados os contatos prévios realizados pelo colega

Prof. Danilo Blank.

36

Adicionalmente, serão beneficiados também os pesquisadores de Linguística

Aplicada/ Linguística de Corpus, que poderão contar com um corpus especialmente reunido,

com descrições sobre ele, no âmbito da linguagem especializada produzida para leigos, e

também os pesquisadores de Informática/Processamento de Linguagem Natural (PLN), que

terão novos subsídios para o aperfeiçoamento de suas ferramentas de simplificação já

desenvolvidas ou em desenvolvimento.

V.c) Orçamento detalhado O orçamento desta pesquisa prevê, basicamente, os seguintes custos, ao longo de 36

meses de execução: Material Permanente => R$ 10.000,00*

- aquisição de um computador portátil com acessórios e com grande capacidade de armazenagem de dados e capacidade de rodagem de sistemas de processamento de textos – R$ 9.000,00

- compra de material bibliográfico - – R$ 1.000,00

Material de Custeio => R$ 40.000,00 - 05% compra de licença de softwares e de assinaturas de acesso a bases de dados úteis

para processamento de linguagem e de textos (Etiquetadores Automáticos de Palavras, assinatura do Sistema Sktech Engine com bancos de corpora textuais de diferentes perfis)

- 70% pagamento de serviços de terceiros para construção e atualização do site da pesquisa, com implementação computacional da Cartilha ao longo de pelo menos 30 meses

- 10% pagamento de serviços de terceiros para auxílio à construção, análise com computacional e manutenção do corpus

- 05% pagamento de serviços de terceiros para condução de testagens de textos com leitores leigos do perfil em foco

- 10% pagamento de despesas de diárias/passagens para participação em eventos acadêmicos Outras fontes de financiamento: Além desses recursos aqui solicitados, estima-se que o PPG-Letras-UFRGS possa proporcionar alguns auxílios e diárias para a participação de eventos. Assim, esses valores podem ser realocados no orçamento acima, especialmente paga pagamento de serviços de terceiros em Informática. A parte de infraestrutura (espaço físico) e de material básico para a pesquisa (material de escritório, copias) possa ser fornecida pelo Instituto de Letras da UFRGS. *Os valores para compra de material permanente estão superestimados em função da atual taxa conversão dólar (EUA) =>Real.

IV. d) Referências bibliográficas ALUISIO, S., SPECIA, L., GASPERIN, C., & SCARTON, C. (2010). Readability Assessment for Text Simplification. The 5th Workshop on Innovative Use of NLP for Building Educational Applications. Los Angeles.

37

ALUÍSIO, Sandra. (2010) Fostering Digital Inclusion and Accessibility: The PorSimples project for Simplification of Portuguese Texts. Proceedings of the NAACL HLT 2010 Young Investigators Workshop on Computational Approaches to Languages of the Americas, p. 46–53, Los Angeles: 2010.

AMANCIO, D. R.; ALUÍSIO, S. M.; OLIVEIRA JR., O. N.; COSTA, L. F. Complex networks analysis of language complexity. Europhysics Letters (Print), v. 100, p. 58002, 2012.

AMORIM, G. (2011). Retratos da leitura no Brasil. São Paulo: Instituto Pró-livro/ Imprensa Oficial do Estado de São Paulo.

ANDERSON, R.C., & PEARSON, P.D. (1984). A schema-theoretic view of basic processes in reading. In P.D. Pearson, R. Barr, M.L. Kamil, & P. Mosenthal (Eds.), Handbook of reading research. White Plains, NY: Longman. Em Handbook of Reading Research (pp. 255-291). New York: Lawrence Erlbaum Associates.

ARAUJO, Vera Maria Araujo Pigozzi. Comunicação documentária - parâmetros enunciativos e terminológicos. 2009. Tese (Doutorado em Estudos da Linguagem) - Programa de Pós-Graduação em Letras da UFRGS. Orientador: Maria Jose Bocorny Finatto.

AVERBUCK, L. M.; APPEL, M. B.; SILVEIRA, R. M. Hessel. Leitura: fatores que interferem na compreensão de textos no ensino de primeiro grau. Leitura: Teoria & Prática (Campinas), Campinas, v. 1, p. 26-39, 1983.

BARLACCHI, G.; TONELLI, S. (2013). ERNESTA: A Sentence Simplification Tool for Children's Stories in Italian. Proceedings of the 14th International Conference on Computational Linguistics and Intelligent Text Processing (CICLing). pp. 476-487.

BARROS, Lídia Almeida. Curso Básico de Terminologia. EdUSP, São Paulo, 2004.

BERBER SARDINHA, Tony. Linguística de Corpus. Manoele: Barueri-SP, 2004.

BEST, R., ROWE, M., OZURU , Y., & MCNAMARA, D. (2005). Deep-level comprehension of science texts: the role of the reader and the text. Topics in Language Disorders, 25, 65-83.

BEVILACQUA, Cleci. R. (2011) WebCorp: ferramentas e recursos para o tradutor. Revista TRANSLATIO, número 2, 2011. Disponível em: http://seer.ufrgs.br/translatio/article/view/36689

BIBER, Douglas. Dimensions of Register Variation – A Cross-Linguistic Comparison. Cambridge: Cambridge University Press, 1995. BIBER, Douglas. Variation across Speech and Writing. Cambridge: Cambridge University Press, 1988. BLANK, D.; FINATTO, M. J. B. ; GOLDNADEL, M. ; TIETBOEHL FILHO, C. N. Vocabulário Panlatino das Pneumopatias Ocupacionais. In: Tina Celestin; Xavier Darras, Denis Godbout. (Org.). Vocabulaire panlatin des pneumopathies professionnelles.1ed.Quebec: Office québécois de la langue française /Realiter, 2012, v. 01, p. 01-99.

CANDIDO JR., A., MAZIERO, E., GASPERIN, C., PARDO, T., SPECIA, L., & ALUISIO, S., 2009. Supporting the adaptation of texts for poor literacy readers: a text simplification editor for Brazilian Portuguese Proceeding EdAppsNLP '09 Proceedings of the Fourth Workshop on Innovative Use of NLP for Building Educational Applications, p. 34-42 Association for Computational Linguistics, Stroudsburg, PA, USA, 2009.

CANDIDO JR., A., MAZIERO, E., GASPERIN, C., PARDO, T., SPECIA, L., & ALUISIO, S. (2009). Supporting the Adaptation of Texts for Poor Literacy Readers: a Text Simplification Editor for Brazilian Portuguese. NAACL-HLT Workshop on Innovative Use of NLP for Building Educational Applications, (pp. 34-42).

CASELI, H.M.; PEREIRA, T.F.; ALUÍSIO, S.M. (2008). Editor de Anotação de Simplificação: Manual do Usuário. Série de Relatórios do NILC, NILC-TR-08-10, Julho, 17 p.

CIAPUSCIO, G. Textos especializados y terminologia. Barcelona: IULA, 2003.

CURTO, Pedro; MAMEDE, Nuno; BAPTISTA, Jorge. (2014). Automatic readability classifier for European Portuguese. INFORUM 2014 - Simpósio de Informática, FEUP Edições, pp. 309-324.

DAHAENE, S. (2009). Reading in the brain: the new science of how we read. New York: Viking.

DALE E; CHALL J. (1948). "A Formula for Predicting Readability". Educational Research Bulletin 27: 11-28.

DAVIDSON, Judith; KOPPENHAVER, David. Adolescent Literacy: What Works and why. Garland, 1993.

38

DAVISON, A., & GREEN, G. (1988). Linguistic complexity and text comprehension - readability issues reconsired. New Jersey: Lawrenc e Erlbaum Associates.

DUBAY, W. H. Smart Language: Readers, Readability And The Grading Of Text. California: Impact Information, 2007.

DUBAY, W. H. The Principles of Readability. Califórnia: Impact Information, 2004.

ECO, U. Quase a mesma coisa: experiências de tradução. Rio de Janeiro: Record, 2007

EVERS, Aline. Processamento de língua natural e níveis de proficiência do português: um estudo de produções textuais do exame Celpe-Bras. Dissertação (mestrado). Universidade Federal do Rio Grande do Sul, Programa de Pós-graduação em Letras, Porto Alegre, 2013.

FLESCH, Rudolf. The Art of Readable Writing. New York: Harper & Row, 1949.

FELTRIM, V. (2004). Uma abordagem baseada em córpus e em sistemas de crítica para a construção de ambientes Web de auxilio à escrita acadêmica em português. Tese de Doutorado, Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. FINATTO, M. B., EVERS, A., & PASQUALINI, B. (2013). Desenhos do vocabulário no Português popular escrito: pesquisa, ensino, produtos lexicográficos e terminológicos. Em C. A. MURAKAWA, & O. L. NADIN, Terminologia: uma ciência interdisciplinar (pp. 255-278). São Paulo: Cultura Acadêmica.

FINATTO, M. J. (2011). Complexidade textual em artigos científicos: contribuições para o estudo do texto científico em português. Organon (UFRGS), 50, pp. 30-45.

FINATTO, Maria José B. Termos, textos e textos com termos: novos enfoques dos estudos terminológicos de perspectiva linguística. In: ISQUERDO, A. N. ; KRIEGER, M. G. (Orgs.). As ciências do léxico: lexicologia, lexicografia, terminologia, volume II. Campo Grande: Ed. UFMS/ PPG-Letras UFRGS, v. 01, p. 353-363, 2004.

FINATTO, M. J. B. ; STEFANI, M. ; PASQUALINI, B. ; CIULLA, A. ; EVERS, A. ; SORTICA, M. (2015b). Leitura: um guia sobre teoria(s) e prática(s). 1. ed. Porto Alegre: Universidade Federal do Rio Grande do Sul, 2015. v. 01. 66p .

FINATTO, M. J. B.; LOPES, Lucelene; CIULLA, Alena. (2015a) Processamento de Linguagem Natural, Linguística de Corpus e Estudos Linguísticos: parcerias que já dão (muito) certo. Domínios de Lingu@Gem, v. 9, p. 41-59, 2015.

FINATTO, M., SCARTON, C., ROCHA, A., & ALUISIO, S. (2011). Características do jornalismo popular: avaliação da inteligibilidade e auxílio à descrição do gênero. Proceedings of the 8th Brazilian Symposium in Information and Human Language Technology, (pp. 49-58). Cuiabá.

FINATTO, M.J.B. EVERS, A.; PASQUALINI, B. (2013) Desenhos do vocabulário no Português popular escrito: pesquisa, ensino, produtos lexicográficos e terminológicos. In: Clotilde de Almeida Azevedo Murakawa; Odair Luiz Nadin. (Org.). Terminologia: uma ciência interdisciplinar. 1ed.São Paulo: Cultura Acadêmica, 2013, v. 1, p. 255-278.

FINATTO, Maria J. B. (2016, no prelo). Textos para leigos e especialistas em pneumopatias ocupacionais: trabalho com grandes e pequenas amostras textuais. A sair em As Ciências do Léxico, volume VIII, editora da UFMS, no prelo.

FREIRE, P. (2008). A importância do ato de ler: em três artigos que se completam. São Paulo: Cortez.

FREIRE, P., & MACEDO, D. P. (1990). Alfabetização: leitura do mundo, leitura da palavra. São Paulo: Paz e Terra.

GALDIANO, Isabela. Proposta de um dicionário da cardiopatia congênita.Dissertação (mestrado). Universidade Estadual Paulista Júlio de Mesquita Filho, Programa de Pós-graduação em EstudosLinguísticos, são José do Rio Preto, 2016. (no prelo)

GRAESSER, A. C., GERNSBACHER, M. A., & GOLDMAN, S. R. (1997). Cognition. Em T. A. Van DIJK, Discourse studies: A multidisciplinary introduction. Vol 1: Discourse as structure and process (pp. 292-319). London: Sage.

GRAESSER, A., JEON, M., ZHIQIANG, C., & McNAMARA, D. (2001). AUTOMATIC ANALYSES OF LANGUAGE, DISCOURSE, AND SITUATION MODELS. Memphis: http://cohmetrix.memphis.edu/CohMetrixWeb2/HelpFile2.htm#CONCSpi.

39

GRAESSER, A., McNAMARA, D., CAI, Z., & LOUWERSE, M. (2004). Coh-Metrix: Analysis of text on cohesion and language. Behavioral Research Methods, 193-202.

INAF/ Instituto Paulo Montenegro. (2011). Indicador de Alfabetismo Funcional (Inaf) - Principais Resultados. Instituto Paulo Montenegro.

JEANTHEAU, J.-P. (2008). Assessing Low Levels of Literacy: the Case of France. Em UNESCO, Literacy and the promotion of citizenship: discourses and effective practices. Hamburgo-Alemanha: UNESCO Institute for Lifelong Learning.

KATO, Mary. O aprendizado de leitura. São Paulo: Martins Fontes, 1995.

KLEIMAN, Angela. Leitura: ensino e pesquisa. Campinas: Pontes, 1987.

—. Oficina de leitura: teoria e prática. Campinas: Pontos, 1997.

—. Os significados do letramento. Campinas: Mercado das Letras, 1995.

KITSCH, W., & VAN DIJK, T. (1978). Toward a model of text comprehension and production. Psychological Review, 85(5), 363-394.

KRIEGER, Maria da Graça; FINATTO, M.J.B. Introdução à terminologia: Teoria e Prática. Contexto: São Paulo 2004.

KRIEGER, Maria da G. Porque Lexicografia e Terminologia: relações textuais? In: Anais do CELSUL 2008, p1-8. http://www.celsul.org.br/Encontros/08/lexicografia_e_terminologia.pdf

LEFFA, Vilson J. “Fatores da compreensão na leitura.” Cadernos do IL 15, n. 15 (1996): 143-159.

LIBERATO, Y. (Org.); FULGÊNCIO, Lúcia (Org.) É possível facilitar a leitura - um guia para escrever claro. São Paulo: Contexto, 2007. 175p .

LIBERATO, Y. G. FULGÊNCIO, Lúcia. Como facilitar a leitura. São Paulo: Editora Contexto, 1992. v. 1. 99p

LIMA, Kelen Cristina Sant’Anna de. Caracterização de registros orientada para a produção textual no ambiente multilíngue: um estudo baseado em corpora comparáveis. Doutorado, Tese, UFMG, 2013.

LOPES, L.; FERNANDES, P.; VIEIRA, R. Estimating term domain relevance through term frequency, disjoint corpora frequency - tf-dcf. Knowledge-based Systems (JCR Impact Factor 2.947), January 2016

MASON, J.M; KENDAL, J.R. (1979) Facilitating reading comprehension through text manipulation. The Alberta Journal of Eduactional Research. 25, p.68-76

MOTTA-ROTH, D. Letramento científico: sentidos e valores. Notas de Pesquisa, Santa Maria, RS, v. 1, n. 0, p. 12-25, 2011, p. 12-25.

MOTTA-ROTH, D. (2009). A popularização da ciência como prática social e discursiva. In: MOTTA-ROTH, D.; GIERING, M. E. (Org.). Discursos de popularização da ciência (Anais do Encontro do Núcleo de Estudos Avançados “Linguagem Cultura e Sociedade” - GT Labler), 2009. Santa Maria: LABLER-PPGL/UFSM. Disponível em http://w3.ufsm.br/hipersaberes/volumeI/.

MOTTA-ROTH, D.; GIERING, M. E. (Org.). Discursos de popularização da ciência (Anais do Encontro do Núcleo de Estudos Avançados “Linguagem Cultura e Sociedade” - GT Labler), 2009. Santa Maria: LABLER-PPGL/UFSM. Disponível em http://w3.ufsm.br/hipersaberes/volumeI/

NEIS, Ignacio Antonio. “A competência de leitura.” Letras de Hoje, 1982: p.43-57

PASQUALINI, B. F. (2012). Leitura, tradução e medidas de complexidade textual em contos da literatura para leitores com letramento básico. Dissertação (mestrado). Universidade Federal do Rio Grande do Sul, Programa de Pós-graduação em Letras, Porto Alegre.

PASQUALINI, B. F., EVERS, A., & FINATTO, M. B. (2010). Medidas de complexidade textual entre traduções brasileiras e originais de literatura inglesa: um estudo-piloto baseado em corpus. Porto Alegre: IX Encontro de Linguística de Corpus e IV Escola Brasileira de Computação.

PASQUALINI, B. F., SCARTON, C., & FINATTO, M. B. (2010). Comparando Avaliações de Inteligibilidade Textual entre Originais e Traduções de Textos Literários. Anais do 8th Brazilian Symposium in Information and Human Language Technology, 30-39.

40

PEARSON, D. P. (2009). The roots of reading comprehension instruction. Em S. E. Israel, & G. G. Duffy, Handbook of Research on Reading Comprehension. New York: Routledge.

PEARSON, Jennifer. Terms in context. Amsterdam, Philadelphia: John Benjamins, 1998.

RIBEIRO, Vera M.; FONSECA, Maria da C. “Matriz de referência para a medição do alfabetismo nos domínios do letramento e do numeramento.” Est. Aval. Educ. 21, n. 45 (jan./abril 2010): 147-168 http://www.fcc.org.br/pesquisa/publicacoes/eae/arquivos/1560/1560.pdf

RODRIGUES, E. D., FREITAS, C., & QUENTAL, V. (2013). Análise de inteligibilidade textual por meio de ferramentas de processamento automático do português: avaliação da Coleção Literatura para Todos. Letras de Hoje, 91-98.

SANTIAGO, Marcio Sales. Rede de palavras-chave para artigos de divulgação científica da Medicina: uma proposta à luz da Terminologia. Dissertação (Mestrado em Linguística Aplicada). Universidade do Vale do Rio dos Sinos, 2007.

SAGGION, H., GÓMEZ-MARTINEZ, E., ETAYO, E., ANULA, A., BOURG, L. (2011). Text Simplification in Simplext: Making Text More Accessible. Revista de la Sociedad Española para el Procesamiento del Lenguaje Natural, n. 47, pp. 341–342.

SCARTON, C. E. ; ALUÍSIO, S. M. Análise da Inteligibilidade de textos via ferramentas de Processamento de Língua Natural: adaptando as métricas do Coh-Metrix para o Português. Linguamática (Braga), v. 2, p. 45-62, 2010.

SCARTON, C., ALMEIDA, D. M., & ALUISIO, S. (2009). Coh-Metrix-Port. Acesso em agosto de 2010, disponível em PorSimples: http://caravelas.icmc.usp.br:3000/

SILVA, R. S. Diagramação: O Planejamento Visual Gráfico na Comunicação Impressa. São Paulo: Summus Editorial, 1985.

SOUSA, L. B. ; HUBNER, Lilian Cristine . Desafios na avaliação da compreensão leitora: demanda cognitiva e leiturabilidade textual. Neuropsicologia Latinoamericana, v. 7, p. 34-46, 2015.

SPECIA, L. (2010). Translating from Complex to Simplified Sentences. PROPOR. Porto Alegre.

TAGNIN, Stella O.; BEVILACQUA, Cleci R. (Orgs.) (2013). Corpora na Terminologia. São Paulo, HUB Editorial, 2013.

TODIRASCU, A., François, T., GALA, N., FAIRON, C., LIGOZAT, A.-L., BERNHARD, D. (2013) Coherence and Cohesion for the Assessment of Text Readability. International Workshop on Natural Language Processing and Cognitive Science (pdf). Marseille, octobre 2013.

TORRES, Lianet Sepúlveda. Escrita científica em português por hispano falantes: recursos linguísticos-computacionais baseados em métodos de alinhamento de textos paralelos. (Doutorado - Programa de Pós-Graduação em Ciências de Computação e Matemática Computacional) -- Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, 2015.

VAN DIJK, T. A. (1997). Discourse as structure and process. London: Sage.

VAN DIJK, T. A. (2008). Discourse and Context. A sociocognitive approach. Cambridge: Cambridge University Press.

VAN DIJK, T., & Kintsch, W. (1983). Strategies of discourse comprehension. New York: Academic Press.

VIEIRA, Renata ; STRUBE DE LIMA, V. L. Linguística Computacional: princípios e aplicações. In: Ana Teresa Martins; Díbio leandro Borges. (Org.). SBC - Jornadas de Atualização em Inteligência Artificial (JAIA). Fortaleza - CE: , 2001, v. 3, p. 47-86.

WATANABE, W. M., Junior, A. C., UZÊDA, V. R., FORTES, R. P. d. M; PARDO, T. A. S., & ALUÍSIO, S. M. (2009). Facilita: Reading assistance for low-literacy readers. Proceedings of the 27th ACM international conference on Design of communication.

41

PARTE 2 – PLANO DE BOLSISTAS

PLANO DE ATIVIDADES PARA OS BOLSISTAS DE IC e AT-NS Como bolsistas, imaginamos poder contar com 02 pessoas:

(1) um aluno de graduação em Letras da UFRGS cm conhecimentos básicos sobre Linguística de Corpus;

(2) um graduado ou técnico em Ciência da Computação, com experiência em desenvolimento de ferramentas de PLN com bases de dados e corpora.

As tarefas desses bolsistas envolverão APOIO às seguintes atividades. Para o bolsista de IC, estão previstas atividades de apresentações de trabalho em eventos.

1) Familiarizacão com a literatura científica médica sobre a DP e sobre os CC disponível em

português e auxílio à reunião e tratamento linguístico e computacional de um corpus textual

específico sobre esses temas dirigido para leitores leigos brasileiros. Levantamento inicial de

textos candidatos a aproveitamento para o corpus. Familiarização com técnicas de estatística

lexical.

2) Auxílio ao levantamento de características macroestruturais dos gêneros

textuais/discursivos e de tipos de textos envolvidos no corpus pré-selecionado reunido, por

temas (DP ou CC), com base na bibliografia disponível sobre acessibilidade e simplificação

textual no âmbito dos Estudos da Linguagem (especialmente FULGÊNCIO e LIBERATO,

1992 e 2007 e LIMA 2013) e do Processamento da Linguagem Natural (PLN), especialmente

com base nas pesquisas do Projeto PorSimples do NILC-USP de São Carlos- SP (AMÂNCIO

e ALUÍSIO 2012e 2011; SCARTON e ALUÍSIO, 2010), aproveitando também os resultados

do Projeto PorPopular (Edital Universal 14-2012, CNPq, Proc. 476556/2012-0), pesquisa que

se dedica ao estudo de padrões lexicais e frasais de jornais populares destinados para leitores

de menor escolaridade (FINATTO, 2011; FINATTO, EVERS, PASQUALINI, 2013).

3) Auxílio ao levantamento estatístico, com apoio computacional, de características sintáticas

(aproveitando indicações gerais, por exemplo, do sistema computacional de BARLACCHI,

TONELLI, 2013 e de ALUISIO, 2010) e lexicais (com apoio, entre outros, do trabalho de

BEST, ROWE, OZURU, MCNAMARA, 2005) dos textos do corpus sobre DP e sobre os

CC reunido por tipos de fontes. Essas características incluem a observação de aspectos tais

como:

42

- palavras e expressões multipalavra (construções, locuções, fraseologias) mais recorrentes

em diferentes segmentos do corpus

- padrões de frases (tipologias de períodos e número de palavras por frase)

- presença/ausência de paráfrases explicativas

- presença de encadeadores frasais e oracionais

- presença de terminologias

- número de palavras por texto e suas respectivas frequências brutas e ponderadas

- contraste do corpus de estudo com padrões textos especializados, especialmente artigos

científicos;

4) Levantamento, na bibliografia especializada, sobre as características de compreensão de

leitura do público leigo em foco e sobre estratégias de simplificação textual mais

recomendadas.

5) Auxílio ao levantamento, junto a profissionais de Saúde e junto a profissionais médicos

associados à nossa Faculdade de Medicina (FAMED-UFRGS), com apoio do médico Prof.

Dr. Danilo Blank, sobre um quadro de informações mais relevantes a serem oferecidas sobre a

DP e sobre CC para o público leigo.

6) Levantamento e auxílio à elaboração de um quadro descritivo de boas e de más práticas de

redação desses materiais de acordo com as bibliografias sobre o tema da facilitação de leitura

e da inteligibilidade e legibilidade textuais e também com apoio da experiência do Dr. Danilo

Blank.

7) Auxílio à descrição de características lexicais, terminológicas e sintáticas (positivas e

negativas) do material reunido em português sobre CC e DP em função das necessidades de

compreensão do perfil de leitor em foco.

8) Auxílio à geração de versões simplificadas/reecritas/melhoradas em tese adequadas para o

público leitor, partindo-se das características sistematizadas de textos problemáticos e de

textos bem-sucedidos presentes no corpus.

9) Auxílio às testagens de compreensão de leitura com uma amostra usuários com o perfil de

leitor em foco.

43

10) Auxílio à elaboração e testagem inicial e implementação do desenho da Cartilha on-line;

11) Auxílio à submissão do desenho da Cartilha a críticas de profissionais médicos indicados

pelo Prof. Dr. Danilo Blank.

12) Auxílio à disponibilização dos corpora e dos materiais da pesquisa e seus registros,

incluindo desenho da Cartilha on-line, em site especialmente devolvido para registro da

pesquisa, planejado como uma extensão dos materiais do Projeto Textecc (em:

http://www.ufrgs.br/textecc/)

13) Auxílio à elaboração de trabalhos para apresentações em eventos e elaboração de

relatórios anuais e relatório final do andamento da pesquisa.

CRONOGRAMA – IC= Iniciação científica + AT = Apoio Técnico

Procedimentos Meses (um bimestre por coluna) ANO 1 BOLSISTAS 1-2 3-4 5-6 7-8 9-10 11-12 1) X X 2) X X 3) X X X X 4) X X 5) X X X X 6) X X X X 7) X X X X 8) X X X 9) X X X 10) X X X X X X 11) X X X 12) X X X X X X 13) X X X X X Elaboração de relatório anual

X X X

Procedimentos Meses (um bimestre por coluna) ANO 2 1-2 3-4 5-6 7-8 9-10 11-12 1) X X 2) X X 3) X X X X 4) X X 5) X X X X

44

6) X X X X 7) X X X X 8) X X X X X X 9) X X X 10) X X X X X X 11) X X X 12) X X X X X X 13) X X X X X Elaboração de relatório anual

X X X

Procedimentos Meses (um bimestre por coluna) ANO 3 1-2 3-4 5-6 7-8 9-10 11-12 1) X X 2) X X 3) X X X X 4) X X 5) X X X X 6) X X X X 7) X X X X 8) X X 9) X X X X 10) X X X X X X 11) X X X X X X 12) X X X X X X 13) X X X X X Elaboração de relatório final

X X X X