Processos de reconhecimento de palavras na leitura - LARPSIlivraria1.tempsite.ws/config/imagens_conteudo/pdf/cap_01.pdf · A pronúncia de uma palavra apresentada visualmente envolve

PARTE IProcessos de reconhecimento de palavras na leitura

Snowling_01.indd 19Snowling_01.indd 19 05/12/12 10:5505/12/12 10:55


Introdução

O reconhecimento de palavras é a base da leitura; todos os outros processos depen-dem dele. Se os processos de reconhecimento de palavras não funcionarem de forma fluente e eficiente, a leitura será, na melhor hipótese, altamente ineficiente. O estudo dos processos de reconhecimento de palavras é uma das mais antigas áreas de pesqui-sa em psicologia experimental (Cattell, 1886). Os capítulos desta seção apresentam uma visão geral das atuais teorias, métodos e resultados do estudo dos processos de reconhecimento de palavras na leitura.

O que queremos dizer aqui com a palavra reconhecimento? O reconhecimento envolve ter acesso às informações armazenadas na memória. No caso do reconhe-cimento visual de palavras, isso geralmente envolve recuperar informações sobre a forma falada e o significado da palavra a partir da sua forma escrita. Os dois pri-meiros capítulos, de Coltheart e Plaut, apresentam os dois arcabouços teóricos mais influentes para estudos do reconhecimento visual de palavras.

Coltheart apresenta a história e a evolução dos modelos de dupla rota da leitura em voz alta (i.e., como é gerada a pronúncia de uma palavra impressa). Esses modelos postulam que existem duas rotas da palavra impressa à fala: uma rota lexical e uma rota não lexical. De forma ampla, a rota lexical envolve analisar a pronúncia de uma palavra armazenada em um léxico ou dicionário mental. Em contrapartida, a rota não lexical envolve traduzir os grafemas (letras ou grupos de letras) em fonemas e gerar a pronúncia da palavra a partir dessa sequência de fonemas. Esse processo deve funcio-nar tão bem para não palavras quanto para palavras, desde que a palavra siga o padrão ortográfico da língua (uma leitura não lexical de YACHT* não produzirá a pronúncia para um tipo de barco a vela). Essa ideia é incorporada em um modelo computacional explícito (o modelo DRC) que Coltheart descreve em detalhe. É importante enfatizar que esse modelo altamente influente é um modelo de como os adultos leem em voz

* N. de R.T.: Transcrição fonética: [jɑt]. Um exemplo para o português é a palavra TÁXI, que se for lida pela rota não lexical [1ta�i] não produzirá a pronúncia para meio de transporte.


22 MARGARET J. SNOWLING & CHARLES HULME (ORGS.)

alta; ele não está interessado em como se adquire o conhecimento que permite que isso ocorra. Um foco importante do modelo é como podemos explicar diferentes transtornos da leitura em voz alta que ocorrem após lesões cerebrais em adultos.

Plaut faz uma síntese de uma classe diferente de modelos da leitura em voz alta que empregam arquiteturas conexionistas (modelos que aprendem a pronunciar pa-lavras por meio do treinamento de associações entre representações distribuídas da ortografia e fonologia). Um modelo particularmente influente desse tipo é o chama-do modelo triangular (Plaut, McClelland, Seidenberg e Patterson, 1996; Seidenberg e McClelland, 1989). Esse modelo abandona a distinção entre um procedimento le-xical e um procedimento não lexical para traduzir palavras impressas em pronúncias. Em vez disso, o mesmo mecanismo é usado para converter palavras e não palavras em pronúncias com base em padrões de conexões entre estímulos ortográficos e produ-tos fonológicos. Outra diferença crítica entre o modelo triangular e o modelo DRC é que o modelo triangular incorpora explicitamente um procedimento de aprendi-zagem e, assim, pode ser considerado um modelo para leitura e desenvolvimento da leitura em adultos. Está claro que essas são concepções muito diferentes de como a mente lê palavras individuais. As duas abordagens lidam com uma grande variedade de evidências. Talvez o modelo DRC seja o mais bem-sucedido para lidar com a forma detalhada de comprometimentos da leitura observada após lesões cerebrais em adultos, ao passo que a capacidade de pensar sobre o desenvolvimento e o desempe-nho de adultos conjuntamente no modelo triangular é um atrativo considerável. Não existe dúvida de que as diferenças entre esses modelos serão fonte de intenso interesse nos próximos anos.

O capítulo de Lupker faz uma revisão de um enorme corpus de pesquisas ex-perimentais sobre como os adultos reconhecem palavras escritas. Muitos desses ex-perimentos investigam um processo notavelmente rápido e preciso na maioria dos adultos, mensurando o tempo de reação ou comprometendo o desempenho com o uso de mascaramento (impedir que os sujeitos vejam uma palavra de forma clara pela sobreposição de outro estímulo imediatamente após a apresentação da palavra). Qualquer modelo completo do reconhecimento de palavras, em última análise, terá que explicar muitos fenômenos desses experimentos, inclusive o fato de que as pes-soas percebem as letras com mais eficiência quando estão inseridas em palavras, que as palavras de alta frequência (i.e., mais familiares) são reconhecidas com mais facili-dade do que palavras menos familiares e que o reconhecimento de palavras é influen-ciado pelas palavras apresentadas anteriormente (ver antes uma palavra relacionada em forma ou significado nos ajuda a reconhecer a palavra que a segue). Uma forte conclusão advinda da revisão de Lupker é a necessidade de modelos interativos em que a ativação de informações ortográficas e a ativação de informações fonológicas se influenciem reciprocamente. Essa questão é abordada em detalhe por Van Orden e Kloos, que apresentam uma variedade de evidências que convergem para a ideia de que existe uma interação íntima e perpétua entre as representações da ortografia e da fonologia (letras e sons) durante o processo de reconhecer uma palavra impressa.

Avançando do reconhecimento de palavras isoladas, Rayner, Juhasz e Pollatsek discutem os movimentos oculares na leitura. Os movimentos dos olhos propiciam uma visão fascinante de como os processos de reconhecimento de palavras atuam


A CIÊNCIA DA LEITURA 23

no contexto mais natural da leitura, dos textos. Parece que o padrão de movimentos oculares na leitura é altamente influenciado pelos processos cognitivos que auxiliam o reconhecimento de palavras e a compreensão textual. A maioria das palavras do texto é fixada diretamente (geralmente em algum ponto da primeira metade da pa-lavra). Para leitores de inglês, a área do texto processado durante uma fixação (a dis-tância perceptiva) é de aproximadamente três ou quatro letras à esquerda da fixação e por volta de 14 a 15 letras à direita. Esse limite parece ser um limite básico, deter-minado por limitações de acuidade, e o indivíduo somente extrai informações úteis sobre a identidade das letras de uma área menor, talvez sete ou oito letras à direita do ponto de fixação. Parece que apenas palavras curtas, frequentes ou muito previsíveis são identificadas antes de serem fixadas (de modo que podem ser omitidas). Todavia, informações parciais (sobre a ortografia e fonologia da palavra, mas geralmente não sobre o seu significado) sobre a palavra após o ponto de fixação costumam ser extraí-das e combinadas com informações extraídas subsequentemente quando a palavra é fixada diretamente. Esses estudos condizem com a visão de que a velocidade e a efi-ciência dos processos de reconhecimento de palavras (bem como processos superiores baseados no texto) impõem limitações cruciais sobre a velocidade com a qual mesmo leitores hábeis leem o texto.

Talvez a questão central no estudo do reconhecimento de palavras na leitura seja o papel da fonologia. Todos os capítulos da Parte I abordam essa questão explicita-mente. Parece que existe um consenso: a codificação fonológica é central ao reconhe-cimento de palavras, embora existam posições divididas sobre muitos detalhes do acesso à fonologia e sua possível importância em proporcionar acesso a informações semânticas.


Modelando a leitura: a abordagem da dupla rotaMax Coltheart

1

Ler é processar informações: transformar es-crita em fala, ou escrita em significado. Qual-quer pessoa que tenha aprendido a ler terá ad-quirido um sistema mental de processamento de informações capaz de realizar essas trans-formações. Se quisermos compreender o pro-cesso de leitura, devemos entender a natureza desse sistema. Quais são seus componentes individuais para o processamento de informa-ções? Quais são as vias de comunicação entre esses componentes?

A maioria das pesquisas sobre a leitura realizadas desde 1970 tem investigado o pro-cesso de leitura em voz alta e, assim, busca aprender a respeito das partes do sistema de leitura que estão particularmente envolvidas em transformar a escrita em fala. Existe um amplo consenso teórico: independentemen-te de as teorias serem conexionistas (p. ex., Seidenberg e McClelland, 1989; Plaut, neste livro) ou não conexionistas (p.ex., Coltheart, Curtis, Atkins e Haller, 1993), concorda-se que, dentro do sistema de leitura, existem dois procedimentos diferentes que realizam essa transformação – existem duas rotas da palavra impressa à fala. (A distinção entre teorias conexionistas e não conexionistas será discutida mais adiante neste capítulo.)

No princípio…

A concepção da leitura segundo a dupla rota foi enunciada inicialmente por De Saussure (1922, p. 34):

[...] também existe a questão da leitura. Le-mos de duas maneiras; a palavra nova ou des-conhecida é decomposta letra por letra, mas uma palavra comum ou familiar é vista em um único vislumbre, sem preocupação com as letras individuais: sua forma visual funciona como um ideograma.

Todavia, foi só na década de 1970 que essa concepção alcançou a sua aceitação atual. Uma expressão clara e explícita da ideia da dupla rota foi proposta por Forster e Cham-bers (1973):

A pronúncia de uma palavra apresentada visualmente envolve designar algum tipo de codificação acústica ou articulatória à sequência de letras em questão. Presume-se que existam duas maneiras alternativas em que se pode designar tal codificação. Primei-ramente, a pronúncia pode ser calculada pela aplicação de um conjunto de regras grafê-micas e fonêmicas, ou regras de correspon-



dência entre letras e sons. Essa codificação pode ser realizada independentemente de qualquer consideração sobre o significado ou a familiaridade da sequência de letras, como na pronúncia de sequências que nunca foram encontradas antes, como flitch, mantiness e streep*. De maneira alternativa, a pronúncia pode ser determinada pesquisando a memó-ria de longa duração em busca de informa-ções armazenadas sobre como pronunciar sequências familiares de letras ou obtendo as informações necessárias com uma olhada direta no dicionário, em vez da aplicação de regras. Obviamente, esse procedimento so-mente funcionaria para palavras familiares. (Forster e Chambers, 1973, p. 627)

Os sujeitos sempre começam a calcular pronúncias a partir do zero, ao mesmo tempo em que começam a busca lexical. O processo que for concluído primeiro controla o produ-to gerado. (Forster e Chambers, 1973, p. 632)

No mesmo ano, Marshall e Newcombe (1973) propuseram uma ideia semelhante com um fluxograma. O texto do seu artigo indica que uma das rotas nesse modelo con-siste em ler “seguindo as supostas regras de correspondência entre grafemas e fonemas” (Marshall e Newcombe, 1973, p. 191). Como a outra rota do modelo que propuseram en-volve ler segundo a semântica e, assim, so-mente está disponível para palavras familiares, sua concepção parecer ser exatamente igual à de Forster e Chambers (1973).

Essa ideia se disseminou rapidamente:

Podemos […] distinguir entre um mecanis-mo ortográfico, que faz uso de relações gerais e produtivas entre padrões existentes de letras e sons, e um mecanismo lexical, que se baseia no conhecimento específico de pronúncias de determinadas palavras ou morfemas, ou seja, um léxico de pronúncias (ou também de sig-nificados). (Baron e Strawson, 1976, p. 386)

Parece que os dois mecanismos que suge-rimos, os mecanismos ortográficos e lexicais,

* N. de R.T.: Pseudopalavras.

são usados para pronunciar palavras impres-sas. (Baron e Strawson, 1976, p. 391)

A nomeação pode ser feita por tradução ortográfico-fonêmica ou por referência ao léxi-co interno. (Frederiksen e Kroll, 1976, p. 378)

Nessas primeiras explicações sobre a ideia da dupla rota, geralmente se estabelecia um contraste entre palavras (que podem ser lidas pela rota lexical) e não palavras (que não po-dem, de modo que necessitam da rota não le-xical). Baron e Strawson (1976) foram os pri-meiros a enxergar que, dentro do contexto de modelos de dupla rota, esse não é exatamente o contraste a fazer (pelo menos para o inglês):

A principal ideia por trás do Experimento 1 era comparar o tempo necessário para ler três tipos diferentes de estímulos: (a) palavras re-gulares, que seguem as “regras” da ortografia inglesa, (b) palavras de exceção, que violam essas regras, e (c) palavras sem sentido, que somente podem ser pronunciadas confor-me as regras, pois não são palavras. (Baron e Strawson, 1976, p. 387)

Baron (1977) foi o primeiro a expressar essas ideias em um fluxograma totalmente ex-plícito para modelar a leitura, que é mostrado na Figura 1.1. Esse modelo tem característi-cas notavelmente modernas: por exemplo, ele tem uma rota lexical não semântica para a lei-tura em voz alta (uma rota que somente está disponível para palavras, mas que não ocorre por meio do sistema semântico) e considera a possibilidade de uma rota da ortografia à semântica usando partes de palavras (Baron tinha em mente prefixos e sufixos), além de uma que use palavras inteiras.

De maneira ainda mais importante, o diagrama da Figura 1.1 envolve dois usos diferentes da concepção da dupla rota. To-dos os trabalhos citados anteriormente neste capítulo dizem respeito a uma explicação de dupla rota para a leitura em voz alta; todavia, o modelo de Baron também propunha uma



explicação de dupla rota para a compreensão da leitura:

[...] podemos passar diretamente da escrita para o significado – como quando usamos imagens ou mapas e possivelmente quando lemos uma frase como I saw the son – ou in-diretamente, pelo som, como quando lemos pela primeira vez uma palavra que somente tínhamos ouvido. (Baron, 1977, p. 176)

Existem duas estratégias disponíveis para leitores de inglês identificarem uma palavra escrita. A estratégia fonêmica envolve primeiro traduzir a palavra para uma representação fo-nêmica completa (auditiva e/ou articulatória), e depois usar essa representação para recuperar o significado da palavra. Esse segundo passo baseia-se no mesmo conhecimento usado para identificar palavras na língua falada. Essa estra-tégia deve ser usada quando encontramos pela primeira vez uma palavra que ouvimos mas não vimos. A estratégia visual envolve usar a própria informação visual (ou, possivelmente, algum derivativo dela que não seja formalmente equi-valente à pronúncia explícita) para recuperar o

significado. Ela deve ser usada para distinguir homófonos quando o contexto for insuficien-te, por exemplo, na sentença Give me a pair (pear).* (Baron e McKillop, 1975, p. 91)

A teoria da dupla rota da leitura em voz alta e a teoria da dupla rota da compreensão da leitura são logicamente independentes: a adequação de uma não diz nada sobre a ade-quação da outra. Uma discussão mais apro-fundada sobre essas duas teorias pode ser en-contrada em Coltheart (2000). Este capítulo considera apenas a abordagem da dupla rota à leitura em voz alta.

Uma última questão que merece ser men-cionada quanto ao capítulo de Baron tem a ver com a analogia que ele usa para ilustrar por que duas rotas podem ser melhores que uma (mesmo que uma seja imperfeita – a rota não lexical com palavras irregulares, por exemplo):

* N. de R.T.: Um exemplo semelhante no português poderia ser: “Veio sem (cem) balas”.

Semântica

Fonologia

Regras de

correspondência

Partes de palavras

Associações

específicas de palavras

Associações

específicas

de palavrasOrtografia

FIGURA 1.1 Arquitetura do sistema de leitura.

Fonte: Adaptado de Baron, 1977.



Uma terceira – e, para mim, satisfatória – ex-plicação do uso da via indireta […] é que ela é usada paralelamente à via direta. Se esse for o caso, podemos esperar que ela seja útil mesmo que seja geralmente mais lenta que a via direta para fornecer informações sobre o significado. Se imaginarmos as duas vias como manguei-ras que possam ser usadas para encher um balde com informações sobre o significado, podemos ver que a adição de uma segunda mangueira pode acelerar o enchimento do balde, mesmo que ela forneça menos água que a primeira. (Baron, 1977, p. 203)

Uma analogia que costuma ser usada para descrever a relação entre as duas rotas em mo-delos de dupla rota é a corrida de cavalos: as rotas lexical e não lexical correm e a que ter-minar primeiro é responsável pelo resultado. Porém, essa analogia está errada. Na leitura em voz alta de palavras irregulares, nas ocasiões em que a rota não lexical vence, segundo a analo-gia com a corrida de cavalos, a resposta estará errada: será um erro de regularização. Porém, o que costuma ser visto em experimentos so-bre o efeito da regularidade na leitura em voz alta é que as respostas a palavras irregulares são corretas, mas lentas. A analogia com a corrida de cavalos não consegue captar esse resultado típico, ao passo que a analogia de Baron com a mangueira e o balde consegue. A segunda ana-logia é igualmente apropriada no caso do mo-delo de dupla rota da compreensão da leitura.

Rotas de leitura “lexicais” e

“não lexicais”

Este uso dos termos “lexical” e “não lexical” em referência às duas rotas de leitura parece ter se originado com Coltheart (1980). A leitura pela rota lexical envolve procurar uma palavra em um léxico mental que contém conhecimento sobre as grafias e pronúncias de sequências de letras que formam palavras reais (e, assim, estão

presentes no léxico); a leitura pela rota não lexi-cal não faz referência a esse léxico, mas envolve fazer uso de regras que relacionam segmentos da ortografia com segmentos da fonologia. A citação de De Saussure, que abre este capítulo, sugere que os segmentos ortográficos usados pela rota não lexical são letras individuais, mas, como discutido por Coltheart (1978), não pode estar certa, pois, na maioria das línguas alfabé-ticas, os fonemas individuais são representados muitas vezes por sequências de letras, em vez de letras individuais. Coltheart (1978) usa o ter-mo “grafema” para se referir a qualquer letra ou sequência de letras que represente um fonema individual, de modo que TH e IGH são os dois grafemas da palavra THIGH*, que tem dois fonemas. Ele sugere que as regras usadas pela rota de leitura não lexical são, especificamente, regras de correspondência entre grafemas e fo-nemas, como TH → /θ/ e IGH → /ai/.**

Fenômenos explicados pelo modelo da dupla rota

Este modelo visa explicar dados não apenas da leitura normal, mas também fatos sobre os transtornos da leitura, tanto os adquiridos quanto os do desenvolvimento.

Os tempos de reação em experimentos com leitura em voz alta são mais longos para palavras irregulares do que para palavras regu-lares e o modelo da dupla rota atribui isso ao fato de que as duas rotas geram informações conflitantes no nível do fonema quando a palavra é irregular, mas não quando a palavra é regular: resolver esse conflito leva tempo, e isso é responsável pelo efeito de regularidade na leitura acelerada em voz alta. Os efeitos da frequência na leitura em voz alta foram expli-

* N. de R.T.: Exemplo próximo no português: palavra CHÁ.

** N. de R.T.: CH → /�/ e a → /a/, em que dois grafe-mas (ch) produzem um fonema (/�/).



cados propondo-se que o acesso a entradas para palavras de alta frequência no léxico men-tal era mais rápido do que o acesso a palavras de baixa frequência. Conclui-se que, segundo o modelo da dupla rota, as palavras de baixa frequência apresentarão um efeito de regulari-dade maior, pois o processamento lexical será relativamente lento para essas palavras e have-rá mais tempo para que as informações da rota não lexical afetem a leitura; essa interação da frequência com a regularidade foi observada.

Suponhamos que uma lesão cerebral em uma pessoa letrada comprometa seletivamente a operação da rota lexical para a leitura em voz alta, deixando intacta a rota não lexical. Como ficaria a leitura dessa pessoa? Bem, as não pa-lavras e as palavras regulares ainda seriam lidas com precisão normal, pois a rota não lexical consegue cumprir essa função; contudo, as pa-lavras irregulares sofreriam, pois a sua leitura correta exige a rota lexical. Se ela falhar com uma palavra irregular, a resposta virá apenas da rota não lexical e, assim, será errada: island será lida como “iz-land”*, yacht rimará com “matched”**, e have rimará com “cave.”*** Esse padrão exato é observado em certas pessoas cuja capacidade de leitura foi comprometida por uma lesão cerebral; ele se chama dislexia superficial, ou dislexia de superfície, e dois ca-sos particularmente claros são os publicados por McCarthy e Warrington (1986) e Behr-mann and Bub (1992). A ocorrência de dis-lexia superficial é uma boa evidência de que o sistema de leitura contém rotas lexicais e não lexicais para a leitura em voz alta, pois esse transtorno da leitura é exatamente o que se es-peraria se a rota lexical for comprometida e a rota não lexical for poupada.

* N. de R.T.: Transcrição fonética: ['ailənd], mas será lida como [1izlend].** N. de R.T.: Transcrição fonética: [jɑt], mas será lida como [jεtʃ] que rimará com [mεtʃ].*** N. de R.T.: Transcrição fonética: [h�v], mas será lida como [heiv] que rimará com [kheiv].

Suponhamos, por outro lado, que a lesão cerebral em uma pessoa letrada comprometa seletivamente a operação da rota não lexical para a leitura em voz alta, deixando intacta a rota lexical. Como ficaria a leitura dessa pes-soa? Bem, as palavras irregulares e as palavras regulares ainda seriam lidas com precisão nor-mal, pois a rota lexical consegue cumprir essa função; porém, as não palavras sofreriam, pois a sua leitura correta exige a rota não lexical. Esse padrão exato – boa leitura de palavras e leitura deficiente de não palavras – é observa-do em certas pessoas cuja capacidade de leitura foi comprometida por uma lesão cerebral; ele se chama dislexia fonológica (ver Coltheart, 1996, para uma revisão desses estudos). Essa também é uma boa evidência da concepção da dupla rota para o sistema de leitura.

Os transtornos da leitura discutidos são chamados de dislexias adquiridas, pois são ad-quiridos como resultado de lesões cerebrais em pessoas que eram letradas. O termo “dislexias do desenvolvimento”, ao contrário, refere-se a pessoas que tiveram dificuldade para aprender a ler em primeiro lugar e nunca alcançaram um nível normal de habilidade de leitura. Assim como uma lesão cerebral pode afetar seletiva-mente a rota de leitura lexical e não lexical, a aprendizagem dessas duas rotas está sujeita à mesma influência seletiva. Isso ocorre de fato. Existem crianças que têm muita dificuldade, para a sua idade, para ler palavras irregulares, mas que são normais na leitura de palavras re-gulares (p. ex., Castles e Coltheart, 1996); essa é a dislexia do desenvolvimento superficial. E existem crianças que têm muita dificuldade, para a sua idade, para ler não palavras, mas que são normais na leitura de palavras regulares e ir-regulares (p. ex., Stothard, Snowling e Hulme, 1996); essa é a dislexia fonológica do desenvol-vimento. Como parece haver dificuldades em aprender apenas a rota lexical ou apenas a rota não lexical, esses padrões diferentes de dislexia do desenvolvimento também são boas evidên-cias para o modelo da dupla rota da leitura.



Modelagem computacional da leitura

Vimos que a concepção da dupla rota, apli-cada à leitura em voz alta e à compreensão da leitura, foi estabelecida em meados da década de 1970. Outro passo importante no estudo da leitura foi a modelagem computacional.

Um modelo computacional de uma forma de processamento cognitivo é um programa de computador que não apenas executa essa forma específica de processamento, mas que o faz de um modo que o modelador acredite que tam-bém seja a maneira como os seres humanos realizam a tarefa cognitiva em questão. Diversas virtudes costumam ser reconhecidas para a mo-delagem computacional – por exemplo, ela per-mite ao teórico descobrir partes de uma teoria que não sejam suficientemente explícitas; partes indefinidas de uma teoria não podem ser tradu-zidas para instruções de computador. Uma vez que o problema foi resolvido e foi escrito um programa que possa ser executado, o modela-dor pode determinar o quanto o comportamen-to do modelo corresponde ao comportamento dos seres humanos. Será que todas as variáveis que influenciam o comportamento de seres humanos enquanto realizam a tarefa cognitiva relevante também afetam o comportamento do programa e do mesmo modo? E será que todas as variáveis que influenciam o comportamento do programa enquanto ele realiza a tarefa cogni-tiva relevante também afetam o comportamen-to de seres humanos e do mesmo modo? Con-siderando que a resposta às duas perguntas seja sim, o estudo do comportamento do modelo computacional demonstrou que a teoria a partir da qual o modelo foi gerado é suficiente para explicar o que se sabe atualmente sobre como os humanos agem no domínio cognitivo relevan-te. Isso não significa que não possa haver uma teoria diferente, a partir da qual se possa gerar um modelo computacional diferente que tenha o mesmo nível de desempenho. Nesse caso, é hora de fazer experimentos nos quais as teorias

façam previsões diferentes – ou seja, cujos re-sultados em simulações com os dois modelos computacionais sejam conflitantes.

De todos os domínios cognitivos, a leitura é aquele em que a modelagem computacional tem sido empregada de forma mais intensiva. Isso começou com o modelo da competição e ativação interativa (IAC) de McClelland e Rumelhart (1981) e Rumelhart McClelland (1982), que era um modelo apenas do reconhe-cimento visual de palavras, e não se ocupava da semântica ou fonologia. Estes domínios foram introduzidos no modelo computacional bastan-te mais extensivo desenvolvido no artigo semi-nal de Seidenberg e McClelland (1989). Uma influência que seu artigo teve foi levar ao desen-volvimento de uma versão computacional do modelo de dupla rota: o modelo de dupla rota em cascata (DRC) (Coltheart et al., 1993; Colt-heart, Rastle, Perry, Langdon e Ziegler, 2001).

O modelo de dupla rota

em cascata (DRC)

O DRC é um modelo computacional que cal-cula a pronúncia a partir da escrita por meio de dois procedimentos, um procedimento lexical e um procedimento não lexical (ver Figura 1.2).

O procedimento lexical envolve acessar uma representação do léxico ortográfico de pa-lavras reais e, a partir daí, ativar o nó da palavra no léxico fonológico de palavras reais, que, por sua vez, ativa os fonemas da palavra no nível fonêmico do modelo. As não palavras não podem ser lidas corretamente por meio desse procedimento, pois não estão presentes nesses léxicos, mas isso não significa que a rota lexical simplesmente não possa produzir nenhum re-sultado fonológico quando o estímulo for uma não palavra. Uma não palavra como SARE pode gerar ativação de entradas no léxico orto-gráfico para palavras visualmente semelhantes a ela, como CARE, SORE ou SANE; isso, por



sua vez, pode ativar o léxico fonológico e, as-sim, o nível fonêmico. Essa ativação lexical não consegue gerar a pronúncia correta para uma não palavra, mas existem evidências de que in-fluencia a leitura em voz alta de não palavras. Por exemplo, uma não palavra como SARE, que é semelhante a muitas entradas no léxico ortográfico, será lida em voz alta com um tem-po de reação menor do que uma não palavra como ZUCE, que é semelhante a poucas en-tradas (McCann e Besner, 1987).

O procedimento não lexical do modelo DRC aplica regras de correspondência entre

grafemas e fonemas à sequência de estímulos para converter letras em fonemas. Isso ocor-re na sequência da esquerda para a direita, considerando inicialmente apenas a primeira letra da sequência, depois as duas primeiras letras, depois as três primeiras letras e, assim por diante, até passar pela última letra do estí-mulo. Ele converte não palavras corretamente da escrita para o som e também palavras re-gulares (aquelas que obedecem suas regras de correspondência entre grafemas e fonemas). As palavras irregulares (exceções) são “regula-rizadas” pelo procedimento não lexical – ou

Conexão excitatória

Conexão inibitória

Sistema

semântico

Léxico

fonológico

Léxico

ortográfico

Unidades de letras

Sistema

fonêmico

Sistema de regras

grafêmicas e

fonêmicas

Unidades de

características visuais

escrita

fala

FIGURA 1.2 O modelo de dupla rota em cascata (DRC).

Fonte: O autor.



seja, suas pronúncias baseadas nas regras, que estarão incorretas.

O processamento pela rota lexical ocorre da seguinte maneira:

Ciclo 0: definir todas as unidades para ca-racterísticas visuais que estejam presentes na sequência de estímulos como 1; definir todas as outras como zero.

Ciclo 1: cada característica visual definida como 1 contribui para a ativação de todas as letras nas unidades de letras a que está conecta-da. As conexões são inibitórias quando a letra não contém essa característica e, assim, a ati-vação transmitida é negativa; as conexões são excitatórias quando a letra contém a caracterís-tica e, assim, a ativação transmitida é positiva.

Ciclo 2: o que acontece no Ciclo 1 acon-tece novamente aqui. Além disso, cada unida-de de letra contribui para a ativação de todas as unidades de palavra no léxico ortográfico a que está conectada. As conexões são inibitó-rias quando a palavra não contém aquela letra e, assim, a ativação transmitida da unidade de letra para a unidade de palavra é negativa; as conexões são excitatórias quando a palavra contém aquela letra e, assim, a ativação trans-mitida da unidade de letra para a unidade de palavra é positiva.

Ciclo 3: tudo que acontece no Ciclo 1 e no Ciclo 2 acontece novamente aqui. Além disso:

a. Anterógrado: cada unidade do léxico or-tográfico contribui para a ativação da sua unidade correspondente no léxico fono-lógico.

b. Retrógrado: cada unidade de palavra na unidade do léxico ortográfico contribui retroativamente para a ativação de todas as unidades de letras a que está conecta-da. As conexões são inibitórias quando a palavra não contém a letra e, assim, a ativação transmitida da unidade de pa-lavra para a unidade de letra é negativa; as conexões são excitatórias quando a pa-

lavra contém a letra e, assim, a ativação transmitida da unidade de palavra para a unidade de letra é positiva.

Ciclo 4: tudo que acontece nos Ciclos 1, 2 e 3 acontece novamente aqui. Além disso:

a. Anterógrado: cada unidade no léxico fo-nológico contribui para a ativação de todas as unidades fonêmicas a que está conecta-da. As conexões são inibitórias quando a pronúncia da palavra não contém aquele fonema e, assim, a ativação transmitida da unidade de palavra para a unidade de fonema é negativa; as conexões são exci-tatórias quando a pronúncia da palavra contém aquele fonema e, assim, a ativação transmitida da unidade de palavra para a unidade de fonema é positiva.

b. Retrógrado: cada unidade do léxico fono-lógico contribui retroativamente para a ativação da sua unidade correspondente no léxico ortográfico.

Ciclo 5: tudo que acontece nos Ciclos 1, 2, 3 e 4 acontece novamente aqui. Além disso, cada unidade fonêmica contribui retroativa-mente para a ativação de todas as unidades de palavras no léxico fonológico a que está co-nectada. As conexões são inibitórias quando a palavra não contém aquele fonema e, assim, a ativação transmitida da unidade de fonema para a unidade de palavra é negativa; as cone-xões são excitatórias quando a palavra contém aquele fonema e, assim, a ativação transmitida da unidade de fonema para a unidade de pa-lavra é positiva.

E assim por diante. À medida que os ciclos de processamento avançam, influências inibitó-rias e excitatórias continuam a fluir para cima e para baixo da maneira descrita até que a respos-ta de leitura em voz alta esteja pronta. Como essa prontidão é determinada? Conforme a se-guir. Na descrição dos ciclos de processamento apresentada, o primeiro ciclo em que o sistema



fonêmico recebe qualquer ativação é o Ciclo 4. Ao final do Ciclo 4, algumas unidades de fo-nemas serão ativadas, mas de forma extrema-mente fraca. À medida que o processamento continua, a ativação de algumas das unidades de fonemas aumentará lentamente. Com fre-quência, no começo do processamento, algu-mas das unidades fonêmicas ativadas serão as incorretas. Porém, ao longo do tempo, à me-dida que as ativações fonêmicas continuarem a aumentar, são os fonemas corretos que são mais ativados. Considera-se que a resposta de leitura está pronta quando os fonemas atingiram um nível crítico de ativação (definido como 0,43 quando o modelo é usado para simular a leitura em voz alta por seres humanos). A pronúncia gerada pelo modelo consiste do fonema mais ativado dentro de cada oito conjuntos de uni-dades fonêmicas (um conjunto por posição) que compreendem o sistema fonêmico. O ciclo de processamento em que esse estado de coisas ocorre é a latência da leitura em voz alta no mo-delo DRC para a sequência de letras específica que foi usada como estímulo.

O processamento ao longo da rota não le-xical não começa a operar até o Ciclo 10. Sem esse lapso de tempo após a rota lexical começar a operar, o modelo teria sérias dificuldades para ler palavras irregulares em voz alta. Quando se chega ao Ciclo 10, a rota não lexical traduz a primeira letra da sequência para seu fonema usando a regra apropriada de grafemas e morfe-mas e contribui para a ativação da unidade do fonema no sistema fonêmico. Isso continua a ocorrer pelos próximos 16 ciclos de processa-mento. O sistema de conversão grafema-fone-ma (CFG) opera da esquerda para a direita, de modo que pode considerar a segunda letra da sequência, assim como a primeira. A cada 17 ciclos, o sistema CFG passa a considerar a pró-xima letra, traduzi-la para um fonema e ativar esse fonema no sistema fonêmico. Desse modo, com a sequência DESK*, o sistema CFG não

* N. de R.T.: Foi mantido termo original (tradução: mesa) para não interferir na análise do autor.

recebe estímulo até o Ciclo 10, lida apenas com D até o Ciclo 27, lida apenas com DE do Ciclo 28 ao Ciclo 44, depois com DES até o Ciclo 60, DESK até o Ciclo 76 e assim por diante.

Os cálculos para a rota lexical e não lexical ocorrem simultaneamente – ou seja, considera--se que as informações do nível das caracterís-ticas visuais fluem simultaneamente pelas rotas lexical e não lexical e convergem no sistema fo-nêmico a partir dessas duas fontes. Independen-temente de o estímulo ser uma palavra irregular ou uma não palavra, as duas fontes de ativação entram em conflito no nível fonêmico. Para que o sistema gere pronúncias corretas para palavras irregulares e para não palavras, ele terá que ter um modo de resolver esses conflitos em favor da pronúncia correta. Não obstante, o modelo lê palavras irregulares e não palavras em voz alta com grande precisão, de modo que esses con-flitos quase sempre são resolvidos de um modo que resulta em uma pronúncia correta (pela inter-relação entre inibição e ativação em níveis variados do modelo). Isso depende de uma es-colha criteriosa de valores para os parâmetros do modelo, como as intensidades das conexões inibitórias e facilitadoras entre componentes do modelo. Se a rota lexical for forte demais em relação à rota não lexical, todas as palavras se-rão lidas corretamente, mas haverá erros na lei-tura de não palavras. Se a rota lexical for fraca demais em relação à rota não lexical, todas as palavras regulares e não palavras serão lidas cor-retamente, mas haverá erros na leitura de pala-vras irregulares. É necessário que se estabeleça um equilíbrio delicado entre as intensidades das duas rotas para que o modelo funcione bem com não palavras e palavras irregulares.

O que o modelo DRC consegue explicar

Uma maneira na qual Coltheart et al. (2001) avaliaram o modelo DRC foi comparar os tempos de reação do modelo a determinados



conjuntos de estímulos com os tempos de rea-ção de leitores humanos quando estão lendo os mesmos estímulos. Será que as variáveis que afetam os tempos de reação de seres humanos ao lerem em voz alta também afetam os tem-pos de reação do modelo para a leitura em voz alta? Coltheart e colaboradores (2001) apre-sentam muitos exemplos em que isso aconte-ce. Para leitores humanos e o modelo DRC:

a. Palavras de alta frequência são lidas em voz alta com mais rapidez do que palavras de baixa frequência.

b. Palavras são lidas em voz alta com mais rapidez do que não palavras.

c. Palavras regulares são lidas em voz alta com mais rapidez do que palavras irregulares.

d. O tamanho da vantagem da regularidade é maior para palavras de baixa frequência do que para palavras de alta frequência.

e. Quanto mais adiante em uma palavra irregular se encontra a correspondência entre fonemas e grafemas irregulares, me-nor o custo incorrido pela irregularidade. Assim, CHEF (irregularidade na posição 1) é pior que SHOE (irregularidade na posição 2), que é pior do que CROW (ir-regularidade na posição 3).*

f. Pseudo-homófonos (não palavras que são pronunciadas exatamente como palavras reais em inglês, como brane)** são lidos em voz alta com mais rapidez do que não palavras não pseudo-homofômicas (como brene).***

g. Pseudo-homófonos derivados de palavras de alta frequência (p. ex., hazz) são lidos em voz alta com mais rapidez do que

* N. de R.T.: Em CHEF, o grafema CH é irregular e está na primeira posição da palavra, em SHOE o OE é irregular e em CROW o OW é irregular, ou seja, esses grafemas têm mais de um som possível.** N. de R.T.: Um exemplo em português seria xapéu, uma pseudopalavra que pela pronúncia gera uma palavra.*** N. de R.T.: Um exemplo em português seria xadéu, uma pseudopalavra que não gera uma palavra pela pronúncia.

pseudo-homófonos derivados de palavras de baixa frequência (p. ex., glew).****

h. O número de vizinhos ortográficos que uma não palavra não pseudo-homofômi-ca possui (i.e., o número de palavras que diferem por apenas uma letra), mais rapi-damente ela será lida em voz alta.

i. O número de vizinhos ortográficos que um pseudo-homófono tem não influen-cia a rapidez com que é lido em voz alta.

j. Quando mais letras houver em uma não palavra, mais lentamente ela será lida em voz alta; mas o número de letras tem pou-co ou nenhum efeito sobre a leitura de palavras reais em voz alta.

O modelo DRC também foi usado para simular dislexias adquiridas. A dislexia superfi-cial foi simulada reduzindo a taxa de acesso ao léxico ortográfico: esse modelo DRC lesionado cometeu erros de regularização com palavras irregulares, e ainda mais quando tinham baixa frequência, como é visto na dislexia superficial, ao passo que a leitura em voz alta de palavras regulares e não palavras permaneceu normal, como nos casos puros de dislexia superficial (Behrmann e Bub, 1992; McCarthy e Warring-ton, 1986). A dislexia fonológica foi simulada desacelerando-se a operação da rota não lexical: esse modelo DRC lesionado ainda leu palavras corretamente, mas leu não palavras incorreta-mente, especialmente se fossem não pseudo-ho-mófonos, como no caso da dislexia fonológica.

Assim, o modelo DRC pode explicar um número surpreendentemente grande de resul-tados de estudos sobre a leitura normal e trans-tornos da leitura, muito mais do que qualquer outro modelo computacional da leitura. En-tretanto, Coltheart e colaboradores (2001) chamaram atenção para algumas limitações da atual implementação do modelo DRC: seu

**** N. de R.T.: Pinheiro (1994) investigou a frequência de ocorrência das palavras em português. Fonte: Pinhei-ro, A.M.V. (1994) Leitura e escrita: uma abordagem cognitiva. Campinas: Editorial Psy.



procedimento para a tarefa de decisão lexical era grosseiro, não era aplicável à pronúncia de palavras polissilábicas e não oferecia nenhuma explicação para um paradigma popular para estudar a leitura (ativação mascarada); a dife-rença entre os tempos de reação na leitura de palavras e não palavras pelo modelo era gran-de em níveis implausíveis; a quantidade de variância nos tempos de reação na leitura de palavras que o modelo conseguia explicar, ain-da que sempre significativa, era decepcionan-temente baixa e o modelo implementado não dizia nada sobre semântica. Uma nova versão do modelo DRC, que corrigirá essas e outras limitações do modelo existente, encontra-se em processo de desenvolvimento.

Modelagem conexionista e não conexionistaEste capítulo faz uma distinção entre mode-los conexionistas da leitura (como os modelos de Seidenberg e McClelland, 1989, e Plaut, McClelland, Seidenberg e Patterson, 1996) e modelos não conexionistas da leitura (como o modelo DRC). A descrição do modelo DRC em Coltheart e colaboradores (2001) usa o termo “conexão”, e o modelo, de fato, “con-tém” por volta de 4,5 milhões de conexões, no sentido do termo “conexão” usado por Coltheart e colaboradores (2001). Todavia, no modelo DRC, as conexões são apenas dis-positivos expositivos usados para falar sobre como os módulos do modelo se comunicam entre si. Pode-se explicar isso de outras ma-neiras sem usar o termo “conexão”. Em com-paração, nos modelos conexionistas, as cone-xões costumam ser consideradas semelhantes a neurônios, os modelos são chamados de redes neurais e costumam-se aplicar termos como “inspiração biológica” ou “neuralmente plausível”. Aqui, uma conexão é algo que é realizável fisicamente como um objeto indivi-dual, ao contrário do modelo DRC, no qual o termo não tem esse sentido.

Uma segunda diferença importante entre a modelagem conexionista e a não conexio-nista, pelo menos como essas abordagens têm sido usadas por enquanto, é que os modelos conexionistas geralmente são desenvolvidos aplicando-se um algoritmo de aprendizagem de rede neural a um conjunto de estímulos de treinamento, ao passo que as arquiteturas de modelos não conexionistas geralmente são es-pecificadas pelo modelador com base nos efei-tos empíricos que o modelo busca explicar.

O modelo computacional conexionista da leitura de Seidenberg e McClelland (1989) costuma ser apresentado como uma alternati-va ao modelo de dupla rota. De fato, afirma-ções como “o modelo de dupla rota tem sido questionado recentemente por uma pletora de modelos computacionais de rota única basea-dos em princípios conexionistas” (Damper e Marchand, 2000, p. 13) são comuns na litera-tura. Porém, essa não era a visão dos autores. Eles foram claros com relação a isso: “nosso modelo é um modelo de dupla rota”, afirmam (Seidenberg e McClelland, 1989, p. 559).

Isso fica perfeitamente evidente a par-tir do seu diagrama do modelo (Seidenberg e McClelland, 1989, Figura 1, reproduzido aqui como Figura 1.3): ele representa explicitamente duas rotas distintas da ortografia à fonologia, uma direta e outra via significado, e representa explicitamente duas rotas distintas da ortografia à semântica, uma direta e outra via fonologia. Uma das duas rotas para a leitura em voz alta (via semântica) somente pode ser usada para ler palavras em voz alta; ela não funcionaria para não palavras. A outra rota (não semântica) para a leitura em voz alta é exigida se o estímulo for uma não palavra. Esse modelo passou a ser chamado de modelo triangular, talvez por cau-sa da referência em Seidenberg e McClelland (1989, p. 559) ao “terceiro lado do triângulo na Figura 1”. Mais de um modelo subsequente já foi chamado de modelo triangular, apesar de ser diferente do modelo de Seidenberg e Mc-Clelland. Por enquanto, já houve sete modelos



triangulares diferentes, uma questão discutida mais adiante neste capítulo.

O que levou a esse mal-entendido co-mum? A resposta é clara: a incapacidade de distinguir as duas hipóteses a seguir:

a. É possível que um único sistema de pro-cessamento leia todas as palavras irregula-res e todas as não palavras corretamente em voz alta.

b. O sistema de leitura humano possui ape-nas um procedimento para calcular a pro-núncia a partir da escrita.

Seidenberg e McClelland (1989) propu-seram a hipótese (a). Porém, não propuseram a hipótese (b); de fato, conforme indica a ci-tação no parágrafo anterior, eles repudiaram a hipótese (b). É por isso que o seu modelo é um modelo de dupla rota da leitura em voz alta.

Esse modelo seminal não se mostrou ca-paz de oferecer uma boa explicação de como

as pessoas leem não palavras em voz alta, pois sua precisão nessa tarefa era menor que a preci-são apresentada por leitores humanos (Besner, Twilley, McCann e Seergobin, 1990). Coltheart e colaboradores (1993) mostraram que a suges-tão estava incorreta (Seidenberg e McClelland, 1990, p. 448) de que isso ocorreu porque o banco de dados de palavras com o qual o mo-delo foi treinado era limitado demais e não continha informações suficientes para aprender a leitura de não palavras com ele. Eles desenvol-veram um algoritmo de aprendizagem de regras CFG e o aplicaram ao conjunto de treinamen-to de Seidenberg-McClelland. O conjunto de regras que o algoritmo aprendeu a partir do conjunto de treinamento foi usado com as 133 não palavras de Glushko (1979). Enquanto o modelo de Seidenberg e McClelland acertou apenas 68% em um subconjunto de 52 dessas não palavras, o modelo DRC leu 97,9% delas corretamente. Isso mostra que as informações necessárias para aprender a ser um excelente

Contexto

Semântica

FonologiaOrtografia

MAKE /mAk/

FIGURA 1.3 O modelo de Seidenberg e McClelland (1989). O modelo implementado está em negrito.

Fonte: Seidenberg e McClelland (1989).



leitor de não palavras estão presentes no banco de dados do modelo e, assim, “o fraco desem-penho do modelo PDP* na leitura de não pala-vras é um defeito não do banco de dados, mas do próprio modelo” (Coltheart et al., 1993, p. 594). Assim, conforme observado por Plaut (1997, p. 769) e Plaut e colaboradores (1996, p. 63), o modelo de Seidenberg e McClelland não conseguiu fornecer evidências de que é possível que um sistema de processamento úni-co leia todas as palavras irregulares e todas as não palavras em voz alta corretamente.

Não obstante, pode ser possível criar um procedimento de processamento único que consiga ler todas as palavras irregulares e to-das as não palavras em voz alta corretamente. Plaut e colaboradores (1996) tentaram criar esse procedimento, treinando uma rede cone-xionista, semelhante em arquitetura geral à da rede de Seidenberg e McClelland apresentada na Figura 1.3 (ela era, por exemplo, um mo-delo de dupla rota no mesmo sentido que Sei-denberg e McClelland consideravam seu mo-delo como um modelo de dupla rota, embora o treinamento tenha sido feito apenas para uma das duas rotas), mas diferente do modelo de Seidenberg e McClelland em diversas ma-neiras, incluindo as formas de representações ortográficas e fonológicas usadas na rede. As unidades de estímulo, que eram representa-ções distribuídas no modelo de Seidenberg e McClelland, tornaram-se representações lo-cais (cada uma representando um grafema). As unidades de produto, que eram represen-tações distribuídas no modelo de Seidenberg e McClelland, tornaram-se representações locais (cada uma representando um fonema).

Plaut et al. (1996), na verdade, apresen-taram três modelos diferentes, ainda que rela-cionados – ou seja, um segundo, um terceiro e um quarto modelos triangulares, sendo o primeiro modelo triangular o de Seidenberg e McClelland (1989):

* N. de R.T.: O modelo de processamento distribuído em paralelo será apresentado no Capítulo 3.

Modelo 1: puramente anterógrado, 105 unidades de grafemas, 100 unidades ocultas, 61 unidades de fonemas.

Modelo 2: como no Modelo 1, mas com retroalimentação de unidades fonêmicas para unidades ocultas: uma rede atrativa.

Modelo 3: como no Modelo 1, mas acres-centando estímulo externo (não implemen-tado) às unidades de produto, de maneira a reproduzir o que aconteceria se houvesse um sistema semântico implementado, ativado pela ortografia e, por sua vez, ativando a fono-logia. Essa abordagem, discutida a seguir, foi perseguida na tentativa de simular a dislexia superficial adquirida.

Em que nível esses modelos conseguem ler não palavras? O Modelo 1 (que, depois do treinamento, acertou 100% da leitura das 2.972 palavras não homográficas do conjunto de treinamento) saiu-se muito bem na leitura de não palavras (ver Tabela 3 de Plaut et al., 1996), quase tão bem quanto leitores huma-nos. Todavia, ele ainda falha com itens como JINJE, pois não existe nenhuma palavra no conjunto de treinamento que termine com o grafema final dessa não palavra. Conclui--se que uma seleção cuidadosa de não pala-vras que explorasse essas lacunas no corpus de treinamento produziria um conjunto de não palavras com o qual o modelo teria o esco-re de zero ou próximo de zero. Os leitores humanos seriam imensamente superiores ao modelo nessas não palavras. Os resultados com a leitura de não palavras pelo Modelo 2 foram semelhantes, embora sua leitura de não palavras tenha sido um pouco pior do que a do Modelo 1. O problema JINJE se manteve.

Considerando esse trabalho de Plaut e colaboradores (1996), o que podemos dizer sobre as duas hipóteses mencionadas acima? As hipóteses eram:

a. É possível que um único sistema de pro-cessamento leia todas as palavras irregula-res e todas as não palavras corretamente em voz alta.



b. O sistema de leitura humano possui ape-nas um procedimento para calcular a pro-núncia a partir da escrita.

Embora a leitura de não palavras tenha sido melhor com os modelos PMSP do que com o modelo SM, os modelos PMSP ainda não leem não palavras corretamente, no sentido de “tão bem quanto leitores humanos”, pois não é di-fícil pensar em não palavras que leitores huma-nos leiam bem e que os modelos PMSP leiam incorretamente: não existe maneira em que ler JINJE de modo a rimar com “wine” (como fa-zem os modelos PMSP) possa ser considerado correto. Assim, a hipótese (a) permanece sem amparo. E nenhum modelo atual da leitura em voz alta faz a hipótese (b). Assim, atualmente, é razoável considerar as duas hipóteses falsas.

Todavia, o trabalho com a simulação da dislexia superficial usando o Modelo 3 tem uma implicação interessante para essas hipóte-ses. De fato, de um modo geral, a simulação de transtornos, ao contrário da leitura normal, tem sido particularmente crucial nos últimos anos para uma avaliação comparativa de mo-delos computacionais da leitura. Assim, grande parte da discussão a seguir sobre a modelagem de dupla rota se concentrará na aplicação desses modelos à explicação de transtornos da leitura.

Simulando transtornos da leitura com os modelos triangularesSimulando a dislexia superficial adquirida. A dislexia superficial adquirida (Marshall e Newcombe, 1973; Patterson, Marshall e Coltheart, 1985) é um transtorno da leitura causado por uma lesão cerebral no qual ocorre um comprometimento seletivo da capacidade de ler palavras irregulares em voz alta, sendo relativamente poupada a leitura de palavras regulares e não palavras. Muitos casos não são normais para a leitura de palavras regu-lares e não palavras; enfocarei aqui, como fizeram Plaut e colaboradores (1996), dois casos particularmente puros, KT (McCarthy

e Warrington, 1986) e MP (Behrmann e Bub, 1992). Ambos apresentavam precisão pratica-mente normal na leitura de palavras regulares e de não palavras em voz alta, especialmente quando fossem de baixa frequência (KT: alta frequência 47%; baixa frequência 26%; MP: alta frequência 93%; baixa frequência 73%).

Os modelos computacionais buscam ex-plicar a leitura comprometida além da leitura normal; ou seja, deve ser possível lesionar arti-ficialmente esses modelos, de modo que seus padrões de leitura preservada ou comprome-tida correspondam corretamente aos padrões observados em formas diversas de dislexia ad-quirida. Portanto, Plaut e colegas investigaram se havia algum modo de lesionar qualquer um de seus três modelos, que levasse à leitura com-prometida de palavras irregulares, com leitura preservada de palavras regulares e não palavras.

Isso foi investigado estudando-se os efeitos de deletar proporções variadas das conexões na via implementada da ortografia à fonologia, ou proporções variadas das unidades ocultas, no Modelo 2. Essa medida não teve sucesso em simular o paciente KT, considerado mais grave: qualquer lesão que produzisse níveis de acurácia de aproximadamente 26% para pala-vras irregulares de baixa frequência também produzia um desempenho muito fraco com não palavras, ao passo que KT era perfeito na leitura de não palavras. Assim, não foi possível simular a dislexia superficial adquirida apenas com a parte implementada do modelo.

Portanto, Plaut e colaboradores passaram do Modelo 2 para o Modelo 3, que tem um componente não implementado (estímulo semântico no nível do produto fonológico). Com suficiente treinamento, o Modelo 3 se sai bem com palavras irregulares, palavras re-gulares e não palavras. O crucial aqui, con-tudo, é a competência da parte implemen-tada (ortografia à fonologia) do Modelo 3. Quando treinado sem a semântica (que é o Modelo 1), ele aprende a ler palavras irregula-res perfeitamente e não palavras muito bem. Todavia, isso não ocorre quando é treinado



com estímulo semântico concomitante. As palavras irregulares de baixa frequência nun-ca são aprendidas perfeitamente aqui pela via direta da ortografia à fonologia: com essa via operando por conta própria, a precisão para palavras irregulares de baixa frequência é de em torno de 70% após 400 períodos de trei-namento e depois decai a por volta de 30% corretas depois de 2 mil períodos. O desem-penho com palavras irregulares de alta fre-quência é quase perfeito com 400 períodos, mas a continuação do treinamento deteriora o desempenho com essas palavras progressi-vamente, chegando a apenas 55% no período 2 mil. O desempenho com palavras regulares e não palavras é quase perfeito no período 400 e permanece nesse nível com a continua-ção do treinamento até o período 2 mil.

Se o treinamento for interrompido em 400 períodos e o estímulo semântico para o sistema for removido, o desempenho será bom com palavras regulares, não palavras e palavras irregulares de alta frequência, mas um pouco comprometido com palavras irre-gulares de baixa frequência; isso corresponde ao padrão disléxico superficial apresentado por MP.

Se o treinamento for interrompido em 2 mil períodos e o estímulo semântico para o sistema for removido, o desempenho será bom com palavras regulares e não palavras, comprometido com palavras irregulares de alta frequência e muito fraco com palavras ir-regulares de baixa frequência; isso correspon-de ao padrão disléxico superficial apresentado por KT.

A sugestão aqui é que a causa da dislexia superficial adquirida é uma lesão semântica e que quanto mais o paciente necessita do es-tímulo semântico para ler em voz alta na si-tuação pré-mórbida, mais grave será a dislexia superficial quando houver lesão semântica. A implicação é que, mesmo que seja possível que um único sistema de processamento leia todas as palavras irregulares e todas as não pa-

lavras em voz alta corretamente, a maioria dos leitores humanos não possui tal sistema.

Como existem pacientes com lesão se-mântica grave que conseguem ler palavras irregulares com precisão normal (p. ex., Ci-polotti e Warrington, 1995; Lambon Ralph, Ellis e Franklin, 1995; Schwartz, Saffran e Marin, 1980a; ver também Gerhand, 2001), Plaut et al. (1996, p. 99) tiveram que supor que certas pessoas aprendem a ler sem ne-nhum amparo da semântica e, assim, con-seguem ler todas as palavras irregulares sem recorrer à semântica. Porém, em outro traba-lho com o uso dos modelos triangulares, essa suposição foi abandonada:

É importante observar que, como essa versão do modelo triangular pressupõe uma relação causal entre o comprometimento semântico e a dislexia superficial, sua adequação é questio-nada por observações de pacientes com com-prometimento semântico cuja leitura não re-vela um padrão disléxico superficial. (Fushimi et al., 2003, p. 1656)

Um sistema semântico degradado inevi-tavelmente compromete a capacidade de “re-conhecer” uma sequência de letras […] como pertencente ao repertório de palavras reais. (Rogers, Lambon Ralph, Hodges e Patterson, 2004, p. 347)

Segundo o Modelo 3, tal qual aplicado à análise da dislexia superficial, os leitores hu-manos intactos possuem duas rotas da escrita à fala. Vamos chamá-las, de uma forma neutra em relação a teorias, Rota A e Rota B. As pro-priedades dessas rotas são:

a. A Rota A consegue ler todas as palavras conhecidas (regulares ou irregulares) em voz alta corretamente, mas não consegue ler não palavras em voz alta corretamente.

b. A Rota B consegue ler todas as palavras regulares e todas as não palavras em voz alta corretamente, mas lê incorretamente X% das palavras irregulares.



Esse modelo conexionista de dupla rota da leitura em voz alta difere do modelo não conexionista de dupla rota da leitura em voz alta (Coltheart et al., 2001, discutido a seguir) apenas com relação ao valor de X. Segundo Plaut e colaboradores (1996), na situação pré--mórbida, X pode, em raras ocasiões, ser zero (nos pacientes supracitados, que são normais na leitura de palavras irregulares, mas apre-sentam comprometimentos semânticos gra-ves), mas geralmente não é, podendo chegar pelo menos a 64% (a taxa de erro geral do pa-ciente KT com palavras irregulares). Segundo o modelo DRC, X é sempre 100%.

Desse modo, embora seja logicamente possível que o sistema que os seres humanos usam para ler em voz alta tenha uma arqui-tetura de rota única, não existem hipóteses teóricas sobre essa arquitetura que possam escapar da refutação com base nos dados dis-poníveis de estudos sobre leitores com desen-volvimento típico e comprometidos. Todos os modelos são modelos de dupla rota. A teori-zação atual e futura é e será sobre os detalhes dessas duas rotas.

Simulando a dislexia fonológica adquiridaHarm e Seidenberg (2001) usaram outro mo-delo triangular conexionista em um trabalho que visava simular a dislexia fonológica ad-quirida. Em sua visão, essa forma de dislexia adquirida sempre é causada por um compro-metimento fonológico. Portanto, depois de treinarem seu modelo até que tivesse um bom desempenho na leitura de palavras e não pa-lavras, eles lesionaram o componente fonoló-gico do modelo, adicionando ruído aleatório cada vez que as unidades do componente fos-sem atualizadas. Isso prejudicou a leitura de não palavras mais que a leitura de palavras e, assim, simulou a dislexia fonológica. Todavia, essa explicação da dislexia fonológica adqui-rida prevê que não haverá casos do transtor-

no sem a presença de um comprometimento fonológico e essa previsão está incorreta. Dé-rouesné e Beauvois (1985), Bisiacchi, Cipo-lotti e Denes (1989), e Caccappolo-van Vliet, Miozzo e Stern (2004) publicaram casos de dislexia fonológica adquirida com processa-mento fonológico preservado.

Como vimos, o desenvolvimento de mo-delos triangulares conexionistas da leitura foi consideravelmente influenciado por tenta-tivas de simular a dislexia adquirida; e essa abordagem também foi aplicada à simulação da dislexia do desenvolvimento.

Simulando a dislexia do desenvolvimento. Harm e Seidenberg (1999) desenvolveram um modelo para simular transtornos do de-senvolvimento da leitura. Seu modelo trian-gular específico diferia de todos os modelos triangulares anteriores em diversas maneiras:

a. A aprendizagem nas unidades fonológicas foi assistida pela presença de um conjun-to de unidades de limpeza anexadas às unidades fonológicas.

b. As unidades fonológicas representavam características fonéticas e não fonemas.

c. As unidades ortográficas representavam letras e não grafemas.

d. A codificação posicional da ortografia era relativa à vogal na sequência de estímulos, em vez de absoluta.

Depois do treinamento, o modelo atingiu níveis satisfatórios de desempenho na leitura de palavras irregulares no conjunto de treina-mento e também na leitura de não palavras (embora, mais uma vez, o desempenho pare-cesse um pouco inferior à leitura de não pala-vras por humanos).

Harm e Seidenberg (1999) estavam inte-ressados especificamente em tentar simular a dislexia do desenvolvimento. Tendo mostrado que seu modelo triangular era capaz de apren-der a ler adequadamente, eles investigaram



maneiras de impedir a sua aprendizagem que pudessem resultar em dois subtipos diferentes de dislexia do desenvolvimento, um em que a leitura de não palavras é afetada seletivamen-te (dislexia fonológica do desenvolvimento) e outro em que a leitura de palavras irregulares é afetada seletivamente (dislexia superficial do desenvolvimento; Harm e Seidenberg pre-feriam o termo “reading delay dyslexia”, pois acreditavam que a leitura de crianças com dis-lexia superficial do desenvolvimento é igual à leitura de crianças menores que estão apren-dendo a ler normalmente).

Como Harm e Seidenberg (1999) acre-ditavam que a dislexia fonológica evolutiva sempre é causada por um déficit do proces-samento fonológico da criança, sua aborda-gem para simular a dislexia fonológica do desenvolvimento envolvia lesionar o sistema fonológico do modelo. Isso foi feito de duas maneiras diferentes:

a. Comprometimento fonológico leve: um pequeno grau de decaimento de pesos foi imposto sobre as unidades de característi-cas fonéticas por meio do treinamento.

b. Comprometimento fonológico mode-rado: além do decaimento de pesos, as unidades de limpeza foram removidas da rede, assim como uma porcentagem alea-tória de 50% das interconexões entre as unidades de características fonéticas.

Os dois tipos de lesão comprometeram a capacidade do modelo de aprender a ler não palavras. Todavia, quando esse comprome-timento era mais que leve, a capacidade do modelo de aprender a ler palavras também foi comprometida. Assim, o que não pode ser simulado aqui foi a dislexia fonológica do de-senvolvimento grave e pura (em que “pura” significa que a leitura de palavras está na faixa normal, e “grave” significa que o comprome-timento da leitura de não palavras era mais do que leve). Isso suscita a seguinte questão:

é possível haver dislexia fonológica do desen-volvimento grave e pura em leitores huma-nos? Alguns casos foram publicados (ver, p. ex., Campbell e Butterworth, 1985; Funnell e Davison, 1989; Holmes e Standish, 1996; Howard e Best, 1996; Stothard et al., 1996). Assim, esses dados da neuropsicologia cogni-tiva do desenvolvimento proporcionam um desafio para o modelo conexionista da leitura de Harm e Seidenberg (1999).

A dislexia superficial do desenvolvimento (“reading delay dyslexia”) foi simulada no tra-balho de Harm e Seidenberg (1999), reduzin-do-se o número de unidades ocultas na rede de 100 para 20 e também reduzindo a taxa de aprendizagem da rede. Os dois tipos de lesão evolutiva na rede prejudicaram a aprendiza-gem de palavras irregulares mais que a apren-dizagem de não palavras; porém, nos dois ca-sos, a aprendizagem de não palavras também sofreu. Assim, não foi possível simular a disle-xia superficial do desenvolvimento “pura” (i.e., leitura comprometida de palavras irregulares com leitura normal de não palavras). Toda-via, a dislexia superficial do desenvolvimento pura é observada em leitores humanos (Cas-tles e Coltheart, 1996; Hanley e Gard, 1995; Goulandris e Snowling, 1991). Portanto, mais uma vez, esses dados da neuropsicologia cog-nitiva do desenvolvimento não proporcionam suporte para o modelo conexionista da leitura de Harm e Seidenberg (1999).

Conclusões

Os teóricos da leitura são unânimes em relação à existência, no sistema humano de leitura, de dois procedimentos separados para a leitura em voz alta – ou seja, duplas rotas da escrita à fala. Uma dessas rotas de processamento so-mente pode ser utilizada quando o estímulo a ser lido for uma palavra real; ela não consegue ler não palavras. A outra rota consegue ler to-



das as não palavras e palavras regulares; ainda existe debate com relação ao nível da sua capa-cidade de ler palavras irregulares.

Esses modelos de dupla rota diferem no sentido de se são modelos conexionistas, como os modelos triangulares, ou modelos não conexionistas, como o modelo DRC. Atualmente, os dados favorecem a abordagem não conexionista. O modelo DRC faz um bom trabalho em simular padrões de dislexia adquirida que os modelos conexionistas não

conseguem. Além disso, os modelos conexio-nistas não conseguem explicar os transtornos do desenvolvimento da leitura, ao passo que o modelo DRC é compatível com tudo o que sabemos atualmente sobre esses transtornos. Finalmente, nenhum dos modelos conexio-nistas consegue explicar todos os fenômenos dos estudos supracitados para a leitura normal (ver a seção “O que o modelo DRC consegue explicar”), mas todos podem ser simulados pelo modelo DRC.


Documents

Processos de reconhecimento de palavras na leitura - LARPSIlivraria1.tempsite.ws/config/imagens_conteudo/pdf/cap_01.pdf · A pronúncia de uma palavra apresentada visualmente envolve