36
E

Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

  • Upload
    others

  • View
    22

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

Análise Lexical

José Borges Neto (UFPR-CNPq)

1 Identi�cação de Palavras

A questão básica tratada nos exercícios desta seção é o da identi�cação daspalavras. Embora pensemos saber o que é uma palavra, trata-se de uma noçãoteórica que nem sempre encontra uma contraparte �concreta� fácil de identi�-car.1

Como diz Langacker (1972, p. 36):

Basic concepts like the notions word and morpheme turn out tobe surprisingly problematic when examined in detail. Furthermore,the lexical analysis of a language is intimately connected with itssyntactic and phonological analysis and cannot be completed withoutconsiderable progress in these other domains. For all these reasons,lexical analysis merits careful consideration2

Observe a di�culdade que enfrentamos na delimitação das palavras do por-tuguês tentando delimitá-las no exercício abaixo (numa transcrição fonética�grossa�):

1. [azázazdazávesãwazúys �as asas das aves são azuis�2. azázazdazborbolétasãwazúys �as asas das borboletas são azuis�3. aspátazdazávesãwmax�õs �as patas das aves são marrons�4. aázadaávestákebráda �a asa da ave está quebrada�5. azázazazúyzdazávesãwbonítas �as asas azuis das aves são bonitas�6. azborbolétast�e�yázazazúys �as borboletas têm asas azuis�7. azborbolétast�e�yázasprétas �as borboletas têm asas pretas�8. obíkodaáve�Eazúw �o bico da ave é azul�9. ozbíkozdazávesãwazúys] �os bicos das aves são azuis�

1tradução e adaptação de excertos de Langacker, R.W. Fundamentals of Linguistic Analy-

sis. New York: Harcourt Brace Jovanovich, 1972, Capítulo 2. Este trabalho contou coma preciosa colaboração dos professores Maria José Foltran e Márcio Renato Guimarães e deinúmeros estudantes que avaliaram uma versão preliminar.

2Conceitos básicos como as noções de palavra e morfema tornam-se surpreendentemente

problemáticos quando examinados em detalhe. Mais que isso, a análise lexical de uma língua

está intimamente ligada com suas análises sintática e fonológica e não pode ser levada a

efeito sem considerável progresso nesses outros domínios. Por todas essas razões, a análise

lexical merece cuidadosa atenção

1

Page 2: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

1.1 A recorrência como critério para o isolamento das pa-

lavras.

Uma palavra pode ser de�nida parcialmente como a forma fonológica que apa-rece recorrentemente nos dados com signi�cado constante. Um passo para adelimitação de palavras, então, consiste em identi�car seqüências fonéticas re-correntes e investigar se as ocorrências dessa possível unidade podem ser relaci-onadas a um componente de signi�cado constante.

Descobrir seqüências fonológicas com signi�cado constante que são recor-rentes não é su�ciente porque unidades obtidas apenas com base nesse critériopodem ser muito pequenas ou muito grandes. Consideremos a palavra inglesa[kaet], que é recorrente e se associa a um componente de signi�cado que podeser simbolizado por �gato�. Toda vez que a seqüência [kaet] ocorre associadacom o signi�cado �gato�, seqüências menores como [kae] ou simplesmente [ae]também ocorrem. No entanto, se [kae] ou [ae] fossem postulados como a uni-dade correspondente ao signi�cado �gato�, teríamos resíduos, tais como [k] ou[t], aos quais não poderíamos atribuir um signi�cado. Numa análise adequada,as unidades de palavras postuladas devem ser amplas o su�ciente para evitar aproliferação de elementos sem signi�cado. Da mesma forma, seqüências maioresque a palavra encontram a condição de recorrência com signi�cado constante:sintagmas, orações e mesmo a sentença toda têm essa propriedade. Unidadesmaiores, desse tipo, podem ser excluídas, em virtude do fato de que contêmseqüências menores que, em si, preenchem a condição de recorrência com signi-�cado constante. As unidades postuladas como palavras devem ser as menoresunidades que preenchem a condição. (Consideraremos a distinção entre palavrase morfemas mais adiante.)

Essa caracterização de critérios para identi�car palavras é, na verdade, so-mente uma primeira aproximação; outras considerações que entram em jogoserão discutidas depois da apresentação dos dois problemas que seguem.

Problema 1: Mandarim

O mandarim é a língua mais falada do mundo. É originário da China, ondeé a língua o�cial, mas é falada em diversos outros países por onde se espalhaa diáspora chinesa. O exercício consiste em isolar as palavras nas sentençasseguintes e estabelecer seu signi�cado. Para o propósito desse exercício, aspalavras podem ser de�nidas como as menores unidades fonológicas com signi�-cado constante que são recorrentes. Sua análise deve ser tal que cada segmentode cada sentença corresponda a uma palavra, ou seja, quando a sentença for

2

Page 3: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

dividida em palavras, não deve haver nenhum resíduo.

1. [wochangge] �eu canto canções�2. [woxihuanshu] �eu gosto de livros�3. [tachangguoge] �ele cantou canções�4. [laoshizaidaimaizi] �o professor está usando chapéu�5. [lisixihuanshi] �Lisi gosta de poemas�6. [xueshengzaidaiguomaizi] �o estudante estava usando chapéu�7. [taxiangxinguoni] �ele acreditou em você�8. [nixiangxinwo] �você acredita em mim�9. [wozaishuijiao] �eu estou dormindo�10. [zangshanzaichangge] �Zangshan está cantando canções�11. [laoshizaichangguoge] �o professor estava cantando canções�

Problema 2: Luiseño

Luiseño é uma língua da família Uto-Azteca falada no sul da Califórnia.Isole as palavras nas sentenças abaixo e estabeleça seus signi�cados. Use a

mesma de�nição provisória de palavra do problema 1 (menores unidades fono-lógicas recorrentes com signi�cado constante), evitando resíduos.

Símbolos fonológicos:

[P] é a oclusão glotal;

[q] é uma oclusiva pós-velar surda;

Dois símbolos de vogais juntos valem por uma vogal longa (quando avogal longa for acentuada, o símbolo do acento será escrito na primeiradas duas vogais). Assim, [óo] é uma vogal posterior média arredondadaque é simultaneamente longa e acentuada.

1. /nawítmalqáywukálaqpokíik/ �a menina não está andando para casa�2. /yaPáSpolóov/ �o homem é bom�3. /yaPáSwukálaqpokíik/ �o homem está andando para casa�4. /nawítmalwukálaqpokíik/ �a menina está andando para casa�5. /yaPáSqáywukálaq/ �o homem não está andando�6. /nawítmalqáypolóov/ �a menina não é boa�7. /yaPáSwukálaqpokíik/ �um homem está andando para casa�

Discussão:

Unidades lexicais podem ser identi�cadas na comparação de sentenças quesão muito semelhantes, mas não idênticas. Por exemplo, (3) e (4) compartilhamo signi�cado �estão andando para casa� e a seqüência fonética [wukálaqpokíik].A diferença [yaPáS] versus [nawítmal] deve ser responsável pela distinção semân-tica �o homem� versus �a menina�. As sentenças (1) e (4) são idênticas, exceto

3

Page 4: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

pela presença da unidade [qáy] em (1), que evidentemente contribui com o sig-ni�cado de �não�. Contrastando (4) e (5) nós descobrimos que [wukálaqpokíik]se decompõe nas unidades menores [wukálaq] �está andando� e [pokíik] �paracasa�. Finalmente, a unidade [polóov] �é bom� pode ser isolada se subtrairmosde (2) ou de (6) unidades que já foram identi�cadas.

Os dados não trazem evidências de que quaisquer desses elementos possamser divididos em unidades menores. [polóov] �é bom� e [pokíik] �para casa� com-partilham a seqüência fonética [po], mas não há, aparentemente, componente dosigni�cado que possa, de forma plausível, ser atribuída a essa seqüência nas duascombinações. Não há fundamento para a divisão de [wukálaq] �está andando�em, digamos, [wu] �está� e [kálaq] �andando� porque nem [wu] nem [kálaq] apa-recem a não ser em conjunto; qualquer segmentação dessa unidade recorrenteserá meramente especulativa, frente aos dados de que dispomos. Também nãopodemos dividir [yaPáS] �o homem� e [nawítmal] �a menina� em artigo+nome,a não ser de forma absolutamente arbitrária; na verdade, (3) e (7) sugerem que�o� e �um� (de�nição e inde�nição) não são expressos em Luiseño.

Solução:

�homem� = yaPáS �é bom� = polóov �não� = qáy�menina� = nawítmal �está andando� = wukálaq �para casa� = pokíik

As sentenças (2) e (6) mostram que o Luiseño pode expressar com umaúnica palavra o que o português só pode expressar com a seqüência ser+ADJ.Da mesma forma, a palavra [wukálaq] e a palavra [pokíik] equivalem, em por-tuguês, a seqüências de palavras: verbo auxiliar + particípio e preposição +substantivo, respectivamente. Outra diferença está na ausência nas sentençasdo Luiseño de qualquer palavra que corresponda ao artigo; Luiseño não tempalavras para signi�car �o/a� e �um/uma�, assim [yaPáS] pode tanto signi�car �ohomem� quanto �um homem�.

As diferenças entre sentenças correspondentes de duas línguas podem sermuito maiores do que essas. A lição que esses exercícios nos dão é que quandoanalisamos uma língua que não conhecemos nunca sabemos com certeza quecomponentes do signi�cado podemos prever numa sentença tomando por basesua tradução; nem podemos saber precisamente como os componentes do sig-ni�cado se agruparão em palavras. Quando estudamos as unidades fonológicasque aparecem recorrentemente com signi�cado constante, então, devemos evitara imposição aos dados da estrutura lexical e semântica de outra língua, seja anossa, seja outra semelhante.

4

Page 5: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

1.2 Fenômenos fonológicos como critério para o isolamen-

to de palavras.

Evidência fonológica também é importante para a delimitação de palavras.Suponha, por exemplo, que um lingüista que não sabe nada sobre o Luiseñoencontre-se diante da sentença [nawítmalqáywukálaqpokíik] �a menina não estáandando para casa�. Embora sua ignorância do sistema fonológico dessa línguaevite que ele tire conclusões até que mais dados estejam disponíveis, seu co-nhecimento das tendências fonológicas universais permitirá, ao menos, que elelevante algumas hipóteses tentativas. Ele sabe, por exemplo, que línguas quefazem uso sistemático do acento intensivo têm a tendência de apresentar apenasuma vogal forte em cada palavra. Ele também sabe que seqüências de consoan-tes (clusters) não são muito freqüentes nas línguas, particularmente no interiorde uma palavra, e que a seqüência formada pela última consoante de uma pa-lavra e a primeira consoante da palavra seguinte muitas vezes forma um clusterque não pode ocorrer no interior de uma palavra isolada. Ele pode especular,com base nisso, que a sentença do Luiseño deve ser segmentada em palavrascomo [nawítmal qáy wukálaq pokíik] ou como [nawít malqáy wukálaq pokíik].Enquanto não obtiver novas evidências, no entanto, ele não poderá decidir qualsegmentação é a correta, nem poderá ter certeza de que não está completamenteerrado.

Qualquer uso sistemático da evidência fonológica para a determinação e alocalização dos limites de palavras supõe, então, um conhecimento parcial dosistema fonológico da língua em questão. Da mesma forma, a análise fonológicade uma língua só pode avançar após muitas palavras e limites de palavras emorfemas terem sido localizados. Esta situação ilustra a dependência mútuados diferentes aspectos de um sistema lingüístico. O investigador não podecompletar a análise lexical primeiro e, em seguida, ir para a fonologia e depoispara a sintaxe; ele deve investigar todas essas áreas simultaneamente, usandoas regularidades que ele descobre em uma área como ajuda para a solução dosproblemas nos outros domínios.

Vários tipos de evidências fonológicas mostram-se relevantes na demarcaçãode palavras. Já vimos que o acento intensivo pode ser relevante, e algumasvezes pode servir como indicador bastante preciso de limite de palavra. Emfrancês, por exemplo, o acento lexical cai sempre na última vogal da palavra(sem contar a vogal reduzida [@]); sob circunstâncias normais, a ocorrência deuma vogal acentuada numa sentença do francês indica a existência de um limitede palavra antes da próxima vogal. Sabendo disso, podemos concluir que asentença abaixo contém ao menos cinco palavras e que um dos limites estáimediatamente antes de [´O], outro antes de [í] ou [íS], um terceiro antes de [�E] ou[�Es], e um quarto antes de [´E] ou [´Eg].

aöiSEöSEs´Egars´OEtEliZ´a�Henry procura cinco rapazes inteligentes�

5

Page 6: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

O acento pode ajudar a delimitar palavras em qualquer língua em que ocor-ram números �xos de sílabas antes ou depois dos limites de palavras.

Quaisquer outros fenômenos revelados pela análise fonológica de uma língua,associados aos limites de palavras, podem ser importantes para a demarcaçãodesses limites. Por exemplo, as consoantes oclusivas em Luiseño são normal-mente não-aspiradas, mas a aspiração (marcada pelo diacrítico [h]) pode acom-panhar opcionalmente uma consoante oclusiva de �m de palavra. A palavrapara �cobertor� pode ser pronunciada [táanat] ou [táanath], mas o [t] inicial nãopode ser aspirado. A ocorrência de uma oclusiva aspirada em Luiseño, então,indica a presença de um limite de palavra.

Outro exemplo, bastante diferente, está na língua Chumash, uma línguaindígena norte-americana, agora extinta, da família Hokan. No interior de umapalavra, duas ocorrências de [s] ou duas ocorrências de [S] são possíveis, mas [s] e[S] não podem ocorrer juntos na mesma palavra; esta restrição é um exemplo doque chamamos de harmonia, o requisito de que certos tipos de sons no interiorda palavra (ou outras unidades) sejam similares em alguns aspectos. As formas[ksaqutinánPus] �eu contei uma história a ele� e [SaqutinánPiS] �história� sãopalavras chumash, mas [saqutinánPiS] não é bem formada. Se tanto [s] quanto[S] aparecem numa seqüência fonética podemos deduzir que um limite de palavradeve estar presente em algum ponto entre eles.

Os dois problemas a seguir ilustram o uso de evidências fonológicas no iso-lamento de palavras. Considerações sintáticas também são levadas em conta.

Problema 3: Papago

Papago é uma língua indígena do grupo Uto-Azteca falada no sul dos EstadosUnidos. O acento é regular em Papago e pode ser usado na identi�cação daspalavras. Na Parte A você vai determinar a regularidade do acento em Papagoe nas partes B e C você vai isolar as palavras.

Parte A:

Formule uma regra que dê conta da regularidade do acento intensivo nosexemplos abaixo.

dóPag �montanha� táatam �dente�Páañi �eu� h�1wagid �emitir cheiro�móPo �cabeça� náak �carro�háPasa �desistir� PáaPim �nós�bán �coiote� ñ�1id �ver�

Solução:

O acento cai na primeira vogal da palavra.

6

Page 7: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

Discussão:

A regularidade na colocação do acento não deve ser entendida como se to-das as palavras do Papago fossem acentuadas. A ocorrência em sentenças (dopapago e de outras línguas) de elementos não-acentuados (ou de elementos comacento secundário) que, por outros aspectos, devem ser vistos como palavrasé bastante comum. Por exemplo, no português, as palavras �as� e �são� nasentença �as asas das aves são azuis� não apresentam acento (são átonas).

Parte B:

Localize os limites das palavras nas seguintes sentenças.

Assuma:

• nenhuma palavra termina com um grupo de consoantes (i.e., as palavrasterminam com vogal ou com consoante simples);

• nenhuma palavra tem mais do que três sílabas.

1. máaginaPom�1d �o carro está correndo�2. wákialPo£íkpan �o vaqueiro está trabalhando�3. wísiloPohúhuPidgmíistol �o bezerro está perseguindo o gato�

Discussão:

A seqüência recorrente [Po] deve ser considerada uma palavra separada. Em(1), por exemplo, [Pom�1d] não pode ser uma palavra, já que essa palavra violariaa regra do acento; nem [máaginaPo] poderia ser uma palavra porque seria umapalavra de quatro sílabas. A seqüência [húhuPidgmíistol] em (3) deve conter umlimite de palavra em algum lugar entre [i] e [íi] porque o último, sendo acentuado,deve ser a primeira vogal da palavra. O limite de palavra não pode vir depoisde [húhuPidgm] ou [húhuPidg] porque nenhuma palavra pode terminar com umgrupo de consoantes. A segmentação [húhuPi dgmíistol] é bastante improvável;[dgm] é bastante não natural como cluster inicial, e é especialmente estranhono Papago. A segmentação apropriada é provavelmente [húhuPid gmíistol].

Solução:

1. máagina Po m�1d2. wákial Po £íkpan3. wísilo Po húhuPid gmíistol

Parte C:

Usando os resultados obtidos nas partes A e B,

1. isole as palavras das sentenças (4) a (8);

2. liste todas as palavras das sentenças (1) a (8) com os seus signi�cados.

7

Page 8: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

4. m�1dPomáagina �o carro está correndo�5. £�1posidPogwákialgwísilo �o vaqueiro está marcando o bezerro�6. míistolPohúhuPidgwákial �o gato está perseguindo o vaqueiro�7. £�1posidPogPáaligmíistol �a criança está marcando o gato�8. PáaliPo£íkpan �a criança está trabalhando�

Solução:

4. m�1d Po gmáagina5. £�1posid Po gwákial gwísilo6. míistol Po húhuPid gwákial7. £�1posid Po gPáali gmíistol8. Páali Po £íkpan

�estar� = Po �vaqueiro� = wákial, gwákial�trabalhar� = £íkpan �bezerro� = wísilo, gwísilo�correr� = m�1d �gato� = míistol, gmíistol�perseguir� = húhuPid �criança� = Páali, gPáali�marcar� = £�1posid �carro� = máagina, gmáagina

Discussão:

O signi�cado de [Po] não pode ser determinado precisamente com base nosdados disponíveis. Ele pode ser apenas um marcador de tempo presente; elepode ser equivalente ao progressivo do português �está ... ndo� ou pode ter al-guma outra função. A regra lexical �estar� = Po é apenas uma hipótese possível.

O estatuto do elemento [g] é mais problemático. Ele pode equivaler ao artigode�nido, mas os dados são insu�cientes para mostrar isso. Os dados tambémsão insu�cientes para que o consideremos uma palavra separada. o [g] apareceregularmente antes de um substantivo, exceto quando este está no início dasentença; dependendo da posição um substantivo pode aparecer com ou sem [g].

As formas [m�1d] e [máagina] só aparecem nas sentenças (1) e (4). Nenhumadessas duas sentenças, sozinha, indica o que signi�ca �carro� e o que signi�ca�correr�. No entanto, o resto dos dados permite concluir que o [g] só apareceantes de substantivo e, assim, podemos concluir que [máagina], porque apareceantecedida de [g] na sentença (4), deve signi�car �carro�.

Problema 4: Turco

O turco é uma língua com harmonia vocálica (todas as vogais de uma pala-vra devem ser similares em algum aspecto). As palavras constituem o domíniorelevante para a harmonia, portanto, esse fenômeno pode ser usado para a deter-minação dos limites de palavras. Na Parte A você vai descobrir a regra básicada harmonia vocálica; você vai usar essa regra para isolar palavras na Parte B

8

Page 9: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

e vai completar a análise na Parte C.

Parte A: descoberta da regra de harmonia vocálica.

1. Sistema de vogais do turco:

Ant n-arr Ant arr Post n-arr Post arraltas i ü 1 unão-altas e ö a o

As oito vogais do turco são de�nidas a partir de três traços fonológicos(altura, anterioridade e arredondamento). Por exemplo:

[ü] = vogal alta, anterior, arredondada;[a] = vogal não-alta, posterior, não-arredondada.A harmonia vocálica requer que todas as vogais de uma mesma palavra,

�concordem� em um desses traços (ou seja, apresentem o mesmo valor para umdos traços).

Observe as seguintes palavras do turco e estabeleça a regra de harmoniavocálica:

evde �em casa� ald1m �peguei�ankara �Ankara� odas1 �seu quarto�verdim �dei� odun �madeira�köprü �ponte� göstermek �mostrar�

Discussão:

A harmonia vocálica não depende dos traços alta/não-alta porque vogaisaltas e não-altas ocorrem numa mesma palavra (por exemplo, [verdim] �dei�,[ald1m] �peguei�). O arredondamento não é o traço crucial (para esses dados, aomenos) porque vogais arredondadas e não-arredondadas coocorrem em [odas1]�seu quarto� e [göstermek] �mostrar�. Assim, o traço relevante deve ser ante-rior/posterior.

Solução:

As vogais de uma palavra devem ser todas anteriores ou todas posteriores.

Parte B:

Divida as seguintes sentenças em palavras

• fazendo as palavras tão grandes quanto possível;

• observando a regra de harmonia vocálica;

• considerando que nenhuma palavra comece ou termine por encontro con-sonantal;

9

Page 10: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

• considerando que uma consoante entre duas vogais, num limite de palavra,sempre pertence à segunda palavra.

1. £ay1i£tik �Nós bebemos o chá�2. odadabir£o��ukgördüm �Eu vi uma criança no quarto�

Solução:1. £ay1 i£tik2. odada bir £o��uk gördüm

Parte C:

Usando os resultados das Partes A e B, isole as palavras nas sentenças (3) e(4). Liste todas as palavras das sentenças (1) - (4), com seus signi�cados.

3. k1zlar1gördüm �Eu vi as meninas�4. biradamgördüm �Eu vi um homem�

Discussão:

A palavra [gördüm] foi isolada em (2); ela reaparece em (2) - (4) com o sig-ni�cado �eu vi�. O resto de (3), [k1zlar1], deve ser constituído por apenas umapalavra, uma vez que só apresenta vogais posteriores. O restante de (4), [bira-dam], deve ser constituído de duas palavras, já que [i] é anterior e [a] é posterior.A segmentação adequada é [bir adam], uma vez que [bir] já foi isolado antes;[bir] deve signi�car �um/uma� (artigo inde�nido) e [adam], em conseqüência,deve signi�car �homem�.

Na determinação dos signi�cados das outras palavras, precisamos fazer in-terferir considerações sintáticas. Em (4), [bir] �um� precede o substantivo quemodi�ca; tentativamente, assumindo que esta ordem é constante, podemos le-vantar a hipótese de que [£o��uk] é palavra para �criança�, em (2), �cando [odada]como a palavra para �no quarto�. O verbo aparece no �nal das sentenças (2) -(4); se isso é regular em turco, o verbo em (1) deve ser [i£tik], signi�cando �nósbebemos�. [£ay1], conseqüentemente, signi�ca �o chá�.

Solução:3. k1zlar1 gördüm4. bir adam gördüm

�eu vi� = gördüm �criança� = £o��uk �as meninas� = k1zlar1�nós bebemos� = i£tik �homem� = adam �o chá� = £ay1�um/uma� = bir �no quarto� = odada

10

Page 11: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

1.3 Critérios sintáticos no isolamento de palavras.

Como os exercícios 3 e 4 mostraram, a evidência sintática é relevante paraa análise lexical. No exercício do Papago, fomos capazes de usar uma regrasintática - especi�camente, a regra que nos diz que [g] precede o substantivo(exceto no início da sentença) - para decidir que [máagina] é um substantivo e[m�1d] um verbo. No exercício do Turco usamos certas assunções sobre a ordemdas palavras para atribuir signi�cados a unidades que haviam sido isoladas porcritérios fonológicos. Assumindo que [bir] sempre precede o substantivo quemodi�ca, identi�camos [£o��uk] como a palavra para �criança�; [i£tik] recebeu osigni�cado �nós bebemos� em virtude da hipótese de que os verbos aparecemregularmente no �nal das sentenças do turco.

Nesses dois casos, a evidência sintática foi usada para atribuir signi�cados aunidades anteriormente isoladas por critérios fonológicos. Considerações sintá-ticas, no entanto, não se restringem a esse papel secundário na análise lexical;elas são tão importantes quanto as considerações fonológicas na determinaçãodos limites de palavras. Por exemplo, uma vez descoberto que [g] regularmenteprecede um substantivo não-inicial em Papago, a ocorrência de [g] numa seqüên-cia fonética pode ser vista como uma pista de que temos um limite de palavraimediatamente antes. Para um lingüista que desconheça o inglês, por exemplo,a segmentação de seqüências em palavras será facilitada pela descoberta de queo su�xo verbal -ing sempre ocorre em posição de �nal de palavra.

Problema 5: Alemão.

Isole as palavras das sentenças abaixo e determine seus signi�cados. Presteatenção especial nas evidências sintáticas.

1. �ErhátdífráwgE²lágEn�Ele bateu na mulher�

2. zíhátdénmángE²tOsEn�Ela empurrou o homem�

3. zíhátdénknábEgEn�üslixgEtrágEn�Ela carregou prazerosamente o rapaz�

4. gEn�üslixhát�ErdénmángE²lágEn�Ele bateu no homem prazerosamente�

5. dényú­gEnknábEhátzígEn�üslixgE²tOsEn�Ela empurrou prazerosamente o rapaz jovem�

6. dénáltenmánhát�ErgEtrágEn�Ele carregou o homem velho�

7. dénmánhát�ErgE²lágEn�Ele bateu no homem�

8. zíhátdíyú­gEfráwgEn�üslixgE²tOsEn�Ela empurrou prazerosamente a mulher jovem�

Discussão:

11

Page 12: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

As seqüências [�Erhát] e [zíhát] devem ser divididas em duas palavras, já que aexistência de [hát�Er], na sentença (6), e de [hátzí]3, na sentença (5), demonstrama possibilidade de permutação4. [gEn�üslix] é aparentemente uma única palavra,ela permuta como uma unidade, como mostra o par de sentenças (3) e (4), e nãohá indicação de que possa ser separada em duas palavras, pela inserção de outrapalavra. Seqüências de artigo e substantivo como [dénmán] �o homem�, podemà primeira vista parecer uma unidade, já que permutam em conjunto, como em(2) e (7). No entanto, as sentenças (5), (6) e (8) mostram que podemos inserirum adjetivo entre artigo e substantivo, o que signi�ca que eles, provavelmente,devem ser tratados como palavras separadas. O verbo aparece consistentementeno �nal da sentença, nos dados disponíveis, e sempre inicia por [gE] e termina por[En]. Este padrão é útil para a análise de outras sentenças: se uma seqüênciafonética da forma [gE ... En] ocorre no �nal de um enunciado, ela pode seridenti�cada, tentativamente, como um verbo.

Solução:�ele� = �Er �mulher� = fráw�ela� = zí �homem� = mán�o� = dén �menino� = knábE�a� = dí �com gosto� = (�com prazer�) = gEn�üslix�velho� = álten �verbo auxiliar� = hát�jovem� = yú­gE, yú­gEn �empurrar� = gE²tOsEn�bater� = gE²lágEn �carregar� = gEtrágEn

Vale a pena acrescentar que as permutações não são neutras. Elas acrescen-tam algum signi�cado às sentenças. É difícil estabelecer claramente a naturezadesses signi�cados (podíamos falar em �signi�cados estilísticos� aqui). Talvezse trate de focalização ou topicalização (processos em que parte da sentençaé discursivamente destacada). Quando pensamos no signi�cado �literal� dassentenças (o signi�cado associado a condições de verdade) essas característicassemânticas �mais �nas� não são levadas em conta. Se pensarmos numa tradução�discursiva� das sentenças do alemão, o quadro �caria como abaixo:

3[hát] é um verbo auxiliar que ajuda a formação do passado em alemão. É equivalente ao�have� do inglês. [hát gE²lágEn] poderia ser traduzido por �has beaten�, em inglês.

4Além disso, a presença de duas vogais acentuadas é indício de que se tratam de duaspalavras

12

Page 13: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

1. �Er hát dí fráw gE²lágEn�Ele bateu na mulher�(Foi ele que bateu na mulher)

2. zí hát dén mán gE²tOsEn�Ela empurrou o homem�(Foi ela que empurrou o homem)

3. zí hát dén knábE gEn�üslix gEtrágEn�Ela carregou prazerosamente o rapaz�(Foi ela que carregou prazerosamente o rapaz)

4. gEn�üslix hát �Er dén mán gE²lágEn�Ele bateu no homem prazerosamente�(Foi com prazer que ele bateu no homem)

5. dén yú­gEn knábE hát zí gEn�üslix gE²tOsEn�Ela empurrou prazerosamente o rapaz jovem�(Foi o rapaz jovem que ela empurrou prazerosamente)

6. dén álten mán hát �Er gEtrágEn�Ele carregou o homem velho�(Foi o homem velho que ele carregou)

7. dén mán hát �Er gE²lágEn�Ele bateu no homem�(Foi no homem que ele bateu)

8. zí hát dí yú­gE fráw gEn�üslix gE²tOsEn�Ela empurrou prazerosamente a mulher jovem�(Foi ela que empurrou prazerosamente a mulher jovem)

1.4 Conclusão

Em suma, muitos fatores diferentes são relevantes para determinar se umaseqüência fonética é uma palavra ou não: recorrência com signi�cado cons-tante; a naturalidade de uma pausa; a possibilidade de constituir um enunciadoisolado; interação com regras fonológicas; a impossibilidade de inserir outraspalavras na seqüência; comportamento como uma unidade na permutação; e,também, a intuição do falante nativo. Nenhum critério, aplicado mecanica-mente, é su�ciente para revelar, em todos os casos, um resultado adequado. Naverdade, diferentes critérios podem implicar em diferentes segmentações, e namedida em que isso seja verdade a noção de palavra �ca um tanto vaga. Ainda,a posição de um limite de palavra pode variar conforme variem o estilo ou avelocidade da fala. Não obstante, essa dose de indeterminação na identi�caçãodas palavras não pode invalidar o uso das evidências estruturais e intuitivas nalocalização dos limites de palavras na grande maioria dos casos relativamenteclaros.

13

Page 14: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

1.5 Anexo 1: Questões do português

No português há alguns casos problemáticos de identi�cação de palavras, quevêm sendo discutidos há muitos anos e sobre os quais não há consenso. Vale apena estudá-los.

1. Os advébios terminados em �mente�

O primeiro caso é o dos advérbios terminados em -mente (felizmente, ti-midamente, realmente, etc.). Uma das posições assume que o -mente é umapalavra e a outra assume que o -mente é um su�xo. Pense em casos como �felize alegremente�, �rápida e completamente�, �positiva ou negativamente� e tenteargumentar em favor de uma posição que considere o -mente como uma palavra(e não um su�xo).

2. O �sufixo� -zinho/aO segundo caso é o do pseudo-su�xo -zinho/a. Note que palavras com esse

su�xo fazem a �exão de gênero e de número DUAS vezes.

�menino� �meninozinho� �meninozinhos��menina� �meninazinha� �meninazinhas��papel� �papelzinho� �papeizinhos��empurrão� �empurrãozinho� �empurrõezinhos�

Se pensarmos que o morfema de plural, que é normalmente [-s] ou [-z] emportuguês, ao encontrar-se com o [z] inicial de "zinho"sofre assimilação, podemosimaginar que em �empurrõezinhos� o que temos é �empurrões + zinhos�. Pensenuma argumentação para sustentar a hipótese de que �zinho� é, de fato, umapalavra (e não um su�xo).

14

Page 15: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

1.6 Anexo 2: Problemas adicionais

Problema adicional 1: Luiseño

Isole as palavras das sentenças seguintes e estabeleça seus signi�cados. Osímbolo [x] representa uma fricativa velar surda e o símbolo [ù] representa umafricativa retro�exa surda, pronunciada com a ponta da língua se aproximandodo palato imediatamente atrás dos alvéolos.

1. húuPunikatqáy£ipómkat�O professor não é um mentiroso�

2. háxùuxé£iqùu­áali�Quem está batendo na mulher?�

3. tóowqùuùu­áalihúuPunikat�O professor vê a mulher?�

4. Pivíùu­áalnonáayixé£iq�Esta mulher está batendo em meu pai�

5. nonáayiùuxé£iqPivíùu­áal�Esta mulher está batendo em meu pai?�

6. PivíhúuPunikatqáynonáayitóowq�Este professor não vê meu pai�

7. húuPunikatùu£ipómkat�O professor é um mentiroso?�

8. ùu­áaliùutóowqhúuPunikat�O professor vê a mulher?�

9. Pivíùu­áalxé£iqnonáayi�Esta mulher está batendo em meu pai�

10. húuPunikat£ipómkat�O professor é um mentiroso�

11. ùu­áalitóowqhúuPunikat�O professor vê a mulher�

12. xé£iqùuùu­áalPivínonáayi�Esta mulher está batendo em meu pai?�

13. háxùu£ipómkat�Quem é mentiroso?�

14. PivíhúuPunikatnonáayitóowq�Este professor vê meu pai�

15. húuPunikatùutóowqùu­áali�O professor vê a mulher?�

15

Page 16: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

Problema adicional 2: Palauan

O Palauan é uma língua malaio-polinésia, falada na Micronésia.

Parte A:

Use o critério da permutação para dividir as expressões (1) a (6) em palavras.As expressões equivalem, em português, a sintagmas nominais (SNs) que contêmuma cláusula relativa (oração subordinada adjetiva relativa, na terminologia dagramática tradicional).

1. aPádelme­itákl �O homem que canta�2. amálkelmerrós �A galinha que cacareja�3. akemá­etelráel �A estrada que é comprida�4. amerróselmálk �A galinha que cacareja�5. ame­itáklelPád �O homem que canta�6. aráelelkemá­et �A estrada que é comprida�

Parte B: Isole as palavras das expressões (1) a (10) e dê seus signi�cados.Tenha em mente que o mais normal é que todos os elementos de uma cláusularelativa sejam contíguos.

7. au­ílelPád �O homem que é bom�8. aklówelmerrós �A galinha que é grande�9. au­ílelráel �A estrada que é boa�10. ame­itákleldíl �A mulher que canta�

16

Page 17: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

Problema adicional 3: Asteca Clássico

Os dados abaixo são do Asteca Clássico (o dialeto do Asteca falado na regiãoda Cidade do México quando da conquista espanhola no século XVI). O símbolo[ň] representa uma consoante africada lateral surda. Este som é produzido porum movimento de oclusão com a ponta e os lados da língua seguido de umaliberação do ar apenas nos lados, criando uma turbulência fricativa. [kw] é um[k] labializado.

Parte A:

A colocação do acento é regular no Asteca Clássico e pode ser usada nalocalização dos limites de palavras. Examine as palavras abaixo e formule aregra de colocação do acento.

sénka �muito� némi �vida�íwan �e� tewántin �nós� (pronome)nakáyoň �corpo� ňakwálli �comida�nawaňatóa �falar claramente� sasanílli �história�

Parte B:

Usando a regra de acento postulada na parte A, segmente as sentenças (1) a(3) em palavras. Assuma, para os propósitos do problema, que nenhuma palavracomeça ou termina por encontro consonantal.

1. yéwaňsíwaňkiňasóňa �Ele ama a mulher�2. kimiktíaskóyoň �Ele vai matar o coiote�3. íninňatoánikimiktíassíwaň �Este soberano vai matar a mulher�

Parte C:

Isole as palavras nas sentenças (1) - (14) e estabeleça seus signi�cados.

4. yéwaňkíttakóyoň �Ele vê o coiote�5. íninkóyoňkíttaňatoáni �Esse coiote vê o soberano�6. ňatoánikiňasóňasíwaň �O soberano ama a mulher�7. íninňatoánisíwaňkimiktías �Este soberano vai matar a mulher�8. kíttaňatoáni �Ele vê o soberano�9. kiňasóňaíninsíwaň �Ele ama esta mulher�10. íninkóyoňňatoánikítta �Este coiote vê o soberano�11. ňatoánikítta �Ele vê o soberano�12. kíttakóyoň �Ele vê o coiote�13. yéwaňkiňasóňasíwaň �Ele ama a mulher�14. ňatoánisíwaňkiňasóňa �O soberano ama a mulher�

17

Page 18: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

Problema adicional 4: dialeto Ayutla do Mixtec

Este problema envolve os tons do Ayutla, dialeto do Mixtec (língua falada noMéxico). Cada vogal do Ayutla Mixtec ocorre com um de três tons: alto, médioou baixo. Esses tons serão representados, respectivamente, pelos diacríticos[� � �]. Quando, por exemplo, [a] ocorre com tom alto será representado [á];quando ocorre com tom médio será representado [â]; e simbolizado [à] quandoocorrer com tom baixo. O símbolo [ty] indica um [t] palatalizado, ou seja, um[t] articulado com a oclusão regular e, além disso, com uma oclusão no palato,a oclusão alveolar é liberada primeiro.

O dialeto Ayutla do Mixtec tem uma regra fonológica que afeta a forma deduas palavras adjacentes se a primeira termina com uma oclusão glotal ([P]): aoclusão glotal é apagada e as primeiras três vogais da segunda palavra recebemos tons respectivos alto, alto, baixo ([� � �]). Por exemplo, a palavra que signi�ca�genro� é [kàsáP] e [kâk�ãkàrà] signi�ca �pedirá mais�. Quando essas duas palavrasse combinam para formar a expressão �o genro pedirá mais�, [kàsáP] perde o [P]�nal e o padrão dos tons da segunda palavra muda de [� ���] para [����], �cando[kák�ãkàrà].

kàsáPkâk�ãkàrà → kàsákák�ãkàrà

A ocorrência da seqüência de tons [���] pode, então, ser uma pista de quehá um limite de palavras imediatamente antes.

Usando essa informação fonológica onde for apropriado, isole as palavras nasexpressões abaixo e estabeleça seus signi�cados.

1. kùmísá²ı`ı �Quatro sobrinhos�2. yàtáíkáàP �A cesta é velha�3. nâmàá²ík�ãrà �Ele pediu sabão�4. kòòtíkà£íP �Não há cobertores�5. nâmàváPà �O sabão bom�6. kùmí£ítyáàyàtáP �Quatro bananas velhas�7. kòòká£íìP �Não há algodão�8. kâk`a`unámáàP �Você pedirá sabão�9. ²àkùtíkà£íP �Uns poucos cobertores�10. dîvìváPà �O ovo está bom�

18

Page 19: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

2 Identi�cação de Morfemas

Sentenças transcritas foneticamente podem ser segmentadas em seqüências es-truturalmente signi�cativas de vários tamanhos (sintagmas e palavras, por exem-plo). Os morfemas são as menores dessas unidades que apresentam signi�caçãoconstante. Segmentos sonoros individuais (como o [k] de �cama�) não se qua-li�cam como morfemas porque não se pode atribuir a eles nenhum signi�cado,exceto indiretamente em virtude de pertencerem a seqüências signi�cativas deelementos (é a presença do [k] em �cama� que distingue essa palavra de �lama� oude �gama� que apresentam, respectivamente [l] e [g] no lugar do [k]). Sentençasencaixadas, sintagmas e muitas palavras (como, por exemplo, �casas�) tambémnão se quali�cam como morfemas porque podem ser divididas em partes sig-ni�cativas menores ([káza] �casa� e [s] �plural�). A distinção entre segmentos,morfemas, palavras e seqüências maiores é claramente válida à despeito do fatode que algumas palavras são constituídas por apenas um morfema e algunsmorfemas constituídos por apenas um segmento.

2.1 A recorrência como critério para o isolamento de mor-

femas.

Como o conceito de palavra, o conceito de morfema também apresenta proble-mas quando sua aplicação aos dados lingüísticos é examinada em detalhes. Ade�nição de morfema como a seqüência fonética mínima recorrente com signi-�cado constante apenas pode ser vista como uma primeira aproximação se ade�nição pretender incluir todos os tipos de elementos que os lingüistas tipica-mente designam com o termo. Mesmo assim, essa caracterização é apropriadapara um grande número de morfemas, talvez para a maioria, e provê um pontode partida conveniente. Os três problemas seguintes ilustram essa concepçãobásica de morfema.

Problema 1: Português

Isole os morfemas que constituem as seguintes palavras (transcritas ortogra-�camente).

19

Page 20: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

felizmente mesa casinhas mesaspreocupado feliz casinha maçãinofensivo feito refeito perinhaofensivamente casa infeliz inativodespreocupadamente casona pereira mesonadespreocupado casas ofensivo ativoinofensivamente perona desfeito pêrainfelizmente mesinha ofensiva preocupada

Discussão:

Embora a análise morfológica dessas palavras deva ser intuitivamente óbviapara a maioria dos falantes de português, ela também pode ser estabelecidacom base na de�nição de morfema como a menor seqüência fonética que re-corre com signi�cado constante. Por exemplo, feliz aparece recorrentementecom o mesmo signi�cado em �feliz�, �infeliz�, �felizmente� e �infelizmente�. Pelacontrastação dessas quatro palavras, somos levados a postular três morfemas:feliz, in e mente; numa caracterização grosseira, in signi�ca �ausência de...� emente signi�ca �de modo...�. Mente e in reaparecem em outras palavras, com omesmo signi�cado, tais como �inofensivamente�, �inofensivo� e �ofensivamente�.Os demais morfemas podem ser isolados de forma similar.

Problema 2: Inglês

Isole os morfemas que constituem as seguintes palavras e estabeleça seussigni�cados (as palavras estão transcritas ortogra�camente).

carefully �cuidadosamente� care �cuidado�hopeless �sem esperança� shamefully �vergonhosamente�wrathful �furioso� harmful �prejudicial�harmlessly �inofensivamente� fearful �medroso�stupidly �estupidamente� fearlessness �destemor�cleverness �inteligência� tastefully �com bom gosto�careful �cuidadoso� rapidly �rapidamente�humorless �sem humor� senseless �sem sentido�carelessly �descuidadamente� blamelessly �irrepreensivelmente�untruthfully �falsamente� truthfulness �veracidade�dumbness �mudez� wrathfully �furiosamente�

20

Page 21: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

Solução:care �cuidado� taste �sabor�hope �esperança� rapid �rápido�wrath �fúria� sense �sentido�harm �ofensa� blame �repreensão�stupid �estúpido� clever �inteligente�humor �humor� ful �que tem...�fear �medo� ly �de modo...�truth �verdade� less �sem...�dumb �mudo� ness �aquele/aquilo que é...�shame �vergonha� un �ausência de...�

Discussão:

O morfema inglês ful equivale, em português, a �cheio de...�, �caracterizadopor...�. O morfema ness forma substantivos a partir de adjetivos.

Praticamente, todas as observações constantes da discussão do problema an-terior cabem igualmente para este problema. Cabe observar que unidades recor-rentes maiores, como fully ou truthful, não se quali�cam como morfemas porquecontêm unidades menores (ful, truth, ly) que aparecem sistematicamente associ-adas a componentes de signi�cado constantes. Seqüências recorrentes menores,tal como o ess de ness e less, não são morfemas porque não são signi�cativas.Less e ness não possuem componente de signi�cado em comum que possa seratribuído a ess, e a postulação de tal morfema deixaria resíduos como l e n queparecem não ter signi�cado. A similaridade fonética entre less e ness parece sermera coincidência.

Problema 3: Luiseño

Isole os morfemas nas sentenças abaixo e estabeleça seus signi�cados. Noteque as palavras já estão identi�cadas.

1. nóo wukálaq �Estou andando�2. nóo páaPiq �Estou bebendo�3. temét £áami páaPivi£unin �O sol nos fará querer uma bebida�4. nóo póy wukálavi£uniq �Eu estou fazendo ele querer andar�5. nóo páaPin �Eu vou beber�6. nóo páaPivi£uq �Eu quero beber�7. temét póy wukálavi£uniq �O sol está fazendo ele querer andar�

Discussão:

Os morfemas podem ser isolados na comparação de sentenças semelhantes.(2) e (5), por exemplo, diferem apenas nos seus segmentos �nais; a diferença

21

Page 22: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

entre [q] e [n] deve, então, ser responsável pela distinção semântica entre pre-sente e futuro.

Se contrastarmos (1) e (2), descobrimos que [wukála] signi�ca �andar� e que[páaPi] signi�ca �beber�. A comparação de (2) e (6) mostra que [vi£u] contribuicom o signi�cado de �querer�. As sentenças (4) e (7) revelam que [nóo] e [temét]signi�cam �eu� (1a pessoa do singular) e �sol�, respectivamente.

Os outros morfemas são facilmente identi�cados. [ni] aparece nas sentenças(3), (4) e (7), que são as únicas sentenças que compartilham o componente designi�cado �fazer�; podemos concluir que [ni] signi�ca �fazer� pelo critério darecorrência com signi�cado constante. [£áami], que só aparece na sentença (3),deve signi�car �nós� (1a pessoa do plural), já que todos os outros elementos de(3) estão identi�cados. Pela mesma razão, o elemento [póy], que ocorre em (4)e (7), deve signi�car �ele� (3a pessoa).

Solução:�eu� = nóo �sol� = temét�ele� = póy �querer� = vi£u�nós� = £áami �fazer� = ni�andar� = wukála presente = q�beber� = páaPi futuro = n

Nós caracterizamos um morfema como resultado da associação de um compo-nente de signi�cado e uma seqüência de segmentos sonoros. Está implícita nessacaracterização a assunção, não inteiramente justi�cada, de que os componentesde signi�cado e as seqüências fônicas recorrentes se alinham e correspondem um-a-um. Embora essa concepção das unidades lexicais mínimas seja válida paraum grande número de casos, ela é muito restritiva para que sirva de modeloadequado para a realidade lingüística.

Quando os lingüistas falam de morfemas, eles tanto podem estar se referindoàs unidades fonológicas quanto às unidades semânticas. Quando os morfemassão vistos como seqüências fônicas recorrentes, nem sempre é possível associaressas seqüências, de forma consistente, a componentes de signi�cado constantes.Quando os morfemas são vistos como componentes de signi�cado, nem sempreé possível isolar seqüências fonéticas únicas que manifestem regularmente es-ses signi�cados. A discrepância entre morfemas como unidades fonológicas emorfemas como unidades semânticas permanece mesmo quando ignoramos aexistência de homônimos (como manga, fruta ou parte da camisa) e sinônimos(como cair e despencar).

2.2 Morfemas como unidades fonológicas.

Seqüências fonéticas recorrentes, mesmo aquelas que parecem ter signi�cânciagramatical, não podem ser associadas sempre a um signi�cado constante. Umtipo de exemplo pode ser encontrado nos itens lexicais �complexos�, itens lexi-cais com mais de um morfema. Os morfemas dos itens lexicais complexos nem

22

Page 23: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

sempre possuem o valor semântico que apresentam em outras combinações. Porexemplo, a palavra aguardente é constituída fonologicamente dos morfemas águae ardente (com crase dos dois /a/, o /a/ do �nal do primeiro morfema e o /a/inicial do segundo), mas semanticamente aguardente não parece ter nada a vercom suas partes constituintes. Não obstante, há razões gramaticais para di-vidir aguardente em água e ardente e para considerar que esses morfemas sãoos mesmos (em algum sentido do termo) que o substantivo �água� e o adjetivo�ardente�. Parece evidente, no entanto, que na palavra aguardente esses doismorfemas �perdem� seus signi�cados originais e que o conjunto formado pelosdois adquire um signi�cado próprio. Muitos outros itens lexicais complexospoderiam ser citados por não terem seus signi�cados derivados de seus mor-femas constituintes (pense em congelar, compreender, apreender, repreender,por exemplo). Para os propósitos da descrição semântica, eles devem ser trata-dos como unidades não-analisáveis. Para os propósitos da descrição fonológicae morfológica, no entanto, perdemos generalizações se não os analisarmos emcomponentes menores.

A ocorrência em itens lexicais complexos não é a única circunstância emque um morfema falha em apresentar seu signi�cado regular. Morfemas sãomuitas vezes comandados pela sintaxe da língua, perdendo seu valor habitualna medida em que passam a ser marcadores gramaticais. Por exemplo, o de ésigni�cativo na sentença Pedro veio de São Paulo, mas não é signi�cativo nasentença Pedro gosta de São Paulo.

Considere as seguintes sentenças do espanhol, que ilustram a concordânciade gênero entre adjetivos e nomes.

1. Él está contento �Ele está contente�2. Ella está contenta �Ela está contente�

A escolha da forma feminina ou masculina do adjetivo é completamentedeterminada pelo gênero do substantivo (no caso, do pronome sujeito das sen-tenças) e, conseqüentemente, não traz nenhuma informação nova. A escolha sóé signi�cativa no sentido em que as formas concordam com elementos que sãoindependentemente signi�cativos.

Os pronomes sujeitos podem ser omitidos em espanhol, situação em que apresença da marca de feminino ou de masculino passa a ser signi�cativa.

3. Está contento �Ele está contente� �He is happy�4. Está contenta �Ela está contente� �She is happy�

Nas sentenças (3) e (4) a presença das marcas de feminino e masculinoestabelece a diferença de signi�cado, uma vez que o gênero do sujeito (oculto) éindicado apenas pela terminação do adjetivo (o que não acontece em português5

5Neste caso particular, com o adjetivo �contente�, e alguns outros. Uma grande parte dosadjetivos em português apresenta marcas de gênero e, em decorrência, comporta-se como osadjetivos do espanhol.

23

Page 24: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

e em inglês).Se entendemos os morfemas como seqüências fônicas recorrentes com signi�-

cado estrutural, vamos encontrar casos em que as unidades obtidas nem sempresão associadas a signi�cados constantes: elas podem não ter signi�cado inde-pendente ou podem ter signi�cado apenas em alguns usos. Essas possibilidadesdevem ser levadas em consideração nos próximos dois problemas.

Problema 4: Português

Isole os morfemas das seguintes palavras e discuta seus valores semânticos.

recorrer importar receberescorrer reportar conceberincorrer deportar percebertranscorrer transportar repreenderconcorrer exportar apreenderdecorrer comportar compreenderpercorrer aportar depreenderacorrer reportar

Solução:re trans corrercom(con) im(in) ceberper es preenderde ex portara

Embora possamos encontrar signi�cados para quase todos esses morfemasno latim, provavelmente não poderemos fazê-lo no português contemporâneo.

Discussão:

A a�rmação de que alguns desses morfemas não são signi�cativos por sisós, ou que, ao menos, não apresentam signi�cados consistentes em todos osseus usos, deve ser levada em conta no momento de dizermos que são, de fato,morfemas; uma alternativa seria analisar receber, compreender6, etc. como mor-femas únicos. No entanto, duas considerações motivam a a�rmação de que essaspalavras devem ser divididas em partes menores. Primeiro, elementos como re,com, preender e ceber recorrem com tal freqüência (normalmente em combi-nação de um com o outro) que passa a ser necessário considerá-los unidadesestruturais reais e não apenas seqüências recorrentes acidentais. Segundo, aunidade ceber, por exemplo, tem signi�cância gramatical uma vez que sob a

6Estou ignorando as �exões próprias dos verbos que, obviamente, estariam contidas nasformas ceber, preender, etc.

24

Page 25: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

forma cept, aparece numa série de adjetivos (receptivo, conceptual, perceptivo,perceptual) e, sob a forma cep, numa série de substantivos (recepção, concepção,percepção). Se ceber não fosse um morfema, não haveria razões para esperarque palavras com ceber dessem origem a adjetivos com cept e a substantivoscom cep; essa regularidade teria que ser tratada como mera coincidência. Alémdisso, a consideração de que ceber é um morfema implica que re, com e per tam-bém sejam morfemas em receber, conceber e perceber ; normalmente assume-seque a divisão das palavras em morfemas deve ser exaustiva. Uma vez que essasunidades são isoladas, o isolamento das outras é apenas questão se seguir essalinha de raciocínio até sua conclusão lógica.

Problema 5: Papago

1. Páañi Pañ £íkpan �Eu estou trabalhando�2. m�1d

˙Po h�1gay �Ele está correndo�

3. Páapim Pam £íkpan �Vocês estão trabalhando�4. £íkpan Po h�1gam �Eles estão trabalhando�5. Páapi Pap m�1d

˙�Você está correndo�

6. £íkpan Pa£ Páa£im �Nós estamos trabalhando�7. h�1gay Po m�1d

˙�Ele está correndo�

8. £íkpan Pañ �Eu estou trabalhando�9. h�1gam Po £íkpan �Eles estão trabalhando�10. Páa£im Pa£ £íkpan �Nós estamos trabalhando�

Discussão:

As palavras [£íkpan] �trabalhar� e [m�1d˙] �correr� são facilmente identi�ca-

das e aparentemente consistem em um único morfema cada. Sobre os prono-mes, as duas formas da terceira pessoa - [h�1gay] �singular� e [h�1gam] �plural� -distinguem-se das formas restantes. A terceira pessoa do plural contém a termi-nação [m], que ocorre em todos os pronomes plurais; no entanto, a formação doplural nos pronomes do Papago envolve mais do que simplesmente o acréscimode [m] à forma do singular, já que [h�1gam] não contém o [y] que aparece nosingular. Os outros quatro pronomes são todos da forma [PáaCi(m)], onde Cindica a presença de uma consoante. O [m] ocorre apenas nas formas plurais[Páa£im] �nós� e [Páapim] �vocês�. A diferença entre as consoantes [ñ £ p] e apresença ou ausência do [m] servem para distinguir os quatro pronomes. Excetopelo [m], a segmentação das formas [PáaCi(m)] em morfemas é mais ou menosarbitrária. Seria possível postular que o morfema [Páa] indica um pronome deoutra pessoa que não a terceira e que [ñi] indica �primeira pessoa singular�, [£i]indica �primeira pessoa plural� e [pi] indica �segunda pessoa�. Outra alternativaseria considerar [Páa....i] um morfema �descontínuo�, deixando [ñ], [£] e [p] comoos morfemas que distinguiriam as formas das primeiras duas pessoas. Não háuma base óbvia para preferir uma análise à outra. Essa indeterminação não é

25

Page 26: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

estranha aos sistemas pronominais, e seria um erro tentar impor uma segmen-tação arbitrária a essas formas com o intuito de preservar arti�cialmente umaconcepção simples de morfema.

Na tradução dos exemplos do Papago para o português as formas [Po], [Pañ],[Pam], [Pap] e [Pa£] foram consideradas correspondentes a formas do verbo au-xiliar �estar�. Os dados do problema são insu�cientes para que possamos fazeruma análise fundamentada, mas podemos supor que [P] indica �presente�; [o]acompanha [P] quando o sujeito é de terceira pessoa e [a] aparece nos outroscasos; as terminações [ñ], [£], [p] e [m] concordam com os pronomes de outraspessoas que não a terceira. Uma vez que a forma dessas partículas átonas écompletamente determinada pelo sujeito, elas não têm signi�cado independente(exceto pela indicação do tempo presente). No entanto, elas permitem a iden-ti�cação da pessoa do sujeito nos casos em que o sujeito foi apagado, como é ocaso de (8).

Solução:�trabalhar� = £íkpan�correr� = m�1d

˙Pronomes:�3a pessoa� = h�1ga(y)�Não 3a pessoa� = Páa�1a pessoa singular� = mi�1a pessoa plural� = £i�2a pessoa� = pi�plural� = m

Partículas �porta-tempo� que concordam com o sujeito:�presente� = P�3a pessoa� = o�Não 3a pessoa� = a�1a pessoa singular� = ñ�1a pessoa plural� = £�2a pessoa singular� = p�2a pessoa plural� = m

2.3 Morfemas como unidades semânticas.

Como vimos acima, morfemas podem ser vistos ou como unidades fonológicasou como unidades semânticas. Já consideramos os morfemas como seqüênciasfonéticas recorrentes e concluímos que tais seqüências não podem ser associadassempre a componentes de signi�cado constantes. Vamos agora considerar osmorfemas como componentes de signi�cado. Vamos encontrar vários tipos deexemplos que mostram que não é sempre possível isolar uma única seqüênciafônica que regularmente manifeste o signi�cado dado.

Sinônimos, como trabalhar ou labutar e suar ou transpirar, mostram que é

26

Page 27: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

possível associarmos um componente de signi�cado a mais do que uma seqüênciafonética. Na maior parte das vezes, a existência de itens lexicais sinônimos nãotem importância estrutural e é um fenômeno de interesse limitado. Algumasvezes, no entanto, a escolha entre itens lexicais alternativos para a manifestaçãode um componente de signi�cado é determinada inteiramente por considera-ções gramaticais e é, portanto, estruturalmente signi�cativa. Por exemplo, omorfema do inglês go é usado no �present tense�, mas a forma não relacionadafonologicamente went é usada no �past tense�. Enquanto killed representa umasimples modi�cação do verbo kill, went pode ser visto como um item lexicaldistinto de go, que é usado no lugar de go no �past tense�. Exatamente o mesmofenômeno pode ser visto com as formas sou e fui do português: di�cilmentepodemos dizer que se trata de �modi�cações� do verbo ser. O uso de itenslexicais alternativos para representar o mesmo componente de signi�cado emcircunstâncias gramaticais distintas é chamado suplência. As variantes suple-tivas do verbo ser (sou, é, somos, são, fui, era, fomos, eram, etc.) ilustrameste caso. A distinção entre a suplência e outros tipos de irregularidade morfo-lógica nem sempre é clara (considere, no inglês, buy e bought, sell e sold, will ewould ; considere, no português, as formas irmão e irmãos, pão e pães, canhão ecanhões), mas o importante aqui é o fato de que um dado signi�cado pode serrepresentado por várias seqüências fonéticas diferentes.

Porque os dados lingüísticos brutos freqüentemente vêm na forma de enun-ciados transcritos foneticamente, é conveniente para os �ns dos exercícios di-dáticos que tratam da análise morfológica que os morfemas (e outras unidadeslexicais) sejam vistos como uma associação entre signi�cados e seqüências fôni-cas. No entanto, seria mais preciso discutir os morfemas em termos fonológicose não como representações fonéticas. Itens lexicais, incluindo os morfemas,consistem na associação de uma representação semântica, uma representaçãosintática e uma representação fonológica subjacente. A representação fonoló-gica de um morfema pode ser constante a despeito de certas variações fonéticasem sua realização em diferentes ambientes. Essas variações fonéticas na formade um morfema são freqüentemente o resultado da aplicação de regras fonoló-gicas gerais, que obscurecem no nível fonético a unidade fonológica subjacentedos morfemas.

Os dados do Ayutla Mixtec, no problema adicional 4 (p.18, acima), nos apre-sentam um bom exemplo. A forma para �sabão� aparece foneticamente como[nâmàá] ou [námáàP] (para simpli�car a questão, uma terceira forma, [nâmà],será desconsiderada). Na verdade, nenhuma dessas seqüências fônicas é idênticaà representação fonológica, que (para os princípios desta discussão, ao menos)pode ser representada como [nâmàáP]. No problema adicional 4 nós observa-mos a existência no Ayutla Mixtec de uma regra que se aplica à combinaçãode duas palavras em que o �nal da primeira é a oclusão glotal. Em tais com-binações a oclusão glotal da primeira palavra é apagada e a seqüência de tonsdas primeiras três vogais da segunda palavra muda para [���]. Esta regra ge-ral é responsável pela derivação das duas variantes fonéticas do item lexicalque signi�ca �sabão� a partir de uma única representação fonológica subjacente.Quando [nâmàáP] ocorre como a primeira palavra de uma expressão, tal como

27

Page 28: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

em [nâmàá²ík´arà] �ele pediu sabão�, a regra fonológica determina a queda do [P]�nal. Quando [nâmàáP] ocorre como a segunda palavra de uma expressão, comoem [kâk`a`unámáàP] �você pedirá sabão�, o [P] �nal permanece, mas a seqüênciade tons muda de [���] para [���]. A variação fonética super�cial da forma para�sabão� não é irregular, então, mas simples re�exo da aplicação de uma regrafonológica geral a representações fonológicas uniformes.

A suplência e a variação fonética causada pelas regras fonológicas gerais sãoapenas duas das di�culdades na determinação da representação segmental doscomponentes de signi�cado. Outra di�culdade é o sincretismo, o uso de umaseqüência fônica única, não divisível, para manifestar mais de um componentede signi�cado. Em algum grau, todas as formas podem ser consideradas sincré-ticas, uma vez que, virtualmente, qualquer signi�cado codi�cado numa formafonológica pode ser dividido em dois componentes de signi�cado menores: �cor-rer�, por exemplo, envolve componentes como �mover-se�, �rapidez�, etc. Noentanto, alguns casos de sincretismo são especiais porque os componentes designi�cado englobados na forma fonética também têm função gramatical e sãofrequentemente manifestados em formas fonéticas separadas.

A forma francesa au [o] �ao� é um exemplo claro. Os componentes de signi�-cado �a� e �o� são algumas vezes manifestados separadamente em francês, comona expressão à l'enfant [alãf´a] �à criança�, em que o [a] corresponde ao �a� e o [l]corresponde ao �o�. No entanto, o segmento [o] no sintagma au garçon [ogars´O]�ao menino� representa tanto o �a� quanto o �o�. Neste exemplo particular, osincretismo se dá no nível fonético e não no nível fonológico; a seqüência fo-nológica subjacente [al] é realizada foneticamente como [o] em virtude de umaregra fonológica geral do francês que muda [al] para [o] antes de consoante. Noentanto, muitas seqüências fônicas sincréticas derivam de representações fonoló-gicas também sincréticas. A forma [q] do Luiseño, que encontramos no Problema2 (p. 3, acima) e que indica �tempo presente�, também indica que o sujeito ésingular, e não há qualquer evidência de uma representação subjacente em queos dois morfemas �presente� e �singular� recebam formas fonológicas separadas.Quando um verbo no presente tem um sujeito plural, usa-se [wun] em lugarde [q]. A forma [wun] também é sincrética (manifestando os componentes designi�cado �presente� e �plural�) e mantém uma relação supletiva com [q].

A manifestação fonológica de componentes de signi�cado envolve ainda ou-tras complexidades. Muitos morfemas são representados fonologicamente comoseqüências de segmentos sonoros, mas alguns têm manifestações mais abstratas.Por exemplo, componentes de signi�cado são algumas vezes representados nãopor segmentos fônicos, mas por fenômenos suprasegmentais (duração, acento,tom, e coisas assim). Em muitas línguas a entoação, sozinha, é capaz de distin-guir certos tipos de pergunta de declarações; assim, as sentenças do portuguêsEle está lá e Ele está lá? diferem foneticamente apenas pela entoação ascen-dente da segunda. O Diegueño (língua que veremos logo a seguir) apresentaoutro tipo de exemplo.

Ainda mais abstratas são as entidades referidas comomorfemas processu-

ais emorfema zero. Os morfemas processuais não têm representação segmen-tal própria; eles são manifestados por meio de alterações fonológicas de outros

28

Page 29: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

morfemas. Em inglês, por exemplo, um modo de obter o passado de algunsverbos é mudar a vogal da raiz verbal. Sang é a forma de passado de sing, rodeé a forma de passado de ride, e assim por diante. Seria arti�cial apontar umsegmento de sang como o morfema de passado (se dissermos que a é o marca-dor de passado, �caríamos com s...ng como a raiz verbal, mas em formas comosings, will sing e singing a raiz é aparentemente sing). Mais adequado é dizerque o morfema de passado é realizado pelo processo morfológico de substituir avogal i da raiz verbal pela vogal a (i.e., de [I] para [æ]). Morfemas processuaismostram que a distinção entre regras lexicais, de um lado, e regras sintáticas efonológicas, de outro, absolutamente não é clara.

Como o nome já diz, morfema zero é um morfema sem qualquer forma fono-lógica. A noção de morfema zero, à primeira vista, parece ser auto-contraditória,mas a di�culdade conceitual se resolve quando notamos que a ausência de umelemento pode veicular tanta informação quanto a sua presença. No AstecaClássico, por exemplo, um verbo normalmente contém um pre�xo que concordacom o sujeito (ver problema abaixo). Quando o sujeito é de primeira ou de se-gunda pessoa, o pre�xo é manifestado por meio de uma seqüência de segmentosfônicos. No entanto, não há tal manifestação segmental quando o sujeito é deterceira pessoa. Dada essa situação, a ausência de um pre�xo marcador de con-cordância é signi�cativa: ela indica que o sujeito do verbo é de terceira pessoa.Para manter a generalização de que os verbos concordam com seus sujeitos emasteca, podemos analisar os verbos com sujeito de terceira pessoa identi�candomorfemas de concordância cuja realização fonética é zero. A noção de morfemazero é, então, coerente em termos de um arranjo paradigmático de formas, talcomo a conjugação verbal. Num sistema assim, um espaço vazio no paradigmapode ser caracterizado como a ausência de algum elemento claramente mani-festado em todos os outros espaços; o zero, em outras palavras, deve ter valorcontrastivo. Certamente, há outros modos de descrever situações como esta -não precisamos falar de morfema zero. Não obstante, o conceito é útil para umgrande número de propósitos.

Problema 6: Diegueño

Este problema aborda a formação do plural dos verbos em diegueño, umalíngua indígena norte-americana da família Hokan. Um verbo em diegueño émarcado plural se seu sujeito ou seu objeto é plural ou se ele designa uma açãoque se repete (iterativa) ou que é contínua. O símbolo [Ï] representa uma lateralsurda e [y] representa a palatalização. Examine as formas do singular e do plural

29

Page 30: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

dos verbos abaixo e discuta a manifestação fonológica do morfema de plural.

Singular Plural

Ïyap Ïyaap �queimar�muÏ muuÏ �colher�£uupuÏ £uupuuÏ �ferver�saaw saw `comer`�wir

˙wiir

˙�ser duro�

Solução:

As formas do singular e do plural destes verbos são idênticas, exceto pela du-ração da vogal �nal. Se a vogal �nal do singular é curta, a vogal correspondenteno plural é longa, e vice-versa. O morfema de plural, então, não se manifestacomo uma seqüência de segmentos fônicos. Trata-se de um morfema processualque afeta as propriedades suprasegmentais da forma singular. A forma pluraldo verbo é derivada da forma singular pela mudança da duração da vogal �nal.

Problema 7: Italiano

Isole os morfemas das sentenças (1) - (8) e estabeleça seus signi�cados. [z]representa uma consoante alveolar africada sonora.

1. lo skoláro e studióso �o aluno é estudioso�2. le zíe sono amerikáne �as tias são americanas�3. li zíi sono studiósi �os tios são estudiosos�4. la skolára e amerikána �a aluna é estudiosa�5. li skolári sono amerikáni �os alunos são americanos�6. la zía e studiósa �a tia é estudiosa�7. le skoláre sono studióse �as alunas são estudiosas�8. lo zío e amerikáno �o tio é americano�

Solução:�é� = e �o� = l�são� = sono �masc. sing� = o�aluno� = skolár �masc. pl.� = i�tio� = zí �fem. sing.� = a�americano� = amerikán �fem. pl.� = e�estudioso� = studiós

Discussão:

As formas para �é� e �são� são supletivas (como em português): isto é, nãosão diretamente relacionadas no nível fonológico. Mais ainda, são sincréticas,embora os dados sejam insu�cientes para que estabeleçamos isso conclusiva-

30

Page 31: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

mente (mas podemos usar nosso conhecimento do português para re�etir sobreessa conclusão, já que português e italiano são semelhantes neste aspecto). Aforma [e] indica o presente do verbo �ser� e também marca a concordância comum sujeito de terceira pessoa singular; [sono] indica o presente do verbo �ser� emarca a concordância com um sujeito de terceira pessoa plural. As terminações[o], [i], [a] e [e] também são sincréticas, cada uma representa simultaneamentegênero e número. Elas são independentemente signi�cativas nos nomes sujeitos,uma vez que apenas a terminação de palavras como [skoláro] e [zío] indicam onúmero e o gênero dos indivíduos que estão sendo referidos. As mesmas quatroterminações ocorrem nos artigos (iniciados por [l]) e nos adjetivos [studiós] e[amerikán]; aqui elas meramente indicam concordância com o substantivo e, emconseqüência, não têm signi�cado independente.

2.4 Conclusão

O conceito de morfema é problemático, uma vez que os lingüistas abrigam sobeste nome diferentes tipos de entidades. Os exemplos mais claros de morfemassão as seqüências mínimas de segmentos fonológicos associadas a um signi�-cado constante. Vimos, no entanto, que o termo é também usado, de formamais geral, para designar unidades estruturais mínimas de vários tipos, que nãoapresentam esse requisito. Seqüências fonológicas estruturalmente signi�cativassão consideradas morfemas mesmo quando não têm signi�cado independente ousó têm signi�cado em determinados usos; muitas unidades que participam daconstrução de um grande número de palavras (tal como: per, re, ceber, preender,etc.) só se quali�cam como morfemas desta forma. Componentes de signi�cadopodem ser considerados morfemas mesmo quando apresentam representaçõessegmentais não-consistentes; morfemas podem manifestar-se foneticamente pormeio de variantes supletivas, sincretismo, fenômenos suprasegmentais ou pro-cessos fonológicos, e algumas vezes não têm sequer realização fonética.

É evidente, então, que a análise morfêmica envolve muito mais coisas doque meramente recortar seqüências fônicas e atribuir etiquetas semânticas àspartes obtidas. Considerações sintáticas e fonológicas interferem no isolamentodas unidades lexicais mínimas e a análise morfêmica de uma língua não podeser concluída na ausência de um mínimo de progresso na análise de sua sintaxee de sua fonologia.

31

Page 32: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

2.5 Problemas adicionais.

Problema adicional 1: Servo-Croata

• Isole os morfemas das sentenças abaixo e dê seus signi�cados.

• Comente sobre morfemas zero, �armadilhas� sentenciais que perturbam aanálise e outras questões equivalentes.

1. yá £itam �eu leio�2. óni píyu �eles bebem�3. pú²i² �você fuma�4. ví £itate �vocês lêem�5. pú²im �eu fumo�6. mí píyemo �nós bebemos�7. tí píye² �você bebe�8. ón £íta �ele lê�9. píyem �eu bebo�10. pú²ite �vocês fumam�11. £ítamo �nós lemos�12. óni pú²e �eles fumam�13. £ítayu �eles lêem�14. pú²i �ele fuma�15. ví píyete �vocês bebem�16. ón píye �ele bebe�17. mí pú²imo �nós fumamos�18. tí £íta² �você lê�

32

Page 33: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

Problema adicional 2: Luiseño

Isole os morfemas das sentenças (1) - (20) e estabeleça seus signi�cados ousuas funções sintáticas. Para os morfemas supletivos, estabeleça as condiçõesem que cada forma é usada.

1. nóo kwótaq �estou levantando�2. húnwutum Pehé­mayumi qePéewun �os ursos estão matando os pássaros�3. £áam tóowwun Pehé­mayi �nós vemos o pássaro�4. húnwutum ­óoraan �os ursos estão correndo�5. £áam wuváPnawun Pehé­mayumi �estamos batendo nos pássaros�6. nóo pókwaq �estou correndo�7. Pehé­may wíilaq �o pássaro está voando�8. £áam móqnawun húnwuti �estamos matando o urso�9. húnwut wuváPnaq £áami �o urso está batendo em nós�10. £áam waráavaan �estamos levantando�11. nóo húnwuti móqnaq �estou matando o urso�12. húnwut ney tóowq �o urso me vê�13. £áam wótiwun húnwuti �estamos batendo no urso�14. nóo qePéeq húnwutumi �estou matando os ursos�15. Pehé­mayum wáapaan �os pássaros estão voando�16. nóo húnwuti wótiq �estou batendo no urso�17. húnwuntum £áami tóowwun �os ursos nos vêem�18. nóo húnwuti tóowq �eu vejo o urso�19. £áam ­óoraan �estamos correndo�20. húnwut pókwaq �o urso está correndo�

33

Page 34: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

Problema adicional 3: Turco

Isole os morfemas das expressões turcas abaixo e estabeleça seus signi�cados.Leve em conta a regra de harmonia vocálica discutida anteriormente (Problema4 - p. 8 e seguintes).

1. gelmek �vir�2. adamlar1n �dos homens�3. almazs1n �você não pega�4. gelmezsiniz �vocês não vêm�5. almamak �não pegar�6. k1zlardan �das meninas�7. ankarada �em Ancara�8. gelsin �deixe-o vir�9. almay1z �nós não pegamos�10. gelmem �eu não venho�11. köprülere �para as pontes�12. gelmez �ele não vem�13. almazlar �eles não pegam�14. adama �para o homem�15. almak �pegar�16. evden �da casa�17. als1nlar �deixe-os pegar�18. gelmezsin �você não vem�19. almam �eu não pego�20. köprüde �na ponte�21. gelmemek �não vir�22. almaz �ele não pega�23. gelmezler �eles não vêm�24. köpeyin �do cachorro�25. gelsinler �deixe-os vir�26. almazs1n1z �vocês não pegam�27. adamlara �para os homens�28. gelmeyiz �nós não vimos�29. als1n �deixe-o pegar�30. köprülerde �nas pontes�

34

Page 35: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

Problema adicional 4: Swahili

Um dos traços mais característicos da sintaxe do swahili é a existência deum conjunto de pre�xos nominais que são usados para a concordância. Todonome apresenta regularmente um pre�xo particular e todo su�xo tem uma formaespecial que é usada quando o nome é plural. Isole os morfemas dos dados abaixoe estabeleça seus signi�cados. Liste os pre�xos nominais e estabeleça as regrasque governam seus usos.

1. tulirúdi �nós voltamos�2. kitábu kimó��a kitanitó²a �um livro será su�ciente para mim�3. ananiulíza �ele está perguntando para mim�4. utasóma �nós leremos�5. watóto walirúdi �as crianças voltaram�6. wanasóma �eles estão lendo�7. vísu vitátu vinato²a �três facas são su�cientes�8. nitawa��íbu �eu vou responder a vocês�9. myumí²i alisóma �o empregado lê�10. walisóma kitábu �eles leram o livro�11. mtarúdi �vocês voltarão�12. tutawaulíza �nós perguntaremos a eles�13. mtóto mmó��a anawató²a �uma criança é su�ciente para eles�14. mlisóma �vocês leram�15. vísu vidógo vitató²a �facas pequenas serão su�cientes�16. ninaku��íbu �eu estou respondendo a você�17. watumí²i watátu watatutó²a �três empregados serão su�cientes para nós�18. kísu kimo��a kilitó²a �uma faca será su�ciente�19. atasóma �ele lerá�20. tutawaulíza �nós perguntaremos a vocês�21. ninarúdi �estou voltando�22. vitábu vidógo vitátu vilimtó²a �três pequenos livros foram su�cientes para ele�23. tulim��íbu �nós respondemos a ele�24. mtimí²i mmó��a atanitó²a �um empregado será su�ciente para mim�25. walirúdi �eles voltaram�26. vísu vitátu vinatutó²a �três facas são su�cientes para nós�

35

Page 36: Análise Lexical - UFPRborges/atividades/HL223-2009-2/An... · 2012. 2. 15. · Análise Lexical José Borges Neto (UFPR-CNPq) 1 Identi cação de Palavras A questão básica tratada

Problema adicional 5: Asteca Clássico

Isole os morfemas das expressões abaixo e estabeleça seus signi�cados. Co-mente as peculiaridades ou variações das manifestações fonéticas dos compo-nentes de signi�cado.

1. tikimpoowáyaP �nós os estávamos contando�2. ninóca �eu chamo�3. tite£ňasóňas �você nos amará�4. óomik �ele morreu�5. annémiP �vocês vivem�6. óonoc �ele chamou�7. ninoňasóňa �eu me amo�8. tinémi �você vive�9. nikimnocáya �eu os estava chamando�10. míki �ele morre�11. micňasóňaP �eles te amam�12. ame£nocáyaP �eles estavam chamando vocês�13. ooníknoc �eu o chamei�14. tinémiP �nós vivemos�15. anne£ňasóňaP �vocês me amam�16. mikíyaP �eles morriam�17. ootíkpoow �você o contou�18. te£ňasóňaP �eles nos amam�19. moňasóňa �ele se ama�20. ame£nócas �ele chamará vocês�21. némiP �eles vivem�22. ankinocáyaP �vocês o chamavam�23. timíkis �você morrerá�24. tikpóowaP �nós o contamos�25. ne£nócas �ele me chamará�

36