324
UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR TÉCNICO Uma interface sintaxe/semântica baseada em regras hierarquicamente organizadas Maria Luísa Torres Ribeiro Marques da Silva Coheur (Mestre) Dissertação para obtenção do Grau de Doutor em Engenharia Informática e de Computadores Orientador: Doutor Gabriel Gerardo Bès Orientador: Doutor Nuno João Neves Mamede Presidente: Reitor da Universidade Técnica de Lisboa Vogais: Doutor Gabriel Gerardo Bès Doutor Nuno João Neves Mamede Doutor Gaël Harry Dias Doutor Jorge Manuel Evangelista Baptista Doutor Diamantino António Caseiro Doutor Pablo Gamallo Otero Dezembro de 2004

UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

Embed Size (px)

Citation preview

Page 1: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR TÉCNICO

Uma interface sintaxe/semântica baseada em regrashierarquicamente organizadas

Maria Luísa Torres Ribeiro Marques da Silva Coheur(Mestre)

Dissertação para obtenção do Grau de Doutor em Engenharia Informática e de Computadores

Orientador: Doutor Gabriel Gerardo BèsOrientador: Doutor Nuno João Neves Mamede

Presidente: Reitor da Universidade Técnica de LisboaVogais: Doutor Gabriel Gerardo Bès Doutor Nuno João Neves Mamede Doutor Gaël Harry Dias Doutor Jorge Manuel Evangelista Baptista Doutor Diamantino António Caseiro Doutor Pablo Gamallo Otero

Dezembro de 2004

Page 2: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

���������

Nesta dissertacao apresenta-se uma interface sintaxe/semantica que segue a proposta do para-

digma 5P. Apos uma analise de superfıcie em que se detecta um conjunto de modelos basicos

num texto, com base nas propriedades de flechagem e numa ferramenta chamada Algas,

estabelecem-se relacoes entre os modelos basicos e os elementos no seu interior, construindo-se

os modelos flechados. Estes modelos sao transformados, atraves de uma ferramenta denomi-

nada Ogre, em grafos, que retiram dos modelos flechados as relacoes entre palavras. Sobre

estes grafos, opera o AsdeCopas, uma ferramenta que, com base em regras semanticas, pode

executar diversas tarefas. Estas regras semanticas tem a particularidade de estarem hierar-

quicamente organizadas. Assim, dadas varias regras em condicoes de serem disparadas, sao

aplicadas apenas as mais especıficas. Adicionalmente, a interface lida com analises parciais, e

mantem separadas as descricoes linguısticas de informacao procedimental.

Descrevem-se ainda duas aplicacoes da interface, nomeadamente: (i) na interpretacao de

questoes no domınio do turismo, tendo como objectivo o calculo de representacoes semanticas;

(ii) na desambiguacao semantica do qualquer e de outros operadores, sendo calculados os valo-

res semanticos destas palavras, de acordo com os contextos sintacticos em que ocorrem.

Page 3: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares
Page 4: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

� � ���������

We present a syntax/semantics interface that follows the 5P Paradigm. In a first stage, after a

syntactic surface analysis of a text, a set of basic models is detected. Then, by using arrow pro-

perties and a tool named Algas, we establish relations between the basic models and between

the elements inside them, and we obtain arrowing models. Afterwards, a graph is built by a

tool called Ogre, that abstracts relations between words from the arrowing models. Finally,

a tool named AsdeCopas takes a set of semantic rules as input and operates over the graph.

Depending on the semantic rules, several tasks can be performed. These semantic rules are

hierachically organized. Therefore, when several rules can be triggered, only the most specific

ones are executed. Moreover, this syntax/semantics interface deals with partial analysis and

keeps linguistic descriptions apart from computational information.

This syntax/semantics interface was applied: (i) in question interpretation, where the goal is to

associate semantic representations to questions (in the tourist domain); (ii) in semantic disam-

biguation, where the semantic values of the word qualquer and other operators, are calculated,

depending on their syntactic context.

Page 5: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares
Page 6: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

��������������� � ������� �"!$# %�'&��

Palavras chave

Interface sintaxe/semantica, Paradigma 5P, propriedades de flechagem, regras

semanticas hierarquicamente organizadas.

Keywords

Syntax-semantics interface, 5P Paradigm, arrow properties, semantic rules hierarchi-

cally organized.

Page 7: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares
Page 8: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

Para a minha Mae.

Page 9: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares
Page 10: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

( ���)&����+*,� �.-/�0��

O meu primeiro agradecimento vai para os meus dois orientadores (muito original!): o Profes-

sor Gabriel Bes e o Professor Nuno Mamede. O Professor Gabriel Bes e um dos poucos cien-

tistas no sentido 90% suor do termo que conheco (e nao e certamente por falta de inspiracao!).

A sua honestidade, rigor, ausencia total de preguica intelectual e maturidade, a sua maneira

propria de olhar para um problema e diagnotisca-lo com precisao, fazem dele um orientador de

luxo. O Professor Nuno Mamede, pela sua disponibilidade, pelos seus conselhos inteligentes e

praticos, pela amizade, pela paciencia, e pela capacidade de nos motivar, mesmo nos momen-

tos mais duros, e tambem um orientador de 5 estrelas. Nao e certamente por acaso que ambos

tem um exercito de orientandos.

O meu terceiro agradecimento vai para o Rui Chaves, pela ajuda cientıfica, mas tambem pelas

suas cronicas semanais, com o Bob, os dendrobatideos e as aulas de Jujitsu. Os conhecimentos

de semantica do Rui e o modo automatico, simpatico e paciente com que os partilha, fazem do

Rui uma especie de co-orientador desta tese.

Agradeco tambem ao Pablo Gamallo, comentarios e sugestoes, sempre tao pertinentes, sobre

o meu trabalho. Em particular, um agradecimento especial pelas (mega-rapidas) crıticas ao

artigo do Epia.

Aos meus amigos de sala, Joana, Paula, Fernando Batista-sem-p, Ricardo e Joao, obrigada por

todo o apoio cientıfico, computacional e emocional. Em particular, obrigada pela paciencia

Page 11: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

que tiveram com as minhas hormonas durante a gravidez da Catarina. A Paula, um segundo

agradecimento, por ter feito umas primeiras leituras da minha tese e por me ter ensinado a

cortar os textos ao bocadinhos (com uma tesoura). A Joana, a pessoa mais prestavel do mundo,

um agradecimento especial por todo o tempo que perdeu comigo, e por todos os chocolates,

bolachas e gelados que me ofereceu, voluntaria e involuntariamente.

Ao resto dos L2f-ianos, David, Hugo, Sergio e Diamantino, Isabel Trancoso e Isabel Mascare-

nhas, Ceu e Teresa, Professor Antonio Serralheiro, Professor Luis Caldas e Joao Paulo Neto, e

tantos outros, um agradecimento por todo o apoio, conselhos e amizade. E nao apenas uma

honra, mas tambem um prazer, fazer parte do L2F.

OOOOOOOOOOh Eeeelsaaaaaaaaaa! Obrigada para ti tambem. Pelo ombro amigo nos mo-

mentos mais difıceis.

Ao Sergio Fernandes e Rito mais dois agradecimentos. Ao Sergio pela simplicidade com que

desmistifica os problemas, por me ter arrastado ano e meio para a piscina anti-stress do Tecnico

e pelas correccoes que fez a alguns dos meus artigos. Ao Rito, por me ter acolhido nos primeiros

tempos de doutoramento e por todos os conselhos sabios.

A Caroline e Luzia, Ines e Nanusca, Ioanna e Lionel, e Critina Mota mais um obrigada. A Ca-

roline por me ter deixado tomar conta da Lia, pelas manhas de patins em linha, pela amizade,

e por tudo o que me ensinou do 5P. A Luzia, pela calma, pela confianca, e por me ter tido como

convidada no grupo de Linguagem Natural. A Ines e Nanusca pela amizade eterna. A Ioanna

e Lionel pelo modo atencioso e simpatico com que me acolheram no GRIL. Tenho pena que

estejam tao longe. A Cristina, pelo que me soube ensinar, pelas vırgulas e pelos comentarios

que fez ao meu trabalho, mas, acima de tudo, pela amizade e simpatia. A semana da Coling

Page 12: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

sem a Cristina nao teria tido piada nenhuma.

Os antepenultimos agradecimentos vao para a minha famılia, pela amizade, simpatia, sentido

de humor e boa disposicao. Quer a componente Lusa quer a Belga foram sempre fontes de in-

centivo para levar esta tarefa ate ao fim. A minha Mae, em especial, a quem dedico esta tese, foi

sem duvida quem mais contribuiu para que este documento terminasse um dia. Tomou conta

do Tomas e da Catarina em dias-de-narizes-a-pingar, fez milhares de sopas e esteve sempre

la para me ajudar nos momentos mais difıceis. A minha irma Ana, pelas tardes dedicadas ao

Tomas e Catarina e por todo o apoio, tambem estou particularmente agradecida.

Ao Baudouin, pelo equilıbrio infinito, um agradecimento muito especial. Perdoa todas as

ausencias fısicas, mas, em especial, as mentais.

Aos meus filhos Tomas e Catarina, as minhas mais perfeitas contribuicoes ao mundo, obri-

gada por tudo o que me ensinaram. Sou, gracas a voces, uma pessoa muito mais crescida e

organizada, e aprendi a dar valor ao que realmente importa. Essa informacao nao esta, defini-

tivamente, em nenhum livro ou artigo que tenha lido para esta tese.

Quero ainda agradecer aos meus alunos do Tecnico, ISLA e Lusofona (excluo mentalmente tres

ou quatro). Foram eles (os nao excluıdos) que me fizeram ter vontade de seguir uma carreira

academica e que me levaram a fazer este doutoramento. Agora e so preciso encontrar a carreira.

Finalmente, agradeco a Fundacao para a Ciencia e a Tecnologia, que financiou esta tese atraves

do programa PRAXIS XXI (referencia PRAXIS XXI/BD/19559/99).

Maria Luısa Torres Ribeiro Marques da Silva Coheur

Page 13: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares
Page 14: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

��1-/�2�3-54�768��� 9 *,:� ( �<;�/=>�)���

Apresentam-se algumas convencoes tipograficas seguidas neste documento:

Def n: ambiente definicao; termina com um N;

Exemplo n: ambiente exemplo; termina com um �;

Notacao n: ambiente notacao; encontra-se dentro de uma caixa;

→: sımbolo usado nas propriedades de flechagem;

: sımbolo usado nas setas;

C: conjunto das etiquetas das categorias (iniciadas por uma minuscula);

M: conjunto das etiquetas dos modelos (iniciadas por uma maiuscula);

W: conjunto das palavras (ou sequencias de palavras);

P: conjunto de variaveis {X1, ..., Xn};

Fn: identificador de uma propriedade de flechagem;

[Rn]: identificador de uma regra semantica;

Texto em Italico: estrangeirismos, exemplos em Lıngua Natural, sımbolos de funcoes;

Texto em TypeWriter: representacoes semanticas;

Texto em Slanted: etiquetas de categorias e de modelos, constituintes de propriedades de fle-

chagem e regras semanticas.

Page 15: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares
Page 16: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

��1-?�0� ;�+&�

1 Introducao 1

1.1 Motivacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Interface desenvolvida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.3 Principais Contribuicoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.4 Organizacao da Tese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2 Estado da Arte 9

2.1 Montague . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.1.1 Sintaxe do fragmento do ingles . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.1.2 Traducao em Logica Intencional . . . . . . . . . . . . . . . . . . . . . . . . 13

2.1.3 Evolucoes e comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.2 Famılia Edite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.2.1 A interface sintaxe/semantica do Edite . . . . . . . . . . . . . . . . . . . . 16

i

Page 17: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2.2.2 Evolucoes e comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.3 DRT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.3.1 Interface da DRT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.3.2 Evolucoes e comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.4 Link grammar e Minimal Logical Form . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.4.1 Link Grammar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.4.2 Construcao das estruturas de dependencia . . . . . . . . . . . . . . . . . . 26

2.4.3 Construcoes das formulas logicas . . . . . . . . . . . . . . . . . . . . . . . 27

2.4.4 Evolucoes e comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

2.5 Conexor FDG e Minimal Logical Form . . . . . . . . . . . . . . . . . . . . . . . . . . 29

2.5.1 Construcao das estruturas de dependencia . . . . . . . . . . . . . . . . . . 29

2.5.2 Construcoes das formulas logicas . . . . . . . . . . . . . . . . . . . . . . . 32

2.5.3 Evolucoes e comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

2.6 Construcao de estruturas de dependencias . . . . . . . . . . . . . . . . . . . . . . 35

2.6.1 Covington . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

2.6.2 Arnola . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

ii

Page 18: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2.6.3 O Incremental Finite-State Parser . . . . . . . . . . . . . . . . . . . . . . . . 39

2.6.4 Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

2.7 Linguagens de representacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

2.7.1 Representacoes intermedias e significado literal . . . . . . . . . . . . . . . 44

2.7.2 Formulas planas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

2.7.3 Subespecificacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

2.8 Resumo e Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

3 Formalismos 53

3.1 Conceitos basicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

3.1.1 Categoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

3.1.2 Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

3.2 Propriedades de flechagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

3.2.1 Motivacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

3.2.2 Sintaxe das Propriedades de flechagem . . . . . . . . . . . . . . . . . . . . 63

3.2.3 Extensoes ao formalismo de flechagem . . . . . . . . . . . . . . . . . . . . 67

3.2.3.1 Elemento inicial/final . . . . . . . . . . . . . . . . . . . . . . . . . 67

iii

Page 19: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

3.2.3.2 A restricao pilha . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

3.3 Regras semanticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

3.3.1 Motivacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

3.3.2 Sintaxe das regras semanticas . . . . . . . . . . . . . . . . . . . . . . . . . 74

3.3.3 Hierarquia de Regras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

3.3.4 Conceito de grafo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

3.3.5 Condicoes de aplicabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . 89

3.3.6 Aplicacao de uma regra semantica . . . . . . . . . . . . . . . . . . . . . . . 94

3.3.7 Extensoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

3.3.8 Funcoes de traducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

3.4 Resumo e Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

4 Recursos disponıveis 97

4.1 Recursos informaticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

4.2 Recursos linguısticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

4.2.1 Dicionario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

4.2.2 Categorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

iv

Page 20: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

4.2.2.1 Verbos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

4.2.2.2 Nomes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

4.2.2.3 Adjectivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

4.2.2.4 Preposicoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

4.2.2.5 Pronomes e adverbios . . . . . . . . . . . . . . . . . . . . . . . . 105

4.2.2.6 Adverbios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

4.2.2.7 Outros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

4.2.3 Modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

4.2.3.1 Modelos nucleares . . . . . . . . . . . . . . . . . . . . . . . . . . 111

4.2.3.2 Modelos verbais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

4.2.3.3 Modelos nominais . . . . . . . . . . . . . . . . . . . . . . . . . . 113

4.2.3.4 Modelos adjectivais . . . . . . . . . . . . . . . . . . . . . . . . . . 113

4.2.3.5 Modelos preposicionais . . . . . . . . . . . . . . . . . . . . . . . 114

4.2.3.6 Modelos de interrogativas e relativas . . . . . . . . . . . . . . . . 114

4.2.3.7 Modelos adverbiais . . . . . . . . . . . . . . . . . . . . . . . . . . 115

4.2.3.8 Outros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

v

Page 21: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

4.2.4 Super-etiquetas de modelos . . . . . . . . . . . . . . . . . . . . . . . . . . 116

4.3 Corpora . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

4.4 Resumo e Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

5 Interpretacao de questoes: propriedades de flechagem 119

5.1 Flechagem no interior dos modelos nucleares . . . . . . . . . . . . . . . . . . . . 119

5.2 Flechagem dos modelos verbais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

5.3 Flechagem dos modelos nominais nucleares . . . . . . . . . . . . . . . . . . . . . . 122

5.3.1 Flechagem sobre modelos verbais . . . . . . . . . . . . . . . . . . . . . . . 122

5.3.2 Auto-flechagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

5.4 Flechagem dos modelos adjectivais nucleares . . . . . . . . . . . . . . . . . . . . . 125

5.4.1 Flechagem sobre modelos nominais . . . . . . . . . . . . . . . . . . . . . . 126

5.4.2 Flechagem sobre modelos preposicionais . . . . . . . . . . . . . . . . . . . 126

5.4.3 Flechagem sobre modelos verbais . . . . . . . . . . . . . . . . . . . . . . . 127

5.5 Flechagem dos modelos preposicionais nucleares . . . . . . . . . . . . . . . . . . 127

5.5.1 Flechagem dos modelos preposicionais a esquerda . . . . . . . . . . . . . 127

5.5.1.1 Flechagem sobre modelos nominais . . . . . . . . . . . . . . . . . 128

vi

Page 22: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

5.5.1.2 Flechagem sobre outros modelos preposicionais nucleares . . . . 128

5.5.1.3 Flechagem sobre modelos verbais . . . . . . . . . . . . . . . . . . 129

5.5.2 Flechagem dos modelos preposicionais a direita . . . . . . . . . . . . . . . 131

5.6 Flechagem dos modelos com partıculas interrogativas e relativas . . . . . . . . . 132

5.6.1 Flechagem dos modelos com partıculas interrogativas . . . . . . . . . . . 132

5.6.2 Flechagem dos modelos com partıculas relativas . . . . . . . . . . . . . . . 133

5.6.3 Flechagem dos modelos contendo um onde . . . . . . . . . . . . . . . . . . 134

5.6.4 Flechagem dos modelos etiquetados por Que . . . . . . . . . . . . . . . . . 136

5.7 Flechagem de modelos adverbiais . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

5.8 Resumo e Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138

6 Interpretacao de questoes: regras semanticas 139

6.1 Determinacao do foco das questoes . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

6.2 Nomes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140

6.2.1 Nomes comuns . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

6.2.1.1 Representacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

6.2.1.2 Regras para os nomes comuns . . . . . . . . . . . . . . . . . . . . 141

vii

Page 23: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

6.2.2 Nomes proprios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142

6.2.2.1 Representacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142

6.2.2.2 Regras para os nomes proprios . . . . . . . . . . . . . . . . . . . 142

6.3 Adjectivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144

6.3.1 Classes logicas dos adjectivos . . . . . . . . . . . . . . . . . . . . . . . . . 144

6.3.2 Adjectivos predicativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146

6.3.2.1 Representacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146

6.3.2.2 Regras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149

6.4 Preposicoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151

6.4.1 Representacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151

6.4.2 Regras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151

6.5 Pronomes interrogativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

6.5.1 Representacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

6.5.2 Regras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

6.6 Adverbios interrogativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154

6.6.1 Representacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154

viii

Page 24: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

6.6.2 Regras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155

6.7 Outros adverbios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156

6.7.1 Representacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

6.7.2 Regras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

6.8 Cardinais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158

6.8.1 Representacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158

6.8.2 Regras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158

6.9 Verbos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

6.9.1 Famılia vc3 ∨ vinf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

6.9.1.1 Representacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

6.9.1.2 Regras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160

6.9.2 Famılia vcopc ∨ vser . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162

6.9.2.1 Representacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162

6.9.2.2 Regras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163

6.9.3 Famılia vexistir e vhaver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164

6.9.3.1 Representacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164

ix

Page 25: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

6.9.3.2 Regras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165

6.9.4 Famılia vc12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166

6.10 Relativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167

6.10.1 Representacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167

6.10.2 Regras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168

6.11 Resumo e Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

7 Desambiguacao de quantificadores 171

7.1 Problematica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171

7.1.1 Multiplicidade de significados e desambiguacao . . . . . . . . . . . . . . . 171

7.1.2 Convergencia de valores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

7.1.3 Estrategia global . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175

7.2 Valores semanticos do qualquer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177

7.2.1 Universal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177

7.2.2 Existencial vago . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178

7.2.3 Vago . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178

7.2.4 Vulgar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179

x

Page 26: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

7.2.5 Valores em sequencias especıficas . . . . . . . . . . . . . . . . . . . . . . . 180

7.3 Contextos sintacticos de desambiguacao do qualquer . . . . . . . . . . . . . . . . . 181

7.3.1 Entidades nao discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182

7.3.2 Esquerda do verbo, posicao pre-nominal . . . . . . . . . . . . . . . . . . . 182

7.3.3 Esquerda do verbo, posicao pos-nominal . . . . . . . . . . . . . . . . . . . 183

7.3.4 Direita do verbo, posicao pre-nominal . . . . . . . . . . . . . . . . . . . . . 184

7.3.5 Direita do verbo, posicao pos-nominal . . . . . . . . . . . . . . . . . . . . . 185

7.3.6 Quadro da negacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186

7.3.6.1 Direita do verbo, posicao pre-nominal, verbo negado . . . . . . . 186

7.3.6.2 Direita do verbo, posicao pos-nominal, verbo negado . . . . . . 187

7.3.6.3 Comparativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187

7.3.7 Contextos especıficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188

7.4 Convergencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189

7.4.1 Todos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189

7.4.2 Algum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191

7.4.3 Nenhum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192

xi

Page 27: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

7.4.4 Resumo e Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193

8 Processamento 195

8.1 Mapeamentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195

8.2 Algas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198

8.2.1 Entradas/saıda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198

8.2.2 Breve descricao do algoritmo . . . . . . . . . . . . . . . . . . . . . . . . . . 199

8.2.2.1 Identificacao das setas . . . . . . . . . . . . . . . . . . . . . . . . . 199

8.2.2.2 Calculo do produto cartesiano . . . . . . . . . . . . . . . . . . . . 201

8.2.2.3 Eliminacao de solucoes . . . . . . . . . . . . . . . . . . . . . . . . 202

8.2.3 Implementacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204

8.3 Ogre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204

8.3.1 Entrada/Saıda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204

8.3.2 Breve descricao do algoritmo . . . . . . . . . . . . . . . . . . . . . . . . . . 205

8.3.2.1 Desdobramento dos modelos flechados . . . . . . . . . . . . . . 205

8.3.2.2 Separacao de modelos e numeracao . . . . . . . . . . . . . . . . . 206

8.3.2.3 Aplicacao da regra de substituicao . . . . . . . . . . . . . . . . . 206

xii

Page 28: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

8.3.3 Implementacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209

8.4 AsdeCopas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210

8.4.1 Entradas/saıda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210

8.4.2 Breve descricao do algoritmo . . . . . . . . . . . . . . . . . . . . . . . . . . 211

8.4.2.1 Identificacao de potenciais regras a aplicar . . . . . . . . . . . . . 211

8.4.2.2 Escolha de regras . . . . . . . . . . . . . . . . . . . . . . . . . . . 213

8.4.2.3 Aplicacao de regras . . . . . . . . . . . . . . . . . . . . . . . . . . 213

8.4.3 Implementacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214

8.5 Resumo e Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214

9 Avaliacao 217

9.1 Interpretacao de questoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217

9.1.1 Corpus de teste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218

9.1.2 Avaliacao do Algas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220

9.1.2.1 Dados de entrada . . . . . . . . . . . . . . . . . . . . . . . . . . . 220

9.1.2.2 Construcao do corpus de referencia, a saıda do Algas . . . . . . 221

9.1.2.3 Metricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221

xiii

Page 29: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

9.1.2.4 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222

9.1.2.5 Analise dos resultados . . . . . . . . . . . . . . . . . . . . . . . . 223

9.1.3 Avaliacao do AsdeCopas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223

9.1.3.1 Dados de entrada . . . . . . . . . . . . . . . . . . . . . . . . . . . 223

9.1.3.2 Construcao do corpus de referencia . . . . . . . . . . . . . . . . 224

9.1.3.3 Metricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224

9.1.3.4 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225

9.1.3.5 Analise dos resultados . . . . . . . . . . . . . . . . . . . . . . . . 226

9.1.4 Avaliacao conjunta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227

9.1.4.1 Dados de entrada . . . . . . . . . . . . . . . . . . . . . . . . . . . 227

9.1.4.2 Construcao do corpus de referencia . . . . . . . . . . . . . . . . . 227

9.1.4.3 Metricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227

9.1.4.4 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228

9.1.4.5 Analise dos resultados . . . . . . . . . . . . . . . . . . . . . . . . 228

9.1.5 Outras avaliacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228

9.2 Algas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229

xiv

Page 30: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

9.3 Ogre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230

9.4 Comparacao com o sistema Edite . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231

9.4.1 Cobertura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232

9.4.2 Utilizacao do contexto sintactico . . . . . . . . . . . . . . . . . . . . . . . . 232

9.4.3 Controle de hipoteses sintacticas . . . . . . . . . . . . . . . . . . . . . . . . 233

9.4.4 Robustez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234

9.4.5 Valores inesperados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236

9.4.6 Duplicacao de informacao e regularidades semanticas . . . . . . . . . . . 237

9.4.7 Extensoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238

9.5 Cuidados a ter no uso desta interface . . . . . . . . . . . . . . . . . . . . . . . . . 239

9.5.1 Utilizacao nao composicional da interface . . . . . . . . . . . . . . . . . . . 239

9.5.2 Eliminacao de variaveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240

9.6 Resumo e Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241

10 Trabalho futuro e conclusoes 243

10.1 Sumario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243

10.2 Trabalho Futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244

xv

Page 31: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

10.2.1 Enriquecimento das descricoes linguısticas . . . . . . . . . . . . . . . . . . 244

10.2.2 Propriedades de flechagem . . . . . . . . . . . . . . . . . . . . . . . . . . . 245

10.2.3 Algas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246

10.2.4 Regras semanticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246

10.2.5 Ferramenta de ordenacao das representacoes semanticas . . . . . . . . . . 247

10.2.6 Aplicacoes alternativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247

10.3 Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248

A Tira-Teimas 251

B Exemplos 255

xvi

Page 32: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

@A*B� �C� &�� DE* ( �������

1.1 Arquitectura simplificada da Interface. . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.2 Utilizacao do AsdeCopas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.1 Analise da frase O hotel Ritz tem piscina? . . . . . . . . . . . . . . . . . . . . . . . . 17

2.2 Regra CR.PN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.3 DRS para a frase Joao procura Maria . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.4 Regra CR.PRO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.5 DRS para a frase Ela desapareceu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.6 Resultado da Link Grammar para John wanted Mary to come . . . . . . . . . . . . . . 35

3.1 Modelo flechado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

3.2 Modelo com cruzamento de flechas . . . . . . . . . . . . . . . . . . . . . . . . . . 59

3.3 Modelo nominal nuclear a flechar sobre o verbo da relativa . . . . . . . . . . . . . 68

3.4 Pilha . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

xvii

Page 33: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

4.1 Saıda do Smorph para a questao Qual a maior praia do Algarve? . . . . . . . . . . . 98

4.2 Saıda do Pasmo para a questao Qual a maior praia do Algarve? . . . . . . . . . . . . 99

4.3 Saıda do Susana para a questao Qual a maior praia do Algarve? . . . . . . . . . . . 100

4.4 Utilizacao do Smorph, Pasmo e Susana . . . . . . . . . . . . . . . . . . . . . . . . 100

8.1 Entradas/saıda do Algas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199

8.2 Entrada/saıda do Ogre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205

8.3 Grafo de saıda do Ogre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208

8.4 Entradas/saıda do AsdeCopas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211

9.1 Processo de baixo para cima: ausencia de visao global . . . . . . . . . . . . . . . . 233

A.1 Arquitectura do Tira-Teimas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252

A.2 Arquitectura do Tira-Teimas Translator (TTT) . . . . . . . . . . . . . . . . . . . . . 252

xviii

Page 34: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

@A*B� �F� &�� 9 � � �.�����

2.1 Alguns operadores usados pelo Edite. . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.2 Entradas na Link Grammar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

2.3 Government Map. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

4.1 Etiquetas para verbos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

4.2 Etiquetas para nomes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

4.3 Etiquetas para adjectivos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

4.4 Etiquetas para preposicoes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

4.5 Etiquetas para sequencias com a palavra que. . . . . . . . . . . . . . . . . . . . . . 106

4.6 Etiquetas finais para algumas sequencias com a palavra que. . . . . . . . . . . . . 107

4.7 Etiquetas para as sequencias a/o(s) qual/quais . . . . . . . . . . . . . . . . . . . . . 109

4.8 Etiquetas para as partıculas interrogativas . . . . . . . . . . . . . . . . . . . . . . . 109

4.9 Etiquetas para adverbios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

xix

Page 35: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

4.10 Outras etiquetas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

4.11 Etiquetas dos modelos verbais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

4.12 Etiquetas dos Modelos nominais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

4.13 Etiquetas dos modelos adjectivais. . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

4.14 Etiquetas dos modelos que contem partıculas interrogativas e relativas. . . . . . . 114

4.15 Etiquetas dos modelos adverbiais. . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

4.16 Outras Etiquetas de Modelos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

7.1 Valores do qualquer em sequencias especıficas. . . . . . . . . . . . . . . . . . . . . 180

7.2 Valores do qualquer em sequencias qualquer coisa. . . . . . . . . . . . . . . . . . . . 181

9.1 Resultados do Algas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222

9.2 Resultado AsdeCopas, avaliacao individual . . . . . . . . . . . . . . . . . . . . . . 225

9.3 Resultado da avaliacao conjunta . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228

xx

Page 36: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

1GH-?���I%&J�54�+6�<1.1 Motivacao

Em 1992, a Direccao Geral de Turismo levou a cabo um levantamento exaustivo dos recur-

sos turısticos portugueses. Para permitir o acesso a essa informacao foram criados quiosques

multimedia que contaram com um sistema de consulta em Lıngua Natural. Este sistema, deno-

minado Edite [da Silva, 1997, Reis et al., 1997, da Silva et al., 1997], dispunha de uma interface

sintaxe/semantica semelhante as descritas em [Allen, 1995] e [Jurafsky e Martin, 2000], base-

ada numa gramatica livre de contexto e em regras semanticas associadas as regras sintacticas.

A analise semantica era feita por um algoritmo de baixo para cima que percorria a arvore

sintactica e construıa de modo composicional as formulas logicas atraves das formulas logicas

resultantes da analise semantica dos seus constituintes.

Se o Edite foi rapidamente desenvolvido, respondendo a algumas questoes em poucos meses,

rapidamente tambem saturou, tornando-se difıcil qualquer extensao. Um dos pontos crıticos

estava na interface sintaxe/semantica e resultava da dependencia entre as regras sintacticas e

semanticas: uma nova regra sintactica podia obrigar regras semanticas a terem de lidar com

valores inesperados e alteracoes nas regras sintacticas podiam dificultar a recuperacao de ele-

mentos semanticos dispersos na arvore. Por vezes ainda, as regras sintacticas tinham de ser

reescritas para se obterem as representacoes semanticas desejadas.

Page 37: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2 CAPITULO 1. INTRODUCAO

Decidiu-se entao enveredar por outra abordagem e encontrou-se no Paradigma 5P [Bes, 1999a,

Bes e Hagege, 2001, Hagege, 2000] – um quadro flexıvel que integra uma metodologia para o

estudo e tratamento das Lınguas Naturais [Bes, 2003] e que tem como objectivo o tratamento de

texto real – a base de trabalho desejada. Em particular, encontrou-se no 5P a proposta de uma

interface sintaxe/semantica, que se resume nas seguintes linhas: considere-se um texto em que

se demarcaram e identificaram varias sequencias, os modelos1 basicos, de acordo com o vo-

cabulario 5Peano. Atraves das propriedades de flechagem, define-se como devem ser ligados

esses modelos basicos, bem como os elementos no seu interior. O resultado e a construcao dos

modelos flechados, tal como sao chamados no 5P os modelos basicos ligados entre si, e con-

tendo elementos ligados no interior. Estes modelos flechados sao a base das funcoes semanticas

no calculo das representacoes semanticas.

Ainda segundo o 5P, a interface deve respeitar os seguintes pontos:

1. As descricoes linguısticas nao devem estar misturadas com informacao de cariz procedi-

mental;

2. As descricoes linguısticas devem poder ser usadas de modo parametrizavel de acordo

com as aplicacoes em vista;

3. A interface devera ser capaz de lidar com analises parciais.

O objectivo desta tese foi entao desenvolver uma interface sintaxe/semantica que se enqua-

drasse na proposta do 5P.

1A motivacao para o termo “modelo” sera oportunamente explicada.

Page 38: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

1.2. INTERFACE DESENVOLVIDA 3

1.2 Interface desenvolvida

Tal como proposto pelo 5P, a interface parte de um conjunto de modelos basicos e constroi os

modelos flechados atraves das propriedades de flechagem. Seguidamente, num passo previsto

pelo 5P mas nao exigido, os modelos flechados sao transformados numa estrutura que contem

apenas relacoes entre palavras, e as quais se chamara genericamente grafo. Finalmente, as

regras semanticas, formalismo desenvolvido no ambito desta tese, calculam as representacoes

semanticas com base nesse grafo.

Esta interface pode ser dividida em duas partes, correspondendo cada uma a uma tarefa dis-

tinta:

Tarefa 1: a partir de um conjunto de modelos basicos, constroem-se os modelos flechados, que

sao posteriormente mapeados num grafo;

Tarefa 2: com base no grafo calculam-se as representacoes semanticas.

Em tracos gerais, a primeira tarefa usa:

• o formalismo das propriedades de flechagem do 5P para especificar como devem ser

relacionados os modelos basicos e os elementos no seu interior;

• uma ferramenta, o Algas (Algoritmo Atribuidor de Setas), que recebe os modelos basicos

e que, com base nas propriedades de flechagem, constroi os modelos flechados;

• uma ferramenta, o Ogre (Obtentor de grafos de entrada), que transforma os modelos

flechados num grafo.

Page 39: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

4 CAPITULO 1. INTRODUCAO

Quanto a segunda tarefa, esta utiliza:

• o formalismo das regras semanticas para exprimir como e que um elemento (ou conjunto

de elementos), num dado contexto, deve ser mapeado numa representacao semantica;

• uma ferramenta, o AsdeCopas (Analisador Semantico depois de Completada a analise

sintactica), que recebe um grafo e que, com base nas regras semanticas, calcula as

representacoes semanticas.

A Figura 1.1 representa a arquitectura simplificada da interface.

!"#$%"&'()&*+"&

!"#$%"&',%$+-.#"&

/0.,"

1$20$&$34.56$&'&$7834*+.&

90"20*$#.#$&'#$',%$+-.:$7

1$:0.&'&$7834*+.&

;%:.&

<:0$

;&#$="2.&

>.0$,.'?

>.0$,.'@

Figura 1.1: Arquitectura simplificada da Interface.

As regras semanticas e o AsdeCopas podem ser usados para outras tarefas para alem do

calculo das representacoes semanticas. Por exemplo, podem ser usados para enriquecer o

grafo etiquetando-lhe os arcos, ou para fazer desambiguacao semantica. Deste modo, as re-

gras semanticas e o AsdeCopas podem ser utilizados numa arquitectura como a da Figura 1.2.

Page 40: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

1.3. PRINCIPAIS CONTRIBUICOES 5

!"#$%

&'("#)*

)'+,-./0#)1)2'3%4#)

&')56.#2%)

Figura 1.2: Utilizacao do AsdeCopas.

Opcionalmente, sobre os modelos basicos pode ser executado o Tira-Teimas

[Coheur e Mamede, 2003, Coheur e Mamede, 2004], uma ferramenta desenvolvida no ambito

desta tese, com o objectivo de verificar se os modelos basicos encontrados satisfazem (ou nao)

um conjunto de restricoes definidas atraves das propriedades de existencia e linearidade do

5P [Bes, 1999a]. Esta aplicacao e independente da interface, e serve apenas para identificar

modelos basicos que nao respeitem as ditas restricoes.

1.3 Principais Contribuicoes

As principais contribuicoes desta tese podem sumariar-se no que se segue:

• Formalismos:

– propriedades de flechagem: extensao do formalismo;

– regras semanticas: criacao do formalismo. Estas regras semanticas tem a particula-

ridade de estarem organizadas hierarquicamente;

Page 41: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

6 CAPITULO 1. INTRODUCAO

• Ferramentas:

– Algas: ferramenta que, com base nas propriedades de flechagem, constroi modelos

flechados a partir dos modelos basicos;

– Ogre: ferramenta que abstrai o grafo dos modelos flechados;

– AsdeCopas: ferramenta que, com base nas regras semanticas, pode ser usada

como desambiguador, para enriquecer o grafo, ou para associar ao texto uma

representacao semantica.

– Tira-Teimas: ferramenta que verifica se um conjunto de modelos basicos verificam

propriedades de existencia e linearidade do 5P;

• Casos estudados:

– interpretacao de questoes;

– desambiguacao semantica de um conjunto de quantificadores.

1.4 Organizacao da Tese

Esta tese esta organizada como se segue:

• Capıtulo 2: Estado da Arte

Neste capıtulo, apresenta-se o estado da arte descrevendo-se um conjunto de interfaces

sintaxe/semantica, bem como algumas caracterısticas de linguagens alvo;

• Capıtulo 3: Formalismos

Neste capıtulo, definem-se os formalismos usados pela interface sintaxe/semantica desta

dissertacao, nomeadamente as propriedades de flechagem e as regras semanticas;

Page 42: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

1.4. ORGANIZACAO DA TESE 7

• Capıtulo 4: Recursos disponıveis

Resumem-se neste capıtulo os recursos informaticos e linguısticos usados, previamente

existentes, isto e, que nao foram desenvolvidos nesta tese. Descreve-se ainda um conjunto

de tratamentos feitos no quadro da interpretacao de questoes;

• Capıtulo 5: Interpretacao de questoes: propriedades de flechagem

Neste capıtulo, apresentam-se as propriedades de flechagem relativas a interpretacao das

questoes;

• Capıtulo 6: Interpretacao de questoes: regras semanticas

Este capıtulo contem as regras semanticas relativas a interpretacao das questoes;

• Capıtulo 7: Desambiguacao de quantificadores

Este capıtulo aborda a desambiguacao semantica do qualquer e de outros operadores;

• Capıtulo 8: Processamento

Descrevem-se aqui as ferramentas desenvolvidas nesta dissertacao, nomeadamente o Al-

gas, o Ogre e o AsdeCopas;

• Capıtulo 9: Avaliacao

Neste capıtulo, e feita a avaliacao do trabalho realizado nesta tese no quadro da

interpretacao de questoes. Faz-se ainda uma comparacao entre a interface desenvolvida

nesta dissertacao e a interface do Edite;

• Capıtulo 10: Trabalho futuro e conclusoes

Neste capıtulo, recordam-se as principais contribuicoes, discute-se o trabalho futuro e

tecem-se algumas consideracoes.

Em apendice encontra-se:

Page 43: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

8 CAPITULO 1. INTRODUCAO

• Apendice A: Tira-Teimas

Neste apendice, descreve-se o Tira-Teimas.

• Apendice B: Exemplos

Neste apendice, apresentam-se exemplos que ilustram varias etapas do processamento

de questoes, incluindo os resultados produzidos pela interface sintaxe/semantica.

Page 44: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2KL� �F��&� &%� �M�0�

Desde que Montague formalizou a primeira interface sintaxe/semantica em [Montague, 1974c]

e que Woods apresentou o sistema Lunar [Woods, 1978], muitos sistemas de processamento

de Lıngua Natural foram desenvolvidos com interfaces sintaxe/semantica proprias. Neste

capıtulo faz-se a apresentacao de um conjunto de interfaces sintaxe/semantica que, por razoes

historicas, por serem largamente difundidas, por terem caracterısticas comuns com a interface

desta tese, ou simplesmente pela sua originalidade, se resolveu destacar. Adicionalmente, e

porque na base da interface desta dissertacao esta um grafo que pode ser visto como uma estru-

tura de dependencias, apresenta-se um conjunto de gramaticas de dependencias. Finalmente,

e dado que a escolha da linguagem alvo e fundamental no desempenho de uma interface sin-

taxe/semantica, tambem algumas caracterısticas usuais das linguagens de representacao alvo

sao discutidas neste capıtulo.

A organizacao do capıtulo e a seguinte: da seccao 2.1 a seccao 2.5 apresentam-se varios tipos

de interface sintaxe/semantica; a seccao 2.6 e dedicada as gramaticas de dependencia; a seccao

2.7 tem por tema as linguagens de representacao alvo.

Page 45: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

10 CAPITULO 2. ESTADO DA ARTE

2.1 Montague

Richard Montague (1930-1971) tornou-se uma referencia obrigatoria em semantica quando afir-

mou que a Lıngua Natural podia ser descrita pela mesma teoria matematica das linguagens

artificiais. Para corroborar esta hipotese, Montague apresentou tres trabalhos: Universal Gram-

mar (UG) [Montague, 1974c], The Proper Treatment of Quantification in Ordinary English (PTQ)

[Montague, 1974b] e English as a Formal Language (EFL) [Montague, 1974a], onde se descrevem

tres interfaces formais que mapeiam fragmentos do ingles num universo de interpretacao (so-

bre o empirismo da hipotese de Montague, leia-se [Bes, 2001b]).

Nesta seccao faz-se um breve resumo da interface de PTQ (consulte-se [Dowty et al., 1981]

para uma apresentacao detalhada). Supostamente PTQ seria uma instancia de UG

[Dowty et al., 1981]. No entanto, ha muitos pontos em que estas duas teorias nao convergem,

remetendo-se o leitor para [Coheur, 2002] onde, para alem de uma apresentacao simplificada

destes dois trabalhos, se faz um paralelo entre eles.

2.1.1 Sintaxe do fragmento do ingles

A sintaxe do fragmento do ingles em analise e descrita por Montague atraves de:

• um conjunto de categorias sintacticas, tendo cada uma associada um conjunto, eventual-

mente vazio, de expressoes basicas;

• um conjunto de regras sintacticas, contendo cada uma:

– uma funcao (que pode ser partilhada por varias regras);

Page 46: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2.1. MONTAGUE 11

– a(s) categoria(s) que constituem os argumentos da funcao;

– a categoria do resultado da funcao.

De seguida, define-se o conjunto de categorias e o conjunto de expressoes basicas associadas a

uma categoria.

Def 1: Conjunto das categorias sintacticas

O que se segue sao categorias sintacticas:

• e e uma categoria sintactica (associada as entidades);

• t e uma categoria sintactica (associada a frase);

• se A e B sao categorias sintacticas, entao A/B e A//B sao categorias sintacticas (assume-

-se associatividade a direita).

N

Exemplo 1: Conjunto das categorias sintacticas

e, t, e/t, e//t, e/t/t, e/t//t, sao categorias sintacticas. �

Def 2: Expressoes Basicas de Categoria A

Seja A uma categoria sintactica. BA e o conjunto de expressoes basicas de categoria A, dizendo-

-se que BA constitui o vocabulario do fragmento. N

Exemplo 2: Expressoes basicas

Denotando t/e por IV e t/IV por T, no fragmento do ingles tem-se (entre outros):

Be = ∅ = Bt;

Page 47: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

12 CAPITULO 2. ESTADO DA ARTE

BIV = {run, walk, talk, rise, change, ...};

BT = {John, Bill, ninety, he0, he1, ...}.

Como Montague considerava que cada nome proprio denotava, nao um indivıduo, mas as propriedades

associadas a ele, o conjunto das entidades e vazio (Be = ∅). Por seu lado, Bt = ∅, pois t denota a frase (ou

seja, nao existem expressoes basicas de categoria t).

Por sua vez, BIV e o conjunto dos verbos intransitivos e dos sintagmas verbais e BT contem os termos,

ou seja, os sintagmas nominais e nomes proprios. �

Def 3: Expressoes de categoria A

Seja A uma categoria. PA, o conjunto das expressoes de categoria A, e a uniao do conjunto de

expressoes basicas de categoria A (BA) com o conjunto de todas a expressoes de categoria A,

obtidas atraves das regras sintacticas. N

Apresenta-se de seguida um exemplo de uma regra sintactica de PTQ: a regra S4, uma regra

que combina o sujeito com o predicado.

Def 4: Regra sintactica S4 (sujeito/predicado)

S4: α ∈ PT , β ∈ PIV ⇒ F4(α, β) ∈ Pt, tal que F4(α, β) = αβ’, onde β’ e o resultado de substituir

o primeiro verbo em β (isto e, um membro de BIV , BTV , ...) pela sua forma na terceira pessoa

do singular. N

Exemplo 3: John walks

John walks e uma expressao de categoria t (e uma frase), pois de acordo com as regras para o fragmento

do ingles:

John ∈ BT e walk ∈ BIV

Page 48: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2.1. MONTAGUE 13

John ∈ PT e walk ∈ PIV

⇓ S4

John walks ∈ Pt. �

2.1.2 Traducao em Logica Intencional

Para alem de uma funcao que mapeia as categorias sintacticas em tipos da Logica Intencional,

Montague utiliza no processo de traducao de PTQ um conjunto de regras de traducao, estando

a cada regra sintactica associada uma regra de traducao.

Comecando pela representacao semantica das expressoes basicas, cada expressao basica de

uma dada categoria sintactica e traduzida numa expressao (nao necessariamente basica) em

Logica Intencional. Como restricao, a representacao escolhida em Logica Intencional tem de

ter como tipo, o tipo resultante do mapeamento da categoria sintactica nos tipos da Logica

Intencional. A escolha da representacao das expressoes basicas nem sempre e muito clara

[Dowty et al., 1981], e fica fora do ambito desta apresentacao. O exemplo que se segue ilus-

tra a representacao atribuıda aos nomes proprios.

Exemplo 4: Traducao de expressoes basicas

A categoria sintactica T e mapeada no tipo <<s, <e, t>>, t> atraves da funcao que mapeia as categorias

sintacticas em tipos da Logica Intencional. Dado que John ∈ BT , ou seja, dado que John e uma expressao

de categoria T , a sua representacao em Logica Intencional – dada por λP [∨P (j)], em que ∨ indica ex-

tensao – tem esse tipo associado. Esta formula define a pessoa John atraves das propriedades que esta

verificar. �

Depois de cada expressao basica ter uma traducao associada, resta apresentar as regras de

Page 49: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

14 CAPITULO 2. ESTADO DA ARTE

traducao (ou semanticas), que estao associadas as regras sintacticas (cada regra sintactica Sn

tem uma regra de traducao Tn associada). Assim, para a regra S4 anteriormente apresentada,

tem-se a seguinte regra de traducao:

Def 5: Regra de Traducao T4(Sujeito/Predicado)1

T4: α ∈ PT , β ∈ PIV e α e β traduzem-se, respectivamente, em α’ e β’⇒ F4(α, β) traduz-se em

α’(∧β’) (em que ∧ indica intencao). N

Exemplo 5: John walks

Seguindo [Dowty et al., 1981], suponha-se que a representacao de walk em Logica Intencional e dada por

walk’. Atraves da regra de traducao T4, a representacao de John walks e dada por walk’(j), pois, sabendo

que ∨∧α = α, tem-se:

λP[∨P(j)](∧walk’) = ∨∧walk’(j) = walk’(j). �

2.1.3 Evolucoes e comentarios

Os tres artigos historicos de Montague encontram-se descritos e discutidos em inumeros tra-

balhos. Consulte-se, por exemplo, [Dowty et al., 1981] sobre PTQ, [Partee e Hendriks, 1999]

para uma discussao mais geral sobre o trabalho de Montague, ou [Chambreuil, 1989] para uma

abordagem mais formal. Em [Gharbia et al., 1998] discute-se o trabalho de Montague, e outras

abordagens que lhe sucederam. Em particular, descreve-se o trabalho de Keenan e Faltz sobre a

semantica booleana [Keenan e Faltz, 1985], onde se da um pouco mais de ordem as algebras do

formalismo de Montague, que passam a algebras booleanas. Em [Gharbia et al., 1998], analisa-

-se ainda a Semantica Geral de Daniel Vanderveken, que trata actos do discurso. A base deste

1Quando a regra de traducao tem a forma α’(∧β’), diz-se que e uma aplicacao funcional [Dowty et al., 1981]. A maioriadas regras tem esta forma.

Page 50: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2.2. FAMILIA EDITE 15

trabalho sao os formalismos de Montague, mas a semantica das expressoes linguısticas nao se

reduz a uma teoria de determinacao de condicoes de verdade, sendo as unidades basicas de

significado constituıdas por actos do discurso.

Em [Bes, 2001b] analisa-se ainda o modo como PTQ e UG lidam com ambiguidade, que foi um

dos problemas do trabalho de Montague: a base de traducao de UG impede que uma palavra

seja semanticamente ambıgua se as duas interpretacoes nao puderem derivar de categorias gra-

maticais distintas (por exemplo, pata, como femea do pato e pata como membro de um animal,

tem a mesma categoria gramatical, logo nao podem ser semanticamente ambıguas).

Consulte-se [Chambreuil, 1989] ou [Cooper et al., 1994] para mais comentarios sobre extensoes

a Gramatica de Montague.

2.2 Famılia Edite

A interface sintaxe/semantica do Edite vai ilustrar toda uma famılia de interfaces que remonta

a trabalhos dos anos 70. Estas interfaces podem usarem calculo-λ nas regras semanticas, podem

basear-se unicamente em unificacao de features, podem ser abordagens fortemente lexicalistas

(ou nao), e podem ainda variar pela linguagem que escolheram como alvo. No entanto, tem

em comum o facto de terem regras semanticas associadas as regras sintacticas (paralelismo

sintaxe-semantica), sendo a interface feita percorrendo as estruturas sintacticas obtidas e fa-

zendo disparar as regras semanticas que estao associadas as regras sintacticas responsaveis

por essas estruturas sintacticas. Nestas abordagens, normalmente, a analise semantica segue-

-se a analise sintactica, apesar de existirem abordagens em que as duas analises sao feitas em

paralelo.

Page 51: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

16 CAPITULO 2. ESTADO DA ARTE

2.2.1 A interface sintaxe/semantica do Edite

Considere-se a questao O hotel Ritz tem piscina?. Suponha-se que no dicionario do Edite se en-

contram as seguintes entradas, em que cada palavra tem associada a sua categoria gramatical

(CAT), a sua semantica (SEM) e um tipo (TIPO). A semantica de uma palavra pode ser indefi-

nida (IND), mas tipicamente e dada por um predicado e pela sua aridade, como por exemplo

hotel, predicado de aridade 1. O tipo da palavra pode ser igualmente indefinido ou uma

palavra. Por exemplo, o tipo da palavra Ritz e hotel.

O/CAT=art,SEM=IND,TIPO=IND

hotel/CAT=nc,SEM=hotel|1,TIPO=hotel

Ritz/CAT=npr,SEM=Ritz,TIPO=hotel

tem/CAT=v,SEM=ter|2,TIPO=IND

piscina/CAT=nc,SEM=piscina|0,TIPO=piscina

As regras semanticas do Edite sao construıdas com base num conjunto de operadores, do qual

se destacam os da tabela 2.1.

Operador Aridade Significado? 1 ?X devolve a semantica de XS 3 S(X N Y) devolve Y com X no N-esimo argumento

Tabela 2.1: Alguns operadores usados pelo Edite.

Suponha-se ainda que a gramatica do Edite (uma gramatica livre de contexto) contem as se-

guintes regras sintacticas e semanticas (entre parentesis).

(1) F -> SN SV {S(?SN 1 ?SV)}

Page 52: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2.2. FAMILIA EDITE 17

(2) SN -> art npr nc {S(?npr 1 ?nc)}

(3) SN -> nc {?nc}

(4) SV -> v SN {S (?SN 2 ?v)}

A primeira regra indica que a semantica da frase (F) e dada substituindo a semantica do sin-

tagma nominal (SN) no primeiro argumento da semantica do sintagma verbal (SV); a segunda

e a terceira indicam, respectivamente, que a semantica do sintagma nominal se obtem substi-

tuindo a semantica do nome proprio no primeiro argumento do nome comum, ou entao que

e a semantica do nome comum; a ultima regra indica que a semantica do sintagma verbal e

obtida substituindo a semantica do sintagma nominal no segundo argumento da semantica do

sintagma verbal.

Com base nesta gramatica obtem-se a arvore da figura 2.1, onde estao igualmente representa-

das as regras semanticas associadas as regras sintacticas responsaveis pela estrutura da arvore.

Figura 2.1: Analise da frase O hotel Ritz tem piscina?

Depois de associar a semantica a cada palavra tal como definida no dicionario e percorrendo a

arvore de baixo para cima, obtem-se a seguinte forma logica:

hotel(Ritz)

Page 53: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

18 CAPITULO 2. ESTADO DA ARTE

tem(Ritz, piscina)

Esta formula resulta do seguinte:

• por um lado, a semantica do SN o hotel Ritz obtem-se substituindo a semantica do nome

proprio (a constante Ritz, de acordo com a entrada no dicionario) no primeiro argu-

mento da semantica do nome comum (a formula hotel(x)), ou seja, a semantica do SN

o hotel Ritz e dada por hotel(Ritz);

• por outro lado, a semantica do SV tem piscina e calculada quando se substitui a semantica

do SN (que e a semantica do nc piscina) no segundo argumento da formula que repre-

senta a semantica do verbo (tem(x, y)). A formula obtida e tem(x, piscina);

• finalmente, a semantica da frase e dada pela formula resultante da substituicao da

formula que representa a semantica do SN o hotel Ritz no primeiro argumento da formula

que representa a semantica do SV. Calcula-se assim a formula tem(Ritz, piscina),

hotel(Ritz).

Repare-se que e a constante Ritz que se insere no primeiro argumento da formula resultante

da analise semantica do sintagma verbal, e nao a formula hotel(Ritz), que originaria uma

formula mal formada em logica de primeira ordem: tem(hotel(x), piscina) . Este passo

de abstraccao e feito internamente no algoritmo de analise semantica. Esta e uma situacao

comum a estas abordagens. Por exemplo, em [Jurafsky e Martin, 2000], recorre-se a nocao de

complex term para tratar este tipo de problemas: termos complexos sao permitidos em lugares

que normalmente seriam ocupados na logica de primeira ordem por termos, e depois uma

regra converte a formula resultante numa formula bem formada da logica de primeira ordem.

Page 54: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2.3. DRT 19

2.2.2 Evolucoes e comentarios

Desta famılia, para alem do Edite, das interfaces descritas em [Allen, 1995] e em

[Jurafsky e Martin, 2000], faz ainda parte a interface do classico Core Language Engine(CLE)

[Alshawi, 1992, Alshawi et al., 1988, Alshawi e Crouch, 1991]. Este sistema foi desenvolvido

pelo SRI International numa serie de projectos que tiveram inıcio em 1986. O sistema original

era para o ingles, mas foi depois estendido para sueco [Gamback e Rayner, 1992] e para frances

e espanhol [Rayner et al., 1996]. No CLE, cada regra semantica descreve como o significado

de uma expressao complexa se compoe com base no significado dos seus constituintes, tendo

cada regra sintactica uma ou mais regras semanticas associadas. A linguagem de representacao

usada no CLE e a Quasi-Logical-Form(QLF).

De acordo com [Bes, 2001b] nao existem regras sintacticas no 5P no sentido convencional do

termo, isto e, a analise sintactica nao se apoia em regras que representem partes de uma

arvore. Deste modo, mesmo que se desejasse seguir um metodo semelhante, em que as re-

gras semanticas estao acopladas as regras sintacticas, tal nao seria possıvel.

No capıtulo 9 a interface proposta e comparada com a interface do Edite.

2.3 DRT

A Discourse Representation Theory (DRT), desenvolvida por Kamp e Reyle nos anos 80, e uma te-

oria sobre a semantica das lınguas naturais que se insere no domınio da semantica formal e da

semantica dinamica, e cuja motivacao original foi a interpretacao de anaforas nominais e tem-

porais em discurso. A primeira versao da DRT encontra-se descrita em [Kamp e Reyle, 1993],

Page 55: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

20 CAPITULO 2. ESTADO DA ARTE

um livro que e uma referencia obrigatoria em semantica, nao apenas pela apresentacao da DRT,

mas pelo modo pedagogico com que apresenta diversos problemas deste domınio.

2.3.1 Interface da DRT

Na DRT a unidade de analise semantica e o discurso e nao a frase. Cada nova frase de um texto

e interpretada no contexto dado pelas frases precedentes, sendo o contexto actualizado com a

contribuicao da nova frase. A actualizacao e feita atraves da introducao de uma nova formula

e – se for caso disso – da introducao dos chamados referentes do discurso, que servirao de

antecedentes a expressoes anaforicas no discurso posterior. Ao mesmo tempo, se a nova frase

tiver elementos anaforicos, estes serao possivelmente associados aos referentes do discurso

pre-existente.

De modo a captar estas informacoes, as estruturas sintacticas sao mapeadas em Discourse Re-

presentation Structures (DRS), estruturas constituıdas por:

• um conjunto de referentes do discurso (que constituem o universo das DRS);

• um conjunto de condicoes.

Tendo as DRS como alvo da interface, esta baseia-se num conjunto de regras que disparam

sempre que se verifica um conjunto de condicoes sintacticas (as trigger conditions). Deve-se

notar que, ao contrario da famılia de interfaces descrita em 2.2, estas regras nao se apoiam

nas regras sintacticas intervenientes na analise sintactica (como nos casos anteriores), mas nas

estruturas sintacticas produzidas por estas regras. Ou seja, as regras semanticas sao disparadas

mediante a existencia de certas estruturas sintacticas, e nao em resultado das regras sintacticas

Page 56: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2.3. DRT 21

que as originaram.

De seguida, ilustra-se o modo como se realiza a interface entre a sintaxe e a semantica no

quadro da DRT, tal como explicada em [Kamp e Reyle, 1993].

Considerem-se as seguintes frases: Joao procura Maria. Ela desapareceu. A informacao linguıstica

em causa (neste caso, concordancia em genero), dira que o pronome Ela se pode ligar na pri-

meira frase ao nome proprio Maria. A primeira frase fara disparar, entre outras, duas vezes

a regra CR.PN (Figura 2.2). Esta regra e disparada quando um sintagma nominal contem um

nome proprio (a sua trigger condition).

Acção:

Introduz um novo referente na DRS principal (seja x)

Substitui na árvore por x

S

SN SV’

np

S

V SN

np

ou

SN

np

Condições de disparo da regra

Z Z Z

Introduz a consição z(x) na DRS principal

Figura 2.2: Regra CR.PN

Com os disparos da regra CR.PN, disponibilizam-se duas variaveis, uma associada a Joao, outra

a Maria, que vao ser colocadas como referentes do discurso, no universo da DRS. Ou seja, findas

as duas aplicacoes da regra CR.PN obtem-se a DRS da figura 2.3.

Segue-se a segunda frase, Ela desapareceu, que contem um pronome. E entao disparada a regra

CR.PRO (figura 2.4).

Esta regra indica que uma frase com um sintagma verbal e com um sintagma nominal que con-

Page 57: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

22 CAPITULO 2. ESTADO DA ARTE

x, y

João(x) Maria(y)

x procura y

Figura 2.3: DRS para a frase Joao procura Maria

Acção:

Escolhe um referente disponível adequado (seja y)

Introduz um novo referente, seja x;

Adiciona a condição x = y;

Substitui por x

S

SN SV’

PRO

S

V SN

PRO

ou

SN

PRO

Condições de disparo da regra

Z

Z

Z

Figura 2.4: Regra CR.PRO

tenha um pronome devera fazer disparar uma accao em que o pronome se liga a “um referente

disponıvel adequado”. Como resultado obtem-se a DRS da figura 2.5, em que o pronome ela

ficou associado a Maria (z = y).

x, y

João(x) Maria(y)

x procura y z desapareceu

z = y

Figura 2.5: DRS para a frase Ela desapareceu

Page 58: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2.3. DRT 23

2.3.2 Evolucoes e comentarios

Foram feitas varias extensoes a DRT ao longo dos ultimos anos, encontrando-se em preparacao

um survey [Kamp et al., 2004]. Tal como e dito em [Kamp et al., 2004], existem versoes da DRT:

• construıdas sobre variados formalismos sintacticos (LFG, HPSG, etc.);

• usando diferentes algoritmos de construcoes de DRS (actualmente, e de acordo com

[Kamp et al., 2004], tem-se usado processos bottom-up);

• usando versoes subespecificadas da DRT – por exemplo, a aplicacao da Hole Semantics

de Bos [Bos, 1995] a DRT (veja-se [Chaves, 2002] para uma descricao de algumas destas

abordagens subespecificadas e comparacoes).

A DRT e um exemplo concreto de uma abordagem em que a informacao linguıstica utilizada

nao e facilmente recuperavel, neste caso das regras. Kamp e Reyle apresentam no texto de

[Kamp e Reyle, 1993], em ingles, os contextos linguısticos que permitem estabelecer relacoes

anaforicas. No entanto, e complicado extrair esta informacao das regras apresentadas, dado

que esta informacao se encontra diluıda nas proprias DRS e no algoritmo de transformacao.

Senao, considerem-se as frases (1) e (2).

(1) O Joao tem um Ferrari. Ele e rapido.

(2) O Joao nao tem um Ferrari. Ele e rapido.

A informacao linguıstica em causa, dira que o pronome Ele se pode ligar na primeira frase

quer ao nome proprio Joao quer ao nome proprio Ferrari, mas, na segunda, apenas ao nome

proprio Joao, dado que o nome proprio Ferrari se encontra sobre o alcance de uma negacao.

Page 59: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

24 CAPITULO 2. ESTADO DA ARTE

Infelizmente, para se obter esta informacao na DRT, ha que a recuperar quer do processa-

mento associado as regras de traducao, quer das proprias DRS. Assim, e de acordo com

[Kamp e Reyle, 1993], a regra CR.PRO, para os pronomes, diz que uma frase com um sintagma

verbal e um sintagma nominal que contenha um pronome (que e o caso do Ele e rapido), devera

fazer disparar uma accao em que o pronome se liga a “um referente disponıvel adequado”. Ora

para perceber quais sao os referentes disponıveis adequados, ha que recuar a representacao das

frases iniciais (O Joao tem um Ferrari e O Joao nao tem um Ferrari). Por um lado, a DRS que re-

presenta a frase O Joao tem um Ferrari, criada atraves da regra CR.PN – disparada quando um

sintagma nominal tem um nome proprio – disponibiliza duas variaveis, uma associada a Joao,

outra a Ferrari2; ou seja, o pronome da segunda frase encontra dois referentes disponıveis. Por

outro lado, a DRS que representa a frase O Joao nao tem um Ferrari, e que usa a regra CR.NEG

(para a negacao), torna apenas disponıvel a variavel associada a Joao. Deste modo o Ele da

segunda frase pode apenas ligar-se a Joao e nao a Ferrari.

Reencontra-se assim a informacao linguıstica, dispersa nas regras que geram as DRS, e nas

proprias DRS.

Apesar de, nesta dissertacao, nao se tratar a anafora, ha um ponto em comum entre a DRT

e o trabalho desta tese: em ambos os casos, as regras semanticas disparam mediante certas

condicoes sintacticas da estrutura resultante da analise sintactica, e nao, ao contrario das inter-

faces anteriormente apresentadas, em resultado das regras sintacticas em si.

2Note-se que esta informacao vem da semantica atribuıda a DRS e nao da regra que a originou.

Page 60: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2.4. LINK GRAMMAR E MINIMAL LOGICAL FORM 25

2.4 Link grammar e Minimal Logical Form

O ExtrAns [Molla et al., 2000b, Rinaldi et al., 2002, Molla et al., 2003] e um sistema de extraccao

de informacao que tem sido aplicado a domınios restritos, e que transforma as questoes e os

documentos onde esta a informacao numa forma logica chamada Minimal Logical Form (MLF).

A base sintactica do ExtrAns e dada por dependencias construıdas com base na Link Gram-

mar [Sleator e Temperley, 1993], gerando-se as formulas em MLF a partir dessas estruturas de

dependencias.

De seguida, faz-se uma breve apresentacao da Link Grammar, de como se constroem as estru-

turas de dependencia e ainda de como e que o ExtrAns chega as formulas em MLF a partir

destas.

2.4.1 Link Grammar

A Link Grammar e uma teoria gramatical baseada em dependencias, sendo a gramatica cons-

tituıda por um dicionario em que cada palavra tem associado um conjunto de requisitos, os

connectors. Cada connector indica os elementos com os quais a palavra se pode ligar. Esta abor-

dagem e lexical, nao se fazendo uso de constituintes ou de categorias gramaticais.3

De acordo com a Link Grammar, uma sequencia de palavras e gramatical se for possıvel cons-

truir uma linkage, isto, e se for possıvel estabelecer ligacoes entre as palavras da sequencia, de

tal modo que:

3Chama-se a atencao para a quantidade de informacao lexical necessaria num sistema deste tipo. Por exemplo,a palavra cat pode ser usada de 369 maneiras, e a palavra time de 1689 [Sleator e Temperley, 1993].

Page 61: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

26 CAPITULO 2. ESTADO DA ARTE

• os requisitos locais de cada palavra sao satisfeitos (satisfacao);

• as dependencias nao se cruzam (projectividade);

• as palavras formam um grafo conectado (conectividade).

Como exemplo, considerem-se as entradas [Sleator e Temperley, 1993] da tabela 2.2, em que os

sufixos “+” e “-” indicam a direccao da dependencia a estabelecer (esquerda ou direita), o “&”

indica que ambas as formulas tem de ser satisfeitas e o “or” indica a disjuncao exclusiva:

palavra connectora, the D+snake, cat D- & (0- or S+)chased S- & 0+

Tabela 2.2: Entradas na Link Grammar.

Considere-se a frase The cat chased a snake. A entrada do dicionario associada a palavra the

indica que o seu connector e um D+. Para que este seja satisfeito, tem de se ligar com um

connector simetrico: D-. Ou seja, pode haver uma ligacao entre este the e snake ou cat. No

entanto, a unica linkage possıvel e feita entre as palavras the e cat (D) – e a e snake (D), cat e

chased (S) e, finalmente, chased e snake (0) – pois a linkage que ligava the a snake desrespeitaria a

projectividade.

2.4.2 Construcao das estruturas de dependencia

Em [Sleator e Temperley, 1993] e apresentado um algoritmo que cria estruturas de de-

pendencias (etiquetadas, mas nao direccionadas) com base na Link Grammar. Sem entrar em

grandes detalhes, o algoritmo baseia-se no nao cruzamento de dependencias (projectividade) e

ainda no facto de duas palavras nao poderem estar ligadas por duas dependencias diferentes

Page 62: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2.4. LINK GRAMMAR E MINIMAL LOGICAL FORM 27

(regra de exclusao). Assim, supondo que foi proposta uma dependencia entre duas palavras

(por exemplo, uma tinha na sua definicao um D+ e a outra, a sua direita, um D-), ha que ana-

lisar as ligacoes entre essas palavras sabendo de antemao que as duas palavras originais nao

estao ligadas de mais nenhuma maneira (regra de exclusao) e que as palavras entre elas estao

ligadas ou a estas duas palavras, ou entre si, nao sendo possıvel estabelecer dependencias com

palavras exteriores ao intervalo (projectividade).

Ao algoritmo original e acrescentado em [Grinberg et al., 1995] o conceito de dependencia nula

(null link): dependencia sem etiqueta que liga palavras adjacentes. Este novo algoritmo lida

com a nocao de custo, baseada na quantidade de dependencias nulas que foi necessario intro-

duzir para realizar a analise. O seu objectivo e determinar as analises com um custo mınimo.

Assim:

• a frase e analisada atraves do algoritmo original;

• se a frase e gramatical, o algoritmo termina; caso contrario, calcula-se o numero total de

dependencias nulas em cada hipotese de analise;

• identificam-se as de menor custo.

2.4.3 Construcoes das formulas logicas

No ExtrAns constroem-se formulas logicas em MLF a partir de estruturas de de-

pendencias da Link Grammar. Este processo e descrito em [Molla et al., 2000a] e em

[Molla e Hutchinson, 2003], e resumido de seguida.

A criacao de formas logicas a partir das linkages e feita em dois passos. No primeiro passo, as

Page 63: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

28 CAPITULO 2. ESTADO DA ARTE

ligacoes devolvidas pela Link Grammar que nao eram direccionadas, passam a se-lo. Na maioria

dos casos isto e feito olhando para o tipo da ligacao numa tabela. No entanto, existem alguns

casos especıficos em que a direccao da dependencia depende do contexto, sendo necessario

um processamento mais elaborado. No segundo passo, a forma logica e construıda num pro-

cesso de cima para baixo que comeca no nucleo da frase principal, e que vai percorrendo as

dependencias. Note-se que as decisoes a tomar em presenca das diferentes dependencias nao

sao definidas externamente a este processo [Molla, 2004].

Quando aparece uma ligacao nao esperada, trabalha-se com informacao parcial. Para isso foi

implementado um tratamento especial que procura palavras nao processadas, localiza os seus

nucleos e, recursivamente, aplica o algoritmo. As formas logicas resultantes sao adicionadas

a forma logica da frase. O resultado e uma forma logica que codifica parte da frase, deixando

alguns elementos nao especificados. No entanto, e de acordo com [Molla e Hutchinson, 2002],

alguns destes passos podem ser muito complexos, por vezes envolvendo aplicacoes recursivas.

Adicionalmente, particularidades especıficas de estruturas de dependencia devolvidas pela

Link Grammar adicionam complexidade a este processo.

2.4.4 Evolucoes e comentarios

O modulo responsavel pela construcao da estrutura de dependencias esta disponıvel

para utilizacao (ou carregamento) em http://www.link.cs.cmu.edu/link/. Neste endereco

encontra-se igualmente uma lista de 900 exemplos de frases que ilustram os fenomenos cober-

tos pela Link Grammar. Deve-se notar que este algoritmo se baseia na propriedade de projecti-

vidade, nao podendo desligar-se dela. Ou seja, a obtencao de resultados que nao a verifiquem

nao e uma opcao de utilizacao.

Page 64: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2.5. CONEXOR FDG E MINIMAL LOGICAL FORM 29

Quanto a interface sintaxe/semantica em si, isto e, a etapa que pega nas estruturas geradas

pela Link Grammar e devolve formulas logicas, a informacao sobre as decisoes a tomar relativas

a geracao das formulas logicas em presenca de certas dependencias faz parte do algoritmo, ou

seja, as descricoes estao misturadas com o processamento.

2.5 Conexor FDG e Minimal Logical Form

2.5.1 Construcao das estruturas de dependencia

A Constraint Grammar (CG) foi proposta por Fred Karlsson nos finais dos anos 90, estando li-

gada a analisadores reducionistas: sao construıdas todas as hipoteses possıveis, e depois, um

conjunto de regras que opera por eliminacao ou seleccao, vai levar a escolha de uma unica

analise. Esta tecnica e usada na analise morfologica – em que etiquetas sao associadas a pala-

vras e um conjunto de regras faz a desambiguacao – e na analise sintactica – em que, depois da

desambiguacao morfologica, todas as etiquetas sintacticas (de superfıcie) sao adicionadas as

palavras, entrando posteriormente em accao um conjunto de regras sintacticas que eliminam

ou seleccionam alternativas.

O formalismo das regras suporta dois tipos basicos: REMOVE e SELECT, que respectivamente,

sao encarregues de eliminar e seleccionar classificacoes associadas a uma palavra. O exem-

plo 6 apresenta uma regra local (o teste e feito sobre os vizinhos imediatos da palavra) de

[Jarvinen e Tapanainen, 1997].

Exemplo 6: Constraint Grammar: regra local

A regra que se segue:

Page 65: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

30 CAPITULO 2. ESTADO DA ARTE

REMOVE (V) IF (-1C DET)

elimina uma hipotese de verbo (V) se a palavra precedente (-1) for, sem duvida (C), um determinante

(DET). �

Para alem de regras locais, o formalismo gramatical dispoe ainda de regras em que o teste e

feito sobre quaisquer elementos da frase, ou entao num contexto limitado por barreiras. Estas

barreiras podem ser palavras ou categorias gramaticais.

Em relacao a analise sintactica efectuada pela CG, sao marcadas no texto as funcoes sintacticas

associadas a cada palavra, ficando implıcitas as relacoes de dependencia. Ficam ainda por

resolver um conjunto de ambiguidades.

Por isto, desenvolveu-se um formalismo baseado na CG, mas com regras mais expressivas,

capaz de explicitar as relacoes de dependencia. A esta nova abordagem chamou-se Functional

Dependency Grammar. Tal como e dito em [Jarvinen e Tapanainen, 1997]:

both the dependent and its head are implicitly (and ambiguosly) present in the Constraint Grammar type

of rule. Here, we make this dependency relation explicit. This is done by declaring the heads and the

dependents (complement or modifier) in the context tests.

Exemplo 7: Functional dependency grammar

A regra (1) (em que as etiquetas para as funcoes sintacticas sao marcadas por @) escolhe a etiqueta su-

jeito (@SUBJ), marcado como dependente, para o verbo auxiliar imediatamente a seguir (1C AUXMOD

HEAD).

(1) SELECT (@SUBJ) IF (1C AUXMOD HEAD). �

Page 66: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2.5. CONEXOR FDG E MINIMAL LOGICAL FORM 31

Adicionalmente, o formalismo permite explicitar nas regras as valencias a serem preenchidas:

Exemplo 8: Functional dependency grammar: valencias

A regra (1), para alem do comportamento definido anteriormente, preenche o sujeito associado ao verbo.

SELECT (@SUBJ) IF (1C AUXMOD HEAD = subject). �

Note-se que neste processo, a ordem de aplicacao das regras e relevante, pois quando e estabe-

lecida uma dependencia entre etiquetas, esta ligacao pode ser usada por outras regras.

Em relacao a ambiguidade, depois da actuacao destas regras ainda ha, por vezes, ambiguidades

a resolver. E entao feito um pruning global que escolhe arvores consistentes. Em relacao a este

processo, considera-se o seguinte:

• nao ha uma unica arvore, mas uma floresta de sub-arvores;

• favorecem-se as maiores sub-arvores;

• quando ha funcoes sintacticas que nao estao ligadas a nada, existindo uma que esta,

eliminam-se as primeiras.

Este processo de poda nao conduz imediatamente a desambiguacao do sistema, mas e aplicado

iterativamente. Depois desta etapa ainda entram em accao um conjunto de heurısticas para

fazer a desambiguacao final.

Em [Jarvinen e Tapanainen, 1997] podem-se consultar os valores resultantes da deteccao de su-

jeito (precisao entre 95% e 98% e cobertura entre 83% e 92%) e objectos (precisao entre 89% e

94% e cobertura entre 83% e 91%), entre outros testes. Na verdade, este trabalho foi tao bem

sucedido que os investigadores associados (Atro Voutilainen, Pasi Tapanainen e Timo Jarvinen)

Page 67: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

32 CAPITULO 2. ESTADO DA ARTE

fundaram a Conexor, que comercializa um conjunto de produtos orientados para diferentes ta-

refas de processamento da Lıngua Natural.

2.5.2 Construcoes das formulas logicas

O Conexor FDG e constituıdo por um analisador comercial e uma gramatica, baseados na teoria

da Functional Dependency Grammar (e daı o FDG).

Em [Molla e Hutchinson, 2002] descreve-se um algoritmo que apos a construcao de uma es-

trutura de dependencia, com base no Conexor FGD, se constroem incrementalmente formas

logicas, num processo de baixo para cima, combinando informacao de uma ou mais palavras

da frase.

O algoritmo para a interpretacao semantica tem tres etapas:

• na primeira, denominada Instrospection dado que cada palavra e analisada isoladamente,

associa-se um predicado a cada palavra. O algoritmo itera sobre cada palavra da frase:

se uma palavra origina um objecto, o predicado associado introduz os seus proprios ar-

gumentos logicos. Em contra-partida, nas restantes situacoes (isto e, quando a palavra

origina uma eventualidade ou uma propriedade) introduzem-se predicados com argu-

mentos vazios, a ser preenchidos posteriormente;

• na segunda etapa, denominada Extrospection dado que se examina a relacao de de-

pendencia entre cada palavra e o seu nucleo, usam-se as relacoes de dependencia para

terminar a especificacao de cada predicado, preenchendo os seus argumentos. Assim:

– se a palavra e um modificador do nucleo, entao o argumento vazio e instanciado

Page 68: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2.5. CONEXOR FDG E MINIMAL LOGICAL FORM 33

com um valor dos argumentos do predicado introduzido pelo nucleo. Dependendo

da natureza da relacao entre o nucleo e o modificador, o novo valor e uma reificacao

ou um argumento logico do predicado do nucleo;

– se a palavra e um argumento sintactico do seu nucleo, entao e o predicado desta que

instancia o argumento logico;

– apenas em alguns casos, a cadeia de dependencias e inspeccionada de modo a que

sejam atribuıdos os argumentos logicos certos.

• na ultima etapa, faz-se uma re-interpretacao, de modo a corrigir os mapeamentos referen-

tes a coordenacao e negacao, pois, de acordo com os autores, a estrutura de argumentos

correcta nao e dedutıvel da estrutura de dependencia.

O algoritmo e robusto a lidar com estruturas de dependencias desconectadas. Nestes casos,

durante a Extrospection associam-se argumentos dummy as formulas logicas se nenhum argu-

mento logico tiver sido atribuıdo. Alternativamente, se um verbo nao tiver argumentos na es-

trutura de dependencias, assume-se que e intransitivo. No caso de o algoritmo se deparar com

estruturas de dependencias complexas, que nao foram completamente apanhadas na analise

semantica, podem-se produzir predicados que podem nao estar ligados.

2.5.3 Evolucoes e comentarios

Em relacao a construcao das estruturas de dependencias, deve-se notar que o sistema nao tem

restricoes de construcao em relacao a projectividade. No entanto, as regras permitem indicar

quando nao pode haver cruzamento de setas. Ou seja, a projectividade nao e uma imposicao

do algoritmo.

Page 69: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

34 CAPITULO 2. ESTADO DA ARTE

Tal como no sistema anterior, a informacao relativa a construcao das formulas logicas faz parte

do algoritmo. Em particular, e em relacao a geracao de formula logicas, dado que na fase

da Extrospection apenas se examinam relacoes locais entre palavras, o presente algoritmo nao

consegue produzir a estrutura de argumentos correcta para long dependencies, pois essas de-

pendencias nao sao directamente expressas pela estrutura devolvida pelo analisador. Este era

um problema que os autores apontam em [Molla e Hutchinson, 2002].

Em [Molla e Hutchinson, 2003] sao feitas duas avaliacoes do analisador da Link Grammar e do

analisador Conexor FDG. A primeira avaliacao e uma avaliacao dita intrınseca, em que os anali-

sadores sao usados como aplicacoes stand-alone. Foram escolhidas quatro relacoes gramaticais

– sujeito, objecto, complemento clausal sem sujeito overt e modificador – e usado um corpus de

500 frases (10 000 palavras) anotado com relacoes gramaticais. Nesta avaliacao, o Conexor FDG

obteve uma melhor classificacao que a Link Grammar, dado que obteve uma precisao media de

74,6% e uma cobertura media de 59,7%, contra, respectivamente 54,6% e 43,7% da Link Gram-

mar.

Na segunda avaliacao, uma avaliacao extrınseca dado que os analisadores sao avaliados no

contexto de uma aplicacao, ambos os analisadores foram usados no ExtrAns, para gerar MLF.

O objectivo de uma avaliacao extrınseca nao e avaliar a precisao ou a cobertura de um modulo,

mas sim o modo como os seus erros afectam o sucesso de uma aplicacao. Tambem aqui o Cone-

xor FDG se comportou melhor, mas as diferencas foram mais pequenas (vejam-se os resultados

em [Molla e Hutchinson, 2003]).

Uma conclusao interessante que resultou destas avaliacoes e que, mesmo que o analisador que

estabelece as relacoes gramaticais tenha muitas falhas (por exemplo, pode nao ser possıvel

estabelecer uma ligacao de sujeito entre um nome e um verbo), o gerador de formulas logicas

Page 70: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2.6. CONSTRUCAO DE ESTRUTURAS DE DEPENDENCIAS 35

consegue muitas vezes obter as formulas desejadas, se conseguir ir seguindo e inspeccionando

varias relacoes de dependencias.

Por exemplo, considere-se a frase John wanted Mary to come [Molla e Hutchinson, 2003], cuja

estrutura de dependencias calculada com base na Link grammar e a da figura 2.6.

Figura 2.6: Resultado da Link Grammar para John wanted Mary to come

Mesmo nao sendo possıvel determinar que Mary e o sujeito de come, seguindo as dependencias

– I, TOo, Os – tal pode ser deduzido.

2.6 Construcao de estruturas de dependencias

As gramaticas de dependencia estao de novo na ordem do dia, tendo-se realizado na Coling

2004 uma workshop dedicada as gramaticas de dependencia, seis anos depois da workshop

com este tema da Coling 1998. Sao variadas as propostas, desde as abordagens que se ba-

seiam essencialmente em informacao linguıstica, as abordagens que recorrem a metodos es-

tatısticos. Nesta seccao, longe de se ter como objectivo um estado da arte sobre esta famılia

de gramaticas, descrevem-se brevemente tres trabalhos desta linha, a somar aos dois previa-

mente apresentados: o da Link Grammar e o do Conexor FDG. Assim, nesta seccao, apresenta-se

a gramatica de dependencias de Convignton, que foca a importancia deste tipo de formalismos

na descricao de lınguas em que existe grande variabilidade na ordem das palavras. Segue-se

uma abordagem determinıstica que representa uma outra famılia de trabalhos neste domınio.

Page 71: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

36 CAPITULO 2. ESTADO DA ARTE

O terceiro trabalho, apesar da falta de unanimidade sobre o que se considera uma gramatica de

dependencias, dificilmente sera considerado como tal, dado que baseia a sua analise sintactica

numa segmentacao do texto em chunks e no estabelecimento de ligacoes entre estes chunks, tal

como sugerido em [Abney, 1995, Berwick et al., 1991]. No entanto, pelo facto de se preocupar

com o estabelecimento de dependencias entre chunks (e por ter varios pontos em comum com

a abordagem desta tese), decidiu-se inclui-lo nesta seccao.

2.6.1 Covington

Em [Covington, 1990], para alem de uma motivacao bem elaborada sobre gramaticas de de-

pendencia, apresentam-se dois algoritmos que se descrevem de seguida, aplicados ao Russo e

Latim, linguagens com grande variabilidade na ordem das palavras. De acordo com o autor, as

gramaticas de dependencia ao permitir o cruzamento de dependencias, conseguem dar conta

de fenomenos que as tradicionais arvores nao permitem tratar. Deste modo, a imposicao da

projectividade feita pela Link Grammar elimina exactamente o ponto forte das gramaticas de

dependencia em relacao as outras abordagens.

Neste trabalho, as possıveis relacoes de dependencia a estabelecer sao dadas atraves das D-

-rules, regras baseadas em estruturas de pares atributo/valor.

Exemplo 9: D-rules

A regra de (1) – baseada num exemplo de [Covington, 1990] – e uma D-rule. Esta D-rule indica que

uma palavra de categoria adj, genero G e numero N pode depender de uma palavra de categoria noun,

genero G e numero N.

[category:noun,gender:G,number:N]← [category:adj, gender:G,number:N]. �

Page 72: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2.6. CONSTRUCAO DE ESTRUTURAS DE DEPENDENCIAS 37

Ainda de acordo com [Covington, 1990], podem-se impor restricoes de precedencia as D-rules.

Ambos os parsers, baseados no conceito de unificacao, mantem duas listas que sao inicialmente

vazias:

• PrevWordList contem todas as palavras ja analisadas;

• HeadList contem todas as palavras que nao dependem de outras palavras (no fim, esta

lista contera apenas um elemento: o nucleo da frase).

A analise e feita processando cada palavra da sequencia em estudo (seja p a palavra em analise),

como se segue:

1. Procura-se em PrevWordList uma palavra da qual p possa depender,

(a) se existir alguma, estabelece-se a dependencia;

(b) se existir mais do que uma, tenta-se4 a mais recente;

(c) se nao existir nenhuma insere-se p em HeadList.

2. Procuram-se em HeadList palavras que possam depender de p. Se existir uma ou mais,

estabelecem-se as respectivas relacoes, sendo estas palavras retiradas de HeadList.

Modificando-se o passo (1), este algoritmo pode ser transformado noutro algoritmo em que

se procuram dependencias adjacentes. Neste novo algoritmo, passam a considerar-se na pes-

quisa da uma palavra da qual p possa depender, apenas a palavra anterior e as palavras das

quais esta dependa, directa ou indirectamente. Do mesmo modo, quando se procuram em He-

4Este passo nao e nada claro.

Page 73: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

38 CAPITULO 2. ESTADO DA ARTE

pos/rel R1 R2 R3 R4

x1

x2 x3

x3 x1

x4 x3 x5

x5 x4

Tabela 2.3: Government Map.

adList palavras que dependam de p – passo (2) – comeca-se com a ultima palavra adicionada e

consideram-se apenas sequencias contıguas e esta.

2.6.2 Arnola

Em [Arnola, 1998] e demonstrado empiricamente que, atraves de escolhas sintacticas, e

possıvel fazer a analise de estruturas de dependencia em tempo linear e determinıstico. O

analisador recorre a heurısticas para escolher um e apenas um governor entre as alternativas.

Apesar do risco de erro, os resultados sao satisfatorios: acerta-se na estrutura exacta de de-

pendencias 85% das vezes.

Neste artigo, comeca-se por construir um Government Map (GM), uma matriz em que as linhas

representam os nos de uma sequencia e as colunas as relacoes binarias consideradas (tabela

2.3).

O GM pode ser visto como um espaco de pesquisa abstracto para encontrar as dependencias.

A ideia por detras do analisador e que e possıvel ordenar as entradas do GM, de modo a que a

distancia maxima entre dois elementos seja limitada, saindo daqui o tempo de processamento

linear. O algoritmo implementa a estrategia do best-first. Inicialmente a frase e dividida em

segmentos, depois o algoritmo e aplicado a cada segmento separadamente, e seguidamente

Page 74: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2.6. CONSTRUCAO DE ESTRUTURAS DE DEPENDENCIAS 39

unem-se os segmentos.

Este analisador usa 32 relacoes basicas e a gramatica tem 950 regras genericas (activadas por

categorias sintacticas) e 12 500 regras lexicais (activadas por palavras). Esteve em desenvolvi-

mento durante anos, e a data do artigo (1998) continuava em desenvolvimento: uma a duas

vezes por mes novos testes eram feitos e os erros corrigidos manualmente.

Deve-se notar que muitos trabalhos que constroem estruturas de dependencias ficaram por

descrever, como por exemplo, as propostas de Joakin Nivre e Jens Nilsson [Nivre, 2003], na

linha do analisador determinıstico de 2.6.2, que apresentam varios algoritmos determinısticos.

2.6.3 O Incremental Finite-State Parser

O Incremental Finite-State Parser (IFSP) [Aıt-Mokhtar e Chanod, 1997a] e uma ferramenta da Xe-

rox. Este analisador comeca por fazer uma segmentacao do texto, a qual se segue uma analise

morfologica e respectiva desambiguacao. De seguida, um conjunto de transdutores, compi-

lados a partir de expressoes regulares, adiciona, incrementalmente, informacao sintactica ao

texto (como alias e pratica comum nos cascaded finite-state parsers). Cada um dos transdutores

tem uma tarefa particular, havendo uma ordem de aplicacao associada a cada camada de trans-

dutores. As operacoes principais sao: a) segmentacao em chunks, em que o ultimo elemento e

o nucleo; b) marcacao sintactica em que se atribuem funcoes sintacticas aos segmentos; c) es-

tabelecimento de dependencias entre os segmentos. Tal como dizem os autores, a marcacao

sintactica limita a sobre-geracao das ligacoes de dependencia.

Em relacao as dependencias, o sistema produz dependencias (funcionais ou sintacticas) quer

entre palavras ou chunks, usando regras que permitem impor restricoes complexas as de-

Page 75: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

40 CAPITULO 2. ESTADO DA ARTE

pendencias a estabelecer (nao se limitam a arvores locais). Os resultados de cada etapa vao

sendo guardados numa arvore, a qual se vai acrescentando informacao.

O algoritmo utiliza regras ditas incrementais, que, segundo os autores correspondem a

operacoes self-contained cujos resultados dependem de um conjunto de restricoes contextuais

definidas na propria regra. Se essas restricoes contextuais sao verificadas, a regra e executada,

tendo em si todo o conhecimento necessario para calcular o resultado [Aıt-Mokhtar et al., 2002].

Cada regra incremental tem a seguinte sintaxe:

| <padrao da sub-arvore> | if < condicoes ><termo d>

em que:

• <padrao da sub-arvore> e uma expressao que unifica com partes da arvore e que des-

creve propriedades estruturais de parte da arvore de entrada;

• <condicoes> e uma expressao booleana constituıda por:

– termos de dependencias;

– relacoes de linearidade;

– operadores;

• <termo d> e um termo de dependencia da forma

nome(f list)(a1, ..., an), em que

– nome e o nome da dependencia;

– f list e uma lista de features associada a relacao de dependencia;

– (a1, ..., an) e um conjunto de argumentos.

Page 76: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2.6. CONSTRUCAO DE ESTRUTURAS DE DEPENDENCIAS 41

O significado de cada regra resume-se no que se segue: se <padrao da sub-arvore> unifica com

uma parte da arvore e <condicoes> e satisfeita no conjunto actual das relacoes de dependencia,

entao <termo d> e adicionado ao conjunto das relacoes de dependencia.5

Impoe-se ainda as regras que todas as variaveis de <termo d> estejam expressas em <padrao

da sub-arvore> ou em <condicoes>. Assim, a satisfacao de <padrao da sub-arvore> e

<condicoes> resulta na instanciacao dos argumentos da nova dependencia.

Algumas das aplicacoes do analisador sao as seguintes: em [Aıt-Mokhtar et al., 2002], mostra-

-se como a partir de uma analise de superfıcie, usando o IFSP, se pode chegar a uma

analise mais profunda, advogando-se que a robustez de um analisador de superfıcie ba-

seado em regras nao esta relacionado com o facto de fazer apenas uma analise de su-

perfıcie, mas com a incrementabilidade das suas descricoes linguısticas e subtarefas. Em

[Aıt-Mokhtar e Chanod, 1997b] usa-se o IFSP para reconhecer e extrair o sujeito e o comple-

mento directo de textos em frances, conseguindo-se uma precisao de 90-97% para sujeitos (84-

88% para objectos) e uma cobertura de 86-92% para sujeitos (80-90% para objectos).

Na linha do IFSP esta tambem o analisador do GREYC, descrito, por exemplo, em

[Giguet e Vergne, 1997] e [Hagege, 2000]. Este analisador trabalha com sintagmas nao recur-

sivos, que sao demarcados e posteriormente ligados. O estabelecimento destas dependencias

baseia-se em informacao estatica (este elemento deve ligar-se com outro), mas tambem

dinamica (com base em dependencias ja estabelecidas).

5As regras de dependencias podem modificar, ou ate apagar dependencias existentes.

Page 77: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

42 CAPITULO 2. ESTADO DA ARTE

2.6.4 Comentarios

Como se vera, numa das etapas da interface desta tese, chega-se ao que pode ser conside-

rada uma estrutura de dependencias, apesar de alguns pontos divergentes das abordagens

tradicionais. No entanto, a estrutura de dependencias e atingida num processo semelhante

ao executado pelo IFSP e analisador do GREYC. Em comum com estes sistemas, trabalha-se

com modelos nucleares, semelhantes a chunks e sintagmas nao recursivos, entre os quais se

estabelecem ligacoes (com base em informacao puramente estatica).

Um outro ponto em comum entre o trabalho desenvolvido nesta tese e o IFSP esta na sintaxe

das regras usadas, dado que a sintaxe das regras semanticas desta dissertacao e muito seme-

lhante a das regras do IFSP. Em particular, e como se vera, a semelhanca da imposicao sobre

as regras do IFSP, a imposicao que se faz sobre a funcao de traducao das regras semanticas e

que esta use elementos presentes no resto da regra semantica. Adicionalmente, e segundo os

autores, a sintaxe das regras usadas no IFSP permite que se avalie e corrija facilmente o com-

portamento de cada uma das regras, facto que se aplica igualmente as regras semanticas desta

dissertacao.

No entanto, ha uma diferenca a apontar. O facto das regras semanticas estarem hierarquica-

mente organizadas evita ter de arrumar as regras em varios nıveis, de acordo com a etapa em

que vao ser aplicadas. Este e um problema apontado em [Aıt-Mokhtar e Chanod, 1997a]: no

IFSP ha que ter em atencao que existe uma dependencia das camadas umas das outras, dado

que a ordem de aplicacao e relevante. Assim, ha que estabelecer com cuidado o que apli-

car primeiro: fenomenos mais gerais sao aplicados numa fase inicial, deixando-se para o fim

casos especıficos e excepcoes. Assim, o estabelecimento da ordem de aplicacao dos transdu-

Page 78: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2.7. LINGUAGENS DE REPRESENTACAO 43

tores baseia-se na intuicao do linguista. Na abordagem desta tese, e como se vera, as regras

estao todas no mesmo nıvel, sendo aplicadas apenas as mais especıficas devido a organizacao

hierarquica das regras.

2.7 Linguagens de representacao

Apesar de existirem abordagens em que a frase em Lıngua Natural e directamente mapeada

num universo de interpretacao, sem passar por nenhuma representacao logica intermedia,

sao poucos os sistemas que o fazem, sendo o trabalho de Montague em [Montague, 1974a]

uma referencia. No entanto, e de acordo com Moore [Moore, 1986] estas abordagens ficam-

-se por domınios sintacticos muito restritos, ficando a duvida se o nıvel da forma logica pode

ser realmente ultrapassado. Assim, o grosso das interfaces utiliza um nıvel intermedio de

representacao em que se alcancam as ditas representacoes intermedias (RI) ou formas quase

logicas (quasi-logical-forms – QLF)6, e a interface desta tese nao e uma excepcao.7

Nas seccoes que se seguem, discutem-se varios pontos relacionados com estas representacoes.

Nomeadamente, o tipo de representacao semantica esperada tendo em conta a informacao dis-

ponıvel, e duas caracterısticas das linguagens de representacao que facilitam o mapeamento: o

facto de usarem formulas nao recursivas e o facto de permitirem a subespecificacao.

6De acordo com [Jurafsky e Martin, 2000] ha uma diferenca subtil entre uma QLF e uma RI: o termo QLF eaplicado a representacoes que se podem converter facilmente numa representacao logica via uma transformacaosintactica simples. Por sua vez, o termo RI e normalmente usado para se referir a representacoes que servem deentrada a futuros processos que visam produzir representacoes de significado mais complexas (ou seja, sobre as RIe injectado mais conhecimento). Repare-se que nesta perspectiva, a representacao usada no Core Language Engine(CLE) – a qual chamam QLF – sera uma RI, pois difere de uma formula logica por poder conter, entre outros,quantificadores e operadores cujo alcance ainda nao foi determinado [Gamback, 1997].

7Em [Bes, 2001b] poe-se a hipotese de ser imperativo na abordagem do 5P o uso de um formalismo intermediode representacao.

Page 79: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

44 CAPITULO 2. ESTADO DA ARTE

2.7.1 Representacoes intermedias e significado literal

Varias abordagens (por exemplo, [Allen, 1995, Cawsey, 1997]) tratam a obtencao de uma RI

como a etapa em que se cria uma forma logica capaz de captar o significado independente

de contexto – referido por muitos autores como significado literal – da frase em Lıngua Na-

tural.8 De acordo com [Jurafsky e Martin, 2000], este significado literal e calculado recorrendo

apenas a conhecimento estatico do lexico e da gramatica. Observe-se o exemplo 10, baseado

num exemplo de [Jurafsky e Martin, 2000], que ilustra exactamente o tipo de resultados que se

espera obter se se usar apenas informacao gramatical.

Exemplo 10: Informacao semantica

Considere-se o sintagma nominal O restaurante italiano, que tem a mesma sintaxe de O rapaz italiano.

Assim, apenas com base em informacao morfo-sintactica, estas formulas poderiam ser mapeadas, res-

pectivamente, nas seguintes representacoes:

restaurante(x), AM(x, italiano)

rapaz(x), AM(x, italiano).

Ora a primeira formula e algo vaga, dado que um restaurante italiano e um restaurante que serve comida

italiana e nao um restaurante que tem como propriedade ser italiano. �

No entanto, acrescentando a palavra italiano um traco TIPO=nacionalidade (como se viu na

seccao 2.2, o Edite permite o acrescento desta informacao), pode-se ter uma regra semantica –

mais especıfica que a regra que calculava a representacao anterior – activada em presenca da

palavra restaurante e que devolve, por exemplo, a seguinte representacao:

8Fica a questao, levantada por varios autores, de se realmente existe um significado literal. Na base da discussaoesta o facto de nao haver uma opiniao unanime sobre os fenomenos que a semantica e a pragmatica cobrem, bemcomo a interaccao que devera existir entre eles [Pulman, 1996]. Tal como se frisa em [Rapaport, 2000], a pragmaticaacaba por ser um grande “saco”, responsavel por tudo o que nao se inserir no domınio semantico (ou sintactico).

Page 80: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2.7. LINGUAGENS DE REPRESENTACAO 45

restaurante(x), tipo comida(x) = italiana.

Esta formula representa mais do que um simples significado literal. Ou seja, de acordo com a

informacao disponıvel, podem-se obter formulas mais precisas.

Como se vera, a interface apresentada nesta tese permite nao apenas o acrescento de tracos as

palavras, mas trabalhar com regras mais especıficas que cancelam a execucao das regras mais

genericas.

2.7.2 Formulas planas

Quando se tenta estabelecer uma interface sintaxe/semantica tendo por alvo uma linguagem

logica tradicional (logica de 1a ordem e extensoes), depara-se com uma inconsistencia estrutu-

ral entre o esqueleto sintactico da frase em Lıngua Natural e o da(s) formula(s) logica(s) dessa

linguagem.

Exemplo 11: Inconsistencia estrutural sintaxe/semantica

Considere-se a frase (1).

(1) A Maria adora todos os livros.

Em (2) e (3) apresentam-se duas analises sintacticas possıveis, em que a primeira e uma analise mais

tradicional, e a segunda segmenta a frase em chunks:

(2) (A Maria)(adora (todos os livros))

(3) (A Maria)(adora)(todos os livros).

A frase (1) pode ser representada no quadro dos quantificadores generalizados, como em (4):

Page 81: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

46 CAPITULO 2. ESTADO DA ARTE

(4) ∀ x (livro(x), adora(Maria, x)).

Observando as estruturas sintacticas e a formula logica nao ha uma correspondencia um-para-um entre

as particoes obtidas nas duas analises sintacticas e partes da formula logica. �

Ora uma linguagem de representacao alternativa pode facilitar o mapeamento. Ou, dito de

outro modo, um conjunto de caracterısticas da linguagem alvo pode facilitar a tarefa. Ape-

sar do conceito nao ser novo [Hobbs, 1983], trabalhos actuais como os de [Molla et al., 2000b,

Baldridge e Kruijff, 2002, Copestake et al., 2001] usam representacoes semanticas ditas planas

(do ingles flat) ou indexadas [Milward, 1999], existindo uma grande variedade de estruturas

deste tipo, sendo a sua forma mais basica a versao indexada de uma representacao semantica

que nao contenha nenhuma forma de recursao explıcita [Milward, 1999].

Exemplo 12: Formula nao recursiva

A formula de (1) tem uma representacao plana, nao recursiva, em (2).

(1) P(a, Q(b, c))

(2) i1:i2(i3,i4), i2:P, i3:a, i4:i5(i6,i7), i5:Q, i6:b, i7:c. �

E repare-se que mesmo uma formula quantificada pode ser convertida numa formula plana.

Exemplo 13: Representacao plana

A formula de (1) pode ser representada atraves da formula plana de (2).

(1) ∀ x (livro(x), adora(Maria, x))

(2) h1:∀(x, h2, h3), h2:livro(x), h3:adora(h4, x), h4:Maria.

Nesta formula, as variaveis h1, h2, h3 e h4 permitem organizar, sem recorrer a parentesis, a estrutura

Page 82: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2.7. LINGUAGENS DE REPRESENTACAO 47

da formula. Assim, a formula basica livro(x) esta associada, atraves de h2, ao primeiro argumento

da estrutura introduzida pelo quantificador, Maria ao primeiro argumento de adora(h4, x) por h4 e

adora(Maria, x) ao segundo argumento da estrutura introduzida pelo quantificador (atraves de h3). �

Ainda de acordo com [Milward, 1999], a representacao semantica ao estilo de [Davidson, 1980]

e muitas vezes descrita como plana, pois as variaveis de eventos actuam como ındices (exemplo

14, baseado num exemplo de [Copestake et al., 1997]).

Exemplo 14: Estilo Davidson

Considere-se a frase no Sabado, a Maria vai para Lisboa. Usando o “estilo Davidson”, esta frase pode ser

representada atraves da formula de (1).

(1) em(e, Sabado), ir(e, Maria), para(e, Lisboa)

Note-se que em alternativa a esta representacao, ter-se-iam as representacoes de (2) e (3), que introduzem

uma ambiguidade que na verdade nao existe.

(2) em(para(ir(Maria), Lisboa), Sabado)

(3) para(em(ir(Maria), Sabado), Lisboa). �

O conceito de plano esta ainda, por vezes, associado ao conceito de reificacao. Hobbs

em [Hobbs, 1983] (e de acordo com [Copestake et al., 1997] tambem em [Hobbs, 1985]), ex-

plora este conceito na sua ontologically promiscuous flat semantics, de modo a suportar a sub-

-especificacao do alcance de quantificadores, introduzindo uma nova variavel para cada pre-

dicado (e operador logico).9 Em [Molla, 2000] e [Rinaldi et al., 2002] descreve-se um processo

similar, apesar de em [Rinaldi et al., 2002], onde se apresenta a Minimal Logical Form (MLF), ja

9Dado que este processo leva a quantificacao adicional sobre as novas variaveis introduzidas, Hobbs assume umuniverso platonico, contendo tudo o que se pode imaginar, sendo cada nova variavel marcada com um predicadoextra, garantido a sua existencia nesse universo.

Page 83: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

48 CAPITULO 2. ESTADO DA ARTE

referida na seccao 2.4, apenas se reificam variaveis para objectos, eventualidades e proprieda-

des.

Se em [Milward, 1999] se fala da abordagem de Hobbs como uma extensao a de Davidson, ja

Molla em [Molla, 2000] coloca a hipotese de os eventos definidos por Davidson e o sistema de

introducao de variaveis de Hobbs pertencerem a domınios diferentes. Como exemplo, introduz

duas variaveis para o verbo sleep: uma, a variavel do evento (s) e usada em construcoes como

John sleeps deeply (deep(s)); a outra, a variavel reificada (e), e utilizada em construcoes como

John probably sleeps (probable(e)). Apesar de nao ser muito clara esta distincao, a ideia e que

as variaveis de Davidson sao usadas para se ligarem a elementos que acrescentam detalhes

ao evento. Em contrapartida, a outra variavel – a que ele chama reificada – existe quando o

elemento modificador tem poder de alterar o evento em si. Daı a necessidade de se reificarem

variaveis para objectos, dado estes poderem ser modificados por adjectivos intencionais.

Para alem da MLF, sao exemplos de linguagens planas a ja referida Minimal Recursion Semantics

[Copestake et al., 2001, Copestake et al., 1997, Copestake et al., 1995, Copestake et al., 1999] e a

Hybrid Logic [Baldridge e Kruijff, 2002].

Sem haver um compromisso com uma linguagem alvo particular, nesta interface trabalha-se

com uma linguagem plana.

2.7.3 Subespecificacao

Outra situacao a ter em conta na escolha da linguagem de representacao diz respeito as varias

hipoteses de interpretacao de cada frase. Uma sequencia em Lıngua Natural fora de um con-

texto pode ter multiplas interpretacoes, resultantes de variadas fontes, que vao desde ambigui-

Page 84: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2.7. LINGUAGENS DE REPRESENTACAO 49

dades lexicais e/ou sintacticas, passando para diferentes alcances de quantificadores, diferen-

tes antecedentes de anaforas e elipses, entre outros [Cooper et al., 1994]. E mesmo frases muito

curtas podem ter centenas de ambiguidades resultantes das combinacoes destes elementos.

Exemplo 15: Multiplicidade de interpretacoes

Considere-se a seguinte frase (1).

(1) Todos os meninos adoram um cao.

Neste exemplo classico existe uma ambiguidade de interpretacoes, dado que tanto pode existir um

unico cao que e alvo de adoracao por parte de todos os meninos, como pode haver mais do que um

cao adorado pelos meninos (no limite, cada menino adora um cao particular). Na logica classica, esta

ambiguidade reflecte-se, respectivamente, nas interpretacoes (2) e (3).

(2) ∃ y (cao(y) ∧ ∀ x (menino(x) ⇒ adora(x, y)))

(3) ∀ x (menino(x) ⇒ ∃ y (cao(y) ∧ adora(x, y))). �

Gerar todas as interpretacoes possıveis e depois, com a adicao de informacao contextual, elimi-

nar as hipoteses erradas e um processo muitas vezes desnecessario e impraticavel em termos

computacionais:

• desnecessario porque algumas combinacoes sao cognitivamente inacessıveis (de acordo

com [Chaves, 2002], sera difıcil a um falante ter consciencia de mais de tres interpretacoes

distintas). Por outro lado, dado que permutacoes de quantificadores identicos resultam

em formulas identicas, havera leituras com o mesmo significado. Finalmente, em algu-

mas tarefas especıficas, como em traducao automatica, poder-se-a querer preservar essa

ambiguidade [Copestake et al., 1997, Copestake et al., 1995].

• impraticavel, pois, segundo [Copestake et al., 1997] e uma solucao do tipo “gerar e tes-

Page 85: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

50 CAPITULO 2. ESTADO DA ARTE

tar”, o que levanta um problema de procura. De acordo com [Muskens, 1998], apenas

considerando ambiguidade de escopo:

A sentence containing n scope bearing elements which are freely permutable will have n! rea-

dings[...] A series of m such sentences would lead to (n!)m possibilities.

Assim, muitas abordagens recorrem a linguagens ditas subespecificadas, cujas formulas

sao capazes de guardar essas ambiguidades, deixando que uma posterior incorporacao de

informacao contextual va desambiguando as formulas geradas. Esta solucao nao e uma

novidade, podendo ser encontrada em trabalhos datados dos anos 70, como o de Woods

[Woods, 1978], relativo ao escopo dos quantificadores. Mais recentemente, destacam-se a ja

referida MRS, a QLF do CLE, a Hole Semantics [Bos, 1995], bem como a Underspecified Discourse

Representation Theory (UDRT), uma adaptacao da DRT a subespecificacao.10

Exemplo 16: Representacao subespecificada

Considere-se de novo a frase do exemplo anterior. Com uma linguagem que suporta subespecificacao,

estas duas formulas podem ser representadas usando a Hole semantics [Blackburn e Bos, 1997], atraves

da formula:

l1: ∀ x (menino(x) ⇒ h1),

l2: ∃ y (cao(y) ∧ h2),

l3: adora(x, y),

l1 ≤ h0, l2 ≤ h0, l3 ≤ h1, l3 ≤ h2.

Cada variavel l (label) representa uma formula. Por seu lado, cada variavel h representa um “espaco”

10Na sequencia destes trabalhos sobre subespecificacao, levantou-se o problema de como raciocinar so-bre formulas ambıguas, que deu azo a variados artigos (por exemplo, [Jaspars, 1997], [Muskens, 1998],[van Eijck e Jaspars, 1996], [Reyle, 1996], [Bos, 1995], [Reyle, 1995]). Estes trabalhos tem sido feitos em dois senti-dos distintos: a) transformar as frases ambıguas em frases nao ambıguas, podendo-se depois raciocinar sobre estas;b) definir regras de inferencia directamente sobre frases ambıguas. No entanto esta tematica foge ao domınio destatese, pelo que ficam apenas dadas algumas referencias.

Page 86: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

2.8. RESUMO E CONCLUSOES 51

(hole) onde pode ser inserida outra formula (a excepcao e a variavel h0, usada para a representacao da

formula final). As formulas finais (nao ambıguas) sao construıdas de modo a respeitarem as restricoes≤.

Assumindo que existe uma correspondencia um-para-um entre os holes e os labels, esta formula origina

as duas formulas do exemplo anterior. �

A referir igualmente e o trabalho de Poesio [Poesio, 1994] no quadro da subespecificacao lexi-

cal, trabalho esse que e ilustrado sobre uma forma de ambiguidade semantica: a ambiguidade

lexical. Assim, Poesio apresenta a Lexically Underspecified Language (LUL). A ideia e que, por

cada palavra ambıgua em Lıngua Natural, exista uma expressao na LUL que denote o conjunto

dos significados dessa palavra.

Exemplo 17: Ambiguidade lexical

Suponha-se a palavra pata, ambıgua entre a femea do pato e o membro de um animal. Dados estes dois

significados, pataU , sera a traducao em LUL desta palavra. �

Como se vera, nesta tese trabalha-se com formulas subespecificadas.

2.8 Resumo e Conclusoes

Neste capıtulo, apresentou-se um conjunto de interfaces sintaxe/semantica. Umas interfaces

baseiam-se em regras semanticas associadas a regras sintacticas; noutras, as regras semanticas

disparam de acordo com certas condicoes sintacticas; outras ainda operam sobre estruturas de

dependencias.

Apresentaram-se ainda trabalhos que constroem estruturas de dependencias e dedicou-se um

capıtulo as linguagens de representacao. Em relacao a estas ultimas, focaram-se duas carac-

Page 87: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

52 CAPITULO 2. ESTADO DA ARTE

terısticas que as tornam um alvo mais facil para as interfaces: serem planas e permitirem

subespecificacao.

Page 88: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

3D�%�N� ���,*B��� ��

Neste capıtulo, apresentam-se os formalismos usados nesta tese.

A organizacao do capıtulo e a seguinte: na seccao 3.1 apresenta-se um conjunto de conceitos

basicos; na seccao 3.2 descrevem-se as propriedades de flechagem; na seccao 3.3 apresentam-se

as regras semanticas. O capıtulo termina na seccao 3.4 com um resumo e conclusoes.

3.1 Conceitos basicos

Nesta seccao, apresentam-se dois conceitos basicos: o de categoria (seccao 3.1.1) e o de modelo

(seccao 3.1.2).

3.1.1 Categoria

Antes de apresentar o conceito de categoria, define-se o conceito de subsuncao.

Def 6: Subsuncao

A relacao de subsuncao pode ser vista como uma relacao (reflexiva) entre conceitos mais es-

pecıficos e conceitos mais genericos. N

Supondo que um conceito c1 e definido por um conjunto C1, e que um conceito c2 se define

Page 89: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

54 CAPITULO 3. FORMALISMOS

atraves do conjunto C2, se C1 ⊆ C2, entao c1 e mais generico que c2, dizendo-se que o subsume.

Ou seja, sendo dados c1 e c2, definidos, respectivamente, por C1 e C2, diz-se que c1 subsume c2

se e so se (sse) C1 ⊆ C2.

Notacao 1: Subsuncao

Supondo que c1 subsume c2, denota-se esta relacao por c1 v c2.

Def 7: Categoria

Assume-se que, tal como no 5P, uma categoria e um conjunto de pares atributo/valor (para

detalhes sobre o sistema de categorias usado pelo 5P veja-se [Bes, 2001a]). N

Notacao 2: Atributo/valor

Denota-se um par atributo/valor atraves de <atributo = valor>.

Exemplo 18: Categoria

Os conjuntos C1 = {<a1 = v1>, <a2 = v2>} e C2 = {<a1 = v1>, <a2 = v2>, <a3 = v3>}, em que a1, a2 e

a3 sao atributos, e v1, v2, v3 valores, representam duas categorias c1 e c2. �

Dadas duas categorias c1 e c2, se o conjunto de pares atributo/valor que define c1 esta contido

no conjunto de pares atributo/valor que define c2, entao c1 subsume c2.

Exemplo 19: Subsuncao

Dadas as categorias c1 e c2 do exemplo anterior, como C1 ⊆ C2, tem-se que c1 v c2. �

Nesta tese, as categorias sao identificadas por uma etiqueta e atraves dela referidas, passando

Page 90: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

3.1. CONCEITOS BASICOS 55

a subsuncao entre categorias a ser referida atraves das etiquetas.

Notacao 3: Subsuncao e etiquetas

Sejam dadas duas etiquetas, et1 e et2, sobre duas categorias, respectivamente c1 e c2,

sobre as quais haja uma relacao de subsuncao: c1 subsume c2. Refere-se a relacao

de subsuncao entre estas categorias atraves das etiquetas, ou seja, diz-se que et1

subsume et2 (o que se denota igualmente por et1 v et2).

Exemplo 20: Subsuncao e etiquetas

Dadas as categorias c1 e c2 do exemplo anterior, e supondo que et1 e uma etiqueta para c1 e et2 para c2,

diz-se que et1 subsume et2 (et1 v et2). �

Notacao 4: Etiquetas

Assume-se que as etiquetas de categorias se iniciam por uma minuscula. Adicional-

mente, assume-se que a etiqueta de cada categoria e formada a partir dos valores

de cada par atributo/valor que a constituem, pelo que a relacao de subsuncao entre

duas categorias pode ser (normalmente) inferida a partir das etiquetas usadas.

Exemplo 21: Subsuncao e etiquetas

Dadas as etiquetas nc1 e nc, tem-se que nc v nc1. �

Notacao 5: Conjunto das etiquetas das categorias

Nesta tese, denota-se por C o conjunto das etiquetas usadas.

Page 91: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

56 CAPITULO 3. FORMALISMOS

Para terminar, deve salientar-se que no sistema de categorias do 5P nenhuma restricao e im-

posta sobre o tipo dos pares atributo/valor. Ou seja, a informacao presente nas categorias

pode percorrer os varios nıveis de abstraccao linguıstica, desde elementos morfo-sintacticos

a informacao semantica. Por exemplo, se em dada tarefa for pertinente distinguir os nomes

proprios que representam localidades (Castelo Branco, Cascais, Alvalade), um par atributo/valor

especıfico e atribuıdo a estes nomes proprios permitindo distingui-los de outros. A possibi-

lidade de acresentar pares de natureza diversa adicionada a organizacao das categorias num

sistema de subsuncao vai ter repercussoes na hierarquia das regras semanticas, sendo funda-

mental para o seu enriquecimento.

3.1.2 Modelo

Com o objectivo de especificar a sintaxe da Lıngua Natural, o 5P suporta propriedades de: (i)

existencia; (ii) linearidade; (iii) flechagem.1

A designacao “modelo” e atribuıda as sequencias de sımbolos que satisfazem as propriedades

do 5P. Os modelos que satisfazem propriedades de existencia e linearidade sao denominados

modelos basicos. Por seu lado, os modelos basicos que satisfazem propriedades de flechagem

dizem-se modelos flechados. Deste modo, um modelo flechado e um par constituıdo por: (i)

um modelo basico; (ii) um conjunto de conjuntos de pares (<n, m>) de flechagem.

1Nesta tese apenas as propriedades de flechagem serao apresentadas, devendo-se consultar[Bes e Hagege, 2001], [Bes, 1999a], [Hagege, 2000] ou [Hagege e Bes, 2002] para detalhes sobre as proprieda-des de existencia e linearidade do 5P.

Page 92: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

3.1. CONCEITOS BASICOS 57

Notacao 6: Modelo

Dado um conjunto de propriedades identificado pela etiqueta X, todas as sequencias

de sımbolos que verificam este conjunto de propriedades sao denominadas modelos

(relativos a essas propriedades), e etiquetadas por X.

Adicionalmente, usa-se m-X para denotar um modelo etiquetado por X, assumindo-

-se que, alternativamente a dizer “um modelo etiquetado por X”, se pode usar “um

modelo m-X”.

Assume-se ainda, e para facilitar a distincao entre etiquetas de categorias e de

modelos, que as etiquetas de modelos se iniciam com uma maiuscula.

Exemplo 22: Modelo basico

Suponha-se que a sequencia constituıda pelos modelos m-X m-Y m-Z satisfaz um conjunto de proprie-

dades identificadas pela etiqueta W.

(m-X m-Y m-Z)W

representa um modelo basico etiquetado por W (ou um modelo m-W). �

Exemplo 23: Modelo flechado

Usando a notacao de [Bes e Hagege, 2001], o que se segue e um modelo flechado, etiquetado por W, em

que o m-X flecha sobre si, o m-Y flecha sobre o m-X, e o m-Z tanto pode flechar sobre o m-X, como sobre

o m-Y (os ındices 1, 2 e 3 indicam as posicoes dos elementos no modelo m-W):

<(m-X1 m-Y2 m-Z3)W ,

{{<1, 1>, <2, 1>, <3, 1>}, {<1, 1>, <2, 1>, <3, 2>}}>

Graficamente, este modelo pode ser representado como na figura 3.1.

Page 93: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

58 CAPITULO 3. FORMALISMOS

Figura 3.1: Modelo flechado

O 5P apresenta ainda um conjunto de restricoes sobre os modelos flechados (as General semantic

conditions [Bes e Hagege, 2001]):

• em cada conjunto de pares de flechagem todos os elementos flecham sobre um e apenas

um elemento;

• em cada conjunto de pares de flechagem um e apenas um elemento flecha sobre si

proprio.

Adicionalmente, considera-se que os modelos flechados formam um grafo acıclico (excluıdo o

elemento que flecha sobre si) [Bes e Hagege, 2001] e nada e imposto sobre o (nao) cruzamento

de flechas (projectividade). Ou seja, a partida nada e imposto sobre a possibilidade de um

modelo flechado conter flechas que se cruzam, tal como e mostrado no exemplo que se segue.

Exemplo 24: Cruzamento de flechas

O modelo que se segue, apesar das duas ultimas flechas se cruzarem, e um modelo flechado:

<(m-X1 m-Y2 m-Y3 m-Z4)W ,

Page 94: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

3.1. CONCEITOS BASICOS 59

{{<1, 1>, <2, 1>, <3, 1>, <4, 2>}}>.

Este modelo pode tambem ser representado como na figura 3.2:

Figura 3.2: Modelo com cruzamento de flechas

Se X identifica um conjunto de propriedades e Y identifica um outro conjunto de propriedades,

podera existir um conjunto de sequencias que satisfazem o primeiro conjunto de propriedades

(os modelos m-X), e um conjunto de sequencia que satisfaz o segundo conjunto de proprie-

dades (os modelos m-Y). Se for necessario referir o conjunto total dos modelos m-X e m-Y,

usar-se-a nesta tese uma outra etiqueta Z, da qual se dira que subsume X e Y. Chamar-se-a a

esta etiqueta super-etiqueta.

Notacao 7: Subsuncao de super-etiquetas

Usa-se igualmente o sımbolo v para representar a relacao de subsuncao entre

etiquetas de modelos. Deve-se notar que, ao contrario da subsuncao entre categorias,

a relacao de subsuncao nao se deduz das etiquetas.

Exemplo 25: Super-etiquetas

Considerem-se as etiquetas An2nq e An2q (respectivamente para os modelos adjectivais de tipo 2 nao

quantificados e para os quantificados). A etiqueta An2 permite referir ambos os tipos de modelos, sendo

Page 95: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

60 CAPITULO 3. FORMALISMOS

por isso uma super-etiqueta. Esta relacao representa-se por An2 v An2nq, An2q. �

Notacao 8: Conjunto das etiquetas de modelos

Nesta tese denota-se por M o conjunto que contem todas as etiquetas associadas a

modelos. Assume-se igualmente que M ∩ C = ∅.

Tal como previsto pelo 5P [Bes e Hagege, 2001, Hagege, 2000], e possıvel referenciar um sub-

conjunto mais especıfico de modelos – os modelos restringidos – atraves da adicao de restricoes

a um conjunto dado de modelos. Ou seja, os modelos restringidos sao constituıdos pelos mo-

delos do conjunto original que verificam essas restricoes. Estas restricoes podem dividir-se

em dois grupos: (i) as restricoes que os modelos restringidos devem verificar (doravante con-

junto das restricoes positivas, denotado, nesta tese, por R+0 ); (ii) as restricoes que os modelos

restringidos nao podem verificar (mutatis mutandis restricoes negativas, denotadas por R−

0 ).

Def 8: Modelo restringido

O triplo (X, R+0 , R−

0 ), em que:

•X ∈M;

•R+0 ⊆ C ∪M;

•R−

0 ⊆ C ∪M;

e um modelo restringido. N

Page 96: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

3.1. CONCEITOS BASICOS 61

Notacao 9: Modelo restringido

Denota-se no 5P o modelo restringido

(X, R+0 , R−

0 )

por

X (R+0 /R−

0 ).

Adicionalmente:

Se R+0 = ∅ denota-se X(∅/R−

0 ) por X(/R−

0 ).

Se R−

0 = ∅ denota-se X(R+0 /∅) por X(R+

0 /).

Se R+0 = R−

0 = ∅ denota-se X(∅/∅) por X.

Se o sımbolo x (etiqueta de modelo ou de categoria) pertencer a R+0 , entao apenas os mode-

los etiquetados por X que contem esse sımbolo (ou outro que este subsuma) verificam essa

restricao. Se o sımbolo x pertence a R−

0 , entao apenas os modelos etiquetados por X que nao

contem esse sımbolo (ou outro que este subsuma) verificam essa restricao. Note-se que per-

tencer ao modelo implica estar no modelo explicitamente e nao, por exemplo, pertencer a um

modelo que pertenca ao modelo. Por exemplo, X ({x}/) representa um conjunto de modelos

etiquetados por X com um x no interior, e nao um conjunto de modelos etiquetados por X com

um modelo no interior no qual ocorre um x.

Exemplo 26: Modelo restringido

Sendo Nn uma etiqueta de modelo e art1 s uma etiqueta de categoria, Nn({art1 s}/) representa os mo-

delos etiquetados por Nn que contem um art1 s no interior. �

Page 97: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

62 CAPITULO 3. FORMALISMOS

3.2 Propriedades de flechagem

3.2.1 Motivacao

As propriedades de flechagem sao usadas no 5P para indicar como devem ser estabelecidas

relacoes quer entre modelos quer entre categorias (tal como as regras do IFSP apresentado na

seccao 2.6.3, que tambem sao usadas para ligar chunks ou categorias).

Exemplo 27: Propriedades de flechagem

Suponha-se que se detectou, no interior de um modelo etiquetado por F, um modelo basico etiquetado

por Nn e um modelo basico etiquetado por Pn:

((a praia)Nn (do Algarve)Pn)F

Se se quiser ligar o modelo etiquetado por Pn ao modelo etiquetado por Nn, entao usa-se a propriedade

de flechagem que se segue, em que o Pn e a origem da flecha, Nn o alvo, e F o modelo corrente:

Pn→F Nn.

Esta propriedade indica que sempre que se encontrar um modelo etiquetado por Pn e um etiquetado

por Nn, no interior de um modelo etiquetado por F, deve-se estabelecer uma relacao entre eles, com

origem no Pn e tendo o Nn por alvo. �

As propriedades de flechagem tem como unico objectivo estabelecer relacoes (entre categorias

e modelos), que levam a obtencao da representacao semantica desejada [Bes, 1999a]. Com a

utilizacao do termo “flechagem” no 5P pretende-se fazer uma demarcacao expressa entre o

conceito de flechagem e o de “dependencia”, dado que a nocao de flechagem nao se enquadra

na problematica que envolve as gramaticas de dependencia: de acordo com [Bes, 2002], a nocao

Page 98: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

3.2. PROPRIEDADES DE FLECHAGEM 63

de flechagem nao se justifica linguisticamente a nao ser pela capacidade de um conjunto de

flechas ser utilizado como entrada das funcoes semanticas.

No entanto, mesmo dentro das gramaticas aceites como gramaticas de dependencias existem

muitos pontos divergentes. Por exemplo, as dependencias da Link grammar, seccao 2.4.1, nao

sao direccionadas, ao contrario da maioria das outras abordagens; a Link Grammar escolhe ge-

ralmente o elemento mais a esquerda para ser a head, quer no caso da frase principal quer das

subordinadas, o que tambem diverge da maioria das outras abordagens; algumas abordagens

impoem a projectividade, outras nao. Deste modo, e dado que as propriedades de flechagem

podem ser usadas para estabelecer ligacoes entre categorias, existem pontos em comum com

as gramaticas de dependencia.

O posicionamento do 5P em relacao a alguns trabalhos na linha das gramaticas de dependencia

pode ser consultado em [Hagege, 2000]. Resumindo, as principais diferencas em relacao as ac-

tuais gramaticas de dependencias sao as seguintes: (i) as propriedade de flechagem permitem

relacionar nao apenas categorias, mas tambem modelos; (ii) as propriedades de flechagem nao

sao etiquetadas; (iii) a flechagem e feita no sentido do nucleo.

3.2.2 Sintaxe das Propriedades de flechagem

As propriedades de flechagem, tal como previsto pelo 5P, sao definidas recorrendo a ındices,

que sao associados aos sımbolos quer de categorias quer de modelos.

Page 99: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

64 CAPITULO 3. FORMALISMOS

Notacao 10: Indices e conjunto dos ındices

Tal como em [Bes e Hagege, 2001], assume-se que i, j, k e l indicam posicoes relativas

com uma ordem associada (dada pela ordem alfabetica), e que p, q indicam posicoes

nao ordenadas. Nesta tese denota-se por I o conjunto dos ındices disponıveis.

Exemplo 28: Indices

Dados xi, yj e zp, os ındices permitem estabelecer que existira uma relacao linear entre x e y (x precede

y, dado que i precede j no abecedario), nao havendo nenhuma relacao de linearidade entre z e restantes

elementos (se se quiser que dois sımbolos tenham uma relacao de linearidade com outros sımbolos, mas

nao entre eles, sugere-se no 5P que se use i, i’, i”, ...). �

Define-se de seguida o conjunto de categorias que sao indexadas por um elemento do conjunto

de ındices disponıveis.

Notacao 11: Conjunto das etiquetas de categorias indexadas

Denota-se por Cidx o conjunto constituıdo pelas etiquetas das categorias indexadas:

Cidx = {cx : c ∈ C ∧ x ∈ I}.

Def 9: Modelos restringidos indexados

Um modelo restringido indexado e um quadruplo (X, R+0 , R−

0 , x), em que:

• (X, R+0 , R−

0 ) e um modelo restringido, tal como definido anteriormente;

•x ∈ I. N

Page 100: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

3.2. PROPRIEDADES DE FLECHAGEM 65

Notacao 12: Modelos restringidos indexados

Denota-se um modelo restringido indexado (X, R+0 , R−

0 , x) atraves da formula

Xx(R+0 /R−

0 ).

Exemplo 29: Modelo restringido indexado

O modelo Nni({art1 s}/) e um modelo restringido indexado. �

Do mesmo modo que se definiu o conjunto das categorias indexadas, define-se o conjunto dos

modelos indexados.

Notacao 13: Conjunto dos modelos restringidos indexados

Denota-se por Midx o conjunto dos modelos restringidos indexados:

Midx = {Xx(A/B) : X ∈M ∧ x ∈ I ∧ A, B ⊆ C ∪M}.

Exemplo 30: Conjunto dos modelos restringidos indexados

Dado o modelo restringido indexado do exemplo anterior, tem-se que Nni({art1 s}/) ∈ Midx. �

Def 10: Propriedade de flechagem

Uma propriedade de flechagem e um quıntuplo (Xn, Z, Ym, R+, R−), em que:

•X, Y ∈M ∪ C (X diz-se a origem e Y o alvo);

•Z ∈M (Z diz-se o modelo corrente);

•R+, R− vMidx ∪ Cidx (R+ e R− dizem-se conjuntos de restricoes);

• n, m ∈ I;

Page 101: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

66 CAPITULO 3. FORMALISMOS

• n = m⇒ X = Y. N

As restricoes impoem os sımbolos que tem (ou nao) de ocorrer no modelo Z (bem como

restricoes de linearidade se os elementos de R+ e R− forem indexados pelos sımbolos orde-

nados i, j, k ou l).

Notacao 14: Propriedade de flechagem

No 5P uma propriedades de flechagem (Xn, Z, Ym, R+, R−) denota-se atraves da

formula:

Xn→Z Ym,

+R+

-R−

Exemplo 31: Propriedade de flechagem

A seguinte propriedade de flechagem

Inti({pint}/)→Fint Nnk

-{Nnj}

indica que numa frase interrogativa (Fint), um modelo interrogativo (Int) com um pronome interrogativo

no interior (pint) flecha sobre um modelo nominal nuclear (Nn) a sua direita (i ≺ k), desde que nao haja

nenhum outro modelo nominal nuclear entre eles (i ≺ j ≺ k). �

No 5P propoem-se ainda restricoes de flechagem sobre as propriedades de flechagem. Este tipo

de restricoes, que permite indicar que um elemento flecha sobre outro se se verificar uma dada

relacao de flechagem, nao e tido em conta nesta tese.

Page 102: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

3.2. PROPRIEDADES DE FLECHAGEM 67

3.2.3 Extensoes ao formalismo de flechagem

Nesta seccao introduz-se um pequeno conjunto de notacoes que visam facilitar a introducao de

informacao. Deve-se notar que o formalismo original permite descrever as situacoes em foco,

apenas de modo menos compacto. Adicionalmente, introduz-se um novo tipo de restricoes – as

restricoes pilha (que podem muito provavelmente ser simuladas pela introducao de restricoes

de flechagem, que, como se disse, nao sao, por agora, tidas em conta) – e que serao fundamen-

tais no processo de atribuicao de flechagem por evitarem que se construam relacoes erradas.

3.2.3.1 Elemento inicial/final

Notacao 15: Elemento inicial/final

Para indicar que um elemento ocorre no ınicio (ou no fim) de um modelo indexa-se o

sımbolo referente a esse elemento com um 0 (ou end).

Exemplo 32: Elemento inicial/final

Por exemplo, suponha-se que se quer declarar que um elemento etiquetado por X flecha sobre um ele-

mento etiquetado por Y num modelo etiquetado por Z sse m-X estiver no inıcio de m-Z. Denota-se esta

propriedade por:

X0 →Z Yp

Mutatis mutandis o mesmo se passa em relacao ao fim do modelo:

Xend →Z Yp.

Page 103: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

68 CAPITULO 3. FORMALISMOS

Do mesmo modo, suponha-se que se quer dizer que um elemento etiquetado por X flecha sobre um

elemento etiquetado por Y num modelo etiquetado por Z sse existir neste um elemento etiquetado por

W na primeira posicao. Entao usa-se:

Xp →Z Yq

+{W0} �

3.2.3.2 A restricao pilha

Quando se trabalha com chunks ou modelos nucleares (seccao 4.2.3.1), e difıcil ter uma visao

global da frase. Por exemplo, considere-se definida uma propriedade de flechagem em que e

dito que um modelo nominal nuclear flecha sobre um modelo verbal. Como os modelos das

relativas – desde o elemento introdutor da relativa ate ao seu fecho – nao estao identificados

como um todo, corre-se o risco de ter um modelo nominal nuclear a esquerda de uma relativa

a flechar sobre o modelo verbal no interior desta. Considere-se, por exemplo, a frase Quais os

hoteis que tem piscina, cuja analise de superfıcie e:

(Quais)Int (os hoteis)Nn (que)Rel (tem)Phv n (piscina)Nnt

A propriedade de flechagem referida estabelece uma relacao entre modelo nominal nuclear os

hoteis com o modelo verbal tem, que nao e o desejado (Figura 3.3).

Figura 3.3: Modelo nominal nuclear a flechar sobre o verbo da relativa

Um problema semelhante e descrito em [Aıt-Mokhtar e Chanod, 1997b], onde se define o “nıvel

Page 104: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

3.2. PROPRIEDADES DE FLECHAGEM 69

corrente” com base na marcacao do texto, e as regras para determinar o sujeito se aplicam

apenas no nıvel corrente. As restricoes pilha representam o modo como nesta tese se lida com

este problema. Explica-se de seguida a motivacao por detras desta restricao.

Em [Hagege e Bes, 1999] descreve-se um algoritmo que permite (entre outros) deliminar relati-

vas. Por exemplo, supondo a existencia de um pronome relativo (denotado por QU) e citando

[Hagege e Bes, 1999] este [...] “abre” uma encaixada cujo verbo principal – que “fecha” esta encaixada

– se encontra no primeiro sintagma verbal a sua direita (V)[...]. Continuando com um exemplo de

[Hagege e Bes, 1999], dada a sequencia

QU1 ... QU2 ... QU3 ... V1 ... V2 ... V3

temos que V1 fecha com QU3, V2 com QU2 e V3 com QU1. Ou seja, em termos algorıtmicos,

vai-se colocando cada elemento etiquetado por QU numa pilha, sendo o utimo elemento da

pilha retirado sempre que surgir um modelo verbal. No fim a pilha devera ser vazia.

Ainda nesta linha, encontra-se actualmente em desenvolvimento um trabalho sobre pa-

rentesis equilibrados (Balanced parentheses) que pode ser consultado em [Bes e Dahl, 2003,

Bes et al., 2003]. A ideia por detras deste trabalho e que existe um equilıbrio na parentetizacao

de frases em Lıngua Natural, podendo estes parentesis ser deduzidos a partir da analise de

um conjunto de elementos a que se chama introdutores (introducers) – por exemplo que, se, ...

– e das formas verbais flexionadas. Em termos gerais, marcando numa frase estes elementos,

consegue-se identificar a frase principal, relativas, elementos coordenados, etc. Como exemplo,

tome-se o que se segue, retirado de [Bes e Dahl, 2003]:

Si les parents s’etaient mis d’accord hier et avaient bien connu la reglementation, les bureaucrates a

qui ils se sont adresses aujourd’hui ne leur auraient pas repondu que c’etait impossible, ils auraient du

Page 105: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

70 CAPITULO 3. FORMALISMOS

presenter leur dossier autrement2

e supondo as seguintes etiquetas (igualmente de [Bes e Dahl, 2003]):

• int para introdutores;

• v para verbos flexionados que nao se seguem a uma vırgula ou a uma coordenacao;

• v1 para verbos flexionados que se seguem (imediatamente) a uma vırgula;

• v2 para verbos flexionados que se seguem (imediatamente) a uma coordenacao;

• il para o limite inicial da sequencia em analise;

• fp para o limite final da sequencia em analise;

• ot para outros;

obtem-se a seguinte analise:

il Siint leso parentso s–etaient–mis–d’accordv hiero et–avaient–bien–connuv2 lao reglementationo ,o

leso bureucrateso a-quiint ilso se–sont–adressesv aujourd’huio ne-leur-auraient-pas-reponduv queint lao

choseo etaitv impossibleo ,o ilsint auraient-duv presentero leuro dossiero autremento fp

da qual resulta a seguinte sequencia de etiquetas se se omitirem as etiquetas ot:

il int v v2 int v v int v int v pf.

Supondo que, quer um introdutor (int) quer o limite inicial (il), introduzem um parentesis (a sua

esquerda) e que um verbo fleccionado (v) o fecha (a nao ser que esteja coordenado com outro

2Se os pais se tivessem posto de acordo ontem e conhecessem bem o regulamento, os burocratas a quem se dirigiram hoje naolhes teriam respondido que era impossıvel, eles deveriam ter apresentado o dossier de outro modo.

Page 106: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

3.2. PROPRIEDADES DE FLECHAGEM 71

(isto e, se a ele se segue um v2, que neste caso sera o responsavel pelo fecho dos parentesis),

obtem-se a seguinte analise:

(il (int v v2) (int v) v*) (int v) (int v) pf.

Com base nesta analise sabe-se com que introdutor cada verbo flexionado esta relacionado e

qual o verbo principal (indicado pelo asterisco), dado que este fecha os parentesis do limite

inicial. Ou seja, usando uma pilha para ilustrar o processo, veja-se a figura 3.4 em que “[ ]”

representa a pilha vazia, e as molduras a volta dos elementos da pilha indicam os elementos a

serem retirados. Os numeros em baixo numeram os passos de construcao da pilha:

Figura 3.4: Pilha

Assim, motivada por este estudo, acrescenta-se a restricao pilha. Esta restricao nao segue o al-

goritmo original descrito em [Bes e Dahl, 2003], dado que ignora a coordenacao e vırgulas. In-

tuitivamente, dados dois elementos candidatos a uma relacao de flechagem (e1 e e2), a restricao

pilha indica que e1 pode flechar sobre e2 se entre eles estiver uma pilha vazia, edificada, da es-

querda para a direita, a comecar imediatamente apos o elemento mais a esquerda, seja ele e1

ou e2, e terminando imediatamente antes do elemento mais a direita. Ou seja, esta pilha nao e

construıda desde o inıcio da frase, mas sim apos o elemento mais a esquerda, terminando na

posicao anterior ao elemento mais a direita. Assim, se a pilha edificada entre e1 e e2 for vazia, e

Page 107: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

72 CAPITULO 3. FORMALISMOS

porque entre eles foram introduzidos tantos introdutores como verbos flexionados e, em cada

passo dado, da esquerda para a direita, ha sempre um numero maior ou igual de introdutores

que de verbos.

Notacao 16: Restricao pilha

A restricao pilha associada a uma propriedade de flechagem cuja origem e X e o alvo

e Y, e em que X precede Y denota-se por:

Xi→Z Yk

+{pilha[i,k]=[ ]}.

Do mesmo modo, se Y precede X tem-se:

Xk →Z Yi

+{pilha[i,k]=[ ]}.

Assim, considerando novamente o exemplo Quais os hoteis que tem piscina, a palavra hoteis nao

flecharia sobre tem, dado que entre eles nao existe uma pilha vazia, mas uma pilha com o

introdutor que.

3.3 Regras semanticas

Nesta seccao, descrevem-se as regras semanticas. Comeca-se por uma breve motivacao (seccao

3.3.1), ao que se segue a apresentacao da sintaxe das regras semanticas (seccao 3.3.2) e a

definicao da relacao de subsuncao entre as regras semanticas (seccao 3.3.3). Na seccao 3.3.4

introduz-se o conceito de grafo, na seccao 3.3.5 definem-se as condicoes de aplicabilidade de

Page 108: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

3.3. REGRAS SEMANTICAS 73

uma regra semantica a um grafo e na seccao 3.3.6 explica-se quando uma regra semantica e efec-

tivamente aplicada (a um grafo). Na seccao 3.3.7 avanca-se com uma extensao opcional ao for-

malismo das regras semanticas e dos grafos. Termina-se a apresentacao das regras semanticas

na seccao 3.3.8, com uma breve explicacao sobre as funcoes de traducao.

3.3.1 Motivacao

Cada regra semantica compreende tres partes, sendo constituıda por:

• um conjunto possivelmente vazio de elementos: os elementos a traduzir;

• um conjunto possivelmente vazio de flechas: o contexto da regra;

• um conjunto eventualmente vazio de funcoes: as funcoes que calculam a traducao a ope-

rar.

Uma das caracterısticas em mente aquando do desenvolvimento destas regras semanticas, foi

que nao dependessem de resultados calculados por outras regras para poderem fazer a sua

contribuicao, o seu calculo, para a representacao semantica. Ora quando se desejam produzir

formulas logicas, em que ha partilha de variaveis entre formulas e relacoes de escopo a definir,

esta propriedade nao e trivialmente alcancada. Assim, assume-se que:

• toda a informacao referente aos elementos que fazem parte das flechas do contexto da

regra (como predicados logicos ou variaveis) e conhecida pela regra semantica que pode

usar estes valores para fazer os seus calculos;

Page 109: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

74 CAPITULO 3. FORMALISMOS

• os argumentos usados pelas funcoes de traducao tem de estar associados ou aos elemen-

tos a traduzir ou aos elementos das flechas do contexto da regra. Ou seja, se na regra

existe apenas um elemento de categoria n e uma flecha deste sobre um elemento de cate-

goria v, entao a traducao nao pode ser feita sobre um adj.

Deste modo, consegue-se que cada regra semantica disponha da informacao que precisa para

calcular os seus valores, nao dependendo dos valores calculados por outras regras semanticas

para executar o seu calculo.

As regras semanticas foram ainda organizadas hierarquicamente atraves de uma relacao de

subsuncao. Assim, dadas duas regras R1 e R2, se R1 subsume R2, entao R2 e mais especıfica

que R1 e se ambas estiverem em condicoes de serem disparadas, apenas R2 o e. Se forem varias

as regras em condicoes de serem disparadas, serao disparadas todas as que nao subsumirem

nenhuma outra, ou seja, serao disparadas todas as mais especıficas. Como se vera, esta relacao

de subsuncao entre as regras esta directamente ligada a relacao de subsuncao definida entre as

categorias.

3.3.2 Sintaxe das regras semanticas

Nesta seccao apresenta-se a sintaxe das regras semanticas. Comeca por introduzir-se um con-

junto de conceitos auxiliares e culmina-se na definicao de regra semantica bem formada.

Page 110: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

3.3. REGRAS SEMANTICAS 75

Notacao 17: Conjunto das palavras/campo vazio

Denota-se por W o conjunto das palavras ou sequencias de palavras em jogo.

Denota-se por P o conjunto de variaveis X1, X2, ..., Xn.

Def 11: Elemento

Um elemento e um triplo (w, c, p), em que:

• w ∈W ∪ { } (w e uma palavra ou e indeterminado);

• c ∈ C ∪ { } (c e uma categoria ou e indeterminado);

• p ∈ P (p e uma variavel).

N

Notacao 18: Elemento

Representa-se o elemento (w, c, p) por elem(w, c, p).

Exemplo 33: Elemento

Dada a palavra hotel, de categoria nc1 s, elem(hotel, nc1 s, X1) e um elemento.

Do mesmo modo elem( , nc1 s, X1) e um elemento, em que o campo da palavra e indeterminado. �

De seguida, introduz-se o conceito de flecha.

Def 12: Flecha

Uma flecha e um tuplo de 8 elementos (w1, c1, p1, w2, c2, p2, d, b) em que:

Page 111: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

76 CAPITULO 3. FORMALISMOS

• w1, w2 ∈W ∪ { } (w1 e w2 denominam-se, respectivamente, por palavra origem e palavra

alvo da flecha);

• c1, c2 ∈ C ∪ { } (c1 e c2 denominam-se, respectivamente, por categoria origem e categoria

alvo da flecha);

• p1, p2 ∈ P (p1 e p2 denominam-se, respectivamente, por posicao origem e posicao alvo da

flecha);

• d ∈ {L, R} ∪ { } (d representa o sentido da flecha: L (left) da direita para a esquerda (x),

R (right) da esquerda para a direita (y));

• b ∈ {0, 1} (b indica o tipo da flecha: se b = 1, a flecha diz-se simples; se b = 0, diz-se

ausente).

N

Notacao 19: Flecha simples e flecha ausente, elemento origem e elemento alvo

Representa-se a flecha simples (w1, c1, p1, w2, c2, p2, d, 1) atraves da formula

flecha(w1, c1, p1, w2, c2, p2, d).

Representa-se a flecha ausente (w1, c1, p1, w2, c2, p2, d, 0) atraves da formula

not flecha(w1, c1, p1, w2, c2, p2, d).

Dada uma flecha (w1, c1, p1, w2, c2, p2, d, b), diz-se que:

(1) (w1, c1, p1) e o elemento origem da flecha;(2) (w2, c2, p2) e o elemento alvo da flecha.

Exemplo 34: Flecha simples e flecha ausente

Dadas as categorias prep e nc1 s, flecha( , prep, X1, , nc1 s, X2, ) e uma flecha simples. Em contra-

-partida not flecha( , prep, X1, , nc1 s, X2, ) e uma flecha ausente. �

Page 112: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

3.3. REGRAS SEMANTICAS 77

De seguida introduz-se o conceito generico de regra semantica (as funcoes de traducao sao

apresentadas na seccao 3.3.8). Segue-se um conjunto de definicoes que vao permitir impor

restricoes a este conceito generico e originar a definicao de regra semantica bem formada.

Def 13: Regra semantica

Uma regra semantica e um triplo Ri = (Σ, Θ, Γ) em que:

• Σ e um conjunto (possivelmente vazio) de elementos (o conjunto dos elementos a tradu-

zir);3

• Θ e um conjunto (possivelmente vazio) de flechas simples e flechas ausentes (o contexto

da regra);

• Γ e um conjunto de funcoes responsaveis pelo calculo da traducao a operar (o conjunto

das funcoes de traducao).

N

Notacao 20: Regra semantica

A regra semantica Ri = (Σ, Θ, Γ) denota-se atraves da formula

[Ri] Σ : Θ# Γ

podendo ser omitidos os parentesis dos conjuntos Σ, Θ e Γ.

Exemplo 35: Regra semantica

A regra R4

3Na versao inicial deste formalismo, nomeadamente em [Coheur et al., 2003b], Σ era necessariamente nao vazio.Em [Coheur et al., 2004b] levantou-se esta restricao. Note-se que apesar do conjunto dos elementos poder ser vazio,as regras semanticas continuam a poder ser vistas como funcoes, cujo domınio compreende os elementos a traduzire o contexto de flechagem.

Page 113: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

78 CAPITULO 3. FORMALISMOS

[R4] {elem( , adj, X1), elem( , n, X2)} : ∅# T

e uma regra semantica, em que ha dois elementos a traduzir atraves das funcoes de T. �

Notacao 21: Conjunto das flechas simples e conjunto das flechas ausentes

Dado Θ, denota-se por Θ↓ o conjunto das flechas simples de Θ, e por Θ↑ o conjunto

das flechas ausentes de Θ.

Os conceitos que se apresentam de seguida – ligacao entre elementos, entre flechas e entre

elementos e flechas – permitem fazer exigencias sobre a sintaxe das regras semanticas. Numa

regra semantica bem formada, todos os elementos a traduzir estao ligados entre si atraves

de flechas simples. Adicionalmente, todas as flechas simples estao tambem ligadas entre si,

directa ou indirectamente. As flechas ausentes, por sua vez, estao directamente associadas a um

elemento a traduzir ou a uma flecha simples. Exige-se ainda que, se o conjunto de elementos

a traduzir e o contexto nao forem vazios, entao haja pelo menos um elemento directamente

ligado a uma flecha.

Def 14: Ligacao directa entre elementos

Seja [Ri] Σ : Θ # Γ uma regra semantica e sejam e1 = elem(w1, c1, p1), e2 = elem(w2, c2, p2)

elementos de Σ. Os elementos e1 e e2 dizem-se directamente ligados sse existe uma flecha

simples flecha(w3, c3, p3, w4, c4, p4, d) ∈ Θ↓ que verifique (1).

(1) Um dos elementos e a origem da flecha e o outro o alvo da flecha, isto e,

(w1 = w3 ∧ w2 = w4 ∧ c1 = c3 ∧ c2 = c4 ∧ p1 = p3 ∧ p2 = p4).

N

Page 114: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

3.3. REGRAS SEMANTICAS 79

Notacao 22: Elementos directamente ligados

Denota-se por e1 ./e e2 a ligacao directa entre dois elementos e1 e e2.

Def 15: Ligacao entre elementos

Seja [Ri] Σ : Θ# Γ uma regra semantica e sejam e1 e e2 elementos de Σ. Os elementos e1 e e2

dizem-se ligados sse verificarem (1) ou (2).

(1) e1 e e2 estao directamente ligados, isto e,

e1 ./e e2;

(2) e1 e e2 estao ligados atraves de um conjunto de elementos e31, ..., e3n

∈ Σ que estabelecem

a ligacao, isto e,

e1 ./e e31∧ e31

./e e32∧ ... ∧ e3n

./e e2.

N

Notacao 23: Elementos ligados

Denota-se por e1 ./∗e e2 a ligacao entre dois elementos e1 e e2.

Def 16: Ligacao directa entre flechas

Seja [Ri] Σ : Θ # Γ uma regra semantica, f1 = (w1, c1, p1, w2, c2, p2, d1, b) uma flecha de Θ

(simples ou ausente) e f2 = flecha(w3, c3, p3, w4, c4, p4, d2) uma flecha simples de Θ↓. As flechas

f1 e f2 dizem-se directamente ligadas sse verificarem (1), (2) ou (3).

(1) Ambas flecham sobre o mesmo elemento, isto e,

(w2 = w4 ∧ c2 = c4 ∧ p2 = p4);

Page 115: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

80 CAPITULO 3. FORMALISMOS

(2) O elemento alvo de f1 e o elemento origem de f2, isto e,

(w2 = w3 ∧ c2 = c3 ∧ p2 = p3);

(3) O elemento origem de f1 e o elemento alvo de f2 isto e,

(w1 = w4 ∧ c1 = c4 ∧ p1 = p4).

N

Notacao 24: Ligacao directa entre flechas

Denota-se por f1 ./f f2 a ligacao directa entre duas flechas.

Def 17: Ligacao entre flechas (simples)

Seja [Ri] Σ : Θ# Γ uma regra semantica, e sejam f1 = flecha(w1, c1, p1, w2, c2, p2, d1) e f2 = fle-

cha(w3, c3, p3, w4, c4, p4, d2) flechas simples de Θ↓. As flechas f1 e f2 dizem-se ligadas sse

verificarem (1) ou (2).

(1) f1 e f2 estao directamente ligadas, isto e,

(f1 ./f f2);

(2) f1 e f2 estao ligadas atraves de um conjunto de flechas simples f31, ..., f3n

∈ Θ↓ que estabe-

lecem a ligacao, isto e,

f1 ./f f31∧ f31

./f f32∧ ... ∧ f3n

./f f2.

N

Notacao 25: Ligacao entre flechas (simples)

Denota-se por f1 ./∗f f2 a ligacao entre duas flechas.

Page 116: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

3.3. REGRAS SEMANTICAS 81

Segue-se a definicao de ligacao directa entre uma flecha (simples ou ausente) e um elemento.

Def 18: Ligacao directa flecha/elemento

Seja [Ri] Σ : Θ# Γ uma regra semantica, f = (w1, c1, p1, w2, c2, p2, d1, b) uma flecha (simples

ou ausente) de Θ e e = elem(w, c, p) um elemento de Σ. A flecha f e o elemento e dizem-se

directamente ligados sse verificarem (1) ou (2).

(1) O elemento e e o elemento origem de f , isto e,

(w = w1 ∧ c = c1 ∧ p = p1);

(2) O elemento e e o elemento alvo de f , isto e,

(w = w2 ∧ c = c2 ∧ p = p2).

N

Notacao 26: Ligacao directa flecha/elemento

Denota-se por f � e a ligacao directa entre uma flecha f e um elemento e.

Finalmente, com base nestas definicoes, apresenta-se a nocao de regra bem formada.4

Def 19: Regra semantica bem formada

Uma regra semantica [Ri] Σ : Θ# Γ diz-se uma regra semantica bem formada (rsbf) sse verifica

(1), (2), (3), (4) e (5).

4Uma primeira apresentacao das regras semanticas encontra-se em [Coheur et al., 2003b]. Nesta primeiraapresentacao ainda nao estao incluıdas as flechas ausentes, que aparecem apenas em [Coheur et al., 2004b]. Pos-teriormente, em [Coheur et al., 2004a], estendeu-se a sintaxe dos elementos e das flechas, que coincide com a apre-sentada nesta seccao.

Page 117: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

82 CAPITULO 3. FORMALISMOS

(1) Todos os elementos a traduzir – se existir algum – estao ligados entre si, isto e,

(∀ e1, e2 ∈ Σ)(e1 ./∗e e2);

(2) Todas as flechas simples estao ligadas entre si, isto e,

(∀ f1, f2 ∈ Θ↓)(f1 ./∗f f2);

(3) Se o conjunto dos elementos a traduzir e o contexto da regra nao forem vazios, existe pelo

menos uma flecha e um elemento que estao directamente relacionados, isto e,

(Σ 6= ∅ ∧ Θ 6= ∅)⇒ (∃ e ∈ Σ)(∃ f ∈ Θ)(f � e);

(4) Todas as flechas ausentes estao directamente ligadas a uma flecha simples ou a um ele-

mento a traduzir, isto e,

(∀ f1 ∈ Θ↑)[(∃ f2 ∈ Θ↓)(f1 ./f f2) ∨ (∃ e ∈ Σ)(f1� e)];

(5) A variavel que indica a posicao de um elemento identifica-o univocamente, isto e,

• (∀ e1 = (w1, c1, p1), e2 = (w2, c2, p2) ∈ Σ)(p1 = p2⇒ (w1 = w2 ∧ c1 = c2));

• (∀ f1 = (w1, c1, p1, w2, c2, p2, d1, b1), f2 = (w3, c3, p3, w4, c4, p4, d2, b2) ∈ Θ)(p1 = p3 ⇒

[w1 = w3 ∧ c1 = c3 ∧ ((b1 = b2 = 1)⇒ (w2 = w4 ∧ c2 = c4 ∧ p2 = p4 ∧ d1 = d2))]);5

• (∀ f1 = (w1, c1, p1, w2, c2, p2, d1, b1), f2 = (w3, c3, p3, w4, c4, p4, d2, b2) ∈ Θ)(p1 = p4 ⇒

(w1 = w4 ∧ c1 = c4));

• (∀ f1 = (w1, c1, p1, w2, c2, p2, d1, b1), f2 = (w3, c3, p3, w4, c4, p4, d2, b2) ∈ Θ)(p2 = p4 ⇒

(w2 = w4 ∧ c2 = c4));

• (∀ e1 = (w, c, p) ∈ Σ)(∀ f1 = (w2, c2, p2, w3, c3, p3, d3, b1) ∈ Θ)(p = p2 ⇒ (w = w2 ∧ c =

c2));

5Uma flecha simples nao pode flechar sobre dois alvos distintos.

Page 118: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

3.3. REGRAS SEMANTICAS 83

• (∀ e1 = (w, c, p) ∈ Σ)(∀ f1 = (w2, c2, p2, w3, c3, p3, d3, b) ∈ Θ)(p = p3 ⇒ (w = w3 ∧ c =

c3)).

N

Exemplo 36: Regra semantica bem formada

Considerem-se a etiqueta da categoria dos nomes (n) e a dos adjectivos (adj). A regra R3 nao e bem

formada dado que os elementos a traduzir nao estao ligados.

[R3] {elem( , adj, X1), elem( ,n, X2)} : ∅# T.

Do mesmo modo, as regras semanticas R2 e R62 tambem nao sao bem formadas. R2 pois as flechas nao

estao ligadas entre si; R62 porque a flecha nao esta ligada a nenhum elemento a traduzir.

[R2] {elem( , adj, X1), elem( ,n, X2)} : {flecha( , adj, X1, , n, X2, ), flecha( , adv, X3, v, X4, )}# T

[R62] {elem( , adj, X1), elem( ,n, X2)} : {flecha( , adv, X3, , v, X4, )}# T

Pelo contrario, a regra R15 e bem formada.

[R15] {elem( , adj, X1), elem( , n, X2)} : {flecha( , adj, X1, , n, X2, ), flecha( , n, X2, , v, X3, )}# T.

Tambem a regra R98 e bem formada, pois a flecha ausente esta ligada ao elemento a traduzir, assim como

a flecha simples.

[R98] {elem( , n, X1)} : {not flecha( , prep, X2, , n, X1, ), flecha( , n, X1, , v, X3, )}# T. �

3.3.3 Hierarquia de Regras

Antes de apresentar a definicao de subsuncao entre regras semanticas, ha que introduzir alguns

conceitos, o primeiro dos quais e o de subsuncao entre dois elementos.

Page 119: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

84 CAPITULO 3. FORMALISMOS

Def 20: Subsuncao entre elementos (a traduzir)

Considerem-se dois elementos e1 = elem(w1, c1, p1) e e2 = elem(w2, c2, p2). Diz-se que e1 sub-

sume e2 sse se verifica (1) e (2).6

(1) Se o campo da palavra de e1 esta definido, entao o campo da palavra de e2 tambem esta

definido e esta preenchido com a mesma palavra, isto e,

(w1 6= )⇒ (w2 = w1);

(2) A categoria de e1 subsume a categoria de e2, isto e,

c1 v c2.

N

Notacao 27: Subsuncao entre elementos (a traduzir)

Denota-se por e1 ve e2 a relacao de subsuncao entre os elementos e1 e e2 (e1 subsume

e2).

Exemplo 37: Subsuncao entre dois elementos

Considerem-se os elementos e1 = elem( , nc, X1) e e2 = elem( , nc1 s, X2). e1 ve e2, pois nc v nc1 s.

Considerem-se os elementos e3 = elem(hotel, nc, X3) e e4 = elem(hotel, nc1 s, X4). e3 subsume e4.

Finalmente, considere-se e5 = elem(hotel, nc, X5) e e6 = elem( , nc1 s, X6). Nao existe nenhuma relacao

de subsuncao entre estes elementos. �

Segue-se a definicao de subsuncao entre flechas.

6Note-se que a o terceiro campo de cada elemento e irrelevante para a definicao desta relacao.

Page 120: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

3.3. REGRAS SEMANTICAS 85

Def 21: Subsuncao entre flechas

Considerem-se duas flechas f1 = (w1, c1, p1, w2, c2, p2, d1, b1) e f2 = (w3, c3, p3, w4, c4, p4, d2, b2),

em que b1 = b2 (ou seja, ambas as flechas sao simples ou ambas as flechas sao ausentes). Diz-se

que f1 subsume f2 sse se verifica (1), (2) e (3).

(1) O elemento origem de f1 subsume o elemento origem de f2, isto e,

elem(w1, c1, p1) ve elem(w3, c3, p3);

(2) O elemento alvo de f1 subsume o elemento alvo de f2, isto e,

elem(w2, c2, p2) ve elem(w4, c4, p4);

(3) Se o campo do sentido de f1 esta definido, entao o campo do sentido de f2 tambem esta

definido e esta preenchido com o mesmo valor, isto e,

(d1 6= )⇒ (d2 = d1).

N

Notacao 28: Subsuncao entre flechas

Denota-se por f1 vf f2 a relacao de subsuncao entre as flechas f1 e f2 (f1 subsume f2).

Exemplo 38: Subsuncao entre flechas

Considerem-se duas flechas simples f1 e f2:

f1 = flecha( , arti, X1, , nc, X2, )

f2 = flecha( , arti, X3, , nc1 s, X4, ).

Como nc v nc1 s, tem-se que f1 vf f2 (isto seria igualmente valido se f1 e f2 fossem flechas ausentes).

Considerem-se agora as flechas ausentes f3 e f4. Nao ha nenhuma relacao de subsuncao entre f3 e f4.

Page 121: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

86 CAPITULO 3. FORMALISMOS

f3 = not flecha( , arti, X1, , nc, X2, L)

f4 = not flecha( , arti, X3, , nc1 s, X4, ). �

Finalmente, define-se a relacao de subsuncao entre duas regras semanticas. Esta relacao

de subsuncao difere da relacao de subsuncao de anteriores apresentacoes deste forma-

lismo [Coheur et al., 2003b, Coheur et al., 2004b, Coheur et al., 2004a]. Nesta nova definicao

privilegia-se a subsuncao entre os elementos a traduzir da regra em relacao ao contexto da

regra. Nos trabalhos anteriores, quer os elementos a traduzir, quer as flechas do contexto da

regra, ambos contribuıam com o mesmo peso para o estabelecimento (ou nao) de uma relacao

de subsuncao entre regras. Agora, se os elementos de uma regra subsumem os de outra, entao,

independentemente do contexto da regras, a primeira regra subsume a segunda.

Def 22: Subsuncao entre regras semanticas

Considerem-se duas regras semanticas bem formadas R1 = (Σ1, Θ1, Γ1) e R2 = (Σ2, Θ2, Γ2).

Diz-se que R1 subsume R2 sse se verifica (1) ou (2):

(1) Os elementos a traduzir de R1 subsumem os elementos a traduzir de R2, isto e,

(∀ e1 ∈ Σ1)(∃ e2 ∈ Σ2) (e1 ve e2);

(2) Os elementos a traduzir de R1 sao os mesmos de R2 e, adicionalmente, as flechas do con-

texto de R1 subsumem as flechas do contexto de R2, isto e,

Σ1 = Σ2 ∧ (∀ f1 ∈ Θ1)(∃ f2 ∈ Θ2)(f1 vf f2).

N

Page 122: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

3.3. REGRAS SEMANTICAS 87

Notacao 29: Subsuncao entre regras semanticas

Denota-se por R1 vr R2 a relacao de subsuncao entre as regras semanticas R1 e R2

(R1 subsume R2).

Exemplo 39: Subsuncao entre regras bem formadas

Dado que n v npr, tem-se que a regra R1 subsume a regra R2.

[R1] {elem( , n, X1)} : {flecha( , n, X1, , v, X2, )}# T1

[R2] {elem( , npr, X3)} : {flecha( , npr, X3, , v, X4, )}# T2

A regra R3 por seu lado, e subsumida por R2 pelo facto de ter um contexto de flechagem mais especıfico.

[R3] {elem( , npr, X1)} : {flecha( , npr, X1, , v, X2, ), flecha( , prep, X3, , npr, X1, R)}# T3. �

Com base na definicao de subsuncao entre regras define-se a hierarquia entre as regras. Ou

seja, as regras estao hierarquicamente organizadas com base nas suas relacoes de subsuncao.

3.3.4 Conceito de grafo

Nesta seccao introduzem-se os conceitos de grafo, grafo bem formado e sub-grafo. Primeira-

mente, apresentam-se os conceitos auxiliares de no e arco.

Def 23: No

Um no e um triplo (w, c, p), em que:

• w ∈W (w e uma palavra);

Page 123: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

88 CAPITULO 3. FORMALISMOS

• c ∈ C (c e uma categoria);

• p ∈ N (p e uma posicao).

N

Notacao 30: No

Representa-se o no (w, c, p) por node(w, c, p).

Exemplo 40: No

Dada a palavra hotel, de categoria nc1 s, node(hotel, nc1 s, 4) e um no. �

Def 24: Arco

Um arco e um par (p1, p2), em que:

• p1 ∈ N (p1 e a posicao da origem do arco);

• p2 ∈ N (p2 e a posicao do alvo do arco).

N

Notacao 31: Arco

Representa-se o arco (p1, p2) por arc(p1, p2).

Exemplo 41: Arco

arc(1, 7) e um arco. �

Def 25: Grafo

Um grafo e um par G = (∆, Ψ), em que:

Page 124: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

3.3. REGRAS SEMANTICAS 89

• ∆ e um conjunto nao vazio de nos;

• Ψ e um conjunto, eventualmente vazio, de arcos.

N

Exemplo 42: Grafo

O par ({node(hotel, nc1 s, 2)}, ∅) e um grafo. �

Def 26: Grafo bem formado

Um grafo G = (∆, Ψ) diz-se um grafo bem formado (gbf) sse verifica (1) e (2).

(1) Todos os arcos do grafo ligam dois nos existentes, isto e,

(∀ arc(p1, p2) ∈ Ψ)(∃ node(w1, c2, pos1), node(w2, c2, pos2) ∈∆)(p1 = pos1 ∧ p2 = pos2).

(2) Nenhum no pode ser a origem de dois arcos distintos, isto e:

(∀ arc(p1, p2), arc(p3, p4) ∈ Ψ)(p1 = p3⇒ p2 = p4).

N

Note-se que, ao contrario do que se apresentou em [Coheur et al., 2003b], nao se impoe ao grafo

o nao cruzamento de arcos.

3.3.5 Condicoes de aplicabilidade

Cada regra semantica pode ser aplicada a um grafo sempre que se encontram os elementos a

traduzir que lhe dizem respeito, e se estes verificam o contexto dado pelas suas relacoes de

flechagem. Ou seja, muito rapidamente, dada uma regra bem formada

[Ri] Σ : Θ# Γ

Page 125: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

90 CAPITULO 3. FORMALISMOS

sempre que um conjunto de nos de um grafo de entrada unifica com Σ e que os arcos desses

nos unificam com Θ a regra reune as condicoes para ser aplicada.

Antes de se apresentar a definicao das condicoes de aplicabilidade de uma regra semantica,

apresenta-se um conjunto de definicoes auxiliares.

Def 27: Unificacao elemento/no

Sejam dados uma regra bem formada [Ri] Σ : Θ# Γ e um grafo bem formado G = (∆, Ψ). Seja

e = elem(wi, ci, pi) ∈ Σ e n = node(wj, cj , pj) ∈ ∆. Diz-se que e unifica com n sse se verifica (1)

e (2):

(1) Se a palavra de e esta definida, entao coincide com a de n, isto e,

(wi 6= )⇒ (wi = wj);

(2) A categoria de e subsume ou e igual a categoria de n, isto e,

ci v cj .

N

Notacao 32: Unificacao elemento/no

Denota-se a unificacao do elemento e com o no n, por f(e, n).

Exemplo 43: Unificacao elemento/no

Dada o elemento elem(hotel, nc1 s, X1), este unifica com o no node(hotel, nc1 s, 23).

Ja o elemento elem( , nc2 s, X1) nao unifica com o no node(hotel, nc1 s, 23). �

Def 28: Unificacao flecha (simples ou ausente)/arco

Page 126: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

3.3. REGRAS SEMANTICAS 91

Sejam dados uma regra bem formada [Ri] Σ : Θ# Γ e um grafo bem formado G = (∆, Ψ). Seja

f = (wn, cn, pn, wm, cm, pm, d, b) ∈ Θ e a = arc(pk, pl) ∈ Ψ. Diz-se que f unifica com a sse os nos

n1 = node(wk, ck, pk) e n2 = node(wl, cl, pl) ∈ ∆ verificam as condicoes (1), (2), (3) e (4).

(1) O elemento origem de f unifica com n1, isto e,

f((wn, cn, pn), n1);

(2) O elemento alvo de f unifica com n2, isto e,

f((wm, cm, pm), n2);

(3) Se o sentido da flecha f e da esquerda para a direita (R), entao n1 precede n2, isto e,

d = R⇒ pk < pl;

(4) Se o sentido da flecha f e da esquerda para a direita (L), entao, n2 precede n1, isto e,

d = L⇒ pk > pl.

N

Notacao 33: Unificacao flecha (simples ou ausente)/arco

Denota-se a unificacao da flecha f com o arco a, por f(f , a).

Exemplo 44: Unificacao flecha (simples ou ausente)/arco

Dados o arco arc(23, 24) e os nos node(hotel, nc1 s, 23) e node(Ritz, npr, 24), a flecha f = ( , npr, X1, ,

nc1 s, X2, ) unifica com o arco arc(23, 24). �

Def 29: Condicao de aplicabilidade de uma regra semantica

Considere-se a regra bem formada [Ri] Σ : Θ # Γ, em que Σ = {e1, ..., em} e o grafo G = (∆,

Ψ). A regra esta em condicoes de ser aplicada a um conjunto de nos N = {n1, ..., nm} de ∆ sse

Page 127: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

92 CAPITULO 3. FORMALISMOS

existe um conjunto de unificacoes possıveis entre os elementos de Σ e de N (f = f(e1, n1), ...,

f(em, nm)), que verifica o seguinte:

(1) Se dois elementos a traduzir da regra Ri estao directamente ligados, os nos com que unifi-

cam estao ligados por um arco de ∆, isto e,

(∀ ei = (wi1 , ci1 , pi1 ) , ej = (wj1 , cj1 , pj1) ∈ Σ, f = flecha (wi1 , ci1 , pi1 , wj1 , cj1 , pj1 , d) ∈ Θ, ni

= (wi2 , ci2 , pi2 ) , nj = (wj2 , cj2 , pj2) ∈N)

[f(ei , ni), f(ej , nj) ∈ f⇒ (∃ a ∈ Ψ)(f(f , a) ∧ a = arc(pi2 , pj2))];

(2) Se duas flechas simples da regra Ri estao directamente ligadas, entao existem dois arcos de

Ψ que unificam com as flechas e que estao igualmente ligados, isto e,

2.1 caso em que o alvo de uma e a origem da outra, e e um elemento a traduzir:

(∀ fi = flecha(wi1 , ci1 , pi1 , wi2 , ci2 , pi2 , di), fj = flecha(wi2 , ci2 , pi2 , wj2 , cj2 , pj2 , dj) ∈

Θ) (∃ n3 = (wi3 , ci3 , pi3 ), n4 = (wi4 , ci4 , pi4 ), n5 = (wi5 , ci5 , pi5) ∈∆) (∃ ai = arc(pi3 , pi4 ),

aj = arc(pi4 , pi5) ∈ Ψ) (f(fi, ai) ∧ f(fj , aj) ∧ (e = (wi2 , ci2 , pi2) ∈ Σ⇒ f(e, n4) ∈ f))

2.2 caso em que tem o mesmo alvo:

(∀ fi = flecha(wi1 , ci1 , pi1 , wi2 , ci2 , pi2 , di), fj = flecha(wj1 , cj1 , pj1 , wi2 , ci2 , pi2 , dj) ∈

Θ) (∃ n3 = (wi3 , ci3 , pi3 ), n4 = (wi4 , ci4 , pi4 ), n5 = (wi5 , ci5 , pi5) ∈∆) (∃ ai = arc(pi3 , pi4 ),

aj = arc(pi5 , pi4) ∈ Ψ) (f(fi, ai) ∧ f(fj , aj) ∧ (e = (wi2 , ci2 , pi2) ∈ Σ⇒ f(e, n4) ∈ f))

(3) Se uma flecha ausente esta ligada a uma flecha simples, entao nao ha nenhum arco ligado

ao arco que unifica com a flecha simples que unifique com a flecha ausente:

(3.1) caso em que o alvo de uma e a origem de outra:

(∀ fi = (wi1 , ci1 , pi1 , wi2 , ci2 , pi2 , di, bi), fj = (wi2 , ci2 , pi2 , wj2 , cj2 , pj2 , dj , bj) ∈ Θ) [bi 6=

bj ⇒¬[ (∃ n3 = (wi3 , ci3 , pi3), n4 = (wi4 , ci4 , pi4 ), n5 = (wi5 , ci5 , pi5 ) ∈∆) (∃ ai = arc(pi3 ,

Page 128: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

3.3. REGRAS SEMANTICAS 93

pi4 ), aj = arc(pi4 , pi5 ) ∈ Ψ) (f(fi, ai) ∧ f(fj , aj))]]

(3.2) caso em que tem o mesmo alvo:

(∀ fi = flecha(wi1 , ci1 , pi1 , wi2 , ci2 , pi2 , di), fj = not flecha(wj1 , cj1 , pj1 , wi2 , ci2 , pi2 , dj)

∈ Θ) ¬[(∃ n3 = (wi3 , ci3 , pi3 ), n4 = (wi4 , ci4 , pi4 ), n5 = (wi5 , ci5 , pi5 ) ∈∆) (∃ ai = arc(pi3 ,

pi4 ), aj = arc(pi5 , pi4 ) ∈ Ψ) (f(fi, ai) ∧ f(fj , aj))]

(4) Se uma flecha simples da regra Ri esta ligada a um elemento, entao existe um arco de Ψ que

unifica com a flecha e que esta ligado a um no que unifica com o dito elemento, isto e,

4.1 caso em que o elemento e a origem da flecha:

(∀ f = flecha(wi1 , ci1 , pi1 , wi2 , ci2 , pi2 , di) ∈ Θ)(∀ e = elem(wi1 , ci1 , pi1 ) ∈ Σ) (∃ n3 =

(wi3 , ci3 , pi3 ), n4 = (wi4 , ci4 , pi4 ) ∈∆) (∃ a = arc(pi3 , pi4) ∈ Ψ) (f(f , a) ∧ f(e, n3) ∈ f)

4.2 caso em que o elemento e o alvo da flecha:

(∀ f = flecha(wi1 , ci1 , pi1 , wi2 , ci2 , pi2 , di) ∈ Θ)(∀ e = elem(wi2 , ci2 , pi2 ) ∈ Σ) (∃ n3 =

(wi3 , ci3 , pi3 ), n4 = (wi4 , ci4 , pi4 ) ∈∆) (∃ a = arc(pi3 , pi4) ∈ Ψ) (f(f , a) ∧ f(e, n4) ∈ f)

(5) Se uma flecha ausente da regra Ri esta ligada a um elemento, entao nao existe um arco de

Ψ que unifica com a flecha e que esteja ligado a um no que unifica com o dito elemento,

isto e,

5.1 caso em que o elemento e a origem da flecha:

(∀ f = not flecha(wi1 , ci1 , pi1 , wi2 , ci2 , pi2 , di) ∈ Θ)(∀ e = elem(wi1 , ci1 , pi1 ) ∈ Σ) ¬[(∃

n3 = (wi3 , ci3 , pi3), n4 = (wi4 , ci4 , pi4) ∈ ∆) (∃ a = arc(pi3 , pi4 ) ∈ Ψ)(f(f , a) ∧ f(e, n3))]

5.2 caso em que o elemento e o alvo da flecha:

(∀ f = not flecha(wi1 , ci1 , pi1 , wi2 , ci2 , pi2 , di) ∈ Θ)(∀ e = elem(wi2 , ci2 , pi2 ) ∈ Σ) ¬[(∃

n3 = (wi3 , ci3 , pi3), n4 = (wi4 , ci4 , pi4) ∈ ∆) (∃ a = arc(pi3 , pi4 ) ∈ Ψ)(f(f , a) ∧ f(e, n4))]

N

Page 129: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

94 CAPITULO 3. FORMALISMOS

Exemplo 45: Condicao de aplicabilidade de uma regra semantica

A regra R20 esta em condicoes de ser aplicada ao grafo G.

[R20] {elem( , adj, X1), elem( , n, X2)} : {flecha( , adj, X1, , n, X2, )}# T1. �

G= ({node(hotel, nc1 s, 34), node(baratinho, adj1 s, 35)}, {arc(35, 34)}.)

3.3.6 Aplicacao de uma regra semantica

A aplicabilidade das regras depende da (in)existencia de regras mais especıficas igualmente em

condicoes de serem aplicadas. A especificidade de uma regra define-se com base na subsuncao

entre regras (seccao 3.3.3). Ou seja, uma regra e mais especıfica que outra se for subsumida

por ela. Assim, se duas ou mais regras estiverem em condicoes de serem disparadas, apenas as

mais especıficas (as que nao subsumem nenhuma outra), sao aplicadas.

Def 30: Aplicabilidade de uma regra

Dadas duas regras R1 e R2, verificando a condicao de aplicabilidade definida anteriormente, se

R1 vr R2 (R1 subsume R2), entao R1 nao e disparada. N

Exemplo 46: Aplicabilidade de uma regra semantica

Dadas a regra R20 do exemplo anterior e a regra R21 abaixo, ambas podem ser aplicadas ao grafo G do

exemplo anterior. Como R21 e mais especıfica que R20, apenas R21 e disparada.

[R21] {elem( , adj1 s, X1), elem( , n, X2)} : {flecha( , adj1 s, X1, , n, X2, )}# T2. �

Page 130: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

3.3. REGRAS SEMANTICAS 95

3.3.7 Extensoes

Admite-se que quer os nos quer os arcos do grafo possam ter um campo extra, opcional, onde

e guardada outro tipo de informacao adicional. Do mesmo modo, e de modo a poder usar essa

informacao, quer os elementos, quer as flechas (simples ou ausentes) das regras semanticas

podem ter um campo adicional. Nesta dissertacao aceitam-se estes novos campos que sao (por

agora) mantidos independentes da organizacao hierarquica das regras semanticas. Ou seja,

a informacao contida nesses campos nao contribui para o estabelecimento de uma relacao de

subsuncao entre duas regras.

3.3.8 Funcoes de traducao

Fica em aberto a definicao das funcoes de traducao, dado que as escolhas dependem do que se

deseja obter. O unico requisito e que a informacao usada na funcao de traducao de uma regra

apareca nos elementos a traduzir ou no contexto da regra.

Permite-se tambem que as funcoes de traducao introduzam explicitamente constantes, predi-

cados ou operadores na formula logica – como e o caso, por exemplo, do predicado NAME.

Nesta dissertacao, as funcoes de traducao apoiam-se nas seguintes funcoes auxiliares pre-

-definidas:

• var(X1) que devolve uma variavel associada ao elemento da posicao X1;

• sem(X1) que devolve o valor semantico (por omissao), associado ao elemento da posicao

X1.

Page 131: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

96 CAPITULO 3. FORMALISMOS

3.4 Resumo e Conclusoes

Apresentaram-se neste capıtulo os formalismos usados nesta tese. Em particular descreveram-

-se as propriedades de flechagem usadas no 5P, que foram enriquecidas com a restricao pi-

lha, inspirada nos trabalhos de [Bes e Dahl, 2003] sobre parentesis equilibrados. Apresentou-se

ainda o formalismo das regras semanticas, e descreveu-se a relacao de subsuncao entre as re-

gras que as organiza hierarquicamente e que leva a que as mais especıficas sejam aplicadas em

detrimento das mais genericas.

Page 132: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

4�����3���O�P�� &A*B��:�1-�;QR�2�3*B�

Neste capıtulo, descrevem-se as ferramentas e os recursos linguısticos previamente dis-

ponıveis, bem como os corpora utilizados. Apresenta-se ainda um conjunto de pequenas

alteracoes feitas as descricoes linguısticas originais, em especial sobre as partıculas interro-

gativas.

A organizacao do capıtulo e a seguinte: na seccao 4.1 apresentam-se as ferramentas disponıveis

utilizadas e na seccao 4.2 os recursos linguısticos que serviram de base a esta dissertacao. Na

seccao 4.3 identificam-se os corpora observados, terminando-se o capıtulo na seccao 4.4, com

um pequeno resumo.

4.1 Recursos informaticos

Este trabalho contou com tres ferramentas que permitiram focar o material informatico a

desenvolver apenas na interface sintaxe/semantica. Essas tres ferramentas sao o Smorph

[Aıt-Mokhtar, 1998], o Pasmo [Paulo, 2001, Paulo, 2004] e o Susana [Batista e Mamede, 2002,

Batista, 2003].

O Smorph e uma ferramenta que faz o processamento pre-sintactico de textos. Mais precisa-

mente, o Smorph permite associar a cada segmento de um texto, um ou mais lemas acompa-

nhados de informacao morfologica. A figura 4.1 ilustra a saıda do Smorph para a questao Qual

Page 133: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

98 CAPITULO 4. RECURSOS DISPONIVEIS

a maior praia do Algarve?.

’Qual’.[ ’qual’, ’CAT’,’rel’, ’NUM’,’s’, ’GEN’, ].[ ’qual’, ’CAT’,’int’, ’NUM’,’s’, ’GEN’, ].

’a’.[ ’o’, ’CAT’,’artd’, ’NUM’,’s’, ’GEN’,’f’].[ ’a’, ’CAT’,’prep’].[ ’a’, ’CAT’,’per’, ’NUM’,’s’, ’GEN’,’f’, ’PES’,’3’, ’CAS’,’acc’].

’maior’.[ ’maior’, ’CAT’,’a’, ’NUM’,’s’, ’GEN’, , ’TAN’,’t1’].

’praia’.[ ’praia’, ’CAT’,’n’, ’NUM’,’s’, ’GEN’,’f’, ’TAN’,’t1’].

’do’.[ ’de’, ’CAT’,’partd’, ’NUM’,’s’, ’GEN’,’m’].

’Algarve’.[ ’Algarve’, ’CAT’,’npr’, ’NUM’,’s’, ’GEN’,’m’, ’TAN’,’t2’].

’?’.[ ’?’, ’CAT’,’int’, ’CAT’,’ponct’].

Figura 4.1: Saıda do Smorph para a questao Qual a maior praia do Algarve?

Analisando, por exemplo, a palavra praia, esta:

• tem como lema praia;

• e um nome (’CAT’, ’n’) de tipo 1 (contavel) (’TAN’,’t1’);

• encontra-se no singular, no feminino (’NUM’,’s’, ’GEN’,’f’).

O Pasmo e um processador pos-morfologico que, de acordo com um conjunto de regras, per-

mite, entre outros, concatenar sequencias de palavras, segmentar palavras, e definir etiquetas

para as classificacoes atribuıdas a cada palavra. Nesta dissertacao o Pasmo e o responsavel

por estes processamentos (note-se que o Smorph poderia executar igualmente algumas destas

tarefas). A figura 4.2 ilustra a saıda do Pasmo para a pergunta em questao.

Neste exemplo, o Pasmo atribuiu uma etiqueta propria a cada uma das classificacoes. Por

exemplo, a categoria associada a palavra praia e etiquetada por nc1 s. Adicionalmente:

Page 134: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

4.1. RECURSOS INFORMATICOS 99

<phrase num=“4”><hypothesis num=“1”>

<word name=“Qual”><class root=“qual”> <id name=“qual int”/> </class>

</word><word name=“a”>

<class root=“o”> <id name=“artd s”/> </class></word><word name=“maior”>

<class root=“maior”> <id name=“adj1 s”/> </class></word><word name=“praia”>

<class root=“praia”> <id name=“nc1 s”/> </class></word><word name=“de”>

<class root=“de”> <id name=“de”/> </class></word><word name=“o”>

<class root=“o”> <id name=“artd s”/> </class></word><word name=“Algarve”>

<class root=“Algarve”> <id name=“npr2”/> </class></word><word name=“?”>

<class root=“?”> <id name=“p int”/> </class></word>

</hypothesis></phrase>

Figura 4.2: Saıda do Pasmo para a questao Qual a maior praia do Algarve?

• a contraccao de preposicao do e segmentada na preposicao de – etiquetada por de – e no

artigo o – etiquetado artd s;

• ha um trabalho de desambiguacao sobre a palavra a, tendo-lhe sido atribuıda apenas uma

classificacao (como artigo).

O Susana e um analisador sintactico de superfıcie, responsavel pela identificacao dos modelos

basicos, o ponto de partida da interface sintaxe/semantica apresentada nesta dissertacao. O

processamento efectuado pelo Susana da frase Qual a maior praia do Algarve? resulta na analise

de superfıcie da figura 4.3, em que foram identificados os modelos basicos etiquetados por Int,

Page 135: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

100 CAPITULO 4. RECURSOS DISPONIVEIS

Nn, Prepn e Ponct.

Fint(Int(qual int(Qual))Nn(artd s(a) adj1 s(maior) nc1 s(praia))Prepn(de(de) artd s(o) npr2(Algarve))Ponct(p int(?)))

Figura 4.3: Saıda do Susana para a questao Qual a maior praia do Algarve?

A figura 4.4 mostra a sequencia de utilizacao destas tres ferramentas.

!"#$%

!"#$%&

'%()%**+,$-.$+.-'",$"&

-,%$-/%

0'%(12

3-*'%

!"#$%&

'%()%**+,$-.$+.-'",$"&

-,%$-/%

04*-,- 5%/"6%*&78*+.%*

Figura 4.4: Utilizacao do Smorph, Pasmo e Susana

4.2 Recursos linguısticos

Grande parte dos recursos linguısticos usados, e que se descrevem de seguida, foram cria-

dos/enriquecidos durante o trabalho de doutoramento de [Hagege, 2000]. Este trabalho teve

como objectivo a extraccao de sintagmas nominais de texto, pelo que apresenta uma descricao

Page 136: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

4.2. RECURSOS LINGUISTICOS 101

detalhada destas construcoes, fazendo um tratamento superficial aos verbos e construcoes ver-

bais.

Como actualmente estao a ser recuperados e integrados um conjunto de recursos linguısticos

que em breve estarao disponıveis [Ribeiro et al., 2004, de Matos et al., 2004], optou-se no desen-

volvimento da interface sintaxe/semantica por trabalhar com a informacao existente, fazendo-

-lhe apenas alteracoes pontuais, e tentando ir o mais longe possıvel com a informacao dis-

ponıvel. Como as descricoes herdadas relativas aos verbos e sequencias verbais sao de facto

muito pobres, e a coordenacao nao e tratada, na interface sintaxe/semantica desta dissertacao

faz-se apenas um tratamento muito superficial dos verbos, sendo ignorada a coordenacao.

4.2.1 Dicionario

O dicionario do Smorph para o Portugues conta com aproximadamente 975000 entradas lexi-

cais, resultantes da aplicacao de 153 modelos de flexao a 26600 lemas. Estes dados foram cria-

dos com o objectivo de conseguir em pouco tempo um analisador para o portugues, pelo que

foram exploradas ao maximo as caracterısticas do Smorph que permitem aplicar heurısticas

para “adivinhar” formas nao codificadas [Hagege, 2004].

4.2.2 Categorias

Nesta seccao apresentam-se as etiquetas das categorias usadas, e descreve-se um conjunto de

processamentos feitos pelo Pasmo, que teve como tarefa agrupar sequencias especıficas, e, de-

sambiguar certas palavras.

Page 137: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

102 CAPITULO 4. RECURSOS DISPONIVEIS

4.2.2.1 Verbos

A tabela 4.1 apresenta as etiquetas de verbos e sequencias verbais, herdadas de [Hagege, 2000]

e usadas nesta dissertacao.

Etiqueta Descricao Exemplosvinf etiqueta para verbos no infinitivo. cantar, surfarvcopc etiqueta para verbos copulativos. estou, permanecevppas etiqueta para os particıpios passado. conquistado

vc3etiqueta para verbos nao copulativos, conjugados na ter-ceira pessoa. Etiqueta tambem algumas sequencias deformas verbais.

tem, acontece, vaiandando

vc12etiqueta para verbos nao copulativos, conjugados na pri-meira ou segunda pessoa.

posso, apanho

Tabela 4.1: Etiquetas para verbos.

A estas etiquetas foram acrescentadas etiquetas para conjugacoes especıficas de verbos com

comportamentos particulares como haver, existir e ser (respectivamente vhaver, vexistir, e vser).

No caso dos verbos haver e existir, o Pasmo etiqueta-os ainda mais especificamente como vha-

ver int e vexistir int caso se encontrem no inıcio da frase, dado que serao os introdutores da

interrogacao (Ha/Existem praias com areia preta no Algarve?).

Certas etiquetas (como vc3), para alem de serem associadas a formas verbais individuais, sao

tambem associadas (pelo Pasmo) a algumas sequencias verbais como esta a dancar ou tem-se

tornado. A estas sequencias, foram acrescentadas outras, igualmente apanhadas numa unica

etiqueta (a etiqueta vc3) pelo Pasmo, tais como e permitido, e possıvel, possibilitam a pratica de.

Falta acrescentar que dado que se pretendem tratar do mesmo modo situacoes como Quais os

lagos na zona norte... e Quais sao os lagos na zona norte... (que sao semanticamente equivalentes),

o Pasmo elimina o verbo ser quando este ocorre a seguir as partıculas qual e quais. Desde modo,

Page 138: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

4.2. RECURSOS LINGUISTICOS 103

Quais sao os lagos na zona norte... e transformado em Quais os lagos na zona norte.... O mesmo

tratamento e dado a Quantos sao e Quem e/sao.

Finalmente, ainda atraves do Pasmo, mapeia-se a sequencia tem que em tem de. Ha

quem considere a primeira sequencia um erro gramatical de Portugues. Apesar de em

[Estrela e Pinto-Correia, 1994] se explicar a subtil diferenca entre as duas sequencias, neste tra-

balho, ambas as construcoes sao tratadas como tendo o mesmo significado.

4.2.2.2 Nomes

As categorias associadas aos nomes sao as definidas em [Hagege, 2000], separando-se os no-

mes comuns dos nomes proprios. Em relacao aos primeiros, distinguem-se os nomes comuns

contaveis dos nao contaveis. Em relacao aos segundos, organizam-se os nomes proprios em

quatro grupos distintos. Usam-se as etiquetas da tabela 4.2.1

4.2.2.3 Adjectivos

A classificacao dos adjectivos provem de [Hagege, 2000], podendo ser sintetizada nos seguintes

testes (em que se supoe que X e o candidato a adjectivo):

Teste 1: pode-se incluir X na construcao X nc? Se sim, entao trata-se de um adj1;

Teste 2: pode-se incluir X na construcao adj3 X? Se sim, entao trata-se de um adj3. Caso

contrario, trata-se de um nadj.

1As etiquetas atribuıdas por Hagege no quadro do seu doutoramento nao permitem diferenciar dois nomes pelogenero. Nesta tese mantem-se estas etiquetas.

Page 139: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

104 CAPITULO 4. RECURSOS DISPONIVEIS

Etiqueta Descricao Exemplos

nc1 s e nc1 petiquetas para os nomes comuns contaveis, nosingular e no plural, respectivamente. mesa, filhos, livros

nc2 s e nc2 petiquetas para os nomes comuns nao contaveis,respectivamente no singular e no plural. chuva, farinha

npr1etiqueta que representa os nomes proprios quenunca sao precedidos por um artigo (tipo 1).

Lisboa, Mozart(em algumasconstrucoes estesnomes podem serprecedidos porum artigo)

npr2etiqueta para os nomes proprios que sao sem-pre precedidos por um artigo (tipo 2).

Mondego, Xutos ePontapes

npr3etiqueta para os nomes proprios que por vezessao precedidos por um artigo e por vezes nao osao (tipo 3).

Italia

npr4

etiqueta para os nomes de pessoas que po-dem ser apanhadas em algumas distribuicoessintacticas que os anteriores nao podem (tipo4).

Ana, Miguel Mar-ques da Silva

Tabela 4.2: Etiquetas para nomes.

Aos adjectivos sao atribuıdas as etiquetas da tabela 4.3, que se explicam de seguida.

Etiqueta Descricao Exemplos

adj1 s e adj1 petiquetas para adjectivos de tipo 1 (singular eplural)

simpatico, fantastico

adj2 s e adj2 p etiquetas exclusivas para as palavras mero e me-ros

adj3 s e adj3 petiquetas para adjectivos de tipo 3 (singular eplural)

portuguesa

nadj s e nadj3 petiqueta para palavras entre o adjectivo e onome (singular e plural).

vizinha, guia

Tabela 4.3: Etiquetas para adjectivos.

4.2.2.4 Preposicoes

Em relacao as preposicoes decidiu-se discriminar um conjunto de preposicoes, tendo-lhes sido

atribuıda uma etiqueta propria. Adicionalmente etiquetou-se um conjunto de locucoes prepo-

Page 140: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

4.2. RECURSOS LINGUISTICOS 105

sitivas com a etiqueta perto de.2 As etiquetas usadas sao as da tabela 4.4.

Etiqueta Descricao Exemplosde etiqueta para a preposicao de decom etiqueta para a preposicao com comem etiqueta para a preposicao em emate etiqueta para a preposicao ate atea etiqueta para a preposicao a a

perto deetiqueta para as sequencias ao pe de, perto de,na(s) proximidade(s) de, nos arredores de, na vizi-nhanca de.

na vizinhanca de

prep etiqueta para as restantes preposicoes ante

Tabela 4.4: Etiquetas para preposicoes.

4.2.2.5 Pronomes e adverbios

Nesta seccao indicam-se as etiquetas atribuıdas as palavras que e onde (em varios contextos),

bem como a um conjunto de pronomes e adverbios, que nao se tentam desambiguar. A mai-

oria dos pronomes e adverbios em analise tem varias hipoteses de categorizacao (por exem-

plo, a palavra quem e ambıgua entre o pronome relativo e o interrogativo [Relvas, 1996]). No

entanto, pelo facto de num corpus de perguntas algumas destas palavras terem quase certa-

mente valor interrogativo, atribuiu-se-lhes (por agora) uma unica etiqueta sendo tratadas ape-

nas como partıculas interrogativas, mesmo correndo o risco de falhar a analise. Excepcao a esta

categorizacao grosseira sao as palavras que e onde, que o Pasmo tenta desambiguar. O trabalho

que se apresenta sobre a desambiguacao do que e do onde serve igualmente de ilustracao ao

trabalho de desambiguacao que futuramente devera ser feito sobre as restantes partıculas (esta

tarefa de desambiguacao foi inicialmente descrita em [Coheur et al., 2003a]).

2Em [Nunes et al., 1986] encontra-se uma lista de locucoes prepositivas que deverao sofrer destino semelhante,ou seja, ter uma etiqueta propria (ou eventualmente partilharem etiquetas com outras preposicoes e/ou locucoesprepositivas).

Page 141: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

106 CAPITULO 4. RECURSOS DISPONIVEIS

Considere-se que o que pode ser ambıguo apenas entre o pronome interrogativo e relativo (e

algumas situacoes em que o que e uma conjuncao comparativa). Excluem-se, por exemplo,

as situacoes em que o que e uma conjuncao causal (Temos de ir que ele precisa de nos.) e uma

conjuncao consecutiva (E tao obvio que nem vale a pena explicar.). Veja-se [Relvas, 1996] para

outras hipoteses.

O Pasmo comeca por agrupar as seguintes sequencias que contem a palavra que, que etiqueta

como indicado na tabela 4.5. Note-se que a ordem de aplicacao das regras do Pasmo e a mesma

que esta associada a introducao das linhas da tabela.

Etiqueta Descricao Exemplosquando dias etiqueta para a sequencia em que dias em que diasquando mes etiqueta para a sequencia em que mes em que mesquando ano etiqueta para a sequencia em que ano em que anoquando horas etiqueta para a sequencia a que horas a que horas

onde intetiqueta para as sequencias de queregiao/local/zona de que regiao

que geral etiqueta para as sequencias a/o/com/de que a queem que geral etiqueta para a sequencia em que em queporque etiqueta para as sequencias porque que (e que) porque que e queporque etiqueta para a sequencia porque e que porque e quee que etiqueta para a sequencia e que e quecomp inf etiqueta para a sequencia menor que menor quecomp sup etiqueta para a sequencia maior que maior queque geral etiqueta para a sequencia que que

Tabela 4.5: Etiquetas para sequencias com a palavra que.

Todas as etiquetas apresentadas sao as etiquetas de saıda do Pasmo, com excepcao das etiquetas

que geral e em que geral. Estas sao ainda transformadas numa das etiquetas da tabela 4.6.

Assim, se um dado contexto permitir desambiguar a palavra que, entao o Pasmo desambigua

essa situacao, transformando a etiqueta que geral em que int ou que rel, consoante for detec-

tado o contexto de uma interrogativa ou relativa, respectivamente. Se nenhuma regra puder

Page 142: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

4.2. RECURSOS LINGUISTICOS 107

Etiqueta Descricao Exemplosque int etiqueta para o que interrogativo Que hotel...em que int etiqueta para o em que interrogativo Em que hotel...que rel etiqueta para o que relativo ...um hotel que...em que rel etiqueta para o em que relativo ... hotel em que...

queetiqueta para o que ambıguo entre o pronomeinterrogativo e relativo –

em queetiqueta para o em que ambıguo entre o pro-nome interrogativo e relativo –

Tabela 4.6: Etiquetas finais para algumas sequencias com a palavra que.

ser aplicada, entao a palavra que entra no Susana com a etiqueta que, que indica ambiguidade

(processo identico sofre o em que geral). Segue-se uma breve descricao das regras usadas pelo

Pasmo no processo de desambiguacao:

• se o que geral (o que inclui as sequencias ja processadas pelo Pasmo e etiquetadas por

que geral) ocorre no inıcio da frase, entao trata-se de um pronome interrogativo, pas-

sando a que int;

ex: Que restaurantes de Coimbra servem especialidades brasileiras?

• se o que geral e seguido pela sequencia e que, entao passa igualmente a que int;

ex: No Alentejo o que e que se pode cacar?

• se imediatamente a seguir a um que geral se encontra um nome comum, entao trata-se

de um que int3;

ex: Em Braga, que campos de tiro estao abertos a nao associados?

• se imediatamente a seguir a um que geral se encontra um verbo, ou a palavra se, ou um

adverbio, entao trata-se de um que rel;

3Note-se que esta regra pode falhar se se aceitarem sequencias (no mınimo “estranhas”) como ?Indique-me umhotel que piscina tenha.

Page 143: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

108 CAPITULO 4. RECURSOS DISPONIVEIS

ex: Em Lisboa, quais os auditorios que proporcionam servico de restaurante?

ex: Quais os museus que se encontram abertos a segunda?

ex: Quais os parque que nao exigem cartao de campista?

• se imediatamente a seguir a um que geral se encontra um artigo, entao trata-se de um

que rel;

ex: Quais os espacos que a Camara de Lisboa recuperou?

Note-se que na maioria dos casos analisados ha varias regras a poderem ser aplicadas (por

exemplo, em O que e que se pode comer no Tavares?, pode ser aplicada a primeira regra, dado que

O que ocorre no inıcio da frase; tambem a segunda regra pode ser aplicada, dado que o o que e

seguido por um e que). O Pasmo aplica a primeira regra que puder ser usada.

A desambiguacao da palavra onde tem alguns pontos comuns a desambiguacao da palavra que,

tal como se pode observar na descricao das regras que se usam no Pasmo (tambem aqui se

pre-etiqueta esta palavra com a etiqueta generica onde geral):

• se onde geral ocorre no inıcio da frase, entao esta-se perante um adverbio interrogativo,

isto e, onde recebe a etiqueta onde int;

ex: Onde fica a serra mais alta de Portugal?

• se onde geral se encontra no fim da frase, ou e seguida apenas pelas sequencias fica(m), e,

se localiza(m), se situa(m), entao esta-se igualmente perante um adverbio interrogativo;

ex: O aqueduto das aguas livres comeca onde?

ex: A Se onde se localiza?

Page 144: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

4.2. RECURSOS LINGUISTICOS 109

• se a seguir a um onde geral se encontra um e que, entao trata-se de um adverbio interro-

gativo

ex: Onde e que eu posso cacar javalis?

As palavras qual e quais, nos contextos o/a qual ou os/as quais, sao pronomes relativos. Fora

deste contexto, e de acordo com [Cunha e Cintra, 1985], sao pronomes interrogativos (em

[Areal, 1996] e apresentado um exemplo em que qual tem valor relativo, apesar de nao ser

precedido por um artigo definido. E, no entanto, um exemplo “rebuscado”, pelo que nao se vai

considerar esta situacao), pelo que o Pasmo fica encarregue de atribuir a etiqueta de partıcula

relativa a estas palavras nos contextos descritos, tal como indicado na tabela 4.7.

Etiqueta Descricao Exemplosqual rel etiqueta para as sequencias o/a qual o qualquais rel etiqueta para as sequencias os/as quais os quais

Tabela 4.7: Etiquetas para as sequencias a/o(s) qual/quais

Para alem destes agrupamentos o Pasmo atribui ainda as etiquetas da tabela 4.8 (tratando-se

posteriormente estes elementos como se de elementos interrogativos se tratassem):

Etiqueta Descricao Exemplosqual int etiqueta para a palavra qual qualquais int etiqueta para a palavra quais quaisquem etiqueta para a palavra quem quemquanto etiqueta para a palavra quanto quantoporque etiqueta para a palavra porque razao porque razaocomo etiqueta para a palavra como comoquando etiqueta para a palavra quando quando

Tabela 4.8: Etiquetas para as partıculas interrogativas

Note-se que a etiqueta porque ja tinha sido atribuıda as sequencias porque que, porque e que e

porque que e que.

Page 145: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

110 CAPITULO 4. RECURSOS DISPONIVEIS

4.2.2.6 Adverbios

Com excepcao dos adverbios anteriormente classificados, as etiquetas dos restantes adverbios

considerados sao as da tabela 4.9.

Etiqueta Descricao Exemplos

adv mente etiqueta para os adverbios terminados emmente.

incrivelmente, lenta-mente

advcomp etiqueta para as palavras mais e menos. menosnao para a palavra nao. nao

Tabela 4.9: Etiquetas para adverbios.

4.2.2.7 Outros

Nesta seccao apresenta-se, na tabela 4.10, um conjunto de etiquetas que aparece nos textos

analisados e em exemplos.

Etiqueta Descricao Exemplos

artd s e artd petiqueta para os artigos definidos no singular eplural. o/a, os/as

arti s etiqueta para os artigos indefinidos no singular. um, umauns p etiqueta para as palavras uns e umas. uns, umasqualquer s e qualquer p etiquetas para as palavras qualquer e quaisquer. qualquer, quaisquertodo s e todo p etiquetas para as palavras todo e todos. todo, todosalgum s e alguns p etiquetas para as palavras algum e alguns. algum, algunsnenhum s e nenhum p etiquetas para as palavras nenhum e nenhuns. nenhum, nenhunscard p etiqueta para os cardinais. tres, cem

comp supetiqueta para as sequencias maior que, nao menorque, superior a, nao inferior a, mais de e nao menosde.

superior a, mais de

comp infetiqueta para as sequencias menor que, nao maiorque, inferior a, nao superior a, menos de e nao maisde.

inferior a, menos de

Tabela 4.10: Outras etiquetas.

Page 146: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

4.2. RECURSOS LINGUISTICOS 111

4.2.3 Modelos

De seguida, apresentam-se os modelos usados nesta dissertacao. Mas antes, uma pequena nota

sobre o conceito de modelo nuclear.

4.2.3.1 Modelos nucleares

Os modelos nucleares sao domınios linguısticos entre a unidade lexical e o sintagma tradici-

onal [Hagege, 2000], e podem caracterizar-se como sequencias de categorias que vao desde a

que foi detectada como sendo a categoria inicial ate a que e considerada vulgarmente como o

nucleo da sequencia [Bes e Hagege, 2001]. Para mais detalhes e um enquadramento dos mo-

delos nucleares, pode-se consultar [Hagege, 2000], onde para alem de se explicitar como se

identifica um conjunto de modelos nucleares, se faz uma comparacao entre estes, os primos

chunks [Abney, 1995, Berwick et al., 1991] e estruturas similares.

Nas descricoes linguısticas feitas no quadro do 5P, os modelos nucleares tem um papel de

destaque. Tal deve-se as suas propriedades, que os tornam mais simples de descrever e de

recuperar que os sintagmas tradicionais [Hagege, 2000]. Por exemplo, estas estruturas nao tem

recursividade interna se se excluir a coordenacao [Hagege e Bes, 1999].4

Exemplo 47: Modelo nuclear

Considere-se a sequencia A muito difıcil tarefa (em que muito e um adverbio, difıcil um adjectivo, e tarefa

um nome). A divisao em modelos e a dada em (1).

4Note-se que, ao contrario dos chunks, e tal como e apontado em [Hagege, 2000], um modelo nuclear pode conteroutro modelo nuclear no seu interior (um chunk nao contem outro chunk). Apenas esse modelo nuclear nunca e domesmo tipo que o modelo nuclear onde esta incluıdo, nem contem nenhum modelo nuclear desse tipo quer directa,quer indirectamente, reencontrando-se deste modo a propriedade da nao recursividade.

Page 147: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

112 CAPITULO 4. RECURSOS DISPONIVEIS

(1) (A (muito difıcil) tarefa) e um modelo nominal em que:

(muito) e um modelo adverbial nuclear;

(muito difıcil) e um modelo adjectival nuclear;

(A (muito difıcil) tarefa) e um modelo nominal nuclear.

Compare-se esta analise com a de A tarefa muito difıcil de (2).

(2) ((A tarefa) (muito difıcil)) e um modelo nominal em que:

(A tarefa) e um modelo nominal nuclear;

(muito) e um modelo adverbial nuclear;

(muito difıcil) e um modelo adjectival nuclear. �

4.2.3.2 Modelos verbais

Consideram-se os modelos verbais da tabela 4.11.

Etiqueta Descricao Exemplos

Infn

etiqueta dos modelos que consistem emsequencias iniciadas por uma preposicao prepe que terminam com um verbo no infini-tivo vinf s, podendo conter entre estes algunsadverbios, clıticos, etc.

de fazer, em rapida-mente terminar

Copvnetiqueta dos modelos constituıdos por umvcopc, aos quais se acrescenta os modelos cons-tituıdos por um existe v, e v ou sao v.

existem, e

Ppnetiqueta dos modelos que contem apenas umparticıpio passado vppas no seu interior.

vigiadas, apanhado

Phvn

etiqueta dos modelos que contem apenas umvc3 no interior, aos quais se acrescenta os mo-delos constituıdos por um elemento etiquetadopor haver int, existe int ou ha v.

tem, pode-se fazer

Phvn12etiqueta dos modelos com um unico elementono interior etiquetado por vc12.

quero, posso

Tabela 4.11: Etiquetas dos modelos verbais.

Page 148: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

4.2. RECURSOS LINGUISTICOS 113

A estes acrescentou-se um conjunto de modelos, etiquetados por Vn, e que compreendem

sequencias dos modelos anteriores. Estas sequencias iniciam-se com um modelo etiquetado

por Phvn, Ppn, Copvn ou Phvn12 e terminam com um modelo etiquetado por Infn. Estes mo-

delos cobrem situacoes como demora a percorrer, posso visitar ou existem para ver.

4.2.3.3 Modelos nominais

Os modelos nominais usados nesta dissertacao sao os descrito na tabela 4.12.

Etiqueta Descricao Exemplos

Nn

etiqueta do grosso dos modelos nominaisnucleares, cuja descricao se baseia na de[Hagege, 2000], nao fazendo parte destes mo-delos os modelos nominais com um uniconome comum no singular no interior.

a simpatica miuda,qualquer rapaz, essefilho

Nntetiqueta para os modelos nominais nuclearesque se caracterizam por conterem um uniconome comum no singular, tıtulo ou nadj.

sopa em comeu sopa

Tabela 4.12: Etiquetas dos Modelos nominais.

4.2.3.4 Modelos adjectivais

Nesta dissertacao consideram-se os modelos adjectivais de tipo 1 e os modelos adjectivais de

tipo 2 de [Hagege, 2000], descritos na tabela 4.13. Os primeiros encontram-se no interior dos

modelos nominais nucleares (m-Nn). Os segundos a nıvel da frase, e dividem-se, por sua vez,

em quantificados e nao quantificados.

Page 149: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

114 CAPITULO 4. RECURSOS DISPONIVEIS

Etiqueta Descricao Exemplos

An1etiqueta dos modelos adjectivais nucleares detipo 1. Em tracos gerais, iniciam-se com ummodelo adverbial e terminam num adjectivo.

muito bonita em amuito bonita rapa-riga

An2nqetiqueta dos modelos adjectivais nucleares detipo 2 nao quantificados.

bonita em A rapa-riga bonita, Ritz emO hotel Ritz

An2qetiqueta dos modelos adjectivais nucleares detipo 2 quantificados.

nenhum em rapaznenhum, todos emos rapazes todos

Tabela 4.13: Etiquetas dos modelos adjectivais.

4.2.3.5 Modelos preposicionais

Os modelos preposicionais em uso sao essencialmente os mesmos que se encontravam nas

entradas do Susana. Usa-se Prepn como etiqueta para os modelos preposicionais nucleares.

Iniciam-se com uma preposicao, podendo ser seguidos por varios elementos. Cobrem casos

como em qualquer situacao ou da tia Maria.

4.2.3.6 Modelos de interrogativas e relativas

Os modelos que contem pronomes e adverbios podem ter uma das etiquetas da tabela 4.14.

Etiqueta Descricao Exemplos

Intetiqueta para os modelos constituıdos por to-das as palavras (ou sequencias de palavras) cu-jas etiquetas sao subsumidas por int.

que em Que hoteistem piscina?

Reletiqueta para os modelos que contem assequencias etiquetadas por que rel. a/o qual, as/os quais

Ondeetiqueta para as sequencias que contem a pala-vra onde etiquetada (ambiguamente) por onde. onde

Queetiqueta que cobre palavra que etiquetada (am-biguamente) por que.

que

Tabela 4.14: Etiquetas dos modelos que contem partıculas interrogativas e relativas.

Page 150: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

4.2. RECURSOS LINGUISTICOS 115

4.2.3.7 Modelos adverbiais

Os modelos adverbiais considerados neste trabalho e apresentados na tabela 4.15 sao apenas

os modelos adverbiais a nıvel da frase e os modelos adverbiais que podem ocorrer no interior

de um modelo adjectival nuclear de tipo 1, isto e, os modelos adverbiais nucleares de tipo 1,

tais como definidos em [Hagege, 2000].

Etiqueta Descricao Exemplos

Advn etiqueta dos modelos adverbiais a nıvel dafrase.

lentamente, muitopouco em dancoumuito pouco

Advn1etiqueta dos modelos adverbiais que se encon-tram no interior de modelos adjectivais nuclea-res de tipo 1.

muito pouco emo muito poucosimpatico fun-cionario

Tabela 4.15: Etiquetas dos modelos adverbiais.

4.2.3.8 Outros

Para alem dos modelos apresentados, consideram-se ainda as etiquetas de modelos da tabela

4.16.

Etiqueta Descricao Exemplos

Equeetiqueta para os modelos que contem um ele-mento no interior etiquetado por e que.

e que em Onde e quefica

Se etiqueta para os modelos que contem a palavrase

se

Coord etiqueta para os modelos que contem umacoordenacao como e ou ou.

ou

Fintetiqueta para os modelos que representam afrase interrogativa.

Onde fica o Ritz?

Tabela 4.16: Outras Etiquetas de Modelos.

Page 151: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

116 CAPITULO 4. RECURSOS DISPONIVEIS

4.2.4 Super-etiquetas de modelos

Se a relacao de subsuncao entre as categorias se deduz a partir das etiquetas, o mesmo nao

se passa com as etiquetas dos modelos. Nesta dissertacao consideram-se as seguintes super-

-etiquetas de modelos:

• V v {Vn, Phvn, Copvn}

• Nom v {Nn, Nnt}

• An2 v {An2q, An2nq}

• Rn v {Onde, Rel, Que}.5

4.3 Corpora

Finalmente, descrevem-se os corpora sobre os quais foram feitas as observacoes que levaram

a formulacao das propriedades de flechagem e regras semanticas que sao apresentadas nos

capıtulos que se seguem.

Do Edite herdou-se o Corpete (Corpus para o Edite) que foi recolhido com o objectivo de ser-

vir de base para testes do sistema Edite. Contem 680 perguntas sobre 68 recursos turısticos,

tais como hoteis, restaurantes, museus e campos de golfe, e foi construıdo por 10 pessoas –

que nao estando directamente ligadas ao projecto, sabiam que serviria para uma interface em

lıngua natural – as quais foi pedido que fizessem uma pergunta sobre cada um dos 68 recursos

5Note-se que quando esta etiqueta for usada, esta-se a atribuir o valor de introdutores de relativa aos modelos(ambıguos) Onde e Que.

Page 152: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

4.4. RESUMO E CONCLUSOES 117

turısticos. Nao sendo um corpus naturalmente construıdo, isto e, nao tendo sido criado por

turistas num caso real de procura de informacao, foi considerado um corpus representativo

dessas situacoes, e sobre ele foram feitas as observacoes que levaram a formulacao das propri-

edades de flechagem e regras semanticas relativas a interpretacao de questoes (capıtulos 5 e

6).

O CETEMPublico (Corpus de Extractos de Textos Electronicos MCT/Publico) e um corpus

de linguagem jornalıstica portuguesa (com material do jornal PUBLICO) criado pelo pro-

jecto Processamento Computacional do Portugues, em Abril de 2000 [Rocha e Santos, 2000,

Santos e Rocha, 2001b]. O corpus inclui textos de cerca de 2.600 edicoes do PUBLICO, entre

os anos de 1991 e 1998, num total de aproximadamente 180 milhoes de palavras (a versao

1.0). Foi sobre este corpus que se fizeram as observacoes que levaram a formulacao das regras

semanticas responsaveis pela desambiguacao semantica (parcial) dos quantificadores qualquer,

algum, nenhum e todos (capıtulo 7). Deve-se referir que se usou neste estudo a ferramenta do

projecto AC/DC (Acesso a corpora/Disponibilizacao de corpora) que permite interrogar cor-

pora [Santos e Bick, 2000, Santos e Sarmento, 2002], e foi de grande utilidade.

4.4 Resumo e Conclusoes

Neste capıtulo apresentou-se a base de trabalho sobre a qual assenta a interface sin-

taxe/semantica apresentada nesta dissertacao. Para a identificacao dos modelos basicos – o

ponto de partida da interface sintaxe/semantica – utilizam-se, em cadeia, o Smorph, o Pasmo

e o Susana. A informacao linguıstica usada por estas ferramentas provem, quase na totalidade,

dos trabalhos de doutoramento de Hagege, tendo-se optado por fazer apenas extensoes pon-

Page 153: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

118 CAPITULO 4. RECURSOS DISPONIVEIS

tuais (em especial sobre partıcula interrogativas e relativas), apesar do tratamento superficial

dado aos verbos e a coordenacao. Neste capıtulo, depois de uma descricao das ferramentas e

etiquetas das categorias e modelos utilizadas pela interface sintaxe/semantica, descreveram-se

os corpora usados na tarefa da interpretacao de questoes e desambiguacao de quantificadores,

respectivamente o Corpete e o CETEMPublico.

Page 154: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

5GH-?�0�3�S:+�T�"�F�U4�+6�< &��

V �2�$� ��68�$�)W:+�I1:2�S*X��&8��&��$� &��

Y �?�3��� ( �.�

Neste capıtulo, apresenta-se um conjunto de propriedades de flechagem no domınio das

interrogacoes. A base sintactica sao as estruturas (categorias e modelos) descritas no capıtulo

4, tendo as observacoes sido feitas sobre o Corpete de desenvolvimento (Corpete sem o Cor-

pete de teste). Deve-se notar que apesar do Corpete ser um corpus artificial, foi considerado

um Corpus representativo de interrogacoes. Assim, as propriedades de flechagem estao base-

adas nas observacoes do Corpete, sendo por vezes bastante restritivas. Ou seja, assume-se que

construcoes sintacticamente aceites que nao ocorram no Corpete, tipicamente nao ocorrerao em

questoes levantadas por um turista. Excepcoes sao algumas construcoes mais obvias, que nao

ocorrem no Corpete, mas que se teve em conta na definicao das propriedades de flechagem.

Este capıtulo esta organizado como se segue: a seccao 5.1 e dedicada a flechagem no interior

dos modelos nucleares, cobrindo as seccoes de 5.2 a 5.7 a flechagem entre os varios modelos

nucleares. Termina-se o capıtulo na seccao 5.8, com o habitual resumo e principais conclusoes.

5.1 Flechagem no interior dos modelos nucleares

A base sintactica disponıvel pode ser vista a dois nıveis: (i) a nıvel dos modelos nucleares;

(ii) a nıvel da frase. Assume-se nesta dissertacao que no interior de um modelo nuclear todos

os elementos flecham sobre o ultimo elemento. Deste modo nada ha a declarar em relacao a

Page 155: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

120 CAPITULO 5. INTERPRETACAO DE QUESTOES: PROPRIEDADES DE FLECHAGEM

flechagem no interior dos modelos nucleares, dado que, implicitamente, todos os elementos

flecham sobre o ultimo elemento.

5.2 Flechagem dos modelos verbais

Em relacao a flechagem dos modelos verbais, considera-se que quando o modelo verbal e o

nucleo da frase, pode flechar sobre si (auto-flechagem). A auto-flechagem e formalizada na

propriedade de flechagem F1 (em que V e uma super-etiqueta das etiquetas dos modelos ver-

bais Vn, Phvn e Copvn1, ou seja, a propriedade de flechagem F1 aplica-se a modelos etiquetados

por Vn, Phvn e Copvn).

F1: Vi→Fint Vi

Exemplo 48: Modelo m-V – auto-flechagem

Em (1), e de acordo com F1, o modelo etiquetado por Phvn pode flechar sobre si.

(1) (O Ritz)Nn (tem)Phvn (piscina)Nnt... �

Admite-se tambem que a flechagem de um modelo m-V pode ser feita sobre um modelo in-

trodutor de uma relativa, tal como indicado em F2 (em que Rn e uma super-etiqueta de Onde,

Que e Rel).2

F2: Vk →Fint Rni

+{pilha[i,k] = []}

1Deve-se lembrar que um modelo etiquetado por X pode ser referido por modelo m-X.2Repare-se que, nesta situacao, os modelos etiquetados por Onde e Que, que contem, respectivamente, um onde

e um que ambıguos, sao tratados como introdutores de relativas.

Page 156: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

5.2. FLECHAGEM DOS MODELOS VERBAIS 121

Exemplo 49: Modelo m-V – flechagem sobre um modelo m-Rn

Em (1), o modelo etiquetado por Phvn flecha sobre o modelo etiquetado por Que, dado que entre eles

existe uma pilha vazia.

(1) ... (que)Que (tem)Phvn (piscina)Nnt... �

Ha ainda a considerar a flechagem dos modelos etiquetados por Ppn (modelos que contem um

verbo no particıpio passado). Assume-se que estes podem flechar sobre um modelo etiquetado

por Copvn a esquerda, ou sobre o primeiro modelo etiquetado por Nn a esquerda, se entre o

modelo m-Copvn e o modelo m-Nn nao existir um outro modelo m-Copvn. Com estas hipoteses

de flechagem, cobrem-se os casos em que os modelos m-Ppn contem adjectivos etiquetados

como particıpios passados.

F3: Ppnk→Fint Copvni

F4: Ppnk→Fint Nni

-{Nnj , Copvnj}

Exemplo 50: Modelo m-Ppn – flechagem sobre modelos m-Copvn e m-Nn

Em (1) o modelo etiquetado por Ppn pode flechar sobre o modelo etiquetado por Copvn. Em (2), a

flechagem pode ser feita sobre o modelo etiquetado por Nn.

(1) ...(e)Copvn (construıdo)Ppn ...3

(2) ...(as feiras)Nn (previstas)Ppn... �

3O modelo em que se encontra o verbo ser, mesmo como auxiliar da passiva, e sempre etiquetado por Copvn.

Page 157: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

122 CAPITULO 5. INTERPRETACAO DE QUESTOES: PROPRIEDADES DE FLECHAGEM

5.3 Flechagem dos modelos nominais nucleares

Consideram-se dois tipos de modelos nominais nucleares: os modelos nominais nucleares eti-

quetados por Nn e os modelos nominais etiquetados por Nnt. Tipicamente, um modelo nominal

nuclear flecha sobre um modelo verbal. No entanto, em situacoes como Quais os lagos na zona

norte..., deseja-se que o m-Nn os lagos fleche sobre si proprio, assumindo o papel de nucleo da

frase.4

5.3.1 Flechagem sobre modelos verbais

As propriedades de flechagem que se seguem, respectivamente F5, F6 e F7, indicam a flechagem

dos modelos m-Nn sobre modelos verbais. F5 e F6 indicam hipoteses de flechagem a esquerda;

F7 a direita. Em todos os casos o modelo etiquetado por Nn tem de estar no mesmo nıvel que o

modelo verbal, ou seja, a restricao pilha tem de ser vazia.

F5: Nnk →Fint Vi

+{pilha[i,k] = [ ]}

F6: Nnk →Fint Phvn12i

+{pilha[i,k] = [ ]}

F7: Nni→Fint Vk

+{pilha[i,k] = [ ]}

4Relembre-se que Quais sao os lagos na zona norte... e equivalente a Quais os lagos na zona norte.... Assim, paraevitar que, no primeiro caso, a flechagem do modelo nominal nuclear os lagos tivesse por alvo o modelo verbal sao,e, no segundo caso, flechasse sobre si, usou-se o Pasmo para eliminar o verbo ser, quando este ocorre no contextoda interrogacao com as partıculas qual e quais. Desde modo, Quais sao os lagos na zona norte... e transformado emQuais os lagos na zona norte..., mesmo antes da analise de superfıcie.

Page 158: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

5.3. FLECHAGEM DOS MODELOS NOMINAIS NUCLEARES 123

O exemplo 51 ilustra estas situacoes de flechagem.

Exemplo 51: Modelo m-Nn – flechagem sobre modelos m-V e m-Phvn12

Em (1) o modelo m-Nn flecha sobre o modelo m-Vn a esquerda, e em (2) o modelo m-Nn flecha a direita

sobre o Phvn (nao flecha sobre o Copvn devido a restricao pilha).

(1) ... (posso alugar)Vn (uma carrinha)Nn...

(2) ...(As vilas)Nn (que)Que (sao)Copvn (patrimonio mundial)Nnt (tem)Phvn...

Em (3), o modelo m-Nn flecha sobre o modelo m-Phvn12.

(3) ...(Quero)Phvn12 (uma carrinha)Nn... �

Em relacao aos modelos m-Nnt, considera-se que flecham a esquerda sobre um modelo verbal

que esteja imediatamente antes, e sobre um modelo verbal a direita, independentemente da

distancia, tal como enunciado nas propriedades de flechagem F8 e F9.

F8: Nnti+1→Fint Vi

F9: Nnti→Fint Vk

Exemplo 52: Modelos m-Nnt – flechagem sobre modelos m-V

Em (1) a flechagem do modelo Nnt e feita sobre a esquerda e em (2) sobre a direita.

(1) ...(posso praticar)Vn (windsurf )Nnt...

(2) ...(tempo)Nnt (demora a chegar)Vn... �

Page 159: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

124 CAPITULO 5. INTERPRETACAO DE QUESTOES: PROPRIEDADES DE FLECHAGEM

5.3.2 Auto-flechagem

Os modelos nominais flecham sobre si em situacoes particulares como Quais os hoteis.... E como

caracterizar estes casos atraves das restricoes disponıveis? Dizer que a flechagem se da na

ausencia de um modelo verbal nao adianta, pois pode sempre existir um modelo verbal no

quadro de uma relativa (Quais os hoteis que tem piscina). Pode-se, no entanto, dizer que esta

situacao apenas ocorre quando existe na frase um modelo interrogativo (m-Int), com um qual

ou um quais no interior, imediatamente anterior ao modelo nominal.5 Deve-se notar que esta

propriedade e apenas para os modelos etiquetados Nn (adiante discutem-se casos de auto-

flechagem de modelos etiquetados por Nnt). A propriedade e formalizada em F10 .

F10: Nni→Fint Nni

+{Inti−1(qual/)}

Exemplo 53: Modelos m-Nn – auto-flechagem

Em (1), o modelo etiquetado por Nn flecha sobre si.

(1) ...(Quais)Int (os lagos)Nn... �

A parte trata-se a auto-flechagem dos modelos m-Nnt, pois as situacoes que levam a esta

hipotese de flechagem nao sao sintacticamente correctas. Sao casos como Alojamento particu-

lar em Vilarinho das Furnas? (em que Alojamento e o modelo m-Nnt). Apesar desta estrutura

sintactica nao representar uma interrogacao, devido aos habitos de pesquisa adquiridos na in-

ternet, em que e pratica corrente a introducao de palavras-chave, estas situacoes nao se podem

negligenciar. Certamente que perante uma interface em Lıngua Natural, muitos utilizadores

5No Corpete de trabalho apenas se encontraram casos em que estes elementos eram contıguos.

Page 160: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

5.4. FLECHAGEM DOS MODELOS ADJECTIVAIS NUCLEARES 125

farao a sua pesquisa atraves de estruturas semelhantes. Considera-se que esta situacao apenas

ocorre quando o m-Nnt se encontra no inıcio da frase (note-se que ocorrer no inıcio da frase nao

implica flechar sobre si). Acrescenta-se entao a propriedade de flechagem F11:

F11: Nnt0→Fint Nnt0

Exemplo 54: Modelo m-Nnt – auto-flechagem

Na frase (1), o modelo etiquetado por Nnt flecha sobre si.

(1) (Turismo)Nnt (em Lisboa)Prepn �

5.4 Flechagem dos modelos adjectivais nucleares

Os modelos adjectivais nucleares a nıvel da frase sao denominados por Hagege modelos ad-

jectivais de tipo 2, em contraste com os modelos adjectivais de tipo 1, que se encontram no

interior dos modelos nominais nucleares. Os modelos adjectivais de tipo 2 sao etiquetados por

An2 e divididos em dois grupos: a) quantificados (etiquetados por An2q); b) nao quantificados

(etiquetados por An2nq).

Nesta dissertacao considera-se que os modelos adjectivais nucleares podem flechar sobre um

modelo nominal nuclear (quer modelos m-Nn, quer m-Nnt, ou seja, genericamente modelos m-

-Nom) ou sobre um modelo m-Prepn (modelo preposicional nuclear) a esquerda. Nestes casos

o adjectivo tem a funcao sintactica de adjunto nominal, ou seja, e um termo acessorio da oracao

[Cunha e Cintra, 1985]. Os modelos adjectivais podem igualmente flechar (a esquerda) sobre

um modelo m-Copvn. Neste caso o adjectivo tem funcao predicativa.

Page 161: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

126 CAPITULO 5. INTERPRETACAO DE QUESTOES: PROPRIEDADES DE FLECHAGEM

5.4.1 Flechagem sobre modelos nominais

Em relacao a flechagem sobre os modelos m-Nom, distinguem-se dois casos. No primeiro, o

modelo m-An2 tem um modelo m-Advn (modelo adverbial nuclear) no interior. Nesta situacao

a flechagem e feita sobre a esquerda. No segundo caso, o modelo m-An2 nao contem um mo-

delo m-Advn. Nesta situacao a flechagem e feita igualmente sobre a esquerda, mas sobre o

modelo m-Nom, que tem de preceder imediatamente o modelo m-An2.

F12: An2j({Advn})→Fint Nomi

F13: An2i+1(/{Advn})→Fint Nomi

Exemplo 55: Modelos m-An2 – flechagem sobre modelos m-Nom

Quer em (1), quer em (2), a flechagem dos modelos etiquetados por An2nq e feita sobre o modelo eti-

quetado por Nn.

(1) ... (desportos)Nn (nauticos)An2nq...

(2) ... (as areas)Nn (de paisagem)Prepn (protegida)Ppn ((mais proximas)Advn2)An2nq... �

5.4.2 Flechagem sobre modelos preposicionais

Assume-se que a flechagem sobre modelos preposicionais e feita apenas se estes se encontrarem

imediatamente a esquerda, tal como indicado na propriedade de flechagem F14.

F14: An2i+1→Fint Prepni

Exemplo 56: Modelos m-An2 – flechagem sobre modelos m-Prepn

Em (1), o modelo etiquetado por An2nq vai, de acordo com a propriedade de flechagem anterior, flechar

Page 162: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

5.5. FLECHAGEM DOS MODELOS PREPOSICIONAIS NUCLEARES 127

sobre o modelo etiquetado por Prepn.

(1) ... (em a zona)Prepn (norte)An2nq... �

5.4.3 Flechagem sobre modelos verbais

Admite-se que os modelos adjectivais nucleares flechem (a esquerda) sobre modelos m-Copvn.

A propriedade de flechagem que indica esta possibilidade e F15.

F15: An2k→Fint Copvni

Exemplo 57: Modelos m-An2 – flechagem sobre modelos m-Copvn

Em (1), o modelo etiquetado por An2nq flecha sobre o modelo etiquetado por Copvn.

(1) ... (cujo acesso)Nn (seja)Copvn (facil)An2nq... �

5.5 Flechagem dos modelos preposicionais nucleares

A flechagem dos modelos preposicionais e particularmente variada – o velho problema do PP-

-attachment – existindo inumeras hipoteses de flechagem. Decidiu-se separar as propriedades

de acordo com o sentido da flechagem: (i) flechagem a esquerda; (ii) flechagem a direita.

5.5.1 Flechagem dos modelos preposicionais a esquerda

Considera-se que um modelo preposicional nuclear pode flechar: (i) sobre um modelo nominal

nuclear (quer m-Nn, quer m-Nnt), podendo este ser adjacente (a esquerda) ou nao; (ii) sobre um

Page 163: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

128 CAPITULO 5. INTERPRETACAO DE QUESTOES: PROPRIEDADES DE FLECHAGEM

outro modelo preposicional nuclear; (iii) sobre varios tipos de modelos verbais. De seguida

exploram-se estas hipoteses.

5.5.1.1 Flechagem sobre modelos nominais

Em relacao a flechagem sobre os modelos nominais, considera-se que o modelo preposicional

pode flechar sobre um modelo nominal que se encontra a sua esquerda. Segue-se as proprie-

dades de flechagem e os respectivos exemplos ilustrativos.

F16: Prepnk→Fint Nomi

Exemplo 58: Modelos m-Prepn – flechagem sobre modelos m-Nom

Quer em (1), quer em (2), o modelo etiquetado por Prepn flecha a esquerda sobre os modelos etiquetados

por Nn.

(1) ... (o horario)Nn (de funcionamento)Prepn...

(2) ... (que int)Int (tipo)Nn (de vegetacao)Prepn... �

5.5.1.2 Flechagem sobre outros modelos preposicionais nucleares

Um modelo preposicional pode flechar sobre um outro modelo preposicional a esquerda.

Considera-se esta situacao quando nao existe nenhum modelo nominal ou verbal entre os mo-

delo preposicional origem e o modelo preposicional alvo.

F17: Prepnk→Fint Prepni

-{Nomj , Vj}

Page 164: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

5.5. FLECHAGEM DOS MODELOS PREPOSICIONAIS NUCLEARES 129

Exemplo 59: Modelos m-Prepn – flechagem sobre modelos m-Prepn

O modelo etiquetado por Prepn, de Portalegre, flecha, gracas a propriedade de flechagem F17, sobre o

modelo etiquetado por Prepn, do distrito.

(1) ... (do distrito)Prepn (de Portalegre)Prepn... �

5.5.1.3 Flechagem sobre modelos verbais

Considera-se que um modelo preposicional nuclear pode estar associado a praticamente todos

os tipos de modelos verbais. No entanto, ha que distinguir as varias hipoteses de flechagem

de modo a que seja possıvel torna-las mais especıficas, pois existe um conjunto particular de

modelos verbais sobre os quais nao se deseja que um modelo preposicional nuclear fleche.

Como exemplo, considere-se a frase Existem hoteis na ilha-do-Corvo?. O modelo preposicional

nuclear na ilha-do-Corvo poderia flechar quer sobre o modelo verbal Existem, quer sobre mo-

delo nominal nuclear hoteis. So que, semanticamente, um objecto “existir em Y” e o mesmo

que o objecto existir e ser de “Y” (pelo menos neste domınio). Assim, ou se consideram as

duas hipoteses de flechagem (ou seja, assume-se que o modelo preposicional nuclear tanto

pode flechar sobre o modelo verbal com o verbo existir, como sobre o modelo nominal), fi-

cando as regras semanticas encarregues de traduzir estas duas hipoteses de flechagem numa

unica representacao; ou se considera apenas uma destas hipotese de flechagem (que sera pos-

teriormente mapeada na representacao semantica escolhida). Optou-se pela segunda hipotese,

assumindo-se que o modelo preposicional nao flecha sobre um modelo verbal que contenha o

verbo existir. Assim, considera-se que um sintagma preposicional flecha sobre um modelo ver-

bal se este nao contiver verbos etiquetados por vhaver, vhaver int, vexistir, vexistir int. Explica-

-se assim a propriedade de flechagem F18.

Page 165: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

130 CAPITULO 5. INTERPRETACAO DE QUESTOES: PROPRIEDADES DE FLECHAGEM

F18: Prepnj →Fint Vi (/{vhaver, vhaver int, vexistir, vexistir int})

Exemplo 60: Modelos m-Prepn – flechagem sobre modelos m-V

Nos casos de (1), (2) e (3), os modelos etiquetados por Prepn podem flechar sobre os modelos etiquetados

por Vn, Copvn e Phvn, respectivamente.

(1) ... (posso visitar)Vn (ao Domingo)Prepn...

(2) ... (ficam)Copvn (em monumentos)Prepn...

(3) ... (pode-se nadar)Phvn (em o Guincho)Prepn... �

Ha ainda a considerar a flechagem sobre os modelos m-Infn, que e dada pela propriedade de

flechagem F19.

F19: Prepnk→Fint Infni

Exemplo 61: Modelos m-Prepn – flechagem sobre modelos m-Infn

Em (1), o modelo etiquetado por Prepn pode flechar sobre o modelo etiquetado por Infn.

(1) ... (para ir)Infn (para o Porto)Prepn... �

Finalmente considera-se a propriedade de flechagem F20, sobre os modelos no particıpio pas-

sado.

F20: Prepnk→Fint Ppni

Exemplo 62: Modelos m-Prepn – flechagem sobre modelos m-Ppn

Em (1), o modelo etiquetado por Prepn flecha sobre o modelo etiquetado por Ppn.

(1) ... (construıdas)Ppn (em o seculo V)Prepn... �

Page 166: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

5.5. FLECHAGEM DOS MODELOS PREPOSICIONAIS NUCLEARES 131

5.5.2 Flechagem dos modelos preposicionais a direita

Caso se encontre no inıcio do modelo, assume-se que um modelo preposicional nuclear pode

flechar a direita sobre o primeiro modelo nominal nuclear que encontrar.

F21: Prepn0→Fint Nnk

-{Nnj}

Exemplo 63: Modelos m-Prepn – flechagem a direita sobre modelos m-Nn

Em (1), o modelo etiquetado por Prepn pode flechar sobre o modelo etiquetado por Nn.

(1) ... (Em o rio)Prepn (Tejo)An2nq (ha)Phvn (golfinhos)Nn... �

Admite-se que um modelo m-Prepn pode igualmente flechar sobre um modelo verbal, desde

que este nao contenha verbos como existir e haver (nao se considera, desta vez, a hipotese de

flechar sobre um modelo m Copvn).

F22: Prepn0→Fint Vnk

F23: Prepn0→Fint Phvnk (/{vhaver, vhaver int, vexistir, vexistir int})

Exemplo 64: Modelos m-Prepn – flechagem a direita sobre modelos m-Vn

Quer em (1), quer em (2), a flechagem do modelo etiquetado por Prepn e feita sobre o modelo verbal

(respectivamente etiquetados por Vn e Phvn).

(1) ... (Em o rio)Prepn (Tejo)An2nq (posso praticar)Vn (ski-aquatico)Nn...

(2) ... (Em o rio)Prepn (Tejo)An2nq (e possıvel alugar)Phvn ... �

Page 167: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

132 CAPITULO 5. INTERPRETACAO DE QUESTOES: PROPRIEDADES DE FLECHAGEM

5.6 Flechagem dos modelos com partıculas interrogativas e relativas

Nesta seccao descrevem-se as propriedades de flechagem relativas aos modelos que contem

uma partıcula interrogativa e aos modelos que contem uma partıcula relativa. Adicionalmente,

descrevem-se as propriedades de flechagem dos modelos m-Onde e m-Que, ou seja, modelos

que contem, respectivamente, um onde e um que que nao se conseguiu desambiguar. No caso

das propriedades do flechagem do m-Onde, estas tem um papel desambiguador.

5.6.1 Flechagem dos modelos com partıculas interrogativas

Os modelos etiquetados por Int contem uma partıcula interrogativa, sendo esta ou um pro-

nome interrogativo (etiquetado por pint), ou um adverbio interrogativo (etiquetado por aint),

variando a flechagem dos modelos interrogativos de acordo com o tipo de partıcula que se en-

contra no seu interior. No caso do modelo m-Int conter um pronome interrogativo consideram-

-se duas propriedades de flechagem. A primeira indica que um modelo m-Int pode flechar

sobre o primeiro modelo nominal nuclear etiquetado por Nn que se encontre a sua direita; a

segunda, que a flechagem pode ser feita sobre um modelo nominal nuclear a esquerda.

F24: Inti({pint}/)→Fint Nnk

-{Nnj}

F25: Intj({pint}/)→Fint Nni

Exemplo 65: Modelos m-Int – flechagem sobre modelos m-Nn

Em (1) e em (2), o modelo etiquetado por m-Int flecha sobre o modelo etiquetado por m-Nn.

(1) ... (Quais)Int (os hoteis)Nn...

Page 168: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

5.6. FLECHAGEM DOS MODELOS COM PARTICULAS INTERROGATIVAS E RELATIVAS 133

(2) ... (Os hoteis)Nn (de Lisboa)Prepn (sao)Phvn (quais)Int? �

No caso do modelo m-Int conter um adverbio interrogativo, assume-se que pode flechar sobre

o primeiro modelo verbal a direita. Adicionalmente, caso nao exista nenhum modelo verbal a

direita, pode flechar sobre um modelo verbal a esquerda.

F26: Inti({aint}/)→Fint Vk

-{Vj}

F27: Intj({aint}/)→Fint Vi

-{Vk}

Exemplo 66: Modelos m-Int – flechagem sobre modelos m-V

Nos segmentos de (1) a (4), os modelos etiquetados por Int flecham sobre os respectivos modelos verbais.

(1) ... (Onde)Int (se)m se (situam)Phvn ...

(2) ... (Onde)Int (fica)Copvn ...

(3) ... (Onde)Int (posso encontrar)Vn...

(4) ... (O Ritz)Nn (e)Copvn (onde)Int... �

5.6.2 Flechagem dos modelos com partıculas relativas

Admite-se que a flechagem dos modelos etiquetados por Rel pode ser feita sobre um modelo

nominal anterior, tal como mostra a propriedade de flechagem F28.

F28: Relk →Fint Nni

Page 169: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

134 CAPITULO 5. INTERPRETACAO DE QUESTOES: PROPRIEDADES DE FLECHAGEM

Exemplo 67: Modelos m-Rel – flechagem sobre modelos m-Nn

Em (1), o modelo etiquetado por Rel flecha sobre o modelo etiquetado por Nn.

(1) ... (hoteis)Nn (os quais)Rel... �

Adicionalmente, admite-se que um modelo m-Rel possa flechar sobre um modelo m-Prepn,

como indica F29.

F29: Relk →Fint Prepni

Exemplo 68: Modelos m-Rel – flechagem sobre modelos m-Prepn

Em (1), o modelo etiquetado por Rel pode flechar sobre o modelo etiquetado por Prepn.

(1) ... (em Lisboa)Prepn (que)Rel... �

5.6.3 Flechagem dos modelos contendo um onde

Os modelos que se analisam nesta seccao contem um onde ambıguo, que o Pasmo nao consegue

desambiguar. O alvo de flechagem das propriedades de flechagem que aqui se apresentam

varia, assumindo-se que a flechagem sobre os modelos verbais indica um onde interrogativo,

e que a flechagem sobre um modelo nominal anterior indica uma relativa. O problema esta

em encontrar as condicoes exactas em que se introduz uma relativa ou uma interrogacao, e

garantir assim um trabalho de desambiguacao.

Observou-se o seguinte:

• se o modelo m-Onde e precedido por um modelo interrogativo e por um modelo nominal

nuclear e nao tem um modelo de coordenacao imediatamente antes (o que garante que

Page 170: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

5.6. FLECHAGEM DOS MODELOS COM PARTICULAS INTERROGATIVAS E RELATIVAS 135

nao existe coordenacao com o modelo interrogativo Quando e onde ...), entao introduz uma

relativa.

ex: Quais as lagoas onde e possıvel alugar pranchas de windsurf?

• se o modelo m-Onde e precedido por um modelo verbal com um verbo etiquetado por

um vexistir int ou ha int e por um modelo nominal nuclear entao introduz uma relativa.

ex: Existem campos de golfe onde possa ter licoes de Alemao?

• se nao existe um modelo nominal anterior, o modelo flecha sobre um modelo verbal, que

se pode encontrar quer a esquerda, quer a direita.

ex: Em Lisboa, onde e que se encontra um hotel com piscina?

Note-se que quando o modelo m-Onde e apenas precedido por um modelo nominal nuclear,

nao se consegue garantir que introduza uma relativa, apesar de tal ser quase certo (Tem algum

hotel onde se possa pernoitar?). Os casos problematicos sao construcoes sintacticamente duvido-

sas como Feira da ladra, onde fica? ou Algarve, onde pernoitar?. Se no primeiro caso a palavra onde

teria sido etiquetada pelo Pasmo como onde int (ver capıtulo 4), no segundo caso, a palavra

mantem a etiqueta ambıgua.

Consideram-se entao as seguintes propriedades de flechagem dos modelos m-Onde. A propri-

edade de flechagem F30 respeita a existencia de um modelo m-Int anterior e a nao existencia de

coordenacao na posicao anterior a do modelo m-Onde.

F30: Ondek→Fint Nomj

+{Inti}

-{Coordk−1}

Page 171: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

136 CAPITULO 5. INTERPRETACAO DE QUESTOES: PROPRIEDADES DE FLECHAGEM

Exemplo 69: Modelos m-Onde – flechagem sobre modelos m-Nom

Em (1), o modelo etiquetado por Onde pode flechar sobre o modelo etiquetado por Nn.

(1) ... (Quais)Int (os portos)Nn(onde)Onde ... �

As propriedades de flechagem que se seguem cobrem a flechagem do modelo m-Onde sobre

um modelo verbal.

F31: Ondej →Fint Vl

-{Inti, Phvni({vhaver int}/), Phvni({vexistir int}/), Vk}

F32: Ondel→Fint Vj

-{Inti, Phvni({vhaver int}/), Phvni({vexistir int}/), Vk}

Exemplo 70: Modelos m-Onde – flechagem sobre modelos m-V

Em (1), (2) e (3) os modelos etiquetados por Onde flecham sobre modelos verbais. Em (1) e (2) o modelo

verbal encontra-se a direita e em (3) a esquerda.

(1) ... (No Algarve)Prep (,)Virg (onde)Onde (pernoitar)Phvn...

(2) ... (Em Lisboa)Prepn (onde)Onde (posso apanhar)Vn...

(3) ... (Pode-se pernoitar)Vn (onde)Onde (no Algarve)Prepn ... �

5.6.4 Flechagem dos modelos etiquetados por Que

Os modelos etiquetados por Que contem um que ambıguo e assume-se que podem introduzir

uma relativa. Considera-se que podem flechar sobre o primeiro modelo nominal a esquerda,

tal como mostra a propriedade de flechagem F33.

Page 172: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

5.7. FLECHAGEM DE MODELOS ADVERBIAIS 137

F33: Quek→Fint Nomi

-{Nomj}

Exemplo 71: Modelos m-Que – flechagem a esquerda sobre modelos m-Nn

Em (1) o modelo etiquetado por Que pode flechar sobre o modelo etiquetado por Nn.

(1) ... (os hoteis)Nn (que)Que (ficam)Phvn... �

5.7 Flechagem de modelos adverbiais

Considera-se que um modelo adverbial sem a palavra nao, pode flechar sobre um modelo ver-

bal, tal como indicam as propriedades de flechagem F34 e F35.

F34: Advni(/{nao})→Fint Vj

+{pilha[i,j] = []}

F35: Advnj(/{nao})→Fint Vi

+{pilha[i,j] = []}

Em relacao aos modelos adverbiais que contem um nao (palavra etiquetada por nao), considera-

-se que flecham sobre o primeiro modelo verbal a sua direita, como mostra a propriedade de

flechagem F36.

F36: Advi({nao}/)→Fint Vk

-{Vj}

Exemplo 72: Modelos m-Advn – flechagem sobre modelos V

Quer em (1), quer em (2), os modelos etiquetados por Advn podem flechar sobre os modelos verbais.

Page 173: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

138 CAPITULO 5. INTERPRETACAO DE QUESTOES: PROPRIEDADES DE FLECHAGEM

(1) ... (que)Que (ainda)Advn (ficam)Phvn...

(2) ... (que)Que (nao)Advn (ficam)Phvn... �

5.8 Resumo e Conclusoes

Nesta seccao apresentou-se um conjunto de propriedades de flechagem, construıdo atraves

de observacao do Corpete, tendo-se assumido que no interior dos modelos nucleares todos

os elementos flecham sobre o ultimo elemento. Ao enunciar cada propriedade de flechagem

tentaram-se encontrar condicoes particulares da relacao a estabelecer, de modo a evitar de-

finir propriedades de flechagem demasiado genericas, responsaveis pelo estabelecimento de

relacoes desnecessarias.

Como ja se disse, o 5P nao impoe nenhuma restricao especial sobre as ligacoes a estabelecer

atraves das propriedades de flechagem, pois se estas tem como objectivo unico a obtencao das

representacoes semanticas, entao, por muito atıpicas que sejam, se servirem os seus propositos

sao consideradas bem definidas. No entanto, a maioria das propriedades especifica as relacoes

sintacticas que o analisador de superfıcie deixou indefinidas.

Page 174: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

6GH-?�0�3�S:+�T�"�F�U4�+6�< &��V ���$� ��68�$�)W �I� ( ���?�

�Z�.� [�7-?��*\�)���

O Edite mapeia as questoes em Lıngua Natural em formulas logicas, para posteriormente as

traduzir em SQL e aceder assim a uma base de dados de recursos turısticos. Neste capıtulo,

apresentam-se as regras semanticas usadas na interpretacao de questoes, isto e, apresentam-

-se as regras semanticas que vao construir as formulas logicas a associar a cada questao. Es-

tas regras semanticas ignoram determinantes e quantificadores (tais como as do Edite), bem

como a coordenacao. Nao se assume um compromisso com uma linguagem de representacao

particular, usando-se representacoes provenientes de varias fontes. Adicionalmente, fazem-se

convergir algumas parafrases.

O capıtulo organiza-se como se segue: na seccao 6.1 explicam-se as heurısticas usadas para

determinar o foco das questoes; entre as seccoes 6.2 e 6.10 apresentam-se regras relativas a

traducao de elementos de categorias gramaticais especıficas. Termina-se o capıtulo na seccao

6.11 com um resumo e conclusoes.

6.1 Determinacao do foco das questoes

Entenda-se por foco da questao o verbo principal de uma interrogativa de eco (Pode-se comer

bacalhau com natas no Atrium?). Nesta seccao explicam-se como as regras semanticas podem ser

usadas para determinar o foco de uma questao. Adicionalmente – e dado que esta informacao

Page 175: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

140 CAPITULO 6. INTERPRETACAO DE QUESTOES: REGRAS SEMANTICAS

pode fazer parte das regras semanticas que constroem as representacoes semanticas e que se

descrevem nas seccoes seguintes – esta seccao permite ilustrar como as regras semanticas po-

dem ser usadas para enriquecer o grafo, marcando os nos do grafo contendo verbos e indicando

se estes sao, ou nao, o foco da questao. Deve-se notar que ao fazer esta separacao, se simpli-

ficam as regras da etapa seguinte, que nao tem de analisar as condicoes sintacticas dos verbos

que indicam se estes sao ou nao o foco da questao.

Sem entrar em detalhes com a apresentacao das regras semanticas exactas, considera-se que

um verbo nao e o foco da questao nas seguintes condicoes:

• os verbos recebem flechas de nomes que, por sua vez, recebem flechas de pronomes in-

terrogativos (Que hoteis tem piscina?);

• os verbos recebem flechas de um adverbio interrogativo (Onde posso comer caracois?);

• os verbos flecham sobre uma palavra etiquetada por uma categoria subsumida por rel

(Quais os hoteis que tem piscina?).

Nestes tres casos o no do grafo passa a ter a marca not focus; as restantes situacoes sao

marcadas por indf (indefinido).

6.2 Nomes

Nesta seccao apresentam-se as regras semanticas relativas aos nomes.

Page 176: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

6.2. NOMES 141

6.2.1 Nomes comuns

6.2.1.1 Representacao

Considere-se o nc1 s praia. Independentemente de o nc1 s flechar sobre si proprio – Qual a

praia ... – ou de flechar sobre um verbo – A praia das Macas tem ... – uma representacao possıvel

e dada pela formula primitiva praia(x), em que a variavel representa uma entidade, sendo

a formula verdadeira para cada entidade que tiver a propriedade de ser uma praia. E esta a

representacao que se vai usar.

6.2.1.2 Regras para os nomes comuns

Dado que o que se quer obter como representacao associada a um nc (e tambem para os nadj)

nao varia com o contexto onde este ocorre, vai-se usar apenas uma regra para este tipo de

nomes, em que o contexto da regra e vazio. Ou seja, esta regra pode ser aplicada sempre que

surgir um nc ou nadj (denotado por nc ∨ nadj), qualquer que seja o contexto de flechagem em

que o nc ou o nadj se encontrem.

[R1] elem( , nc ∨ nadj, X1)

: ∅

# sem(X1)(var(X1))

Exemplo 73: Regra semantica para os nomes comuns

Dado o nc1 s hotel e supondo que a funcao sem aplicada a palavra hotel devolve o predicado hotel, a

regra R1 traduz hotel em hotel(x). �

Page 177: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

142 CAPITULO 6. INTERPRETACAO DE QUESTOES: REGRAS SEMANTICAS

6.2.2 Nomes proprios

6.2.2.1 Representacao

Considere-se o npr Ritz. A representacao usada e a sugerida em [Jurafsky e Martin, 2000] em

que se introduz o predicado NAME. Ou seja, o npr Ritz origina a formula NAME(x, Ritz), em

que x representa uma entidade cujo nome e Ritz.

A construcao desta formula depende do alvo da flechagem do npr. Se o npr flechar sobre um

verbo, e porque se encontra num contexto como o do npr Ritz em O Ritz tem piscina?; se flechar

sobre um nome comum (ou nadj), o contexto sera por exemplo o de O hotel Ritz tem piscina? No

primeiro caso o npr e o unico elemento que identifica a entidade em causa, pelo que a variavel

que representa essa entidade e a variavel do npr. Ou seja, o npr Ritz em O Ritz tem piscina? vai

originar NAME(x, Ritz).

No segundo caso, ou seja, no caso do npr flechar sobre um nc (ou nadj), a entidade deno-

minada pelo npr e identificada pela variavel associada ao nc (ou nadj). Ou seja O hotel Ritz

origina hotel(x), NAME(x, Ritz). Neste caso ha ainda que garantir que nao existe uma

preposicao (prep) a flechar sobre o npr, pois nas situacoes em que o npr flecha sobre o nc (ou

nadj) e recebe a flecha de uma prep – A piscina do Ritz – nao se quer obter piscina(x),

NAME(x, Ritz).

6.2.2.2 Regras para os nomes proprios

As regras que se seguem cobrem os casos discutidos anteriormente. A situacao em que o npr

flecha sobre um verbo e coberta por uma regra mais generica, que e disparada sempre que

Page 178: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

6.2. NOMES 143

se encontre um npr, nao se exigindo nenhuma relacao de flechagem particular no contexto de

flechagem (que sera vazio).1 Note-se que nesta regra o predicado NAME e introduzido directa-

mente na formula.

[R2] elem( , npr, X1)

: ∅

# NAME(var(X1), sem(X1))

Exemplo 74: Regra generica para os nomes proprios

Supondo que a funcao sem aplicada a palavra Ritz devolve a constante Ritz, com a regra R2, o npr de O

Ritz tem piscina? e O hotel do Ritz tem piscina? produz as formulas NAME(x, Ritz) e NAME(y, Ritz),

em que x e y sao variaveis associadas a Ritz. Repare-se que se nenhuma regra bloquear esta regra, esta

e igualmente disparada em situacoes como O hotel Ritz ..., dando origem a NAME(z, Ritz), em que z

e a variavel associada a Ritz (e nao a hotel como desejado). �

A regra que se segue e aplicada num contexto mais especıfico (sendo por isso subsumida pela

anterior), cobrindo a segunda situacao, sendo disparada quando um npr flecha sobre um nc

ou sobre um nadj e nao recebe uma flecha de uma preposicao a sua esquerda (ou seja, nao ha

nenhuma flecha de uma preposicao sobre o npr da esquerda para a direita (R)). Como e mais

especıfica que a anterior, quando estiverem reunidas condicoes para a disparar, e esta regra que

e usada em detrimento da anterior, mais generica.

[R3] elem( , npr, X1)

: flecha( , npr, X1, , nc ∨ nadj, X2, ), not flecha( , prep, X3, , npr, X1, R)

# NAME(var(X2), sem(X1))

1Repare-se que esta regra e igualmente disparada sempre que uma preposicao flecha sobre um nome proprio.

Page 179: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

144 CAPITULO 6. INTERPRETACAO DE QUESTOES: REGRAS SEMANTICAS

Exemplo 75: Regra especıfica para os nomes proprios

O npr de O hotel Ritz tem piscina?, e dado que o npr Ritz flecha sobre o nc hotel (e nao recebe nenhuma

flecha de preposicoes), produz agora NAME(x, Ritz), em que x e a variavel associada a hotel. �

6.3 Adjectivos

Nesta seccao estao em foco os adjectivos. Comeca-se por uma breve analise das classes logicas

dos adjectivos (seccao 6.3.1), ao que se segue uma explicacao sobre a representacao adoptada

para os adjectivos predicativos, bem como a apresentacao das regras semanticas associadas

(seccao 6.3.2).

6.3.1 Classes logicas dos adjectivos

Tal como e dito em [EAGLES, 1998] os adjectivos, mais do que as outras categorias, sao capa-

zes de fazer variar o seu significado em funcao do contexto em que ocorrem. De tal modo

que e questionavel se se conseguira alguma vez enumerar todos os seus possıveis valores

semanticos. Sem querer entrar em grandes detalhes propoe-se uma particao logica que se

adapta a classificacao sintactica disponıvel.

De acordo com [Peters e Peters, 2000], a divisao dos adjectivos feita em

[Chierchia e McConnell-Ginet, 2000] – e que faz igualmente parte das recomendacoes do

EAGLES para a organizacao semantica dos adjectivos – agrupa-os em: (i) adjectivos intersecti-

vos; (ii) adjectivos subsectivos; (ii) adjectivos nao predicativos.

Def 31: Adjectivos intersectivos

Page 180: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

6.3. ADJECTIVOS 145

Os adjectivos intersectivos sao aqueles adjectivos em que o conjunto de objectos denotado pelo

composto nome-adjectivo e a interseccao entre o conjunto de objectos denotados pelo adjectivo

e o conjunto de objectos denotados pelo nome. N

Exemplo 76: Adjectivos intersectivos

Considere-se o adjectivo italiano. O juiz italiano pode ser interpretado como a interseccao dos objectos

que sao juızes com os que sao italianos. �

Def 32: Adjectivos subsectivos

Os adjectivos subsectivos nao denotam conjuntos de objectos que possam ser identificados

independentemente do nome que qualificam. N

Exemplo 77: Adjectivos subsectivos

Este e o caso do pequeno elefante. Numa situacao como esta nao tem sentido partir em busca do conjunto

de objectos pequenos (onde a partida nao estaria um elefante), dado que este conceito depende do nome

a que esta associado. �

Ao conjunto dos adjectivos intersectivos e subsectivos chama-se adjectivos predicativos.2

Def 33: Adjectivos nao predicativos

Os adjectivos nao predicativos definem-se pelo facto de nao seleccionarem um subconjunto de

objectos denotados pelo nome que modificam. N

Exemplo 78: Adjectivos nao predicativos

E o que se passa com o adjectivo falso. Repare-se que falso diamante nao identifica um objecto que e um

diamante. �

2De acordo com [Peters e Peters, 2000], os adjectivos intersectivos sao apenas menos dependentes de contextoque os subsectivos.

Page 181: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

146 CAPITULO 6. INTERPRETACAO DE QUESTOES: REGRAS SEMANTICAS

Pondo de lado os adjectivos nao predicativos, estranhamente (ou nao) a particao sintactica dos

adjectivos que se tem estado a usar, baseada unicamente na sua distribuicao sintactica, parece

emparelhar bem com estas duas classes. Senao repare-se no seguinte: os adj1, adjectivos que

tanto podem aparecer a esquerda como a direita de um nome (pequeno, grande), sao, de um

modo geral, adjectivos subsectivos. Os adj3 e os nadj (portugues e amigo) cobrem os adjectivos

intersectivos.

6.3.2 Adjectivos predicativos

6.3.2.1 Representacao

Uma representacao possıvel dos adjectivos e feita atraves de um predicado sobre a entidade

modificada. Ou seja, por exemplo, O bonito museu pode ser representado atraves da formula

bonito(x), museu(x).

Mas, se esta representacao parece servir os adjectivos intersectivos, nao serve os adjectivos sub-

sectivos. Tal como e explicado em [de Swart, 1998], se se mapear elefante pequeno, na formula

elefante(x), pequeno(x), esta-se a perder a ligacao entre o nome e o adjectivo no sen-

tido em que pequeno(x) e dependente do nome que qualifica: o conceito de pequenez e

diferente em elefante pequeno ou piolho pequeno. Desde modo, [Jurafsky e Martin, 2000] intro-

duz o predicado AM para ligar os dois conceitos, sugerindo a representacao elefante(x),

AM(x, pequeno) e chamando a atencao para esta representacao nao ser ainda satisfatoria

para os adjectivos nao predicativos. Pode-se pensar entao em usar o predicado auxiliar

AM quer para os adjectivos intersectivos, quer para os subsectivos, tal como sugerido em

[Jurafsky e Martin, 2000]. So que esta representacao ainda tem um problema: o que fazer se

Page 182: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

6.3. ADJECTIVOS 147

se quiser representar modificacao sobre os adjectivos – por exemplo muito pequeno elefante?

Uma solucao consiste em introduzir uma variavel sobre o adjectivo, permitindo a sua

modificacao. Assim, o muito pequeno elefante originaria a seguinte formula: elefante(x),

AM(x, y), pequeno(y), ADVM(y, z), muito(z), em que ADVM e um predicado que

indica modificacao adverbial.

E sera que se pode avancar para o passo seguinte de escrita de regras, supondo que a

contribuicao de um adjectivo para uma formula e dada por um predicado representando o in-

divıduo e pelo predicado AM explicitando a modificacao? A verdade e que se esta representacao

serve os adj1 (subsectivos), o predicado AM apenas complica no caso dos adj3.

Suponha-se a sequencia o portugues conquistador. Esta sequencia deve ter a mesma

representacao de conquistador portugues e a formula resultante deveria ser apenas:

(1) portugues(x), conquistador(x).

Se se usa o predicado AM, portugues conquistador e conquistador portugues tem, respectivamente,

a seguinte representacao:

(2) portugues(x), AM(x, y), conquistador(y)

(3) conquistador(x), AM(x, y), portugues(y).

Mas, mesmo a formula (1) ainda nao e completamente satisfatoria, pois esta promiscuidade no

uso das variaveis leva a que o (muito conquistador) portugues e o (muito portugues) conquistador

tenham a mesma representacao:

(4) ADVM(x, z), muito(z), portugues(x), conquistador(x).

Page 183: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

148 CAPITULO 6. INTERPRETACAO DE QUESTOES: REGRAS SEMANTICAS

Uma representacao semelhante a esta e sugerida no forum de avaliacao Senseval

[ACL-SIGLEX, 2004], na tarefa denominada Logical Form, que tem por objectivo a associacao

de formulas logicas a um texto. No Senseval, a modificacao do adjectivo sobre o pronome e a

do adverbio sobre o adjectivo em situacoes como Sunshine makes me very happy sao representa-

das por:

me(x2) very:r (x2), happy:a (x2).

Nesta dissertacao decidiu-se atribuir uma variavel diferente a ambos os adjectivos, usando

a igualdade para indicar que se referem a mesma entidade (e supondo que se mantem a

modificacao adverbial apenas sobre o elemento modificado). Ou seja, o (muito conquistador)

portugues e representado por

(5) ADVM(y, z), muito(z), conquistador(y), portugues(x), x = y

e o (muito portugues) conquistador por

(6) ADVM(y, z), muito(z), portugues(y), conquistador(x), x = y.

Estas representacoes podem ser mapeadas nas representacoes mais usuais, respectivamente:

(5’) portugues(x), muito(conquistador(x))

(6’) conquistador(x), muito(portugues(x)).

Page 184: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

6.3. ADJECTIVOS 149

6.3.2.2 Regras

Supoe-se que por omissao, a presenca de um adjectivo resulta numa formula unaria. A regra

R4 traduz quente em quente(x).

[R4] elem( , adj, X1)

: ∅

# sem(X1)(var(X1))

Esta regra serve para cobrir, entre outros, os casos em que o adj recebe a flecha de uma

preposicao e quando o adjectivo flecha sobre um verbo copulativo.

Exemplo 79: Adjectivos: regra por omissao

Esta regra transforma o adjectivo de praia para nudistas, em nudistas(x); e o adjectivo de A agua do

Algarve e quentinha em quentinha(x). �

A regra R5 e responsavel por transformar adjectivos (adj) (que nao recebem flechas de

preposicoes) e que flecham sobre nomes comuns ou adjectivos do tipo 3 (denotados por n ∨

adj3). Como muitos adjectivos aparecem etiquetados como ppas – como protegidas em Que

especies protegidas existem ... e a flechar sobre um nome, estende-se a regra a estas situacoes (e

daı a etiqueta adj ∨ ppas).

[R5] elem( , adj ∨ ppas, X1)

: flecha( , adj ∨ ppas, X1, , n ∨ adj3, X2, ), not flecha( , prep, X3, , adj ∨ ppas, X1, R)

# AM(var(X2), var(X1)), sem(X1)(var(X1))

Exemplo 80: Regra para os adjectivos subsectivos

Page 185: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

150 CAPITULO 6. INTERPRETACAO DE QUESTOES: REGRAS SEMANTICAS

Esta regra R5 traduz o adj1 de hotel bonito, em que bonito flecha sobre hotel, em AM(x, y), bonito(y),

sendo x a variavel associada a hotel. �

A regra que se segue trata dos adjectivos intersectivos (adj3) quando este flecham sobre um

outro adj3 (mais uma vez esta regra aplica-se quando os adjectivos nao recebem flechas de

preposicoes).3 Note-se que a regra que se segue e subsumida pela anterior.

[R6] elem( , adj3, X1)

: flecha( , adj3, X1, , adj3, X2, ), not flecha( , prep, X3, , adj3, X1, R)

# sem(X1)(var(X1)), var(X1) = var(X2)

Exemplo 81: Regras para os adjectivos intersectivos

Estas regras mapeiam os adj3 de o conquistador portugues em conquistador(x), x = y,

portugues(y). �

Note-se que ao nao impor restricoes a ordem de flechagem, a representacao e a mesma para

conquistador portugues ou portugues conquistador. No entanto, como e sabido, ha adjectivos que

nao tem o mesmo comportamento em posicao pre-nominal e em posicao pos-nominal – pobre

mulher e mulher pobre. Se fosse possıvel identificar esses adjectivos, bem como os nomes que

fazem divergir o seu significado – velho hotel e hotel velho tem o mesmo significado, ao contrario

de velho amigo e amigo velho – podiam-se acrescentar regras que os contemplassem (mais es-

pecıficas, pelo facto de imporem restricoes a orientacao da flechagem) e em que se fosse buscar

outro significado da palavra. Nesta dissertacao nao se dedica mais tempo a este assunto – que

na verdade podia ser uma tarefa complicada, dadas as variacoes a que os adjectivos estao su-

jeitos – e assume-se que o significado e o mesmo, quer a flechagem seja feita sobre a esquerda,

3As regras dos nadj estao definidas com as dos nomes.

Page 186: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

6.4. PREPOSICOES 151

quer sobre a direita.

6.4 Preposicoes

Esta seccao e dedicada as preposicoes. Na seccao 6.4.1 discute-se a representacao e na seccao

6.4.2 as regras semanticas.

6.4.1 Representacao

Considera-se que uma preposicao origina – como e usual – uma formula com dois argumentos

em que o primeiro representa o elemento ao qual esta associado o modelo preposicional nu-

clear4 e o segundo o nucleo do modelo preposicional nuclear. Ou seja, deseja-se obter para ca-

sos como o hotel de Lisboa uma formula como hotel(x), em(x, z), NAME(z, Lisboa).

6.4.2 Regras

A regra R7 e dispara quando a preposicao flecha sobre um nome ou um adjectivo (denotados

por n ∨ adj), e este sobre outro nome ou adjectivo:

[R7] elem( , prep, X1)

: flecha( , prep, X2, , n ∨ adj, X2, R), flecha( , n ∨ adj, X2, , n ∨ adj, X3, )

# sem(X1)(var(X3), var(X2))

Exemplo 82: Preposicoes: nome sobre nome

4O elemento ao qual esta associado o modelo preposicional nuclear pode ser um evento (Posso nadar na Lagoa deAlbufeira?) ou uma entidade (Indique-me um hotel em Lisboa).

Page 187: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

152 CAPITULO 6. INTERPRETACAO DE QUESTOES: REGRAS SEMANTICAS

A preposicao de hotel de Lisboa, como flecha sobre o npr Lisboa, que, por sua vez, flecha sobre o nc hotel,

origina a formula de(x, y), em que x e a variavel associada a hotel e y a Lisboa. �

Segue-se o caso da flechagem sobre um nome (ou adjectivo), que flecha sobre um verbo.

[R8] elem( , prep, X1)

: flecha( , prep, X1, , n ∨ adj, X2, R), flecha( , n ∨ adj, X2, , vc3 ∨ vinf, X3, )

# sem(X1)(var(X3), var(X2))

Exemplo 83: Preposicoes: flechagem de n ∨ adj sobre vc3 ∨ vinf

A preposicao de vou para Lisboa, em que a preposicao para flecha sobre Lisboa, que por sua vez flecha

sobre vai, origina a formula para(x, y) em que x e a variavel associada ao verbo e y a Lisboa. �

A ultima regra para as preposicoes e aplicada quando a preposicao flecha sobre um verbo no

infinitivo que, por sua vez flecha sobre um nome (prancha de winsurfar):

[R9] elem( , prep, X1)

: flecha( , prep, X1, , vinf, X2, R), flecha( , vinf, X2, , n ∨ adj3, X3, )

# sem(X1)(var(X3), var(X2))

Exemplo 84: Preposicoes: verbo infinitivo

Esta regra transforma a preposicao de touca para nadar, e dado que esta flecha sobre nadar, que por sua

vez flecha sobre touca, em para(x, y), em que x e a variavel associada a touca e y a nadar. �

Page 188: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

6.5. PRONOMES INTERROGATIVOS 153

6.5 Pronomes interrogativos

Nesta seccao descrevem-se as regras semanticas associadas aos pronomes interrogativos

(seccao 6.5.2, depois de discutida a representacao, na seccao 6.5.1).

6.5.1 Representacao

Para representar os pronomes interrogativos, exceptuando o quanto(s), vai-se usar ?x, em que x

e uma variavel associada a uma entidade. Assim, quer a pergunta seja Quem..., Qual..., Quais...

ou Que..., a representacao e ?x, em que x e o objecto sobre o qual e feita a pergunta. No caso

do quanto(s), a representacao sera dada por ?#x.

6.5.2 Regras

A regra R10 traduz um elemento cuja categoria seja subsumida por qu (isto e, elementos eti-

quetados por que int, qual int, quais int e quem), e que fleche a direita sobre um n ∨ adj, em ?x,

sendo x a variavel associada ao alvo de flechagem.

[R10] elem( , qu, X1)

: flecha( , qu, X1, , n ∨ adj, X2, R)

# ?var(X2)

Exemplo 85: Pronomes Interrogativos: qu

O pronome interrogativo de Que hoteis..., e dado que o que int Que flecha sobre o nc1 p hoteis, e trans-

formado em ?x, em que x e a variavel associada a hoteis. �

Page 189: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

154 CAPITULO 6. INTERPRETACAO DE QUESTOES: REGRAS SEMANTICAS

A regra R11 traduz os elementos cuja categoria e subsumida por quanto, que flecham igual-

mente sobre um n ∨ adj (a direita).

[R11] elem( , quanto, X1)

: flecha( , quanto, X1, , n ∨ adj, X2, R)

# ?#var(X2)

Exemplo 86: Pronomes Interrogativos: quanto

O pronome interrogativo de Quantos hoteis... e transformado em ?#x, em que x e a variavel associada a

hoteis. �

6.6 Adverbios interrogativos

6.6.1 Representacao

A representacao dos adverbios interrogativos utiliza o valor devolvido pela funcao sem, apli-

cada aos adverbios. Assim, supondo que o valor devolvido pela funcao sem, quando aplicada

a palavra onde, e onde, o adverbio de Onde se pode nadar, sera representado por ?onde(e), em

que e e a variavel associada a nadar.

Em algumas situacoes seria interessante desprezar o verbo sobre o qual flecha o adverbio in-

terrogativo, pois ha um conjunto de verbos que nao contribuem para a semantica da frase e

apenas complicam a sua representacao. Como exemplo, tome-se Onde fica o hotel Ritz?. Nestes

casos uma representacao possıvel seria dada pela formula ?onde(x), hotel(x), NAME(x,

Ritz). No entanto, ao “deitar fora” a contribuicao do fica, cria-se um problema: e se a questao

Page 190: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

6.6. ADVERBIOS INTERROGATIVOS 155

fosse Onde fica agora o hotel Ritz?, o agora iria estar associado ao fica. Estas situacoes em que se

deseja eliminar a contribuicao de um elemento para a representacao final tem de ser cuidado-

samente pensada (este assunto e de novo abordado na seccao 6.9.2, voltando a ser a discutido

na seccao 9.5.2). Neste caso concreto decidiu-se deitar fora a contribuicao do verbo, mas apenas

se nenhum adverbio (nao interrogativo) flechar sobre ele.

6.6.2 Regras

A regra para os adverbios que flecham sobre um vc3 ∨ vinf e dada por:

[R12] elem( , adv int, X1)

: flecha( , adv int, X1, , vc3 ∨ vinf, X2, )

# ?sem(X1)(var(X2))

Exemplo 87: Adverbios: flechagem sobre vc3 ∨ vinf

Em Onde e que se pode comer bacalhau com natas em Arraiolos?, o adverbio interrogativo Onde origina a

formula ?onde(e), em que e e o evento associado a comer. �

A regra que se segue serve o caso em que os adv int flecham sobre um verbo dito especial (por

agora os verbos etiquetados por vser, vexistir, vhaver, vexistir int, vhaver int e vcopc, e deno-

tados por v especiais). Nesta situacao estabelece-se uma relacao imediata entre o adverbio

que flecha sobre o verbo e o n ∨ adj3 ∨ ppas (sobre o qual nao flecha nenhuma preposicao)

que flecha sobre o mesmo verbo. Isto apenas no caso de nenhum adverbio flechar sobre estes

elementos.

[R13] elem( , adv int, X1)

Page 191: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

156 CAPITULO 6. INTERPRETACAO DE QUESTOES: REGRAS SEMANTICAS

: flecha( , adv int, X1, , v especiais, X2, ), flecha( , n ∨ adj3 ∨ ppas, X3, , v especiais, X2, ),

not flecha( , prep, X4, , n ∨ adj3 ∨ ppas, X3, R), not flecha( , adv, X5, , v especiais, X2, )

# ?sem(X1)(var(X3))

Exemplo 88: Adverbios: flechagem sobre v especiais

Em Onde e Arraiolos?, o adverbio interrogativo Onde origina a formula ?onde(x), em que x e a variavel

associada a Arraiolos. �

Esta regra cobre o caso em que o adverbio flecha sobre um verbo dito especial, e este e o alvo

da flecha de um adverbio. A nova variavel permite modificacao adverbial.

[R14] elem( , adv int, X1)

: flecha( , adv int, X1, , v especiais, X2, ), flecha( , n ∨ adj3 ∨ ppas, X3, , v especiais, X2, ),

not flecha( , prep, X4, , n ∨ adj3 ∨ ppas, X3, R), flecha( , adv, X5, , v especiais, X2, )

# ?sem(X1)(var(X2),var(X3))

Exemplo 89: Adverbios: flechagem sobre v especiais com adv

Em Onde e agora Arraiolos?, o adverbio interrogativo Onde origina a formula ?onde(e, x), em que e e

a variavel associada ao verbo ser e x e a variavel associada a Arraiolos. Esta representacao permite que a

pergunta seja interpretada de acordo com o adverbio agora. �

6.7 Outros adverbios

Esta seccao segue a linha das anteriores: discute-se a representacao dos adverbios em 6.7.1 e

apresentam-se as regras semanticas em 6.7.2.

Page 192: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

6.7. OUTROS ADVERBIOS 157

6.7.1 Representacao

Para os restantes adverbios vai-se considerar uma representacao relacionada com a associada

ao adjectivos. Ou seja, o adverbio de O Porto ja tem metro?, sera representado por MADV(e,

y), ja(y) em que e e o evento associado ao verbo ter. Uma representacao semelhante sera

obtida se a flechagem for feita sobre um adjectivo.

6.7.2 Regras

A regra R15 cobre o caso em que os adverbios flecham sobre um verbo qualquer v.

[R15] elem( , adv, X1)

: flecha( , adv, X1, , v, X2, )

# MADV(var(X2), var(X1)), sem(X1)(var(X1))

Exemplo 90: Adverbios sobre verbos

O adverbio ainda de Ainda se pode andar no 28?, origina a formula MADV(e, x), ainda(x), em que e

e a variavel associada a andar. �

A regras R16 aplica-se quando os adv flecham sobre um adjectivo qualquer adj.

[R16] elem( , adv, X1)

: flecha( , adv, X1, , adj, X2, )

# MADV(var(X2), var(X1)), sem(X1)(var(X1))

Exemplo 91: Adverbios sobre adjectivos

O adverbio muito em muito grande, e dado que muito flecha sobre grande, origina a formula MADV(x,

Page 193: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

158 CAPITULO 6. INTERPRETACAO DE QUESTOES: REGRAS SEMANTICAS

y), muito(y), em que x e a variavel associada ao adjectivo. �

6.8 Cardinais

A seccao dedicada aos cardinais organiza-se como se segue: na seccao 6.8.1 discute-se a

representacao; na seccao 6.8.2 as regras semanticas.

6.8.1 Representacao

Consideram-se apenas casos como Indique-me 5 hoteis com piscina, em que o cardinal flecha

sobre um n ∨ adj3. Nesta situacao, a representacao associada ao cardinal acrescenta a ?x,

hoteis(x), obtido atraves de regras anteriores, n(x) = 5.

6.8.2 Regras

Segue-se entao a regra para os cardinais, quando estes flecham sobre um nome ou adj3:

[R17] elem( , card p, X1)

: flecha( , card p, X1, , n ∨ adj3, X2, )

# n(var(X2)) = sem(X1)

Exemplo 92: Cardinais

O cardinal de Indique-me campos de golfe com 18 buracos, e supondo que 18 flecha sobre buracos, origina a

formula n(x) = 18, em que x e a variavel associada a buracos. �

Page 194: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

6.9. VERBOS 159

Apesar de incompleto, da-se por concluıdo o tratamento dado aos cardinais nesta dissertacao.

Note-se que, ficam de fora casos com mais de 18 buracos e com menos de 18 buracos, que por agora

ficam com a mesma representacao de com 18 buracos.

6.9 Verbos

Nesta seccao apresentam-se as regras semanticas para os verbos que foram divididos em varias

famılias. Assim a seccao 6.9.1 trata os verbos etiquetados por vc3 e os verbos no infinitivo; a

seccao 6.9.2 e dedicada aos verbos copulativos e a seccao 6.9.3 aos verbos existir e haver. A

seccao 6.9.4 trata os verbos etiquetados por vc12.

6.9.1 Famılia vc3 ∨ vinf

6.9.1.1 Representacao

Dada a classificacao dos verbos usada, nao se pode esperar uma representacao muito sofisti-

cada. Por exemplo, se a etiqueta dos verbos nao guarda informacao sobre o tempo, nao se pode

esperar que na representacao se encontre informacao relativa ao tempo do verbo.

Optou-se por uma representacao semelhante a discutida em [Jurafsky e Martin, 2000], no sen-

tido em que, em vez de se preencherem os argumentos da formula associada ao verbo com os

objectos que com ele estao relacionados, o predicado associado ao verbo e unario, contendo

apenas a variavel associada ao evento. As relacoes entre o verbo e os objectos que lhe estao

associados sao definidas em formulas primitivas cujo predicado identifica a relacao existente

Page 195: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

160 CAPITULO 6. INTERPRETACAO DE QUESTOES: REGRAS SEMANTICAS

entre o verbo e o argumento.

Exemplo 93: Representacao dos vc3 ∨ vinf

A questao Que hotel tem piscina?, em vez de ser representada pelas formulas

?x, hotel(x), tem(x, y), piscina(y)

ou

?x, hotel(x), tem(e, x, y), piscina(y)

e representada atraves da formula:

?x, hotel(x), tem(e), arg1(e) = x, arg2(e) = y, piscina(y). �

6.9.1.2 Regras

A regra seguinte cobre os vc3 ∨ vinf.

[R18] elem( , vc3 ∨ vinf, X1, )

: ∅

# {sem(X1)(var(X1))}

Exemplo 94: Famılia vc3 ∨ vinf

O verbo de O Ritz tem piscina? e transformado em tem(e). �

Se o vc3 ∨ vinf for o foco da questao, entao, pelo pre-processamento da seccao 6.1, o elemento

do grafo que lhe esta associado foi marcado com a etiqueta indf. A regra que se segue marca

um evento como sendo o foco da questao.

Page 196: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

6.9. VERBOS 161

[R19] elem( , vc3 ∨ vinf, X1, indf)

: {flecha( , vc3 ∨ vinf, X1, , vc3 ∨ vinf, X2, )}

# {?var(X1)}

Exemplo 95: Famılia vc3 ∨ vinf – foco

O verbo de O Ritz tem piscina? origina ainda a formula ?e, em que e e a variavel associada a tem. �

Alternativamente a definir num so passo as regras que estabelecem as relacoes do verbo com

os objectos que flecham sobre ele, e por isso, ter de definir regras para verbos transitivos e

intransitivos, optou-se por definir regras para a flechagem a esquerda e regras para a flechagem

a direita desses objectos sobre o verbo. As regras que se seguem tem o conjunto de elementos

a transformar vazio, sendo, por isso, regras estruturais.

[R20] ∅

: {flecha( , n ∨ adj3, X1, , vc3 ∨ vinf, X2, R), not flecha( , prep, X3, , n ∨ adj3, X1, )}

# {arg1(var(X2)) = var(X1)}

[R21] ∅

: {flecha( , n ∨ adj3, X1, , vc3 ∨ vinf, X2, L), not flecha( , prep, X3, , n ∨ adj3, X1, )}

# {arg2(var(X2)) = var(X1)}

Exemplo 96: Regras estruturais para vc3 ∨ vinf

A regra R20 constroi a partir das condicoes sintacticas de O hotel tem piscina?, a formula arg1(e) = x,

em que x e a variavel associada a hotel e e ao evento ter.

Esta regra R21, por sua vez, constroi a partir de O hotel tem piscina? a formula arg2(e) = y, em que y

e a variavel associada a piscina. �

Page 197: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

162 CAPITULO 6. INTERPRETACAO DE QUESTOES: REGRAS SEMANTICAS

6.9.2 Famılia vcopc ∨ vser

6.9.2.1 Representacao

Os verbos copulativos, em algumas situacoes, nao acrescentam nada a questao, complicando

apenas a sua representacao se forem tidos em conta.

Exemplo 97: Verbos copulativos e adverbios interrogativos

Considerem-se as questoes:

Onde fica a Expo98?

Onde e a Expo98?

Estas questoes podem ser representadas por:

?onde(x), NAME(x, Expo98)

em que os verbos sao omitidos. �

Esta representacao nao foi plenamente adoptada, pois no caso de existir um outro adverbio que

fleche sobre o verbo, a variavel do verbo foi eliminada.

Exemplo 98: Verbos copulativos e adverbios

A questao:

Onde fica a Expo98 agora?

traz problemas a representacao anterior, dado nao haver nenhuma variavel de evento ao qual se ligar o

adverbio agora. �

Page 198: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

6.9. VERBOS 163

Na seccao 6.6, optou-se por representar o adverbio interrogativo por onde(e, x) caso exista um

adverbio a flechar sobre o verbo.

Tendo em mente esta decisao, o vcopc ∨ vser nao vai interferir na representacao final nestes

contextos, tendo as regras semanticas que ter em conta esta situacao. Adicionalmente, nos

casos em que o vcopc ∨ vser recebe a flecha de um objecto a direita assume-se que este tem a

funcao de predicativo do sujeito, indicado pela etiqueta arg3.

6.9.2.2 Regras

A regra R22 marca como arg1 e arg3 os objectos que flecham sobre um vcopc ∨ vser desde que

sobre este nao fleche um adv int. Note-se que, ao contrario do que se fez na seccao 6.9.1, uma

unica regra constroi a formula completa associada ao verbo.

[R22] elem( , vcopc ∨ vser, X1)

: flecha( , vcopc ∨ vser, X1, , vcopc ∨ vser, X1, ), flecha( , n ∨ adj3, X2, , vcopc ∨ vser, X1, ),

flecha( , adj, X3, , vcopc ∨ vser, X1, ), not flecha( , adv int, X4, , vcopc ∨ vser, X1, )}

# {sem(X1)(var(X1)), arg1(var(X1)) = var(X2)

arg3(var(X1)) = var(X3)}

A regra que se segue marca o vcopc ∨ vser como foco da questao. Note-se que nao e necessario

impor que nenhum adverbio interrogativo fleche sobre ele, pois se flechasse o elemento associ-

ado nao estaria marcado como indf.

[R23] elem( , vcopc ∨ vser, X1, indf)

: ∅

Page 199: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

164 CAPITULO 6. INTERPRETACAO DE QUESTOES: REGRAS SEMANTICAS

# {?var(X1)}

Exemplo 99: Famılia vcopc ∨ vser

A regra R22 permite gerar e(e), arg1(e) = x, arg2(e) = y a partir do verbo copulativo de O

Ritz e limpo?, supondo que x e a variavel associada a Ritz e y a limpo. Com a regra R23, o verbo de O Ritz

e giro? origina ?e. �

6.9.3 Famılia vexistir e vhaver

6.9.3.1 Representacao

Em relacao aos verbos existir e haver, consideram-se as seguintes situacoes:

• sao o foco da questao (ex: Ha hoteis..., Em Lisboa, existem parques de campismo?), dando

origem a interrogativas totais (ou de sim/nao) [Mateus et al., 2003];

• tem o valor ter quando:

– recebem a flecha de um n ∨ adj, que, por sua vez, recebe uma flecha de um

em que int (ex: Em que hoteis ha piscina?);

– recebem a flecha de um n ∨ adj3, e flecham sobre um ond rel, que flecha sobre um n

∨ adj (ex: Indique-me hoteis onde ha piscina?)

• flecham sobre um qu rel (ex: Quais os parque naturais que existem?);

• recebem a flecha de um adv int (ex: Onde ha hoteis em Lisboa?)

Estes verbos vao ser ignorados nos dois ultimos contextos, escolhendo-se as seguintes

representacoes para os restantes (respectivamente):

Page 200: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

6.9. VERBOS 165

• ?existe(e, x) em que e e a variavel associada ao verbo (e vai garantir qualquer

combinacao com um potencial adverbio) e x a variavel associada a hoteis (ou parques de

campismo);

• ter(e), arg1(e) = x, arg2(e) = y, em que e e a variavel associada ao verbo, x a

variavel associada a hoteis e y a piscina para os dois casos em que toma o valor do verbo

ter.

6.9.3.2 Regras

A regra R24 cobre o caso em que um verbo etiquetado por vexistir ou vhaver (vexistir ∨ vhaver)

e o foco da questao:

[R24] elem( , vexistir ∨ vhaver, X1, indf)

: {flecha( , n ∨ adj3, X2, , vexistir ∨ vhaver, X3, R), not flecha( , prep, X4, , n ∨ adj3, X2, )}

# {?existe(var(X1), var(X2))}

Exemplo 100: Famılia vexistir ∨ vhaver – foco da questao

Esta regra transforma o verbo de Em Lisboa ha hoteis que..., e dado que hoteis flecha sobre ha, em

?existe(e, x), em que x e a variavel associada a hoteis. �

As regras R25 e R26 cobrem as situacoes em que o verbo haver ou existir tem o significado do ter,

tal como explicado.

[R25] elem( , vexistir ∨ vhaver, X1, not focus)

: {flecha( , vexistir ∨ vhaver, X1, , vexistir ∨ vhaver, X1, ),

flecha( , n ∨ adj3, X2, , vexistir ∨ vhaver, X1, L),

Page 201: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

166 CAPITULO 6. INTERPRETACAO DE QUESTOES: REGRAS SEMANTICAS

not flecha( , prep, X3, , n ∨ adj3, X2, ), flecha( , n ∨ adj3, X4, , vexistir ∨ vhaver, X1, R),

not flecha( , prep, X5, n ∨ adj3, X4, ), flecha( , em que int, X6, n ∨ adj3, X2, )}

# {tem(var(X1)), arg1(var(X1)) = var(X2),

arg2(var(X1)) = var(X4)}

Exemplo 101: Famılia vexistir ∨ vhaver – contexto “em que”

Esta regra transforma o verbo de Em que hoteis ha piscina ..., e supondo que hoteis e piscina flecham sobre

ha, e que Em que flecha sobre hoteis, em ter(e), arg1(e) = x, arg2(e) = y, em que x e a variavel

associada a hotel e y a piscina. �

[R26] elem( , vexistir ∨ vhaver, X1, not focus)

: {flecha( , vexistir ∨ vhaver, X1, , rel, X2, L), flecha( , rel, X2, , n ∨ adj3, X3, L),

flecha( , n ∨ adj3, X4, , vexistir ∨ vhaver, X1, R), not flecha( , prep, X5, , n ∨ adj3, X4)}

# {tem(var(X1)), arg1(var(X1)) = var(X3),

arg2(var(X1)) = var(X4)}

Exemplo 102: Famılia vexistir ∨ vhaver – contexto relativa

Esta regra transforma o verbo de Quais os hoteis onde ha piscina ... em tem(e), arg1(e) = x,

arg2(e) = y, em que x e a variavel associada a hotel e y a piscina, pois ha flecha sobre onde que, por

sua vez, flecha sobre hoteis e piscina flecha sobre ha. �

6.9.4 Famılia vc12

Em relacao a esta famılia, dado que cobrem os casos do imperativo, define-se a regra R27, que

tem apenas como objectivo identificar o objecto alvo do pedido.

Page 202: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

6.10. RELATIVAS 167

[R27] elem( , vc12, X1)

: {flecha( , n ∨ adj3, X2, , vc12, X1, L), not flecha( , prep, X3, , n ∨ adj3, X2, )}

# {?var(X2)}

Exemplo 103: Famılia vc12

Esta regra transforma o verbo de Faca-me uma lista de ... em ?x, em que x e a variavel associada a lista. �

6.10 Relativas

Nesta seccao apresentam-se as regras semanticas associadas as partıculas relativas (seccao

6.10.2), discutindo-se previamente a sua representacao (seccao 6.10.1).

6.10.1 Representacao

Inicialmente tinha-se pensado que a representacao das relativas seria dada por uma formula

que une o nome ao qual esta ligada a relativa e o verbo (vc3 ∨ vinf) desta (hotel(x), que(x,

e), tenha(e) para ... um hotel que tenha...). Mas considerando apenas o predicados arg1 e

arg2, pode-se fazer um pequeno trabalho de convergencia. Por exemplo Que hoteis tem pis-

cina e Quais os hoteis que tem piscina deveriam ser mapeados na mesma formula. Se a relativa

introduzir o predicado arg1, ambas as questoes podem ser mapeadas em (?x, hoteis(x),

tem(e), arg1(e) = x, arg2(e) = y, piscina(y)). Do mesmo modo Quais as casas

que o Bernardim Ribeiro habitou? podia ser representada por ?x, casa(x), habitou(e),

arg1(e) = y, arg2(e) = x, NAME(y, Bernadim Ribeiro).

Considerou-se igualmente uma regra da relativa para quando esta recebe a flecha de um vcopc

Page 203: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

168 CAPITULO 6. INTERPRETACAO DE QUESTOES: REGRAS SEMANTICAS

∨ vser. Dado que a regra anterior para o vcopc ∨ vser e aplicada quando este flecha sobre si,

esta regra e disparada quando o vcopc ∨ vser flecha sobre um rel.

6.10.2 Regras

As regras R28, R29, R30 cobrem os casos descritos anteriormente.

[R28] elem( , rel, X1)

: {flecha( , vc3 ∨ vinf, X2, , rel, X1, L), not flecha( , n ∨ adj3, X3, , vc3 ∨ vinf, X2, R),

flecha( , rel, X1, , n ∨ adj3, X3, L)}

# {arg1(var(X2)) = var(X3)}

Exemplo 104: rel, regra 1

A relativa de ... hotel que tenha..., origina a formula arg1(e) = x, em que x representa a variavel

associada a hotel. �

[R29] elem( , rel, X1)

: {flecha( , vc3 ∨ vinf, X2, , rel, X1, L), flecha( , n ∨ adj3, X3, , vc3 ∨ vinf, X2, R),

flecha( , rel, X1, , n ∨ adj3, X4, L)}

# {arg2(var(X2)) = var(X4)}

Exemplo 105: rel, regra 2

A relativa de ... hotel que o Joao habitou..., origina a formula arg2(e) = x, em que x representa a variavel

associada a hotel, pois habitou flecha sobre que, que flecha sobre hotel e Joao flecha sobre habitou. �

A regra que se segue e para quando um vcopc ∨ vser flecha sobre um rel.

Page 204: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

6.11. RESUMO E CONCLUSOES 169

[R30] elem( , rel, X1, )

: {flecha( , vcopc ∨ vser, X2, , rel, X1, L), flecha( , n ∨ adj, X3, , vcopc ∨ vser, X2, L),

flecha( , rel, X1, , n ∨ adj3, X4, L)}

# {sem(var(X2)), arg1(var(X2)) = var(X4), arg3(var(X2)) = var(X3)}

Exemplo 106: rel, regra 2

A relativa de ... hotel que e giro..., origina a formula e(e), arg1(e) = x, arg3(e) = y, em que x

representa a variavel associada a hotel e y a giro. �

6.11 Resumo e Conclusoes

Apresentaram-se as regras semanticas responsaveis pelo criacao de representacoes semanticas,

no domınio da interpretacao de questoes. As representacoes a calcular dependem da

informacao gramatical em jogo. Se esta fosse mais rica, poder-se-iam obter representacoes mais

elaboradas.

Page 205: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

170 CAPITULO 6. INTERPRETACAO DE QUESTOES: REGRAS SEMANTICAS

Page 206: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

7] ���^��� � * ( ���U4�+6�� &��

V �.��-?��*_=>�)��&7%�T�$�

Neste capıtulo, pretende-se mostrar como as regras semanticas podem ser usadas numa tarefa

de desambiguacao semantica, ainda que parcial. Assim, as regras semanticas vao expressar

condicoes sintacticas que permitem identificar o significado de um conjunto de palavras, ou

pelo menos limitar ambiguidades. Em analise esta a palavra qualquer e os quantificadores todos,

algum e nenhum.

A organizacao deste capıtulo e a seguinte: a seccao 7.1 descreve a problematica relativa a este

processo de desambiguacao; a seccao 7.2 introduz os valores semanticos atribuıdos ao qualquer;

a seccao 7.3 apresenta um conjunto de contextos sintacticos (e regras semanticas) que permi-

tem limitar ou mesmo identificar o valor semantico do qualquer. Finalmente, a seccao 7.4 e

dedicada aos quantificadores todos, algum e nenhum, fechando-se o capıtulo na seccao 7.4.4 com

um resumo e principais conclusoes.

7.1 Problematica

7.1.1 Multiplicidade de significados e desambiguacao

A palavra qualquer, como tantas outras, pode ter varios significados.

Page 207: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

172 CAPITULO 7. DESAMBIGUACAO DE QUANTIFICADORES

Exemplo 107: Alguns significados da palavra qualquer

Considere-se a frase (1).

(1) Qualquer crianca sabe chorar.

Nesta situacao o qualquer tem um valor universal: todas as criancas sabem chorar. Uma interpretacao

diferente, ocorre em (2) onde o qualquer e um operador de identificacao vaga numa estrutura de

quantificacao cardinal: existe um e um unico tio, nao identificado, que ofereceu a prenda.

(2) Foi uma prenda de um tio qualquer.

Ja em (3) o qualquer tem um significado pejorativo.

(3) Ele e um jornalista qualquer, que nao tem onde cair morto. �

Em algumas situacoes, o significado preciso do qualquer pode ser identificado atraves dos con-

textos sintacticos em que ocorre. No entanto, nem sempre e facil encontrar essas condicoes

sintacticas, sendo por vezes impossıvel identificar o significado do qualquer apenas com base

em informacao sintactica.

Exemplo 108: Desambiguacao com base em informacao semantica

Compare-se (1) com (2).

(1) A lista telefonica tem qualquer numero.

(2) A lista telefonica tem qualquer defeito.

No primeiro caso, o valor e universal: todos os numeros constam da lista telefonica; no segundo caso,

existencial vago: a lista telefonica tem um (ou mais) defeitos, introduzindo o qualquer uma “marca”

de desconhecimento do defeito (ou defeitos) em causa. Sintacticamente as construcoes sao identicas.

Apenas sabendo o significado dos conceitos em causa permite atribuir o valor certo ao qualquer. �

Page 208: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

7.1. PROBLEMATICA 173

Ha ainda situacoes em que so na continuacao do discurso se torna possıvel levantar (ou pelo

menos limitar) a ambiguidade.

Exemplo 109: Desambiguacao com base no contexto do discurso

Considere-se a frase:

(1) A Maria nao gosta de qualquer perfume.

O valor do qualquer e ambıguo nesta situacao dado que as interpretacoes de (2) e (3) sao ambas possıveis.

(2) A Maria so gosta de um tipo particular de perfumes.

(3) A Maria nao gosta de nenhum perfume.

No entanto, a frase (1) incluıda nas frases (4) e (5) ja pode ser desambiguada. O valor que toma em (4)

corresponde a interpretacao de (2), e o valor que toma em (5) a de (3).

(4) A Maria nao gosta de qualquer perfume, apenas dos muito discretos.

(5) A Maria nao gosta de qualquer perfume. Nem do Rive Gauche, ve la tu! �

Em resumo, ha palavras que podem tomar varios significados e certos contextos sintacticos

permitem identificar alguns destes significados. No entanto, por vezes, so com outro tipo de

informacao se consegue fazer a desambiguacao. Neste capıtulo tenta-se fazer a desambiguacao

possıvel com a informacao sintactica disponıvel.

7.1.2 Convergencia de valores

Neste capıtulo, para alem de desambiguar a palavra qualquer, identificam-se palavras (ou

sequencias de palavras) que tomam os mesmos valores semanticos e os contextos sintacticos

em que o fazem. Infelizmente a tarefa e ardua, pois os contextos sintacticos que permitem esco-

Page 209: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

174 CAPITULO 7. DESAMBIGUACAO DE QUANTIFICADORES

lher um valor para uma palavra nem sempre sao os mesmos em que ocorrem as palavras que a

parafraseiam. Para ilustrar este problema, analise-se o exemplo 110, comparando-se, em parti-

cular, as frases (1) e (6): todos e qualquer, palavras que aparentemente tem o mesmo significado,

tem valores diferentes no mesmo contexto.

Exemplo 110: Convergencias

A frase (1) pode ser parafraseada por (2).

(1) O David nao conhece qualquer livro do Tolkien.

(2) O David desconhece qualquer livro do Tolkien.1

No entanto, (1) e (2) podem ser parafraseadas por (3), mas nao por (4), que e agramatical.

(3) O David nao conhece nenhum livro do Tolkien.

(4) *O David desconhece nenhum livro do Tolkien.

Para complicar, (1), (2) e (3) podem ser parafraseadas por (5), mas nao por (6). A frase (6) nao e agrama-

tical, mas nao parafraseia as anteriores, pois sao diferentes as suas condicoes de verdade (enquanto que

(1), (2), (3) e (5) sao verdadeiras apenas se o David desconhecer a totalidade da obra de Tolkien, para

que (6) seja verdadeira, basta que o David desconheca apenas um livro do Tolkien).

(5) O David desconhece todos os livro do Tolkien.

(6) O David nao conhece todos os livro do Tolkien.

Para terminar, (1), (2), (3) e (5) podem ser parafraseadas por (7).

(7) O David nao conhece livro algum do Tolkien. �

1Note-se que esta frase tambem pode ser interpretada como se o David desconhecesse apenas um livro doTolkien.

Page 210: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

7.1. PROBLEMATICA 175

7.1.3 Estrategia global

Mais do que encontrar contextos que “disparam” um ou mais valores semanticos do qualquer (e

dos outros quantificadores), ha que pensar em termos globais na escolha desses valores, dado

que esta escolha depende de outras decisoes. Em particular, se o objectivo for criar formulas

logicas, ha que decidir as relacoes de escopo que se vao considerar entre os elementos nas

formulas finais.

Por exemplo, em frases que contem a negacao, em [Moia, 1992] atribui-se ao qualquer o valor

de quantificador existencial, dado que se considera que este esta sob o escopo da negacao.

Admite-se, no entanto, que lhe pode ser atribuıdo um valor universal, caso se considere que

nao esta sobre o escopo da negacao. De acordo com [Moia, 1992], esta e uma longa discussao na

literatura, dado que se obtem solucoes correctas caso se assuma um ou outro valor, dependendo

de se considerar ou nao o qualquer sob o escopo da negacao. O exemplo 111 ilustra esta situacao.

Exemplo 111: Escopo da negacao

Considere-se a frase (1).

(1) O David nao conhece qualquer livro do Tolkien.

Tomando o valor existencial para o qualquer, e assumindo que este esta sobre o escopo da negacao,

obtem-se na logica de predicados:

¬∃x(livro do Tolkien(x) ∧ conhece(David, x)).

Se se adoptar o valor universal, e se se assumir que o qualquer nao esta sob o escopo da negacao, tem-se

a seguinte representacao:

∀x(livro do Tolkien(x) ⇒ ¬conhece(David, x)).

Page 211: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

176 CAPITULO 7. DESAMBIGUACAO DE QUANTIFICADORES

sendo as duas formulas equivalentes, como se pode facilmente verificar. �

O mesmo se passa em relacao ao condicional, como se pode observar no exemplo 112.

Exemplo 112: Escopo do condicional

Considere-se o condicional de (1).

(1) Se a Catarina tivesse comido qualquer fruta, a Ana ficaria contente.

Supondo a interpretacao em que o qualquer toma um valor existencial e esta sob o escopo do condicional,

tem-se:

[∃x(fruta(x) ∧ comeu(Catarina, x))] ⇒ contente(Ana).

Se se considerar a interpretacao em que o qualquer e universal e nao esta sob o escopo do condicional, a

formula passa a:

∀x(fruta(x) ∧ comeu(Catarina, x)) ⇒ contente(Ana).

Estas formulas sao equivalentes. �

Com estes exemplos confirma-se mais uma vez a posicao defendida em [Bes, 2001b], na qual

se frisa que num sistema com uma multiplicidade de hipoteses nao vale a pena tentar justi-

ficar isoladamente cada hipotese ou tipo de hipotese, mas sim confrontar o resultado final –

resultante da interaccao de um conjunto de hipoteses – com a realidade observada. Ou seja,

neste caso particular, nao vale a pena discutir se e melhor (ou pior) associar o valor universal

ou existencial ao qualquer no quadro da negacao, dado que esta escolha vai interagir com a

escolha feita sobre o escopo da negacao. Se se escolher o valor existencial e se assumir que o

escopo de negacao recai igualmente sobre este operador, os resultados sao os mesmos que os

obtidos se se optar por um valor universal e se assumir que apenas o verbo esta sobre o escopo

Page 212: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

7.2. VALORES SEMANTICOS DO QUALQUER 177

da negacao. Em ambos os casos os resultados obtidos coincidem com a semantica pretendida

para as construcoes em causa.

7.2 Valores semanticos do qualquer

De seguida apresentam-se os valores semanticos atribuıdos ao qualquer no ambito desta

dissertacao. Deve-se notar que esta e apenas uma particao possıvel. Uma particao alternativa,

se bem que com muitos pontos em comum, e a de [Moia, 1992].

7.2.1 Universal

O valor universal e provavelmente o valor mais intuitivo do qualquer, assumindo-se que toma

este valor quando pode ser parafraseado por todos, sem excepcao.

Exemplo 113: Valor universal

Em construcoes como as que se seguem, provindas de [Moia, 1992], o operador em analise tem um valor

universal:

(1) Qualquer peixe sabe nadar.

(2) Uma pessoa qualquer que cometa uma infraccao sera multada.

(3) O Pedro e mais inteligente que qualquer aluno.

Na primeira frase assume-se que todos os peixes sabem nadar; na segunda, que todas as pessoas que

cometam uma infraccao serao multadas; na terceira, que o Pedro e o mais inteligente de todos os alunos.

Page 213: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

178 CAPITULO 7. DESAMBIGUACAO DE QUANTIFICADORES

Notacao 34: Valor universal

O valor universal e denotado por univ.

7.2.2 Existencial vago

Tipicamente atribui-se o valor existencial a um operador quando este pode ser parafraseado

por um ou mais. De acordo com Moia, ha situacoes em que o valor do qualquer e do tipo existen-

cial, mas este valor nao consegue captar sozinho o valor real do qualquer, dado que o qualquer

adiciona uma “marca” de desconhecimento ao objecto sobre a qual opera. Assim, segundo

Moia, o qualquer toma um valor existencial vago quando pode ser parafraseado por um ou mais,

mas nao sei precisar.

Exemplo 114: Valor existencial vago

Em (1) assume-se que o qualquer toma um valor existencial vago.

(1) A Rita tem qualquer problema. �

Notacao 35: Valor existencial vago

O valor existencial vago e denotado por exist vago.

7.2.3 Vago

Em construcoes como Foi uma prenda de um tio qualquer, o qualquer acrescenta uma “marca” de

desconhecimento, sendo denominado em [Moia, 1992] por operador de identificacao vaga.

Page 214: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

7.2. VALORES SEMANTICOS DO QUALQUER 179

Exemplo 115: Operador de identificacao vaga

Compare-se (1) com (2). (2) permite precisar o Tio generoso, ao contrario da construcao de (1), como se

pode observar em (3) e (4).

(1) Foi uma prenda de um tio qualquer.

(2) Foi uma prenda de um tio.

(3) *Foi uma prenda de um tio qualquer: do Tio Antonio.

(4) Foi uma prenda de um tio: do Tio Antonio. �

Notacao 36: Valor vago

Denota-se este valor por vago.

Note-se que este valor esta associado quer a estruturas de quantificacao cardinal (Foi uma prenda

de um tio qualquer), quer existencial (A Rita tem um problema qualquer). Neste segundo caso, nao

esta excluıda a hipotese de a Rita ter mais do que um problema.2

7.2.4 Vulgar

O qualquer pode ainda actuar como [...] modificador de tipo adjectival, com sentido normalmente

pejorativo, proximo de expressoes como “vulgar”, “ordinario”, “sem importancia”, “nao especial” [...]

[Moia, 1992].

Exemplo 116: Valor vulgar

Em (1) e (2) o qualquer tem sentido pejorativo.

2Assume-se que o tipo de quantificacao desta ultima frase e dado pelo artigo um, cabendo ao qualquer apenas opapel de operador de identificacao vaga.

Page 215: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

180 CAPITULO 7. DESAMBIGUACAO DE QUANTIFICADORES

(1) A Maria nao e uma actriz qualquer. Ja ganhou dois premios de interpretacao.

(2) A Maria e uma actriz qualquer que ninguem sabe quem e. �

Notacao 37: Valor vulgar

Denota-se este valor por vulgar.

7.2.5 Valores em sequencias especıficas

A palavra qualquer pode ocorrer no contexto de um conjunto de expressoes particulares. Assim,

os valores da tabela 7.1 dizem respeito ao qualquer quando inserido em algumas construcoes

tıpicas (qq abrevia qualquer), tendo sido recolhidos do corpus Natura/Publico anotado, versao

3.3 [Rocha e Santos, 2000, Santos e Rocha, 2001b].

SEQUENCIA OCORR. VALOR EXEMPLO

de qq modo 8 anyway Fica. De qq modo vou-me embora.de qq forma 64 anyway Fica. De qq forma vou-me embora.de qq maneira 25 anyway Fica. De qq maneira vou-me embora.a qq momento 33 a-qq-momento A qq momento comeca a guerra.a qq preco 8 a-qq-preco Ele ha-de vencer a qq preco.todo/a e qq 35 univ Todo e qq aluno quer boas notas.sem qq 150 sem Estou sem qq paciencia.qq um/a 51 univ qq um te dira que estas errado.qq que 21 univ qq que seja a razao, foi mau.

Tabela 7.1: Valores do qualquer em sequencias especıficas.

Por agora consideram-se apenas estes valores. No entanto, deve notar-se que algumas destas

construcoes podem ter significados alternativos, como se pode observar no exemplo 117.

Exemplo 117: Valores alternativos

Compare-se Fica. De qualquer maneira vou-me embora com Ele vestiu-se de qualquer maneira. No primeiro

Page 216: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

7.3. CONTEXTOS SINTACTICOS DE DESAMBIGUACAO DO QUALQUER 181

caso, de qualquer maneira significa independentemente de ficares ou nao. No segundo caso, significa sem

preocupacoes, sem cuidado. �

Para terminar esta seccao, uma construcao tıpica, que ocorre noutras construcoes especıficas

com valores proprios e a sequencia qualquer coisa que, por isso, se decidiu tratar a parte (famılia

qualquer coisa) (qq c abrevia qualquer coisa). Desta famılia, distinguem-se as sequencias da tabela

7.2:

SEQUENCIA OCORR. VALOR EXEMPLO

qq c 108 vago O Joao comeu qq c que lhe fez mal.qq c como 33 aproximada/ Essa saia custa qq c como 120 euros.qq c do genero 2 semelhante E qq c do genero que quero fazer.qq c no genero 1 semelhante E qq c no genero que quero fazer.

Tabela 7.2: Valores do qualquer em sequencias qualquer coisa.

Acrescentem-se a esta famılia as construcoes uma coisa qualquer, equivalentes as construcoes

qualquer coisa.

7.3 Contextos sintacticos de desambiguacao do qualquer

De seguida identificam-se alguns contextos sintacticos que “disparam” os valores identificados

para a palavra qualquer. As regras que se apresentam sao bastante genericas, podendo ser

acrescentadas novas regras, mais especıficas, para precisar os valores a atribuir. Em particular,

informacao mais detalhada sobre os tempos verbais e fundamental para um trabalho mais

exacto, como se mostra na seccao 7.3.3.

Page 217: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

182 CAPITULO 7. DESAMBIGUACAO DE QUANTIFICADORES

7.3.1 Entidades nao discretas

Em [Moia, 1992] dividem-se as entidades nao discretas em duas sub-categorias:

• nomes massivos, como vinho, ouro, oxigenio;

• nomes que denotam valores de propriedades como pejo, responsabilidade, esperanca, im-

portancia.

Na categorizacao disponıvel, apresentada no capıtulo 4, os nomes massivos (nc2) distinguem-

-se dos restantes (nc1). Pondo de lado os nomes que denotam valores de propriedades, assume-

-se que perante um nc2, o qualquer toma o valor univ. A regra semantica e entao a seguinte:

[R1] elem( , qualquer s, X1)

: {flecha( , qualquer s, X1, , nc2, X2, )}

# {univ}

Exemplo 118: Massivos

O qualquer em (1) tem um valor univ.

(1) Bebia qualquer vinho que me desses. �

7.3.2 Esquerda do verbo, posicao pre-nominal

Quando o qualquer se encontra antes do nome e este esta a esquerda do verbo, assume-se que

toma o valor univ.

Page 218: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

7.3. CONTEXTOS SINTACTICOS DE DESAMBIGUACAO DO QUALQUER 183

[R2] elem( , qualquer s, X1)

: {flecha( , qualquer s, X1, , n, X2, R), flecha( , n, X2, , v, X3, R)}

# {univ}

Exemplo 119: Esquerda do verbo, posicao pre-nominal

Em (1) o valor do qualquer e o univ.

(1) Qualquer peixe sabe nadar. �

7.3.3 Esquerda do verbo, posicao pos-nominal

Quando o qualquer ocorre em posicao pos-nominal3, vem tipicamente associado ao artigo in-

definido (mas nem sempre: tal como se vai a outro bar qualquer...). Considere-se o qualquer em

posicao pos-nominal, a esquerda do verbo. Neste contexto nao ha apenas um valor para o qual-

quer. O exemplo 120 mostra como, dispondo de informacao linguıstica mais precisa, se poderia

caminhar no sentido de uma desambiguacao mais exacta.

Exemplo 120: Desambiguacao

Se em construcoes como a de (1) o valor de qualquer parece ser univ, ja o mesmo nao acontece em

construcoes como a de (2) em que o qualquer pode ser facilmente interpretado como vago.

(1) Uma pessoa qualquer que cometa uma infraccao sera multada.

(2) Um peixe qualquer sabe nadar.

O facto de na primeira situacao se estar perante um valor univ e na segunda vago podera dever-se a

relativa da primeira frase. Se se acrescentar uma relativa a (2), o valor do qualquer aproxima-se do univ,

como mostra (3).

3De acordo com [Moia, 1992], nao ha consenso sobre a gramaticalidade de algumas destas construcoes.

Page 219: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

184 CAPITULO 7. DESAMBIGUACAO DE QUANTIFICADORES

(3) Um peixe qualquer que caia a agua sabe nadar.

Mas tambem o tempo verbal tem repercussoes no valor a atribuir ao qualquer. Comparando (3) com (4),

apesar da relativa (e de eventuais duvidas sobre a gramaticalidade da construcao), o valor de (4) esta de

novo mais proximo do vago.

(4) Um peixe qualquer que caiu a agua soube nadar. �

Como nao se esta a usar informacao mais precisa sobre os tempos verbais, esta tarefa fica-se

pelas regras que se apresentam de seguida. Deve-se notar que facilmente se acrescentam regras

mais especıficas que tem em conta os tempos verbais.

[R3] elem( , qualquer s, X1)

: {flecha( , qualquer s, X1, , n, X2, L), flecha( , n, X2, , v, X3, R),

not flecha( , que rel, X4, , n, X2, L)}

# {vago}

[R4] elem( , qualquer s, X1)

: {flecha( , qualquer s, X1, , n, X2, L), flecha( , n, X2, , v, X3, R),

flecha( , que rel, X4, , n, X2, L)}

# {univ ou vago}

7.3.4 Direita do verbo, posicao pre-nominal

A direita do verbo e em posicao pre-nominal, o qualquer toma um valor ambıguo entre o univ

e o exist vago.4

4Neste contexto, o qualquer pode tomar tambem o valor vulgar quando o verbo e negado. Mas como existe umaregra para essa situacao particular (regra R7), nao ha necessidade de acrescentar esse valor a R5. Note-se que seria

Page 220: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

7.3. CONTEXTOS SINTACTICOS DE DESAMBIGUACAO DO QUALQUER 185

[R5] elem( , qualquer s, X1)

: {flecha( , qualquer s, X1, , n, X2, R), flecha( , n, X2, , v, X3, L)}

# {univ ou exist vago}

Exemplo 121: Direita do verbo, posicao pre-nominal

Esta regra aplica-se a (1) e (2), sendo atribuıdo ao qualquer um valor ambıguo entre o univ e o

exist vago.

(1) A lista telefonica tem qualquer numero.

(2) A lista telefonica tem qualquer problema.

No primeiro caso o valor exacto e univ, no segundo exist vago. �

7.3.5 Direita do verbo, posicao pos-nominal

Quando o qualquer se encontra a direita do verbo, em posicao pos-nominal, o seu valor e

ambıguo entre o vago e vulgar.

[R6] elem( , qualquer s, X1)

: {flecha( , qualquer s, X1, , n, X2, L), flecha( , n, X2, , v, X3, L)}

# {vago ou vulgar}

Exemplo 122: Direita do verbo, posicao pos-nominal

No caso de (1) e de (2), o qualquer tem o valor vago ou vulgar (o valor vago cobre situacoes como a de

(1), o vulgar como a de (2)).

(1) A Rita tem um problema qualquer.

irrelevante acrescentar a regra R5 o valor vulgar, pois como esta subsume a regra R7, nunca e aplicada quando overbo e negado.

Page 221: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

186 CAPITULO 7. DESAMBIGUACAO DE QUANTIFICADORES

(2) A Rita e uma actriz qualquer. �

7.3.6 Quadro da negacao

De seguida definem-se os valores para o qualquer no quadro da negacao.

7.3.6.1 Direita do verbo, posicao pre-nominal, verbo negado

A direita do verbo negado, em posicao pre-nominal, escolhem-se os valores univ e vulgar5,

assumindo-se que na eventual construcao de uma formula logica o operador nao estara sobre

o alcance da negacao. Note-se que a regra R7 e subsumida pela regra R5. No caso de ambas

poderem ser disparadas, apenas R7 e disparada, pois e mais especıfica.

[R7] elem( , qualquer, X1)

: {flecha( , qualquer, X1, , n, X2, R), flecha( , n, X2, , v, X3, L),

flecha( , nao, X4, , v, X3, )}

# {univ ou vulgar}

Exemplo 123: Direita do verbo, posicao pre-nominal, verbo negado

Quer no exemplo (1), quer no exemplo (2), o qualquer significa univ ou vulgar (o valor univ cobre

casos como o de (1), o valor vulgar como o de (2)).

(1) Os cogumelos nao tem qualquer valor nutritivo.

(2) A Rita nao e qualquer actriz. �

5Segundo [Moia, 1992], o qualquer de significado vulgar so surge em posicao pre-nominal no quadro de frasesnegativas ou condicionais.

Page 222: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

7.3. CONTEXTOS SINTACTICOS DE DESAMBIGUACAO DO QUALQUER 187

7.3.6.2 Direita do verbo, posicao pos-nominal, verbo negado

Quando o qualquer ocorre a direita de um verbo negado, em posicao pre-nominal, considera-se

que tem apenas o valor vulgar. Repare-se que a regra R8 subsume a regra R6.

[R8] elem( , qualquer s, X1)

: {flecha( , qualquer s, X1, , n, X2, L), flecha( , n, X2, , v, X3, L),

flecha( , nao, X4, , v, X3, )}

# {vulgar}

Exemplo 124: Direita do verbo, posicao pos-nominal, verbo negado

Em (1), o qualquer tem o significado vulgar.

(1) A Maria nao e uma actriz qualquer. �

7.3.6.3 Comparativas

Em relacao as comparativas, e dado nao terem sido contempladas no domınio das

interrogacoes, assuma-se que numa frase como O Paulo e mais inteligente que qualquer aluno,

o adverbio mais (etiquetado por advcomp) flecha sobre o adjectivo inteligente; que este, por sua

vez, flecha sobre o que; que o que flecha sobre o nome comum aluno; que o nome comum aluno

e tambem alvo da flecha que tem origem no qualquer. Uma flechagem semelhante tem a frase

O Paulo e mais inteligente que um aluno qualquer (apenas nesta ultima, a flechagem do qualquer e

feita a esquerda e nao a direita).

Considera-se que, no quadro das comparativas, em posicao pre-nominal, o qualquer toma o

valor univ, e em posicao pos-nominal o valor vago.

Page 223: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

188 CAPITULO 7. DESAMBIGUACAO DE QUANTIFICADORES

[R9] elem( , qualquer s, X1)

: {flecha( , qualquer s, X1, , n, X2, R), flecha( , adj, X3, , que, X4, R),

flecha( , que, X4, , n, X2, R), flecha( , advcomp, X5, , adj, X3, )}

# {univ}

[R10] elem( , qualquer s, X1)

: {flecha( , qualquer s, X1, , n, X2, L), flecha( , adj, X3, , que, X4, R),

flecha( , que, X4, , n, X2, R), flecha( , advcomp, X5, , adj, X3, )}

# {vago}

Exemplo 125: Comparativas

Em (1), o qualquer tem o significado univ, em (2) vago.

(1) O Paulo e mais inteligente que qualquer aluno.

(2) O Paulo e mais inteligente que um aluno qualquer. �

7.3.7 Contextos especıficos

As sequencias descritas na seccao 7.2.5, dedicada a situacoes especıficas onde ocorre a palavra

qualquer, sao mapeadas nos valores identificados. Destas regras, apresenta-se apenas, como

ilustracao, a regra R11. Note-se que como o campo da palavra esta preenchido, estas regras sao

mais especıficas que qualquer uma das anteriores, sendo por isso disparadas em seu lugar:

[R11] elem(qualquer coisa, , X1)

: ∅

# {vago}

Page 224: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

7.4. CONVERGENCIAS 189

7.4 Convergencias

De seguida identifica-se um conjunto de palavras ou sequencias de palavras que parafraseiam

o qualquer. Tal como se fez para este operador, identificam-se os contextos que disparam os

seus diferentes valores, e apresentam-se as regras responsaveis por este processo. O objectivo

e fazer convergir variacoes linguısticas como as apresentadas na seccao 7.1.2.

7.4.1 Todos

De acordo com [Moia, 1992], se nao estiver no quadro da negacao, nem de um condicional, o

qualquer com o valor universal pode ser parafraseado por todo o e todos, todos e cada um de, todo

e qualquer. Assim, optou-se por considerar uma regra por omissao para a categoria todo p –

categoria que foi atribuıda as sequencias acima mencionadas – e varias regras mais especıficas.

A regra R12 e a regra por omissao.

[R12] elem( , todo p, X1)

: ∅

# {univ}

Exemplo 126: Caso todo p, regra generica

Em (1), todos toma o valor univ.

(1) Todos os rapazes fugiram. �

A regra R13, por sua vez, e disparada quando a palavra etiquetada por todo p flecha sobre um

nome que se encontra a direita do verbo, encontrando-se o verbo negado. Considera-se que

Page 225: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

190 CAPITULO 7. DESAMBIGUACAO DE QUANTIFICADORES

neste contexto o todos tem o valor exist.

[R13] elem( , todo p, X1)

: {flecha( , todo p, X1, , n, X2, ), flecha( , n, X2, , v, X3, L), flecha( , nao, X4, , v, X3, )}

# {exist}

Exemplo 127: Caso do todo p, nome a direita do verbo, verbo negado

Nas frases (1) e (2), todos tem o valor exist.

(1) Nao fugiram todos os rapazes.

(2) Nao fugiram os rapazes todos. �

Para cobrir os casos em que a palavra etiquetada por todo p flecha directamente sobre o verbo,

existe a regra R14.

[R14] elem( , todo p, X1)

: {flecha( , todo p, X1, , v, X2, L), flecha( , nao, X3, , v, X2, )}

# {exist}

Exemplo 128: Caso do todo p, direita do verbo, verbo negado

Em (1), todos tem valor exist.

(1) Nao fugiram todos. �

Acrescenta-se ainda a regra R15 para o caso do nem todos. Assume-se nesta situacao que o nem

flecha sobre o mesmo nome que o todos.

Page 226: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

7.4. CONVERGENCIAS 191

[R15] elem( , todo p, X1)

: {flecha( , todo p, X1, , n, X2, R), flecha( , nem, X3, , n, X2, )}

# {exist}

Exemplo 129: Caso do todo p com flecha de nem sobre um nome

A palavra todos em (1) toma o valor exist.

(1) Nem todos os rapazes fugiram. �

Nesta dissertacao nao se avanca mais na associacao de valores a palavra todos.

7.4.2 Algum

Analisa-se nesta seccao o operador algum. A palavra algum em posicao pre-nominal significa

existe pelo menos um, e em posicao pos-nominal, se o verbo nao for negado significa nenhum.

Adicionalmente, segundo [Moia, 1992], em posicao pos-nominal e a direita de um verbo ne-

gado, a palavra algum pode parafrasear o qualquer com valor univ (assumindo-se que, posteri-

ormente, na formula final, ja nao esta sob o escopo da negacao). Consideram-se assim 3 regras,

duas genericas para o algum em posicao pre e pos-nominal (respectivamente valor exist e

nenhum) e outra para o algum quando a direita de um verbo negado e em posicao pos-nominal

(univ), respectivamente:

[R16] elem( , algum s, X1)

: {flecha( , algum s, X1, , n, X2, R)}

# {exist} 6

6Esta regra pode aplicar-se tambem ao plural.

Page 227: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

192 CAPITULO 7. DESAMBIGUACAO DE QUANTIFICADORES

[R17] elem( , algum s, X1)

: {flecha( , algum s, X1, , n, X2, L)}

# {nenhum}

[R18] elem( , algum s, X1)

: {flecha( , algum s, X1, , n, X2, L), flecha( , n, X2, , v, X3, L), flecha( , nao, X4, , v, X3, )}

# {univ}

Note-se que a regra R18 e subsumida pela regra R17.

Exemplo 130: Caso do algum s

A regra R16 cobre (1) atribuindo-se o valor exist ao algum.

(1) Algum rapaz fugiu.

A regra R17 cobre (2) atribuindo-se o valor nenhum ao algum.

(2) Rapaz algum fugiu.

A regra R18 atribui ao algum de (3) o valor univ.

(3) Nao fugiu rapaz algum. �

7.4.3 Nenhum

De acordo com [Moia, 1992], sob o escopo da negacao o qualquer pode ser parafraseado por ne-

nhum. As regras R19 e R20 atribuem ao nenhum, respectivamente, o valor por omissao nenhum,

e o valor univ. Repare-se que R19 subsume R20.

Page 228: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

7.4. CONVERGENCIAS 193

[R19] elem( , nenhum s, X1)

: ∅

# {nenhum}

[R20] elem( , nenhum s, X1)

: {flecha( , nenhum s, X1, , n, X2, ), flecha( , n, X2, , v, X3, L), flecha( , nao, X4, , v, X3, )}

# {univ}

Exemplo 131: Caso do nenhum s

A regra R19 aplica-se a (1).

(1) Nenhum rapaz fugiu.

A regra R20, por sua vez, aplica-se a (2), atribuindo-lhe o valor univ.

(2) O David nao conhece nenhum livro do Tolkien. �

Muito haveria ainda a fazer em relacao a palavra nenhum, dado que nao e apenas o

verbo negado que lhe atribui o valor univ (ex: Ninguem as elegeu para coisa nenhuma

[Santos e Rocha, 2001a]), podendo a palavra ninguem fazer “disparar” esse valor. Por agora,

nada mais se acrescenta a analise do nenhum.

7.4.4 Resumo e Conclusoes

Apresentou-se um conjunto de valores semanticos que as palavras qualquer, todos, algum e

nenhum podem tomar e definiram-se contextos sintacticos capazes de desambiguar total ou

parcialmente esses valores, tendo-se usado as regras semanticas para representar os contextos

Page 229: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

194 CAPITULO 7. DESAMBIGUACAO DE QUANTIFICADORES

sintacticos desambiguadores. O facto de estas regras terem um campo que permite represen-

tar explicitamente o contexto facilita a declaracao (e recuperacao) de informacao. Adicional-

mente, a organizacao hierarquica das regras semanticas permite que se declarem regras mais

genericas. Regras mais especıficas podem ser futuramente adicionadas ao sistema, sem que

seja necessario re-escrever as regras actuais.

Como deve ser claro, este tipo de trabalho pode prolongar-se infinitamente: a escolha dos

valores semanticos pode ser sempre mais fina e a identificacao dos contextos sintacticos de

desambiguacao pode tambem ser levada muito mais longe. Esgotados os contextos sintacticos

desambiguadores pode-se recorrer a informacao semantica ou pragmatica para calcular os va-

lores semanticos do qualquer (ou de outras palavras).

Page 230: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

8� �I%�$�$�`�^��� �3-?�a

Neste capıtulo, apresentam-se as ferramentas desenvolvidas nesta dissertacao que vao permitir

testar as descricoes apresentadas anteriormente.

A organizacao do capıtulo e a seguinte: discute-se na seccao 8.1 a exigencia do 5P em relacao

a separacao entre as descricoes linguısticas e informacao de cariz procedimental; na seccao 8.2

apresenta-se o Algas, a ferramenta que tem como objectivo a construcao de modelos flechados;

na seccao 8.3 descreve-se o Ogre, a ferramenta responsavel pela construcao de um grafo; na

seccao 8.4 esta em foco o AsdeCopas, a ferramenta que permite obter varios tipos de resultados,

de acordo com as regras semanticas utilizadas (o Tira-Teimas, dado que e opcional, e apresen-

tado no apendice A). Estas tres ultimas seccoes estao organizadas do mesmo modo: comecam

com uma explicacao sobre os dados de entrada e saıda da ferramenta em causa, ao que se segue

uma descricao do algoritmo usado. Terminam com uma breve nota sobre a implementacao da

ferramenta. O capıtulo termina na seccao 8.5, com o habitual resumo e conclusoes.

8.1 Mapeamentos

Se as descricoes linguısticas se encontram diluıdas no processamento torna-se difıcil o seu rea-

proveitamento. Esta e uma situacao bem identificada na literatura, e se sistemas como o Edite

tem no seu codigo instrucoes para gerar predicados relativos aos cardinais, tal nao e certa-

Page 231: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

196 CAPITULO 8. PROCESSAMENTO

mente um motivo de orgulho. Relacionada com esta situacao esta outra que normalmente nao

e apontada como problematica: se um formalismo que tem por objectivo descrever a Lıngua

Natural, guarda igualmente, e sem demarcacao, informacao procedimental, pode tornar-se um

problema recuperar a informacao linguıstica. Tal como e dito em [Hagege, 2000], na pratica, se

uma gramatica que se quer de grande cobertura e usada para descrever sequencias da lıngua

e, ao mesmo tempo, e a entrada directa de uma ferramenta, entao vai conter dispositivos par-

ticulares, nao linguısticos, que tem por objectivo guiar o processo de analise, deixando a parte

puramente descritiva de ser acessıvel, pois encontra-se diluıda em informacao nao linguıstica.

Assim, no 5P sugere-se que o formalismo que expressa as descricoes linguısticas nao seja dese-

nhado com o objectivo adicional de servir de entrada de uma ferramenta [Bes et al., 1999].

Posto isto, suponha-se que se define um formalismo para expressar descricoes linguısticas,

sem preocupacoes computacionais. Suponha-se ainda que se implementa uma ferramenta que

recebe como entrada informacao proveniente dessas descricoes. A ferramenta pode usar par-

tes dessas descricoes ou a sua totalidade, e nada impede que as entradas da ferramenta se-

jam as proprias descricoes. No entanto, mesmo que o formalismo que expressa as descricoes

linguısticas coincida com a entrada da ferramenta, devera manter-se algum tipo de separacao

entre o formalismo que expressa as descricoes linguısticas e as entradas da ferramenta. Isto por-

que com a evolucao do sistema ha certamente necessidade de acrescentar informacao procedi-

mental as entradas da ferramenta, nao devendo essa informacao ser acrescentada as descricoes

linguısticas.

O exemplo que se segue ilustra bem este problema: observando a quantidade de modelos

flechados produzidos, pode-se pensar em impor as propriedades de flechagem limites nas

distancias de flechagem. E se as propriedades de flechagem permitem declarar que um ele-

Page 232: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

8.1. MAPEAMENTOS 197

mento pode flechar sobre um elemento (imediatamente) anterior, porque nao acrescentar a

propriedade de flechagem um valor que limita essa distancia de flechagem? Ora, tratando-se

de Lıngua Natural, pode-se dizer que dois elementos se seguem, imediatamente ou nao, mas

nunca impor uma distancia fixa entre eles. Assim, acrescentar essa possibilidade as propri-

edades de flechagem faria com que as descricoes linguısticas passassem a conter informacao

que nada tem a ver com a realidade da lıngua. Apesar disto, tambem e verdade que esta

informacao de controle pode ser muito util para fins computacionais, pelo que nao tem sentido

ignora-la. Se as descricoes forem de algum modo independentes das entradas das ferramen-

tas, esta informacao pode ser adicionada as entradas das ferramentas, mantendo as descricoes

linguısticas a salvo.

Nesta dissertacao, optou-se por manter as propriedades de flechagem separadas das entradas

da ferramenta que as utiliza, o Algas, e desenvolveu-se uma funcao que mapeia a informacao

das propriedades de flechagem nas entradas do Algas (o mesmo se passa em relacao as regras

semanticas e a ferramenta que as utiliza, o AsdeCopas). Estas funcoes encontram-se descritas

em [Coheur, 2004].

Considera-se ainda que sempre que se quiser distinguir as propriedades de flechagem das en-

tradas do Algas, referem-se as segundas chamando-lhes “setas”. Pelo contrario, e dado que,

por enquanto, nao foi acrescentada nenhuma informacao procedimental as entradas do Asde-

Copas, estas mantem a designacao de regras semanticas.

Deve-se notar que esta separacao nao impede que informacao de caracter procedimental seja

incluıda nas descricoes, dado que esta separacao depende da capacidade do responsavel pelo

enriquecimento das descricoes em classificar a informacao em causa, o que nem sempre e facil.

Page 233: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

198 CAPITULO 8. PROCESSAMENTO

8.2 Algas

8.2.1 Entradas/saıda

O Algas (Algoritmo Atribuidor de Setas) recebe um texto sobre o qual foi feita uma analise

de superfıcie e no qual se detectaram os modelos basicos, e devolve um texto com os modelos

flechados associados. Para realizar esta tarefa, o Algas conta com tres fontes de informacao:

• Hierarquias: informacao sobre as relacoes de subsuncao entre as etiquetas de modelos

e entre as etiquetas de categorias. As relacoes de subsuncao entre categorias, apesar de

serem dedutıveis das etiquetas atribuıdas, sao explicitamente definidas nas Hierarquias;

• Setas: informacao sobre as propriedades de flechagem em jogo. As setas sao as entradas

do Algas nas quais foi mapeada informacao proveniente das propriedades de flechagem.

Adicionalmente, as setas ainda permitem que se imponham distancias maximas de fle-

chagem. Em [Coheur, 2004] descreve-se em detalhe esta estrutura de dados;

• Modelos especiais: informacao sobre modelos que tem um tratamento particular, dado

que se assume que no seu interior todos os elementos flecham sobre a ultima posicao.

Como tipicamente no interior de um modelo nuclear todos os elementos flecham sobre

o ultimo elemento, todos os modelos nucleares apresentados no capıtulo 4 sao conside-

rados modelos especiais, evitando muitos calculos ao Algas, dado que a flechagem no

interior destes modelos fica assim pre-definida.

A figura 8.1 mostra as entradas/saıda do Algas. Note-se que as propriedades de flechagem

nao sao uma entrada directa no Algas.

Page 234: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

8.2. ALGAS 199

!"#$%"&'()&*+"&

!"#$%"&'

,%$+-.#"&

/0"10*$#.#$&'

#$',%$+-.2$34%2.&

5*$0.067*.&

!"#$%"&'

$&1$+*.*&

Figura 8.1: Entradas/saıda do Algas

8.2.2 Breve descricao do algoritmo

O calculo dos modelos flechados pode ser dividido em varias etapas: (i) identificacao de setas;

(ii) calculo do produto cartesiano; (iii) eliminacao de solucoes.

8.2.2.1 Identificacao das setas

O primeiro passo do Algas e associar a cada categoria ou modelo as suas hipoteses de flecha-

gem. Assim, por cada modelo dado, constroi-se um vector – denominado “vector geral” –

em que cada elemento (igualmente um vector) representa as hipoteses de flechagem de cada

posicao do modelo (note-se que cada posicao pode representar uma categoria ou um modelo).

Cada um desses vectores sao constituıdos por pares de naturais em que o primeiro elemento

representa a posicao da origem da seta1 e o segundo a posicao do alvo da seta.

1Este primeiro elemento e redundante dado que a posicao da origem coincide com a posicao ocupada pelo vectorno vector geral.

Page 235: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

200 CAPITULO 8. PROCESSAMENTO

Exemplo 132: Construcao do vector geral

Considere-se o modelo m-X:

(m A m B m C)X.

Considere-se ainda o conjunto de setas que se segue, em que se usa o sımbolo para demarcar as setas

das propriedades de flechagem, as quais utilizam o sımbolo→:

S1: A X B

S2: A X C

S3: B X B

S4: B X C

S5: C X C.

Com base no modelo m-X e nas setas apresentadas, constroi-se o vector V = [V1, V2, V3], em que:

V1 = [<1, 2>, <1, 3>]

V2 = [<2, 2>, <2, 3>]

V3 = [<3, 3>].

Tome-se, por exemplo, o vector V2, que esta associado a posicao 2, onde se encontra o elemento etique-

tado por B. Este vector contem o par <2, 2> devido a seta S3, que indica que um B pode flechar sobre

si. Por seu lado, o par <2, 3> deve-se a S4, pois esta seta relaciona um B com C (posicao 3). �

Tal como nas propriedades de flechagem, podem-se impor restricoes as setas. Quando se

constroi o vector geral, estas restricoes sao tidas em conta.

Exemplo 133: Construcao do vector geral e setas com restricoes

Suponha-se que a primeira seta do exemplo anterior passa a:

Page 236: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

8.2. ALGAS 201

S1’: A X B

- {C}.

Com esta nova seta, num modelo X, o A so pode flechar sobre o B, se nao existir um C. Como o modelo

m-X do exemplo anterior contem um C, o par <1, 2> nao podera existir nas potenciais hipoteses de

flechagem de A dadas pelo vector V1. Assim, o vector V1 passa a:

V1 = [<1, 3>]. �

8.2.2.2 Calculo do produto cartesiano

Depois de se saber quais as hipoteses de flechagem de cada posicao, e calculado o produto

cartesiano (PC) dos vectores calculados,2 obtendo-se um conjunto de hipoteses de flechagem

do modelo, ou seja, obtem-se um modelo flechado (que eventualmente nao respeitara as General

semantic conditons, apresentadas na seccao 3.1.2).

Exemplo 134: Calculo do produto cartesiano

Continuando com o exemplo anterior, obtem-se o vector

PC = [PC1, PC2, PC3, PC4]

em que cada posicao representa uma hipotese de flechagem:

PC1 = [<1, 2>, <2, 2>, <3, 3>]

PC2 = [<1, 2>, <2, 3>, <3, 3>]

PC3 = [<1, 3>, <2, 2>, <3, 3>]

PC4 = [<1, 3>, <2, 3>, <3, 3>].

2Esta decisao de usar o produto cartesiano e discutida nos capıtulos 9 e 10.

Page 237: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

202 CAPITULO 8. PROCESSAMENTO

Ou seja, obtem-se assim um modelo flechado com quatro hipoteses de flechagem. �

8.2.2.3 Eliminacao de solucoes

Finalmente, anulam-se algumas das hipoteses de flechagem anteriormente calculadas, de

acordo com os seguintes criterios, a que se chamara criterios de boa formacao dos modelos

flechados:

(1) unicidade do nucleo: existe no maximo um elemento que flecha sobre si;

(2) ciclos nao admitidos: nao se admitem ciclos formados pelas flechas;

(3) cruzamentos de flechas nao admitidos (projectividade): se dois elementos estao ligados

por flechas, nao pode haver um terceiro, que se encontre entre estes e que fleche sobre um

elemento exterior ao intervalo cujos limites sao a origem e o alvo da seta. Tambem nao

pode haver um terceiro elemento nesse intervalo que seja o alvo de uma flecha exterior

(ao intervalo).

(4) elementos que nao flecham condicionalmente admitidos: admitem-se elementos que nao

flechem sobre nenhum outro, desde que nao sejam o alvo de alguma flecha. Ou seja, se

num dado vector um elemento nao flecha sobre nenhum outro, mas e o alvo de uma ou

mais flechas, entao esse vector e eliminado.

Os exemplos seguintes ilustram cada uma destas imposicoes.

Exemplo 135: Unicidade do nucleo

No seguimento do exemplo anterior, aplicando o criterio da unicidade do nucleo, os vectores PC1 e PC3

sao eliminados, dado terem ambos dois elementos a flechar sobre si proprios. �

Page 238: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

8.2. ALGAS 203

Exemplo 136: Ciclos nao admitidos

Se atraves do produto cartesiano tivesse sido calculado o vector

[<1, 2>, <2, 3>, <3, 1>],

este seria eliminado, pois contem um ciclo. �

Exemplo 137: Cruzamento de flechas nao admitidos

Dado um modelo com quatro elementos, o vector

[<1, 3>, <2, 2>, <3, 2>, <4, 2>]

e eliminado, dado haver cruzamento de flechas (flechas <1, 3> e <4, 2>). �

Exemplo 138: Elementos que nao flecham condicionalmente admitidos

Dado um modelo com quatro elementos, o vector

[<2, 2>, <3, 2>, <4, 2>]

nao e eliminado, apesar de nao haver nenhuma hipotese de flechagem para a posicao 1. Isto deve-se ao

facto de nenhuma flecha ter esta posicao como alvo. Ao contrario, o vector

[<1, 3>, <3, 2>, <4, 3>]

e eliminado, dado nao haver nenhuma flechagem associada a posicao 2, e o terceiro elemento flechar

sobre esta posicao. �

Como se pode constatar, o Algas nao se rege pelas General Semantic Conditions impostas pelo 5P

sobre os modelos flechados (seccao 3.1.2), dado que permite a construcao de modelos em que

nem todos os elementos flecham sobre outro elemento (no entanto, cada modelo tem de ter um

e um unico nucleo). Esta decisao prende-se com o facto de que, mesmo com uma flechagem

Page 239: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

204 CAPITULO 8. PROCESSAMENTO

incompleta, se quer avancar para uma analise semantica, ainda que parcial.

Tal como no 5P, os ciclos nao sao permitidos. Ao contrario do 5P, que nao impoe restricoes

ao cruzamento de setas, os modelos flechados produzidos pelo Algas nao permitem que tal

se verifique. Frise-se que esta e uma situacao temporaria, que se implementou porque se esta

a trabalhar para o Portugues – em que tipicamente nao se verifica o cruzamento de setas –

permitindo eliminar muitas hipoteses erradas. Um dos objectivo a curto prazo e tornar este

criterio – bem como os outros criterios definidos anteriormente – uma opcao de utilizacao do

Algas.

8.2.3 Implementacao

O Algas esta implementado em C++, estando os seus dados de entrada e saıda codificados em

XML [W3C, nda].

8.3 Ogre

8.3.1 Entrada/Saıda

O Ogre (Obtentor de grafos de entrada) recebe um conjunto de modelos flechados e devolve

um grafo (figura 8.2). O grafo devolvido esta de acordo com a definicao de grafo apresentada

na seccao 3.3.5.3

3Note-se que os modelos flechados tambem podem ser vistos como grafos, cujos nos contem modelos flechados.

Page 240: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

8.3. OGRE 205

!"#$%"&'

(%$)*+#"&

,-+("

./-$

Figura 8.2: Entrada/saıda do Ogre

8.3.2 Breve descricao do algoritmo

O processamento efectuado pelo Ogre pode ser dividido nas seguintes etapas: (i) desdobra-

mento dos modelos flechados; (ii) separacao de modelos e numeracao; (iii) aplicacao da regra

de substituicao; (iv) construcao do grafo.

8.3.2.1 Desdobramento dos modelos flechados

O primeiro passo do Ogre consiste em transformar as varias hipoteses de flechagem de cada

modelo flechado em varios modelos flechados com uma unica hipotese de flechagem. Ou seja,

se um modelo flechado contem varios conjuntos de conjuntos de flechagem, entao e desdo-

brado em varios modelos flechados sendo cada um dos conjuntos do conjunto de flechagem

associado a um dos novos modelos.

Exemplo 139: Desdobramento dos modelos flechados

Dada a questao Qual a profundidade da maior gruta de Portugal?, apos o Ogre, o modelo flechado

Page 241: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

206 CAPITULO 8. PROCESSAMENTO

<(Int1 Nn2 Prepn3 Prepn4 Ponct5)Fint,

{{<1, 2>, <2, 2>, <3, 2>, <4, 2>}, {<1, 2>, <2, 2>, <3, 2>, <4, 3>}}>

e desdobrado nos seguintes modelos flechados:

<(Int1 Nn2 Prepn3 Prepn4 Ponct5)Fint, {{<1, 2>, <2, 2>, <3, 2>, <4, 2>}}>

e

<(Int1 Nn2 Prepn3 Prepn4 Ponct5)Fint, {{<1, 2>, <2, 2>, <3, 2>, <4, 3>}}> �

8.3.2.2 Separacao de modelos e numeracao

De seguida o Ogre executa varios procedimentos menores, destinando-se o primeiro a intro-

duzir um separador entre os varios modelos flechados. Este separador serve apenas para faci-

litar uma posterior leitura, ao permitir que o AsdeCopas possa separar as varias hipoteses de

analises por cada frase. O segundo procedimento associa um numero a cada categoria. Esta

numeracao e feita de acordo com a posicao que a palavra (ou sequencia de palavras) associ-

ada a essa categoria ocupa no texto. Como se vera na seccao 8.4.2.3, este procedimento esta na

base da geracao das variaveis pelo AsdeCopas, dado que o ındice das variaveis e dado por este

valor.

8.3.2.3 Aplicacao da regra de substituicao

A regra de substituicao [Bes, 1999b] indica que se um modelo m1 flecha sobre outro modelo

m2, entao o nucleo de m1 devera flechar sobre o nucleo de m2 (mantendo-se a autoflechagem

do modelo de topo). Ao aplicar-se esta regra obtem-se uma estrutura em que as relacoes de

Page 242: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

8.3. OGRE 207

flechagem entre modelos sao substituıdas pelas relacoes de flechagem entre os nucleos desses

modelos.

Esta regra e aplicada pelo Ogre do seguinte modo: as categorias sao percorridas, por ordem

crescente de posicao, sendo associada a cada uma o seu alvo de flechagem. Seja c1 a categoria

em analise:

1. se c1 nao flecha sobre si, mantem-se o alvo de flechagem;

2. se c1 flecha sobre si analisa-se o modelo onde esta inserido. Se este flecha sobre si proprio,

analisa-se o modelo onde, por sua vez, esta inserido, e assim sucessivamente ate ocorrer

uma das seguintes situacoes:

(a) atingir-se o modelo de topo. Neste caso c1 continua a flechar sobre si proprio;

(b) o modelo onde esta inserido nao flechar sobre si. Procura-se entao o elemento alvo

da flecha (denominado “elemento corrente”). De seguida:

i. analisa-se o elemento corrente;

ii. se o elemento corrente e uma categoria, c1 flecha sobre ele;

iii. se o elemento corrente e um modelo procura-se o seu nucleo, que passa a ele-

mento corrente, voltando-se a (i).

Apos a aplicacao desta regra, com base na informacao associada a cada palavra – categoria,

posicao no texto e alvo de flechagem – constroi-se um grafo, em que cada no contem:

• a palavra (ou sequencia de palavras);

• a categoria que lhe foi associada;

Page 243: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

208 CAPITULO 8. PROCESSAMENTO

• a posicao que ocupa no texto;

• um campo adicional, inicialmente vazio, que posteriormente pode ser enriquecido numa

nova aplicacao do AsdeCopas (veja-se a seccao 6.1 sobre este assunto);

Por sua vez, cada arco do grafo e constituıdo:

• pelas posicoes associadas ao no origem e ao no alvo.

A figura 8.3 representa o grafo devolvido pelo Ogre, para a questao Qual a profundidade da maior

gruta de Portugal?.

Figura 8.3: Grafo de saıda do Ogre

Page 244: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

8.3. OGRE 209

8.3.3 Implementacao

O Ogre esta implementado atraves de um conjunto de programas em XSLT [W3C, ndb,

Tidwell, 2001] e em Perl [Wall et al., 2000]. As entrada do Ogre sao as saıdas do Algas, pelo que

estao em XML. As sua saıdas sao clausulas de Horn. Ou seja, o grafo da figura 8.3 representa-se

como indicado no exemplo 140:

Exemplo 140: Saıda do Ogre, pergunta Qual a profundidade da maior gruta de portugal?

Apos ser processada pelo Ogre, a pergunta Qual a profundidade da maior gruta de portugal?, origina as

seguintes clausulas:

node(’Qual’, qual int, 108, ).

arc(108, 110, ).

node(’a’,artd s,109, ).

arc(109, 110, ).

node(’profundidade’,nc1 s,110, ).

node(’de’,de,111, ).

arc(111, 114, ).

node(’a’,artd s,112, ).

arc(112, 114, ).

node(’maior’,adj1 s,113, ).

arc(113, 114, ).

node(’gruta’,nc1 s,114, ).

arc(114, 110, ).

node(’de’,de,115, ).

arc(115, 116, ).

node(’Portugal’,npr1,116, ).

arc(116, 110, ).

node(’separador’,separador,117, ).

node(’Qual’, qual int, 118, ).

arc(118, 120, ).

node(’a’, artd s, 119, ).

arc(119, 120, ).

node(’profundidade’, nc1 s, 120, ).

node(’de’, de, 121, ).

Page 245: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

210 CAPITULO 8. PROCESSAMENTO

arc(121, 124, ).

node(’a’, artd s, 122, ).

arc(122, 124, ).

node(’maior’, adj1 s, 123, ).

arc(123, 124, ).

node(’gruta’, nc1 s, 124, ).

arc(124, 120, ).

node(’de’, de, 125, ).

arc(125, 126, ).

node(’Portugal’, npr1, 126, ).

arc(126, 124, ). �

8.4 AsdeCopas

8.4.1 Entradas/saıda

O AsdeCopas (Analisador Semantico depois de Completada a analise sintactica) recebe como

entrada um grafo e as regras semanticas, e devolve objectos diferentes consoante a aplicacao

em que esta a ser usado, podendo devolver, por exemplo, um novo grafo, formulas logicas ou

valores semanticos. Para realizar esta tarefa, para alem do grafo de entrada, o AsdeCopas conta

com tres fontes de informacao:

• Hierarquia de categorias: informacao relativa a subsuncao entre categorias; mais uma

vez, explicitam-se as relacoes de subsuncao entre as etiquetas das categorias;

• Regras semanticas: informacao proveniente das regras semanticas;

• Hierarquia das regras semantica: informacao que explicita as relacoes de subsuncao entre

as regras semanticas.

Page 246: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

8.4. ASDECOPAS 211

A figura 8.4 mostra as estruturas de entrada/saıda do AsdeCopas, supondo que a saıda sao

representacoes semanticas.

!"#$%

&'("')'*+#,-').)'/0*+12#)

&'3"#).)'/0*+12#)

4)5'6%(#)

71'"#"891#.5'.2#+'3%"1#)

71'"#"891#.5#)."'3"#)

Figura 8.4: Entradas/saıda do AsdeCopas

8.4.2 Breve descricao do algoritmo

O AsdeCopas percorre cada elemento do grafo por ordem crescente de posicao (note-se que

qualquer que seja a ordem percorrida, os resultados sao os mesmos), passando cada elemento

pelas seguintes etapas: (i) identificacao de potenciais regras a aplicar; (ii) escolha de regras; (iii)

aplicacao de regras. Seguidamente, o AsdeCopas passa para o elemento na posicao seguinte,

que se submete ao mesmo processo e assim sucessivamente. Explica-se de seguida cada uma

destas etapas.

8.4.2.1 Identificacao de potenciais regras a aplicar

A primeira tarefa do AsdeCopas, e, em cada posicao, procurar potenciais regras a disparar.

Uma regra semantica e uma potencial regra a disparar se verificar as condicoes de aplicabili-

Page 247: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

212 CAPITULO 8. PROCESSAMENTO

dade de uma regra, tais como definidas na seccao 3.3.5. Todas as regras semanticas apresenta-

das nos capıtulos 6 e 7 tem no maximo um elemento a traduzir, pelo que o facto de o AsdeCopas

percorrer os elementos do grafo um a um, analisado cada posicao individualmente, se adapta

sem problemas a estas regras (o que inclui o caso em que nao ha nenhum elemento a traduzir,

que unifica com qualquer elemento). No entanto, na definicao formal das regras semanticas

do capıtulo 3, cada regra pode traduzir mais do que um elemento, estando previsto que cada

regra com mais de um elemento a traduzir seja mapeada em varias regras semanticas (uma por

cada elemento), em que apenas numa se produzem resultados. Este assunto e detalhado em

[Coheur, 2004]. Por agora, assuma-se que cada regra semantica tem no maximo um elemento a

traduzir.

Exemplo 141: Identificacao de regras a aplicar

Seja dada a frase Qual a area de Portugal?, a qual o Ogre associa o seguinte grafo:

node(’Qual’, qual int, 831, ).

arc(831, 833, ).

node(’a’, artd s, 832, ).

arc(832, 833, ).

node(’area’, nc1 s, 833, ).

arc(833, 833, ).

node(’de’, de, 834, ).

arc(834, 836, ).

node(’Portugal’, npr1, 834, ).

arc(834, 832, ).

e relembre-se a regra semantica que se segue:

[R2] {elem( , npr, X1)} : ∅# {NAME(var(X1), sem(X1)}

Supondo que o AsdeCopas esta a avaliar o no 834 do grafo, que contem a palavra Portugal,

como o no 834 contem um npr1 e nprv npr1, a regra semantica R2 pode ser-lhe aplicada. Deste

Page 248: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

8.4. ASDECOPAS 213

modo, para a posicao 834 encontrou-se uma regra semantica a aplicar: a regra R2. Note-se que

a variavel X1 unifica com o valor 834. �

8.4.2.2 Escolha de regras

A fase seguinte consiste em escolher, de entre as regras semanticas encontradas na etapa an-

terior, as mais especıficas. Estas sao as regras que nao subsumem nenhuma outra regra do

conjunto encontrado. Note-se que pode ser disparada mais do que uma regra. No caso do

exemplo anterior, apenas uma regra podia ser disparada, pelo que nao ha escolhas a fazer.

8.4.2.3 Aplicacao de regras

O passo final consiste em aplicar a(s) regra(s) seleccionadas na etapa anterior. Deve-se notar

que no AsdeCopas se faz uma geracao controlada de variaveis, assumindo que cada posicao

do texto tem um conjunto de variaveis associadas, cujo ındice e dado pelo valor da posicao.

Assim, quando o AsdeCopas gera uma variavel, fa-lo com base nesta regra. Note-se que

nesta geracao de variaveis se inclui a possıvel geracao de handles, tal como definidos em

[Copestake et al., 2001] (este assunto e explorado em [Coheur et al., 2004b]).

Este controlo de variaveis permite que uma regra semantica “conheca” as variaveis associadas

aos elementos que fazem parte do seu contexto. Se as variaveis fossem geradas aleatoriamente,

a regra teria de esperar pelo calculo destas variaveis e dependeria de outras regras.

Outro ponto a destacar e a geracao dinamica de formulas feita pelo AsdeCopas. Como nao se

dispoe de um lexico com informacao semantica, esta e simulada pelo AsdeCopas recorrendo a

Page 249: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

214 CAPITULO 8. PROCESSAMENTO

propria palavra.

Exemplo 142: Aplicacao de regras

No seguimento do exemplo anterior, aplicando-se a regra R2, obtem-se o seguinte resultado:

R2: NAME(x834, Portugal).

Neste exemplo, a variavel x834 representa um objecto de nome Portugal, tendo-se assumido

que a constante Portugal e o resultado da funcao sem aplicada a X1 (unificado com 834), ou

seja, e o resultado da funcao sem aplicada ao elemento na posicao 834. �

8.4.3 Implementacao

O AsdeCopas esta implementado em Prolog e opera sobre varios ficheiros contendo clausulas

de Horn, dependendo o formato dos seus dados de saıda do que se quer produzir.

8.5 Resumo e Conclusoes

Neste capıtulo explicou-se brevemente a exigencia do 5P em relacao a separacao entre as

descricoes linguısticas e a informacao de cariz procedimental, e apresentou-se o Algas, o Ogre e

o AsdeCopas. O Algas nao segue completamente as General semantic conditions do 5P, dado que

aceita como modelos flechados, modelos em que nem todas as posicoes sao a origem de uma

flecha, permitindo assim analises parciais nestas situacoes. Deve-se notar que o Algas se rege

por um conjunto de criterios – os criterios de boa formacao dos modelos flechados – que sao

independentes do algoritmo utilizado e que, de futuro, serao opcoes de utilizacao. Destaca-se

Page 250: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

8.5. RESUMO E CONCLUSOES 215

ainda o controle de variaveis do AsdeCopas – se uma palavra origina uma variavel, a posicao

no texto que ocupa e o ındice dessa variavel – e a geracao dinamica de formulas logicas, deri-

vada do facto de nao se dispor de informacao semantica lexical.

Page 251: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

216 CAPITULO 8. PROCESSAMENTO

Page 252: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

9 ���7�,*��U4�+6�<

Neste capıtulo faz-se uma avaliacao preliminar da interface sintaxe/semantica. Preliminar,

pois o conjunto de testes e muito pequeno, e nao foi possıvel comparar quantitativamente esta

interface com interfaces de outros sistemas.

A organizacao deste capıtulo e a seguinte: na seccao 9.1 a interface foi testada em relacao a

sua capacidade em chegar as representacoes logicas desejadas no domınio das interrogacoes.

Discute-se ainda a implementacao do Algas (seccao 9.2) e o passo executado pelo Ogre (seccao

9.3). Termina-se a avaliacao na seccao 9.4 comparando a interface com a do sistema Edite,

dedicando-se a seccao 9.5 aos principais cuidados a ter na utilizacao das regras semanticas.

Fecha-se o capıtulo na seccao 9.6, com um resumo e conclusoes.

9.1 Interpretacao de questoes

A avaliacao do Algas e do AsdeCopas foi feita individual e conjuntamente. Em ambos os casos

parte-se de uma analise de superfıcie manualmente corrigida. No caso da avaliacao conjunta,

os resultados do Algas, depois de processados pelo Ogre, entram directamente no AsdeCopas.

No caso da avaliacao individual, os resultados do Algas sao corrigidos e so depois passados ao

Ogre e AsdeCopas. Fizeram-se ainda testes adicionais ao Algas, impondo distancias maximas

de flechagem as setas que tem os modelos preposicionais (bem como alguns adjectivais) como

Page 253: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

218 CAPITULO 9. AVALIACAO

origem.

9.1.1 Corpus de teste

Das 680 perguntas do Corpete foram extraıdas 50 perguntas, tentando cobrir o maior numero

possıvel de construcoes. Como apenas dez pessoas participaram na construcao deste corpus,

sao muitas as estruturas sintacticas repetidas, pelo que se optou pela extraccao manual em

detrimento de uma extraccao aleatoria. Sobre este pequeno corpus (doravante o Corpete de

teste1) foram feitos alguns pre-tratamentos: (i) eliminaram-se coordenacoes (por exemplo, Exis-

tem restaurantes ou hoteis no Parque Nacional de Sintra? foi transformada em Existem restaurantes

no Parque Nacional de Sintra?), (ii) agruparam-se atraves do Pasmo algumas sequencias, nome-

adamente:

• alguns termos compostos (por exemplo, pousada de juventude);

• nomes de terras (por exemplo, Castelo Branco);

• nomes de monumentos (por exemplo, Mosteiro dos Jeronimos).

Estes tratamentos foram feitos por duas razoes: como a coordenacao nao e tratada na analise

sintactica nem nas analises posteriores, nao tem sentido avaliar a interface sintaxe/semantica

sobre um conjunto de construcoes para as quais nao foi pensada. Por outro lado, num sistema

real, as sequencias agrupadas pelo Pasmo seriam tambem consideradas como um todo, sendo

este processo de reagrupamento de palavras comum em muitos sistemas de processamento de

Lıngua Natural (tal como e apontado em [Katz et al., 1998] e [Milward, 1999], existem estru-

1Assuma-se que Corpete - Corpete de teste = Corpete de desenvolvimento.

Page 254: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

9.1. INTERPRETACAO DE QUESTOES 219

turas – tais como datas, numeros e termos compostos – que, sendo tratadas individualmente

simplificam a cadeia de processamento). No entanto, deve ser claro que o funcionamento da

maquinaria informatica nao depende destas simplificacoes. Ou seja, dado o Corpete de teste

original continuam a obter-se formulas logicas, sendo apenas piores os resultados, como ilus-

tram os exemplos que se seguem.

Exemplo 143: Coordenacao

Em relacao a coordenacao, dada a questao Existem restaurantes ou hoteis no Parque Nacional de Sintra?, os

resultados sao os seguintes:

R24: ?existe(e1, x2)

R1: restaurantes(x2)

R1: hoteis(x3)

R7: em(x2, x6)

R2: NAME(x6, Parque Nacional de Sintra)

R24: ?existe(e8, x9)

R1: restaurantes(x9)

R1: hoteis(x10)

R7: em(x10, x13)

R2: NAME(x13, Parque Nacional de Sintra)

Como nao estao previstas nem propriedades de flechagem nem regras semanticas para a coordenacao, o

modelo preposicional no Parque Nacional de Sintra tem duas hipoteses de flechagem distintas (sobre hoteis

ou sobre restaurantes), sendo estas hipoteses consideradas em duas analises distintas e nao numa unica.

Em relacao ao foco da pergunta, o sistema considerou que o pedido era feito apenas sobre restaurantes.

Exemplo 144: Agrupamentos do Pasmo

Em relacao aos agrupamentos de palavras feito pelo Pasmo, estes apenas evitam que se criem formulas

como:

Page 255: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

220 CAPITULO 9. AVALIACAO

R1: Parque(x429)

R7: de(x426, x432)

R1: Nacoes(x432)

em vez de:

R2: NAME(x429, Parque das Nacoes) �

Em resumo, o Corpete de teste foi tratado ate nao existirem palavras desconhecidas, nem

coordenacoes, tendo-se agrupado alguns termos compostos. De seguida, este corpus foi pro-

cessado pelo Smorph, Pasmo e Susana. A tıtulo de curiosidade, foi igualmente processado pelo

Tira-Teimas (veja-se o apendice A sobre este processamento). Os modelos basicos resultantes

do processamento do Susana foram manualmente corrigidos ate existir um modelo basico por

questao, correspondendo esse modelo basico a particao desejada. A este corpus chama-se Su-

sana de referencia.

9.1.2 Avaliacao do Algas

9.1.2.1 Dados de entrada

Para alem do Corpete de teste manualmente corrigido, o Algas recebe como entrada:

• Hierarquias: declaracao explıcita das relacoes de subsuncao entre as etiquetas de catego-

rias e de modelos usadas no capıtulo 4;

• Setas: conjunto de setas resultantes do mapeamento das propriedades de flechagem apre-

sentadas no capıtulo 5. Das propriedades de flechagem apresentadas em 5 foi apenas

eliminada a propriedade que permite relacionar a relativa a um modelo preposicional,

Page 256: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

9.1. INTERPRETACAO DE QUESTOES 221

dado que nunca foi observada no Corpete de desenvolvimento (sobre este assunto veja-

-se 10.2.2 em que se discute a necessidade de atribuir pesos as propriedades);

• Modelos especiais: um conjunto de etiquetas de modelos, no interior dos quais se consi-

dera que todos os elementos flecham sobre o nucleo. Este conjunto de etiquetas compre-

endeu todas as etiquetas de modelos do capıtulo 4, com a excepcao de Fint.

A avaliacao do Algas foi ainda feita sobre dois outros conjuntos de setas: no primeiro, impos-se

uma distancia de 1 a todas as setas que tem como origem um modelo preposicional nuclear ou

um modelo adjectival nuclear; no segundo, uma distancia de 2 para as mesmas setas.

9.1.2.2 Construcao do corpus de referencia, a saıda do Algas

O Susana de referencia foi processado pelo Algas (com as entradas descritas na seccao 9.1.2.1),

tendo sido manualmente construıdo, a partir dos resultados obtidos, um corpus de referencia,

em que cada questao tem o modelo flechado desejado associado. Esse modelo flechado e um

par constituıdo pelo modelo basico associado pelo Susana a questao, e por um conjunto de

hipoteses de flechagem que representam as ligacoes desejadas entre os elementos do modelo

basico. A cada um desses modelos flechados chama-se modelo flechado correcto (MFC). Ao

corpus de referencia assim construıdo chama-se Algas de referencia.

9.1.2.3 Metricas

Suponha-se que:

• NQ representa o numero de questoes em analise;

Page 257: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

222 CAPITULO 9. AVALIACAO

• um modelo flechado resultado (MFR) e um par constituıdo por um modelo basico e um

conjunto de hipoteses de flechagem, em que este conjunto representa as ligacoes que o

sistema estabeleceu entre os elementos do modelo basico.

Usam-se as seguintes metricas:

• media: numero de MFRNQ

;

• precisao: numero de MFCnumero de MFR

;

• cobertura: numero de MFCNQ

.

9.1.2.4 Resultados

O Susana de referencia foi processado pelo Algas tres vezes. No primeiro processamento, usou-

-se o conjunto de setas proveniente das propriedades de flechagem do capıtulo 5; no segundo,

impos-se a ja mencionada distancia de 1 as setas que tem um modelo preposicional ou adjecti-

val na origem; no terceiro, impos-se uma distancia de 2 a estas mesmas setas. Seguidamente,

estes tres resultados foram comparados com o Algas de referencia, onde se encontravam os

MFC . A tabela 9.1 mostra os resultados desta avaliacao.

– Setas simples d = 1 d = 2media 2,5 (125/50) 1,04 (52/50) 1,5 (75/50)

precisao 0,38 (47/125) 0,62 (32/52) 0,59 (44/75)cobertura 0,94 (47/50) 0,64 (32/50) 0,88 (44/50)

Tabela 9.1: Resultados do Algas

Saiba-se que se se eliminar um resultado particularmente mau (42 analises), a precisao da pri-

meira avaliacao sobe para 0,55 (46/83).

Page 258: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

9.1. INTERPRETACAO DE QUESTOES 223

9.1.2.5 Analise dos resultados

Da analise destes resultados pode-se concluir que:

• a cobertura e razoavel, mas a precisao nao. Este facto deve-se em grande parte as setas

que tem os modelos preposicionais (e alguns adjectivais) como origem (a precisao passa

de 38% para 62%, quando se impoe uma distancia de flechagem a estas setas);

• a distancia de 1 e bastante restritiva – a cobertura desce para 64% – mas a distancia de

d=2, praticamente mantem a cobertura, aumentando bastante a precisao.

Saiba-se ainda que o facto de nao se trabalhar com informacao relativa a genero nao foi a cau-

sadora de nenhum erro nesta etapa.

9.1.3 Avaliacao do AsdeCopas

9.1.3.1 Dados de entrada

Nesta avaliacao, para alem das regras semanticas mapeadas nas entradas do AsdeCopas, e

da hierarquia de categorias apresentadas no capıtulo 6, o AsdeCopas recebe como entrada

um grafo – o Ogre de referencia – que resulta do processamento do Ogre sobre o Algas de

referencia.

Page 259: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

224 CAPITULO 9. AVALIACAO

9.1.3.2 Construcao do corpus de referencia

O AsdeCopas processou o Ogre de referencia, tendo os seus resultados sido corrigidos manu-

almente e construindo-se o AsdeCopas de referencia, em que cada questao tem um conjunto

de formulas associadas, que constitui a representacao desejada da questao. A este conjunto de

formulas associado a uma questao chama-se representacao correcta (RC).

9.1.3.3 Metricas

De acordo com as regras semanticas actuais, e dado que se supoem valores semanticos subes-

pecificados, o AsdeCopas associa uma unica representacao (constituıda por varias formulas)

a cada grafo. Chama-se a essa representacao, representacao resultado (RR).2 Assim, como

nesta avaliacao do AsdeCopas se usa o Algas de referencia, cada questao tem apenas um grafo

associado, pelo que cada questao vai ter apenas uma RR associada.

Para esta avaliacao consideram-se as seguintes metricas baseadas nas usadas no Senseval, na

tarefa denominada Logic Forms.3 A avaliacao e feita sobre cada RR. Assim, seja:

• FR (formula resultado) uma formula de uma RR;

• FC (formula correcta) uma formula de uma RR, em que o predicado e o correcto, e os

argumentos sao exactamente os desejados.

• NFC o numero de FC de cada RC (resultado correcto).

2Note-se que nao se exige que a frase so tenha uma interpretacao: como se permitem valores subespecificados,uma unica representacao pode encapsular varias interpretacoes. Por exemplo, a palavra altura em Em que alturase pode skiar na Serra da Estrela? pode ser interpretada de duas maneiras: em que altura do ano, ou a que alturaem metros, assumindo-se que altura(x) representa uma formula subespecificada que representa estes diferentessignificados.

3No Senseval faz-se ainda uma avaliacao sobre os argumentos das formulas.

Page 260: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

9.1. INTERPRETACAO DE QUESTOES 225

As metricas usadas sobre cada RR sao as seguintes:

• precisao: numero de FCnumero de FR

;

• cobertura: numero de FCNFC

.

Adicionalmente ainda se usa a metrica “numero de representacoes exactas”, que e dada pelo

numero de RR em que: precisao = cobertura = 1.

9.1.3.4 Resultados

Das 50 questoes analisadas foram encontradas 45 representacoes exactas. As 5 RR que nao

coincidiram com a RC , foram avaliadas de acordo com as metricas apresentadas, para que se

percebesse qual a sua “distancia” a RC .

No da frase Precisao Cobertura23 0,86 (6/7) 1 (6/6)28 0,85 (7/8) 0,85 (7/8)37 1 (12/12) 0,92 (12/13)40 1 (8/8) 0,8 (8/10)42 0,86 (6/7) 0,75 (6/8)

Tabela 9.2: Resultado AsdeCopas, avaliacao individual

Tome-se, por exemplo, a frase 37. Das 12 FR devolvidas, 12 sao tambem FC (precisao = 100%).

No entanto, a frase devia ter originado 13 FC , pelo que a cobertura e de 92%.

Page 261: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

226 CAPITULO 9. AVALIACAO

9.1.3.5 Analise dos resultados

A primeira conclusao que se pode tirar e que as RR estao bastante proximas da RC . Uma das

principais causas dos erros das RR e a ausencia de regras semanticas especıficas para essas

situacoes. Por exemplo, a questao 28, Quais os parques naturais do continente com uma area supe-

rior a 10820 hectares, tem a formula n(x197) = 10820 hectares associada (em que x197

e a variavel associada a area), em vez de n(x197) > 10820 hectares. Esta situacao era

esperada, pois apenas se definiu uma regra para os cardinais (seccao 6.8). Do mesmo modo, a

questao 37, Quais as Igrejas de Lisboa que estao abertas ao culto todos os dias da semana?, tem uma

FC a menos, pois nao ha nenhuma regra semantica que relacione dias com aberto. O mesmo se

passa com a questao 40, Dos mosteiros de Lisboa, quais e que foram construıdos no tempo de D. Joao

II?. Neste caso a partıcula interrogativa esta associada a um nome comum mosteiros, que recebe

uma seta de uma preposicao, nao tendo este caso sido previsto.

O erro da questao 23 Quanto tempo demora a percorrer a Serra do Caldeirao? deve-se mais a um

pre-tratamento que deveria ser efectuado que a ausencia de regras semanticas, pois a palavra

demora poderia ter sido associada a palavra tempo.

Quanto a questao 42, Em que data foi o Castelo de Sao Jorge conquistado aos Mouros?, o Castelo de Sao

Jorge foi associado como arg2 de foi (veja-se capıtulo 6), e nao se estabeleceu nenhuma relacao

entre este verbo e a palavra conquistado.

Em conclusao, 10% das representacoes obtidas para cada questao nao estao totalmente correc-

tas, mas estao muito proximas das representacoes desejadas.

Page 262: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

9.1. INTERPRETACAO DE QUESTOES 227

9.1.4 Avaliacao conjunta

Na avaliacao que se segue, nao sao corrigidas as saıdas do Algas. Ou seja, entra no Ogre o

Corpete de teste processado pelo Algas, e nao o Algas de referencia.

9.1.4.1 Dados de entrada

O texto de entrada e o Susana de referencia, ja usado para a avaliacao do Algas. Usam-se

igualmente os dados ja utilizados na avaliacao do Algas, nao se impondo nenhuma distancia

as setas nesta avaliacao.

9.1.4.2 Construcao do corpus de referencia

Como corpus de referencia usa-se nesta avaliacao o AsdeCopas de referencia, introduzido na

seccao 9.1.3.2.

9.1.4.3 Metricas

Dado que o AsdeCopas nao faz a seleccao de uma unica representacao do conjunto das RR

obtidas por cada questao, ou seja, cada questao pode ter varias RR associadas, introduziram-

-se outras metricas:

• media: numero de RRNQ

;

• precisao: numero de RCnumero de RR

;

Page 263: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

228 CAPITULO 9. AVALIACAO

• cobertura: numero de RCNQ

.

9.1.4.4 Resultados

Os resultados obtidos sao os da Tabela 9.3.

– Setas simplesmedia 2,5 (125/50)

precisao 0,35 (44/125)cobertura 0,88 (44/50)

Tabela 9.3: Resultado da avaliacao conjunta

9.1.4.5 Analise dos resultados

As analises efectuadas pelo Algas que nao resultam em MFC(modelos flechados correctos)

nao originam RC . Sao os casos das perguntas 33, 37 e 40. A estas questoes, a etapa da res-

ponsabilidade do AsdeCopas, acrescenta alguns erros. Nomeadamente, as questoes 23, 28 e 42

(discutidas anteriormente) tem RRs que nao coincidem com a RC .

9.1.5 Outras avaliacoes

Analisando o Corpete de teste, as regras do Pasmo descritas na seccao 4.2.2.5 e responsaveis

pela desambiguacao da palavras que e onde, bem como a flechagem dos modelos m-Onde des-

critas na seccao 5.6.3, permitem tratar correctamente, como partıculas relativas ou interrogati-

vas 100% dos casos. Tambem as regras semanticas, descritas no capıtulo 6, permitem identificar

o foco da questao em 100% dos casos.

Page 264: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

9.2. ALGAS 229

9.2 Algas

O Algas baseia o seu algoritmo no produto cartesiano, pelo que nao conseguem analisar fra-

ses muito compridas e/ou que envolvam muitas hipoteses de flechagem. Como frases muito

compridas, mas sem muita ambiguidade de flechagem nao causam problemas, e frases cur-

tas, mesmo muito ambıguas, tambem nao constituem um problema, nao e possıvel avancar

numeros. Em tracos gerais, pode-se dizer que o Algas comporta-se como o primeiro algo-

ritmo descrito em [Courtin e Genthial, 1998], igualmente combinatorio, que segundo os auto-

res, constroi rapidamente estruturas de dependencia, desde que a frase nao seja demasiado

longa e/ou ambıgua.

Ora as questoes que exprimem interrogacoes a uma base de dados, nao sao tipicamente frases

muito compridas nem muito ambıguas, pois o utilizador quer fazer-se compreender. Deste

modo, optou-se pelo produto cartesiano. Consegue-se ainda com esta abordagem dispor de

todas as hipoteses de flechagem e decidir posteriormente o que fazer com elas. Por outro lado,

a possibilidade de impor distancias a flechagem, bem como as proprias restricoes de flechagem,

permitem contornar o problema de ter frases muito longas.

Sobre as futuras extensoes a fazer ao Algas veja-se a seccao 10.2.3. Note-se, no entanto, que

quaisquer que sejam as possibilidades futuras do Algas, a tarefa que este prototipo realiza

actualmente representa o primeiro passo de processamento, dado que nao se eliminam possi-

bilidades reais de flechagem.

Page 265: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

230 CAPITULO 9. AVALIACAO

9.3 Ogre

A proposta do 5P para a interface nao exige o passo executado pelo Ogre, em que se passa a tra-

balhar apenas com relacoes entre palavras/categorias e nao modelos. As duas primeiras pro-

postas de interfaces para o 5P, descritas em [Bes, 2000] e [Coheur e Mamede, 2002], trabalham

directamente sobre modelos flechados. Na primeira, um conjunto de funcoes semanticas e de-

finido sobre as flechas, indicando como devem ser combinadas as variaveis das suas origens e

alvos. A segunda, opera igualmente sobre um conjunto de ligacoes entre modelos, usando um

conjunto de funcoes semanticas pre-definidas para calcular formulas logicas. Como nenhuma

destas interfaces foi implementada, nao e possıvel avaliar realmente a (in)dispensabilidade do

Ogre.

O objectivo do Ogre e manter as regras semanticas mais independentes dos modelos escolhi-

dos. Assim, optou-se por incorporar o Ogre na interface, extraindo um conjunto de relacoes

entre palavras, implıcitas nos modelos flechados. Por exemplo, considerem-se as sequencia o

gato gordo e o gordo gato. As particoes em modelos flechados sao, respectivamente, as seguintes:

<(o1 gato2)Nn, {{<1, 2>, <2, 2>}}>

<(gordo1)An, {{<1, 1>}}>

<(Nn An...)Fint, {{<2, 1>}}>4

e

<(o1 gato2 gordo3)Nn, {{<1, 2>, <2, 2>, <3, 2>}}>

4Deixa-se indefinida a flechagem do Nn. Podera flechar sobre si ou nao.

Page 266: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

9.4. COMPARACAO COM O SISTEMA EDITE 231

Apos o Ogre, posicoes a parte, obtem-se a mesma estrutura para ambos os modelos:

node(o, artd s, X, ).

node(gato, nc1 s, Y, ).

node(gordo, adj1 s, Z, ).

arc(X, Y, ).

arc(Z, Y, ).

As regras semanticas sao entao definidas sobre estas estruturas, permitindo que estruturas

identicas provenientes de modelos distintos, sejam tratadas do mesmo modo.

No entanto, ha um ponto em que o Ogre deve ser criticado, pois mesmo abstraindo as relacoes

entre palavras, poderia ter mantido informacao relativa aos modelos em que se encontravam

as palavras. Esta informacao teria poupado trabalho as regras semanticas. Como se viu, foi

necessario definir nas regras semanticas que os nomes proprios (entre outros) tem um dado

comportamento quando nao recebem a flecha de uma preposicao. Ora, estes so recebem a fle-

cha de uma preposicao se originalmente estivessem no interior de um modelo preposicional. Se

esta informacao fosse guardada por cada elemento, mesmo continuando-se a trabalhar com as

relacoes de flechagem entre palavras, nao haveria necessidade de acrescentar flechas ausentes

a tantas regras.

9.4 Comparacao com o sistema Edite

Como nao se dispoe actualmente nem do Edite, nem de dados sobre os seus resultados, nao

e possıvel fazer uma comparacao quantitativa entre as duas interfaces. Assim, comeca-se por

Page 267: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

232 CAPITULO 9. AVALIACAO

falar na cobertura sintactica dos dois sistemas. Depois, apresenta-se um conjunto de possibili-

dades da interface actual, que o Edite nao dispoe; avaliam-se a interfaces em relacao a robustez;

e indicam-se alguns problemas do Edite, que nao afectam a interface aqui descrita.

9.4.1 Cobertura

A gramatica do Edite aceita alguns elementos coordenados, por exemplo, aceita Quais sao os

hoteis com piscina e discoteca?. Quando a coordenacao passou a fazer parte do domınio sintactico

do Edite, os problemas de sobre-geracao aumentaram (infelizmente, nao se dispoe de numeros

para ilustrar este aumento). O Algas e o AsdeCopas ignoram a coordenacao. Nao deixam de

operar sobre elementos coordenados, mas dado que nao estao preparados para lidar com eles,

tambem nao calculam os resultados exactos, como alias se mostrou na seccao 9.1.1. Esta e uma

vantagem do sistema Edite, e que adia uma comparacao mais precisa entre as duas interfaces.

9.4.2 Utilizacao do contexto sintactico

A analise semantica do Edite e feita num processo de baixo para cima, nao sendo consultados

os nıveis acima no processo de construcao das formulas (tipicamente, isto aplica-se as interfaces

da famılia do Edite). Do mesmo modo, as regras semanticas sao definidas apenas em funcao

das regras sintacticas a que estao associadas. Assim, por exemplo, a regra semantica associada

a regra sintactica SV → V, nao tem em conta os elementos que o V pode conter. Por estas

razoes, mesmo que o contexto sintactico permita resolver ambiguidades semanticas, o Edite

nao consegue aproveitar essa informacao. Como exemplo, considere-se a palavra qualquer, em

estudo no capıtulo 7. Como se viu, esta palavra pode ter um conjunto de valores semanticos,

Page 268: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

9.4. COMPARACAO COM O SISTEMA EDITE 233

tendo-se assumido, na seccao 7.3.6.2, que em posicao pos-nominal a direita do verbo, estando

o verbo negado, toma o valor vulgar (ex: O Ritz nao e um hotel qualquer!).

Considere-se o fragmento da gramatica da Figura 9.1. Um analisador que opere de baixo para

cima nao deita fora os valores desnecessarios, pois no ponto (1), quando finalmente se tem uma

visao geral do contexto, a regra semantica associada a este ponto nao toma em consideracao a

negacao no interior do V.

Figura 9.1: Processo de baixo para cima: ausencia de visao global

9.4.3 Controle de hipoteses sintacticas

A analise sintactica do Edite pode ser vista como correspondendo as etapas executadas pelo

Susana e Algas. Se o Edite gera varias arvores por cada analise sintactica distinta, o analisa-

dor de superfıcie Susana segmenta o texto em estruturas minimais subespecificadas, sobre as

quais opera o Algas, que ao estabelecer relacoes entre os varios modelos, identifica as possıveis

analises sintacticas.

Exemplo 145: Estruturas minimais subespecificadas

Considere-se seguinte frase, baseada num exemplo classico:

Vi o homem no monte com os binoculos.

Page 269: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

234 CAPITULO 9. AVALIACAO

O Edite gera varias arvores: numa o sintagma preposicional com os binoculos esta ao nıvel do sintagma

nominal, fazendo ambos parte do complemento directo do verbo; noutra e um modificador do sintagma

nominal o homem; etc. O Susana, por sua vez, devolve a seguinte analise de superfıcie:

(vi)Vn (o homem)Nn (no monte)Prepn (com os binoculos)Prepn

ficando a cargo do Algas indicar as possıveis hipoteses de ligacao dos Prepns. �

Estes sao dois processos de obtencao do mesmo resultado. No entanto, a interface sintaxe-

semantica desenvolvida nesta dissertacao e mais flexıvel em algumas situacoes, que se expli-

cam de seguida.

Para comecar, note-se que impor o nao cruzamento de flechas na frase do exemplo anterior

pode anular uma possibilidade (o homem tem binoculos, e o orador viu no monte). O Algas,

dado que a projectividade e um imposicao temporaria, executada numa segunda etapa – seccao

8.2 – pode vir a aceitar esta hipotese. O Edite, ao contrario, e incapaz de o fazer, dado que a

estrutura em arvore nao permite ramos cruzados. Esta e alias uma vantagem das gramaticas

de dependencia sobre as ditas de constituintes [Covington, 1990, Debusmann, 2000].

Outra vantagem da interface desenvolvida sobre a interface sintaxe/semantica do Edite diz

respeito a possibilidade de limitar as distancias de flechagem exteriormente ao processamento.

O Edite, baseado em regras recursivas, dificilmente incorporara esta informacao nas regras. O

mesmo se passa em relacao as restricoes sobre as propriedades de flechagem.

9.4.4 Robustez

De acordo com [Aıt-Mokhtar et al., 2002], um sistema diz-se robusto se:

Page 270: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

9.4. COMPARACAO COM O SISTEMA EDITE 235

• for capaz de produzir pelo menos uma analise (nem que seja parcial) de cada entrada;

• for capaz de limitar o numero de hipoteses de analises, ou, pelo menos, ordena-las.

O nao apresentar solucoes e um dos grandes problemas de muitos sistemas, que consideram

agramatical tudo o que nao conseguem reconhecer. O analisador sintactico do Edite e inca-

paz de produzir analises parciais: se nao conseguir analisar sintactica ou semanticamente uma

frase, nao da nenhuma resposta.

O Algas, na maioria dos casos (veja-se o capıtulo 10 sobre este assunto), e capaz de devolver

analises parciais, em que apenas alguns modelos flecham. O AsdeCopas, baseado nas regras

semanticas, acaba sempre por devolver analises parciais, nem que sejam resultantes do disparo

de regras genericas. Claro que e discutıvel se se prefere ter informacao parcial ou nenhuma

resposta caso nao se consiga dar uma resposta exacta, pois uma resposta parcial pode induzir

em erro. Por exemplo, se a pergunta Quais os parques de campismo que nao exigem cartoes de cam-

pista?, a resposta forem todos os parque de campismo que exigem cartao de campista, porque

o sistema nao trata a negacao, se calhar e melhor nao ter resposta nenhuma. No entanto, e

como se viu na seccao 9.1.3.5, uma representacao incompleta pode guardar grande parte da

informacao da pergunta.

Quanto a capacidade de limitar o numero de hipoteses, apesar do Edite nao usar uma heurıstica

elaborada – escolhia a representacao com mais formulas e, em caso de empate, escolhia a pri-

meira – sobre o Algas e sobre o AsdeCopas ainda nao se fez nenhum trabalho de ordenacao de

solucoes (veja-se o capıtulo 10). A interface do Edite esta pois neste ponto a frente da interface

descrita nesta tese.

Page 271: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

236 CAPITULO 9. AVALIACAO

Em conclusao, nenhuma das interfaces pode ser considerada robusta actualmente, de acordo

com a definicao acima apresentada. O Edite porque falha no primeiro ponto, a interface sin-

taxe/semantica desta dissertacao porque falha no segundo.

9.4.5 Valores inesperados

Uma regra sintactica do Edite que seja mais generica pode levar a que a regra semantica que

lhe for associada seja obrigada a lidar com comportamentos semanticos variados.

Exemplo 146: Valores inesperados

Suponham-se as seguintes regras do Edite:

SP→ prep SN {S (?SN 2 ?prep)}

SN→ N {?N}

N→ det nc {?nc}

N→ npr {?npr}

Supondo que a semantica associada a um nome proprio e uma constante (Ritz) e a semantica associada

a um nome comum e uma formula unaria (hotel(x)), a semantica associada ao SN pode ser de um

destes tipos. Como resultado, o calculo da semantica associada ao SP tem de ser feito recorrendo a um

estratagema interno. Isto porque a substituicao da semantica do SN hotel, no segundo argumento da

semantica da preposicao, origina uma formula mal formada em logica: em(hotel(x), Lisboa). �

Para resolver algumas destas situacoes o Edite recorre a um truque de implementacao, que

abstrai a variavel associada ao nome, gerando-se a formula em(x, Lisboa), hotel(x).5.

5Para resolver este problema [Jurafsky e Martin, 2000] recorre a nocao de complex term.

Page 272: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

9.4. COMPARACAO COM O SISTEMA EDITE 237

A interface aqui apresentada, dado que cada regra semantica e construıda directamente sobre

os elementos a transformar, nao tem este problema.

9.4.6 Duplicacao de informacao e regularidades semanticas

Se um ou mais elementos participam em varias regras sintacticas, mesmo que tenham sempre o

mesmo comportamento semantico, as regras sintacticas em que participam vao estar associadas

regras semanticas com o mesmo comportamento.

Exemplo 147: Duplicacao de informacao

O Edite tem na sua gramatica as seguintes regras:

N→ art nc npr

N→ nc npr

Nestas duas regras a relacao semantica entre o nc e o npr e estabelecida inserindo a semantica associada

ao npr no primeiro argumento da semantica associada ao nc (ou seja, a formula associada, quer a o hotel

Ritz quer a hotel Ritz e hotel(Ritz)). Esta funcao faz parte das duas regras semanticas associadas as

regras sintacticas. �

Esta duplicacao de informacao leva a outra situacao: nao e facil com a interface do Edite de-

terminar o comportamento de um dado elemento num dado contexto. Ou seja, para detectar

regularidades ha que percorrer a gramatica.

Exemplo 148: Regularidades semanticas

Para perceber qual o comportamento de um nc que ocorra a esquerda de um v, ha que percorrer todo

um conjunto de regras associadas a estas categorias, por exemplo:

Page 273: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

238 CAPITULO 9. AVALIACAO

VAUX→ v {?v}

VPRIN→ v {?v}

N→ nc {?nc}

N→ nc np {S(?npr 1 ?nc)}

Seguidamente, ha que ir percorrendo as regras sintacticas associadas a estas regras ate se atingir o nıvel

da frase. Depois, ha que observar os varios resultados semanticos e tentar perceber se existem regulari-

dades. �

A interface apresentada nesta tese, tenta isolar em regras semanticas proprias os comporta-

mentos comuns dos varios elementos. Deste modo, nao se duplica informacao e conseguem-se

detectar regularidades semanticas.

9.4.7 Extensoes

A grande vantagem da interface aqui apresentada sobre o Edite respeita a extensao do sis-

tema. Por um lado, a hierarquia das regras semanticas permite definir regras genericas, even-

tualmente pouco precisas em algumas situacoes. Se o sistema for enriquecido, por exemplo,

distinguindo um conjunto de palavras com um determinado comportamento semantico, po-

dem adicionar-se ao sistema regras mais especıficas, relativas a essas palavras. As regras

mais genericas subsumem as regras mais especıficas e nao disparam quando estas estao em

condicoes de actuar, evitando a sobre-geracao.

Adicionalmente, se os resultados calculados pela introducao de uma nova regra semantica

(e isto aplica-se igualmente as propriedades de flechagem) nao forem os esperados, o facto

de cada regra nao estar escrita em funcao de outras regras permite isolar a regra e analisa-la

Page 274: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

9.5. CUIDADOS A TER NO USO DESTA INTERFACE 239

individualmente.

Esta capacidade de controlar as regras em causa faz da interface aqui apresentada um sistema

mais facil de manter e estender.

9.5 Cuidados a ter no uso desta interface

9.5.1 Utilizacao nao composicional da interface

Intuitivamente um sistema de Processamento da Lıngua Natural deve ser capaz de operar com-

posicionalmente. Sem querer discutir o que se entende por composicionalidade6, ha que cha-

mar a atencao para o facto de, se o objectivo for obter directamente formulas estruturadas, por

exemplo, atraves de parentesis, a interface aqui apresentada so consegue obter essas formulas

de modo nao composicional. O exemplo 149 ilustra este problema.

Exemplo 149: Utilizacao nao composicional

Considere-se a frase (1).

(1) Um rapaz fugiu

O mapeamento de (1) numa formula estruturada como a de (F1) pode ser obtida atraves da regra Rn.

6O princıpio da composicionalidade e normalmente apresentado de um modo tao generico (o significado deuma expressao composta e uma funcao do significado das suas partes) que da azo a varias interpretacoes. Bes em[Bes, 2001b] chama a atencao para este facto e arruma as diferentes interpretacoes em varias classes, que vao desde aque aborda este conceito intuitivamente, a que o define de um modo completamente formal. Independentemente doque se entende por composicionalidade, existem muitos exemplos na lıngua natural que sao anti-composicionais,e autores como Partee [Partee e Hendriks, 1999] sugerem que uma finite complete semantics baseada na composici-onalidade nao e possıvel. No reverso da medalha, autores como Janssen sao defensores radicais deste princıpio.Este, em [Janssen, 1997], apresenta uma definicao formal de composicionalidade, baseada num modelo matematicosemelhante ao de UG [Montague, 1974c]. Segundo este autor, se uma solucao se obtem de modo nao composicional,ha sempre uma solucao melhor que respeite este princıpio.

Page 275: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

240 CAPITULO 9. AVALIACAO

(F1) ∃ x (rapaz(x) ∧ fugiu(e, x)),

[Rn]{elem( , art, X1), elem( , nc, X2), elem( , v, X3) : {flecha( , art, X1, , nc, X2, ),

flecha( , nc, X2, , v, X3, ),}

7→ {∃ var(X2) (sem(X2)(var(X2)) ∧ sem(X3)(var(X3), var(X2))}

No entanto, para que (2) tenha como representacao F2, ha que acrescentar a regra Rm.

(2) Um simpatico rapaz fugiu

(F2) ∃ x (rapaz(x) ∧ simpatico(x) ∧ fugiu(e, x)),

[Rm]{elem( , art, X1), elem( , adj1, X2), elem( , nc, X3), elem( , v, X4)

: {flecha( , art, X1, , nc, X3, ), flecha( , adj1, X2, , nc, X3, ), flecha( , nc, X3, , v, X4, ),}

7→ {∃ var(X3) (sem(X3)(var(X3)) ∧ sem(X2)(var(X3)) ∧ sem(X4)(var(X4), var(X3))}. �

Apesar de nao se excluir uma representacao estruturada, que podia ser util num domınio muito

restrito, nao tem sentido enveredar por uma abordagem nao composicional, num domınio

mais alargado. Daı a necessidade do uso de uma linguagem plana, e dado que linguagens

como a MRS7 permitem representar de modo equivalente (e plano) estas frases, a interface

apresentada nesta dissertacao nao consegue obter directamente, de modo composicional, uma

representacao estruturada, mas sim uma representacao equivalente.

9.5.2 Eliminacao de variaveis

Se se quer obter uma dada formula em que se ignora a contribuicao de um dado elemento,

ha que ter o cuidado de garantir que todas as outras formulas fazem o mesmo. Como se viu,

7Em [Coheur et al., 2004b] apresenta-se um pequeno exemplo que ilustra como se pode obter, atraves destainterface, uma representacao em MRS.

Page 276: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

9.6. RESUMO E CONCLUSOES 241

quando um verbo copulativo recebe a seta de um adverbio interrogativo, decidiu-se ignora-

-lo. Mas se este verbo recebesse uma seta de um adverbio de outro tipo, a regra semantica

associada a este adverbio iria provavelmente jogar com a variavel associada ao verbo, pelo que

apareceria na formula uma variavel que nao estava associada a nada. Estas situacoes tem de

ser analisadas com cuidado. O exemplo 150 ilustra esta situacao.

Exemplo 150: Eliminacao de variaveis

Suponhamos que a Regra R13 do capıtulo 6, relativa aos adverbios interrogativos, nao tem em conta

se um outro adverbio flecha sobre o verbo sobre o qual flecha o adverbio interrogativo, produzindo a

formula ?onde(x), em que a variavel x representa o objecto denominado Arraiolos, para o adverbio

interrogativo de Onde e Arraiolos?, e que nao existe a regra R14 (que cobria estes casos).

Nesta situacao, se a frase for Onde e agora Arraiolos?, o adverbio agora vai, de acordo com a regra R15

do capıtulo 6, dar origem a formula MADV(e, y), agora(y), em que e e o evento associado a e,

que fica “perdida” na representacao da frase. Ou seja, as suas variaveis nao estao ligadas ao resto da

representacao: ?onde(x), NAME(x, Arraiolos), MADV(e, y), agora(y). �

9.6 Resumo e Conclusoes

Neste capıtulo fez-se uma primeira avaliacao da interface sintaxe/semantica apresentada nesta

dissertacao. Num conjunto de teste de 50 perguntas, em que se eliminou a coordenacao e

se agruparam alguns termos compostos, obteve-se uma cobertura de 88% e uma precisao de

35%. A precisao e muito baixa devido a enorme quantidade de modelos flechados gerados

pelo Algas. O PP-attachment esta por detras destes resultados, pois a precisao na construcao

dos modelos flechados passa a 62% se se impuser uma distancia de flechagem maxima de

Page 277: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

242 CAPITULO 9. AVALIACAO

1. No entanto, essa distancia e demasiado restritiva, obtendo-se uma melhor relacao entre a

cobertura e precisao com uma distancia de 2. Observou-se tambem que mesmo nas situacoes

em que as representacoes obtidas nao sao exactamente as desejadas, nao estao muito longe das

representacoes correctas.

Neste capıtulo comparou-se ainda esta interface sintaxe/semantica com a interface sin-

taxe/semantica do Edite, concluindo-se que nenhuma delas pode ser considerada robusta. A

defendida nesta tese porque nao ordena resultados, a do Edite porque nao lida com analises

parciais. Algumas das vantagens da interface desta dissertacao sobre a do Edite (e, tipica-

mente, sobre interfaces da famılia do Edite) sao as seguintes: (i) sao tidos em conta contextos

sintacticos; (ii) as regras semanticas nao tem de lidar com valores inesperados; (iii) podem-se

controlar hipoteses sintacticas, impondo, por exemplo, distancias as setas; (iv) as regularida-

des semanticas podem ser captadas numa unica regra, nao havendo necessidade de duplicar

informacao; (v) a interface pode ser mais facilmente estendida, devido a hierarquia de regras,

e qualquer erro numa regra, e mais facilmente despistado. No entanto, uma comparacao mais

precisa entre esta interface e a interface do Edite sera feita quando os domınios sintacticos trata-

dos pelas duas interfaces forem os mesmos, nomeadamente quando se integrar a coordenacao

na interface desta dissertacao.

Page 278: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

109 ��� � ���,�� bc�?�����I �

��1-+�3�,�)�$68���

Neste capıtulo, faz-se um breve sumario da interface sintaxe/semantica apresentada nesta tese,

resumem-se os planos para o futuro e tecem-se algumas conclusoes.

10.1 Sumario

Apresentou-se uma interface sintaxe/semantica que tenta cumprir os requisitos da proposta

do 5P. Esta interface parte de um conjunto de modelos basicos e, com base nas proprieda-

des de flechagem e numa ferramenta chamada Algas, constroi os modelos flechados. Esses

modelos flechados sao transformados, atraves de uma ferramenta chamada Ogre, em grafos.

Estes grafos servem de base de trabalho a uma ferramenta chamada AsdeCopas, que, atraves

das regras semanticas, executa um conjunto de tarefas, tais como enriquecer o grafo, calcular

representacoes semanticas, ou desambiguar palavras semanticamente ambıguas. Estas regras

semanticas tem a particularidade de estarem organizadas hierarquicamente. Assim, se um con-

junto de regras esta em condicoes de ser disparada, apenas as mais especıficas sao aplicadas.

A interface sintaxe/semantica foi usada em duas tarefas: (i) interpretacao de questoes do

domınio do turismo, em que se calculam representacoes semanticas para as questoes; (ii)

desambiguacao semantica do qualquer e de outros operadores, em se calculam os valores

semanticos que estas palavras tomam, de acordo com os contextos sintacticos em que se en-

Page 279: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

244 CAPITULO 10. TRABALHO FUTURO E CONCLUSOES

contram.

O desempenho da interface sintaxe/semantica foi avaliada na interpretacao de questoes, tendo

a interface sintaxe/semantica sido ainda comparada com a interface sintaxe/semantica do sis-

tema Edite.

10.2 Trabalho Futuro

Nesta seccao descreve-se um conjunto de tarefas que visam enriquecer e flexibilizar a interface

desenvolvida. Sugerem-se ainda futuras aplicacoes.

10.2.1 Enriquecimento das descricoes linguısticas

Muito trabalho ha a fazer em relacao as descricoes linguısticas. Em particular, e como ja foi

apontado, os verbos e os modelos verbais necessitam de uma dedicacao urgente. Um primeiro

passo sera eliminar as regras do Pasmo que limitam as classificacoes verbais a meia duzia de

etiquetas.

A coordenacao e outro dos assuntos urgentes a tratar. Dificilmente se compara a interface

sintaxe/semantica desta dissertacao com outras, nao tendo a coordenacao integrada.

Deve-se notar que nao se poe de lado o enriquecimento automatico dos dados do Susana e do

Algas. A Floresta Sintactica e os corpora do PAROLE sao potenciais fontes de informacao a

considerar.

E tambem fundamental acrescentar a interface informacao sobre sub-categorizacao verbal, nao

Page 280: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

10.2. TRABALHO FUTURO 245

apenas para tentar evitar tanta ambiguidade nos modelos flechados, mas tambem para permi-

tir regras semanticas mais precisas. O ja referido trabalho em curso de [Ribeiro et al., 2004,

de Matos et al., 2004], trara alguma informacao sobre sub-categorizacao verbal. Posterior-

mente, e sendo mais fino o tratamento dado aos verbos, ha que repensar a representacao

semantica.

Ainda em relacao a ambiguidade dos modelos flechados, e, em particular ao problema da am-

biguidade de flechagem dos modelos nucleares preposicionais, seria interessante incorporar na

interface sintaxe/semantica o trabalho sobre a determinacao de classes semanticas usado em

[Gamallo et al., 2003] para decidir as ligacoes dos modelos preposicionais.

Ainda dentro do trabalho futuro, ter um sistema, e, em particular a interface, a funcionar para

o Ingles e outro dos trabalhos a curto prazo.

10.2.2 Propriedades de flechagem

Uma primeira extensao as propriedades de flechagem sera aceitar propriedades de flechagem

entre palavras (e nao apenas entre categorias e modelos). Ou seja, no futuro, poder-se-a dizer

que a palavra x, flecha sobre a palavra y (mediante certas condicoes).

Adicionalmente, e dado que ha propriedades que representam relacoes entre elementos que

apesar de possıveis, raramente ocorrem, associar um peso, uma probabilidade, as propriedades

de flechagem, e uma hipotese a ter em conta. Como se viu, o que que introduz uma relativa

pode estar associado a um modelo preposicional (ex: em Lisboa que e tao bonita...), e, no entanto,

no Corpete esta situacao nunca ocorreu. Assim, atribuindo um peso a esta propriedade de

flechagem, permitira avalia-la como uma possibilidade real, mas sem a manter ao mesmo nıvel

Page 281: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

246 CAPITULO 10. TRABALHO FUTURO E CONCLUSOES

de outras propriedades.

10.2.3 Algas

O Algas permite associar modelos flechados as questoes em analise, mas tem de ser melhorado.

Em primeiro lugar e mais eficiente ir eliminando solucoes que nao cumprem os criterios de boa

formacao dos modelos flechados (como aceitar ou nao solucoes com mais do que um nucleo,

ou aceitar ou nao o cruzamento de setas) a medida que se constroem os modelos flechados, do

que faze-lo apenas no fim. Adicionalmente, os criterios de boa formacao dos modelos flechados

devem ser parametrizaveis. Ainda neste processo, ha que ter em atencao se os criterios de boa

formacao dos modelos flechados eliminam todas as solucoes. Nesse caso, o Algas deve relaxar

os criterios de boa formacao, de modo a garantir analises parciais.

O Algas deve ainda dispor de um panic mode tal como o da Link Grammar

[Temperley et al., 2004], para o caso de o numero de solucoes a calcular ser demasiado

grande. Nesta situacao, o Algas deve enveredar por um algoritmo alternativo, que eventual-

mente elimine hipoteses correctas, mas que permita calcular solucoes, ainda que parciais.

O Algas deve ainda ser estendido de modo a ordenar os modelos flechados. A atribuicao de

pesos as propriedades de flechagem permitira fazer esta ordenacao.

10.2.4 Regras semanticas

As regras semanticas podem ser mais expressivas se no contexto de flechagem se puder usar a

disjuncao. Assim, pode-se declarar numa unica regra semantica que um conjunto de elementos

Page 282: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

10.2. TRABALHO FUTURO 247

a traduzir, no contexto de flechagem C1 ou C2, tem um dado comportamento semantico.

As regras semanticas podem tambem ser estendidas de modo a permitir que o conjunto das

funcoes de traducao seja vazio. Estas regras podem ser muito uteis quando nao se quer que

uma formula apareca numa representacao.

10.2.5 Ferramenta de ordenacao das representacoes semanticas

Outra das tarefas prioritarias e a da ordenacao das representacoes semanticas. Para alem de

atribuir pesos as regras semanticas, as seguintes heurısticas podem ser um ponto de partida:

• escolher as representacoes com o maior numero de predicados gerados;

• escolher as representacoes com o menor numero de variaveis que ocorrem em apenas

uma formula;

• eliminar as representacoes geradas por regras semanticas que nao devem disparar ao

mesmo tempo.

10.2.6 Aplicacoes alternativas

Pensa-se usar esta interface sintaxe/semantica em varias aplicacoes, nomeadamente no sis-

tema de dialogos descrito em [Mourao et al., 2003, Mourao et al., 2004], e no sistema SAF

[Franca e Custodio, 2004], que tem como objectivo a deteccao de actos de fala.

Espera-se tambem integrar esta interface sintaxe/semantica no sistema Edite, em substituicao

da sua interface sintaxe/semantica. Para esta integracao ha que recuperar do Edite todo o

Page 283: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

248 CAPITULO 10. TRABALHO FUTURO E CONCLUSOES

trabalho feito em relacao ao modelo conceptual e mapeamento das formulas logicas em SQL

[Filipe e Mamede, 2000, Filipe e Mamede, 1999].

Finalmente, existem planos para uma aplicacao que transforme texto em Minimal Recursion

Semantics, onde em foco esta exactamente a quantificacao. Uma primeira aproximacao a este

trabalho encontra-se descrita em [Coheur et al., 2004b].

10.3 Conclusoes

A interface sintaxe/semantica segue a proposta do 5P, calculando as representacoes semanticas

a partir dos modelos flechados convertidos num grafo. As descricoes linguısticas nao estao

misturadas com informacao de cariz procedimental, podendo-se, por exemplo, controlar a

distancia de flechagem (informacao de controle) atraves da inclusao de informacao nas en-

tradas do Algas, nao sendo adicionada esta informacao as propriedades de flechagem que

contem as descricoes linguısticas. Adicionalmente, as descricoes linguısticas podem ser usa-

das de modo parametrizavel de acordo com as aplicacoes em vista. Ou seja, pode-se pegar em

qualquer subconjunto quer das propriedades de flechagem, quer das regras semanticas, e tra-

balhar directamente com estes subconjuntos. Finalmente, a interface lida com analises parciais.

Quer o Algas, quer o AsdeCopas sao capazes de operar sobre analises e descricoes parciais.

Foram feitos testes preliminares sobre um corpus de 50 questoes, em que a coordenacao foi

eliminada e se agruparam varios termos. A cobertura no calculo das representacoes semanticas

e de 88%, mas a precisao e de 35%. A principal causa deste valor para a precisao deve-se a

muita ambiguidade causada pelos modelos flechados que tem sintagmas preposicionais como

origem. Impor uma distancia de flechagem de 2, faz aumentar a precisao no estabelecimento

Page 284: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

10.3. CONCLUSOES 249

dos modelos flechados de 38% para 59% (descendo a cobertura de 94% para 88%). Foram ainda

feitas alguns testes as representacoes calculadas, e chegou-se a conclusao que mesmo quando

estas nao sao exactamente as representacoes desejadas, nao estao longe destas (cobertura entre

85% e 100% e precisao entre 75% e 100%).

Apesar do muito trabalho que ainda ha a fazer e da difıcil avaliacao desta interface sin-

taxe/semantica, dado que opera sobre descricoes verbais pobres, e dado que a coordenacao

e ignorada, julga-se ter em maos uma interface que nao padece de um conjunto de problemas

que afectam o sistema Edite (e afins). Em particular, a extensao desta interface nao tem os efei-

tos colaterais da interface do Edite, dado que nao ha uma dependencia entre regras sintacticas

e regras semanticas. Adicionalmente, como as regras semanticas nao sao recursivas, e nao de-

pendem de resultados calculados por outras regras semanticas, e muito facil despistar regras

problematicas.

Para terminar, a organizacao hierarquica das regras semanticas permite declarar regras

semanticas por omissao, regras estas que apenas sao disparadas se nao existirem regras

semanticas mais especıficas. Esta opcao e muito util na extensao do sistema. Sempre que se

dispuser de informacao mais fina, podem definir-se regras semanticas mais especıficas, que

sao aplicadas em detrimento das regras mais genericas, previamente existentes.

Page 285: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

250 CAPITULO 10. TRABALHO FUTURO E CONCLUSOES

Page 286: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

A9 *,���edf9 �.*,� �?�

O 5P usa um conjunto de propriedades para descrever a sintaxe da Lıngua Natural. Com

base nestas propriedades, Hagege fez uma descricao precisa dos sintagmas nominais do Por-

tugues (excluindo a coordenacao) que pode ser consultada em [Hagege, 2000]. Em paralelo,

desenvolveu o algoritmos das folhas (AF) – que posteriormente deu origem ao Susana – e

enriqueceu as estruturas de dados deste algoritmo com informacao proveniente das referidas

descricoes dos sintagmas nominais. No entanto, apesar de se conseguir garantir a preservacao

de um certo nıvel de informacao das propriedades atraves destas estruturas de dados (o ma-

peamento e descrito em [Hagege, 2000]), estas sao bem menos flexıveis que as proprieda-

des do 5P, perdendo-se informacao potencialmente relevante, e nao havendo garantias de

que os modelos encontrados pelo AF/Susana respeitam essas propriedades. O Tira-Teimas

[Coheur, 2003, Coheur e Mamede, 2003, Coheur e Mamede, 2004] foi desenvolvido com o ob-

jectivo de identificar os modelos encontrados que nao respeitam as propriedades do 5P.

O Tira-Teimas e um modulo em XSLT que pega num texto sobre no qual e detectaram os mode-

los basicos e testa cada modelo basico verificando se este respeita as propriedades do 5P. Se um

modelo nao respeita uma ou mais propriedades, e marcado com o identificador da propriedade

desrespeitada. A figura A.1 ilustra a arquitectura do Tira-Teimas.

Adicionalmente, e como codificar directamente as propriedades do 5P em XSLT e uma tarefa

penosa, em especial devido as relacoes de subsuncao, desenvolveu-se um modulo auxiliar que

Page 287: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

252 APENDICE A. TIRA-TEIMAS

!"#$%"&'()&*+"&

!"#$%"&'()&*+"&'

,-.+-#"&

/*.-0/$*,-&'

1234/5

6."7.*$#-#$&'#"'

86

Figura A.1: Arquitectura do Tira-Teimas

recebe as propriedades do 5P em XML, mas num formato mais amigavel, e gera o proprio Tira-

Teimas. Chamou-se a este modulo Tira-Teimas Translator (TTT). Assim, a arquitectura final e a

da figura A.2:

!"#$%"&'()&*+"&

!"#$%"&'()&*+"&'

,-.+-#"&

/*.-0/$*,-&'

1234/5

6."7.*$#-#$&'#"'

86

///'

1234/5

Figura A.2: Arquitectura do Tira-Teimas Translator (TTT)

Foram feitos varios testes usando o Tira-Teimas, sobre varios tipos de Corpora, e verificou-

-se que este modulo serve nao apenas para cortar algumas hipoteses de segmentacao

ambıguas que desrespeitavam propriedades do 5P relativas aos sintagmas nominais nu-

Page 288: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

253

cleares descritas por Hagege, mas igualmente para assinalar erros em propriedades (ver

[Coheur e Mamede, 2004] para exemplos e detalhes). Ou seja, com este modulo pode-se nao

apenas garantir o aproveitamento total das descricoes feitas atraves das propriedades do 5P,

mas igualmente testar a qualidade das descricoes feitas, o que nao era possıvel fazer ate ao

momento.

O Tira-Teimas foi executado sobre o Corpete, e dado que a unica propriedade desrespeitada

foi uma propriedade considerada errada, garantiu-se que os modelos nominais nucleares assi-

nalados pelo Susana neste corpus respeitam as descricoes dos sintagmas nominais de Hagege

feitas usando as propriedades do 5P.

Page 289: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

254 APENDICE A. TIRA-TEIMAS

Page 290: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

BKhg3�.� :��i��

Apresentam-se neste apendice os resultados produzidos nas varias etapas, desde a introducao

de uma pergunta em Lıngua Natural, ate a sua representacao numa formula logica.

—————————————————————————————————————–

Pergunta 1: Em que hoteis ha piscina em Lisboa?

—————————————————————————————————————–

———————————————

Resultados Smorph:

———————————————

’Em’.

[ ’em’, ’CAT’,’prep’].

’que’.

[ ’que’, ’CAT’,’conj’, ’CONJ’,’coord’, ’COOR’,’expli’].

[ ’que’, ’CAT’,’conj’, ’CONJ’,’adve’, ’ADV’,’caus’].

[ ’que’, ’CAT’,’conj’, ’CONJ’,’adve’, ’ADV’,’conc’].

[ ’que’, ’CAT’,’conj’, ’CONJ’,’adve’, ’ADV’,’temp’].

[ ’que’, ’CAT’,’conj’, ’CONJ’,’adve’, ’ADV’,’cons’].

[ ’que’, ’CAT’,’conj’, ’CONJ’,’compl’].

[ ’que’, ’CAT’,’rel’, ’NUM’, , ’GEN’, ].

[ ’que’, ’CAT’,’int’, ’NUM’, , ’GEN’, ].

[ ’que’, ’CAT’,’compar’, ’NUM’, , ’GEN’, , ’CONJ’,’adve’, ’ADV’,’comp’].

’hoteis’.

[ ’hotel’, ’CAT’,’n’, ’NUM’,’p’, ’GEN’,’m’, ’TAN’,’t1’].

’ha’.

Page 291: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

256 APENDICE B. EXEMPLOS

[ ’haver’, ’CAT’,’v’, ’NUM’,’s’, ’GEN’, , ’PES’,’3’, ’MOD’,’ind’, ’TMP’,’pre’].

[ ’haver’, ’CAT’,’v’, ’NUM’,’s’, ’GEN’, , ’PES’,’2’, ’MOD’,’itfp’].

’piscina’.

[ ’piscina’, ’CAT’,’n’, ’NUM’,’s’, ’GEN’,’f’, ’TAN’,’t1’].

’em’.

[ ’em’, ’CAT’,’prep’].

’Lisboa’.

[ ’lisboa’, ’CAT’,’npr’, ’NUM’,’s’, ’GEN’,’f’, ’TAN’,’t1’].

[ ’Lisboa’, ’CAT’,’npr’, ’NUM’,’s’, ’GEN’,’f’, ’TAN’,’t1’].

’?’.

[ ’?’, ’CAT’,’int’, ’CAT’,’ponct’].

———————————————

Resultados Pasmo:

———————————————

<word name=”Em que”>

<class root=”em que”> <id name=”em que int”/> </class>

</word>

<word name=”hoteis”>

<class root=”hotel”> <id name=”nc1 p”/> </class>

</word>

<word name=”ha”>

<class root=”haver”> <id name=”ha v”/> </class>

</word>

<word name=”piscina”>

<class root=”piscina”> <id name=”nc1 s”/> </class>

</word>

<word name=”em”>

<class root=”em”> <id name=”em”/> </class>

</word>

<word name=”Lisboa”>

<class root=”lisboa”> <id name=”npr1”/> </class>

<class root=”Lisboa”> <id name=”npr1”/> </class>

Page 292: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

257

</word>

<word name=”?”>

<class root=”?”> <id name=”p int”/> </class>

</word>

———————————————

Resultados Susana:

———————————————

Fint(

Int( em que int(Em que))

Nn( nc1 p(hoteis))

Phvn( ha v(ha))

Nnt( nc1 s(piscina))

Prepn( em(em) npr1(Lisboa))

Ponct( p int(?)))

———————————————

Resultados Algas:

———————————————

<text> Em que hoteis ha piscina em Lisboa ? </text>

<model label=”Fint”>

<model label=”Int”>

<terminal category=”em que int”word=”Em que”> </terminal>

<connections>

<connection source=”0”target=”0”arc=-1”> </connection>

</connections>

</model>

<model label=”Nn”>

<terminal category=”nc1 p”word=”hoteis”> </terminal>

<connections>

Page 293: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

258 APENDICE B. EXEMPLOS

<connection source=”0”target=”0”arc=-1”> </connection>

</connections>

</model>

<model label=”Phvn”>

<terminal category=”ha v”word=”ha”> </terminal>

<connections>

<connection source=”0”target=”0”arc=-1”> </connection>

</connections>

</model>

<model label=”Nnt”>

<terminal category=”nc1 s”word=”piscina”> </terminal>

<connections>

<connection source=”0”target=”0”arc=-1”> </connection>

</connections>

</model>

<model label=”Prepn”>

<terminal category=”em”word=”em”> </terminal>

<terminal category=”npr1”word=”Lisboa”> </terminal>

<connections>

<connection source=”0”target=”1”arc=-1”> </connection>

<connection source=”1”target=”1”arc=-1”> </connection>

</connections>

</model>

<model label=”Ponct”>

<terminal category=”p int”word=”?”> </terminal>

<connections>

<connection source=”0”target=”0”arc=-1”> </connection>

</connections>

</model>

<connections>

<connection source=”0”target=”1”arc=”0”> </connection>

<connection source=”1”target=”2”arc=”11”> </connection>

<connection source=”2”target=”2”arc=”39”> </connection>

<connection source=”3”target=”2”arc=”13”> </connection>

<connection source=”4”target=”1”arc=”29”> </connection>

Page 294: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

259

</connections>

<connections>

<connection source=”0”target=”1”arc=”0”> </connection>

<connection source=”1”target=”2”arc=”11”> </connection>

<connection source=”2”target=”2”arc=”39”> </connection>

<connection source=”3”target=”2”arc=”13”> </connection>

<connection source=”4”target=”3”arc=”29”> </connection>

</connections>

</model>

———————————————

Resultados Ogre:

———————————————

frase(1,’Em que hoteis ha piscina em Lisboa ? ’).

arc(em que int,1,nc1 p,2,indf).

node(’Em que’,em que int,1,indf).

arc(nc1 p,2,ha v,3,indf).

node(’hoteis’,nc1 p,2,indf).

arc(ha v,3,ha v,3,indf).

node(’ha’,ha v,3,not focus).

arc(nc1 s,4,ha v,3,indf).

node(’piscina’,nc1 s,4,indf).

arc(em,5,npr1,6,indf).

node(’em’,em,5,indf).

arc(npr1,6,nc1 p,2,indf).

node(’Lisboa’,npr1,6,indf).

node(’separador’,separador,7,indf).

arc(em que int,8,nc1 p,9,indf).

node(’Em que’,em que int,8,indf).

arc(nc1 p,9,ha v,10,indf).

node(’hoteis’,nc1 p,9,indf).

arc(ha v,10,ha v,10,indf).

node(’ha’,ha v,10,not focus).

Page 295: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

260 APENDICE B. EXEMPLOS

arc(nc1 s,11,ha v,10,indf).

node(’piscina’,nc1 s,11,indf).

arc(em,12,npr1,13,indf).

node(’em’,em,12,indf).

arc(npr1,13,nc1 s,11,indf).

node(’Lisboa’,npr1,13,indf).

———————————————

Resultados AsdeCopas:

———————————————

frase(1,’Em que hoteis ha piscina em Lisboa ? ’).

R10: ?x2

R1: hoteis(x2)

R25: ter(e3), arg1(e3) = x2, arg2(e3) = x4

R1: piscina(x4)

R7: em(x2, x6)

R2: NAME(x6, Lisboa)

R10: ?x9

R1: hoteis(x9)

R25: ter(e10), arg1(e10) = x9, arg2(e10) = x11

R1: piscina(x11)

R7: em(x11, x13)

R2: NAME(x13, Lisboa)

Page 296: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

261

—————————————————————————————————————–

Pergunta 2: Que hoteis tem piscina em Lisboa?

—————————————————————————————————————–

———————————————

Resultados Smorph:

———————————————

’Que’.

[ ’que’, ’CAT’,’conj’, ’CONJ’,’coord’, ’COOR’,’expli’].

[ ’que’, ’CAT’,’conj’, ’CONJ’,’adve’, ’ADV’,’caus’].

[ ’que’, ’CAT’,’conj’, ’CONJ’,’adve’, ’ADV’,’conc’].

[ ’que’, ’CAT’,’conj’, ’CONJ’,’adve’, ’ADV’,’temp’].

[ ’que’, ’CAT’,’conj’, ’CONJ’,’adve’, ’ADV’,’cons’].

[ ’que’, ’CAT’,’conj’, ’CONJ’,’compl’].

[ ’que’, ’CAT’,’rel’, ’NUM’, , ’GEN’, ].

[ ’que’, ’CAT’,’int’, ’NUM’, , ’GEN’, ].

[ ’que’, ’CAT’,’compar’, ’NUM’, , ’GEN’, , ’CONJ’,’adve’, ’ADV’,’comp’].

’hoteis’.

[ ’hotel’, ’CAT’,’n’, ’NUM’,’p’, ’GEN’,’m’, ’TAN’,’t1’].

’tem’.

[ ’ter’, ’CAT’,’v’, ’NUM’,’p’, ’GEN’, , ’PES’,’3’, ’MOD’,’ind’, ’TMP’,’pre’].

’piscina’.

[ ’piscina’, ’CAT’,’n’, ’NUM’,’s’, ’GEN’,’f’, ’TAN’,’t1’].

’em’.

[ ’em’, ’CAT’,’prep’].

’Lisboa’.

[ ’lisboa’, ’CAT’,’npr’, ’NUM’,’s’, ’GEN’,’f’, ’TAN’,’t1’].

[ ’Lisboa’, ’CAT’,’npr’, ’NUM’,’s’, ’GEN’,’f’, ’TAN’,’t1’].

’?’.

[ ’?’, ’CAT’,’int’, ’CAT’,’ponct’].

Page 297: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

262 APENDICE B. EXEMPLOS

———————————————

Resultados Pasmo:

———————————————

<word name=”que”>

<class root=”que”> <id name=”que int”/> </class>

</word>

<word name=”hoteis”>

<class root=”hotel”> <id name=”nc1 p”/> </class>

</word>

<word name=”tem”>

<class root=”ter”> <id name=”vc”/> </class>

</word>

<word name=”piscina”>

<class root=”piscina”> <id name=”nc1 s”/> </class>

</word>

<word name=”em”>

<class root=”em”> <id name=”em”/> </class>

</word>

<word name=”Lisboa”>

<class root=”lisboa”> <id name=”npr1”/> </class>

<class root=”Lisboa”> <id name=”npr1”/> </class>

</word>

<word name=”?”>

<class root=”?”> <id name=”p int”/> </class>

</word>

———————————————

Resultados Susana:

———————————————

Fint(

Page 298: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

263

Int( que int(que))

Nn( nc1 p(hoteis))

Phvn( vc(tem))

Nnt( nc1 s(piscina))

Prepn( em(em) npr1(Lisboa))

Ponct( p int(?)))

———————————————

Resultados Algas:

———————————————

<text> que hoteis tem piscina em Lisboa ? </text>

<model label=”Fint”>

<model label=”Int”>

<terminal category=”que int”word=”que”> </terminal>

<connections>

<connection source=”0”target=”0”arc=-1”> </connection>

</connections>

</model>

<model label=”Nn”>

<terminal category=”nc1 p”word=”hoteis”> </terminal>

<connections>

<connection source=”0”target=”0”arc=-1”> </connection>

</connections>

</model>

<model label=”Phvn”>

<terminal category=”vc”word=”tem”> </terminal>

<connections>

Page 299: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

264 APENDICE B. EXEMPLOS

<connection source=”0”target=”0”arc=-1”> </connection>

</connections>

</model>

<model label=”Nnt”>

<terminal category=”nc1 s”word=”piscina”> </terminal>

<connections>

<connection source=”0”target=”0”arc=-1”> </connection>

</connections>

</model>

<model label=”Prepn”>

<terminal category=”em”word=”em”> </terminal>

<terminal category=”npr1”word=”Lisboa”> </terminal>

<connections>

<connection source=”0”target=”1”arc=-1”> </connection>

<connection source=”1”target=”1”arc=-1”> </connection>

</connections>

</model>

<model label=”Ponct”>

<terminal category=”p int”word=”?”> </terminal>

<connections>

<connection source=”0”target=”0”arc=-1”> </connection>

</connections>

</model>

<connections>

<connection source=”0”target=”1”arc=”0”> </connection>

<connection source=”1”target=”2”arc=”11”> </connection>

<connection source=”2”target=”2”arc=”39”> </connection>

<connection source=”3”target=”2”arc=”13”> </connection>

<connection source=”4”target=”1”arc=”29”> </connection>

</connections>

<connections>

Page 300: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

265

<connection source=”0”target=”1”arc=”0”> </connection>

<connection source=”1”target=”2”arc=”11”> </connection>

<connection source=”2”target=”2”arc=”39”> </connection>

<connection source=”3”target=”2”arc=”13”> </connection>

<connection source=”4”target=”3”arc=”29”> </connection>

</connections>

<connections>

<connection source=”0”target=”1”arc=”0”> </connection>

<connection source=”1”target=”2”arc=”11”> </connection>

<connection source=”2”target=”2”arc=”39”> </connection>

<connection source=”3”target=”2”arc=”13”> </connection>

<connection source=”4”target=”2”arc=”32”> </connection>

</connections>

</model>

———————————————

Resultados Ogre:

———————————————

frase(14,’que hoteis tem piscina em Lisboa ? ’).

arc(que int,14,nc1 p,15,indf).

node(’que’,que int,14,indf).

arc(nc1 p,15,vc,16,indf).

node(’hoteis’,nc1 p,15,indf).

arc(vc,16,vc,16,indf).

node(’tem’,vc,16,not focus).

arc(nc1 s,17,vc,16,indf).

node(’piscina’,nc1 s,17,indf).

arc(em,18,npr1,19,indf).

node(’em’,em,18,indf).

arc(npr1,19,nc1 p,15,indf).

node(’Lisboa’,npr1,19,indf).

node(’separador’,separador,20,indf).

arc(que int,21,nc1 p,22,indf).

Page 301: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

266 APENDICE B. EXEMPLOS

node(’que’,que int,21,indf).

arc(nc1 p,22,vc,23,indf).

node(’hoteis’,nc1 p,22,indf).

arc(vc,23,vc,23,indf).

node(’tem’,vc,23,not focus).

arc(nc1 s,24,vc,23,indf).

node(’piscina’,nc1 s,24,indf).

arc(em,25,npr1,26,indf).

node(’em’,em,25,indf).

arc(npr1,26,nc1 s,24,indf).

node(’Lisboa’,npr1,26,indf).

node(’separador’,separador,27,indf).

arc(que int,28,nc1 p,29,indf).

node(’que’,que int,28,indf).

arc(nc1 p,29,vc,30,indf).

node(’hoteis’,nc1 p,29,indf).

arc(vc,30,vc,30,indf).

node(’tem’,vc,30,not focus).

arc(nc1 s,31,vc,30,indf).

node(’piscina’,nc1 s,31,indf).

arc(em,32,npr1,33,indf).

node(’em’,em,32,indf).

arc(npr1,33,vc,30,indf).

node(’Lisboa’,npr1,33,indf).

———————————————

Resultados AsdeCopas:

———————————————

frase(14,’que hoteis tem piscina em Lisboa ? ’).

R10: ?x15

R1: hoteis(x15)

R20: arg2(e16) = x17

R19: arg1(e16) = x15

Page 302: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

267

R18: tem(e16)

R1: piscina(x17)

R7: em(x15, x19)

R2: NAME(x19, Lisboa)

R10: ?x22

R1: hoteis(x22)

R20: arg2(e23) = x24

R19: arg1(e23) = x22

R18: tem(e23)

R1: piscina(x24)

R7: em(x24, x26)

R2: NAME(x26, Lisboa)

R10: ?x29

R1: hoteis(x29)

R20: arg2(e30) = x31

R19: arg1(e30) = x29

R18: tem(e30)

R1: piscina(x31)

R8: em(e30, x33)

R2: NAME(x33, Lisboa)

—————————————————————————————————————–

Pergunta 3: Onde posso comer um bom atum no Algarve?

—————————————————————————————————————–

———————————————

Resultados Smorph:

———————————————

’Onde’.

[ ’onde’, ’CAT’,’rel’, ’NUM’, , ’GEN’, ].

Page 303: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

268 APENDICE B. EXEMPLOS

[ ’onde’, ’CAT’,’int’, ’NUM’, , ’GEN’, ].

[ ’ondar’, ’CAT’,’v’, ’NUM’,’s’, ’GEN’, , ’PES’,’1’, ’MOD’,’sub’, ’TMP’,’pre’].

[ ’ondar’, ’CAT’,’v’, ’NUM’,’s’, ’GEN’, , ’PES’,’3’, ’MOD’,’sub’, ’TMP’,’pre’].

[ ’ondar’, ’CAT’,’v’, ’NUM’,’s’, ’GEN’, , ’PES’,’3’, ’MOD’,’itf’].

[ ’ondar’, ’CAT’,’vcl’, ’NUM’,’s’, ’GEN’, , ’PES’,’2’, ’MOD’,’sub’, ’TMP’,’pre’].

’posso’.

[ ’poder’, ’CAT’,’v’, ’NUM’,’s’, ’GEN’, , ’PES’,’1’, ’MOD’,’ind’, ’TMP’,’pre’].

’comer’.

[ ’comer’, ’CAT’,’n’, ’NUM’,’s’, ’GEN’,’m’, ’TAN’,’t1’].

[ ’comer’, ’CAT’,’v’, ’MOD’,’inf’].

[ ’comer’, ’CAT’,’v’, ’NUM’,’s’, ’GEN’, , ’PES’,’1’, ’MOD’,’inf’].

[ ’comer’, ’CAT’,’v’, ’NUM’,’s’, ’GEN’, , ’PES’,’3’, ’MOD’,’inf’].

[ ’comer’, ’CAT’,’v’, ’NUM’,’s’, ’GEN’, , ’PES’,’1’, ’MOD’,’sub’, ’TMP’,’fut’].

[ ’comer’, ’CAT’,’v’, ’NUM’,’s’, ’GEN’, , ’PES’,’3’, ’MOD’,’sub’, ’TMP’,’fut’].

[ ’comer’, ’CAT’,’v’, ’NUM’, , ’GEN’, , ’PES’, , ’MOD’,’raiz’].

’um’.

[ ’um’, ’CAT’,’arti’, ’NUM’,’s’, ’GEN’,’m’].

’bom’.

[ ’bom’, ’CAT’,’a’, ’NUM’,’s’, ’GEN’,’m’, ’TAN’,’t1’].

’atum’.

[ ’atum’, ’CAT’,’n’, ’NUM’,’s’, ’GEN’,’m’, ’TAN’,’t1’].

’no’.

[ ’em’, ’CAT’,’partd’, ’NUM’,’s’, ’GEN’,’m’].

’Algarve’.

[ ’Algarve’, ’CAT’,’npr’, ’NUM’,’s’, ’GEN’,’m’, ’TAN’,’t2’].

’?’.

[ ’?’, ’CAT’,’int’, ’CAT’,’ponct’].

———————————————

Resultados Pasmo:

———————————————

<word name=”Onde”>

<class root=”onde”> <id name=”onde int”/> </class>

</word>

Page 304: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

269

<word name=”posso”>

<class root=”poder”> <id name=”vc12”/> </class>

</word>

<word name=”comer”>

<class root=”comer”> <id name=”nc1 s”/> </class>

<class root=”comer”> <id name=”vinf s”/> </class>

<class root=”comer”> <id name=”eliminer”/> </class>

</word>

<word name=”um”>

<class root=”um”> <id name=”arti s”/> </class>

</word>

<word name=”bom”>

<class root=”bom”> <id name=”adj1 s”/> </class>

</word>

<word name=”atum”>

<class root=”atum”> <id name=”nc1 s”/> </class>

</word>

<word name=”em”>

<class root=”em”> <id name=”em”/> </class>

</word>

<word name=”o”>

<class root=”o”> <id name=”artd s”/> </class>

</word>

<word name=”Algarve”>

<class root=”Algarve”> <id name=”npr2”/> </class>

</word>

<word name=”?”>

<class root=”?”> <id name=”p int”/> </class>

</word>

———————————————

Resultados Susana:

———————————————

Page 305: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

270 APENDICE B. EXEMPLOS

Fint(

Int( onde int(Onde))

Vn(

Phvn12( vc12(posso))

Infn( vinf s(comer)))

Nn( arti s(um) adj1 s(bom) nc1 s(atum))

Prepn( em(em) artd s(o) npr2(Algarve))

Ponct( p int(?)))

———————————————

Resultados Algas:

———————————————

<text> Onde posso comer um bom atum em o Algarve ? </text>

<model label=”Fint”>

<model label=”Int”>

<terminal category=”onde int”word=”Onde”> </terminal>

<connections>

<connection source=”0”target=”0”arc=-1”> </connection>

</connections>

</model>

<model label=”Vn”>

<model label=”Phvn12”>

<terminal category=”vc12”word=”posso”> </terminal>

<connections>

<connection source=”0”target=”0”arc=-1”> </connection>

</connections>

</model>

Page 306: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

271

<model label=”Infn”>

<terminal category=”vinf s”word=”comer”> </terminal>

<connections>

<connection source=”0”target=”0”arc=-1”> </connection>

</connections>

</model>

<connections>

<connection source=”0”target=”1”arc=-1”> </connection>

<connection source=”1”target=”1”arc=-1”> </connection>

</connections>

</model>

<model label=”Nn”>

<terminal category=”arti s”word=”um”> </terminal>

<terminal category=”adj1 s”word=”bom”> </terminal>

<terminal category=”nc1 s”word=”atum”> </terminal>

<connections>

<connection source=”0”target=”2”arc=-1”> </connection>

<connection source=”1”target=”2”arc=-1”> </connection>

<connection source=”2”target=”2”arc=-1”> </connection>

</connections>

</model>

<model label=”Prepn”>

<terminal category=”em”word=”em”> </terminal>

<terminal category=”artd s”word=”o”> </terminal>

<terminal category=”npr2”word=”Algarve”> </terminal>

<connections>

<connection source=”0”target=”2”arc=-1”> </connection>

<connection source=”1”target=”2”arc=-1”> </connection>

<connection source=”2”target=”2”arc=-1”> </connection>

</connections>

</model>

Page 307: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

272 APENDICE B. EXEMPLOS

<model label=”Ponct”>

<terminal category=”p int”word=”?”> </terminal>

<connections>

<connection source=”0”target=”0”arc=-1”> </connection>

</connections>

</model>

<connections>

<connection source=”0”target=”1”arc=”2”> </connection>

<connection source=”1”target=”1”arc=”39”> </connection>

<connection source=”2”target=”1”arc=”10”> </connection>

<connection source=”3”target=”2”arc=”29”> </connection>

</connections>

</model>

———————————————

Resultados Ogre:

———————————————

frase(34,’Onde posso comer um bom atum em o Algarve ? ’).

arc(onde int,34,vinf s,36,indf).

node(’Onde’,onde int,34,indf).

arc(vc12,35,vinf s,36,indf).

node(’posso’,vc12,35,indf).

arc(vinf s,36,vinf s,36,indf).

node(’comer’,vinf s,36,not focus).

arc(arti s,37,nc1 s,39,indf).

node(’um’,arti s,37,indf).

arc(adj1 s,38,nc1 s,39,indf).

node(’bom’,adj1 s,38,indf).

arc(nc1 s,39,vinf s,36,indf).

node(’atum’,nc1 s,39,indf).

arc(em,40,npr2,42,indf).

node(’em’,em,40,indf).

arc(artd s,41,npr2,42,indf).

Page 308: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

273

node(’o’,artd s,41,indf).

arc(npr2,42,nc1 s,39,indf).

node(’Algarve’,npr2,42,indf).

———————————————

Resultados AsdeCopas:

———————————————

frase(34,’Onde posso comer um bom atum em o Algarve ? ’).

R12: ?Onde(e36)

R20: arg2(e36) = x39

R18: comer(e36)

R4: AM(x39, x38), bom(x38)

R1: atum(x39)

R7: em(x39, x42)

R2: NAME(x42, Algarve)

Page 309: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

274 APENDICE B. EXEMPLOS

Page 310: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

j * � �,*i ( ���/=k�

[Abney, 1995] Abney, S. (1995). Chunks and Dependendencies: Bringing Processing Evidence to

Bear on Syntax. In Cole, J., Green, G., e Morgan, J., editores, Linguistics and Computation, pp.

145–164, Standford, CA. CSLI Publications.

[ACL-SIGLEX, 2004] ACL-SIGLEX (2004). Senseval, Evaluation exercises for Word Sense Disambi-

guation. Web page. http://www.senseval.org/.

[Aıt-Mokhtar, 1998] Aıt-Mokhtar, S. (1998). L’analyse Presyntaxique en une seule etape. Tese

de Doutoramento, Universite Blaise-Pascal, Clermont-Ferrand, Franca.

[Aıt-Mokhtar e Chanod, 1997a] Aıt-Mokhtar, S. e Chanod, J.-P. (1997a). Incremental finite-state

parsing. In Proceedings of the 5th Conference on Applied Natural Language Processing (ANLP-97),

Washington DC.

[Aıt-Mokhtar e Chanod, 1997b] Aıt-Mokhtar, S. e Chanod, J.-P. (1997b). Subject and object de-

pendency extraction using finite-state transducers. In ACL workshop on Automatic Information

Extraction and Building of Lexical Semantic Resources for NLP Applications, Madrid, Espanha.

[Aıt-Mokhtar et al., 2002] Aıt-Mokhtar, S., Chanod, J.-P., e Roux, C. (2002). Robustness beyond

shallowness: incremental deep parsing. Natural Language Engineering, 8(2/3):121–144.

[Allen, 1995] Allen, J. (1995). Natural Language Understanding. The Benjamin Cummings

Publishing Company, 2 edition.

275

Page 311: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

276 BIBLIOGRAFIA

[Alshawi, 1992] Alshawi, H., editor (1992). The Core Language Engine. Bradford Books, MIT

Press.

[Alshawi et al., 1988] Alshawi, H., Carter, D. M., van Eijck, J., Moore, R., Moran, D., e Pulman,

S. G. (1988). Overview of the Core Language Engine. In Proceedings of International Conference on

Fifth Generation Computing Systems, pp. 1108–115, Toquio.

[Alshawi e Crouch, 1991] Alshawi, H. e Crouch, R. (1991). Monotonic Semantic Interpretation.

Relatorio tecnico, CCSRC Technical Report, Cambridge Computer Science Research Center,

SRI International, Cambridge, Inglaterra.

[Areal, 1996] Areal, A. (1996). Curso de Portugues Questoes de Gramatica Nocoes de Latim.

Edicoes Asa.

[Arnola, 1998] Arnola, H. (1998). On parsing binary dependency structures deterministically in

linear time. In Kahane, S. e Polguere, A., editores, Workshop on Processing of Dependency-based

Grammars (COLING-ACL), Canada.

[Baldridge e Kruijff, 2002] Baldridge, J. e Kruijff, G.-J. M. (2002). Coupling CCG and Hybrid Logic

Dependency Semantics. In Proceedings of the 40th Annual Meeting of the Association for Computa-

tional Linguistics (ACL), pp. 319–326.

[Batista, 2003] Batista, F. (2003). Analise Sintactica de Superfıcie. Tese de Mestrado, Instituto

Superior Tecnico, Universidade Tecnica de Lisboa, Lisboa, Portugal.

[Batista e Mamede, 2002] Batista, F. e Mamede, N. (2002). SuSAna: Modulo Multifuncional da

Analise Sintactica de Superfıcie. In Gonzalo, J., Penas, A., e Ferrandez, A., editores, Workshop on

Multilingual Information Access and Natural Language Processing Workshop (IBERAMIA 2002),

pp. 29–37, Sevilha, Espanha.

Page 312: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

BIBLIOGRAFIA 277

[Berwick et al., 1991] Berwick, R., Abney, S., e Tenny, C., editores (1991). Parsing by Chunks.

Kluwer Academic Publishers.

[Bes, 1999a] Bes, G. G. (1999a). La phrase verbal noyau en francais. In Recherches sur le francais

parle, volume 15, pp. 273–358. Universite de Provence, Franca.

[Bes, 1999b] Bes, G. G. (1999b). Satisfaction et Substitution. Relatorio tecnico, GRIL, Universite

Blaise-Pascal, Clermont-Ferrand, Franca.

[Bes, 2000] Bes, G. G. (2000). Vers le parsage de la phrase. Relatorio tecnico, GRIL, Universite

Blaise-Pascal, Clermont-Ferrand, Franca.

[Bes, 2001a] Bes, G. G. (2001a). Categories for 5P. Relatorio tecnico, GRIL, Universite Blaise-

Pascal, Clermont-Ferrand, Franca.

[Bes, 2002] Bes, G. G. (2002). Private communication.

[Bes, 2003] Bes, G. G. (2003). La linguistique entre science et ingenierie. TAL.

[Bes, 2001b] Bes, G. G. (Avril, 2001b). Empiricite en linguistique et grammaire de Montague: la

semantique en 5P et la compositionnalite (avec en annexe Grammaire de Montague et ambiguıte).

Relatorio tecnico, GRIL, Universite Blaise-Pascal, Clermont-Ferrand, Franca.

[Bes e Dahl, 2003] Bes, G. G. e Dahl, V. (2003). Balanced parentheses in NL texts: a useful cue in

the syntax/semantics interface. In Workshop on Prospects and Advances in the Syntax/Semantics

Interface, Nancy.

[Bes et al., 2003] Bes, G. G., Dahl, V., Guillot, D., Lamadon, L., Milutinovici, I., e Paulo, J. (2003).

A parsing system for balanced parentheses in NL texts. In 14th meeting of computational linguistics

in the Netherlands (CLIN’2003).

Page 313: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

278 BIBLIOGRAFIA

[Bes e Hagege, 2001] Bes, G. G. e Hagege, C. (2001). Properties in 5P. Relatorio tecnico, GRIL,

Universite Blaise-Pascal, Clermont-Ferrand, Franca.

[Bes et al., 1999] Bes, G. G., Hagege, C., e Coheur, L. (1999). Des proprietes linguistiques a l’analyse

d’une langue. In VEXTAL, Veneza, Italia.

[Blackburn e Bos, 1997] Blackburn, P. e Bos, J. (1997). Representation and inference for natural lan-

guage. A first course in computational semantics. CLAUS Report 90, Universitat des Saarlandes,

Saarbrucken. Working with First-Order Logic.

[Bos, 1995] Bos, J. (1995). Predicate Logic Unplugged. In Dekker, P. e Stokhof, M., editores, Proce-

edings of the 10th Amstardam Colloquium, pp. 133–142.

[Cawsey, 1997] Cawsey, A. (1997). The Essence of Artificial Intelligence. Prentice Hall.

[Chambreuil, 1989] Chambreuil, M. (1989). Grammaire de Montague. Adosa.

[Chaves, 2002] Chaves, R. (2002). Fundamentos para uma Gramatica Computacional do Portugues

Uma abordagem lexicalista. Tese de Mestrado, Faculdade de Letras da Universidade de Lisboa,

Lisboa, Portugal.

[Chierchia e McConnell-Ginet, 2000] Chierchia, G. e McConnell-Ginet, S. (2000). Meaning and

Grammar – an Introduction to Semantics. The MIT Press, 2 edition.

[Coheur, 2002] Coheur, L. (2002). Montague exlicado aos informaticos. Relatorio Tecnico

RT/009/02-CDIL, L2F-Laboratorio de Sistemas de Lıngua Falada, Inesc-id, Lisboa, Portu-

gal.

[Coheur, 2003] Coheur, L. (2003). Tira-Teimas: um verificador de propriedades. Relatorio Tecnico

RT/003/03-CDIL, L2F-Laboratorio de Sistemas de Lıngua Falada, Inesc-id, Lisboa, Portugal.

Page 314: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

BIBLIOGRAFIA 279

[Coheur, 2004] Coheur, L. (2004). De P2 a P5, propriedades de flechagem, regras semanticas, Al-

gas e AsdeCopas. Relatorio tecnico, L2F-Laboratorio de Sistemas de Lıngua Falada, Inesc-id,

Lisboa, Portugal. Em preparacao.

[Coheur et al., 2003a] Coheur, L., Batista, F., e Paulo, J. (2003a). JaVaLI!: understanding real ques-

tions. In EUROLAN 2003 student workshop: Applied Natural Language Processing, possible appli-

cations for the Semantic Web, Bucareste, Romenia.

[Coheur e Mamede, 2002] Coheur, L. e Mamede, N. (2002). From syntax to semantics: taking

advantage of 5P. In Ranchhod, E. e Mamede, N., editores, Advances in Natural Language Pro-

cessing, Third International Conference, Portugal for Natural Language Processing (PorTAL), pp.

79–82, Faro, Portugal. Springer-Verlag, LNAI 2389.

[Coheur e Mamede, 2003] Coheur, L. e Mamede, N. (2003). Tira-Teimas: after Shallow Parsing.

In Branco, A., Mendes, A., e Ribeiro, R., editores, Tagging and Shallow Processing of Portuguese:

workshop notes of TASHA’2003, volume TR–03–28 of Technical Reports, pp. 19–20, Lisboa, Por-

tugal. Faculdade de Ciencias da Universidade de Lisboa.

[Coheur e Mamede, 2004] Coheur, L. e Mamede, N. (2004). Language Technology for Portu-

guese: shallow processing tools and resources, chapter Checking properties after shallow

parsing. Colibri, Lisboa, Portugal.

[Coheur et al., 2003b] Coheur, L., Mamede, N., e Bes, G. G. (2003b). ASdeCopas: a syntactic-

semantic interface. In Pires, F. M. e Abreu, S., editores, Progress in Artificial Intelligence: 11th

Portuguese Conference on Artificial Intelligence, EPIA 2003, volume 2902 / 2003 of Lecture Notes

in Artificial Inteligence, Beja, Portugal. Springer-Verlag.

Page 315: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

280 BIBLIOGRAFIA

[Coheur et al., 2004a] Coheur, L., Mamede, N., e Bes, G. G. (2004a). A multi-use incremental

syntax-semantic interface. In Estal – Espana for natural Language Processing, Alicante, Espanha.

Springer-Verlag.

[Coheur et al., 2004b] Coheur, L., Mamede, N., e Bes, G. G. (2004b). A step towards incremental

generation of logical forms. In Romand 2004: 3rd workshop on RObust Methods in Analysis of

Natural Language Data (Coling 2004), Genebra, Suica.

[Cooper et al., 1994] Cooper, R., Crouch, R., van Eijck, J., Fox, C., van Genabith, J., Jaspers, J.,

Kamp, H., Pinkal, M., Poesio, M., Pulman, S., e Vestre, E. (1994). Describing the Approaches.

Relatorio tecnico, CWI Amsterdam, University of Edinburgh, Universitat des Saarlandes,

SRI Cambrige. The FraCas Consortium.

[Copestake et al., 1995] Copestake, A., Flickinger, D., Malouf, R., Riehemann, S., e Sag, I. A.

(1995). Translation using Minimal Recursion Semantics. In Proceedings of the 6th International

Conference on Theoretical and Methodological Issues in Machine Translation (TMI-95), Leuven,

Belgica.

[Copestake et al., 2001] Copestake, A., Flickinger, D., Pollard, C., e Sag, I. A. (2001). Minimal

Recursion Semantics: An Introduction. L&C, 1(3):1–47.

[Copestake et al., 1997] Copestake, A., Flickinger, D., e Sag, I. A. (1997). Minimal Recursion

Semantics: An Introduction. draft version.

[Copestake et al., 1999] Copestake, A., Flickinger, D., Sag, I. A., e Pollard, C. (1999). Minimal

Recursion Semantics: an Introduction. draft version.

Page 316: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

BIBLIOGRAFIA 281

[Courtin e Genthial, 1998] Courtin, J. e Genthial, D. (1998). Parsing with Dependency Relati-

ons and Robust Parsing. In Kahane, S. e Polguere, A., editores, Workshop on Processing of

Dependency-based Grammars (COLING-ACL), Canada.

[Covington, 1990] Covington, M. (1990). A Dependency parser for variable-word-order Languages.

Relatorio tecnico, University of Georgia, Athens, Georgia. AI-1990-01.

[Cunha e Cintra, 1985] Cunha, C. e Cintra, L. (1985). Breve Gramatica do Portugues Contem-

poraneo. Edicoes Joao Sa da Costa.

[da Silva, 1997] da Silva, L. M. (1997). Edite, Um Sistema de Acesso a Base de Dados em Lingua-

gem Natural, Analise Morfologica, Sintactica e Semantica. Tese de Mestrado, Instituto Superior

Tecnico, Universidade Tecnica de Lisboa, Portugal.

[da Silva et al., 1997] da Silva, L. M., Mamede, N., e Matos, D. (1997). EDITE - Um sistema de

acesso a uma base de dados em linguagem natural. In Workshop sobre taggers para o portugues, pp.

20–33, Lisboa, Portugal. Instituto de Linguıstica Teorica e Computacional.

[Davidson, 1980] Davidson, D. (1980). Essays on Actions and Events. Oxford University Press

Inc, New York.

[de Matos et al., 2004] de Matos, D. M., Ribeiro, R., e Mamede, N. (2004). Rethinking Reusable

Resources. In LREC 2004., Lisboa, Portugal.

[de Swart, 1998] de Swart, H. (1998). Introduction to Natural Language Semantics. CSLI Pu-

blications, Center for Study of Language and Information, Stanford, California.

[Debusmann, 2000] Debusmann, R. (2000). An Introduction to Dependency Grammar.

[Dowty et al., 1981] Dowty, D., Wall, R., e Peters, S. (1981). Introduction to Montague Seman-

tics, volume 11 of Texts and studies in linguistics and philosophy. Reidel.

Page 317: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

282 BIBLIOGRAFIA

[EAGLES, 1998] EAGLES (1998). Preliminary Recommendations on Semantic Encoding. Relatorio

tecnico, EAGLES (The EAGLES Lexicon Interest Group).

[Estrela e Pinto-Correia, 1994] Estrela, E. e Pinto-Correia, J. D. (1994). Guia Essencial da lıngua

Portuguesa, 3a edicao. ”Editorial Notıcias”.

[Filipe e Mamede, 1999] Filipe, P. P. e Mamede, N. J. (1999). Aquisicao de vocabulario num sistema

de interrogacoes em lıngua natural. In IV Encontro para o Processamento Computacional da Lıngua

Portuguesa (PROPOR’99), pp. 65–77, Evora, Portugal.

[Filipe e Mamede, 2000] Filipe, P. P. e Mamede, N. J. (2000). Databases and Natural Language

Interfaces. In V Jornada de Engenharia de Software e Bases de Dados (JESBD’2000), Espanha.

[Franca e Custodio, 2004] Franca, J. e Custodio, P. (2004). SAF – Speech Act Finder. Relatorio

tecnico, Instituto Superior Tecnico, Lisboa.

[Gamallo et al., 2003] Gamallo, P., Agustini, A., e Lopes, G. P. (2003). Acquiring Semantic Clas-

ses to Elaborate Attachment Heuristics. In 11th Portuguese Conference on Artificial Intelligence

(EPIA’01), Beja, Portugal. LNAI, Springer Verlag.

[Gamback, 1997] Gamback, B. (1997). Processing Swedish Sentences: A Unification-Based

Grammar and some Applications. Tese de Doutoramento, The Royal Institute of Techno-

logy and Stockholm University, Stockholm, Sweden.

[Gamback e Rayner, 1992] Gamback, B. e Rayner, M. (1992). The Swedish Core Language En-

gine. In Proceedings of the 3rd Nordi Conference on Text Comprehension in Man and Machine,

Linkoping, Suecia.

[Gharbia et al., 1998] Gharbia, A. B., Bernigot, C., Chambreuil, M., Otero, P. G., Panissod, C., e

Reinberger, M.-L. (1998). Semantiques. Hermes.

Page 318: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

BIBLIOGRAFIA 283

[Giguet e Vergne, 1997] Giguet, E. e Vergne, J. (1997). Syntactic analysis of unrestricted French. In

Proceedings of the International Conference on Recent Advances in Natural Languages Processing

(RANLP’97), pp. 276–281, Tzigov Chark, Bulgaria.

[Grinberg et al., 1995] Grinberg, D., Lafferty, J., e Sleator, D. (1995). A Robust Parsing Algorithm

For Link Grammars. Relatorio Tecnico CMU-CS-TR-95-125, School of Computer Science, Car-

negie Mellon University, Pittsburgh.

[Hagege, 2000] Hagege, C. (2000). Analyse Syntatic Automatique du Portugais. Tese de Dou-

toramento, Universite Blaise Pascal, Clermont-Ferrand, Franca.

[Hagege e Bes, 1999] Hagege, C. e Bes, G. G. (1999). Delimitacao das construcoes relativas e com-

pletivas na analise de superfıcie de textos. In IV Encontro para o Processamento Computacional da

Lıngua Portuguesa (PROPOR’99), pp. 93–104, Evora, Portugal.

[Hagege e Bes, 2002] Hagege, C. e Bes, G. G. (2002). Encoding and reusing linguistic information

expressed by Linguistic Properties. In Proceedings of COLING’2002, Taipei.

[Hagege, 2004] Hagege, C. (2004). Private comunication.

[Hobbs, 1983] Hobbs, J. R. (1983). An Improper Treatment of Quantification in Ordinary English.

In 21st Annual Meeting of the Association for Computational Linguistics (ACL).

[Hobbs, 1985] Hobbs, J. R. (1985). Ontological Promiscuity. In 23rd Annual Meeting of the Associ-

ation for Computational Linguistics (ACL).

[Janssen, 1997] Janssen, T. M. (1997). Compositionality. In van Benthem, J. e ter Meulen, A.,

editores, Handbook of Logic and Linguistics, pp. 417–473. Elsevier Science Publishers.

[Jarvinen e Tapanainen, 1997] Jarvinen, T. e Tapanainen, P. (1997). A non-projective dependency

parser. In Association for Computational Linguistics (ACL), pp. 64–71, Washington, DC USA.

Page 319: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

284 BIBLIOGRAFIA

[Jaspars, 1997] Jaspars, J. (1997). Minimal logics for reasoning with ambiguous expressions. Re-

latorio Tecnico 94, Universitat des Saarlandes, Saarbrucken.

[Jurafsky e Martin, 2000] Jurafsky, D. e Martin, J. (2000). Speech and Language Processing,

chapter 15. Prentice Hall.

[Kamp e Reyle, 1993] Kamp, H. e Reyle, U. (1993). From Discourse to logic. Kluwer Academic

Publishers.

[Kamp et al., 2004] Kamp, H., van Genabith, J., e Reyle, U. (2004). Discourse Representation

Theory: An updated survey. DRAFT of an article to appear in the new edition of the Handbook

of Philosophical Logic.

[Katz et al., 1998] Katz, B., Yuret, D., Lin, J., Felshin, S., Schulman, R., e Ilik, A. (1998). Blitz:

A Preprocessor for Detecting Context-Independent Linguistic Structures. In Proceedings of the 5th

Pacific Rim Conference on Artificial Intelligence (PRICAI ’98).

[Keenan e Faltz, 1985] Keenan, E. L. e Faltz, L. M. (1985). Boolean Semantics for Natural Lan-

guage. Kluwer Academic Publishers.

[Mateus et al., 2003] Mateus, M. H. M., Brito, A. M., Duarte, I., e Faria, I. H. (2003). Gramatica

da Lıngua Portuguesa. Editorial Caminho, Lisboa, 5 edition.

[Milward, 1999] Milward, D. (1999). Towards a Robust Semantics for Dialogue using Flat Structu-

res. In Amstelogue Workshop on the Semantics and Pragmatics of Dialogue, Amsterdam Univer-

sity.

[Moia, 1992] Moia, T. (1992). Aspectos da Semantica do Operador Qualquer. In Cadernos de

Semantica, volume 5. Faculdade de Letras da Universidade de Lisboa.

Page 320: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

BIBLIOGRAFIA 285

[Molla, 2000] Molla, D. (2000). Ontologically Promiscuous Flat Logical Forms for NLP. In IWCS-4,

Tilburg, Holanda.

[Molla et al., 2000a] Molla, D., Schwitter, R., Hess, M., e Fournier, R. (2000a). Answer Extraction

using a dependency grammar in Extrans. T.A.L., 41(1):127–156.

[Molla et al., 2000b] Molla, D., Schwitter, R., Hess, M., e Fournier, R. (2000b). Extrans, an answer

extraction system. T.A.L. special issue on Information Retrieval oriented Natural Language Proces-

sing, 41(2):1–25.

[Molla, 2004] Molla, D. (2004). Private comunication.

[Molla e Hutchinson, 2002] Molla, D. e Hutchinson, B. (2002). Dependency-Based Semantic In-

terpretation for Answer Extraction. In Proceedings of the Australasian NLP Workshop (ANLP’02),

Canberra, Australia.

[Molla e Hutchinson, 2003] Molla, D. e Hutchinson, B. (2003). Intrinsic versus Extrinsic Eva-

luations of Parsing Systems. In Proceedings European Association for Computational Linguistics

(EACL), workshop on Evaluation Initiatives in Natural Language Processing, pp. 43–50, Buda-

peste, Hungria.

[Molla et al., 2003] Molla, D., Schwitter, R., Rinaldi, F., Dowdall, J., e Hess, M. (2003). ExtrAns:

Extracting Answers from Technical Texts. IEEE Intelligent Systems, 18(4).

[Montague, 1974a] Montague, R. (1974a). English as a Formal Language. In Thomason, R., editor,

Formal Philosophy. Selected papers of Richard Montague, pp. 188–221. Yale University Press,

New Haven.

Page 321: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

286 BIBLIOGRAFIA

[Montague, 1974b] Montague, R. (1974b). The Proper Treatment of Quantification in Ordinary

English. In Thomason, R., editor, Formal Philosophy. Selected papers of Richard Montague, pp.

247–270. Yale University Press, New Haven.

[Montague, 1974c] Montague, R. (1974c). Universal Grammar. In Thomason, R., editor, For-

mal Philosophy. Selected papers of Richard Montague, pp. 223–246. Yale University Press, New

Haven.

[Moore, 1986] Moore, R. C. (1986). Problems in logical form. In Grosz, B., Jones, K., e Webber, B.,

editores, Readings in Natural Language Processing, pp. 285–292. Morgan Kaufmann Publishers.

[Mourao et al., 2004] Mourao, M., Cassaca, R., e Mamede, N. (2004). An independent Domain

Dialog System Through A Service Manager. In Estal – Espana for natural Language Processing,

Espanha. Springer-Verlag.

[Mourao et al., 2003] Mourao, M., Madeira, P., e Mamede, N. (2003). Interpretation and Discourse

Obligations in a Dialog System. In 6th PROPOR Workshop, Faro, Portugal.

[Muskens, 1998] Muskens, R. (1998). Underspecied semantics. Relatorio Tecnico 95, Universitat

des Saarlandes, Saarbrucken.

[Nivre, 2003] Nivre, J. (2003). An efficient algorithm for projective dependency parsing. In Procee-

dings of the 8th International Workshop on Parsing Technologies (IWPT 03), pp. 149–160, Nancy,

Franca.

[Nunes et al., 1986] Nunes, C., Oliveira, M. L., e Sardinha, M. L. (1986). Nova Gramatica de

Portugues, 13a edicao. ”Didactica Editora”.

[Partee e Hendriks, 1999] Partee, B. H. e Hendriks, H. (1999). Montague Grammar. recolhido na

net.

Page 322: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

BIBLIOGRAFIA 287

[Paulo, 2001] Paulo, J. (2001). PAsMo - Pos-Analise Morfologica. Relatorio tecnico, Instituto Su-

perior Tecnico, Lisboa.

[Paulo, 2004] Paulo, J. (2004). ATA Aquisicao de Termos Automatica. Tese de Mestrado, Instituto

Superior Tecnico, UTL, Lisboa.

[Peters e Peters, 2000] Peters, I. e Peters, W. (2000). The Treatment of Adjectives in SIMPLE:

Theoretical Observations. In 2nd International Conference on Language Resources and Evaluation

(LREC).

[Poesio, 1994] Poesio, M. (1994). Ambiguity, Underspecification and Discourse Interpretation. In

H. Bunt, R. A. M. e (eds.), G. R., editores, Proceedings of the First International Workshop on

Computational Semantics, pp. 151–160. ”ITK, Tilburg University”.

[Pulman, 1996] Pulman, S. G. (1996). Semantics. In Cole, R., Mariani, J., Uszkoreit, H., Zaenen,

A., e Zue, V., editores, Survey of the State of the Art in Human Language Technology. Cambridge

University Press.

[Rapaport, 2000] Rapaport, W. (2000). How to Pass a Turing Test: Syntactic Semantics, Natural-

Language Understanding, and First-Person Cognition. Journal of Logic, Language, and Information,

pp. 467–490.

[Rayner et al., 1996] Rayner, M., Carter, D., e Bouillon, P. (1996). Adapting the Core Language

Engine to French and Spanish. In Proceedings of NLP-IA-96, Moncton, new Brunswick.

[Reis et al., 1997] Reis, P., Matias, J., e Mamede, N. (1997). Edite - A Natural Language Interface

to Databases: a New Dimension for an Old Approach. In Proceedings of the Fourth International

Conference on Information and Communication Technology in Tourism (ENTER’97), pp. 317–326,

Edinburgh, Escocia. Springer-Verlag, Berlin, Germany.

Page 323: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

288 BIBLIOGRAFIA

[Relvas, 1996] Relvas, J. M. (1996). Gramatica Portuguesa. ”EUROPRESS/Livraria Leia”, Lis-

boa/Maputo, 2 edition.

[Reyle, 1995] Reyle, U. (1995). Proceedings of the EACL-95. In On Reasoning with Ambiguities.

[Reyle, 1996] Reyle, U. (1996). Co-Indexing Labelled DRSs to Represent and Reason with Ambigui-

ties. In S.Peters e van Deemter, K., editores, Semantic Ambiguity and Underspecification. CSLI,

Stanford CA”.

[Ribeiro et al., 2004] Ribeiro, R., de Matos, D. M., e Mamede, N. (2004). How to integrate data

from different sources. In A Registry of Linguistic Data Categories within an Integrated Language

Resources Repository Area, LREC 2004., Lisbon, Portugal.

[Rinaldi et al., 2002] Rinaldi, F., Dowdall, J., Hess, M., Molla, D., e Schwitter, R. (2002). Towards

Answer Extraction: An application to technical Domains. In Proceedings of the 15th European

Conference on Artificial Intelligence, Lyon. citeseer.nj.nec.com/rinaldi02towards.html.

[Rocha e Santos, 2000] Rocha, P. e Santos, D. (2000). CETEMPublico: Um corpus de grandes di-

mensoes de linguagem jornalıstica portuguesa. In das Gracas Volpe Nunes, M., editor, Actas

do V Encontro para o processamento computacional da lıngua portuguesa escrita e falada (PRO-

POR’2000), pp. 131–140, Sao Paulo, Brasil.

[Santos e Rocha, 2001a] Santos e Rocha (2001a). Corpus Natura/Publico.

[Santos e Bick, 2000] Santos, D. e Bick, E. (2000). Providing Internet access to Portuguese corpora:

the AC/DC project. In Proceedings of the Second International Conference on Language Resources

and Evaluation (LREC 2000), pp. 205–210, Athens.

Page 324: UNIVERSIDADE TÉCNICA DE LISBOA INSTITUTO SUPERIOR … · Uma interface sintaxe/semântica baseada em regras ... 3.1 Conceitos basicos ... 5.4 Flechagem dos modelos adjectivais nucleares

BIBLIOGRAFIA 289

[Santos e Rocha, 2001b] Santos, D. e Rocha, P. (2001b). Evaluating CETEMPublico, a free resource

for Portuguese. In Proceedings of the 39th Annual Meeting of the Association for Computational

Linguistics, pp. 442–449, Toulouse.

[Santos e Sarmento, 2002] Santos, D. e Sarmento, L. (2002). O projecto AC/DC: acesso a cor-

pora/disponibilizacao de corpora. In Actas do XVIII Encontro da Associacao Portuguesa de

Linguıstica (APL), pp. 705–717. Amalia Mendes and Tiago Freitas.

[Sleator e Temperley, 1993] Sleator, D. e Temperley, D. (1993). Parsing English with a link gram-

mar. In Proceedings of the Third International Workshop on Parsing Technologies.

[Temperley et al., 2004] Temperley, D., Sleator, D., e Lafferty, J. (2004). Link Grammar.

[Tidwell, 2001] Tidwell, D. (2001). XSLT. O’Reilly & Associates.

[van Eijck e Jaspars, 1996] van Eijck, J. e Jaspars, J. (1996). Ambiguity and Reasoning. Relatorio

Tecnico CS-R9616, Centrum voor Wiskunde en Informatica, Amsterdam.

[W3C, nda] W3C (n.d.a). Extensible Markup Language (XML). World Wide Web Consortium

(W3C). See: www.w3.org/XML.

[W3C, ndb] W3C (n.d.b). The Extensible Stylesheet Language (XSL). World Wide Web Con-

sortium (W3C). See: www.w3.org/Style/XSL.

[Wall et al., 2000] Wall, L., Christiansen, T., e Orwant, J. (2000). Programming Perl. O’Reilly &

Associates.

[Woods, 1978] Woods, W. A. (1978). Semantics and quantification in natural language question

answering. In Yovitz, M., editor, Advance in Computers, volume 17. New York: Academic

Press. Reprinted in Readings in Natural Language Processing, edited by B. Grosz, K. Jones and

B. Webber and published by Morgan Kaufmann Publishers, Inc. in 1986.