15
Cristina Mota Encontro do Segundo HAREM Universidade de Aveiro, 7 de Setembro de 2008

Cristina Mota Encontro do Segundo HAREM Universidade de Aveiro, 7 de Setembro de 2008

Embed Size (px)

Citation preview

Page 1: Cristina Mota Encontro do Segundo HAREM Universidade de Aveiro, 7 de Setembro de 2008

Cristina Mota

Encontro do Segundo HAREMUniversidade de Aveiro, 7 de Setembro de

2008

Page 2: Cristina Mota Encontro do Segundo HAREM Universidade de Aveiro, 7 de Setembro de 2008

Opções Adicionais de Anotação

Motivação: durante o processo de anotação mostrou-se necessário esclarecer dúvidas com o grupo propente

Resultado: documentámos a resposta a essas dúvidas

Page 3: Cristina Mota Encontro do Segundo HAREM Universidade de Aveiro, 7 de Setembro de 2008

Opções Adicionais de AnotaçãoTEMPO clássico

Extensão da entidade quando incluída numa expressão que toda ela responde adequadamente a "(prep) quando?" ou "quando?"

Extensão da entidade quando a expressão é constituída por DATA e HORA

Classificação como GENERICO

<EM ID="ric-22961-209“ CATEG="TEMPO" TIPO="GENERICO" >nos tempos</EM> em que São Paulo amanhecia mais surpreendente

nasceu <EM ID=" hub-71248-191" CATEG="TEMPO" TIPO="TEMPO_CALEND“ SUBTIPO="HORA">aos 30 segundos</EM> <EM ID="hub-71248-192" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de hoje</EM>

situado <EM ID=" H2-dhy6432-141" CATEG="TEMPO" TIPO="GENERICO">nos dias de hoje</EM> no Paquistão [*quando é que estava [Mehrgarh] situada no Paquistão? / nos dias de hoje]

Page 4: Cristina Mota Encontro do Segundo HAREM Universidade de Aveiro, 7 de Setembro de 2008

Opções Adicionais de AnotaçãoTEMPO clássico

Classificação como DURACAO

Classificação de expressões iniciadas por "há“

Ausência de marcação

<EM ID="aa87333-155" CATEG="TEMPO" TIPO="DURACAO">durante um período</EM> de férias

o CCB iniciava, <EM ID="Ntyr-78-400" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">há quinze anos</EM>, a sua actividade é um projeto que vem sendo realizado <EM ID="bob-14949-607" CATEG="TEMPO" TIPO="DURACAO">há mais de dois anos</EM>

"bimestral" em "com periodicidade bimestral""mais uma vez" e "outra vez"

Page 5: Cristina Mota Encontro do Segundo HAREM Universidade de Aveiro, 7 de Setembro de 2008

Opções Adicionais de AnotaçãoTEMPO estendido

Expressões compostas por data absoluta e data referencial

Expressões com valor de data sem nenhum dos campos ANO-MES-DIA especificado

<EM ID="hub-18050-209" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA" TEMPO_REF="TEXTUAL" SENTIDO="SIMULT" VAL_DELTA="">a 30 desse mês </EM>

<EM ID="ric-54609-190" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA" TEMPO_REF="ABSOLUTO" VAL_NORM="">nos anos 90</EM>

Page 6: Cristina Mota Encontro do Segundo HAREM Universidade de Aveiro, 7 de Setembro de 2008

Opções Adicionais de AnotaçãoTEMPO estendido

Expressões com valor simultâneo

Preenchimento de VAL_DELTA e VAL_NORM na ausência total de informação

<EM ID="aa33715-460" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA" TEMPO_REF="ENUNCIACAO" SENTIDO="SIMULT" VAL_DELTA="">este ano </EM>

<EM ID="aa94781-176" CATEG="TEMPO" TIPO =" DURACAO" VAL_NORM="">Há anos</EM>

Page 7: Cristina Mota Encontro do Segundo HAREM Universidade de Aveiro, 7 de Setembro de 2008

CD TEMPO (1)DOCS: 30Parágrafos: 304Palavras: 12992Entidades: 1508Entidades vagas: 118 [21 classes]Entidades TEMPO: 232 [15.38%]

Distribuição de categorias

Page 8: Cristina Mota Encontro do Segundo HAREM Universidade de Aveiro, 7 de Setembro de 2008

CD TEMPO (2)

Categorias associadas às entidades

Classes de vagueza

Page 9: Cristina Mota Encontro do Segundo HAREM Universidade de Aveiro, 7 de Setembro de 2008

CD TEMPO (3)

Page 10: Cristina Mota Encontro do Segundo HAREM Universidade de Aveiro, 7 de Setembro de 2008

Avaliação do TEMPO

N

n

certostnsubtipos

certotntipos

certacncats1

_)1

1(_)1

1(_)1

1(1

M

n

espuriostnsubtipos

espuriotntipos

espuriacncats1

_1

_1

_1

s_certo*

tr_certo*

lim_certo) + M_certo + (H_certo *

lim_certo + ES_certa + M_certo + H_certo + D_certo + A_certo + (E_certa *

vn_certo*

vd_certo*

HAREM Clássico

TEMPO estendido completo

HAREM estendido sem normalização

HAREM estendido só normalização

TEMPO_REF

SENTIDO

VAL_DELTA

VAL_NORM DURACAO

VAL_NORM DATA

VAL_NORM HORA

Page 11: Cristina Mota Encontro do Segundo HAREM Universidade de Aveiro, 7 de Setembro de 2008

ParticipantesSistema TEMP

OComTIPO

ComSUBTIPO

SENTIDO

TEMPO_REF

Norm

Cage2

DobrEM

PorTexTO

Priberam

R3M

REMBRANDT

REMMA

SEI-Geo

SeRELeP

XIP-L2F/Xerox

Page 12: Cristina Mota Encontro do Segundo HAREM Universidade de Aveiro, 7 de Setembro de 2008

Resultados (1)

Page 13: Cristina Mota Encontro do Segundo HAREM Universidade de Aveiro, 7 de Setembro de 2008

Resultados (2)

Page 14: Cristina Mota Encontro do Segundo HAREM Universidade de Aveiro, 7 de Setembro de 2008

Comentários finaisAlgum grau de desadequamento em relação

ao modelo semântico do HAREMGENERICO, por exemplo, pode não ter valor

temporal:Dezembro tem 8 letras

Avalição dos atributos estendidos combinada ou separada da avaliação clássica?

O processo de anotação podia ter beneficiado por ter colaboração de um dos proponentes

Page 15: Cristina Mota Encontro do Segundo HAREM Universidade de Aveiro, 7 de Setembro de 2008

Agradecimentos

A Linguateca e o HAREM são financiados através do contrato nº 339/1.3/C/NAC, financiado pelo governo português e pela União Europeia, e executado pela FCCN.

15