Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas...

Preview:

Citation preview

Modelo Geral, Novidades e Avaliação

Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota

Encontro do Segundo HAREMUniversidade de Aveiro, 7 de Setembro de

2008

1

Desafios HAREM clássico (seguindo genericamente

o modelo de classificação proposto no Primeiro HAREM, mas refinando algumas distinções, quer ao nível da segmentação das EM quer da sua classificação)

Pista para identificação e normalização de expressões temporais (Hagège et al., 2008)

Pista ReRelEM, para a identificação de relações semânticas entre EM

2

Calendário do HAREM (2007)

Primeira chamada para o Segundo HAREM

Data-limite para registo no HAREM

Data-limite para discussão sobre os moldes do Segundo HAREM

Versão preliminar das directivas do Segundo HAREM

3

Calendário do HAREM (2008)

Directivas finais e material de treino

Colecção HAREMPrimeira versão da Colecção Dourada

Primeira versão da mini-CD do TEMPO e a versão final CD Primeira versão da mini-CD do ReRelEM Versão final da mini-CD do TEMPO Resultados preliminares do HAREM clássicoResultados preliminares da pista do TEMPO

Versão final da mini-CD do ReRelEM

Resultados da pista ReRelEM Relatórios de desempenho

4

Caracterização do HAREM EM em contexto

 

 

5

O acordo político quanto à revisão foi obtido durante a <EM ID="aa46996-48" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Presidência Alemã</EM> , tendo cabido a <EM ID="aa46996-54" CATEG="ORGANIZACAO" TIPO="ADMINISTRACAO">Portugal</EM> concluir o processo de revisão.

Regressou então a <EM ID="hub-67792-106" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Portugal</EM>, onde iniciou meteórica carreira na experimentação de novas formas de expressão

Este debate passou completamente ao lado de <EM ID="H2-dftre765-8" CATEG="PESSOA" TIPO="POVO">Portugal</EM>

«o problema do <EM ID="hub-24360-322“ CATEG="ORGANIZACAO|ABSTRACCAO" TIPO="INSTITUICAO|DISCIPLINA">PSD</EM> é começar a ter só um <EM ID="hub-24360-323" CATEG="ABSTRACCAO" TIPO="IDEIA">Portugal</EM> ou dois dentro de si»

<EM ID=“Ex-1GM" CATEG="PESSOA" TIPO=“GRUPOMEMBRO">Portugal</EM> perdeu com a <EM ID=“Ex-2GM" CATEG="PESSOA" TIPO=“GRUPOMEMBRO“>Suíça</EM> por <EM ID=“Ex-3GM" CATEG=“VALOR" TIPO=“CLASSIFICACAO">2-0</EM>

Caracterização do HAREM EM vagas

 

 

6

Pela mão do <EM ID="aa66435-107" CATEG="PESSOA" TIPO="INDIVIDUAL">ministro Freitas do Amaral</EM>, e sem necessidade alguma, <EM ID="aa66435-108" CATEG="ORGANIZACAO|PESSOA" TIPO="ADMINISTRACAO|POVO">Portugal</EM> foi enxovalhado, coberto de vergonha e de cobardia, por um dos mais tristes textos políticos que já alguém escreveu.

<EM ID="hub-28874-31" CATEG="VALOR" TIPO="QUANTIDADE">Mais de 32 mil</EM> pessoas poderiam morrer se uma pandemia de gripe humana de origem aviária atingisse <EM ID="hub-28874-32" CATEG="PESSOA|LOCAL" TIPO="POVO|HUMANO" SUBTIPO="|PAIS">Portugal</EM>

os dois reinos católicos, <EM ID="aa66435-51" CATEG="PESSOA|ORGANIZACAO" TIPO="GRUPOIND|ADMINISTRACAO">Portugal</EM> e<EM ID="aa66435-52" CATEG="PESSOA|ORGANIZACAO" TIPO="GRUPOIND|ADMINISTRACAO">Espanha</EM>, partiram à conquista do mundo e tornaram-se <ALT> <EM ID="aa66435-53" CATEG="OUTRO">Impérios</EM> | Impérios </ALT> marítimos do <EM ID="aa66435-54" CATEG="LOCAL|LOCAL" TIPO="FISICO|HUMANO" SUBTIPO="REGIAO|DIVISAO">Novo Mundo</EM>

Caracterização do HAREM Análises alternativas (ALT)

 

 

7

Ambiguidade estrutural: aproximava a <ALT> <EM ID="H2-dftre765-106" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Igreja de Inglaterra</EM> | <EM ID="H2-dftre765-106-aa" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Igreja</EM> de <EM ID="H2-dftre765-16" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Inglaterra</EM> </ALT> do calvinismo.

Possibilidade de uma expressão poder ser reconhecida como EM, ou não:

<EM ID="aa66435-51" CATEG="PESSOA|ORGANIZACAO“ TIPO="GRUPOIND|ADMINISTRACAO">Portugal</EM> e <EM ID="aa66435-52" CATEG="PESSOA|ORGANIZACAO" TIPO="GRUPOIND|ADMINISTRACAO">Espanha</EM>, partiram à conquista do mundo e tornaram-se <ALT> <EM ID="aa66435-53" CATEG="OUTRO">Impérios</EM> | Impérios </ALT> marítimos;

Novidades no Segundo HAREM Uso extensivo de ALT para representação sistemática da

estrutura interna das EM constituídas por outras EM

<ALT><EM ID="aa55968-473" CATEG="PESSOA" TIPO="CARGO">presidente da Câmara de Nova Iorque</EM>

| presidente da   <EM ID="aa55968-7" CATEG="ORGANIZACAO" TIPO="ADMINISTRACAO">Câmara de Nova

Iorque</EM> | presidente da   <EM ID="aa55968-475aa" CATEG="ORGANIZACAO" TIPO="ADMINISTRACAO">Câmara</EM> de <EM

ID="aa55968-475" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="DIVISAO">Nova Iorque</EM> </ALT>

 

 

8

Novidades no Segundo HAREM ALT sistematicamente aplicados

9

CATEG ESTRUTURA EXEMPLO

PESSOA PESSOA de LOCALPESSOA de ORGANIZACAOPESSOA de ORG|LOCALPESSOA de PESSOA

Santo António de LisboaPresidente do Parlamento EuropeuPresidente dos Estados UnidosFCP de José Mourinho

ORGANIZACAO ORG de LOCALORG de ORG

Associação Académica de CoimbraConselho da UE

LOCAL LOCAL de LOCALLOCAL de ORGANIZACAO

Teatro Scala de MilãoCentro de Eventos da Fiergs

OBRA OBRA de PESSOAOBRA|LOCAL de LOCAL

Sagrada Família de GaudíMosteiro de Santa Clara-a-Velha

ACONTECIMENTO

ACONT de LOCALACONT de TEMPO

Jogos Olímpicos de BarcelonaVolta a Espanha de 1985

ABSTRACCAO ABSTRACCAO de LOCAL Blues do Delta

COISA COISA de ORGANIZACAO iPhone da Apple

Novidades no Segundo HAREM Não reconhecimento de certas palavras em maiúsculas como EM

 

 

 

10

Quando ocorrem no âmbito de uma unidade lexical composta que não constitui, ela própria, uma EM

pastéis de Belém; amêijoas à Bulhão Pato

Se os restantes constituintes (grafados em minúscula) dessa unidade lexical integrarem a lista das minúsculas permitidas no âmbito desta avaliação, toda a unidade lexical deverá ser reconhecida como EM

<EM ID="ric-19806-172" CATEG="ABSTRACCAO“ TIPO="ESTADO">doençadoença de Chagas</EM>

CATEGORIA TIPO SUBTIPOABSTRACCAO ESTADO, DISCIPLINA, IDEIA, NOME

OUTRO

ACONTECIMENTO EFEMERIDE, EVENTO, ORGANIZADOOUTRO

COISA CLASSE, MEMBROCLASSE, OBJECTOSUBSTANCIA, OUTRO

LOCAL

FISICO

HUMANO

VIRTUALOUTRO

AGUACURSO, AGUAMASSA, ILHA, PLANETA, REGIAO, RELEVO, OUTROCONSTRUCAO, DIVISAO, PAIS, REGIAO, RUA, OUTROCOMSOCIAL, OBRA, SITIO, OUTROOUTRO

OBRA ARTE, PLANO, REPRODUZIDA, OUTRO

ORGANIZACAOADMINISTRACAO, EMPRESA, INSTITUICAO, OUTRO

PESSOACARGO, GRUPOCARGO, GRUPOIND, GRUPOMEMBRO, INDIVIDUAL, MEMBRO, POVO, OUTRO

TEMPODURACAO, FREQUENCIA, GENERICOTEMPO_CALENDOUTRO

DATA, HORA, INTERVALO, OUTRO

VALORCLASSIFICACAO, MOEDA, QUANTIDADE, OUTRO

OUTRO13

X ESCOLA, OBRA, PLANO

X SUB

X PERIODO, CICLICO

X VARIADO

Colecção HAREM

14

Distribuição dos documentospor género na CD

DOCS: 1040Parágrafos: 15737Palavras: 670610

CD em números (1)

15

DOCS: 129Parágrafos: 2274Palavras: 147991Entidades: 7836Entidades vagas: 633 [52 classes]

Distribuição de categorias

16

CD em números (2)

Categorias associadas às entidades

Classes de vagueza(21 mais frequentes)

Processo de anotação da CDAnotação da CD, usando o Etiquet(h)arem

17

Processo de anotação da CDComparação automática das anotações, usando o

AlinhadorAnálise e discussão das diferenças encontradasValidação da sintaxe, usando o validador

desenvolvido para o efeitoRevisão manual da CDRevisão sequencial dos documentosRevisão por categoriaRevisão das análises alternativas (ALT)

18

Avaliação do HAREM clássico Melhorias em relação ao Primeiro HAREM

Contabilização de entidades parcialmente identificadas como incorrectas

Possibilidade de avaliação estrita dos ALT Casos conceptualmente distintos,

representados de forma diferente: ignorância, certeza de ser diferente, erro

Sistematização no tratamento das EM

19

Avaliação da classificação semântica

N

n

certostnsubtipos

certotntipos

certacncats1

_)1

1(_)1

1(_)1

1(1

M

n

espuriostnsubtipos

espuriotntipos

espuriacncats1

_1

_1

_1

N = número de diferentes classificações na CD de acordo com o cenárioM = número de classificações espúrias enviadas pelo sistemaα, β, γ = pesos das categorias (1), tipos (0.5) e subtipos (0.25)(c, t, st)_certo = 1, se estiver certo; caso contrário, (c, t, st)_certo = 0(c, t, st)_espuria= 1, se for espuria; caso contrário, (c, t, st)_espuria= 0

20

Programas de avaliação do HAREM clássico: entradas

<?xml version="1.0" encoding="ISO-8859-1" ?> <colHAREM versao="SegundoHarem">…<DOC DOCID="Xyz">

O <ALT> <EM ID="Xyz-60" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França de 2009</EM> | <EM ID="Xyz-60-aa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França</EM> <EM ID="Xyz-5" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> | <EM ID="Xyz-60-aaa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour</EM> de <EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> <EM ID="Xyz-5-aa" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> </ALT> vai começar no <EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> com um contra-relógio de <EM ID="Xyz-585" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM>, numa etapa que também terminará no principado monegasco. O início do contra-relógio terá lugar precisamente no mesmo local do local de partida das provas de <EM ID="Xyz-586" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Fórmula 1</EM>. "O prestígio do principado, a filosofia que tem para o desporto e grandes eventos e a localização geográfrica" foram apontados por <EM ID="Xyz-587" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM> como justificação para a decisão.

</DOC>…</colHAREM>

CDHAREM.xmlCDHAREM.xml

<?xml version="1.0" encoding="ISO-8859-1" ?> <colHAREM versao="CD">…<DOC DOCID="Xyz">

O Tour de <EM ID="Xyz_1" CATEG="LOCAL" TIPO=“FISICO“ SUBTIPO=“REGIAO">França</EM> <EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> vai começar no <EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> com um contra-relógio de <EM ID="Xyz_4" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM>, numa etapa que também terminará no principado monegasco. O início do contra-relógio terá lugar precisamente no mesmo local do local de partida das provas de Fórmula 1. "O prestígio do principado, a filosofia que tem para o desporto e grandes eventos e a localização geográfrica" foram apontados por <EM ID="Xyz_5" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM> como justificação para a decisão.

</DOC></colHAREM>

participacao.xmlparticipacao.xml

DOC Xyz<ALT><ALT1><EM ID="Xyz-60" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França de 2009</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>, <EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]</ALT1><ALT2><EM ID="Xyz-60-aa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]<EM ID="Xyz-5" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> ---> [<EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]</ALT2><ALT3><EM ID="Xyz-60-aaa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour</EM> ---> [null]<EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]<EM ID="Xyz-5-aa" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> ---> [<EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]</ALT3></ALT><EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]<EM ID="Xyz-585" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM> ---> [<EM ID="Xyz_4" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM>]<EM ID="Xyz-586" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Fórmula 1</EM> ---> [null]<EM ID="Xyz-587" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM> ---> [<EM ID="Xyz_5" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM>]

Programas de avaliação do HAREM clássico: Alinhador

Alinhador

CDHAREM.xmlCDHAREM.xml

participacao.xmlparticipacao.xml

EMs na CD

EMs na participaç

ão

DOC Xyz<ALT><ALT1><EM ID="Xyz-60" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França de 2009</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>, <EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]::[Parcialmente_Correcto_por_Defeito(0.1; 0.9), Parcialmente_Correcto_por_Defeito(0.2; 0.8)]</ALT1><ALT2><EM ID="Xyz-60-aa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Parcialmente_Correcto_por_Defeito(0.16666666666666666; 0.8333333333333334)]<EM ID="Xyz-5" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> ---> [<EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]::[Correcto]</ALT2><ALT3><EM ID="Xyz-60-aaa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour</EM> ---> [null]::[Em_Falta]<EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Correcto]<EM ID="Xyz-5-aa" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> ---> [<EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]::[Correcto]</ALT3></ALT><EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[Correcto]<EM ID="Xyz-585" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM> ---> [<EM ID="Xyz_4" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM>]::[Correcto]<EM ID="Xyz-586" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Fórmula 1</EM> ---> [null]::[Em_Falta]<EM ID="Xyz-587" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM> ---> [<EM ID="Xyz_5" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM>]::[Correcto]

Programas de avaliação do HAREM clássico: Avaliador de alinhamentos

Alinhador

CDHAREM.xmlCDHAREM.xml

participacao.xmlparticipacao.xml

Avaliador de alinhamentos

EM em falta

Alinhamentos classificados como: Correctos, Espurios,

Em Falta ou Parcialmente

Correctos

EMs parcialmente correctas são removidas na próxima fase

Tipos de cenário

Cenário total: elenco completo de categorias, tipos e subtipos propostos para o Segundo HAREM.

Cenário selectivo de avaliação: sub-conjunto de categorias, tipos e subtipos do cenário total que é alvo de avaliação.

Cenário selectivo de participação: sub-

conjunto de categorias, tipos e subtipos do cenário total que cada participante se propôs a utilizar.

24

#LOCAL(FISICO{ILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,RELEVO,AGUAMASSA};HUMANO{PAIS,RUA,DIVISAO,REGIAO,CONSTRUCAO,OUTRO};OUTRO{OUTRO};VIRTUAL{COMSOCIAL,OUTRO,SITIO,OBRA})

DOC Xyz<ALT><ALT1><EM CATEG="ESPURIO">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Espurio]</ALT1><ALT2></ALT2><ALT3><EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Correcto]</ALT3></ALT><EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[Correcto]

Programas de avaliação do HAREM clássico: Véus HAREM

Alinhador

CDHAREM.xmlCDHAREM.xml

participacao.xmlparticipacao.xml

Avaliador de alinhamentos

Véus(HAREM)

Dentro desta alternativa, a EM é

espúria

Alinhamentos filtrados de acordo com o cenário

pretendido

Remoção de alinhamentos

parcialmente correctos

#LOCAL(FISICO{ILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,RELEVO,AGUAMASSA};HUMANO{PAIS,RUA,DIVISAO,REGIAO,CONSTRUCAO,OUTRO};OUTRO{OUTRO};VIRTUAL{COMSOCIAL,OUTRO,SITIO,OBRA})

DOC Xyz<ALT><ALT1><EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Correcto]^1</ALT1></ALT><EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[Correcto]

Programas de avaliação do HAREM clássico: Organizador de ALTs

Organizadorde ALTs Alinhador

CDHAREM.xmlCDHAREM.xml

participacao.xmlparticipacao.xml

Avaliador de alinhamentos

Véus(HAREM)

- Remoção de alternativas vazias/duplicadas, surgidas depois da aplicação de véus- Remoção de EMs alinhadas mais do que uma vez dentro do mesmo ALT- Atribuição do peso1/total de ALT a cada EM dentro de um ALT

Peso

A EM espúria desapareceu porque alinhava correctamente com a alternativa

seguinte

Programas de avaliação do HAREM clássico: Avaliador semântico

#LOCAL(FISICO{ILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,RELEVO,AGUAMASSA};HUMANO{PAIS,RUA,DIVISAO,REGIAO,CONSTRUCAO,OUTRO};OUTRO{OUTRO};VIRTUAL{COMSOCIAL,OUTRO,SITIO,OBRA})

DOC Xyz<ALT><ALT1><EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[{Categoria(Correcto:[LOCAL] Espurio:[] Em_Falta:[]) Tipo(Correcto:[] Espurio:[FISICO] Em_Falta:[HUMANO]) Subtipo(Correcto:[] Espurio:[] Em_Falta:[]) MaxCSC_CD(1.5833333333333333) MaxCSC_S(1.5892857142857144) CSC(0.875) PALT(1.0)}]</ALT1></ALT><EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[{Categoria(Correcto:[LOCAL] Espurio:[] Em_Falta:[]) Tipo(Correcto:[HUMANO] Espurio:[] Em_Falta:[]) Subtipo(Correcto:[PAIS] Espurio:[] Em_Falta:[]) MaxCSC_CD(1.5833333333333333) MaxCSC_S(1.5833333333333333) CSC(1.5833333333333333)}]

Avaliadorsemântico

Organizadorde ALTs Alinhador

CDHAREM.xmlCDHAREM.xml

participacao.xmlparticipacao.xml

Avaliador de alinhamentos

Véus(HAREM)

Precisão

Abrangência

Medida-F

- Avaliação dos atributos semânticos.

Classificação máxima da EM na

CD

Classificação máxima da EM na

participação

Classificação efectiva

Peso ALT

Programas de avaliação do HAREM clássico: Selector de ALTs

#LOCAL(FISICO{ILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,RELEVO,AGUAMASSA};HUMANO{PAIS,RUA,DIVISAO,REGIAO,CONSTRUCAO,OUTRO};OUTRO{OUTRO};VIRTUAL{COMSOCIAL,OUTRO,SITIO,OBRA})

DOC Xyz<EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[{Categoria(Correcto:[LOCAL] Espurio:[] Em_Falta:[]) Tipo(Correcto:[] Espurio:[FISICO] Em_Falta:[HUMANO]) Subtipo(Correcto:[] Espurio:[] Em_Falta:[]) MaxCSC_CD(1.5833333333333333) MaxCSC_S(1.5892857142857144) CSC(0.875)}]<EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[{Categoria(Correcto:[LOCAL] Espurio:[] Em_Falta:[]) Tipo(Correcto:[HUMANO] Espurio:[] Em_Falta:[]) Subtipo(Correcto:[PAIS] Espurio:[] Em_Falta:[]) MaxCSC_CD(1.5833333333333333) MaxCSC_S(1.5833333333333333) CSC(1.5833333333333333)}]

Avaliadorsemântico

Organizadorde ALTs Alinhador

CDHAREM.xmlCDHAREM.xml

participacao.xmlparticipacao.xml

Avaliador de alinhamentos

Véus(HAREM)

Selectorde ALTs

Selecção da melhor alternativa (melhor medida-F e melhor

classificação)

Ficou a única alternativa que existia

Participação no Segundo HAREM

Manifestações de interesse: 22Sistemas inscritos: 16Sistemas participantes: 10Saídas: 27 (máx. 4 por participante)

29

Cenários selectivos de participaçãoSistema CE

N PES

ORG

LOC OBR

ACO

ABS

COI

TEM VAL

Cage2 Sel2 CAT CAT F + H CAT

DobrEM Pes

PorTexTO Temp

Priberam Tot

R3M Sel3

REMBRANDT Tot

REMMA Sel4 C/T C/T

SEI-Geo Sel5 F + H

SeRELeP Tot

XIP/L2F/XEROX

Sel6 NORM

IdentificaçãoClassificação

30

CAT – apenas CATEGORIAC/T – apenas CATEGORIA e TIPOF+H – apenas locais FISICOs e HUMANOsNORM – normalização das expressões temporais

ResultadosCenário total com avaliação estrita de ALTs

31

ResultadosCenário total com avaliação relaxada de ALTs

32

ResultadosCenário próprio com avaliação relaxada de

ALTs

33

Avaliação por categorias (melhores sistemas)

34

Precisão Abrangência

Medida-F

Agradecimentos

A Linguateca e o HAREM são financiados através do contrato nº 339/1.3/C/NAC, financiado pelo governo português e pela União Europeia, e executado pela FCCN.

35