Title: Segundo HAREM
1Segundo HAREM
- Modelo Geral, Novidades e Avaliação
- Paula Carvalho e Hugo Oliveira
- Diana Santos, Cláudia Freitas e Cristina Mota
Encontro do Segundo HAREM Universidade de Aveiro,
7 de Setembro de 2008
2Desafios
- HAREM clássico (seguindo genericamente o modelo
de classificação proposto no Primeiro HAREM, mas
refinando algumas distinções, quer ao nível da
segmentação das EM quer da sua classificação) - Pista para identificação e normalização de
expressões temporais (Hagège et al., 2008) - Pista ReRelEM, para a identificação de relações
semânticas entre EM
3Calendário do HAREM (2007)
4Calendário do HAREM (2008)
5Caracterização do HAREM
Regressou então a ltEM ID"hub-67792-106"
CATEG"LOCAL" TIPO"HUMANO" SUBTIPO"PAIS"gtPortuga
llt/EMgt, onde iniciou meteórica carreira na
experimentação de novas formas de expressão
O acordo político quanto à revisão foi obtido
durante a ltEM ID"aa46996-48" CATEG"ACONTECIMENTO
" TIPO"ORGANIZADO"gtPresidência Alemãlt/EMgt ,
tendo cabido a ltEM ID"aa46996-54"
CATEG"ORGANIZACAO" TIPO"ADMINISTRACAO"gtPortugallt
/EMgt concluir o processo de revisão.
Este debate passou completamente ao lado de ltEM
ID"H2-dftre765-8" CATEG"PESSOA"
TIPO"POVO"gtPortugallt/EMgt
o problema do ltEM ID"hub-24360-322
CATEG"ORGANIZACAOABSTRACCAO" TIPO"INSTITUICAOD
ISCIPLINA"gtPSDlt/EMgt é começar a ter só um ltEM
ID"hub-24360-323" CATEG"ABSTRACCAO"
TIPO"IDEIA"gtPortugallt/EMgt ou dois dentro de si
ltEM IDEx-1GM" CATEG"PESSOA" TIPOGRUPOMEMBRO"gt
Portugallt/EMgt perdeu com a ltEM IDEx-2GM"
CATEG"PESSOA" TIPOGRUPOMEMBROgtSuíçalt/EMgt por
ltEM IDEx-3GM" CATEGVALOR" TIPOCLASSIFICACAO"
gt2-0lt/EMgt
6Caracterização do HAREM
Pela mão do ltEM ID"aa66435-107" CATEG"PESSOA"
TIPO"INDIVIDUAL"gtministro Freitas do
Amarallt/EMgt, e sem necessidade alguma, ltEM
ID"aa66435-108" CATEG"ORGANIZACAOPESSOA"
TIPO"ADMINISTRACAOPOVO"gtPortugallt/EMgt foi
enxovalhado, coberto de vergonha e de cobardia,
por um dos mais tristes textos políticos que já
alguém escreveu.
ltEM ID"hub-28874-31" CATEG"VALOR"
TIPO"QUANTIDADE"gtMais de 32 millt/EMgt pessoas
poderiam morrer se uma pandemia de gripe humana
de origem aviária atingisse ltEM
ID"hub-28874-32" CATEG"PESSOALOCAL"
TIPO"POVOHUMANO" SUBTIPO"PAIS"gtPortugallt/EMgt
os dois reinos católicos, ltEM ID"aa66435-51"
CATEG"PESSOAORGANIZACAO" TIPO"GRUPOINDADMINIST
RACAO"gtPortugallt/EMgt e ltEM ID"aa66435-52"
CATEG"PESSOAORGANIZACAO" TIPO"GRUPOINDADMINIST
RACAO"gtEspanhalt/EMgt, partiram à conquista do
mundo e tornaram-se ltALTgt ltEM ID"aa66435-53"
CATEG"OUTRO"gtImpérioslt/EMgt Impérios lt/ALTgt
marítimos do ltEM ID"aa66435-54"
CATEG"LOCALLOCAL" TIPO"FISICOHUMANO"
SUBTIPO"REGIAODIVISAO"gtNovo Mundolt/EMgt
7Caracterização do HAREM
- Análises alternativas (ALT)
-
-
-
- Ambiguidade estrutural
-
- aproximava a ltALTgt ltEM ID"H2-dftre765-106"
CATEG"ABSTRACCAO" TIPO"DISCIPLINA"gtIgreja de
Inglaterralt/EMgt ltEM ID"H2-dftre765-106-aa"
CATEG"ABSTRACCAO" TIPO"DISCIPLINA"gtIgrejalt/EMgt
de ltEM ID"H2-dftre765-16" CATEG"LOCAL"
TIPO"HUMANO" SUBTIPO"PAIS"gtInglaterralt/EMgt
lt/ALTgt do calvinismo.
- Possibilidade de uma expressão poder ser
reconhecida como EM, ou não - ltEM ID"aa66435-51" CATEG"PESSOAORGANIZACAO
TIPO"GRUPOINDADMINISTRACAO"gtPortugallt/EMgt e
ltEM ID"aa66435-52" CATEG"PESSOAORGANIZACAO"
TIPO"GRUPOINDADMINISTRACAO"gtEspanhalt/EMgt,
partiram à conquista do mundo e tornaram-se
ltALTgt ltEM ID"aa66435-53" CATEG"OUTRO"gtImpérioslt/
EMgt Impérios lt/ALTgt marítimos
8Novidades no Segundo HAREM
- Uso extensivo de ALT para representação
sistemática da estrutura interna das EM
constituídas por outras EM - ltALTgt
- ltEM ID"aa55968-473" CATEG"PESSOA"
TIPO"CARGO"gtpresidente da Câmara de Nova
Iorquelt/EMgt - presidente da
- ltEM ID"aa55968-7" CATEG"ORGANIZACAO"
TIPO"ADMINISTRACAO"gtCâmara de Nova Iorquelt/EMgt - presidente da
- ltEM ID"aa55968-475aa" CATEG"ORGANIZACAO"
TIPO"ADMINISTRACAO"gtCâmaralt/EMgt de ltEM
ID"aa55968-475" CATEG"LOCAL" TIPO"HUMANO"
SUBTIPO"DIVISAO"gtNova Iorquelt/EMgt - lt/ALTgt
-
-
9Novidades no Segundo HAREM
- ALT sistematicamente aplicados
CATEG ESTRUTURA EXEMPLO
PESSOA PESSOA de LOCAL PESSOA de ORGANIZACAO PESSOA de ORGLOCAL PESSOA de PESSOA Santo António de Lisboa Presidente do Parlamento Europeu Presidente dos Estados Unidos FCP de José Mourinho
ORGANIZACAO ORG de LOCAL ORG de ORG Associação Académica de Coimbra Conselho da UE
LOCAL LOCAL de LOCAL LOCAL de ORGANIZACAO Teatro Scala de Milão Centro de Eventos da Fiergs
OBRA OBRA de PESSOA OBRALOCAL de LOCAL Sagrada Família de Gaudí Mosteiro de Santa Clara-a-Velha
ACONTECIMENTO ACONT de LOCAL ACONT de TEMPO Jogos Olímpicos de Barcelona Volta a Espanha de 1985
ABSTRACCAO ABSTRACCAO de LOCAL Blues do Delta
COISA COISA de ORGANIZACAO iPhone da Apple
10Novidades no Segundo HAREM
- Não reconhecimento de certas palavras em
maiúsculas como EM -
-
-
- Quando ocorrem no âmbito de uma unidade lexical
composta que não constitui, ela própria, uma EM - pastéis de Belém amêijoas à Bulhão Pato
- Se os restantes constituintes (grafados em
minúscula) dessa unidade lexical integrarem a
lista das minúsculas permitidas no âmbito desta
avaliação, toda a unidade lexical deverá ser
reconhecida como EM - ltEM ID"ric-19806-172" CATEG"ABSTRACCAO
TIPO"ESTADO"gtdoença de Chagaslt/EMgt
11Novidades no Segundo HAREM
- Desaparecimento de algumas EM estruturalmente
complexas -
-
-
-
-
- Moradas (anterior LOCAL CORREIO)
Primeiro HAREMltEM IDPH1 CATEGLOCAL
TIPO"CORREIO"gtRua Augusta, nº 5 , 1100-054
Lisboalt/EMgt
Segundo HAREMltEM IDSH1 CATEGLOCAL
TIPOADMINISTRATIVO SUBTIPORUAgt Rua
Augustalt/EMgt, nº 5, 1100-054 ltEM IDSH2
CATEGLOCAL TIPOADMINISTRATIVO
SUBTIPODIVISAOgtLisboalt/EMgt
12Novidades no Segundo HAREM
- Desaparecimento de algumas EM estruturalmente
complexas -
-
-
-
-
- Moradas (anterior LOCAL CORREIO)
- Referências bibliográficas (anterior OBRA
PUBLICACAO)
Primeiro HAREMSegundo ltEM ID"ric-85133-263"
CATEGOBRA TIPOPUBLICACAO"gt Calvino 1990
121lt/EMgt),
Segundo HAREM Segundo ltEM ID"ric-85133-263"
CATEG"PESSOA TIPO"INDIVIDUAL"gtCalvinolt/EMgt (
ltEM ID"ric-85133-273" CATEG"TEMPO"
TIPO"TEMPO_CALEND" SUBTIPO"DATA"gt1990lt/EMgt
121),
13CATEGORIA TIPO SUBTIPO
ABSTRACCAO ESTADO, DISCIPLINA, IDEIA, NOME OUTRO
ACONTECIMENTO EFEMERIDE, EVENTO, ORGANIZADO OUTRO
COISA CLASSE, MEMBROCLASSE, OBJECTO SUBSTANCIA, OUTRO
LOCAL FISICO HUMANO VIRTUAL OUTRO AGUACURSO, AGUAMASSA, ILHA, PLANETA, REGIAO, RELEVO, OUTRO CONSTRUCAO, DIVISAO, PAIS, REGIAO, RUA, OUTRO COMSOCIAL, OBRA, SITIO, OUTRO OUTRO
OBRA ARTE, PLANO, REPRODUZIDA, OUTRO
ORGANIZACAO ADMINISTRACAO, EMPRESA, INSTITUICAO, OUTRO
PESSOA CARGO, GRUPOCARGO, GRUPOIND, GRUPOMEMBRO, INDIVIDUAL, MEMBRO, POVO, OUTRO
TEMPO DURACAO, FREQUENCIA, GENERICO TEMPO_CALEND OUTRO DATA, HORA, INTERVALO, OUTRO
VALOR CLASSIFICACAO, MOEDA, QUANTIDADE, OUTRO
OUTRO
X ESCOLA, OBRA, PLANO
X SUB
X PERIODO, CICLICO
X VARIADO
14Colecção HAREM
DOCS 1040 Parágrafos 15737 Palavras 670610
Distribuição dos documentos por género na CD
15CD em números (1)
DOCS 129 Parágrafos 2274 Palavras
147991 Entidades 7836 Entidades vagas 633 52
classes
Distribuição de categorias
16CD em números (2)
Classes de vagueza(21 mais frequentes)
Categorias associadas às entidades
17Processo de anotação da CD
- Anotação da CD, usando o Etiquet(h)arem
18Processo de anotação da CD
- Comparação automática das anotações, usando o
Alinhador - Análise e discussão das diferenças encontradas
- Validação da sintaxe, usando o validador
desenvolvido para o efeito - Revisão manual da CD
- Revisão sequencial dos documentos
- Revisão por categoria
- Revisão das análises alternativas (ALT)
19Avaliação do HAREM clássico
- Melhorias em relação ao Primeiro HAREM
- Contabilização de entidades parcialmente
identificadas como incorrectas - Possibilidade de avaliação estrita dos ALT
- Casos conceptualmente distintos, representados de
forma diferente ignorância, certeza de ser
diferente, erro - Sistematização no tratamento das EM
20Avaliação da classificação semântica
N número de diferentes classificações na CD de
acordo com o cenárioM número de classificações
espúrias enviadas pelo sistemaa, ß, ? pesos
das categorias (1), tipos (0.5) e subtipos
(0.25) (c, t, st)_certo 1, se estiver certo
caso contrário, (c, t, st)_certo 0 (c, t,
st)_espuria 1, se for espuria caso contrário,
(c, t, st)_espuria 0
21Programas de avaliação do HAREM clássico entradas
22Programas de avaliação do HAREM clássico
Alinhador
Alinhador
EMs na CD
DOC Xyz ltALTgt ltALT1gt ltEM ID"Xyz-60"
CATEG"ACONTECIMENTO" TIPO"ORGANIZADO"gtTour de
França de 2009lt/EMgt ---gt ltEM ID"Xyz_1"
CATEG"LOCAL" TIPO"FISICO" SUBTIPO"REGIAO"gtFranç
alt/EMgt, ltEM ID"Xyz_2" CATEG"TEMPO"
TIPO"TEMPO_CALEND" SUBTIPO"DATA"gtde
2009lt/EMgt lt/ALT1gt ltALT2gt ltEM ID"Xyz-60-aa"
CATEG"ACONTECIMENTO" TIPO"ORGANIZADO"gtTour de
Françalt/EMgt ---gt ltEM ID"Xyz_1" CATEG"LOCAL"
TIPO"FISICO" SUBTIPO"REGIAO"gtFrançalt/EMgt ltEM
ID"Xyz-5" CATEG"TEMPO" TIPO"TEMPO_CALEND"
SUBTIPO"DATA"gtde 2009lt/EMgt ---gt ltEM ID"Xyz_2"
CATEG"TEMPO" TIPO"TEMPO_CALEND"
SUBTIPO"DATA"gtde 2009lt/EMgt lt/ALT2gt ltALT3gt ltEM
ID"Xyz-60-aaa" CATEG"ACONTECIMENTO"
TIPO"ORGANIZADO"gtTourlt/EMgt ---gt null ltEM
ID"Xyz-61" CATEG"LOCAL" TIPO"HUMANO"
SUBTIPO"PAIS"gtFrançalt/EMgt ---gt ltEM ID"Xyz_1"
CATEG"LOCAL" TIPO"FISICO" SUBTIPO"REGIAO"gtFranç
alt/EMgt ltEM ID"Xyz-5-aa" CATEG"TEMPO"
TIPO"TEMPO_CALEND" SUBTIPO"DATA"gtde 2009lt/EMgt
---gt ltEM ID"Xyz_2" CATEG"TEMPO"
TIPO"TEMPO_CALEND" SUBTIPO"DATA"gtde
2009lt/EMgt lt/ALT3gt lt/ALTgt ltEM ID"Xyz-584"
CATEG"LOCAL" TIPO"HUMANO" SUBTIPO"PAIS"gtMónacolt
/EMgt ---gt ltEM ID"Xyz_3" CATEG"LOCAL"
TIPO"HUMANO" SUBTIPO"PAIS"gtMónacolt/EMgt ltEM
ID"Xyz-585" CATEG"VALOR" TIPO"QUANTIDADE"gt15
quilómetroslt/EMgt ---gt ltEM ID"Xyz_4"
CATEG"VALOR" TIPO"QUANTIDADE"gt15
quilómetroslt/EMgt ltEM ID"Xyz-586"
CATEG"ABSTRACCAO" TIPO"DISCIPLINA"gtFórmula
1lt/EMgt ---gt null ltEM ID"Xyz-587"
CATEG"PESSOA" TIPO"INDIVIDUAL"gtChristian
Prudhommelt/EMgt ---gt ltEM ID"Xyz_5"
CATEG"PESSOA" TIPO"INDIVIDUAL"gtChristian
Prudhommelt/EMgt
EMs na participação
23Programas de avaliação do HAREM clássico
Avaliador de alinhamentos
Alinhamentos classificados como Correctos,
Espurios, Em Falta ou Parcialmente Correctos
Alinhador
Avaliador de alinhamentos
DOC Xyz ltALTgt ltALT1gt ltEM ID"Xyz-60"
CATEG"ACONTECIMENTO" TIPO"ORGANIZADO"gtTour de
França de 2009lt/EMgt ---gt ltEM ID"Xyz_1"
CATEG"LOCAL" TIPO"FISICO" SUBTIPO"REGIAO"gtFranç
alt/EMgt, ltEM ID"Xyz_2" CATEG"TEMPO"
TIPO"TEMPO_CALEND" SUBTIPO"DATA"gtde
2009lt/EMgtParcialmente_Correcto_por_Defeito(0.1
0.9), Parcialmente_Correcto_por_Defeito(0.2
0.8) lt/ALT1gt ltALT2gt ltEM ID"Xyz-60-aa"
CATEG"ACONTECIMENTO" TIPO"ORGANIZADO"gtTour de
Françalt/EMgt ---gt ltEM ID"Xyz_1" CATEG"LOCAL"
TIPO"FISICO" SUBTIPO"REGIAO"gtFrançalt/EMgtParc
ialmente_Correcto_por_Defeito(0.16666666666666666
0.8333333333333334) ltEM ID"Xyz-5"
CATEG"TEMPO" TIPO"TEMPO_CALEND"
SUBTIPO"DATA"gtde 2009lt/EMgt ---gt ltEM ID"Xyz_2"
CATEG"TEMPO" TIPO"TEMPO_CALEND"
SUBTIPO"DATA"gtde 2009lt/EMgtCorrecto lt/ALT2gt lt
ALT3gt ltEM ID"Xyz-60-aaa" CATEG"ACONTECIMENTO"
TIPO"ORGANIZADO"gtTourlt/EMgt ---gt
nullEm_Falta ltEM ID"Xyz-61" CATEG"LOCAL"
TIPO"HUMANO" SUBTIPO"PAIS"gtFrançalt/EMgt ---gt
ltEM ID"Xyz_1" CATEG"LOCAL" TIPO"FISICO"
SUBTIPO"REGIAO"gtFrançalt/EMgtCorrecto ltEM
ID"Xyz-5-aa" CATEG"TEMPO" TIPO"TEMPO_CALEND"
SUBTIPO"DATA"gtde 2009lt/EMgt ---gt ltEM ID"Xyz_2"
CATEG"TEMPO" TIPO"TEMPO_CALEND"
SUBTIPO"DATA"gtde 2009lt/EMgtCorrecto lt/ALT3gt lt
/ALTgt ltEM ID"Xyz-584" CATEG"LOCAL"
TIPO"HUMANO" SUBTIPO"PAIS"gtMónacolt/EMgt ---gt
ltEM ID"Xyz_3" CATEG"LOCAL" TIPO"HUMANO"
SUBTIPO"PAIS"gtMónacolt/EMgtCorrecto ltEM
ID"Xyz-585" CATEG"VALOR" TIPO"QUANTIDADE"gt15
quilómetroslt/EMgt ---gt ltEM ID"Xyz_4"
CATEG"VALOR" TIPO"QUANTIDADE"gt15
quilómetroslt/EMgtCorrecto ltEM ID"Xyz-586"
CATEG"ABSTRACCAO" TIPO"DISCIPLINA"gtFórmula
1lt/EMgt ---gt nullEm_Falta ltEM ID"Xyz-587"
CATEG"PESSOA" TIPO"INDIVIDUAL"gtChristian
Prudhommelt/EMgt ---gt ltEM ID"Xyz_5"
CATEG"PESSOA" TIPO"INDIVIDUAL"gtChristian
Prudhommelt/EMgtCorrecto
EMs parcialmente correctas são removidas na
próxima fase
EM em falta
24Tipos de cenário
- Cenário total elenco completo de categorias,
tipos e subtipos propostos para o Segundo HAREM. - Cenário selectivo de avaliação sub-conjunto de
categorias, tipos e subtipos do cenário total que
é alvo de avaliação. -
- Cenário selectivo de participação sub-conjunto
de categorias, tipos e subtipos do cenário total
que cada participante se propôs a utilizar. -
25Programas de avaliação do HAREM clássico Véus
HAREM
Alinhador
Avaliador de alinhamentos
Véus (HAREM)
Alinhamentos filtrados de acordo com o cenário
pretendido
LOCAL(FISICOILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,
RELEVO,AGUAMASSAHUMANOPAIS,RUA,DIVISAO,REGIAO,C
ONSTRUCAO,OUTROOUTROOUTROVIRTUALCOMSOCIAL,OU
TRO,SITIO,OBRA) DOC Xyz ltALTgt ltALT1gt ltEM
CATEG"ESPURIO"gtFrançalt/EMgt ---gt ltEM ID"Xyz_1"
CATEG"LOCAL" TIPO"FISICO" SUBTIPO"REGIAO"gtFranç
alt/EMgtEspurio lt/ALT1gt ltALT2gt lt/ALT2gt ltALT3gt lt
EM ID"Xyz-61" CATEG"LOCAL" TIPO"HUMANO"
SUBTIPO"PAIS"gtFrançalt/EMgt ---gt ltEM ID"Xyz_1"
CATEG"LOCAL" TIPO"FISICO" SUBTIPO"REGIAO"gtFranç
alt/EMgtCorrecto lt/ALT3gt lt/ALTgt ltEM
ID"Xyz-584" CATEG"LOCAL" TIPO"HUMANO"
SUBTIPO"PAIS"gtMónacolt/EMgt ---gt ltEM ID"Xyz_3"
CATEG"LOCAL" TIPO"HUMANO" SUBTIPO"PAIS"gtMónacolt
/EMgtCorrecto
Dentro desta alternativa, a EM é espúria
Remoção de alinhamentos parcialmente correctos
26Programas de avaliação do HAREM clássico
Organizador de ALTs
Organizador de ALTs
Alinhador
Avaliador de alinhamentos
Véus (HAREM)
LOCAL(FISICOILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,
RELEVO,AGUAMASSAHUMANOPAIS,RUA,DIVISAO,REGIAO,C
ONSTRUCAO,OUTROOUTROOUTROVIRTUALCOMSOCIAL,OU
TRO,SITIO,OBRA) DOC Xyz ltALTgt ltALT1gt ltEM
ID"Xyz-61" CATEG"LOCAL" TIPO"HUMANO"
SUBTIPO"PAIS"gtFrançalt/EMgt ---gt ltEM ID"Xyz_1"
CATEG"LOCAL" TIPO"FISICO" SUBTIPO"REGIAO"gtFranç
alt/EMgtCorrecto1 lt/ALT1gt lt/ALTgt ltEM
ID"Xyz-584" CATEG"LOCAL" TIPO"HUMANO"
SUBTIPO"PAIS"gtMónacolt/EMgt ---gt ltEM ID"Xyz_3"
CATEG"LOCAL" TIPO"HUMANO" SUBTIPO"PAIS"gtMónacolt
/EMgtCorrecto
A EM espúria desapareceu porque alinhava
correctamente com a alternativa seguinte
Peso
- Remoção de alternativas vazias/duplicadas,
surgidas depois da aplicação de véus - Remoção de EMs alinhadas mais do que uma vez
dentro do mesmo ALT- Atribuição do peso1/total
de ALT a cada EM dentro de um ALT
27Programas de avaliação do HAREM clássico
Avaliador semântico
Avaliador semântico
Organizador de ALTs
Alinhador
Avaliador de alinhamentos
Véus (HAREM)
Precisão
Medida-F
Abrangência
LOCAL(FISICOILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,
RELEVO,AGUAMASSAHUMANOPAIS,RUA,DIVISAO,REGIAO,C
ONSTRUCAO,OUTROOUTROOUTROVIRTUALCOMSOCIAL,OU
TRO,SITIO,OBRA) DOC Xyz ltALTgt ltALT1gt ltEM
ID"Xyz-61" CATEG"LOCAL" TIPO"HUMANO"
SUBTIPO"PAIS"gtFrançalt/EMgt ---gt ltEM ID"Xyz_1"
CATEG"LOCAL" TIPO"FISICO" SUBTIPO"REGIAO"gtFranç
alt/EMgtCategoria(CorrectoLOCAL Espurio
Em_Falta) Tipo(Correcto EspurioFISICO
Em_FaltaHUMANO) Subtipo(Correcto Espurio
Em_Falta) MaxCSC_CD(1.5833333333333333)
MaxCSC_S(1.5892857142857144) CSC(0.875)
PALT(1.0) lt/ALT1gt lt/ALTgt ltEM ID"Xyz-584"
CATEG"LOCAL" TIPO"HUMANO" SUBTIPO"PAIS"gtMónacolt
/EMgt ---gt ltEM ID"Xyz_3" CATEG"LOCAL"
TIPO"HUMANO" SUBTIPO"PAIS"gtMónacolt/EMgtCateg
oria(CorrectoLOCAL Espurio Em_Falta)
Tipo(CorrectoHUMANO Espurio Em_Falta)
Subtipo(CorrectoPAIS Espurio Em_Falta)
MaxCSC_CD(1.5833333333333333) MaxCSC_S(1.583333333
3333333) CSC(1.5833333333333333)
- Avaliação dos atributos semânticos.
Peso ALT
Classificação máxima da EM na CD
Classificação máxima da EM na participação
Classificação efectiva
28Programas de avaliação do HAREM clássico
Selector de ALTs
Avaliador semântico
Organizador de ALTs
Alinhador
Avaliador de alinhamentos
Véus (HAREM)
Selecção da melhor alternativa (melhor medida-F e
melhor classificação)
Selector de ALTs
LOCAL(FISICOILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,
RELEVO,AGUAMASSAHUMANOPAIS,RUA,DIVISAO,REGIAO,C
ONSTRUCAO,OUTROOUTROOUTROVIRTUALCOMSOCIAL,OU
TRO,SITIO,OBRA) DOC Xyz ltEM ID"Xyz-61"
CATEG"LOCAL" TIPO"HUMANO" SUBTIPO"PAIS"gtFrançalt
/EMgt ---gt ltEM ID"Xyz_1" CATEG"LOCAL"
TIPO"FISICO" SUBTIPO"REGIAO"gtFrançalt/EMgtCat
egoria(CorrectoLOCAL Espurio Em_Falta)
Tipo(Correcto EspurioFISICO
Em_FaltaHUMANO) Subtipo(Correcto Espurio
Em_Falta) MaxCSC_CD(1.5833333333333333)
MaxCSC_S(1.5892857142857144) CSC(0.875) ltEM
ID"Xyz-584" CATEG"LOCAL" TIPO"HUMANO"
SUBTIPO"PAIS"gtMónacolt/EMgt ---gt ltEM ID"Xyz_3"
CATEG"LOCAL" TIPO"HUMANO" SUBTIPO"PAIS"gtMónacolt
/EMgtCategoria(CorrectoLOCAL Espurio
Em_Falta) Tipo(CorrectoHUMANO Espurio
Em_Falta) Subtipo(CorrectoPAIS Espurio
Em_Falta) MaxCSC_CD(1.5833333333333333)
MaxCSC_S(1.5833333333333333) CSC(1.583333333333333
3)
Ficou a única alternativa que existia
29Participação no Segundo HAREM
- Manifestações de interesse 22
- Sistemas inscritos 16
- Sistemas participantes 10
- Saídas 27 (máx. 4 por participante)
30Cenários selectivos de participação
Sistema CEN PES ORG LOC OBR ACO ABS COI TEM VAL
Cage2 Sel2 CAT CAT F H CAT
DobrEM Pes
PorTexTO Temp
Priberam Tot
R3M Sel3
REMBRANDT Tot
REMMA Sel4 C/T C/T
SEI-Geo Sel5 F H
SeRELeP Tot
XIP/L2F/XEROX Sel6 NORM
CAT apenas CATEGORIA C/T apenas CATEGORIA e
TIPO FH apenas locais FISICOs e HUMANOs NORM
normalização das expressões temporais
Identificação
Classificação
31Resultados
- Cenário total com avaliação estrita de ALTs
-
32Resultados
- Cenário total com avaliação relaxada de ALTs
-
33Resultados
- Cenário próprio com avaliação relaxada de ALTs
-
-
33
34Avaliação por categorias (melhores sistemas)
Precisão
Abrangência
Medida-F
35Agradecimentos
- A Linguateca e o HAREM são financiados através do
contrato nº 339/1.3/C/NAC, financiado pelo
governo português e pela União Europeia, e
executado pela FCCN.