Title: Kein Folientitel
1Phrasenerkennung Nach dem Artikel
Linguistically Motivated Information Retrieval
Avi Arampatzis, Th.P. van der Weide, P. van
Bommel, C.H.A. Koster To appear in Encyclopedia
of Library and Information Science, Volume 69,
December 2000. Allen Kent, editor. Published by
Marcel Dekker, Inc., New York, Basel
2(No Transcript)
3Definition 1 (naive keyword retrieval
hypothesis) If a query and a document have a
(key)word in common, then the document is to some
extent about the query.
4- Probleme
- Geht nicht auf die Morphologische Variation ein,
die Schlüsselwörter mit unterschiedlichem Numerus
und Genus hervorbringt. - Geht nicht auf Fälle ein, in denen
unterschiedliche Wörter verwendet werden, um die
gleiche Bedeutung zu repräsentieren. Das wird
hier als lexikalische Variation bezeichnet. - Unterscheidet nicht Fälle, in denen einzelne
Wörter mehrfache Bedeutung haben auf Grund von
semantischer Variation (bzw. Ambiguität). - Liefert unbefriedigende Ergebnisse bei
syntaktischer Variation.
5Definition 2 (naive Phrase Retrieval
Hypothesis) If a query and a document have a
phrase in common, then the document is to some
extent about the query.
6the hillary clinton health care bill proposal
7Definition 3 (noun phrase for IR) A core noun
phrase NP, from an IR point of view, has the
general form NP det pre
head post
Definition 4 (verb phrase for IR) A verb phrase
VP, from an IR point of view, has the general
form VP subj kernel comp
8(No Transcript)
9(No Transcript)
10Lemmatization 1. Verb forms are reduced to the
infinitive. 2. Inflected forms of nouns are
reduced to the nominative singular. 3.
Comparatives and superlatives of gradable
adjectives are reduced to the absolute form
phrase frame PF h m
11 engineering 1026 , of software 7
reverse 102 software 842 ...
12Definition 5 (noun phrase normalization) NP
det pre head post head pre post
13Definition 6 (verb phrase normalization I) VP
subj kernel comp subj verb(kernel)
verb(kernel) comp