Tanker og tendenser innen fagomrdet indeksering - PowerPoint PPT Presentation

1 / 78
About This Presentation
Title:

Tanker og tendenser innen fagomrdet indeksering

Description:

Tanker og tendenser innen fagomrdet indeksering – PowerPoint PPT presentation

Number of Views:33
Avg rating:3.0/5.0
Slides: 79
Provided by: Inge73
Category:

less

Transcript and Presenter's Notes

Title: Tanker og tendenser innen fagomrdet indeksering


1
Tanker og tendenser innen fagområdet indeksering
  • Workshop om nye retningslinjer innen indeksering
  • Høgskolen i Oslo, 28.november 2003
  • Ingeborg Torvik Sølvberg
  • IDI, NTNU

2
Dagens Tema
  • Eksempler på søking i systemer
  • Søking med søkemotor med alltheweb, SCIRUS
    (FAST)
  • Amazon.com
  • GalleriNor
  • CYC project
  • Metoder etc.
  • Semantisk web
  • RDF
  • Emnekart
  • Stedsnavnsregister

3
(No Transcript)
4
Search, German
5
FAST Topics Advanced Research Projects, Libraries
Initiative- Digital Library, Multimedia Database
Resources- Libraries Resources, Digital Library,
Online Archives- Putting Digital, Masullo Thomas,
Work- German Digital Libraries, Global-
Info- Information Retrieval, Investing
Effort- Selected Resource Guide, Stephen
Chapman- Text Archives Resources, Electronic
Journal- Building Large-scale Digital,
Computer- Fourth Delos Workshop, Digital
Library- Practical Digital Libraries, Prepare
Graduate- Bubl Link, Digital Libraries, Standards
Based- Register Canadian Digital, Libraries
Symposium- Usability Evaluation, Technology
Libraries, Library Issues- Fourth Acm Digital
Libraries  fewer topics
6
SCIRUS, incl.websearch
7
SCIRUS, no websearch
8
(No Transcript)
9
1.on Page 44 ". . . 44 FJORDS AND FERRIES
ROUTES 6-10 ROUTE 11 (SOUTH) 0 100 km 0 I 60
miles N n Kristiansund aU - Rlndél W l r.
urnadal - Alesund Rurrae, DPE T., rSylgen
Snohetta . Vestkapp SVNOM Vald . . . 2.on
Page 53 ". . . KRISTIANSUND 53 of 12 bridges
and stone embankments, which link , the islands
and holms. If the wind is strong, . . . 3.on
Page 106 ". . . Northern Lights Festival in
Tromso. Classical and contemporary music.
February Roros Fair, held since 1854. Lillc-
hammer Winter Arts Festival. Kristiansund Opera
Festival. Narvik Winter Festival, with music,
dance and carnivals, including steam engine
trips. March The Birkebeinerrennetcross-country
ski race between . . . 4.on Page 114 ". . .
fjords of western Norway, while divers prefer to
search wrecks and look for treasure in the area
around Alesund and Kristiansund. White-water
rides are not restricted to rip-roaring rivers
with narrow gorges. On the Westfjord between
Lofoten and the mainland, it . . . 5.from Index
". . . Flám railway ..........74
Krdkmo.................... 86 Norwegian Maritime
Tromso ................41-3 Forvik................
...... 92 Kristiansand ........35-7 Museum
............ 27 Tromvik ..................43
Fredrikstad ..............62 Kristiansund
............53 Norwegian Folk Trondheim
........38-40 Gedo ..................71-2 Kvaloya
island ........97 Museum ............28
Tvedestrand ............69 Geizanger
................78 Lake Bandak............ 70
Roval . . ."
10
AMAZON COM
Allows you to access millions og pages
11
GalleriNor
  • Digital katalog over viktige fotografier i Norge,
    1880-1950
  • 68.053 foto m/ beskrivelser
  • Lite standardiserte søkebegrep, bruker ikke
    (norsk) standard for stedsnavn, type
  • I eksemplet søker på kirke

12
(No Transcript)
13
(No Transcript)
14
Beskrivende data
  • Eier Norsk Folkemuseum Fotograf Lindahl,
    AxelDatering 1880 - 1890Tittel Søkeord
    kirke, hovedstad, bydel, torg, folkelivUtfyllende
    opplysninger Prot Christiania Vor Frelsers
    KirkeNavnOslo domkirke 1697 -
    (avbildet)Hansen, Knut Vigar - (41)Sted71 Oslo
    71 Sentrum Stortorvet 1Samling Tilvekstnr
    NF.WL 00066 Internnr NBR931200086

15
(No Transcript)
16
Beskrivende data
  • Eier Norsk Folkemuseum Fotograf Lindahl,
    AxelDatering 1880 - 1890Tittel Søkeord
    bygd, landskap, kirkeUtfyllende opplysninger
    Prot Telemarken, Vinje Kirke og Præster, med
    BygdepartiNavnHansen, Knut Vigar - (41)Vinje
    kirke 1796 - (avbildet)Sted71 Vinje T 71 Vinje
    Samling Tilvekstnr NF.WL 00207 Internnr
    NBR931200255

17
  • Ved søk på
  • Kirke og Telemark ingen treff
  • Kirke og Vinje ingen treff
  • gt Behov for bedre beskrivelser, standardisering,
    stedsnavsregister ( gazetteer)

18
CYC prosjekt
  • An immense multi-contextual knowledge base and an
    efficient inference engine. The knowledge base is
    built upon a core of over 1,000,000 hand-entered
    assertions (or "rules") designed to capture a
    large portion of what we normally consider
    consensus knowledge about the world. For example,
    Cyc knows that trees are usually outdoors, that
    once people die they stop buying things, and that
    glasses of liquid should be carried rightside-up.

19
CYC prosjekt tilbyr også programvare
  • OpenCyc is the open source version of the Cyc
    technology, the world's largest and most complete
    general knowledge base and commonsense reasoning
    engine
  • 6,000 concepts an upper ontology for all of
    human consensus reality.
  • 60,000 assertions about the 6,000 concepts,
    interrelating them, constraining them, in effect
    (partially) defining them.
  • A compiled version of the Cyc Inference Engine
    and the Cyc Knowledge Base Browser.
  • Software, documentation, a specification of CycL
    (more .. )
  • http//www.cyc.com/overview.html

20
What can one use OpenCyc to do?
  • OpenCyc can be used as the basis for a wide
    variety of intelligent applications such as
  • speech understanding (using the KB to prune
    implausible choices via common sense, discourse
    context, and prosodics)
  • database integration (using the KB as an
    interlingua through which semantic joins occur
    automatically via back chaining) and
    consistency-checking
  • rapid development of an ontology in a vertical
    area (by extending and growing the OpenCyc KB in
    that area, using the OpenCyc Rapid Theory
    Formation toolkit)
  • email prioritizing, routing, summarizing, and
    annotating
  • to name just a few

21
OpenCyc Selected Vocabulary and Upper Ontology
  • Fundamentals
  • Top Level
  • Rule Macro Predicates
  • Time and Dates
  • Spatial Relations
  • Quantities
  • Mathematics
  • Microtheories and Contexts
  • Groups
  • "Doing"
  • Transformations
  • Changes Of State
  • Transfer Of Possession
  • Movement
  • Parts of Objects
  • Composition of Substances
  • Agents
  • Organizations
  • Actors
  • Social
  • Biology
  • Chemistry
  • Physiology
  • General Medicine
  • Materials
  • Waves
  • Devices
  • Construction
  • Financial
  • Food
  • Clothing
  • Weather
  • Geography
  • Paths and Traversals
  • Transportation
  • Information
  • Perception
  • Agreements

22
CYC ontology
  • In philosophy, ontology is the study of being.
    In knowledge-based systems, an ontology is that
    part of the system which specifies what things
    exist and what is true about them. Cyc's
    ontology is essentially its whole knowledge base.
    You may hear people refer to their "ontology of
    devices" or their "temporal ontology". What they
    are talking about is those parts of their
    knowledge base (the constants and assertions)
    that concern devices or time.

23
CYC Fundamentals
24
genls   genls
  • A instance of TaxonomicSlotForCollections
    (q.v.) and a specialization of generalizations.
    genls relates a given collection (see
    Collection) to those collections that subsume
    it. More precisely, (genls SUBCOL SUPERCOL)
    means that SUPERCOL is a supercollection of
    SUBCOL anything that is an instance of (see
    isa) SUBCOL is also an instance of SUPERCOL.
    For example, (genls Dog Mammal) holds.
    genls is one of the most commonly-occurring
    predicates in the Cyc Knowledge Base, and one of
    the relations most fundamental to the Cyc
    ontology. See also subsetOf.

25
CYC Thing
  •    things Thing is the universal collection
    the collection which, by definition, contains
    everything there is. Every thing in the Cyc
    ontology every Individual (of any kind),
    every Set-Mathematical, and every Collection
    -- is an instance of (see isa) Thing.
    Similarly, every collection is a subcollection
    of (see genls) Thing. Trivially, Thing is
    both an instance of and a subcollection of
    itself, and is not a subcollection of any other
    collection. (Note that the above reference to
    every thing in the Cyc ontology is _not_ meant to
    be limited to things actually _reified_ in the
    Cyc system, but includes (e.g.) every instance --
    reified or not, known or not -- of every
    collection recognized by Cyc.)

26
CYC - types of temporally enduring object
27
CYC Clothing
  • SomethingToWear   wearable items
  • wornOn   worn on
  • wearsClothing   wears clothing
  • PuttingOnAClothingItem   putting on clothes 
  • dressAttribute-Coll   dress attribute - coll   

28
CYC SomethingToWear   wearable items
  • SomethingToWear is a specialization of
    DurableGoods, Device-SingleUser,
    PersonalProduct, and PortableObject. Each
    instance of SomethingToWear is an object that a
    mannequin or an animal (usually a person) wears
    on its body, i.e., in a WearingSomething event.
    It is worth remarking that, in such an event, the
    wearer doesn't have to exert any intentional
    effort to continue wearing the object. For
    example, shirts remain on people's torsos, hats
    stay on heads, rings on fingers once in place,
    dog collars stay on dogs, saddles stay on horses.
    By contrast, a hula hoop is NOT an example of
    SomethingToWear. A borderline case is a
    Purse, which at first blush seems to be
    something to wear, yet requires carrying by the
    performer, hence is not a member of this
    collection. Similarly, a briefcase is not an
    instance of SomethingToWear.guid
    bd5904a0-9c29-11b1-9dad-c379636f7270direct
    instance of ProductByGenericType
    ExistingObjectType direct specialization of
    PersonalProduct  PortableObject  Device-Sing
    leUser  DurableGood  direct generalization of
    Clothing-Generic ProtectiveAttire

29
CYC wornOn   worn on
  • This predicate is used to describe on what part
    of an individual's body a particular device or
    garment is worn. (wornOn ITEM BODYPART) means
    that ITEM is being worn on the body part
    BODYPART. wornOn can apply to human or animal
    wearers, and the items worn can include clothing,
    jewelry, medical devices, harnesses, carrying
    devices, wigs--basically, anything which can be
    attached to or borne upon a body part without
    intentionally holding or carrying it. Note that
    more than one item can be worn on a single body
    part at a single time -- one can simultaneously
    wear eyeglasses and a hat on one's head. Also, a
    single item can be worn on multiple body parts at
    once -- overalls, e.g., are worn simultaneously
    on the shoulders, the torso and the legs. See
    SomethingToWear for its specializations of
    things that can be worn. See wearsClothing,
    which relates entire wearers, rather than body
    parts, to items worn. See wornOn-TypeType for a
    predicate used to relate types of items worn to
    the body parts types they are by default worn
    on.guid bd5909d2-9c29-11b1-9dad-c379636f7270di
    rect instance of InterActorSlot direct
    specialization of touches supportedBy

30
Metoder etc
  • Semantisk web
  • RDF
  • Emnekart

31
The semantic web
  • Definition The Semantic Web is the abstract
    representation of data on the World Wide Web,
    based on the RDF standards and other standards to
    be defined. It is being developed by the W3C, in
    collaboration with a large number of researchers
    and industrial partners.
  • "The Semantic Web is an extension of the current
    web in which information is given well-defined
    meaning, better enabling computers and people to
    work in cooperation." -- Tim Berners-Lee, James
    Hendler, Ora Lassila, The Semantic Web,
    Scientific American, May 2001

32
The semantic web
  • Facilities to put machine-understandable data on
    the Web are becoming a high priority for many
    communities. The Web can reach its full potential
    only if it becomes a place where data can be
    shared and processed by automated tools as well
    as by people. For the Web to scale, tomorrow's
    programs must be able to share and process data
    even when these programs have been designed
    totally independently. The Semantic Web is a
    vision the idea of having data on the web
    defined and linked in a way that it can be used
    by machines not just for display purposes, but
    for automation, integration and reuse of data
    across various applications.

33
Bakgrunn
  • World Wide Web er i utgangspunket basert på at
    informasjon skulle leses av mennesker
  • Informasjonen på www er maskin-lesbar, men i
    liten grad maskin-forståelig.
  • Vanskelig å automatisere på www, og
    informasjonsvolumet gjør det umulig å forvalte
    informasjonene manuelt.
  • Løsningen på dette er å bruke metadata for å
    beskrive informasjonen www inneholder
  • Skillet mellom metadata og data er ikke distinkt,
    det som er data i en sammenheng er metdata i en
    annen sammenheng.

34
RDF
  • The Resource Description Framework is an
    infrastructure that enables the encoding,
    exchange, and reuse of structured metadata

35
Hva er RDF?
  • RDF er en spesifikasjon utviklet av W3C
  • Det er et rammeverk for å beskrive ressurser i et
    distribuert miljø (WWW), på en måte som kan
    tolkes av maskiner
  • Definerer en graf-basert modell for å beskrive
    ressurser (og hvordan disse er relatert til
    hverandre)
  • Spesifikasjonen definerer en syntaks implementert
    i XML

36
Formål
  • Resource Description Framework (RDF) er et
    grunnlag for å prosessere metadata
  • Gir interoperabilitet mellom applikasjoner som
    uveksler maskinforståelig informasjon
  • RDF legger vekt på automatisk prosessering av
    innhold på WWW
  • Viktig del av the Semantic Web

37
RDF - datamodell
Resources (ressurs) Properties (egenskap) Value
(verdi) Statements (utsagn)
38
RDF - datamodell
  • En ressurs (resource) er et hvilket som helst
    objekt/enhet som kan identifiseres med en URI
  • Ressurser har egenskaper (properties)
  • En egenskap har en spesifikk mening og en type.
    Den uttrykker semantikken mellom en verdi og
    ressursen den er assosiert med
  • En egenskap har en verdi (value)
  • Verdier kan være atomiske eller andre ressurser
  • En spesifisert ressurs sammen med en egenskap og
    tilhørende verdi kalles et uttrykk (statement)

39
RDF - resource
  • Alt som beskrives av RDF uttrykk kalles resource
  • En enkelt webside
  • Del av en webside
  • Samling av websider
  • Objekt som ikke direkte er tilgjengelig på web,
    f.eks. en trykt bok
  • En resource er alltid navngitt av en URI
  • Et hvilket som helst objekt/enhet som kan
    identifiseres med en URI kan beskrives vha. RDF

40
RDF - property
  • Ressurser har egenskaper (properties)
  • En egenskap er et spesifikt aspekt,
    karakteristika, attributt eller relasjon som
    brukes for å beskrive en resource
  • En egenskap har en spesifikk mening og en type.
    Den uttrykker semantikken mellom en verdi og
    ressursen den er assosiert med
  • Hvordan egenskaper skal defineres er en tema for
    en egen WWW spesifikasjon RDF Schema
    Specification

41
RDF - value
  • I et uttrykk vil en egenskap ar en verdi (value)
  • En verdi kan være kan være en annen resource
    eller en literal (f.eks. tekststreng)
  • Navn Trond Aalberg
  • Navn http//www.idi.ntnu.no/trondaal
  • Verdier kan være atomiske eller komplekse
    (definert som andre ressurser)

42
RDF - statement
  • En spesifikk resource sammen med en navngitt
    property pluss verdien av property er et RDF
    statement.
  • Disse tre individuelle delene av et statement
    kalles subjekt, predikat og objekt

43
Eksempel på RDF statement
Alt.1) Forfatteren av Dokument er Trond
Aalberg Alt.2) Trond Aalberg er forfatteren av
Dokument
Dokument
Forfatter
Trond Aalberg
Predikat (property)
Subjekt (resource)
Objekt (literal value)
44
RDF - identifikatorer
En resource identifiseres vha. av resource
identifiers. En resource identifier er en URI
evt. anchor id
http//www.ifi.ntnu.no/trondaal/index.html
Forfatter
Trond Aalberg
45
Et mer komplekst RDF-uttrykk
Objektet i uttrykket kan også være en
identifiserbare ressurs med tilhørende
egenskaper
http//www.idi.ntnu.no/trondaal/index.html
Tittel
Min hjemmeside
Forfatter
http//www.idi.ntnu.no/ansattid/123
Email
Navn
Trond Aalberg
trondaal_at_ifi.ntnu.no
46
Ontologier
  • Ontologier er en måte å beskrive meningene og
    relasjonene til en term
  • RDF Schema
  • benyttes for å definere RDF properties
  • DAML - The DARPA Agent Markup Language
  • Bygger på RDF, men går et skritt lengre enn RDF
    Schema og gir muligheten for større
    uttrykkskraft

47
Relasjoner som del av metadata
  • Tradisjonelt er metadata fokusert på å beskrive
    dokumenter
  • Indre og ytre egenskaper
  • Klassifisering
  • Relasjoner mellom bibliografiske enheter er også
    viktige
  • Klassifisering kan karakteriseres som å relatere
    basert på likhet (emnebasert)
  • Mange aktuelle relasjons typer jmfr. FRBR
    modellen
  • Et generelt problem at relasjoner ofte uttrykkes
    som henvisninger (som er lite egnet for
    prosessering)

48
Relasjoner i FRBR modellen
  • Definerer et sett med bibliografiske
    relasjonstyper
  • Slike relasjoner er nødvendige for at brukerne
    skal kunne navigere i det univers av entiteter
    som beskrives i bibliografisk informasjon

Work Charles Dickens A Christmas Carol

is realized through
is realized through
Expression1 Tamil translation by Venkatachari
Expression1 original english text
has a translation
is a translation
49
Part of a semantic net (ontology) Project
KNOWIT Satellite-communication
hsc
Process
Satellite-control
has-subprosess
Power-controll
has-subprosess
Gain-adjustment
controls
Up-link-power-cntr
influences
Output-power-cntr
hsc
Property
Transmitter-pwr
has-synonym
Transmitter-gain
has-property
influences
Propagation-loss
Transmission-loss
Has-synonym
hsc
Component
Noise-propagation
Transmitter
50
Generelt om TopicMaps
  • TopicMaps kan relateres til mange andre måter å
    organisere informasjon på
  • fra bibliotek og informasjonsfag
  • f.eks. thesauri
  • fra kunnskapsrepresentasjon i AI-faget
  • f.eks. semantiske nett
  • metadata-løsninger
  • f.eks. RDF
  • hypermedia
  • f.eks. lenker som ekstern informasjon
  • Basis bruk av topic, association og occurrence
    elementer er relativt enkel, MEN det ligger en
    signifikant kompleksitet i bruken av
    emne-identifikatorer og topics som typemekanisme
    for de forskjellige element forekomstene som
    benyttes.

51
TopicMaps
  • ISO standard for å beskrive kunnskapsstrukturer
    og forbinde disse med ressurser.
  • Opprinnelig basert på ISO HyTime(en SGML-basert
    standard for hypermedia)
  • XTM (XML Topic Maps) er en implementasjon av
    TopicMaps basert på XML

52
Basis konsepter i TopicMaps
  • Topics
  • Association
  • Occurrences

53
Reifisering
  • XTM
  • The act of creating a topic is called
    reification
  • Encyclopædia Britannica Online
  • the treatment of something abstract as a
    material or concrete thing

54
Reifisering i TopicMaps
  • Reifisering er et basis paradigme i TopicMaps
  • Den eneste måten å si noe som helst vha. en
    TopicMap er ved å opprette en topic og tilordne
    denne karakteristikker.
  • Lager representasjoner av emner som er
    maskinprosesserbare
  • Et topic er for en maskin det et emne er for et
    menneske.
  • Siden alt kan reifiseres som et topic, er det
    også mulig å bruke dette på elementene i et
    topicmap, f.eks. på association og occurrence
    elementet
  • muliggjør kunnskapsrepresentasjon på flere nivåer

55
Emne identitet
  • For å kunne fastslå hvilket emne et topic
    representerer må emnet gies en identitet
  • To topics som har samme emne-identitet ansees for
    å være om det samme og må slåes sammen
  • For å kunne støtte sammenslåeing av topicmaps er
    det lagt stor vekt på behovet for å kunne
    identifisere emner (via topics).
  • Emne identitet etableres ved
  • å adressere et emne direkte (når det lar seg
    gjøre f.eks. adresserbare informasjonsressurser)
  • ved indirekte emne-indikatorer (f.eks. henvisning
    til ontologi)

56
Topic
  • A topic is a resource that acts as a proxy for
    some subject it is the topic map system's
    representation of that subject
  • Karakteristikker vi kan tilordne et topic
  • navn
  • klassifisering (instanceOf)
  • emne identifikator (subjectIdentity)
  • forekomst (occurence)
  • en ressurs som inneholder informasjon relevant
    for emnet
  • For en topic som deltar i en assosiasjon kan vi
    karakterisere den rollen en topic har

57
Occurence
  • The ltoccurrencegt element specifies a resource
    supplying information relevant to a topic.
  • Type ressurs kan indikeres vha. instanceOf
    elementet og subelementene kan inneholde et
    subjectIdentityRef eller topicRef element
  • Topics og Occurences er skilt i to lag
  • (Occurence role mnemonic)
  • Occurence type reference to a topic which
    further gives the characteristics of the nature
    of the occurences relevance to its subject

58
Associations
  • An association is a relationship between one or
    more topics
  • Hver assosiasjon er en instans av en
    assosiasjonsklasse
  • kan indikeres ved en emne identifikator eller
    referanse til topic som representerer denne typen
    assosiasjoner
  • Topics deltar i en assosiasjon vha member
    elementet
  • Association mellom topics kan grupperes i hht
    type
  • Hvilken rolle en topic oppfyller i en
    assosiasjon, spesifiseres vha. rolle elementet
  • Sematikken ved en rolle kan indikeres vha
    topicRef eller subjectIndicatorRef
  • Association mekanismen muliggjør beskrivelser av
    relasjoner mellom Topics, som i semantisk nett og
    i thesauri.

59
Sondre Skaug Bjørnebekkhttp//www.idi.ntnu.no/gru
pper/if/publikasjoner/Report_topicmaps_9sem.pdf
60
(No Transcript)
61
(No Transcript)
62
(No Transcript)
63
Noen karakteristikker oppgaven
  • Prototype Emnekart på eksisterende
    innholdstjeneste med tanke på navigasjon i tekst
  • Samfun.net laget av Aschehoug med Inspera som
    leverandør av teknisk løsning
  • ser kun på deler av TMs muligheter

64
Vurderinger
  • Generelle vurderinger
  • Emnekart-metodikk svært generell enkle
    grunnkonsepter
  • Standardiserte former for utveksling
  • Generellgt mer kompleksitet (gir (for?) mange
    muligheter?)
  • Emnebasert navigasjon gt Enkelt å finne relevante
    ressurser
  • Kvalitet avhenger av korrekt klassifisering
  • Fortsatt behov for skreddersøm for ulike
    brukergrupper
  • Spesielt positiv for prosjekter der underliggende
    informasjonsstruktur har stor grad av
    assosiativitet
  • Bedriftsavhengige vurderinger
  • Kan få mulighet for rikere navigering, men mer
    komplekst system, inkl. også for mekanismer for
    rangering av søketreff
  • Har i dag operative løsninger, gir ca tilsvarende
    muligheter som TM
  • Emnekart kan brukes i tillegg til dagens løsning.
    Hvis kunden ønsker
  • Emnekart gir mulighet til eksport til tredjepart
    krever XTM utbredelse mye større enn i dag (XTM
    XML-basert syntaks for emnekart, beregnet for
    standardisert datautveksling)
  • Løsning basert på Emnekart anbefales ikke i
    dagens system

65
RDF kontra TopicMaps
  • Felles mål
  • beskrive informasjon
  • Lik metodologi
  • konseptuell modell og implementasjon vha. XML
  • Kan dekke mye av de samme behovene
  • Forskjellig perspektiv
  • metadata kontra emne

66
RDF kontra TopicMaps
  • Noen likheter
  • RDF resources lt-gt Topics
  • RDF resource types lt-gt Topic Types
  • Just as Resource Types are Resources, Topic Types
    are Topics
  • RDF Statements lt-gt Associations
  • RDF statement predicates lt-gt Association Types
  • Noen ulikheter
  • Resources refer to one particular object (through
    URIs), Topics have Occurences, which are deemed
    to be relevant to the Topic in some way.
    Occurences may be referenced e.g. by URIs.
  • The role of an Occurence is defined by an
    occurence type which is itself a topic

67
Norsk Stedsnavnsregister, Gazetteer
  • Mange norske samlinger er relatert til geografisk
    stedsnavn og steds-type
  • Norsk stedsnavnsregister
  • GalleriNor

68
Beskrivende data
  • Eier Norsk Folkemuseum Fotograf Lindahl,
    AxelDatering 1880 - 1890Tittel Søkeord
    bygd, landskap, kirkeUtfyllende opplysninger
    Prot Telemarken, Vinje Kirke og Præster, med
    BygdepartiNavnHansen, Knut Vigar - (41)Vinje
    kirke 1796 - (avbildet)Sted71 Vinje T 71 Vinje
    Samling Tilvekstnr NF.WL 00207 Internnr
    NBR931200255

69
(No Transcript)
70
(No Transcript)
71
Gazetteer
  • En liste over geografiske steder (stedsnavn,
    geografiske navn,
  • enkelte egenskaper)
  • Tre hoved-attributter til en innførsel i en
    gazetteer
  • Geografisk navn
  • Lengde- og bredde koordinater
  • Kategorier (fjell, fjord, våtmarksområde, by
    etc.)
  • Alexandria-prosjektet vil tilby tjenester som
  • Gi svar på hvor er
  • Gi svar på hva finnes der
  • Finn steder avhengig av type (fjord, ås, våtmark,
    by, militært område, , , )

72
ADL, Expressing location
  • by place names, e.g. San Francisco
  • by positional reference , e.g. near the Pacific
    Ocean
  • by footprint - latitude and longitude to site,
    geometry bounding or point
  • feature, e.g. populated places

73
Gazetteer, preferred terms
  • manmade features
  • . agricultural sites
  • . buildings
  • . . capitol buildings
  • . . commercial sites
  • . . . industrial sites
  • . . . . power generation sites
  • . . court houses
  • . . institutional sites
  • . . . correctional facilities
  • . . . educational facilities
  • . . . medical facilities
  • . . . religious facilities
  • . . library buildings
  • . . museum buildings
  • . . post office buildings
  • . . research facilities
  • . . . data collection facilities
  • . . residential sites
  • . . . housing areas
  • . . . mobile home parks
  • . cemeteries
  • . disposal sites
  • . fisheries
  • . fortifications
  • . historical sites
  • . . archaeological sites

74
Gazetteer , alphabetical listing
  • battlefields
  • USE historical sites
  • bayous
  • USE wetlands
  • bays
  • SN A water area that is an inlet of the
    sea/ocean.
  • USGS Circ 1048
  • UF bahias
  • coves
  • BT hydrographic features
  • NT fjords
  • RT basins
  • bights
  • channels
  • gulfs
  • wetlands
  • beach ridges
  • USE ridges
  • libraries
  • USE library buildings
  • library buildings
  • UF archive buildings
  • archives
  • libraries
  • BT buildings
  • RT educational facilities
  • light houses
  • USE reference locations
  • light stations
  • USE reference locations
  • lighthouses
  • USE reference locations

75
Referanse
  • Eksemplene for Thesaurus i denne presentasjonen
    er
  • hentet fra
  • http//www.alexandria.ucsb.edu
  • Her finnes også mer info om Gazetteer

76
COEUR Project, IDI
  • c

77
Semantic Interoperability
  • Mutual understanding between two actors must
    share both syntax and semantics of the
    interchanged data
  • Data semantics is the relationship between data
    and what the data stands for
  • The acors have to share a model of what the data
    are about
  • Semantic interoperability is about how to achieve
    such mutual understanding

78
Two main areas for research in order to improve
the quality of DLs
  • Improve interoperability between DLs, distributed
    collections and digital objects improve IR,
    document classification ease cooperation in
    teamsgt Semantics of data and information
  • Improve useability, reliability of DLsgt
    Conceptual Models for DLs, modeling (User)
    requirements
Write a Comment
User Comments (0)
About PowerShow.com