IT-Zertifikat der Phil.Fak - PowerPoint PPT Presentation

1 / 45
About This Presentation
Title:

IT-Zertifikat der Phil.Fak

Description:

IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle Daten- und Metadaten SS 09 – PowerPoint PPT presentation

Number of Views:88
Avg rating:3.0/5.0
Slides: 46
Provided by: Patrick560
Category:
Tags: der | fak | getty | museum | phil | zertifikat

less

Transcript and Presenter's Notes

Title: IT-Zertifikat der Phil.Fak


1
IT-Zertifikat der Phil.Fak
  • Kurs 4 Daten- und Metadatenstandards

Patrick Sahle Daten- und Metadaten SS 09
2
  • TEI (Text Encoding Initiative)
  • Einstieg
  • http//www.youtube.com/watch?v4sHYDfITjHY
  • http//www.bobdylan.com//songs/subterranean-home
    sick-blues
  • http//etcl.uvic.ca/wp-content/uploads/tei/Encode
    d_Dylan_Lyrics.xml

3
  • TEI (Text Encoding Initiative)
  • Basics Wikipedia
  • Grundansatz (Auszeichnung als Abstraktion)
  • Schieflagen? Anwendungsbereich?

4
  • TEI (Text Encoding Initiative)
  • Ein Beispiel
  • site http//graves.uvic.ca/
  • file http//graves.uvic.ca/get_markup.xq?identr
    ies1935-02
  • TEI verstehen und benutzen
  • Einstieg http//www.tei-c.org/index.xml
  • Elemente http//www.tei-c.org/release/doc/tei-p5
    -doc/en/html/REF-ELEMENTS.html

5
  • TEI (Text Encoding Initiative)
  • TEI Strukturen
  • P5 http//www.tei-c.org/release/doc/tei-p5-doc/e
    n/html/index.html
  • ongoing activities http//www.tei-c.org/Activiti
    es/index.xml

6
  • TEI (Text Encoding Initiative)
  • TEI anwenden
  • Das Roma-Tool http//www.tei-c.org/Roma/

7
  • Dublin Core (DC)
  • Einstieg
  • http//de.wikipedia.org/wiki/Dublin_Core
  • http//en.wikipedia.org/wiki/Dublin_Core
    (besser!)
  • http//dublincore.org/
  • Organisatorischer, historischer und
    konzeptioneller Hintergrund

8
  • Dublin Core
  • einfacher Satz an Elementen/Begriffen zur
    Beschreibung von Objekten auf der
    Metadatenebene
  • core elements, version 1.1, ISO 15836 (2003)
  • http//dublincore.org/documents/dces/
  • identifier
  • format, type, language
  • title, subject, coverage, description
  • creator, publisher, contributor, rights,
    provenance
  • relation, source
  • date

9
  • Dublin Core
  • "Dublin Core Simple" (15 Elemente) vs.
  • "Dublin Core Qualified" (element refinements)
  • "Begriffe im Namensraum DCTerms" (55 Elemente)
    http//dublincore.org/documents/dcmi-terms/

10
  • Dublin Core
  • definiert Begriffe / Konzepte, keine Syntax
  • kann ausgedrückt werden z.B. mittels HTML oder
    XML

ltheadgt ltmeta name"DC.title" content"DC
Einführung"/gt ltmeta name"DC.creator"
content"Patrick Sahle"/gt ltmeta
name"DCTERMS,created" content"2009-01-20"
/gt ltmetadata xmlnsdc"http//purl.org/dc/element
s/1.1/" xmlnsdcterms"http//p
url.org/dc/terms/" /gt ltdctitlegtDC
Einführunglt/dctitlegt ltdccreatorgtPatrick
Sahlelt/dccreatorgt ltdctermscreatedgt2009-01-20lt
/dctermscreatedgt
11
  • Dublin Core
  • Anwendungsbeispiel BSB-Digitalisate an der
    OAI-Schnittstelle
  • ltmetadatagt ltdctitlegtReichstagshandbuch.
    lt/dctitlegt ltdcpublishergtReichsdr.lt/dcpubli
    shergt ltdcdategt1924lt/dcdategt
    ltdcformatgttext/xmllt/dcformatgt
    ltdc_identifiergthttp//nbn-resolving.de/urnnbnde
    bvb12-bsb00000002-6lt/dc_identifiergtlt/metadatagt
  • ltmetadatagt ltdctitlegtReichstagshandbuch.
    lt/dctitlegt ltdcpublishergtReichsdr.lt/dcpubli
    shergt ltdcdategt1924lt/dcdategt
    ltdcformatgttext/xmllt/dcformatgt
    ltdc_identifiergthttp//nbn-resolving.de/urnnbnde
    bvb12-bsb00000003-1lt/dc_identifiergtlt/metadatagt

12
  • DC revisited
  • Vor und Nachteile?
  • Lob der Einfachheit!
  • Informationsreduktion? (Strategien)
  • Gebunden an Perspektiven und Wissensbereiche
  • Was ist das Objekt?
  • Granularität, Seitenbezug
  • Typ, Ontologischer Status

13
  • Rekapitulation Dublin Core (DC)
  • "Scope"
  • Ansatz
  • Datenstandard, kein Datenformat
  • Syntax? HTML und XML.
  • Dublin Core Simple / Dublin Core Qualified
  • Vor- und Nachteile? Problematisierung?

14
  • Dublin Core
  • Anwendungsbeispiel OPAL
  • http//www.opal-niedersachsen.de/

15
  • Dublin Core
  • Anwendungsbeispiel OPAL
  • ? myOpal ? xmlDownload ? ein Beispiel aussuchen
  • Was ist hier los? Ist das noch Dublin Core?
  • Lokale Anwendung! Dokumentation "Application
    Profile"
  • Leicht übersetzbar auf Standard-"Dublin Core"

16
  • DC revisited
  • Vor und Nachteile?
  • Lob der Einfachheit!
  • Informationsreduktion? (Strategien)
  • Gebunden an Perspektiven und Wissensbereiche
  • Was ist das Objekt?
  • Granularität, Seitenbezug
  • Typ, Ontologischer Status

17
OAI Open Archives Initiative (eigentlich
OAI-PMH Protocol for Metadata Harvesting)
18
  • OAI
  • Einstieg
  • http//de.wikipedia.org/wiki/Open_Archives_Initia
    tive
  • http//en.wikipedia.org/wiki/Open_Archives_Initia
    tive
  • http//www.openarchives.org/
  • http//www.openarchives.org/OAI/openarchivesproto
    col.html
  • Beispiel für eine Schnittstelle zur
    Kommunikation von (Meta-)Daten über das
    Internet
  • Wichtige Begriffe Data-Provider,
    Service-Provider

19
  • OAI
  • Datenkommunikation über http-Request
  • Basisadresse Script ( Verb ( Argument)?)
  • Sechs "Verben" zur Kommunikation
  • Identify wer bist du?
  • ListMetadataFormats was sprichst du?
  • ListSets was hast du für Sammlungen?
  • ListIdentifiers gib mir deine Identifier
  • ListRecords gib mir Datensätze
  • GetRecords gib mir Datensätze
  • Sechs "Argumente" metadataPrefix,
    identifier, from, until, set, resumptionToken

20
  • OAI
  • Beispielanwendungen
  • OAISTER (Service Provider) http//www.oaister.or
    g/
  • ZVDD (Data Provider) http//www.digitalisiertedr
    ucke.de/
  • http//www.digitalisiertedrucke.de/oai2d.py?verb
    ListSets
  • BSB (Data Provider) http//www.bsb-muenchen.de/
  • http//mdz1.bib-bvb.de/db/OAI/oai2.php?verbIden
    tify
  • CEEC (Data Provider) http//www.ceec.uni-koeln.d
    e/
  • http//www.ceec.uni-koeln.de/ceec-oai/kleioc?verb
    Identify

21
  • OAI
  • Beispielanwendung CEEC
  • Handschrift Dom 213
  • Bild http//www.ceec.uni-koeln.de/ceec-cgi/kleio
    c/0010/exec/pagesma/22kn28-0213_001.jpg22/segmen
    t/22body22
  • Beschreibung http//www.ceec.uni-koeln.de/ceec-c
    gi/kleioc/0010/exec/katl/22kn28-021322
  • XML (TEI-like) http//www.ceec.uni-koeln.de/pro
    jekte/CEEC/database/descriptions/kn28-0213.xml
  • OAI (oai_dc) http//www.ceec.uni-koeln.de/ceec-o
    ai/kleioc?verbGetRecordmetadataPrefixoai_dcide
    ntifierkn28-0213

22
  • Rekapitulation OAI (PMH)
  • "Scope"
  • http-Requests
  • "Schnittstelle" Data-Provider, Service-Provider
  • Sechs "Verben" (Identify, ListMetadataFormats,
    ListSets, ListIdentifiers, ListRecords,
    GetRecords), mehrere "Argumente"
  • oai_dc plus weitere Metadatenformate

23
  • Metadaten im BAM-Sektor
  • (Bibliotheken / Archive / Museen a.k.a Cultural
    Heritage)
  • Bibliotheken METS
  • Archive EAD
  • Museen museumdat

24
  • Metadaten in Bibliotheken
  • Bibliographische Daten
  • MAB2
  • MARC (? RDA)
  • MODS
  • DC
  • Komplexe digitale Objekte
  • METS / MODS

25
  • METS / MODS (Zusammenfassung)
  • "Scope"
  • Problemlage
  • verschiedene Sichten auf ein Objekt
  • Grundprinzip
  • Verbindung verschiedener Arten von Metadaten
    (METS-header, descriptive metadata,
    administrative metadata, files, structural
    map, links)
  • Nochmals ein Beispiel? (Ponickau)

26
7 Abschnitte eines METS-Dokuments
  • ltmetsgt
  • ltmetsHdr/gt - Der Kopfteil - METS Header
  • ltdmdSec/gt - Erschließungsangaben - Descriptive
    Metadata
  • ltamdSec/gt -Verwaltungsangaben - Administrative
    Metadata
  • ltfileSec/gt - Dateiabschnitt - File Section
  • ltstructMap/gt - Strukturbeschreibung
    Structural Map
  • ltstructLink/gt - Strukturverknüpfungen
    Structural Links
  • ltbehaviorSec/gt - Verhalten Behavior
  • lt/metsgt

27
METS als Containerformat
  • ltmetsgt
  • ltdmdSecgt
  • ltmdWrapgt
  • ltxmlDatagt
  • lt! Metadaten aus anderem namespace--gt
  • lt/xmlDatagt
  • lt/mdWrapgt
  • lt/dmdSecgt
  • lt/metsgt

28
Konkurrierende Hierarchien?
29
  • Rekapitulation Metadaten in Bibliotheken
  • Traditionell Bibliographische Daten
  • Ausweitung Komplexe digitale Objekte
  • Standard METS / MODS
  • "Scope"
  • Problemlage
  • verschiedene Sichten auf ein Objekt
  • Grundprinzipien
  • Verbindung unterschiedlicher Metadaten
    (METS-header, descriptive metadata,
    administrative metadata, files, structural map,
    links)
  • "Containerformat"

30
  • Metadaten im Archiv EAD
  • Die Heimat von EAD http//www.loc.gov/ead/
  • wikipedia http//de.wikipedia.org/wiki/Encoded_A
    rchival_Description ,
    http//en.wikipedia.org/wiki/Encoded_Archival_Desc
    ription
  • Scope
  • Bestandteile
  • 146 Elemente zur Beschreibung von Findmitteln
    und Archivalien
  • eadHeader (über die EAD-Datei)
  • archDesc
  • did (Zum Gesamtbestand)
  • dsc / c (Beschreibung über geschachtelte
    Container)
  • Beispiel http//www.bundesarchiv.de/,
    http//www.bundesarchiv.de/findbuecher/sapmo/Zdaof
    indxml/EAD-Dateien/Lehmann

31
  • Rekapitulation Metadaten in Archiven EAD
  • Scope
  • Findmittel, nicht Archivalien
  • Bestandteile
  • eadHeader (über die EAD-Datei)
  • archDesc
  • did (Zum Gesamtbestand)
  • dsc / c (Beschreibung über geschachtelte
    Container)
  • Übung Vergleichen Sie EAD mit TEI und METS

32
  • Metadaten in Museen
  • HIDA-MIDAS (Marburger Informations-,
    Dokumentations- und Administrations-System)
  • VRA Core 4.0 (http//www.vraweb.org/projects/vrac
    ore4/index.html)
  • CDWA (http//www.getty.edu/research/conducting_re
    search/standards/cdwa/)
  • museumdat (http//museum.zib.de/museumdat/ ,
    http//www.museumdat.org/ , http//de.wikipedia.or
    g/wiki/Museumdat )

33
  • Rekapitulation Metadaten im Museum
    Beispiel Museumdat
  • Scope
  • Zielstellung
  • Harvesting, Datenaustausch
  • Bezug zu anderen Standards
  • CDWA Lite, CIDOC CRM
  • Beschreibungsbereiche Objektklassifikation,
    Identi- fikation, Beschreibung, Ereignisse,
    Beziehungen, Administration

34
  • Semantic Web Zusammenfassung
  • Problem Wie kann die "Bedeutung" von Daten für
    den Computer verwertbar gemacht werden?
  • Lösung Explikation, Annotation, Metadaten,
    Taxonomien, Authority Files (Normdaten),
    eindeutige Identifikatoren (z.B. auch URIs),
    Ontologien, standardisierte Ausdrucksformen

35
  • RDF Zusammenfassung
  • (Fallback http//de.wikipedia.org/wiki/Resource_D
    escription_Framework)
  • RDF Resource Description Framework
  • Formale Beschreibung von Informationen
    ("Resourcen")
  • Aussagen werden als Tripel modelliert
  • Subjekt Prädikat Objekt
  • sind selbst wieder als URI identifiziert (oder
    auch nur Strings)
  • RDF als Datenmodell und als Syntax (XML, N3)
  • Frage Verhältnis von RDF und DC?
  • RDFS als Schema für die formale Beschreibung
    ein- facher Ontologien (Konstrukte Klassen und
    Eigenschaften)

36
  • OWL Zusammenfassung
  • (Fallback http//de.wikipedia.org/wiki/Web_Ontolo
    gy_Language)
  • Web Ontology Language
  • Sprache zur formalen Beschreibung von Ontologien
  • Baut auf RDF auf und geht über RDFS hinaus
  • Konstrukte Klassen, Eigenschaften, Instanzen

37
Noch Zeit? Übung Wir semantisieren Regest
9 (nur konzeptionell natürlich)
38
  • CDWA / CDWA Lite
  • Die Heimat von CDWA http//www.getty.edu/researc
    h/conducting_research/standards/cdwa/,
    http//www.getty.edu/research/conducting_research
    /standards/cdwa/cdwalite.html
  • wikipedia http//en.wikipedia.org/wiki/CDWA
  • Scope
  • CDWA vs. CDWA Lite
  • Charakteristika

39
CDWA-Lite
Beispiel http//www.getty.edu/research/conducting
_research/standards/cdwa/cdwalite/oai1_painting_gm
_816.cdwalite
40
  • Museumdat
  • Die Heimat von Museumdat http//www.museumdat.or
    g/
  • Scope
  • Zielstellung
  • Harvesting, Datenaustausch
  • Bezug zu anderen Standards
  • CDWA Lite, CIDOC CRM
  • Beschreibungsbereiche Objektklassifikation,
    Identi- fikation, Beschreibung, Ereignisse,
    Beziehungen, Administration

41
  • CIDOC-CRM
  • Ausgangspunkte
  • http//de.wikipedia.org/wiki/CIDOC_Conceptual_Ref
    erence_Model
  • http//en.wikipedia.org/wiki/CIDOC_Conceptual_Ref
    erence_Model
  • Die Heimat von CIDOC-CRM http//cidoc.ics.forth.
    gr/

42
  • Semantic Web Zusammenfassung
  • Problem Wie kann die "Bedeutung" von Daten für
    den Computer verwertbar gemacht werden?
  • Lösung Explikation, Annotation, Metadaten,
    Taxonomien, Authority Files (Normdaten),
    eindeutige Identifikatoren (z.B. auch URIs),
    Ontologien, standardisierte Ausdrucksformen

43
  • RDF Zusammenfassung
  • (Fallback http//de.wikipedia.org/wiki/Resource_D
    escription_Framework)
  • RDF Resource Description Framework
  • Formale Beschreibung von Informationen
    ("Resourcen")
  • Aussagen werden als Tripel modelliert
  • Subjekt Prädikat Objekt
  • sind selbst wieder als URI identifiziert (oder
    auch nur Strings)
  • RDF als Datenmodell und als Syntax (XML, N3)
  • Frage Verhältnis von RDF und DC?
  • RDFS als Schema für die formale Beschreibung
    ein- facher Ontologien (Konstrukte Klassen und
    Eigenschaften)

44
RDF Beispiel ltrdfRDF xmlnsrdf"http//www.w
3.org/1999/02/22-rdf-syntax-ns"
xmlnsdc"http//purl.org/dc/elements/1.1/"gt ltrdf
Description rdfabout"http//en.wikipedia.org/wi
ki/Tony_Benn"gt ltdctitlegtTony
Bennlt/dctitlegt ltdcpublishergtWikipedialt/dcpubl
ishergt lt/rdfDescriptiongt lt/rdfRDFgt
45
  • OWL Zusammenfassung
  • (Fallback http//de.wikipedia.org/wiki/Web_Ontolo
    gy_Language)
  • Web Ontology Language
  • Sprache zur formalen Beschreibung von Ontologien
  • Baut auf RDF auf und geht über RDFS hinaus
  • Konstrukte Klassen, Eigenschaften, Instanzen
Write a Comment
User Comments (0)
About PowerShow.com