Parcours FRBR 3 : format RDF et FRBRisation - PowerPoint PPT Presentation

About This Presentation
Title:

Parcours FRBR 3 : format RDF et FRBRisation

Description:

Parcours FRBR 3 : format RDF et FRBRisation Le J.e-cours va bient t commencer, merci de votre patience Merci de d sactiver votre micro : – PowerPoint PPT presentation

Number of Views:205
Avg rating:3.0/5.0
Slides: 38
Provided by: fle120
Category:

less

Transcript and Presenter's Notes

Title: Parcours FRBR 3 : format RDF et FRBRisation


1
Parcours FRBR3 format RDF et FRBRisation
  • Le  J.e-cours  va bientôt commencer, merci de
    votre patience
  • Merci de désactiver votre micro
  • Repérer votre nom dans la liste ( moi )
  • Cliquer sur licône  Silence 

2
Parcours FRBR
  • Partie 1. LES PRINCIPES GÉNÉRAUX
    (10/10/2013)
  • Partie 2. DES CATALOGUES FRBRisés
    (07/11/2013)
  • Partie 3. FORMAT RDF et FRBRisation
    (19/12/2013)
  • Vos formateurs
  • Philippe Le Pape
  • Olivier Rousseaux
  • Michaël Jeulin
  • Laurent Piquemal

3
Partie 3. FORMAT RDF et FRBRisation
Support élaboré à partir des travaux du groupe
national de formateurs RDA
4
plan
  • Le rapport entre format RDF et FRBRisation
  • Le format RDF
  • Les données du Sudoc en RDF

5
LE RAPPORT ENTRE FORMAT RDF et FRBRisation
6
Rappel les enjeux de la FRBRisation
  • Mieux représenter les résultats de recherche de
    nos catalogues, y compris sur le web
  • Modifier la granularité de la description
    bibliographique la donnée, plutôt que la notice
  • Pour que cela soit possible il faut libérer la
    donnée du carcan de la notice

7
Enjeu 1 mieux présenter les résultats
  • Une notice bibliographique est structurée par
  • un format spécifique (MARC)
  • 200 1aL_at_origine des espèces par le moyen de
    la sélection naturelle
  • bTexte impriméfCharles Darwin
  • 700 1aDarwinbCharlesf1809-18824070
  • Structure dune base de données classique
  • Champ valeur du champ
  • 200 a pour titre ltvaleurgt
  • 700 a pour auteur ltvaleurgt

8
Enjeu 1 mieux présenter les résultats
  • Tout logiciel bibliographique programmé pour ça
    saura reconnaître et identifier cette structure.

9
Enjeu 1 mieux présenter les résultats
  • Mais un moteur de recherche NE SAIT PAS
  • interpréter cette structure MARC

La notice reste indéchiffrable
10
Enjeu 1 mieux présenter les résultats
  • Pour que la structure de nos données soit
  • comprise par les moteurs de recherche, il faut la
  • TRADUIRE dans la structure des données sur le
  • web.

11
Enjeu 2 changer la granularité
  • Volonté doffrir aux usagers du web une
  • description à la granularité plus fine.
  • Permet de choisir le niveau dinformation
    pertinent
  • - infos sur lœuvre, pour une recherche
  • - infos sur litem, pour un emprunt

12
Enjeu 2 changer la granularité
NOTICE
TITRE
EDITEUR
COTE
NOTICE
TITRE
EDITEUR
COTE
TITRE
NOTICE
EDITEUR
COTE
13
Enjeu 2 changer la granularité
  • Requêtes spécifiques résultats spécifiques

COTE
TITRE
TITRE
EDITEUR
EDITEUR
EDITEUR
COTE
TITRE
COTE
Œuvres de Darwin ?
Versions originales?
Disponibilité ?
TITRE
TITRE
TITRE
EDITEUR
TITRE
COTE
EDITEUR
COTE
14
RDF convient à la FRBIsation
ENJEU FRBR 1 données visibles sur le web
ENJEU FRBR 2 donnée comme granularité de la
description
BESOIN format de données interprétables par
des machines
BESOIN nouvelle structuration des données qui
conserve les liens
  • Convient, car
  • Basé sur un langage XML interprétable par des
    machines
  • Structuré pour rendre compte de liens  typés 

15
LE FORMAT RDF
16
Du Web de documents au web de données
  • Le Web dans les années 90 des urls et des liens
    hypertextes (http) pour  naviguer  entre des
    pages et des fichiers un web de documents
  • Les moteurs de recherche indexent les pages, mais
    mal leur contenu.
  • En particulier les bases de données, parmi
    lesquelles les catalogues.
  • Emergence du web de données à partir des années
    2000
  • Il sagit de sappuyer sur la technologie du web
    traditionnel pour représenter les données
    elles-mêmes

17
RDF (Resource Description Framework)
  • Proposé en 1999 par le W3C
  • RDF est un modèle conceptuel qui sappuie sur
    larchitecture du web
  • Il permet dencoder des données pour quune
    machine puisse les traiter et les analyser
  • Un langage logique qui décrit, représente et
    relie des données à échanger sur le Web.

18
Un langage pour les machines
Une grammaire RDF HTTP URIs
Des vocabulaires RDFS / OWL ontologies
Des règles décriture RDF/XML, N3, Turtle, RDFa
Des moyens de communication SPARQL protocoles
19
Principe de base du RDF
  • Toute chose ou ressource peut être décrite avec
    des phrases minimales composées
  • dun verbe
  • dun sujet
  • et dun complément
  • Les URI servent à identifier ces ressources
  • gt c.à.d. en pratique, une URL

20
Exemple
  • Darwin a écrit  Lorigine des espèces 
  • Sujet Charles Darwin
    Sujet
  • Verbe a écrit
    Prédicat
  • Complément  Lorigine des espèces 
    Objet

Les 3 éléments sujet prédicat
objet constituent un TRIPLET
21
RDF une syntaxe
Le SUJET est toujours une URI. Toute  chose 
sur laquelle on veut faire des assertions
(SUJET) doit avoir une URI. Les  choses  ont
toujours un type une CLASSE.
Le PRÉDICAT est toujours une URI. Il permet
dexprimer les PROPRIÉTÉS des  choses , ou
les RELATIONS des  choses  entre elles.
LOBJET peut êtreun texte (LITTÉRAL)ou une URI.
Les CLASSES et les PROPRIÉTÉS sont déclarées
dans des VOCABULAIRES (ou  ONTOLOGIES ) pour
être réutilisées.
22
Traduction en RDF
Pour un humain
Sujet  Lorigine des espèces  Sujet Verbe
a pour auteur
Prédicat Complément Charles Darwin Objet
Pour un logiciel de bibliothèque
  • Sujet PPN 021050384 (par ex.) Sujet
  • (titre contenu dans le 200a)
  • Verbe 700 1?3026812304?4070 Prédicat
  • Complément 3026812304 Objet
  • (PPN 026812304 autorité de Charles Darwin)

Pour nimporte quelle machine
  • Sujet http//www.sudoc.fr/021050384/id Sujet
  • Verbe http//id.loc.gov/vocabulary/relators/aut
    Prédicat
  • (ou marcrelaut)
  • Complément http//www.idref.fr/026812304/id Obje
    t
  • (et pour le titre dctitle  Lorigine )

23
La notion de graphe
  • Chaque ressource représentée par une URI peut
    faire lobjet de nouvelles assertions
  • devenir le sujet de nouveaux triplets
  • Lensemble des triplets, reliés les uns aux
    autres par les URI quils ont en commun,
    constitue un graphe

24
Exemple de graphe
estcontemporain de
est une
a créé
est né en
est né en
est conservée à
1840
représente
est né à
est mort en
est né à
1850
est mort à
est un
est situé à
25
LES DONNÉES DU SUDOC EN RDF
26
La première brique identifier
  • Des URL pérennes pour les ressources
  • Sudoc http//www.sudoc.fr/053911512
  • Construite sur le PPN de la notice
  • Idref http//idref.fr/026927608
  • Construite sur le PPN de la notice
  • Des sitemaps pour parcourir les notices
  • Permet aux moteurs de recherche didentifier des
    ressources

27
Lexposition du Sudoc
  • Exposition des données depuis juillet 2011
  • Deux sorties
  • Du Schéma.org en html
  • Données minimales promues par les principaux
    moteurs concession aux moteurs de recherche
  • Page en RDF/XML
  • Générée  à la volée  pas (encore) de base de
    données en RDF
  • Conversion encore partielle

28
Exemple
29
En RDF/XML, ça donne quoi ?
  • Données relatives à la notice
  • Données relatives
  • au document (Book)
  • Auteurs (liens IdRef)
  • Accès
  • http//www.sudoc.fr/127064583.rdf

30
Ce quon pourrait voir en plus dans un Sudoc
FRBRisé
http//www.sudoc.fr/ URI Oeuvre
rdafrbr1workManifested (œuvre manifestée
raccourci RDA)
Autre expression de la même oeuvre
frbrerP2001 is realized through ou (RDA)
rdabrbr1expressionOfWork
http//www.sudoc.fr/ URI Expression
Autre manifestation de la même expression
frbrerP1023 is embodied in ou (RDA)
rdabrbr1expressionManifested
http//www.sudoc.fr/021050384/id ( Manifestation)
frbrerP2005 is exemplified by ou
(RDA) rdafrbr1manifestationExemplified
URI Item
URI Item
31
Un début de FRBRisation exemple dune thèse
NNT
32
Un essai de moissonnage du Sudoc Sindice
  • Agrégateur de contenu RDF
  • Au départ projet universitaire National
    University of Ireland (Galway), DERI (Digital
    Enterprise Research Institute, Irlande),
    Fondazione Bruno Kessler (Italie) et Openlink
    Software (USA).
  • Moissonne les notices du Sudoc depuis 2011
  • Depuis novembre 2012 récupère les  dumps 
  • La totalité du Sudoc est interrogeable en SPARQL
  • Interface de recherche par formulaire
  • Sparql endpoint (Virtuoso) http//sparql.sindice
    .com/
  • permet dinterroger les données en RDF et de les
    exporter

33
Sindice
Exemple de requête SPARQL récupérer des ppn à
partir dun titre
Résultat
34
DU RDF partout à lAbes
  • Dans Theses.fr
  • Dans Calames
  • Moissonnés par le portail Isidore
  • Le hub de métadonnées
  • RDF comme pivot pour stocker tous les formats
  • Le projet de recherche Qualinca (en cours)
  • Travail sur la qualité des liens entre notices
    bibliographiques et dautorités
  • Algorithmes basés sur une modélisation en RDF
    (ontologie FRBRoo)

35
EN RÉSUMÉ
  • Lexposition des données est un enjeu de la
    FRBRisation
  • Le RDF est pour cela privilégié car
  • Cest un standard officiel et libre du web
  • Il est souple et ouvert
  • Aujourdhui
  • Les modèles sont encore balbutiants
  • la FRBRisation de lexistant reste problématique,
    En RDF comme en Marc
  • Demain
  • Vers des modèles de données plus riches et mieux
    structurés
  • Du FRBR, enrichi FRBRoo ?
  • Un jour, du RDF en production ?

36
Se former à FRBR
  • Demandez à votre CFCB ou établissement
    lorganisation dune
  • formation  labelisée   Groupe RDA en France .
  • Coordonnées des formateurs sur la page  Se
    former 

37
(No Transcript)
Write a Comment
User Comments (0)
About PowerShow.com