Title: Les Mtadonnes
1Les Métadonnées
2PLAN
- Introduction
- Méta-data before SW
- Purpose of Metadata?
- Why is metadata important?
- Metadata Categories
- Metadata Features
- Examples of Metadata Schema
- Enhancement of Metadata Approach
3Problématique
- Recherche dinformation sur Internet
- Internet est une immense source dinformation en
constante évolution. Il est très difficile, voire
même impossible de trouver linformation
pertinente, à laide des moteurs de recherche
classique type Google. - Contexte recherche dinformation par des
utilisateurs, non par des machines - Cest lutilisateur qui interprète les résultas
et reconnaît les documents pertinents. - Cest lui qui leur associe un SENS !
4Problématique
- Mesures en recherche dinformation
- Précision R ? P R
- Rappel R ? P
P - Documents retrouvés notés R
- Documents pertinents notés P
5Problématique
- Si lon manque de nombreuses informations
pertinentes, on obtient un rappel faible.
Rappel R ? P
P - Si lon est submergé par de très nombreuses
information, on obtient une faible précision.
Précision R ? P R
R
P
R
P
6Problématique
- Dans certains cas, il est nécessaire davoir un
très bon critère de rappel recherche de brevets
par exemple. - Dans dautres cas, lutilisateur désire obtenir
un faible nombre de documents pertinents. Il est
prêt à parcourir une douzaine de résultats pour
les identifier. - Des facteurs de 10-20 pour le rappel et la
précision sont acceptables dans de nombreux cas
7Problématique
- Moteur de recherche sur Internet
- Le facteur précision est bien souvent inférieur à
1 - Moteur de recherche ANZWERS sur lacronyme "IETF"
(Internet Engineering Task Force) retrouvait
896,354 résultats au début Août 1997. - Toutes les pages qui contenaient IETF de
manière accidentelle étaient inclues dans les
résultats. - Moteur Google Course metadata
produits toutes les pages qui contiennent of
course avec ou sans metadata - Aucun moyen de faire la différence entre les mots
importants et les autres qui ne sont pas
représentatif de la ressource pour lobjectif
courant de lutilisateur.
8Rôles des métadonnées
- Recherche dinformation
- Dans un contexte traditionnel ou sur Internet, un
point clé des métadonnées est de faciliter et
daméliorer la recherche dinformation. - Les métadonnées sont un moyen pour rendre la
recherche dinformation plus efficace et plus
ciblée. - Elles permettent un contrôle plus précis des
outils de recherche dinformation. - Les métadonnées fournissent aux moteurs de
recherche des informations spécialisées et
structurées sur les sites.
9Rôles des métadonnées
- Réutilisation, partage et échange
- Les métadonnées doivent fournir les informations
nécessaires à la réutilisation des informations - Elles déterminent les conditions et les contextes
pour cette réutilisation - Par des utilisateurs, cest eux qui assurent
linterprétation de ces données - Par des machines, cest elles qui assurent
linterprétation et qui automatisent
partiellement ou totalement cette réutilisation - Par les deux, certains champs de méta données
seront dédiés à lutilisateur ou à la machine.
10Rôles des métadonnées
- Faciliter la gestion et larchivage
- Informer sur le cycle de vie des documents
- Gérer des collections de ressources
- Gérer des archivages électroniques
- Gérer et protéger les droits
- Les droits de propriété intellectuelle
- Les droits daccès à des pages web (restriction
de consultation) - Authentifier un document signature électronique
11Rôles des métadonnées
- En effet, c'est en 1841 que Sir Anthony Panizzi
(Antonio pour ses intimes) publia ses fameuses 91
règles pour les besoins du catalogue du British
Museum. Cette publication marque l'acte de
naissance du catalogage moderne.
12Définition
- Définition
- Données sur des Données
- Ambiguë compris de manière différente par
différentes communautés qui conçoivent, créent,
décrivent, préservent et utilisent des systèmes
dinformation et des ressources - Jusquen 1995, métadonnées était un terme surtout
utilisé par des communautés impliquées dans la
gestion et linteropérabilité de données géo
spatiales et dans la gestion de données et la
conception et la maintenance de systèmes
13Définition
- Tout ce qui peut être dit sur un objet
dinformation quelque soit le niveau
dagrégation. - Un objet dinformation est toute entité qui peut
être adressée et manipulée par un système ou une
personne comme un objet discret. - Objet simple ou atomique ou un agrégat dentités
- Métadonnées peut aussi être compris comme une
extension des pratiques de catalogage
bibliographique traditionnel.
14Définition
- Projet britannique DESIRE,
- Ce sont des données associées à des objets qui
libèrent les usagers potentiels de la nécessité
de connaître à l'avance leur existence et leurs
caractéristiques - En bref, les métadonnées sont des informations
bibliographiques, des résumés, des termes
d'indexation, des abstracts, des propriétés
spécifiques, tout ce qui peut être un substitut
au document original
15(No Transcript)
16(No Transcript)
17(No Transcript)
18(No Transcript)
19Définition
- Associer une information exploitable à une
ressource signifie deux choses essentielles. - Information structurée utilisable et
descriptive de la ressource, de son utilisation
afin de faciliter et den améliorer laccès - La ressource existe et peut être exploitée sur le
Web indépendamment des informations qui lui sont
associées dans le cadre du Web sémantique
celles-ci sont utiles, mais non nécessaires pour
accéder et utiliser la ressource, la page Web ou
le service
20Définition
- Indexation métadonnées et annotations.
- Une métadonnée est une donnée sur une donnée .
Cette définition est un peu vague voire même
ambiguë, et elle est comprise de manière
différente par différentes communautés qui
conçoivent, créent, décrivent, préservent et
utilisent des systèmes dinformation et des
ressources. - Une annotation est à la base une note critique ou
explicative accompagnant un texte, et par
extension, une quelconque marque de lecture
portée sur un document, que celui-ci soit textuel
ou image.
21Définition
- Nous proposons ce distinguo
- Une métadonnée sera plutôt attachée à une
ressource identifiée en tant que telle sur le web
aura plutôt une pertinence a priori et sera
plutôt saisie suivant un schéma. Par exemple, la
description normalisée dun service web, lauteur
dun document, qui permettront de mettre en place
des inférences. - Une annotation sera plus située au sein de cette
ressource et écrite au cours dun processus
dannotation/lecture. Par exemple, un commentaire
libre associé à un fragment dune page web
quelques mots, un paragraphe déterminé au
besoin.
22Définition
- Considérer les différents types de métadonnées
(annotations) en fonction - Des types de ressources quelles concernent, plus
ou moins fragmentées, - De la structuration plus ou moins forte de leur
schéma , - Des tâches quelles soutiennent (ou
sous-tendent), - De lautomatisation plus ou moins marquée de leur
mise en place, - De lutilisation qui en est faite par les agents
logiciels, plus ou moins intelligente ou par
des utilisateurs.
23Définition
Ressources
Tâches utilisateurs
Métadonnées
24Définition
- Composition de résumés vidéo à la demande
Résumé vidéo de 20 mn
Films originaux
25Définition
- Principes fondamentaux
- Contraintes utilisateur durée du résumé
- Moteur de composition
- Espace dinformation un seul évènement,
plusieurs , - Segmentation des films choix, taille, etc.
- Indexation des fragments choix et rôle des
indexes - Principes de sélection des fragments,
- Principes dorganisation des fragments
- Principes dassemblage des fragments
- Comment maintenir la cohérence de lensemble
produit ?
26Définition
- Principes fondamentaux
- Espace dinformation un spectacle, fragments de
taille fixes 2 mn. - Sélection les fragments les plus importants,
critère qualitatif, un index importance muni
de trois valeurs (faible, moyenne, forte) - Filtrage utilisation dun autre critère pour
éliminer certains fragments afin de respecter la
contrainte de temps - Organisation ordre chronologique des fragments
- Règle dassemblage pour obtenir une vidéo fluide
de tous les fragments
27Définition
- Choix des métadonnées ou annotations
- Fonctionnalités et Objectifs utilisateur
- Type des ressources
- Remarquons que pour le Web sémantique, on parlera
le plus souvent de - Métadonnées ou annotations sémantiques. Deux
possibilités dinterprétation sont ici
disponibles - sémantique au sens de sémantique
formelle , - et puis au sens plus vague de faisant sens dans
le cadre dune tâche pour un utilisateur .
28Métadonnées et recherche dinformation
- Amélioration de la qualité de la recherche
- Une métadonnée contient un ensemble dindexes
structurés - Un rôle et une fonction sont associés à chaque
index - Elle ne permet donc que laccès aux critères
importants pour la ou les tâches de
lutilisateur (recherche, réutilisation,
protection, etc.) - Auteur Jules Ferry, date 02/08/1880, format
pdf, taille 1M0, sujet république, laïque,
29Métadonnées et recherche dinformation
- Amélioration de la qualité de la recherche
- Les ressources hétérogènes peuvent être
recherchées et traitées - Les ressources complexes peuvent aussi être
recherchées et traitées, dès quon leur associe
des métadonnées - Les ressources non visibles peuvent être
accessibles dès que leurs métadonnées sont
accessibles - Protégées par des mots de passe, contenu dans des
ressources complexes, etc.
30Quelques catégories de métadonnées
- Donner des exemples
- LOM
- ICCARS
31Quelques catégories de métadonnées
- Trois vues principales pour tout objet (A.J.
Gilliland) - Contenu lié à ce que lobjet contient,
intrinsèque à lobjet - Contexte indique qui, quoi, pourquoi, où,
comment aspects liés à la création de lobjet,
extrinsèque à un objet - Structure liées aux associations à lintérieur
où parmi les objets individuels, peut être
intrinsèque ou extrinsèque à lobjet - Musés, librairie, etc. ont utilisés intensivement
des métadonnées pour améliorer laccès aux
informations - Musés beaucoup travaillés sur le contexte
32Quelques catégories de métadonnées
- Trois catégories fonctionnelles (Wendler 99)
- Descriptive facilitant la découverte de
ressources et lidentification - Administrative supportant la gestion de
ressources dans une collection - Structurelle liant ensemble des composants
complexes dobjets dinformation - Dautres catégorisations existent ou peuvent
exister - Dublin Core Metadata descriptive
33Quelques catégories de métadonnées
- Administrative utilisées pour la gestion et
ladministration des ressources - Acquisition de linformation
- Droits et reproduction
- Documentation des conditions daccès légaux
- Localisation de linformation
- Etc.
34Quelques catégories de métadonnées
- Descriptive utilisée pour décrire ou identifier
les ressources dinformation - Enregistrement des entrées de catalogage
- Aides à la recherche
- Indexes spécialisés
- Hyperliens et relations entre les ressources
- Annotations (commentaires) par les utilisateurs
- Etc.
35Quelques catégories de métadonnées
- Technique description du comportement du
système et/ou des métadonnées - Documentation sur le matériel et le logiciel
- Information de numérisation formats, taux de
compression, etc. - Suivi des temps de réponse du système
- Données dauthentification et de sécurité clés
de cryptage, mots de passe.
36Quelques propriétés des métadonnées
- Les métadonnées peuvent être aussi des ressources
dinformation. - Une métadonnées peut être à la fois une
description et une donnée dépend de lusage qui
en est fait - Une critique de film à un niveau, cest une
métadonnée sur le film, elle se substitue à
celui-ci à une autre niveau, cest une travail
de littérature avec son auteur et ses propriétés
intellectuelle. - Une métadonnée nest pas nécessairement numérique.
37Quelques propriétés des métadonnées
- Niveau de granularité
- Métadonnée pour un objet atomique
- Une image, un texte, une vidéo
- Métadonnée pour un objet complexe
- Un site web, un livre électronique
- Métadonnée pour une partie dune ressource
- Un hyperlien, un paragraphe, une expression, une
partie dimage, etc.
38Quelques propriétés des métadonnées
- Structure
- Standardisée
- MARC
- TEI et EAD
- LOOM, ARIADNE, Dublin Core,
- Local database formats
- Non standardisée
- Champs de textes libres
39Quelques propriétés des métadonnées
- Création
- Un humain (a créateur, professionnel de
linformation, un utilisateur, etc.), en général
lauteur de la ressource - Un expert dun domaine ou un spécialiste de
linformation, généralement pas le créateur de la
ressource - Lordinateur, peut remplir automatiquement
certaines métadonnées - Mots clés, version, date, droits, etc.
- Ou les trois, ou encore deux dentre eux
40Quelques propriétés des métadonnées
- Cycle de vie des métadonnées
- Elles continues à saccumuler tout au long de la
vie dune ressource ou dun système. - Elles peuvent être crées, modifiées et même
détruites pendant le vie dune ressource. - Certaines ne changent jamais pendant toute la vie
de la ressource - Titre, provenance, date de création,
- Métadonnées dynamiques qui changent avec lusage
ou la manipulation de la ressource - Log de transaction des utilisateurs résolution
des images
41Quelques propriétés des métadonnées
- Cycle de vie des métadonnées
- Métadonnées à long terme, nécessaires assurer et
guarantir laccès à la ressource - Format technique et de traitement des
informations, - Droites daccès
- Métadonnées à cours termes, principalement de
nature transactionnelle
42Quelques propriétés des métadonnées
- Sémantique
- Métadonnées conformes à un vocabulaire
standardisé ou une autorité de contrôle - AAT ULAN AACR2
- Classifications
- Ontologies
- Métadonnées libres
- Notes de texte libre
- Balise méta dHTML
43Quelques propriétés des métadonnées
- Stockage
- Lassociation entre des métadonnées et la
ressource quelles décrivent est inhérent au
concept de métadonnées. - Dans la ressource
- A lextérieur de la ressource
- Les deux
44Quelques propriétés des métadonnées
- Les Normes
- Définition officielle ISO "Document établi par
un consensus et approuvé par un organisme
reconnu, qui fournit, pour des usages communs et
repérés, des règles, des lignes directrices ou
des caractéristiques, pour des activités ou leurs
résultats, garantissant un niveau d'ordre optimal
dans un contexte donné." - Les Standards
- Ensemble de recommandations développées et
préconisées par un groupe représentatif
dutilisateurs.
45Quelques propriétés des métadonnées
- Les normes et standards enjeux
- Accessibilité permettre la recherche,
l'identification, l'accès et la livraison de
ressources (contenus et composantes) en ligne de
façon distribuée. - Interopérabilité permettre l'utilisation de
contenus et composantes développés par une
organisation sur une plate-forme donnée par
d'autres organisations sur d'autres plateformes. - Réutilisabilité permettre aux contenus et
composantes à différentes fins, dans différents
produits, dans différents contextes et par
différents modes d'accès.
46Quelques propriétés des métadonnées
- Les normes et standards enjeux
- Durabilité permettre aux contenus et
composantes d'affronter les changements
technologiques sans la nécessité d'une
réingénierie ou d'un redéveloppement. - Adaptabilité permettre la modulation sur mesure
des contenus et des composantes.
47Quelques propriétés des métadonnées
- La qualité des métadonnées
- Définition officielle "L'ensemble des
caractéristiques d'une entité qui lui confèrent
l'aptitude à satisfaire des besoins explicites et
implicites" - Nécessite de mettre en place des procédures de
validation des métadonnées saisies - Nécessite de mettre en place des procédures de
validation des modifications des schéma de
métadonnées, donc de lévolution des métadonnées - Dossier métadonnées, normes et standards
- http//www.educnet.education.fr/dossier/metadata/d
efault.htm
48Les métadonnées
- http//www.w3.org/Metadata/
- http//metadata.net/
- http//www.ifla.org/II/metadata.htm
- http//www.ukoln.ac.uk/metadata/
- http//www.rcip.gc.ca/Francais/Normes/metadonnees_
multimedia.html - http//www.xmlnews.org/
49Exemples de métadonnées
- Dublin Core
- http//dublincore.org/index.shtml
- LOM in Education
- IMS Project http//www.imsglobal.org/
- Version 1.2.1 final specification
- IMS Learning resource Meta-data XML Binding
- IMS Learning resource Meta-data Information Model
- IMS Learning resource Meta-data Best practice and
Implementation guide - Etc.
50Learning Object Model, IMS Project
- Elements
- ltgeneralgt
- ltlifecyclegt
- ltmetametadatagt
- lttechnicalgt
- lteducationalgt
- ltrightsgt
- ltrelationgt
- ltannotationgt
- ltclassificationgt
51(No Transcript)
52(No Transcript)
53(No Transcript)
54(No Transcript)
55(No Transcript)
56(No Transcript)
57(No Transcript)
58(No Transcript)
59Problèmes non traités
- Il ny a bien souvent pas de sémantique formelle
associée aux métadonnées, donc pas
dinterprétation possible par les machines - Aller plus loin Le Semantic Web
- Ontologies mécanismes dinférence
- XML RDF RDFS
- Etc.