Les Mtadonnes - PowerPoint PPT Presentation

1 / 59
About This Presentation
Title:

Les Mtadonnes

Description:

Il est tr s difficile, voire m me impossible de trouver l'information pertinente, ... Contexte: recherche d'information par des utilisateurs, non par des machines ... – PowerPoint PPT presentation

Number of Views:32
Avg rating:3.0/5.0
Slides: 60
Provided by: GARL3
Category:

less

Transcript and Presenter's Notes

Title: Les Mtadonnes


1
Les Métadonnées
  • S. Garlatti

2
PLAN
  • Introduction
  • Méta-data before SW
  • Purpose of Metadata?
  • Why is metadata important?
  • Metadata Categories
  • Metadata Features
  • Examples of Metadata Schema
  • Enhancement of Metadata Approach

3
Problématique
  • Recherche dinformation sur Internet
  • Internet est une immense source dinformation en
    constante évolution. Il est très difficile, voire
    même impossible de trouver linformation
    pertinente, à laide des moteurs de recherche
    classique type Google.
  • Contexte recherche dinformation par des
    utilisateurs, non par des machines
  • Cest lutilisateur qui interprète les résultas
    et reconnaît les documents pertinents.
  • Cest lui qui leur associe un SENS !

4
Problématique
  • Mesures en recherche dinformation
  • Précision R ? P R
  • Rappel R ? P
    P
  • Documents retrouvés notés R
  • Documents pertinents notés P

5
Problématique
  • Si lon manque de nombreuses informations
    pertinentes, on obtient un rappel faible.
    Rappel R ? P
    P
  • Si lon est submergé par de très nombreuses
    information, on obtient une faible précision.
    Précision R ? P R

R
P
R
P
6
Problématique
  • Dans certains cas, il est nécessaire davoir un
    très bon critère de rappel recherche de brevets
    par exemple.
  • Dans dautres cas, lutilisateur désire obtenir
    un faible nombre de documents pertinents. Il est
    prêt à parcourir une douzaine de résultats pour
    les identifier.
  • Des facteurs de 10-20 pour le rappel et la
    précision sont acceptables dans de nombreux cas

7
Problématique
  • Moteur de recherche sur Internet
  • Le facteur précision est bien souvent inférieur à
    1
  • Moteur de recherche ANZWERS sur lacronyme "IETF"
    (Internet Engineering Task Force) retrouvait
    896,354 résultats au début Août 1997.
  • Toutes les pages qui contenaient  IETF  de
    manière accidentelle étaient inclues dans les
    résultats.
  • Moteur Google  Course   metadata 
    produits toutes les pages qui contiennent  of
    course  avec ou sans  metadata 
  • Aucun moyen de faire la différence entre les mots
    importants et les autres qui ne sont pas
    représentatif de la ressource pour lobjectif
    courant de lutilisateur.

8
Rôles des métadonnées
  • Recherche dinformation
  • Dans un contexte traditionnel ou sur Internet, un
    point clé des métadonnées est de faciliter et
    daméliorer la recherche dinformation.
  • Les métadonnées sont un moyen pour rendre la
    recherche dinformation plus efficace et plus
    ciblée.
  • Elles permettent un contrôle plus précis des
    outils de recherche dinformation.
  • Les métadonnées fournissent aux moteurs de
    recherche des informations spécialisées et
    structurées sur les sites.

9
Rôles des métadonnées
  • Réutilisation, partage et échange
  • Les métadonnées doivent fournir les informations
    nécessaires à la réutilisation des informations
  • Elles déterminent les conditions et les contextes
    pour cette réutilisation
  • Par des utilisateurs, cest eux qui assurent
    linterprétation de ces données
  • Par des machines, cest elles qui assurent
    linterprétation et qui automatisent
    partiellement ou totalement cette réutilisation
  • Par les deux, certains champs de méta données
    seront dédiés à lutilisateur ou à la machine.

10
Rôles des métadonnées
  • Faciliter la gestion et larchivage
  • Informer sur le cycle de vie des documents
  • Gérer des collections de ressources
  • Gérer des archivages électroniques
  • Gérer et protéger les droits
  • Les droits de propriété intellectuelle
  • Les droits daccès à des pages web (restriction
    de consultation)
  • Authentifier un document signature électronique

11
Rôles des métadonnées
  • En effet, c'est en 1841 que Sir Anthony Panizzi
    (Antonio pour ses intimes) publia ses fameuses 91
    règles pour les besoins du catalogue du British
    Museum. Cette publication marque l'acte de
    naissance du catalogage moderne.

12
Définition
  • Définition
  •  Données sur des Données 
  • Ambiguë compris de manière différente par
    différentes communautés qui conçoivent, créent,
    décrivent, préservent et utilisent des systèmes
    dinformation et des ressources
  • Jusquen 1995, métadonnées était un terme surtout
    utilisé par des communautés impliquées dans la
    gestion et linteropérabilité de données géo
    spatiales et dans la gestion de données et la
    conception et la maintenance de systèmes

13
Définition
  •  Tout ce qui peut être dit sur un objet
    dinformation quelque soit le niveau
    dagrégation. 
  • Un objet dinformation est toute entité qui peut
    être adressée et manipulée par un système ou une
    personne comme un objet discret.
  • Objet simple ou atomique ou un agrégat dentités
  •  Métadonnées  peut aussi être compris comme une
    extension des pratiques de catalogage
    bibliographique traditionnel.

14
Définition
  • Projet britannique DESIRE,
  •  Ce sont des données associées à des objets qui
    libèrent les usagers potentiels de la nécessité
    de connaître à l'avance leur existence et leurs
    caractéristiques 
  • En bref, les métadonnées sont des informations
    bibliographiques, des résumés, des termes
    d'indexation, des abstracts, des propriétés
    spécifiques, tout ce qui peut être un substitut
    au document original

15
(No Transcript)
16
(No Transcript)
17
(No Transcript)
18
(No Transcript)
19
Définition
  • Associer une information exploitable à une
    ressource signifie deux choses essentielles.
  • Information structurée utilisable et
    descriptive de la ressource, de son utilisation
    afin de faciliter et den améliorer laccès
  • La ressource existe et peut être exploitée sur le
    Web indépendamment des informations qui lui sont
    associées dans le cadre du Web sémantique 
    celles-ci sont utiles, mais non nécessaires pour
    accéder et utiliser la ressource, la page Web ou
    le service

20
Définition
  • Indexation métadonnées et annotations.
  • Une métadonnée est  une donnée sur une donnée .
    Cette définition est un peu vague voire même
    ambiguë, et elle est comprise de manière
    différente par différentes communautés qui
    conçoivent, créent, décrivent, préservent et
    utilisent des systèmes dinformation et des
    ressources.
  • Une annotation est à la base une note critique ou
    explicative accompagnant un texte, et par
    extension, une quelconque marque de lecture
    portée sur un document, que celui-ci soit textuel
    ou image.

21
Définition
  • Nous proposons ce distinguo 
  • Une métadonnée sera plutôt attachée à une
    ressource identifiée en tant que telle sur le web
    aura plutôt une pertinence a priori et sera
    plutôt saisie suivant un schéma. Par exemple, la
    description normalisée dun service web, lauteur
    dun document, qui permettront de mettre en place
    des inférences.
  • Une annotation sera plus située au sein de cette
    ressource et écrite au cours dun processus
    dannotation/lecture. Par exemple, un commentaire
    libre associé à un fragment dune page web
    quelques mots, un paragraphe déterminé au
    besoin.

22
Définition
  • Considérer les différents types de métadonnées
    (annotations) en fonction
  • Des types de ressources quelles concernent, plus
    ou moins fragmentées,
  • De la structuration plus ou moins forte de leur
     schéma ,
  • Des tâches quelles soutiennent (ou
    sous-tendent),
  • De lautomatisation plus ou moins marquée de leur
    mise en place,
  • De lutilisation qui en est faite par les agents
    logiciels, plus ou moins  intelligente  ou par
    des utilisateurs.

23
Définition
Ressources
Tâches utilisateurs
Métadonnées
24
Définition
  • Composition de résumés vidéo à la demande

Résumé vidéo de 20 mn
Films originaux
25
Définition
  • Principes fondamentaux
  • Contraintes utilisateur durée du résumé
  • Moteur de composition
  • Espace dinformation un seul évènement,
    plusieurs ,
  • Segmentation des films choix, taille, etc.
  • Indexation des fragments choix et rôle des
    indexes
  • Principes de sélection des fragments,
  • Principes dorganisation des fragments
  • Principes dassemblage des fragments
  • Comment maintenir la cohérence de lensemble
    produit ?

26
Définition
  • Principes fondamentaux
  • Espace dinformation un spectacle, fragments de
    taille fixes 2 mn.
  • Sélection les fragments les plus importants,
    critère qualitatif, un index  importance  muni
    de trois valeurs (faible, moyenne, forte)
  • Filtrage utilisation dun autre critère pour
    éliminer certains fragments afin de respecter la
    contrainte de temps
  • Organisation ordre chronologique des fragments
  • Règle dassemblage pour obtenir une vidéo fluide
    de tous les fragments

27
Définition
  • Choix des métadonnées ou annotations
  • Fonctionnalités et Objectifs utilisateur
  • Type des ressources
  • Remarquons que pour le Web sémantique, on parlera
    le plus souvent de
  • Métadonnées ou annotations sémantiques. Deux
    possibilités dinterprétation sont ici
    disponibles 
  •  sémantique  au sens de  sémantique
    formelle ,
  • et puis au sens plus vague de  faisant sens dans
    le cadre dune tâche pour un utilisateur .

28
Métadonnées et recherche dinformation
  • Amélioration de la qualité de la recherche
  • Une métadonnée contient un ensemble dindexes
    structurés
  • Un rôle et une fonction sont associés à chaque
    index
  • Elle ne permet donc que laccès aux critères
    importants pour la ou les tâches de
    lutilisateur (recherche, réutilisation,
    protection, etc.)
  • Auteur Jules Ferry, date 02/08/1880, format
    pdf, taille 1M0, sujet république, laïque,

29
Métadonnées et recherche dinformation
  • Amélioration de la qualité de la recherche
  • Les ressources hétérogènes peuvent être
    recherchées et traitées
  • Les ressources complexes peuvent aussi être
    recherchées et traitées, dès quon leur associe
    des métadonnées
  • Les ressources non  visibles  peuvent être
    accessibles dès que leurs métadonnées sont
    accessibles
  • Protégées par des mots de passe, contenu dans des
    ressources complexes, etc.

30
Quelques catégories de métadonnées
  • Donner des exemples
  • LOM
  • ICCARS

31
Quelques catégories de métadonnées
  • Trois vues principales pour tout objet (A.J.
    Gilliland)
  • Contenu lié à ce que lobjet contient,
    intrinsèque à lobjet
  • Contexte indique qui, quoi, pourquoi, où,
    comment aspects liés à la création de lobjet,
    extrinsèque à un objet
  • Structure liées aux associations à lintérieur
    où parmi les objets individuels, peut être
    intrinsèque ou extrinsèque à lobjet
  • Musés, librairie, etc. ont utilisés intensivement
    des métadonnées pour améliorer laccès aux
    informations
  • Musés beaucoup travaillés sur le contexte

32
Quelques catégories de métadonnées
  • Trois catégories fonctionnelles (Wendler 99)
  • Descriptive facilitant la découverte de
    ressources et lidentification
  • Administrative supportant la gestion de
    ressources dans une collection
  • Structurelle liant ensemble des composants
    complexes dobjets dinformation
  • Dautres catégorisations existent ou peuvent
    exister
  • Dublin Core Metadata descriptive

33
Quelques catégories de métadonnées
  • Administrative utilisées pour la gestion et
    ladministration des ressources
  • Acquisition de linformation
  • Droits et reproduction
  • Documentation des conditions daccès légaux
  • Localisation de linformation
  • Etc.

34
Quelques catégories de métadonnées
  • Descriptive utilisée pour décrire ou identifier
    les ressources dinformation
  • Enregistrement des entrées de  catalogage 
  • Aides à la recherche
  • Indexes spécialisés
  • Hyperliens et relations entre les ressources
  • Annotations (commentaires) par les utilisateurs
  • Etc.

35
Quelques catégories de métadonnées
  • Technique description du comportement du
    système et/ou des métadonnées
  • Documentation sur le matériel et le logiciel
  • Information de numérisation formats, taux de
    compression, etc.
  • Suivi des temps de réponse du système
  • Données dauthentification et de sécurité clés
    de cryptage, mots de passe.

36
Quelques propriétés des métadonnées
  • Les métadonnées peuvent être aussi des ressources
    dinformation.
  • Une métadonnées peut être à la fois une
    description et une donnée dépend de lusage qui
    en est fait
  • Une critique de film à un niveau, cest une
    métadonnée sur le film, elle se substitue à
    celui-ci à une autre niveau, cest une travail
    de littérature avec son auteur et ses propriétés
    intellectuelle.
  • Une métadonnée nest pas nécessairement numérique.

37
Quelques propriétés des métadonnées
  • Niveau de granularité
  • Métadonnée pour un objet atomique
  • Une image, un texte, une vidéo
  • Métadonnée pour un objet complexe
  • Un site web, un livre électronique
  • Métadonnée pour une partie dune ressource
  • Un hyperlien, un paragraphe, une expression, une
    partie dimage, etc.

38
Quelques propriétés des métadonnées
  • Structure
  • Standardisée
  • MARC
  • TEI et EAD
  • LOOM, ARIADNE, Dublin Core,
  • Local database formats
  • Non standardisée
  • Champs de textes libres

39
Quelques propriétés des métadonnées
  • Création
  • Un humain (a créateur, professionnel de
    linformation, un utilisateur, etc.), en général
    lauteur de la ressource
  • Un expert dun domaine ou un spécialiste de
    linformation, généralement pas le créateur de la
    ressource
  • Lordinateur, peut remplir automatiquement
    certaines métadonnées
  • Mots clés, version, date, droits, etc.
  • Ou les trois, ou encore deux dentre eux

40
Quelques propriétés des métadonnées
  • Cycle de vie des métadonnées
  • Elles continues à saccumuler tout au long de la
    vie dune ressource ou dun système.
  • Elles peuvent être crées, modifiées et même
    détruites pendant le vie dune ressource.
  • Certaines ne changent jamais pendant toute la vie
    de la ressource
  • Titre, provenance, date de création,
  • Métadonnées dynamiques qui changent avec lusage
    ou la manipulation de la ressource
  • Log de transaction des utilisateurs résolution
    des images

41
Quelques propriétés des métadonnées
  • Cycle de vie des métadonnées
  • Métadonnées à long terme, nécessaires assurer et
    guarantir laccès à la ressource
  • Format technique et de traitement des
    informations,
  • Droites daccès
  • Métadonnées à cours termes, principalement de
    nature transactionnelle

42
Quelques propriétés des métadonnées
  • Sémantique
  • Métadonnées conformes à un vocabulaire
    standardisé ou une autorité de contrôle
  • AAT ULAN AACR2
  • Classifications
  • Ontologies
  • Métadonnées libres
  • Notes de texte libre
  • Balise  méta  dHTML

43
Quelques propriétés des métadonnées
  • Stockage
  • Lassociation entre des métadonnées et la
    ressource quelles décrivent est inhérent au
    concept de métadonnées.
  • Dans la ressource
  • A lextérieur de la ressource
  • Les deux

44
Quelques propriétés des métadonnées
  • Les Normes
  • Définition officielle ISO "Document établi par
    un consensus et approuvé par un organisme
    reconnu, qui fournit, pour des usages communs et
    repérés, des règles, des lignes directrices ou
    des caractéristiques, pour des activités ou leurs
    résultats, garantissant un niveau d'ordre optimal
    dans un contexte donné."
  • Les Standards
  • Ensemble de recommandations développées et
    préconisées par un groupe représentatif
    dutilisateurs.

45
Quelques propriétés des métadonnées
  • Les normes et standards enjeux
  • Accessibilité  permettre la recherche,
    l'identification, l'accès et la livraison de
    ressources (contenus et composantes) en ligne de
    façon distribuée.
  • Interopérabilité permettre l'utilisation de
    contenus et composantes développés par une
    organisation sur une plate-forme donnée par
    d'autres organisations sur d'autres plateformes.
  • Réutilisabilité permettre aux contenus et
    composantes à différentes fins, dans différents
    produits, dans différents contextes et par
    différents modes d'accès.

46
Quelques propriétés des métadonnées
  • Les normes et standards enjeux
  • Durabilité permettre aux contenus et
    composantes d'affronter les changements
    technologiques sans la nécessité d'une
    réingénierie ou d'un redéveloppement.
  • Adaptabilité permettre la modulation sur mesure
    des contenus et des composantes.

47
Quelques propriétés des métadonnées
  • La qualité des métadonnées
  • Définition officielle "L'ensemble des
    caractéristiques d'une entité qui lui confèrent
    l'aptitude à satisfaire des besoins explicites et
    implicites"
  • Nécessite de mettre en place des procédures de
    validation des métadonnées saisies
  • Nécessite de mettre en place des procédures de
    validation des modifications des schéma de
    métadonnées, donc de lévolution des métadonnées
  • Dossier métadonnées, normes et standards
  • http//www.educnet.education.fr/dossier/metadata/d
    efault.htm

48
Les métadonnées
  • http//www.w3.org/Metadata/
  • http//metadata.net/
  • http//www.ifla.org/II/metadata.htm
  • http//www.ukoln.ac.uk/metadata/
  • http//www.rcip.gc.ca/Francais/Normes/metadonnees_
    multimedia.html
  • http//www.xmlnews.org/

49
Exemples de métadonnées
  • Dublin Core
  • http//dublincore.org/index.shtml
  • LOM in Education
  • IMS Project http//www.imsglobal.org/
  • Version 1.2.1 final specification
  • IMS Learning resource Meta-data XML Binding
  • IMS Learning resource Meta-data Information Model
  • IMS Learning resource Meta-data Best practice and
    Implementation guide
  • Etc.

50
Learning Object Model, IMS Project
  • Elements
  • ltgeneralgt
  • ltlifecyclegt
  • ltmetametadatagt
  • lttechnicalgt
  • lteducationalgt
  • ltrightsgt
  • ltrelationgt
  • ltannotationgt
  • ltclassificationgt

51
(No Transcript)
52
(No Transcript)
53
(No Transcript)
54
(No Transcript)
55
(No Transcript)
56
(No Transcript)
57
(No Transcript)
58
(No Transcript)
59
Problèmes non traités
  • Il ny a bien souvent pas de sémantique formelle
    associée aux métadonnées, donc pas
    dinterprétation possible par les machines
  • Aller plus loin Le  Semantic Web 
  • Ontologies mécanismes dinférence
  • XML RDF RDFS
  • Etc.
Write a Comment
User Comments (0)
About PowerShow.com