Ontologies pour l - PowerPoint PPT Presentation

About This Presentation
Title:

Ontologies pour l

Description:

Repr sentation des informations via des ontologies (indexation) ... ACTES DE. CONFERENCE. LITTERATURE DU DOMAINE. Est un. Est un. Est un. CHERCHEUR. nom. pr nom ... – PowerPoint PPT presentation

Number of Views:32
Avg rating:3.0/5.0
Slides: 35
Provided by: Nath231
Category:
Tags: actes | ontologies | pour

less

Transcript and Presenter's Notes

Title: Ontologies pour l


1
Ontologies pour lastronomie
  • Nathalie Hernandez
  • Josiane Mothe
  • Laurent Cardonner

2
Objectifs
  • Représentation des informations via des
    ontologies (indexation)
  • Etude des thesaurus existants
  • Adéquation aux collections
  • Mise à jour de la connaissance du domaine
  • Découverte de connaissances
  • Ontologie du domaine de la tâche / du contenu

3
Plan
  • Résultats des analyses via Syntex
  • Définition de mesures dadéquation dune
    ontologie par rapport à un corpus
  • Techniques de mise à jour
  • Définition de différents types dontologies
    adaptés à lusage des données
  • Exemple de lexploration des publications

4
Analyses
Techniques de mise à jour
Exemple
Ontologies spécifiques à une tache
Mesures dadéquation
  • A notre disposition
  • thesaurus de lastronomie IAU
  • résumés darticles publiés dans les revues AA et
    APJ sur plusieurs années.

5
Syntex analyseur syntaxique de corpus
Analyses
Techniques de mise à jour
Exemple
Ontologies spécifiques à une tache
Mesures dadéquation
  • Intérêt extraire syntaxiquement les expressions
    dune collection documentaire Bourigault
    Fabre, 2000
  • Deux phases
  • Pré-traitement par un étiqueteur
  • Analyse syntaxique
  • Originalité apprentissage endogène Bourigault
    Lame, 2002

6
Résultats
Analyses
Techniques de mise à jour
Exemple
Ontologies spécifiques à une tache
Mesures dadéquation
  • APJ
  • AA

7
IAU
Analyses
Techniques de mise à jour
Exemple
Ontologies spécifiques à une tache
Mesures dadéquation
  • Thesaurus (représentation terminologique du
    domaine de lastronomie) crée en 1995
  • 2863 termes dont 2222 expressions (magnetic
    field, X ray,)
  • 5000 relations entre termes de plusieurs natures
  • t1 BT t2 terme t2 plus spécifique t1
  • t1 NT t2 terme t2 plus générique t1
  • t1 U t2 utiliser le terme t1 plutôt le terme t2
  • t1 UF t2 utiliser le terme t2 à la place de t1
  • t1 RT t2 t1 et t2 sont liés

8
Recherche termes IAU / CORPUS
Analyses
Techniques de mise à jour
Exemple
Ontologies spécifiques à une tache
Mesures dadéquation
  • APJ
  • 1999 865 termes retrouvés
  • 2002 877 termes retrouvés
  • AA
  • 1995 832 termes retrouvés
  • 2002 884 termes retrouvés
  • 588 termes communs aux 4 corpus
  • ? IAU adapté à lindexation de nos corpus?
  • ? Mesures génériques (ontologie/thesaurus)

9
IAU en OWL
Mesures dadéquation
Techniques de mise à jour
Exemple
Ontologies spécifiques à une tache
Analyses
  • Ontology Web Language http//www.w3.org/TR/owl-fe
    atures/
  • recommandation du W3C
  • Transformation
  • Définition de concepts (différents labels)X Ray
    UF X-RayX Ray UF X-Ray radiation X Ray
    X-Ray, X-Ray radiation
  • Définition de relations (généricité/specificité,
    est lié à)

10
Analyse lexicale
  • Couverture ontologie / corpus
  • Pourcentage de termes de lontologie présents
    dans le corpus
  • ?Choix ou non de lontologie comme point de
    départ
  • Couverture corpus / ontologie
  • Détection des concepts représentatifs des
    documents (tf.idf Salton 71)
  • ?Proposition de nouveaux termes à ajouter

11
Analyse conceptuelle
  • Principe  un concept est représentatif dun
    domaine si il est en relation avec dautres
    concepts du domaine 
  • Définition dune mesure du pouvoir représentatif
    dun concept
  • Définition dune mesure du pouvoir représentatif
    dune ontologie à partir de la mesure des
    concepts retrouvés dans les documents
  • ? Validation du choix de lorganisation des
    concepts dans lontologie

12
Mise à jour des concepts
Techniques de mise à jour
Exemple
Ontologies spécifiques à une tache
Analyses
Mesures dadéquation
  • Ajout des termes représentatifs des documents
    dans lontologie
  • Nouveau label pour un concept
  • Nouveau concept
  • ?utilisation des mesures de proximité sémantique
    de Syntex

13
Mise à jour des relations
Techniques de mise à jour
Exemple
Ontologies spécifiques à une tache
Analyses
Mesures dadéquation
  • Spécification sémantique de la relation  est lié
    a  ( événement lié à ,  objet lié a )
  • Détection de nouvelles relations entre concepts
  • ? utilisation des mesures de proximité sémantique
    de Syntex

14
  • Nécessité de deux types ontologies
  • Ontologie du domaine de la tâche organisation
    des méta-données ou rôles des connaissances dans
    la réalisation dune tâche
  • Ontologie du domaine abordé dans le corpus
    représentation de la connaissance liée au domaine
    traité dans le contenu des documents
  • ? optimiser les tâches

15
Architecture
16
Cadre applicatif
  • Tâche Exploration des publications dans les
    revues AA et APJ
  • Collection à notre disposition
  • Expérience à partir de Tétralogie

17
Ontologie du domaine de la tache dexploration
  • ? Construction semi-automatique

18
Ontologie du domaine abordé dans le corpus
  • Échantillon construit à partir de IAU et Factguru

19
Liens entre les deux ontologies
20
Prototype interface de visualisation
Exemple
Analyses
Mesures dadéquation
Techniques de mise à jour
Ontologies spécifiques à une tache
  • Plusieurs niveaux de navigation
  • Niveau conceptuel vue générale sur le corpus
  • Niveau instance détails sur le corpus
  • Deux accès à la collection
  • À travers lontologie du domaine de la tâche
  • A travers lontologie du domaine abordé dans la
    collection

21
Aperçu de linterface
Exemple
Analyses
Mesures dadéquation
Techniques de mise à jour
Ontologies spécifiques à une tache
22
Exploration via ontologie domaine tache
Exemple
Analyses
Mesures dadéquation
Techniques de mise à jour
Ontologies spécifiques à une tache
23
Connaissance établie pour instance Chercheur
Exemple
Analyses
Mesures dadéquation
Techniques de mise à jour
Ontologies spécifiques à une tache
24
Connaissance établie pour instance Article
Exemple
Analyses
Mesures dadéquation
Techniques de mise à jour
Ontologies spécifiques à une tache
25
Exploration via ontologie domaine abordé dans
corpus
Exemple
Analyses
Mesures dadéquation
Techniques de mise à jour
Ontologies spécifiques à une tache
26
Conclusion
  • IAU
  • Intégration d autres éléments instances des
    concepts ?
  • Instruments,
  • objets - Exemple objets Lien avec Simbad
  • FACTGURU ?? http//www.site.uottawa.ca4321/astr
    onomy/index.html

27
Travaux à faire
  • Évaluation
  • Cadre
  • Réalisable
  • Définition de tâches
  • Mise à jour - Mots clés (oui avec niveau souhaité
    - Ontologie - Web sémantique)
  • Lien avec UCD

28
(No Transcript)
29
Evaluation
  • Comparer ladéquation déchantillons de deux
    ontologies sur un même corpus, puis sur des
    différents (évolution du domaine)
  • ? Proposer les corpus et les deux ontologies

30
Evaluation
31
Ontologie
  • Ontologie  spécification explicite et formelle
    dune conceptualisation partagée Studer 1998
  • Deux niveaux sémiotiques
  • Lexical (termes)
  • Conceptuel (concepts et relations entre concepts)
  • ? base pour la communication entre les machines,
    entre humains et machines

32
Recherche dinformation et ontologie
  • Intégration des ontologies dans un processus de
    recherche
  • Réduction du silence extension des requêtes à
    partir des termes et concepts de lontologie
  • Réduction du bruit désambiguïsation des termes
    contenus dans la requête

33
Recherche d information et Ontologie
  • Indexation des documents à partir des concepts de
    lontologie
  • Descripteurs choisis dans lontologie
  • Indexation à partir de concepts et non plus à
    partir de mots souvent ambigus
  • ? Choix dune ontologie reflétant le ou les
    domaines de connaissance relatifs aux corpus

34
Exploration de collections documentaires à partir
dontologies
  • Objectifs
  • Aide à lindexation des documents par un procédé
    de catégorisation automatique des documents au
    niveau des concepts dontologies
Write a Comment
User Comments (0)
About PowerShow.com