Title: Ontologies pour l
1Ontologies pour lastronomie
- Nathalie Hernandez
- Josiane Mothe
- Laurent Cardonner
2Objectifs
- Représentation des informations via des
ontologies (indexation) - Etude des thesaurus existants
- Adéquation aux collections
- Mise à jour de la connaissance du domaine
- Découverte de connaissances
- Ontologie du domaine de la tâche / du contenu
3Plan
- Résultats des analyses via Syntex
- Définition de mesures dadéquation dune
ontologie par rapport à un corpus - Techniques de mise à jour
- Définition de différents types dontologies
adaptés à lusage des données - Exemple de lexploration des publications
4Analyses
Techniques de mise à jour
Exemple
Ontologies spécifiques à une tache
Mesures dadéquation
- A notre disposition
- thesaurus de lastronomie IAU
- résumés darticles publiés dans les revues AA et
APJ sur plusieurs années.
5Syntex analyseur syntaxique de corpus
Analyses
Techniques de mise à jour
Exemple
Ontologies spécifiques à une tache
Mesures dadéquation
- Intérêt extraire syntaxiquement les expressions
dune collection documentaire Bourigault
Fabre, 2000 - Deux phases
- Pré-traitement par un étiqueteur
- Analyse syntaxique
- Originalité apprentissage endogène Bourigault
Lame, 2002
6Résultats
Analyses
Techniques de mise à jour
Exemple
Ontologies spécifiques à une tache
Mesures dadéquation
7IAU
Analyses
Techniques de mise à jour
Exemple
Ontologies spécifiques à une tache
Mesures dadéquation
- Thesaurus (représentation terminologique du
domaine de lastronomie) crée en 1995 - 2863 termes dont 2222 expressions (magnetic
field, X ray,) - 5000 relations entre termes de plusieurs natures
- t1 BT t2 terme t2 plus spécifique t1
- t1 NT t2 terme t2 plus générique t1
- t1 U t2 utiliser le terme t1 plutôt le terme t2
- t1 UF t2 utiliser le terme t2 Ã la place de t1
- t1 RT t2 t1 et t2 sont liés
8Recherche termes IAU / CORPUS
Analyses
Techniques de mise à jour
Exemple
Ontologies spécifiques à une tache
Mesures dadéquation
- APJ
- 1999 865 termes retrouvés
- 2002 877 termes retrouvés
- AA
- 1995 832 termes retrouvés
- 2002 884 termes retrouvés
- 588 termes communs aux 4 corpus
- ? IAU adapté à lindexation de nos corpus?
- ? Mesures génériques (ontologie/thesaurus)
9IAU en OWL
Mesures dadéquation
Techniques de mise à jour
Exemple
Ontologies spécifiques à une tache
Analyses
- Ontology Web Language http//www.w3.org/TR/owl-fe
atures/ - recommandation du W3C
- Transformation
- Définition de concepts (différents labels)X Ray
UF X-RayX Ray UF X-Ray radiation X Ray
X-Ray, X-Ray radiation - Définition de relations (généricité/specificité,
est lié à )
10Analyse lexicale
- Couverture ontologie / corpus
- Pourcentage de termes de lontologie présents
dans le corpus - ?Choix ou non de lontologie comme point de
départ - Couverture corpus / ontologie
- Détection des concepts représentatifs des
documents (tf.idf Salton 71) - ?Proposition de nouveaux termes à ajouter
11Analyse conceptuelle
- Principe  un concept est représentatif dun
domaine si il est en relation avec dautres
concepts du domaine - Définition dune mesure du pouvoir représentatif
dun concept - Définition dune mesure du pouvoir représentatif
dune ontologie à partir de la mesure des
concepts retrouvés dans les documents - ? Validation du choix de lorganisation des
concepts dans lontologie
12Mise à jour des concepts
Techniques de mise à jour
Exemple
Ontologies spécifiques à une tache
Analyses
Mesures dadéquation
- Ajout des termes représentatifs des documents
dans lontologie - Nouveau label pour un concept
- Nouveau concept
- ?utilisation des mesures de proximité sémantique
de Syntex
13Mise à jour des relations
Techniques de mise à jour
Exemple
Ontologies spécifiques à une tache
Analyses
Mesures dadéquation
- Spécification sémantique de la relation  est lié
a ( événement lié à  ,  objet lié a ) - Détection de nouvelles relations entre concepts
- ? utilisation des mesures de proximité sémantique
de Syntex
14- Nécessité de deux types ontologies
- Ontologie du domaine de la tâche organisation
des méta-données ou rôles des connaissances dans
la réalisation dune tâche - Ontologie du domaine abordé dans le corpus
représentation de la connaissance liée au domaine
traité dans le contenu des documents - ? optimiser les tâches
15Architecture
16Cadre applicatif
- Tâche Exploration des publications dans les
revues AA et APJ - Collection à notre disposition
- Expérience à partir de Tétralogie
17Ontologie du domaine de la tache dexploration
- ? Construction semi-automatique
18Ontologie du domaine abordé dans le corpus
- Échantillon construit à partir de IAU et Factguru
19Liens entre les deux ontologies
20Prototype interface de visualisation
Exemple
Analyses
Mesures dadéquation
Techniques de mise à jour
Ontologies spécifiques à une tache
- Plusieurs niveaux de navigation
- Niveau conceptuel vue générale sur le corpus
- Niveau instance détails sur le corpus
- Deux accès à la collection
- À travers lontologie du domaine de la tâche
- A travers lontologie du domaine abordé dans la
collection
21Aperçu de linterface
Exemple
Analyses
Mesures dadéquation
Techniques de mise à jour
Ontologies spécifiques à une tache
22Exploration via ontologie domaine tache
Exemple
Analyses
Mesures dadéquation
Techniques de mise à jour
Ontologies spécifiques à une tache
23Connaissance établie pour instance Chercheur
Exemple
Analyses
Mesures dadéquation
Techniques de mise à jour
Ontologies spécifiques à une tache
24Connaissance établie pour instance Article
Exemple
Analyses
Mesures dadéquation
Techniques de mise à jour
Ontologies spécifiques à une tache
25Exploration via ontologie domaine abordé dans
corpus
Exemple
Analyses
Mesures dadéquation
Techniques de mise à jour
Ontologies spécifiques à une tache
26Conclusion
- IAU
- Intégration d autres éléments instances des
concepts ? - Instruments,
- objets - Exemple objets Lien avec Simbad
- FACTGURU ?? http//www.site.uottawa.ca4321/astr
onomy/index.html
27Travaux à faire
- Évaluation
- Cadre
- Réalisable
- Définition de tâches
- Mise à jour - Mots clés (oui avec niveau souhaité
- Ontologie - Web sémantique) - Lien avec UCD
28(No Transcript)
29Evaluation
- Comparer ladéquation déchantillons de deux
ontologies sur un même corpus, puis sur des
différents (évolution du domaine) - ? Proposer les corpus et les deux ontologies
30Evaluation
31Ontologie
- Ontologie  spécification explicite et formelle
dune conceptualisation partagée Studer 1998 - Deux niveaux sémiotiques
- Lexical (termes)
- Conceptuel (concepts et relations entre concepts)
- ? base pour la communication entre les machines,
entre humains et machines
32Recherche dinformation et ontologie
- Intégration des ontologies dans un processus de
recherche - Réduction du silence extension des requêtes Ã
partir des termes et concepts de lontologie - Réduction du bruit désambiguïsation des termes
contenus dans la requête
33Recherche d information et Ontologie
- Indexation des documents à partir des concepts de
lontologie - Descripteurs choisis dans lontologie
- Indexation à partir de concepts et non plus Ã
partir de mots souvent ambigus - ? Choix dune ontologie reflétant le ou les
domaines de connaissance relatifs aux corpus
34Exploration de collections documentaires à partir
dontologies
- Objectifs
- Aide à lindexation des documents par un procédé
de catégorisation automatique des documents au
niveau des concepts dontologies