Title: Aucun titre de diapositive
1Catalogue de métadonnées Utilisation dXML pour
la création de métadonnées et de requêtes
thématiques Anne-Sophie Archambeau, Cathy
Boonne, Vanessa Maigné Institut Pierre Simon
Laplace, Paris e_mail Anne-Sophie.Archambeau_at_i
psl.jussieu.fr Cathy.Boonne_at_ipsl.jussieu.fr Vaness
a.Maigne_at_ipsl.jussieu.fr
2Plan
- Présentation des activités de lIPSL
- Présentation des activités de-XMLMedia
- Projet du métacatalogue de lIPSL
- Objectifs
- - Pourquoi XML ?
- - Moyens utilisés
- Utilisation dXML dans linterface
- Fonctionnement général
- Présentation du langage XMLQuery
- Edition de requête
- Traitement des résultats
- Conclusion et perspectives
3Présentation des activités de lIPSL
- IPSL (Institut Pierre Simon Laplace)
- fédération de six laboratoires de recherche
situés à Paris - - Directeur J. Jouzel
- - 650 membres
- (scientifiques, doctorants, ingénieurs et
techniciens) -
- Activités de recherche
- Etudes des sciences de la Terre
- (océan atmosphère biosphère cryosphère
surface continentale) - à différentes échelles locale, régionale,
et globale
4Présentation des activités de-XMLMedia
- e-XMLMedia
- Start up de 18 membres fondée par G.Gardarin,
expert en base de données, Paris. - - Partenaire Teamlog (900 membres)
- - Filiale aux Etats-Unis à San Matéo,
Californie - (Professeurs Tomasic et Garcia Molina)
-
- Principales activités de-XMLMedia
- - Développement et distribution de modules basés
sur - le langage XML pour gérer la
distribution dinformations - - Consulting
- - Formation
- - Support technique pré-requis,
maintenance
5Le projet du métacatalogue
- Objectifs
- - automatiser la génération du métacatalogue
et créer dynamiquement des fichiers - de métadonnées
- optimiser les métadonnées et laccès aux données
- préserver linformation sur la production des
données - promouvoir et valoriser les données au sein et Ã
lextérieur de lIPSL - - réaliser un traitement automatisé des requêtes
6Le projet du métacatalogue
- Pourquoi XML?
- - Définir son schéma spécifique pour décrire
ses propres informations - (création de balises extensibles)
- - Modéliser la structure DTD, Schéma
- - Réaliser des sélections sur les éléments
balisés - - Renforcer les tests derreur et la
validation - - Etendre les possibilités de SGML ou HTML
- - Livrer les données avec les métadonnées
- - Utiliser des feuilles de styles pour la
présentation et la transformation en HTML - (Saxon)
- - Développer les systèmes dinterrogations
multi-bases, véritables moteurs de - recherche du Web
7Le projet du métacatalogue
- Une interface utilisateur pour les producteurs de
données et métadonnées et pour - les utilisateurs scientifiques consultation,
création de fichiers de métadonnées, - interrogation.
- Réalisation
- - outils utilisant des composants standards tels
que - le Directory Interchange Format
(DIF),Version 8 - standard de fichier de métadonnées
- un middleware pour insérer, actualiser les
données et réaliser les requêtes - e-XML Repository Version 2.0
- - loutil doit être
- efficace, portable, performant, évolutif
8ARGAU0 This dataset presents physical and
geochimical data from water samples taken at
various locations and depths in the south
Atlantic ocean and the southern
ocean. Parameters Earth Science Atmosphere
Atmospheric Winds Surface Winds Earth
Science Atmosphere Atmospheric Chemistry Carvon
Dioxyde AIR PCO2 Investigator Alain
POISSON Email apoisson_at_ccr.jussieu.fr Phone01
44 27 48 69 Adress LBCM 4 place jussieu 75005
paris
Title Summary Parameters Category Topic Te
rm Variable Category Topic Term Variable Detailed
Variable Role - Name Email Phone Adress
ltEntry_TitlegtARGAU0lt/Entry_Titlegt ltSummarygtThis
dataset presents physical and geochimical data
from water samples taken at various locations
and depths in the south Atlantic ocean and the
southern ocean.lt/Summarygt ltParametersgt ltCateg
orygtEARTH SCIENCElt/Categorygt ltTopicgt ATMOSPHERE
lt/Topicgt ltTermgt ATMOSPHERIC WINDS
lt/Termgt ltVariablegt SURFACE WINDS
lt/Variablegt ltDetailed_Variable/gt ltCategorygtEARTH
SCIENCElt/Categorygt ltTopicgtATMOSPHERElt/Topicgt ltTerm
gt ATMOSPHERIC CHEMISTRY lt/Termgt ltVariablegtCARBON
DIOXYDElt/Variablegt ltDetailed_Variablegt AIR
PCO2lt/Detailed_Variablegt lt/Parametersgt ltRolegtInve
stigatorlt/Rolegt ltNamegt Alain POISSON
lt/Namegt ltEmailgt apoisson_at_ccr.jussieu.fr
lt/Emailgt ltPhonegt01 44 27 48 69lt/Phonegt ltAdressgtLBC
M 4 place jussieu 75005 parislt/Adressgt
9Plan
Utilisation dXML dans linterface
- Fonctionnement général
- XMLQuery
- Présentation du langage
- Exemple
- Edition de requêtes
- Utilisateur confirmé en XMLQuery
- Menu personnalisé
- Extraction des paramètres, création de
larborescence - Intégration des mots-clés
- Traitement des résultats
- Opérations précédant la traduction
- Intervention de Saxon
- Conclusions et perspectives
10Fonctionnement général
11Le langage XQuery
- Nouveau standard du W3C
- Véritable langage de programmation fonctionnel
- Construction similaire au SQL, avec en plus
- intégration des arbres XML
- recherche textuelle
- Expression de chemin XPath
- Collection( ltrecueilgt )
- Expression FLWR(Flower)
- Itération for ltvargt in ltforestgt
ltvargt in ltforestgt - Assignation let ltvargt ltsubtreegt
- Elagage where ltconditiongt
- Construction return ltresultgt
12Exemple de requêtes
- Expression FLWR
- for E in collection(OCEANS)/DIF
- where E/Keyword CO2
- return ltresgt E/Entry_Title lt/resgt
- XPath équivalent
- Collection(Â OCEANSÂ )/DIF
- KeywordCO2/Entry_Title
ltDIFgt ltEntry_IDgt CIVA1 lt/Entry_IDgt
ltPersonnelgt ltRolegtinvestigator
lt/Rolegt lt/Personnelgt
ltKeywordgtCO2lt/Keywordgt lt/DIFgt
Document XML
Requête XMLQuery
13Edition de requête
- Utilisateur confirmé en XMLQuery
- Utilisation de formulaires dédition directe de
requêtes - Exploitation optimale du potentiel dXMLQuery
- Menu personnalisé de requêtes
- Mémorisation des requêtes fréquentes pour chaque
utilisateur - Diminution des redondances de manipulation
14Edition de requête
- Extraction des paramètres _ création de
larborescence - Construction dynamique extraction des
paramètres lors dune première connexion
transparente à la base (chargement de
lapplication) - Conservation de la hiérarchie des paramètres dans
larborescence - Category, Topic, Term, Variable,
Detailed_Variable - Edition progressive et automatique de la requête
avec reconnaissance des balises et des niveaux
respectifs - Intégration des mots-clé
- Affiner la requête résultats de plus en plus
précis - Augmenter le potentiel de lapplication en
élargissant le champ daction de requête - Couverture temporelle, location, capteur, source,
keyword
15Traitement des résultats
- Résultats obtenus sous forme dun unique fichier
XML - Traitement des résultats
- Extraction des titres pour laffichage
- Sauvegarde des documents respectifs
- Utilisation de Saxon pour les traductions en HTML
- Traduction à la volée du document XML sélectionné
- Création du fichier HTML correspondant pour
laffichage
16Conclusion et perspectives
- Toutes les fonctionnalités de linterface de
métadonnées de lIPSL - ont été testées et validées.
- Prochaines modifications
- Jusquà présent
- Création des DIFs uniquement sous la forme HTML
- Insertion dans le Repository précédée dune
traduction manuelle dHTML en XML - Prévisions
- Conservation des fichiers HTML créés pour guider
les modifications de lutilisateur dans lédition
de DIF - Création automatique et parallèle du fichier XML
correspondant afin denvoyer uniquement ce
dernier lors de larchivage - Implémentation dune interface administrateur
- Ouverture en janvier 2003
- http//dataipsl.ipsl.jussieu.fr/metadata