Title: Projet ANR e-WOK_HUB (Environmental Web Ontology Knowledge Hub)
1Projet ANRe-WOK_HUB (Environmental Web
Ontology Knowledge Hub)
- Partenaires
- BRGM, EADS, ENSMP, IFP, INRIA, LISI/ENSMA/CRITT
- Colloque STIC 2007
2Projet ANR E-WoK_HUB
Objectifs scientifiques
- Mettre en place un ensemble de portails
communicants (les Hubs e-WOK), proposant à la
fois - des applications web accessibles aux utilisateurs
finaux à travers des IHM en ligne - et des services webs accessibles aux applications
à travers des interfaces programmatiques
3Projet ANR E-WoK_HUB
Objectifs applicatifs
- Gestion de la mémoire de plusieurs projets sur la
capture et le stockage du CO2, avec exploitation
des résultats de la veille technologique sur le
domaine - Intégration dinformations issues de bases
différentes et de logiciels métiers
4Projet ANR E-WoK_HUB
Les Hubs e-WOK
Hub e-WOK serveur web sémantique et portail
offrant un accès sémantique à des ressources
documentaires, des données métiers et des
services (génériques ou métiers) en utilisant des
ontologies adéquates
- Fonctionnalités de mise en réseau des portails
pour accéder les uns aux autres et mutualiser
leurs ressources
Boîte à outils pour générer les annotations des
ressources et les interfaces programmatiques des
services utiles pour le domaine considéré
- Intégration dinterfaces homme machine pour gérer
les échanges entre utilisateurs et le réseau de
portails
Indexation des contenus textuels des documents et
des données
Accès aux entités sémantiques et gestion de leur
persistance
5Projet ANR E-WoK_HUB
Résultats attendus du projet
- Au niveau scientifique
- Éditeurs coopératifs et contextuels,
- Connexion entre les standards
- RDF(S)/OWL et EXPRESS/PLIB,
- SPARQL et OntoQL
- Prise en compte de multiples points de vue dans
les annotations et lors de la recherche
dinformation, - Exploitation de techniques linguistiques et
probabilistes pour la création / enrichissement
des annotations à partir de textes, - Prise en compte de linfluence de lévolution
de lontologie sur les annotations, - Géolocalisation associée à la sémantique,
- Lien entre la gestion de la mémoire de projet
et les résultats de la veille technologique.
6Projet ANR E-WoK_HUB
Résultats attendus du projet
- Au niveau applicatif
- Veille technologique sur la caractérisation des
sites de stockage du CO2 - Application à dautres domaines thématiques dans
le domaine des géosciences (risques naturels, eau
souterraine) ou dans des domaines en ingénierie
nécessitant mémoire inter-projets ou veille
technologique - Au niveau exploitation
- CRITT outils développés autour de PLIB
- IFP et BRGM exploitation des résultats
7Projet ANR E-WoK_HUB
Résultats scientifiques et industriels
8Projet ANR E-WOK_HUB
Vision globale du projet
Besoins (cas dutilisation)
Expériences background
BESOINS SPECIFICATION LOT 1 (1/2)
EVALUA TION LOT 1 (2/2)
K-repository et applications
Applications existantes
Leader BRGM
MISE EN PLACE DU E-WOK_HUB LOT 4
Besoins Specs
PERSISTANCE DES ONTOLOGIES ET DES REGLES LOT 3
Démos analyse des résultats
Leader EADS
Outils spécifiques à la persistance
Leader BRGM
Leader LISI
Outils génériques
Outils génériques
OUTILS ET METHODES GENERIQUES LOT 2
Leader INRIA
9Projet ANR E-WoK_HUB
Résultats industriels Lot 1
Use cases - Besoins
- ? une annotation automatique
- ? Pas de charge de travail supplémentaire,
succès de lutilisation - ? un moteur de recherche performant
- ? une amélioration dans le principe de recherche
sémantique géo-localisation - ? un outil central pour la démarche de recherche
- ? élargir le périmètre des ressources actuelles
(ressources du centre de documentation) en
incluant des images, des services
cartographiques, services web , des références de
base de données - ? collaboration entre organismes pour les données
- ? lamélioration de la connaissance
- ? une collaboration de ses agents pour parfaire
la définition de la connaissance - ? un outil de gestion des ressources, des
requêtes et de leurs résultats, des différents
projets - ? une capitalisation des démarches
intellectuelles - ? un outil daide dans le suivi dun projet de
consultation des référentiels de ressources.
10Projet ANR E-WoK_HUB
Résultats industriels Lot 1
Use cases
- On porte une attention particulière aux aspects
géologiques et géographiques et on lapplique sur
le projet PICOREF. - Use case amont (BRGM)
- Mémoire des projets CO2
- Annotations
- Edition dontologies
- Exemples de requêtes dans le projet PICOREF
- Use case aval (IFP)
- Cas détude IFP
11Projet ANR E-WoK_HUB
Résultats industriels Lot 1
Use Case amont à partir du corpus de documents
"BRGM/PICOREF"
- 1/ Retrouver les infos de localisation
géographiques "globales" de chaque document. - 2/ Retrouver les entités géologiques citées dans
chaque document. - 3/ Dater les entités géologiques repérées dans
les documents. - 4/ Localiser les entités géologiques repérées
dans les documents - 5/ Etendre la recherche des entités géologiques
aux publications référencées dans le corpus de
documents. - 6/ Extraire des documents les "sections" "
segments" et "fragments" qui décrivent les
hypothèses chrono stratigraphiques associées aux
entités géologiques et les présenter à
l'utilisateur lors de la phase d'interprétation
pour annoter ces interprétations ( Geological
Knowledge Editor).
12Projet ANR E-WoK_HUB
Résultats industriels Lot 1
Use-cases et ontologies obtenues Exemples de
questions
Question dopérateur Je recherche les lignes
sismiques qui ont été étudiées dans le cadre
du projet PICOREF Question dexpert Le
Callovo-Oxfordien est-il une bonne couverture ?
Question dusager Existe-t-il des sites
potentiels de stockage de CO2 à moins de 25 km
de mon usine ?
Dans un premier temps, les réponses seront
fournies sous forme dune liste de documents
permettant à lusager de répondre à la question
posée.
Plus dune centaine de questions identifiées
13Projet ANR E-WoK_HUB
Résultats industriels Lot 1
Use-cases et ontologies obtenues Analyse du
contenu dun document
On vise à mettre en œuvre une méthodologie
plus performante que la recherche habituelle par
mots-clés. La méthode repose sur lanalyse
du contenu de documents entiers sans définition
préalable de mots-clés.
- Extraction automatique de mots ou groupes de
mots signifiants - (plate-forme linguistique, INRIA)
- Annotation des termes extraits en référence à
des ontologies de domaine définies préalablement. - Traitement statistique éventuel des termes
annotés en vue de déterminer les éléments-clés
du document considéré
14Projet ANR E-WoK_HUB
Résultats industriels Lot 1
Use-cases et ontologies obtenues
- On part dun corpus de textes de référence (une
dizaine de documents articles, rapports, thèse
etc.) que les experts annotent à la main. - Ce travail de départ permet de définir les
diverses ontologies de domaine qui devront être
construites et de leur associer une première
liste de concepts et de propriétés. - On a défini
- une ontologie des termes géographiques (INSEE,
BRGM) - une ontologie de la chronologie géologique
(ENSMP) - 5 ontologies relatives aux différentes
sous-disciplines géologiques à prendre en compte
(ENSMP)
15Projet ANR E-WoK_HUB
Résultats industriels Lot 1
Use-cases et ontologies obtenues Ontologies
définies pour la géologie
16Projet ANR E-WoK_HUB
Résultats industriels Lot 1
Use-cases et ontologies obtenues Chronologie
géologique
17Projet ANR E-WoK_HUB
Résultats industriels Lot 1
Use Case AVAL " IFP" Schéma simplifié
La Vue Utilisateur
INCOMPLETE
Archives Numériques (ex fichiers RESCUE)
18Projet ANR E-WOK_HUB
Vision globale du projet
Besoins (cas dutilisation)
Expériences background
BESOINS SPECIFICATION LOT 1 (1/2)
EVALUA TION LOT 1 (2/2)
K-repository et applications
Applications existantes
Leader BRGM
MISE EN PLACE DU E-WOK_HUB LOT 4
Besoins Specs
PERSISTANCE DES ONTOLOGIES ET DES REGLES LOT 3
Démos analyse des résultats
Leader EADS
Outils spécifiques à la persistance
Leader BRGM
Leader LISI
Outils génériques
Outils génériques
OUTILS ET METHODES GENERIQUES LOT 2
Leader INRIA
19Projet ANR E-WoK_HUB
Résultats scientifiques Lot 4
Architecture des hubs Approche de conception
- Les tâches des utilisateurs de_Wok_Hub sont
organisées en projets - Les connaissances métier constituent des
ressources pour les projets - Les partenaires techniques fournissent des
services qui exploitent les ressources
disponibles et produisent de nouvelles ressources - Les applications opérationnelles sont construites
par composition de services - Les portails e-Wok donnent accès aux ressources
et aux services disponibles pour conduire les
projets - ? ARCHITECTURE ORIENTEE SERVICES
20Projet ANR E-WoK_HUB
Résultats scientifiques Lot 4
Architecture proposée
Interface utilisateur
- Web Service
- XML
- WSDL
- WS-BPEL
- SOAP
- SPARQL
- OWL/RDFS
- RDF
- PLIB
Portail
Conception de Work-Flow
Configuration administration
Applications
Monitoring
Orchestration
Sécurité
Supervision
Distribution et messaging
Services "Métier"
Spécifiques
Génériques
Services Techniques
données sémantiques
documents
données techniques
21Projet ANR E-WoK_HUB
Résultats scientifiques Lot 4
Architecture des hubs linfrastructure
dintégration
ESB infrastructure conçue pour exposer,
accéder, orchestrer, administrer les services
Web Services
Publication/ Abonnement
Échange de fichiers
Messagerie asynchrone
RPC synchrone
Orchestration de services
Enterprise Service Bus
XML
HTML
Oracle
Word/Excel
txt
ACORD
PostgreSQL
PDF
ODT
Multiples langages de programmation
Modèles et Formats de données disparates
Plates-formes hétérogènes
? Évaluation des ESB disponibles en open source
Petals
22Projet ANR E-WoK_HUB
Résultats scientifiques Lot 4
Réseau de Hubs
23Projet ANR E-WOK_HUB
Vision globale du projet
Besoins (cas dutilisation)
Expériences background
BESOINS SPECIFICATION LOT 1 (1/2)
EVALUA TION LOT 1 (2/2)
K-repository et applications
Applications existantes
Leader BRGM
MISE EN PLACE DU E-WOK_HUB LOT 4
Besoins Specs
PERSISTANCE DES ONTOLOGIES ET DES REGLES LOT 3
Démos analyse des résultats
Leader EADS
Outils spécifiques à la persistance
Leader BRGM
Leader LISI
Outils génériques
Outils génériques
OUTILS ET METHODES GENERIQUES LOT 2
Leader INRIA
24Projet ANR E-WoK_HUB
Résultats scientifiques Lot 2
Rapport sur les services pour les ontologies
- Editeur contextuel et collaboratif ECCO
- Approche danalyse de corpus et de techniques
linguistiques - Spécifications de techniques denrichissement
sémantique semi-automatique à partir de textes en
reposant sur la kernelisation de champs
aléatoires conditionnels - Techniques basées sur des règles de détection
dincohérence et restauration de cohérence pour
traiter linfluence de lévolution dontologies - Transformation entre le modèle dontologies
RDF(S) / OWL Lite et le modèle PLIB
25Projet ANR E-WoK_HUB
Résultats scientifiques Lot 2
Service dontologies ECCO
ECCO (Editeur Collaboratif et Contextuel
dOntologies)
- Méthodologie
- suivre les phases de conception
dune ontologie - À partir de lextraction de termes dans des
sources de données -
- Jusquà lédition fine de lontologie
26Projet ANR E-WoK_HUB
Résultats scientifiques Lot 2
Service dontologies ECCO (2)
ECCO (Editeur Collaboratif et Contextuel
dOntologies)
Extraction collaborative de termes chaque
utilisateur visualise ses propres termes ceux
extraits par les autres utilisateurs. Extraction
contextuelle le contexte du terme extrait est
attaché à celui-ci.
27Projet ANR E-WoK_HUB
Résultats scientifiques Lot 2
Service dontologies ECCO (3)
ECCO (Editeur Collaboratif et Contextuel
dOntologies)
(Méta) annotation des termes représenter le
statut de chacun des termes.
28Projet ANR E-WoK_HUB
Résultats scientifiques Lot 2
Service dontologies ECCO (4)
ECCO (Editeur Collaboratif et Contextuel
dOntologies)
(Méta) annotation des termes permettre aux
utilisateurs davoir un historique des
discussions sur un terme donné.
29Projet ANR E-WoK_HUB
Résultats scientifiques Lot 2
Service dontologies ECCO (6)
ECCO (Editeur Collaboratif et Contextuel
dOntologies)
Technos utilisées J2EE / Web 2.0 / Web
sémantique
30Projet ANR E-WoK_HUB
Résultats scientifiques Lot 2
Service dontologies Evolution des ontologies
Approche suivie
Gestion des annotations inconsistantes après
évolution de lontologie.
- Processus dévolution
- Avec trace dévolution des ontologies
- Sans trace dévolution des ontologies
31Projet ANR E-WoK_HUB
Résultats scientifiques Lot 2
Service dontologies Evolution des ontologies
(3)
1er cas Evolution des ontologies avec traces
existantes
Générateur de traces dévolution ECCO
Résolution à laide des stratégies COSWEM
32Projet ANR E-WOK_HUB
Vision globale du projet
Besoins (cas dutilisation)
Expériences background
BESOINS SPECIFICATION LOT 1 (1/2)
EVALUA TION LOT 1 (2/2)
K-repository et applications
Applications existantes
Leader BRGM
MISE EN PLACE DU E-WOK_HUB LOT 4
Besoins Specs
PERSISTANCE DES ONTOLOGIES ET DES REGLES LOT 3
Démos analyse des résultats
Leader EADS
Outils spécifiques à la persistance
Leader BRGM
Leader LISI
Outils génériques
Outils génériques
OUTILS ET METHODES GENERIQUES LOT 2
Leader INRIA
33Projet ANR E-WoK_HUB
Résultats scientifiques Lot 3
Service de persistance Introduction
- Proposition dun modèle de persistance autour de
la plate-forme OntoDB - Modélisation dontologies de domaine
- Connexion à larchitecture E-Wok-HUB
34Projet ANR E-WoK_HUB
Résultats scientifiques Lot 3
Modèle de persistance (1)
- ONTODB
- Base de données à base ontologique pour PLIB
- Structure de persistance pour les ontologies et
leurs instances - Extension dune classe une relation (une vue)
35Projet ANR E-WoK_HUB
Résultats scientifiques Lot 3
Modèle de persistance (2)
- ONTODB pour E-Wok-Hub
- Extension proposées
- Représentation des données, ontologies et
raisonnements spatiaux - Prise en compte des modèles, langages et formats
du web sémantique - Représentation XML des données natives de ONTODB
(OntoML) - Mise en œuvre
- Définition dun noyau commun des langages et des
modèles dontologies - Expressions déquivalences vues et opérateurs
de logique de description - Caractéristiques de symétrie, inverse,
contraintes, etc...
36Projet ANR E-WoK_HUB
Résultats scientifiques Lot 3
Service de persistance Modélisation à base
ontologique
- Construction de nouvelles ontologies et de bases
de données à base ontologique - Représentation des données spatiales
- Validation avec ONTODB
- EarthModel, GeoTimeScale, Petrographer
- Indexation de bases de données existantes
- Rétro-conception de bases de données
- Approche dannotation sémantique de bases de
données existantes - Application aux données fournies par le BRGM avec
prise en compte de données géographiques
37Projet ANR E-WoK_HUB
Résultats scientifiques Lot 3
Service de persistance Intégration dans
l architecture E-Wok-Hub
- Connexion au Hub
- Utilisation de SPARQL comme langage daccès à la
BDBO - Interprétateur OntoQL
- Spécification des modules dimport/export
ONTOML/RDF-S
Meta-Schema
System Catalog
SPARQL
OntoQL
Ontology
Logical model
Ontologie RDF-S
38Projet ANR E-WoK_HUB
Plan de travail
Travail en cours Prototype
1er prototype sur le scénario 1 établi par
IFP-BRGM
39Projet ANR E-WoK_HUB
Plan de travail
Prototype Recherche sur critères géographiques
- Scénario opérationnel et annotation manuelle du
corpus (ENSMP) - Socle technique (EADS)
- Services métiers
- Acquisition de documents Ewok Hub (IFP)
- Analyse linguistiques (INRIA)
- Annotation géographique par apprentissage (EADS)
- Annotation toponymique et géométrique (IFP, BRGM,
INRIA) - Stockage Indexation dans un entrepôt sémantique
(LISI) - Interfaces Homme-Machine (BRGM)
- E-Wok Client
40Projet ANR E-WoK_HUB
Plan de travail
Prototype EWC - Ewok Client
Techno Web 2.0
41Projet ANR E-WoK_HUB
Plan de travail
Prototype EWC - Ewok Client
42Projet ANR E-WoK_HUB
Plan de travail
Prototype Recherche sur critères géographiques
- E-WOK_HUB
- projet pluridisciplinaire informatique et
géosciences - http//www-sop.inria.fr/edelweiss/projects/ewok
- Questions?