Corese Moteur de recherche s - PowerPoint PPT Presentation

About This Presentation
Title:

Corese Moteur de recherche s

Description:

En utilisant des vocabulaires conceptuels standardis s : ontologie ... Moteur de recherche Corese : RDF en graphe conceptuels. R gles de graphe. 73. Comma ... – PowerPoint PPT presentation

Number of Views:59
Avg rating:3.0/5.0
Slides: 79
Provided by: sou1
Category:

less

Transcript and Presenter's Notes

Title: Corese Moteur de recherche s


1
CoreseMoteur de recherche sémantique pour RDF
  • Olivier.Corby_at_sophia.inria.fr
  • Projet ACACIA
  • INRIA, Sophia Antipolis
  • http//www.inria.fr/acacia
  • Knowledge is Power

2
Corese
  • COnceptual REsource Search Engine
  • Moteur de recherche RDF
  • Resource Description Framework (W3C)

3
Histoire
  • 1992 Acacia acquisition des connaissances à
    partir de documents structurés avec des graphes
    conceptuels
  • 1998 XML
  • 1999 RDF, 1er prototype de Corese
  • 2000 ICCS RDF et les graphes conceptuels
  • 2000-2001 Moteur Corese pour Comma, projet
    européen

4
Web Sémantique
  • Extension du Web actuel où linformation serait
    munie dune signification (meaning) bien définie
  • Pour faciliter le travail en coopération
    homme-machine
  • Un Web de données et de documents

5
Web Sémantique
  • Évolution du Web pour permettre le traitement
    automatique des informations (par programme)
  • Documents et données structurés (XML)
  • Associer sémantique (sens) aux documents et aux
    données

6
W3C
7
Applications
  • Préparer automatiquement un voyage, par
    lInternet, en combinant des informations (hôtel,
    avion, voiture)
  • Mémoire dentreprise web sémantique dentreprise

8
XML
  • Extensible Markup Language
  • Langage de description et déchange de
  • documents structurés
  • données structurées
  • W3C

9
XML
  • Définit la structure (syntaxe) comme un arbre de
    syntaxe abstraite
  • Mais rien sur la signification, le sens la
    sémantique
  • La sémantique permet de définir la signification
    des balises, donc des informations. Contraint les
    traitements

10
Sens
  • ltbookgt book a kind of Document
  • ltauthorgt Documents have an author, which is a
    Person,
  • lttitlegt a title which is a Literal

11
Sens
  • Décrire le sens avec un certain consensus
  • En utilisant des vocabulaires conceptuels
    standardisés ontologie

12
Ontologie
  • Se mettre d'accord sur le sens des termes
    employés dans une organisation, une communauté,
    un métier
  • Faire en sorte que les personnes et les logiciels
    se comprennent

13
Ontologie
  • Identifier, modéliser les concepts et les
    relations d'un domaine, pertinents pour une/des
    applications
  • Se mettre d'accord, au sein d'une communauté,
    sur les termes employés pour se référer à ces
    notions

14
Ontologie
  • Identifier un domaine technique
  • Recenser, classer les termes du vocabulaire
  • Identifier les termes dénotant
  • des objets
  • des propriétés
  • des relations
  • Classer les objets

15
Ontologie
  • Identifier les points de vue pertinents du
    domaine
  • Technique, Financier, Management
  • Structurel, Fonctionnel

16
Ontologie
  • Ontologie modélisation des connaissances
  • Au sens où une théorie physique est un modèle de
    la réalité
  • Il peut y avoir plusieurs modèles dune même
    réalité
  • expérience de la chute des corps
  • théorie de la gravitation de Newton
  • relativité générale dEinstein

17
Connaissance
  • Continuum donnée, information, connaissance
  • donnée ---
  • information SOS
  • connaissance en cas dalerte, déclencher
    les secours
  • La connaissance permet de produire de nouvelles
    données, informations, connaissances inférence

18
Connaissance
  • Connaissances de résolution de problème
  • conception, diagnostic, évaluation, planification
  • tâches, inférences
  • Connaissances du domaine
  • électronique, mécanique, médecine, etc.
  • Concept, relation

19
Ontologie
  • Composant réutilisable
  • Réutilisation généralité, abstraction (reuse)
  • Partage consensus, standardisation (sharing)
  • Accord sur conceptualisation partagée
    engagement ontologique (commitment)

20
RDF
  • W3C Resource Description Framework
  • Langage de description de meta données pour le
    web sémantique
  • Modèle de triplets
  • resource property value
  • A léchelle du web utilise des URI
  • Permet de classer les ressources

21
RDF
  • Meta donnée pour décrire le contenu des documents
  • Type de document
  • Auteurs
  • Origine
  • Sujet
  • Public cible

22
RDF Triples
  • exdoc extitle Theory of Justice
  • exdoc rdftype exBook
  • exdoc exauthor exjr
  • exdoc exsubject exphilosophy
  • exjr exname John Rawls
  • exjr rdftype exPerson

23
Syntaxe XML
  • ltexBook rdfaboutdocgt
  • ltexauthor rdfresourcejr/gt
  • ltextitlegtTheory of Justice
  • lt/extitlegt
  • lt/exBookgt
  • ltexPerson rdfaboutjrgt
  • ltexnamegtJohn Rawlslt/exnamegt
  • lt/exPersongt

24
RDF Schema
  • Vocabulaire standard pour décrire des ressources
  • Classes de ressources
  • Propriétés et signatures

25
Classes
  • exBook rdftype rdfsClass
  • exBook rdfssubClassOf exDocument
  • exPerson rdftype rdfsClass
  • exPerson rdfssubClassOf exHominidae

26
Propriétés
  • exauthor rdftype rdfProperty
  • exauthor rdfsdomain exDocument
  • exauthor rdfsrange exPerson
  • exname rdftype rdfProperty
  • exname rdfsdomain exPerson
  • exname rdfsrange rdfsLiteral

27
Inférence de type
  • exdoc exauthor exjr
  • exauthor rdfsdomain exDocument
  • exauthor rdfsrange exPerson
  • ?
  • exdoc rdftype exDocument
  • exjr rdftype exPerson

28
Typage class
  • Si une ressource a pour type C, alors C est une
    classe
  • rdftype rdfsrange rdfsClass
  • exolivier rdftype exPerson
  • ?
  • exPerson rdftype rdfsClass

29
Sous-propriété
  • exnickName rdfssubPropertyOf exname
  • exjr exnickName Joe
  • ?
  • exjr exname Joe

30
RDFS XML
  • ltrdfsClass rdfIDPersongt
  • ltrdfssubClassOf rdfresourceHominidae/gt
  • lt/rdfsClassgt
  • ltrdfProperty rdfIDnamegt
  • ltrdfsdomain rdfresourcePerson/gt
  • ltrdfsrange rdfresourcerdfsLiteral/gt
  • lt/rdfPropertygt

31
Ressource anonyme
  • Ressource intermédiaire, sans identificateur
  • Sémantique existentielle il existe une
    ressource
  • ltnsCoursgt
  • ltnsauteurgt
  • ltnsPersongt
  • ltnsnamegtO. Corbylt/nsnamegt
  • lt/nsPersongt
  • lt/nsauteurgt
  • lt/nsCoursgt

32
Relation n-aire
  • Les propriétés sont des relations binaires
  • Pour décrire une relation n-aire, utiliser une
    ressource anonyme
  • ltnsMobilegt
  • ltnsvitesse rdfparseTypeResourcegt
  • ltrdfvaluegt130lt/rdfvaluegt
  • ltnsunitgtkm/hlt/nsunitgt
  • lt/nsvitessegt
  • lt/nsMobilegt

33
Relation n-aire
  • ltnsMobilegt
  • ltnsvitessegt
  • ltrdfDescriptiongt
  • ltrdfvaluegt130lt/rdfvaluegt
  • ltnsunitgtkm/hlt/nsunitgt
  • lt/rdfDescriptiongt
  • lt/nsvitessegt
  • lt/nsMobilegt

34
Requêtes
  • Trouver les cours dont O. Corby est enseignant ?
  • Qui enseigne le cours LOG11 ?
  • Y a-t-il un enseignant-chercheur ?
  • Y a-t-il une Personne de l'INRIA ?

35
Requêtes
  • A la OQL (Object Query Language)
  • select c.num, p.nom
  • from c Cours, p Personne
  • where c.titre like connaissance and
  • p.institut INRIA

36
Sémantique
  • Tous les énoncés RDF sont considérés comme vrais,
    dans un même environnement, la conjonction des
    énoncés est considérée comme vrai également
  • Il ny a pas de contexte local (dans lequel
    quelque chose serait vrai)
  • Il ny a pas de négation
  • RDF est monotone ce qui est vrai reste vrai au
    fur et a mesure que lon rajoute de linformation
  • RDF est un sous-ensemble de la logique du premier
    ordre avec des prédicats binaires et des
    variables existentielles.

37
Graphes conceptuels
  • Réseau sémantique
  • Concept et relation
  • Concepts et relations typés
  • Hiérarchies de types de concept et de relation

38
GC
  • Bookdoc-
  • -(author)-Personjr-
  • -(name)-LiteralJohn Rawls
  • -(title)-
  • LiteralTheory of Justice

39
GC - RDF
  • Concept ? ressource
  • Relation ? propriété
  • Type ? classe
  • Signature de relation ? domain, range
  • Projection pour retrouver des ressources
  • RDF comme format de GC

40
Différences
  • RDF relation binaire
  • RDF ressources peuvent avoir plusieurs types
  • RDF distingue les littéraux et les ressources
  • RDF est multilingue (xmllang tag)

41
(No Transcript)
42
Corese
  • Construire une représentation
  • dun schema RDF et
  • dénoncés RDF
  • Rechercher des ressources
  • Classer des ressources par inférence de type
  • Compléter la base de ressources par des
    inférences
  • Serveur Web sémantique

43
Moteur de recherche
  • Projection dun graphe requête sur le graphe
    cible
  • Opérateurs de recherche
  • Projection approchée
  • Groupement des résultats

44
Requête
  • select d.title, p.name
  • from d Document, p Person
  • where d.title contains XML and d.author p

45
Requête
  • ltcDocument cTitleXMLgt
  • ltcauthorgt
  • ltcPerson cname?x/gt
  • lt/cauthorgt
  • lt/cDocumentgt

46
Projection
  • Document (author) Creator
  • Trouve des occurrences spécialisées
  • Paper (author) Person
  • Report (author) Team

47
Projection approchée
  • Réponse tolère des concepts non spécialisés
  • Query
  • TechnicalReport(author)Person
  • vs
  • Target
  • ResearchReport (author) Team

48
Distance ontologique
  • Calcule une distance ontologique entre concept
    requête et concept cible
  • Distance longueur du plus court chemin le long
    de la relation de subsomption entre concept
    requête et cible
  • Distance entre réponse et requête somme des
    distances des concepts approchés

49
Distance ontologique
  • Distance entre des frêres 2
  • Entre des cousins germains 4

50
Distance
  • De plus, la distance diminue avec la profondeur
  • La distance entre un père et un fils de
    profondeur n est de 1/2n
  • Ainsi Homme est plus proche de Chimpanzé que
    Vertébré de Invertébré !

51
Opérateurs
  • contain
  • startWith
  • lt lt gt gt
  • ! negation ! !
  • boolean or XML RDF
  • lt lt gt gt type

52
Opérateurs
  • Document ?x TechnicalReport
  • Un document de type égal à TechnicalReport

53
XML Schema Datatypes
  • xsdstring
  • xsdfloat
  • xsdinteger
  • xsddate
  • Xsdboolean

54
RDF Datatype
  • lt!ENTITY xsd http//www.w3.org/2001/XMLSchema
    gt
  • ltcPersongt
  • ltcage rdfdatatypexsdintegergt43lt/cagegt
  • ltcname rdfdatatypexsdstringgtLaurent
  • lt/cnamegt
  • lt/cPersongt

55
Groupement
  • Une requête a pour réponse G1 .. Gn
  • On peut grouper les graphes
  • distinct x1 .. xn
  • group by x1 .. xn
  • group by connex x1 .. xn
  • count x (by y)

56
Distinct
  • Une requête a pour réponse G1 .. Gn
  • distinct x1 x2
  • G1 x1Jules, x2Jim
  • G2 x1Jim, x2Jules
  • Ne garder quun seul graphe

57
Group by
  • Une requête a pour réponse G1 .. Gn
  • group by x1 x2
  • Joindre les graphes qui ont même x1 et même x2
  • Ex grouper les documents par auteur et par année

58
Group by connex
  • Une requête a pour réponse G1 .. Gn
  • group by connex x1 x2
  • Joindre les graphes qui ont même valeur pour x1
    et/ou x2

59
Count
  • Une requête a pour réponse G1 .. Gn
  • Count x
  • Compter les occurrences différentes de x dans le
    graphe résultat
  • Ex compter les ouvrages dun auteur

60
Extensions
  • OWL
  • owlTransitiveProperty
  • owlSymmetricProperty
  • owlinverseOf
  • owlintersectionOf
  • owldisjointWith

61
Intersection
  • owlClass Woman
  • owlintersectionOf
  • owlClass Human
  • owlClass Female
  • Définit une équivalence entre Woman et
    lintersection de Human et Female
  • Human ? Female ? Woman

62
Inverse
  • p1 owlinverseOf p2
  • X p1 Y ? Y p2 X
  • hasParent owlinverseOf hasChild
  • John hasParent Jim ? Jim hasChild John

63
Symétrie
  • p rdftype owlSymmetricProperty
  • X p Y ? Y p X
  • exsibling rdftype owlSymmetricProperty
  • John exsibling Jack ?
  • Jack exsibling John

64
Transitivité
  • owlTransitiveProperty
  • X p Y ? Y p Z ? X p Z
  • expartOf rdftype owlTransitiveProperty
  • exaxis expartOf exengine
  • exengine expartOf excar
  • ?
  • exaxis expartOf excar

65
Règles
  • CG1 ? CG2
  • Si CG1 alors compléter loccurrence de CG1,
    trouvée par projection, par CG2
  • Person?x
  • -(member)-Team
  • -(participate)-Consortium?c
  • ?
  • Participant?x (participate)-Consortium?c

66
Inférences
  • Préciser le type dun concept
  • Person ?x -gt Participant ?x
  • Relation entre concepts
  • Participant ?x-(participate)-Consortium ?c

67
Règle de graphe
  • règles de graphe conceptuel
  • Pour appliquer une règle C?D
  • sur un graphe G
  • 1. Trouver C, une occurrence de C dans G par
    projection C? C
  • 2. Joindre la conclusion D au graphe G sur les
    concepts de C trouvés par projection

68
Syntaxe RDF
  • ltcosrulegt
  • ltcosifgt
  • ltcPerson rdfabout?pgt
  • ltcmembergt
  • ltcTeamgt
  • ltcparticipategt
  • ltcConsortium rdfabout?c/gt
  • lt/cparticipategt
  • lt/cTeamgt
  • lt/cmembergt
  • lt/cPerson
  • lt/cosifgt

69
Syntaxe RDF
  • ltcosthengt
  • ltcParticipant rdfabout?pgt
  • ltcparticipate rdfresource?c/gt
  • lt/cParticipantgt
  • lt/costhengt
  • lt/cosrulegt

70
Serveur Web sémantique
  • Moteur Corese intégré dans un serveur web
  • Ontologie structure linformation

71
Applications
  • 2000-2001 Comma
  • 2002 Corese pour Samovar avec Renault
  • 2003-2004 Corese pour KMP, projet RNRT
    Cartographie des compétences sur Sophia Antipolis
  • Version de distribution
  • http//www.inria.fr/acacia/soft/corese
  • 2002-2004 ODL Inria

72
Comma
  • OComma Corporate Memory Management through
    Agents
  • Système multi agents (Jade)
  • Ontology en RDF Document, Entreprise, Domaine,
    Utilisateur
  • Moteur de recherche Corese RDF en graphe
    conceptuels
  • Règles de graphe

73
Comma
  • Méthode Recueil, Phase terminologique,
    Structuration, Validation, Formalisation en RDFS
  • Résultat 470 concepts, 80 relations,
  • 13 niveaux de profondeur

74
Comma
75
KMP
  • KMP Knowledge Management Platform
  • Cartographie des compétences en Télécom sur
    Sophia Antipolis
  • Serveur Web sémantique de compétence
  • Favoriser les partenariats
  • Ontologie en RDF Compétence, Organisation,
    Domaine

76
Projets Futurs
  • eLearning,
  • mémoire dentreprise,
  • génie civil,
  • documentaire,
  • web sémantique pour l énergie

77
Références
  • http//www.inria.fr/acacia/cours/utt/corese.ppt
  • http//www.inria.fr/acacia/soft/corese

78
Démo
Write a Comment
User Comments (0)
About PowerShow.com