Title: Introduction au web smantique
1Introduction au web sémantique
- Daniel Le Berre
- DEA Systèmes Intelligents et Applications
- Faculté Jean Perrin
- Janvier 2003
2La vision du web sémantique
- "Avoir des données et des informations décrites
d'une manière qui facilite leur réutilisation et
leur composition par les machines à travers
différentes applications."Laublet, Ontosaurus,
2002
Berners-lee, Hendler and Lassila, The semantic
web, Scientific American, 17 Mai 2001
3Quelques acronymes
- RDF Resource Description Framework
- DAML DARPA Agent Markup Language
- OIL Ontology Inference Layer
- DARPA Defence Advanced Research Project Agency
- W3C World Wide Web Consortium
- URL Uniform Resource Locator
- URI Universal Resource Identifier
- HTML Hyper Text Markup Language
- XML eXtended Markup Language
- XSDL XML Schema Definition Language
4Le web d'aujourd'hui
- Un ensemble de ressources et de liens
- Les ressources sont désignées par des URIs
- Les documents sont adaptés aux humains, pas aux
machines - La structure des documents est explicite pour un
anglophone (header, body, paragraph, etc.) - La signification des liens dépend du contexte
Eric Miller,W3C
5(No Transcript)
6(No Transcript)
7Le web demain
- Un espace d'échange de ressources entre machines
permettant l'exploitation de grands volumes de
données et de services variés. - Simplifier le rôle de l'utilisateur dans la
recherche et l'exploitation de l'information
grâce à - de meilleurs moteurs de recherche
- l'intégration facilité des sources de données
- la découverte, l'exploitation et la combinaison
de services - des possibilités accrues de raisonnement sur les
données - Laublet,2002
8Comment y arriver ?
- Apprendre la sémantique à la machine (IA/KR)
- structure du document
- dictionnaires
- connaissances sur la langue
- etc.
- Ajouter des informations sémantiques destinées
aux machines (SW) - Ajouter des concepts, relations, prédicats.
- Ajouter des règles d'inférence
9Le web vu par la machine
présentation du web sémantique par James Hendler
10Les balises aident à la compréhension
présentation du web sémantique par James Hendler
11Mais ce n'est pas suffisant
présentation du web sémantique par James Hendler
12L'utilisation de schemas aide
présentation du web sémantique par James Hendler
13Mais ce n'est toujours pas suffisant ...
ltnomgt
ltscolaritégt
ltcuriculumgt
ltprivégt
présentation du web sémantique par James Hendler
14Il manque la sémantique
présentation du web sémantique par James Hendler
Comment deviner que ltnomgtltnamegtlt????gt ?
15Ontologie
- En philosophie, une ontologie est une théorie sur
la nature de l'existence, sur les types de chose
qui existent. La discipline du même nom concerne
l'étude de ces théories. - En Intelligence Artificielle et pour le web, une
ontologie est un document ou un fichier qui
définit formellement les relations entre termes.
Une ontologie pour le web contiendra le plus
souvent une taxonomie et un ensemble de règles
d'inférence. - Berners-lee, Hendler and Lassila, The semantic
web, Scientific American, 17 Mai 2001
16XML
- Les balises permettent de représenter la
structure d'un document, mais ne donnent aucune
information quand à sa sémantique. - ltdocumentgt
- ltauteurgt
- ltnamegtDaniel Le Berrelt/namegt
- ltfonctiongtMCFlt/fonctiongt
- ltbureaugtC308lt/bureaugt
- lttelephonegt03 21 79 17 88lt/telephonegt
- lt/auteurgt
- ...
- lt/documentgt
17XMLSchema
- Permet de partager la structure
- ltdlbdocument xmlnsdlb"monschema"gt
- ltdlbauteurgt
- ltdlbnamegtDaniel Le Berrelt/dlbnamegt
- ltdlbfonctiongtMCFlt/dlbfonctiongt
- ltdlbbureaugtC308lt/dlbbureaugt
- ltdlbtelephonegt03 21 79 17 88lt/dlbtelephonegt
- lt/dlbauteurgt
- ...
- lt/dlbdocumentgt
18XMLOntologie
- Permet de partager le sens
- ltdlbdocument xmlnsdlb"monontologie"gt
- ...
- lt/dlbdocumentgt
- monontologie format imaginaire
- lttype nom"personne"/gt
- lttype nom"auteur" est"personne"/gt
- ltpropriété nom"name" type_sujet"personne"
type_valeur"String"/gt - ltpropriété nom"fonction" type_sujet"personne"
type_valeur"String"/gt - ...
- ltequivalent arg1"name" arg2"zork.net/ontoname"/
gt - ltequivalent arg1"fonction" arg2"edu/position"/gt
19SW Les besoins
- Un langage de description des ressources du Web
contenu sémantique, fonctionnalités, concepts
manipulables par un agent logiciel - Un formalisme avec une sémantique formelle bien
définie limitant les erreurs d'interprétation et
permettant d'effectuer des traitements
automatisés - Un standard pour des raisons d'interopérabilité
- Charley, Laublet, Reynauld, AS 32 Web
Sémantique, 18 Juin 2002
20KR vs SW
- KR approche centralisée
- Les concepts doivent être les mêmes pour tout le
monde - Les systèmes actuels ne peuvent gérer de grandes
sources de données - Basés sur divers systèmes d'inférence /-
traitables - SW approche décentralisée
- Chaque concept est associé à une ontologie
- Les règles d'inférences sont
- simples (sur des triplets)
- seulement exprimées, pas utilisées (propriétés)
21Le web sémantique
- Web
- Méta-données (en XML)
- RDF et descendants
- Ontologie
- ? Les liens peuvent être fortement typés
- ? Une vision pour l'humain, une autre pour la
machine
Eric Miller,W3C
22Applications
- Identification, exploitation et combinaison
intelligente et automatique de ressources
(documents, services) - Traitements automatisés des données et des
connaissances - Gestion de l'hétérogénéité
- Gestion de l'interaction avec l'utilisateur
- Charley, Laublet, Reynauld, AS 32 Web
Sémantique, 18 Juin 2002
23Exemples d'application
- Moteurs de recherche "intelligents"
- Comparaison de produits sur le web
- Portails rassemblant les commentaires sur des
produits (livre, CD, vidéos, films) de divers
sites (amazon.com, fnac.com, universal.com). - Annotations (revue d'article, signets
collaboratifs, ...)
24Le web sémantique par l'exemple
25HTML
- ltHTMLgt
- ltHEADgt ltTITLEgtProf. James A. Hendlerlt/TITLEgtlt/HEAD
gt - ltBODYgt
- ltIMG SRC"http//www.cs.umd.edu/hendler/hendler.g
if" ALIGN"LEFT" WIDTH200 HEIGHT240gt - ltH1gtProfessor James A. Hendlerlt/H1gt
- ltH3gtPositionlt/H3gt
- ltPREgt
- Full Professor, ltA HREF"http//www.cs.umd.edu"gt
Dept. of Computer Sciencelt/Agt, - ltA HREF"http//www.umiacs.umd.edu"gt UM Institute
for Advanced Computer Studies lt/Agt, ltA
HREF"http//www.isr.umd.edu"gt Institute for
Systems Researchlt/Agt, - and ltA HREF"http//www.ee.umd.edu"gt Dept. of
Electrical Engineering lt/Agt - University of Maryland at College Park
- Acting Head, ltA HREF"/users/hendler/AITL/index.ht
ml"gtAdvanced Information Technology
Laboratorylt/Agt - Head, ltA HREF"/projects/plus/plus.html"gtParalleL
Understanding Systems Laboratorylt/Agt - Head, ltA HREF"/projects/amrl/index.html"gtAutonomo
us Mobile Robotics Laboratorylt/Agt - lt/PREgt
- ltA href"mailtohendler_at_cs.umd.edu"gt
ltH3gtE-maillt/H3gt lt/Agt - ltH3gtAddress/Phonelt/H3gt
- ltPREgt
- Dept. of Computer Science
26SHOE CS ontologie
- ltONTOLOGY ID"cs-dept-ontology" VERSION"1.0"
- DESCRIPTION"An example ontology for computer
science academic department"gt - ltUSE-ONTOLOGY ID"base-ontology" VERSION"1.0"
PREFIX"base" - URL"http//www.cs.umd.edu/projects/plus/SHOE/ont
s/base1.0.html"gt - ...
- ltDEF-CATEGORY NAME"Person" ISA"base.SHOEEntity"
SHORT"person"gt - ltDEF-CATEGORY NAME"Worker" ISA"Person"
SHORT"worker"gt - ltDEF-CATEGORY NAME"Faculty" ISA"Worker"
SHORT"faculty member"gt - ltDEF-CATEGORY NAME"Professor" ISA"Faculty"
short"professor"gt - ...
- ltDEF-RELATION NAME"head"
- SHORT"is headed by"gt
- ltDEF-ARG POS1 TYPE"Organization"gt
- ltDEF-ARG POS2 TYPE"Person"gt
27SHOE méta-données
- ltINSTANCE KEY"http//www.cs.umd.edu/users/hendler
/"gt - ltUSE-ONTOLOGY ID"cs-dept-ontology" VERSION"1.0"
PREFIX"cs" URL "http//www.cs.umd.edu/projects/p
lus/SHOE/cs.html"gt - ltCATEGORY NAME"cs.Professor" FOR"http//www.cs.u
md.edu/users/hendler/"gt - ltRELATION NAME"cs.member"gt
- ltARG POS1 VALUE"http//www.cs.umd.edu/projects
/plus/"gt - ltARG POS2 VALUE"http//www.cs.umd.edu/users/h
endler/"gt - lt/RELATIONgt
- ltRELATION NAME"cs.name"gt
- ltARG POS2 VALUE"Dr. James Hendler"gt
- lt/RELATIONgt
- ltRELATION NAME"cs.doctoralDegreeFrom"gt
- ltARG POS1 VALUE"http//www.cs.umd.edu/users/he
ndler/"gt - ltARG POS2 VALUE"http//www.brown.edu"gt
- lt/RELATIONgt
- ltRELATION NAME"cs.emailAddress"gt
- ltARG POS2 VALUE"hendler_at_cs.umd.edu"gt
- lt/RELATIONgt
- ltRELATION NAME"cs.head"gt
- ltARG POS1 VALUE"http//www.cs.umd.edu/project
s/plus/"gt
28DAMLOIL
- ltrdfRDF
- xmlnsStanfordKSL"http//www.ksl.stanford.edu/pr
ojects/DAML/ksl-daml-desc.daml" - ...
- xmlns "http//www.cs.umd.edu/users/hendler/j
hendler.daml"gt - ltStanfordKSLPerson rdfID"JimHendler"gt
- ltStanfordKSLhas-Full-NamegtProfessor James A.
Hendler, PhD lt/StanfordKSLhas-Full-Namegt - lt/StanfordKSLPersongt
- ltShoeGenPerson rdfabout"JimHendler"gt
- ltShoePersemailAddressgtjhendler_at_darpa.millt/Shoe
PersemailAddressgt - ltShoePerschildgt http//www.cs.umd.edu/users/he
ndler/sharon.htmllt/ShoePerschildgt - ltShoePersagegtabout 44lt/ShoePersagegt
- ltShoeGenhead rdfresource"PlusLab" /gt
- ltdexhasHeight rdfresource"http//www.daml.or
g/2001/03/damloil-exshort" /gt - ltCmuAtlassex rdfresource"http//www.cs.umd.e
du/projects/plus/DAML/onts/personal1.0.damlMale"/
gt - lt/ShoeGenPersongt
- ltrdfDescription rdfabout"http//www.cs.cmu.edu/
softagents/atlas/ontologies/atlas-cmu.damlProje
ct"gt - ltdamlequivalentTo rdfresource"http//www.cs.u
md.edu/ projects/plus/DAML/onts/general1.0.damlOr
ganization" /gt - lt/rdfDescriptiongt
29Notation of Triples (N3)
- Base was http//www.cs.umd.edu/users/jhendler
.daml - _at_prefix ltgt .
- _at_prefix StanfordKSL .
- JimHendler a ShoeGenPerson,
StanfordKSLPerson - CmuAtlassex ShoePersMale
- ShoeGenhead PlusLab
- ShoePersage "about 44"
- ShoePerschild "http//www.cs.umd.edu/users
/hendler/sharon.html" - ShoePersemailAddress "jhendler_at_darpa.mil"
- dexhasHeight dexshort
- StanfordKSLhas-Full-Name "Professor James
A. Hendler, PhD" . - CmuAtlasProject damlequivalentTo
ShoeGenOrganization . -
30Structure du web sémantique
Berners-Lee, W3C 99
31D'XML au web sémantique
- XML format d'échange de données, pas de
sémantique - RDF méta-données, un peu de sémantique et
d'inférence. - RDF Schema modélisation de concept, plus de
sémantique et d'inférence. - DAMLOIL langage d'ontologie plus expressif,
très expressif gt inférence plus coûteuse. - OWL langage d'ontologie standard, avec
différents niveaux d'expressivité (Lite, Descr.
Logic, Full)
32Resource Description Format
- Outils de base pour modéliser l'information.
- Ressource tout ce qui peut être désigné par une
URI - Propriété relation, caractéristique, attribut
d'une ressource - Triplet ltsujet,propriété,objetgt ou
ltressource,propriété,valeurgtobjet/valeur
sont des ressources ou des littéraux (chaînes de
caractères)
33RDF exemple 1/3
- Ora Lassila is the creator of the resource
http//www.w3.org/Home/Lassila. - Ressource http//www.w3.org/Home/Lassila
- Propriété creator
- Objet Ora Lassila
34 RDF exemple 2/3
- The individual whose name is Ora Lassila, email
ltlassila_at_w3.orggt, is the creator of
http//www.w3.org/Home/Lassila. - Le diagramme exprime
- http//www.w3.org/Home/Lassila has creator
something and something has name Ora Lassila and
email lassila_at_w3.org
35RDF exemple 3/3
- The individual referred to by employee id 85740
is named Ora Lassila and has the email address
lassila_at_w3.org. The resource http//www.w3.org/Hom
e/Lassila was created by this individual.
36Resource Description Format (2)
- XML permet de représenter la même information de
diverses manières. - RDF permet de coder les triplets en XML de
manière à garantir une interprétation unique. - En XML, on utilise seulement les balises
reconnues. - En RDF, on utilise seulement les triplets
reconnus. - NS URI http//www.w3.org/1999/02/22-rdf-syntax-ns
- Spécification http//www.w3.org/TR/1999/REC-rdf-sy
ntax-19990222 - ltrdfRDF xmlnsrdf"http//www.w3.org/1999/02/22-r
df-syntax-ns"gt... - lt/rdfRDFgt
37Premier exemple en RDF/XML
- ltrdfRDFgt
- ltrdfDescription about"http//www.w3.org/Home/L
assila"gt - ltsCreatorgtOra Lassilalt/sCreatorgt
- lt/rdfDescriptiongt
- lt/rdfRDFgt
- lt?xml version"1.0"?gt
- ltrdfRDF
- xmlnsrdf"http//www.w3.org/1999/02/22-rdf-synt
ax-ns" - xmlnss"http//description.org/schema/"gt
- ltrdfDescription about"http//www.w3.org/Home/L
assila"gt - ltsCreatorgtOra Lassilalt/sCreatorgt
- lt/rdfDescriptiongt
- lt/rdfRDFgt
38Troisième exemple en RDF/XML
- ltrdfRDFgt
- ltrdfDescription about"http//www.w3.org/Home/L
assila"gt - ltsCreator rdfresource"http//www.w3.org/sta
ffId/85740"/gt - lt/rdfDescriptiongt
- ltrdfDescription about"http//www.w3.org/staffI
d/85740"gt - ltvNamegtOra Lassilalt/vNamegt
- ltvEmailgtlassila_at_w3.orglt/vEmailgt
- lt/rdfDescriptiongt
- lt/rdfRDFgt
39Resource Description Format (3)
- Containers
- Alt alternatives (miroirs par exemple).
- Bag liste non ordonnée d'éléments.
- Sequence liste ordonnée d'éléments.
40RDF Container Bag
- The students in course 6.001 are Amy, Tim, John,
Mary, and Sue. - ltrdfRDFgt
- ltrdfDescription
- about"http//mycollege.edu/courses/6.001"gt
- ltsstudentsgt
- ltrdfBaggt
- ltrdfli resource"http//mycollege.edu/students/Am
y"/gt - ltrdfli resource"http//mycollege.edu/students/Ti
m"/gt - ltrdfli resource"http//mycollege.edu/students/Jo
hn"/gt - ltrdfli resource"http//mycollege.edu/students/Ma
ry"/gt - ltrdfli resource"http//mycollege.edu/students/Su
e"/gt - lt/rdfBaggt
- lt/sstudentsgt
41RDF Container Alt
- The source code for X11 may be found at
ftp.x.org, ftp.cs.purdue.edu, or ftp.eu.net. - ltrdfRDFgt
- ltrdfDescription about"http//x.org/packages/X1
1"gt - ltsDistributionSitegt
- ltrdfAltgt
- ltrdfli resource"ftp//ftp.x.org"/gt
- ltrdfli resource"ftp//ftp.cs.purdue.ed
u"/gt - ltrdfli resource"ftp//ftp.eu.net"/gt
- lt/rdfAltgt
- lt/sDistributionSitegt
- lt/rdfDescriptiongt
- lt/rdfRDFgt
42RDF Schema
- NS URI http//www.w3.org/2000/01/rdf-schema
43L'inférence en RDFS
- rdfssubClassOf
- Si lts1,rdfstype,c1gt et ltc1,rdfssubClassOf,c2gt
alors lts1,p2,c1gt - Si ltc1,rdfssubClassOf,c2gt et ltc2,rdfssubClassOf,
c3gt alors ltc1,rdfssubPropertyOf,c3gt. - rdfssubPropertyOf
- Si lts1,p1,o1gt et ltp1,rdfssubPropertyOf,p2gt alors
lts1,p2,o1gt - Si ltp1,rdfssubPropertyOf,p2gt et
ltp2,rdfssubPropertyOf,p3gt alors
ltp1,rdfssubPropertyOf,p3gt.
44DARPA Agent Markup Language
- Extension de RDF
- Plus expressif que RDFS.
- And, or et not sur les classes.
- Meilleure gestion des cardinalités
- Support de propriétés transitives et inverses
- Support de types de données primitifs (entiers,
chaînes). - Axiomes écrits en KIF (Knowledge Interchange
Format), un format proposé à l'ANSI.
45Ontology Inference Layer
- Européen (Amsterdam, Manchester)
- Basé sur les logiques de description
- Meilleure compatibilité avec RDF que DAML
- Pas de possibilité de donner des valeurs par
défaut comme en DAML
46DAMLOIL
- Le meilleur des deux mondes
- Ns URI http//www.w3.org/2001/10/damloil
- Soumis au W3C pour former la base du langage
standard d'ontologie pour le web.
47OWL Web Ontology Language
- NS http//www.w3.org/2002/07/owl
- ltowlOntology rdfabout"http//www.example.org/wi
ne"gt - ltrdfscommentgtAn example OWL ontologylt/rdfscomm
entgt - ltowlversionInfogt
- Id Overview.html,v 1.2 2002/11/08
164225 connolly Exp - lt/owlversionInfogt
- ltowlimports rdfresource"http//www.w3.org/TR/
2002/WD-owl-guide-20021104/food.owl"/gt - lt/owlOntologygt
- ...
- ltowlClass rdfID"Winery"/gt subClassOf
owlThing - ltowlClass rdfID"Region"/gt
- ltowlClass rdfID"ConsumableThing"/gt
- ltowlClass rdfID"PotableLiquid"gt
- ltrdfssubClassOf rdfresource"ConsumableThing"
/gt - ...
- lt/owlClassgt
- ltowlClass rdfID"Wine"gt
- ltrdfssubClassOf rdfresource"PotableLiquid"/gt
- ltrdfslabel xmllang"en"gtwinelt/rdfslabelgt
48OWL Web Ontology Language 2
- Définition des objets et des propriétés
- ltRegion rdfID"CentralCoastRegion" /gt
- equivalent a
- ltowlThing rdfID"CentralCoastRegion" /gt
- ltowlThing rdfabout"CentralCoastRegion"gt
- ltrdftype rdfresource"Region"/gt
- lt/owlThinggt
- ...
- ltowlClass rdfID"Grape"gt
- ltowlClass rdfID"WineGrape"gt
- ltrdfssubClassOf rdfresource"Grape"/gt
- lt/owlClassgt
- ltWineGrape rdfID"CabernetSauvignonGrape" /gt
- ...
- ltowlObjectProperty rdfID"madeFromGrape"gt
49OWL Web Ontology Language 3
- propriétés des propriétés
- ltowlObjectProperty rdfID"locatedIn"gt
- ltrdftype rdfresource"owlTransitiveProperty"
/gt - ltrdfsdomain rdfresource"owlThing" /gt
- ltrdfsrange rdfresource"Region" /gt
- lt/owlObjectPropertygt
- ltRegion rdfID"SantaCruzMountainsRegion"gt
- ltlocatedIn rdfresource"CaliforniaRegion" /gt
- lt/Regiongt
- ltRegion rdfID"CaliforniaRegion"gt
- ltlocatedIn rdfresource"UsRegion" /gt
- lt/Regiongt
- on peut conclure
- ltRegion rdfID"SantaCruzMountainsRegion"gt
- ltlocatedIn rdfresource"UsRegion" /gt
- lt/Regiongt
50OWL Web Ontology Language 4
- Équivalences/Différences entre ontologies
- ltowlClass rdfID"Wine"gt
- ltowlsameClassAs rdfresource"vinWine"/gt
- lt/owlClassgt
- ltWine rdfID"MikesFavoriteWine"gt
- ltowlsameIndividualAs rdfresource"StGenevieve
TexasWhite" /gt - lt/Winegt
- ltWineSugar rdfID"Dry" /gt
- ltWineSugar rdfID"Sweet"gt
- ltowldifferentIndividualFrom rdfabout"Dry"/gt
- lt/WineSugargt
- ltWineSugar rdfID"OffDry"gt
- ltowldifferentIndividualFrom rdfabout"Dry"/gt
- ltowldifferentIndividualFrom rdfabout"Sweet"/
gt - lt/WineSugargt
51Relation avec UML
- Schema Classe
- Propriété Attribut ou association
- Héritage de classe
- Héritage de propriété
- Pas de notion de visibilité en RDF
52De UML à DAML 1/4
http//ubot.lockheedmartin.com/ubot/details/examp
le.html
53De UML à DAML 2/4
54De UML à DAML 3/4
55De UML à DAML 4/4
"Trey Clever is the CEO of the B2B company
acronym.com".
56Dublin Core Metadata initiative
- Organisation dédiée à l'adoption de méta-données
standard et à promouvoir la création de
méta-données spécialisées. - Choix de méta-données
- Simples à créer et faciles à maintenir
- De sens commun
- A l'échelle internationale
- Evolutif
57Dublin Core Elements
- Content
- Coverage
- Description
- Type
- Relation
- Source
- Subject
- Title
- Intellectual Property
- Contributor
- Creator
- Publisher
- Rights
- Instantiation
- Date
- Format
- Identifier
- Language
58Dublin Core exemple
- lt?xml version"1.0" ?gt
- ltrdfRDF xmlnsrdf"http//www.w3.org/1999/02/22-r
df-syntax-ns"
- xmlnsdc"http//purl.org/dc/elements/1.1
/"gt - ltrdfDescription about"http//purl.org/DC/documen
ts/notes-cox-816.htm"gt -
- ltdctitlegtRecording qualified Dublin Core
metadata in HTMLlt/dctitlegt -
- ltdcdescriptiongt We describe a notation for
recording - qualified Dublin Core metadata in HTML meta
elements. The syntax - includes recommended usage of the standard
HTML syntax to record - the different classes of qualification needed
to represent the - model.lt/dcdescriptiongt
-
- ltdcdategt1999-08-18lt/dcdategt
- ltdcformatgttext/htmllt/dcformatgt
- ltdclanguagegtenlt/dclanguagegt
- ltdcpublishergtDublin Core Metadata
Initiativelt/dcpublishergt
59Conclusion
- Le web sémantique, un web plus "computer
friendly" - Ajout de méta-données pour la machine
- Utilisation de standards (XML,RDF,DAML) pour
faciliter le partage et le traitement des données - Le web sémantique, c'est aujourd'hui !
- Il suffit d'annoter ses pages web
- Il faut surtout trouver les bonnes ontologies
- Et demain ? Les résultats en IA/KR permettra à
des agents logiciels de plus en plus intelligents
d'utiliser leur web sémantique.
60Plus d'infos sur le web sémantique
- www.w3.org
- www.semanticweb.org
- www.daml.org
- www.mindswap.org
- www.dublincore.org
- www.lalic.paris4.sorbonne.fr/stic/
- ...
- Google "semantic web" ou "web sémantique"