Int - PowerPoint PPT Presentation

1 / 24
About This Presentation
Title:

Int

Description:

Int gration texte-repr sentation formelle dans la gestion de documents XML Rapha l Troncy – PowerPoint PPT presentation

Number of Views:133
Avg rating:3.0/5.0
Slides: 25
Provided by: Moyens
Category:
Tags: int

less

Transcript and Presenter's Notes

Title: Int


1
Intégration texte-représentation formelle dans la
gestion de documents XML
  • Raphaël Troncy

2
Problématique (1/2)
  • Web espace dinformation
  • Problème difficulté à trouver et à utiliser
    linformation disponible
  • Exemple on cherche la page personnelle dun
    chercheur nommé Smith
  • résultats à propos de forgeron (problème de
    précision)
  • on souhaite aussi connaître son prénom (problème
    dutilisation)

3
Problématique (2/2)
  • Principe représenter la connaissance contenue
    dans les documents de façon à ce que celle-ci
    soit exploitable par des machines
  • Quels moyens faut-il mettre en œuvre pour
    représenter la connaissance contenue dans des
    documents et produire le système qui va en tirer
    parti ?

4
Action de recherche ESCRIRE
  • But comparaison de trois classes de formalisme
    de représentation de connaissance
  • Méthodologie

5
Présentation du corpus de travail
  • Résumés darticles scientifiques traitant
    dinteraction géniques chez la drosophile pendant
    son processus de segmentation
  • Drosophile petite mouche utilisée pour la
    recherche en biologie dans le domaine de la
    génétique

6
Plan de la présentation
  • I) Les solutions existantes
  • II) Des éléments de réponse
  • III) Proposition dimplémentation

7
Le langage SHOE (1/2)
  • Maryland, 1996 Heflin, Spector, Hendler, Luke
    et Roger
  • Langage permettant de définir des ontologies
  • définition de classe ltDEF-CATEGORY
    NAME"gap" ISA"gene-class" /gt
  • définition de relation ltDEF-RELATION
    NAME"interaction"gt ltDEF-ARG POS"1"
    TYPE"gene" /gt ltDEF-ARG POS"2" TYPE"gene"
    /gt lt/DEF-RELATIONgt
  • règles dinférence

8
Le langage SHOE (2/2)
  • Langage permettant de définir des instances
    ltCATEGORY NAME"gap"/gt ltRELATION
    NAME"interaction"gt ltARG POS"1" VALUEme /gt
    ltARG POS"2" VALUE"hb" /gt lt/RELATIONgt
  • Outils associés à SHOE
  • agent EXPOSE
  • outil permettant dannoter graphiquement les
    pages Web
  • interface graphique pour composer des requêtes

9
Le système ONTOBROKER (1/2)
  • Karlsruhe, 1997 Studer, Decker, Erdmann et
    Fensel
  • Architecture générale

10
Le système ONTOBROKER (2/2)
  • Langage de représentation
  • Classes Object. GeneObject.
    InteractionObject.
  • Attributs Interactionpromoter gtgt Gene
    target gtgt Gene.
  • Langage dannotation
  • lta onto"pageInteractionpromoter tll,
    target hb"gtlt/agt
  • Langage de requête
  • FORALL O ? O CA ?gtgtV
  • Outils associés à ONTOBROKER
  • interface de requête, moteur dinférence,
     webcrawler 

11
Bilan (1/2)
  • Multitude de systèmes (OIL, XOL, OML ...)
  • Points communs
  • définition dune ontologie, description de faits,
    possibilité de formuler des requêtes
  • interface XML
  • Inconvénients
  • systèmes performants pour des applications
    précises

12
Bilan (2/2)
  • Comment représenter la connaissance contenue dans
    un document ?
  • Quels éléments du document va-t-on décrire ?
  • A quel type de requête désire-t-on répondre ?
  • Comment intégrer cette formalisation de la
    connaissance au sein du document ?

13
II) Des éléments de réponse (1/5)
  • Comment représenter la connaissance contenue dans
    un document ?
  • Nature des documents
  • fiction vs non-fiction
  • Constructeurs de représentation de connaissance
    utiles
  • classes, objets, relations, règles dinférence

14
II) Des éléments de réponse (2/5)
Quelle description du document va-t-on donner ?
  • Image en couleur
  • Il y a 2 hommes
  • Il y a 2 présidents
  • Il y a Jacques Chirac et Boris Yeltsin
  • Jacques Chirac et Boris Yeltsin se serrent la
    main
  • Jacques Chirac et Boris Yeltsin se serrent la
    main le 30 mai 1997 devant lElysée

15
II) Des éléments de réponse (3/5)
  • Quels éléments du document va-t-on décrire ?
  • le document fait allusion à 2 gènes
  • ces gènes appartiennent aux classes gap et
    pair-rule
  • ces gènes sont tailless (tll) et fushi-tarazu
    (ftz)
  • ces 2 gènes ont une influence
  • tll inhibe ftz dans la partie antérieure de la
    mouche

16
II) Des éléments de réponse (4/5)
  • A quel type de requête désire-t-on répondre
    ? Quels sont les documents qui traitent
    dinteractions entre les classes gap et pair-rule
    ?
  • Langage de requête (OQL, XML-QL) SELECT
    FROM interactionI WHERE I.promoter-class
    "gap" AND I.target-class "pair-rule"
  • Interprétation inférences locales vs inférences
    globales

17
II) Des éléments de réponse (5/5)
  • Comment intégrer cette formalisation de la
    connaissance au sein du document ?
  • à lintérieur des documents
  • dans len-tête dune page HTML, encapsulée dans
    des balises RDF
  • à lextérieur des documents
  • dans des fichiers séparés reliés au document via
    un serveur dannotation

18
III) Proposition dimplémentation (1/5)
  • Annotation des documents

19
III) Proposition dimplémentation (2/5)
  • Exemple dannotation ltescobjref
    id"gap" /gt ltescobjref id"pair-rule"
    /gt ltescrelation type"interaction"gt
    ltescrole name"promoter-class"gt ltescobjref
    id"gap" /gt lt/escrolegt ltescrole
    name"target-class"gt ltescobjref
    id"pair-rule" /gt lt/escrolegt
    lt/escrelationgt

20
III) Proposition dimplémentation (3/5)
  • Interrogation des documents

21
III) Proposition dimplémentation (4/5)
  • Exemple de requête ltescselect
    /gt ltescfromgt ltescrelvar
    type"interaction" id"I" /gt lt/escfromgt ltesc
    wheregt ltescandgt ltesceqgt ltescpathgt
    ltescrelvarref type"interaction" id"I" /gt
    ltescattribute name"promoter" /gt lt/escpathgt
    ltescobjref id"gt" /gt lt/esceqgt ltesceqgt
    ltescpathgt ltescrelvarref
    type"interaction" id"I" /gt ltescattribute
    name"target" /gt lt/escpathgt ltescobjref
    id"Hb" /gt lt/esceqgt lt/escandgt lt/escwheregt

22
III) Proposition dimplémentation (5/5)
  • Annotation des documents
  • Applet de composition dune requête
  • Analyseur de requêtes (Expat)
  • Évaluateur de requêtes (optimisation)
  • Intégration dans TROEPS
  • Affichage des réponses

23
Conclusion
  • Plusieurs granularités de description possible
    (le choix des éléments à annoter dépend de
    lapplication résultante)
  • Structures générales classes, objets, relations
  • Mise en œuvre dans TROEPS, un langage de RCO et
    proposition dun processus permettant
    dinterroger les documents
  • Proposition dun langage de requête

24
Perspectives
  • Application à tout le corpus sur la drosophile
  • Comparaison des performances du SRCO avec les
    autres formalismes de représentation de
    connaissance
  • Remise en question de certains choix
  • Utilisation dautres corpus de documents pour
    dégager des grandes classes dapplication
Write a Comment
User Comments (0)
About PowerShow.com