Le langage XML : fonctionnalits et standards associs - PowerPoint PPT Presentation

About This Presentation
Title:

Le langage XML : fonctionnalits et standards associs

Description:

90% de l'information sont des documents. Traitement de texte et PAO ... Parsing et traitement applicatif. import dans un SGBD. Reg n ration : export d'un SGBD ... – PowerPoint PPT presentation

Number of Views:89
Avg rating:3.0/5.0
Slides: 34
Provided by: xxx3245
Category:

less

Transcript and Presenter's Notes

Title: Le langage XML : fonctionnalits et standards associs


1
Le langage XML fonctionnalités et standards
associés
  • Antoine Rizk
  • EUROCLID

2
La problèmatique
  • Création de linformation 20 du PNB
  • 90 de linformation sont des documents
  • Traitement de texte et PAO traditionnels
  • 30 du temps sur le formattage
  • 30 du temps sur la recherche dinformations
  • La technologie change tous les 18 mois
  • US nombre de documents produits/an 92 Mds

3
Les solutions
XML
1998
WWW
HTML
1992
1986
SGML
Internet
GM
1960
4
XML Avantages
  • Productivité
  • Réutilisabilité
  • Perrenité
  • Integrité
  • Partage
  • Portabilité

5
XML demain
  • A partir du deuxième semestre de lan 2000
  • le volume des données XML sera plus important
    que celui des données HTML.
  • - Gartner Group
  • 47 des entreprises utiliseront XML
  • 47 des entreprises utiliseront Linux
  • 90 des entreprises utiliseront Java
  • - Java Web Panel survey, IBM 12/98

6
Introduction à XML
  • Premier exemple
  • lt?xml version"1.0"
    standalone"yes"?gt
  • ltIdentityCardgt
  • ltFirstNamegtAntoinelt/FirstNamegt
  • ltLastNamegtRizklt/LastNamegt
  • ltCardNumbergt11437398lt/CardNumb
    ergt
  • ltPhoto url"ar.gif"/gt
  • lt/IdentityCardgt

7
Documents bien formés
  • A chaque balise ouvrante doit correspondre une
    balise fermante
  • Balisage spécifique pour les éléments vides
  • ltIMG SRC"picture.gif"/gt
  • ltIMG SRC"picture.gif"gtlt/IMGgt
  • Les balises doivent simbriquer
    correctement
  • Une racine doit exister
  • Un élément ne peut avoir des attributs vides
  • ltDL COMPACTgt
  • incorrecte
  • ltDL COMPACT""gt
  • correcte

8
Documents valides
  • Un document valide doit
  • être bien formé
  • ET
  • se conformer à une grammaire (DTD)

9
La DTD
lt!ELEMENT obs (loc, date, temp?, hygro?, nebulo?,
anemo?, pluvio?) gt lt!ATTLIST obs num ID REQUIRED
gt
  • Document Type Definition
  • Structure générique logique
  • Grammaire de la structure du document
  • Etablit les règles de structure de documents
  • Définit les noms d'éléments
  • Définit les relations entre éléments
  • Déclare les attributs ainsi que leurs types

Document
parser validant
sortie
erreurs
DTD
10
Les parsers
  • Modèle événementiel (SAX)
  • Callback appelé pour chaque événement
  • début balise, attribut, fin document etc..
  • Peut être efficace sur les gros documents
  • Larbre nest jamais construit entièrement en
    mémoire

11
Les parsers (API DOM)
  • Un modèle darbre est construit en mémoire
    (arbres abstraits)
  • Lapplication accède par API à larbre pour le
    manipuler
  • API DOM est normalisée (recommandation W3C)

12
Limites dune DTD
  • Un langage différent de celui des instances
  • Limité à la structure darbre, différent du
    modèle R
  • Pas de typage de contenu
  • Pas dhéritage
  • gt possibilité dutiliser des schémas XML-Schema

13
Données/documents
dept
poste
labo
322
LABO 322 RIZK,Courtaud
lttelephone poste"322"gt ltdeptgtlabolt/deptgt ltperson
gtRizklt/persongt ltpersongtCourtaudlt/persongt lt/telepho
negt
compta
456
poste
nom
Rizk
322
Courtaud
322
Parigot
456
14
Données ou documents ?
  • ltchapitregt
  • lttitregtceci est un fragment d'un livrelt/titregt
  • ltnotegt
  • ltpargt cette note contient deux paragraphes
  • lt/pargt
  • ltpargt un autre paragraphe
  • lt/pargt
  • lt/notegt
  • lt/chapitregt

lttransactiongt lttime date"19980509"/gt ltamountgt123lt
/amountgt ltcurrency type"pounds"/gt ltfrom
id"X3543gtG.Dupontlt/fromgt ltto id"X7987gtJ.Smithlt/t
ogt lt/transactiongt
15
Traitement XML/XSL
  • Parsing et traitement applicatif
  • import dans un SGBD
  • Regénération export dun SGBD
  • Fusion de données, génération darbre,
    transformation
  • XSL
  • Présentation
  • CSS, XSL

16
XSL
ltdategtdécembre, 1997lt/dategt
W3C XSL
\c6\f12\i décembre, 1997\par
ltP STYLE"font-styleitaliccolorgreen"gt décembre
, 1997lt/Pgt
ltfoblock font-style "italic" color"green"
xmlnsfo"http//www.w3.org/TR/WD-xsl/FO"gtdécembre
, 1997lt/foblockgt
...
ltxsltemplate match"date"gt ltfoblock
font-style"italic" color"green"gt
ltxslapply-templates/gt lt/foblockgt lt/xsltemplat
egt
17
XML XSL
SGBDR
Terminal
XML
SGBDO
XML
Internet/Intranet
XSL
Terminal
HTML
  • Portail/
  • Serveur dintermédiation

Fichiers
Terminal
WAP
18
XMLXSL
SGBD-R
labo
322
lttelephone poste"322"gt ltdeptgtlabolt/deptgt ltperson
gtRizklt/persongt ltpersongtIsraellt/persongt lt/telephone
gt
compta
456
Données XML Plus feuilles XSL
SGBD-O
Rizk
322
Israel
322
Parigot
456
19
XML XSL generic architecture
Client-side XSL transform Client-side prog. -gt
DOM
SQL
R-DBMS
Query handling Server-side XSL transform
G X M L
Browser HTML/XML graphics rendering under CSS /
XSL fo control
R-DBMS
Net HTTP server(s)
Middle-tier server
XQL
20
Ex. 2 ré-ingénierie de données
R-DBMS-1
DBMS-2(IR)
DBMS-3
DB2XML
DB2XML
DB2XML
XML
XML
XML
XML statique
Transformations (scripts)
Feuille XSLT
Processeur XSLT
XML données fusionnées
Script python
Impression catalogue
DB-RESULTAT
21
(No Transcript)
22
Les limites
  • XML reste au niveau syntaxique
  • Pas de typage
  • Pas de sémantique
  • Pas de relations/rôles entre concepts
  • gt
  • Les liens hypertextes XLL (XlinkXpath)
  • Les métadonnées RDF spec et RDF schema
  • Les schémas typés XML-Schema
  • Les topic maps

23
Liens simples
24
Xpath
25
Liens étendus
Document B
26
Liens étendus out of line
Link elements
Document C
Document A
Document B
27
Topic maps www.infoloom.com
28
Lenjeu
  • Définir une ontologie par domaine
  • Organiser les schémas de navigation
  • DTD concepts roles sémantique ontologie
  • ontologie thesaurus RDF schema
  • RDF schema gt RDF specifications gt métadonnées
  • Augmenter le taux de précision
  • Diminuer le taux de rappel

29
Lévolution documentaire
RDF Ontologie, Thesaurus
Intermédiation
Structure sémantique
Production Publication
XML,XSL XQL,XLL, SMIL...
Structure syntaxique
Formats monomédia
ASCII, JPEG, MPEG...
30
Létat actuel
  • XML recommandation 10 fév 1998
  • DOM DOM1 (1er oct 1998), DOM2 (Candidate 10 mai
    00), DOM3..
  • Xlink, Xpointer WD
  • SVG WD V8
  • SMIL WD V3
  • XSLT Xpath recommandation 16 nov 1999
  • XSL WD final
  • MathML V1 (recommandation Avr 1998), V1.1
    (Juil. 99), V2 (WD)
  • XML Schema , XMLQuery
  • RDF Modelsyntax (recommandation fév
    1999),schema spec (candidate Mars 2000)
  • XHTML
  • Xforms WD 1

31
Autres applications (1)
  • Channel Definition Format, CDF (Based on XML)
  • Web Collections using XML
  • Meta Content Framework Using XML (MCF)
  • XML-Data
  • ANZLIC - Metadata
  • XML Metadata Interchange Format (XMI) - OMG
  • Educom Instructional Management Systems Project
    (IMS)
  • Structured Graph Format (SGF)
  • Legal XML Working Group
  • Web Standards Project (WSP)
  • Open Software Description Format (OSD)
  • XLF (Extensible Log Format) Initiative
  • WAP Wireless Markup Language Specification
  • HTTP Distribution and Replication Protocol (DRP)
  • Chemical Markup Language
  • Bioinformatic Sequence Markup Language (BSML)
  • Virtual Hyperglossary (VHG)
  • Weather Observation Definition Format (OMF)
  • vCard Electronic Business Card
  • Open Financial Exchange
  • Open Trading Protocol (OTP)
  • Signed Document Markup Language (SDML)
  • Bank Internet Payment System (BIPS)
  • OpenMLS - Real Estate DTD Design
  • Customer Support Consortium
  • XML for the Automotive Industry - SAE J2008
  • X-ACT - XML Active Content Technologies Council
  • OpenTag Markup
  • CDIF XML-Based Transfer Format
  • Precision Graphics Markup Language (PGML)
  • Vector Markup Language (VML)
  • WebBroker Distributed Object Communication on
    the Web
  • Web Interface Definition Language (WIDL)
  • XML/EDI - Electronic Data Interchange
  • XML/EDI Repository Working Group
  • DISA, ANSI ASC X12/XML
  • Information and Content Exchange (ICE)
  • CommerceNet Industry Initiative

32
Autres application (2)
  • LACITO Projet Archivage de données linguistiques
  • Astronomical Markup Language
  • GedML GEDCOM Genealogical Data in XML
  • Newspaper Association of America (NAA) -
    Classified Ads Format
  • Notes Flat File Format (NFF)
  • Java Help API
  • Cold Fusion Markup Language (CFML)
  • Document Content Description for XML (DCD)
  • XSchema
  • WEBDAV
  • Tutorial Markup Language (TML)
  • Java Speech Markup Language (JSML)
  • XML and VRML (Virtual Reality Modeling Language)
  • XML for Workflow Management NIST
  • SWAP - Simple Workflow Access Protocol
  • Theological Markup Language (ThML)
  • XML-F ('XML for FAX')
  • Extensible Forms Description Language (XFDL)
  • Broadcast Hypertext Markup Language (BHTML)
  • Open Settlement Protocol (OSP) - ETSI/TIPHON
  • WDDX - Web Distributed Data Exchange
  • Common Business Library (CBL)
  • Open Applications Group - OAGIS 6
  • Schema for Object-oriented XML (SOX)
  • VoxML Markup Language
  • Telecommunications Interchange Markup (TIM,
    TCIF/IPI)
  • Encoded Archival Description (EAD)
  • UML eXchange Format (UXF)
  • Translation Memory eXchange (TMX)
  • Scripting News in XML
  • InterX.org Initiative
  • NuDoc Technology
  • Coins Tightly Coupled JavaBeans and XML Elements
  • DMTF Common Information Model (CIM)
  • Process Interchange Format XML (PIF-XML)
  • Ontology and Conceptual Knowledge Markup Languages

33
Pour aller plus loin ..
  • www.w3c.org
  • www.oasis-open.org/cover
Write a Comment
User Comments (0)
About PowerShow.com