Title: Solutions Open Source pour la gestion lectronique des documents
1Solutions Open Source pour la gestion
électronique des documents
Journée ADBS du 11 mai 2004 François Olléon
Panorama des logiciels de gestion de contenu en
Open-Source
Consultant en Systèmes dInformationfrancois_at_olle
on.com33 (0) 6 85 93 49 89
2Programme
- Un premier exemple les Wikis
- Architectures
- Weblogs et forums
- CMS
- Zope
- Autres outils
GED et Open-Source séminaires Technoforum
2
3Wikis
Journée ADBS Mardi 11 mai 2004 François Olléon
Panorama des logiciels de gestion de contenu en
Open-Source
Consultant en Systèmes dInformationfrancois_at_olle
on.com33 (0) 6 85 93 49 89
4Quest-ce quun Wiki ?
- Utilitaire simplissime pour la création
collaborative de pages Web - Imaginé en 1995 par Ward Cunningham
- Chacun peut créer et modifier toutes les pages
- Pour créer une page
- Donner son nom dans ladresse URL
- Ou mettre du texte avec SonNom (avec 2
majuscules) ou son /Nom - Possibilité de revenir à une version antérieure
en cas derreur ou de vandalisme - Règles typographiques simples pour faire la
présentation - Cest tout !
- Exemple
GED et Open-Source séminaires Technoforum
4
5Démonstration UseMod10
- Usemod10 (www.usemod.com)
- Un exemple (parmi beaucoup dautres)
- Architecture
- Apache Perl fichiers
- Compétences nécessaires
- Perl
- Forces
- Simplissime
- Très peu de contraintes
- Langage de mise en forme simple à apprendre
- Faiblesses
- Simpliste
- Pas assez de contraintes, pas de procédures de
validation - Évolutivité nulle
- Autres implémentations
- Vraiment très nombreuses voir par exemple
http//c2.com/cgi/wiki?WikiEngines
GED et Open-Source séminaires Technoforum
5
6Architectures de produits Open-Source
Journée ADBS Mardi 11 mai 2004 François Olléon
Panorama des logiciels de gestion de contenu en
Open-Source
Consultant en Systèmes dInformationfrancois_at_olle
on.com33 (0) 6 85 93 49 89
7Architectures
- LAMP
- Linux Apache MySQL PHP
- Le choix de prédilection des outils de bas et
moyen de gamme - J2EE
- Java 2 Entreprise Edition
- Le choix pour les outils de milieu et haut de
gamme - Propriétaire
- Exemple Zope
GED et Open-Source séminaires Technoforum
7
8Architectures WAMP et LAMP
- xAMP
- x système dexploitation Windows (WAMP) ou
Linux (LAMP) - A serveur HTTPD Apache
- M base de données relationnelle mySQL
- P langage de programmation PHP
- Mise en place
- Récupérer chacun des composants et les configurer
pour quils marchent ensemble - Trouver une installation prête à lemploi comme
XAMPP - Compétences nécessaires
- Programmation en PHP
- Programmation des SGBDR
Application
PHP
mySQL
Apache
Windows ou Linux
GED et Open-Source séminaires Technoforum
8
9Larchitecture J2EE les grands principes
Tomcat ou Jetty
JBOSS ou JONAS
- J2EE Java 2 Platform, Enterprise Edition
- Un ensemble de spécifications destinées Ã
standardiser les applications Java coté serveur - Émises par le Java Community Process (dont Sun
nest quun partenaire majeur) - Éléments de base
- Composants
- EJB Enterprise Java Beans, composants serveur
- Servlets composants serveur orientés Web
- JSP Java Serveur Pages, pages Web dynamiques
- Interfaces de programmation
- JDBC Java DataBase Connection
- JMS (Java Messaging Services), RMI/IIOP (Remote
Method Invocation), JNDI (Java Namin Directory
Interface), JTA (Java Transactional API)
GED et Open-Source séminaires Technoforum
9
10Architecture Jakarta (J2EE) mySQL Lucene
- Jakarta
- Initiative affiliée à Apache
- Environnement entièrement Java conforme à J2EE
- Ensemble de composants
- Un JDK (Java Development Toolkit)
- Tomcat un serveur dapplications (similaire Ã
la partie servlet/jsp de WebSphere ou WebLogic) - Lucene moteur de recherche en texte intégral
- Ant équivalent du make (outil de gestion de
la compilation des sources) - Compétences nécessaires
- Architecture J2EE, Programmation java
- Programmation jsp et des SGBDR
LUTECE
mySQL
Lucene
TOMCAT
JDK - JVM
Windows ou Linux
GED et Open-Source séminaires Technoforum
10
11Cocoon
- Quest-ce que cest ?
- Une servelt particulière
- Génération dun résultat par succession de
transformations de type XSL - Intérêt
- Très grande souplesse
- Très puissant pour générer des pages dynamique
- Un catalogue important doutils de génération
- Difficultés
- Dun abord difficile
- Connaître XML, XSL, XSLT, XSLFO, java, etc.
- Beaucoup de niveaux dindirection
Navigateur Internet
tomcat
Servlet
jsp
Cocoon
JVM
mySQL
jdbc
Windows Linux
Classes Java XSP XML, XLSx Logisheets
Pages JSP
Pages HTML
Don-nées
Servlet Classes Java
GED et Open-Source séminaires Technoforum
11
12Zope
- Le tout en un
- Serveur httpd
- Base de donnée objet (ZODB)
- Serveur de pages DTML/HTML
- Gestionnaire de modules Python
- Moteur de recherche en texte intégral
- Compétences nécessaires
- Programmation python
- Programmation DTML
- Programmation des SGBDOO
Navigateur Internet
Zope
Don-nées
httpd
DTML
ZODB
Prog Python
Python
Pages DTML
Windows / Linux
GED et Open-Source séminaires Technoforum
12
13Weblogs et Forums
Journée ADBS Mardi 11 mai 2004 François Olléon
Panorama des logiciels de gestion de contenu en
Open-Source
Consultant en Systèmes dInformationfrancois_at_olle
on.com33 (0) 6 85 93 49 89
14Quest-ce quun Weblog, ou Blog
- Objectif
- Carnet de bord (logbook) consigner des
informations au jour le jour - Le premier weblog fut le Whats New ? de Tim
Berners-Lee (le créateur du cern httpd ) au
Cern, qui pointait sur les nouveaux sites Web au
fur et à mesure de leur apparition. - Le second fut le Whats New ? de Marc
Andreesen au National Center for Supercomputing
Applications (le créateur des navigateurs Mosaic
puis Netscape), avec un rôle similaire, jusquÃ
mi 1996 - Démonstration SquishDot
- Architecture Zope
- Concepts
- Suite darticles postés dans un ordre
chronologique - Classement par thèmes
- Pas de réponses de type forums
- Possibilités de navigations par auteur ou thèmes
Thème
Article
Article
Article
Article
GED et Open-Source séminaires Technoforum
14
15Quest quun forum ?
Thème
- Autres noms
- Gestionnaire de news , Bulletin Board
- Objectif
- Permettre un échange de points de vue sur des
sujets variés - Concepts
- Thèmes de discussion, fils de discussions
(thread), Messages (post) - Gestion des accès différenciés suivant les
thèmes, Modération - Démonstration phpBB2
- Architecture xAMP
- Forces Très simple dinstallation et
dutilisation, Robuste - Faiblesses
- Contrôle des accès aux articles limité (pas de
possibilité daffecter des accès par groupe
dutilisateurs, en dehors de ceux prédéfinis) - Autres implémentations
- Très nombreuses, souvent incluses avec dautres
fonctionnalités de type collaboratif
Fil de discussion
Fil de discussion
Fil de discussion
Article
Réponse
Réponse
Réponse
Réponse
Réponse
Réponse
GED et Open-Source séminaires Technoforum
15
16CMS Content Management System
Journée ADBS Mardi 11 mai 2004 François Olléon
Panorama des logiciels de gestion de contenu en
Open-Source
Consultant en Systèmes dInformationfrancois_at_olle
on.com33 (0) 6 85 93 49 89
17Quest-ce quun CMS
Contribution
- Objectif principal
- Publication de contenu sur le Web
- Gestion de la création des contenus
- Gestion de la publication
- Fonctions
- Contribution
- Écriture de contenu
- Validation de contenu
- Administration
- Organisation du référentiel
- WorkFlow de validation
- Mise en page
Administration
Validation
Création
Gestion du contenu
Référentiel
Publication
Consultation
GED et Open-Source séminaires Technoforum
17
18Mon premier CMS SPIP
- Origine
- Production dun petit groupe de développeurs
ayant à créer des sites éditoriaux, dont les plus
connus sont uZine, Le Monde Diplomatique et
Vacarme - Objectif
- Permettre la gestion dun site du type Webzine
- Architecture
- xAMP (Apache mySQL PHP)
GED et Open-Source séminaires Technoforum
18
19Concepts de SPIP
- Pages, articles et brèves
- Arborescence de pages, appelées rubriques , et
sous-rubriques - Création et publication de pages dans les
rubriques et sous-rubriques - Validation des articles par une personne
différente (éventuellement) - Les articles apparaissent dans leur rubrique ou
sous-rubrique et sont signalés en page daccueil - Les brèves sont des articles qui apparaissent
uniquement dans les rubriques (pas dans les
sous-rubriques)
GED et Open-Source séminaires Technoforum
19
20Utilité de SPIP
- Gestion dun site éditorial
- Forces
- Simple à mettre en uvre, sur une architecture
quon trouve facilement chez des hébergeurs à bas
coût (attention aux limitations sur le temps de
recalcul des pages) - Utilisable dès la mise en place
- Français (avec une bonne documentation)
- Facilement adaptable pour la présentation, avec
de nombreux exemples de squelettes - Faiblesses
- Les modifications sur la présentation peuvent
être faites sans trop de difficultés, mais
au-delà (ajout dun caddy par exemple), pas
doutil
GED et Open-Source séminaires Technoforum
20
21Typo3
- Gestion dun site généraliste
- Produit dorigine suédoise (Kasper Skårhøj)
- Forces
- Un des meilleurs en architecture LAMP
- Prêt à lemploi
- Intégration dImageMagick gt manipulation
dimages - Fonctionnellement très complet (WorkFlow,
Templates, Gestion des droits, etc.) - Outil dadministration très fouillé
- Communauté très active, contributions très
nombreuses, ajouts dextensions - Tutoriel complet en français
- Faiblesses
- Dun abord nettement plus complexe que SPIP
GED et Open-Source séminaires Technoforum
21
22Lutèce
- Projet initié par la Mairie de Paris
- Création de sites portail pour les mairies
- Mise à disposition de la communauté en Open
Source en septembre 2002 - Sites exemples
- 15 mairies de Paris
- lAssociation des Collectivités Territoriales de
lEst Parisien - Société Adeuza
- Nouvelle version 2 en préparation
- Réalisation ATOS, financée par la Mairie de Paris
GED et Open-Source séminaires Technoforum
22
23Concepts de Lutèce
- Pages et rubriques
- Le site est organisé sous forme darborescence de
pages - Chaque page est composé de rubriques, logées dans
des colonnes - Chaque rubrique est dun type prédéfini
- Du HTML, des fiches ou des articles , des
fichiers à télécharger,
- Séparation de la fonction de création et de la
fonction de publication - Création de contenu
- Production de flux de fiches (données
permanentes) et flux darticles (durée de vie
limitée) - Sous la responsabilité dauteurs (utilisateurs)
faisant partie de fournisseurs appartenant Ã
des entités - Administration en ligne de la mise en page
Flux darticles
Arborescence de pages
Flux de fiches
Fichiers à télécharger
Page composée de rubriques
Mise en page
Création de contenu
GED et Open-Source séminaires Technoforum
23
24Utilité de Lutèce
- Gestion dun site éditorial orienté
collectivité - Forces
- Simple à mettre en uvre, sur une architecture
moderne (J2EE) - Utilisable dès la mise en place
- Français (avec une bonne documentation)
- Pas trop compliqué à adapter gt bonne
introduction à ce type darchitecture - Des concepts bien pensés pour
- La séparation production / publication
- Les fonctions dune collectivité (présentation
des élus, sources différentes) - Faiblesses
- Pas doutil dadministration pour définir la
structure des articles ou les champs dindexation
GED et Open-Source séminaires Technoforum
24
25Autres CMS
- Architecture LAMP
- PHP Nuke Un grand classique qui a donné lieu Ã
beaucoup de dérivés (dont PostNuke) - Midgard Attention partie administration non
open-source - EZ Publish Un des rares à permettre de créer
des types darticles - Architecture Tomcat MySQL ou Postgresql
- RedHAT CCM
- Un des plus prometteurs. Dorigine ArsDigita.
- Difficile à installer, pousse vers RedHat
Postgresql / RedHat DB ou Oracle - Architecture à framework java . Utilisation de
XSLT - OpenCMS
- Dorigine FramFab (Suède)
- Backoffice puissant
- Architecture à framework java
- Cofax
- Éprouvé, performant, simple
- Beaucoup de sites de presse américain
- www.egide.asso.fr, bureau international poids et
mesure, intranet CAMIF - Cf. le livre blanc des solutions CMS de
www.smile.fr
GED et Open-Source séminaires Technoforum
25
26Sites dinformation sur les CMS
- SSLL
- http//www.smile.fr/ société Smile
- Publie en particulier un Livre Blanc des CMS
- Travaille avec openCMS, Typo3, EZ Publish, RedHat
CCM, etc. -
- Sites dinformation
- http//www.boomtchak.net/ site français
- http//www.cmsinfo.org/ même genre en anglais
- http//www.cmswatch.com/ idem, mais plus
généraliste
GED et Open-Source séminaires Technoforum
26
27Zope, CMF, Plone , CPS
Journée ADBS Mardi 11 mai 2004 François Olléon
Panorama des logiciels de gestion de contenu en
Open-Source
Consultant en Systèmes dInformationfrancois_at_olle
on.com33 (0) 6 85 93 49 89
28En quelques mots
- Zope
- Un environnement de développement dapplications
Web - CMF (Content Management Framework)
- Un ensemble doutils construits sur Zope, offrant
les fonctions de base dun outil de gestion de
contenus Web (CMS Content Management System, ou
WCM Web Content Management) - Plone ou CPS
- Des réalisations particulières de CMS basées sur
CMF
GED et Open-Source séminaires Technoforum
28
29Quest-ce que Zope ?
- Zope est un environnement de développement pour
créer des sites Web dynamiques - Un serveur Web (peut être remplacé par Apache, MS
IIS, ou tout serveur HTTPD gérant les CGI
(Common Gateway Interface) - Une base de données objet
- Un support pour des langages de programmation
- Python, Perl
- DTML (Document Template Markup Language), propre
à Zope - Possibilité de coupler une base relationnelle Ã
la place de la base objet (Oracle, Sybase,
PostgreSQL, MySQL) - Interface Web complète (administration,
développement et utilisation)
GED et Open-Source séminaires Technoforum
29
30Quest-ce que Plone ou CPS (de Nuxeo) ?
- Fonctionnalités de base
- Système collaboratif, utilisateurs multiples
- Création et modification de contenu
- Documents, fichiers, actualités, événements
- Circuit de validation des nouveaux contenus
- Gestion de droits
- Fonctionnalités de portail (configuration de la
page daccueil)
GED et Open-Source séminaires Technoforum
30
31Forces et faiblesses
- Forces
- Concepts puissants / produits finis prêts Ã
lemploi - Existant conséquent
- Nombreuses références
- Communauté très active
- Prestataires formés
- Faiblesses
- Python
- Architecture propriétaire
GED et Open-Source séminaires Technoforum
31
32Pour en savoir plus
- Les sites
- http//www.zope.org
- http//www.plone.org
- http//cmf.zope.org
- Les ouvrages (téléchargeables dans les sites
ci-dessus) - The Zope Book , The Plone Book
- Les prestataires autour de Zope
- Nuxeo (http//www.nuxeo.com/)
- Nuxeo Collaborative Portal Server et Nuxeo
Groupware Suite - Pilot Systems (http//www.pilotsystems.net/)
- Développements autour de Plone
- Ingeniweb (http//www.ingeniweb.com/)
- Hébergement Zope et Plone
GED et Open-Source séminaires Technoforum
32
33Petit récapitulatif
GED et Open-Source séminaires Technoforum
33
GED et Open-Source séminaires Technoforum
33
34Autres outils
Journée ADBS Mardi 11 mai 2004 François Olléon
Panorama des logiciels de gestion de contenu en
Open-Source
Consultant en Systèmes dInformationfrancois_at_olle
on.com33 (0) 6 85 93 49 89
35Moteur de recherche
- Dans le cas présent, il sagit de moteurs de
recherche en texte intégral - Deux outils majeurs
- Lucene
- Environnement Jakarta
- Binaire java portable (unix, windows)
- Ht//dig
- Disponible en code source
- Fonctionne sur Linux ou Windows/cygwin
GED et Open-Source séminaires Technoforum
35
36Portail
- Vision fonctionnelle du portail
- Regrouper / Donner accès à / un ensemble
dinformations ou doutils dans un minimum
despace - Version simple, de type annuaire
- Assembler un ensemble de liens vers dautres
sources dinformations en relation avec le sujet
du portail - Version plus complète
- Technologie permettant dassembler des
applications différentes dans une seule fenêtre - Notion de portlet
- Syndication de contenu (fil dagence)
- La référence Open-Source jetspeed
(jakarta.apache.org/jetspeed)
GED et Open-Source séminaires Technoforum
36
37WorkFlow
- Ce qui existe
- Moteurs inclus dans des outils de CMS
- Modèle peu puissant, limité à un cycle de
validation, en général linéaire - Pas dinterface graphique permettant de définir
les cartes de routage - Des moteurs en kit
- jBPM (1.0b5) (jbpm.org)
- Le plus abouti actuellement
- Architecture jboss
- Pas dinterface graphique de construction
- WF générique, pas spécialement couplé à de la GED
- OpenWFE (0.5.0)
- Bossa Workflow (0.4.1) Moteur java approche
réseaux de Petri - Java Graphical Process Designer
- Une interface possible pour la partie designe de
OpenWFE - Wftk actuellement peu actif
- En conclusion Bof
GED et Open-Source séminaires Technoforum
37
38Système intégré de gestion de bibliothèque (SIGB)
- Gestion dune bibliothèque ou centre de
documentation - Gestion dun catalogue, accessible en ligne
(OPAC) - Gestion des fonctions de bibliothéconomie
Acquisition, prêt, bulletinage, etc. - Deux catégories dutilisateurs
- Postes professionnels ou internes
- Postes des usagers , éventuellement
accessibles en Internet (réservations) - Un produit se distingue Koha (www.koha-fr.org)
- Licence GPL, développé à lorigine en
Nouvelle-Zélande par le Horowhenua Library Trust
et Katipo Communications Ltd - Catalogue en format MARC (UNIMARC et MARC21)
- Serveur et client Z39-50, Architecture LAMP
(perl) - Pour linstant, installation facile sur Linux et
ardue sur Windows - Références France ESIEE, Abbaye des Dombes,
Ecole des Mines Paris - Voir phpmylibrary.sourceforge.net Architecture
xAMP (PHP)
GED et Open-Source séminaires Technoforum
38
39Gestion darchives
- En fait, plusieurs possibilités
- Une gestion intégrée darchives
- Exemple en propriétaire ES-Archives, Thot,
Damaris-Archives, Amig, etc. - Pas dOpen Source (amc)
- Une gestion dinstruments de recherche
- Outils de description de fonds darchives,
essentiellement dans le domaine du patrimoine - SDX / PLEADES / NAVIMAGES
- SDX et al.
- Initiative du ministère de la Culture et des 2
sociétés AJLSM et Anaphore - Outil dindexation et de recherche sur des
fichiers XML Extraction des champs et
indexation par Lucène - PLEADES application pour les archives
Fichiers XML selon DTD propres au monde des
archives, DTD EAD (Encoded Archival Description) - Navimages complément pour laffichage des
documents numérisés Va sortir prochainement
GED et Open-Source séminaires Technoforum
39
40Et la GED classique ? (1)
- Que faut-il entendre par GED classique? Beaucoup
de choses - Gestion de grandes masses de documents dans un
contexte capture / stockage / recherche ou
circulation (à la FileNet) - Rien de satisfaisant immédiatement, trop loin des
CMS - Ce qui manque
- Gestion de grands volumes de documents (pose des
problèmes de gestion des surfaces de stockage, du
stockage sur optique, du stockage hiérarchique) - Gestion de fiches dindexation suffisamment riche
(sans tomber dans le catalogage MARC) - Workflow digne de ce nom
- Gestion des matériels, en particulier des
scanners et des juke-boxes optiques - Gestion de centres de numérisation (workflow, OCR
et cie)
GED et Open-Source séminaires Technoforum
40
41Et la GED classique ? (2)
- Gestion de grandes masses de documents dans un
contexte cycle de vie (à la Documentum) - Rien de satisfaisant immédiatement, mais les CMS
donnent plus de réponses - Ce qui manque
- Workflow pas assez puissant
- Gestion des versions
- Check-in check-out
- Gestion de grands volumes de documents
- Gestion de fiches dindexation suffisamment riche
(sans tomber dans le catalogage MARC)
GED et Open-Source séminaires Technoforum
41