Title: Ecole nationale des chartesYann NICOLAS (ABES)
1Calames
- Histoire naturelle, anatomie et dissection
2Calames et lABES
- Calames Catalogue en ligne des archives et des
manuscrits de lenseignement supérieur - ABES Agence bibliographique de lenseignement
supérieur - Sudoc (monographies, périodiques) ? PeB
- Calames (manuscrits, archives)
- Star (workflow des thèses électroniques)
- Groupement de commandes pour la doc. élec.
3Plan
- Genèse de Calames
- Anatomie de Calames
- Dissection de Calames
4Genèse de Calames
52. Genèse de Calames
- a. La naissance du projet
6Les 2 faces de Calames
- une interface de consultation et de recherche
(ouverte depuis le 1er décembre 2007) - un outil de catalogage (rodage à partir davril
2008, avec 9 établissements)
7Périmètre de Calames (1) Quels documents ?
- ? Manuscrits et archives
- diversité
- ms. médiévaux, papiers de chercheurs ou
d'érudits, ms. littéraires contemporains,
archives audiovisuelles, - quelles limites ?
8Périmètre de Calames (2)Quels établissements ?
- Etablissements denseignement supérieur
- en majorité des bibliothèques
- mais les bibliothèques ne sont pas les seuls
partenaires - ? Calames, c'est aussi un réseau
9Calames pourquoi ?
- Fonds de manuscrits peu décrits
- au mieux en format MARC dans les catalogues de
bibliothèques - format peu adapté à la structure des données,
recherche parfois difficile, mais au moins
disponible en ligne - beaucoup dinventaires manuscrits,
dactylographiés ou imprimés consultables sur
place - encore beaucoup de fonds tout juste inventoriés,
et à peine accessibles
10Une opportunité le CGM
- Projet dinformatisation du Catalogue général des
manuscrits des bibliothèques publiques de France - 116 volumes, 182 000 notices, publiés entre 1849
et 1993 - tous types de bibliothèques publiques
municipales, universitaires, sociétés savantes,
ministères, BN (Arsenal)
11Le projet CGM
- Projet interministériel (Culture Ens. Sup.)
lancé en 2001 - Choix d'une structure XML DTD EAD (Encoded
Archival Description) - Accès commun par le CCFr
- mais chacun disposera de ses données
- (pour l'Ens. Sup. lABES chaque
bibliothèque)
12Palme
- Répertoire de manuscrits littéraires français
contemporains - constitué entre 1995 et 2006
- dans toutes sortes de bibliothèques françaises
- hébergé dans BN-Opaline jusquen juin 2007
- données converties en EAD
13CGM PalmeDeux opportunités pour mener une
politique des manuscrits globale, dans le
périmètre Ens. Sup. ? autour du réseau et des
outils Calames
14Politique Ens. Sup.
- Catalogage centralisé en ligne
- Sécurité
- Cohérence
- Esprit réseau
- Simplicité
- Hors Sudoc
- Fonctionnalités avancées
- Catalogue collectif en ligne, mais
- Exports vers les outils locaux (Pléade)
- Vues locales et customisées sur le catalogue
- Données réutilisables (SRU, RDF)
152. Genèse de Calames
- b. La déroulement du projet
16Le projet Calames quand ?
- Conception mars décembre 2006
- Développements janvier juillet 2007
- Tests et ajustements juillet novembre 2007
- Chargement des données EAD octobre 2007
février 2008 - Lancement de Calames (interface publique) 1er
décembre 2007 - Ouverture de linterface de catalogage avril
2008
17Les contraintes du projet
- Les délais 18 mois
- La masse des données
- La structure des données EAD
- Les performances
- Lextensibilité
- Ouverture (recherche fédérée SRU, moteurs)
18Les contraintes du projet (suite)
- Les exports en UNIMARC
- La gestion des autorités
19La solution retenue
- Développer à partir de solutions XML génériques
- Une base de données mixte (XML relationnel)
- Un éditeur XML générique et accessible par un
navigateur
20Qui a travaillé sur les outils ?
- Choix de développer des outils en interne
- 2 informaticiens (conception développement)
- 2 bibliothécaires
- Appel à un graphiste professionnel
- Appui sur le groupe de travail ES de la
rétroconversion
21Le groupe de travail
- composition SDBIS, bibliothèques avec de riches
fonds de manuscrits, dont des experts et
formateurs EAD - Jacqueline Artier (Sorbonne), Pascale Heurtel
(Museum), Patrick Latour (Mazarine), Gérard
Littler (BNUS), Max Naudi (SDBIS), Fabienne
Queyroux (Institut), Nathalie Rollet (BSG),
Mireille Vial (BIU Montpellier) - travail concomitant sur la préparation des
données et sur les développements des outils ?
avantages et inconvénients
22Relations ABES / Groupe de travail
- Forte interaction
- Itérations spécifications/développements
- ABES, force de proposition (scénarios,
prototypes, maquettes) - ? Pas du développement agile , mais ça y
ressemble
232. Anatomie
24Questions clés
- Comment stocker la structure XML EAD ?
- Comment lindexer ?
- Comment y accéder ?
- Comment lafficher
252 méthodes
- Le fichier EAD en tant quinstance XML
- Le fichier EAD en tant que base de données
- ? Calames utilise les deux méthodes
26Méthode 1 EAD en tant que XML
- Exploiter le fichier tel quel
- On garde toutes la richesse des données
- On utilise des outils standard
- XQuery pour interroger
- XQuery update (en développement au W3C)
- Méthode utilisée pour le catalogage dans Calames
- XML-DML (Microsoft) en attendant XQuery update
27Méthode 1 EAD en tant que XML
- Le fichier EAD est stocké et mis en mémoire comme
un tout - Dans linterface de catalogage, il est affiché et
modifié bloc par bloc - Démo Calames Catalogage
- Souplesse maximale
28Méthode 1 EAD en tant que XML
- Pourquoi ne pas utiliser encore cette méthode
pour la recherche et la consultation ? - problèmes de performance
- problèmes de la recherche Full Text
- ? Le tout XML nest pas encore prêt
29Méthode 2 EAD en tant que base de données
- Traduire la structure EAD en base de données
relationnelles - Pour
- Technologie éprouvée et performante
- La régularité de lEAD sy prête assez bien
- Contre
- Trop rigide
- Comment gérer le contenu mixte ?
- ltunittitlegtPapiers de ltpersnamegtUntellt/persnamegtlt/
unittitlegt
30Méthode 2 EAD en tant que base de données
- Compromis dans Calames
- Découper EAD en ltcgt liés
- Chaque ltcgt est stocké en tant quinstance XML
- Le meilleur du relationnel et le meilleur dXML
31De la base à la page Web
- La base renvoie directement de lXML
- qui est exploitable dans le navigateur
32Interface AJAX
- AJAX Asynchronous JavaScript and XML
- Modifier une page Web de manière partielle, en
allant chercher certaines infos XML (ou JSON) sur
le serveur. - ? Permet une interface plus réactive
33Interface AJAX
- Le serveur envoie de lXML
- Cest le navigateur (client) qui est en charge de
construire lHTML - Avec Javascript
- Avec XSLT
- ? le serveur est soulagé
- ? performances améliorées
34AJAXinconvénients et solutions
- Interfaces non accessibles
- par les handicapés visuels
- par les moteurs de recherche (robots)
- ? Proposer une version dégradée du site en pur
HTML (ex Gmail)
353. Dissection
36Méthode de dissection
- Scalpel Firebug (plugin Firefox)
- Observer le code (html, javascript, css, xslt)
- Observer les requêtes AJAX
- Observer les flux de données
372. Dissection de Calames
38Anatomie gt la recherche (1)
- Recherche simple par défaut
- Combinable avec recherche avancée
- Filtrage sur bibliothèque(s)
- ? Apparition du champ Cote
- Accès direct à chaque bibliothèque
- Feuilletage des index
39Anatomie gt la recherche (2)
- Chargement initial de données
- Liste des bibliothèques (XML)
- Liste des langues (XML)
- Décodage des bibliothèques (JSON)
- Décodage des langues (JSON)
- Chargement initial de lXSLT
40Anatomie gt la recherche (3)
- Feuilletage des index
- Listes dynamiques en fonction de la bibliothèque
- Autocomplétion (search as you type)
- Exploitation des renvois des autorités Sudoc
412. Dissection de Calames
42Anatomie gt les résultats (1)
- Une liste de résultats (1000 max)
- Une URL réutilisable
- Liste filtrée (traitements côté serveur)
- 50 résultats par page (car rapide)
- Tris
- Facettes
43Anatomie gt les résultats (2)
- Traitements sur la liste brute infanticide
- Si un lot de résultats contient un ltcgt parent et
un de ses ltcgt enfants, on supprime lenfant. - Moins de résultats
- Moins de redondances
- Compense lhéritage (des dates, langues,
sujets) - La navigation permet de retrouver lenfant
disparu
44Anatomie gt les résultats (3)
- Facettes
- Filtres a posteriori (non a priori)
- Évitent de reformuler la recherche
- Raffiner pas à pas la recherche
- Hélas, pas de mention du nombre doccurrences
(prix à payer pour infanticide)
452. Dissection de Calames
- c. Laffichage des notices
46Anatomie gt les notices et leur contexte (1)
- Zoomer sur un composant ltcgt
- Pouvoir se déplacer autour
- Les ancêtres
- Les enfants
- Les frères (avant et après)
- Pouvoir afficher plusieurs niveaux dans la même
page - Avoir une vue moins parcellaire
- Affichage et impression à la carte
47Anatomie gt larborescence
- Obtenir une vue plus large sur larborescence
globale - Enjeu comment se promener dans des arbres
composés de milliers ditems ?
48Anatomie gt les nuages
- Vue globale sur un corpus
49Anatomie gt Liens sortants
- Lier vers des images, des transcriptions, des
bibliographies - Lier sans vampiriser
- Lier sans saisir toutes les URL
- http//elec.enc.sorbonne.fr/miroir/donat/traductio
n/?paraparis2 ?
50Anatomie gt Liens entrants
- Aujourdhui URL stables et propres
- Demain URL pérennes
- Dilemme pérennité / usabilité
- Sur quoi construire lURL pérenne ?
- La cote ?
- ? Réflexion en cours
51pour en savoir plus...
- Calames
- http//www.calames.abes.fr
- Site de lABES http//www.abes.fr/abes/page,580,m
anuscrits.html - Arabesques n 48 et n 49
- http//www.abes.fr/abes/page,386,arabesques.html
- Calames, le blog
- http//calames.wordpress.com/
- Nous écrire
- manuscrits_at_abes.fr
52Crédits photos
- http//flickr.com/photos/54945394_at_N00/1338967778/
- http//flickr.com/photos/drlopezfranco/1447712697/
- http//flickr.com/photos/patrlynch/450129440/