Title: Les Archives Ouvertes
1Les Archives Ouvertes
- Définitions, historique et principales
initiatives internationales - Christine.Aubry_at_msh-alpes.prd.fr - MSH-Alpes
- Joanna.Janik_at_imag.fr - IMAG
- Journée Archives Ouvertes URFIST de Bordeaux,
31 mars 2005
2- 1. Archives ouvertes contexte historique
- 2. Les aspects techniques du protocole OAI-PMH
- 3. Des serveurs de publications électroniques aux
archives institutionnelles et grands portails
3- Archives ouvertes
- contexte historique
4Convergence de plusieurs facteurs
- Un contexte technologique
- Le Web et son architecture
- Un contexte économique
- Le mouvement des Bibliothèques américaines
- Explosion des coûts des abonnements
- Licences et consortiums
- Les chercheurs se sentent prisonniers de leurs
éditeurs - Un contexte socio-économique l ère du partage
des connaissances - Renforcement de ce mouvement aujourdhui dans le
contexte du mouvement alter-mondialiste
5Une réalité
- Les institutions publiques financent
- Les recherches (salaires, équipements,
fonctionnement) - La publication des résultats de la recherche
- L accès aux résultats publiés
- Mais de plus
- Les institutions sont responsables de la qualité
et de la diffusion des connaissances - L évaluation se fait très souvent par des
comités de lecture des revues
6Les enjeux
- Le Libre accès permet
- Un accès ouvert et simplifié
- Des recherches croisées
- interopérabilité des archives
- développement de services associés
- Le Libre accès augmente limpact scientifique
- Limpact scientifique fait avancer le progrès
scientifique - Il contribue au prestige des institutions de
recherche - Il génère les subventions de la recherche
- Il fait avancer la carrière du chercheur
- Le Libre accès est essentiel pour les pays en
voie de développement
7 Les textes fondateurs du Libre accès
- La pétition PLoS (début 2001)
- L Initiative de Budapest pour l Accès Ouvert
(BOAI) (février 2002) - Le Libre accès aux résultats de la recherche
devient un postulat - Le Libre accès est possible par deux voies BOAI1
et BOAI2 - 1) Les Archives Ouvertes développement de
bases de pré-print avec auto-archivage et
enrichissement des articles publiés - 2) Les revues en Libre accès développement de
nouveaux modèles de revues électroniques
gratuites (revue.org)
8Les premiers acteurs
- Des initiatives isolées (1990)
- Paul Ginsparg à Los Alamos - ArXiv
- Stevan Harnad à l université de Southampton -
Cogprints - Jean Claude Guedon
- Peter Suber (SPARC Open Access Newsletter)
- LAssociation of Research Libraries (ARL) crée
Scholarly Publishing and Academic Resources
Coalition (SPARC) 1998
9Les textes fondateurs
- La Déclaration de Bethesda pour l édition en
Libre accès (avril 2003) - La Déclaration de Berlin (octobre 2003)
- La Déclaration de principes au SMSI (décembre
2003) - L IFLA 5 décembre 2003
- LOCDE (janvier 2004)
10Les freins
- Prépublications postpublications publications
électroniques - Évaluation vers de nouveaux modes dévaluation?
- Visibilité (site personnel)
- Questions juridiques
- Saisie
11 Définition dune publication en Libre Accès
- Le Libre accès concerne les publications des
chercheurs - déposées sur un serveur (auto-archivage)
- publiées dans des revues en libre accès
- Deux conditions
- les auteurs donnent un droit d accès gratuit
- le document est déposé sous forme électronique
dans une archive (Eprints ou E-publications) dès
sa publication - Déclaration de Bethesda avril 2003
12Typologie des acteurs
- Les communautés scientifiques (chercheurs)
- Les bibliothèques / documentalistes
- Les institutions de recherche
- Les fondations scientifiques (National Institute
of Health) - Les universités
- Les éditeurs
- Le politique
13Typologie des archives
- Archives institutionnelles
- Archives disciplinaires
- Archives thématiques
14Les moissonneurs
- Moissonnage des métadonnées sur
- un entrepôt, en local
- les entrepôts déclarés
- Réutilisation des métadonnées
- par l utilisateur final
- par les portails thématiques
15Type de documents mis en archive
- Articles scientifiques (pré et post-publications)
- Actes de congrès
- Thèses
- Notices bibliographiques
- Rapports - Cours - Posters
- Monographies - Chapitres de monographies
- Articles de journaux
- Documents numérisés
- Descriptions de projets, etc.
- Mais aussi tous types d objet image, son...
16- Les aspects techniques du protocole OAI-PMH
17Protocole OAI-PMH
- LOAI-PMH est née en 1999
- LOAI définit des normes déchanges de
métadonnées (OAI-PMH) pour que les archives
soient interopérables, cest-à-dire pour que
les métadonnées puissent être récoltées et
interrogées en une seule requête comme si les
archives nen faisaient quune. - mai 2003 90 serveurs OAI (fournisseurs de
données) - septembre 2003 118 serveurs OAI
- mars 2005 749 serveurs OAI
- http//gita.grainger.uiuc.edu/registry/searchform.
asp
18Le protocole OAI-PMHobjectifs
- faciliter léchange de données entre
- des fournisseurs de données (pe. des
bibliothèques ou des musées...) - un fournisseur de service (une bibliothèque, un
centre de documentation, un portail thématique ou
local désirant rassembler des données) - créer, alimenter et tenir à jour des réservoirs
denregistrements - qui signalent, décrivent et rendent accessibles
des documents, sans les dupliquer ni modifier
leur localisation dorigine - faire communiquer entre elles des bases de
données diverses et hétérogènes - réaliser des partenariats entre plusieurs
établissements que rapprochent leurs collections
(complémentarité des fonds) ou leurs publics
(services culturels dune même collectivité)
19Le protocole OAI-PMHLes acteurs
- le fournisseur de données
- archive
- entrepôt modèle partagé et modèle réservé
- le fournisseur de services
- l agrégateur rassemble des données collectées
par un moissonneur. - le moissonneur pose des requêtes XML aux
entrepôts via le protocole HTTP, pour extraire
les enregistrements des items - lutilisateur final
- interroge uniquement le réservoir de notices du
fournisseur de service - sélectionne les notices pertinentes
- active le lien hypertexte vers le document
primaire sur le serveur du fournisseur de données
20services
Entrepôt
Fournisseur(s) de services
metada
Services provider
Moissonneur
Harvester
HTTP//
client
serveur
Fournisseur(s) de données
Repositories
Entrepôt(s)
Archive(s)
21metadata
record(s)
metadata
metadata
- format XML,
- différents schéma de données (DC, EAD, etc.),
- flux de données,
- ensemble (set),
- date format UTC
Id.
item
- génération dynamique ou statique des méta,
- identifiant unique (syntaxe URI),
ressource
- interne/externe,
- numérique/analogique.
22Terminologie
- la ressource le document-objet décrit, réel
- la fiche ou la notice informatique (item)
décrivant cet objet (ex. une notice
bibliographique en format UNIMARC) - lidentifiant unique, construit selon les
recommandations de lOpen Archive Initiative,
attribué à la notice de métadonnées dans la base
qui le contient - lenregistrement (record) ensemble de
métadonnées extraites dune notice dans un format
XML, et qui fait lobjet de léchange entre
lentrepôt et le moissonneur (ex. la
description du livre en format BiblioML) il y a
autant denregistrements possibles par item que
de formats dans lesquels lentrepôt est
moissonnable - les lots chacun des items peut relever dun ou
de plusieurs ensembles ou lots (sets), définis
par le producteur de lentrepôt
23Les métadonnées
- gérer les ressources (date de dernière
modification, document en consultation) - documenter les ressources (titre, sujet,
description) - retrouver les ressources (mot-clef, date, titre
) - préserver les ressources et leur contexte ou
documentation (stockage, modules nécessaires à la
lecture) - définir les droits et conditions dutilisation
des ressources (détenteur des droits,
permissions dutilisation ) - décrire la structure des ressources (nombre de
chapitres de louvrage )
24Les métadonnées (suite)
- Le Dublin Core non qualifié comporte 15 éléments
Contenu Propriété intellectuelle Instanciation
- Couverture COVERAGE
- Description DESCRIPTION
- Type TYPE
- Relation RELATION
- Source SOURCE
- Titre TITLE
- Sujet SUBJECT
- Droits RIGHTS
- Contributeur CONTRIBUTOR
- Editeur PUBLISHER
- Créateur CREATOR
- Langue LANGUAGE
- Identifiant IDENTIFIER
- Format FORMAT
- Date DATE
25Les outils et les services
- Des logiciels (libres) de saisie
- Eprints.org , CDSWare, DSpace, Archimède
- Liste de logiciels maintenue par l'OAF
http//www.oaforum.org/oaf_db/list_db/list_softwar
e.php - Des moteurs de recherche spécifiques
- OAIster http//oaister.umdl.umich.edu/
- ARC, Citebase Search, Scirus
- Des outils de bibliométrie et de scientométrie
- Citebase http//citebase.eprints.org/
26LOAI-PMH et la norme Z39-50
- la norme dinterrogation Z39-50
- Recherche multibases
- Affichage des réponses en temps réel
- Lourd à mettre en uvre
- Temps de réponse longs
- le protocole OAI-PMH
- Recherche par agrégation des métadonnées
- Affichage figé des données collectées après
passage du moissonneur
27HAL-imag
28Dspace-MSH
29- Des serveurs de publications électroniques
- ...aux archives institutionnelles
30Les premières Archives disciplinaires
- ArXiv en physique des hautes énergies
- PubMed (Ebiomed)
- Cogprints en sciences cognitives et neurosciences
- http//cogprints.ecs.soton.ac.uk/
- Repec en économie
- http//repec.org/
- Math-Net en mathématiques
- ADS (the Nasa Astrophysics Data System)
31Évolution des types darchives
- 1991 à 1998 Serveurs par disciplines
-
- 1999 Des modèles nationaux ou internationaux
- PubMed Central (USA) et E-Biosci (Europe)
- SciELo (Amérique latine)
- 2000 Les serveurs dinstituts de recherche
européens CCSD et ZIM - 2001 Les serveurs universitaires ou
institutionnels grâce à lOAI - Les portails et les bases thématiques
internationales
32Les archives institutionnelles
- Caltech Library System Papers and Publications
(California Institute of Technology) - http//caltechlib.library.caltech.edu/
- Scielo Scientific Library Online
http//www.scielo.org/index.php?langen - Rassemble différents pays dAmérique latine et
lEspagne - Initiative des années 1998 (avant
lOAI) - Les périodiques ont été mis en libre accès
(documents anglais, espagnols, portugais) - The Australian National University
- http//eprints.anu.edu.au/
- archives universitaires nationales créés en 2001
(2 250 documents)
33En Europe La force des universités anglaises
- un soutien financier (JISC) pour des projets
inter-universités - programme FAIR 14 projets (TARDis, E-Prints UK,
projet Romeo, SHERPA) - Department of Electronics and Computer Science à
lUniversité de Southampton - http//eprints.ecs.soton.ac.uk/
- St Andrews Eprints (UK)
- http//eprints.st-andrews.ac.uk/
- nouvelle méthode dévaluation des chercheurs -
une incitation dans les universités - http//www.ariadne.ac.uk/issue35/harnad/
34Les Archives dans d autres pays d Europe
- LU research - Université de Lund (Suède)
http//eprints.lub.lu.se/ - Dare (Pays Bas) 13 universités dont
l université dUtrecht http//www.darenet.nl/ - CERN (Suisse) CDSWare http//cdsware.cern.ch/
- Institut Max Planck - luniversité von Humboldt
de Berlin (Allemagne) - Organic Eprint (Danemark) http//orgprints.org/
- Archive thématique, créée fin 2002 par le Danish
Research Centre for Organic Farming à
Vocation internationale pour les publications
de recherche en agriculture
35En France
- Tous les organismes de recherche se sont engagés
dans le processus - INRA
- Publications des chercheurs du département de
Physiologie Animale - INRA http//phy043.tours.in
ra.fr8080/ - INSERM
- CNRS CCSD http//ccsd.cnrs.fr
- Universités
- Lille 1 http//bibliothèques.univ-lille1.fr/gris
emine
36En France (suite)
- Archives de thèses
- Pastel (ParisTech) Thèses des grandes écoles
dingénieurs - TEL (CCSD), Cyberthèses (Lyon2) CITHER (INSA
Lyon) - Les autres archives de publications scientifiques
ont toutes démarré en 2002 - Institut Jean Nicod
- ArchiveSic
- Physiologie Animale (INRA Tours)
37Vers les archives institutionnelles
- la Déclaration de Berlin octobre 2003 - signée
par les 4 organismes CNRS, lInserm, lINRA et
lINRIA - Berlin 3 conférence de Southampton
- 28 février - 1er mars 2005
- "Laccès à linformation scientifique est un
enjeu vital pour le chercheur et pour la société
dans son ensemble". - Les quatre établissements publics de recherche
présentent leur politique en faveur du libre
accès avec la création darchives
institutionnelles - Communiqué de presse du CNRS 22 mars 2005
http//www2.cnrs.fr/presse/communique/640.htm
38Les grands projets archives et portails en
France
- Gallica BNF
- http//oai.bnf.fr/oai2
- BNSA (Banque Numérique du Savoir Acquitaine)
http//bnsa.aquitaine.fr/ - IRCAM
- Portail SUDOC
39Le rôle des grandes Bibliothèques américaines
- DLF (Digital Library Federation)
- http//www.diglib.org/
- Modifications du protocole OAI-PMH pour une
meilleure utilisation dans le secteur des
bibliothèques - Découvrir le Web caché
- MetaArchives Université Emory
- Digital Gateway to cultural heritage Université
dIllinois - OAIster Université du Michigan
- http//www.oaister.org/
40 Exemples de grands projets documentaires
- OLAC (Open Language Archives Community)
- Sheet Music Consortium
- Projet Picture Australia
- http//www.pictureaustralia.org
- Bases de publications électroniques et
ressources pédagogiques - Format spécifiques de métadonnées
41Exemples de grands projets documentaires (suite)
- Projet européen TEL (The European Library)
- http//www.europeanlibrary.org/
- NSDL (National Science Digital Library)
- http//nsdl.org
- Portail de lIMLS (Institute for Museum and
Library services) - http//imlsdcc.grainger.uiuc.edu
42 Réflexions sur lenvironnement de linformation
de demain (Europe)
- Projet OAForum financé par la Commission
Européenne - http//www.oaforum.org
- DELOS réseau dexcellence européen
- http//www.delos.info
- JISC (Joint Information Systems Comitee)
- http//www.jisc.ac.uk
43 Les compétences pour le développement de ces
archives
- techniques (gestion de l'archive, des logiciels
associés, des ordinateurs et connectivité
internationale) - organisation des documents de l'archive,
définition des métadonnées - évaluation scientifique pour les classements des
documents - promotion de l'archive et suivi des usages
44Conclusion
- Pour mettre en place une archive
- http//www.culture.gouv.fr/culture/dll/OAI-PMH.ht
m - Pour sinformer
- http//www.inist.fr/openaccess/
- http//www.tours.inra.fr/prc/internet/documentatio
n/communication_scientifique/archives