Title: HAL
1 Le CCSD construit HAL, une archive ouverte
internationale et multi disciplinaire
daniel.charnay_at_ccsd.cnrs.fr
2Limpact du Web sur lédition scientifique
- Visibilité et accessibilité
- Limpact dune publication est accru de manière
substantielle si celle-ci est accessible
librement sur le Web On line or invisible ?
S. Lawrence, NEC Research Institute - Dans les domaines de mathématiques (Odlyzko A.,
2001), astrophysique (Kurtz MJ, 2003), physique,
avec un échantillonnage de 14 millions darticles
de la BdD ISI sur 10 ans, le taux de citation est
2.5 à 5 fois supérieur pour les articles en libre
accès (S. Harnad, 2004) - Depuis fin novembre 2004, on peut consulter
http//scholar.google.com qui indexe les
articles en ligne et traite toutes leurs
références
3Limpact du Web sur lédition scientifique
- Pérennité
- Différentes études sur les liens figurant en
notes de bas de page et références des
publications révèlent une inquiétante
dégénérescence avec le temps - 3,8 des liens cités dans les articles de 3
journaux scientifiques (Nature, Science et The
New England Journal of Medecine) sont
inaccessibles 3 mois après leur publication ce
taux monte à 10 après 15 mois, 13 après 27 mois
- 40 des liens référencés par les articles de
deux journaux informatiques sont inaccessibles 4
ans après la publication - Je pense à lincendie de la bibliothèque
dAlexandrie - Robert Delavalle, physicien à
luniversité du Colorado
4Un mouvement mondial en faveur du libre accès
- Au-delà des accords de Budapest (2002), Bethesda
et Berlin (2003) - 25 prix Nobel soutiennent le Libre Accès (lettre
ouverte au congrès, septembre 2004) - En France
- LAcadémie des Sciences, lINRIA, lINSERM, le CA
de lANR, le CNRS (lettre du DG prévue pour
juillet 2006), recommandent le dépôt en archives
ouvertes - Signature imminente de laccord
inter-établissements - CEMAGREF, CIRAD, CNRS, CPU, INRA, INRIA, INSERM,
Institut PASTEUR, IRD, Conférence des Grandes
Ecoles
5Phrases clés, mots clés
- Libre accès aux résultats de la recherche
- Réappropriation de la communication scientifique
par les scientifiques - Revendication humaniste le libre accès à la
connaissance, gratuité, accessibilité - Revendication pragmatique les budgets
documentaires des organismes narrivent plus à
suivre les tarifs des éditeurs - Emergence de nouveaux modèles économiques de
lédition scientifique - Découplage des différentes fonctions du processus
traditionnel de publication - évaluation archivage diffusion
enregistrement labellisation - Communication scientifique directe (CSD)
- Un circuit court et rapide entre les chercheurs
pour faire connaître leur résultats (et prendre
date pour leur recherche) - Auto archivage
- Les chercheurs déposent eux-mêmes leurs articles
sur des bases ouvertes - Interopérabilité
- On met en œuvre des moyens pour favoriser
linterconnexion des bases darticles
scientifiques - Archivage à long terme
6HAL, la mission du CCSD
- Une initiative pour des archives scientifiques
multidisciplinaires - Une approche internationale
- Ne construire ni une archive nationale, ni une
archive institutionnelle mais sintégrer dans le
mouvement open archives - Une approche essentiellement chercheur
- Des archives alimentées directement par les
chercheurs avec, comme vocation première, la
réalisation dun outil scientifique offrant
laccès au texte intégral du document - Un outil institutionnel indirect grâce à la
collecte de méta données suffisantes (association
auteur -gt laboratoires -gt institutions) - Résolution des problèmes darchivage à long terme
7ArXiv, un modèle en physique et mathématiques
depuis plus de 10 ans
- Initiative de Paul Ginsparg à Los Alamos (xxx)
- 4 000 manuscrits déposés par mois
- 500 000 manuscrits déposés à ce jour
- 300 000 consultations journalières
- Des sites miroirs dans le monde entier
Australie, Brésil, Chine, Allemagne, Inde,
Israël Italie, Japon, Russie, Afrique du Sud,
France Corée du Sud, Espagne, Taiwan, Angleterre,
8HAL, les raisons dune centralisation
- Garantir laccessibilité au texte intégral
- Préserver un niveau scientifique homogène et de
qualité - Offrir une meilleure visibilité à linternational
- Fournir des URL pérennes
- Permettre lindexation global du texte intégral
contenu dans la base - Horodater les dépôts
- Interconnecter avec les bases mondiales de
référence - Enrichir automatiquement les référentiels
institutionnels - Limiter la saisie des références
- Centraliser les alertes du lecteur
- Gérer larchivage à long terme
- Et limiter leffort à une seule unité
spécialisée
9Politique des éditeurs
- Les éditeurs, sont de plus en plus nombreux à
revoir leur politique de publication et les
contrats de transfert de droits dexploitation
associés. - Depuis mai 2004 Elsevier
- An author may post his version of the final
paper on his personal web site and on his
institutions web site (including his
institutional repository). Each posting should
include the articles citation and link to the
journal homepage (or the article DOI). The author
does not need our permission to do this, but any
other posting (e.g to a repository elsewhere)
would require our permission. By his version we
are referring to his word or tex file, not a pdf
or HTML download from science direct, but the
author can update his version to reflect changes
made during the refereeing and editing process.
- K. Hunter senior vice president strategy
Elsevier, may 2004
10Larchive ouverte HAL
- Développée entièrement par le CCSD
- Partenariat avec lINRIA
- Technologies libres
- LAMP (Linux, Apache, MySQL, PHP)
- Environnement sécurisé (hébergé par le Centre de
Calcul de lIN2P3)
11HAL
- Usages
- Pré publications, Post publications, notices
bibliographiques o(( - Typologie des notices bibliographiques
- Publications dans des revues à comité de lecture
- Conférences invitées dans des congrès
- Proceedings à comité de lecture
- Publications dans des revues sans comité
- Communications à des congrès, symposium
- Séminaires, workshops
- Chapitres dans les ouvrages
- Livres et ouvrages
- Brevets
- Thèses
12HAL, usages
- Scénario
- Le chercheur dépose sa pré publication dans
larchive - Des retours rapides de sa communauté scientifique
vont peut être initier de sa part le dépôt dune
nouvelle version - Cest presque avec lassentiment de sa
communauté quil dépose sa pré publication
chez un éditeur - Larticle est publié, le chercheur met à jour les
références bibliographique dans la base,
larticle devient une post publication - Le chercheur souhaite faire de nouvelles mise à
jour de cet article ? Il en dépose une
nouvelle version ! - Le cycle de vie dun article va donc au-delà de
sa publication dans une revue e-publication ?
Les archives ouvertes bouleversent la publication
post publications et pré publications
deviennent des notions obsolètes !
13Déposer dans HAL
- Modalités de dépôt
- Identification simplifiée
- Compte auto validé (possibilité
dauthentification institutionnelle) - Contributeurs auteurs, documentalistes,
éditeurs scientifiques, etc. - Niveau scientifique requis
- Tout article qui, soumis à une revue à comité
de lecture, serait envoyé à un rapporteur - Vérification avant mise en ligne
- Vérification technique
- Validation scientifique sommaire par domaine ou
par portail de dépôt - Format des documents libre
- Format visualisable obligatoire (PDF, PS)
- Fichiers sources recommandés
- Dépôt sans retrait
- Possibilité de déposer des nouvelles versions
- Lensemble des versions est accessible par
linternaute
14Interopérabilité, interconnexions, imports/exports
- OAI-PMH
- multi formats dont OAI_DC (Dublin core non
qualifié) - REDIF
- pour le moissonnage par RePeC (économistes)
- RSS
- Connexions
- arXiv dans les domaines de physique et
mathématiques (biologie), uniquement de HAL vers
arXiv - Pubmed (HAL-INSERM)
- Depuis février 2006 facilité dimport de la
notice depuis Pubmed - Transfert vers Pubmed Central en cours détude
- Imports
- Fichiers XML, méta données et texte intégral (Web
services courant 2006) - Exports
- Listes selon critères de recherches dans tous les
formats informatiques usuels - Home page chercheur
- Exports institutionnels (Crac, Labintel, etc.)
- Web services
15Structure de HAL
16générique
typologique
institutionnel
EXPORTS IMPORTS XML, WS
haL
Texte intégral
Notice bibliographique
17générique
institutionnel
typologique
EXPORTS IMPORTS XML, WS
haL
Collections personnalisables, extractions, tampons
18référentiel classification scientifique
référentiel titres de revues
référentiel laboratoires
Accessibilité des référentiels
19Quoi de neuf dans HAL ?
20Intégrations
- Différentes archives étaient indépendantes de HAL
et sur danciennes plates-formes e-Print - Depuis septembre 2005, nous avons intégré dans
HAL - TEL le serveur de Thèses en Lignes
- Archivesic
- Archive de lInstitut Jean Nicod
21Quelques nouveaux portails de dépôt
- HAL-INSERM
- PRUNEL (École Normale Supérieure de Lyon
(sciences)) - HAL-EMSE (École des Mines de St Etienne)
- HAL-UJM (Université Jean Monnet St Etienne)
- Telearn
- Etc.
- Prochainement
- LInstitut Pasteur
- Le Muséum dhistoire naturelle
- HAL-STIC
- Etc.
- Et des dizaines de collections (tampons)
22Méta portail
- Principe
- Regrouper les portails dune fédération
détablissements ou de laboratoires dans un
portail unique - Proposer une navigation élémentaire
- Lorsque lon séchappe dans un des portails, on
trouve un onglet de retour vers le méta portail - En projet pour
- Le PUL (Pôle Universitaire Lyonnais)
- Agropolis
- LInstitut fédératif des neurosciences
- Etc.
23Méta données disciplinaires
- HAL générique recueille des métas données
identiques pour toutes les disciplines
scientifiques - Certains portails exploitent des méta données ou
des fonctionnalités institutionnelles et
disciplinaires ! - Exemple HAL-INSERM permet de télécharger les méta
données dune notice via le pubmed_id - HAL générique réintégrera toutes méta données ou
fonctionnalités disciplinaires qui seraient
nécessaires - Toutes les notices dune même discipline
devraient être ainsi homogènes quel que soit le
portail utilisé pour le dépôt - Ceci permettra louverture du dépôt pour tous les
domaines scientifiques depuis le HAL générique
(SHS)
24Normalisation
- La typologie des documents sera normalisée sur
lensemble de la plate-forme - La typologie sera adaptée à celle du ministère
utilisée pour les contrats quadriennaux
25Facilités
- auteurs connus de HAL
- mes statistiques
- page chercheur (SHS)
- recherche en texte intégral
(septembre)
- à létude, une nouvelle ergonomie pour la page
auteur labo
26Fonctionnalité nouvelle
- Embargo
- Possibilité de cacher le texte intégral dun
dépôt pour répondre au délai dembargo dun
éditeur (de 15 jours à 2 ans) - Le document devient automatiquement public passé
ce délai - Document non public
- Cet état peut être modifié par un rôle de type
documentaliste - Les rôles spécifiques ne peuvent aller que vers
la mise en ligne et ne peuvent pas faire passer
un document en ligne vers un mode non public - Peut répondre à une politique de type portail
INSERM (actuellement) - Dépôts par le chercheur dans un mode forcé non
public - Passage en ligne par un valideur
27Services WEB
- Utilisation du protocole SOAP (Simple Object
Application Protocol) - Échange de données au format XML
- Encapsulation du texte intégral en base64 pour
son transfert - Fournir des méthodes pour quune application
informatique extérieure puisse utiliser HAL - Lecture des référentiels (laboratoires,
thématiques, listes des journaux, etc.) - Nécessaire pour préparer lenvoi dun document
- Dépôt dun document
- Modification des méta données dun document,
ajout des références, etc. - Dépôt dune nouvelle version
- Recherche et lecture dans la base
- En adhérant au schéma de données de HAL, il
devient possible - de connecter son propre système documentaire
- de créer sa propre interface de dépôt
28Services Web, premiers projets
- Développé par EVER-EZIDA pour le compte de la
MISHA - Le logiciel FLORA permettra de déposer sur HAL
- sur demande de lutilisateur, le dépôt dun
article pertinent pour HAL sera
automatiquement effectué - Disponibilité prévue septembre 2006
- Intégration de HAL dans les ENT des universités
grenobloises - Dépôt, recherche, etc.
29Supports utilisateurs
- Mise en place dun outil pour lassistance aux
utilisateurs - Fondé sur XOOP/XHELP
- Dépôts via une interface Web (ou par mail)
- http//support.ccsd.cnrs.fr
- Garantir une réponse à lutilisateur
- Personnels du CCSD dastreinte
- Tracabilité des incidents
- Base de connaissances
30Statistiques de dépôt
31Répartition par domaines scientifiques des
dépôts avec texte intégral
32Nombre de dépôts en texte intégral sur
lensemble de larchive
33Ensemble des dépôts, texte intégral et notices
sur lensemble de larchive
34Sur une plate-forme unique URLS
- HAL
- http//hal.ccsd.cnrs.fr
- http//tel.ccsd.cnrs.fr
- http//halshs.ccsd.cnrs.fr
- http//hal.in2p3.fr
- http//archive-edutice.ccsd.cnrs.fr
- http//hal.inria.fr/
- http//hal-inserm.ccsd.cnrs.fr/
- http//artxiker.ccsd.cnrs.fr/
- http//etol.ccsd.cnrs.fr
- http//cel.ccsd.cnrs.fr
- http//nicod.in2p3.fr/
- http//asic.ccsd.cnrs.fr/
- http//hal-ens-lyon.ccsd.cnrs.fr/
- Etc.
35http//ccsd.cnrs.fr
Questions ?
Daniel.Charnay_at_in2p3.fr
36Services Web (2)
- Dévelopé par EVER-EZIDA pour le compte de la
MISHA - Le logiciel FLORA permettra de déposer sur HAL
- Sur demande de lutilisateur, le dépôt dun
article pertinent pour HAL sera
automatiquement effectué - Disponibilité prévue septembre 2006
37Dépôt
- Simplification
- 4 étapes
- Méta données
- Auteurs, association laboratoires, établissements
- téléchargement du document
- Récapitulation contrôle, dépôt
- Retour en arrière possible
auteurs
métadonnées
récapitulation
fichiers
38Dépôt
- Choix des étapes
- Lordre des étapes peut être paramétré au niveau
dune interface particulière - Par exemple, on peut décider de commencer par le
téléchargement du fichier, afin den extraire
automatiquement - La liste dauteurs
- Le résumé
- Les références bibliographiques
- Etc.
- Ces possibles automatismes dépendent fortement du
niveau de structuration du document source, (donc
de la discipline ?)