Title: HAL
1 Communication scientifique Archives
ouvertes Archives institutionnelles Larchive du
CNRS
daniel.charnay_at_ccsd.cnrs.fr
2LIST au CNRS
- La communication scientifique est rattachée
directement à la direction de la stratégie du
CNRS - Création de la DIS
- Fédérations des acteurs (INIST, CCSD, CENS, )
- Communiqués de presse, mars 2005
- Vers un accès libre aux résultats de la
recherche - Le CNRS, lINSERM, lINRA et lINRIA tirent parti
de leurs spécificités respectives et créent des
archives institutionnelles pour les chercheurs - Announcement INRIA launches its Open Archive in
April 2005 - INRIAs Open Archive is part of the HAL Open
Archive, produced by the CCSD
3ArXiv, le modèle depuis plus de 10 ans
- Initiative de Paul Ginsparg à Los Alamos (xxx)
- 4 000 manuscrits déposés par mois
- 500 000 manuscrits déposés à ce jour
- 300 000 consultations journalières
- Des sites miroirs dans le monde entier
Australie, Brésil, Chine, Allemagne, Inde,
Israël Italie, Japon, Russie, Afrique du Sud,
France Corée du Sud, Espagne, Taiwan, Angleterre,
4Les missions du CCSD
- Une initiative du CNRS pour des archives
scientifiques ouvertes - Une approche internationale
- Ne pas construire une archive nationale, mais
sintégrer dans le mouvement open archives - Une approche essentiellement chercheur
- Des archives alimentées directement par les
chercheurs avec, comme vocation première, la
réalisation dun outil scientifique offrant
laccès au document intégral - Un outil administratif indirect grâce à la
collecte au passage de méta données
suffisantes - Une mission darchivage à long terme
5Les services du CCSD
- Bientôt sur une plate-forme unique
- HAL - Hyper Articles en Ligne interconnecté avec
ArXiv - HALSHS (Sciences de lHomme et de la société)
- Tématice (SHS, MSH de Paris)
- Démocrite 3 (IN2P3)
- Etc.
- TEL Thèses en Ligne (en cours dintégration
dans HAL) - Quelques serveurs spécifiques (en cours de
migration vers HAL) - Jean Nicod (sciences cognitives)
- ArchiveSIC (sciences de linformation)
- Cours en ligne, Codes informatiques en ligne,
MemSIC - Les miroirs
- ArXiv
- PhysNet
6Collaborations, partenaires
- ArXiv Cornell University (Paul Ginsparg)
- INRIA (accord cadre)
- MathDoc, lUJF, lIMAG
- LINIST (HAL, memSIC, etc.)
- La MSH de Paris et HESS
- Les EPST INRA(IRD, IFREMER), INSERM, IRSN, etc.
- Des projets sont en cours de discussion avec les
universités (CPU), la sous direction des
bibliothèques, la direction de la recherche, les
EPST pour un futur statut de HAL et du CCSD - Co-pilotage, comité stratégique
7 - Un frontal pour tous les domaines scientifiques
dArXiv - Tous les documents déposés sur Hal le sont
simultanément sur ArXiv si le domaine existe - Mêmes règles, mêmes formats, davantage de méta
données - Un serveur multi-disciplinaire
- ArXiv et non ArXiv
- Des méta données plus riches
- Des vues sélectives ou privées les collections,
fondées sur un système de tampon (épi journaux,
congrès) - Trois types dobjets articles, articles
anciens , et notices - Ouvert depuis septembre 2002 (accroissement 200
articles/mois)
8 - Respect des standards
- OAI-PMH (entrepôt de données)
- RSS (Cite seer, utilisateurs)
- REDIF (REPEC)
- Indexable
- Structure permettant lindexation par les moteurs
de recherche publiques - Google, Google scholar
- Interconnectable
- API (XML)
- Moissonneur / intégrateur (2006)
9 - Un système souple permettant, en plus de la
version généraliste, des environnements
personnalisés - Exemple Tématice en SHS
- Plus de méta données, règles de dépôt différentes
(autoarchivage et enrichissement de la notice par
des documentalistes) - Démocrite_at_hal à lIN2P3
- Système orienté documentaliste
- HAL-SHS
- Dédié au Sciences de lHomme et de la Société
- Etc.
10TEL Thèses En Ligne
- Un serveur de thèses multi-disciplinaire
- Une collaboration MathDoc CCSD
- Ouvert depuis juillet 2001
- Plus de 4000 thèses à ce jour (accroissement 200
thèses/mois) - Alimenté par les auteurs ou les laboratoires
- ou automatiquement (IMAG, IN2P3,etc.)
- Tris
- Par universités, laboratoires .
- Un modérateur par domaine vérifie lexistence
réelle de la thèse
11Formats des documents
- Encouragement au dépôt des documents source
- Pérennité de larchivage et conservation à long
terme - TeX, LaTeX recommandés en sciences dures (ArXiv)
- Formats visualisables (PDF essentiellement)
- Autres formats possibles (selon les serveurs et
les domaines) - HTML, PS, RTF, DOC, audio
- Migrations
- Quid de XML ?
- Difficulté à utiliser dans les domaines de
physique et de mathématiques (formules, mathML
???)
12Règles de dépôt
- Dépôt par lauteur préalablement identifié
- Obtention libre dun compte ( examen du 1er
dépôt dun auteur) - Modération technique avant publication
- Le document est examiné du point de vue de son
niveau scientifique et de la pertinence de son
classement thèmatique - Collections
- Un ou plusieurs tampons sont attribués à
toute instance qui en fait la demande
(université, société savante, journal, epst,
laboratoire, etc.) . Des vues sélectives
peuvent ainsi être proposées affichant seulement
les articles tamponnés - Versions
- Lauteur peut proposer plusieurs versions du même
document (le tampon est dispensé par version)
13Futur
- Continuer à étendre la couverture disciplinaire
(en particulier, vers les sciences humaines et
sociales, les sciences de la vie,) - Faire un travail de rétroconversion, à la fois
des thèses et des articles - Articuler mieux avec les revues scientifiques
classiques (liens croisés, ajout de
références pour tout le matériau publié) - EPJ,
- Favoriser lémergence de revues scientifiques
nouvelles ( épi-journaux ), constituées de
tables des matières et de liens pointant vers une
archive générale et universelle - Mettre tout le dispositif sous contrôle
international pour assurer sa pérennité à très
long terme (UNESCO)
14Structure de HAL
15Les objectifs recherchés 1
- Archive multidisciplinaire orientée texte
intégral - Une seule base de données pour lensemble des
disciplines - Dépôt du texte intégral mais aussi de notices et
de rétro dépôts - Orientée chercheurs
- Autoarchivage, mais possibilité denrichissement
des méta données par des professionnels - Centralisée mais
- Multi interfaces
- Préservation de lidentité
- Méta données variables au-delà de la DTD
minimum - Environnements de dépôt et de consultation
personnalisés - Internationale
- Interconnectée avec les autres systèmes de
références - ArXiv en physique / mathématiques / informatique
/ biologie / - PubMed Central en médecine et biologie (2006)
16Les objectifs recherchés 2
- Mesurabilité de la production scientifique
- Des laboratoires, des institutions et plus
globalement, de toutes les tutelles - À disposition des déposants mais aussi des
institutions - Génération des listes de publications dans tous
formats - (XML, TeX, DOC/RTF, PDF, )
- Transferts vers les bases administratives
- Alimentation de CRAC (fiche chercheur CNRS)
- Alimentation de Labintel publications
- Pérennité
- Archivage à long terme
- Stabilité des URLs
17OAI
EXPORTS IMPORTS
haL
Texte intégral
Notice bibliographique
18OAI
EXPORTS IMPORTS
haL
19OAI
EXPORTS IMPORTS
haL
202005
OAI
EXPORTS IMPORTS
haL
Texte intégral
Notice bibliographique
21Dépôt
- Simplification
- 4 étapes
- Méta données
- Auteurs, laboratoires, tutelles et association
- téléchargement du document
- Récapitulation contrôle, dépôt
- Retour en arrière possible
auteurs
métadonnées
récapitulation
fichiers
22Dépôt
- Choix des étapes
- Lordre des étapes peut être paramétré au niveau
dune interface particulière - Par exemple, on peut décider de commencer par le
téléchargement du fichier, afin den extraire
automatiquement - La liste dauteurs
- Le résumé
- Les références bibliographiques
- Etc.
- Ces possibles automatismes dépendent fortement du
niveau de structuration du document source, (donc
de la discipline ?)
23URLS
- http//ccsd.cnrs.fr
- http//hal.ccsd.cnrs.fr
- http//tel.ccsd.cnrs.fr
- http//halshs.ccsd.cnrs.fr
- http//democrite.in2p3.fr
- http//archive-edutice.ccsd.cnrs.fr
- http//hal.inria.fr/
- http//artxiker.ccsd.cnrs.fr/
- http//etol.ccsd.cnrs.fr
- http//cel.ccsd.cnrs.fr
24http//ccsd.cnrs.fr
Questions ?
Daniel.Charnay_at_in2p3.fr
25Etat des lieux en juillet 2005
- Activité en forte progression
- HAL toute instance
- 20 dépôts fulltext / jour
- 1500 transferts darticles / jour
- 2900 comptes utilisateurs
- TEL
- 4 dépôts de thèses / jour
- 900 transferts de thèses / jour
- Documents
- 6500 articles fulltext sur HAL
- 3300 thèses
- 1550 articles (autre serveur)
- Contributeur
- 2500 (HAL) 2000 (TEL)
26Dépôts