HAL - PowerPoint PPT Presentation

1 / 26
About This Presentation
Title:

HAL

Description:

Communication scientifique Archives ouvertes Archives institutionnelles L archive du CNRS daniel.charnay_at_ccsd.cnrs.fr – PowerPoint PPT presentation

Number of Views:112
Avg rating:3.0/5.0
Slides: 27
Provided by: Daniel1502
Category:
Tags: hal

less

Transcript and Presenter's Notes

Title: HAL


1
Communication scientifique Archives
ouvertes Archives institutionnelles Larchive du
CNRS
daniel.charnay_at_ccsd.cnrs.fr
2
LIST au CNRS
  • La communication scientifique est rattachée
    directement à la direction de la stratégie du
    CNRS
  • Création de la DIS
  • Fédérations des acteurs (INIST, CCSD, CENS, )
  • Communiqués de presse, mars 2005
  • Vers un accès libre aux résultats de la
    recherche
  • Le CNRS, lINSERM, lINRA et lINRIA tirent parti
    de leurs spécificités respectives et créent des
    archives institutionnelles pour les chercheurs
  • Announcement INRIA launches its Open Archive in
    April 2005
  • INRIAs Open Archive is part of the HAL Open
    Archive, produced by the CCSD

3
ArXiv, le modèle depuis plus de 10 ans
  • Initiative de Paul Ginsparg à Los Alamos (xxx)
  • 4 000 manuscrits déposés par mois
  • 500 000 manuscrits déposés à ce jour
  • 300 000 consultations journalières
  • Des sites miroirs dans le monde entier

Australie, Brésil, Chine, Allemagne, Inde,
Israël Italie, Japon, Russie, Afrique du Sud,
France Corée du Sud, Espagne, Taiwan, Angleterre,
4
Les missions du CCSD
  • Une initiative du CNRS pour des archives
    scientifiques ouvertes
  • Une approche internationale
  • Ne pas construire une archive nationale, mais
    sintégrer dans le mouvement  open archives 
  • Une approche essentiellement  chercheur 
  • Des archives alimentées directement par les
    chercheurs avec, comme vocation première, la
    réalisation dun outil scientifique offrant
    laccès au document intégral
  • Un outil administratif indirect grâce à la
    collecte  au passage  de méta données
    suffisantes
  • Une mission darchivage à long terme

5
Les services du CCSD
  • Bientôt sur une plate-forme unique
  • HAL - Hyper Articles en Ligne interconnecté avec
    ArXiv
  • HALSHS (Sciences de lHomme et de la société)
  • Tématice (SHS, MSH de Paris)
  • Démocrite 3 (IN2P3)
  • Etc.
  • TEL Thèses en Ligne (en cours dintégration
    dans HAL)
  • Quelques serveurs spécifiques (en cours de
    migration vers HAL)
  • Jean Nicod (sciences cognitives)
  • ArchiveSIC (sciences de linformation)
  • Cours en ligne, Codes informatiques en ligne,
    MemSIC
  • Les miroirs
  • ArXiv
  • PhysNet

6
Collaborations, partenaires
  • ArXiv Cornell University (Paul Ginsparg)
  • INRIA (accord cadre)
  • MathDoc, lUJF, lIMAG
  • LINIST (HAL, memSIC, etc.)
  • La MSH de Paris et HESS
  • Les EPST INRA(IRD, IFREMER), INSERM, IRSN, etc.
  • Des projets sont en cours de discussion avec les
    universités (CPU), la sous direction des
    bibliothèques, la direction de la recherche, les
    EPST pour un futur statut de HAL et du CCSD
  • Co-pilotage, comité stratégique

7
  • Un frontal pour tous les domaines scientifiques
    dArXiv
  • Tous les documents déposés sur Hal le sont
    simultanément sur ArXiv si le domaine existe
  • Mêmes règles, mêmes formats, davantage de méta
    données
  • Un serveur multi-disciplinaire
  • ArXiv et non ArXiv
  • Des méta données plus riches
  • Des vues sélectives ou privées les collections,
    fondées sur un système de tampon (épi journaux,
    congrès)
  • Trois types dobjets articles, articles
    anciens , et notices
  • Ouvert depuis septembre 2002 (accroissement 200
    articles/mois)

8
  • Respect des standards
  • OAI-PMH (entrepôt de données)
  • RSS (Cite seer, utilisateurs)
  • REDIF (REPEC)
  • Indexable
  • Structure permettant lindexation par les moteurs
    de recherche publiques
  • Google, Google scholar
  • Interconnectable
  • API (XML)
  • Moissonneur / intégrateur (2006)

9
  • Un système souple permettant, en plus de la
    version généraliste, des environnements
    personnalisés
  • Exemple Tématice en SHS
  • Plus de méta données, règles de dépôt différentes
    (autoarchivage et enrichissement de la notice par
    des documentalistes)
  • Démocrite_at_hal à lIN2P3
  • Système orienté documentaliste
  • HAL-SHS
  • Dédié au Sciences de lHomme et de la Société
  • Etc.

10
TEL Thèses En Ligne
  • Un serveur de thèses multi-disciplinaire
  • Une collaboration MathDoc CCSD
  • Ouvert depuis juillet 2001
  • Plus de 4000 thèses à ce jour (accroissement 200
    thèses/mois)
  • Alimenté par les auteurs ou les laboratoires
  • ou automatiquement (IMAG, IN2P3,etc.)
  • Tris
  • Par universités, laboratoires .
  • Un modérateur par domaine vérifie lexistence
    réelle de la thèse

11
Formats des documents
  • Encouragement au dépôt des documents  source 
  • Pérennité de larchivage et conservation à long
    terme
  • TeX, LaTeX recommandés en sciences dures (ArXiv)
  • Formats visualisables (PDF essentiellement)
  • Autres formats possibles (selon les serveurs et
    les domaines)
  • HTML, PS, RTF, DOC, audio
  • Migrations
  • Quid de XML ?
  • Difficulté à utiliser dans les domaines de
    physique et de mathématiques (formules, mathML
    ???)

12
Règles de dépôt
  • Dépôt par lauteur préalablement identifié
  • Obtention libre dun compte ( examen du 1er
    dépôt dun auteur)
  • Modération technique avant publication
  • Le document est examiné du point de vue de son
    niveau scientifique et de la pertinence de son
    classement thèmatique
  • Collections
  • Un ou plusieurs tampons sont attribués à
    toute instance qui en fait la demande
    (université, société savante, journal, epst,
    laboratoire, etc.) . Des  vues  sélectives
    peuvent ainsi être proposées affichant seulement
    les articles  tamponnés 
  • Versions
  • Lauteur peut proposer plusieurs versions du même
    document (le tampon est dispensé par version)

13
Futur
  • Continuer à étendre la couverture disciplinaire
    (en particulier, vers les sciences humaines et
    sociales, les sciences de la vie,)
  • Faire un travail de rétroconversion, à la fois
    des thèses et des articles
  • Articuler mieux avec les revues scientifiques
     classiques  (liens croisés, ajout de
    références pour tout le matériau publié)
  • EPJ,
  • Favoriser lémergence de revues scientifiques
     nouvelles  ( épi-journaux ), constituées de
    tables des matières et de liens pointant vers une
    archive générale et universelle
  • Mettre tout le dispositif sous contrôle
    international pour assurer sa pérennité à très
    long terme (UNESCO)

14
Structure de HAL
15
Les objectifs recherchés 1
  • Archive multidisciplinaire orientée texte
    intégral
  • Une seule base de données pour lensemble des
    disciplines
  • Dépôt du texte intégral mais aussi de notices et
    de rétro dépôts
  • Orientée chercheurs
  • Autoarchivage, mais possibilité denrichissement
    des méta données par des professionnels
  • Centralisée mais
  • Multi interfaces
  • Préservation de lidentité
  • Méta données variables au-delà de la DTD
    minimum
  • Environnements de dépôt et de consultation
    personnalisés
  • Internationale
  • Interconnectée avec les autres systèmes de
    références
  • ArXiv en physique / mathématiques / informatique
    / biologie /
  • PubMed Central en médecine et biologie (2006)

16
Les objectifs recherchés 2
  • Mesurabilité de la production scientifique
  • Des laboratoires, des institutions et plus
    globalement, de toutes les tutelles
  • À disposition des déposants mais aussi des
    institutions
  • Génération des listes de publications dans tous
    formats
  • (XML, TeX, DOC/RTF, PDF, )
  • Transferts vers les bases administratives
  • Alimentation de CRAC (fiche chercheur CNRS)
  • Alimentation de Labintel publications
  • Pérennité
  • Archivage à long terme
  • Stabilité des URLs

17
OAI
EXPORTS IMPORTS
haL
Texte intégral
Notice bibliographique
18
OAI
EXPORTS IMPORTS
haL
19
OAI
EXPORTS IMPORTS
haL
20
2005
OAI
EXPORTS IMPORTS
haL
Texte intégral
Notice bibliographique
21
Dépôt
  • Simplification
  • 4 étapes
  • Méta données
  • Auteurs, laboratoires, tutelles et association
  • téléchargement du document
  • Récapitulation contrôle, dépôt
  • Retour en arrière possible

auteurs
métadonnées
récapitulation
fichiers
22
Dépôt
  • Choix des étapes
  • Lordre des étapes peut être paramétré au niveau
    dune interface particulière
  • Par exemple, on peut décider de commencer par le
    téléchargement du fichier, afin den extraire
    automatiquement
  • La liste dauteurs
  • Le résumé
  • Les références bibliographiques
  • Etc.
  • Ces possibles automatismes dépendent fortement du
    niveau de structuration du document source, (donc
    de la discipline ?)

23
URLS
  • http//ccsd.cnrs.fr
  • http//hal.ccsd.cnrs.fr
  • http//tel.ccsd.cnrs.fr
  • http//halshs.ccsd.cnrs.fr
  • http//democrite.in2p3.fr
  • http//archive-edutice.ccsd.cnrs.fr
  • http//hal.inria.fr/
  • http//artxiker.ccsd.cnrs.fr/
  • http//etol.ccsd.cnrs.fr
  • http//cel.ccsd.cnrs.fr

24
http//ccsd.cnrs.fr
Questions ?
Daniel.Charnay_at_in2p3.fr
25
Etat des lieux en juillet 2005
  • Activité en forte progression
  • HAL toute instance
  • 20 dépôts fulltext / jour
  • 1500 transferts darticles / jour
  • 2900 comptes utilisateurs
  • TEL
  • 4 dépôts de thèses / jour
  • 900 transferts de thèses / jour
  • Documents
  • 6500 articles fulltext sur HAL
  • 3300 thèses
  • 1550 articles (autre serveur)
  • Contributeur
  • 2500 (HAL) 2000 (TEL)

26
Dépôts
Write a Comment
User Comments (0)
About PowerShow.com