Title: Diapositive 1
1Formation SIST Méthode de construction des sites
SIST nationaux
2Méthode de construction des SIST Nationaux
- PARTIE I Préparation de la structure du site
- PARTIE II Etude pays et connexion des sources
- PARTIE III Récupération des bases de données
- PARTIE IV Mise en place des FORUM et WIKI
- PARTIE V Sites partenaires et sites SIST
3Plan - PARTIE I Préparation de la structure du
site national
- CREATION DES PAGES WEB
- HOME PAGE personnaliser la page aux couleurs du
pays - ESPACE COLLABORATIF Créer une rubrique de
niveau 2 comme point dentrée pour les pages Web
des institutions représentées sur le site SIST
(bases de données hébergées) - ACTUALITE SCIENTIFIQUE Connecter quelques flux
RSS représentatifs (sciences générales si pas
didée) en nationaux ou internationaux et
commenter la page de ces actualités
4Plan - PARTIE I Préparation de la structure du
site national
- CREATION DES THEMATIQUES DANS HUBBLE
- Trouver une classification simple des ressources
soit cette classification est indiquée dans
létude pays, soit elle est a définir. Elle peut
être thématique (médecine, agriculture, sciences
humaines .) ou géographique (pays, Afrique,
reste du monde) ou sur des sujets dactualité
(désertification, grippe aviaire, sida ) - Créer les onglets appropriés dans Hubble
(thématiques) - Ces onglets seront reportés à lidentique dans
les modules MAGELLAN, CYRUS et GUTENBERG mais à
la seule condition que vous disposiez de
ressources pour remplir ces onglets (pas donglet
vide !) - Remarque une source peut appartenir à plusieurs
onglets
5Plan - PARTIE I Préparation de la structure du
site national
- CREATION DES PAYS DANS HUBBLE
- Trouver une classification simple des pays pas
facile, attention cest le contenu de la source
qui doit concerner le pays - Très souvent on trouve juste deux valeurs dans
cette listbox le pays et international - Remarque une source ne peut appartenir quà un
seul pays
6Plan - PARTIE I Préparation de la structure du
site national
- CREATION DES TYPES DANS HUBBLE
- Très utiles pour la sélection automatisée des
sources - Trouver une classification simple des sources par
type généralement - Actualités scientifiques flux RSS, page Web
News ou Evénements, bases de données dactualité - Annuaires bases annuaires, page web annuaire,
bases annuaires récupérées - Articles Web sites web
- Bases bibliographiques base bibliographique en
ligne, bases bibliographiques récupérées - Bases scientifiques base de données en ligne
- Journaux/Revues revues électroniques en ligne
- Outils collaboratifs locaux forums et Wikis
crées sur le SIST - Portails dinformation système dinformation en
ligne, autres SIST nationaux - Texte intégral bases de données en ligne, page
web, répertoire de document, archives ouvertes - Remarque une source ne peut appartenir quà un
seul type
7Plan - PARTIE II Etude pays et connexion des
sources
- Parcours linéaire de létude pays et repérage de
- Site web lensemble du site est intéressant,
repérer lURL de la home page - Partie de site Web seule ou quelques pages sont
intéressantes (publications, annuaire, news,
événements ..), repérer lURL de la page
intéressante - Formulaire vérifier rapidement sil est en mode
GET, PUT ou sil contient des Frames ou une
information de session (souvent impossibles à
connecter), repérer lURL de réponse - Flux RSS repérer lURL du flux
- Archive ouverte repérer lURL
- Remarque une même ressource peut fournir
plusieurs sources (un site Web peut donner une
source site web, une sources flux RSS, une source
formulaire .)
8Plan - PARTIE II Etude pays et connexion des
sources
- Parcours linéaire de létude pays et repérage de
- Idem pour les ressources internationales
- Même travail mais non plus sur les ressources
nationales mais sur les ressources
internationales - Généralement mieux balisées
- Remarque un package standard Ressources
nationales est proposé en annexe de ce document
9Plan - PARTIE II Etude pays et connexion des
sources
- Connexion des ressources repérées de type sites
Web dans MAGELLAN - Créer les thématiques nécessaires dans MAGELLAN
- Eventuellement créer des thématiques spécifiques
(News, Evénements, annuaires, Texte intégral) si
vous avez des sites web contenants des pages
statiques de ce type - Positionnez alors le MAXhops des fichiers
indexerXX.conf crées à 2 pour nindexer que la
page et éventuellement le niveau suivant mais pas
plus - Lancer lindexation manuellement (la nuit) et
vérifier son bon déroulement - Cest très long la première fois, moins les
autres fois
10Plan - PARTIE II Etude pays et connexion des
sources
- Connexion des ressources repérées de type Flux
RSS DANS GUTENBERG - Créer les thématiques nécessaires dans GUTENBERG
- Entrez les URL des flux RSS
11Plan - PARTIE II Etude pays et connexion des
sources
- Connexion des ressources repérées de type
Archives ouvertes dans CYRUS - Créer les thématiques nécessaires dans CYRUS
- Entrez juste lURL des Archives ouvertes et un
email quelconque pour déclencher la mise à jour
du formulaire. - Lancer manuellement le moissonnage la nuit
- Cest long la première fois, beaucoup plus rapide
les autres fois
12Plan - PARTIE II Etude pays et connexion des
sources
- Connexion des ressources repérées de type Flux
RSS dans HUBBLE - Créer une source HUBBLE par flux en indiquant
juste son URL, sont type et son pays
13Plan - PARTIE II Etude pays et connexion des
sources
- Connexion des ressources Archives ouvertes et
Sites Web dans HUBBLE - Il faut maintenant raccorder les sources traitées
par MAGELLAN et CYRUS dans HUBBLE - Pour chacune des thématiques décrites dans
MAGELLAN ET CYRUS créer une source HUBBLE
intitulée Bouquet ) - Par exemple Bouquet archives ouvertes
médecine, bouquet sites web sicences humaines
14Plan - PARTIE II Etude pays et connexion des
sources
- Connexion des ressources repérées de type
Formulaire Web dans HUBBLE - Connecter et tester les sources de type
formulaire Web - Pour les formulaires en mode POST aidez-vous de
lextension Web Developer Extension pur le
navigateur FIREFOW qui permet de transformer les
formulaires POST en formulaires GET - http//chrispederick.com/work/webdeveloper/
15Plan - PARTIE III Récupération des bases de
données
- Création dune base de donnée MySQL différente de
celle utilisée par le SIST ( sist_annexes ) - Récupération des fichiers de données (CDS-ISIS,
ACCESS, EXCELL ) sous une forme tabulée (un
enregistrement par ligne, les valeurs des champs
séparées par un même séparateur) -
- ltvaleur_champ1gtltséparateurgt ltvaleur_champ2gtltsépar
ateurgt ltvaleur_champ3gtltséparateurgtltvaleur_champNgt
- ltvaleur_champ1gtltséparateurgt ltvaleur_champ2gtltsépar
ateurgt ltvaleur_champ3gtltséparateurgtltvaleur_champNgt
- ltvaleur_champ1gtltséparateurgt ltvaleur_champ2gtltsépar
ateurgt ltvaleur_champ3gtltséparateurgtltvaleur_champNgt
- ltvaleur_champ1gtltséparateurgt ltvaleur_champ2gtltsépar
ateurgt ltvaleur_champ3gtltséparateurgtltvaleur_champNgt
- Création des tables MySQL recevant les données
- Importation des données
- Création des clés uniques
- Création des sources MysqlFinder
16Plan - PARTIE III Récupération des bases de
données
- Création dune page Web par institution qui a
donné sa base, lien vers linterrogation
spécifique de sa base - Connexion de ces sources MySQLFinder à Hubble
- Elles doivent apparaitre dans le moteur de
recherche fédérée
17Plan - PARTIE IV Mise en place des forums et
des wikis
- Création dans l espace collaboratif dun espace
dédié aux forum et aux wikis - Création dun formulaire pour la suggestion de
création des forums - Idem pour les Wikis
- Connexion des sources Forums et Wikis à Hubble
- Elles doivent apparaitre dans le moteur de
recherche fédérée
18Plan - PARTIE V Sites partenaires et sites SIST
- Connexion des sites partenaires à HUBBLE
- Dans loptique où un partenaire à crée un accès
privilégié (url spécifique SIST) à sa source - Connexion des autres SIST à Hubble
- Dans le moteur de recherche fédérée vous pouvez
créer une source par SIST nationaux de vos
collègues de travail. - Attention ne jamais déclarer cette source comme
une source par défaut !!! Cela provoquerait des
problèmes de réccursivité