Title: Recherche Information Web
1Recherche Information Web
2Recherche sur Internet
- Plusieurs centaines doutils de recherche sur des
informations ciblées à partir de questions - Recherche par Sujet (annuaire)
- Hiérarchies (Yahoo)
- WAIS, Sélection de sources
- Indexation plein texte
- Altavista, WebCrawler, Virtual Library,
Excite,Voilà - Google
3Recherche sur Internet
- Recherche par mots clés ou thésaurus
- Recherche sur tous les mots gt 2 caractères
- Serveurs indexeurs
- Indexation automatique du document
- Soit sur demande
- Altavista, Webcrawler, Infoseek, Lycos, Ecila,
Lokace, yahoo,voila... - Interrogation par Opérateurs logique (et, ou,
sauf) - Problèmes
- du bruit/silence
- les mêmes serveurs apparaissent plusieurs fois
4Interrogation Base Documentaire
Documents pertinents
Documents extraits
requêtes
Base Documents
Systèmes Information Documentaire
5Recherche dInformation
- Précision
- P Nombre de documents pertinents extraits
- Nombre de documents extraits
- Bruit
- B Nombre de documents non pertinents extraits
- Nombre de documents extraits
B 1 - P
6Recherche dInformation
- Rappel
- R Nombre de documents pertinents extraits
- Nombre de documents pertinents
- Silence
- S Nombre de documents pertinents non extraits
- Nombre de documents pertinents
-
S 1 - R
7Recherche dInformation
- Annuaire
- Construit manuellement
- Listes de sites sous ensemble correspondant a des
rubriques - Rubriques
- Actualités
- Enseignement ..
- Informatique et internet
- Science et technologie
- Sciences humaines
- Santé
- Sport
-
8Recherche dInformation
- Annuaire
- Yahoo.com ou fr
- Deux modes d utilisation
- Hiérarchique Rubrique , sous rubrique
- Listes de sites centrés sur thème recherché
- Recherche arborescente puis séquentielle
- Recherche par mot clé
- On obtient Rubriques
- Sites avec bref descriptif
9Recherche dInformation
- Avantages
- Navigation guidée efficace
- Sites sélectionnés centrés sur thème recherché
- Recherche arborescente puis séquentielle
- Inconvénients
- Taille annuaire réduite (fonction du temps
humain) - On ne trouve que ce qui a été classé par
gestionnaire annuaire - Mise a jour limitée
10Les Moteurs de Recherche
- Développés pour rechercher dans les serveurs Web
- Principe similaire à ceux de Wais
- - Recherche des documents sur tous les mots (gt2
caractères) - - Indexation des documents contenant des mots
(anglais le plus souvent) - - Listes des documents avec URL
- - Requêtes plus sophistiquées (et, ou,non)
- - Rapatriement des documents eux-mêmes
11Moteur Recherche dInformation
- Méthodes
- Indexation par moteur qui passe sur toutes les
pages web des sites - Indexe sur tous les mots gt 2 caractères
- Indexe nouvelles pages et contenus de maniere
continue - Pondère les documents recherchés
- Recherche
- Mot ou groupe de mots
- Opérations Logiques (ET OU SAUF)
- Classement des résultats par fréquence
(apparition des mots , visites du site ) -
12Opérateurs Logiques
- Opérateurs Logiques (Booléens)
- a ET b a b a ET b
- V V V
- V F F
- F V F
- F F F
- a OU b a b a OU b
- V V V
- V F V
- F V V
- F F F
- NON a a NON a
- V F
- F V
13Moteur Recherche dInformation
- Google
- Indexation par moteur qui passe sur toutes les
pages web des sites - Ignore les articles, adverbes .
- Ignore Majuscules Minuscules
- Par defaut ignore les accents
- Recherche
- ET logique si plusieurs mots
- Exclusion de mots SAUF (-)
- Ou (OR)
- Expression entre
- Forcer à chercher un mot
-
14Moteur Recherche dInformation
- Google
- Plus de 10 milliards de page en toutes les
langues - Temps de réponse tres rapide (lt0.5S)
- Sélection des pages en fonction d une requete
- Classement avec algoritme declassement en
fonction fréquence et de la popularité d une page - Ignore Majuscules Minuscules
- Par defaut ignore les accents
- Recherche
- ET logique si plusieurs mots
- Exclusion de mots SAUF (-)
- Ou (OR)
- Expression entre
- Forcer à chercher un mot
-
15Moteur Recherche dInformation
- Choix mot clés
- Choisir des noms
- Mots les plus probables dans pages recherchées
- Précis et bref
- Mots concrets
- Mots importants en Tête
- Rechercher Phrases si possible
- Ex (sanglots longs des violons )
- Limites
- Pas de mots dérivés (canal mais pas canaux)
- Limite a 32 mots
- Ignore la ponctuation et signes spéciaux
- Favorise pâges avec mots dans le même ordre
- Etendre recherche fichier texte (.doc .pdf ..)
-
16Moteur Recherche dInformation
- Google
- Moteur le plus utilisé
- Variante géographique (google earth)
- Variante Scientifique (scholar)
- On y trouve toujours quelquechose
- Recherche Simple
- Pas de prise en compte des Majuscules
- Pas de motsde 2 carateres sauf si précéde de
- Pas daccent , ni suigne diacritiques(Cédille,
trema,tilde ) - Dans toute la page, le titre ,adresses
- Expression exacte entre
- Selon le type de format de fichier
- Etendre recherche fichier texte (.doc .pdf ..)
-
17Moteur Recherche dInformation
- Google
- Moteur le plus dynamique
- Variante géographique (google earth)
- On y trouve toujours quelquechose
- Variante Scientifique (scholar)
- Cartes et lieu donné (Google Map)
- Recherche Avancée
- Limiter recherche a un site donné
- Langue donnée
- Base ou ensemble fichiers restreint
- Dans toute la page, le titre ,adresses
- Période donnée
- Selon le type de format de fichier
- Etendre recherche fichier texte (.doc .pdf ..)
-
18Moteur Recherche dInformation
- Google
- Dabord recherche de pages cointenant tous les
mots (ET) - Puis un mot en moins
- Classement des Pages
- Pésentation résultats
- Classement selon algoirthme (pageRanking )
- Pésentation résultats
- Dabord les pages les plus consultées
- Nombre de liens pointant sur page
- Pages les plus populaires dabord
-
19Moteur Recherche dInformation
- Avantages
- Requetes simples ou complexes
- Index augmentent avec web
- Mise a jour continue et rapide
- Peu de silence
- Inconvénients
- Difficulté Choix des mots pour interrogation
- Difficulté pour nouveaux sites demerger
- On ne trouve que ce qui a été classé par les
robots qui indexent sites - Bruit important
20Recherche dInformation documentaire
- Bases de données Documentaire
- NLM (MEDLINE)
- Pubmed liens avec Plein texte
- Editeurs
- Elsvcier, Springer , Lipincott, Blackwell
- Voir ENT
- Bases Bibliographiques En France
- Pascal (CNRS)Thèses Articles
- BDSP (ENSP) Santé Publique
21Recherche dInformation documentaire
- Catalogue Bibliothèque
- Listes de documents organisés
- Thématique
- Auteurs
- Titre
- Par numéro unique international
- ISBN (International standard Book Number) Livre
- ISSN (International standard Serial Number) pour
revue
22Recherche dInformation documentaire
- Sudoc (Systeme Universitaire de documentation)
- 5 millions de références des universités
française Mise a jour limitée - Thèses de Sciences Médecine Pharmacie Dentaire
- Décrit par des notices auteur ,titre ,éditeur,
année - On peut savoir ou trouver le document dans BU
Francaises - www.sudoc.abes.fr
23Recherche dInformation documentaire
- INIST CNRS (Pascal)
- Tous les domaines des sciences
- http//articlesciences.inist.fr/
- Moteur recherche et commandes
- Par nom auteur , années
- Par mot clés
24Recherche dInformation documentaire
- BDSP
- Tous les domaines de Santé Publique
- http//www.bdsp.tm.fr/Base/QbeA.asp
- Moteur recherche
- Par mots titre , mot clés
- nom auteur , années
- Par type de document
25Recherche dInformation documentaire
- BNF
- Catalogue Collectif de France
- Tous les domaines
- Textes, audio, video, multimedia
- 20 millions documents
- http//www.ccfr.bnf.fr
- Moteur recherche
- Par mots titre , mot clés
- nom auteur , années
- Par type de document
26Recherche dInformation documentaire
- Epidémiologie Statistiques Santé
- Base de données
- Cause médicales décès
- INSERM Vesinet
- http//www.cepidc.vesinet.inserm.fr
- Recherche Base de données
- Par zone géographique (région, dept..)
- Années
- Par cause de décès (CIM ..)
27Recherche dInformation documentaire
- Consortium revues en ligne
- La plupart des revues scientifiques
- Consortia Payants
- Partagé entre universités (Couperin)
- ENT /documentation /doc electronique
- ScienceDirect (elsevier)
- Springer
- Blackwell
- New England
28Recherche dInformation documentaire
- UMVF
- http//www.umvf.org
- Ressources pédagogiques
- GIP UMVF
- Partage et mutualisation entre universités
- Indexation par DocUMVF
- Cours (support et campus numériques)
- Cas cliniques
- Vidéos
- Vidéo enrichie
- Podcast
29Recherche simple
30(No Transcript)
31Recherche avancée
32Recherche avancée par discipline
33(No Transcript)
34Recherche ECN
Complétionautomatique
35(No Transcript)
36Affichage mots clefs
37Section ENC
38(No Transcript)
39(No Transcript)
40