Title: Recherche d'Information Gabriel Gallezot Universit
1Recherche d'InformationGabriel
GallezotUniversité de Nice Sophia
AntipolisURFISTgallezot_at_unice.fr
2Imaginez la situation suivante
Intro
- Vous êtes actuellement chercheur dans un labo. En
vue de la réalisation d'un prochain projet, le
responsable du labo vous demande - De produire une bibliographie sur de le thème de
l'anthropocene - De lui fournir sur la base de la bibliographie
réalisée une dizaine de documents significatifs
afin de mieux cerner ce thème. - De surveiller un certain nombre de sites sur ce
même thème et d'être attentif à l'image de
l'organisme sur le web. - De lui proposer un moyen simple de partager des
références (liens sur textes ou sites) avec les
autres membres du projet de recherche qui
travaillent sur d'autres thèmes connexes.
Pull
Push
3Plan
- Introduction générale à la recherche
dinformation - Outils de recherche
- En Bu
- Sur le web
- Mon environnement de travail
- Methode Push
41Introduction générale à la recherche
dinformation
5- Lécriture nous a permis d externaliser en
partie notre mémoire. - Limprimerie nous a permis de transmettre cette
mémoire externe. - La Toile a diminué considérablement les coûts de
transmission de linformation. - Surtout, elle a permis à chacun dapporter sa
contribution personnelle au patrimoine collectif - ABITEBOUL, Serge. Sciences des données de la
logique du premier ordre à la Toile. Nouvelle
édition en ligne. Paris Collège de France,
2012. Disponible sur Internet
lthttp//books.openedition.org/cdf/506gt.
6Données, informations, connaissances et document
- Une donnée est une description élémentaire,
typiquement numérique pour nous, dune réalité.
Cest par exemple une observation ou une mesure. - À partir de données collectées, de linformation
est obtenue en organisant ces données, en les
structurant pour en dégager du sens. - En comprenant le sens de linformation, nous
aboutissons à des connaissances, cest-à-dire à
des faits considérés comme vrais dans
lunivers dun locuteur, et à des lois (des
règles logiques) de cet univers. - "Toute connaissance mémorisée, stockée sur un
support, fixée par l'écriture ou inscrite par un
moyen mécanique, physique, chimique,
électronique, constitue un document. ... tant
que le document est créé mais n'est pas encore
utilisé par un récepteur, il reste un document
virtuel. Dès lors qu'il est employé et décodé par
un récepteur, le document devient réel il a
trouvé son utilisateur" (voir dia la
tridimensionnalité du document )
ABITEBOUL, Serge. Sciences des données de la
logique du premier ordre à la Toile. Nouvelle
édition en ligne. Paris Collège de France,
2012. Disponible sur Internet
lthttp//books.openedition.org/cdf/5 ESTIVAL
(Robert), MEYRIAT (Jean).- "La dialectique de
l'écrit et du document. Un effort de synthèse".-
in Schéma et schématisation, nº14, 2e trim.
1981.- p.82-91.06gt.
7Tridimensionnalité du document
- Pédauque R-T, Salaün J-M. Le document à la
lumière du numérique. CF Editions 2006.
Signe ou forme
Ou repéré
document support inscription Document est
une promesse
Texte ou contenu
contrat de lecture
Ou retenu
Ou compris
Médium ou relation
document objet mémoriel
Le document est une trace permettant
dinterpréter un événement passé à partir dun
contrat de lecture cest une construction
sociale , le vu (la trace, laspect matériel),
le lu (linterprétation, la dimension
intellectuelle) et le su (la dimension mémorielle
de lévénement)
8L'accès à l'information
Invariant -)
Source C. Fauré
- Les "techniques intellectuelles" sont des
méthodes et des outils ayant la capacité de
repérer et de retrouver l'information
9Repérage / indexation de d'information
- Référents externes
- Liste
- Taxinomie
- Thésaurus
- Ontologie (graph)
- Référents internes
- métadonnées
- structures
10taxinomie / thésaurus / ontologie
11Index
- Le principe de stockage des informations dans
l'index est celui d'un annuaire inversé - Chaque terme est associé a une liste de documents
y contenant une occurrence -gt critère de rapidité
de recherche - L'index stocke les informations sur les sources
dans un format pivot La richesse de ce format
pivot, qui structure l'index, va être garante de
la qualité de recherche.
Source C. Fauré
12Répères pour appréhender le Web
- 1991 (public) Tim Berners-Lee et Robert Cailliau
- Système métastable (métaphore du rocher),
distribué et ouvert - Pb du web croissance rapide, création de
désorientation du web classique gt proposition
d'un web sémantique (web de données) en 1994. - Autres solutions en attendant le web de données
- Les moteurs
- Web 2.0
- réseaux sociaux
- API (Application Programming Interface, web
services)
13Pourquoi un moteur de recherche est-il si rapide
pour chercher dans des milliards de pages ?
- Réponse il ne cherche pas !
- Il a déjà toutes les réponses aux requêtes qui
lui sont formulées.
Chaque requête est une métadonnée
Source C. Fauré
14Moteur de rechercheet texte mining
- Texte mining art de générer automatiquement des
métadonnées.gt plusieurs méthodes - - Recherche plein texte (occurrences)
- - Recherche associative (statistique les
vecteurs) - - Recherche linguistique (tokenisation,
lemmatisation, entity extraction) - - Recherche sémantique (structurée) le moteur
s'appuie sur des référentiels (à partir d'un
référentiel métier par exemple)
Source C. Fauré
15Principe des moteurs
- Pour trouver de l'information, certes. Mais
surtout pour - trouver rapidement l'information
- trouver de l'information dans des sources
diverses et hétérogènes - rechercher dans des informations peu ou
- faiblement structurées
16Complémentarité des approches
Source C. Fauré
17Appréhension de linfo
Source Info_at_vis
18Matching correspondance des mots-clés dune
requête avec les mots-clés représentant le(s)
document(s) résultat (système documentaire).
Watching une vue des résultats introduite
par une organisation spécifique (ex. page rank,
clusterisation, recommandation, etc) (monde des
moteurs) et classements affinitaires
personnalisés (monde des réseaux sociaux)gtgtgtgtgt
la question des algorithmes et des outils de
visualisation de l'information
19http//www.davidgaliana.fr/medias-sociaux/infograp
hie-60-secondes-sur-le-web/
20Où chercher ?
- Information contenue sur les ordinateurs
individuels - plusieurs millions dordinateurs inter-connectés
P2P
- bases de données spécialisées
- Contenu dynamique
- Index partiel des sites
- Interdiction dindexation
Web invisible (web profond)
Web visible et Web 2.0 (web surfacique)
- 1000 Milliards de
- Pages web ?
- Forum de
- discussion
- Contenu indexable,
- contenu taggé
À partir de source Eric Boutin
21Usages des moteurs
21 du temps passé en ligne est consacré à la
recherche
93 des internautes utilisent les moteurs de
recherche pour trouver et accéder aux sites
46 des recherches concernent des informations
sur des produits ou des services (e-commerce)
57 des internautes cherchent sur le web chaque
jour
50 du trafic dun site vient dun moteur de
recherche (France)
Infographiclabs, 2010, GO-Gulf, 2012,
Médiamétrie, 2012
Source A. Bouchard
22Sites les plus visités
Paul Jacionis, 05/2012
Source A. Bouchard
23Nombre de requêtes
Etude comScore, 2013
Source A. Bouchard
24La personnalisation de la recherche
Lalgorithme de Google utilise plus de 200
paramètres pour affiner une requête. Cela inclut
le PageRank du site internet, la localisation
géographique de linternaute, les liens sur
lesquels il clique généralement, la façon dont il
modifie ses requêtes quand il nest pas
satisfait, ainsi que son historique de
recherche (T. Vanderbilt, 2013, voir également
infographie)
Personnalisation sur Google (étude A. Hannak et
al., 2013) - 12 des résultats différents -
basée surtout sur lidentification au service et
sur ladresse IP (localisation)
25Les opérateurs(les booléens et les autres)
OR
AND
AND NOT
( )
Formadoct http//guides-formadoct.ueb.eu/conten
t.php?pid111868sid842560
link
site
filetype
as_qdrd15
allinurl
Fonctionnalités http//www.google.fr/intl/fr/hel
p/features.html
mais surtout de plus en plus dinterfaces à
comprendre, à appréhender, à suivre, ... Exemple
avec Google gt
26La Galaxie Google
- Google Trends (comparaison de termes, de sites)
http//trends.google.com - Ex http//www.google.org/flutrends/
- Google Alerte http//www.google.com/alerts
- Google Custom Search http//www.google.fr/cse/
- ... http//www.google.fr/intl/fr/options/
- Google Knwoledge Graph http//insidesearch.blogsp
ot.fr/2012/05/introducing-knowledge-graph-things-n
ot.html - - Attention google and your memory
http//www.onlinecolleges.net/2011/09/19/google-an
d-your-memory/
272Les outils de recherche
- En Bibliothèque (ex de lUNS)
- Sur le Web
28Ressources en BU
Catalogue et ressources électroniques
29Exercice avec les outils de la bibliothèque
- je cherche si l'ouvrage Nous n'avons jamais
été modernes essai d'anthropologie
symétrique de Latour Bruno . Est disponible
dans une BU de l'université...comment faire ? - Dans quelle(s) autre(s) BU en France l'ouvrage
est-il disponible ? ... comment faire ? - je souhaite lire l'ouvrage Sociologie de la
traduction Textes fondateurs, de Latour,
Bruno. Callon, Michel. Akrich, M. ? comment
faire ? Conseillez-moi.
30- je cherche à savoir ce qu'est le "Dreaming" pour
les Aborigènes dAustralie ... comment faire ? - je cherche un article du Courrier International
intitulé Le livre à l'ère du numérique
Attention, le livre électronique décolle !... (13
avril 2008) comment faire ? - savez-vous si je peux consulter les articles
(full-text) des revues "Agricultural and Forest
Meteorology" et "Journal of Documentation ?
(précisez)
31Ressources sur le web
Exemples doutils(panorama sur le web)
32Le Web chercher des références et les textes
associés
- Le monde de Bibliothèques (cat. et BN)
- Les Dictionnaires et les encyclopédies (Dico
Co) - Les Archive Ouvertes et Revues en ligne (AO Co)
- Les outils du web2.0
- Les Moteurs
- Les outils embarqués (extensions navigateur)
- son moteur
- La méthode Push (selon déroulement du cours)
33Le monde des bibliothèques
- Catalogues
- Dédié aux thèses http//www.theses.fr/
- Worldcat http//worldcat.org/
- JournalTOC http//www.journaltocs.ac.uk/
- Ne pas oublier Amazon, chapitre.com, decitre..
- Bibliothèques Numérique
- Gallica http//gallica.bnf.fr/
- Europeana http//www.europeana.eu/portal/
- Hathi trust http//www.hathitrust.org/
- Wikisource http//fr.wikisource.org/wiki/Wikisou
rceAccueil - . Le projet Gutenberg (ebook) http//www.gutenber
g.org/wiki/Main_Page - . Internet Archive (le web) http//www.archive.o
rg/ - . Google book http//books.google.com/
- . Liste des Bibliothèques numériques
http//www.science.gouv.fr/fr/bibliotheques-numeri
ques/ et http//signets.bnf.fr/html/categories/c_
011textes_num.html
34Dico Co
- Wikipedia http//fr.wikipedia.org/wiki/Accueil
- Scholarpedia http//www.scholarpedia.org/
- CNRTL Centre National de Ressources Textuelles
et (Morphologies, Lexicographie, Etymologie,
Synonymie, Antonymie, Proxémie, Concordance)
http//www.cnrtl.fr/lexicographie/ (accès à TLFI
et d'autres dictionnaire) - Dicorama http//www.dicorama.com/
35OA Co
- HAL http//hal.archives-ouvertes.fr/
- Revues.org http//www.revues.org/
- Persee http//www.persee.fr/web/guest/home/
- OAIster (cf. Worldcat) http//oaister.worldcat.o
rg/ - Base http//www.base-search.net/
- ISIDORE http//www.rechercheisidore.fr/
- OpenDOAR http//www.opendoar.org/
- Scientific commons http//www.scientificcommons.or
g/ - DOAJ http//www.doaj.org/
36Le web2.0Recherche verticale
- Signets Diigo http//www.diigo.com/,
Delicious - Ref biblio CiteUlike http//www.citeulike.org/
, LibraryThing http//www.librarything.com,
Mendeley http//www.mendeley.com - Illustrations Flickr http//www.flickr.com/ ,
youtube http//www.youtube.com/ , - Présentations PPT http//www.slideshare.net
- Tweets search de twitter et Topsy
http//topsy.com/ - Transversaux (avec choix) Qwant,
socialmention,...
37Les outils de recherche du web(quelques exemples)
- Moteurs academics
- Google scholar http//scholar.google.com
- Microsoft academics search http//academic.rese
arch.microsoft.com/ (voir aussi
http//academic.research.microsoft.com/AcademicMap
) (ex avec UPF) - Scirus http//www.scirus.com
- JURN http//www.jurn.org/
- ...
- Cf aussi dia AO co
38Les outils de recherche du web(quelques exemples
- suite)
- Verticaux selon plateforme
- choix du vertical http//socialmention.com/
- Selon les droits associés http//search.creative
commons.org/ - Moteurs inversés
- Tineye http//www.tineye.com/
- Midomi http//www.midomi.com
- Moteur collaboratifs Blekko
- Moteur anomysé Duckduckgo
-
- Moteur vocal google sur chrome
- Recherche dans la vidéo Voxalead
http//voxaleadnews.labs.exalead.com/ - Moteur de réponses WolframAlpha,
https//www.wolframalpha.com
- MétaMoteurs
- Ixquick http//www.eu.ixquick.com/fra/
- Clusty http//clusty.com/
- Interfaçage
- SearchCube http//search-cube.com/
- Oamos http//www.oamos.com/
- Moteurs de médias
- Vidéos http//www.blinkx.com/
- Images http//www.picsearch.com/
- Sur mobile phone
- Google googles
- Shazam, Soundhound
- ...
39- Outils embarqués des extensions FireFox
- Tous les outils dans un menu déroulant
- Add to search https//addons.mozilla.org/en-US/f
irefox/addon/3682 - Ajout de fonctionnalités sur certain outils de
recherche. - search Cloudlet https//addons.mozilla.org/fr/fi
refox/addon/search-cloudlet-for-google-yah/ - ...
- Sur mesure créer son moteur de recherche (ex
LeMien)? - sur google custom search (ex co-op) ,
équivalent de lopérateur site multiplié à
souhait http//www.google.com/coop/cse/
40Exercices
- Je dois me déplacer à l'université de Nouvelle
Calédonie, indiquez-moi la(es) références
bibliographique(s) des ouvrages de Bruno latour,
(postérieur à 2010) que je pourrai consulter sur
place. - Je souhaite me procurer l'article Zalasiewicz,
J., P.J. Crutzen, et W. Steffen. 2012. Chapter
32 - The Anthropocene . In The Geologic Time
Scale, Boston Elsevier, p. 1033-1040.
Conseillez moi ! - Je souhaite me procurer l'article Slaughter,
Richard A. 2012. Welcome to the anthropocene .
Futures 44(2) 119-126.. Conseillez moi ! - Sur Google, Je cherche des documents en pdf qui
comportent le mot-clé énergie sur le site du
ministère de l'environnement .(rédigez la
requête) - Sur Google, comment trouver des documents qui
comportent le mot clés anthropocene et sont
datés de 2011 sur le site de l'université de
Nice - Je cherche des images libre de droits pour
illustrer mon cours sur anthropocene - Je cherche des images similaires à
http//grandquebec.com/upl-files/ours_polaire.jpg - Quelle est la référence bibliographique originale
du document comportant l'extrait suivant
La maîtrise de lénergie mécanique a été le fait
dartisans et de techniciens souvent étrangers
aux cercles scientifiques
41Exercices (suite)
- je souhaite lire l'ouvrage l'origine des
espèces de C. Darwin comment faire ?
Conseillez-moi. - Je souhaite être averti par mail des nouvelles
publications de la revue dont l'ISSN est
1869-1099 ? Conseillez-moi. - Quel est le titre de louvrage dont lisbn est
9782343002538 - Je cherche le document dont le titre est
Conservation and social-ecological systems in
the 21st century of the Anthropocene era . - Je cherche l'article de la revue Nonprofit and
Voluntary Sector Quarterly de l'éditeur Sage
journals intitulé Volunteerism Research A
Review Essay , Conseillez-moi. - Je veux lire la totalité de l'ouvrage dont le
titre est The Pacific Northwest Research
Station's biodiversity initiative ... .
Conseillez-moi. - Je souhaite avoir un aperçu des publications de
Stevan Harnad, conseillez-moi - Quelle est l'invention notable de Theodore Maiman
? conseillez-moi
42Vos questions
?