Title: Diapositiva 1
1Cercare e organizzare Teresa
Numerico tnumerico_at_uniroma3.it
2Menone e il dilemma della conoscenza
- MENONE Ma come cercherai, o Socrate, quello che
ignori pienamente? E, delle cose che ignori quale
ti proporrai di cercare? e se per avventura ti
imbattessi in quella, come taccorgerai che
quella che non conosci è proprio quella che
cerchi? - SOCRATE Intendo che vuoi dire, Menone in che
disputazione mi metti! Vuoi dire che nessuno può
cercare ciò che sa, né ciò che non sa perché,
ciò che sa non lo dovrebbe cercare, perché lo sa
né ciò che non sa, perché non saprebbe quello che
deve cercare.
Platone Menone 80d-81a
3La ricerca di conoscenza secondo Descartes
- At verò in omni quaestione, quamvis aliquid
debeat esse incognitum, alioqui enim frustra
quaererentur, oportet tamen hoc ipsum certis
conditionibus ita esse - Regula XIII, Regulae ad directionem ingenii
4La legge dell'archivio
- L'archivio è anzitutto la legge di ciò che può
essere detto, il sistema che governa
l'apparizione degli enunciati - Ma l'archivio è anche ciò che fa sì che tutte
queste cose dette non si ammucchino all'infinito
in una moltitudine amorfa, ma che si
raggruppino in figure distinte, si compongano le
une con le altre secondo molteplici rapporti - È evidente che non si può descrivere
esaurientemente l'archivio di una società, di una
cultura, di una civiltà
Foucault M.(1980) Larcheologia del sapere,
Rizzoli, Milano, p.173-174
5La violenza dellarchivio secondo Derrida
- Ogni archivio è istitutivo e conservativo,
rivoluzionario e tradizionale - Conserva, preserva, salva ma in un modo
innaturale costruendo la legge da rispettare
nella conservazione - Non cè archivio senza un luogo in cui può essere
con-segnato, senza una tecnica di ripetizione, e
senza una certa esteriorità. Non cè archivio
senza un di-fuori - Ogni archivio lavora a priori contro se stesso
J. Derrida Archive Fever, University of Chicago
Press, 1998 7-12 passim
6Un diverso modello di ricerca social Serendipity
- Serendipity the faculty of making fortunate
discoveries by accident - Il nome nasce secondo Horace Walpole (1754) da un
racconto The three Princes of Serendip (Sri
Lanka) as their highnesses traveled, they were
always making discoveries, by accidents and
sagacity, of things which they were not in quest
of....
7I motori di ricerca tra tecnica ed etica
- Problemi tecnologici
- La completezza e la freschezza delle informazioni
- La libertà di accesso alle informazioni tutte le
pagine sono uguali per gli algoritmi di
ordinamento? - Problemi etici
- La privacy nella ricerca sul web
- I rischi di censura
8Gli elementi di un motore di ricerca
Fonte Langville Meyer 2006 11
9Le 3 parti di un SE
- Il crawl la navigazione dei crawler o spider nel
web che acquisisce tutti i contenuti delle pagine
e segue la navigazione attraverso i link - Il sistema di indicizzazione
- Il sistema di risposta alle query degli utenti
10L'ordine dei link e la libertà di info
- Gli algoritmi di ranking sono essenziali per i
motori di ricerca xké mettono ordine nella lista
di link di risposta a una query - Google ha avuto successo a causa del suo
algoritmo PageRank (PR) che attribuisce
autorevolezza alle pagine sulla base di quanto
sono linkate da altre pagine autorevoli - L'autorevolezza è una nozione ricorsiva e
numerica per PR una pagina è connessa è
autorevole, è autorevole, maggiore è il peso
del suo link verso un'altra pagina
11Fonte Barabási 2002
12Il ruolo degli hub nelle reti
- Nelle reti casuali tutti i nodi hanno circa lo
stesso numero di link. - Le reti sociali sono invece dotate di alcuni nodi
cosiddetti hub o connettori che sono molto più
interconnessi degli altri e permettono che ci
siano pochi gradi di separazione tra gli altri
nodi della rete. - Sono gli hub che dominano le reti e le fanno
apparire come piccoli mondi. E sono loro che
creano i collegamenti brevi tra tutti i nodi - Se ci sono 6 gradi di separazione media tra i
nodi di una rete, la separazione da un hub per
qualunque nodo è spesso solo 1 o 2
13Il web frammentato
- Facendo una ricerca sulla qualità dei risultati
dei motori di ricerca si scoprì che ogni motore
di ricerca non riesce a coprire più di un quarto
di tutto il web - Inoltre Andrei Broder nel 1999 esaminando un
campione di circa un quinto della rete dellepoca
stabilì che trattandosi di una rete orientata
essa era costituita di sottoreti solo
parzialmente interconnesse tra loro - Questo vale non solo per il web, ma per tutte le
reti orientate (i cui link non sono reversibili)
14I continenti di una rete orientata
Fonte Barabási 2002
15Freschezza delle informazioni
- LE PAGINE PIU' LONGEVE RISCHIANO DI ESSERE MEGLIO
INDICIZZATE DI QUELLE PIU' RECENTI
16Proteggere le minoranze nel Web
- NON E' DETTO CHE LE INFORMAZIONI MEGLIO CONNESSE
SIANO ANCHE LE PIU' ATTENDIBILI
17I motori e lo spam
- Spam boosting (rilevanza)
- Spam hiding (rilevanza)
- Link spam (autorevolezza)
18Link spam le farm
Target
La slide è opera di Mathan Rochlitz
19I difetti tecnici dei MR
- Il problema della freschezza delle informazioni,
più è grande il repository più si rischia di
utilizzare informazioni vecchie (i crawler, ci
mettono del tempo per effettuare lintero
viaggio) - La mancanza di capacità di indicizzare documenti
e informazioni che siano scritte usando diversi
linguaggi di codifica, per esempio i Database
sono ignorati dai motori di ricerca a meno che
questi non si interfaccino con una metastruttura
XML - La bassa cucina dellanalisi linguistica che
viene fatta per analizzare il contenuto delle
pagine - Il suggerimento delle query che orienta non solo
la risposta, ma anche la formulazione della
domanda
20Cosa non va socio-filosoficamente?
- Sono scatole nere con in input le nostre
interrogazioni e in output la lista ordinata dei
link in risposta alla query, senza fornire
dettagli su come labbiano definita - Non proteggono le minoranze culturali chi ha più
link vince la guerra della visibilità - Sono cognitivamente pregiudiziali cercano di
indovinare le intenzioni dellutente e rispondono
a tono - Detengono un enorme potere sulla costruzione
della conoscenza e lo amministrano a fini
commerciali
21Esercizi
- Trova i dettagli della politica di censura di
internet in Cina o, comunque, un report
dettagliato e affidabile sullargomento - Trova lanalisi più recente sulla condizione del
giornalismo americano, con particolare riguardo
alle scelte economiche dei fruitori - Ce un recente (2008) rapporto delle relazioni
con internet dei giornali americani. Cercalo - Trova i dati sulla pubblicità sulla stampa in
italia di febbr. 2010 - Trova i dati medi di Repubblica, Corriere e La
Stampa di diffusione e vendita tra dicembre 2008
e dicembre 2009
22Unapprofondimento sui problemi
socio-politico-filosofici dei motori
- Valutazione, censura, privacy e controllo
23 Laspetto cognitivo del controllo della rosa
epistemica associata ad ogni interrogazione
24Google Book Search
Possibile per google Sostituire tutto questo?
Che conseguenze avrebbe?
25Comportamento informativo del ricercatore del
futuro (gen 2008)
- Ricerca di informazione orizzontale
- Comportamento da scoiattolo
- Autorità e fiducia sono basate sui marchi
favoriti (e.g. Google etc.) - Digital literacy e information literacy non vanno
di pari passo - Linformation literacy dipende molto da
educazione e altri fattori sociali - Ricerca segnalata in Metitieri 2009
http//www.bl.uk/news/pdf/googlegen.pdf
26Motori di ricerca e privacy
27Motori di ricerca e censura
28Che fare?
- Chiedere maggiore trasparenza della scatola nera
- Formare le giovani generazioni allinformation
literacy - Sviluppare tecnologie alternative ai MR
- Essere consapevoli di rischi e opportunità dei
diversi strumenti di ricerca disponibili
29Azioni di resistenza
- Essere creativi e non comunicativi
- Chiudere gli strumenti di comunicazione (ogni
tanto) - Vivere senza lasciare (troppe) tracce digitali
- Non giudicare le persone e il mondo solo in
relazione alla loro rappresentazione digitale - Dimenticare o distruggere le memorie digitali
30Altre cose da fare
- La variazione è un fattore chiave per la
trasmissione della conoscenza e della cultura - Variazione vs standardizzazione?
- Supportare le diverse tecnologie di ricerca (e.g.
P2P search dynamic strategies), semantica,
visuale, sociale etc. - Cross-generation information literacy e
educazione - Stabilire fiducia e autorevolezza controllando
una molteplicità di fonti attraverso uno sforzo
cross mediale
31Alcuni strumenti di ricerca -) sulla ricerca
32Epic 2015
- http//www.albinoblacksheep.com/flash/epic
- Le tappe principali di epic 2015 in italiano
http//blog.mytech.it/index.php/2006/11/27/epic-20
15/ - Una traduzione del primo epic 2014 in Italiano
http//nextmedia.blogspot.com/2004/12/le-mie-previ
sioni-per-i-prossimi-10.html
33Per saperne di più link
- Un sito per controllare Google e le sue attività
(non molto aggiornato) www.google-watch.org - La privacy policy di Google http//www.google.com/
privacypolicy.html - Una comparazione delle query filtrate su
Google.cn fino a prima dellattuale crisi di
rapporti china-google http//opennet.net/google_ch
ina - Opennetinitiative si propone di monitorare tutti
i paesi in cui si attuano politiche di filtraggio
della rete http//www.opennetiniti
ative.net/ - Electronic privacy information center
http//www.epic.org/ - Il Blog di John Battelle http//battellemedia.com/
34Informazioni su motori e metamotori di ricerca
- Meta-Search Engines
- http//www.lib.berkeley.edu/TeachingLib/Guides/Int
ernet/MetaSearch.html - Wikipedia
- http//en.wikipedia.org/wiki/Metasearch_engine
- Il Blog di John Battelle sui motori di ricerca
- http//battellemedia.com/
- Guida ai motori di ricerca
- http//searchenginewatch.com/
- Motoridiricerca
- http//www.motoridiricerca.it/
- http//www.motoridiricerca.it/mappa-motori.htm
35Strumenti di ricerca specializzati
- LexisNexis Raccolta di informazioni giuridiche
- http//www.lexisnexis.com/
- Answers.com offre risposte provenienti da
dizionari, enciclopedie ecc., ecc. - http//www.answers.com/
- http//answers.yahoo.com/
- Globalspec the engineering search engine
- http//www.globalspec.com/
- Internet movie database, il database del cinema
mondiale - http//www.imdb.com
36Il web 2.0
- Il web 2.0 secondo lantropologo americano
Michael Wesch http//www.youtube.com/watch?v6gmP
4nk0EOEeurl
37Social bookmarking
- http//www.blinklist.com/
- http//delicious.com/
- http//boingboing.net
- http//digg.com
- . Per maggiori dettagli cè la pagina di
Wikipedia list of social software
38Altri strumenti interessanti per la ricerca
- Social library http//www.librarything.com/
- Free Dictionary http//www.wiktionary.org/
- Wikisource, fonti opensource http//en.wikisource.
org/wiki/Main_Page - http//www.arxiv.org/ un archivio di articoli
scientifici opensource - Larchivio delle risorse di internet
http//www.archive.org/index.php - Virtual library http//vlib.org
39Top 25 web 2.0 search engines
- http//oedb.org/library/features/top-25-web20-sear
ch-engines
40Multimedia searching
- VideoSurf http//www.videosurf.com/
- Blinkx http//www.blinkx.com/
- Retrievr http//labs.systemone.at/retrievr/
- Oneriot http//www.oneriot.com/
- Google audio indexing http//labs.google.com/gaudi
- Pixsy http//www.pixsy.com/
- Liveplasma http//www.liveplasma.com/
- Vdoogle http//vdoogle.com/
41Sistemi di visualizzazione e altri motori
- Kartoo http//www.kartoo.net/eng/index.html
- Ujiko http//ujiko.com/v2a/flash.php?langueen
- Touchgraph http//www.touchgraph.com/TGGoogleBrows
er.html - Exalead il motore francese che offre varie
opportunità di ricerca http//www.exalead.com
42Metamotori e altri strumenti gestiti da esperti
- Powerset http//www.powerset.com/
- Kosmic http//www.kosmix.com
- Clusty http//clusty.com/
- Ixquick http//ixquick.com/
- Grokker http//grokker.com/
- Chacha http//www.chacha.com/
- Deepdyve http//www.deepdyve.com/
- Freebase http//www.freebase.com
- Wolfram Alpha http//wolframalpha.com
43Alcune risorse fornite dalle biblioteche
- La directory del Librarians Internet Index
http//lii.org - Infomine una biblioteca virtuale di risorse
digitali per studenti e docenti
http//infomine.ucr.edu - Il catalogo di tutti gli opac online
http//www.worldcat.org - Il catalogo del Sistema bibliotecario nazionale
http//www.internetculturale.it/moduli/opac/opac.j
sp
44Per saperne di più
- Barabási A.L. et al. (2001) Parasitic
Computing, Nature 412894-897 - Barabási A.L. (2002) Linked, Perseus Publishing,
Cambridge (MA) trad. it. Link, Einaudi, Torino,
2004. - Battelle J. (2006) Google e gli altri, Raffaello
Cortina, Milano. - Bawa M., Manku G. and Raghavan P. (2003) SETS
Search Enhanced by Topic Segmentation, in Proc.
of the 26th Intl. ACM Conf. on Research and
Development in Information Retrieval (SIGIR),
URL http//citeseer.ist.psu.edu/bawa03sets.html.
- Gori M. and Numerico T. (2003) Social Networks
and web minorities, Cognitive System Research,
vol. 4 355-364. - p Lawrence S. and Giles C.L. (1998) Searching
for the World Wide Web, Science (3 Apr) 280
98-100. - Numerico T., Bowen J. P. and Filippini-Fantoni S.
(2005) Search Engines and On-line Museum Access
on the Web, Museum and the Web, - Raghavan P. (2002) Information retrieval for
enterprise content Upgrade Vol. III No.35-8.
(). - Sherman C. Price G. (2001) The invisible web,
Information today, Inc. Medford, New Jersey. - Witten I., Gori M., Numerico T. (2007) Web
Dragons inside the myths of search engines,
Morgan Kaufmann, Los Angeles
45Per saperne di più/2
- Deleuze G. (1990) Pourparlers, Les éditions de
Minuit, Paris. - Derrida J. (1998) Archive Fever, University of
Chicago Press, Chicago. - Descartes R. (2000) Regole per la guida
dellintelligenza, Bompiani, Milano - Foucault M. (1969/1980) Larcheologie du savoir,
Gallimard, Paris trad. it. Archeologia del
sapere, Rizzoli, Milano, 1980. - Langville A.W. Meyer C.D. (2006) Googles
PageRank and Beyond, Princeton Univ. Press,
Princeton. - Licklider J.C.R. (1965) Libraries of the future,
The MIT Press, Cambridge, MA. - Numerico T., Fiormonte D., Tomasi F. (2010)
lumanista digitale, Il Mulino, Bologna. - ULC (University College London)(2008) Information
behaviour of the researcher of the future, 11
January, http//www.bl.uk/news/pdf/googlegen.pdf