Title: Peer-to-Peer Systems
1 Peer-to-Peer Systems
G r u p p o 12
Content-Based Routing of Path Queries in
Peer-to-Peer Systems Georgia Koloniari and
Evaggelia Pitoura
Ingargiola SalvatoreMontauti Andrea Pompei Fabio
2 Sommario
- Introduzione
- Sistemi Peer-to-Peer
- Filtri di Bloom
- Organizzazione reti P2P Content-Based
- Risultati Sperimentali
- Conclusioni
3 Introduzione
- Migliorare le performance di information
retreaving in sistemi P2P
- Ipotesi di lavoro
- Contenuto nodi documenti XML schema-less
sintetizzati mediante filtri di Bloom
multilivello - Organizzazione rete P2P Content-Based
- Tipologia query path queries (XPath-like)
4 Sistemi P2P Stato dellArte
- Sistema Peer to Peer ibrido
- impiega un server centrale per ottenere
meta-informazioni sull'identità dei Peer che
posseggono le informazioni richieste. - Napster e OpenNap
- Sistema Peer to Peer puro
- I Peer sono connessi direttamente tra di loro.
- Non è necessario un server principale.
- Query routing flooding, indici decentralizzati.
- Gnutella e Freenet
5 Filtro di Bloom
- Un Bloom Filter è un vettore di bit definito da
due parametri - Array di M bit
- K funzioni di Hash indipendenti con CDom in 1,M
- I bit del filtro sono usati per codificare in
modo efficiente un insieme di N oggetti. - Per Costruire un Bloom filter si scorrono uno
dopo laltro gli oggetti dellinsieme. Applicando
K funzioni hash ad ogni oggetto si ottengono K
valori hash, ogni valore rappresenta la posizione
di un bit che deve essere settato ad uno. - N.B. più di una chiave può settare lo stesso
bit.
6 Filtro di Bloom esempio
7 Filtri di Bloom multilivello
- Filtri di Bloom semplici inadeguati per
sintetizzare la struttura multilivello dei
documenti XML.
- Soluzioni proposte
- Breadth Bloom Filters (BBF)
- Depth Bloom Filters (DBF)
8 Breath Bloom Filter
XML ltsportgt ltmotogt lt/motogt ltautogt
ltf3000gtlt/f3000gt ltf1gtlt/f1gt lt/autogt lt/sportgt
9 BBF filter-match operation
Root query /sport/auto/f1
10 Depth Bloom Filter
XML ltsportgt ltmotogt lt/motogt ltautogt
ltf3000gtlt/f3000gt ltf1gtlt/f1gt lt/autogt lt/sportgt
11 DBF filter-match operation
Root query /sport / auto / f1
12 Risultati Sperimentali
BBF DBF con filtri maggiori di 78.000 bit
Migliori performance di BBF con elevato numero
di elementi
13 Struttura gerarchica reti P2P
14 Content-Based
- Struttura gerarchica organizzata non più sulla
prossimità dei nodi bensì sulla similarità dei
loro contenuti
- Operazioni analizzate
- Join
- Query routing
- Update CountSum, BitSum
15 Content-Based Join
XML ltfotogt ltcalendariogt ltmodellegt
lt/modellegt lt/calendariogt lt/fotogt
Similarity m d(Nx, Ny)
Funzione Hash
N1 N6 N7 N2
Nx 9 6 5 7
Threshold 6
16 Content-Based Query routing
Path query //calendario/modelle
A
17 Content-Based Query routing
Path query //calendario/modelle
18 Content-Based Query routing
Path query //calendario/modelle
19 Content-Based Query routing
XML ltfotogt ltcalendariogt ltmodellegt
lt/modellegt lt/calendariogt lt/fotogt
Path query //calendario/modelle
20 Content-Based Update
CountSum
BitSum
0 0 1 0
0 0 2 0
1 0 1 1
3 0 2 5
0 0 1 0
0 0 2 0
1 0 1 1
2 0 2 2
1 0 1 1
1 0 1 2
1 0 1 1
2 0 1 3
1 0 1 1
1 0 1 2
1 0 1 1
2 0 1 3
21CountSum
BitSum
1 0 1 1
3 0 3 5
1 0 1 1
2 0 2 2
1 0 1 1
1 0 1 2
1 0 1 1
1 0 1 1
1 0 1 1
1 0 1 2
1 0 1 1
1 0 1 2
2
1
0
1
0
22CountSum
BitSum
1 0 1 1
3 0 3 4
1 0 1 1
2 0 2 2
1 0 1 1
3 0 3 5
1 0 1 1
1 0 1 1
1 0 1 1
1 0 1 1
1 0 1 1
1 0 1 2
1 0 1 1
1 0 1 2
1 0 1 1
1 0 1 1
1 0 1 1
1 0 1 1
1 0 1 1
1 0 1 2
2
1
0
1
0
23CountSum
BitSum
1 0 1 1
3 0 3 4
1 0 1 1
2 0 2 2
1 0 1 1
3 0 3 3
1 0 1 1
2 0 2 1
1 0 1 0
1 0 1 0
1 0 1 0
1 0 1 0
1 0 1 1
1 0 1 1
1 0 1 1
1 0 1 1
1 0 1 0
1 0 1 0
1 0 1 0
1 0 1 0
1 0 1 1
1 0 1 1
1 0 1 1
1 0 1 1
2
1
0
1
0
24CountSum
BitSum
1 0 1 1
3 0 3 4
1 0 1 1
2 0 2 2
1 0 1 1
3 0 3 3
1 0 1 1
2 0 2 1
1 0 1 1
1 0 1 1
1 0 1 1
1 0 1 1
1 0 1 0
1 0 1 0
1 0 1 0
1 0 1 0
1 0 1 1
1 0 1 1
1 0 1 1
1 0 1 1
1 0 1 0
1 0 1 0
1 0 1 0
1 0 1 0
2
1
0
1
0
25CountSum
BitSum
1 0 1 1
3 0 3 5
1 0 1 1
2 0 2 2
1 0 1 1
3 0 3 4
1 0 1 1
1 0 1 2
1 0 1 1
1 0 1 1
1 0 1 1
1 0 1 1
1 0 1 1
1 0 1 2
1 0 1 1
1 0 1 2
1 0 1 1
1 0 1 1
1 0 1 1
1 0 1 1
2
1
Con il metodo Bitsum meno scambi di messaggi
0
1
0
26 Risultati Sperimentali
In sistemi content-based convergenza più veloce
Con filtri multilivello minor numero di salti per
completare la query
27 Conclusioni
- Dal processo dicotomico dellanalisi sperimentale
si evince che il miglioramento delle performance
nellinformation retreaving può essere ottenuto
mediante
- Organizzazione gerarchica Content-Based
- Filtri di Bloom multilivello BBF
- BitSum come implementazione dei contatori
28 Bibliografia
- G. Koloniari, E. Pitoura. (2004) Content-Based
Routing of Path Queries in Peer-to-Peer Systems.
In Proceedings of the 9 Intenational Conference
on Extending Database Technology, pages 29-47. - G. Koloniari, E. Pitoura. Filters for XML-based
Service Discovery in Pervasive Computing.
Computer Science Dept, University of Ioannina,
Greece. - X. Gong, W. Qian, Y. Yan, A. Zhou. Bloom
Filter-based XML Packets Filtering for Millions
of Path Queries. Department on Computer Science
and Enngineering Fundan University, Shanghai,
China. - N. Gioia. (2004) Un sistema Peer-to-Peer per
linterrogazione distribuita di dati XML. Tesi di
Laurea, Università degli studi di Pisa.
29 Peer-to-Peer Systems
G r u p p o 12
Content-Based Routing of Path Queries in
Peer-to-Peer Systems Georgia Koloniari and
Evaggelia Pitoura
Ingargiola SalvatoreMontauti Andrea Pompei Fabio