Otto-von-Guericke - PowerPoint PPT Presentation

About This Presentation
Title:

Otto-von-Guericke

Description:

Otto-von-Guericke Universit t Magdeburg Arbeitsgruppe Data and Knowledge Engineering Institut f r Technische und Betriebliche Informationssysteme – PowerPoint PPT presentation

Number of Views:306
Avg rating:3.0/5.0
Slides: 15
Provided by: unil189
Category:
Tags: guericke | leipzig | otto | von

less

Transcript and Presenter's Notes

Title: Otto-von-Guericke


1
  • Otto-von-Guericke Universität Magdeburg
  • Arbeitsgruppe Data and Knowledge Engineering
  • Institut für Technische und Betriebliche
    Informationssysteme
  • Effizientes Routing in verteilten skalierbaren
    Datenstrukturen
  • Leipzig, 27.02.2003
  • Erik Buchmann, Klemens Böhm
  • buchmannkboehm_at_iti.cs.uni-magdeburg.de

2
Merkmale von Peer-to-Peer Systemen
  • alle Knoten gleichberechtigt, keine Trennung
    Client - Server
  • dynamisch skalierbar auf sehr viele, unabhängige
    Rechner
  • jeder neue Teilnehmer bringt neue Ressourcen ein
  • wirtschaftlicher Betrieb, keine Rechenleistung
    auf Vorrat

3
Peer-to-Peer Datenstrukturen
  • Zahlreiche Anwendungen, z.B.
  • Index- oder Speicherstruktur bei DBMS
  • Object Lookup in sehr großen Datenbeständen /
    sehr vielen Rechnern
  • Auslieferung von Webseiten
  • Operationen
  • put(Key,Value), get(Key)
  • Selbstorganisation, selbständige Entscheidungen
    über Replikation, Lastausgleich, Datenverteilung
  • Varianten
  • CAN, Chord, Pastry, P-Grid etc.

4
Content-Adressable Networks
  • Jeder Knoten
  • hat eigenen, n-dimensionalen Schlüsselbereich
    (Torus)
  • kennt alle Nachbarn seines Schlüsselbereichs
  • leitet Messages an Nachbarn in Richtung des Ziels
    weiter

5
Routing im CAN
  • Operationen put(Key,Value), get(Key)
  • Transformation der Anwendungs-schlüssel in
    CAN-Schlüssel (Schlüssel) ? k0,k1,...,kn
    "www.erikbuchmann.de" ? 81256,12445
  • Nachrichten an den Knoten weitergeben, dessen
    Schlüsselraum den geringsten Abstand zum
    Zielpunkt aufweist
  • Kritische Größe Message Hops pro Operation

6
Vorschlag 1 Kontaktdaten-Cache
  • zusätzlich zu den Nachbarn weitere Knoten in der
    Kontaktliste halten
  • veraltete / unvoll-ständige Infor-mationen
    möglich
  • Informationsbe-schaffung ohne zusätzliche Messages

7
Fragen im Zusammenhang mit dem Kontaktdaten-Cache
  • Wahl der richtigen Größe des Cache
  • zu klein ineffektiv
  • zu groß veraltete Einträge, hoher
    Ressourcenverbrauch
  • Wahl der optimalen Ersetzungsstrategie
  • wenig veraltete Einträge, kurze Wege zu häufig
    nachgefragten Datenobjekten
  • Nutzen bei realen Daten
  • unser Szenario Einsatz bei einem Web-Service

8
Durchführung der Experimente
  • Simulationsumgebung
  • PC-Cluster aus 32 Rechnern 2GHz-P4, 2 GB RAM, 100
    MBit-Ethernet
  • CAN-Prototyp
  • 100.000 Knoten
  • 1.000.000 Abfragen
  • 2D-Schlüsselraum
  • Experimente sowohl mit künstlich generierten
    als auch mit echten Testdaten

9
Experiment 1 Cache-Größe
  • bereits geringe Cache-Größe verringert Messages
    um 2/3

10
Vorschlag 2 Lokalitätserhaltende
Schlüsselabbildung
  • Eingriff bei der Abbildung von Anwendungsschlüssel
    n auf CAN-Schlüssel
  • Klassisch Gleichverteilung derSchlüsselwerte
  • z.B. Hash-Funktion
  • soll gleichmäßige Auslastung sicherstellen
  • keine Berücksichtigung der Abfragelokalität
  • Lokalitätserhaltende Schlüsselabbildung
  • Abruf benachbarter Objekte zu konstanten Kosten

11
Realisierung lokalitätserhaltender
Schlüsselabbildung
  • Beispiel URLs

Schlüsselraum des CAN
Schlüsselwerte /iti_dke/ /iti_dke/lehre/ /iti_dke
/lehre/ecommerce.html /buchmann/index.htm /buchm
ann/styles.css /buchmann/back.jpg /buchmann/empt
y.gif /buchmann/logo.jpg /buchmann/progrs.htm /
buchmann/arrowleft.gif /buchmann/main.gif /buchm
ann/arrowright.gif
12
Experiment 2 Schlüsselabbildung
Gleichverteilung (Zufallsgenerator) Mittlere
Anfragelokalität (Künstliche Websurfer) Hohe
Anfragelokalität (Webserver-Log)
  • Zahl der Messages konnte nahezu halbiert werden!

13
Vorschlag 3 Caching-Strategie
  • Optimierung des Kontaktdaten-Cache durch Wahl
    einer Verdrängungsstrategie
  • Experimente Random, LRU, LRD, LFU, ISD
  • ISD Inverse Square Distribution
  • für P2P-Datenstrukturen entwickelt
  • Wahrscheinlichkeit für ein Node im Cache
    umgekehrt proportional zum Quadrat der
    überbrückten Distanz
  • Aber Ersetzungsstrategie hat keinen großen
    Einfluß

14
Zusammenfassung und Ausblick
  • wir haben
  • ein prototypisches, flexibel anpassbares
    Content-Adressable Network
  • einen Cluster, auf dem auch 500.000 parallel
    arbeitende Peers möglich sind
  • erste Anwendungen und realistische Testszenarien
  • erste Erfolge
  • winziger Cache für Kontaktdaten beschleunigt
    Routing
  • die lokalitätserhaltende Abbildung der
    Anwendungs- schlüssel steigert die
    Routing-Performanz weiter
  • zukünftige Vorhaben
  • Entwicklung von Anwendungen, Replikation,
    Lastausgleich
Write a Comment
User Comments (0)
About PowerShow.com