Title: Diapositive 1
1- Persistance de noyau dans les systèmes dynamiques
à grande échelle - V. Gramoli, A-M. Kermarrec, A. Mostéfaoui, M.
Raynal, B. Sericola
2Contexte
- Les systèmes dynamiques à grande échelle
- Les nœuds quittent et rejoignent le système
- Lorsquils reviennent il ne possèdent pas
forcément leurs données - Les nœuds ne peuvent maintenir une information
globale - Problème de persistance des données
- Pour une donnée, si tous les nœuds la détenant
quittent le système, cette donnée est perdue - Constatations sur les systèmes Peer-to-Peer
- Très dynamiques
- Jamais vides
3Motivation de la Persistence
- Disponibilité des données
- Répliquer sur suffisamment de noeuds
- Répliquer suffisamment fréquemment
- Cohérence atomique des données Disponibilité de
la dernière valeur écrite - Répliquer la valeur à jour (i.e., donnée
critique) - Sur suffisamment de noeuds
- Suffisamment fréquemment
- en dépit du dyamisme
4But
- Assurer la persistance des données en dépit du
dynamisme du système. - Défi majeur
- Etant donné
- La probabilité requise, p, et
- Le va-et-vient ( churn ) du système, v,
- Il faut recopier la donnée
- Ajuster la période de recopiage, d,
- Ajuster la taille de la recopie, q.
5Modèle du système
- Système distribué à grande échelle
- n nœuds interconnectés
- Chacun avec id unique
- Sans connaissance globale
- Système dynamique
- Les nœuds rejoignent/quittent le système.
- Un nœud rejoignant est nouveau.
- Donnée
- Une donnée est détenue par un sous-ensembles de
nœuds, le noyau.
6Modèle de va-et-vient ( churn ), v
- Va-et-vient
- Intensité du dynamisme du système.
- Il représente
- Le taux de départ et darrivée par nœud et par
unité de temps. - On observe le système à 2 instants
- Soit Q le noyau de départ, et q sa taille,
- Soit A les nœuds remplacés, et a sa taille,
- Soit Q le noyau après remplacement.
7Modèle de va-et-vient
Nœuds avec la donnée.
Nœuds sans la donnée.
t
temps
8Modèle de va-et-vient
Nœuds avec la donnée.
Nœuds sans la donnée.
t
temps
Le Noyau Q au temps t, Q q
9Modèle de va-et-vient
Nœuds avec la donnée.
Nœuds sans la donnée.
t
t d
temps
Après une période d 2
et avec un va-et-vient de v 0,2
Le Noyau Q au temps t, Q q
10Modèle de va-et-vient
Nœuds avec la donnée.
Nœuds sans la donnée.
t
t d
temps
Après une période d 2
et avec un va-et-vient de v 0,2
Les nœuds remplacés A, A a
Le Noyau Q au temps t, Q q
11Modèle de va-et-vient
Nœuds avec la donnée.
Nœuds sans la donnée.
t
t d
temps
Après une période d 2
et avec un va-et-vient de v 0,2
Les nœuds remplacés A, A a
Le noyau Q au temps td, Q q
Le Noyau Q au temps t, Q q
12Modèle de va-et-vient
- Evolution du nombre des nœuds initialement
présents - t0 n nœuds initiaux
- t1 n-nv n(1-v) nœuds initiaux
- ...
- ti n(1-v)i nœuds initiaux
- ti1 n(1-v)i - n(1-v)iv n(1-v)i1 nœuds
initiaux - On choisit a n-n(1-v)d le nombre de nœuds
remplacés après d unités de temps
13Disponibilité dune donnée
- Initialement, q nœuds ont la donnée
- Les nœuds remplacés sont choisis aléatoirement de
façon uniforme - Combien de copies de la donnée restent-il de
disponible après d unités de temps dans un
système avec va-et-vient v ?
14Disponibilité dune donnée
- Observation préliminaire
- Le nombre ß Q n A de nœuds qui avaient la
donnée et quittent le système est borné - max(0, a q - n) ß min(a, q)
a
b
15Disponibilité dune donnée
- Probabilité que ß k copies de la donnée aient
été remplacées ?
16Chercher une donnée
- Initialement, q nœuds ont la donnée.
- d unités de temps plus tard, on tire
aléatoirement et de façon uniforme q nœuds du
système. - Quelle est la probabilité quon trouve la donnée
critique après ces d unités de temps dans un
système avec va-et-vient v ?
17Chercher une donnée
- Probabilité de ne pas trouver la donnée
- Tirage aléatoire, uniforme et sans remise de q
nœuds. - Soit E Q \ A.
(évts disjoints)
18Chercher une donnée
- Probabilité de ne pas trouver la donnée
19Taille de Noyau pour n 104
la taille du noyau
a/n
proba de ne pas trouver la donnée
20Probabilité, dynamisme, durée de vie et noyau
- Variation du va-et-vient et de la probabilité
Proba de trouver
a/n
Taille du noyau pour
21Conclusion
- Retrouver une donnée est paradoxalement facile!
- Applications de stockage
- Modifier les données en q nœuds
- Accéder les données à jour en contactant q nœuds
- Les noyaux sont des quorums probabilistes
- Futures recherches
- Modéliser le churn en utilisant un modèle plus
réaliste (Markovien continue). - Spécifier un protocole pour la cohérence/persistan
ce probabiliste des données en systèmes
dynamiques.
22Des références
- Core Persistence in P2P Systems. Relating size to
Lifetime. - V. Gramoli, A.-M. Kermarrec, A. Mostéfaoui, M.
Raynal, B.Séricola - OTM06 Intl Workshop on Reliability in
Decentralized Distributed Systems - A Quorum based protocol for searching objects in
P2P ntwks. - K. Miura, T. Tagawa, and H. Kakugawa.
- IEEE Trans. on Parallel and Distributed Systems,
17(1)2537, 2006. - Probabilistic quorums for dynamic systems.
- I. Abraham and D. Malkhi.
- Distributed Computing, 18(2)113124, 2005.
- Reconfigurable distributed storage for dynamic
ntwks. - G. Chockler, S. Gilbert, V. Gramoli, P. M.
Musial, and A. A. Shvartsman. - In Proc. of 9th Intl Conf. on Principles of
Distributed Systems, 2005.