Title: D
1Détecteurs de fautes pour réseaux dynamiques
- P. Sens, L. Arantes, M. Bouillaguet
- Projet REGAL
2Plan
- Détecteurs de fautes non fiables
- Implémentation asynchrone
- Caractéristiques des réseaux dynamiques
- Algorithmes
- Performances
3FLP 85
- Impossible de résoudre le consensus de façon
déterministe - Asynchrone
- Réseau fiable
- 1 seul crash
- Idée
- Impossible de différencier un processus
défaillant dun processus lent - La décision peut dépendre dun seul vote
4Contourner FLP 85
- Changer le problème
- k-agreement Cha90
- Plusieurs valeurs peuvent être décidées
- Consensus probabiliste BO83
- Des processus peuvent ne pas terminer
- Systèmes partiellement synchrones DDS87
- Les bornes sont non connues, valables uniquement
à partir dun moment - Algorithmique dépendante du système
- Les détecteurs de défaillances non fiables CT96
- Algorithmique en asynchrone (indépendante du
système) - Hypothèses plus facilement utilisables
5Détecteur de défaillances
- Oracle local sur chaque nœud
- Fournit une liste des processus suspectés dêtre
défaillants - Informations non fiables
- Possibilité de fausses suspicions
s
p
s
s
r
r
q
LENT
Complétude un processus défaillant doit être
détecté comme défaillant Justesse un processus
correct ne doit pas être considéré comme
défaillant
s
t
s
s
r
u
s
r
6Classes de détecteurs
Justesse Justesse Justesse Justesse
Forte Faible Finalement forte Finalement faible
Complétude forte P S ?P ?S
- Complétude forte
- Il existe un instant à partir duquel tout
processus défaillant est suspecté par tous les
processus corrects - Justesse
- Forte aucun processus correct nest suspecté
- Faible il existe au moins un processus correct
qui nest jamais suspecté - Finalement forte il existe un instant à partir
duquel tout processus correct nest plus suspecté
par aucun processus correct - Finalement faible il existe un instant à partir
duquel au moins un processus correct nest
suspecté par aucun processus correct - Consensus résoluble avec ?S
- Impossible à implémenter en asynchrone
7Implémentations basées sur les temporisateurs
?H
p
q
Dto
Dto
p up
p up
Détecteur de q
p down
?H
p
q
Dto
Dto
p up
p up
Détecteur de q
p down
8Implémentations asynchrones
- Mostefaoui03
- Hypothèses
- Ensemble de processus connus
- Réseau maillé / fiable
- f crashs au maximum
- pas de temporisateur
- Basé sur un mécanisme de requêtes-réponse
- Principe nœud pi
- Envoyer requête aux n nœuds
- Attendre n-f réponses
- Construire lensemble des suspects
- Réception requête
- Renvoyer lensemble des réponses recus
9Caractéristiques réseaux dynamiques
- Nombre de nœuds inconnu
- Graphe non complet
- Mobilité
10Modèle
- Nombre de nœuds inconnu
- f fautes maximum
- Chaque nœud possède un range de transmission
contenant au moins d nœuds (densité) - Communication fiable
- Hypothèse temporelle
- Certains nœuds (les nœuds relais) doivent avoir
la Responsivness Property répondre parmi les
premiers
11F-covering network
12Algorithmes (1)
- Variables du processus i
- range i
- suspected i ensemble des suspects
- mistake i les dernières erreurs
- K i la connaissance des voisins directs
13Algorithmes (2)
14Exemple
15Exemple
16Exemple
17Exemple
18Preuve
- Preuve de ltgtS (voir rapport)
- Nécessité de propriété de responsivness Il
existe dans chaque intersection au moins un nœud
qui répond parmi les premiers
19Extension pour la mobilité
- Mobilité limitée les propriétés de densité et
f-covering doivent maintenue - Idée Lorsque la mobilité est détectée retirer
le nœud des K du range source
20Algorithme avec mobilité
21Performances - Configurations
22Performances temps de détection
23Performances temps de détection
24Performances Justesse
25Performances - Mobilité
26Conclusion
- Problèmes ouverts
- F-covering trop fort lalgorithme
marcherait avec des hypothèses plus faibles - Le consensus
- Perspectives
- Algorithme moins dépendant de la densité
- Etendre la mobilité
27Référence
- Titre
- Asynchronous Implementation of Failure Detectors
with partial connectivity and unknown
participants - Auteur
- Pierre Sens, Luciana Arantes, Mathieu Bouillaguet
- Rapport de recherche RR6088
- hal.inria.fr