Title: Statistiques de balayage : analyse des
1Statistiques de balayage analyse des
clusters dévènements
- Journée SMAI IMdR 6 février 2009
2- Clusters et statistiques de balayage
introduction sur un exemple simple - Méthodes de simulation
- Monte-Carlo
- Petri net
- Méthodes markoviennes
- Chaîne de Markov simplifiée, simple fenêtre de
balayage - Chaîne de Markov simplifiée, double fenêtre de
balayage - Chaîne de Markov complète
- Résultats et Comparaison des méthodes
- Conclusion
36 août Le vol 1153 de Tuninter sabîme en mer
près de Palerme
2 août Le vol 358 dAir France sort de piste en
atterrissant à Toronto
Fréquence moyenne des accidents aériens 0,88
par période de 22 jours.
14 août Le vol 522 dHélios sécrase sur un
massif près dAthènes
23 août Le vol 204 de la Tans sécrase à
lapproche en Amazonie
16 août Le vol 1153 de la West Caribbean se
crashe au Venezuela
Une telle série semble très improbable mais
Les statistiques de balayage permettent dévaluer
ou dapprocher la probabilité doccurrence dun
tel cluster dévènements.
4Objectif évaluer la probabilité dobserver un
cluster de k évènements ou plus dans une fenêtre
temporelle de longueur w balayant une période de
taille donnée T.
5- Solutions
- Simulation de Monte Carlo
- directe (implémentée dans un algorithme dédié)
- supportée par un réseau de Pétri
- Chaînes de Markov
6- Simulation de Monte-Carlo directe
- Les dates daccidents sont générées
aléatoirement selon la loi considérée et de
manière à recouvrir la période dobservation
0,T - La liste des dates est scannée jusquà
observation dun cluster - Une variable Nb_Cluster est incrémentée dune
unité
La quantité recherchée est donnée par
où N est le nombre de répétitions de la
simulation.
7- Réseau de Petri animant une simulation de
Monte-Carlo - Processus de comptage simple (simple counting
medium) - 2 places et 2 transitions
- Initialement
- la place 1 est marquée dune pièce
- Nb_Cluster est égal à zéro
- Les variables ei (i 1 à k) indiquent les dates
de k accidents successifs - Lindex I permet de calculer en continu le temps
écoulé entre les évènements i et (ik-1) - Nb_Cluster passe à 1 dès que k accidents se
produisent dans une fenêtre de longueur w
8MODELES MARKOVIENS
Notation
- Xi variable aléatoire donnant le nombre
dévènements sur i-1,i - N(u,w) variable aléatoire comptant le number
dévènements sur la fenêtre u,uw - p la probabilité quun évènement se produise sur
un sous-intervalle de longueur 1
9PREMIER MODELE MARKOVIEN
Gain de la variable aléatoire Xuw1
Perte de la variable aléatoire Xu1
10PREMIER MODELE MARKOVIEN
Etats E0, E1, E2 respectivement 0, 1 ou 2
évènements dans la fenêtre courante E3
3 évènements ou plus dans la fenêtre courante
Chaîne de Markov
Probabilité dun cluster de 3 évènements ou plus
dans une fenêtre de taille w10
11PREMIER MODELE MARKOVIEN
Nombre ditérations
12PREMIER MODELE MARKOVIEN
La probabilité dobserver un cluster de k3
évènements ou plus dans une fenêtre de taille
w10 balayant la période de longueur T365 est
donnée par le produit MNX avec N356
13DEUXIEME MODELE MARKOVIEN
Problème le modèle autorise des chemins qui
ne sont pas réalisables en pratique
14DEUXIEME MODELE MARKOVIEN
Partage de la fenêtre de balayage en deux
sous-fenêtres
15DEUXIEME MODELE MARKOVIEN
La matrice de transition est une matrice de
taille DD avec Dk(k-1)1
16TROISIEME MODELE MARKOVIEN
Modèle complet
Notation état (i1,i2,,im) pour i1i2im1 et
il0 sinon
17TROISIEME MODELE MARKOVIEN
Matrice de transition
18TROISIEME MODELE MARKOVIEN
La probabilité dobserver un cluster de k3
évènements ou plus dans une fenêtre de taille
w10 balayant la période de longueur T365 est
donnée par le produit MNX avec N356
19Résultats
Discrétisation Jour Jour Heure Heure
Méthodes Bernoulli Poisson Bernoulli Poisson
Monte Carlo direct 0.1250 0.1329 0.1310 0.1329
RdP, Monte Carlo 0.1225 0.1317 0.1251 0.1317
Premier modèle markovien 0.0991 0.1176 0.1274 0.1280
Double fenêtre de balayage 0.1014 NaN 0.1296 NaN
Modèle markovien complet 0.1028 0.1217 NaN NaN
20Conclusions
- Les résultats obtenus dans le cadre du modèle de
Bernoulli convergent vers ceux obtenus dans le
cadre du modèle de Poisson lorsque le pas de
discrétisation tend vers 0. - A notre connaissance, il nexiste pas de méthode
exacte pour résoudre en un temps très court
le problème de lestimation de la probabilité
doccurrence dun cluster dévènements - Les méthodes proposées permettent dévaluer ou
dapprocher cette probabilité en un temps très
acceptable. - Les méthodes proposées sont très différentes,
faisant appel à la simulation, à des approches
combinatoires, ou aux chaînes de Markov. - Cependant, nous observons quelles donnent des
résultats quasi identiques lorsque la
discrétisation est suffisamment fine.