Title: Qu
1Formation SIG-Santé
Epidémiologie, analyse spatiale et géostatistique
Marc SOURIS
Master Géographie de la Santé Paris X. Nanterre
Laboratoire de Cartographie Appliquée IRD - Bondy
2Sommaire
- Epidémiologie classique
- Epidémiologie spatiale
- Epidémiologie spatiale et géostatistique
- Epidémiologie spatiale et SIG
3Lépidémiologie
- Généralités
- Lépidémiologie étude de la distribution des
états de santé dans les populations humaines et
de leurs déterminants - Lépidémiologie joue maintenant un rôle central
en recherche étiologique dans le domaine des
pathologies dorigine multifactorielle - Les principes et méthodes de lépidémiologie
sarticulent autour de la notion de risque
(probabilité dêtre malade) et de facteur de
risque (variable ayant une influence sur le
risque) - Les facteurs de risque ne sont pratiquement
jamais une cause nécessaire (des malades sans
facteur de risque) ou suffisante (de nombreux non
malades avec facteur de risque) au niveau
individuel. La causalité se situe au niveau des
probabilités - Un objectif établir un modèle permettant
dévaluer la probabilité dêtre malade, en
fonction de facteurs de risque à déterminer
4Lépidémiologie
- Généralités
- Lexpression des modèles est basée sur le calcul
mathématique des probabilités - Ex. le modèle logistique, qui exprime la
probabilité dun individu dappartenir à un
groupe. Il est valide si le quotient des
probabilités conditionnelles sexprime comme
lexponentielle dune fonction affine du vecteur
des variables explicatives, ce qui est le cas de
la plupart des distributions de la famille
exponentielle. - Lestimation des coefficients utilise les
données de situations observées, et des méthodes
de minimisation (en général, maximum de
vraisemblance)
5Lépidémiologie
- Une démarche générale
- Rechercher des facteurs de risque, par lanalyse
des situations observées - Rechercher la forme dun modèle pour évaluer les
probabilités - Ajuster les coefficients du modèle
- De nombreuses méthodes ont été développées pour
la recherche de facteur de risque, au niveau
individuel comme au niveau des populations - statistiques univariées (moments,
distributions), - statistiques bivariées (régressions, différence
au sein de deux sous-groupes, évaluation de
facteurs de confusion) et multivarées - statistiques spatiales
6La recherche de facteurs de risque
- Les évènements en santé de multiples facteurs
de risque potentiels - Présence du pathogène
- Présence dun vecteur ou dun réservoir
- Conditions de vie, comportements, probabilités
de contact, exposition - à un environnement
- Facteurs génétiques
- Facteurs évènementiels aléatoires, etc.
- Certains facteurs ne sont pas distribués de
façon aléatoire (dans le temps et/ou dans
lespace). Le résultat nest peut-être donc pas
distribué de façon aléatoire dans le temps ou
dans lespace - Inversement, une situation non aléatoire (dans
le temps et/ou dans lespace) des évènements de
santé peut nous aider à déterminer des facteurs
de risque. Il faut déterminer la probabilité
doccurrence dune situation réelle observée,
dans le temps et dans lespace, par rapport à un
modèle
7Lépidémiologie
- La statistique
- La statistique a pour objectif général dévaluer
des probabilités à partir de situations observées - Elle peut être descriptive (pour décrire une
situation observée de façon synthétique) ou
inférentielle (pour décrire les processus à
partir de situations observées, ou pour décrire
les situations observées à partir déchantillons) - Les causes multifactorielles induisent une
variabilité aléatoire pour chacun des facteurs
indépendants (la distribution des résidus est
aléatoire Poisson, binomiale, normale) - Lorsque les situations observées sont
appréhendées à partir déchantillons, pris dans
la population globale, les statistiques utilisées
pour évaluer la probabilité des situations
observées sont sujettes à la variabilité due à
léchantillonnage
8Lépidémiologie
- Statistiques classiques
- Les statistiques classiques élémentaires
concernent les mesures centrales (moyenne,
médiane, mode), les mesures de dispersion
(étendue, forme variance, écart-type, symétrie,
aplatissement), et les mesures de fréquence.
Lobjectif général est de rendre compte de la
distribution des valeurs prises par une variable,
quelle soit qualitative ou quantitative. - Les mesures dassociation rendent compte du
degré dassociation entre deux variables par
exemple, le coefficient r (Pearson) mesure le
degré dassociation entre deux variables
quantitatives.
9Épidémiologie classique
- Variables étudiées
- Données de comptage ou quantités absolues
- Rapports prévalence, incidence, densités,
risques, risques relatifs, odd-ratios
10Épidémiologie classique
- Les méthodes classiques permettent détudier les
relations entre les effets de la maladie et les
facteurs dexposition, en séparant les individus
en deux groupes - Étude de la variabilité dans des groupes
- Étude de la relation entre la différence des
effets et la différence des expositions - Les groupes sont basés sur un critère descriptif
- Etudes cas-témoins (groupes basés sur leffet de
la maladie) - Etudes de cohorte (groupes basés sur
lexposition à un facteur)
11Épidémiologie spatiale
- Lépidémiologie spatiale étudie la localisation
des individus ou des groupes dindividus, ou la
différence de distribution spatiale entre deux
groupes dindividus (en utilisant des distances,
des voisinages, etc.) - Une distribution significativement éloignée dune
distribution aléatoire indique soit la
non-indépendance des individus entre eux, soit
une relation avec un facteur lui-même
spatialement non-aléatoire - La localisation néchappe pas à la variabilité,
au contraire les facteurs non localisés
induisent une composante aléatoire dans la
distribution spatiale des évènements, et les
facteurs géographiques reliés au phénomène de
santé transmettent également leur variabilité
aléatoire (ex. les évènements naturels, risques
et climat)
12Épidémiologie spatiale
- Létiologie est toujours multifactorielle. Dans
les mêmes conditions environnementales, deux
épidémies ne se répètent jamais à lidentique et
ne donneront pas la même forme. La situation
réelle observée nest quune parmi beaucoup de
probables la variabilité est grande. Il est
nécessaire de poser des hypothèses pour générer
des situations probables, et dévaluer la
situation réelle observée parmi les situations
probables. - La localisation peut aider les situations
réelles présentent souvent une probabilité très
faibleDans certaines situations, la probabilité
doccurrence aléatoire dun agrégat ou dun forme
particulière est très faible. Ceci permet de
conserver comme aléatoires certaines situations,
et de considérer avec prudence les conclusions
lorsque le risque ? est gt 0.001 (et non 0.05). - La cartographie est utile, mais insuffisante
pour évaluer la probabilité dune situation
réelle observée
13Épidémiologie spatiale
- Les phénomènes naturels ou anthropiques
présentent souvent des distributions spatiales
non aléatoires - Beaucoup de phénomènes naturels sont continus
dans lespace ils présentent de
lautocorrélation est des tendances spatiales. - La distribution spatiale est le résultat de
nombreux facteurs, spatiaux et non spatiaux - Tendances spatiales et distributions de facteurs
géographiques - - Relations spatiales entre évènements
(attraction-répulsion, diffusion à partir dune
source ou dun réseau, voisinage et processus
infectieux)à un facteur de risque - - Autres facteurs non géographiques (composante
aléatoire - - Distribution aléatoire intrinsèque des
évènements
14Épidémiologie spatiale
- Processus spatio-temporels dans lémergence et
la diffusion - Processus démergence évènements inhabituels,
souvent spatialement aléatoires, avec une
distribution spatiale poissonniène. Des
conditions environnementales peuvent être
nécessaires (habitat écologique, présence dun
vecteur, etc.). - Processus de diffusion caractéristiques du
pathogène (infectiosité, persistance),
susceptibilité de la population et vulnérabilité,
relations entre population et environnement,
relations entre individus susceptibles et
caractéristiques du vecteur, etc. - Processus dextinction
- Pour évaluer les facteur environnementaux de
lémergence, il est nécessaire de séparer les
facteur environnementaux des relations entre
évènements
15Épidémiologie spatiale
- Cartographie de la maladie
- Visualisation de prévalence incidence, risques,
risques relatifs. Souvent basés sur un processus
dagrégation par transfert déchelle dans des
objets géographiques prédéfinis. Pour réduire les
différences de variabilité aléatoire entre
objets, il est possible davoir recours à un
ajustement bayésien (EBE) - Modélisation à partir des données observées
- Régression linéaire, régression logistique, de
Poisson, etc. Les modèles ne prennent pas en
compte les relations spatiales entre individus,
et doivent être maniés avec prudence dans le cas
des maladies infectieuses, car il supposent
lindépendance entre les observations.
16Épidémiologie spatiale
- Étude par objets, sur lensemble des objets
- Étude de la distribution spatiale dun
sous-ensemble de cas dans lensemble des objets - Variabilité spatiale du nuage de points
- Caractère aléatoire du nuage de points
- Recherche dagrégats spatiaux et classification
- Recherche de formes particulières du nuage de
points - Analyse spatio-temporelle
17Épidémiologie spatiale et géo-statistique
- Étude par individu, position et distribution
spatiale des évènements - Position absolue des évènements
- Les événements sont-ils distribués de façon
aléatoire, tenant compte de la position absolue
des objets initiaux (individus, maisons,
villages, etc.) ? - Position relative des évènements
- Situations aléatoires, agrégats (cluster),
formes, tendances - Continuité spatiale dune variable numérique
- Variogrammes, indices (Moran, Geary, G), LISA
- Analyse spatio-temporelle
- Processus démergence et de diffusion, index
cases - Modélisation de la diffusion
- Équations différentielles, IBM, deux approches
différentes
18Épidémiologie spatiale et SIG
- Analyse spatiale position et distribution
spatiale des évènements - La distribution spatiale des évènements de santé
doit toujours être évalués en prenant en compte
la distribution spatiale originale des objets - Les effets collatéraux ne peuvent être résolus
quavec une simulation MC
19Épidémiologie spatiale et SIG
- Analyse spatiale mesures de centralité
spatiale - Centre moyen (minimise la somme des carrés des
distances avec les points) - Centre médian, distance de Manhattan (minimise
la somme des distances avec les autres points) - Centre médian, distance euclidienne (minimise la
somme des distances avec les autres points) - Analyse spatiale mesures de dispersion
spatiale - Standard distance (écart-type de la distance de
chaque point au centre moyen). Ne prend pas en
compte la forme de la distribution spatiale. - Ellipse de déviation, définie par trois
paramètres (angle de rotation, dispersion le long
du grand axe, dispersion le long du petit axe)
20Épidémiologie spatiale et SIG
- Analyse spatiale Point Pattern Analysis
- Analyse les propriétés spatiales dun ensemble
de points, ou dun sous-ensemble dans un ensemble - Deux approches distinctes par point
(distances) ou par surface (densités) - Une approche par lanalyse de la densité locale
(quadrat analysis) - Une approche par lanalyse des relations
métriques entre les points (plus proches voisins)
21Épidémiologie spatiale et SIG
- Étude par individu, sur lensemble des
individus - Étude de la distribution spatiale dune valeur
numérique dans lensemble des individus - Recherche dune distribution non aléatoire
(autocorrélation spatiale, indices
dautocorrélation de Moran, de Geary, statistique
G) - Recherche dune tendance ou dune forme dans la
distribution spatiale de la valeur (?1/rn,
?sin(f(x)),)
22Études spatio-temporelles
- Étude de la relation entre les individus ou les
événements dans lespace et le temps - Trouver de clusters spatio-temporels
- - Test de Mantel et Knox
- - Reconstruction dun patron spatio-temporel,
indice de cas - - Fonctions de Kernel et processus démergence et
diffusion - - Scan statistiques
23Épidémiologie spatiale et SIG
- Agrégation des individus en sous-groupes
spatiaux, et étude des relations spatiales entre
les sous-groupes - Soit la localisation des individus nest pas
connue - Si on veut utiliser des rapports (incidences,
risques, ) qui ne peuvent être calculés que sur
des populations - Soit les données sont déjà agrégées sur une base
spatiale administrative - Leffet zone peut être important et doit être
inclus dans létude statistique, dans le modèle
deffet comme dans le modèle de mesure
24Épidémiologie spatiale et SIG
- Agrégation des individus en sous-groupes
spatiaux, et étude des relations spatiales entre
les sous-groupes - En agrégeant les individus par sous-groupes
spatiaux, on multiplie dabord les individus
étudiés, car on désagrège lensemble total en
sous-ensembles - La variabilité augmente, et est différente
suivant les groupes - La cartographie permet de représenter les
différences entre les groupes, mais il faut
vérifier la significativité de ces différences - Les processus dagrégation en sous-ensembles
fait remplacer des individus par des groupes,
caractérisés souvent par des valeurs moyennes
25Épidémiologie spatiale et SIG
- Agrégation des individus en sous-groupes
spatiaux, et étude des relations spatiales entre
les sous-groupes - On cherche implicitement les relations spatiales
de proximité, les tendances, les formes dans la
distribution spatiale - La variabilité est beaucoup plus grande, la
désagrégation fait perdre de la puissance
statistique - Léchelle dagrégation est importante
26Épidémiologie spatiale et SIG
- Utilité du SIG pour gérer données, échelles,
procédures dagrégations et géostatistique - Gestion de données spatiales (épidémiologie et
environnement) - Cartographie des maladies et EBE
- Géo-agrégation et transfert déchelle
- Interpolation spatiale
- Analyses spatio-temporelles
- Calculs statistiques et géostatistiques avec les
objets voisins et avec des relations de distance
27Lépidémiologie
- Lépidémiologie ne remplace pas la géographie
- un modèle nexplique pas les processus qui le
sous-tendent - les interrelations entre facteurs de risque sont
nombreuses - une réflexion synthétique est nécessaire
- certaines informations sont difficiles à
modéliser dans une description schématique - Lépidémiologie peut expliquer le comment ,
la géographie le pourquoi
28 Fin M. Souris, 2010