Title: Evaluation de l
1Evaluation de leffet des traitements en
situation observationnelle par utilisation des
modèles structuraux marginaux
Une application à lévaluation de limpact des
antirétroviraux sur le devenir clinique des
patients infectés par le VIH
- Emilie Lanoy INSERM U720 UPMC Univ Paris 06
- GDR Statistique et Santé
- 14 novembre 2008
- Université Paris V Descartes
2Bibliographie sélective
- Robins. Marginal Structural Models and Causal
Inference in Epidemiology - Hernán. Marginal Structural Models to Estimate
the Causal Effect of Zidovudine on the Survival
of HIV-Positive Men - Epidemiology 2000 11550-70
- Hernán. A structural Approach to Selection Bias.
- Epidemiology 2004 15615-25
- Sterne. Long-term effectiveness of potent
antiretroviral therapy in preventing AIDS and
death a prospective cohort study - Lancet 2005 366378-84
- Hernán. Estimating causal effects from
epidemiological data - JECH 2006 60578-86
- Robins and Hernán. Causal inference book.
- Causal Inference (Chapman Hall/CRC, 2009) Ă
paraître - http//www.hsph.harvard.edu/causal/
3Problématique (1)
- Exemple (VIH) effet du traitement
antirétroviral sur la survie ajusté sur le taux
de CD4 - Le taux de CD4 est dépendant du temps
- Le taux de CD4 est influencé par ladministration
du traitement antirétroviral - Le taux de CD4 influence la survie et la
prescription de traitement antirétroviral (en
épidémiologie, on parle alors de biais
dindication)
4Problématique (2)
- Estimation de leffet dun facteur dépendant du
temps (exposition, traitement), ajusté sur des
covariables, quand une des covariables - est dépendante du temps
- prédit lévénement mais aussi les valeurs du
facteur étudié (1) - est influencée par les valeurs antérieures du
facteur (2) - Cette covariable est un facteur de confusion
(confounder)
5Problématique (3)
- Le facteur de confusion entraîne un biais de
causalité - Association structurelle entre une exposition
(ex traitement) et un événement (le décès) qui
ne découle pas de leffet causal de lexposition
sur lévénement - Exposition (ex traitement) et événement (le
décès) ont des causes communes (taux de CD4 ) - Exposés (traités) et non exposés (non traités) ne
sont pas interchangeables
biais dindication Epidémiologie ? biais de
causalité Statistique, Econométrie
6Problématique (4)
- Représentation graphique causal Directed
Acyclic Graphs - On veut estimer leffet du traitement sur la
survenue de décès
At traitement antirétroviral reçu au temps t
Lt taux de lymphocytes CD4 au temps t, facteur
de confusion sur le chemin causal Y événement
décès U réel niveau dimmunosuppression A et
L sont des covariables dépendantes du temps
confounder
Judea Pearl, UCLA (1988,1995,2000)
7Problématique (5)
- Comment bloquer le chemin causal pour mesurer
leffet de A sur Y? - Design de létude
- Dans les essais thérapeutiques, on tire au sort
lattribution du traitement L, le taux de CD4,
facteur de confusion, nest alors plus sur le
chemin causal - Analyse (si le biais de causalité na pu être
prévenu, par exemple si utilisation de données
observationnelles) - Modèles structuraux marginaux pondérés sur la
probabilité inverse de traitement
8Principe (1)
- Blocage du chemin causal sur lequel se trouve le
facteur de confusion L par création dune
pseudo-population dans laquelle, Ă chaque
instant, la probabilité dêtre traité nest plus
liée aux facteurs pronostiques mesurés - Dans la pseudo-population
- Les facteurs de confusion sont supprimés
- Leffet de lexposition est le mĂŞme que dans la
population cible
NB il sagit uniquement des facteurs mesurés
9Principe (2)
- Calcul pour chaque sujet Ă chaque temps du
rapport de risque causal - PrYa11/PrYa01
- en supposant linterchangeabilité
conditionnelle au sein de chaque niveau des
facteurs de confusion L - Introduction du contrefactuel quel serait
lĂ©vĂ©nement si le traitement Ă©tait contraire Ă
celui effectivement observé ? - Pondération par linverse de probabilité de
traitement en fonction de ses antécédents
cliniques L - Effet du traitement sur la survenue de
lĂ©vĂ©nement mesurĂ© par un modèle de Cox Ă
risques proportionnels pondérés par linverse de
probabilité de traitement
10Hypothèses
- Prise en compte uniquement de ce qui est mesuré
?tirage au sort dans un essai qui contrĂ´le ce qui
est mesuré et ce qui ne lest pas. - Hypothèse de calcul des probabilités inverses de
mise au traitement recueil au cours du temps de
toutes les variables décrivant les facteurs
associés à la prescription du traitement (taux de
lymphocytes CD4, charge virale, survenue
dévénements cliniques) - Condition de positivité dans chaque niveau de
L, il doit y avoir dans léchantillon, des
patients exposés et non exposés au traitement
11Glossaire
- IPW Inverse probability weighting , pondération
par inverse de probabilité, méthode appropriée
dajustement sur tous les facteurs de confusion
mesurés avant la mise au traitement - MSMs Marginal Structural Models, nouvelle
classe de modèles causaux utilisés pour estimer
leffet dun facteur dépendant du temps en
présence de facteurs de confusion (confunders) - IPTW inverse-probability-of-treatment-
weighted estimator estimateur des MSM
12(No Transcript)
13(No Transcript)
14(No Transcript)
15(No Transcript)
16Illustration
- Evaluer leffet de lAZT sur la survie en
estimant les paramètres IPTW dun modèle de Cox Ă
structure marginale - Modélisation et estimation des paramètres du
modèle de Cox MSM - Programmation logicielle (SAS)
- Hernán. Marginal Structural Models to Estimate
the Causal Effect of Zidovudine on the Survival
of HIV-Positive Men - Epidemiology 2000 11550-70
17Population sélectionnée
- 2 178 hommes VIH ayant eu un suivi dans la MACS
entre mars 86 et oct 94 - Patients non SIDA et naïfs dARV à leur 1ère
visite éligible - Suivi médian 69 mois
- 1 296 patients ont reçu de lAZT
- 750 décès
18Cofacteurs étudiés
- Variable dintérêt administration dAZT
- Cofacteurs biologiques âge, taux de CD4, de
CD8, de globules blancs, de globules rouges
et de plaquettes - Facteurs cliniques présence oui/non dun
symptôme (parmi fièvre, candidose orale,
diarrhée, perte de poids, leucoplasie chevelue,
herpès, zona) survenue oui/non dune affection
classant SIDA - Mesurés en baseline et/ou au cours du temps
19Modèle de Cox classique (1)
- Modèle de Cox classique avec le traitement
dépendant du temps, estimation du risque de décès
proportionnel en t - ?T(t/A(t),V ) ?0(t) exp(?1A(t) ?2 V )
- où T est le délai entre linclusion et le
décès du sujet - A(t) est lexposition à lAZT du sujet au temps t
- A(t) est lantĂ©cĂ©dent dexposition du sujet Ă
lAZT au temps t - V est le vecteur des covariables en baseline
20Modèle de Cox classique (2)
- ?1 , obtenu par maximisation de la vraisemblance
du Cox partiel, est un estimateur sans biais de
?1 - Mais, lestimation de leffet causal de lAZT
sur la survie est biaisée quand on introduit les
facteurs de confusion notées L
21Hypothèses pour la démonstration
- Hypothèses pour la suite de la démonstration
- Dès qu1 sujet est mis sous AZT, il reste sous
AZT jusquĂ la fin du suivi - Le pas de temps est mensuel les covariables
dépendantes du temps changent au plus une fois
par mois
22Ecriture du modèle de Cox causal (1)
- Introduction des facteurs de confusion
dépendants du temps notés L dans un modèle de Cox
classique ? Biais de causalité - Ajustement du modèle par pondération par la
probabilité de traitement inverse (IPW Inverse
probability weighting) (cf. Robins)
23Ecriture du modèle de Cox causal (2)
- Notion de contrefactuel
- conditionnel contraire aux faits qui sont
observés nous avons observé quelquun à C1 mais
il aurait pu être à C0 (Cox) - Soient T délai observé jusquau décès, le
traitement observé et les antécédents des autres
covariables - Considérons le paramètre inconnu ?0 dans le délai
U à lissue duquel le sujet serait décédé si,
éventuellement contrairement aux faits observés,
le traitement navait pas été reçu. - ?0 peut être contrefactuel (Robins)
- On souhaite reconstituer ce qui se serait passé
si le patient navait pas eu de traitement
(hypothèse qui peut ĂŞtre contraire Ă
lobservation)
24Ecriture du modèle de Cox causal (3)
- Formalisation des effets contrefactuels
- Pour chaque antécédent dexposition à lAZT, a
?a(t),?t 0?, - soit Ta (V.A.) le délai jusquau décès
- a, antécédent dAZT depuis le début du suivi
(peut être contrefactuel de lantécédent observé)
- Ta nest observé que pour les a qui correspondent
aux antécédents dAZT observés (Ta T ) - Risque proportionnel du modèle de Cox causal MSM
?Ta(t,V ) ?0(t) exp(?1a(t) ?2 V )
25Ecriture du modèle de Cox causal (4)
- où ?Ta(t,V), risque de décès à t, parmi les
sujets avec les covariables V en baseline, issus
dune population source contrefactuelle oĂą tous
les sujets ont un antécédent a dAZT jusque t - où ?1 et ?2, inconnus et ?0 risque de décès en
baseline - Estimateur de ?1 pondéré par la probabilité
inverse de traitement (IPTW inverse-probability-o
f-treatment-weighted estimator)
?Ta(t,V ) ?0(t) exp(?1a(t) ?2 V )
26Calculs des poids stabilisés (1)
- Etape 1 calcul des poids stabilisés sous
lhypothèse que tous les décès sont observés (pas
de censure à droite) - int(t) , le plus grand entier inférieur ou égale
Ă t - k , entier indiquant le nombre de mois complets
depuis le début du suivi - Par définition, A(-1)0
- Chaque facteur du dénominateur est la probabilité
que le sujet reçoive son traitement observé au
mois k sachant ses antécédents de traitement et
de facteurs pronostiques - Chaque facteur du numérateur est la probabilité
que le sujet reçoive son traitement observé
sachant ses antécédents thérapeutiques et ses
covariables en baseline (mais pas ses facteurs
pronostiques dépendant du temps, V ? L(0) )
oĂą
27Calculs des poids stabilisés (2)
- Etape 2 Introduction de la censure Ă droite
- Soit C indicateur de censure Ă droite (C(t)1 si
censure, 0 sinon), - pour estimer ?1, le modèle de Cox pondéré est
ajusté par une nouvelle pondération - Où A(-1)0 et C(-1)0 par définition
28Calculs des poids stabilisés (3)
- Etape 3 Produit des poids stabilisés
- swi(t) x swi?(t) a pour dénominateur la
probabilité du sujet i davoir eu jusque en t ces
antécédents dAZT et de censure - estimateur du paramètre causal ?1 pondéré par le
produit swi(t) x swi?(t) est consistant sous
lhypothèse quil permet aussi dajuster en
fonction des biais de sélection dus à la perte de
vue
29Propriétés du modèle structural marginal (1)
- La pondération permet dobtenir une estimation
IPTW de la vraisemblance partielle. - Si les facteurs dépendants du temps sont tous
mesurés et inclus dans L(t) alors la pondération
crée, à un temps t pour un ensemble de facteurs
de risque, une pseudo-population où - L(t) ne prédit plus la mise sous AZT en t
- Lassociation causale entre AZT et mortalité est
la même que dans la population cible étudiée - ? ?1, estimateur IPTW du paramètre ?1 du modèle
de Cox classique, convergera vers ?1 qui peut
être interprété comme leffet causal de lAZT sur
la mortalité (sur une échelle log rate ratio)
30Propriétés du modèle structural marginal (2)
- Pour chaque V , le modèle est structuré (causal)
pour la distribution marginale des variables
contrefactuelles Ta - Cest un modèle MSM (Marginal Structural Model)
où ?1, causal log rate ratio pour lAZT - exp(?1), interprétation causale du ratio du taux
de décès en t des patients exposés à lAZT
comparés aux non exposés - estimateur IPTW de ?1 consistant sous lhypothèse
que L(t) contienne toutes les covariables
associées à la mise sous traitement
?Ta(t,V ) ?0(t) exp(?1a(t) ?2 V )
31Estimation de swi(t) x swi?(t) par régression
logistique pondérée poolée (1)
- Estimation de swi(t)
- Délai de mise sous AZT considéré comme un délai
de survie (où décès mise sous AZT) - Modélisation de la probabilité de mise sous AZT
par un modèle logistique poolé (1 observation 1
personne-mois) avec un intercept dépendant du
temps - ex modèle logit prA(k)0/A(k-1)0,L(k)
?0(k)?1L(k)?2V(k) - sujets vivants et non censurés au mois k
- sujets ayant déjà commencé lAZT au mois k
- pi(k)expit (?0(k)?1L(k)?2V(k)) probabilité
estimée du sujet i de ne pas être mis sous
AZT au mois k sachant quil nest pas sous
AZT au mois k-1
ajusté sur
32Estimation de swi(t) x swi?(t) par régression
logistique pondérée poolée (2)
- Estimation du produit dénominateur de swi(t)
- ? pi(u) si le sujet nest pas sous AZT au mois k
- 1- pi(t) ? pi(u) si le sujet est sous AZT
depuis t ? k - Remarques
- Même démarche pour estimer le numérateur (sans
L(k)) - Lestimateur du dénominateur devant être
consistant, on ne peut avoir destimateur
individualisé pour chaque mois k de lintercept
?0(k) et il faut emprunter la puissance des
sujets mis sous AZT les autres mois - En supposant ?0(k) constant sur une fenĂŞtre de 3
mois - En lissant k (courbes de régression, courbes de
lissage,) - pour swi?(t), même démarche (censure prise en
compte)
k u0
33Quelques remarques sur la programmation
logicielle
- Les programmes logiciels standards ne permettant
pas une pondération dépendante du temps, les
estimateurs IPTW ne peuvent être calculés
directement, il faut donc - Programmer les régressions logistiques poolées
pondérées avec une observation par personne-mois - Ne pas utiliser les pondérations sur la
modélisation de Cox standard du logiciel (proc
phreg) car les corrélations intra-sujets
invalident les résultats - Tenir compte du fait quil y a des mesures
répétées par sujet en utilisant les programmes
GEE (proc genmod) qui fournissent des
estimateurs robustes de la variance pour les
données corrélées et donc des intervalles de
confiance à 95 correctes pour les paramètres
Generalized Estimating Equations
34Effet causal de lAZT données de la MACS (1)
- Risque relatif de décès associé à lAZT dans le
modèle de Cox univarié standard - RRAZT 3,6
- IC95(RRAZT) 3,0 4,3
- Risque relatif de décès associé à lAZT dans le
modèle de Cox ajusté sur V, vecteur des
covariables en baseline - RRAZT 2,3
- IC95(RRAZT) 1,9 2,8
35Effet causal de lAZT données de la MACS (2)
- Calcul des poids stabilisés swi(t) x swi?(t) pour
chaque patient-mois - Préparation dun fichier trié de données MAIN
avec un enregistrement par patient et par mois - Calcul des swi(t) x swi?(t) comme moyennes de 4
régressions logistiques poolées - 2 où la variable réponse binaire mis sous AZT
donne la probabilité du patient davoir ses
propres antécédents dAZT observés jusquau mois
t étant donnés - V covariables en baseline (/model 1/)
- V , et L covariables dépendantes du temps
(/model 2/) - 2 où la variable réponse binaire indique la
censure en ajoutant la variable dépendante du
temps binaire indiquant si le patient a été mis
sous AZT Ă t-1 - V covariables en baseline (/model 3/)
- V , et L covariables dépendantes du temps
(/model 4/)
36Effet causal de lAZT données de la MACS (3)
- Noms des variables des modèles dans SAS
- en baseline AGE_0 (âge) YEAR_01 YEAR_02 YEAR_03
(année dinclusion) CD4_01 CD4_02 (CD4) CD8_01
CD8_02 (CD8) WBC_01 WBC_02 (globules blancs)
RBC_01 RBC_02 (globules rouges) PLAT_01 PLAT_02
(plaquettes) SYMPT_0 (symptĂ´mes) MONTH (mois)
MONTH1-MONTH3 (fonctions polynĂ´miales
spéficifiques de MONTH calculées avec une macro
RCSPLINE lissage permettant destimer
lintercept dépendant du temps) - Dépendant du temps CD4_1 CD4_2 CD8_1 CD8_2 WBC_1
WBC_2 RBC_1 RBC_2 PLAT_1 PLAT_2 SYMPT AIDS (SIDA) - A mise sous AZT et C censure (mois de mise sous
AZT noté ZDV_M)
37Effet causal de lAZT données de la MACS (4)
- / MODEL 1 /
- PROC LOGISTIC dataMAIN
- where MONTHltZDV_M or ZDV__M.
- model AAGE_0 YEAR_01 YEAR_02 YEAR_03
- CD4_01 CD4_02 CD8_01 CD8_02
- WBC_01 WBC_02 RBC_01 RBC_02
- PLAT_01 PLAT_02
- SYMPT_0
- MONTH MONTH1-MONTH3
- output outmodel1 ppzdv_0
- run
- / MODEL 2 /
- PROC LOGISTIC dataMAIN
- where MONTHltZDV_M or ZDV_M.
- model AAGE_0 YEAR_01 YEAR_02 YEAR_03
- CD4_01 CD4_02 CD8_01 CD8_02
- WBC_01 WBC_02 RBC_01 RBC_02
- PLATE_01 PLATE_02 SYMPT_0
- CD4_1 CD4_2 CD8_1 CD8_2 WBC_1 WBC_2
- RBC_1 RBC_2 PLAT_1 PLAT_2 SYMPT AIDS
- MONTH MONTH1-MONTH3
- output outmodel2 ppzdv_w
- run
- / MODEL 3 /
- PROC LOGISTIC dataMAIN
- model CA AGE_0 YEAR_01 YEAR_02 YEAR_03
- CD4_01 CD4_02 CD8_01 CD8_02
- WBC_01 WBC_02 RBC_01 RBC_02
- PLATE_01 PLATE_02
- SYMPT_0
- MONTH MONTH1-MONTH3
- output outmodel3 ppunc_0
- run
- / MODEL 4 /
- PROC LOGISTIC dataMAIN
- model CA AGE_0 YEAR_01 YEAR_02 YEAR_03
- CD4_01 CD4_02 CD8_01 CD8_02
- WBC_01 WBC_02 RBC_01 RBC_02
- PLATE_01 PLATE_02 SYMPT_0
- CD4_1 CD4_2 CD8_1 CD8_2
- WBC_1 WBC_2 RBC_1 RBC_2
- PLAT_1 PLAT_2 SYMPT AIDS
- MONTH MONTH1-MONTH3
- output outmodel4 ppunc_w
- run
38Effet causal de lAZT données de la MACS (5)
- 4 fichiers de données créés par patient-mois avec
les variables dorigine et celle prédite par le
modèle (1 pzdv_0,2 pzdv_w, 3 punc_0 et 4
punc_w) - Dans une Ă©tape DATA, jointure des 4 fichiers dans
le fichier MAIN_W et calcul, en multipliant pour
chaque patient, les valeurs prédites mois après
mois, - du numérateur k2_0 et du dénominateur k2_w de
swi?(t) (Ă partir de punc_0 et punc_w des
modèles 3 et 4) - du numérateur k1_0 et du dénominateur k1_w de
swi(t) (Ă partir pzdv_0 et pzdv_w des
modèles 1 et 2) - jusquau mois de mise sous AZT inclus
- en multipliant par 1-pzdv_w le mois de mise
sous AZT - Obtention du poids stabilisé swi(t) x swi?(t)
- stabw
39Effet causal de lAZT données de la MACS (6)
DATA MAIN_W merge model1 model2 model3 model4by
ID MONTH / variables ending with 0 refer to the
numerator of the weights variables ending with w
refer to the denominator of the weights / /
reset the variables for a new patient / if
first.id then dok1_01 k2_01 k1_w1
k2_w1end retain k1_0 k2_0 k1_w k2_w /
Inverse probability of censoring weights
/ k2_0k2_0punc_0k2_wk2_wpunc_w / Inverse
probability of treatment weights / / patients
not on zidovudine / if zdv_mgtday or zdv_m .
then do k1_0k1_0pzdv_0k1_wk1_wpzdv_wend
/ patients that start zidovudine this month
/ else if zdv_mday then do k1_0k1_0(1-pzdv_
0)k1_wk1_w(1-pzdv_w)end / patients that
have already started zidovudine / else
dok1_0k1_0k1_wk1_wend stabw(k1_0k2_0)/(k1_
wk2_w) /Stabilized weights / run
40Effet causal de lAZT données de la MACS (7)
- Estimation des paramètres du modèle de Cox MSM
- PROC GENMOD où la variable dichotomique réponse D
indique si le patient est décédé ou non au cours
du mois - Loption repeated permet dobtenir des
estimations robustes des erreurs standards - Spécification de la variable ID identifiant le
patient subject ID et du type de matrice de
corrélations indépendante type ind - Pondération par stabw par linstruction
scwgtstabw
proc genmod dataMAIN_W class id model DA
AGE_0 YEAR_01 YEAR_02 YEAR_03 CD4_01 CD4_02
CD8_01 CD8_02 WBC_01 WBC_02 RBC_01 RBC_02 PLAT_01
PLAT_02 SYMPT_0 MONTH MONTH1-MONTH3/linklogit
distbin scwgt stabwrepeated subjectID/typeind
run
41Le risque relatif de décès associé à lAZT estimé
par le modèle de Cox MSM est RRAZT
0,7 IC95(RRAZT) 0,6 1,0
42Perspectives (1)
- Evaluation de limpact des antirétroviraux sur la
survenue dévénements neurologiques classant SIDA
- Problématique
- pénétration des antirétroviraux
- dans le système nerveux central
- ?
- diminution de la réplication virale
- dans le liquide céphalo-rachidien
- Est-ce que les traitements antirétroviraux de
meilleure pénétration dans le système nerveux
central permettent de limiter le risque de
survenue dun événement neurologique classant
SIDA ?
Letendre et al. Arch Neurol 2008
43Perspectives (2)
- Objectif estimer linfluence de la pénétration
des antirétroviraux dans le système nerveux
central sur la survenue dun événement
neurologique classant SIDA - Population détude données issues du projet HIV
Causal - Collaboration de cohortes européennes et
nord-américaines (participation de ANRS CO4-FHDH) - 119 929 patients inclus
- Grandes variétés de thérapeutiques administrées
(différents systèmes de soins)