Title: Nombre de sujets ncessaires en recherche clinique
1Nombre de sujets nécessairesen recherche clinique
2Types détudes
- Problème destimation
- Nombre de sujets pour une précision de
lestimation - Problème de comparaison
- Nombre de sujets pour une puissance suffisante
pour montrer une différente attendue - Problème de prédiction
- Nombre de sujets pour mettre en évidence un
niveau de risque attendu
3Problème destimation
- Etude dun échantillon représentatif de n sujets
pour extrapoler les résultats observés à la
population entière dont est issu léchantillon
4Problème destimation
- Etude dun échantillon représentatif de n sujets
pour extrapoler les résultats observés à la
population entière dont est issu léchantillon - Estimation sur léchantillon de la mesure
- Évènement en terme de fréquence pobservé avec son
écart-type ?pq/n (1) - Mesure dune variable quantitative sous forme de
moyenne avec son écart-type sem (?s²/n) (2)
5Problème destimation
- Etude dun échantillon représentatif de n sujets
pour extrapoler les résultats observés à la
population entière dont est issu léchantillon - Estimation sur léchantillon de la mesure
- Évènement en terme de fréquence pobservé avec son
écart-type ?pq/n (1) - Mesure dune variable quantitative sous forme de
moyenne avec son écart-type sem (?s²/n) (2) - On montre que la mesure dans la population a 95
de chances de se situer dans lintervalle - (1) po ? ?? ?poqo/n
- (2) m ? ?? s/?n ?? 1,96 pour ??5
6Précision dune estimation
- Soit i la précision
- ? i correspond à lintervalle autour de
lestimation ponctuelle ? ?? ?pq/n ou ? ?? s?n - Pour une fréquence
- i ?? ?pq/n, en montant tout au carré i² ??² p
q /n - n ??²p q / i²
- Pour une moyenne
- i ?? s/?n, en montant tout au carré i² ??²s²
/n - n ??²s² / i²
7Exemples
- Observatoire de malades traités pour hépatite C
estimer le dadéquation à lAMM - Hypothèse 80 , précision 5 au risque ? 5
- ? n (1,96² x 0,80 x 0,20)/ 0,05² 246
- Hypothèse 60 , précision 3 au risque ? 5
- n (1,96² x 0,60 x 0,40)/ 0,03² 1025
- . Estimer le nombre de CD4 des malades sous
HAART. une petite étude préliminaire a montré une
variance de 4900 (s 70) - - précision de la moyenne à ? 20 au risque ? 5
- n (1,96² x 4900)/ 20² 48
- - précision de la moyenne à ? 15 au risque ? 2
- n (2,326² x 4900)/ 15² 118
8Problème de comparaison (1) de moyennes
- Rappel sur le principe des tests
9Problème de comparaison (1) de moyennes
- Rappel sur le principe des tests
- Formuler les hypothèses H0 µ1 µ2 H1 µ1
? µ2 formulation bilatérale
10Problème de comparaison (1) de moyennes
- Rappel sur le principe des tests
- Formuler les hypothèses H0 µ1 µ2 H1 µ1
? µ2 formulation bilatérale - Calculer la probabilité des observations sous H0,
connaissant la loi de distribution de la
différence m1-m2
11Problème de comparaison (1) de moyennes
- Rappel sur le principe des tests
- Formuler les hypothèses H0 µ1 µ2 H1 µ1
? µ2 formulation bilatérale - Calculer la probabilité des observations sous H0,
connaissant la loi de distribution de la
différence m1-m2 - Choisir la règle de décision on rejette ou non
H0 avec un certain risque derreur, càd pour une
valeur seuil L telle que l?l gt L
12Problème de comparaison (1) de moyennes
- Rappel sur le principe des tests
- Formuler les hypothèses H0 µ1 µ2 H1 µ1
? µ2 formulation bilatérale - Calculer la probabilité des observations sous H0,
connaissant la loi de distribution de la
différence m1-m2 - Choisir la règle de décision on rejette ou non
H0 avec un certain risque derreur, càd pour une
valeur seuil L telle que l?l gt L - Les 2 risques derreur
- De 1ère espèce ? P(rejet H0 si H0 vraie)
P(l?l gt seuil L si H0 vraie) - De 2ème espèce ? P(non rejet H0 si H1 vraie)
P(l?l lt seuil L si H1 vraie). 1- ? puissance
dun test P(rejet H0 si H1 vraie)
13Comparaison (1) de moyennes
- On ne peut pas calculer exactement ? car on ne
connaît pas la valeur exacte de ? µ1- µ2 - H1 est une hypothèse composite il faut
spécifier une hypothèse particulière. Il y a une
valeur de ? pour chaque valeur de µ1- µ2 - Réalité Conclusion du test
- valeur de ? rejet de H0 non rejet de H0
- H0 est vraie ? 0 ? 1- ?
- H1 est vraie ?H1 1 - ? ?
- ?H1 1 - ? ?
14Comparaison de 2 moyennes
- Distribution de la différence observée m1-m2
selon que H0 est vraie ou H1 est vraie en
supposant même ?²
15Comparaison de 2 moyennes
- Sous H0, µ1- µ2 suit une loi Normale de moyenne 0
et on rejettera H0 si m1-m2 gt L - P(m1-m2)gtlLl/H0 ? L-0 ??
- ? L ????1/n11/n2 ??²1/n11/n2
- Sous H1 on attend une différence µ1- µ2 ?,
différence minimale que lon souhaite montrer on
ne rejettera pas H0 si m1-m2 lt L, - P(m1-m2)ltL/H1 ? L - ? -?2? si
? lt50 - ? L ?-?2???1/n11/n2 ??²1/n11/n2
- Si on fait correspondre L et L on obtient
- ????1/n11/n2 ?- ?2???1/n11/n2
16Comparaison de 2 moyennes
- n1n2 ?²(???2?)² et si n1n2 alors n1n2/
n1n2 n/2 - n1n2 ?²
- ? n 2 ?²(???2?)²
- ?²
- Si on inclut dans chaque échantillon un nombre
nltn, on peut calculer a posteriori la puissance
quavait létude de montrer la différence
attendue ? - ?2? n ?² - 1,96 doù on tire ? en lisant
dans la table - 2 ?² la valeur de 2 ? puis la
puissance 1- ?
17Ex ?2? 1,0 ? 2? 0,32, ? 0,16, doù une
puissance de 0,84
18Problème de comparaison (2) de pourcentages
- Les hypothèses sécrivent H0 P1P2 H1
P1?P2 - On observe p1 et p2. On ne peut pas faire
lhypothèse dégalité des variances, P1Q1/n étant
forcément différent de P2Q2/n si H1 est vraie ?
changement de variable p ? y Arcsinus?p
(Arcsinus est la fonction inverse de la fonction
sinus ?p sin(y)) - Cette transformation angulaire permet
- Y suit une distribution proche de la Normale
- Var(Y) tant vers une constante 1/4n dès que n gt
20 - Dans la formule de comparaison de moyennes, on
remplace - ?² par ¼
- ? par (Arcsinus?p1 - Arcsinus?p2)
19Comparaison de 2 pourcentages
- Pour un test bilatéral
- n (???2?)²
- 2(Arcsinus?p1 - Arcsinus?p2)²
- et ?2? ?2n(Arcsinus?p1 - Arcsinus?p2) 1,96
20Table dArcsinus
21Cas des effectifs inégaux
- Essai thérapeutique 2 fois plus de malades dans
le groupe nouveau Ttt que dans le groupe placebo - Étude épidémiologique 2 témoins pour un cas
- ? en partant de 1/n1 1/n2 2/n en cas
deffectifs égaux - Pour n2/n1 2 on obtient n1 n/2 (11/2) et
n2 n/2(12) - Et de façon plus générale, pour n2/n1 ?
- n1 n/2 (11/ ?) et n2 n/2(1 ?)
- On calcule dabord n, effectifs égaux, puis n1 et
n2 en fonction de ? - n1 n2 est toujours supérieur à 2n
22Problème de prédiction
- M M-
- E a b R1 risque de maladie chez E
- E- c d R0 risque de maladie chez E-
- P 1-P
- Pour quantifier lassociation entre exposition et
maladie - Risque relatif RR R1 / R0
- Odds ratio OR R1 / (1 - R1) estimé par ad/bc
- R0 / (1 - R0)
- En labsence dassociation RR et OR 1
- En cas dassociation positive RR et OR gt 1
- Principe calculer le nombre de sujets
nécessaires E et E- pour montrer un OR choisi,
avec une puissance définie, connaissant la
fréquence de la maladie (R0) chez les E-
23Exemples numériques
- Evaluation du risque de cancer du foie sur
cirrhose chez les sujets atteints
dhémochromatose - Hypothèse le risque de cancer du foie chez les
cirrhotiques non hémochromatosiques est de 5 - Combien de malades pour montrer un risque 3 fois
plus grand avec une puissance de 80 - Résolution
- E- cirrhoses sans hémochromatose
- E cirrhoses sur hémochromatose
- R0 0,05, OR attendu 3
- On lit dans des tables il faut inclure 168
malades par groupe - Si lon craint des PDV ou sujets non évaluables,
il faut majorer dun dépendant du problème. Ici
10 , il faut donc 185 sujets/groupe
24Exemples numériques
- Essai thérapeutique pour tester 2somnifères S1 et
S2 - Soit par la durée de sommeil l?1 - ?2l 1 heure
en supposant les variances égales de valeur
1,5²quel nombre de sujets pour montrer ?1 ? ?2
avec ? 5 , ? 10 et n1 n2 - Soit par le de sujets ayant une durée de
sommeil dau moins 6 heures. Avec S1 on sait que
ce taux est de 30 , on désire quil soit dau
moins 50 avec ? 5 , ? 10 et n1 n2
25Exemples numériques
- Essai thérapeutique pour tester 2somnifères S1 et
S2 - Soit par la durée de sommeil l?1 - ?2l 1 heure
en supposant les variances égales de valeur
1,5²quel nombre de sujets pour montrer ?1 ? ?2
avec ? 5 , ? 10 et n1 n2 - Résolution
- Test bilatéral de comparaison de moyennes
- n (2 x 1,5²)/1² x (1,96 1,282)² 47,3 soit n
48 sujets/groupe - Si lon craint des PDV ou sujets non évaluables,
il faut majorer dun dépendant du problème. Ici
10 , il faut donc 53 sujets/groupe
26Exemples numériques
- Essai thérapeutique pour tester 2somnifères S1 et
S2 - Soit par le de sujets ayant une durée de
sommeil dau moins 6 heures. Avec S1 on sait que
ce taux est de 30 , on désire quil soit dau
moins 50 avec ? 5 , ? 10 et n1 n2 - Résolution
- Test unilatéral de comparaison de pourcentages
- n (1,645 1,282)²/2x(0,785 0,580)² 101,9
donc 102 sujets /groupe - En majorant de 10 pour les sujets non
évaluables - il faut 113 sujets par groupe
- Même problème, critère de jugement différent, il
faut 2 fois plus de malades pour montrer une
différence de 20 que d1 heure
27Exemples numériques
- En fait, le nombre de malades recrutés est plus
faible que prévu et seuls sont analysables
n1n230 - On observe m1 5,8 (s 1,6) p1 0,30
- m2 6,5 (s 1,7) p2 0,53
- le test ? 1,64, non rejet H0 le test ?²
3,36, non rejet H0 - Quelle était la puissance pour montrer les
différences attendues sous les mêmes hypothèses ? - 1. ?2? n ?² - 1,96 ? ?2? 0,622 ? 2? ?
0,51 ? ? ? 0,255 - 2 ?² et la puissance 1- ? 0,745
- 2. ?2? ?2n(Arcsinus?p1 - Arcsinus?p2) 1,645
0,175 - ? 2? ? 0,86 ? ? ? 0,43 et la puissance 1- ?
0,57
28Ce quil ne faut pas faire
- Un essai thérapeutique est mis en place sur 3
centres. Le nombre de sujets prévu est de 98 par
groupe pour montrer une différence de 20 (60 vs
40) en test bilatéral, avec ? 5 et ? 20 - Un des 3 centres inclut la moitié soit 50 malades
par groupe et observe 58 vs 40 de bons
résultats. - Il décide danalyser et de publier lui-même ses
propres résultats ??² 3,24, p 0,072, NS - Lensemble des résultats sur les 3 centres montre
des taux de réponses de 57 vs 41 ??² 5,23, p lt
0,03