Title: Intervalles de confiance
1L2 STE
Intervalles de confiance et tests statistiques
2Plan
- Intervalles de confiance tests statistiques
- Echantillonnage, rappels
- Intervalle de confiance
- MoyenneVariance et écart typeMédianePourcentage
- Tests usuels
- Principe (rappels)Théorie de la statistique de
décision (rappels)Comparaison de deux moyennes
expérimentales (grands et petits
échantillons)Comparaison de moyennes de deux
échantillons appariés Comparaison de deux
fréquences expérimentalesComparaison de deux
variances expérimentales - Tests non-paramétriques
- Conditions dutilisationUtilisation des
rangsTest de signe Test U de Mann-WhitneyTest
de WilcoxonTest de Kolmogorov-Smirnov
3Echantillonnage Estimation dun paramètre
Extraction de n échantillons dune population
P Si lon extrait plusieurs échantillons
représentatifs de taille n fixée, les différences
observées entre les résultats obtenus sont dues à
des fluctuations déchantillonnage. A partir dun
échantillon, on na donc pas de certitudes mais
des estimations de paramètres. L'estimation
d'un paramètre peut être faite - par un seul
nombre estimation ponctuelle- par 2 nombres
entre lesquels le paramètre peut se trouver
estimation par intervalle
4Echantillonnage Estimation dun paramètre
Estimation ponctuelle dune moyenne
x barre
Estimateur sans biais
Ecart type de la moyenne
5Echantillonnage Estimation dun paramètre
Pour améliorer la connaissance de la moyenne, il
faut augmenter la taille de léchantillon
6Echantillonnage Estimation dun paramètre
Intervalle de confiance de la moyenne
Cas des grands échantillons (variance
connue) Soit une population obéissant à une loi
normale de moyenne m et décart type s.
7Echantillonnage Estimation dun paramètre
Exemple 45 hommes de Neandertal males adultes
à 95 de confiance
8Echantillonnage Estimation dun paramètre
9Echantillonnage Estimation dun paramètre
Intervalle de confiance de la moyenne
Cas des petits échantillons Quand nlt30 ou quand
la variance est inconnue, on prend la loi de
Student.
Pour n n-1 degrés de liberté
Finalement on peut toujours utiliser la loi de
Student puisque t tend vers la loi normale quand
n est grand
10La loi de Student t(n)
n degrés de liberté
Converge vers la loi Normale quand n augment.
11La loi de Student t(n)
La probabilité dobtenir une valeur de t à
lextérieur de lintervalle (-ta/2 et ta/2) -gt
TABLES.
12Echantillonnage Estimation dun paramètre
13Echantillonnage Estimation dun paramètre
Exemple 6 hommes de Neandertal males adultes
à 95 de confiance
Finalement on peut toujours utiliser la loi de
Student puisque t tend vers la loi normale quand
n est grand
14Echantillonnage Estimation dun paramètre
Intervalle de confiance de la variance
Soit une population obéissant à une loi normale
de moyenne m (inconnue) et décart type s
(inconnu).
Pour n n-1 degrés de liberté
15La loi du Khi carré c2
Si Z1, Z2, Zn sont des variables aléatoires
normales centrées réduites et indépendantes
entres elles, la somme des carrées de ces
varaibles aléatoires obéit à la loi du c2 à n
degrés de libertés
16La loi du Khi carré c2
17La loi du Khi carré c2
En fait, les calculs sont fastidueux -gt TABLES
18La loi du Khi carré c2
19Echantillonnage Estimation dun paramètre
Intervalle de confiance de lécart type (idem)
Soit une population obéissant à une loi normale
de moyenne m et décart type s.
Pour n n-1 degrés de liberté
20Echantillonnage Estimation dun paramètre
Intervalle de confiance de la médiane
Si un échantillon est extrait dune population
approximativement normale, et si son effectif est
relativement grand (ngt60), la distribution
déchantillonnage de la médiane sapproche de la
loi normale.
21Echantillonnage Estimation dun paramètre
Estimation ponctuelle dun pourcentage
La population est formée dindividus ayant ou non
un caractère A. Soit p la probabilité pour quun
individu pris au hasard dans la population
présente le caractère A.
Quand on dispose dun seul échantillon de taille
n, la meilleure estimation ponctuelle de P est
donc la fréquence p observée sur léchantillon.
22Echantillonnage Estimation dun paramètre
Intervalle de confiance dun pourcentage
Grands échantillons (ngt30), p ni voisin de 0, ni
voisin de 1, (npgt5, n(1-p)gt5) La variable
fréquence obéit à une loi normale centrée réduite
23Echantillonnage Estimation dun paramètre
Un problème très fréquent! Un quotidien publie
tous les mois la cote du chef du gouvernement à
partir d'un sondage réalisé sur un échantillon
représentatif de 1000 personnes. En janvier, la
cote publiée était de 38 d'opinions favorables,
en février de 36. Un journaliste commente alors
ces valeurs par "Le chef du gouvernement perd 2
points !!" En fait On construit un intervalle
de confiance autour des proportions. Avec un
seuil de 95, on obtient respectivement 3541
et 3339 pour les valeurs 38 et 36. Les
deux intervalles ayant une intersection non vide,
on ne peut pas conclure qu'il y ait eu baisse ou
augmentation de la cote du chef de gouvernement.
24L2 STE
Tests statistiques
25Théorie de la statistique de décision
Quel est le problème?
On sait quun homme de Neandertal mesure en
moyenne 165 cm. Sur un site on trouve 16 hommes
avec une moyenne de 167 et un écart type de 8 cm
(e.t. échantillon). Comparaison de la moyenne
avec la valeur théorique de 165 cm
Possibilités Moyenne très élevée Nous pourrons
être amenés à croire que ces hommes ont des
tailles différentes de 165 cm Moyenne faiblement
plus élevée on ne pourra pas conclure si cest
significativement supérieur à la norme ou si
cest leffet du hasard.
26Théorie de la statistique de décision
Question à partir de quelle limite pouvons nous
raisonnablement conclure à une différence? H0
m165 (il ny pas de différence) H1
m?165 Calcul de
Sur la table la probabilité pour que la moyenne
déchantillonnage soit différente celle de la
population de plus 2,131 de écart-type est de 5.
27Théorie de la statistique de décision
Les deux risques derreur dans un test.
Erreur de 2nde espèce (compliquée)
1-a
1-b
Erreur de 1ere espèce
A priori on ne sait pas à quel type derreur on
sera confronté Le résultat de léchantillon a
révélé 167 cm probablement par pur hasard. On
conclue que la moyenne pourrait être 165 cm alors
quen fait elle est mesurée à 167 cm.
28Théorie de la statistique de décision
H0 hypothèse nulle ou principale Ex Les haches
de type A présentent les mêmes teneurs en Sn que
les haches de type B. H1 hypothèse alternative
ou contraire Soumission à une épreuve de
vérité! Conclusion différence attribuable aux
fluctuations déchantillonnage???
29Théorie de la statistique de décision
Niveau de signification un peu
arbitraire significatif 0.05 hautement
significatif 0.01 très hautement significatif
0.001. Test bilatéral / unilatéral bilatéral
différence sans se préoccuper du
sens. Unilatéral gt ou lt. Zone de rejet dun
seul coté de la distribution de probabilité de
référence. Echantillons indépendants ou
appariés Indépendants aucune influence du 1er
ech sur le 2nd. Appariés prélèvements par
paires. Ex fumeurs H F.
30Comparaison de deux moyennes expérimentalesgrands
échantillons -
Comparaison des moyennes de 2 grands échantillons
indépendants (n1 et n2 gt30)
Deux échantillons qui suivent des lois normales
m1, s21 m2, s22
H0 m1 m2
Si H0 est vraie, Zc suit une loi normale N(0,1)
31Comparaison de deux moyennes expérimentalesgrands
échantillons -
H1 m1 ? m2 bilatéral
32Comparaison de deux moyennes expérimentalesgrands
échantillons -
H1 m1 gt m2 unilatéral
33Comparaison de deux moyennes expérimentalesgrands
échantillons -
H1 m1 lt m2 unilatéral
34Comparaison de deux moyennes expérimentalesgrands
échantillons -
Pour résumer
Maintenant un exemple...
35Comparaison de deux moyennes expérimentalesgrands
échantillons -
Taille des silex sur deux sites
Les moyennes de ces deux échantillons prélevés
indépendamment lun de lautre diffèrent-elles
dune façon hautement significative?
36Comparaison de deux moyennes expérimentalesgrands
échantillons -
n1 et n2 grands -gt test sur la loi normale H0
ma mb H1 ma ? mb (bilatéral)
a 0.01, Za/2 2.57
37Comparaison de deux moyennes expérimentalesgrands
échantillons -
H0 rejetée au seuil de signification de 1
38Comparaison dune moyenne empirique à une moyenne
théorique
Même principe que précédemment (quand n est
grand)
H0 mm0
que lon teste sur la loi normale N(0,1)
39Comparaison de deux moyennes expérimentales
petits échantillons -
Cas des petits échantillons Test t
Deux populations normales m1 et m2 de même
variance (au moins approximativement) s2. Si n1
et n2 sont petits, s2x1 et s2x2 sont des
estimateurs peu précis de s2. Dans ce cas, la
variable différence centrée réduite nobéit plus
à une loi normale mais à une loi de Student à
nn1n2-2 degrés de liberté.
40Comparaison de deux moyennes expérimentales
petits échantillons -
La variance de la distribution des différences de
moyennes est estimées par s2D
avec
41Comparaison de deux moyennes expérimentales
petits échantillons -
Ce qui donne H0 ma mb
Avec n n1 n2 - 2
42Comparaison de deux moyennes expérimentales
petits échantillons -
Si les variances savèrent inégales alors test t
modifié.
avec
43Comparaison dune moyenne empirique à une moyenne
théorique
Même principe que précédemment. Suivant si n est
petit ou grand, on calcule les variables
auxiliaires suivantes
H0 mm0
que lon teste sur la loi de Student ou loi
normale N(0,1)
44Comparaison de moyennes de deux échantillons
appariés
Fondée sur les différences de chaque paire
déléments
On imagine que la différence obéit à une loi
normale, mais en général on utilise une loi de
Student à n-1 degrés de liberté
45Comparaison de moyennes de deux échantillons
appariés
H0 m1 m2 ou md 0 H1 m1 ? m2 ,
bilatéral H1 m1 gt m2 , unilatéral H1 m1 lt m2 ,
unilatéral
t calculé pour n n-1 degrés de liberté
46Comparaison de deux fréquences expérimentales
Comparaison des fréquences de 2 grands
échantillons indépendants.
Deux échantillons f1, n1 f2, n2 On approxime
la loi binomiale par la loi normale mais n1gt30,
n2gt30, n1f1gt5, n2f2gt5, n1(1-f1)gt5, n2(1-f2)gt5
H0 p1 p2 p
47Comparaison de deux fréquences expérimentales
Sous H0 on peut réunir les deux échantillons, et
on est conduit à lestimation de p
Zc devient
H1 p1?p2 H1 p1gtp2 H1 p1ltp2
Test sur la loi normale N(0,1)
48Comparaison dune fréquence empirique et dune
fréquence théorique
La différence entre f (mesuré) et p (théorique)
est-elle seulement explicable par les aléas dus à
léchantillonnage? On approxime la loi binomiale
par la loi normale mais ngt30, npgt5 et nqgt5 H0
f p
H1 f?p H1 fgtp H1 fltp
Test sur la loi normale N(0,1)
49Comparaison de deux variances expérimentales
Deux échantillons qui suivent des lois normales
m1, s21 m2, s22
Plus grande variance
H0 s21s22 calcul de
gt1
Plus petite variance
Si H0 est vraie, Fc suit une loi de
Fisher-Snedecor avec n1n1-1 et n2n2-1
50La loi de Fisher - Snedecor F(n1,n2)
Soit c21 et c22, un couple de variables
aléatoires indépendantes suivant respectivement
des lois du c2 à n1 et n2 degrés de libertés.
Utile pour les tests de variance et de covariance
51La loi de Fisher - Snedecor F(n1,n2)
52Comparaison de deux variances expérimentales
H1 s21gts22 Sous H0 Pr(FcltFa)1-a
rejet H0
Accept. H0
Fa
53Comparaison de deux variances expérimentales
H1 s21?s22 Sous H0 Pr(FcltFa/2)1-a
rejet H0
Accept. H0
a/2
Fa/2
54Comparaison de deux variances expérimentales
Table de Fisher- Snedecor
55Tests non-paramétriques
56Plan
- 1. Généralités
- Conditions dapplication Utilisation des rangs
- 2. Les tests Le test de signes Le test U de
Mann-Whitney Le test de Wilcoxon Le test de
Kolmogorov Smirnov
571. Généralités Conditions dapplication
Pourquoi et quand utiliser des statistiques
non-paramétriques?
- Les tests non paramétriques ne font aucune
hypothèse sur la distribution sous-jacente des
données. On les qualifie souvent de tests
distribution free. Létape préalable consistant à
estimer les paramètres des distributions (p.e.
moyenne et écart type) avant de procéder au test
dhypothèse proprement dit nest plus nécessaire. - Quand?
- Léchelle des données est ordinale plutôt que
sous forme dintervalles ou de rapports. Dans ce
cas les opérations arithmétiques nont pas de
sens! - Les mesures sont sur des échelles dintervalles
ou de rapports mais les distributions de
fréquences observées sont très éloignées de la
distribution normale.
581. Généralités Conditions dapplication
Données Paramétrique Non-paramétrique
Distribution normale n grand Précis et fiable Si H0 est rejeté, le résultat devrait être le même quavec le test paramétrique Si H0 est accepté, le résultat nest peut être pas fiable
Distribution non normale n petit Résultat absolument pas fiable souvent un rejet de H0 abusif Meilleur résultat possible avec de telles données
591. Généralités Utilisation des rangs
Maintenant, on ne travaille plus que sur les
rangs
Données Rangs
x1 4,3 R(x1) 5
x2 9,3 R(x2) 8
x3 0,3 R(x3) 1
x4 2,9 R(x4) 3
x5 3,2 R(x5) 4
x6 7,7 R(x6) 7
x7 5,0 R(x7) 6
x8 0,4 R(x8) 2
On pourrait ordonner du plus grand au plus petit.
Les rangs seraient différents, mais les tests
aboutiraient au mêmes résultats! Si x2 avait été
1000, x2 aurait eu le même rang (donc perte
irrémédiable dinformation)!
601. Généralités Utilisation des rangs
Données Rangs
x1 4,3 R(x1) 5
x2 9,3 R(x2) 8
x3 0,3 R(x3) 1
x4 0,4 R(x4) 2,5
x5 3,2 R(x5) 4
x6 7,7 R(x6) 7
x7 5,0 R(x7) 6
x8 0,4 R(x8) 2,5
Si 2 valeurs ou plus sont identiques, le rang
devient la moyenne des rangs de la paire ou du
groupe
En pratique, souvent peu crucial
611. Généralités Rappels sur la médiane
Si n est impair médiane valeur du point avec
le rang (n1)/2 Si n est pair médiane entre les
valeurs des points qui ont les rangs n/2 et
(n2)/2
Valeur pour laquelle la fréquence cumulée est
égale à 0.50 ou point qui partage la distribution
en 2 parties égales.
Pour n impair
Pour n pair
622. Les tests Le test des signes (petits
échantillons)
- Alternative non-paramétrique au test t
- Cas dun petit échantillon
- Voyons un exemple ces mesures de mercure dans
les sols sont-elles issues dune population dont
la médiane serait 40 ppm?
Hg ppm 56 42 61 61 42 55 35 42 39 65 44 51 32 82 41
Signe - - -
Résultat 3 () et 12 () Question Est-ce
significativement différent de 50 (-) et 50
()? Il semble quil y ait déséquilibre à voir
632. Les tests Le test des signes (petits
échantillons)
Imaginons que () soit un succès p 0,5. On
peut appliquer la distribution binomiale, avec x,
le nombre dapparitions, p, la probabilité de
succès, n, le nombre de tentatives Probabil
ité de 7 succès (ou 8) sur 15 essais
0,19638 Probabilité de 6 succès (ou 9) sur 15
essais 0,15274 Probabilité de 5 succès (ou 10)
sur 15 essais 0,09164 Probabilité de 4 succès
(ou 11) sur 15 essais 0,04166 La somme de ces
probabilités 0,9648, donc plus de 95 de
chances de se retrouver avec de 4 à 11 ().
642. Les tests Le test des signes (petits
échantillons)
On pose les hypothèses H0 la médiane 40 ppm
Hg H1 la médiane ? 40 ppm Hg Avec 12(), on
rejette H0 car on a déjà plus de 96 de chances
de se trouver entre 4 () et 11 () par le
simple fait du hasard. On en conclue donc que la
médiane de la population est significativement
différente de 40 ppm de Hg.
652. Les tests Le test des signes (grands
échantillons)
Quand n est suffisamment grand (ngt20), on peut
utiliser lapproximation normale de la loi
binomiale avec une correction de continuité
Exemple Durée de vie supposée dun foret
pétrolier gt 250h 271 230 198 275 282 225 284 219
253 216 262 288 236 291 253 224 264 295 211 252 29
4 243 272 268 - - - - - - -
- -
15(), 9(-)
H0 médiane de la population médiane
hypothétique spécifiée H1 médiane de la
population gt médiane hypothétique
spécifiée Attention test unilatéral
662. Les tests Le test des signes (grands
échantillons)
Correction de continuité (puisque la loi
binomiale est discrète alors que la loi normale
est continue) Il faut retrancher 0.5 à X si XgtNp
et ajouter 0.5 à X si XltNp.
Ici cest un test unilatéral, Z0,05 1,645.
ZltZ0.05, donc H0 nest pas rejetée. La publicité
de la marque nest pas justifiée!!!
672. Les tests Le test U de Mann-Whitney
Alternative non-paramétrique du test t à deux
échantillons. Probablement le test
non-paramétrique le plus utilisé dans la
littérature. Il teste lhypothèse nulle
dégalité des médianes de populations à partir
desquelles deux échantillons sont tirés. H0
médiane de la population x médiane de la
population y H1 médiane de la population x ?
médiane de la population y
682. Les tests Le test U de Mann-Whitney (petits
échantillons)
Le plus simple traiter un exemple
Alliage A (n18) Alliage B (n210)
18.3 16.4 22.7 17.8 18.9 25.3 16.1 24.2 12.6 14.1 20.5 10.7 15.9 19.6 12.9 15.2 11.8 14.7
Etape 1 Transformation en rangs
Plus petit effectif n1
Alliage B
Alliage A
3 5 15 1 8 14 4 7 2 6
12 10 16 11 13 18 9 17
Etape 2
R1Somme rangs 106
R2 somme rangs 65
692. Les tests Le test U de Mann-Whitney (petits
échantillons)
Pour tester la différence entre les rangs, on
utilise la statistique suivante. Calcul de U pour
léchantillon 1 2
U min (U1,U2)
Ici
Donc U10
702. Les tests Le test U de Mann-Whitney (petits
échantillons)
Si n1 n2 lt 20 Valeurs limites ma fournie par
une table telle que sous H0, P(Ultma)a On
rejette H0 si Ultma Ici Ult17, donc H0 est rejeté.
Il y a donc une différence significative entre
les deux groupes
712. Les tests Le test U de Mann-Whitney (grands
échantillons)
Si n1 n2 gt 20, la distribution U peut être
approchée par une distribution normale de telle
sorte que
avec
Ceci se teste tout naturellement sur la loi
normale
Accepter H0 si Za/2ltZltZa/2, sinon rejeter H0
722. Les tests Le test de Wilcoxon
Comparaison de deux échantillons appariés (chaque
valeur dun échantillon est associée à une valeur
de lautre échantillon, les deux ont la même
taille). Question Existe-t-il une différence
entre les 2 échantillons? H0 Pas de différence
entre les deux groupes H1 Une différence entre
les deux groupes
M 5 4 2 3 4 3 8 5 4 5
R 6 3 3 1 1 3 4 2 5 7
Diff -1 1 -1 2 3 0 4 3 -1 -2
Calcul de la différence n nombre de
différences non nulles 9
732. Les tests Le test de Wilcoxon (petits
échantillons)
Test de Wilcoxon
On classe ensuite les différences par ordre
croissant de valeurs absolues
Val. -1 1 -1 -1 2 -2 3 3 4
Rg 2.5 2.5 2.5 2.5 5.5 5.5 7.5 7.5 9
On affecte à chaque différence son rang dans le
classement
w somme des rangs des différences positives w-
somme des rangs des différences négatives
w 2.5 5.5 7.5 7.5 9 32 w- 2.5
2.5 2.5 5.5 13 w min (w, w-) 13
74 2. Les tests Le test de Wilcoxon (petits
échantillons)
n Niveau de signification, test unilatéral Niveau de signification, test unilatéral Niveau de signification, test unilatéral
n 0,025 0,01 0,005
n Niveau de signification, test bilatéral Niveau de signification, test bilatéral Niveau de signification, test bilatéral
n 0,05 0,02 0,01
6 0
7 2 0
8 4 2 0
9 6 3 2
10 8 5 3
11 11 7 5
12 14 10 7
13 17 13 10
14 21 16 13
15 25 20 16
16 30 24 20
17 35 28 23
18 40 33 28
19 46 38 32
20 52 43 38
21 59 49 43
22 66 56 49
23 73 62 55
24 81 69 61
25 89 77 68
2 cas possibles Si nlt25 (empirique), alors on
utilise une table
Sous H0, P(Wltwa)a avec a 0.05 et a 0.01 On
rejette lhypothèse nulle si wltwa Ici, pour n
9 et a 0.05, wa 6 w gt w0.05 donc on ne peut
pas rejeter H0. Il ny a pas de différence
significative entre les deux échantillons.
752. Les tests Le test de Wilcoxon (grands
échantillons)
Si ngt25, lorsque H0 est vraie, W suit
approximativement une loi normale N(m,s) avec
On calcule la valeur de la variable normale
centrée réduite
La valeur est comparée à la valeur Za de la loi
normale. Si Za/2ltZltZa/2 on accepte H0
762. Les tests Le test de Kolmogorov Smirnov
Test non paramétrique de conformité de Kolmogorov
Smirnov Il consiste à calculer les différences
existants entre les distributions de fréquences
relatives cumulées de deux échantillons et à
vérifier si la plus grande différence peut être
fortuite ou pas (Dobs).
Pour au moins une valeur de xi
Simple sur un exemple
772. Les tests Le test de Kolmogorov Smirnov
Domaine vital de lours noir (F M)
Sexe Domaine vital (km2)
F F M M F M F F M F M M F F F 37 72 94 504 60 173 49 18 560 50 274 168 102 49 20
Question Létendue du domaine vital des ours
noirs males est-elle différente de celle du
domaine des femelles? Hypothèses
Pour au moins une valeur de xi
782. Les tests Le test de Kolmogorov Smirnov
Freq cum abs.
Freq cum rel.
Diff.
Diff. max.
xi Fcum(xiF) Fcum(xiM) Fcum(xiF)/nF (A) Fcum(xiM)/nM (B) (A)-(B) Dobs
18 20 37 49 50 60 72 94 102 168 173 274 504 560 1 2 3 5 6 7 8 8 9 9 9 9 9 9 0 0 0 0 0 0 0 1 1 2 3 4 5 6 0,111 0,222 0,333 0,555 0,666 0,777 0,888 0,888 1 1 1 1 1 1 0 0 0 0 0 0 0 0,166 0,166 0,333 0,500 0,666 0,833 1 0,111 0,222 0,333 0,555 0,666 0,777 0,888 0,722 0,833 0,666 0,500 0,333 0,166 0 0,888
792. Les tests Le test de Kolmogorov Smirnov
802. Les tests Le test de Kolmogorov Smirnov
Ici cas des petits échantillons nF nM lt 25 (en
fait nF9 et nM6) On calcule une variable
auxiliaire KS nF nM Dobs 9.6.0,888 47,952
48
Dans la table, la valeur critique sélève à 39
pour a 0,05 Si KSgtKSa, alors on rejete H0
(rejet des valeurs trop grandes) Ici 48gt39, donc
on rejette H0 Conclusion Létendue du domaine
vital des mâles diffère significativement de
létendue du domaine des femelles.
812. Les tests Le test de Kolmogorov Smirnov
Si au contraire n1 n2 sont supérieurs à 25 on
calcule
Si Dobs gt Da, lhypothèse H0 est refusée au
profit de H1