Title:
1Échantillonnage (STT-2000)
- Section 2
- Estimation sans biais du total.
Version 22 août 2003
2Estimation de la moyenne et du total dans un plan
systématique
- Il peut être montré que la quantité suivante
estime la moyenne - De même, le total de la variable y peut être
estimé par
3Estimation de la variance dans un plan
systématique
- Malheureusement, il nexiste pas destimateurs de
variance pour les estimateurs précédents! - Lestimation de la variance sera toujours la
considération délicate dans un tirage
systématique. - La raison en est la suivante le hasard dépend
uniquement dune seule unité (celle choisie parmi
les a premières dans la liste).
4Problème relié aux cycles possibles
Dans cet exemple, si par malchance il existe un
cycle comme dans lexemple extrême ci-contre,
léchantillonnage risque de donner que les
petites valeurs de la variable dintérêt.
5Autre exemple de cycles
- Si par malchance les données sont listées selon
les mois de janvier, février, mars, etc et si le
pas est de 12, alors les données dun même mois
seront toujours sélectionnées! - Dans la mesure du possible, dans lexemple
précédent, il suffit de bien mélanger la
population avant de procéder au tirage.
6Probabilité de sélection (Henry, p.25 et voir
acétate 11 du cours 1)
- Dans la formule ci-dessus le facteur ns/N est
appelée la probabilité de sélection. - Probabilité de sélection probabilité de faire
partie de léchantillon. - Dans ce cas-ci, les chances sont les mêmes pour
toutes les unités dans la population cest un
plan à probabilités égales.
7Estimateurs de la moyenne sous tirage aléatoire
simple sans remise
- Pour une variable y, lestimateur de la moyenne
est - Lestimateur de la variance est
- où
- La constance fn/N est le taux de sondage.
- IC
8Estimateurs du total sous tirage aléatoire simple
sans remise
- Pour une variable y, lestimateur de la moyenne
est - Lestimateur de la variance est
-
- IC
9Poids déchantillonnage
- Dans la formule le
facteur N/ns est appelé poids déchantillonnage. - Ce facteur a une interprétation pour les
spécialistes des sondages. - Chaque observation yk est dilatée par le facteur
N/ns. - Supposons que N1000 et que ns100. Alors N/ns
10 et cest comme si chaque unité dans
léchantillon représente 10 unités dans la
population.
10Taille de léchantillon
- Pour trouver la taille de léchantillon, il faut
se munir dun critère. Plusieurs approches
existent. Ardilly p. 68 et Henry p.54. - On a vu que lintervalle de confiance est
- On appelle la
précision ou encore la marge derreur. - Après des calculs, on peut isoler n.
11Quel est le n?
- Les détails sont dans Ardilly, p. 68 et Henry
p.54. - On calcule dans un premier temps
- S est lécart-type.
- P est la précision.
12Que fait-on en pratique?
- On utilise habituellement les formules obtenues
pour le tirage aléatoire simple. - Ainsi, on fait comme si léchantillon était
obtenu par tirage aléatoire simple. - Avantages facile à mettre en œuvre.
- Inconvénients la performance du tirage
systématique dépend de lordre dans lequel se
trouve les unités dans la base de sondage. On ne
choisit pas cet ordre (ex bottin téléphonique).