Th - PowerPoint PPT Presentation

About This Presentation
Title:

Th

Description:

Pour la contr ler: entra nement des interviewers, d roulement de ... On accepte la non-r ponse. On ne tente pas d'imputer. Cependant, on cherche redresser ... – PowerPoint PPT presentation

Number of Views:34
Avg rating:3.0/5.0
Slides: 15
Provided by: pierred3
Category:
Tags: accepte

less

Transcript and Presenter's Notes

Title: Th


1
Théorie de léchantillonnage (STT-6005)
  • Problème de la non-réponse
  • (SSW, Chapitre 15)

Version 10 mars 2004
2
Non-réponse
  • Problème survenant dans plusieurs sondages.
  • Peut varier considérablement dans le temps, même
    pour un même sondage effectué à plusieurs
    reprises dans le temps.
  • Pour la contrôler entraînement des interviewers,
    déroulement de lentrevue (longueur de
    lentrevue, choix et formulation des questions,
    etc.)

3
Exemples de non-réponse
  • Incapacité de contacter un individu, un ménage,
    ou de manière générale une unité.
  • La personne peut décider de ne pas répondre
    refus catégorique incompréhension (langue,
    analphabétisme)
  • Idéalement, linterviewer tente dobtenir de
    linformation démographique sur le non-répondant
    (âge?, sexe?, ethnie?, lieu de résidence
    rural/urbain?)

4
Effets de la non-réponse
  • Biais potentiel dans les estimateurs des
    paramètres de la population.
  • La non-réponse est particulièrement grave car la
    volonté de réponse est souvent liée à la variable
    dintérêt y.

5
Facteurs principaux qui font que le biais est
petit
  • Moyenne chez les non-répondants est similaire à
    la moyenne chez les répondants.
  • Taux de non-réponse est raisonnablement petit.
    (Pour EPA enquête population active, taux de
    non-réponse est denviron 7 5 et moins est
     acceptable .)

6
Taux de non-réponse en pratique
  • Enquête de la population active autour de 10.
  • Moins de 10 est bon en général.
  • Souvent 30 et plus.
  • Mesure de non-réponse si plus de deux variables?

7
Exemple
Réponse aux deux questions.
Échantillon s
Réponse à une question mais pas aux deux.
(non-réponse par item)
Non-réponse aux deux questions. (non-réponse par
unité)
Non-échantillonné, partie U-s
8
Formalisation de la non-réponse pour une variable
y
  • Contexte On sélectionne s dans U avec
    probabilité p(s), avec pk gt 0 et pkl gt 0.
  • Après la collecte des données, yk est disponible
    seulement pour les unités pour
  • et
  • Dans une telle situation, nous sommes en présence
    de données manquantes ou de la non-réponse.

9
Illustration du problème de biais Enquête sur le
revenu, où tous les hauts revenus ont une
probabilité de répondre plus faible.
  • Ceci implique une sous-représentativité des hauts
    revenus dans .
  • Si tirage SI (n parmi N)
  • Si on considère comme estimateur
  • où m est le nb de répondants

10
Techniques pour contrôler le problème de la
non-réponse
  • Sous-échantillonnage des non-répondants.
  • Techniques de réponses randomisées.
  • Techniques basées sur la modélisation de la
    non-réponse.
  • Imputation.
  • Substitution de dossiers analogues (qui partagent
    certaines caractérisques avec les unités
    non-répondantes).
  • Technique de redressement. On remplace 1/pk par
    autre chose.

11
Imputation on pose des valeurs plausibles pour
les valeurs manquantes
  • On connaît
  • On impute
  • On obtient ainsi un ensemble de données
    complétées

12
Autre exemples dimputation
  • Hot Deck On choisit au hasard une valeur déjà
    obtenue pour remplir les trous.
  • Cold Deck Utilisation de données provenant de
    sources externes.
  • Imputation par la moyenne Chacun des trous est
    remplacé par la valeur moyenne des répondants.
  • Imputation utilisant des modèles par le ratio,
    par la régression, etc.

13
Repondération comme une méthode dajustement pour
la non-réponse
  • On accepte la non-réponse.
  • On ne tente pas dimputer.
  • Cependant, on cherche à redresser léchantillon
    de répondants.
  • On a besoin cependant dinformation auxiliaire,
    permettant un découpage en catégories (exemple
    âge, sexe)

14
Mécanisme de réponse
  • Permet de modéliser la non-réponse.
  • On considère un échantillon s choisi dans U selon
    un plan p avec les pk et pkl usuels.
  • Léchantillon des répondants r est pris dans s
    selon un mécanisme de réponse inconnu.
  • Cette façon daborder le problème est une
    application directe de la théorie
    déchantillonnage en 2 phases.
Write a Comment
User Comments (0)
About PowerShow.com