Codage des donn - PowerPoint PPT Presentation

About This Presentation
Title:

Codage des donn

Description:

Atelier r gional des Nations Unies sur le traitement des donn es de recensement: ... susceptibles d' tre donn es et chacune desquelles est affect un code. ... – PowerPoint PPT presentation

Number of Views:124
Avg rating:3.0/5.0
Slides: 26
Provided by: UnitedN3
Learn more at: https://unstats.un.org
Category:
Tags: affecte | codage | des | donn

less

Transcript and Presenter's Notes

Title: Codage des donn


1
  • Codage des données de recensement
  • Une vue densemble

Division de statistique des Nations Unies
2
Vue densemble de la présentation
  • Quest-ce que le codage?
  • Les méthodes de codage
  • Les index de codage
  • Types dopérations de codage
  • Types de codes
  • Questions ouvertes
  • Systèmes de codage
  • Organisation du codage
  • Sources derreurs de codage

3
1. Quest-ce que le codage?
  • Processus dans lequel les données du
    questionnaire sont transformées and valeurs
    numériques et/ou alphanumériques
  • Objectif est de préparer les données dans une
    forme utilisable par un ordinateur pour analyse
    ultérieure
  • Réalisé en déterminant les réponses possibles
    pour chaque question et établissant une table de
    correspondance entre ces réponses et les valeurs
    numériques et/ou alphanumériques

4
2. Méthodes de codage
  • Simple
  • Limité à une seule question du questionnaire
  • Direct la réponse peut être codée selon une
    liste
  • Structuré
  • Utilisé pour des variables complexes (profession,
    activité économoqie, éducation, etc.)
  • Référence peut être faite à plusieurs questions
    (statut dans lemploi, public/privé)
  • Des règles de codage peuvent être établies pour
    guider les opérateurs

5
Méthodes de codage(cont.)
  • Successif (ou hiérarchique)
  • Sapplique aux caractéristiques pour lesquels il
    est nécessaire davoir plusieurs niveaux de
    détail avant dassigner un code
  • Utilisé communément pour le codage des adresses
  • Le codeur commence par chercher à identifier un
    niveau gégoraphique large (province), puis
    détermine la ville, puis la rue, puis le numéro
    dans la rue

6
3. Index de codage
  • Quel que soit le système utilisé, il sappuie sur
    des index
  • Les index sont des liste de réponses
    caractéristiques susceptibles dêtre données et À
    chacune desquelles est affecté un code.
  • Doivent sappuyer sur les déclarations des
    recensés et pas uniquement sur les libellés des
    postes de la nomenclature
  • Permet de répartir les réponses entre les
    diverses rubriques de la nomenclature
  • Qualité de ces index est primordiale le temps et
    les efforts nécessaires ne doivent pas être
    sous-estimés
  • Les index ne sont pas statiques et doivent être
    mis à jour pour prendre en compte de nouvelles
    réponses

7
4. Types d'opérations de codage
  • Les opérations de codage peuvent impliquer une
    des trois options
  • Assigner des codes numériques aux réponses
    libéllées en clair, par exemple les variables
    tels que lieux géographique, métier, activité
    économique, etc.
  • Reporter des codes numériques sur une feuille de
    programmation séparée de faciliter la saisie de
    données.
  • Utiliser des entrées précodées sur les
    questionnaires qui peuvent être employés
    directement pour la saisie de données

8
5.Types de codage
  • Réponses pré-codées
  • Codage manuel en bureau

9
(a) réponses pré-codées
  • Adapté aux questions fermées les nombres dans
    les cases du questionnaire sont employés pour
    coder les réponses
  • Dans la mesure du possible, les réponses
    précodées devraient être employées pour le
    recensement avec des codes numériques ou
    alphanumériques
  • Les catégories de codage devraient être
    mutuellement exclusives et exhaustives
  • Pour
  • Plus facile
  • Plus rapide
  • Contre
  • Ne peut pas être utilisé pour des questions
    ouvertes

10
(b) Codage manuel en bureau
  • Toutes les questions de recensement ne peuvent
    être précodées, par exemple, celles qui exigent
    des réponses ouvertes
  • Létendue complète des réponses peut ne pas être
    connue et ne peut pas donc être codée sur place,
    ainsi le codage est fait après la collecte

11
Questions ouvertes avantages
  • Permet aux répondants de sexprimer par
    eux-mêmes, plutôt quavec les termes choisis par
    les organisateurs du recensement
  • Particulièrement approprié pour des concepts
    complexes comme la profession
  • Les chercheurs peuvent étudier comment les
    répondants parlent de leur profession par
    example, et trouver des informations de valeur
    pour eux

12
Questions ouvertes inconvénients
  • Différents répondants peuvent aborder la même
    question de différentes perspectives de sorte que
    leurs réponses ne puissent pas être entièrement
    comparables
  • Les questions ouvertes sont une source commune
    d'erreur de mesure sur des recensements
  • Le codage peut impliquer de grouper ensemble les
    répondants qui ont apporté les réponses
    semblables. Puisqu'aucun deux répondants peuvent
    jamais ne pas donner des réponses identiques, le
    codeur peut compléter des détails d'une réponse
    en faisant des conjectures au sujet de quel
    répondant a voulu dire pour dire.

13
Questions ouvertes problèmes autour du codage
  • Toutes les questions dun recensement ne peuvent
    être précodées (par exemple, caractéristiques
    économiques)
  • Il est nécessaire de former le personnel pour
    déterminer des codes appropriés avec les listes
    des codes existantes sur la base de l'information
    fournie par des répondants
  • La catégorie autre est habituellement incluse
    parce que souvent la gamme complète des réponses
    n'est pas connue

14
6. systèmes de codage
  • Les réponses textuelles et verbales doivent être
    remplacées par des codes par intervention
  • Manuelle
  • Assistée par ordinateur
  • Automatique
  • Combinaison des précédentes

15
(a)Codage manuel
  • Les codeurs assignent manuellement un code aux
    réponses en consultant lindex, ou les livres de
    code
  • Ils écrivent alors manuellement les codes sur un
    formulaire pour la saisie et le traitement de
    données postérieurs
  • Pour
  • Simple
  • Contre
  • Long et pénible
  • Sujet à des biais et au sur-codage (codeur trop
    zélé pour trouver un code même en labsence
    dinformation suffisante)
  • Plus sujet à erreurs que d'autres types de
    codage.

16
(b) Codage assisté par ordinateur
  • Systèmes automatisés (ordinateurs centraux, PCs,
    etc.) utilités pour aider les codeurs
  • Les index utilisés sont comme décrit auparavant,
    mais cette fois ils sont stockés sur
    lordinateur. Les codes associés sont stockés
    dans une base de données et accédés pendant
    l'opération de codage
  • Un codeur peut saisir soit à partir de feuilles
    de programmation soit saisir chaque réponse à
    partir du questionnaire directement

17
(b) Codage assisté par ordinateur (cont.)
  • Exécution pratique
  • Le codeur dactylographie quelques caractères de
    chaque mot dans la réponse
  • L'ordinateur renvoie une liste de valeurs
    possibles à partir de l'index de codage approprié
  • Le codeur choisit la valeur dans la liste de
    possibilités
  • L'ordinateur enregistre automatiquement le code
    correspondant
  • Exemple pour éleveur de volaille le codeur
    écrit elev vol

18
(b) Codage assisté par ordinateur (cont.)
  • Pour
  • Relativement plus efficace
  • Plus de règles de codage peuvent être incorporées
    au système pour guider les codeurs, ce qui a pour
    conséquence des données de meilleure qualité
  • Approprié au codage structuré en particulier
  • Contre
  • Relativement complexe
  • Long et coûteux à développer

19
(c) Codage automatique
  • Un algorithme automatisé compare la réponse
    textuelle capturée (par exemple, d'ICR) à des
    index, et assigne le numéro de code dans la
    majorité des cas sans intervention humaine
  • Implique typiquement un mécanisme de notation où
    un nombre minimum de points est exigé avant
    qu'une réponse soit considérée comme valide
  • Quand le score est au-dessous d'un certain
    niveau, l'intervention humaine est nécessaire
  • Les taux de codage dépendent des algorithmes
    utilisés et des types de variables

20
(c) Codage automatique (cont.)
  • Pour
  • Vitesse
  • Grande efficacité
  • Bonne qualité
  • Particulièrement adapté au codage structuré
  • Contre
  • Complexe
  • Coûts élevés
  • Risques derreurs systématiques dans le cas de
    défauts dans les algorithmes de correspondance et
    les index

21
7. Organisation du codage
  • NSO élaborent souvent une liste de codes communs
    pour quelques variables employées dans le
    recensement et dans les enquêtes par exemple,
    lieu de naissance, langue, appartenance
    ethnique/race, citoyenneté
  • L'exemple du code commun pour le lieu
    géographique pourrait être code hiérarchique de
    3 chiffres avec pour le premier chiffre le plus
    large niveau de la géographie, et le troisième
    chiffre le niveau le plus fin
  • Le problème commun qui se pose est quand les
    définitions diffèrent ou changent entre les
    recensements (ou entre un recensement et une
    enquête) pour des variables telles que le travail
    ou l'appartenance ethnique le NSO doit
    développer une politique sur la façon dont
    prendre en considération ces changements
  • Pour le codage simple , le NSO doit définir
    une liste de codes
  • Ex. Sexe maaculin-1, féminin-2
  • Ex. Type dinactivité au foyer-0, étudiant-1,
    retraité-2, other-3

22
7. Organisation du codage (cont.)
  • Pour le codage structuré , il y a un certain
    nombre de systèmes de classification
    internationaux que les NSOS peuvent employer
    directement ou adapter à leurs propres variantes
    nationales
  • Exemples
  1. Classification Internationale Type par Industrie,
    de toutes les branches dactivité économique,
    CITI Rév. 4

Type de code Niveau Catégorie Code
Deux chiffres Division Fabrication de produits alimentaires 10
Trois chiffres Groupe Travail des grains, fabrication de produits amylacés 106
Quatre chiffres Classe Travail des grains 1061
23
7. Organisation du codage (cont.)
(b) Classification Internationale Type des
Professions, CITP-08
Type de code Niveau Catégorie Code
Deux chiffres Sous-grands groupes Métiers qualifiés du bâtiment et assimilés, sauf électriciens 71
Trois chiffres Sous-groupes Métiers qualifiés du bâtiment (gros oeuvre) et assimilés 711
Quatre chiffres Groupes de base Maçons 7112
24
8. Sources derreurs de codage
  • Les règles de codage peuvent être déficientes
  • Les règles de codage peuvent ne pas être
    correctement appliquées
  • Le codage peut être fortement subjectif
  • Les opérations de codage sont importantes dans
    les recensements et donc difficile à contrôler

25
  • MERCI
Write a Comment
User Comments (0)
About PowerShow.com