Title: Codage des donn
1- Codage des données de recensement
- Une vue densemble
-
Division de statistique des Nations Unies
2 Vue densemble de la présentation
- Quest-ce que le codage?
- Les méthodes de codage
- Les index de codage
- Types dopérations de codage
- Types de codes
- Questions ouvertes
- Systèmes de codage
- Organisation du codage
- Sources derreurs de codage
3 1. Quest-ce que le codage?
- Processus dans lequel les données du
questionnaire sont transformées and valeurs
numériques et/ou alphanumériques - Objectif est de préparer les données dans une
forme utilisable par un ordinateur pour analyse
ultérieure - Réalisé en déterminant les réponses possibles
pour chaque question et établissant une table de
correspondance entre ces réponses et les valeurs
numériques et/ou alphanumériques
42. Méthodes de codage
- Simple
- Limité à une seule question du questionnaire
- Direct la réponse peut être codée selon une
liste - Structuré
- Utilisé pour des variables complexes (profession,
activité économoqie, éducation, etc.) - Référence peut être faite à plusieurs questions
(statut dans lemploi, public/privé) - Des règles de codage peuvent être établies pour
guider les opérateurs
5Méthodes de codage(cont.)
- Successif (ou hiérarchique)
- Sapplique aux caractéristiques pour lesquels il
est nécessaire davoir plusieurs niveaux de
détail avant dassigner un code - Utilisé communément pour le codage des adresses
- Le codeur commence par chercher à identifier un
niveau gégoraphique large (province), puis
détermine la ville, puis la rue, puis le numéro
dans la rue
63. Index de codage
- Quel que soit le système utilisé, il sappuie sur
des index - Les index sont des liste de réponses
caractéristiques susceptibles dêtre données et À
chacune desquelles est affecté un code. - Doivent sappuyer sur les déclarations des
recensés et pas uniquement sur les libellés des
postes de la nomenclature - Permet de répartir les réponses entre les
diverses rubriques de la nomenclature - Qualité de ces index est primordiale le temps et
les efforts nécessaires ne doivent pas être
sous-estimés - Les index ne sont pas statiques et doivent être
mis à jour pour prendre en compte de nouvelles
réponses
74. Types d'opérations de codage
- Les opérations de codage peuvent impliquer une
des trois options - Assigner des codes numériques aux réponses
libéllées en clair, par exemple les variables
tels que lieux géographique, métier, activité
économique, etc. - Reporter des codes numériques sur une feuille de
programmation séparée de faciliter la saisie de
données. - Utiliser des entrées précodées sur les
questionnaires qui peuvent être employés
directement pour la saisie de données
85.Types de codage
- Réponses pré-codées
- Codage manuel en bureau
9(a) réponses pré-codées
- Adapté aux questions fermées les nombres dans
les cases du questionnaire sont employés pour
coder les réponses - Dans la mesure du possible, les réponses
précodées devraient être employées pour le
recensement avec des codes numériques ou
alphanumériques - Les catégories de codage devraient être
mutuellement exclusives et exhaustives - Pour
- Plus facile
- Plus rapide
- Contre
- Ne peut pas être utilisé pour des questions
ouvertes
10(b) Codage manuel en bureau
- Toutes les questions de recensement ne peuvent
être précodées, par exemple, celles qui exigent
des réponses ouvertes - Létendue complète des réponses peut ne pas être
connue et ne peut pas donc être codée sur place,
ainsi le codage est fait après la collecte
11 Questions ouvertes avantages
- Permet aux répondants de sexprimer par
eux-mêmes, plutôt quavec les termes choisis par
les organisateurs du recensement - Particulièrement approprié pour des concepts
complexes comme la profession - Les chercheurs peuvent étudier comment les
répondants parlent de leur profession par
example, et trouver des informations de valeur
pour eux
12 Questions ouvertes inconvénients
- Différents répondants peuvent aborder la même
question de différentes perspectives de sorte que
leurs réponses ne puissent pas être entièrement
comparables - Les questions ouvertes sont une source commune
d'erreur de mesure sur des recensements - Le codage peut impliquer de grouper ensemble les
répondants qui ont apporté les réponses
semblables. Puisqu'aucun deux répondants peuvent
jamais ne pas donner des réponses identiques, le
codeur peut compléter des détails d'une réponse
en faisant des conjectures au sujet de quel
répondant a voulu dire pour dire.
13Questions ouvertes problèmes autour du codage
- Toutes les questions dun recensement ne peuvent
être précodées (par exemple, caractéristiques
économiques) - Il est nécessaire de former le personnel pour
déterminer des codes appropriés avec les listes
des codes existantes sur la base de l'information
fournie par des répondants - La catégorie autre est habituellement incluse
parce que souvent la gamme complète des réponses
n'est pas connue -
146. systèmes de codage
- Les réponses textuelles et verbales doivent être
remplacées par des codes par intervention - Manuelle
- Assistée par ordinateur
- Automatique
- Combinaison des précédentes
15(a)Codage manuel
- Les codeurs assignent manuellement un code aux
réponses en consultant lindex, ou les livres de
code - Ils écrivent alors manuellement les codes sur un
formulaire pour la saisie et le traitement de
données postérieurs - Pour
- Simple
- Contre
- Long et pénible
- Sujet à des biais et au sur-codage (codeur trop
zélé pour trouver un code même en labsence
dinformation suffisante) - Plus sujet à erreurs que d'autres types de
codage.
16(b) Codage assisté par ordinateur
- Systèmes automatisés (ordinateurs centraux, PCs,
etc.) utilités pour aider les codeurs - Les index utilisés sont comme décrit auparavant,
mais cette fois ils sont stockés sur
lordinateur. Les codes associés sont stockés
dans une base de données et accédés pendant
l'opération de codage - Un codeur peut saisir soit à partir de feuilles
de programmation soit saisir chaque réponse à
partir du questionnaire directement
17(b) Codage assisté par ordinateur (cont.)
- Exécution pratique
- Le codeur dactylographie quelques caractères de
chaque mot dans la réponse - L'ordinateur renvoie une liste de valeurs
possibles à partir de l'index de codage approprié - Le codeur choisit la valeur dans la liste de
possibilités - L'ordinateur enregistre automatiquement le code
correspondant - Exemple pour éleveur de volaille le codeur
écrit elev vol -
18(b) Codage assisté par ordinateur (cont.)
- Pour
- Relativement plus efficace
- Plus de règles de codage peuvent être incorporées
au système pour guider les codeurs, ce qui a pour
conséquence des données de meilleure qualité - Approprié au codage structuré en particulier
- Contre
- Relativement complexe
- Long et coûteux à développer
19(c) Codage automatique
- Un algorithme automatisé compare la réponse
textuelle capturée (par exemple, d'ICR) à des
index, et assigne le numéro de code dans la
majorité des cas sans intervention humaine - Implique typiquement un mécanisme de notation où
un nombre minimum de points est exigé avant
qu'une réponse soit considérée comme valide - Quand le score est au-dessous d'un certain
niveau, l'intervention humaine est nécessaire - Les taux de codage dépendent des algorithmes
utilisés et des types de variables
20(c) Codage automatique (cont.)
- Pour
- Vitesse
- Grande efficacité
- Bonne qualité
- Particulièrement adapté au codage structuré
- Contre
- Complexe
- Coûts élevés
- Risques derreurs systématiques dans le cas de
défauts dans les algorithmes de correspondance et
les index -
217. Organisation du codage
- NSO élaborent souvent une liste de codes communs
pour quelques variables employées dans le
recensement et dans les enquêtes par exemple,
lieu de naissance, langue, appartenance
ethnique/race, citoyenneté - L'exemple du code commun pour le lieu
géographique pourrait être code hiérarchique de
3 chiffres avec pour le premier chiffre le plus
large niveau de la géographie, et le troisième
chiffre le niveau le plus fin - Le problème commun qui se pose est quand les
définitions diffèrent ou changent entre les
recensements (ou entre un recensement et une
enquête) pour des variables telles que le travail
ou l'appartenance ethnique le NSO doit
développer une politique sur la façon dont
prendre en considération ces changements - Pour le codage simple , le NSO doit définir
une liste de codes - Ex. Sexe maaculin-1, féminin-2
- Ex. Type dinactivité au foyer-0, étudiant-1,
retraité-2, other-3
227. Organisation du codage (cont.)
- Pour le codage structuré , il y a un certain
nombre de systèmes de classification
internationaux que les NSOS peuvent employer
directement ou adapter à leurs propres variantes
nationales - Exemples
- Classification Internationale Type par Industrie,
de toutes les branches dactivité économique,
CITI Rév. 4
Type de code Niveau Catégorie Code
Deux chiffres Division Fabrication de produits alimentaires 10
Trois chiffres Groupe Travail des grains, fabrication de produits amylacés 106
Quatre chiffres Classe Travail des grains 1061
237. Organisation du codage (cont.)
(b) Classification Internationale Type des
Professions, CITP-08
Type de code Niveau Catégorie Code
Deux chiffres Sous-grands groupes Métiers qualifiés du bâtiment et assimilés, sauf électriciens 71
Trois chiffres Sous-groupes Métiers qualifiés du bâtiment (gros oeuvre) et assimilés 711
Quatre chiffres Groupes de base Maçons 7112
24 8. Sources derreurs de codage
- Les règles de codage peuvent être déficientes
- Les règles de codage peuvent ne pas être
correctement appliquées - Le codage peut être fortement subjectif
- Les opérations de codage sont importantes dans
les recensements et donc difficile à contrôler
25