Title: Atelier r
1- Saisie des données de recensement vue densemble
2Sommaire
- Définition (N-U)
- Méthodes de saisie de données
- Différentes Méthodes
- Avantages et inconvénients
- Facteurs à considérer lors du choix dune méthode
- Conclusion
3Quest-ce que la saisie de données?
- la saisie de données est le procédé utilisé
pour convertir les données obtenues lors du
recensement dans une forme interprétable par un
ordinateur (traduction libre) - Data capture is the system used to convert the
information obtained in the census to a format
that can be interpreted by a computer. - Source United Nations Principles and
Recommendations for Population and Housing
Censuses, Rev. 2, p.68.
4Méthodes de saisie de données
- Saisie au clavier (manuelle)
- Reconnaissance optique de marques (OMR)
- Reconnaissance optique de caractères (OCR) /
Reconnaissance intelligente de caractères /ICR) - Assistant Numérique Personnel (PDA)
- Internet
5Saisie au clavier (manuelle)
- Les réponses obtenues lors du recensement sont
entrées par le biais du clavier dans un
ordinateur - Peut avoir recours à une assistance par
ordinateur où lopérateur sélectionne une réponse
parmi plusieurs options affichées sur écran - Lutilisation de cette méthode dépend des
facteurs délai, coût, installation dune
infrastructure technologique, etc. - Peut nécessiter le traitement des réponses sous
forme de texte en une classification par catégorie
6Avantages et inconvénients de la saisie manuelle
- Advantages
- Méthode requièrt des logiciels et équipements
simples -
- Moins coûteuse!
- Déploiement dun grand nombre de PC pour dautres
utilisations après le recensement
- Disadvantages
- Exige plus de personnel
- Tâche prend plus de temps que celle de la saisie
automatique - Erreurs potentielles durant la saisie
- Normalisation des opérations difficle vu que la
performance dépend des individus
7Technologies de saisie de données
- Les techniques dimagerie et de reconnaissances
optique et intelligente de caractères offrent un
grand potentiel et des avantages pour la saisie
des données - Lutilisation de la technologie pour la saisie
des données devrait être pour renforcer leur
efficacité/efficience et non pour le bien de la
technologie - Sensibilisation pour les longs délais et
linfrastructure technologique nécessaires pour
la réussite de la mise en œuvre de la
reconnaissance intelligente de caractères
8Reconnaissance Optique de Marques (OMR)
- LOMR est une méthode de numérisation des
formulaires ou les réponses sont lues par un
ordinateur sans le recours à un clavier - La technologie OMR lit les réponses à des
questions de type cases à cocher sur un papier
spécial - La machine ne détecte que la présence ou
labsence de la marque - Les réponses scannées sont transformées en codes
- Les réponses écrites à la main doivent être
saisies manuellement ou codées avec lassistance
dun ordinateur
9Avantages et inconvénients de lOMR
- Avantages
- Amélioration dans la précision des données
- Plus rapide que celle de la saisie manuelle
- Equipement relativement pas cher
- Relativement simple à installer et faire
fonctionner - Technologie testée et utilisée dans plusieurs
pays
- Inconvénients
- Restrictions au niveau du modèle des formulaires,
les types de papier et encre à utiliser - Précision exigée pour le processus dimpression
et de coupure du papier - Les réponses dans des cases doivent être cochées
par des moyens de marquage visibles par la
machine (un stylo ou crayon de graphite) - Pas de saisie de réponses sous forme de texte
10Reconnaissance Optique de Caractères (OCR)/
Reconnaissance Intelligente de Caractères (ICR)
- OCR et ICR combinent les technologies de scannage
et de reconnaissance de caractères pour numériser
au complet le formulaire et interpréter les
réponses - LOCR reconnait seulement les caractères
imprimées à la machine - LICR lit à la fois les réponses imprimées à la
machine et celles écrites à la main dans des
places bien spécifiques du formulaire et
convertit les réponses en codes - Pour lOCR, les réponses écrites à la main
doivent être saisies manuellement ou codées avec
lassistance par ordinateur
11Principes de fonctionnement
- Scannage optique dune page dont on veut
récupérer le texte (image numérique) - Image contrastée pour que le programme discerne
facilement les caractères - Le programme lit le document et, se basant sur
des bibliothèques de formes, détecte les
caractères afin den faire correspondre la forme
au caractère attendu - Des dictionnaires permettent de recupérer
certaines erreurs puisque le logiciel se basera
alors sur des mots existants pour faire ses
comparaisons
12Advantages of OCR/ICR
- La conception du formulaire nest pas aussi
stricte que pour lOMR - Le délai de traitement peut être réduit en raison
de la nature automatisée du processus - Permet le dépôt sous forme numérique des
questionnaires, améliorant l'efficacité de
stockage et de récupération des questionnaires
pour un usage futur - Certains réponses manuscrites peuvent être
automatiquement codées améliorant ainsi la
qualité des données
13Inconvénients de OCR/ICR
- Augmentation du coût des équipements (matériel
sophistiqué / logiciel requis) - Personnel (IT ) de haut niveau, nécessaire pour
appuyer le système - L écriture manuelle sur les formulaires de
recensement doit être aussi proche que possible
du modèle de l'écriture pour éviter les erreurs
de reconnaissance - Possibilité derreurs durant la substitution de
caractères, affectant la qualité des données - Le réglage du moteur de reconnaissance est
critique, avec un compromis sur la qualité et le
coût
14Assistant Numérique Personnel (PDA)
- Un PDA (Personal Digital Assistant, littéralement
assistant numérique personnel, aussi appelé
organiseur) est un ordinateur de poche composé
d'un processeur, de mémoire vive, d'un écran
tactile et de fonctionnalités réseau dans un
boîtier compact d'extrêmement petite taille.
15Fonctionnement du PDA
- Le contenu du formulaire de recensement est
enregistré sur le PDA afin que les questions
apparaissent successivement sur l'écran - Les données sont entrées dans un ordinateur de
poche au lieu du papier du formulaire de
recensement - Les données sont ensuite transmises par voie
électronique à la base de données de loffice
national de la statistique pour un traitement
ultérieur
16Avantages et inconvénients de lutilisation du PDA
- Advantages
- La saisie instantanée des données au point de
collecte, permet de réduire les erreurs de saisie
manuelle - Validation immédiate des données, réduction des
re-vérifications ultérieures - Délai plus efficace avec les régles de validation
logique, réduisant les erreurs logiques - Traitement plus rapide de l information du
recensement menant à la dispposition à temps des
résultats -
- Inconvénients
- Mise en place du système peut prendre beaucoup de
temps car il nécessite de nombreux essais - Exige que les agents recenseurs aient la capacité
d'utiliser le dispositif qui nécessiterait la
conduite d'un test - Nécessite une formation intensive des enquêteurs
sur l'usage de dispositif (formation plus
compliquée) - Besoin de recharger la batterie qui pourrait se
décharger durant le recensement - Possibilité de défaillance de l'équipement
17Collecte par Internet
- Internet est de plus en plus utilisé pour la
collecte des données du recensement - Toutefois, la méthode est toujours utilisée en
complément avec d'autres méthodes plus établies - Le formulaire en ligne n'est pas une version
téléchargeable de la version papier - Un mot de passe, pour accéder et remplir le
formulaire, est requis - Le développement du système de collecte de
données par Internet est généralement sous-traité
pour manque d'expertise interne
18Internet avantages/inconvénients
- Avantages
- Réduction des ressources nécessaires à la gestion
des formulaires et la saisie des données - Meilleure opportunité pour atteindre les zones
géographiques difficiles et recenser certains
groupes de population - Filtrage automatique de la pertinence des
questions - Des données de meilleure qualité en raison du
mécanisme de vérification interactif, intégré à
la machine - Disponibilité plus rapide des résultats du
recensement, due a un processus de saisie et
correction de données plus simplifié -
- Inconvénients
- Exige que les répondants aient un ordinateur avec
accès Internet - Gestion des réponses peut être problématique, par
exemple, que les ménages ont répondu une et une
seule fois - Exige un haut niveau de système de sécurité pour
assurer la sécurité du transfert et la
confidentialité des données - Nécessité de mettre en place du système de
traitement parallèle vu que tout le monde ne va
utiliser l'Internet - Nécessite dun mécanisme pour vérifier les
omissions et communications - Est coûteux et nécessite beaucoup de ressources
pour la mise en place de manière adéquate et
tester le système
19Facteurs à considérer lorsdu choix dune méthode
- Choix de la méthode devrait faire partie de
l'objectif stratégique global du recensement de
la population en termes de délai, de précision et
de coût - Choix de système de traitement et de la
technologie à utiliser doivent être mis en place
au début du processus de recensement - Suffisamment de temps est nécessaire pour
expérimenter et mettre en œuvre le système - Lorsque la technologie de l'imagerie est utilisée
pour la saisie des données, des tests sont
nécessaires bien avant le recensement - Possibilité de sous-traiter quand l'expertise
requise n'est pas disponible
20Facteurs à considérer (cont.)
- Des tests extensifs du système sont également
critiques quant la collecte de données est
effectuée soit par PDA soit via Internet - Conception et qualité du papier de recensement
devraient être liées à la méthode de saisie des
données - Lorsque on décide dutiliser la technologie de
l'imagerie, une formation adéquate des agents
recenseurs sur la façon de bien remplir les
formulaires est cruciale
21Conclusion
- Le choix dune méthode appropriée dépend de la
situation particulière de chaque pays - Chaque méthode a ses avantages et ses
inconvénients, ses coûts et impacts sur les
équipments logiciel et matériel au niveau de la
saisie de données mais aussi au niveau des étapes
ultérieures - Dans un recensement, la saisie de données peut
impliquer une combinaison de plus dune des
méthodes présentées
22