Saisie des données de recensement: vue d’ensemble Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes.

Download Report

Transcript Saisie des données de recensement: vue d’ensemble Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes.

Saisie des données de
recensement: vue d’ensemble
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Sommaire
 Définition (N-U)
 Méthodes de saisie de données :
- Différentes Méthodes
- Avantages et inconvénients
 Facteurs à considérer lors du choix d’une méthode
 Conclusion
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Qu’est-ce que la
saisie de données?
“la saisie de données est le procédé utilisé pour
convertir les données obtenues lors du
recensement dans une forme interprétable par un
ordinateur” (traduction libre)
“Data capture is the system used to convert the information
obtained in the census to a format that can be interpreted by
a computer.”
Source: United Nations Principles and Recommendations for Population and
Housing Censuses, Rev. 2, p.68.
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Méthodes de saisie de données
1) Saisie au clavier (manuelle)
2) Reconnaissance optique de marques (OMR)
3) Reconnaissance optique de caractères
(OCR) / Reconnaissance intelligente de
caractères /ICR)
4) Assistant Numérique Personnel (PDA)
5) Internet
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Saisie au clavier (manuelle)

Les réponses obtenues lors du recensement sont entrées par le
biais du clavier dans un ordinateur

Peut avoir recours à une assistance par ordinateur où l’opérateur
sélectionne une réponse parmi plusieurs options affichées sur
écran

L’utilisation de cette méthode dépend des facteurs délai, coût,
installation d’une infrastructure technologique, etc.

Peut nécessiter le traitement des réponses sous forme de texte
en une classification par catégorie
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Avantages et inconvénients de la saisie manuelle
Advantages

Méthode requièrt des logiciels
et équipements simples

Moins coûteuse!

Déploiement d’un grand
nombre de PC pour d’autres
utilisations après le
recensement
Disadvantages

Exige plus de personnel

Tâche prend plus de temps que celle
de la saisie automatique

Erreurs potentielles durant la saisie

Normalisation des opérations difficle
vu que la performance dépend des
individus
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Technologies de saisie de données

Les techniques d’imagerie et de reconnaissances optique et
intelligente de caractères offrent un grand potentiel et des
avantages pour la saisie des données

L’utilisation de la technologie pour la saisie des données
devrait être pour renforcer leur efficacité/efficience et non
pour le bien de la technologie

Sensibilisation pour les longs délais et l’infrastructure
technologique nécessaires pour la réussite de la mise en
œuvre de la reconnaissance intelligente de caractères
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Reconnaissance Optique de Marques (OMR)

L’OMR est une méthode de numérisation des formulaires ou
les réponses sont lues par un ordinateur sans le recours à un
clavier

La technologie OMR lit les réponses à des questions de type
“cases à cocher” sur un papier spécial

La machine ne détecte que la présence ou l’absence de la
marque

Les réponses scannées sont transformées en codes

Les réponses écrites à la main doivent être saisies
manuellement ou codées avec l’assistance d’un ordinateur
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Avantages et inconvénients de l’OMR
Avantages
Inconvénients

Plus rapide que celle de la
saisie manuelle
Restrictions au niveau du modèle des
formulaires, les types de papier et
encre à utiliser


Equipement relativement
pas cher


Relativement simple à
installer et faire fonctionner
Précision exigée pour le processus
d’impression et de coupure du papier
Les réponses dans des cases doivent
être cochées par des moyens de
marquage visibles par la machine (un
stylo ou crayon de graphite)


Technologie testée et
utilisée dans plusieurs pays
Pas de saisie de réponses sous forme
de texte

Amélioration dans la
précision des données

Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Reconnaissance Optique de Caractères (OCR)/
Reconnaissance Intelligente de Caractères (ICR)

OCR et ICR combinent les technologies de scannage et de
reconnaissance de caractères pour numériser au complet le
formulaire et interpréter les réponses

L’OCR reconnait seulement les caractères imprimées à la
machine

L’ICR lit à la fois les réponses imprimées à la machine et celles
écrites à la main dans des places bien spécifiques du formulaire
et convertit les réponses en codes

Pour l’OCR, les réponses écrites à la main doivent être saisies
manuellement ou codées avec l’assistance par ordinateur
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Principes de fonctionnement
 Scannage optique d’une page dont on veut récupérer le
texte (image numérique)
 Image contrastée pour que le programme discerne
facilement les caractères
 Le programme lit le document et, se basant sur des
bibliothèques de formes, détecte les caractères afin d’en
faire correspondre la forme au caractère attendu
 Des dictionnaires permettent de recupérer certaines
erreurs puisque le logiciel se basera alors sur des mots
existants pour faire ses comparaisons
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Advantages of OCR/ICR

La conception du formulaire n’est pas aussi stricte que pour
l’OMR

Le délai de traitement peut être réduit en raison de la nature
automatisée du processus

Permet le dépôt sous forme numérique des questionnaires,
améliorant l'efficacité de stockage et de récupération des
questionnaires pour un usage futur

Certains réponses manuscrites peuvent être automatiquement
codées améliorant ainsi la qualité des données
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Inconvénients de OCR/ICR

Augmentation du coût des équipements (matériel sophistiqué /
logiciel requis)

Personnel («IT ») de haut niveau, nécessaire pour appuyer le
système

L’ écriture manuelle sur les formulaires de recensement doit
être aussi proche que possible du modèle de l'écriture pour
éviter les erreurs de reconnaissance

Possibilité d’erreurs durant la substitution de caractères,
affectant la qualité des données

Le réglage du moteur de reconnaissance est critique, avec un
compromis sur la qualité et le coût
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Assistant Numérique Personnel (PDA)
 Un PDA (Personal Digital Assistant,
littéralement assistant numérique
personnel, aussi appelé organiseur) est un
ordinateur de poche composé d'un
processeur, de mémoire vive, d'un écran
tactile et de fonctionnalités réseau dans un
boîtier compact d'extrêmement petite taille.
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Fonctionnement du PDA

Le contenu du formulaire de recensement est enregistré sur
le PDA afin que les questions apparaissent successivement
sur l'écran

Les données sont entrées dans un ordinateur de poche au
lieu du papier du formulaire de recensement

Les données sont ensuite transmises par voie électronique à
la base de données de l’office national de la statistique pour
un traitement ultérieur
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Avantages et inconvénients de l’utilisation du PDA
Advantages
Inconvénients

La saisie instantanée des données au
point de collecte, permet de réduire
les erreurs de saisie manuelle

Mise en place du système peut prendre
beaucoup de temps car il nécessite de
nombreux essais

Validation immédiate des données,
réduction des re-vérifications
ultérieures

Exige que les agents recenseurs aient la
capacité d'utiliser le dispositif qui nécessiterait
la conduite d'un test

Délai plus efficace avec les régles de
validation logique, réduisant les
erreurs logiques

Nécessite une formation intensive des
enquêteurs sur l'usage de dispositif (formation
plus compliquée)

Traitement plus rapide de l’
information du recensement menant
à la dispposition à temps des
résultats

Besoin de recharger la batterie qui pourrait se
décharger durant le recensement

Possibilité de défaillance de l'équipement
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Collecte par Internet

Internet est de plus en plus utilisé pour la collecte des données
du recensement

Toutefois, la méthode est toujours utilisée en complément avec
d'autres méthodes plus établies

Le formulaire en ligne n'est pas une version téléchargeable de la
version papier

Un mot de passe, pour accéder et remplir le formulaire, est
requis

Le développement du système de collecte de données par
Internet est généralement sous-traité pour manque d'expertise
interne
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Internet: avantages/inconvénients
Avantages





Réduction des ressources
nécessaires à la gestion des
formulaires et la saisie des données
Meilleure opportunité pour
atteindre les zones géographiques
difficiles et recenser certains
groupes de population
Filtrage automatique de la
pertinence des questions
Des données de meilleure qualité
en raison du mécanisme de
vérification interactif, intégré à la
machine
Disponibilité plus rapide des
résultats du recensement, due a un
processus de saisie et correction de
données plus simplifié
Inconvénients






Exige que les répondants aient un ordinateur
avec accès Internet
Gestion des réponses peut être
problématique, par exemple, que les
ménages ont répondu une et une seule fois
Exige un haut niveau de système de sécurité
pour assurer la sécurité du transfert et la
confidentialité des données
Nécessité de mettre en place du système de
traitement parallèle vu que tout le monde ne
va utiliser l'Internet
Nécessite d’un mécanisme pour vérifier les
omissions et communications
Est coûteux et nécessite beaucoup de
ressources pour la mise en place de manière
adéquate et tester le système
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Facteurs à considérer lors
du choix d’une méthode
 Choix de la méthode devrait faire partie de l'objectif stratégique
global du recensement de la population en termes de délai, de
précision et de coût
 Choix de système de traitement et de la technologie à utiliser
doivent être mis en place au début du processus de recensement
 Suffisamment de temps est nécessaire pour expérimenter et
mettre en œuvre le système
 Lorsque la technologie de l'imagerie est utilisée pour la saisie des
données, des tests sont nécessaires bien avant le recensement
 Possibilité de sous-traiter quand l'expertise requise n'est pas
disponible
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Facteurs à considérer
(cont.)
 Des tests extensifs du système sont également
critiques quant la collecte de données est effectuée soit
par PDA soit via Internet
 Conception et qualité du papier de recensement
devraient être liées à la méthode de saisie des données
 Lorsque on décide d’utiliser la technologie de l'imagerie,
une formation adéquate des agents recenseurs sur la
façon de bien remplir les formulaires est cruciale
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Conclusion
 Le choix d’une méthode appropriée dépend de la situation
particulière de chaque pays
 Chaque méthode a ses avantages et ses inconvénients,
ses coûts et impacts sur les équipments logiciel et matériel
au niveau de la saisie de données mais aussi au niveau
des étapes ultérieures
 Dans un recensement, la saisie de données peut impliquer
une combinaison de plus d’une des méthodes présentées
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Merci
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008