Saisie des données de recensement: vue d’ensemble Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes.
Download ReportTranscript Saisie des données de recensement: vue d’ensemble Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes.
Saisie des données de recensement: vue d’ensemble Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 Sommaire Définition (N-U) Méthodes de saisie de données : - Différentes Méthodes - Avantages et inconvénients Facteurs à considérer lors du choix d’une méthode Conclusion Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 Qu’est-ce que la saisie de données? “la saisie de données est le procédé utilisé pour convertir les données obtenues lors du recensement dans une forme interprétable par un ordinateur” (traduction libre) “Data capture is the system used to convert the information obtained in the census to a format that can be interpreted by a computer.” Source: United Nations Principles and Recommendations for Population and Housing Censuses, Rev. 2, p.68. Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 Méthodes de saisie de données 1) Saisie au clavier (manuelle) 2) Reconnaissance optique de marques (OMR) 3) Reconnaissance optique de caractères (OCR) / Reconnaissance intelligente de caractères /ICR) 4) Assistant Numérique Personnel (PDA) 5) Internet Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 Saisie au clavier (manuelle) Les réponses obtenues lors du recensement sont entrées par le biais du clavier dans un ordinateur Peut avoir recours à une assistance par ordinateur où l’opérateur sélectionne une réponse parmi plusieurs options affichées sur écran L’utilisation de cette méthode dépend des facteurs délai, coût, installation d’une infrastructure technologique, etc. Peut nécessiter le traitement des réponses sous forme de texte en une classification par catégorie Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 Avantages et inconvénients de la saisie manuelle Advantages Méthode requièrt des logiciels et équipements simples Moins coûteuse! Déploiement d’un grand nombre de PC pour d’autres utilisations après le recensement Disadvantages Exige plus de personnel Tâche prend plus de temps que celle de la saisie automatique Erreurs potentielles durant la saisie Normalisation des opérations difficle vu que la performance dépend des individus Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 Technologies de saisie de données Les techniques d’imagerie et de reconnaissances optique et intelligente de caractères offrent un grand potentiel et des avantages pour la saisie des données L’utilisation de la technologie pour la saisie des données devrait être pour renforcer leur efficacité/efficience et non pour le bien de la technologie Sensibilisation pour les longs délais et l’infrastructure technologique nécessaires pour la réussite de la mise en œuvre de la reconnaissance intelligente de caractères Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 Reconnaissance Optique de Marques (OMR) L’OMR est une méthode de numérisation des formulaires ou les réponses sont lues par un ordinateur sans le recours à un clavier La technologie OMR lit les réponses à des questions de type “cases à cocher” sur un papier spécial La machine ne détecte que la présence ou l’absence de la marque Les réponses scannées sont transformées en codes Les réponses écrites à la main doivent être saisies manuellement ou codées avec l’assistance d’un ordinateur Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 Avantages et inconvénients de l’OMR Avantages Inconvénients Plus rapide que celle de la saisie manuelle Restrictions au niveau du modèle des formulaires, les types de papier et encre à utiliser Equipement relativement pas cher Relativement simple à installer et faire fonctionner Précision exigée pour le processus d’impression et de coupure du papier Les réponses dans des cases doivent être cochées par des moyens de marquage visibles par la machine (un stylo ou crayon de graphite) Technologie testée et utilisée dans plusieurs pays Pas de saisie de réponses sous forme de texte Amélioration dans la précision des données Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 Reconnaissance Optique de Caractères (OCR)/ Reconnaissance Intelligente de Caractères (ICR) OCR et ICR combinent les technologies de scannage et de reconnaissance de caractères pour numériser au complet le formulaire et interpréter les réponses L’OCR reconnait seulement les caractères imprimées à la machine L’ICR lit à la fois les réponses imprimées à la machine et celles écrites à la main dans des places bien spécifiques du formulaire et convertit les réponses en codes Pour l’OCR, les réponses écrites à la main doivent être saisies manuellement ou codées avec l’assistance par ordinateur Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 Principes de fonctionnement Scannage optique d’une page dont on veut récupérer le texte (image numérique) Image contrastée pour que le programme discerne facilement les caractères Le programme lit le document et, se basant sur des bibliothèques de formes, détecte les caractères afin d’en faire correspondre la forme au caractère attendu Des dictionnaires permettent de recupérer certaines erreurs puisque le logiciel se basera alors sur des mots existants pour faire ses comparaisons Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 Advantages of OCR/ICR La conception du formulaire n’est pas aussi stricte que pour l’OMR Le délai de traitement peut être réduit en raison de la nature automatisée du processus Permet le dépôt sous forme numérique des questionnaires, améliorant l'efficacité de stockage et de récupération des questionnaires pour un usage futur Certains réponses manuscrites peuvent être automatiquement codées améliorant ainsi la qualité des données Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 Inconvénients de OCR/ICR Augmentation du coût des équipements (matériel sophistiqué / logiciel requis) Personnel («IT ») de haut niveau, nécessaire pour appuyer le système L’ écriture manuelle sur les formulaires de recensement doit être aussi proche que possible du modèle de l'écriture pour éviter les erreurs de reconnaissance Possibilité d’erreurs durant la substitution de caractères, affectant la qualité des données Le réglage du moteur de reconnaissance est critique, avec un compromis sur la qualité et le coût Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 Assistant Numérique Personnel (PDA) Un PDA (Personal Digital Assistant, littéralement assistant numérique personnel, aussi appelé organiseur) est un ordinateur de poche composé d'un processeur, de mémoire vive, d'un écran tactile et de fonctionnalités réseau dans un boîtier compact d'extrêmement petite taille. Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 Fonctionnement du PDA Le contenu du formulaire de recensement est enregistré sur le PDA afin que les questions apparaissent successivement sur l'écran Les données sont entrées dans un ordinateur de poche au lieu du papier du formulaire de recensement Les données sont ensuite transmises par voie électronique à la base de données de l’office national de la statistique pour un traitement ultérieur Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 Avantages et inconvénients de l’utilisation du PDA Advantages Inconvénients La saisie instantanée des données au point de collecte, permet de réduire les erreurs de saisie manuelle Mise en place du système peut prendre beaucoup de temps car il nécessite de nombreux essais Validation immédiate des données, réduction des re-vérifications ultérieures Exige que les agents recenseurs aient la capacité d'utiliser le dispositif qui nécessiterait la conduite d'un test Délai plus efficace avec les régles de validation logique, réduisant les erreurs logiques Nécessite une formation intensive des enquêteurs sur l'usage de dispositif (formation plus compliquée) Traitement plus rapide de l’ information du recensement menant à la dispposition à temps des résultats Besoin de recharger la batterie qui pourrait se décharger durant le recensement Possibilité de défaillance de l'équipement Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 Collecte par Internet Internet est de plus en plus utilisé pour la collecte des données du recensement Toutefois, la méthode est toujours utilisée en complément avec d'autres méthodes plus établies Le formulaire en ligne n'est pas une version téléchargeable de la version papier Un mot de passe, pour accéder et remplir le formulaire, est requis Le développement du système de collecte de données par Internet est généralement sous-traité pour manque d'expertise interne Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 Internet: avantages/inconvénients Avantages Réduction des ressources nécessaires à la gestion des formulaires et la saisie des données Meilleure opportunité pour atteindre les zones géographiques difficiles et recenser certains groupes de population Filtrage automatique de la pertinence des questions Des données de meilleure qualité en raison du mécanisme de vérification interactif, intégré à la machine Disponibilité plus rapide des résultats du recensement, due a un processus de saisie et correction de données plus simplifié Inconvénients Exige que les répondants aient un ordinateur avec accès Internet Gestion des réponses peut être problématique, par exemple, que les ménages ont répondu une et une seule fois Exige un haut niveau de système de sécurité pour assurer la sécurité du transfert et la confidentialité des données Nécessité de mettre en place du système de traitement parallèle vu que tout le monde ne va utiliser l'Internet Nécessite d’un mécanisme pour vérifier les omissions et communications Est coûteux et nécessite beaucoup de ressources pour la mise en place de manière adéquate et tester le système Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 Facteurs à considérer lors du choix d’une méthode Choix de la méthode devrait faire partie de l'objectif stratégique global du recensement de la population en termes de délai, de précision et de coût Choix de système de traitement et de la technologie à utiliser doivent être mis en place au début du processus de recensement Suffisamment de temps est nécessaire pour expérimenter et mettre en œuvre le système Lorsque la technologie de l'imagerie est utilisée pour la saisie des données, des tests sont nécessaires bien avant le recensement Possibilité de sous-traiter quand l'expertise requise n'est pas disponible Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 Facteurs à considérer (cont.) Des tests extensifs du système sont également critiques quant la collecte de données est effectuée soit par PDA soit via Internet Conception et qualité du papier de recensement devraient être liées à la méthode de saisie des données Lorsque on décide d’utiliser la technologie de l'imagerie, une formation adéquate des agents recenseurs sur la façon de bien remplir les formulaires est cruciale Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 Conclusion Le choix d’une méthode appropriée dépend de la situation particulière de chaque pays Chaque méthode a ses avantages et ses inconvénients, ses coûts et impacts sur les équipments logiciel et matériel au niveau de la saisie de données mais aussi au niveau des étapes ultérieures Dans un recensement, la saisie de données peut impliquer une combinaison de plus d’une des méthodes présentées Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008 Merci Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies modernes pour la saisie et correction des données Bamako, Mali, 3-7 Novembre 2008