Saisie optique des données: Reconnaissance optique de marques (OMR) Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies.

Download Report

Transcript Saisie optique des données: Reconnaissance optique de marques (OMR) Atelier régional des Nations Unies sur le traitement des données du recensement : les technologies.

Saisie optique des données:
Reconnaissance optique de marques
(OMR)
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Sommaire:







OMR: Concepts/Définitions
Conception des formulaires
Scanners & logiciel
Stockage
Précision
OMR: avantages et inconvénients
Fournisseurs commerciaux
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Définition de l’OMR
 Une technologie qui permet à un périphérique
d'entrée (par exemple, un scanner) de lire les
marques inscrites à la main sur du papier
spécialement conçu telles que de petits cercles
ou rectangles .
 Souvent utilisé pour test, enquête, ou des réponses à
un questionnaire.
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Concept de l’OMR
 Le principe de saisie des données par OMR est
basé sur le contraste du à la réflectivité des
positions prédéterminées sur une page
 Désigné ausssi par lecteur optique de marques
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Les formulaires OMR
 "Lit" la marque sous forme de chiffres ou
de lettres et la met dans l'ordinateur.
 Les marques doivent être situées de façon
précise
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Les formulaires OMR
(suite)
 Avec l’OMR on travaille avec un document spécialisé,
contenant des “timing track” (repères sur une piste
latérale) sur un côté du document pour indiquer au
scanner où lire les marques qui ressemblent à des
boîtes noires sur le haut ou le bas d'un formulaire.
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Formulaires OMR (suite)
 Les repères sur la piste indiquent où on lit les
marques et où on coupe les images
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Les Scanners et logiciels OMR

Les scanners OMR ont des « LEDs » (diodes
électroluminescentes) placées dans des positions spécifiques

Les LEDs détectent les marques dans certaines colonnes une fois
qu’un repère est détecté

Le logiciel interprète le résultat de la numérisation et la traduit
dans le format désiré (par exemple ASCII)
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Les Scanners et logiciels OMR (suite)
 Caractéristiques du Scanner :
 ~85 pages par minute (e.g Axiome AXM 980 or
Kodak 3000 Series)
 ~130 pages par minute
(e.g. Kodak i 830)
 Caractéristiques du logiciel:

Effectue des fonctions d'imagerie spécifiques
telles que:
- L'acquisition d'images,
- Conversion de fichiers,
- Extraction de données, et
- Fichier en lecture / écriture des commandes
(e.g. ISIS)
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
OMR: Caractéristiques du Stockage
 Codes à barres : Identification de formes
 Les marques OMR et les codes à barres sont lus et stockés
directement dans un système de gestion de bases de
données (SQL, par exemple), puis dans une base de
données du recensement
 Normalement, les images ne sont pas numérisées et
stockées
 Cependant, la capacité de sauvgarder l'image numérisée
est là!
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Stockage des images numérisées
 De plus en plus critique pour valider les résultats
 Les images peuvent être utilisées pour corriger les
formulaires mal remplis
 Les images peuvent être utilisées pour valider les résultats
 Une base de données des images de formulaires complète
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Précision de l’ OMR
 Pour atteindre une grande précision, une conception bien
structurée ainsi qu’une impression de bonne qualité de
ces formulaires sont essentielles.
 Si le repère et les bulles sur le formulaire ne sont pas
dans les bonnes colonnes où les LEDs dans les têtes de
lecture peuvent les détecter (asymétrie-skew), il n'y a
aucun moyen pour le scanner de lire les marques
(flottement-float)
 On parle d'asymétrie et de flottement
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Avantages de l’OMR
 L’OMR est une technologie de saisie de
données qui ne nécessite pas un moteur de
reconnaissance. Par conséquent:
 Rapide, en utilisant moins de puissance de
traitement pour traiter les formulaires
 Coûts prévisibles et définis
 Vitesses de saisie par OMR sont autour de 4000
formulaires à l'heure
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Inconvénients
 L’OMR ne peut reconnaître les caractères imprimés à la
main ou à la machine
 Avec l’OMR, des images de formulaires ne sont pas
saisies par les scanners de façon que la restitution
électronique n'est pas possible
 Cocher les cases peut ne pas être approprié pour tous
les types de questions
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Défis/Problèmes de l’OMR

L'ensemble du processus doit être testé




Conception du questionnaire et la préparation sont essentielles


Saisie d’information
Reconnaissance
Vérification des résultats
Les formulaires, quand ils sont collectés, doivent être lisibles pour le
scanner
Les agents recenseurs sur le terrain doivent prendre un soin
particulier à remplir les questionnaires


L'exhaustivité et les contrôles de cohérence doivent être mis en place
Une attention particulière pour prendre soin de l'état du questionnaire
(poussière, humidité, transport, etc)
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Quelques fournisseurs majeurs

Contex- Danish company

Pearson NCS - UK Company with US manufacturing base

Scantron - US Company with US manufacturing base

Sekonic - Japanese Company with Japanese manufacturing
base (http://www.sekonic.co.jp)

Axiome - Swiss Company with Swiss Manufacturing base
(http://www.ncspearson.com)
(http://www.scantron.com)
(http://www.axiome.ch)
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008
Merci pour votre attention!
Atelier régional des Nations Unies sur le traitement des données du recensement : les
technologies modernes pour la saisie et correction des données
Bamako, Mali, 3-7 Novembre 2008