Collecte et Conversion des Données Workshop on Census Cartography and Management, Port-of-Spain, Trinidad and Tobago, 22-26 October 2007

Collecte et Conversion des Données
Données nécessaires pour la mise en place de
la BDN de recensement
Identification des sources de données existantes:
Collecte des données géographiques supplémentaires
Conversion des données
• Numérisation
• Topologie
intégration des données dans la BD
• Géoréférencement
• Codage
• Combinaison et intégration
Pourquoi un Inventaire de données ?
Identifier les sources de données existantes et les
Eviter la duplication des efforts
Données géographiques:
• travail intensif
• propension aux erreurs
• couts élevés (70% des projects SIG)
Inventaire des cartes analogues existantes
Cartes nationales d’ensemble 1:250,000-1:5,000,000
• divisions du territoire, agglomérations, routes, cours
d’eau, lacs, relief, etc.
Cartes Topographiques- 1:25,000 to 250,000
Cartes/Plans de ville, (1:1,000 to 1:5,000)
rues, quartiers, parcs, etc.
Cartes des unités administratives (a tous les niveaux)
Cartes Thématiques
distribution population (des recensements précédents)
Inventaire (cont.)
Données numériques existantes :
• Import
cartes numériques, Photos aéreiennes,
images satellitales.
Collecte des données géographiques supplementaires:
• Travail sur terrain (techniques traditionnelles de levés,
GPS, SIG nomade)
• Imagerie aérienne & satellitale.
Collecte de Donnees
Photo. aerienne
Leves terrain
Recensement & Enquetes
Conversion des informations sur les cartes
imprimées en données numériques
Carte Papier
Carte numerique
(reproduite a souhait)
Conversion des données géographiques:
Deux méthodes:
• Numérisation manuelle
• Table à numeriser
• Sur écran: frontale “heads-up digitizing”
• Scannage
• Scanneur
• Conversion raster to vector
Numerisation Manuelle
Methode la plus courante
conversion de donnees
Necessite une table a numeriser
• Dim. Variables: (25x25 cm to
Idealement, la carte doit etre
plate, sans plis ou dechirures
Cout: quelques centaines a
dizaines $
Etapes de numerisation
Determiner 4 points de repere sur la carte ( dont les
coordonnees reelles sont connues dans le systeme de
projection de la carte de base)
Tracer les elements ponctuels et lineaires qui vont être
numérisés avec un curseur (souris): mode vecteur
Mode d’enregistrement des coordonnees:
• Point: cliquer sur des positions où la direction change
• Mode controle (“Stream”) : le numériseur enregistre
automatiquement la position, à intervalles réguliers ou
lorsque le curseur s’est déplacé à une distance fixe.
Numérisation frontale (sur ecran) I
Les elements cartographiques sont tracés sur une feuille
transparente qu’on attache à l'écran
Option, s'il n'ya pas de numériseur disponible; et exigence
en précision tres reduite
Heads-Up Digitizing II
Methode commune
Une carte scannée, une
photographie aérienne ou une
image satellite come arriereplan
L’operateur suit la trace des
elements geographiques a l’aide
d'une souris (en mode vecteur)
Avantages et inconvenients de la numerisation
Facile à apprendre et donc ne nécessite pas de maind'oeuvre qualifiée et coûteuse ,
informations attributaires peuvent être ajoutées au cours
du processus de numérisation
Grande précision peut être atteinte grâce à la
numérisation manuelle: il y a généralement un minimum
de perte de précision par rapport à la carte-source
Necessite un travail fastidieux, fatigant: des instructions
de controle a etablir pour reduire les erreurs et gagner du
temps lors des corrections ulterieures
Processus lent: projets de conversion de donnees a large
echelle necessitent un grand nombre d’operateurs et
tables a numeriser
Precision des cartes numerisees limitee par la qualite de
la source
Le Scannage: alternative viable par rapport a la
Balayage optique:
le scannage donne une image
matricielle (raster) de la carte
initiale, image qui peut etre
standard (TIFF ou GIF)
Plusieurs types dont les prix varient
selon le mode de balayage et la
Avantages et desavantages du scannage
Les cartes scannees peuvent etre utilisees comme arriereplan pour l’information vectorielle
Les cartes topographiques scannees peuvent etre combinees
avec les limites des DR numerisees pour la production des
cartes pour les enqueteurs
Les scanneurs Petit format scanners sont relativement peu
chers et fournissent une saisie rapide des donnees
Les informations scannees (raster) sont
coordonnees (vecteur): vectorisation
Conversion de large cartes avec un scanneur petit format
exige un re-assemblage fastidieux des parts individuelles
Scanners de grand format et a grand debit sont chers
Malgre les recentes avancees dans les logiciels de
vectorization associes au scannage, une correction a la
main est parfois necessaire.
Verification et correction
Objectif de la numerisation: represention exacte de la
carte d’origine
La numerisation manuelle est sujette a des erreurs:
• Les lignes qui se connectent sur la carte doivent se
connecter dans la base de donnees numerique:
connecter les lignes
• Pas d’objets manquants, ni
d’objets dupliques,
Some common digitizing errors
-” Spike”: pointe
- “undershoot”: ligne
trop courte
- “overshoot”:
line digitized
Correction automatique de quelques
erreurs de numerisation
Quelques unes de ces erreurs courantes peuvent etre evitees en
utilisant les tolerances du logiciel de numerisation (tolerance de
raccordement: “snap tolerance”).
• Par exemple, on peut specifier que tous les points extremes d’une
ligne qui se trouvent a moins d’1 mm d’une autre ligne seront
automatiquement raccordees (‘snapped”).
Les polygones minces crees lorsqu’une ligne est numerisee deux
fois doivent etre automatiquement elimines.
Construction de la Topologie
Le SIG determine les relations entre les objets geographiques
features dans la base de donnees
Par exemple, le systeme va determiner les intersections entre
deux ou plusieurs routes et creer les noeuds
Pour les donnees polygone, le systeme va determiner quelle
lignes qui definissent le contour de chaque polygone
La construction de topologie facilite le processus de correction:
reperer les polygones qui ne sont pas clos
Integration des donnees (multi-sources, multiformats, multi-echelles)
• Consiste a convertir les coordinates de la carte (relatives) aux
coordonnes reelles correspondant au systeme de projection
de la carte-source (pourrait etre effectue au stade de
Attacher des codes aux objects numerises (point, ligne,
polygone), assurant le lien entre les entites geographiques aux
attributs enregistres pour chacune d’elles
Integrer d’autres donnees attributaires: “Spreadsheets”, liens
avec des bases de donnees externes
Conversion des donnees
• Conversion des cartes analogues en cartes numeriques
• Numerisation
• Scannage (incluant la vectorisation)
• Correction
• Topologie
• Georeferencement
• Codage
• Integration de donnees attributaires
Merci pour votre attention!
Sources of
geographic data
Identify existing
data sources
Paper maps,
existing printed
air photos and
satellite images
Field mapping
such as
sketch maps
Digital air photos
and satellite
GPS coordinate
Existing digital
Generate lines
and polygons
Raster to vector
(automated or
topology for
Digital map
data integration
(coordinate transformation and
projection change)
Coding (labelling)
of digital
Combine and
integrate digital
map sheets
Parallel activity
delineation of
EA boundaries
Data resolution: Typically applied to raster GIS databases,
this is the size of raster grid cells.
Resolution is the
measurement of the smallest map feature that can be
stored or displayed
OBIA Raster to Vector Conversion
Object-Based Image Analysis (OBIA) is a tentative name
for a sub-discipline of GIScience devoted to partitioning
remote sensing (RS) imagery into meaningful image-objects,
and assessing their characteristics through spatial, spectral
and temporal scale. At its most fundamental level, OBIA
requires image segmentation,
attribution, classification and the ability to query and link
individual objects (a.k.a. segments) in space and time. In
order to achieve this, OBIA incorporates knowledge from a
vast array of disciplines involved in the generation and use of
geographic information (GI).
Object-Based Image Analysis
OBIA Dwelling Identification
• Segmentation based
• Pixel based
• Automated Digitizing
Object-Based Image Analysis
• Increasing demand for updated geo-spatial information,
rapid information extraction
• Complex image content of VHSR data needs to be
structured and understood
• Huge amount of data can only be utilized by automated
analysis and interpretation
• New target classes and high variety of instances
• Monitoring systems and update cycles
• Transferability, objectivity, transparency, flexibility
Aerial photography
La photographie aérienne est obtenue à l'aide de caméras
spécialisées à bord des avions volant à basse altitude. La
caméra capte l'image numériquement ou sur film
La photographie aérienne est la méthode de choix pour la
les applications cartographiques qui nécessitent une grande
précision et une réalisation rapide des tâches.
Photogrammétrie - la science relative aux mesures des
images photographiques.
Aerial photography (cont.)
Traditional end product: printed photos
Digital image (scanned from photo) in standard graphics format
(TIFF, JPEG) that can be integrated in a GIS or desktop mapping
Trend: fully digital process
digital orthophotos
corrected for camera angle, atmospheric distortions and
terrain elevation
georeferenced in a standard projection (e.g. UTM)
geometric accuracy of a topographic map
large detail of a photograph
Remote sensing process
of Energy
Earth Surface
Collection of point data
Stored as “waypoints”
Accuracy dependent on device and environmental variables
Paper Based
Manual recording of information
Electronic Based
Handheld device
Keyboard entry
keyboard entry of coordinate data
e.g., point lat/long coordinates
from a gazetteer (a listing of
place names and their
from locations recorded on a
Latitude/Longitude coordinate conversion
Latitude is y-coo, Longitude is x-coo
Common format is
degrees, minutes, seconds
113º 15’ 23” W 21º 56’ 07” N
To represent lat/long in a GIS, we need to convert to
decimal degrees
-113.25639 21.93528
DD = D + (M + S / 60) / 60
Conversion of hardcopy maps to digital data
Transformer les elements visibles sur carte-papier en information
numérique sous forme de point, ligne, polygone, et d’attributs
Dans de nombreux projets SIG, l'étape qui necessite de loin le
plus de temps et de ressources (jusqu'à 80% du coût du projet)
De récents méthodes reduisent l’effort consenti pour cette étape
Le transfert des données fait souvent appel à l'échange de
données dans la plupart des formats de fichiers propriétaires
utilisant la fonction d’importation / exportation des SIG
les logiciel de conversion de données libres deviennent largement
Source de donnees pour l’etablissement
de cartes de districts de recensement
• Types of cartes necessaires
•Cartes nationales d’ensembles (divisions du territoire, routes, cours
d’eau, lacs, relief, etc./ Cartes topographiques/ Cartes de villes (rues,
qaurtiers, parcs)/ Cartes admin./ Cartes thematiques (distrib. de pop.)
• Inventaire des sources existantes: (carte-papier, donnees num.)
•Meta-donnees: ref. geo, echelle, legende, date, source, etc.
• Importation des donnees numeriques existantes
• Collecte de donnees geographiques supplementaires
•Techniques de terrain traditionnels/Photo. Aeriennes/Images-Satellite
Numérisation frontale II
La numérisation frontale est maintenant commune: lorsque
l‘operateur utilise une carte scannée, une photographie
aérienne ou une image satellite comme arriere-plan et suit la
trace des elements geographiques a l’aide d'une souris.
Cette méthode donne des résultats plus précis
Rapide, plus facile de retracer, et gagner des étapes
Geographical Data Accuracy
Logical accuracy
• Refers to the integrity of relationships among geographic
e.g. a river stored in a hydrological database that defines the
boundary between admin. Units should coincide with the
boundary between those units
Positional accuracy
• Coordinates of features in the GIS database are correct relative
to their true position on the earth’s surface.
• Note: For a census database, it may be more important that a certain
street defines the boundary of an EA, than to know that the exact
coordinates represent the real-world
Usage direct des images scannees
• e.g., scanned air-photos
digital topographic maps in raster format
• Scanner output is a raster data set usually needs to be
converted into a vector representation
Often requires considerable editing
Vectorisation: raster en vecteur
Conversion des informations scannees contenues dans
l’image matricielle (raster) en coordonnees (vecteur)
Automatic mode: the system converts all lines on the
raster image into sequences of coordinates automatically.
automated raster to vector process starts with a line
thinning algorithm
Semi-automatic mode, the operator clicks on each line
that needs to be converted; system then traces that line to
the nearest intersections and converts it into a vector
Fixation des Erreurs
Some of the common digitizing errors shown in the figure
can be avoided by using the digitizing software’s snap
tolerances that are defined by the user
For example, the user might specify that all endpoints of a
line that are closer than 1 mm from another line will
automatically be connected (snapped) to that line
Small sliver polygons that are created when a line is
digitized twice can also be automatically removed
Converting Between Different Digital Formats
All software systems provide links to other formats
But the number and functionality of import routines varies
between packages
Problems often occur because software developers are
reluctant to publish the exact file formats that their systems
Option of using a third data format
• Example: Autocad’s DXF format
Collecte et conversion des donnees
/Processus d’integration
Collecte des donnees
• Inventaire des sources existantes: cartes papier /
donnees numeriques
• Imagerie: satellite, photo aerienne, etc.
• Collecte de terrain (hand-held devices-GPS, etc.)
Data Input/Conversion
• Keyboard entry of coordinates
• Digitizing/Scanning/Raster-to-Vector
• Editing/Building Topology
Data Integration
• Georeferencing
Agencies to contact
National geographic institute / mapping agency
Military mapping services
Province, district and municipal governments
Various government or private organizations dealing with
spatial data
Geological or hydrological survey
Environmental protection authority
Transport authority
Utility and communication sector companies
Land titling & surveying agencies
Academic institutions
Donor activities
