Transcript www.zef.de

GLOWA Volta Project
Data Management and Application of GIS and Remote Sensing
in Natural Resources Management Training Workshop
Wednesday, December 12 – Friday, December 14, 2007
DGRE, Ouagadougou, Burkina Faso
Gestion des données dans le
projet GLOWA-Volta
Antonio Rogmann
(Center for Development Research
University of Bonn)
Antonio Rogmann (ZEFc), Universität Bonn
1
Gestion de Données
Table des matières
1. Gestion de données
 Problèmes, solutions et défis
2. Gestion de données
 flux de travaux (Workflow)
3. Conception de l‘infrastructure de la gestion de données
 Éléments et interfaces
4. Systèmes d’Information Géographique
 Qu‘est-ce qu’un SIG?
 Besoin et applications du SIG
 Bases
Antonio Rogmann (ZEFc), Universität Bonn
2
Gestion de Données: problèmes
Sondage avec les institutions partenaires et parties prenantes du
GLOWA Volta lors du
„PARTNERS’ CAPACITY NEEDS ASSESSMENT WORKSHOP”
(31.05.-01.06.2007, Accra, Ghana)
Pour la compréhension
 Cohérence entre les institutions en terme d’échange / flux des données relatives
au management de l’eau
 Environnement des données : software/modèles utilisés, stockage des données
et facilités d’accès, hardware
 Ensemble défini de problème dans la gestion (l’accès) des données
Comme condition pour
 L’ajustement de système de gestion des données du GLOWA Volta au besoin
des partenaires
 Offrir aux partenaires des solutions pour améliorer la qualité de la gestion de
données
Antonio Rogmann (ZEFc), Universität Bonn
3
Gestion de Données: problèmes
Institutions participants au sondage:
Coalition of NGO's in Water and Sanitation (CONIWAS)
 Kwame Nkrumah University of Science and Technology, Kumasi (KNUST)
 Soil Research Institute, Council for Scientific and Industrial Research (SRI)
 Water Research Institute, Council for Scientific and Industrial Research (WRI)
 Hydrological Service Department (HSD)
 Water Resources Commission (WRC) (2 participants)
 Hydrological Service Department (HSD)
 Ghana Irrigation Development Authority (GIDA)
 Water Research Institute, Council for Scientific and Industrial Research (WRI)
 Ghana Water Company Ltd, Head Office (GWCL)
 Dept. of Agriculture Economy & Agriculture Business. College of Agric. and Consumer service
 Environmental Protection Agency (EPA)
 Centre for Environmental Impacts Analysis (CEIA)
 Volta Basin Development Foundation (VBDF)
 Training, Research Network for Development (TREND)
 UDS: Faculty of Integrated Development Studies
 Savannah Agricultural Research Institute (SARI)
 Volta River Authority (VRA)
Antonio Rogmann (ZEFc), Universität Bonn
4
Gestion de Données: problèmes
Résultats
 Manque d‘information sur les données = données à propos des données = méta
données
Votes
Problémes pour obtenir des informations
à propos des données concernat
basé sur le questionnaire
participants = 19. Choix multiple
10
9
8
7
6
5
4
3
2
1
0
Pourvoyeur des
Données
Antonio Rogmann (ZEFc), Universität Bonn
Qualité des Donées
Contenu / Format
des Données
Droits de untilization Softw are utilisé
pour le compilation
/ prix
des données
5
Gestion de Données: problèmes
Résultats
 Documentation des données principalement interne sur catalogues digital (ex:
Tables Excel), sur papier ou sans aucune documentation
 Meta base de données basées sur le web comme exception
Documentation des donées obtenues sur
basé sure les organisations
representées dans le
questionnaire participants.
N = 19. Choix multiple
7
6
Votes
5
4
3
2
1
0
Méta bases de
données
Antonio Rogmann (ZEFc), Universität Bonn
Catalogue digital
Catalogue sur papier
Sans documentation
6
Gestion de Données: problèmes
Résultats
 Transfert de données copieux et long
 L’envoi de données par e-mail pose des problèmes de volume et de temps de
transfert
Votes
Transfert des données aux partenaires par
basé sure les organisations
représentées dans le
questionnaire participants.
N = 19. Choix multiple
11
10
9
8
7
6
5
4
3
2
1
0
Email
Antonio Rogmann (ZEFc), Universität Bonn
CD /DVD par
poste
Téléchargement
sur le w eb
Collecté
personellement
Autres moyens
7
Gestion de Données: problèmes
Questions courantes lors de la
recherche de données:
Institution
 Quelles données existantes serviront
ma recherche/mes décisions/mes
besoins en information ?
 Où trouver ces données ?
 Dans quels formats ? Sont-ils
compatibles avec mes applications/
modèles ?
 Quelles sont les caractéristiques des
données (ex : unités de temps et
autres unités)
données
?
Usager des
données
Département de
Service
données
Organisation
 A qui appartiennent ces données ?
Faut-il les payer ?
données
Antonio Rogmann (ZEFc), Universität Bonn
8
Solution: Gestion de Données
Nous aimerions vous offrir une solution en fournissant :
 Une base de données centrale


donnant accès aux stocks de données
du GVP
la possibilité d’étendre le stock de
données avec vos propres données
??
Web
données
 Une méta-base de données centrale


des réponses sur les besoins en
données
des références sur les pourvoyeurs
de données
Géo-portail
 Un géo portail informant


sur les projets en relation avec la
gestion hydraulique dans le bassin
du Volta
et leurs données en visualisation
spatiale
Antonio Rogmann (ZEFc), Universität Bonn
Meta Données
!!
Serveur de
plans
Banque de
données
Serveur de
Données
Banque de
métadonnées
données
Département de
Service
données
données
9
Données in the GVP
Données du projet: que peux fournir le GVP?

Données hydrologiques : décharge d’eau, nappes phréatiques (série
chronologique)

Données climatologiques : précipitations, températures, humidité de l’air,
évapotranspiration, flux de chaleur (série chronologique et prédictions)

Données sur l’utilisation d’eau : agriculture (irrigation) / nationale / industrielle
(énergie hydraulique) / réservoirs

Données sur l’utilisation des sols / la couverture des sols : agriculture,
urbanisation, sols, géologie, végétation

Données topographiques / infrastructurelles / administratives : réseaux des
rivières, lacs, élévation des routes, agglomérations, électricité, frontières

Données socio-économiques : démographie, recensement, activités
économiques (marchés), sondages

En différents formats : vecteur / trame (télédétection), tables, documents,
formats spécifiques au modèle
Antonio Rogmann (ZEFc), Universität Bonn
10
Données du projet: utilisées comme
 Inputs pour modèles. Dans le GVP:

MM5-ETH:

WaSIM:

GAMS:

LUDAS:

Mike Basin:
Antonio Rogmann (ZEFc), Universität Bonn
11
Solution: Gestion de Données
 La gestion de données est la toile de fond sur laquelle les facilités d’accès
viennent se superposer
 La gestion des données dans une organisation est basées sur un ensemble
de méthodes pour

La description des données (métadonnées)

Assurance de la qualité des données

Distribution et accès des données

Sécurité
Antonio Rogmann (ZEFc), Universität Bonn
12
Solution: Gestion de Données
La gestion pratique de données dans une organisation est basée sur :
 Des normes
Des normes standards, par exemple pour les métadonnées, l’identification des
ressources, les formats, …
 Des normes internes en fonction du consensus interne a l’organisation, par
exemple pour les modèles de base de données, noms de fichiers, règles de
données…

 Déroulement des opérations / Étapes du procédé / responsabilités
 Technologie : hardware, software, interfaces…  infrastructure des
données
Antonio Rogmann (ZEFc), Universität Bonn
13
Gestion de Données : Metadonnées
Règles concernant l’information à propos des données
 Métadonnées

Plusieurs standards développés par des organisations, tels que l’ ISO 15119
pour données géo du Federal Geographic Data Committee

Enregistrés auprès de l’International Organization for Standardization (IOS)

Consistent en une variété d’éléments / champs pour décrire les ressources
(données, software, services)

Métadonnées standards consistant partiellement de plusieurs centaines
d’éléments
Antonio Rogmann (ZEFc), Universität Bonn
14
Gestion de Données : Metadonnées
 Métadonnées dans le cadre du GVP : Dublin Core Metadata Standard

noyau de 15 éléments, étendus par certains éléments spéciaux pour données
géo

tus les éléments, exceptes les titres et identificateurs, sont optionnels

une description des éléments compréhensible

chaque type de ressource (données, software, modèle,…) peut être décrit
 Éléments « rechargeables » des métadonnées comme

Sujet : le sujet sera décrit par des mots-clefs, phrases-clefs, ou code de
classification

Publieur : une entité (personne, institution) responsable pour pourvoir les
données

Format : le format des fichiers, les mediums physiques ou dimensions des
ressources
go to manual
Antonio Rogmann (ZEFc), Universität Bonn
15
Gestion de Données : Metadonnées
Créer des métadonnées
 Les métadonnées doivent être stockées dans la banque de métadonnées

Conservées dans un lieu central

Offrant un accès web et des interfaces de recherche pour les données et la
description des ressources
 Les métadonnées peuvent être créées de deux manières :

En-ligne : entrée directe des métadonnées dans l banque centrale de
métadonnées un utilisant un browser Internet, java script, php

Hors-ligne : en utilisant un browser Internet et un script java, stockant chaque
ensemble de métadonnées localement et proche de la description de l’objet dans
le fichier XML

Si les fichiers de métadonnées XML ont été créés hors-ligne :
► Un collecteur de métadonnées peut automatiquement rassembler et insérer les fichiers
locaux dans la banque de métadonnées sur un serveur
► Les fichiers XML peuvent être téléchargés sur la banque de métadonnées
Antonio Rogmann (ZEFc), Universität Bonn
16
Gestion de Données : Metadonnées
Champ d‘entrée des éléments de métadonnées
 Champ d‘entrée*
pour

Créer les
métadonnées sous
forme de XML fichier

Entrée des
métadonnées dans
la banque du
métadonnées (web /
réseau local)
* Développé comme prototype
par Dr. Marcel Endejan,
Deputive Executive Officer,
GWSP in Dissertation
Antonio Rogmann (ZEFc), Universität Bonn
éléments
obligatoires des
métadonnées
ouvre un
masque
URN
champ d‘entrée
des éléments de
métadonnées
17
Gestion de Données : Metadonnées
Champ d‘entrée des éléments de métadonnées
éléments de
métadonnée
bouton
d‘insertion
Antonio Rogmann (ZEFc), Universität Bonn
18
Gestion de Données : Métadonnées
Description interne des fichiers pour les données structurées (ex :
mesures)

En-tête de fichiers de données
informant sur le contenu, les unités
utilisées, l’instrumentation, la qualités
de valeurs, la localisation, …

Indépendamment des métadonnées,
toute information importante est
proposée à l’utilisateur / receveur

Multiples fichiers/ensemble de
données similaires peuvent être
décrits dans
► La première fiche (ex : dans un
fichier excel)
► Le premier fichier d’un ensemble
de fichiers (référencés par d’autres)
► Un fichier texte séparés et stockes
proche des fichiers
Antonio Rogmann (ZEFc), Universität Bonn
19
Data Management: Nomenclature
 Détermination de base des catégories de données

Données qualitative : données riche en détails et précisions, souvent sous
forme de texte, format narratif, par exemple : études de cas, revues de
documents, …..

Données quantitatives : donnes numériques. Donnes qui sont mesurées soit
sur le rapport ou sur l’échelle de mesures, ex : température, niveaux des
eaux, …
 Nomenclature des données (recommandé particulièrement pour les
données quantitatives) devrait refléter :
Discipline
(Exemple:)
Sujet
Site
Laps de temps Version
hyd_waterlevel_ghana-kaburi_020101-020630_v1.xls
 Mais : il n’est pas nécessaire de stopper le système de nomenclature
actuel, par contre il est nécessaire …
Antonio Rogmann (ZEFc), Universität Bonn
20
Data Management: Identification
Identification des ressources comme fichiers de données, documents,
plans
 … un identificateur unique pour chaque ressource comme élément d’une
métadonnées centrale. Nous utilisons un « Uniform Resource Name »
(URN).
 Quasi-standard pour l’identification des ressources dans un système
d’information. Exemple : ISBN
 Peut être utilisé comme nom pour une ressource (ex : nom de fichier)
 Doit suivre une syntaxe standard
 URN dans le GVP seront facilement générés en utilisant un générateur de
nom de ressources (en utilisant un browser Internet)
Antonio Rogmann (ZEFc), Universität Bonn
21
Data Management: Identification
Identification: URN
syntaxe standardisée :
NID
‚urn:‘<NID>‘:‘<NSS>
= Namespace Identifier  représente un organisation, projet, réseau,
personne
urn:x-gvp:uid:<NSS>
urn
x
gvp
uid
= uniform resource name
= experimental, not officially registered
= glowa volta project
= user identification
Antonio Rogmann (ZEFc), Universität Bonn
22
Data Management: Identification
standardized syntax:
‚urn:‘<NID>‘:‘<NSS>
NSS = Namespace Specific String  codifìe le „type“, „l‘utilísation“ et le „moyen
de stockage“ de la ressource / des données
urn:<NID>:<resType>-<resSubType>.<sTitel>.v<verNr>.<for>.<med>
<resType>
= type of resource, e.g. dataset, document, software
<resSubType> = subtype o.r., e.g. primary / secondary data, model input
<sTitel>
= short titel, name
<verNr>
= versionsnumber
<for>
= format
<med>
= medium on which resource / data file is stored
Antonio Rogmann (ZEFc), Universität Bonn
23
Data Management: Identification
Exemple:
urn:x-gvp:HD12:ds-pd.waterlevel_gh-kab_020101-020630-V1.0.xls.cd
gvp
HD12
=
=
ds
=
pd
=
waterlevel ... 30 =
V1.0
=
xls
CD
=
=
GLOWA Volta Project
Institution par exemple „Hydro Service“, person en charge e.g.
12 = personne xy
enregistrement
données primaire
titre en bref p.ex. abréviation pour „hyd_waterlevel_ghanakaburi_020101-020630”
version du enregistrement, ex. données brutes en premier
version (incontrôlé)
MS Excel
dans CD
Antonio Rogmann (ZEFc), Universität Bonn
24
Data Management: Identification
Créer un URN
 Utilisation du « Resource Name Generator »

Crée un URN en utilisant une application JavaScript à partir d’un exploreur Internet

Existe actuellement comme prototype
* Développé comme prototype
par Dr. Marcel Endejan,
Deputive Executive Officer,
GWSP in Dissertation
Antonio Rogmann (ZEFc), Universität Bonn
25
Data Management: Identification
 Resource Name Generator (= générateur de nom de ressource)

Intègre les codes spéciaux pour les types de ressources a l’intérieur d’un réseau qui
partage les données

Les types de ressources doivent être identifiés

et intégrés dans le script
Sous-Type de
ressource
Type de
ressource
Antonio Rogmann (ZEFc), Universität Bonn
26
Data Management: Identification
 Resource Name Generator

Version, format et moyen de stockage peuvent être sélectionnés

Copier et coller URN dans les noms de l’ensemble de données (si requis) et
l’entrer dans la métadonnées

Les URN seront ajustés individuellement avec la banque de données
centrale, dans laquelle les données seront enregistrées et décrites
Numéro de
version
Medium de mémoire
informatique
Antonio Rogmann (ZEFc), Universität Bonn
Format
URN
éviter de duplicata
27
Data Management: Formats
Formats
 Les données peuvent être stockées en format « propriétaire » ou « non-
propriétaire »

Le format propriétaire codifies les données d’une manière spécifique, le
fichier ne peut être ouvert que par le programme dans lequel il a été créé

Les formats « non propriétaire peuvent être utilises par une vaste gamme
d’applications (surtout en utilisant les fonctions d’import)
 Les données doivent être stockées pour de longues périodes de temps
et il n’est pas sur quels programmes seront disponibles dans 10 ans
 Autant que possible, l’inter-operablitité entre les différents programmes
et applications doit être garantie
Antonio Rogmann (ZEFc), Universität Bonn
28
Data Management: Formats
 Standards internationaux certifiés comme l’ISO « Open Document
Format for Office Applications » (ODF) “HTML”, “XML” or OGC’s “GML”
(Geographic Markup Language - Open Geospatial Consortium)
 Certains formats sont des de facto-standards (comme MS Excel) parce
que les programmes propriétaire qui les génèrent sont appliqués par de
nombreux utilisateurs
 Les software de traitement utilises couramment par les membres d‘un
réseau d‘échange de données ont des exigences en matière de format
d‘input
Antonio Rogmann (ZEFc), Universität Bonn
29
Data Management: Formats
 Conclusion :
 essayer d’ utiliser des formats d’échange non-propriétaire autant que possible,
et considérer les exigences de format du software utilisés
 Exemples:

Microsoft Word (.doc)  Rich Text Format (.rtf), Open Document Text (.odt)

MS Excel (.xls)  Comma Separate Value (.csv), Extensible Markup Language
(.xml)

ESRI shape  Geographic Markup Language (GML)
 Recommandations:

Utiliser un software bureau ouvert comme OpenOffice.org

Dans ses fonctionnalités, similaire à Microsoft Office (incl. Excel, Access, etc.)

Le format est ISO-Standard depuis 2006 (ODF - ISO/IEC 26300)!

Pas de coûts!
Antonio Rogmann (ZEFc), Universität Bonn
30
Data Management: Securité
Sécurité
 Garantie contre les accès et applications des données et ressources
non-autorisés
 Utiliser les facilités des sécurités informatiques telles que :

Authentification Control List (ACL)

Canaux d’accès sécurisés comme la technologie Secure Shell (SSH)
Antonio Rogmann (ZEFc), Universität Bonn
31
Data Management: Contrôle de l‘accès
Contrôle de l‘accès aux données
 Les données peuvent avoir généré des couts lors de la création, ne sont
pas dans le domaine publique, pas encore publiées, ….
 Le contrôle de l‘accès aux données est base sur un arrangement des la
communauté (scientifique) de producteurs, utilisateurs et fournisseurs
de données, en terme de règles d’accès aux données
 Signifie:

Qui (groupe utilisateur) est autorise a utiliser (obtenir) quelles données et
sous quelles conditions (droits d’auteur, paiement)

Comment organiser le processus d’identification schématiquement 
groupes d’utilisateurs avec droits d’accès graduels

Comment mettre en place le processus d’identification sur le plan technique
Antonio Rogmann (ZEFc), Universität Bonn
32
Gestion des données: Qualité
Qualité des données signifie
 Données sont complètes, valides, consistantes, suivent un ordre
chronologique et précises, ce qui rend les données appropriées pour un
usage spécifique avec un système informatique
 Vue complète fournie par la gestion de données
 Les méthodes basées sur le software sont liées aux disciplines
scientifiques spécifiques

Doivent être transparentes et compréhensibles

Devraient être déclarées/recommandées a l’intérieur d’un réseau administratif
ou scientifique

Le niveau de qualité doit être décrit dans le fichier de données, dans les
métadonnées
Antonio Rogmann (ZEFc), Universität Bonn
33
Data Management: Qualité
Garantie de qualité ds donnes dans le GVP
 Faites par les scientifiques dans leur propre discipline sous leur responsabilité
 Testes par diagrammes, si les
données sont fiables
 Comparaisons avec d’autres sources
de données
 Calibrage de routines des instruments
 Vérification des limites du
programme
 Statistiques de base
Antonio Rogmann (ZEFc), Universität Bonn
34
Gestion des données : challenges
 Récolter les bénéfices de la gestion de données requiert les efforts de tous
les participants
 La gestion de données (GD) a besoin d’accords fermes en matière de :

Standards

Sélection des utilisateurs des données et de leur droit d’accès et d’utilisation

L’environnement technique tel que software (-interfaces), protocoles de réseau,
etc.

Responsabilité personnelle et/ou institutionnelle dans le cadre du…

… déroulement des opérations de la gestion de données : production des
données > contrôle de qualité > nomenclature, identification > description >
transfert auprès de l’hôte des données > livraison depuis l’hôte des données
La GD requiert la volonté d’investir du temps et de se
tenir aux standards !
Antonio Rogmann (ZEFc), Universität Bonn
35
Data Management Workflow
 Prochains diapos font partie d’un manuel et documentation GVP-
data-management-workflow digitaux
 Sera fini et publie début 2008
 Base pour la prochaine session d’entrainement pour gestion web
de données et administration de banque de (géo) données
 Manuel de déroulement des opérations sera offert dans un
design similaire mais dans d’autres formats (PDF, HTML), ainsi
pouvant être fourni et publie sur le web
Sert comme référence de bonne pratique pour GVP,
mais doit être étendu pour inclure d’autres exigences
dans le système du cote des parties prenantes – après
le GVP!!!
Antonio Rogmann (ZEFc), Universität Bonn
36
Data Management Workflow
1
2
3
4
7
6
transfer
1
workflow
steps
5
(linked)
Antonio Rogmann (ZEFc), Universität Bonn
37
Data Management: Etapes Workflow
Sous forme de note
Recommandations …
Étape 1: Récolte données
 Prendre notes dans le journal
 Instrument de mesure : nom, fabricant,
numéro de série
 Date : quand les données ont-elles été
récoltées
 Nom : de la personne qui a récolte les
données sur le terrain
 Qu’est-ce qui a été fait : maintenance,
réglage
 Particularités : quelque chose de spécial
a été observé ?
Procédés
- Sondage
- Télécharger registre
données
- Sonder et cartographier
Lieu
- Terrain
- Site
Processeur
- Scientifique
- Planificateur
- Récolteur de données
Software / Interfaces
- Explorer fichier
- Interface téléchargement
- Pistage-GPS
- Software traitement
données
- Imprimé
Hardware
- Registre données
- Lap Top
- GPS
 GPS measurements and mappings
 Choisir le système de coordonnées
approprié pour l’espace de travail
 Pour le Ghana Coordinate System
WGS1984 projected in UTM (Zones
30/31N), (Burkina Faso 30/31P)
Back to overview
Antonio Rogmann (ZEFc), Universität Bonn
38
Data Management: Etapes Workflow
Sous forme de note
Étape 2: Contrôle qualité
Procédés
- Chercher des trous,
anomalies, fichier
endommages
- Effacer erreurs de
données
- Remplir des trous
- documenter
Lieu
- Terrain
- Site
- Bureau
Recommandations ...
 Plus sur le sujet
 Documentation
Quelles incertitudes restent
 Qu’est-ce qui a été entrepris pour le
contrôle de qualité
 Algorithme et software spécifiques
utilisés
 Prendre note dans le métadonnées
 Prendre note dans la table des en-têtes

Processeur
- Scientifique
- Récolteur de données
Software / Interfaces
- Méthodes statistiques
(algorithme)
- Programme traitement
données (e.g. HYDAT)
Hardware
- Lap Top
- PC
Back to overview
Antonio Rogmann (ZEFc), Universität Bonn
39
Data Management Etapes Workflow
Sous forme de note
Étape 3: Nommer, URN
Procédés
- Créer une syntaxe
appropriée
- Nommer ressources
- Créer les URN
A considérer ….
 Le nom des données reflète :
 Le sujet du contenu
 La couverture spatiale et temporelle
 Le statut de traitement (version)
 Le partage local de données (ex :
réseau bureau)
Lieu
- Bureau
Trouver un accord pour la syntaxe de
nomenclature des fichiers  standard
GVP ?
 Identifier les types de ressources/
données pour définir une syntaxe URN
 standard GVP?

Processeur
- scientifique
- Planificateur
- Administrateur banque
données
Software / Interfaces
- Explorer fichier
- Internet Explorer
- html, Java Script
Hardware
- Lap Top
- PC
Back to overview
 Plus sur le sujet

Assigner un nom de ressource
unifie
Utiliser le « Resource Name
Generator » pour créer un URN
 Enregistrer le URN dans les données
 Enregistrer le URN dans catalogue de
données
 Enregistrer le URN dans métadonnées

Antonio Rogmann (ZEFc), Universität Bonn
40
Data Management Etapes Workflow
Sous forme de note
Étape 4: organisation
données
Procédés
- Créer uns structure
stockage appropriée
(annuaire) sur système
fichier
Recommandations ...
 Structure du répertoire

spécialement important
► Quand les données et ressources sont partagées dans une
communauté-bureau
► Dans un petit Local Area Networks (LAN)
► Dans un peer-to-peer network

Peut être conçue en focalisant sur
► Dans le cadre de traitement de données (modèles etc.)
► Structure du projet (sous-projets  hiérarchie du projet)
► contenu spatial, temporel ou thématique du stock de données
(ex:. par régions, thèmes..)

Devrait être répliqué sur disque
local par tous les participants au
réseau - ajusté aux points focaux
personnels dans le travail

plus facile de trouver les
ressources
Lieu
- Bureau
Processeur
- Scientifique
- Planificateur
- Administrateur réseau
Software / Interfaces
- File explorer / manager
Hardware
- Lap Top
- PC
- LAN (Server)
 Plus sur le sujet
Back to overview
Antonio Rogmann (ZEFc), Universität Bonn
41
Data Management Etapes Workflow
Sous forme de note
Étape 4: organisation
données
Procédés
- Insérer information sur
données dans
dictionnaire de données
Lieu
- Terrain
- Site
- Bureau
Processeur
- Scientifique
- Planificateur
Software / Interfaces
- Excel
- OpenOffice Calc
Hardware
- Lap Top
- PC
Back to overview
Recommandations ...
 Plus sur le sujet
 Catalogue Données
 Petite table fichier avec
enregistrement de
données, scriptes, etc.
personnels sur disque
local
 donne vue d’ensemble
et gagne du temps
 éléments minimum
devraient être:
► Uniform Ressource
Name (URN)
► Titre / Nom
► Courte Description
► Format
► Lieu de stockage
(chemin)

Antonio Rogmann (ZEFc), Universität Bonn
Exemple du GVP
42
Data Management Etapes Workflow
Sous forme de note
Étape 4: organisation
données
Procédés
- insérer ensemble de
données directement
dans ou proche du
fichier
Lieu
- Terrain
- Site
- Bureau
Processeur
- Scientifique
- Planificateur
Software / Interfaces
- Software de traitement
- Explorer fichier
Hardware
- Lap Top
- PC
Recommendations ...
 Plus sur le sujet
 En-tête de table détaillé pour :
 Unified Resource Name: [‚urn:‘<NID>‘:‘<NSS>]
 Données fournies par : [nom, prénom, adresse email, institution]
 Lieu : [nom du lieu, coordonnées UTM (X,Y)]
 Altitude : [mètres au-dessus du niveau de la mere]
 Style des mesures : [description des méthodes appliquées]
 Preneur de mesure : [nom, (projet, institution)]
 Période de mesure : [jjjjmmdd-jjjjmmdd, incréments de temps
(jours/h/m/s)]
 Valeurs manquantes : [-9999.9]
 Qualité : [description des méthodes de garantie de qualité]
 Notes : [remarques]
 En-tête de table avec description des paramètres utilisés
 Expliquer le sens des abréviations/codes
 Déclarer les unités utilisées pour les paramètres si non-évidentes
 Utiliser les informations du journal de récolte des données
Back to overview
En rouge = éléments métadonnées (si les fichiers de métadonnées
Antonio Rogmann (ZEFc), Universität Bonn
sont juste crées, ces points ne sont pas nécessaires!)
43
Data Management Etapes Workflow
En-tête de fichier données: example
 Plus sur le sujet
Back to overview
Antonio Rogmann (ZEFc), Universität Bonn
44
Data Management Etapes Workflow
Sous forme de note
Étape 5: description,
créer les
métadonnées
Procédés
- Description des données/
ressources selon le
standard pour
métadonnées
Lieu
- Bureau
Processeur
- Scientifique
- Producteur des données
- Planificateur
A faire …
 Plus sur le sujet
 Métadonnées
Au minimum si les données vont être publiées, elles devraient
être décrites en entrant les métadonnées
 Utiliser l’interface browser internet (comme décrit ici) pour entrer
les métadonnées
 Remplir autant d’éléments que possible
 L’utilisation appropriée de mots-clefs dans l’élément “sujet et
mots-clefs” est très importante
 La plupart des questions aux métadonnées concernent “sujet et
mots-clefs” ainsi que “couverture spatiale”

Software / Interfaces
- Internet browser
- html, java script
Équipement
- Lap top
- PC
- bureau
Back to overview
Antonio Rogmann (ZEFc), Universität Bonn
45
Data Management Etapes Workflow
Sous forme de note
Étape 5: créer les
métadonnées
Procédés
- Description des données/
ressources selon le
standard pour
métadonnées
Lieu
- Bureau
Processeur
- Producteur des données
- Scientifique
- Planificateur
à considérer ….
 Métadonnées
 Ne pas oublier de donner l’information sur l’accès aux données /
ressources
► Emplacement actuel : où les données peuvent être obtenues
► Modalités d’accès : (coûts, droits d’utilisations, moyens
techniques, etc.)
► Si les données ne sont pas transmises à un hôte central :
nom du contact local
 Fichiers de stockage pour métadonnées

Software / Interfaces
- Internet browser
- html, java script
Équipement
- PC
 Plus sur le sujet
Si la saisie directe dans la banque de métadonnées n’est pas
possible (pas de connexion Internet) : les fichiers de métadonnées
XML doivent être envoyés à l’administration de la banque de
métadonnées centrale, par exemple sur CD par poste
 Données et métadonnées

Les métadonnées doivent seulement être crées si l’utilisation
ultérieure des ressources par d’autres est prévue
Back to overview
Antonio Rogmann (ZEFc), Universität Bonn
46
Data Management Etapes Workflow
Sous forme de note
Étape 6: (préparation
du) transfert
Procédés
- Prise de décision pour
 la publication des
données
 les contraintes
d’accès (l’utilisateur)
 le transfert á la
banque de données
centrale
Lieu
- Institution collective
- Bureaux locaux
à faire ….
 Plus sur le sujet
 Prendre une décision

Si les ensembles de données ou ressource (software, modèles)
doivent être partagés

Qui – personnes, institutions, partenaires- devraient avoir accès
aux données

Si l’accès aux données doit être payant

Ou les données accessibles doivent être stockées : localement ou
sur un serveur central ?

Qui est la personne responsable pour contrôler la transmission a
une banque de données centrale. Cette personne responsable
doit contrôler si
Processeur
- Utilisateur des données
- Administrateur de la
banque de données
Software / Interfaces
Hardware
Back to overview
Antonio Rogmann (ZEFc), Universität Bonn
► Les ressources / ensembles de données satisfont le standard
de gestion de données de la communauté
► Particulièrement si les données contiennent des
métadonnées avec une définition claire des droits d’utilisation
( donner a l’administrateur de la banque de données une
liste des utilisateurs potentiels)
47
Data Management Etapes Workflow
Sous forme de note
Étape 7: transfert
Procédés
- Formatage
- Téléchargement sur la
banque de données
centrale
Lieu
- Bureau local
- Hôte de la banque de
données centrale
Processeur
- Producteur de données
- Administrateur de la
banque de données
centrale
à faire ….
 Plus sur le sujet
 Préparer le transfert

Reformater les données si nécessaire

Informer l’administrateur de la banque de données centrale
► Quels ensembles de données seront télécharger sur la banque
centrale et pourquoi
► Que les métadonnées sont entrées directement dans la banque
de métadonnées par une interface web
► Que les fichiers de métadonnées sont transmis ensemble avec
les ensembles de données
 Faire le transfert
 Télécharger les données dans un catalogue de transfert sur le serveur
Software / Interfaces
principal
- Software de traitement
 Utiliser un software de téléchargement basé sur le ftp (file transfer
de données
- html, java script
protocole) or SFTP (Secure Shell – File Transfer Protocol) si les
- SSH (e.g. winscp)
facilites sont fournies
Hardware
 Le GVP utilise SFTP pour les transferts des données sur le serveur de
- PC
données
- Serveur
Back to overview
 Si le téléchargement n’est pas possible en raison d’une connexion
48
Antonio Rogmann (ZEFc), Universität Bonn Internet trop lente, envoyer les données par poste sur CD/DVD
GLOWA
Volta HP
MetadataInterface
GVP – Infrastructure des données
xml/xsl
request to download
Internetzone
Intranetzone
Webserver (VM)
Datenserver (+RAID)
File System
Apache
JavaScript
Mapbender
inkl. PostgreSQL
(Samba)
PHP
(CGI)
File
MapServer
CGI
Catalog-Manager
PHP,
DOM
MySQL/
Postgres:
ADODB
:1521
Meta-DB
Portal-DB
ESRIGeodatabase
Meta.dc.xml
describes
inkl. phpMyAdmin
JDBC
:1521
SMB
lokal/offline
SMB
SMB,
JDBC
Tomcat
Portal
ArcGIS Client
Antonio Rogmann (ZEFc), Universität Bonn
SMB
JSP/
Java
Java-based Client
(COBIDS)
ESRI ArcGIS
Clients
49
GVP – Infrastructure des données
Ne soyez pas choqués, c’est du langage
technique, regardons maintenant du point
de vue de l’utilisateur
Antonio Rogmann (ZEFc), Universität Bonn
50
GVP – Infrastructure des données
Récolter les fruits:
D
a
t
a
u
s
e
r
 Une banque de données centralisée


Donne accès au stock de données du
GVP

Avec la possibilité d’étendre le stock de
données avec vos propres données
Web
Une banque de métadonnées centralisée
qui fournit


Des réponses a propos des données
requises
Des références sur les fournisseurs de
données
Géo-portail
Meta Données
données
 Un géo-portail qui informe


Sur les projets en relation avec la
gestion des eaux dans le bassin du
Volta
Et leurs données : dans une
visualisation spatiale
Antonio Rogmann (ZEFc), Universität Bonn
Département de
Service
Serveur de
plans
Banque de
données
Serveur de
Données
Banque de
métadonnées
Département de
Service
données
données
51
GVP – Infrastructure des données
Vue sur l’arrière-plan:
Interfaces
d‘utilisateur
 Interfaces d’utilisateur
 Géo-portail
 Exploreur
Internet avec
interfaces pour banques de
données
Web
 Banques de données
 Portail-banque
de données
 Banque
de métadonnées
 System
de fichier
 Banque
de « géo-portail »
Géo-portail
Meta Données
données
Serveur de
plans
Serveur d.
databases
Données
 Technologies web
 Pas
le sujet d’aujourd’hui!
Banques de
données
Antonio Rogmann (ZEFc), Universität Bonn
Département de
Service
Banque de
données
Banque de
méta-données
Département de
Service
données
données
52
Infrastructure des données: vue des utilisateurs web
1. Comment obtenir les données
Via le géo-portail
1. Le géo-portail cherche dans la banque
de métadonnées
2. Le software Catalogue Manager sur le
serveur fournit une liste des résultats
3. Les géo-données trouvées peuvent
être demandées comme…
4. … cartes interactives, fournies au
browser Internet comme
WebMapService généré par UMNMapServer
1
2
Data Server
Meta
data
3
4
GVP
data
5
ACL-List
5. Ou pour téléchargement des fichiers
de données originaux (et autres
données) si permis
Antonio Rogmann (ZEFc), Universität Bonn
53
Infrastructure des données: vue des utilisateurs web
2. Comment obtenir les données
Via le catalogue de ressources / données
1
1. L’interface du browser Internet (sur la
homepage) cherche dans la banque de
métadonnées
2
2. Le software Catalogue Manager sur le
serveur fournit une liste des résultats
3
3. Les géo-données trouvées peuvent être
demandées comme…
4. … cartes interactives, fournies au
browser Internet comme
WebMapService généré par UMNMapServer
4
Data Server
Meta
data
GVP
data
5
ACL-List
5. Ou pour téléchargement des fichiers de
données originaux (et autres données)
si permis
Antonio Rogmann (ZEFc), Universität Bonn
54
Infrastructure des données: Géo-portail
Éléments du géoportail
Vue
d‘ensemble
Outils cartes:
zoom, pan, selection
 WebMapService
est OGC-standard
 Mapbender
est un
software gratuit
pour client pour
serveur-carte
Mapserver
est gratuit et
couramment utilisé
comme software
de serveur-carte
Couche
 UMN

Le Geoportal Interface
Software est en ce
moment développé par
L. Laubach (Institute for
Computer Sciences III
Uni Bonn)
Antonio Rogmann (ZEFc), Universität Bonn
Caractéristique
des info
(sélectionné) :
table d’attributs
avec propriétés
et lieus vers le
documents /
graphiques /
adresses web
55
Infrastructure des données: Interfaces
web
intranet
File Explorer
SSH Client
File System
(Samba)
(only authorized
direct access)
Internet Browser
Data Server
(Linux)
GeodataBase
(ESRI)
GIS-Client
Antonio Rogmann (ZEFc), Universität Bonn
56
GVP – Infrastructure des données
intranet
User System
view on data server file system
Data
user
Data
user
User Group 1
Data
user
User Group 2
Data
user
Antonio Rogmann (ZEFc), Universität Bonn
57
GVP – Infrastructure des données:
banque des géo-données
 „Geodatabase“ = Base de géo-données,
format par ESRI
 Base de données « relationnelle »
 Toutes données ( entités=objets=couche)
organisées en table
 Les tables peuvent être liées entre elles
► En utilisant des clefs
► Basées sur des cardinalités (relations
1 :1, 1 :n, m :n)
 Formats GIS courants
 (shape, couverture Arcinfo, …) sont
organisés en plusieurs fichiers simples
représentant une classe d’objet
► Par géométrie
► Par attribut
► Pour liaison géométrie <->attributs
► Etc.
Antonio Rogmann (ZEFc), Universität Bonn
58
GVP – Infrastructure des données:
banque des géo-données
 Une base de données « relationnelle » est gérée par un système de gestion de
base de données (Par exemple MS Access, DB2, Oralce, MySQL)
 Une base de géo-données ESRI est gérée par l’application ArcGIS « ArcCatalog »
Antonio Rogmann (ZEFc), Universität Bonn
59
GVP – Infrastructure des données:
banque des géo-données
Une base de géo-données fournit les facilités complètes pour

Le stockage d’une collection de géo-données de types différents sur
une place centrale
 L’imposition de relations et règles sophistiquées sur les données
 La modélisation de comportement spatiaux complexes (topologie,
réseaux géométriques,…)
 Maintenance de l’intégrité des données
 Échelonnage facile du stockage des données
 Définition d’objets courants
Antonio Rogmann (ZEFc), Universität Bonn
60
GVP – Infrastructure des données:
banque des géo-données
Base de géo-données (« relationnelle ») dans le GVP
 Seulement prototypes


Format pas encore utilisé dans le GVP

Etablissement d’une base de géo-données dans le GVP est encore en
discussion
Avantages d’une base de géo-données

Géo-données bien organisées

Haut niveau d’information (modélisation)

Facilités de banque de données pour garantir l’intégrité (-qualité) des données
 Désavantages d’une base de géo-données

Licences pour l’amélioration du Software ArcView Client (coûts)

Gros effort pour la création de la base de données
Antonio Rogmann (ZEFc), Universität Bonn
61
GVP – Infrastructure des données:
banque des géo-données
Alternatives pour le stockage des géo-données dans le GVP
 Les géo-données sont enregistrées dans un format GIS commun
(shape, …) dans un système de fichier, ainsi que maintenant
 « Open Source » (gratuites) Bases de Géo-données
(PostgreSQL/PostGIS)


Pas de coûts de licence pour installation, mais pour support

Pas facile à administrer

Mauvaises connections entre ESRI et Postgres
Mais l’utilisation de bases de géo-données ouvertes et libre-accès devrait
être considéré dans les futures développements du
Projet GLOWA Volta et de ses partenaires
Antonio Rogmann (ZEFc), Universität Bonn
62
Merci pour votre prévenance!!
Antonio Rogmann (ZEFc), Universität Bonn
63