Transcript Présentation PPT - Le Forum français de l`OGC
Sémantisation des données pour le monde environnemental
Danielle Ziébelin Philippe Genoud LIG STEAMER Université de Grenoble [email protected]
1
Données environnementales
• • • Que sont les données environnementales : – Collections : spécimens, échantillons, prélèvements … – – Études Écologiques Séquences génomiques – Analyses d’images, LIDAR – Monitoring de la biodiversité Quels sont les traitements : – identifier, comparer, évaluer les populations ou des quantités, localiser et dater des données et/ou des analyses Les données de la biodiversité sont – Globalement distribuées et volumineuses – Hautement hétérogènes au niveau de leur structure et leur contenu – Augmentent rapidement 2
• • •
Le web sémantique peut aider à l’intégration et au partage de données
Métadonnées – Directive Inspire – Directive SEIS (Shared Environmental Information System ) – Iso 19115, 19119,19110 … Vocabulaires contrôlés – LTRE (Linked Thesaurus fRamework for Environement), – EARTh (Environmental Applications) – – – Thésaurus Ecoplanète (ministère Ecologie), Thesaurus AnaEE-France, EnVoc (en relation avec Convention sur la biodiversité), – … Ontologies – OBOE (Extensible Observation Ontology) – – – SERONTO (Socio-Ecological Research and Observation oNTOlogy) SWEET (Semantic Web for Earth and Environmental Terminology) SSN ontology (Semantic Sensor Network Ontology) – – Envo (Environment Ontology), … 3
Charactéristiques communes des architectures du web sémantiques (1)
Quelle est l’évolution de cet écosystème (eau, sol) par rapport au réchauffement climatique ?
Quelles sont les ressources en eaux que je peux allouer à un projet d’extraction pétrolière et gazière ?
Accéder à des ressources : données ou des connaissances
Web
Services WEB configurés pour ajouter de l’information Applications WEB applications
pour des utilisateurs avec un GUI adapté
Collecter de nouvelles données 4
Plan
• • • • • • • Introduction et objectifs Architecture Données et modèles de données Ontologies Lier les données Requêtes sémantiques Conclusions 5
Exemple d’Architecture MAP-EON
MapEON Client Query Processor (SPARQL) Ontology manager
MapEON server
OWL DL ontologies OWL reasoner Ontology Loader RDF Graph Triplestore Data Loader
Adaptator 1 … Adaptator n … LOD Cloud 6
Exemple d’architecture ObsBD
“Lightweight Ontology-Based Tools for Managing Observational Data” Shawn Bowers,
Riley Englin, Carlos Fonseca, Paul Jewell, Lauren Joplin, Patrick Mosca, Tyler Pacheco, Jacob Troxel, Tyler Weeks, Proceedings of the First International Workshop on Semantics for Biodiversity Montpellier, France, May 27, 2013
7
Technologies de Web Sémantique
• Données et Ontologies – Ontologies
(RDFS/OWL )
– Annotations
(RDF)
– Déduction
(Pellet, Hermit, BraidComposer …)
– Requêtes
(SPARQL)
• Services – WFS - WPS – Web services sémantiques 8
Plan
• • • • • • • Introduction et objectifs Architecture Données et modèles de données Ontologies Lier les données Requêtes sémantiques Conclusions 9
•
Données de MAP-EON
tabular data (excel file) Region Measure Descriptor Measure Site Measures Set location site type 10
Modèle de données de l’application
Quelques classes et relations qui décrivent les concepts utilisés dans l’application 11
Graphe RDF
Les données sont transformées en un graphe RDF qui utilise le vocabulaire défini dans le modèle d’application.
RDF Resource Description Framework (W3C standard) subject
individual (resource identified by an URI)
predicate object property data property rdf:type RDFS and OWL add semantic to RDF object
individual literal value
Owl class defining the rdf:type of the individual rdf:type rdf:type rdf:type rdf:type 12
Exemple d’ontologie de Domaine
• Le graphe peut être enrichi en exploitant une ontologie de domaine
Hydrologic Ontology for Discovery ( http://his.cuahsi.org/ontologyfiles.html
)
The purpose of this ontology is to support the discovery of time-series data collected at a fixed point, including physical, chemical, and biological measurements.
13
Modèle de l’application + Ontologie de domaine
• Le graphe peut être enrichi par des éléments de l’ontologie de domaine domain ontology rdf:type rdf:type rdf:type rdf:type 14
SONet:
Scientific Observations Network Dr. Mark Schildhauer Director of Computing NCEAS, UCSB USA
Domain-Specific Ontology
is-a Tree part-of is-a Tree Leaf has-part Weight Bio.Entity
hasCharact eristic is-a is-a is-a Biomass is-a Leaf Litter Wet Weight Dry Weight usesStandard Mass Unit is-a Gram
OBOE Semantic Annotation
Observation hasMeasurement Measurement
Structural Metadata
Data Site
GCE6 GCE6 GCE7 …
Species
Picea Rubens Picea Rubens Picea Rubens …
Ind
1 2 1 …
Mass
75.13
179.81
443.20
…
Ontologie d’observations : OBOE
Multiples modèles pour les observations : Exemples O&M, PATO/EQ, ODM, OBOE “core concepts” décrit : Entities, properties measured, units, protocols, etc.
Observations et mesures : ISO 19156 O&M : dépences directes
• Feature ISO 19109 • Geometry ISO 19107 • Temporal ISO 19108 • Coverage (fields) ISO 19123 • Metadata ISO 19115-12 • Meta-model ISO 19150-2 • Basic datatypes ISO 19103 O&Min OWL | Simon Cox
Cox, OGC Abstract Specification – Topic 20: Observations and Measurements 2.0
ISO 19156:2011 Geographic Information – Observations and measurements
* hasContext * Observation hasMeasurement 1..1
* Measurement * * 1..1
hasValue Value 1..1
usesProtocol Protocol 1..1
* * * ofCharacteristic 1..1
usesStandard Standard ofEntity 1..1
Extensible OBservation Ontology (OBOE) Entity Characteristic 16
Plan
• • • • • • • Introduction et objectifs Architecture Données et modèles de données Ontologies Lier les données Requêtes sémantiques Conclusions 17
Types d’ontologies : différents objectifs
Catherine Roussey (ISTREA) • • • Ontologies terminologiques : – Interopérabilité lexicale Ontologies de données : – Interopérabilité sur les données Ontologie Logique – Interopérabilité d’objets 18
Types d’ontologies : différents objectifs
Catherine Roussey (IRSTEA) • Ontologies terminologiques : Interopérabilité lexicale * * Property * Logical Definition
hasLabel
*
hasName
Textual Definition Relation 1 * Concept/ Class 1 *
hasArgument
*
isInstanceOf hasArgument
Object/Instance * * Semantic Relation Object Relation * 1
hasArgument
Term Linguistic Relation
hasName
19
Types d’ontologies : différents objectifs
Catherine Roussey (IRSTEA) • Ontologies de données : Interopérabilité sur les données * Property * Logical Definition Textual Definition Relation
hasLabel hasName
* 1 * 1 Concept / Class *
hasArgument isInstanceOf
*
hasArgument
Object/Instance * * Semantic Relation Object Relation * 1
hasArgument
Term Linguistic Relation
hasName
20
Types d’ontologies : différents objectifs
Catherine Roussey (IRSTEA) • Ontologie Logique : Interopérabilité d’objets / de concepts * Property *
hasLabel
Logical Definition 1 * 1 Concept / Class Textual Definition * *
hasArgument
* Relation Semantic Relation
hasName isInstanceOf
Object/Instance
hasArgument
* * Object Relation * 1
hasArgument
Term Linguistic Relation
hasName
21
Plan
• • • • • • • Introduction et objectifs Architecture Données et modèles de données Ontologies Lier les données Requêtes sémantiques Conclusions 22
Lier les données au LOD cloud
• • Lien avec l’ontologie de domaine Lien avec des jeux de données ouvertes domain ontology corresponding geonames resource application ontology corresponding DBpedia resource legend Individual Owl class defining the rdf:type of the individual :region Object Property Data Property 23
Lien avec le LOD cloud
• Liens avec les descriptions RDF de geonames resource URI http://sws.geonames.org/5892587/ RDF description geonames resource describing Northwest Territories 24
Lier des données de différentes sources
• • Lier des entités et les caractéristiques de 2 ontologies : Utilise des axiomes d’inclusion et d’équivalence de OWL – Équivalence : • propriété owl:equivalentClass • propriété owl:equivalentProperty • propriété owl:sameAs • … Généralisation/Spécialisation : • • rdfs:subClassOf rdfs:subPropertyOf 25
Querying Data trough Ontology Local Ontology Query Observation Data Base Mapping Local Schema Global Ontology Local Schema MultiMedia Source Observation Data Base
26
Caractéristiques communes des architectures du web sémantique
• • • Intéroperabilité et intégration de différentes ressources Données structurées ou non structurées – – Documents Data-bases Données spatio-temporelles hétérogènes – Multi-sites avec multi-acteurs – Multi-modèles – Multi-formats 27
Plan
• • • • • • • Introduction et objectifs Architecture Données et modèles de données Ontologies Lier les données Requêtes sémantiques Conclusions 28
Requêtes sémantiques
• • Accéder à des informations inférées depuis l’ontologie de domaine Accéder à des informations supplémentaires au travers de données liées (linked data) 29
Requêtes sémantiques
• Interroger les données avec des données inférées (SPARQL) 30
Plan
• • • • • • • Introduction et objectifs Architecture Données et modèles de données Ontologies Lier les données Requêtes sémantiques Conclusions 31
Retour d’expérience sur les pratiques
• • Au niveau local : sources de données : – Amélioration de la qualité des données – Publication des sources de donnée avec les métadonnées – Recherche de documentation et de liaison des données – Architecture complexe avec des modules nouveaux : cartographie et du spatio-temporel Au niveau communautaire – Standards ISO, OGC – Propriété intellectuelle, information privée et partagée, accès publique, VGI, licences.
– Infrastructures et portails.
32
Retour d’expérience : les outils
• Recherche et création de liens – outils existants • e.g. SILK A Link Discovery Framework for the Web of Data, http://wifo5 03.informatik.uni-mannheim.de/bizer/silk/ ) – exploitation de l’information spatiale et temporelle • Publication des données – outils génériques pour transformer des jeux de données en RDF • dataLift http://datalift.org/ , • open refine (former google refine) http://openrefine.org/ ) 33
Travaux connexes
– GEO BON Biodiversity Observation Network within GEOSS Global Earth Observation System of Systems, Portal (global) • Worldwide voluntary effort • GEOSS Earth Observation infrastructure – GEO portal : web portal, search registries – – GEOSS components and services registry (catalogue) GEOSS clearinghouse (connects the differents components) – GEOSS standards and interoperability (catalologue of standards) – – http://www.geoportal.org/web/guest/ http://wiki.ieee-earth.org/Documents/GEOSS_Tutorials/ • GEOSS Water Services 34
Travaux connexes
• • • • • Shared Environmental Information System (Europe) http://ec.europa.eu/environment/seis/ Semantic Web for Earth and Environmental Terminology (SWEET), http://sweet.jpl.nasa.gov/sweet/ Extensible Observation Ontology (OBOE) https://code.ecoinformatics.org/code/semtools/trun k/dev/oboe/oboe.1.1rc1/oboe-core.owl
SemantEco/SemantAqua : Rensselaer Polytechnic Institute (D. McGuinness) http://tw.rpi.edu/web/project/SemantEco ObsDB : Gonzaga University Washington 35