Transcript [slides]

Modélisation et reformulation
d’expressions temporelles extraites de
textes en langage naturel
Cyril Faucher1, Jean-Yves Lafaye1, Frédéric Bertrand1, Charles Teissèdre2,3
1 L3i,
2 MoDyCo
Université de La Rochelle, France
[email protected]
- Université de Paris Ouest Nanterre La Défense – CNRS
3 Mondeca,
AFADL 2010 - du 9 au 11 juin 2010 – Poitiers Futuroscope
10es Journées Francophones Internationales
sur les Approches Formelles dans l’Assistance
au Développement de Logiciels)
France
Ce travail est financé par l’Agence Nationale de la Recherche
(ANR-Contint, projet RelaxMultiMedias 2)
1
Introduction
 Chaîne d’acquisition de connaissances temporelles
 A partir de textes (dépêches)
Texte libre
Evénements
+ propriétés
temporelles
Sous forme de modèles
Texte contrôlé
 Produire une reformulation des informations saisies, dans un
langage formel non ambigu, proche du langage naturel initial
 => validation sémantique par l’utilisateur
2
Plan
 1. Contexte et objectifs
 2. Workflow générique
 3. Modéliser des propriétés temporelles d’événements
 4. Acquisition et Modélisation de Connaissances
Temporelles : chaîne TKAM
 5. Conclusion et perspectives
3
1. Contexte
 Notion d’événements
 Nature des événements: culturels, touristiques
 Propriétés spatiales et temporelles
 Récurrence et périodicité
 Interopérabilité avec les standards du domaine (presse)
 IPTC (NewsML, EventsML)
 iCalendar
2
4
1. Contexte : utilisation de l’IDM
 Utilisation de (Méta-) Modèles pivots pour assurer
 l’interopérabilité d’applications métier (passerelles entre espaces
techniques)
 l’intégration de données hétérogènes
 la vérification de l’intégrité d’instances / d’information
 Exemple : transformation / reformulation / intégration
Texte
Libre
DSL
(Domain Specific
Language)
SGBDR
MODELE
PIVOT
Ontologie
Langages formels,
langages de preuve
Texte
contrôlé
Langages
de règles
Applications
5
1. Objectifs
 Représenter de manière intégrée des événements et leurs
métadonnées
 Assurer la persistance dans une base de données / connaissances
 Aligner un modèle métier sur des ontologies existantes (donne
accès à des raisonneurs, définit une sémantique de manière
formelle et structurée)
 Formuler des requêtes sur le Modèle Pivot, exécuter dans un autre
espace (ex. base de connaissances)
 Visualiser des ensembles de données conformes au Modèle Pivot
dans des environnements ad hoc (SimileExhibit, Google Agenda, etc)
6
2. Workflow générique
Métier : linguistique
Modèle pivot
Dépêches
Texte
Libre
Extraction de
connaissance
Représentation
dans un DSL
Modèle linguistique :
expressions
temporelles pour les
périodes d’accès
Texte contrôlé
Reformulation en
langage naturel
contrôlé à l’aide d’une
grammaire formelle
Représentation dans
le modèle pivot
Vérification de
propriétés structurelle
(invariant) et
sémantique
CU1 : Persistance
Associer des propriétés
temporelles aux Events
Obtention de propriétés
temporelles valides
CU2 : Résolution de
requêtes
Rechercher des
expressions temporelles
dans les bases
7
3. Modéliser des propriétés temporelles
d’événements : Comment ?
 Deux types de représentations des occurrences d’événements
 Concrète : un ensemble (extension) contenant des dates identifiables
dans un calendrier (une granularité est fixée, le calendrier est défini sur
une base annuelle)
 Extension :
{ …, « de 2010-05-20T14:00:00 à 2010-05-20T16:00:00 »,
« de 2010-05-27T14:00:00 à 2010-05-27T16:00:00 », … }
 Abstraite : une formule décrit en intension l’ensemble précédent
 Particulièrement adapté aux événements périodiques ou pseudo
périodiques (exceptions), et aussi aux événements définis
relativement les uns par rapport aux autres
 Intension [Carnap] :
« tous les jeudis de mai de chaque année de 14h à 16h »
« tous les jours 3 heures avant la basse mer »
8
3. Modéliser des propriétés temporelles
d’événements : avec quel modèle ?
 Modèle métier : DSL Modèle d’accessiblité [Battistelli, Teissèdre]
 Modèle d’événement : métadonnées sur les événements (IPTC)
 spatiales
 temporelles
…
 Modèles temporels existants
 ISO 19108 standard : Time geometry: Instant, Period, Allen’s relations
 iCalendar format : Periodic interval, Exception (+ periodic exception)
 TimeML [Pustejovsky], OWL-Time [Pan]
 Modèle temporel proposé
 synthèse de l’ISO et d’iCalendar sous une forme objet
 position relative (3 heures avant la basse mer)
 une grammaire formelle
9
3. Modéliser des propriétés temporelles
d’événements : Periodic Temporal Occurrence
 Extension de l’ISO 19108
 Basé sur le concept de PeriodicRule
Norme ISO 19108
10
3. Modéliser des propriétés temporelles
d’événements : Position relative
Définition d’un intervalle entre
2 expressions temporelles
avec les relations d’Allen
Expression relative: 3 heures avant la Basse Mer
Allen’s relations
1
11
3. Un langage textuel contrôlé pour exprimer
des propriétés temporelles
 L’utilisateur saisie des expressions temporelles avec un éditeur contextuel
 Techniques IDM : EMF, xText
Peuplement
Vue textuelle
12
3. Un langage textuel contrôlé pour exprimer
des propriétés temporelles
Temporal Model
Grammar (xText)
PeriodicRule :
('(identified by 'name=ID')')?
(frequency=Frequency)?
('using a time span as ' validity+=PeriodicTimeSpan)*
('time extent ' ruleExtent=TM_Period )?
;
FreqWithDurationRef :
(
(times=INT 'times') |
// times is fixed to 1
('during one' referenceDuration=Duration 'period') |
(times=INT 'times during one‘
referenceDuration=Duration 'period')
)
('and starts on' startTime=TM_Instant)?
;
13
4. Acquisition et de Modélisation de
Connaissances Temporelles : chaîne TKAM
 Période d’accès d’un lieu exprimé en intension
 Le musée est ouvert tous les jours de 10h à 19h sauf le lundi
 Le restaurant est fermé les 1ère et 2ème semaines d’avril
 Le marché est exceptionnellement ouvert les 3ers dimanche de décembre
14
4. Acquisition et de Modélisation de
Connaissances Temporelles : chaîne TKAM
Métamodèle générique
pour les Events
Approche IDM
Event
Texte libre
ISO19108
extension
iCalendar
DSL des
périodes
d’accès
Métamodèle pivot
pour les propriétés
temporelles
conforme à
Données
métier
conforme à
Instances du
modèle pivot
Vérification de
contraintes structurelle
(invariant) et sémantique
(modèle de calendrier)
Grammaire
formelle (xText)
conforme à
Textes
contrôlés
Solveur de
requêtes
15
4. Acquisition et de Modélisation de
Connaissances Temporelles : chaîne TKAM
- du texte en langage naturel au texte contrôlé Expression saisie : « Ouvert du lundi au vendredi, de 9h à 18h.
Nocturne le jeudi jusqu'à 22h. Fermé le 18 mai. »
La chaîne de traitement a
iCalendar
été expérimentée sur un
corpus de 513 expressions
Export par RelaxNews
fournies
I
Kermeta
D
M
Instances du
modèle linguistique
I
D
M
Instances du
modèle temporel
I
Kermeta
D
M
Texte contrôlé
16
4b. Autre application : couplage d’un
SMA avec le modèle temporel
SMA : DAHU
Requête
temporelle
TimeManager
Réponse :
Agents
pêcheurs
pêche autorisée,
interdite ou
restreinte
Modèle Temporel
Texte réglementaire :
“Digging is prohibited each year,
from 9 pm to 6 am between July
1st and August 31st. Out of these
periods, digging is allowed from
3 hours before low tide up to 3
hours after the same low tide
(according to the tide almanac
in Douarnenez).”
Faucher C., Tissot C., Lafaye J.Y., Bertrand F., "Benefits of a periodic temporal model
for the simulation of human activities", GeoVA(t) (Geospatial Visual Analytics : Focus
on Time) Workshop at AGILE 2010, 10-11 May 2010, Guimaraes (Portugal)
17
5. Conclusions
 Chaîne d’acquisition et de modélisation de connaissances
temporelles
 D’un texte en langage naturel vers un texte contrôlé
 Un modèle générique d’expressions temporelles pour modéliser des
phénomènes périodiques





Extension de la norme ISO 19108
Expressions temporelles en intension (à l’inverse d’extension)
Grammaire formelle
Vérification structurelle et sémantique
2 cas d’utilisations pour expérimenter les approches dont 1 industriel
18
5. Perspectives
 Moteur de requêtes
 en formulant une requête sous forme d’expressions temporelles
 exprimer et calculer l’intersection de deux expressions sans calculer
leurs extensions
 Traduire une règle périodique en requête (SQL/SPARQL…) sur la base
de données ou de connaissance
 Filtrer les nuplets/graphes candidats de la base pour optimiser
l’exécution de la requête
19
Merci de votre attention
Modélisation et reformulation d’expressions
temporelles extraites de textes en langage naturel
Cyril Faucher1, Jean-Yves Lafaye1, Frédéric Bertrand1, Charles Teissèdre2,3
1 L3i,
2 MoDyCo
University of La Rochelle, France
[email protected]
- Université de Paris Ouest Nanterre La Défense - CNRS
3 Mondeca,
France
20