Transcript [slides]
Modélisation et reformulation d’expressions temporelles extraites de textes en langage naturel Cyril Faucher1, Jean-Yves Lafaye1, Frédéric Bertrand1, Charles Teissèdre2,3 1 L3i, 2 MoDyCo Université de La Rochelle, France [email protected] - Université de Paris Ouest Nanterre La Défense – CNRS 3 Mondeca, AFADL 2010 - du 9 au 11 juin 2010 – Poitiers Futuroscope 10es Journées Francophones Internationales sur les Approches Formelles dans l’Assistance au Développement de Logiciels) France Ce travail est financé par l’Agence Nationale de la Recherche (ANR-Contint, projet RelaxMultiMedias 2) 1 Introduction Chaîne d’acquisition de connaissances temporelles A partir de textes (dépêches) Texte libre Evénements + propriétés temporelles Sous forme de modèles Texte contrôlé Produire une reformulation des informations saisies, dans un langage formel non ambigu, proche du langage naturel initial => validation sémantique par l’utilisateur 2 Plan 1. Contexte et objectifs 2. Workflow générique 3. Modéliser des propriétés temporelles d’événements 4. Acquisition et Modélisation de Connaissances Temporelles : chaîne TKAM 5. Conclusion et perspectives 3 1. Contexte Notion d’événements Nature des événements: culturels, touristiques Propriétés spatiales et temporelles Récurrence et périodicité Interopérabilité avec les standards du domaine (presse) IPTC (NewsML, EventsML) iCalendar 2 4 1. Contexte : utilisation de l’IDM Utilisation de (Méta-) Modèles pivots pour assurer l’interopérabilité d’applications métier (passerelles entre espaces techniques) l’intégration de données hétérogènes la vérification de l’intégrité d’instances / d’information Exemple : transformation / reformulation / intégration Texte Libre DSL (Domain Specific Language) SGBDR MODELE PIVOT Ontologie Langages formels, langages de preuve Texte contrôlé Langages de règles Applications 5 1. Objectifs Représenter de manière intégrée des événements et leurs métadonnées Assurer la persistance dans une base de données / connaissances Aligner un modèle métier sur des ontologies existantes (donne accès à des raisonneurs, définit une sémantique de manière formelle et structurée) Formuler des requêtes sur le Modèle Pivot, exécuter dans un autre espace (ex. base de connaissances) Visualiser des ensembles de données conformes au Modèle Pivot dans des environnements ad hoc (SimileExhibit, Google Agenda, etc) 6 2. Workflow générique Métier : linguistique Modèle pivot Dépêches Texte Libre Extraction de connaissance Représentation dans un DSL Modèle linguistique : expressions temporelles pour les périodes d’accès Texte contrôlé Reformulation en langage naturel contrôlé à l’aide d’une grammaire formelle Représentation dans le modèle pivot Vérification de propriétés structurelle (invariant) et sémantique CU1 : Persistance Associer des propriétés temporelles aux Events Obtention de propriétés temporelles valides CU2 : Résolution de requêtes Rechercher des expressions temporelles dans les bases 7 3. Modéliser des propriétés temporelles d’événements : Comment ? Deux types de représentations des occurrences d’événements Concrète : un ensemble (extension) contenant des dates identifiables dans un calendrier (une granularité est fixée, le calendrier est défini sur une base annuelle) Extension : { …, « de 2010-05-20T14:00:00 à 2010-05-20T16:00:00 », « de 2010-05-27T14:00:00 à 2010-05-27T16:00:00 », … } Abstraite : une formule décrit en intension l’ensemble précédent Particulièrement adapté aux événements périodiques ou pseudo périodiques (exceptions), et aussi aux événements définis relativement les uns par rapport aux autres Intension [Carnap] : « tous les jeudis de mai de chaque année de 14h à 16h » « tous les jours 3 heures avant la basse mer » 8 3. Modéliser des propriétés temporelles d’événements : avec quel modèle ? Modèle métier : DSL Modèle d’accessiblité [Battistelli, Teissèdre] Modèle d’événement : métadonnées sur les événements (IPTC) spatiales temporelles … Modèles temporels existants ISO 19108 standard : Time geometry: Instant, Period, Allen’s relations iCalendar format : Periodic interval, Exception (+ periodic exception) TimeML [Pustejovsky], OWL-Time [Pan] Modèle temporel proposé synthèse de l’ISO et d’iCalendar sous une forme objet position relative (3 heures avant la basse mer) une grammaire formelle 9 3. Modéliser des propriétés temporelles d’événements : Periodic Temporal Occurrence Extension de l’ISO 19108 Basé sur le concept de PeriodicRule Norme ISO 19108 10 3. Modéliser des propriétés temporelles d’événements : Position relative Définition d’un intervalle entre 2 expressions temporelles avec les relations d’Allen Expression relative: 3 heures avant la Basse Mer Allen’s relations 1 11 3. Un langage textuel contrôlé pour exprimer des propriétés temporelles L’utilisateur saisie des expressions temporelles avec un éditeur contextuel Techniques IDM : EMF, xText Peuplement Vue textuelle 12 3. Un langage textuel contrôlé pour exprimer des propriétés temporelles Temporal Model Grammar (xText) PeriodicRule : ('(identified by 'name=ID')')? (frequency=Frequency)? ('using a time span as ' validity+=PeriodicTimeSpan)* ('time extent ' ruleExtent=TM_Period )? ; FreqWithDurationRef : ( (times=INT 'times') | // times is fixed to 1 ('during one' referenceDuration=Duration 'period') | (times=INT 'times during one‘ referenceDuration=Duration 'period') ) ('and starts on' startTime=TM_Instant)? ; 13 4. Acquisition et de Modélisation de Connaissances Temporelles : chaîne TKAM Période d’accès d’un lieu exprimé en intension Le musée est ouvert tous les jours de 10h à 19h sauf le lundi Le restaurant est fermé les 1ère et 2ème semaines d’avril Le marché est exceptionnellement ouvert les 3ers dimanche de décembre 14 4. Acquisition et de Modélisation de Connaissances Temporelles : chaîne TKAM Métamodèle générique pour les Events Approche IDM Event Texte libre ISO19108 extension iCalendar DSL des périodes d’accès Métamodèle pivot pour les propriétés temporelles conforme à Données métier conforme à Instances du modèle pivot Vérification de contraintes structurelle (invariant) et sémantique (modèle de calendrier) Grammaire formelle (xText) conforme à Textes contrôlés Solveur de requêtes 15 4. Acquisition et de Modélisation de Connaissances Temporelles : chaîne TKAM - du texte en langage naturel au texte contrôlé Expression saisie : « Ouvert du lundi au vendredi, de 9h à 18h. Nocturne le jeudi jusqu'à 22h. Fermé le 18 mai. » La chaîne de traitement a iCalendar été expérimentée sur un corpus de 513 expressions Export par RelaxNews fournies I Kermeta D M Instances du modèle linguistique I D M Instances du modèle temporel I Kermeta D M Texte contrôlé 16 4b. Autre application : couplage d’un SMA avec le modèle temporel SMA : DAHU Requête temporelle TimeManager Réponse : Agents pêcheurs pêche autorisée, interdite ou restreinte Modèle Temporel Texte réglementaire : “Digging is prohibited each year, from 9 pm to 6 am between July 1st and August 31st. Out of these periods, digging is allowed from 3 hours before low tide up to 3 hours after the same low tide (according to the tide almanac in Douarnenez).” Faucher C., Tissot C., Lafaye J.Y., Bertrand F., "Benefits of a periodic temporal model for the simulation of human activities", GeoVA(t) (Geospatial Visual Analytics : Focus on Time) Workshop at AGILE 2010, 10-11 May 2010, Guimaraes (Portugal) 17 5. Conclusions Chaîne d’acquisition et de modélisation de connaissances temporelles D’un texte en langage naturel vers un texte contrôlé Un modèle générique d’expressions temporelles pour modéliser des phénomènes périodiques Extension de la norme ISO 19108 Expressions temporelles en intension (à l’inverse d’extension) Grammaire formelle Vérification structurelle et sémantique 2 cas d’utilisations pour expérimenter les approches dont 1 industriel 18 5. Perspectives Moteur de requêtes en formulant une requête sous forme d’expressions temporelles exprimer et calculer l’intersection de deux expressions sans calculer leurs extensions Traduire une règle périodique en requête (SQL/SPARQL…) sur la base de données ou de connaissance Filtrer les nuplets/graphes candidats de la base pour optimiser l’exécution de la requête 19 Merci de votre attention Modélisation et reformulation d’expressions temporelles extraites de textes en langage naturel Cyril Faucher1, Jean-Yves Lafaye1, Frédéric Bertrand1, Charles Teissèdre2,3 1 L3i, 2 MoDyCo University of La Rochelle, France [email protected] - Université de Paris Ouest Nanterre La Défense - CNRS 3 Mondeca, France 20