Swip : une interface Langue Naturelle à SPARQL

Download Report

Transcript Swip : une interface Langue Naturelle à SPARQL

Swip : une interface Langue Naturelle à SPARQL programmée en SPARQL IC 2014 15/05/2014 Camille Pradel -­‐ Ollivier Haemmerlé – Nathalie Hernandez Équipe Melodi ProblémaBque C’est qui, déjà, l’acteur qui joue le rôle de George ValenBn dans le film The ArBst ? PREFIX : <http://www.irit.fr/ontologies/cinema#>
SELECT ?acteur
WHERE
{
?acteur :incarne :GeorgeValentin;
:estActeurDans :TheArtist.
}
2 Travaux connexes •  Démarche globale: •  appariement des mots-­‐clés de la requête aux enBtés de la base de connaissances •  construcCon de graphes requêtes établissant des liens entre les enCtés appariées •  classement des requêtes construites •  affichage des requêtes et choix de l'uBlisateur. —  Limites: 1. 
2. 
3. 
… 3 —  Complexité de la construcBon de la requête —  Beaucoup de requêtes générées non perBnentes Nos objecBfs C’est qui, déjà, l’acteur qui joue le rôle de Qui interprète George George VValenBn alenBn ddans ans le le fifilm lm TThe he AAr'st rBst ?? PREFIX : <http://www.irit.fr/ontologies/cinema#>
1)
Isoj fosdjifpmq oi ?
SELECT ?acteur
2)
WHERE D ofjsmldj fùzs ?
{
3)
dsD
kfsfslj efief mls ?
?acteur :incarne :GeorgeValentin;
:estActeurDans :TheArtist.
4)
}
4 … 1)  Générer des requêtes qui ont du sens pour l’uBlisateur 2)  Favoriser l’interacBon en langue naturelle Notre proposiBon : les patrons 5 requête intermédiaire = requête pivot •  Faciliter la mise en œuvre du mulBlinguisme LN pivot SPARQL …
•  Prendre en compte les informaBons issues de l’analyse syntaxique de la requête LN Dans quel film réalisé par Sofia Coppola joue Bill Murray? 6 La requête pivot Le langage pivot –  Extension d’un langage de mots-­‐clés –  Permet d’exprimer des relaBons Exemples : –  Liste des films réalisés par Sofia Coppola
→?film: réalisatrice= Sofia Coppola. –  Liste des films dans lesquels joue Bill Murray
→?film: acteur= Bill Murray.
–  « Dans quel film réalisé par Sofia Coppola joue Bill Murray? »
→?film: réalisatrice= Sofia Coppola.
?film: acteur= Bill Murray. 7 Aperçu du processus InterprétaCon et formalisaCon de la requête uClisateur Requête exprimée en langage naturel InterprétaCon de la requête en langage naturel Patrons Requête pivot FormalisaCon de la requête pivot IC12 IC13 Ontologie + triplets RDF IC11 Liste de requêtes formelles classées phrases explicaBves 8 ImplémentaBon Requête exprimée en langage naturel TraducCon de la requête en langage naturel vers la requête pivot LKB gazepeer → idenBficaBon des enBtés nommées TreeTagger → analyse en dépendances MaltParser Java → applicaBon des règles Requête pivot TraducCon de la requête en langage Java Liste de requêtes formelles classées SPARQL pivot vers des requêtes graphes 9 ImplémentaBon tout en SPARQL Ontologie Pa@erns Patrons en RDF Mises à jour SPARQL (fédérées) 10 Ontologie Queries Traitement de la requête en RDF SPARQL Etapes implémentées en SPARQL Qui interprète George ValenBn dans le film The ArBst ? ?personne: interprète= George ValenBn. ?personne: The ArBst. :Réalisateur :aPourRéalisateur c2 r1 c
1 :Movie c3 :Acteur eur rAct
u
o
:aP
r2 :appar
aîtDan
r3 s :interprète réal
(0,n
) :Rôle c4 PREFIX : <http://
www.irit.fr/
ontologies/cinema#>
SELECT ?acteur
WHERE
{
?
acteur :incarne :Geo
rgeValentin;
:estActeurDa
ns :TheArtist.
}
Patrons de requêtes en RDF Requête pivot: ?personne: interprète= George ValenBn. ?personne: The ArBst. Ontologie Pa@erns … Étape 1 : inserCon de la requête pivot Étape 2: appariement des éléments de requête Étape 3: associaCon des éléments de patron Ontologie Queries papern1 triple1 elem1 subpapern1 query map1 "George ValenBn" subpapern2 triple2 triple3 elem2 elem3 match3 map2 k3 match2 sq1 "personne" k2 :Personne "interprète" map3 :incarne k1 "personne" sq2 12 match1 k4 "The ArBst" :Rôle :RôleDActeur :LongMétrage "The ArBst" match4 InterprétaCon de la requête :TheArBst :Acteur :JeanDujardin "interprète
" "George ValenBn" :GeorgeValenBn Base(s) de connaissances à interroger ImplémentaBon Système déployé et uBlisable : hpp://swip.univ-­‐tlse2.fr/ 13 CriBque •  UBlisaBon d’un système de cache (requête, mots-­‐clés) •  Asynchronisme •  Approche homogène et cohérente (données, standards) •  Déploiement distribué et client léger exploitant les récentes foncBonnalités de fédéraBon de SPARQL •  ImplémentaBon dépendant des performances des moteurs SPARQL •  « Jeunesse » de la recommandaBon SPARQL 14 PerspecBves •  SPARQL pour programmer –  TraducBon LN vers pivot (NIF et l’iniBaBve NLP2RDF) •  Nouvelles expérimentaBons –  MulBlinguisme avec QALD –  UBlisaBon dans un cadre réel avec l’IRSTEA •  AutomaBser la concepBon de patrons de requêtes –  ApprenBssage –  Alignement d’ontologies 15