Télécharger - Université Mouloud Mammeri de Tizi Ouzou
Download
Report
Transcript Télécharger - Université Mouloud Mammeri de Tizi Ouzou
Université Mouloud Mammeri de Tizi-Ouzou
R2I 12-14 Juin 2011
Modèle de Recherche d’Information
Personnalisée Basé sur les Réseaux
Bayésiens
Mme Farida Achemoukh - Adouane
Mr Rachid Ahmed-Ouamer
Laboratoire LARI Université Mouloud
Mammeri de Tizi-Ouzou
Plan de la présentation
Introduction
Problématique
Accès Personnalisé à l’ Information
Contribution
Conclusion & perspectives
R2I 12-14 juin 2011
2
Introduction
La vocation d’un système de recherche d’information est
de fournir à l’utilisateur des informations utiles
Virus
biologique
Virus
informatique
Q=‘virus’
Collection
documents
Requête
C’est l’expression
d’un besoin en
information
SRI
Doc 1
Doc
DocNN
12/06/2011
R2I 12-14 juin 2011
3
Introduction
Le système tiens compte de la requête utilisateur et des
informations qui le décrivent
Virus
informatique
Q=‘virus’
Profil utilisateur
Domaine d’intérêt :
informatique
Collection
documents
SRI
Profil utilisateur
Doc 1
Doc M
Personnalisation de l’information
12/06/2011
12/06/2011jz
R2I 12-14 juin 2011
informations décrivant ses
centres d’intérêts et ses
préférences
4
Problématique
Comment modélisation l'utilisateur ?
Comment inclure l’utilisateur dans le processus
d'accès à l'information ?
12/06/2011
R2I 12-14 juin 2011
5
Accès Personnalisé à l’ Information
Modèlisation de l’utilisateur
Representation du Profil
Vectorielle (Gowan 2003)
Hiérarchique (Micarelli et al.2004)
Multidimensionnlle (Kostadinov 2003)
Construction du Profil
Explicite (Kraft et al.2005)
Implicite (Gauch et al.2003)
12/06/2011
R2I 12-14 juin 2011
6
Accès Personnalisé à l’ Information
Exploitation du Profil Utilisateur dans le processus de
recherche
Reformulation de la requête
(Sieg et al. 2004), (Koutrika et al.2005)
augmentation de la requête par des termes issus du profil utilisateur
Appariement Requête- Documents
(Haveliwala et al.2002), (Zemirli et al. 2008)
compte tenu de la requête et du profil utilisateur dans le calcul de
pertinence de documents
Présentation des résultats de recherche
(Gowan 2003),(Liu et al.2004)
Le score final est la combinaison de score de similarité entre le
document et le profil avec le score d’appariement initial du document
12/06/2011
R2I 12-14 juin 2011
7
Contribution
Idée directrice
Les Réseaux Bayésiens constituent un outil puissant pour la
représentation des connaissances
Les utiliser pour la présentation des différentes informations
participantes à la définition du modèle de recherche
Définition d’un module d’appariement intégrant le profil
utilisateur
12/06/2011
R2I 12-14 juin 2011
8
Contribution
Démarche adoptée
1. Définition de la librairie des centres d’intérêts
chaque centre d’intérêt ck est défini comme un vecteur de termes ti
pondérés selon la formule BM25 (Kassab R et al. 2005)
N :le nombre total de documents de la
collection ;
n : le nombre de documents
de la collection contenant le terme ti ;
R : le nombre de documents pertinents face
à une requête utilisateur ;
r : le nombre de documents pertinents
contenant le terme ti.
12/06/2011
R2I 12-14 juin 2011
9
Contribution
2. Présentation du modèle
Le modèle consiste en un graphe G= (V, E) acyclique orienté
requête
Documents
Termes
Centres
d’intérêts
Nœuds V englobent la requête, les documents de la collection et
la librairie de centres d’intérêts
Arcs E orientés des termes constituant l’espace d’indexation, vers
les documents, les requêtes et les centres d’intérêts.
12/06/2011
R2I 12-14 juin 2011
10
Contribution
3. Calcul de la Pertinence
(1)
U : l’ensemble des configurations u possibles de termes.
P(u) : la probabilité à priori associée à une configuration de termes
L’espace de termes est réduit à la configuration couverte par la
requête q
P(q/u)=
1 si q=u
0 sinon
Le modèle « réseau bayésien » généralise « le modèle vectoriel »
l’équation (1) peut être écrite
12/06/2011
R2I 12-14 juin 2011
11
Contribution
4. Exemple illustratif
Soit une collection= {d1, d2, d3, d4, d5}
d1= {10t1, 2t2, 4t3, 5t5}, d2= {4t1, 9t2, 7t6}, d3= {5t2, 7t3, 12t4, 9t6}
d4= {2t1, 11t4, 3t5, 7t6} , d5= {10t2, 15t3, 5t4, 8t5, 14t6}
Libraire des centres d’intérêts
Requêtes Q= {q1, q2, q3, q4, q5 }
q1= {t1} ,q2= {t2} , q3= {t3} , q4= {t4}, q5= {t5}
Table 1. Librairie de centres d’intérêts
12/06/2011
R2I 12-14 juin 2011
12
Contribution
Architecture
du modèle
ordre de pertinence
Avec intégration du
profil
+ D2
D5
D4
D3
- D1
Centres
d’intérêts
Termes
d’indexation
t1
C1
d1
t2
C2
d2
t3
c3
d3
t4
c4
d4
t5
c5
d5
+ D5
D2
D3
D4
- D1
t6
Q
12/06/2011
Collection
documents
R2I 12-14 juin 2011
Requête
utilisateur
13
Conclusion
Le modèle proposé mesure la pertinence comme un
degrés de convergence des trois concepts document,
requête utilisateur et centre d’intérêt
La prise en compte du profil utilisateur modélisé par
son centre d’intérêt dans le module d’appariement permet
un bon ordonnancement des résultats.
12/06/2011
R2I 12-14 juin 2011
14
Perspectives
Validation du modèle proposé sur une collection
personnalisée
Prise en compte de l’évolution du profil
utilisateur dans le modèle proposé
12/06/2011
R2I 12-14 juin 2011
15
Merci de votre attention!
12/06/2011
R2I 12-14 juin 2011
16