Systemes de Recommandation

Download Report

Transcript Systemes de Recommandation

Les systèmes de
recommandation
NEGRE Elsa
Université Paris-Dauphine
[email protected]
Plan


Qu’est ce qu’un système de recommandation ?
Les méthodes les plus utilisées







Filtrage collaboratif
Basée sur le contenu
Hybride
Quelques variations
Un petit mot sur l’évaluation
La recommandation en BD et OLAP
Conclusion et perspectives
2/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Un système de
recommandation – Quèsaco?

Un système de recommandation (RS) aide les utilisateurs qui n'ont
pas suffisamment d'expérience ou la compétence nécessaire pour
évaluer le nombre, potentiellement important, d’alternatives offertes
par un site (web).

Dans leur forme la plus simple les RS
 recommandent à leurs utilisateurs des listes personnalisées et
classées d'articles
 fournissent aux consommateurs des renseignements pour les
aider à décider quels articles acheter

Les articles peuvent être :
 musique, livres, films, …

De manière générale, on parle d’items
3/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Un système de recommandation
– Quèsaco? (2)


Problématique : estimation de scores pour
des articles non encore évalués
Définition [Hill+:CHI’95] :
 Soit




C : ensemble de tous les utilisateurs
S : ensemble de tous les articles possibles
u : fonction d’utilité d’un article s à l’utilisateur c
Alors, choisir l’article s’ non encore évalué de S qui maximise
l’utilité de chaque utilisateur c de C
4/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Plan


Qu’est ce qu’un système de recommandation ?
Les méthodes les plus utilisées







Filtrage collaboratif
Basée sur le contenu
Hybride
Quelques variations
Un petit mot sur l’évaluation
La recommandation en BD et OLAP
Conclusion et perspectives
5/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Les méthodes les plus
utilisées

[La personnalisation - Personalized
recommendations]

Le filtrage collaboratif – Collaborative filtering

Les recommandations basées sur le contenu
– Content-based

Les approches hybrides
6/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Les méthodes les plus
utilisées (2)
Personalized recommendations
7/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Les méthodes les plus
utilisées (3)
Collaborative: "Dites-moi ce qui est
populaire parmi mes pairs"
8/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Les méthodes les plus
utilisées (4)
Content-based: “Montrez-moi plus que
ce qui ressemble à ce que j’ai aimé"
9/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Les méthodes les plus
utilisées (5)
Hybrid: combinaisons de différentes
entrées et/ou composition de différents
mécanismes
10/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Plan


Qu’est ce qu’un système de recommandation ?
Les méthodes les plus utilisées







Filtrage collaboratif
Basée sur le contenu
Hybride
Quelques variations
Un petit mot sur l’évaluation
La recommandation en BD et OLAP
Conclusion et perspectives
11/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Filtrage collaboratif
Collaborative: "Dites-moi ce qui est
populaire parmi mes pairs"
12/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Filtrage collaboratif - Présentation

Les systèmes basés sur le filtrage collaboratif produisent des
recommandations en calculant la similarité entre les préférences
d’un utilisateur et celles d’autres utilisateurs

De tels systèmes ne tentent pas d’analyser ou de comprendre le
contenu des items à recommander

Ils sont capables de suggérer de nouveaux items à des
utilisateurs qui ont des préférences similaires à d’autres

La méthode consiste à faire des prévisions automatiques
(filtrage) sur les intérêts d'un utilisateur en collectant des avis de
nombreux utilisateurs (collaborateurs). L'hypothèse sous-jacente
de cette approche est que ceux qui ont accepté (aimé qqch)
dans le passé ont tendance à accepter (aimer qqch) de nouveau
dans l'avenir.
13/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Filtrage collaboratif Mécanisme



Idée :
Essayer de prédire l'opinion de l'utilisateur qu’il aura sur les
différents items et être en mesure de recommander le
«meilleur» item à chaque utilisateur en fonction de : des
goûts/avis précédents de l'utilisateur et des avis d'autres
utilisateurs qui lui sont semblables
Mécanisme :
1.
Un grand groupe de préférences d’utilisateurs sont enregistrées
2.
Un sous-groupe d’utilisateurs est repéré dont les préférences
sont similaires à celles de l'utilisateur qui cherche la
recommandation
3.
Une moyenne des préférences pour ce groupe est calculée
4.
La fonction de préférence qui en résulte est utilisée pour
recommander des options à l'utilisateur qui cherche la
recommandation
5.
La notion de similitude doit être définie d'une certaine façon
14/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
How collaborative filtering works?
“People who liked this also liked…”
abcd
How it works
Item to
Item
User to User
NEGRE
Elsa - Systèmes de recommandation - Lens - 25/06/2012
Source : Bracha Shapira
abcd
User-to-User
 Les recommandations sont faites en
trouvant des utilisateurs ayant des avis
similaires. Jane et Tim aiment tous les
deux l’Item 2 et détestent l’Item 3; il
semble qu’ils ont des avis similaires, ce
qui suggère qu’en général Jane et Tim
sont du même avis. Donc, l’Item 1 est
une bonne recommandation pour Tim.
Cette approche n’est pas adaptée pour
des millions d’utilisateurs.
Item-to-Item
 Les recommandations sont faites en
trouvant les items qui ont le même
intérêt pour plusieurs utilisateurs. Tom
et Sandra aiment l’Item 1 et l’Item 4.
Cela suggère que, en général, les
utilisateurs qui aiment l’Item 4
aimeront aussi l’Item 1, donc l’Item 1
pourra être recommander à Tim. Cette 15/43
15
approche s’adapte à des millions
Filtrage collaboratif –
Techniques utilisées

Similarité :




Sélection du voisinage


Neighbourhood-based algorithms (kNN, …)
Rating Prediction



Pearson’s correlation coefficients between 2 users,
Cosinus similarity measure
SVD – Matrix Factorization
LSA
Association rules
…
16/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Filtrage collaboratif –
Avantages



Utilise des recommandations d’autres
utilisateurs (score) pour évaluer l’utilité des
items
l'essentiel est de trouver des utilisateurs ou
groupes d'utilisateurs dont les intérêts
correspondent à l'utilisateur courant
Plus il y a d’utilisateurs, plus il y a de scores :
meilleurs sont les résultats
17/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Filtrage collaboratif –
Inconvénients

Trouver des utilisateurs ou groupes d’utilisateurs similaires est difficile

cold start problem – démarrage à froid
 Nouvel utilisateur = Pas de préférences
 Nouvel item = Pas de score

Faible densité de la matrice utilisateur/score

Évolutivité:


Portfolio Effect: Non Diversity Problem


dans les systèmes avec un grand nombre d‘items et d'utilisateurs, le calcul croît
linéairement; des algorithmes appropriés sont nécessaires
Il n'est pas utile de recommander tous les films avec Antonio Banderas à un utilisateur
qui a aimé l'un d'eux dans le passé
Sécurité
 Privacy
18/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Plan


Qu’est ce qu’un système de recommandation ?
Les méthodes les plus utilisées







Filtrage collaboratif
Basée sur le contenu
Hybride
Quelques variations
Un petit mot sur l’évaluation
La recommandation en BD et OLAP
Conclusion et perspectives
19/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Basée sur le contenu
Content-based: “Montrez-moi plus que
ce qui ressemble à ce que j’ai aimé"
20/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Basée sur le contenu –
Présentation

Pour les recommandations basées sur le contenu, le
système essaie de recommander des items qui
correspondent au profil de l'utilisateur.

Le profil est basé sur les items que l’utilisateurs a
aimé dans le passé ou sur les intérêts qu’il a
explicitement définis.

Un RS basé sur le contenu fait coïncider le profil de
l’item avec le profil de l’utilisateur pour décider de sa
pertinence pour l’utilisateur.
21/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Basée sur le contenu –
Exemple
update
Read
New books
Match
Recommender
Systems
22
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
User Profile
User Profile
recommendation
22/43
Basée sur le contenu Techniques


Ces systèmes utilisent le plus souvent un algorithme
de “machine learning” pour obtenir un profil des
préférences de l’utilisateur à partir d’exemples
basés sur une description du contenu.
…
23/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Basée sur le contenu –
Avantages

Recommander des items similaires à ceux que les utilisateurs ont aimé
dans le passé

Le profil des utilisateurs est la clé

Le matching entre les préférences de l'utilisateur et les caractéristiques
des items fonctionne aussi pour les données textuelles

Pas besoin de données sur les autres utilisateurs.

Pas de problème de démarrage à froid ou de faible densité

Possibilité de faire des recommandations à des utilisateurs avec des
goûts « uniques ».

Possibilité de recommander de nouveaux items ou même des items qui
ne sont pas populaires
24/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Basée sur le contenu –
Inconvénients

Tous les contenus ne peuvent pas être représentés avec des mots-clés (exemple: les
images, …)

Des items représentés par le même ensemble de mots-clés ne peuvent pas être distingués

Les utilisateurs avec des milliers d'achats/items sont un problème

Nouvel utilisateur : pas d’historique

“Over-specialization” : limitation aux items similaires

Les profils utilisateurs…

Pour produire des recommandations précises, l'utilisateur doit fournir un « feedback » sur
les suggestions retournées - les utilisateurs n'aiment pas…

Entièrement basé sur les scores d’articles et de sujets d'intérêt: moins il y a de scores, plus
l’ensemble de recommandations possibles est limité.

Il faut faire attention à l’évolution des intérêts de l’utilisateur et les prendre en compte

Impossible d’exploiter les jugements des autres utilisateurs
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
25/43
Plan


Qu’est ce qu’un système de recommandation ?
Les méthodes les plus utilisées







Filtrage collaboratif
Basée sur le contenu
Hybride
Quelques variations
Un petit mot sur l’évaluation
La recommandation en BD et OLAP
Conclusion et perspectives
26/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Hybride
Hybrid: combinaisons de différentes
entrées et/ou composition de différents
mécanismes
27/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Hybride - Présentation

Combinaison du filtrage collaboratif et basé
sur le contenu

3 approches :



Monolitique
Parallèle
Pipeline
28/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Plan


Qu’est ce qu’un système de recommandation ?
Les méthodes les plus utilisées







Filtrage collaboratif
Basée sur le contenu
Hybride
Quelques variations
Un petit mot sur l’évaluation
La recommandation en BD et OLAP
Conclusion et perspectives
29/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Quelques variations…

Knowledge based RS



Cluster Models






Utilise les informations des utilisateurs et des items
L'interaction conversationnelle est utilisée pour établir les préférences des utilisateurs :
« plus comme ci », « moins comme ça », « aucun de ceux là », …
Crée des clusters ou des groupes
Met un utilisateur dans une catégorie
La classification simplifie la tâche de “matching” entre utilisateurs
Plus d'évolutivité et de performances
Un peu plus précis que le filtrage collaboratif classique
Graph-based method


Principe de la propagation d’activité
Utilise les chemins de longueur > 3 pour recommander des items
30/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Plan


Qu’est ce qu’un système de recommandation ?
Les méthodes les plus utilisées







Filtrage collaboratif
Basée sur le contenu
Hybride
Quelques variations
Un petit mot sur l’évaluation
La recommandation en BD et OLAP
Conclusion et perspectives
31/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Evaluation des systèmes de
recommandation

Mean Absolute Error (MAE) calcule l’écart entre les
scores prédits et les scores réels.

Root Mean Square Error (RMSE) , similaire à la MAE,
mais met l’accent sur les plus grands écarts

Rappel et précision

Le « rank score » est défini comme le rapport entre le
score des items corrects et le meilleur score théorique
réalisable pour l'utilisateur

…
32/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Plan


Qu’est ce qu’un système de recommandation ?
Les méthodes les plus utilisées







Filtrage collaboratif
Basée sur le contenu
Hybride
Quelques variations
Un petit mot sur l’évaluation
La recommandation en BD et OLAP
Conclusion et perspectives
33/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Les systèmes de recommandation
en BD et OLAP
Recommandations en bases de données :
 Etant donnés :
 Un log de requêtes
 Une base de données
 Une session courante
 Soit
 Q : ensemble de requêtes
 S : ensemble de sessions
 u : fonction d’utilité d’une requête q pour une session s
 Alors choisir la requête q’ non encore évaluée de Q qui maximise
l’utilité pour chaque session s de S
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012

34/43
Les systèmes de recommandation
en BD et OLAP (2)

Approches basées sur :
 Exploitation du profil d’utilisation
(Cuppens+:DSS’91, Jerbi+:DAWAK’09)

Analyse pilotée par la découverte
(Sarawagi:VLDB’99-VLDB’00-VLDB’01,
Cariou+:DAWAK’08, Giacometti+:IJDWM’09)

Exploitation du log de requêtes (Sapia:DMDW’99DAWAK’00, Chatzopoulou+:SSDBM’09,
Yang+:ICDE’09, Negre:09)
35/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Les systèmes de recommandation
en BD et OLAP (3)

Requête :
{Rouge}X{Centre, Limousin}X πAnnée(Temps)X{Montant}

Références :
{<Montant, Rouge, Centre, 2007>, <Montant, Rouge, Limousin, 2007>
<Montant, Rouge, Centre, 2008>, <Montant, Rouge, Limousin, 2008>}

Résultats :
36/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Exploitation du profil
37/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Analyse pilotée par la
découverte
38/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Exploitation du log de
requêtes
39/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Plan


Qu’est ce qu’un système de recommandation ?
Les méthodes les plus utilisées







Filtrage collaboratif
Basée sur le contenu
Hybride
Quelques variations
Un petit mot sur l’évaluation
La recommandation en BD et OLAP
Conclusion et perspectives
40/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Conclusion



Les systèmes de recommandation ont leurs racines dans de
nombreux domaines de recherche :
 Recherche d’information
 Filtrage d’information
 Classification de texte
 …
Ils utilisent des techniques issues de différents domaines :
 Machine learning
 Data mining
 …
Et abordent différents sujets :
 Algorithmes de recommandation
 Approches collaboratives, basées sur le contenu, hybrides, …
 Evaluation des RS
 …
41/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Perspectives

Amélioration des techniques de filtrage collaboratif




Multicriteria recommender systems







Traitement du langage naturel,
Dialog-based systems for interactive preference, and
Passage des RS classiques aux “conseillers virtuels”.
Les techniques de recommandation vont fusionner avec d’autres champs de recherche




Prendre en compte les aspects temporel, géographiques, …
Contexte émotionnel (“Je suis tombée amoureuse d’un garçon. Je veux voir un film romantique.")
…
Group recommendations
Améliorer les modèles d’interactions


Exploiter les scores multicritères qui contiennent de l’information contextuelle, pour améliorer les
recommandations
Context awareness


Utiliser plus de sources de données (tagging data, demographic information, and time data)
Combiner des techniques
…
User modeling
Personalized reasoning
…
…
42/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Questions ?
43/43
NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012