추천 시스템을 서비스에 이용하고 있는 Commercial & non
Download
Report
Transcript 추천 시스템을 서비스에 이용하고 있는 Commercial & non
Flexible Recommendation Framework
2010. 05. 12
Sangkeun Lee
IDS Lab.
Seoul National University
공통점 찾아보기
추천 시스템을 서비스에 이용하고 있는 Commercial & non-commercial 사례
Copyright 2010 by CEBT
2
추천 시스템 (Recommender System/Engines)
Recommender systems or
recommendation engines form or work
from a specific type of information
filtering system technique that attempts
to recommend information items that
are likely to be of interest to the user.
(from Wikipedia)
Variety of Services
영화
웹사이트
문서
책
Variety of Domains
음악
Copyright 2010 by CEBT
Amazon, Amie Street, Barilliance, Barnes
and Noble, Baynote, ChoiceStream,
Collarity, Digg.com, eBay, Google, News,
Gravity, R&D, half.ebay.com, Heeii,
Hollywood, Video, Hulu, iLike, Internet
Movie Database, iTunes, Last.fm,
LibraryThing, Loomia, Musicmatch,
MyStrands, Netflix, Simania,……
films, television, video on demand, music,
books, news, images, web pages, etc
3
모든 것이 좋아 보이나…
ReadWriteWeb – ‘5 Problems of Recommender Systems’
(http://www.readwriteweb.com/archives/5_problems_of_recommender_systems.php)
Lack of Data
Changing User Preferences
–
–
need a lot of data to
effectively make
recommendations
–
a chicken and egg problem to get good recommendations,
you need a lot of users
Unpredictable Items
–
Changing Data
–
–
biased towards the old and
have difficulty showing new
each attribute (think fit, price,
color, style, fabric, brand, etc)
has a different level of
importance at different times
for the same consumer
Copyright 2010 by CEBT
today I have a particular
intention when browsing e.g.
Amazon - tomorrow I might
have a different intention
The type of movie that people
either love or hate
This Stuff is Complex!
–
it takes a lot of variables to do
even the simplest
recommendations
–
find the magic formula for
recommending new products
or content to their users…??
4
Finding the Magic Formula?
‘최적의 추천 공식’ – 즉, 사용자의 만족도를 가장 높여 줄 수 있는 추천 알고리즘과
파라메터를 찾는 것은 결코 쉬운 일이 아니다.
시간의 흐름에 따라 데이터는 지속적으로 변화한다
추천을 위한 속성의 중요도가 변화한다
사용자마다 다른 추천 기법이 최적일 수 있다.
추천에 활용할 수 있는 변수들은 너무도 많다.
다양한 추천 알고리즘들이 존재한다
상황에 따라 다른 성능을 보인다
Amazon이나 Netflix, Google같은 많은 사용자를 확보하고 있는 대표 서비스들을 제
외하고는 많은 추천 서비스들이 만족스러운 결과를 얻는 데 필요한 그들만의 공식을
찾는 것이 어려운 것이 현실이다 (추천 시스템의 가장 성공적인 Case로 꼽히는 Netflix 또한 추천 정확
도의 10% 향상을 위한 Netflix Prize을 개최하고 있다.)
Copyright 2010 by CEBT
5
Flexible Recommendation Framework
최적 솔루션을 찾기 위한 Empirical Experiment를 할 수 있어야 한다
다양한 추천 알고리즘들의 Dynamic하게 속성별 중요도를 조정해가면서 결과를 비교
분석 할 수 있도록 하는 실험이 가능하다면 경험적으로(Empirically) 최적의 솔루션을
찾는 데 도움이 될 것이다.
그러나 대부분의 추천 시스템은 Hardly-wired recommendation algorithm 을 이용해
추천 서비스를 제공한다.
–
실험이나 파라메터의 변경, 새로운 추천 기법의 도입을 위해 Code-level의 수정이 필요하다.
–
정해진 데이터 스키마 구조를 가정하고 있어서 유연하지 않으며 low-level 데이터의 구조를 이
해해야 추천 알고리즘을 변경 할 수 있다.
Flexible Recommendation Framework 가 필요하다
Related Works
Multidimensional Recommender Systems: A Data Warehousing Approach
–
RQL: formulated on a pre-specified multidimensional cube of ratings
FlexRecs
–
a general and open framework for expressing and pro- cessing flexible recommendations
over relational data
Copyright 2010 by CEBT
6
Copyright 2010 by CEBT
7
Copyright 2010 by CEBT
8
Goal of Flexible Recommendation Framework
Two types of relations - Atomic, Composed
Atomic relations are pre-calculated from low-level log data (Code Level)
Composed relations are calculated by composing atomic relations (System Level)
By combining relations, (any) recommendation algorithms can be declaratively
defined without understanding low-level log data
Expected Contributions
Dynamic 하게 Relation들을 넣고 빼고 결과를 보면서 추천 알고리즘을 테스트 할 수 있
다.
Coding Skill이나 Computer Engineering에 대한 깊은 이해가 없는 사람이라고 할지라
도 의미 기반의 추천 알고리즘을 작성하고 테스트 할 수 있다.
재사용 가능한 의미 단위의 Building Block을 활용함으로써 Code 를 새로 작성하는 것
을 최소화 한다.
데이터의 구조를 변경하지 않고 새로운 추천 알고리즘의 결과를 실험해볼 수 있다. (on
the fly)
여러 가지 추천 알고리즘의 결과를 쉽게 Blend 할 수 있다.
어떤 것이라도 추천의 대상이 될 수 있다. (multiple-dimensions)
Copyright 2010 by CEBT
9