추천 시스템을 서비스에 이용하고 있는 Commercial & non

Download Report

Transcript 추천 시스템을 서비스에 이용하고 있는 Commercial & non

Flexible Recommendation Framework
2010. 05. 12
Sangkeun Lee
IDS Lab.
Seoul National University
공통점 찾아보기
추천 시스템을 서비스에 이용하고 있는 Commercial & non-commercial 사례
Copyright  2010 by CEBT
2
추천 시스템 (Recommender System/Engines)

Recommender systems or
recommendation engines form or work
from a specific type of information
filtering system technique that attempts
to recommend information items that
are likely to be of interest to the user.
(from Wikipedia)

Variety of Services
영화
웹사이트

문서
책

Variety of Domains

음악
Copyright  2010 by CEBT
Amazon, Amie Street, Barilliance, Barnes
and Noble, Baynote, ChoiceStream,
Collarity, Digg.com, eBay, Google, News,
Gravity, R&D, half.ebay.com, Heeii,
Hollywood, Video, Hulu, iLike, Internet
Movie Database, iTunes, Last.fm,
LibraryThing, Loomia, Musicmatch,
MyStrands, Netflix, Simania,……
films, television, video on demand, music,
books, news, images, web pages, etc
3
모든 것이 좋아 보이나…
ReadWriteWeb – ‘5 Problems of Recommender Systems’
(http://www.readwriteweb.com/archives/5_problems_of_recommender_systems.php)



Lack of Data
Changing User Preferences
–
–
need a lot of data to
effectively make
recommendations
–
a chicken and egg problem to get good recommendations,
you need a lot of users

Unpredictable Items
–
Changing Data
–
–
biased towards the old and
have difficulty showing new
each attribute (think fit, price,
color, style, fabric, brand, etc)
has a different level of
importance at different times
for the same consumer
Copyright  2010 by CEBT

today I have a particular
intention when browsing e.g.
Amazon - tomorrow I might
have a different intention
The type of movie that people
either love or hate
This Stuff is Complex!
–
it takes a lot of variables to do
even the simplest
recommendations
–
find the magic formula for
recommending new products
or content to their users…??
4
Finding the Magic Formula?


‘최적의 추천 공식’ – 즉, 사용자의 만족도를 가장 높여 줄 수 있는 추천 알고리즘과
파라메터를 찾는 것은 결코 쉬운 일이 아니다.

시간의 흐름에 따라 데이터는 지속적으로 변화한다

추천을 위한 속성의 중요도가 변화한다

사용자마다 다른 추천 기법이 최적일 수 있다.

추천에 활용할 수 있는 변수들은 너무도 많다.

다양한 추천 알고리즘들이 존재한다

상황에 따라 다른 성능을 보인다
Amazon이나 Netflix, Google같은 많은 사용자를 확보하고 있는 대표 서비스들을 제
외하고는 많은 추천 서비스들이 만족스러운 결과를 얻는 데 필요한 그들만의 공식을
찾는 것이 어려운 것이 현실이다 (추천 시스템의 가장 성공적인 Case로 꼽히는 Netflix 또한 추천 정확
도의 10% 향상을 위한 Netflix Prize을 개최하고 있다.)
Copyright  2010 by CEBT
5
Flexible Recommendation Framework

최적 솔루션을 찾기 위한 Empirical Experiment를 할 수 있어야 한다

다양한 추천 알고리즘들의 Dynamic하게 속성별 중요도를 조정해가면서 결과를 비교
분석 할 수 있도록 하는 실험이 가능하다면 경험적으로(Empirically) 최적의 솔루션을
찾는 데 도움이 될 것이다.

그러나 대부분의 추천 시스템은 Hardly-wired recommendation algorithm 을 이용해
추천 서비스를 제공한다.


–
실험이나 파라메터의 변경, 새로운 추천 기법의 도입을 위해 Code-level의 수정이 필요하다.
–
정해진 데이터 스키마 구조를 가정하고 있어서 유연하지 않으며 low-level 데이터의 구조를 이
해해야 추천 알고리즘을 변경 할 수 있다.
Flexible Recommendation Framework 가 필요하다
Related Works

Multidimensional Recommender Systems: A Data Warehousing Approach
–

RQL: formulated on a pre-specified multidimensional cube of ratings
FlexRecs
–
a general and open framework for expressing and pro- cessing flexible recommendations
over relational data
Copyright  2010 by CEBT
6
Copyright  2010 by CEBT
7
Copyright  2010 by CEBT
8
Goal of Flexible Recommendation Framework

Two types of relations - Atomic, Composed

Atomic relations are pre-calculated from low-level log data (Code Level)

Composed relations are calculated by composing atomic relations (System Level)

By combining relations, (any) recommendation algorithms can be declaratively
defined without understanding low-level log data

Expected Contributions

Dynamic 하게 Relation들을 넣고 빼고 결과를 보면서 추천 알고리즘을 테스트 할 수 있
다.

Coding Skill이나 Computer Engineering에 대한 깊은 이해가 없는 사람이라고 할지라
도 의미 기반의 추천 알고리즘을 작성하고 테스트 할 수 있다.

재사용 가능한 의미 단위의 Building Block을 활용함으로써 Code 를 새로 작성하는 것
을 최소화 한다.

데이터의 구조를 변경하지 않고 새로운 추천 알고리즘의 결과를 실험해볼 수 있다. (on
the fly)

여러 가지 추천 알고리즘의 결과를 쉽게 Blend 할 수 있다.

어떤 것이라도 추천의 대상이 될 수 있다. (multiple-dimensions)
Copyright  2010 by CEBT
9