Transcript PPT下载

一种基于半监督学习的推荐系统
冷启动问题研究
姓名:成英超
导师:郝志峰
目录
1.研究背景及意义
2.研究现状及内容
3.研究创新及难点
4.路线和进度安排
研究背景

Top-N推荐算法
预测客户购买需求
研究背景
冷启动:对新(不活跃)用户和新(购买率
低)的商品推荐效果不给力
亚马逊的推荐
算法说
“Sorry"
都不是用户想要
的内容
研究意义
社会效益
在历史数据不足的情况下完成有效推荐
为其他存在数据不足问题的课题领域提供学
习借鉴
研究现状
Netflix电影推荐大赛获胜团队提出的 推荐算
法:基于模型的协同过滤(CF)算法

T
简化
   bu  bi  q i p u
r
表示: ui
用户和电
影之间的
交互影响
预测的推
荐评分
数据集中
平均评分
用户的个
人品味
电影的公
众评价
现状不足
对新(不活跃)用户和新(购买率低)的商
品推荐效果不给力
对新电影和少人评论的电影的
预测效果差
^
RMSE 

( u , i )TestSet
实际评分
( rui  rui )
2
| TestSet |
预测评分
研究现状
清华大学唐杰等人提出基于协同过滤算法的
背景模型
用户对电影类别的偏好

rui
   bu  bi  q i p u 
T

g  genres ( i )
b ug
| genres ( i ) |
特定年龄a的
用户u对电影
i的偏好
 b i a  b io  b is
特定职业o的
用户u对电影i
的偏好
特定性别s
的用户u对
电影i的偏好
研究现状
清华大学唐杰等人提出半监督-联合训练方法
CSEL
研究目标
目标一:提升推荐结果准确率
目标二:大幅消减“冷启动问题”对推荐结
果的影响
研究内容
一:提出更加详尽的背景模型
二:运用特征选择方法筛选细化后的用户背
景属性
三:优化CSEL,将回归器扩展到三个以上
四:提出更加有效、准确的训练结果整合方
法
研究路线
 1.The BellKor solution to the Netflix Prize
(ProgressPrize2007_KorBell)
 2.The BellKor 2008 Solution to the Netflix Prize
 3.The BigChaos Solution to the Netflix Grand Prize
 4.The Pragmatic Theory solution to the Netflix
Grand Prize(2009)
 5.The BellKor Solution to the Netflix Grand
Prize(2009)
 6.SIGIR14-Zhang-et-al-cold-startrecommendation(2014)
研究创新点
一:所构建的背景模型更加详尽,考虑了更
多影响推荐效果的因子
二:半监督学习下要构建三组回归器协同训
练
三:所提出的训练结果整合方法更加复杂、
高效
研究的难点
一:如何构建更详尽的背景模型,应该添加
哪些影响推荐效果的因子
二:如何将半监督学习下的协同训练扩展到
三个以上的回归器
三:怎样优化训练结果整合方法
进度安排
.
THX
请各位老师提出宝贵意见!
谢谢