Transcript PPT下载
一种基于半监督学习的推荐系统
冷启动问题研究
姓名:成英超
导师:郝志峰
目录
1.研究背景及意义
2.研究现状及内容
3.研究创新及难点
4.路线和进度安排
研究背景
Top-N推荐算法
预测客户购买需求
研究背景
冷启动:对新(不活跃)用户和新(购买率
低)的商品推荐效果不给力
亚马逊的推荐
算法说
“Sorry"
都不是用户想要
的内容
研究意义
社会效益
在历史数据不足的情况下完成有效推荐
为其他存在数据不足问题的课题领域提供学
习借鉴
研究现状
Netflix电影推荐大赛获胜团队提出的 推荐算
法:基于模型的协同过滤(CF)算法
T
简化
bu bi q i p u
r
表示: ui
用户和电
影之间的
交互影响
预测的推
荐评分
数据集中
平均评分
用户的个
人品味
电影的公
众评价
现状不足
对新(不活跃)用户和新(购买率低)的商
品推荐效果不给力
对新电影和少人评论的电影的
预测效果差
^
RMSE
( u , i )TestSet
实际评分
( rui rui )
2
| TestSet |
预测评分
研究现状
清华大学唐杰等人提出基于协同过滤算法的
背景模型
用户对电影类别的偏好
rui
bu bi q i p u
T
g genres ( i )
b ug
| genres ( i ) |
特定年龄a的
用户u对电影
i的偏好
b i a b io b is
特定职业o的
用户u对电影i
的偏好
特定性别s
的用户u对
电影i的偏好
研究现状
清华大学唐杰等人提出半监督-联合训练方法
CSEL
研究目标
目标一:提升推荐结果准确率
目标二:大幅消减“冷启动问题”对推荐结
果的影响
研究内容
一:提出更加详尽的背景模型
二:运用特征选择方法筛选细化后的用户背
景属性
三:优化CSEL,将回归器扩展到三个以上
四:提出更加有效、准确的训练结果整合方
法
研究路线
1.The BellKor solution to the Netflix Prize
(ProgressPrize2007_KorBell)
2.The BellKor 2008 Solution to the Netflix Prize
3.The BigChaos Solution to the Netflix Grand Prize
4.The Pragmatic Theory solution to the Netflix
Grand Prize(2009)
5.The BellKor Solution to the Netflix Grand
Prize(2009)
6.SIGIR14-Zhang-et-al-cold-startrecommendation(2014)
研究创新点
一:所构建的背景模型更加详尽,考虑了更
多影响推荐效果的因子
二:半监督学习下要构建三组回归器协同训
练
三:所提出的训练结果整合方法更加复杂、
高效
研究的难点
一:如何构建更详尽的背景模型,应该添加
哪些影响推荐效果的因子
二:如何将半监督学习下的协同训练扩展到
三个以上的回归器
三:怎样优化训练结果整合方法
进度安排
.
THX
请各位老师提出宝贵意见!
谢谢