推荐系统


一个例子, 预测电影的评分

这个案例中, 我们要预测其中所有打问号的地方,预测他们的值是多少

其中 r(i, j) 如果是真, 则表示已经被评论上, 如果假,则未评论。

i 表示电影序号, j 表示用户序号

y(i, j) 表示评分序号, 值的范围为 0~5

推荐系统的任务就是, 利用算法,给定了一个如此的数据集,预测其中问号的值。 

1. 基于内容的推荐(Content-Based)

问题: 使用基于内容的推荐算法,预测问号的值。

条件:有两属性, n = 2,x1 表示 浪漫程度, x2 表示 动作程度, 值的范围为0-1.0

解法: 首先预测 Alice 对于 电影 Cute Puppies of love 的值。

n = 2 , 表示有两个属性, 假设 theat(j) 是一个如图标注的值,则 最后预测的值为 4.95。

问题阐述, 目的,学习得到 theat(j)

 使用线性回归,得到theat(j) 的最小值。 theat(j) 是一个 (n+1, 1) 的矩阵。

对上述函数进行整理

梯度下降查找最优

2. 协同过滤算法(Collaborative Filtering)

如果用户给了评分规则,告诉了每个用户的喜好,但是数据集中没有特征值,此时,如何预测问号中的值?

通过特征值,预测每个用户对其

算法实现流程

3. 算法的向量化实现

相关