推荐系统--矩阵分解(5)

推荐系统–矩阵分解(1)
推荐系统–矩阵分解(2)
推荐系统–矩阵分解(3)
推荐系统–矩阵分解(4)
推荐系统–矩阵分解(5)
推荐系统–矩阵分解(6)

8 基于隐式反馈的矩阵分解

8.1 引入

相对于显示反馈的评分数据，隐式反馈有以下几方面的特征：

只有正反馈，没有负反馈，只能得到用户喜欢那些物品，对于用户不喜欢的物品没有数据支持；
隐式反馈噪声比较多，不像用户评分行为是用户强烈的主动行为，用户浏览行为、点击行为都相对比较被动。例1，某个页面是因为用户默认打开页面导致打分较高；例2，买东西可能只是用来送礼；
显式反馈的评分数据代表用户真实的喜好程度，隐式反馈代表置信度；
需要有合适的方法来对隐式反馈进行评价，而不能直接用RMSE。

8.2 模型

模型引入喜好变量和置信度变量。
$fui={1rui>00rui=0(1)f_{u i}=\left\{\begin{array}{cc} 1 & r_{u i}>0 \\ 0 & r_{u i}=0 \end{array}\right. \tag1$
符号说明：
喜好变量 $f_{u i}$ ：一个二元变量，表示用户是否具有该偏好。
置信度变量的计算有两种方式：
$cui=1+αrui(2)c_{u i}=1+\alpha r_{u i} \tag2$
或
$cui=1+αlog⁡(1+rui/ϵ)(3)c_{u i}=1+\alpha \log \left(1+r_{u i} / \epsilon\right) \tag3$
符号说明：
置信度变量 $c_{u i}$ ：表示用户对物品喜好的置信程度。

最终得到如下优化目标函数：
$\min _{p_{\star}, q_{\star}} \sum_{u, i} c_{u i}\left(f_{u i}-p_{u}^{T} q_{i}\right)^{2}+\lambda\left(\sum_{u}\left\|p_{u}\right\|^{2}+\sum_{i}\left\|q_{i}\right\|^{2}\right) \tag4$

8.3 求解 $p_u$ 和 $q_i$

首先计算梯度：
$12∂L(p,q)∂pu=∑icui(puTqi−fui)qi+λpu=∑icui(qiTpu−fui)qi+λpu=QTCuQpu−QTCuf(u)+λpu\begin{aligned} \frac{1}{2} \frac{\partial L(p, q)}{\partial p_{u}} &=\sum_{i} c_{u i}\left(p_{u}^{T} q_{i}-f_{u i}\right) q_{i}+\lambda p_{u} \\ &=\sum_{i} c_{u i}\left(q_{i}^{T} p_{u}-f_{u i}\right) q_{i}+\lambda p_{u} \\ &=Q^{T} C^{u} Q p_{u}-Q^{T} C^{u} f(u)+\lambda p_{u} \end{aligned}$
有两种方法可以求解 $p_u$ 和 $q_i$ ：

第一种方法为直接法，令偏导为0，则有：
$pu=(QTCuQ+λI)−1QTCuf(u)p_{u}=\left(Q^{T} C^{u} Q+\lambda I\right)^{-1} Q^{T} C^{u} f(u)$
矩阵计算的维度如下：
$\times n \& n \times n \& n \times k) \& (k \times n) \& (n \times n) \& (n \times 1)= k \times 1$
同理可得：
$qi=(PTCiP+λI)−1PTCif(i)q_{i}=\left(P^{T} C^{i} P+\lambda I\right)^{-1} P^{T} C^{i} f(i)$

符号说明：
$\in \mathbb{R}^{n}$ ：包含用户 $u$ 的所有偏好向量；
$\in \mathbb{R}^{m}$ ：包含用户对物品 $t_i$ 的偏好向量；
$\in \mathbb{R}^{m \times k}$ ：潜在用户特征矩阵；
$\in \mathbb{R}^{n \times k}$ ：潜在物品特征矩阵；
$Cu∈Rn×nC^{u} \in \mathbb{R}^{n \times n}$ ：是 $C_{i i}^{u}=c_{u i}$ ，其余地方为0的对角矩阵，如下所示：


$C_{22}^{u}$
	$C_{33}^{u}$
		$C_{44}^{u}$
			$C_{55}^{u}$

$Ci∈Rm×mC^{i} \in \mathbb{R}^{m \times m}$ ：是 $C_{uu}^{i}=c_{u i}$ 的对角矩阵，其余地方为0的对角矩阵，如下所示：


$C_{22}^{i}$
	$C_{33}^{i}$
		$C_{44}^{i}$
			$C_{55}^{i}$

第二种方法为迭代法：
梯度计算如下：
$12∂L(p,q)∂pu=∑i[cui(puTqi−fui)]qi+λpu=∑i[cui(qiTpu−fui)]qi+λpu12∂L(p,q)∂qi=∑u[cui(puTqi−fui)]pu+λqi\begin{aligned} \frac{1}{2} \frac{\partial L(p, q)}{\partial p_{u}} &=\sum_{i} \left[c_{u i}\left(p_{u}^{T} q_{i}-f_{u i}\right)\right] q_{i}+\lambda p_{u} \\ &=\sum_{i} \left[c_{u i}\left(q_{i}^{T} p_{u}-f_{u i}\right)\right] q_{i}+\lambda p_{u} \\ \frac{1}{2}\frac{\partial L(p, q)}{\partial {q}_{i}}&= \sum_{u}\left[c_{u i}\left({p}_{u}^{T}{q}_{i}- f_{u i}\right)\right] {p}_{u}+ \lambda {q}_{i} \end{aligned}$
迭代公式为：
$pu=pu−γ∂L(p,q)∂puqi=qi−γ∂L(p,q)∂qi\begin{aligned} {p}_{u}&={p}_{u}-\gamma \frac{\partial L(p, q)}{\partial {p}_{u}}\\ {q}_{i}&={q}_{i}-\gamma \frac{\partial L(p, q)}{\partial {q}_{i}} \end{aligned}$