文章目录
- 1.DIN模型
- 原理
- 缺点
- 2.SIM模型
- 原理
- 算法步骤
- 1.查找
- 2.注意力机制
- 参考文献
1.DIN模型
原理
- 计算用户Last N向量的加权平均
- 权重是候选物品与Last N物品的相似度
缺点
- 注意力层的计算量正比于n(用户行为序列的长度)
- 只能记录最近的几百个物品,否则计算量太大
- 只关心短期兴趣,会遗忘长期兴趣
2.SIM模型
对长期兴趣建模
原理
- 对用户长期行为记录,n大小可以是几千
- 对于每个候选物品,在用户Last N记录中快速查找,找到k个相似物品
- 把Last N变成TopK,然后输入注意力层
- 计算量从n降到k
算法步骤
1.查找
2.注意力机制
对比DIN,user侧的LastN交互记录被换成了上一步查找到的TopK交互记录。
参考文献
王树森推荐系统公开课-SIM模型
SIM论文
DIN论文