推荐系统--矩阵分解(4)

推荐系统–矩阵分解(1)
推荐系统–矩阵分解(2)
推荐系统–矩阵分解(3)
推荐系统–矩阵分解(4)
推荐系统–矩阵分解(5)
推荐系统–矩阵分解(6)

7 基于情感分析的矩阵分解

7.1 引入

【摘要】推荐系统旨在基于丰富的信息预测用户的偏好,例如用户评分、人口统计和评论。 尽管评论比评级更稀疏,但它们提供了有关用户真实偏好的更详细和可靠的信息。 目前,评论通常用于提高推荐系统的可解释性。 在本文中,我们提出了基于情感的具有可靠性的矩阵分解(SBMF+R)算法来利用评论进行预测。 首先,我们开发了一种情感分析方法,使用一种新的基于星的字典构建技术来获得情感分数。 其次,我们设计了一个结合用户一致性和评论反馈的用户可靠性度量。 第三,我们将用户评分、评论和反馈纳入概率矩阵分解框架进行预测。 对八个亚马逊数据集的实验表明,SBMF+R 比最先进的算法更准确。

核心思想:分析发现,用户评论和用户评分存在一定的偏差(图1所示),为此我们将用户评论转换为情感分数,将用户评分、评论和反馈纳入概率矩阵分解框架进行预测。
在这里插入图片描述

7.2 评论的情感分析

在第一阶段,我们从评论文本构建基于星级的情感词典。 表 2 显示了从基于星的字典中选择的一些具有情感分数的单词。 基于星级的意思是我们在情感词的分类中考虑评分星级。 我们的直觉是 5 星的评论主要传达积极的情绪,反之亦然。
因此,评论中的关键词应该符合评论的整体情绪。 我们设计了两种构建字典的技术。 大多数现有的情感词典只用二个值(正或负)标记单词。 我们根据不同的情绪强度分配不同的分数以获得更准确的结果。 同一个词可以对不同类别的产品表达不同的情感。 因此,我们为每个类别构建了一个不同的字典来缓解这个问题。
在这里插入图片描述
否定可用于拒绝或拒绝语句。 我们考虑两种类型的否定反转来检查是否应该调整情绪分数。 一种否定完全颠倒了情绪的极性。 例如,如果我们假设“舒适”的分数是+1,那么“不舒服”的分数就反转为-1。 另一种类型的否定是非常积极(否定)的形容词,它稍微颠倒了极性。 例如,如果我们假设“优秀”的分数是+2,那么“不优秀”的分数乘以-0.5 到1。
情态是在句子中嵌入可能性、必要性或能力的语法表达。 它通过情态动词如“maybe”、“certainly”和“may”在语法上表达。 我们采用并考虑减弱情感强度的情态动词的方法。 因此,出现在情态范围内的情感词乘以0.5以抑制其强度。
表 3 显示了否定和模态操作后的最终情绪分数。
在这里插入图片描述

7.3 SBMF

在这里插入图片描述

考虑情感分数的矩阵分解优化目标函数为:

L(θ)=∑u,iIui[(rui−puTqi)2]+∑u,iIui[(Sui−puTqi)2]+λ(∥pu∥F2+∥qi∥F2)L(\theta)=\sum_{u, i} I_{u i}\left[\left(r_{u i}-p_{u}^{T} q_{i}\right)^{2}\right]+\sum_{u, i} I_{ui}\left[\left(S_{ui}-p_{u}^{T} q_{i}\right)^{2}\right]+\lambda(\|p_u\|_{F}^{2}+\|q_i\|_{F}^{2})L(θ)=u,iIui[(ruipuTqi)2]+u,iIui[(SuipuTqi)2]+λ(puF2+qiF2)
注意:为了保持上下文符号统一,图中的SijS_{ij}Sij在公式中用SuiS_{ui}Sui替换了。

7.4 SBMF+R

在这里插入图片描述
只有少数作者讨论了评分或评论在预测任务中是否更可靠。 我们同时考虑用户一致性和评论反馈作为可靠性衡量标准。 然后我们计算每个评级的可靠性度量,为它们分配个性化的权重。
我们将用户uuu 的评分向量表示为 ru=[ru1,…,run]r_u = [r_{u1}, \dots, r_{un}]ru=[ru1,,run]。 设 Su=[Su1,…,Sun]S_u = [S_{u1}, \dots, S_{un}]Su=[Su1,,Sun] 是我们使用情感分析计算的用户情感得分向量。 用户uuu 的一致性定义为用户评分向量与用户情感得分向量之间的欧氏距离 CuC_uCu。 评分和评论之间的距离越大,用户的一致性越低。 用户一致性定义为
Cu=∑i=1n(Rui−Sui)2C_{u}=\sqrt{\sum_{i=1}^{n}\left(R_{ui}-S_{ui}\right)^{2}} Cu=i=1n(RuiSui)2
除了用户一致性之外,我们还会考虑每条评论的有用性。 大多数电子商务网站都允许用户以赞成或反对的方式提供评论反馈。 此反馈被视为评论的有用性,反映了评论的真实性。 因此,我们使用正面反馈作为评论的有用性。 一些研究人员提出自动评估每个评论的反馈。让 FuiF_{ui}FuiFuiPF_{ui}^PFuiP表示用户 uuu对项目 tit_iti评论的总票数和正面票数。 然后,评论HuiH_{ui}Hui的有用性由下式给出:
Hui=FuiP/FuiH_{ui}=F_{ui}^{P} / F_{ui} Hui=FuiP/Fui
WuiW_{ui}Wui 表示用户uuu对项目tit_iti的评论的可靠性。 那么评分ruir_{ui}rui 的可靠性因子为:
Wui=Hui1−CuW_{ui}=\frac{H_{ui}}{1-C_{u}} Wui=1CuHui
类似地,情感得分SuiS_{ui}Sui的可靠性因子是 1−Wui1 − W_{ui}1Wui。 我们将可靠性区间归一化为 [0, 1]。 使用可靠性估计,我们最终获得每个评级的个性化权重。
我们根据其可靠性为评分和评论分配不同的权重。 计算可靠性因子 WuiW_{ui}Wui 后,误差平方和目标函数由下式给出:
L(θ)=∑u,iIui[Wui(rui−puTqi)2]+∑u,iIui[(1−Wui)(Sui−puTqi)2]+λ(∥pu∥F2+∥qi∥F2)\begin{aligned} L(\theta)=&\sum_{u, i} I_{u i}\left[W_{ui}\left(r_{u i}-p_{u}^{T} q_{i}\right)^{2}\right] \\ &+\sum_{u, i} I_{ui}\left[(1-W_{ui})\left(S_{ui}-p_{u}^{T} q_{i}\right)^{2}\right]+\lambda(\|p_u\|_{F}^{2}+\|q_i\|_{F}^{2}) \end{aligned} L(θ)=u,iIui[Wui(ruipuTqi)2]+u,iIui[(1Wui)(SuipuTqi)2]+λ(puF2+qiF2)

参考文献

Sentiment based matrix factorization with reliability for recommendation

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/507544.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

yarn 卸载包_0609-6.1.0-如何卸载CDH6.1

1.文档编写目的Fayson在两年前的文章中介绍过CDH的卸载,参考《如何卸载CDH(附一键卸载github源码)》。除非你是使用Cloudera官方提供的一键安装脚本安装的CDH,否则并没有现成的一键卸载的脚本供使用。为了更好的理解CDH的卸载,这里再次简单介…

推荐系统--矩阵分解(3)

推荐系统–矩阵分解(1) 推荐系统–矩阵分解(2) 推荐系统–矩阵分解(3) 推荐系统–矩阵分解(4) 推荐系统–矩阵分解(5) 推荐系统–矩阵分解(6) 5 TimeSVD:增加时间因素 物品的受欢迎度随着时间而改变,例如,电影可以因外部事件(如新电影中演员…

python安装不了是什么问题_安装不上python的模块怎么办?别怕,我这有妙招!

之前我们介绍过如何在Python中安装第三方的包:Python以第三方包丰富而著称,你想要的功能几乎都可以通过pip命令安装,避免什么都要自己重新造轮子尬尴。但是pip安装有两个常见问题,第一是下载慢,第二是无法安装。慢的原…

推荐系统--矩阵分解(5)

推荐系统–矩阵分解(1) 推荐系统–矩阵分解(2) 推荐系统–矩阵分解(3) 推荐系统–矩阵分解(4) 推荐系统–矩阵分解(5) 推荐系统–矩阵分解(6) 8 基于隐式反馈的矩阵分解 8.1 引入 相对于显示反馈的评分数据,隐式反馈有以下几方面的特征: 只有正反馈&…

xss跨站脚本攻击_网络安全xss跨站脚本攻击原理

以下在未经授权的网站操作均为违法行为XSS跨站脚本攻击xss的危害网络钓鱼,盗取各类账号密码我们先来看一下下面的案例:先来记住一下下面中的表我们来做一个转发上面页面显示已经登录,但是突然页面中提醒再此登录此时,我们并没有多…

推荐系统--联邦学习下的矩阵分解(6)

推荐系统–矩阵分解(1) 推荐系统–矩阵分解(2) 推荐系统–矩阵分解(3) 推荐系统–矩阵分解(4) 推荐系统–矩阵分解(5) 推荐系统–矩阵分解(6) 9 应用于联邦学习的矩阵分解 这个部分主要参考以下两篇论文: 2008-Collaborative Filtering for Implicit Feedback Dat…

python类的特殊方法汇总_Python笔记001-类的特殊方法

Python笔记001-类的特殊方法以下是我学习《流畅的Python》后的个人笔记,现在拿出来和大家共享,希望能帮到各位Python学习者。首次发表于: 微信公众号:科技老丁哥,ID: TechDing,敬请关注。本篇主要知识点:类…

什么是联邦学习

联邦学习 1.1 联邦学习的概念 历史:联邦学习最早在 2016 年由谷歌提出,原本用于解决安卓手机终端用户在本地更新模型的问题; 本质:联邦学习本质上是一种分布式机器学习技术,或机器学习框架。 目标:联邦学…

循环自增_大学C语言—循环结构及应用

基础知识常见循环结构及形式for循环for(设置初始值;循环条件判断;设置循环增减量){语句1;语句2;…… 语句n;}while循环while(条件判断){语句1;语句2;……语句n;}do-while循环d…

论文写作的辅助工具

1 英文翻译 translate.google.cn 2 英文句子 我们以前的做法是要求每个同学收集一些经典的句子,现在有一个网站已经把这个工作做好了,这个可以解决60%句子问题,接下来就是写作的逻辑 https://www.phrasebank.manchester.ac.uk/ 3 画图工具…

dac0832控制电机驱动流程图_某驱动电机控制器拆解实拍照片

小编作为一个电控专业100%小白,机缘巧合获得某纯电动汽车驱动电机控制器一台,拆解之,权为业内人士参考之用,文中显得外行、用词不对及谬误之处还请各位大神不吝赐教!外观标牌背面拆解固定托架侧面拆解固定托架拆解固定…

推荐系统--安全联邦矩阵分解(7)

相关论文: Secure Federated Matrix Factorization 论文源代码见: https://github.com/Di-Chai/FedMF 1 摘要 为了保护用户隐私和满足法律法规,联邦(机器)学习近年来获得了广泛的关注。 联邦学习的关键原则是在不需要知道每个用…

联邦学习--数据攻击(1)

参考论文:Deep Leakage from Gradients(NeurIPS 2019) 源代码: https://github.com/mit-han-lab/dlg 核心思想:作者通过实验得到,从梯度可以反推用户的个人信息。并验证了其在计算机视觉和自然语言处理任务…

python制作图_Python做图的方法

最近一直没有更新文章,在学习Machine learning。然后业余在kaggle那里瞎转,对Python常用的作图摸了个遍,本文将对这些作图方法做个简单介绍一般我们作图主要是为了看数据分布、数据趋势、以及比较大小。常用的图包括:line(折线图)…

联邦学习--数据攻击(2)

参考论文:See through Gradients: Image Batch Recovery via GradInversion(CVPR 2021 ) 源代码: 核心思想:解决了Deep Leakage from Gradients(NeurIPS 2019)中batch大于1效果无效的情况。 缺点…

python简单网络爬虫_【Python】 简单网络爬虫实现

介绍网络爬虫(英语:网络爬虫),也称为网络蜘蛛(蜘蛛)是一个Web机器人用于自动浏览万维网。其目的通常是为了编译web索引。\u2014\u2014维基百科web爬虫程序可以节省他们访问的页面,以便搜索引擎可以为用户搜索生成索引。一般来说,有两个步骤:1。获取网页内容2。准备获得web内容和…

对抗攻击(1)

本文是根据李宏毅老师在B站上的视频整理而来,视频地址为: https://www.bilibili.com/video/BV1n3411y7xD?p65 1 无目标和有目标攻击的区别 无目标攻击:攻击后的标签不确定,只要是和原始标签差别越大越好。 有目标攻击&#xff…

python爬虫隐藏ip_Python3网络爬虫之使用User Agent和代理IP隐藏身份

本文介绍了Python3网络爬虫之使用User Agent和代理IP隐藏身份,分享给大家,具体如下:运行平台:WindowsPython版本:Python3.xIDE:Sublime text3一、为何要设置User Agent有一些网站不喜欢被爬虫程序访问&…

对抗攻击(2)

本文将介绍一些经典的对抗攻击算法,未完待续…

乌班图快速创建ftp

需求:乌班图22.04安装配置ftp,然后配置一个用户,用户名deviceftp密码aaaa,并且设置端口为60021,并且限制在/app/deviceftp目录下,不允许匿名登录 在Ubuntu 22.04上安装和配置FTP服务器的步骤如下&#xff…