【搜索/推荐排序】Pairwise:BPR

1.BPR

在这里插入图片描述

1.1 做法

  • 构建样本对
  • 假设背后是某个常见模型:如MF
  • 排序对成立情况下倒推U/V向量,计算UV乘积,得到完整评分矩阵

矩阵分解:Xˉ=WHT\bar{X}=WH^TXˉ=WHT
贝叶斯:P(θ∣>u)=P(>u∣θ)P(θ)P(>u)P(\theta|>_u)=\frac{P(>_u|\theta)P(\theta)}{P(>_u)}P(θ>u)=P(>u)P(>uθ)P(θ)
<u,i,j> :P(i>uj∣θ)P(i>_u j|\theta)P(i>ujθ),i在j前面,用户u,θ\thetaθ是W、H,是个模型
P(>u∣θ)P(>_u|\theta)P(>uθ)极大似然估计
Πu∈UP(>u∣θ)=Π(u,i,j)∈U×I×IP(i>uj∣θ)δ((u,i,j)∈D)(1−P(i>uj∣θ)δ((u,i,j)∉D))\Pi_{u\in U}P(>_u|\theta)=\Pi_{(u,i,j)\in U\times I\times I}P(i>_u j|\theta)^{\delta((u,i,j)\in D)}(1-P(i>_u j|\theta)^{\delta((u,i,j)\notin D)})ΠuUP(>uθ)=Π(u,i,j)U×I×IP(i>ujθ)δ((u,i,j)D)(1P(i>ujθ)δ((u,i,j)/D))
D:已有的评分矩阵
P(i>uj∣θ)=σ(xˉuij(θ))P(i>_u j|\theta)=\sigma(\bar{x}_{uij}(\theta))P(i>ujθ)=σ(xˉuij(θ))
xˉuij=xuiˉ−xujˉ\bar{x}_{uij}=\bar{x_{ui}}-\bar{x_{uj}}xˉuij=xuiˉxujˉ
Πu∈UP(>u∣θ)=Π(u,i,j)∈Dσ(xuiˉ−xujˉ)\Pi_{u\in U}P(>_u|\theta)=\Pi_{(u,i,j)\in D}\sigma(\bar{x_{ui}}-\bar{x_{uj}})ΠuUP(>uθ)=Π(u,i,j)Dσ(xuiˉxujˉ)
->这是在预测矩阵X的对应的值

P(θ)P(\theta)P(θ)假设是高斯分布
lnP(θ∣>u)正比ln(P(>u∣θ)P(θ))=∑(u,i,j)∈Dσ(xuiˉ−xujˉ)+λ∣∣θ∣∣2lnP(\theta|>_u)正比ln(P(>_u|\theta)P(\theta))=\sum_{(u,i,j)\in D}\sigma(\bar{x_{ui}}-\bar{x_{uj}})+\lambda||\theta||^2lnP(θ>u)ln(P(>uθ)P(θ))=(u,i,j)Dσ(xuiˉxujˉ)+λθ2

计算:求导,使用梯度上升
在这里插入图片描述

1.1.1 构建样本对

  • 构建样本对:
    • 假设我们现在有 N 个视频,每个视频有两种用户行为:被用户点击,没有被用户点击。
    • 现在设定用户给物品的评分如下:
      • 正例:被用户点击过的视频得分 +1 ,
      • 负例:从没有被用户点击过的视频中进行采样得到一部分视频,这部分视频被认为是用户不喜欢的视频,得分 -1 。

1.1.2 假设

  • 假设
    假设用户对物品的评分背后的模型是某个常见模型,比如矩阵分解模型,也就是用户对物品的评分 R = U’ * V ,其中 U 是用户向量,而 V 是物品向量。算法假定所有得分 +1 的物品和所有得分 -1 的物品,如果用评分矩阵 R 重新对物品进行打分,原本得分 +1 的物品的新得分将高于原本得分 -1 的物品的新得分。

  • 诉求/流程
    本质诉求是在**可能的满足原有的 +1 物品得分高于 -1 物品得分的排序对成立的情况下,倒推出 R 评分分解后的 U 和 V 向量。**通过计算 U和 V 的乘积,得到用户对物品的完整评分矩阵,完成整个算法过程

1.2 实现/代码

class BPR(nn.Module):def __init__(self, user_num, item_num, factor_num):super(BPR, self).__init__()"""user_num: number of users;item_num: number of items;factor_num: number of predictive factors."""		self.embed_user = nn.Embedding(user_num, factor_num)self.embed_item = nn.Embedding(item_num, factor_num)nn.init.normal_(self.embed_user.weight, std=0.01)nn.init.normal_(self.embed_item.weight, std=0.01)def forward(self, user, item_i, item_j):user = self.embed_user(user)item_i = self.embed_item(item_i)item_j = self.embed_item(item_j)prediction_i = (user * item_i).sum(dim=-1)prediction_j = (user * item_j).sum(dim=-1)return prediction_i, prediction_jloss = - (prediction_i - prediction_j).sigmoid().log().sum()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481422.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

见证历史!数学家张益唐北大讲座:本质上已证明“零点猜想”,111页论文已公开...

来源&#xff1a;AI前线整理&#xff1a;凌敏有数论学者表示&#xff0c;张益唐有关朗道 - 西格尔零点猜想的论文结果意义重大&#xff0c;使得以前的很多结果从假设性结果变成了确定性结果。张益唐在北大作“零点猜想”学术报告11 月 8 日上午 9 点&#xff0c;数学家张益唐在…

【搜索排序】召回综述Semantic Models for the First-Stage Retrieval: A Comprehensive Review

Semantic Models for the First-Stage Retrieval: A Comprehensive Review 文章目录管道语义模型1.召回形式化1.0 Indexing MethodsThe inverted index倒排索引approximate nearest neighbor (ANN)1.1 classical term-based retrieval methods,VSM概率方法BIM二元独立模型语言模…

Science 封面 4 文连发:大脑分区不是功能关键!智慧从脑区间连接中诞生

来源&#xff1a;深度学术搜索是时候重新认识一下我们大脑的运行原理了&#xff01;最新一期顶刊Science&#xff0c;以特刊的形式连发 4 篇论文&#xff0c;剑指同一核心要点&#xff1a;大脑各种功能的关键&#xff0c;并不在于各脑区独立完成特定功能&#xff0c;而在于不同…

【信息检索导论1】布尔模型

1.Information Retrieval 定义&#xff1a; Information retrieval (IR) is finding material (usually documents) of an unstructured nature (usually text) that satisfies an information need from within large collections (usually stored on computers). web search…

一个基于 Transformer 的深度学习架构,在基因调控中组蛋白代码的定量破译方面性能超群...

编辑 | 萝卜皮通过组蛋白修饰对转录控制的定量表征受到许多计算研究的挑战&#xff0c;但其中大多数只关注启动子周围的狭窄和线性基因组区域&#xff0c;留下了改进的空间。韩国首尔大学的研究人员提出了 Chromoformer&#xff0c;这是一种基于 Transformer 的三维染色质构象感…

【搜索排序】预训练综述Pre-training Methods in Information Retrieval

文章目录相关性效率系统预训练word embeddingtransformers2. 召回阶段2.1 Sparse Retrieval Models2.2 Dense Retrieval Models。2.3 混合方式3.re-rank阶段4. 其他组件4.1 在query理解上4.2 在doc理解上&#xff1a;未来工作数据集数据集中排行榜信息检索中的花式预训练综述&a…

i-Refill | 张益唐:虽未实现大海捞针,但摸透了整个海底的情况

来源&#xff1a;IDG资本#i-Refill欢迎回到本周的i-Refill! 我们知道&#xff0c;黎曼猜想是当代数学领域内最重要的待解决问题之一&#xff0c;很多深入和重要的数学及物理结果都将在它成立的大前提下得到证明。10月中&#xff0c;我们围绕数学家张益唐承认已攻克黎曼猜想的弱…

【搜索排序】(ReRank)A Deep Look into Neural Ranking Models for Information Retrieval

文章目录数据集3. 同一框架4. 模型结构-对称与非对称对称结构&#xff1a;s,t可互换siamese networksSymmetric interaction networks,非对称结构query splitdocument splitJoint split,one-way attention mechanism基于表示的模型和基于交互的模型representation-focused arch…

2022全国市域治理与城市大脑峰会开放报名

来源&#xff1a;中国指挥与控制学会未来智能实验室的主要工作包括&#xff1a;建立AI智能系统智商评测体系&#xff0c;开展世界人工智能智商评测&#xff1b;开展互联网&#xff08;城市&#xff09;大脑研究计划&#xff0c;构建互联网&#xff08;城市&#xff09;大脑技术…

新的深度学习方法可能有助于预测大脑认知功能

编辑 | 萝卜皮人类大脑结构与认知功能的关系很复杂&#xff0c;而这种关系在儿童期和成年期之间有何不同却知之甚少。一个强有力的假设表明&#xff0c;流体智能&#xff08;Gf&#xff09;的认知功能依赖于前额叶皮层和顶叶皮层。在这项工作中&#xff0c;西北大学&#xff08…

哈佛大学教授详解:深度学习和经典统计学差异?

来源&#xff1a;机器学习研究组订阅深度学习和简单的统计学是一回事吗&#xff1f;很多人可能都有这个疑问&#xff0c;毕竟二者连术语都有很多相似的地方。在这篇文章中&#xff0c;理论计算机科学家、哈佛大学知名教授 Boaz Barak 详细比较了深度学习与经典统计学的差异&…

【CTR优化】威尔逊区间

实际&#xff1a;正态分布 采样得到的&#xff1a;不一样 p^\hat{p}p^​:wilson p: 区间相等原则:&#xff08;假设&#xff09; P1/P2都是P,是实际值 做CTR优化时 p^\hat{p}p^​为计算所得CTR点击率/曝光率 优化后的为w- 疑问&#xff1a;why取w-?因为默认P<p(P1<p) …

数字科技与数字经济的数字大脑模型

本文2022年10月发表于中国科学报社《科学新闻》杂志作者&#xff1a;刘锋21世纪是数字科技和数字经济爆发的时代。从2000年开始&#xff0c;社交网络、web2.0等数字科技不断涌现&#xff0c;由此诞生的谷歌、亚马逊、腾讯、阿里巴巴、京东等科技企业构成了日益壮大的数字经济&a…

【hadoop3.2.1】windows10 docker学习环境创建,windows和容器bridge模式下联网,测试例子

本地机器&#xff1a;windows10 虚拟机&#xff1a;centOS7.9 docker创建hadoop学习环境 1.创建docker镜像&#xff08;hadoop&#xff09; 下载centos镜像: docker pull centos 启动一个容器&#xff1a;docker run -td --name base -i centos bash 进入容器&#xff0c;安装…

工信部专家:中国传感器最大的问题是什么?怎么解决?(最新观点)

来源&#xff1a;中国传感器与应用技术大会、河南省智能传感器行业协会、中国电子报、传感器专家网&#xff08;本文仅做综合整理&#xff09;11月11日-13日&#xff0c;首届中国传感器与应用技术大会在深圳市光明区隆重举行。会上&#xff0c;工信部电子元器件行业发展研究中心…

皮亚杰:数学结构和逻辑结构

来源&#xff1a;人机与认知实验室计算是封闭的事实结构&#xff0c;算计是开放的价值组合&#xff0c;计算计是开放性封闭的事实价值混合体——编者按群的概念如果不从检验数学结构开始&#xff0c;就不可能对结构主义进行批判性的陈述。其所以如此&#xff0c;不仅因为有逻辑…

大模型狂欢背后:AI基础设施的“老化”与改造工程

来源&#xff1a;OneFlow社区作者&#xff1a;River Riddle、Eric Johnson、Abdul Dakak翻译&#xff1a;胡燕君、杨婷机器学习模型逐渐发展成人们口中的“庞然大物”。全球顶尖的科技公司纷纷踏上“军备竞赛”之路&#xff0c;立志训练出规模最大的模型&#xff08;MUM、OPT、…

DeepMind 最新发文:AlphaZero 的黑箱打开了

来源&#xff1a;AI科技评论作者&#xff1a;李梅编辑&#xff1a;陈彩娴AlphaZero 表明神经网络可以学到人类可理解的表征。国际象棋一直是 AI 的试验场。70 年前&#xff0c;艾伦图灵猜想可以制造一台能够自我学习并不断从自身经验中获得改进的下棋机器。上世纪出现的“深蓝”…

陶哲轩:张益唐新论文存在一些技术问题,我已请他澄清

来源&#xff1a;梦晨 羿阁 发自 凹非寺量子位 | 公众号 QbitAI张益唐的零点猜想证明&#xff0c;该由谁来检验&#xff1f;不少人把目光投向陶哲轩。最新消息&#xff0c;陶哲轩已经读过张益唐的论文并做出点评&#xff1a;目前论文的基本正确性尚未得到确认。存在一些印刷错误…

MIT提出封闭式连续时间神经网络,解决大脑动力学问题可产生灵活的机器学习模型...

编辑/绿萝去年&#xff0c;麻省理工学院&#xff08;MIT&#xff09;的研究人员开发出了「液体」神经网络&#xff0c;其灵感来自小型物种的大脑&#xff0c;不仅能在训练阶段学习&#xff0c;而且还能持续不断地适应。可用于自动驾驶和飞行、大脑和心脏监测、天气预报和股票定…