港大推出XRec:「会说话」的推荐系统大模型, 从黑盒预测到可解释

在这里插入图片描述

代码链接: https://github.com/HKUDS/XRec

论文链接: https://arxiv.org/pdf/2406.02377

实验室链接: https://sites.google.com/view/chaoh

最近,香港大学数据智能实验室推出了一款名为 XRec 的全新智能大模型,旨在为传统推荐系统注入可解释性的新动力。XRec 利用大语言模型(LLM)的强大自然语言处理能力,为推荐系统赋予了可解释性,让系统不仅能给出精准的推荐结果,还能用通俗易懂的语言向用户阐述其推荐依据。

通过这种融合语义理解与结构建模的方式,XRec为推荐系统注入了前所未有的智能化。不仅能够生成个性化、贴合用户需求的推荐结果,还能为用户提供富有洞见的背景解释,让他们真正理解推荐的逻辑。这种创新性的范式无疑为未来的个性化服务发展带来了全新的可能。

导读

传统推荐系统虽然能给出准确的推荐结果,但缺乏对推荐过程的透明解释,难以让系统更好地理解其兴趣偏好是如何被捕捉和建模的。XRec 旨在突破这一局限,通过整合大语言模型的语义理解能力和协同过滤的用户偏好建模,构建一种"可解释推荐"框架,使推荐系统具备深入洞察用户需求、生成清晰解释的智能化水平。

这种融合自然语言处理和推荐系统的创新尝试,不仅能大幅提升用户体验,增强他们对推荐结果的理解和信任,也将为推荐技术的发展注入新的动力。通过人机协作,XRec能为用户提供更优质的智能服务,为推荐系统的未来发展开辟新的可能性。

总的来说,XRec的提出标志着推荐系统正朝着更加智能化和可解释的方向迈进。这一创新成果不仅能满足用户对推荐系统更高的期望,也将为整个推荐技术领域的发展带来新的启示和动力,为推荐系统的未来发展指明新的方向。

模型方法

在这里插入图片描述

XRec通过巧妙地融合强大的大型语言模型(LLMs),为推荐系统的输出注入了丰富多彩的自然语言解释。该框架巧妙地整合了协作信号,并采用轻量级的推荐信号适配器,能够深入洞悉用户复杂多变的偏好模式,以及他们与各类物品间错综复杂的交互细节。值得一提的是,XRec在面临零样本场景时也展现出了出色的泛化能力,能够为前所未见的用户和物品生成富有见地且富有意义的推荐解释。

协同行为关系建模

XRec巧妙地融合了图神经网络(GNNs)技术,以强大的表征学习能力弥补了自然语言在捕捉用户-商品协作关系方面的不足。在我们的系统中,GNN作为一种"协作信号的tokenizer",将复杂的用户-商品交互模式高效地编码到潜在的嵌入空间中,从而实现了对用户复杂偏好的有效建模。具体来说,基于图神经网络的消息传递机制,我们的协作图tokenizer在用户-商品交互图上进行信息的传播和聚合,促进了用户和商品节点表征的学习。这不仅能够更好地捕捉节点之间的关联,还能够反映出交互过程中蕴含的复杂模式。

行为与文本语义空间的对齐

表征空间对齐的映射器
XRec的创新之一在于,它配备了一个轻量级但大有作为的适配器模块,用于协调融合不同语义模态间的差异。我们注意到,用户-商品的交互行为所反映的协同信息,其潜在语义表达空间可能与基于文本的用户/商品语义存在一定差异。为此,这个适配器模块的作用就是对这些不同的语义模态进行精准对齐,使我们的模型能够高效地整合利用协同信号和文本语义,从而提升整体的建模性能。

向大语言模型(LLM)注入行为信号
XRec的另一大创新点在于,它能够巧妙地融合协同过滤(CF)技术和大语言模型(LLM)的优势。在完成前述的语义模态对齐后,我们的系统已做好将丰富的协同信号融入LLM的准备工作。具体来说,我们会在输入提示中预留特殊标记(tokens),然后将提示转换为token嵌入,最后将已适配的协同信息嵌入注入到这些保留位置中。

在这里插入图片描述

XRec的另一个创新之处,在于它采用了一种独特的机制来避免协同信息在融合过程中的损失。我们注意到,随着输入提示长度的增加,分配给每个嵌入token的注意力权重(attention weight)不可避免地会有所减弱,这可能导致本就稀疏的协同信号被稀释。

为了解决这一问题,我们将适配后的协同嵌入不仅注入到LLM的初始输入提示中,还扩展到LLM每一个隐藏层的保留位置。具体来说,我们对LLM内部的query、key和value投影函数进行了专门的修改,以更好地促进这一融合过程。

f q , k , v ( x i ) + = W q , k , v ⋅ a i f_{q,k,v}(x_i) \ += W_{q,k,v} · a_i fq,k,v(xi) +=Wq,k,vai

具体来说,我们不仅在LLM的输入阶段注入适配后的协同嵌入 a i a_i ai,还将其扩展到整个网络的各个隐藏层中。我们运用了LLM内部的查询(query)、键(key)和值(value)投影矩阵 W q , k , v W_{q,k,v} Wq,k,v,确保模型能够在整个计算过程中持续访问和整合这些丰富的协同信息。这不仅保持了协同上下文的强大表征,还使得梯度在回传到专家混合(MoE)模块时更为有效。这种融合设计,充分发挥了LLMs在深层语义理解方面的优势,同时又能充分吸收GNN在捕捉结构模式方面的专长。

模型优化

在XRec的模型优化部分,我们着重于提升大型语言模型(LLMs)在生成语境和句法连贯解释方面的能力。我们的核心目标,是最小化预测下一个token的概率与实际下一个token之间的差距。

为此,我们采用了负对数似然(Negative Log Likelihood, NLL)作为训练损失函数。具体公式如下:

L = − 1 N ∑ i = 1 N ∑ c = 1 C i y i c ⋅ log ⁡ ( y ^ i c ) L = -\frac{1}{N} \sum_{i=1}^N \sum_{c=1}^{Ci} y_{ic} \cdot \log(ŷ_ic) L=N1i=1Nc=1Ciyiclog(y^ic)

其中, N N N 表示每个样本所需生成的解释数量, C i C_i Ci 代表每个解释中的字符数。 y i c y_{ic} yic y ^ i c ŷ_{ic} y^ic 分别代表实际和预测的token。

这种加权形式的损失函数,能够确保模型在优化预测准确性的同时,也能够关注生成解释的整体连贯性。通过按字符数进行归一化,我们确保了各个解释在损失计算中获得公平的权重,从而推动模型学习生成更加流畅自然的解释文本。

为了降低训练复杂度,我们选择冻结了LLMs内部的所有参数,仅在基于专家混合(Mixture of Experts, MoE)的适配器模型中进行参数更新。这种策略确保了模型能够充分利用LLMs庞大的知识储备,同时又能够灵活地针对特定任务进行优化和精细调整。

解释文本的优化

基于大型语言模型(LLM)的创新解决方案,XRec能够从原始用户评论中提取出更加明确清晰的用户意图和需求特征,大幅提升基准解释的质量和可解释性。与简单使用原始评论文本相比,这种基于LLM的分析方法能够洞悉隐藏在表面字面之下的语义内涵,更加深入地捕捉用户的潜在偏好。

在这里插入图片描述

模型验证

XRec模型在多个公开数据集上的验证实验取得了出色表现。我们利用GPTScore、BERTScore等可解释性指标对模型进行评估,结果显示XRec在可解释性和稳定性方面均明显优于基准模型(Att2Seq、NRT、PETER和PEPLER)。

在这里插入图片描述

模型鲁棒性的探索

为了更全面地检验模型的泛化能力,我们在不同数据稀疏性的场景下进行了实验。将测试集划分为五个子集(tst1至tst5),涵盖了从罕见到频繁不等的用户群体。结果表明,XRec不仅在常规用户群体中表现卓越,在零样本场景下(仅包含训练期间未遇到的新用户)也优于基准模型,与其他子集的性能基本持平。这种在冷启动场景下的出色表现,体现了XRec强大的泛化能力,对于新用户的推荐应用具有重要价值。

总的来说,XRec在可解释性、稳定性以及对新旧用户的适应性等方面的优异表现,充分证明了该模型在实际应用中的广泛适用性。无论是用户行为还是项目目录发生变化的动态环境,XRec都能够保持高水平的性能,为推荐系统的智能化升级提供可靠的技术支撑。

在这里插入图片描述

模型消融实验

为了深入探究模型关键组件的影响,我们进行了一系列消融实验。具体来说,我们比较了包含所有特性的完整模型(Ours)与三种变体:

  1. 无Profile(Ours w/o profile): 省略了用户和项目属性
  2. 无协同信号注入(Ours w/o injection): 保留对齐嵌入在提示中,但未将其注入到LLM层
  3. 无属性&协同信号注入(Ours w/o profile & injection): 同时缺少属性和基于协同信号嵌入的注入

我们在Amazon-books和Google-reviews两个数据集上,使用GPTScore和BERTScore这两个可解释性指标对这些变体进行了严格的评估,并比较了它们的标准差。

结果显示,我们的完整模型(Ours)在可解释性和稳定性方面均优于其他变体。这突出了每个组件在推动模型性能和能力方面的关键作用。用户/项目属性以及协同信息的注入,都为模型的出色表现做出了重要贡献。

在这里插入图片描述

结语

本研究提出了一种全新的XRec框架,它实现了基于图的协同过滤方法与大语言模型(LLM)技术的有机融合。这种创新设计使得XRec能够为推荐输出生成全面而见解深刻的解释说明。

通过利用用户-商品交互图中蕴含的内在协同关系,XRec有效捕捉到了构成用户偏好和项目关联的高阶依赖性。关键在于,XRec配备了专门的协同信息适配器模块,作为协同信号(collaborative signal)与LLM语义空间之间的关键连接纽带。

广泛的实验结果充分证明了XRec框架的显著优势。它不仅提升了推荐过程的可解释性,而且在具有挑战性的零样本场景中展现出了出色的泛化能力和鲁棒性。这意味着XRec能够更好地满足用户个性化需求,为下一代智能推荐系统开辟新的可能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/38747.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PyTorch入门笔记

学习参考: PyTorch简单入门视频 深入浅出PyTorch 小土堆笔记 前置知识 AI vs ML vs DL AI(Artificial Intelligence):通过让机器模仿人类进而超越人类ML(Machine Learning):让机器模仿人类的一…

【C++】const详解

📢博客主页:https://blog.csdn.net/2301_779549673 📢欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正! 📢本文作为 JohnKi ,引用了部分大佬的案例 📢未来很长,…

Edge浏览器选中后,出现AI智能生成 AI专业写作

这个是扩展里边的“ 网页万能复制 & ChatGPT AI写作助手”造成的,这个拓展增加了AI写作功能。关闭这个拓展就解决了。

入门Axure:快速掌握原型设计技能

2002 年,维克托和马丁在旧金山湾区的一家初创公司工作,发现自己一再被软件开发生命周期的限制所困扰,而且产品团队在编写规范之前很难评估他们的解决方案,开发人员经常不理解(或不阅读)给出的规范&#xff…

【linux学习---1】点亮一个LED---驱动一个GPIO

文章目录 1、原理图找对应引脚2、IO复用3、IO配置4、GPIO配置5、GPIO时钟使能6、总结 1、原理图找对应引脚 从上图 可以看出, 蜂鸣器 接到了 BEEP 上, BEEP 就是 GPIO5_IO05 2、IO复用 查找IMX6UL参考手册 和 STM32一样,如果某个 IO 要作为…

14-16 AI Agent:您无法忽视的盈利未来

忘掉关于机器人接管我们工作的争论吧。一场更加微妙、可能更有利可图的革命正在酝酿之中——智能代理的崛起,而智能代理的光芒常常被其更简单的“表亲”虚拟助理所掩盖。 虽然 Siri 和 Alexa 可以处理基本任务和基本对话,但人工智能代理则完全不同。想象…

HTML5的多线程技术:Web Worker API

Web Workers API 是HTML5的一项技术,它允许在浏览器后台独立于主线程运行脚本,即允许进行多线程处理。这对于执行密集型计算任务特别有用,因为它可以防止这些任务阻塞用户界面,从而保持网页的响应性和交互性。Web Workers在自己的…

中国动物志(140卷)

中国动物志,共140卷,包括昆虫纲、鸟纲、兽纲、无脊椎动物、硬骨鱼纲等多类,是反映我国动物分类区系研究工作成果的系列专著,是研究物种多样性、探讨物种演化和系统发育的重要参考,是动物资源开发利用、有害物种控制、濒…

昇思25天学习打卡营第12天|linchenfengxue

DCGAN生成漫画头像 通过示例代码说明DCGAN网络如何设置网络、优化器、如何计算损失函数以及如何初始化模型权重。 GAN基础原理 生成式对抗网络(Generative Adversarial Networks,GAN)是一种生成式机器学习模型,是近年来复杂分布上无监督学习最具前景的…

什么是Web3D交互展示?有什么优势?

在智能互联网蓬勃发展的时代,传统的图片、文字及视频等展示手段因缺乏互动性,正逐渐在吸引用户注意力和提升宣传效果上显得力不从心。而Web3D交互展示技术的横空出世,则为众多品牌与企业开启了一扇全新的展示之门,让线上产品体验从…

【C语言】extern 关键字

在C语言中,extern关键字用于声明一个变量或函数是定义在另一个文件中的。它使得在多个文件之间共享变量或函数成为可能。extern关键字常见于大型项目中,通常用于声明全局变量或函数,这些变量或函数的定义位于其他文件中。 基本用法 变量声明…

Python基础入门知识

目录 引言 简要介绍Python语言 为什么要学习Python Python的应用领域 Python安装和环境配置 Python的下载和安装(Windows, macOS, Linux) 配置Python环境变量 安装和使用IDE(如PyCharm, VS Code) Python基本语法 注释 变量和数据类型(数字,字符串,列表,元组,字典,…

P3374 【模板】树状数组 1

题目描述 如题,已知一个数列,你需要进行下面两种操作: 将某一个数加上 𝑥x 求出某区间每一个数的和 输入格式 第一行包含两个正整数 𝑛,𝑚n,m,分别表示该数列数字的个数和操作的总个数。 …

<sa8650>sa8650 qcxserver-之-摄像头传感器VB56G4A驱动开发<1>

<sa8650>sa8650 qcxserver-之-摄像头传感器VB56G4A驱动开发 <1> 一、前言二、QCX架构三、QCX 传感器驱动程序定制开发3.1 sensor硬件接口3.2 sensor配置文件3.2.1 cameraconfig.c3.2.2 cameraconfigsa8650_water.c3.2.3 新增编译MK3.2.4 参数解析3.2.4.1 struct Camera…

干式电抗器的工作原理是什么

干式电抗器是电力系统中常用的无功补偿设备&#xff0c;主要用于调节电网的电压、提高功率因数、限制短路电流等。它的工作原理主要是通过在电路中引入一个与负载电流相反的磁场&#xff0c;从而产生一个与负载电流相抵消的电抗力&#xff0c;达到调节电压和功率因数的目的。 干…

常微分方程算法之编程示例十-两点狄利克雷边值问题(理查德森外推法)

目录 一、研究问题 二、C++代码 三、计算结果 一、研究问题 本节我们采用理查德森法对示例八中的两点狄利克雷边值问题进行外推求解,相应的原理及推导思路请参考: 常微分方程算法之高精度算法(Richardson法+紧差分法)_richardson外推法-CSDN博客https://blog.csdn.net/…

20_系统测试与维护

目录 测试基础知识 测试原则 动态测试 静态测试 测试策略 测试阶段 测试用例设计 黑盒测试用例设计 白盒测试用例设计 McCabe度量法 鲁棒性测试 缺陷探测率(Defect Detection Percentage,DDP) 调试 系统维护基础 系统转换 系统维护指标 软件容错技术 嵌入式安…

【AI 大模型训练数据白皮书 2024】

文末有福利&#xff01; 自《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》发布以来&#xff0c;我国数据要素建设不断深入&#xff0c;在国家数据局等 17 部门联合印发的《“数据要素 ” 三年行动计划&#xff08;2024 - 2026 年&#xff09;》进一步明确…

z-index的工作原理

z-index的工作原理 HTML文档中的元素却是存在于三个维度之中。除了大家熟知的平面画布中的x轴和y轴&#xff0c;还有控制第三维度的z轴。 像 margin , float , offset 这些属性&#xff0c;控制着元素在x轴和y轴上的表现形式一样。 z-index 这个属性控制着元素在z轴上的表现形…

不使用AMap.DistrictSearch,通过poi数据绘制省市县区块

个人申请高德地图key时无法使用AMap.DistrictSearch&#xff0c;可以通过poi数据绘制省市县区块 1.进入POI数据网站找到需要的省市县&#xff0c;下载对应的GeoJson文件 &#xff0c;此处为poi数据网站链接 2.​ 处理geoJson数据&#xff0c;可以直接新建json文件&#xff0c;…