AI论文速读 | 2024[SIGIR]基于大语言模型的下一个兴趣点推荐

论文标题:Large Language Models for Next Point-of-Interest Recommendation

作者:Peibo Li ; Maarten de Rijke ; Hao Xue (薛昊); Shuang Ao ; Yang Song ; Flora D. Salim

机构:新南威尔士大学(UNSW),阿姆斯特丹大学(UVA)

论文链接https://arxiv.org/abs/2404.17591

Cool Paperhttps://papers.cool/arxiv/2404.17591

代码https://github.com/neolifer/LLM4POI

TL, DR:本文通过利用预训练的大语言模型处理位置基社交网络数据,提出了一种新的方法来提高下一个兴趣点推荐的性能,同时通过轨迹提示和关键查询对相似性来缓解冷启动问题。

关键词:位置基社交网络(LBSN)、POI推荐、大语言模型(Large Language Models, LLMs)

Total 10 Pages(2 Methodology+3.5 Experiment)


🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘!🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

摘要

下一个兴趣点 (POI) 推荐任务是根据用户的历史数据来预测用户的下一次 POI 访问。基于位置的社交网络(LBSN)数据通常用于下一个 POI 推荐任务,但也面临着挑战。一项经常被忽视的挑战是如何有效地利用 LBSN 数据中存在的丰富上下文信息。以前的方法受到数值性质的限制,无法解决这一挑战。本文提出了一个使用预训练大语言模型(LLM)来应对这一挑战的框架。该框架允许我们以原始格式保存异构 LBSN 数据,从而避免上下文信息的丢失。此外,由于包含常识知识,该框架能够理解上下文信息的内在含义。在实验中,在三个真实的 LBSN 数据集上测试框架。结果表明,所提出的框架在所有三个数据集中都优于最先进的模型。分析证明了所提出的框架在使用上下文信息以及缓解常见的冷启动和短轨迹问题方面的有效性。

Q: 这篇论文试图解决什么问题?

2种POI推荐范式

A: 这篇论文试图解决的问题是如何有效地利用位置基社交网络(Location-based Social Network, LBSN)数据中的丰富上下文信息来提高下一个兴趣点(Point-of-Interest, POI)推荐任务的性能。具体来说,论文提出了以下几个关键挑战:

  1. 上下文信息的提取:如何从原始数据中提取上下文信息,如时间、POI类别和地理坐标。
  2. 上下文信息与常识知识的连接:如何将上下文信息与常识知识相结合,以有效地促进下一个POI推荐。

传统的基于数值的方法在处理上下文信息时存在两个主要限制:

  • 它们需要将异构的LBSN数据转换为数字,这可能导致上下文信息的固有含义丢失。
  • 它们仅依赖于统计和人为设计来理解上下文信息,缺乏对上下文信息提供的语义概念的理解。

为了解决这些挑战,论文提出了一个框架,使用预训练的大语言模型(Large Language Models, LLMs)来处理LBSN数据。该框架允许在原始格式下保留异构的LBSN数据,从而避免上下文信息的丢失,并且能够通过包含常识知识来理解上下文信息的内在含义。

论文的主要贡献包括

  1. 提出了一个使用预训练大语言模型的框架,用于下一个POI推荐任务,这是首次在标准尺寸的数据集上微调语言模型以利用常识知识。
  2. 提出了基于提示(prompt-based)的轨迹相似性概念,用于结合历史轨迹和不同用户的轨迹信息,以缓解冷启动问题,并提高对各种长度轨迹的预测准确性。
  3. 在三个真实世界的LBSN数据集上进行了广泛的实验评估,证明了所提出的下一个POI推荐模型在所有三个数据集上都显著优于现有的最先进模型。

ChatGPT真实世界数据总结的POI分类

Q: 有哪些相关研究?

A: 论文中提到的相关研究主要分为以下几个领域:

  1. 下一个POI推荐(Next POI Recommendation)
    • 早期工作通常将下一个POI推荐视为序列推荐任务,使用了FPMC、Markov链和softmax函数等方法。
    • 随着深度学习的发展,开始应用基于RNN的模型,如HST-LSTM、LSTPM、PLSPL、STAN和CFPRec等,这些模型能够捕捉复杂的序列模式。
  2. 基于图的模型(Graph-based models)
    • 用于解决序列模型的局限性,如STP-UDGAT、HMT-GRN、DRGN、GETNEXT和STHGCN等,这些模型通过全局视角和图注意力网络来捕捉用户和POI之间的复杂关系。
  3. 大语言模型(Large Language Models, LLMs)在时间序列数据(Time-series Data)中的应用
    • SHIFT和AuxMobLCast等研究将人类移动性预测视为语言翻译问题,使用序列到序列的语言模型。
    • LLM4TS采用了两阶段微调方法,首先对LLM进行监督微调以适应时间序列数据,然后进行特定任务的微调。
  4. 大语言模型在推荐系统(Recommender Systems)中的应用
    • 近期的研究工作采用了LLMs,如通过设计多个提示模板来从不同角度处理新闻数据,并使用BERT进行提示学习。
    • 其他方法包括直接微调LLMs进行提示完成,或者将LLMs的嵌入与现有序列模型结合,以增强模型的性能。

这些研究为本文提出的使用预训练的大语言模型来处理下一个POI推荐任务提供了理论和技术基础。论文中提到的相关工作还包括了如何通过提示工程(prompt engineering)和微调技术来利用LLMs,以及如何将这些技术应用于推荐系统和时间序列预测任务。

Q: 论文如何解决这个问题?

LLM4POI

提示和签到记录的结构

红色表示当前轨迹块。紫色表示历史轨迹块。橙色表示指令块。蓝色表示目标块。

A: 论文提出了一个基于大语言模型(LLMs)的框架来解决下一个兴趣点(POI)推荐任务中的挑战,具体方法如下:

  1. 轨迹提示(Trajectory Prompting)
    • 将用户的检查点数据序列转换为自然语言问答格式,以便LLMs能够遵循提示中的指令并生成POI推荐。
    • 通过设计不同的句子块来构建提示,包括当前轨迹块、历史轨迹块、指令块和目标块。
  2. 关键查询对相似性(Key-Query Pair Similarity)
    • 提出一种计算框架,用于计算自然语言格式中轨迹的相似性,以便从历史轨迹和其他用户的轨迹中捕获用户行为模式。
    • 通过计算关键提示(当前轨迹,不包括最后一个条目)和所有查询提示(代表早于关键提示开始时间的轨迹)之间的相似性,选择与关键提示相似性高的查询提示。
  3. 监督微调(Supervised Fine-tuning)
    • 采用参数高效的微调技术,包括低秩适应(LoRA)、量化技术和FlashAttention,以减少训练成本和提高模型的效率。
  4. 实验评估
    • 在三个真实世界的LBSN数据集上进行广泛的实验评估,证明了所提出的模型在所有数据集上都显著优于现有的最先进模型。
  5. 分析
    • 对模型进行了深入分析,包括用户冷启动分析、轨迹长度分析、历史数据变体数量分析、未见数据泛化分析和上下文信息分析,以展示模型在处理冷启动问题、不同长度轨迹、利用历史数据和上下文信息方面的有效性。

通过这些方法,论文提出的框架能够有效地利用LBSN数据中的上下文信息,并缓解冷启动和短轨迹问题,同时提高下一个POI推荐任务的性能。

key和query prompt形成和配对

key和query的相似度计算

Q: 论文做了哪些实验?

数据集POI分类统计

实验结果

冷启动

轨迹长度分析

A: 论文中进行了多项实验来评估提出的基于大语言模型(LLMs)的下一个兴趣点(POI)推荐框架的性能。具体的实验包括:

  1. 数据集选择
    • 实验使用了三个公开的数据集:Foursquare-NYC、Foursquare-TKY和Gowala-CA。
  2. 基线模型比较
    • 与多个现有的推荐模型进行比较,包括FPMC、LSTM、PRME、STGCN、PLSPL、STAN、GETNext和STHGCN。
  3. 模型变体评估
    • 评估了三种不同的模型变体,包括仅使用当前轨迹块的LLAMA2-7b、加上历史轨迹块但不考虑关键查询相似性的LLAMA2-7b*,以及结合历史轨迹块和关键查询相似性的LLAMA2-7b**。
  4. 评估指标
    • 使用Accuracy@1作为主要的评估指标,即预测的准确性在推荐列表的第一位。
  5. 实验设置
    • 描述了实验的具体设置,包括数据预处理、训练集、验证集和测试集的划分,以及模型训练的超参数设置。
  6. 主要结果
    • 展示了在三个数据集上的实验结果,显示提出的模型在所有数据集上都显著优于基线模型。
  7. 用户冷启动分析
    • 分析了模型对冷启动问题的处理能力,通过将用户分为活跃、正常和非活跃三组,比较了模型在不同用户群体上的性能。
  8. 轨迹长度分析
    • 探讨了轨迹长度对模型性能的影响,将轨迹分为长、中、短三类,并分析了模型在不同长度轨迹上的表现。
  9. 历史数据变体数量分析
    • 研究了在提示中使用不同数量的历史检查记录对模型性能的影响。
  10. 未见数据泛化分析
    • 评估了模型在未见过的数据集上的泛化能力,即在某个数据集上训练并在其他数据集上评估。
  11. 上下文信息分析
    • 分析了上下文信息在模型中的作用,通过在提示中移除POI类别名称的上下文信息来评估其对模型性能的影响。
  12. 不同组件效果分析
    • 通过去除历史轨迹块、关键查询相似性或上下文信息,来评估这些组件对模型性能的贡献。

这些实验全面评估了提出的框架在不同方面的表现,并与现有的推荐模型进行了深入的比较。通过这些实验,论文证明了其方法在处理冷启动问题、不同长度的轨迹、利用上下文信息以及泛化到未见数据方面的优势。

零样本(1个数据集训练,剩下数据集测试)

少样本

(探索泛化能力)POI ID在测试集提示的比例和测试集提示答案在提问中

不同提示

消融实验

Q: 总结一下论文的主要内容

A: 这篇论文的主要内容概括如下:

  1. 问题定义:论文旨在解决如何利用位置基社交网络(LBSN)数据中的丰富上下文信息来提高下一个兴趣点(POI)推荐任务的性能。
  2. 挑战:现有的POI推荐方法在处理上下文信息时存在局限性,包括信息的数值化转换导致语义丢失,以及缺乏对上下文信息语义概念的理解。
  3. 方法:提出了一个基于预训练大语言模型(LLMs)的框架,通过轨迹提示(Trajectory Prompting)将POI推荐任务转化为问答任务,同时利用关键查询对相似性(Key-Query Pair Similarity)来缓解冷启动问题。
  4. 实验:在三个真实世界的LBSN数据集上进行实验,与多个基线模型相比,提出的框架在所有数据集上均显著提高了推荐性能。
  5. 分析:通过用户冷启动分析、轨迹长度分析、历史数据变体数量分析、未见数据泛化分析和上下文信息分析,展示了模型在处理不同用户行为和数据特性方面的有效性。
  6. 贡献:主要贡献包括提出了一个新的框架,利用预训练的LLMs来推荐下一个POI,以及一种新的基于提示的轨迹相似性方法。
  7. 未来工作:论文提出了未来工作的方向,包括效率优化、提示设计改进、链式思考推理、多步未来偏好推断、上下文信息的深入利用等。
    型在处理不同用户行为和数据特性方面的有效性。
  8. 贡献:主要贡献包括提出了一个新的框架,利用预训练的LLMs来推荐下一个POI,以及一种新的基于提示的轨迹相似性方法。
  9. 未来工作:论文提出了未来工作的方向,包括效率优化、提示设计改进、链式思考推理、多步未来偏好推断、上下文信息的深入利用等。
  10. 结论:论文证明了利用LLMs进行下一个POI推荐任务的潜力,并展示了模型在未见数据上的泛化能力,同时指出了当前方法的局限性和未来改进的可能方向。

🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘!🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/27406.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

springboot三层架构与MVC,以及三层架构入门

三层架构与MVC 1. 三层架构是什么 把各个功能模块划分为表示层,业务逻辑层,和数据访问层三层架构,各层之间采用接口相互访问,并通过对象模型的实体类(model)作为数据传递的载体,不同的对象模型…

深入理解计算机系统 家庭作业6.22

每条磁道存 位 有r-xr条磁道 二者相乘就是我们要求的容量) 所以最大值x0.5

计算机网络 —— 运输层(运输层概述)

计算机网络 —— 运输层(运输层概述) 运输层运输层端口号复用分用复用(Multiplexing)分用(Demultiplexing) 常用端口号页面响应流程 我们今天进入到运输层的学习: 运输层 我们之前学习的物理层…

最新大屏幕互动系统PHP源码 附动态背景图和配乐素材

本文来自:最新大屏幕互动系统PHP源码 附动态背景图和配乐素材 含搭建教程 - 源码1688 应用介绍 简介: 最新大屏幕互动系统PHP源码 附动态背景图和配乐素材 含搭建教程 测试环境:NginxPHP7.0MySQL5.6 前端图片: 后台图片&#x…

【算法专题--链表】相交链表--高频面试题(图文详解,小白一看就会!!)

目录 一、前言 二、题目描述 三、解题方法 ⭐双指针 --- 数学思维 ⭐双指针 --- 按链表长度计算 🥝 判断相交 🍇 求出交点 🍍实现步骤 四、总结与提炼 五、共勉 一、前言 相交链表这道题,可以说是--链表专题--&#xf…

OpenAI半年收入达34亿美元:年化收入翻倍,CTO却揭露:ChatGPT与免费模型差距不大

根据硅谷知名付费科技媒体The Information的独家报道,自12月以来,OpenAI的年化收入翻了一番,达到34亿美元,其中大部分收入来自订阅和API访问(32亿美元)。 没体验过OpenAI最新版GPT-4o?快戳最详细…

【日常记录】【node】从零开发一个node命令行工具

1、命令行工具 命令行工具(Cmmand Line Interface)简称cli,顾名思义就是在命令行终端中使用的工具。我们常用的 git 、npm、vim 等都是 cli 工具,比如我们可以通过 git clone 等命令简单把远程代码复制到本地。 再比如&#xff1a…

Apache druid未授权命令执行漏洞复现

简介 Apache Druid是一个实时分析型数据库,旨在对大型数据集进行快速的查询分析("OLAP"查询)。Druid最常被当做数据库来用以支持实时摄取、高性能查询和高稳定运行的应用场景,同时,Druid也通常被用来助力分析型应用的图…

5款好用的轻量云服务器(618超便宜轻量云)

轻量云服务器是一种面向入门级用户和小型业务的云服务器产品,它们通常价格更实惠,管理起来也相对简单,以下是五款好用的轻量云服务器产品: 1.阿里云 优势:阿里云是国内最大的云服务提供商之一,拥有丰富的配…

BT音频方案

一、缩写 缩写 全程 释义 I2S I2S 音频传输接口总线 PCM Pulse-Code Modulation 基础音频数据或翻译为音频接口总线 HFP Handsfree 蓝牙通话协议 A2DP Advanced Audio Distribution Profile 蓝牙媒体音频协议 二、音频流转策略 蓝牙音频功能分为通话声音和媒体…

电脑数字键被锁住不能输入数字

情况: 反复点击数字键盘的NumLock,看它的灯是否能正常启动 1.如果NumLock灯可以正常的打开和关闭,并且无法输入内容 1.1打开控制面板 1.2 进入轻松使用中选择更改键盘的工作方式 1.3找到并点击设置鼠标键 1.4 赵到NumLock设置为关闭,然后确定即可

线性规划问题——单纯形算法

第一步:化“约束标准型” 在每个等式约束中至少有一个变量的系数为正,且这个变量只在该约束中出现。在每个约束方程中选择一个这样的变量称为基本变量。 剩下变量称为非基本变量。 一个简单的栗子 上图是一个约束标准型线性规划的例子。 等式1&#x…

理解查准率P、查全率R及Fβ度量怎么得来的

如果得到的是一组样本在两个算法上的一次预测结果,其中每个样本都被赋予了一个为正样本的概率(例如,通过逻辑回归或朴素贝叶斯分类器得到的概率估计),那么可以通过改变不同的阈值点来利用这些预测结果画出PR曲线。 如果…

blender

通用设置: 仅显示/取消隐藏:数字键盘/移动视角:shift+鼠标中键Blender如何给场景添加参考图片-百度经验 (baidu.com)进入编辑模式:Tab编辑模式:点-线-面 反选:ctrl+按键重新计算面朝向:shift+n水密:+修改器:焊接连选的区别: 视窗设置 两个视图 …

Pytorch环境配置的方法

Pytorch虚拟环境配置全流程 以安装pytorch1.9.1为例 1. 创建虚拟环境 安装Anaconda3,打开 PowerShell 创建虚拟环境并进入: conda create -n torch1.9.1 python3.8 conda activate torch1.9.1 conda create -n torch1.9.1 python3.8 conda activate to…

错题记录(小测)

单选 错题1 错题2 错题3 代码题 反转链表 链表的回文结构

【LeetCode】4,寻找两个正序数组中的中位数

题目地址 B站那个官方解答视频实在看不懂,我就根据他那个代码和自己的理解写一篇文章 1. 基本思路 在只有一个有序数组的时候,中位数把数组分割成两个部分。中位数的定义:中位数,又称中点数,中值。中位数是按顺序排列…

消息队列的应用场景有哪些

通常来说,使用消息队列主要能为我们的系统带来下面三点好处: 异步处理 削峰/限流 降低系统耦合性 除了这三点之外,消息队列还有其他的一些应用场景,例如实现分布式事务、顺序保证和数据流处理。 异步处理 通过异步处理提高系…

计算机网络:网络层 - IPv4数据报 ICMP协议

计算机网络:网络层 - IPv4数据报 & ICMP协议 IPv4数据报[版本 : 首部长度 : 区分服务 : 总长度][标识 : 标志 : 片偏移][生存时间 : 协议 : 首部检验和][可变部分 : 填充字段] ICMP协议 IPv4数据报 一个IPv4数据报,由首部和数据两部分组成&#xff…

Python 越来越火爆

Python 越来越火爆 Python 在诞生之初,因为其功能不好,运转功率低,不支持多核,根本没有并发性可言,在计算功能不那么好的年代,一直没有火爆起来,甚至很多人根本不知道有这门语言。 随着时代的…