科研学习|论文解读——基于旅游知识图谱的游客偏好挖掘和决策支持(IPM,2023)

原文题目

Mining tourist preferences and decision support via

tourism-oriented knowledge graph

摘要

目前,旅游管理研究的重点是通过对异构用户生成的内容进行广泛分析,来理解旅游偏好的波动,制定有针对性的发展策略。然而,鉴于在线景点评论涉及过多的混合和无形维度,广泛使用的无监督文本挖掘可能是不完整的或不准确的。此外,现有文献通常局限于几个旅游目的地和起源地的某些类型的景点,很难保证具有全面的洞察力。为了克服这些局限性,本研究提出了一种新的知识图谱驱动框架,该框架涉及旅游知识图谱(TKG)的系统构建和深入的研究与推理。遵循领域知识本体,从多源文本语料库中提取出11296716个多方面知识的结构化三联模型,提高了43.64%~50.65%的准确率,从中国340个旅游地中抽取了11174034名游客和20481个景点。利用TKG可以建立一个综合的决策支持系统,它分为符号查询和分布式推理两种不同的知识应用模式。在TKG上通过SPARQL查询实现多重时空分析,可以逐步发现旅游偏好、因果解释的分布规律及其对旅游地发展的影响。通过TKG注入丰富的上下文知识来细化对象的分布表示,可以显著增强下游推理任务,如旅游需求预测和旅游竞争情报。

一、引言

对旅游偏好的清晰把握一直是旅游研究者和实践者关注的焦点。洞察游客的行为偏好有助于旅游营销组织完善现有景点,规划新景点,并提出有效的营销策略。旅游从业者可以进一步识别游客选择行为的潜在决定因素,并及时预测对景点的需求,或细分旅游市场,定制与旅游者特征相符的个性化套餐。然而,全面了解游客对景点的偏好一直是一个挑战,因为景点属于体验产品,具有有形、认知和情感特征维度的复杂多变的耦合。

分析旅游偏好和制定有针对性的策略通常利用人工调查的离散选择实验,如问卷或访谈。该方法适用于测量特定旅游场景的反馈或预测一个新产品的支付意愿,并测试潜在因素的假设。然而,在进行调查时,无可避免地存在抽样偏差和时间限制的挑战,这可能会限制研究范围和结果的概化性。幸运的是,随着信息和通信技术的快速发展,尤其有影响力的社交媒体平台,海量用户生成的内容被记录、存储和积累,形成了一种重要的大数据类型。这些内容公开、易收集、低成本、自发、充满热情和洞察力。在众多类型的UGC中,在线评论可以提供关于游客行为偏好的大量信息。因此,它被称为一个很有前途的替代数据源,以克服人工调查的局限性。在线评论的相关分析已成功地应用于各种旅游问题,如服务性能改进,旅游地形象感知、旅行日记分析、差异化营销,以及旅游需求预测。

尽管在文献中对在线评论的文本挖掘做出了许多努力,但在深入了解复杂的旅游者偏好以支持旅游规划决策方面仍然存在3个重要的研究空白。

1. 在线评论分析主要应用于酒店、餐厅以及航空部门,其目的是确定旅游体验的感知维度和满意度。然而,景点作为旅游地的关键吸引力,直到最近才通过在线评论挖掘进行了少量研究。
2. 在方法论方面,流行的无监督文本挖掘算法已广泛应用于当前的酒店和餐饮研究,但在从景点评论中提取知识方面可能存在问题,甚至无效。不像酒店和餐厅有几个明确的属性,景点评论内容的主题异质性要广泛得多,以不同的动机和活动为特征,并结合了众多无形的特征。可以说,这些数据的这种特性可能会导致提取的主题过多、可分性差、歧义增加,从而降低主题识别的准确性。
3. 大多数研究在描述性统计分析中停滞不前,比如局限于特定旅游者群体在特定时段对特定旅游地内少数类型旅游产品的偏好模式。因此,基于在线评论,对景点特征的旅游偏好的一般时空规律的见解很少,更不用说潜在的因果解释和对旅游地发展的潜在影响了。这是由于缺乏对大地理范围内的多个旅游地及起源地进行广泛的比较分析。因此,仍然需要解决一些问题,例如在有关景点的在线评论中充分发挥文本挖掘技术的潜力,以实现系统和全面地理解决策支持的旅游偏好。

为了填补上述空白,本研究提出了一个新的决策支持框架,系统地研究游客的偏好,基于知识图(KG)以及相应的查询技术和推理模型。KG作为一个基于图形的数据模型,通过充分的事实知识三元组,其节点表示感兴趣的实体,其边表示这些实体之间潜在的不同关系。KG的核心能力3点特征为旅游业的UGC挖掘和相关决策支持带来了前景。

  • 整合多源异构旅游数据:高度可扩展的知识表示结构三元组能够自然融合多模态、碎片化的旅游数据,实现不同类型信息的互补、粒度和来源。这种能力有两个明显的好处。首先,KG可以涵盖旅游场景中的各种实体,并对实体之间丰富的多种关系、行为互动和异质属性进行建模,这有利于对旅游现象从规律到因果解释再到潜在影响进行全面系统的探索。第二,多个信息源之间的重叠信息可以支持对发现的规律进行交叉验证,进一步增强结论的概括性。
  • 准确的旅游知识提取和完整的旅游场景建模:随着深度的日益成熟自然语言处理技术,相应的KG方法可以充分填补传统文本挖掘的上述空白,大大提高旅游者行为偏好知识提取的准确性和完整性,从而形成一个结构完整的旅游领域知识体系。
  • 面向决策支持的海量旅游知识的有效部署和推理:KG的应用可以分为两种方式,即符号查询和分布式推理。凭借高性能的图形DBMS,KG可以有效地查询,以可视化的交互方式提供多个时空分析,全面探索游客的行为模式和偏好分布。此外,前沿的分布式知识计算和推理模型(也称为KGL/KGE)可以被引入,以实现和增强各种下游任务丰富的语义知识,如旅游需求预测、竞争情报等。

3个方面的利益相对应,KG的关键操作也可以分为3个过程:知识组织、获取和部署。知识组织是设计KG的本体,它形式化地表示领域专家的知识。知识获取是实例化根据本体从语料库中提取知识库中的信息。知识部署是利用KG实现多个下游决策支持任务的知识驱动解决方案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/807751.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【51单片机入门记录】IIC总线协议 EEPROM存储器AT24C02应用

目录 一、AT24C20相关函数操作流程 (0)根据第十五届蓝桥杯初始iic.c进行的初步修改(便于编写后续函数) (1)AT24C20存数据操作流程及代码 (2)AT24C02读数据操作流程及代码 &#…

一、OpenMIPS指令集CPU的ori指令的实现

前言 根据“自己动手写CPU”这本书学习,自己动手实现一个MIPS指令集的CPU。 本文章实现了一个ori指令即“或”操作的五级流水线,后续会持续添加其他指令完善此CPU。 文章作为学习笔记持续更新,源代码也在github上持续更新 项目源码https://…

MySQL 行锁和表锁是什么?区别,作用等学习总结

一、所谓‘锁’ 是什么 个人理解,所谓的锁就是为了保证数据库数据操作的一致性而产生的一种机制,即我们可能有很多数据,但是当我们有多个人或者多个线程或会话对同一条数据或同一批数据执行操作时,可能大家都要修改这一部分数据&…

头歌-机器学习 第1次实验 Python机器学习软件包Scikit-Learn的学习与运用

第1关:使用scikit-learn导入数据集 scikit-learn包括一些标准数据集,不需要从外部下载,可直接导入使用,比如与分类问题相关的Iris数据集和digits手写图像数据集,与回归问题相关的波士顿房价数据集。 以下列举一些简单…

JAVA面试八股文之数据库

MySQL面试题 MySQL 存储引擎架构了解吗?CHAR 和 VARCHAR 的区别是什么?索引是越多越好嘛?MySQL数据库中空值(null)和空字符串()的区别?SQL 中 on 条件与 where 条件的区别&#xff1…

mySql数据库学习003-多表查询

多表查询 创建数据表:班级表与学生表 create table if not exists class(id tinyint unsigned primary key auto_increment,name varchar(20) not null,description varchar(255),createAt timestamp default current_timestamp,updateAt timestamp default curre…

面试算法-171-翻转二叉树

题目 给你一棵二叉树的根节点 root ,翻转这棵二叉树,并返回其根节点。 示例 1: 输入:root [4,2,7,1,3,6,9] 输出:[4,7,2,9,6,3,1] 解 class Solution {public TreeNode invertTree(TreeNode root) {if (root n…

Leetcode【双指针法】

目录 一、left right在一个循环里 二、两个指针在各自的循环里 三、slow fast追逐型 四、slow fast条件型 双指针法常用与题型:数组、字符串、链表、N数之和 一、left right在一个循环里 left right在一个循环里。 left和right移动需要条件,一般是向…

腾讯云4核8G服务器多少钱?4核8G能干啥?

腾讯云4核8G服务器多少钱?腾讯云4核8G轻量应用服务器12M带宽租用价格646元15个月,活动页面 txybk.com/go/txy 活动链接打开如下图所示: 腾讯云4核8G服务器优惠价格 这台4核8G服务器是轻量应用服务器,详细配置为:轻量4核…

【2024年5月备考新增】冲刺(1)《第四版教材十五矩阵》

所谓十五矩阵,就是十大管理,五大过程组 【高项】信息系统项目管理师教程(第4版)十五矩阵知识领域项目管理过程组启动过程组规划过程组执行过程组监控过程组收尾过程组项目整合管理制定项目章程制订项目管理计划指导与管理项目工作监控项目工作结束项目或阶段管理项目知识实…

前端代码优化--computed

随便记录一下 主要是通过计算属性来简化和优化代码。在 Vue 中,计算属性是一种方便的工具,可以让你根据依赖状态的变化来动态计算衍生值。在这个例子中,我们使用计算属性 formattedCommunicationType 来根据 workDetail.realTimeItemDeviceDT…

node.js常用命令大全

命令用法nodenode [文件名]:运行指定的 Node.js 脚本文件; node --version:显示当前安装的 Node.js 版本号; node -h 或 node --help:显示 Node.js 的帮助信息。npmnpm install [模块名]:安装指定的 Node.j…

Scala之函数Day-2

Scala 函数(Function) 概述 将一段逻辑进行封装便于进行重复使用,被封装的这段逻辑就是函数。在Scala中,必须通过def来定义函数 基本语法 def 函数名(参数列表) : 返回值类型 {函数体return 返回值 }案例 // 案例:定义函数计算两个整数的…

openlayer实现webgis端绘制制图及编辑

在WebGIS端制图是指通过Web浏览器界面实现地理信息数据的可视化、编辑、分析以及地图产品的制作。这一过程通常涉及以下几个关键环节: **1. 前端技术栈: •HTML/CSS/JavaScript:作为Web开发的基础,用于构建用户界面布局、样式设…

Win11又来「重大」更新!

ChatGPT狂飙160天,世界已经不是之前的样子。 新建了免费的人工智能中文站https://ai.weoknow.com 新建了收费的人工智能中文站ai人工智能工具 更多资源欢迎关注 Windows 11预览通道的22635.3420版本迎来了几个比较大的改进,主要有三个方面: …

一种快速移植 OpenHarmony Linux 内核的方法

移植概述 本文面向希望将 OpenHarmony 移植到三方芯片平台硬件的开发者,介绍一种借助三方芯片平台自带 Linux 内核的现有能力,快速移植 OpenHarmony 到三方芯片平台的方法。 移植到三方芯片平台的整体思路 内核态层和用户态层 为了更好的解释整个内核…

python-study-day1-(病人管理系统-带sql)

MainWindow代码 from tkinter import * from tkinter import messagebox from tkinter.ttk import Comboboxclass MianWindow(Frame):def __init__(self, masterNone):super().__init__(master, padx30, pady20)self.flag 0self.pack(expandTrue, fillBOTH)self.id StringVa…

深入OceanBase内部机制:系统架构与组件精讲

码到三十五 : 个人主页 心中有诗画,指尖舞代码,目光览世界,步履越千山,人间尽值得 ! 目录 1️⃣OceanBase 整体架构1.1 分区1.2 分片1.3 日志流1.4 对等节点1.5 多租户 2️⃣OceanBase 架构与组件详解2.1 存储层2.2 …

Disk Drill Enterprise for Mac v5.5.1515数据恢复软件中文版

Disk Drill 是 Mac 操作系统固有的Mac数据恢复软件:使用 Recovery Vault 轻松保护文件免遭意外删除,并从 Mac 磁盘恢复丢失的数据。支持大多数存储设备,文件类型和文件系统。 软件下载:Disk Drill Enterprise for Mac v5.5.1515激…

keepalived2.2.8+drbd9+nfs高可用存储部署

目录 一.本文基于上一篇文章keepalived环境来做的,主机信息如下 二.为两台虚拟机准备添加一块新硬盘设备 三.安装drbd9 1.使用扩展源的rpm包来下载 2.创建资源并挂载到新增的硬盘 3.主设备升级身份 4.主备两个设备手动切换身份演示 四.安装配置nfs 五.安装…