1 论文笔记:Efficient Trajectory Similarity Computation with ContrastiveLearning

2022CIKM

1 intro

1.1 背景

  • 轨迹相似度计算是轨迹分析任务(相似子轨迹搜索、轨迹预测和轨迹聚类)最基础的组件之一
  • 现有的关于轨迹相似度计算的研究主要可以分为两大类:
    • 传统方法
      • DTW、EDR、EDwP等
      • 二次计算复杂度O(n^2)
      • 缺乏稳健性
        • 会受到非均匀采样、噪点的影响
    • 基于学习的方法
      • 旨在减少计算复杂度和/或提高稳健性
      • 根据它们的目的将它们分为两个方向
        • 神经逼近方法
          • 利用强大的神经网络在隐藏空间中逼近任何现有的轨迹测量
          • 训练一个神经网络g以将轨迹编码到隐藏空间
          • 最小化估计的相似性和基准之间的差异
            • |D_H(g(T_i),g(T_j))-D(T_i,T_j)|
              • Dh​是隐藏空间中的差异(相似性)测量(例如,欧几里得距离)
          • 不需要两个轨迹之间的点对齐,因此计算复杂度在轨迹的长度上是线性的
          • 由于要逼近的测量而遭受 稳健性问题
        • auto-encoder 方法
          • 无监督地学习映射函
          • 为了提高潜在表示相对于低质量的鲁棒性,这些方法采用了不同的策略
            • t2vec利用去噪顺序自编码器
            • Trembr整合了路网信息并设计了多个任务
          • 在训练编码模型方面 效率低下
            • 这是由于顺序自编码器架构的固有限制,其中解码过程和逐步重构非常耗时
            • t2vec 在 Tesla K40 GPU 上训练 2千万轨迹的一个epoch大约需要 14 小时,平均每个轨迹有 60 个样本
          • 这些方法试图学习相同基础路线轨迹(高采样轨迹)的一致表示以解决质量问题
            • 换句话说,即使来自相同基础路线的轨迹具有不同的采样率和噪点,表示应该是相同的
            • 论文认为,由于他们的目标是重构轨迹而不是基础路线,顺序自编码器无法实现这一目标
            • ——>对于顺序自编码器来说, 获得一致的表示是非常困难的

1.2 论文思路

  • 提出了一种基于对比学习的轨迹相似性计算的新型鲁棒模型(CL-TSim)
    • 遵循常见的范例,首先学习轨迹的表示,然后使用欧几里得距离在编码空间中计算轨迹之间的相似性
  • 对轨迹 Ti 进行预处理,以获得增强轨迹 Tj
    • 其中使用下采样和扭曲增强来适应轨迹特征,包括非均匀采样率和噪点
  • 同时将它们编码到隐藏空间并最大化它们之间的一致性

  • 遵循对比学习架构,CL-TSim 只包含一个编码器和一个投影器
    • 编码器用于编码原始轨迹以学习它们的表示
    • 投影器用于将表示映射到损失函数的度量空间
    • 与顺序自编码器相比,它不需要解码器和逐步重构,这可以显著减少训练时间。

2 Preliminary

2.1 基础路线

  • 由移动对象生成的连续空间曲线
  • 只存在于理论中,因为配备了 GPS 的设备无法连续记录时空位置

2.2  轨迹

  • 移动对象的轨迹,记为 T
  • 从基础路线中采样的一系列有限点的序列,形式为 𝑇=((𝑥1,𝑦1,𝑡1),(𝑥2,𝑦2,𝑡2),...,(𝑥𝑛,𝑦𝑛,𝑡𝑛))
  • xi,yi 代表在时间戳 𝑡𝑖 的采样位置的经度和纬度信息
  • 受采样方法和设备的影响,轨迹通常基于不同的采样率生成,并包含有噪点

2.3 问题定义

给定一组轨迹,我们的问题是设计一个高效且鲁棒的模型,以计算轨迹之间的相似性,目标如下:

1)高效的表示学习:有效地为每个轨迹 T 学习一个表示 t,其中 t 可以反映轨迹 T 的基础路线,用于计算轨迹相似性;

 2)模型的鲁棒性:换句话说,两个任意轨迹Ti 和Tj 之间的相似性是一致的,不受非均匀采样率和噪点的影响

3 模型

4 实验

4.1 数据

4.2 评估方法

4.2.1 自相似性

  • 给定一组轨迹,随机选择 m 条轨迹和 n 条轨迹,分别记为 Q 和 D
    • 对于 Q 中的每条轨迹,通过交替从中取点来创建两个子轨迹(称为双胞胎轨迹),并将第一个子轨迹加入 Q1,而另一个加入 Q2
    • 对于 Q1 中的每条轨迹,称为查询轨迹,我们在Q2∪D 中检索最相似的轨迹,称为数据库轨迹
    • 显然,Q2 中的轨迹应该排在 D 之前,因为它们是由与 Q1 中相同的轨迹生成的
  • 假设 Ti 是 Q1 中的一个查询轨迹,而 Tj 是 Q2 中的相应双胞胎轨迹
    • 计算 Ti 与 Q2∪D1 之间轨迹的相似性,根据相似性对轨迹进行排序,并记 Tj 的排名为 ri
  • 基于此,采用两个广泛使用的度量标准,即精确度 P 和平均排名 MR

当 ri 等于 0 时,pi 等于 1;否则,pi 等于 0。(只有查询数据集里面Tj是最相似的,才会是1)

更大的 P 或更小的 MR 值意味着更好的自相似性性能。

4.2.2 交叉相似性

一个好的相似性度量应该能够保持两个不同轨迹之间的相似性,而不考虑数据采样策略

交叉距离偏差(CDD)来评估性能

Ta 和 Tb 是具有原始率的两个不同的轨迹,Ta′(rd) 是通过以 d 的速率随机丢弃(或扭曲)样本点获得的Ta 的变体,而 Tb′(rd) 是以与 Ta′(rd) 相同的方式获得的 Tb 的变体。

较小的 CDD 值表明评估的相似性(即,距离)更接近真实值。

4.3 结果

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/91918.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Flutter笔记:滚动之-无限滚动与动态加载的实现(GetX简单状态管理版)

Flutter笔记 无限滚动与动态加载的实现(GeX简单状态管理版) 作者:李俊才 (jcLee95):https://blog.csdn.net/qq_28550263 邮箱 :291148484163.com 本文地址:https://blog.csdn.net/qq…

idea常用快捷键 idea搜索快捷键

常用快捷键 IntelliJ IDEA 是一款流行的 Java 集成开发环境(IDE),有许多常用的快捷键可以帮助开发者提高效率。以下是一些常用的 IntelliJ IDEA 快捷键: CtrlSpace:基本代码补全,用于输入任何东西&#x…

stm32 - 初识2

stm32 - 初识2 工程架构点灯程序寄存器方式点灯库函数的方式点灯 工程架构 启动文件 中断向量表,中断服务函数,其他中断等 中断服务函数中的,复位中断是整个程序的入口,调用systeminit,和main函数 点灯程序 寄存器方式…

HTML的相关知识

1.什么是HTML?基本语法 HTML: Hyper Text Markup Language (超文本标记语言) 超文本?超级文本,例如流媒体,声音、视频、图片等。 标记语言?这种语言是由大量的标签组成。HTML标签参考手…

尚硅谷谷粒商城部分报错问题处理

1、启动报错: 内容: org.springframework.beans.factory.BeanCreationException: Error creating bean with name attrAttrgroupRelationController: Lookup method resolution failed; nested exception is java.lang.IllegalStateException: Failed t…

《数据结构、算法与应用C++语言描述》-栈的应用-离线等价类问题

离线等价类问题 问题描述 等价类:假定一个具有n个元素的集合U1,2,…,n和一个具有r个关系的集合 R ( i 1 , j 1 ),( i 2 , j 2 ), ……

推出全新AIGameFi,SCF金融公链FinSOUL促进元宇宙发展

在被誉为元宇宙元年的2021年,SCF(Standard Cross Finance)金融公链正着眼于打造一项开创性的项目,推出创新的金融公链生态,并期待成为元宇宙2.0的先锋。虽然2021年见证了元宇宙项目的强势崛起,但在SCF金融公…

Vue定义全局组件的方式

Vue.js是一种流行的JavaScript框架,用于构建交互式的Web应用程序。Vue提供了一种简单而灵活的方式来定义和使用组件。在本文中,我们将探讨Vue中定义全局组件的三种方式,让你能够更好地理解和使用Vue组件。 引言 组件是Vue应用程序的基本构建…

【C++】class的设计与使用(十)重载iostream运算符

希望对某个类对象进行读写操作&#xff0c;直接cout<<类对象<<endl;或cin>>类对象;编译器会报错&#xff0c;所以我们必须提供一份重载的input/output运算符&#xff1a; 重载ostream运算符 ostream& operator<<(ostream &os, const Triangu…

Redis配置和优化

Redis配置和优化 一 、Redis介绍二、关系数据库和非关系数据库2.1、关系型数据库2.2、 非关系型数据库2.3、 非关系型数据库的产生背景2.4、 关系型数据库和非关系型数据库区别2.5、 总结 三、缓存概念3.1、系统缓存3.2、 缓存保存位置及分层结构3.2.1、DNS缓存3.2.2、 应用层缓…

10.1 File类

前言&#xff1a; java.io包中的File类是唯一一个可以代表磁盘文件的对象&#xff0c;它定义了一些用于操作文件的方法。通过调用File类提供的各种方法&#xff0c;可以创建、删除或者重命名文件&#xff0c;判断硬盘上某个文件是否存在&#xff0c;查询文件最后修改时间&…

MySQL数据库基础与概念解析

在如今这个信息爆炸的时代,数据成了我们生活中不可或缺的一部分。但是,数据本身并没有太大的价值,真正重要的是我们如何管理和利用这些数据。这就引出了数据库这一概念,一个系统化、高效的数据管理工具。 特别是在复杂的应用场景中,比如游戏《三国志》系列,一个好的数据…

【HTML】表格行和列的合并

概述 当我们需要在 HTML 表格中展示复杂的数据时&#xff0c;行和列的合并可以帮助我们实现更灵活的布局和结构。通过合并行和列&#xff0c;我们可以创建具有更多层次和结构的表格&#xff0c;使数据更易于理解和分析。 在 HTML 表格中&#xff0c;我们可以使用 rowspan 和 …

ELK整合springboot(第二课)

一、创建一个springboot的项目 pom文件如下&#xff1a; <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLo…

Debian跳过grub页面

nano /etc/default/grub将GRUB_TIMEOUT的值改为0 将GRUB_CMDLINE_LINUX_DEFAULT的值改为"quiet splash" 如果要禁用开局日志的话&#xff0c;将GRUB_CMDLINE_LINUX_DEFAULT的值改为"quiet splash loglevel0" update-grub

lv5 嵌入式开发-12 信号灯

目录 1 信号量/灯(semaphore)基本概念 2 信号量&#xff0d;&#xff30;&#xff0f;&#xff36;操作概念 3 三种信号灯 3.1 有名信号灯 3.1.1 打开 3.1.2 关闭 3.1.3 删除 3.2 无名信号灯 3.2.1 初始化 3.2.2 销毁 3.3 信号灯P操作 3.4 信号灯V操作 3.5 示例 …

Visual Studio 中将TAB设置为空格

将TAB设置为空格的原因很多&#xff0c;其中一点是为了统一不同编译器对TAB的解释&#xff0c;防止代码风格在不同编译器下不一致等。 在菜单中选择: 工具-->选项-->文本编辑器--->所有语言-->制表符 在窗口中选择&#xff0c;制表符大小和缩进大小都选为4&#xf…

10.1 国庆节小任务

目录 select实现服务器并发 服务器 客户端 运行现象 select实现服务器并发 服务器 #include<myhead.h>#define PORT 8888 //1024~49151 #define IP "192.168.1.104" //ifconfig查看本机IPint main(int argc, const char *argv[]) {//创建流式…

本次CTF·泰山杯网络安全的基础知识部分(二)

简记23年九月参加的泰山杯网络安全的部分基础知识的题目&#xff0c;随时补充 15&#xff08;多选&#xff09;网络安全管理工作必须坚持“谁主管、谁负责&#xff0c;谁运营、谁负责&#xff0c;谁使用、谁负责”的原则&#xff0c;和“属地管理”的原则 谁主管、谁负责&…

WiFi网络分析工具Airtool for Mac

Airtool是一款Mac平台上的WiFi网络分析工具&#xff0c;它可以帮助用户监测、分析和管理无线网络。 以下是Airtool的一些主要功能和特点&#xff1a; 实时监测&#xff1a;Airtool可以实时监测当前Mac设备所连接的WiFi网络&#xff0c;包括网络速度、信号强度、连接状态等。信…