比赛调研资料

视觉文旅

在这里插入图片描述

现有的模型

在这里插入图片描述

数据

在这里插入图片描述
在这里插入图片描述

功能

  • 精准营销
    在这里插入图片描述

  • 基于地理推荐能力
    在这里插入图片描述

  • 乡村圈分析能力
    在这里插入图片描述

  • 都市圈分析能力在这里插入图片描述

产品体系

在这里插入图片描述

三大数据平台

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


携程问道

旅游服务框架:前置(推荐种草),途中(客服),售后(?)

  • 行程规划

在这里插入图片描述

携程问道在训练期间筛选了200亿个高质量非结构性旅游数据,再结合携程现有精确的实时数据进行自研垂练,成为百亿参数规模的行业垂直大模型。

  • 大模型推荐

“携程问道”大模型目前已经具备了“前置推荐”和“智能查询”两项能力:
首先,在用户需求尚未确定时,携程问道能为其提供出行推荐服务;
如若用户已有相对明确的需求,问道也能提供智能查询结果。

“旅游重在体验,任何一个5%的行程规划失误都会造成100%的旅游问题”,携程深知,AI能否给出可靠答案,将直接关乎游客的出行体验。

  • 客服
    当前互联网平台主流的客服回复方式,无外乎线上咨询、电话语音和电子邮件。随着技术升级迭代,携程已将成熟的AI客服系统与客户无缝对接。

据了解,在中文渠道或是涉及多语种对话的场景中,携程AI的自助率已经达到了约75%,50%的电话咨询能够通过AI解决;利用文本抽取和意图识别技术,后台25%的邮件反馈,也已交由AI进行回复。
数据显示,AI客服上线至今,日均可节约10000+小时客服工作时间,邮件回复速度已从小时级降低至分钟级。

  • 显然,凭借公司自身在旅游行业多年深耕积累的旅游数据,训练语义理解、信息抽取、信息摘要等模型,携程正在用AI技术,提升着旅行全程的效率和体验。

中国移动

数据优势:

  • 数据覆盖人们的生活,移动用户基数大
    在这里插入图片描述
  • 尤其是轨迹位置数据

融合多种位置数据,包括信令、话单、MR以及流量解析中的GPS数据等,综合多维模型能力,提供高精准、高保障、高连接、
高响应、低时延的实时精准位置服务能力。

时间和位置数据如何利用?

  1. TimeGPT的方案,Transformer单独训练一个预测大模型,作为一个轨迹预测模块,针对单用户进行时间序列建模

  2. 多模态大模型,将时间和位置加入预训练数据中,作为一个Prefix,拼接到数据中

    • 存在一个问题,训练数据是已知的,推理是未知的,OOD
    • 位置可以直接拼接,时间不行使用相对时间,offset偏移?
      • 针对一个位置使用相对时间?
  3. Diffusion模型,进行预测

    • 扩散模型生成GPS轨迹:https://zhuanlan.zhihu.com/p/660517182
  4. TrafficGPT

    • https://zhuanlan.zhihu.com/p/656801328
    • https://arxiv.org/pdf/2309.06719.pdf
    • 用Tools实现各个功能的调用,
  • 移动目前的核心就是,基于位置的识别模型?

    • 那么我们如何建立一个大一统的识别模型呢?
    • 其实不用,可以使用Tools来唤醒各个专用的小模型
  • 需要精确性和可靠性

    • 精确性:ChatGPT已经可以很好的知道世界的经纬度了,所以可以大胆的加入位置信息进行训练
    • 可靠性:语言模型无法做到实时查询,通过tools来实现实时的查询

TrafficGPT的可靠性解决方案:

数据真实性:指示TrafficGPT避免生成虚假的交通基础模型(TFM)名称、输入和输出数据至关重要。这确保输出可信且可靠,最大程度地减少了误导信息的可能性。

最小化冗余:通过指示TrafficGPT避免重复使用工具,您鼓励了连贯的问题解决,同时减少了错误的机会。这种方法通过防止不必要的重复,增强了系统的可靠性和准确性。

人工干预协议:承认现有信息和TFM的局限性,该协议强调了当TrafficGPT遇到无法准确完成的情况时人工干预的重要性。它指示系统暂停并请求人类提供额外信息,以确保最终输出的准确性和可靠性。

任务精确性和响应及时性:由于TrafficGPT利用多种交通基础模型(TFMs)并能将它们相互关联以完成复杂任务,因此提供精确的提示变得至关重要。这确保系统准确理解任务要求,并能及时地做出响应,有效地利用相互关联的TFMs。

这些策略共同旨在通过关注真实数据生成、避免冗余、在需要时引入人工监督,并通过精确的任务理解和及时的响应来维护TrafficGPT在处理复杂交通相关任务时的可靠性和准确性。

ChatGLM问答(回复生成)

  • https://mp.weixin.qq.com/s/1ODytWmjCkEs8lL5VFo-PA

GPS轨迹(轨迹预测)

  • DiffTraj: 利用扩散模型生成 GPS 轨迹: https://zhuanlan.zhihu.com/p/660517182
  • DYffusion: DYnamics-Informed Diffusion Model: https://neurips.cc/media/neurips-2023/Slides/73469.pdf

在这里插入图片描述

TableGPT(做数据分析)

  • https://zhuanlan.zhihu.com/p/644674989

Global Table Representation 表格全局表达
Chain-of-Command 链式命令
Domain-aware Fine-Tuning 领域感知微调

在这里插入图片描述

Background:目前的大模型逐渐走向多模态,除了文字之外,还可以处理图像、音频等。但就如之前所说,现有的大模型处理表格数据的能力十分有限。要让大模型正确地理解和解释表格是一个难题。之前有人做过各种尝试,比如把表格数据的每一行转换成句子状的文本描述等等。但这些方法都只是从表格里提取了部分信息喂给大模型,而忽略了整体,也没有考虑到数据中隐含的行业相关背景。

那么能不能直接从表格中提取矢量表征呢?这里最大的挑战是,不同于图像、音/视频,表格数据是一种非常抽象的结构化数据。同时表格还具有双置换不变结构,即重新排列行或列不会影响表格中包含的信息,这与图像和音频形成了鲜明的对比,后者在相邻位置或序列中具有归纳偏差。更不用说不同的表格的大小、尺寸、列数都不一样,要用统一的神经网络架构来提取特征是很困难的。

普通的大模型在理解表格的时候往往太拘泥于每一格中的具体信息,而忽略了全局。于是研究团队的解决方法是让他们的模型像人类数据分析师那样去理解表格。具体来说,就是把表格中的信息分成两部分:

  1. 第一部分是表格的元数据表征,即表格的呈现形式、表格内容的行业背景,每一列的栏目名称等。这样可以大模型对表格结构有一个整体的把握。
  2. 而第二部分是学习表格中的数字信息表征,比如每一列中数值的分布和变化趋势。这里他们将表格的行和列视为一组元素,并学习整个集合的整体表征。而表格编码器的主干来自修饰过的集合转换器(modified set transformer)。
  • 编码器通过注意力机制加强之后可以理解不同行和列之间的相互关系

指令链

大模型具有思维链(chain-of-thought),可以把复杂的推理过程分解成一系列中间步骤。而在这里,研究团队提出指令链(chain-of-command),为思维链的这一系列中间步骤提供逐步的指示。

例如当用户提出:“列出 5 部利润最高的电影。” 大模型会先检查列表里面有没有利润这一栏,如果没有这一栏,那么它会生成一套指示来指导自己通过票房和成本数据计算出利润,再根据指示按照利润高低排列电影,找出利润最高的那 5 部。指令链增强了大模型的多跳推理(multi-hop reasoning)能力,使其能够把用户的诉求拆解成一系列指令,这样更易于进行复杂的跨表格操作。此外,当用户的请求太过模糊、宽泛的时候,比如用户说“给我一些数据”,那么指令链还会提醒用户把请求变得具体、明确。

用处: 用自然语言去进行数据分析

另一方面,在同一企业内部,数据分析部门与其它部门之间沟通不畅,数据分析的术语对于其它部门人员来说晦涩难懂,而数据分析师由于不在业务的一线,也很难理解业务的真实需求。

如果有一个工具可以降低数据分析的门槛,让所有人都可以用自然语言与之交互,省去了学习复杂的工具和写代码的麻烦,那么将大有可为。我们希望 TableGPT 会是这样的工具。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/152133.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【SpringMvc】SpringMvc +MyBatis整理

🎄欢迎来到边境矢梦的csdn博文🎄 🎄本文主要梳理 Java 框架 中 SpringMVC的知识点和值得注意的地方 🎄 🌈我是边境矢梦,一个正在为秋招和算法竞赛做准备的学生🌈 🎆喜欢的朋友可以关…

JSP协同办公eclipse定制开发mysql数据库BS模式java编程OA系统

一、源码特点 java 协同办公管理系统是一套完善的web设计系统 ,对理解JSP java编程开发语言有帮助,系统具有完整的源代码和数据库,系统主要采用B/S模式开发。开发环境为TOMCAT7.0,eclipse开发,数据库为Mysql5.0,使…

2023Linux常见命令手册

目录 文件命令 文件和目录命令 文件的权限命令 文件搜索命令 进程命令 查看进程命令 关闭进程命令 用户和群组命令 网络命令 firewall-cmd 网络应用命令 高级网络命令 网络测试命令 网络安全命令 网络配置命令 软件管理命令 系统信息命令 vi编辑器 关机命令…

技术岗位竞业协议规避的坑

​ 前言 技术岗位竞业协议指员工在离开公司后,不能在指定期限内从事与公司业务有竞争关系的工作。 有的公司在入职的时候签订,有的在离职的时候签订(更有的公司在工作中途补签),但是要记住,签了就生效了…

如何修改dpi为300?96dpi怎么改成300dpi?

平时使用的图片dpi一般都是96,但是我们在打印的时候,都要求dpi为300以上,这时候就需要修改图片分辨率,如何改图片分辨率成了一个问题,所以今天就教大家一个图片分辨率提高在线处理的方法,一起来了解一下吧。…

【Java程序员面试专栏 专业技能篇】Java SE核心面试指引(一):基础知识考察

关于Java SE部分的核心知识进行一网打尽,包括四部分:基础知识考察、面向对象思想、核心机制策略、Java新特性,通过一篇文章串联面试重点,并且帮助加强日常基础知识的理解,全局思维导图如下所示 本篇Blog为第一部分:基础知识考察,子节点表示追问或同级提问 基本概念 …

《数据:挖掘价值,洞察未来

大数据:挖掘价值,洞察未来 我们正身处一个数据驱动的时代,大数据已经成为企业和个人决策的重要依据。本文将深入探讨大数据的魅力,挖掘其价值,并洞察未来发展趋势,让我们一起领略大数据的无穷奥秘。 一、大…

开发仿抖音APP遇到的问题和解决方案

uni-app如何引入阿里矢量库图标/uniapp 中引入 iconfont 文件报错文件查找失败 uni-app如何引入阿里矢量库图标 - 知乎 uniapp 中引入 iconfont 文件报错文件查找失败:‘./iconfont.woff?t1673007495384‘ at App.vue:6_宝马金鞍901的博客-CSDN博客 将课件中的cs…

FastJson竟然会导致内存泄露?你遇到过吗?

FastJson是一款性能优异的java序列化和反序列框架,广泛应用于日常开发工作中,也许正是因为作者在设计这款框架时,比较注重性能方面的考量,在框架安全性,空间占用等方面做了一些牺牲。 很不幸小编前两天就遇到了一个使…

Windows 下 Sublime Text 3.2.2 下载及配置

1 下载地址: https://www.sublimetext.com/3 Sublime Text 3.2.2 (此版本选择了 portable version),直接解压就可以使用。 https://download.sublimetext.com/Sublime Text Build 3211.zip 2 相关配置 2.1 取消自动更新(修改完,需要注册码…

企业OA办公系统的设计与实现【附源码】

企业办公自动化系统设计与实现 毕业论文 摘 要 办公自动化(Office Automation,简称OA)是将现代化办公和计算机网络功能结合起来 的一种新型的办公方式。企业办公自动化系统在此基础上实现企业的快速运转和交流,进而 有效提高企业办公效率。 本…

Decoder-Only、Encoder-Only和Encoder-Decoder架构的模型区别、优缺点以及使用其架构的模型示例

❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️ 👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博…

vue el-table字段点击出现el-input输入框,失焦保存

一、效果展示 当没有数据初始化展示如下&#xff1a; 有数据展示数据&#xff0c;点击出现输入框&#xff0c; 失焦保存修改 二、代码实现 <!-- cell-click"cellClick" 当前单击的单元格 --> <el-tableref"table"size"mini"height&qu…

笔记57:双向循环神经网络

本地笔记地址&#xff1a;D:\work_file\DeepLearning_Learning\03_个人笔记\3.循环神经网络\第9章&#xff1a;动手学深度学习~现代循环神经网络 a a a a a a a a a a a a

mysql面试题——存储引擎相关

一&#xff1a;MySQL 支持哪些存储引擎? MySQL支持多种存储引擎&#xff0c;比如InnoDB&#xff0c;MyISAM&#xff0c; MySQL大于等于5.5之后&#xff0c;默认存储引擎是InnoDB 二&#xff1a;InnoDB 和 MyISAM 有什么区别? InnoDB支持事务&#xff0c;MyISAM不支持InnoD…

html综合笔记:设计实验室主页

&#xff11; 主页来源及效果 Overview - Lab Website Template docs (gitbook.io) greenelab/lab-website-template: An easy-to-use, flexible website template for labs (github.com) 2 创建网页 3 主要的一些file 3.1 index.md 主页面 3.1.1 intro 3.1.2 highlight …

springBoot 配置druid多数据源 MySQL+SQLSERVER

1:pom 文件引入数据 <dependency> <groupId>com.alibaba</groupId> <artifactId>druid-spring-boot-starter</artifactId> <version>1.1.0</version> </dependency>…

Unity使用Visual Studio Code 调试

Unity 使用Visual Studio Code 调试C# PackageManager安装Visual Studio EditorVisual Studio Code安装Unity 插件修改Unity配置调试 PackageManager安装Visual Studio Editor 打开 Window->PackageManger卸载 Visual Studio Code Editor &#xff0c;这个已经被官方废弃安…

【C++ STL】string类-----迭代器(什么是迭代器?迭代器分哪几类?迭代器的接口如何使用?)

目录 一、前言 二、什么是迭代器 三、迭代器的分类与接口 &#x1f4a6;迭代器的分类 &#x1f4a6;迭代器的接口 &#x1f4a6;迭代器与接口之间的关联 四、string类中迭代器的应用 &#x1f4a6; 定义string类----迭代器 &#x1f4a6;string类中迭代器进行遍历 ✨be…