拓数派向量计算引擎PieCloudVector助力东吴证券AIGC应用升级

1.项目背景

随着人工智能技术的不断创新和应用,我们可以看到人工智能在各个领域的应用越来越广泛。深度学习技术在图像识别、语音识别、自然语言处理等领域表现出色。机器学习算法的改进将解决更多实际问题,如增强学习、迁移学习和联合学习等,以更有效地处理复杂的数据问题。自然语言处理技术的不断进步,有助于实现更自然的对话和交流方式,在智能客服、虚拟助手、智能翻译等方面有着广泛应用。数据与AI融合是不可阻挡的历史潮流,大数据和AI技术相互激发、相辅相成,共同推进彼此的发展,两把“金钥匙”握手会再次在金融行业掀起高潮。

AIGC类应用是数智融合的典型,底层基础是强大的数据治理能力,预训练语言大模型不断获得高质量数据进行训练、迭代和优化,从而带来远胜以往的智能应用理念。大模型将激活证券行业的非结构化数据,更高效地释放数据价值,应用将渗透到业务前中后段,带来新的生产力升级。大模型的爆发,将金融业带入到了一个全新时代,但同时也给行业带来了一些难题。

2.现状及痛点

2.1 数据安全问题

涉及敏感信息的业务应用,数据隐私是一个不可忽视的问题。部分场景中存在调用LLM API接口服务的情况,不能直接拿取业务数据,需要考虑数据泄露的风险。

2.2 私域数据问题

通用大模型在训练过程中并未接触过企业的私域数据和特定业务场景,因此,它们无法完全满足企业实际需求,也无法优化企业的具体业务流程,需要将其与企业内部的特定知识和数据进行整合。

2.3 实时性问题

大模型通常是基于历史的某个时间点及其以前的数据进行训练和优化的,缺失了部分实时的数据,假如有用户询问有关最新数据的问题,AIGC会生成错误的答案,这就是LLM幻觉问题。并且LLM计算并生成对应答案也需要一定的时间,一般都在3~5秒左右,用户交互时延较高。

2.4 长期记忆问题

LLM主要是处理数据,并能生成数据,但是本身却没有长期记忆能力, 这对于需要持续互动的AIGC场景是致命问题,长期记忆对于维持上下文理解至关重要,可以提供更自然、更个性化的用户体验。缺乏长期记忆,影响了LLM的性能和AIGC类应用的用户体验。

3.基于向量数据库的AIGC应用

3.1 整体架构

image.png

3.2 解决方案

  • 采用自研大模型东吴秀财GPT + LangChain开发框架 + PieCloudVector向量数据库构建了AIGC应用平台,接入了交易应用的结构化数据和非结构化数据,其中非结构化数据主要是文本类数据(如法律法规、金融资讯、产研报告等);

  • 东吴秀财GPT当前生产上线的参数为130亿,将于2024年4月中旬完成千亿参数大模型的训练,训练集包括2.235万亿Tokens的中英文语料,其中包括4000亿Tokens的金融语料,采用40台8卡H800训练;

  • 拓数派提供了分布式的向量数据库PieCloudVector,采用4节点部署,总数据量超4TB,单Collection最大近2亿条向量数据,支持多种索引类型和主流检索算法;

  • PieCloudVector配合东吴秀财GPT大模型,整体形成了RAG架构,PieCloudVector主要存储Embedding后的向量数据,同时也支持应用的标量数据存储,并提供LangChain的SDK,无缝集成到AIGC应用开发框架中;

  • PieCloudVector是拓数派国内自主研发产品,通过了信通院的向量数据库能力测试。本次在东吴证券中也基于国产海光服务器和国产麒麟操作系统部署,满足了自主可控的要求。

3.3 应用及收益

  • 东吴秀财GPT基于文本理解与生成、RAG增强搜索、企业智能中枢、智能BI四大应用范式,开发了N个AI证券行业应用场景。现有应用包括涨跌分析和盘后总结,企微AI客服助手,智能尽职调查、年报问答、基金问答、量化投资、内部培训等,并接入了东吴数字人;

  • PieCloudVector向量数据库支撑东吴秀财GPT训练阶段的海量数据的分类、去重和清洗,给大模型的训练降本增效;

  • 通过外挂基于PieCloudVector向量数据库的知识库,帮助大模型提升处理新问题的能力,突破预训练带来的知识时间限制,避免大模型出现幻觉;

  • 在推理阶段,通过PieCloudVector向量数据库本身的权限控制,能真正实现隐私数据可控不出域。同时减少重复计算,通过缓存避免反复进行大模型推理,提高响应速度和性能;

  • 在上下文限制方面,由于PieCloudVector具备历史数据持久化的能力,同时通过内置的KNN、ANN算法做相似性查询,返回最相关内容,从而突破大模型上下文限制,实现长期记忆。将大模型问答结果进行缓存,确保数据一致性,避免因模型更新或数据变化而引起的结果不一致问题,提升用户信任度;

  • PieCloudVector向量数据库具备万亿级大规模向量数据库快速查询的能力,支持单节点多线程的索引创建,可充分调度硬件所有计算能力,索引创建性能提升5倍,检索性能提升6倍,交互响应速度提升3倍。

4.PieCloudVector产品优势

image.png

5.PieCloudVector应用场景

image.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/791749.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

蓝桥杯 - 受伤的皇后

解题思路: 递归 回溯(n皇后问题的变种) 在 N 皇后问题的解决方案中,我们是从棋盘的顶部向底部逐行放置皇后的,这意味着在任何给定时间,所有未来的行(即当前行之下的所有行)都还没…

算法学习——LeetCode力扣动态规划篇9(1035. 不相交的线、53. 最大子数组和、392. 判断子序列、115. 不同的子序列)

算法学习——LeetCode力扣动态规划篇9 1035. 不相交的线 1035. 不相交的线 - 力扣(LeetCode) 描述 在两条独立的水平线上按给定的顺序写下 nums1 和 nums2 中的整数。 现在,可以绘制一些连接两个数字 nums1[i] 和 nums2[j] 的直线&#x…

matlab使用教程(33)—求解时滞微分方程(1)

1.时滞微分方程(DDE)的分类 时滞微分方程 (DDE) 是当前时间的解与过去时间的解相关的常微分方程。该时滞可以固定不变、与时间相关、与状态相关或与导数相关。要开始积分,通常必须提供历史解,以便求解器可以获取初始积分点之前的时间的解。 1.1常时滞 D…

【MATLAB源码-第176期】基于matlab的16QAM调制解调系统频偏估计及补偿算法仿真,对比补偿前后的星座图误码率。

操作环境: MATLAB 2022a 1、算法描述 在通信系统中,频率偏移是一种常见的问题,它会导致接收到的信号频率与发送信号的频率不完全匹配,进而影响通信质量。在调制技术中,QPSK(Quadrature Phase Shift Keyin…

LeetCode每日一题之专题一:双指针 ——复写零

复写零OJ链接:1089. 复写零 - 力扣(LeetCode) 题目: 解法(原地复写-双指针): 算法思路: 如果「从前向后」进⾏原地复写操作的话,由于 0 的出现会复写两次,导致…

java 数据结构 Map和Set

目录 搜索树 操作-查找 操作-插入 操作-删除(难点) Map Map 的常用方法 Set 哈希表 哈希函数 哈希冲突 冲突-避免-负载因子调节(重点掌握) 冲突-解决 冲突-解决-开散列/哈希桶(重点掌握) 实现HashBuck类 put方法 …

C#清空窗体的背景图片

目录 一、涉及到的知识点 1.设置窗体的背景图 2.加载窗体背景图 3.清空窗体的背景图 二、 示例 一、涉及到的知识点 1.设置窗体的背景图 详见本文作者的其他文章:C#手动改变自制窗体的大小-CSDN博客 https://wenchm.blog.csdn.net/article/details/137027140…

AI结合机器人的入门级仿真环境有哪些?

由于使用真实的机器人开发和测试应用程序既昂贵又费时,因此仿真已成为机器人应用程序开发中越来越重要的部分。在部署到机器人之前在仿真中验证应用程序可以通过尽早发现潜在问题来缩短迭代时间。通过模拟,还可以更轻松地测试在现实世界中可能过于危险的…

C# 登录界面代码

背景 MVVM 是一种软件架构模式,用于创建用户界面。它将用户界面(View)、业务逻辑(ViewModel)和数据模型(Model)分离开来,以提高代码的可维护性和可测试性。 MainWindow 类是 View&a…

【星计划★C语言】c语言初相识:探索编程之路

🌈个人主页:聆风吟_ 🔥系列专栏:星计划★C语言、Linux实践室 🔖少年有梦不应止于心动,更要付诸行动。 文章目录 📋前言一. ⛳️第一个c语言程序二. ⛳️数据类型2.1 🔔数据单位2.2 &…

哲♂学家带你深♂入了解动态顺序表

前言: 最近本哲♂学家学习了顺序表,下面我给大家分享一下关于顺序表的知识。 一、什么是顺序表 顺序表是用一段物理地址连续的存储单元依次存储数据元素的线性结构,一般情况下采用数组存储。在数组 上完成数据的增删查改。 顺序表&#xff…

C++从入门到精通——入门知识

1. C关键字(C98) C总计63个关键字,C语言32个关键字 2. 命名空间 在C/C中,变量、函数和后面要学到的类都是大量存在的,这些变量、函数和类的名称都将存在于全局作用域中,可能会导致很多冲突。使用命名空间的目的就是对标识符的名…

PS从入门到精通视频各类教程整理全集,包含素材、作业等(8)复发

PS从入门到精通视频各类教程整理全集,包含素材、作业等 最新PS以及插件合集,可在我以往文章中找到 由于阿里云盘有分享次受限制和文件大小限制,今天先分享到这里,后续持续更新 B站-PS异闻录:萌新系统入门课课程视频 …

大模型论文阅读:ADAPTIVE BUDGET ALLOCATION FOR PARAMETEREFFICIENT FINE-TUNING

大模型论文阅读:ADAPTIVE BUDGET ALLOCATION FOR PARAMETEREFFICIENT FINE-TUNING 论文链接:https://arxiv.org/pdf/2303.10512v1.pdf 当存在大量下游任务时,微调所有预训练模型的参数变得不可行。因此,为了以参数高效的方式学习预训练权重的增量更新,提出了许多微调方法,…

【并发编程】CountDownLatch

📝个人主页:五敷有你 🔥系列专栏:并发编程 ⛺️稳中求进,晒太阳 CountDownLatch 概念 CountDownLatch可以使一个获多个线程等待其他线程各自执行完毕后再执行。 CountDownLatch 定义了一个计数器,…

【每日一道算法题】移除链表节点

这里写自定义目录标题 【每日一道算法题】移除链表元素思路记录我的代码力扣官方题解递归迭代 【每日一道算法题】移除链表元素 力扣题目链接(opens new window) 给你一个链表的头节点 head 和一个整数 val ,请你删除链表中所有满足 Node.val val 的节点&#xf…

arm的状态寄存器

目录 一、arm 的 PSRs二、CPSR2.1 CPSR_cxsf 三、SPSR四、APSR 一、arm 的 PSRs arm 中有很多程序状态寄存器(Program Status Registers,PSRs)用于存储处理器的状态信息,包括 CPSR\SPSR\FPSR\APSR 等: CPSR&#xff…

Vue3配置router路由步骤

Vue3配置router路由步骤 首先创建一个vue3的项目 先检查一下router的版本,可以在pakage.json里面查看,也可以你直接在终端输入 npm list vue-router如果版本比较低的话,先升级一下 vue3的话,用以下命令 npm install vue-route…

红蓝色WordPress外贸建站模板

红蓝色WordPress外贸建站模板 https://www.mymoban.com/wordpress/5.html

TSINGSEE青犀推出河道/河湖/水域治理视频AI智能解决方案

一、方案背景 “十四五”时期,在面源污染防治等方面实现突破,实现主要水污染排放总量持续减少,水生态环境持续改善等任务艰巨。进一步完善流域综合治理体系,提升流域水环境综合治理能力和水平,更好适应新阶段发展需求…