突破AI迷雾:英特尔携手星环科技打造向量数据库革新方案,直降大模型幻觉

去年爆火的大模型,正在从百模大战走向千行百业落地应用。不过行业数据规模有限,企业数据隐私安全的要求等等因素,都让行业大模型的准确率面临挑战。近期发布的《CSDN AI 开发者生态报告》数据显示,“缺乏数据/数据质量问题”在大模型技术开发者面临的问题中,占据首位。


具体来说,行业领域大模型需要有对行业(如医学、法律、科研)高深专业术语的理解、完成特定的行业领域任务,并且对大模型输出结果要求准确,无法如个人用户一样接受大模型的反复多次推理。

RAG 技术有效降低模型幻觉,加速行业大模型落地

检索增强生成技术 RAG(Retrieval-Augmented Generation)应时而生。在 RAG 系统中,使用向量数据库进行信息检索是系统能够正常运行的核心功能之一,通过 embedding 技术将问题和知识库内容转换为向量,基于相似性找到最相关的文档并提供给大模型生成答案。

采用 RAG 技术可以有效地解决大模型在知识更新不及时、数据安全、存在幻觉等方面的问题,通过向量数据库、图数据库等作为大模型的外置知识库,使大模型具有更高的精确度,因此,在今年受到技术界的广泛关注。RAG 与向量数据库成为了行业模型落地的优选项。

在云计算时代拥有自研大数据技术的资深数据厂商星环科技,正在进一步基于 RAG 技术与星环科技向量数据库 Transwarp Hippo,利用行业与企业中存在的大量半结构化和非结构化数据,去提升行业大模型的准确性。

Transwarp Hippo 是一款企业级云原生分布式向量数据库,支持存储、索引以及管理海量的向量式数据集,解决向量相似度检索以及高密度向量聚类等问题。Hippo 具备高可用、高性能、易拓展等特点,支持多种向量搜索索引,以及数据分区分片、数据持久化、增量数据摄取、向量标量字段过滤混合查询等功能,能够很好的满足企业针对海量向量数据的高实时性检索等场景需求。

CPU 助力大模型优化创新,星环科技与英特尔发布向量数据库解决方案

不过,大模型与数据系统的性能提升绝非易事,企业落地大模型,除了要确保模型的实时性、隐私安全和准确性之外,还有考虑系统性能、扩展性,以及部署实施成本等因素。为了系统软硬件结合调优,提升向量数据库性能,并降低企业落地大模型的成本,星环科技与英特尔联合发布了向量数据库解决方案。

结合英特尔至强可扩展处理器多方面的性能优势,并把软硬件进行深度融合,英特尔携手星环科技打造了一个整体更加高性能的解决方案,值得注意的是,这也是一个用 CPU 去实现大模型优化的创新方案。英特尔中国软件技术合作事业部总经理唐炯表示:“和星环科技的合作,能帮助英特尔从更完整的、端到端的客户需求角度来理解数据存储、数据治理、智能分析等技术需求,为中国市场交付更能够满足用户综合需求和使用习惯的硬件产品。”

具体来说,该解决方案得益于英特尔至强可扩展处理器里集成的 AVX512 扩展指令集,重写向量距离计算函数,降低向量计算所需 CPU 指令与 CPU Cycle 数量,能够充分发挥处理器高内存带宽优势。另外,方案采用 NUMA 友好的向量计算负载调度算法,避免 CPU 远程内存访问造成 CPU Stalling,充分发挥了英特尔至强可扩展处理器的多核性能优势。第三,基于数据离散度的浮点数矢量化算法,以及充分利用 VNNI 指令集,该方案进一步提升了向量计算的性能。

方案中使用的 AVX-512 是英特尔至强可扩展处理器中的一项集成内置加速器功能——英特尔® 高级矢量扩展 512(英特尔® AVX-512)。AVX-512提供针对 AI、分析、科学模拟、金融模拟和其他涉及基于矢量计算的计算密集型任务的内置加速,而无需其他独立加速器,从而在降低复杂性的同时也控制了成本。得益于Hippo向量数据库和至强可扩展处理器的性能优势,软硬件一体的联合解决方案整体性能可以实现20%-30%左右的提升



联合方案用向量数据库可以解决大模型领域知识实时性低、数据隐私安全、模型幻觉等问题,通过软硬件的深度优化,能够满足海量、高纬度向量数据处理对性能的极致需求,并具备低时延和高精确度等优势。对于企业而言,该方案可以让 AI 数据系统按需进行水平扩展,以容器化技术支持服务弹性扩/缩容,满足企业未来发展对海量、高维度向量数据存储和计算的需求,降低大模型二次训练的成本,并且通过系统自带 Embedding 工具和模型、高扩展、高性能等特性提升企业在大模型建设方面的总体拥有成本效益。

星环科技基础架构部副总经理刘熙指出,“与英特尔联合研发,共同优化星环科技的数据库产品,让向量数据库在通用 x86 服务器上就可以获取 AI 应用所需要的性能和特性。”此外,数智融合趋势下,AI 对数据的需求还有很多。刘熙也分享了对大数据技术的趋势观察和星环科技的实践成果,分别是湖仓集一体化、实时数据和历史数据融合分析、利用大数据技术增强大模型能力、利用大模型来增强大数据分析

而本次联合发布方案已经不是星环科技与英特尔第一次合作。刘熙表示早前双方已经联合研发推出了分析型数据库软硬件一体的解决方案。现在英特尔与星环的深层合作已经遍及 AI 大模型各层,希望全方位助力企业落地大模型并实现降本增效。

回到《CSDN AI 开发者生态报告》,我们能够看到,除了数据问题,让大模型技术落地的开发工作无比庞杂,开发者面临的问题还有如 AI 大模型技术基础设施不足、缺乏和难招聘 AI 技术人才,以及监管、法律风险与合规性等问题。灵活、性价比永远是企业落地新兴技术的关注重点,而基于 CPU 构建的 AI 数据方案,可以让企业更灵活的通过软硬件技术,落地大模型与 AI 应用,对大多数企业而言是更具可行性的技术路线。我们将持续关注大模型创新技术与应用落地实践。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/7793.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Pycharm远程同步的mapping与sync

用Pycharm进行项目远程部署的时候会遇到两个同步文件,一个是点击 tools—>deployment—>configration——>mapping 一个是链接虚拟环境的时候会有一个sync,那么这两种同步有什么区别呢? 区别就是,2包括1,要用…

常见错误以及如何纠正它们

团队和关键结果目标 (OKR) 之间的关系是深刻且至关重要的。总而言之,一切都应该是相互关联的。正如《团队的智慧》一书中所强调的: 在团队中,没有什么比每个成员对共同目标和一组相关绩效目标的承诺更重要的了,而团队对此负有共同…

【热门话题】实用Chrome命令:提升前端开发效率的利器

🌈个人主页: 鑫宝Code 🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 ​💫个人格言: "如无必要,勿增实体" 文章目录 实用Chrome命令:提升前端开发效率的利器引言目录1. 快速打开Chrome …

Django调用MTP服务器给指定邮箱发送邮件

Django调用MTP服务器发送邮箱 邮箱的激活链接含有用户数据不能直接发送需要对其进行加密 发送邮箱是借助SMTP服务器进行中转 一. 配置SMTP服务中的邮箱信息以及激活链接 1. 配置邮箱权限 打开网易邮箱设置点击POP3 开启选项 注 : 在打开的过程中会弹出授权密码一点要保存 …

C++ 递归函数

一 递归函数 递归函数(Recursive Function)即自调用函数,即在函数体内有直接或间接地自己调用自己的语句。 大多数递归函数都能够用非递归函数代替。 例如:求两个整数a,b的最大公约数。 算法描述: 大多数递归函数都能用非递归…

Angular中组件之间的传值

Angular中组件之间的传值 文章目录 Angular中组件之间的传值前言一、父亲向儿子传值二、儿子向父亲传值三、爷爷向孙子传值四、兄弟之间的传值 前言 Angular的组件是构成应用的基础单元,它们封装了HTML模板、TypeScript代码以及CSS样式,以实现特定的功能…

rag-embeddings基础流程

什么是检索增强的生成模型 LLM 固有的局限性 LLM 的知识不是实时的LLM 可能不知道你私有的领域/业务知识 检索增强生成 RAG(Retrieval Augmented Generation)顾名思义,通过检索的方法来增强生成模型的能力。 类比:你可以把这个…

CTK库编译-01

地址 官网地址:Commontk github地址:https://github.com/commontk/CTK 编译环境 Qt套件: IDE:VS2022 使用vs2022 文件->打开->cmake 修改根目录下的CMakeLists.txt 默认只编译core模块,所以需要把部分模块…

一文读懂Python的`__init__`,`__init__`方法的终极指南

大家好,今天给大家介绍一个Python中一个特殊的函数__init__。 在Python中,__init__方法是一个特殊的函数,它在创建类的新实例时自动调用。它的作用类似于其他编程语言中的构造函数,用于初始化对象的状态。这篇文章将带你深入了解…

资料总结分享:SAM,bam,bed文件格式

目录 sam文件 bam文件 bed 文件 sam文件 SAM(Sequence Alignment/Map)文件是存储测序数据比对结果的一种常见格式。SAM文件通常用于存储DNA或RNA测序数据在参考基因组上的比对结果。 SAM文件由多行文本组成,每一行代表一个比对结果。SAM文…

QX-mini51学习---(2)点亮LED

目录 1什么是ed 2led工作参数 3本节相关原理图分析 4本节相关c 5实践 1什么是ed 半导体发光二极管,将电能转化为光能,耗电低,寿命长,抗震动 长正短负,贴片是绿点处是负极 2led工作参数 3本节相关原理图分析 当…

计算图:深度学习中的链式求导与反向传播引擎

在深度学习的世界中,计算图扮演着至关重要的角色。它不仅是数学计算的图形化表示,更是链式求导与反向传播算法的核心。本文将深入探讨计算图的基本概念、与链式求导的紧密关系及其在反向传播中的应用,旨在为读者提供一个全面而深入的理解。 计…

嵌入式5-7

练习:优化登录框,输入完用户名和密码后,点击登录,判断账户是否为 Admin 密码 为123456,如果判断成功,则输出登录成功,并关闭整个登录界面,如果登录失败,则提示登录失败&a…

JavaScript异步编程——03-Ajax传输json和XML

Ajax 传输 JSON JSON 的语法 JSON(JavaScript Object Notation):是 ECMAScript 的子集。作用是进行数据的交换。语法更为简洁,网络传输、机器解析都更为迅速。 语法规则: 数据在键值对中 数据由逗号分隔 花括号保存对象 方括号保存数组…

远程桌面连接不上,远程桌面连接不上的专业解决策略

在信息技术领域,远程桌面连接是一种非常重要的工具,它允许用户从任何地点、任何时间访问和操作远程计算机。然而,当远程桌面连接出现问题时,可能会严重影响工作效率。以下是一些可能导致远程桌面连接不上的原因以及相应的解决方案…

Verilog刷题笔记47

题目: From a 1000 Hz clock, derive a 1 Hz signal, called OneHertz, that could be used to drive an Enable signal for a set of hour/minute/second counters to create a digital wall clock. Since we want the clock to count once per second, the OneHer…

普洱茶泡多少茶叶才算淡茶?

普洱茶淡茶一般放几克茶叶,品深茶官网根据多年专业研究与实践结果,制定了淡茶冲泡标准。在冲泡普洱茶淡茶时,茶叶的投放量是关键因素之一。淡茶冲泡标准旨在保持茶汤的清爽口感,同时充分展现普洱茶的独特风味。 根据《品深淡茶冲…

AMEYA360详解:蔡司利用纳米探针技术探索半导体微观电学性能

半导体器件尺寸不断缩小和复杂度增加,纳米探针(Nanoprobing)技术成为解决微观电学问题和优化器件性能的重要工具,成为半导体失效分析流程中越来越重要的一环。 随着功率半导体的快速发展,其厂商也开始密切关注纳米探针技术在PN结特性分析和掺…

js宏任务微任务输出解析

第一种情况 setTimeout(function () {console.log(setTimeout 1) //11 宏任务new Promise(function (resolve) {console.log(promise 1) //12 同步函数resolve()}).then(function () {console.log(promise then) //13 微任务})})async function async1() {console.log(async1 s…

贪吃蛇大作战(C语言--实战项目)

朋友们!好久不见。经过一段时间的沉淀,我这篇文章来和大家分享贪吃蛇大作战这个游戏是怎么实现的。 (一).贪吃蛇背景了解及效果展示 首先相信贪吃蛇游戏绝对称的上是我们00后的童年,不仅是贪吃蛇还有俄罗斯⽅块&…