重新理解百度智能云:写在大模型开放后的24小时

在这些回答背后共同折射出的一个现实是——大模型不再是一个单选题,而更是一个综合题。在这个新的时代帆船上,产品、服务、安全、开放等全部都需要成为必需品,甚至是从企业的落地层面来看,这些更是刚需品。 

作者| 皮爷 

出品|产业家 

过去的5个月,李亮很忙。

“从今年3月份文心一言发布之后,很多工业侧的企业,甚至是国央企,都主动来和我们探讨大模型的落地。”他表示,“也包括很多行业伙伴都找过来,说看如何一起打造具备服务共性的平台。”

作为百度智能云的一位工程师,过去的近半年时间里,他真切感受到了企业对AI大模型的热切程度。这种热切是企业对具备落地能力的新技术的期待,也更是担心落后的焦虑。

这不是个例。

伴随着OpenAI和国内一众大模型企业的频频发声,越来越多的“产业+AI大模型”框架正在清晰地呈现在企业面前,相较于之前的元宇宙、区块链等技术,AI大模型应用距离企业的真实场景更近,应用路径也更短,效果更“立竿见影”。

但在热火朝天的AI实践里,越来越多企业开始逐渐发现一个更为现实的问题:最佳的大模型切入点在哪?或者说,企业应该如何高效地构建适配自身的大模型?

问题背后,对应着一众企业在大模型转型路上的“挫折”。“现在很多企业的问题是有意愿,但没渠道;或者是尝试后,整体进度很慢。”一位投资人告诉我们,“中间包括数据清洗、标注,以及prompt的生成、模型微调、训练这些,市面上都没有特别易用的方式。”

实际上,这些现象也构成了尽管企业对大模型热情依旧高涨,但越来越多开始在迈出第一步同时保持“谨慎”态度,这种观望在清晰与否的转型路径,也更在参与其中的成本性价比。

不过,AI加速的好消息依旧在传来。在刚刚过去的8月31日,百度文心一言、商汤商量SenseChat等大模型首批通过了《生成式人工智能服务管理暂行办法》备案,正式面向全社会开放服务。此外,据悉,针对企业用户,百度智能云还将在9月5日举行的2023百度云智大会上宣布四大配套举措,旨在助力企业以更低成本更快捷方式使用上大模型。

在滚滚而来的AI洪流中,企业应该如何选择适合自己的大模型?或者说,在如今大模型开放的AI时代,怎样的AI大模型才能成为企业在AI数智化时代的最佳航船?

在8家大模型获批上线的当下,这个问题正在被加速推到台前。

一、AI需求,和背后的新产业命题

在得出答案之前,不妨先来看天平的另一侧:即客户AI落地的难点到底在哪?

“现在大家对于大模型在行业会怎么落地,有哪些完全颠覆性的应用,或者说这种能带来很大风潮的应用,会出现在哪儿,也都不是很确定。其实我们客户也很清楚的认识到这一点。”百度智能云一位解决方案工程师表示。

这是如今国内很多企业面临AI大模型的共性。即尽管企业对自身的业务场景有充分的认知,但大模型能做到哪一步,以及如何使用大模型进行原有业务的降本增效,这都是未知命题。

而对部分已经尝试的企业,问题则是更为尖锐。

“我们最开始使用的是国外开源模型,但最近也在考虑尝试重新接入国内的大模型,因为国外开源的中文语义理解太差了,基本的交互都出现问题。”一位低代码企业创始人这样告诉我们。

有同样感受的是另外一家农业方向的企业,在和其创始人的交流过程中,他直言,“从最开始做prompt,到后面一轮一轮的训练,包括数据清洗、高质量标注等等,整个过程的开销非常大的,训练效果还不是特别好,甚至不如原有界面。”截止到目前,这家企业的大模型产品仍然处在内测阶段,尚未对外使用。

在这些之外,更多的企业则是停滞在大模型的“第一步”——选型。

不过,在选型阶段,企业的顾虑有所不同。对目前大部分中小企业而言,其选型难的原因在于不清楚哪家底层大模型企业的产业能力强,这些能力包括产品能力,也更有对模型微调、知识增强等服务落地的要求。

而对大型企业而言,除了数据安全之外,产业理解和复用性是企业的最核心考量。“大企业更看重的是,你不仅要在我看重的这一点的业务上能做出效果,还有就是要在整个集团的复用性上,能和既有业务结合的效率要更高。”上述工程师表示。

在他的感知里,以央国企为代表的大型企业更多地希望大模型服务商是一个教练的角色,不仅要给到好的工具,还要教会企业怎么用,从长期提升价值。

从更大的视角来看,当下大模型落地的难点大概分为三个层面,一是企业不知道选择怎样的大模型,或者说企业不知道自身的需求怎样的大模型可以满足,视野范围内的大模型选项太少;二是对部分选择自建大模型的企业而言,其在prompt提示词和数据清洗、标注以及中文增强等工具链层面屡屡碰壁,投入太大或者经验不足;三是企业自身的数据安全和合规性较高,同时需要较深的产业know-how,对大模型服务商的功能能力要求较高。

不难感知到的是,如果从原子化服务的角度拆解来看,当下国内企业对大模型的需求已然不仅在产品层面,如参数、逻辑推理等硬核指标,更大的需求点涌现在服务侧,即对不同企业需求的一站式满足,这些满足或是在prompt层面、或在中文增强、数据标注、训练层面,再或是在产业场景适配乃至数据安全,以及最核心的成本层面。

大模型,已然从一道单纯的技术命题,悄然进化为一道糅合技术、产品、服务等全部环节的产业综合命题。

二、千帆背后,看见大模型的“真实表达”

在忙碌的几个月里,李亮对一家企业印象很深刻。

“有一个矿山行业的合作伙伴,在大模型的领域非常期望跟我们合作,想要通过大模型去进行整个的矿山的智慧化服务,包括安全生产的管理,安全生产的预警等等。”他说道,“我们现在在跟他进行多轮测试,有很多也有非常不错的测试效果。”

他的意外之处在于,像矿山这样的偏传统的企业,也开始主动找到百度寻求大模型方面的进展和落地。据了解,如今双方经过多轮共创,一个基于矿山场景的大模型已经接近成型。

实际上,这不是第一个主动找到百度智能云的企业。而百度智能云对这些产业伙伴的一个统一服务界面,正是在今年3月份正式推出的一站式企业级大模型平台“百度智能云千帆”。

作为唯一TO B大模型界面,百度智能云千帆也恰构成着百度大模型在如能源、金融、政务、交通等不同产业场景的真实表达,以及包括数据管理、模型训练、评估&优化、预测服务和Prompt工程和插件服务等全部大模型开发周期的能力展示。

而在刚刚过去的8月,它更是交出了一张亮眼的成绩单。

一个亮眼之处是,在本次对外公布的模型种类中,百度智能云千帆除了文心大模型的核心外,其也更全面接入Llama 2全系列、ChatGLM2-6B、RWKV-4-World、MPT-7B-Instruct、Falcon-7B等33个开源大模型,成为国内拥有大模型最多的平台。

换言之,基于百度智能云千帆的“模型仓库”,除了文心大模型之外,企业可以自行适合自身的其它基础大模型产品。

此外,和其它模型仓库不同的是,百度智能云千帆对“模型仓库”内的模型进行了“二次加工”。

比如,在安全性层面,千帆对所有接入的第三方模型均做了模型安全增强,不仅保障文心大模型的内容安全,还保障了第三方大模型的安全输出;再比如在成本层面,对每一个接入的大模型,千帆都做了二次性能增强。

根据测算,在性能调优后,第三方模型体积可压缩至25%-50%,推理成本可降低50%。这意味着,相较于直接调用,企业在千帆平台上使用这些模型可极大地节约成本,提升效果。

与此同时,千帆对接入的大模型做了深度适配,其为企业提供模型再训练的全套工具链以及多种形式模型调优,其中包括SFT(全量参数微调、Prompt Tuning、Lora)及强化学习(奖励模型学习、强化学习训练)等等。

换言之,基于百度智能云千帆,不论是选择文心大模型,还是平台上的第三方开源大模型,企业都可以端到端地搭建自身的专属模型

不仅于此,在对外的服务能力上,百度智能云千帆可以为企业提供公有云和私有部署两种方式,包括上文所说的大模型落地难的推理、微调、托管,企业都可以基于公有云模式接入使用。而在本地部署方面,百度智能云千帆也更是可以纯软件和软硬一体的交付方式,充分满足企业本地部署的要求。

实际上,这些能力在也构成了百度智能云千帆在一众产业侧的真实落地。根据不完全统计,在过去的5个月时间里,千帆大模型平台在超过400个真实产业场景中实现了落地。截止目前,百度文心大模型已拥有中国最大的产业落地规模。

这些落地构成了中国大模型赛道的一个个特殊节点。比如在能源层面,百度智能云和国家电网联合打造的“设备运检知识助手”入选北京市首批十大行业大模型应用案例。与深圳燃气联合发布的“深燃-百度·文心大模型”,基于大模型能力,只需要进行微调,就可以形成针对性的行业模型能力,完成多个应用场景的任务。

再比如在金融层面,百度智能云与中信金控联合打造了基于大模型的数字人,让每一位银行客户都有自己专属的理财顾问,可以承担包括投研助手、投顾助手、营销助手、合规助手等在内的多个角色。

这些真实的产业落地侧写也更在一众中小企业侧。根据不完全统计,已经有超过10万家企业申请测试,这个数目伴随着如今面向全社会层面的开放动作,也更在加速倍增。据了解,在在开放的24小时内,文心一言共计回复网友问题数超过3342万个。

可以说,不论是在产品层面,还是服务层面,千帆大模型为企业提供的是一个开放兼容的大模型选择界面,在这里,企业既可以实现从0到1的端到端大模型搭建,也更可以寻求到包括数据标注、prompt在内的一众工具链能力,以最低的成本和门槛,构建出自身的专属大模型。

三、AI时代,我们需要怎样的大模型?

如今,越来越多人开始讨论的一个命题是:在如今的产业数字化时代,我们需要怎样的大模型?有的人的回答是产品,有的人的回答是服务,也更有人的回答是数据安全。

在这些回答背后共同折射出的一个现实是——大模型不再是一个单选题,而更是一个综合题。在这个新的时代帆船上,产品、服务、安全、开放等全部都需要成为必需品,甚至是从企业的落地层面来看,这些更是刚需品。

不过,这些问题也正在被作答。

以百度智能云为例,除了在产业领域侧联合企业进行落地之外,其也更是和生态伙伴联合打造了更多基于特定场景的产品。比如和软通动力打造的大模型基础设施软通天璇2.0,与微盟联合构建的AI应用型产品WAI,以及和金蝶、金山办公一起研发的专属领域大模型产品。

在这个新的团战背后,大模型正在以更加真实的姿态出现在各个产业场景和各个企业应用中,不仅是金融、能源,也不仅是大型的央国企,在如今百度智能云千帆的底座之上,越来越多的产业场景和越来越多体量的企业都正在齐力迈出AI大模型时代的第一步。

此外,从更大的视角也同样能清晰看到的是,这些产业的真实表达也恰在构成着大模型企业的产品和营收新增长飞轮。

根据不完全统计,截至目前,百度智能云千帆平台上有103款Prompt模板,包含对话、编程、电商、医疗、游戏、翻译、演讲等十余个场景。其中既有基于百度智能云在产业实践中积累的Prompt模板,也有来源于文心一言高频用户的Prompt模板。可以预见的是,作为大模型训练中最核心的环节之一,这些Prompt模板将使得千帆更容易被企业和市场欢迎。

而在财报层面,根据百度发布的2023年Q2财报显示,第二季度百度营收341亿元实现加速增长,净利润高速增长44%。此外,由《IDC中国AI公有云服务市场份额,2022》报告数据显示,2022年中国AI公有云服务总体市场79.7亿元,其中百度智能云占28.9%排名第一。

或者可以说,在AI大模型在成为各个产业基建企业验金石的同时,它也更在成为一个新的发动机。

进度仍在持续推进。在接下来的9月5日,百度智能云还将在2023百度云智大会上宣布四大配套举措。

据内部人士透露,在此次大会上,百度智能云将全面升级“千帆大模型平台”,升级将覆盖算力基础设施、大模型工具链、高质量数据集等等。此外,其将推出基于文心大模型重构的行业解决方案,同时还将发布覆盖服务营销、办公提效、生产优化三大领域的10款企业级的AI原生应用产品。大模型相关的生态政策也将在大会上同步披露。

或许再来回答前面那个问题,即“我们需要怎样的一个大模型?”——这不仅是一个对企业而言,寻找最佳选项的命题,也更是对大模型企业而言,锚定未来和自证的长期思考。

恰如百度相关负责人在采访中所说,“未来肯定还会有更多AI产品,或许这些产品不是百度开发出来,但企业都可以基于百度智能云千帆开发出来,这是我们想要的,也是会一直持续去做的。”

答案,已经在成形的路上。

*文中李亮为化名

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/65609.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

c语言每日一练(13)

前言:每日一练系列,每一期都包含5道选择题,2道编程题,博主会尽可能详细地进行讲解,令初学者也能听的清晰。每日一练系列会持续更新,上学期间将看学业情况更新。 五道选择题: 1、程序运行的结果…

Go死码消除

概念: 死码消除(dead code elimination, DCE) 是一种编译器优化技术, 作用是在编译阶段去掉对程序运行结果没有任何影响的代码 和 逃逸分析[1],内联优化[2]并称为 Go编译器执行的三个重要优化 效果: 对于 const.go代码如下: package mainimport "fmt"func max(a, b i…

一篇文章教会你如何编写一个简单的Shell脚本

文章目录 简单Shell脚本编写1. 简单脚本编写2. Shell脚本参数2.1 Shell脚本参数判断2.1.1 文件测试语句2.1.2 逻辑测试语句2.1.3 整数值测试语句2.1.4 字符串比较语句 3. Shell流程控制语句3.1 if 条件测试语句3.1.1 if...3.1.2 if...else...3.1.3 if...elif...else 4. Shell脚…

汽车自适应巡航系统控制策略研究

目 录 第一章 绪论 .............................................................................................................................. 1 1.1 研究背景及意义 ..........................................................................................…

文件夹中lib,dll含义

.dll文件是动态链接库(Dynamic Link Library)的缩写,它包含了一组可执行的函数和数据,供程序调用。它可以被多个应用程序共享和重用,减少了代码的冗余。通过动态链接库,可以实现代码的模块化和提高代码的复…

ELK安装、部署、调试(五)filebeat的安装与配置

1.介绍 logstash 也可以收集日志,但是数据量大时太消耗系统新能。而filebeat是轻量级的,占用系统资源极少。 Filebeat 由两个主要组件组成:harvester 和 prospector。 采集器 harvester 的主要职责是读取单个文件的内容。读取每个文件&…

机器学习技术(六)——有监督学习算法之线性回归算法实操

机器学习技术(五)——有监督学习之线性回归算法实操 引言: 机器学习监督算法是一种基于已有标记数据的学习方法,通过对已知输入和输出数据的学习,建立一个模型来预测新的输入数据的输出。这种算法模仿人类的学习过程&a…

安防监控/视频汇聚平台EasyCVR调用rtsp地址返回的IP不正确是什么原因?

安防监控/云存储/磁盘阵列存储/视频汇聚平台EasyCVR可拓展性强、视频能力灵活、部署轻快,可支持的主流标准协议有GB28181、RTSP/Onvif、RTMP等,以及厂家私有协议与SDK接入,包括海康Ehome、海大宇等设备的SDK等,能对外分发RTSP、RT…

docker 笔记2 Docker镜像和数据卷

参考: 1.镜像是什么?(面试题) 是一种轻量级、可执行的独立软件包,它包含运行某个软件所需的所有内容,我们把应用程序和配置依赖打包好形成一个可交付的运行环境(包括代码、运行时需要的库、环境变量和配置文…

算法笔记——路径问题

在引入介绍如何写一个算法的时候,我们先引入一个题作为例子 1137. 第 N 个泰波那契数 - 力扣(LeetCode) 作为刚开始学习算法的我们,看到这个题目的时候,应该想好以下的问题: 1.状态表示 我们要用什么来表…

Windows7安装SSH客户端的解决方案

大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的…

SQL sever中库管理

目录 一、创建数据库 1.1库界面方式 1.2SQL命令方式 二、修改数据库 2.1库界面方式 2.2SQL命令方式 三、删除数据库 3.1库界面方式 3.2SQL命令方式 四、附加和分离数据库 4.1附加和分离数据库概述 4.2作用 4.3附加和分离数据库方法 4.4示例 一、创建数据库 1.1库…

第 3 章 栈和队列 (循环队列)

1. 背景说明 和顺序栈相类似,在队列的顺序存储结构中,除了用一组地址连续的存储单元依次存放从队列头到队列尾的元素之外, 尚需附设两个指针 front 和 rear 分别指示队列头元素及队列尾元素的位置。约定:初始化建空队列时&#x…

XmlDocument.SelectNodes 不起作用

今天采用Xpath读取Xml节点,怎么都读不出。 问题分析: 错误代码如下: XmlDocument xmlD new XmlDocument();xmlD.PreserveWhitespace true;xmlD.LoadXml(xStr);xmlD.SelectNodes("job-scheduling-data/schedule/job");经排查 do…

Python学习笔记——从面试题出发学习Python

Python学习笔记——从面试题出发学习Python Python学习笔记——从面试题出发学习Python1. 可变数据类型与不可变数据类型,深拷贝与浅拷贝,函数参数的传递机制1.1 变量与对象1.2 可变数据类型与不可变数据类型1.3 深拷贝与浅拷贝1.4 函数参数的传递机制1.…

Matlab(画图初阶)

目录 1.plot()函数 2. hold(添加新绘图是否保留旧绘图) 3. Plot Style 3.1 线型 3.2 标记 3.3 颜色 ​编辑 4. legend() 5.X 、Y and Title? 6. Text()和annotation() 7.line(创建基本线条) 7.1 基本语法 7.2 指定线条属性 7.3 更改线条属性 8.图像属性 8.1 …

c++入门一

参考:https://www.learncpp.com/cpp-tutorial/ When you finish, you will not only know how to program in C, you will know how NOT to program in C, which is arguably as important. Tired or unhappy programmers make mistakes, and debugging code tends…

软考高级架构师——6、软件架构设计

像学写文章一样,在学会字、词、句之后,就应上升到段落,就应追求文章的“布局谋 篇”,这就是架构。通俗地讲,软件架构设计就是软件系统的“布局谋篇”。 人们在软件工程实践中,逐步认识到了软件架构的重要性…

HarmonyOS Codelab 优秀样例——购物应用,体验一次开发多端部署魅力

一. 样例介绍 本篇Codelab基于自适应布局和响应式布局,实现购物应用在手机、折叠屏、平板不同屏幕尺寸设备上按不同设计显示。通过三层工程结构组织代码,实现一次开发,多端部署 。 手机运行效果如图所示: 折叠屏运行效果图&#x…

C语言:大小端字节序存储

一、大小端字节序存储介绍 大端字节序存储模式:把一个数据低位字节处的数据存放在高地址处,数据高位字节处的数据存放在低地址处 小端字节序存储模式:把一个数据低位字节处的数据存放在低地址处,数据高位字节处的数据存放在高地址…