产业,到底需要什么大模型?

[

产业究竟需要怎样的大模型?关于这个问题,本文作者便提出了他的看法,并总结了产业大模型目前阶段的三点落地挑战。一起来看看,或许可以帮助你更好地理解大模型与行业、与产业的融合。

img

写下这篇的起因,是前不久的一件事。

我们参与了一个大模型与行业结合的主题论坛。活动结束之后,来自行业主办方的一位代表跟我们交流时却说:“你们一直在说大模型。到底什么是大模型?多大才算大?为什么不能用小模型?”

这一系列问题又一次让我们意识到,智能化的供需双方很多时候根本处在两套话语体系。你这边Transfomer、Agent的说了半天,那边可能还在好奇大模型这三个字到底是怎么来的。

这种隔膜,在AI时代尤为严重。因为AI技术涉及的链条更长,做算法的、做云的、做硬件的、做IT解决方案的,以及最后买单的,大家可能在各说各的,谁也没打算真正理解谁。

今天,各家都在说产业大模型、行业大模型。确实从技术逻辑上看,很容易发现大模型能够给很多行业带来巨大的生产力释放,而从技术路线上看,中国企业对智能化的接受度更高、需求更强烈。大模型走向产业实现数实融合,是中国AI最具特色的一条脉络,在数字中国的大背景下具有极强的宏观战略意义。

img做了8年产品经理后,我是这么看产品经理的我个人是从非常初级的产品经理做起,再到负责一个大产品的项目管理,现在有幸跳出了日常基础的工作更多的去看产品的PMF,product strategy…查看详情 >

但在实践中,这条路却充满了挑战与误解。

毕竟AI算法公司做toB,十家有九家做不成。在大模型toB的新机会窗口前,我们首先要确定产业究竟需要怎样的大模型?

一、产业大模型,就不是一种模型

AI公司做大模型结合行业,最大的误区在于搞不清供需关系。

诚然,目前行业对大模型的认可与接纳程度已经比较好,但智能化项目依旧是一个绝对的买方市场。技术供应商需要去适配最终用户的需求、能力、背景,甚至沟通话术和商业习惯。

但由于做AI大模型的公司,涌入了大量互联网领域的人才和资金。互联网的供需逻辑是单点供应对大量需求,我有一招鲜天下涌进来。而大模型在很多行业的适配又是很容易就能想到的。比如工厂需求配料分析,银行需要投资分析,那我的大模型不是都能分析吗?

于是,在这样的“风口思维”下,很多AI公司陷入了一个巨大的误区:他们认为我有大模型,各行业的客户都应该来找我。我推出两三个行业的案例,其他行业都应该认可。我的这个大模型哪里都能用,所以它就叫产业大模型。

无论这些AI从业者是真的相信大模型等于产业万金油,还是仅仅是故意吹成这样。在产业客户看来,这一幕就等于胡说八道。他们会觉得,金融业用的技术,关我煤矿什么事?如果有一种食品,说是猫能吃牛能吃人也能吃,你敢吃吗?

产业需要大模型做的第一件事,就是不要笼统的天差地别的各个行业归纳为“产业”两个字就结束了。即使在某个行业内,大模型都仅仅能解决行业的一个或几个问题,更不可能有一种模型能够“包治百业”。

做IT的都知道,有产品更要有服务,懂技术更要懂行业。但做AI的企业,尤其是拿着热钱涌入大模型赛场的企业,普遍对产业需求的差异性缺乏了解和尊重。

当然,不同行业对大模型的需求也有共通之处。比如对基础的对话、CV、多模态能力。但更多的情况下,每个行业的只能用意愿、基础数字能力,乃至安全需求、时延需求、运维需求都不相同。在今天的阶段,一种大模型能够在具体行业内复制推广已经非常不容易,更别想一口吃下几个甚至几十个行业。

产业智能化,优先级永远是产业大于智能化。

二、不提硬件和工程化,约等于瞎耽误功夫

很多做数字化、智能化的企业,在看了客户环境之后会奇怪这么一件事:客户花了大钱买回来的东西,其实就是很简单的软件封在一个盒子里,然后按照行业要求做了点按钮、UI之类的东西。甚至这些软件很多都是国外很古早的开源软件进行再封装,技术上早就落后了。这时他们会感叹,行业客户的钱可真好骗啊。

可是问题来了,如果我们换个角度思考这个问题,要是没有这层封装,企业要怎么用呢?难道一家工厂、一座矿山、一片林场,要招来和培养一大堆云计算、AI算法层面的人才?而且要让这些数字化人才指导整个企业的生产、运营和销售?这显然是不靠谱的。

所以,一个有点反常识的事实是,相比于天花乱坠的先进技术,行业用户往往更在乎那层“壳”。那层壳就说硬件化和工程化,是将技术能力按照最终的使用需求进行封装、管理和维护。虽然最后组装出来的东西可能很难用,可能不先进,但对于行业用户来说,有的用,员工能学会,才是智能化的最重要条件。

在讨论行业大模型时,今天也经常会陷入这个误区。从业者往往过分关注算法层的领先性、国际性,跟参数规模和测试纪录较劲,把目光聚焦在软件上。但行业需要大模型做的,是跟此前的数字系统较劲,跟使用成本较劲,跟操作门槛较劲。这就需要大模型考虑硬件环境、网络环境、存算资源、操作系统,甚至考虑部署环境的电力供应、湿度、温度。

产业大模型要做的第二件事,是必须兼顾硬件适配和工程化问题。

大模型能否落地,都在说要找准场景。但什么是场景?最后能起作用的那个地方才叫场景。

绝大部分企业,都不是IT为导向。甚至大部分企业根本无法派专人去仔细了解什么是大模型。这个事情在漫长的时间里都无法改变。

山不会过来看你,所以你要去看山。

很多人把大模型比作一座金矿,那么训练大模型仅仅是挖到金矿,通过工程化方法,讲大模型融入到行业已有的数字化基础设施,才是把金矿运出山。

三、专家下工厂,终究要不得

很多AI厂商无论是在给客户讲故事,还是面向公众做传播,总是会提起这么一段:你们不要担心,我们有专家有博士后扎根行业。下工厂,下农田,一驻守就是几个月。

如果你是大模型的潜在行业用户,那么这个故事听听就算了。专家驻厂确实是真的,但那个厂极大概率不是你的厂。

事实上,AI专家亲临产业一线,是缩短行业需求与大模型供给之间的有效路径。这也是一个产业智能化必经的发展过程。

但这个过程必然也只能是暂时性的,不可能长久。试想一下,如今大模型正在风口浪尖,专家们都是什么身价?一个专家组入驻现场,就这个薪资成本哪家实体企业能撑得住?

AI企业所宣称的专家驻厂,其实是在做案例、做测试。一般都是和行业内的头部客户合作,厂商愿意以亏损为代价把模型跑通,观察有哪些具体问题。

**专家可以下厂,但专家肯定不能经年累月驻守一家又一家工厂。**这是AI厂商进入某行业时的标准动作,但往往会有意无意被理解为一个常规动作,可真要只能依赖专家下厂来推广大模型,那么AI永远也无法落地,因为这个成本谁也承受不起。

产业大模型要做的第三件事,是技术具有行业内的低门槛可复制性,不能大量依赖人工进行订制化合作。

尤其需要注意的是,目前阶段大中型企业在智能化上的投资愈发谨慎,试错成本不能过高。实验性与不确定性太强的大模型落地方案,在目前阶段已经很难得到大客户认同,更遑论成千上万的中小客户,更是不可能依赖重人工投入的方式来推动。

总结一下,产业大模型目前阶段的落地挑战有三点:

  1. AI厂商总把大模型想象为万金油,但行业需要的是理解和专注。
  2. AI厂商总是关注算法创新,但行业需要的是工程化和可操作。
  3. AI厂商大量宣传依靠人才能力跑通的个案,但行业需要的是低成本和可复制。

大模型落地产业,正是旭日东升时,但也要有意识去清扫一些积雪,而回到用户界面,往往就能找到更多问题的答案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/23525.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[已解决]FinalShell连接CentOS失败:java.net.UnknownHostException: centos

报错: 解决办法: 1.查看Windows:C:\Windows\System32\drivers\etc\ 2.拷贝hosts文件,用记事本打开hosts文件 3.添加主机名centos及对应IP地址,保存并粘贴覆盖C:\Windows\System32\drivers\etc\中的hosts文件 4.打开cmd命令窗口输…

Mac下删除系统自带输入法ABC,正解!

一、背景说明 MacOS 在 14.2 以下的系统存在中文输入法 BUG,会造成系统卡顿,出现彩虹圆圈。如果为了解决这个问题,有两种方法: 升级到最新的 14.5 系统使用第三方输入法 在使用第三方输入法的时候,会发现系统自带的 …

RabbitMQ启动报错:Error during startup: {error, {schema_integrity_check_failed,

报错信息如下: Error during startup: {error,{schema_integrity_check_failed,[{table_attributes_mismatch,rabbit_user,[username,password_hash,tags,hashing_algorithm,limits],[username,password_hash,tags,hashing_algorithm]},{table_attributes_mismatch…

集合进阶相关基础及底层原理

集合体系结构 单列集合: Collenction 每次只能添加一个值,其中红色是接口,蓝色是实现类 图来自黑马程序员网课 List系列集合:添加的元素是有序,可重复,有索引 Set系列集合:添加的元素是…

搜索与图论:深度优先搜索

搜索与图论&#xff1a;深度优先搜索 题目描述参考代码 题目描述 参考代码 #include <iostream>using namespace std;const int N 10;int n; int path[N]; bool st[N];void dfs(int u) {// u n 搜索到最后一层if (u n){for (int i 0; i < n; i) printf("%d …

ICPC2024 邀请赛西安站(7/8/13)

心得 [ICPC2024 Xian I] ICPC2024 邀请赛西安站重现赛 - 比赛详情 - 洛谷 7表示赛时ac了7个&#xff0c;8表示含补题总共ac数&#xff0c;13表示题目总数 题目 M. Chained Lights 打表&#xff0c;发现只有k1是YES //#include <bits/stdc.h> #include<iostream&…

模型评估指标(三)

模型评估指标三 1、模型评估回顾2、综合分类模型评估指标2.1、F1-Score与Fβ-Score2.2、灵敏度与特异度2.3、ROC曲线2.4、AUC曲线3、分类模型评估指标总结4、Sklearn模型评估指标1、模型评估回顾 本文接上篇:模型评估指标(二) 分类模型的评估与回归模型的侧重点不同,回归模型…

【智能算法】大蔗鼠算法(GCRA)原理及实现

目录 1.背景2.算法原理2.1算法思想2.2算法过程 3.结果展示4.参考文献5.代码获取 1.背景 2024年&#xff0c;JO Agushaka受到自然界中大蔗鼠在交配季节和非交配季节觅食行为启发&#xff0c;提出了大蔗鼠算法&#xff08;Greater Cane Rat Algorithm, GCRA&#xff09;。 2.算法…

保利威观看页SDK 官方VUE开源项目 polyv-web-live-watch-sdk

一、安装:node、npm 二、下载源码 polyv-web-live-watch-sdk: 保利威直播观看 SDK 官方文档:保利威帮助中心 进入项目根目录 npm ci #安装依赖,如果 CI 失败,请试一下 npm ci --no-cache --registry=https://registry.npmmirror.com/ npm run dev #启动项目 执行完成后…

Qt图标字体文件中提取字体保存为图片

本文借用别人写的一个IconHelper来做说明。 1. 加载一个字体文件 QScopedPointer<IconHelper> iconHelper(new IconHelper(":/fa-regular-400.ttf", "Font Awesome 6 Pro Regular"));构造函数 IconHelper::IconHelper(const QString &fontFile…

【基础】LwM2M 通讯协议

【基础】LwM2M 通讯协议 LwM2M 协议基础LwM2M 简介LwM2M 基本架构LwM2M 资源定义 LwM2M 协议实现开源协议实现Java LwM2M Client LwM2M 协议基础 LwM2M 简介 LwM2M 的全称为 Lightweight Machine-To-Machine&#xff0c;是一种适用于物联网设备的轻量级的通讯协议&#xff0c…

Flutter基础 -- Flutter布局练习(小项目)

目录 1. Splash 布局&#xff08;第一页&#xff09; 1.1 目标 1.2 当前效果图 1.3 创建 Splash 界面 1.4 设置 MaterialApp 1.5 设置 Splash 背景色 1.6 布局 Splash 界面 1.7 总结 2. Splash 圆角图片 2.1 目标 2.2 当前效果图 2.3 蓝湖下载图片 2.4 图片导入项…

在编程Python的时候发生ModuleNotFoundError: No module named distutils报错怎么办

1.先查看Python版本 首先我们先去打开终端就是先widr再输入cmd 然后进去在输入Python -V要注意大小写 我的版本是3.9.7版本但是我使用的PyCharm 是 2021.1.1 x64版本没有办法主动去识别因为这个版太低了你的Python版本很高所以无法识别 2.解决方法 只需要把你的Python现版…

微信公众号【原子与分子模拟】: 熔化温度 + 超导电性 + 电子化合物 + 分子动力学模拟 + 第一性原理计算 + 数据处理程序

往期内容主要涵盖&#xff1a; 熔化温度 超导电性 电子化合物 分子动力学模拟 第一性原理计算 数据处理程序 【1】熔化温度 分子动力学 LAMMPS 相关内容 【文献分享】分子动力学模拟 LAMMPS 熔化温度 晶体缺陷 熔化方法 LAMMPS 文献&#xff1a;金属熔化行为的局域…

vscode ctrl+鼠标左键无法跳转

打开设置&#xff0c;搜索intel…… 将这个智能感知改成default就可以了&#xff0c;我之前是在disable处。 分析了一下&#xff0c;其实跳转功能主要是根据上下文语法分析来实现的&#xff0c;并不是简单得全文匹配&#xff0c;因此需要相关得语法分析工具。 那么为什么默认式…

微软Edge浏览器深度解析:功能、同步、隐私与安全

微软Edge浏览器是微软公司开发的一款网页浏览器,它基于Chromium内核,提供了快速、安全和兼容性良好的网页浏览体验。以下是关于微软Edge浏览器的详细信息和使用指南: 微软Edge浏览器的主要特点: 1. 基于Chromium内核: 渲染引擎:Chromium内核是基于开源项目Blink的,它…

可视化数据科学平台在信贷领域应用系列五:零代码可视化建模

信贷风控模型是金融机构风险管理的核心工具&#xff0c;在信贷风险管理工作中扮演着至关重要的角色。随着信贷市场的环境不断变化&#xff0c;信贷业务的风险日趋复杂化和隐蔽化&#xff0c;开发和应用准确高效的信贷风控模型显得尤为重要。信贷风险控制面临着越来越大的挑战和…

问你为什么选择Kafka,你会怎么回答?

可靠的含义在百度百科的解释是&#xff1a;可以信赖、可以相信、可靠的朋友。那Kafka究竟是不是一个可靠的朋友呢&#xff1f;既然全世界绝大部分高可用系统都有Kafka的支持&#xff0c;Kafka必定有其过人之处&#xff0c;跟着我来分析分析。 另外多提一嘴Kafka在GitHub目前已…

六西格玛培训,带你解锁职场超能力工具!

当提及六西格玛培训的精髓时&#xff0c;我们不得不提到那些强大而实用的工具&#xff0c;它们如同探险者的指南针&#xff0c;引导我们走向卓越。今天&#xff0c;就让我们一起揭开这些神秘工具的面纱&#xff0c;探寻六西格玛背后的智慧。 首先&#xff0c;DMAIC流程是六西格…

cesium 漫游

token记得换成您自己的&#xff01;&#xff01;&#xff01; 申请cesium的token 官网【Cesium: The Platform for 3D Geospatial】 <template><div id"cesiumContatiner"><!-- <div id"mapContainer1"></div> --></di…