大模型应用如何点燃?

▎****尽管在中国,关于大模型的商业模式的讨论尚显早期,但智能体,尤其是专业智能体,蕴藏着巨大的潜力。

ChatGPT 还没有颠覆世界。

身处“第三次信息革命”,很多人被浓烈的FOMO(Fear of Missing Out)情绪裹挟。

业界的共识是,随着技术迭代曲线放缓、基础大模型赛道的竞争格局企稳,生成式AI市场的性质正在发生变化,更多的创新和价值创造正在向应用层汇聚。但目前的现状是,2C端入口难觅超级应用,2B端高附加值的闭环应用尚未规模化呈现。

从“百模大战”到“降价潮”,从“卷技术”到“卷价格”再到“卷应用”,真正可行的商业模式究竟几何——擅长回答问题的GPT们还无法给出答案。国内厂商蚂蚁、字节、腾讯以及初创企业已经在趟不同的路了。或许,他们的行动能带来未来的答案。

国内首款办事型AI生活管家“支付宝智能助理”


当AI进入“补贴互联网时代”


李开复说,美国人的“ChatGPT时刻”发生在17个月前,但中国用户却还在翘首以待属于自己的“中国式AI时刻”。

比“AI时刻”更早到来的是中国人熟稔的大模型“价格战”。6月,OpenAI发出封禁邮件选择“脱钩”,几乎所有国产大模型均表示要以降价或免费的方式兼容OpenAI。5月,字节跳动旗下云平台火山引擎宣布,其自研的豆包大模型正式对外提供服务,并给出大幅低于行业主流水平的定价。随后,阿里、百度、腾讯、讯飞等厂商纷纷跟随降价。

行业计价标准从以分计价发展到以厘计价。可以说,“百模大战”硝烟未净,国内大模型已从参数规模、性能指标“卷”到了token价格。AI快速进入了补贴互联网时代。

各大模型降价的目标很明确:吸引开发者,推动大规模应用落地。但有业内人士认为,当前的大模型价格战,表面上是在降低使用门槛,实际则是由于市场需求不足,企业不得已而为之。

在供给端,价格战的背后是当前大模型产品能力的逐渐趋同——这也并不是仅仅中国市场的问题,Scaling Law 是否还会持续有效最近受到热议也与此有关。

最典型的信号是GPT-5的一再跳票。OpenAI首席技术官Mira Murati近日透露,GPT-5有望在2025年底或2026年初推出,而市场此前的预测时间是2023年底或2024年夏季。

猎豹移动董事长兼CEO傅盛认为,目前大模型在性能上遭遇了提升瓶颈,各家难以拉开显著差距,于是降低成本、降低售价成为了当前各家公司的首要任务。

低价是优势,但不一定构成竞争力。只有真正能结合场景,把大模型用起来,才能疏通供需两端。

工作与娱乐:大模型应用的两个场景


中国大模型市场的竞争无疑非常激烈。但历史经验告诉我们,竞争是产品创新最重要的催化剂。

没有科技公司想错过这波AI应用浪潮,中国的大模型技术已经“卷”出了多种多样的创新应用。

一些互联网科技企业集体出动:支付宝开发出了智能助理,下拉支付宝帮你办事,简单方便,实用;百度已通过文心一言大模型调整搜索结果的传统信息,还发布了多个AI社交应用、AI绘画工具与医疗AI产品;微信推出了元宝小程序,实现AI搜索、文档总结和AI作图功能;科大讯飞除了“讯飞星火”聊天机器人,还推出了AI口语助手和多个提高效率的工具;商汤科技不仅发布了其大模型,还推出了生成式AI应用如“商量”和“秒画”。

创业公司同样积极入局,典型者如月之暗面(Moonshot AI)旗下国产大模型Kimi智能助手一度凭借200万字级的长上下文处理能力骤然走红。

总结目前中国市场上的大模型应用,可以大致分为娱乐场景下的对话工具和工作场景下的生产力工具。

前者如抖音“豆包”、微软“小冰”、微信“小微”,它们普遍具备聊天、陪伴、写作文案、翻译等多种功能。这类大模型应用富有情感和互动体验,可以满足用户的情感需求。

而生产力工具典型者如Kimi、百度飞桨(PaddlePaddle)以及各类智能客服机器人、写作助手、代码助手等等,它们往往聚焦于某一具体的生产力环节,通过工具的智能化帮助企业实现效率提升。

据了解,一些传统办公软件甚至已经可以支持写Java代码。没有专业IT团队的制造业工厂的员工可通过简单的培训学习,自主开发特定需求的应用程序。

同时,编程助手确实已成为大模型落地的重要场景。蚂蚁已经有一半员工用他们自己研发的代码大模型codefuse写代码,去年的支付宝“五福”项目开发里,程序员的工作效率提升了30%。腾讯云称,“AI代码助手对鹅厂整体研发效能的提升,超过20%。”

可以说,通用生产力工具和娱乐型对话代表着中国大模型应用发展的两个方向。生产力工具专注于提升企业效能和决策能力,推进各行业智能化变革;而娱乐型对话则致力于提升用户体验,通过互动和娱乐功能增加用户参与度。

这两条路径展示了大模型在不同领域的应用潜力。虽然未来的商业化前景还是未知数,但庞大的用户规模和既有的场景能力,意味着巨大的增长潜力。

专业智能体,中国大模型的下一步


如果我们将观察大模型的视野向深处探究,中国的智能体未来将走向何方?

在笔者看来,智能体的生命力在于应用,而应用的核心在于能否真正解决用户的问题。

沿着这一逻辑,在既有的工作和娱乐之外,大模型还有另外一个应用场景的增量,那就是垂直领域专业服务。越是复杂的问题,越是专业的领域,越能孕育出更具价值的智能体。最典型者如医疗、金融等行业。

中国蓬勃发展的移动互联网为大模型行业提供了丰富而复杂的应用场景,以医疗和金融为代表的高专业度、高壁垒行业,虽然已经初步实现数字化或线上化,但在大模型时代,谁能深刻改造这些场景,破解更复杂的问题,谁就能抓住发展的先机。

在2024年世界人工智能大会上,蚂蚁集团一连对外展示了三个“AI管家”,分别对应金融、医疗和生活场景。在这些场景下,智能体为用户提供的都是专业服务——不是简单的聊天式对话,而是要在对话交互之后配合理财分析、辅助诊疗、消费预定等一系列服务。

蚂蚁集团董事长兼CEO井贤栋在世界人工智能大会上提出“专业智能体”概念,“从我们的实践来看,专业智能体是大模型落地严谨产业的最佳路径。”

蚂蚁集团的最新动作,也代表了中国大模型产业发展的一个面向。

蚂蚁集团大模型应用总经理顾进杰向钛媒体App进一步阐释了“专业智能体”。所谓“专业”,即指向那些更需严谨的产业,需要在相当程度上确保服务的准确性和可靠性。

业界普遍认为,通用大模型落地严谨产业,面临着三个“能力短板”:领域知识相对缺乏、复杂决策难以胜任,以及对话交互不等于有效协同。

这几点得到顾进杰的认同。他提到,以医疗行业为例,医疗行业的大量知识并没有在互联网上呈现,甚至很多都是医生经验性的认知积累。行业内擅长复杂推理的专家,其最具价值的思维框架、思维模式远未形成文档化或者数字化。

更进一步地说,单纯的对话形态产品一定解决不了全部问题——比如,问答可以实现医疗问诊,但是不能帮你挂号、帮你回复药品相关问题以及帮你复诊。

为了解决这些问题,蚂蚁集团采取了多层次的策略。

以医疗行业为例,蚂蚁做的第一件事,就是强化大模型的专业认知。基于蚂蚁百灵大模型开发的支付宝医疗大模型 ,背后是支付宝与合作机构构建的全国权威医学专业教材医疗知识图谱;蚂蚁和上海市一医院联合打造Al就医助理,背后是上海市一医院自建的“服务与病例知识库”。

这些垂直领域不同类型的数据,进而被抽象成不涉及隐私信息的领域知识,“合成”为大模型的“专业教材〞。

在处理复杂决策方面,蚂蚁的大模型方案中引入了“专家级决策框架(FoE)”——即通过一种框架机制,让AI的决策机制线性化、流程化,让AI在某一专业领域模仿人类专家的思维方式进行决策。例如,医疗管家“安诊儿”不仅能解答问诊问题,还能提供精细的治疗建议。智能金融管家则通过综合分析市场和风险,为用户提供个性化的投资方案。

顾进杰还提到,“RAG(检索增强生成,可以在一定程度上克制幻觉)在严谨行业下不能完全解决问题,RAG实际上也会引入其他类型的幻觉错误”。在蚂蚁看来,单一大模型无法解决全部问题。专业智能体的进步,还需要更多行业专家、生态伙伴的参与,全行业的协作,可以有效提升智能体的“专业性”。

第二个层次的工作,是让智能体的能力更具综合性。蚂蚁的策略是多智能体协作。专业智能体不仅要在单一领域表现出色,还可以覆盖用户的多种需求。比如,在医疗场景中,用户可以通过“安诊儿”帮助病情诊断,并由“生活管家”安排就医相关交通和住宿。对用户而言,这些交互都可以在支付宝App内完成,支付宝App也由此从移动互联网入口升级为智能AI入口。

如果将大模型时代与移动互联网时代相比照,在移动互联时代,APP、小程序是应用的关键载体;大模型时代,智能体则成为新的应用范式,聚焦严谨领域的“专业智能体”是中国智能体的新方向所在。

在今年的世界人工智能大会(WAIC)上,专业智能体和它背后的相关技术也受到了广泛关注和认可。支付宝针对生活场景开发的支付宝智能助理入选八大“镇馆之宝”,而蚂蚁与浙江大学合作开发的用于提升AI在严谨产业中的认知、推理和决策能力的“ 智能认知决策技术与平台”也获得了2024WAIC的SAIL(卓越人工智能奖)TOP30。

在井贤栋看来,通过专业智能体的深度连接,Al会像互联网一样,带来服务的代际升级。

尽管在中国,关于大模型的商业模式的讨论尚显早期,但智能体,尤其是专业智能体,蕴藏着巨大的潜力。通过“专业智能体”实现各领域的深入应用,解决用户的实际问题,这是大模型的中国机遇,超大市场规模和海量需求,也会释放专业智能体的商业价值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/48299.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

昇思25天学习打卡营第12天 | ResNet50图像分类

ResNet50在CIFAR-10数据集上的图像分类实践 在深入学习和实践使用ResNet50进行CIFAR-10数据集上的图像分类后,我对深度学习模型的构建、训练和优化有了更深刻的理解。本次学习经历涵盖了从理论探索到实际应用的全过程,以下是我的主要收获和反思。 1. 理…

(南京观海微电子)——电感的电路原理及应用区别

电感 电感是导线内通过交流电流时,在导线的内部及其周围产生交变磁通,导线的磁通量与生产此磁通的电流之比。 当电感中通过直流电流时,其周围只呈现固定的磁力线,不随时间而变化;可是当在线圈中通过交流电流时&am…

Jump Point Search(JPS)算法与A*算法

A* A*算法本质上讲是结合了DFS和BFS,针对当前起点先做一次BFS,再针对搜索的八个点做一次DFS BFS--广度优先算法(Breadth First Search) DFS A* 算法思想 A*的核心思想就是先进行一次BFS搜索,然后从这次BFS中找到距离…

python Requests库7种主要方法及13个控制参数(实例实验)

文章目录 一、Requests库的7种主要方法二、kwargs:控制访问的13个参数 一、Requests库的7种主要方法 序号方法说明1requests.request():提交一个request请求,作为其他请求的基础2requests.get():获取HTML网页代码的方法3requests.head()&…

基于重要抽样的主动学习不平衡分类方法ALIS

这篇论文讨论了数据分布不平衡对分类器性能造成的影响,并提出了一种新的有效解决方案 - 主动学习框架ALIS。 1、数据分布不平衡会影响分类器的学习性能。现有的方法主要集中在过采样少数类或欠采样多数类,但往往只采用单一的采样技术,无法有效解决严重的类别不平衡问题。 2、论…

9种二极管及其特点总结

二极管种类和特点 名字特点恒流二极管近些年出现,电压大于某个值,电流恒定,一般用于led普通二极管低频整流和续流,便宜,反向恢复时间us级别,PN结肖特基二极管比普通二极管反向关断更快,10ns级别…

智能硬件——0-1开发流程

文章目录 流程图1. 市场分析具体分析 2. 团队组建2. 团队组建早期团队配置建议配置一:基础型团队 (4人)配置二:扩展型团队 (6人)配置三:全面型团队 (7人) 3. 产品需求分析4. ID设计(Industrial Design, 工业设计)5. 结…

阿里云公共DNS免费版自9月30日开始限速 企业或商业场景需使用付费版

本周阿里云发布公告对公共 DNS 免费版使用政策进行调整,免费版将从 2024 年 9 月 30 日开始按照请求源 IP 进行并发数限制,单个 IP 的请求数超过 20QPS、UDP/TCP 流量超过 2000bps 将触发限速策略。 阿里云称免费版的并发数限制并非采用固定的阈值&…

Unity游戏开发入门:从安装到创建你的第一个3D场景

目录 引言 一、Unity的安装 1. 访问Unity官网 2. 下载Unity Hub 3. 安装Unity Hub并安装Unity编辑器 二、创建你的第一个项目 1. 启动Unity Hub并创建新项目 2. 熟悉Unity编辑器界面 3. 添加基本对象 4. 调整对象属性 5. 添加光源 三、运行与预览 引言 Unity&…

netty 自定义客户端连接池和channelpool

目录标题 客户端池化运行分析问题修复 客户端池化 通信完成之后,一般要关闭channel,释放内存。但是与一个服务器频繁的打开关闭浪费资源。 通过连接池,客户端和服务端之间可以创建多个 TCP 连接,提升消息的收发能力,同…

【深度学习】VGG-16原理及代码实现

1.原理及介绍 2.代码实现 2.1model.py import torch from torch import nn from torchsummary import summary import torch.nn.functional as Fclass VGG16(nn.Module):def __init__(self):super(VGG16, self).__init__()self.block1 nn.Sequential( # 用一个序列&#xf…

51单片机嵌入式开发:13、STC89C52RC 之 RS232与电脑通讯

STC89C52RC 之 RS232与电脑通讯 第十三节课,RS232与电脑通讯1 概述2 Uart介绍2.1 概述2.2 STC89C52UART介绍2.3 STC89C52 UART寄存器介绍2.4 STC89C52 UART操作 3 C51 UART总结 第十三节课,RS232与电脑通讯 1 概述 RS232(Recommended Stand…

Github报错:Kex_exchange_identification: Connection closed by remote host

文章目录 1. 背景介绍2. 排查和解决方案 1. 背景介绍 Github提交或者拉取代码时,报错如下: Kex_exchange_identification: Connection closed by remote host fatal: Could not read from remote repository.Please make sure you have the correct ac…

HTML5大作业三农有机,农产品,农庄,农旅网站源码

文章目录 1.设计来源1.1 轮播图页面头部效果1.2 栏目列表页面效果1.3 页面底部导航效果 2.效果和源码2.1 源代码 源码下载万套模板,程序开发,在线开发,在线沟通 作者:xcLeigh 文章地址:https://blog.csdn.net/weixin_4…

计算机三级嵌入式笔记(一)—— 嵌入式系统概论

目录 考点1 嵌入式系统 考点2 嵌入式系统的组成与分类 考点3 嵌入式系统的分类与发展 考点4 SOC芯片 考点5 数字(电子)文本 考点6 数字图像 考点7 数字音频与数字视频 考点8 数字通信 考点9 计算机网络 考点10 互联网 考纲(2023&am…

2、如何发行自己的数字代币(truffle智能合约项目实战)

2、如何发行自己的数字代币(truffle智能合约项目实战) 1-Atom IDE插件安装2-truffle tutorialtoken3-tutorialtoken源码框架分析4-安装openzeppelin代币框架(代币发布成功) 1-Atom IDE插件安装 正式介绍基于web的智能合约开发 推…

【Vue3】响应式数据

【Vue3】响应式数据 背景简介开发环境基本数据类型对象数据类型使用 reactive 定义对象类型响应式数据使用 ref 定义对象类型响应式数据 ref 和 reactive 的对比使用原则建议 背景 随着年龄的增长,很多曾经烂熟于心的技术原理已被岁月摩擦得愈发模糊起来&#xff0…

牛客:TOP101链表相加(二)

文章目录 1. 题目描述2. 解题思路3. 代码实现 1. 题目描述 2. 解题思路 按照我们习惯的加法运算,肯定是要从个位开始相加,然后十位……,但是在链表中如果我们先运算后面的,那么接下来我们是无法找到前一位的。想要解决这个问题也很…

数模·插值和拟合算法

插值 将离散的点连成曲线或者线段的一种方法 题目中有"任意时刻任意的量"时使用插值,因为插值一定经过样本点 插值函数的概念 插值函数与样本离散的点一一重合 插值函数往往有多个区间,多个区间插值函数样态不完全一样,简单来说就…

【系统架构设计 每日一问】二 MySql主从复制延迟可能是什么原因,怎么解决

主从复制的架构设计如下图所示: 同步原理 具体到数据库之间是通过binlog和复制线程操作的: Master的更新事件(update、insert、delete)会按照顺序写入bin-log中。当Slave连接到Master的后,Master机器会为Slave开启,binlog dump线程,该线程…