对于“百模大战”,几乎所有大佬的口风都180 °大转变了?

文 | 智能相对论

作者 | 陈泊丞

在2024世界人工智能大会暨人工智能全球治理高级别会议产业发展主论坛上,百度创始人、董事长兼首席执行官李彦宏谈了些对于AI大模型的看法,语惊四座。

他先是指出,“百模大战造成了社会资源的巨大浪费,尤其是算力的浪费。但同时也使得我们追赶世界上最先进基础模型的能力得到了建立。”

而后又强调,“没有应用,光有基础模型,不管是开源还是闭源都一文不值。”同时李彦宏也表示,要跳出移动时代的思维逻辑,避免掉入“超级应用陷阱”,不是只有10亿DAU的应用才叫成功。

可以说,李彦宏的发言挺激烈的。这似乎也是第一次有大佬在这么高级别的场合去把“百模大战”和大模型的发展摊开了说。

当然,秉持着类似观点的,也不只是李彦宏。

金沙江创投主管合伙人朱啸虎在6月的黑马大课上也提到,很多创业者盲目投资AI底层技术。虽然创造了“百模大战”的盛况,但也造成了社会资源浪费。

他强调,“很显然,AI创业的赚钱风向,已经彻底变了。”

怎么变?

除了李彦宏、朱啸虎之外,还有猎豹移动董事长兼CEO、猎户星空董事长傅盛,智谱AI COO张帆、百川智能创始人王小川等大佬在不同的场合也或多或少谈到了大模型行业竞争转变的方向,能最终达成共识的关键点在于“场景”和“应用”。

聚焦基础大模型的“卷”所导致的“百模大战”似乎该喊停了,大模型的重点还是得“卷”场景应用。

大佬们在这一点上达成了共识。今年以来,大家的口风都变了!

不要过度竞争基础大模型,该“卷”场景应用了

在过去一段时间内,美国涌向了大量专注于大模型应用开发的创业公司,如Adept、Stability.ai、Runway、BettrData、Tinybird、UnSkript等等。

同时,像OpenAI、Anthropic这样的大模型头部领军企业以及如谷歌、微软等科技巨头也在致力于利用开源模型或自主研发的基础模型,开发出各种应用场景的解决方案。

GPTs的推出以及OpenAI宣称的一系列给开发者让利的行为,都旨在吸引更多的创业团队参与到GPT技术的创新和应用中,从而丰富GPT生态系统,帮助OpenAI在接下来的时间内占据大模型领域在场景应用方向的优势。

以国外大模型行业的趋势来看,国内这些大佬们的口风转变并非空穴来风。

目前,百度文心一言的日均调用量已经超过5亿,而在两个月前百度官方才刚刚宣布文心一言的日调用量超过2亿。

期间2个月的时间,调用量就发生如此之大的变化,可见大模型要“卷”场景应用不仅仅是厂商们的推动,还有整个市场的需求已经摆上台面,呈现出爆发式增长趋势。

类似的信号也在阿里云的主场上释放。

在世界人工智能大会上,阿里云CTO周靖人公布了近期通义大模型和阿里云百炼平台的最新进展——近2个月,通义千问开源模型下载量增长2倍,突破2000万次,阿里云百炼服务客户数从9万增长至23万,涨幅超150%。

谈及大模型,比起参数上的比较,现如今国内的大佬们似乎更愿意去告诉市场自家的大模型如何好用,有多少人用,接下来还能怎么用等等一系列与场景应用落地相关的事情。

而以朱啸虎为代表的投资者们也开始在应用层去寻找大模型的投资机会。

市场的风向变了,不仅仅只是大佬的口风在变。

“超级能干”的应用在哪?

“AI时代,‘超级能干’的应用比只看DAU的‘超级应用’更重要。”在世界人工智能大会上,李彦宏试图为接下来的大模型应用开发趋势下一个结论。

然而,“超级能干”的应用或许理解起来并不难,市场悬而未决的问题在于这样的应用是如何开发出来的,又是如何推向大众?

基于现阶段的行业表现,「智能相对论」认为有几点思考值得探究。

一、在“超级能干”的应用背后,大模型技术的迭代和适配是必要的。

行业的趋势大多殊途同归,大模型领域在今年以来掀起的MoE架构迭代趋势,则是代表了在技术方面大模型正为“卷”场景应用而作支撑。

如今,OpenAI的GPT-4、谷歌的Gemini、Mistral AI的Mistral、xAI的Grok-1、昆仑万维的天工AI、浪潮信息的源2.0-M32、通义千问团队发布的Qwen1.5-MoE-A2.7B等国内外大模型都采用了MoE架构。

MoE架构通过引入专家网络(Expert Networks)和门控机制(Gating Mechanism)实现了模型的稀疏化和模块化,在数据处理、算力资源调配、输出结果优化等方面都有相当不错的反馈。这为大模型的场景应用落地和推广提供了非常关键的技术支持。

比如,微软就提出了一个端到端的MoE训练和推理解决方案DeepSpeed-MoE,其通过深度优化MoE在并行训练中的通信,减少通信开销,实现了高效的模型并行。此外,DeepSpeed-MoE还提出了基于微调的专家排序机制,可以根据训练过程中专家的损失动态调整输入样本到专家的分配,提升效果。

二、“超级能干”的应用意味着一场更商业化的生态竞争。

技术没问题,但商业化路径不清晰仍然会在今天的市场面临崩盘。日前,微软官网更新了一条通知——“GPT Builder即将停用”。曾经掀起AI圈无数热议与高潮的GPTs似乎正在走向败局。

谁又能想起,当时GPTs概念横空出世的那场发布会还被外界形容为“OpenAI的iPhone时刻”。

OpenAI本意是想借助低门槛的技术能力以及全球开发者们共同打造出一批“超级能干”的应用,结果却因技术问题带来的体验瑕疵以及模糊不清的货币化政策,让GPTs这一概念的商业化路径始终走不通,最终只能“凉凉”。

“超级能干”的应用大多是建立在成熟的商业生态之上,或许全球的AI厂商都需要认清楚这一点。值得一提的,在大洋的彼岸,阿里云在2022年11月牵头发起的开源AI模型社区刚刚斩获2024 SAIL之星奖的魔搭ModelScope。

历经一年多的发展,魔搭社区已成为国内规模最大、最活跃的AI模型社区,汇聚5500多款优质模型和上千数据集,为超过560万开发者提供了模型及免费算力服务。或许,OpenAI没能走通的生态路径,在中国会有新的生机吧。

三、“超级能干”的应用必然萌芽于行业场景中。

朱啸虎送给大模型创业者的忠告,“不要迷信AI,聚焦尖刀场景尽快落地。”——场景是孵化“超级能干”应用的摇篮,然而更深入地来看,也不能只看场景,最终还得看用户反馈和价值呈现。

医疗、教育、金融、制造、交通、农业等等这些行业领域是大模型应用“高发”场景,但打造出来的智能体或解决方案究竟如何,“如人饮水,冷暖自知”罢了。

To B的项目看效率。在快递领域,目前通过大模型来帮助处理订单,就可以做到了“一张图、一句话寄快递”,不再需要其他繁琐的流程,时间从3分多钟缩短到19秒。而且90%以上的售后问题,也都由大模型来解决。——这样的效率提升,才称得上是“超级能干”。

To C的场景看用户。此前,在高峰期,百度的高考智能体每天要回答超过两百万个考生的问题。对于全国1000万的考生来说,这一比例是相当高的。——这样的用户数量,也算得是“超级能干”。

今天,大模型应用覆盖文本生成、数据处理、PPT制作、市场营销、客服售后、医疗诊断等各类通用的和垂直的场景。实际上,市场并不缺场景,而是缺乏能干、有效的应用,“卷”应用须在场景中找用户、找价值。

*本文图片均来源于网络

此内容为【智能相对论】原创,

仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。

•AI产业新媒体;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能 十万个为什么》

•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/42879.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

现在2024年网络安全真实情况还好就业吗?_2024年网络安全专业到底行不行了

2024年网络安全行业的前景看起来非常乐观。根据当前的趋势和发展,一些趋势和发展可能对2024年网络安全行业产生影响: 5G技术的广泛应用:5G技术的普及将会使互联网的速度更快,同时也将带来更多的网络威胁和安全挑战。网络安全专家…

java-spring boot光速入门教程(超详细!!)

目录 一、引言 1.1 初始化配置 1.2 整合第三方框架 1.3 后期维护 1.4 部署工程 1.5 敏捷式开发 二、SpringBoot介绍 spring boot 2.1 搭建一个spring boot工程 2.2 使用idea创建项目 2.3 在线创建姿势 2.4 项目的目录结构 2.5 项目的运行方式 2.6 yml文件格式 2…

分享外贸工作中常用英文标准表达和英文语句

常用英文表达 报拉格斯最低到岸价 quote the lowest price CIF Lagos经营纺织品多年 be in the line of textiles for many years货物受欢迎 the goods are very popular with customers / have met with a warm reception /be well received/accepted/ enjoy a wide populari…

Java线程死锁及解决方法

多线程环境下,死锁即两个或两个以上的线程去争夺同一个共享资源,而导致互相等待的情况。 要产生死锁,必须满足如下四个条件: 互斥条件,共享资源x和y只能被一个线程占有请求和保持条件,T1持有x&#xff0c…

解读BASE理论:高可用性与性能的完美平衡

Base概念 BASE 理论是一种处理大规模分布式系统中的数据一致性问题的思路。相比于传统的严格一致性,它更灵活,适用于那些需要高可用性和性能的系统。BASE 理论由三个部分组成: 基本可用(Basically Available) 基本可用…

利用亚马逊云科技云原生Serverless代码托管服务开发OpenAI ChatGPT-4o应用

今天小李哥继续介绍国际上主流云计算平台亚马逊云科技AWS上的热门生成式AI应用开发架构。上次小李哥分享​了利用谷歌云serverless代码托管服务Cloud Functions构建Gemini Pro API​,这次我将介绍如何利用亚马逊的云原生服务Lambda调用OpenAI的最新模型ChatGPT 4o。…

CSAL: the Next-Gen Local Disks for the Cloud——论文泛读

EuroSys 2024 Paper 论文阅读笔记整理 问题 云本地磁盘以其实惠的价格和高性能而极具吸引力。在云本地磁盘中,物理存储设备直接连接到计算服务器,并作为块设备虚拟化到虚拟机(VM)。在这种设置下,计算节点受其有限的计…

纯前端如何实现Gif暂停、倍速播放

前言 GIF 我相信大家都不会陌生&#xff0c;由于它被广泛的支持&#xff0c;所以我们一般用它来做一些简单的动画效果。一般就是设计师弄好了之后&#xff0c;把文件发给我们。然后我们就直接这样使用&#xff1a; <img src"xxx.gif"/>这样就能播放一个 GIF …

MPC学习资料汇总

模型预测控制MPC学习资料汇总 需要的私信我~ 需要的私信我~ 需要的私信我~ 【01】课件内容 包含本号所有MPC课程的课件&#xff0c;以及相关MATLAB文档。 【02】课件源代码 本号所有MPC课程的源代码。 【03】MPC仿真案例 三个MPC大型仿真案例&#xff1a; 1&#xff09;…

【数据结构】09.树与二叉树

一、树的概念与结构 1.1 树的概念 树是一种非线性的数据结构&#xff0c;它是由n&#xff08;n>0&#xff09;个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树&#xff0c;也就是说它是根朝上&#xff0c;而叶朝下的。 根结点&#xff1a;根…

俯卧撑计数器(Python)

通过 MediaPipe 检测人体姿态&#xff0c;计算俯卧撑角度和计数&#xff0c;并在图像上进行可视化展示 需要有cv2库和mediapipe库 mediapipe库&#xff1a; MediaPipe是Google开源的机器学习框架&#xff0c;用于构建实时音频、视频和多媒体处理应用程序。它提供了一组预训练的…

一文清晰了解HTML

有这样一个txt记事本文件和一张图片&#xff1a; txt文本内容是这样的&#xff1a; <html><head><title>HTML学习</title></head><body><h1>hello HTML</h1><img src"高清修复.png"/></body> </html…

LabVIEW的JKI State Machine

JKI State Machine是一种广泛使用的LabVIEW架构&#xff0c;由JKI公司开发。这种状态机架构在LabVIEW中提供了灵活、可扩展和高效的编程模式&#xff0c;适用于各种复杂的应用场景。JKI State Machine通过状态的定义和切换&#xff0c;实现了程序逻辑的清晰组织和管理&#xff…

In Search of Lost Online Test-time Adaptation: A Survey--论文笔记

论文笔记 资料 1.代码地址 https://github.com/jo-wang/otta_vit_survey 2.论文地址 https://arxiv.org/abs/2310.20199 3.数据集地址 1论文摘要的翻译 本文介绍了在线测试时间适应(online test-time adaptation,OTTA)的全面调查&#xff0c;OTTA是一种专注于使机器学习…

【软件分享】我们都需要会用的ArcGIS10.8和ArcGIS Pro

ArcGIS是地理人必备的地理制图、空间分析常用的工具&#xff0c;读地理&#xff0c;或多或少都会接触到ArcGIS的使用&#xff0c;今天小编要带来的就是ArcGIS10.8软件资源和升级版ArcGIS Pro的软件资源。 软件安装包获取 公众号回复关键词&#xff1a;“ArcGIS"&#xff…

防爆手机终端安全管理平台

防爆手机终端安全管理平台能够满足国家能源、化工企业对安全生产信息化运行需求&#xff0c;能够快速搭建起高效、快捷的移动终端管理平台&#xff0c;提高企业安全生产管理水平&#xff0c;保证企业的安全运行和可持续发展。#防爆手机 #终端安全 #移动安全 能源、化工等生产单…

公有链、私有链与联盟链:区块链技术的多元化应用与比较

引言 区块链技术自2008年比特币白皮书发布以来&#xff0c;迅速发展成为一项具有颠覆性潜力的技术。区块链通过去中心化、不可篡改和透明的方式&#xff0c;提供了一种全新的数据存储和管理方式。起初&#xff0c;区块链主要应用于加密货币&#xff0c;如比特币和以太坊。然而&…

VBA-计时器的数据进行整理

对计时器的数据进行整理 需求原始数据程序步骤VBA程序结果 需求 需要在txt文件中提取出分和秒分别在两列 原始数据 数据结构 计次7 00:01.855 计次6 00:09.028 计次5 00:08.586 计次4 00:08.865 计次3 00:07.371 计次2 00:06.192 计次1 00:05.949 程序步骤 1、利用Trim()去…

CV每日论文--2024.7.4

1、InternLM-XComposer-2.5: A Versatile Large Vision Language Model Supporting Long-Contextual Input and Output 中文标题&#xff1a;InternLM-XComposer-2.5&#xff1a;支持长上下文输入和输出的多功能大视觉语言模型 简介&#xff1a;我们推出了InternLM-XComposer-…

学生护眼台灯哪个牌子实用?值得入手的学生护眼台灯十大排名分析

在这个数码时代&#xff0c;人们对屏幕的依赖程度越来越高&#xff0c;尤其是孩子们。他们不仅在学校里需要长时间盯着教科书&#xff0c;还会在学习和娱乐中使用各种数码设备。然而&#xff0c;这也使得眼睛健康问题逐渐凸显&#xff0c;尤其是儿童近视的问题。为了保护视力&a…