2024,大模型杀进“决赛圈”

outside_default.png

6d77b022fa0e9921e0235d68ef369783.png

Henry Chesbrough在著作《通过技术创新盈利势在必行》中,曾提出过一个创新的“漏斗模型”。开放式创新一开始鼓励百花齐放,但最终只有10%的技术能够通过这个漏斗,成功抵达目标市场target market,进入到商业化与产业化的下一个阶段,而其余的90%的技术,逐渐淡出人们的视野。

大模型的2024,就经历了漏斗秩序的残酷检验。

ff1e97b5cab045ecd6f99625ebe45d6e.png

2023年初,业界最关注的问题是“中国能不能孕育出顶尖的大模型”。随后一年,国产大模型数量的井喷式增长,完成备案并上线服务的大模型数量已达100多个。

于是到了2024年初,大家最关注的问题已经变为“这么多的大模型,我们该怎么消化和利用?”

如今来看,经过百模大战,基础大模型已“去九存一”,只有约10%的具有市场活力、用户活跃度高的大模型脱颖而出,进入到了决赛圈。大模型的商业市场,也从百家争鸣,收束为两股势力:

一是以互联网、云计算企业为代表的科技巨头,包括百度的文心大模型、阿里的通义大模型、腾讯的混元大模型、字节跳动的豆包大模型、华为的盘古大模型。

二是以“AI六小虎”为代表的头部创企,比如智谱AI的智谱清言、零一万物的Yi大模型家族。

33edb7b348b016d7ac6b08b99cba8f85.png

可以说,大模型在2024年,走过了一个完整的“漏斗模型”。但重资产的大模型行业,竞争也远比一般技术更残酷。我们预计,99%的大模型都会丧失产业空间。所以,这场模型淘汰赛并未到终局。接下来,基础模型的创新漏斗还会进一步收窄,最终仅留下三四个产品,作为AI基础设施。

我们还是有必要花一点篇幅,来回溯一下2024年的大模型淘汰赛,留下了哪些种子选手。

fccceb73363bc5d4404823104996c65d.png

2024国内外的大模型格局,都呈现出鲜明的马太效应。在海外,OpenAI、谷歌、微软等巨头屹立不倒,而众多大模型初创公司,诸如Stability AI、Adept、Humane、Reka AI等,则排队寻求出售。

国内的情况也大致相似。以互联网和云厂商为代表的科技巨头(百度、阿里、腾讯、华为、京东、字节跳动),以及融资能力出众的AI创企(AI六小虎),成为大模型商业市场中具备活力的竞争者。

潮水退去,暴露出沙滩上的礁石,而产学各界炼大模型的热情消退,我们得以在2024年看到更清晰的大模型商业模式。具体来说,大模型成功穿过漏斗,需要三种动力:

1.可持续的资源投入。AI大模型是一个重资产行业,2024年Scaling Law仍未失效,随着模型不断变大,训练新模型所需要的高质量数据量与计算量也在增加。这就像登山,百尺竿头更进一步。而头部企业在资金、技术、数据等方面的优势日益凸显,代表就是字节跳动。

dca83d668ac4c519a7f0b4a562546d44.png

字节跳动2024年才开始全力押注大模型,5月推出的豆包大模型很快就在业内崭露头角,日均Tokens使用量从5月份的1200亿,9月突破了1.3万亿。凭借此前的火山云基础设施和人才团队积累,以及这一年大举挖人、增加投入,在几个月内就建立了优势壁垒。

2.快速迭代的模型能力。字节跳动的后来居上、快速超车,也说明AI大模型并没有特别安全的护城河。模型能力在不断贬值,有了新的更高级的模型版本,旧模型就不值钱了;有了开源模型,能力接近的闭源模型就会被开发者放弃。这就要求模厂不断开发更强大的新模型,迭代旧模型。

86a1bc218cac711fd1d9fa774e5ec838.png

比如文心大模型,得益于百度在芯片、框架、模型和应用上的全栈布局,以及飞桨深度学习平台和文心的联合优化,文心大模型的迭代速度,一直处于业内领先水平。2024年百度在文心大模型4.0的基础上,相继推出了文心大模型4.0工具版、文心大模型4.0 Turbo,推理速度和效果进一步提升。而模型的迭代速度快,有助于增强用户和开发者的信心,增加使用黏性和付费意愿。

65ed6c71392a8f3f35b5ed267c0c3662.png

3.可变现的商业通道。模厂的竞争,不仅表现在基础模型的研发上,而体现在后续的商业推广。

2024年,大模型从“价格战”杀到了“免费战”,5月字节跳动将国内大模型的市场价格带入“厘时代”,随后文心大模型就宣布两大主力模型ENIRESpeed和ENIRELite全面免费。随着模型进入免费时代,模厂就必须有其他商业通道来实现营收,收回自己在大模型上的前期投入。

其中,科技巨头大多直接掌握着用户数据、应用产品和渠道资源,可以让AI大模型触达最终用户,为价值付费。比如百度文库app,就通过AI改造,上线了基于文心大模型的智能PPT、智能画本等一系列AI功能,付费用户快速增长,目前已有数千万AI月活用户。

f230f06714abe19c940e15efbbc88d35.png

而AI创企则有望凭借新锐的技术和产品解决方案,在商业市场中脱颖而出。“六小虎”中,零一万物明确表示不会放弃预训练模型。目前,零一万物正基于Yi 系列基座模型的标准化能力,深入业务场景的垂直精细化切口,推出了数字人解决方案“如意”、营销短视频解决方案“万视”。

总的来说,2024的大模型产业,就是一个又一个的大模型被推向市场之后,不得不面对一个狭窄的“漏斗”出口,经历一场艰难的淘汰赛。互联网与云计算巨头和极少数AI独角兽,成功穿过漏斗,抵达下一阶段。

54edf65373023b70ce65082eeabbd235.png

2024年的淘汰赛洗礼,让大模型去九存一,产业格局更加合理,只留下了约10%的大模型进入决赛圈。

从结果看,大模型呈现出“强者恒强”的马太效应。那么,这些强者是怎么从战场中厮杀出来的呢?如果说2023年,大模型的关键一战,是基础设施攻坚战,各个模厂都不遗余力地建设训练大模型所需要的算力集群和高端硬件资源,那么2024年,大模型的关键一战,则转向了商业市场的争夺战。

争夺活跃用户,这一年大模型的商业市场有两个主题:

主题一,烧钱营销。

基于大模型的生成式AI(AIGC)产品,可以通过为用户提供服务来完成商业转化,这也成为大模型最直接、最快速的商业化路径。2024年,AIGC产品爆发,根据《生成式人工智能服务已备案信息》显示,截至2024年11月,我国共有309个生成式人工智能产品完成备案。而如此繁多的AIGC产品,存在大量重叠的功能,于是,模厂不得不通过大规模、高频次的市场推广和营销活动,来争夺活跃用户,提高用户基数。

62d7bc9ed2e852914f6607a79393fd67.png

月之暗面、智谱等都被报道过在营销上砸了重金,kimi智能助手的平均单个用户获客成本高达30元。

这些烧钱营销的AIGC产品,切实提升品牌知名度和用户基数,但也必须承认,最终能够激活多大的商业价值尚不明确。

主题二,走向应用。

不烧钱买流量,不赔本赚吆喝,大模型有可能赚到钱吗?那就需要向应用走。走向产业,走向广大用户和开发者,通过价值付费、项目付费等实现商业化,2024年,“大模型致用”已经是事实。

首先是智能体,让大模型更有用。大模型的应用从AI助手,转向了智能体,比如豆包、kimi、文小言等,能够自动拆解指令并执行一些简单的操作,“自动驾驶”水平更好,极大地提升了技术的可用性。

046aa44e272efcbf898aca589b6fefff.png

其次是工具链,让大模型更好用。文心智能体平台、字节跳动扣子、阿里通义千问等,都推出了智能体技术及工具链的支撑能力,普通人也能快速低成本地制作属于自己的智能体。其中,押注“AI应用化”的百度在智能体生态上布局最全,推出了APP builder、Agent builder等开发平台,以及本地部署一体机等硬件,支持C端和行业用户开发专属智能体。字节跳动的扣子也极易上手,用户可以复制官方的高质量模板,结合私有数据快速完成智能体开发,并发布到字节系等产品中使用。

“砸钱买量”“以用换量”,这两大主题交织在2024年的大模型商业化之战中,一家模厂可能综合运用这两种手段,来确保大模型的用户基数与市场活力,稳固住这一阶段的领航地位。

a2960f36ea898bc8d7ac0afe39c67b03.png

消费级技术,有一个基本规则:将复杂技术简单化,从而解锁突破性应用。就像我们平时发邮件,不需要探究背后的SMTP协议,使用手机支付,也不必弄懂背后的加密技术。这种“藏起代码”的简化,使得技术更加易用,因此能够更快普及和扩展。

由此,我们可以预测一下,底层模型的“决赛圈”可能发生哪些变化:

模型数量变少。科技巨头和AI创企领航的大模型们,还将继续洗牌,最终只留下3—4个基础模型,作为基础设施来支撑丰富多样的下游应用。这个过程中,投入的可持续性、迭代速度、商业化能力依然会发挥关键影响,互联网公司和云厂商的胜算更大。

e71fa8dd56c7bf120b3e27ed49d38c73.png

使用进一步简化。目前来看,大模型技术的使用还有继续简化的空间。比如智能体开发,仍然没有实现低代码或零代码,一旦涉及个性化场景的专业插件、知识库、数据处理等,开发工程的复杂度就又会变高,阻拦一些行业专家开发专业性更强的智能体,这限制了大模型在B端的爆发。所以2025年,智能体开发与专属模型训练,应该会变得更简单、傻瓜式,想上手AI开发的零基础读者不妨期待一下。

生态变大。人人都能上手AI开发,涉及对私有敏感数据的训练分析,以及多种多样的个性化功能需求,因此基础模厂不能只提供对一个底层模型的简单封装,而要支持本地训练与部署,多种模型的调用与组合,更多元的发布渠道,这些要求基础模厂能够将AI硬件、AI终端、垂类模厂、渠道伙伴等都纳入自身的生态体系内,共同满足用户的定制化需求。“朋友圈”有多大,也是2025年的一个大模型赛点。

cb188493510be60c016a4a3e54f04314.png

2024年,底层模型的中场战事宣告结束,进入决赛圈。随着大模型的漏斗被收束到最小,AI应用的漏斗才刚刚开始喷发。你听,“人人皆可AI”的2025离我们越来越近了。

e5b41d9bafcd4909ac9ed3292bb95ebc.png

·

·

·

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/63126.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

STM8单片机学习笔记·GPIO的片上外设寄存器

目录 前言 IC基本定义 三极管基础知识 单片机引脚电路作用 STM8GPIO工作模式 GPIO外设寄存器 寄存器含义用法 CR1:Control Register 1 CR2:Control Register 2 ODR:Output Data Register IDR:Input Data Register 赋值…

页面加载速度优化策略:提升用户体验的关键

文章目录 前言一、为什么需要优化页面加载速度?二、前端优化技术三、后端优化策略四、构建与部署优化五、案例研究:实际效果展示结语 前言 在当今快节奏的互联网环境中,页面加载速度不仅是用户体验的重要组成部分,更是影响网站性…

【CSS in Depth 2 精译_081】 13.1:CSS 渐变效果(下)——CSS 径向渐变(13.1.3)+ CSS 锥形渐变(13.1.4)

当前内容所在位置(可进入专栏查看其他译好的章节内容) 第四部分 视觉增强技术 ✔️【第 13 章 渐变、阴影与混合模式】 ✔️ 13.1 渐变 ✔️ 13.1.1 使用多个颜色节点(上)13.1.2 颜色插值方法(中)13.1.3 径…

商务礼仪学习笔记

时间,场合,地点 女士: 1. 着装(裙装套装,最短不能超过膝盖一拳,裙子形状直通,颜色简单不能花里胡哨,上下颜色不能超过三种,深灰深蓝;上下颜色,装饰,面料统一;丝袜不要过于花,肉色透明比较推荐) 2. 妆容和发型(经过搭理,不要毛躁; 肤色保持一致,均衡;腮红…

ubuntu 用 ss-tproxy的最终网络结构

1、包含了AD广告域名筛选 2、Ss-tproxy 国内国外地址分类 3、chinadns-ng解析 4、透明网关 更多细节看之前博客 ubuntu 用ss-TPROXY实现透明代理,基于TPROXY的透明TCP/UDP代理,在 Linux 2.6.28 后进入官方内核。ubuntu 用 ss-tproxy的内置 DNS 前挂上 AdGuardHome…

iOS swift开发系列--如何给swiftui内容视图添加背景图片显示

我需要在swiftui项目中显示背景图,有两种方式,一种是把图片拖入asset资源中,另外一种是直接把图片放在源码目录下。采用第一种方式,直接把图片拖到资源目录,但是swiftui项目没有弹出, “Copy items if need…

BUUCTF Pwn [HarekazeCTF2019]baby_rop2 题解

下载 得到两个文件 checksec 64位 拖入IDA64 查看main函数 看到给了个libc说明这题是ret2libc题 这里的打印函数是printf 所以利用printf函数的plt输出真实地址got 但printf的got好像不行 所以换成了read的got 因为这是64位程序 所以用寄存器传参;又因为printf得…

语音识别失败 chrome下获取浏览器录音功能,因为安全性问题,需要在localhost或127.0.0.1或https下才能获取权限

环境: Win10专业版 谷歌浏览器 版本 131.0.6778.140(正式版本) (64 位) 问题描述: 局域网web语音识别出现识别失败 chrome控制台出现下获取浏览器录音功能,因为安全性问题,需要在…

【前端知识】Javascript进阶-类和继承

文章目录 概述一、类(Class)二、继承(Inheritance) 三、继承的实现方式作用一、类和作用二、继承和作用 概述 当然可以,以下是对JavaScript中类和继承的详细介绍: 一、类(Class) 定…

前端搭建企业级项目的具体步骤?

‌前端搭建企业级项目的具体步骤如下‌: ‌确定项目技术栈和规划项目结构‌:首先,确定使用的前端框架,如Vue.js,并规划项目的目录结构,包括src、components、routes、store等‌。 ‌准备开发环境‌&#x…

Less和SCSS,哪个更好用?

前言 Less 和 SCSS 都是流行的 CSS 预处理器,它们的目的都是扩展 CSS 的功能,使样式表更具组织性、可维护性和可重用性。虽然它们有许多相似之处,但在语法、特性和工作方式上也存在一些差异。 Less Less 是一种动态样式表语言,…

【第三节】Git 基本操作指南

目录 前言 一、获取与创建项目 1.1 git init 1.2 git clone 二、基本快照操作 2.1 git add 2.2 git status 2.3 git diff 2.4 git commit 2.5 git reset HEAD 三、 文件管理 3.1 git rm 3.2 git mv 四、 总结 前言 本文将详细介绍 Git 的基本操作,包括…

【Graylog】索引别名deflector的异常处理和索引分片数限制解除

索引别名deflector的异常处理 官方推荐处理步骤 Stop all Graylog nodes (OPTIONAL) If you want to keep the already ingested messages, reindex them into the Elasticsearch index with the greatest number, e. g. graylog_23 if you want to fix the deflector graylo…

PyTorch 2.0 以下版本中设置默认使用 GPU 的方法

PyTorch 2.0 以下版本中设置默认使用 GPU 的方法 在 PyTorch 2.0以下版本中,默认情况下仍然是使用 CPU 进行计算,除非明确指定使用 GPU。在 PyTorch 2.0 以下版本中,虽然没有 torch.set_default_device 的便捷方法,但可以通过显式…

【一本通】输入两个不同的数,通过指针对两个数进行相加和相乘

【一本通】输入两个不同的数,通过指针对两个数进行相加和相乘 C语言代码C代码Java代码 💐The Begin💐点点关注,收藏不迷路💐 输入两个不同的数,通过指针对两个数进行相加和相乘,并输出。 输入 …

X.game解析柚子币提升速效双向利好和年中历史新低原因

柚子币最新消息,币安宣布将于2024年9月25日21:00左右暂停柚子币网络上的代币存取业务,以全力支持即将到来的柚子币网络升级和硬分叉,这一消息为柚子币的未来发展增添了新的期待和变数。 除了速度的提升,Spring1.0还带来了诸多技术…

redis集群安装部署 redis三主三从集群

redis集群安装部署 redis三主三从集群 1、下载redis2、安装redis集群 三主三从3、配置redis开机自启动3.1、建立启动脚本3.2、复制多份redis启动脚本给集群使用3.3、添加可执行权限3.4、配置开机自启动 1、下载redis 本次redis安装部署选择当前最新的稳定版本7.4.1 下载链接: …

数据结构,链表的简单使用

任意位置删除&#xff1a; void Any_Del(LinkListPtr h,int a)//任意删 {if(NULLh||a>h->len){printf("删除失败");}LinkListPtr ph;for(int i0;i<a-1;i){pp->next;}LinkListPtr p2p;p2p2->next;p->nextp->next->next;free(p2);p2NULL;h-&g…

Servlet容器来扫描指定包中的类 找到带有WebServlet注解的类

项目框架如上图 myweb下边三个类 package com.qcby.tomcat.myweb;import com.qcby.tomcat.webServlet.WebServlet;WebServlet(urlPatterns {"MyFirstServlet"}) public class MyFirstServlet {}package com.qcby.tomcat.myweb;import com.qcby.tomcat.webServlet.W…

clickhouse 查询优化思路

最重要的是要学会看懂explain &#xff0c;尤其是下推创建表时&#xff0c;可以选择表为分布式表。多个表join &#xff0c;创建表时根据join 字段,进行分片&#xff0c;让数据在同一个节点进行join &#xff0c;提高join 效率。多个表join , 通过创建物化视图的方式&#xff0…