火山引擎“奇袭”阿里云

图片|电影《美国队长3》剧照

©自象限原创

作者丨程心

编辑丨罗辑

大模型价格战,已经不是什么新闻。

从OpenAI发布GPT-4o,将API价格下调50%,并宣布面向普通用户免费开始,就标志着大模型的竞争从性能进入到了成本时代。

国内的价格战从创业公司开始,先是DeepSeek宣布降价,智普AI,面壁智能等创业公司跟进开始。直到火山引擎,将战火从创业公司烧到大厂跟前,然后就是一系列的连锁反应。

▲图源:火山引擎官方

5月21日,阿里云最先应战,百度智能云直接掀了桌子,宣布两款轻量级主力模型免费,科大讯飞跟进,就连一向在行业里保持低调的腾讯,也给出了相当有诚意的优惠。

短短一周之内,一场围绕着价格的角逐就从局部冲突演变为全面战争,大模型杀疯了。

但在这场混战中,最典型也最有代表性的,恐怕要属阿里云和火山引擎,因为这两者的价格战,代表了目前大模型企业和云计算平台最典型的两种竞争方式。

一、火山引擎“奇袭”阿里云

某种程度上,大模型的价格战是无可避免的。但国内这场价格战却有一个非常戏剧性的特点。

即大厂之间,率先降价的并不是之前一直高举“低价”大旗的阿里云,而是字节跳动旗下的火山引擎。

▲图源:阿里云、火山引擎官方

火山引擎和阿里云的竞争,就像一个成名多年的高手,在自己最得意的招式上,被一个年轻小伙子出其不意的抢了先机,这无法不让人感到意外。

但这件事情其实是早有预兆,我们可以从字节和阿里过往的竞争中找到一些端倪。

如果从阿里和字节的层面,这一次其实是字节跳动第二次“奇袭”阿里,因为第一次是去年抖音电商异军突起猛攻淘宝。

2023年,抖音电商全年GMV快速超过2万亿,抖音向整个电商行业证明了它不仅仅是一个内容创造者,更是一个流量黑洞。只要抖音能抓住消费者的注意力,就能撬动B端让利。

通过这种方式,抖音电商在淘宝的“眼皮子”底下长大了,以一种几乎戏谑的方式,挑战着淘宝的传统电商老大的地位。

如今,抖音又将这个“绝招”用在了云市场上。

当我们把时间线拉长,捋清字节跳动这一年AI的轨迹,就会发现它“没有一个动作是多余的”。

比如「自象限」在《解密Kimi:大模型应用当红顶流是如何练成的?》提到,字节旗下的豆包与Kimi等应用在C端市场打响了营销战。如今,火山引擎又率先挑起面向B端和开发者的价格战。

看起来营销战和价格战分别对2C和2B发起的进攻,但本质上这是字节跳动一盘棋中的两步。

据「自象限」了解到,在字节跳动内部「豆包」及其他大模型应用产品的产品战略负责人是曾经操刀过Musical.ly和TikTok早期产品规划的副总裁朱骏,而火山引擎主要负责豆包大模型的2B服务,与千行百业的结合,由谭待负责。

也就是说,本质上,豆包2C的营销和投放和火山引擎的2B战略是两条业务线。

但有一个问题在于,2B市场尤其是传统行业在做创新性决策时,往往需要一个参照物或者是一个样本,对于完全陌生的领域,他们更追求“可预判性”而不是完全未知。

一位火山引擎的头部客户告诉「自象限」:“领导不懂技术,但他们可能用豆包,我们提案,就说内部做一个豆包,领导一下就能懂了。”

对于2B客户而言,创不创新是小事,但不能行差踏错。

由于豆包在C端市场已经通过营销打下了一定的用户心智,以及由于豆包的助力模型是云雀语音大模型,在一众大模型产品中,豆包具有一定的差异化,用户几乎不需要打字,通过语音就能和豆包进行对话,还有Agent通话功能。

这个功能,满足了很多老年人的需求。从去年开始我们发现身边有很多老人开始陆续使用豆包,有的父亲带着豆包去买菜,碰到不认识的菜就拍下来问问豆包;有的博士生导师和豆包一起改学生的论文;有的姥爷用豆包带娃哄孩子...

一位接近豆包的行业人士向「自象限」透露到:“从Grace改名叫豆包的时,产品团队几乎就选中了老年人群体和接地气的路线,也对这部分群体做了针对性的营销和渗透,尤其是通过抖音的定向推送。”

有流量平台果然能“一鱼多吃”,更何况目前大部分的公司的话语权,都掌握在这部分人手里。

这看起来是一个迂回策略,但事实上,或许从字节将大模型产品从Grace改名为豆包,外人都笑他“土”的时候,这盘棋的第一步就已经落子。

通过技术见长而打造产品差异化是第一步;而根据产品的差异化精准定位人群,是第二步。

通过抖音的大流量平台,进行精准的投放培养用户心智、和产品认知,顺带着参与了一轮营销战,是第三步。

有了标杆产品之后,2C和2B就开始有了连接点,以「豆包」为模版,打造企业自己的豆包,一度是火山引擎的核心销售话术。

这个销售策略和字节跳动2B的风格一致,即:将自己擅长的能力外化。飞书是字节内部管理流程的外化、火山引擎的诞生是源于字节推荐算法能力的外化。

降价,是全面引爆2B市场认知度的一把火,但却不是唯一的目的。谭待不断强调,降价的前提是因为“我们大模型的能力准备好了”,或许火山引擎想要对外的传达的,不只是价格低,而是模型能力早已ready。

但我们推测,降价、掀起价格战只是大模型的某一阶段,它并不是字节甚至火山引擎的直接目的。至于他的目的是什么,谭待也说的很清楚:“大模型尚未真正大规模落地,只要把价格降下来就还有机会。火山引擎最重要的,就是如何把最佳实践做好、市场做大。”

从而实现第四朵云的弯道超车。大模型是云厂商的新机会,很明显,火山引擎正在牢牢抓住这个新的机会不放,目前,已经获得了和阿里云同一牌桌的机会。

不过,想要做好整个市场,火山引擎还太“嫩”了,在阿里云的优势战区,火山引擎光“讨巧”已经不灵了,后面还需要拿出点硬实力。

二、技术降本VS规模化降本

套用马斯克的一句话:没有人不想用大模型,只要它足够便宜。

大模型的降价是一种必然,只是谁也没想过,它会来的那么快。

也更没人会没想到,到了大模型时代,阿里竟是第一个被字节跳动冲击的公司。

除了电商的核心业务之外,阿里云是名副其实的“二当家”,过去几年,阿里云在云市场拥有着绝对的先发优势,无论是IaaS层的规模化、2B的服务经验还是生态体系的健全程度,都让火山引擎这个“年轻小子”无法望其项背。

去年4月,阿里云主导了云市场的大规模降价潮,一年过去了当我们回头再看便会发现,彼时的降价并不是一个基于市场化竞争的决定,而是规模化带来的降本,降本之后的良性降价。

云计算发展了近20年,大部分IDC基建已经铺设的基本完善,也来到了摊薄成本的转折点,从2009年成立开始至2024年,随着基础设施的完善,平台整体性能的提高,降价成为了一种必然趋势,也是云厂商走过成长期,进入成熟期的标志。

在这一次通义千问的全面降价中,阿里也不断提到公有云规模化带来的算力普惠,阿里云公共云事业部刘伟光特意点出了:“公共云技术公里和规模效应,将带来巨大的成本和性能优势。”

归根结底,阿里云的降价仍然是规模化降本导致的降价,是足够老、足够久、足够庞大的人,才有的特权。

相比之下,火山引擎太年轻了,它第一次对外提供服务是2019年,和阿里云比谁更“厚”,几乎是一条死路。

但不代表,火山引擎就不能把成本“打下来”。

让我们回顾一下移动互联网时代的抖音,当时面临最大的困难是用户习惯?市场渗透?还是推荐算法难题?

其实都不是,当时抖音大规模普及面临最大的问题,是“流量太贵了”。

在那个3G到4G转变的节点,在人均每个月只有20M、30M流量的年代,没有人愿意一个月花几百块钱刷抖音。

所以从那时候开始,抖音的算法团队就在探索如何用更少的流量资源来刷视频这件事,这种算法的逻辑本质上和今天用有限的算力推理出更多结果是一个道理。

所以阿里通义降价的核心是规模化,而火山引擎则是技术带来的降本。

谭待曾公开讲道:“我们今天之所以降价,是因为我们能做到。我们在技术上有非常多的优化手段,能把它的成本降低,同时把效果做好。比如我们在模型结构上做优化和调整,在工程上用分布式推理替代单机推理,通过混合调度体系,日均处理1200亿Tokens文本,生成3000万张图片,加强使用算力的程度,大大降低成本。”

除了豆包大模型之外,被称为“大模型界的拼多多”的DeepSeek,也通过技术手段将算力成本降到最低,在行业地板的价格,仍然能获得50%的利润。同时如潞晨科技一样的创业公司,也正在锚定算力优化的路线,通过算法侧的改变,将单卡的开发程度达到最高,将多卡的耗损降到最低。

▲图源:DeepSeek论文中的优化架构

在当下这个阶段,规模化降本和技术降本是两条互相缠绕着的路线,阿里云和火山引擎都选择了适合自己的路。

这场“奇袭”,始于字节在大模型时代的猛攻。但也如同上文所说,奇袭可以杀个措手不及,但不代表能够获得胜利。

当火山引擎要在阿里的腹地与其贴脸开打,还有一场场硬仗等待着他。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/15947.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【机器学习】期望最大化(EM)算法

文章目录 一、极大似然估计1.1 基本原理1.2 举例说明 二、Jensen不等式三、EM算法3.1 隐变量 与 观测变量3.2 为什么要用EM3.3 引入Jensen不等式3.4 EM算法步骤3.5 EM算法总结 参考资料 EM是一种解决 存在隐含变量优化问题 的有效方法。EM的意思是“期望最大化(Exp…

Aloha机械臂的mujoco仿真问题记录

今天在测试ACT代码时,遇到了仿真中的机械臂无法摆放正确的姿势来抓去红色方块。 后来经过测试,发现应该是python包的版本问题有误,下面记录下正确的包版本: 官方给出的包: conda create -n aloha python3.8.10 conda…

vue3 ts问题 找不到模块“@/views/home/index.vue”或其相应的类型声明。

1. 找不到模块“/views/HomeView.vue”或其相应的类型声明 今天帮同事看了一个问题,他尝试用vitevue3tspinia创建项目,结果刚上来就遇到这么一个问题 2. 解决办法 出现这个问题的原因就是:ts只支持导出导入模块,但是vue不是模块…

leetcode 1631. 最小体力消耗路径 二分+BFS、并查集、Dijkstra算法

最小体力消耗路径 题目与水位上升的泳池中游泳类似 二分查找BFS 首先,采用二分查找,确定一个体力值,再从左上角,进行BFS,查看能否到达右下角,如果不行,二分查找就往大的数字进行查找&#xff…

web及网络基础图文详解

目录 1.1TCP/IP 协议族 1.2TCP/IP 的分层管理 1.3TCP/IP通信传输流 1.4 与 HTTP 关系密切的协议 : IP、TCP 和 DNS (1)负责传输的 IP协议(网络层) (2)确保可靠的 TCP协议(传输层&#xff…

一行代码实现UI拖拽的效果

演示 先来看效果吧! 实现方式 1.首先创建一个你想拖动的UI图片 2.创建一个C#的脚本 3.编写控制脚本(代码按我的敲就行) 付上代码片段 public void OnDrag(PointerEventData eventData){transform.position eventData.position;} 4.添加脚…

产品经理-需求分析(三)

1. 需求分析 从业务的需要出发,确定业务目的和目标,将业务需求转为产品需求 1.1 业务需求 业务需求 业务动机 业务目标 就是最根本的动机和目标成果,通过这个需求解决特定的问题 1.2 产品需求 产品需求 解决方案 产品结构 产品流程…

等了10年,终于迎来RTX5/RTX4全家桶开源,开源,开源! 且免费商用

我们的V4, V5, V6 ,V7开发板都配套了大量的RTX4, RTX5教程和案例,从2015年发布首版RTX4内核教程以来,已经整整10年了。 1、制作这个RTX教程和案例,其实也承受了很大的压力,因为只有RTX内核是免费商用的,中间件并不免费…

AUTOMATIC1111/stable-diffusion-webui/stable-diffusion-webui-v1.9.3

配置环境介绍 目前平台集成了 Stable Diffusion WebUI 的官方镜像,该镜像中整合如下资源: GpuMall智算云 | 省钱、好用、弹性。租GPU就上GpuMall,面向AI开发者的GPU云平台 Stable Diffusion WebUI版本:v1.9.3 Python版本:3.10.…

数据结构(四)串

2024年5月26日一稿(王道P127) 定义和实现

【计算机毕业设计】基于SSM+Vue的新能源汽车在线租赁管理系统【源码+lw+部署文档】

摘 要 随着科学技术的飞速发展,社会的方方面面、各行各业都在努力与现代的先进技术接轨,通过科技手段来提高自身的优势,新能源汽车在线租赁当然也不能排除在外。新能源汽车在线租赁是以实际运用为开发背景,运用软件工程开发方法&…

ChatGPT-4o 实战 如何快速分析混淆加密和webpack打包的源码

ChatGPT-4o 几个特点 一个对话拥有长时间的记忆,可以连续上传文件,让其分析,最大一个代码文件只能3M,超出3M的文件,可以通过split-file可以进行拆分 其次ChatGPT-4o可以生成文件的下载链接,这有利于大文件的…

Vue3实战笔记(37)—粒子特效登录页面

文章目录 前言一、粒子特效登录页总结 前言 上头了&#xff0c;再来一个粒子特效登录页面。 一、粒子特效登录页 登录页&#xff1a; <template><div><vue-particles id"tsparticles" particles-loaded"particlesLoaded" :options"…

2024年5月大语言模型论文推荐:模型优化、缩放到推理、基准测试和增强性能

前一篇文章总结了关于计算机视觉方面的论文&#xff0c;这篇文章将要总结了2024年5月发表的一些最重要的大语言模型的论文。这些论文涵盖了塑造下一代语言模型的各种主题&#xff0c;从模型优化和缩放到推理、基准测试和增强性能。 大型语言模型(llm)发展迅速&#xff0c;跟上…

【idea插件】查询maven小工具——maven-search

1、简介 该插件提供一个查询工具方便在IDE中快速查找maven依赖&#xff0c;定制模糊查找算法。支持查找全网类。注&#xff1a;该功能需要连接网络。所有数据来源于源码阅读网 2、使用方法 开启菜单&#xff1a;Tools / Maven Search 快捷键 &#xff1a;Shift Control M 或…

3款简洁个人网站引导页(附带源码)

3款个人网站引导页 效果图及部分源码1.个人页2.引导页3.导航页 领取源码下期更新预报 效果图及部分源码 1.个人页 部分源码 * {margin: 0;padding: 0; }body {background-image: linear-gradient(to left, rgba(255, 0, 149, 0.2), rgba(0, 247, 255, 0.2)), url(../img/bg.j…

新建一个STM32的工程

一、SMT32开发方式 1、基于寄存器的方式&#xff1a;和51单片机开发方式一样&#xff0c;是用程序直接配置寄存器&#xff0c;来达到我们想要的功能&#xff0c;这种方式最底层、最直接、效率会更高一些&#xff0c;但是STM32的结构复杂、寄存器太多&#xff0c;所以不推荐基于…

【408真题】2009-15

“接”是针对题目进行必要的分析&#xff0c;比较简略&#xff1b; “化”是对题目中所涉及到的知识点进行详细解释&#xff1b; “发”是对此题型的解题套路总结&#xff0c;并结合历年真题或者典型例题进行运用。 涉及到的知识全部来源于王道各科教材&#xff08;2025版&…

OmicsTools新增了22种发表级的配色方案

OmicsTools新增了22种发表级的配色方案 我开发了一款本地电脑无限使用的零代码生信数据分析作软图神器电脑软件OmicsTools&#xff0c;欢迎大家使用OmicsTools进行生物医学科研数据分析和作图&#xff0c;该软件件能让大家在不需要任何编程和代码编写的基础上&#xff0c;分析…

电子电器架构 - AUTOSAR软件架构Current Features in a Nutshell

电子电器架构 - AUTOSAR软件架构Current Features in a Nutshell 我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 屏蔽力是信息过载时代一个人的特殊竞争力,任何消耗你的人和事,多看一眼都是你的…