一张图看懂大模型性价比:能力、价格、并发量全面PK

图片

最近,国内云厂商的大模型掀起一场降价风暴。火山引擎、阿里云、百度云等纷纷宣布降价,部分模型价格降幅据称高达99%,甚至还有些模型直接免费。

五花八门的降价话术,一眼望去遍地黄金。但事实真的如此吗?今天我们就拨开迷雾,深挖下大模型降价背后那些事。

1

选大模型

要最强版还是轻量级?

企业选用大模型,首先要明确模型的使用需求:

如果需要语言理解、生成、逻辑等综合能力强,能解决复杂业务场景问题的大模型,那么必须使用各大头部厂商的最强模型,包括豆包Pro系列、通义千问Qwen-Max系列和文心ERNIE 4.0。这些模型均已超越GPT3.5,但距离GPT-4略有差距。

如果对模型能力要求不高,比如简单的对话问答,但是需要响应速度快、便宜的大模型,那么可以使用各家大模型的轻量化版本。包括豆包Lite系列、通义千问Qwen-Long/Plus/Turbo系列、文心ERNIE-3.5/Speed/Lite系列。

选模型就像选车一样,高端商务和家用买菜,肯定不是一个价。入门级的车就算给你倒贴钱,你敢开去跑极限越野吗?所以还是要关注模型能力,不能光看最低价。

2

比价格,还要比并发

选好适配业务的模型之后,就要算算使用成本了。

各家大模型公布的x元/千tokens,都是指“后付费”的刊例价。也就是按照实际使用的tokens算账。

乍看很简单——谁的单价低,谁就更便宜呗。但真要用起来,这里面门道就多了。

和“后付费”价格绑定在一起的,有两个关键指标,一个叫TPM(每分钟token数),一个叫RPM(每分钟请求数)。

TPM,代表着一家企业客户在单位时间内能够使用的token限额;RPM,代表着一家企业客户在单位时间内最多能用多少次大模型。两个指标中有一个达到限额,模型就拒绝提供服务了。

打个比方:大模型API调用就像一个大水池,TPM是限定了每分钟可以打一杯水还是一桶水,RPM是限定了同时可以来10个人还是来100个人打水。无论水价多便宜,哪怕是免费的,如果一分钟只能接一杯水,那也没太大用处。

3

大模型降价“御三家”最详细对比

搞清楚大模型价格那些事儿,接下来看看这波降价潮里最风口浪尖的三家云厂商:首先掀桌的火山引擎和豆包大模型,火上浇油的阿里云和通义千问大模型,摔杯免费的百度智能云和文心大模型。

在这里插入图片描述

以上数据均来自于各厂商官网及产品控制台,数据采集时间为5月22日。如有变动,以厂商最新公告为准。

为了更直观地表现以上大模型的综合性价比,我们按照模型能力分级,计算一元钱能购买的tokens数量,以及不同模型支持的并发能力,分别做成图表。

图片

备注:在典型流量场景中,推理输入远大于推理输出,一般为5比1到10比1之间。在长文本对话的PDF总结摘要等场景,输出相比输入更是可以忽略。因此本文以推理输入价格为准,计算一元钱能买到的tokens数量。

4

简单总结

百度最强模型的价格不变,但轻量模型把“厘时代”直接打到免费。不过需要注意的是,根据文心一言官网介绍,ERNIE Speed模型适用于精调,而精调还是要收费的。

阿里云的模型全线降价,最强模型降幅低,轻量模型降幅高。所有价格应该都是经过了精密的测算,不会是随意拍的数。从价格来看还是颇有诚意,但初始支持的TPM/RPM稍显不足,企业在实际使用中需要对相关权益做好沟通。

字节,火山引擎。当我们说起价格那些事儿,不由想起《明朝那些事儿》的经典台词:要么不做,要么做绝。豆包大模型闷声发育一年,无论是最强模型还是轻量模型,TPM还是RPM,用九个字可以形容:不留空档,竞争力拉满。

如何学习AI大模型?

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

在这里插入图片描述

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍

在这里插入图片描述

四、AI大模型各大场景实战案例

在这里插入图片描述

五、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/14274.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

统计信号处理基础 习题解答10-2

题目 两个随机变量x和y,如果联合PDF分解为: 那么称他们为条件独立的。在上式中z是条件随机变量。 我们观察 其中, , 是相互独立的。证明和是条件独立的。给出条件变量是A。和是无条件独立么?也就是 成立么?为了回答这个问题&…

如何使用jmap工具生成堆内存快照

1、确保已安装JDK: 首先,确保你的系统上安装了Java Development Kit (JDK)。 2、找到Java进程的PID: 你需要知道你想要生成堆内存快照的Java进程的进程ID(PID)。你可以使用命令行工具如ps(在Unix/Linux系…

Redis Cluster 集群搭建

1. 安装 Redis sudo apt-get update sudo apt-get install redis-server2. 创建配置文件 为每个 Redis 实例创建独立的配置文件和数据目录: mkdir -p /usr/local/redis-cluster/{7000,7001,7002,7003,7004,7005}3. 配置文件内容 每个 Redis 实例的配置文件内容如…

秋招突击——算法打卡——5/24——两数之和

题目描述 实现代码 ListNode* addTwoNumbers(ListNode* l1, ListNode* l2) {int addNumber 0;// 表示进位ListNode* res ListNode();ListNode* curNode res;while(l1 && l2){curNode.value (l1.value l2.value addNumber) % 10 addNumber (l1.value l2.value…

python3序列化模块之pickle

官方文档 简介 pickle 是 Python 中用于对象序列化和反序列化的标准库模块。它可以将 Python 对象转换为字节流,并将其保存到文件或通过网络传输,在需要时再将其恢复为原来的 Python 对象。 模块 pickle 实现了对一个 Python 对象结构的二进制序列化和反序列化。 “pickling…

如何快速增加外链?

要快速增加外链并不难,相信各位都知道,难的是快速增加外链且没有风险,所以这时候GNB外链的重要性就出现了,这是一种自然的外链,何谓自然的外链,在谷歌的体系当中,自然外链指的就是其他网站资源给…

mysql 、oss 结合使用

以下是一个使用 Express、MySQL、OSS 和 axios 的 Node.js 示例。这个示例创建了一个 Express 服务器,该服务器有一个路由用于处理视频上传的请求。视频文件首先被上传到 OSS,然后视频的 OSS URL 被存储到 MySQL 数据库。 首先,我们需要安装必…

最大负载1kg!高度模块化设计!大象机器人智能遥控操作机械臂组合myArm MC

引入 近年来,市面上涌现了许多类似于斯坦福大学的 Alopha 机器人项目,这些项目主要通过模仿人类的运动轨迹来进行学习,实现了仿人类的人工智能。Alopha 机器人通过先进的算法和传感技术,能够精确复制人类的动作,并从中…

【stm32】——使用HAL库点灯

目录 一、安装STM32CubeMX 二、HAL库点亮LED灯 1.STM32CubeMX创建项目 2.进入Keil编写代码 三、采用中断控制LED灯的亮灭 1.创建项目 2.Keil中编写代码 四、Keil波形分析 总结 一、安装STM32CubeMX 具体操作可以参考下面链接: 搭建STM32开发环境——STM32CubeMX&a…

用Python pynput库捕捉每一次组合键的优雅舞步

哈喽,大家好,我是木头左! 一、初识pynput:键盘与鼠标的监控利器 当谈论计算机交互时,键盘和鼠标无疑是最常用的设备。无论是编写代码、浏览网页还是玩游戏,都依赖于这些输入设备与机器沟通。但在一些特殊的…

蓝桥杯单片机-国赛5——各外设时序记忆方法及手册重点提取

蓝桥杯涉及三个通讯外设,时序很难记忆,因此本文重点在于记录如何不背时序,直接看手册 注意:本文参考2024年第15届比赛手册讲解,没有英文基础也没关系 每一个外设会在第一张时序图中详细讲解,后续简写&…

【DevOps】深入理解 Nginx Location 块:配置示例与应用场景详解

目录 一、location 块的基本概念 二、location 块的语法 三、location 块的匹配方式 四、location 块的优先级 五、location 块的应用场景 六、location 块的嵌套 七、location 块的指令 八、示例配置 Nginx 是一个高性能的 Web 服务器和反向代理服务器,它广…

网站工作原理

web发展史 1.0时代不可修改 2.0可修改,比如发微博 有以下问题: 课程2: 静态页面 html 动态页面 php 经过服务端的语言解释器,解析成html文件,剩下的就和静态流程一样 后面三个是web服务器,语言解释器&…

边缘人工智能中的视频目标检测方法详解

随着边缘计算和人工智能技术的发展,视频目标检测在边缘设备上的应用变得越来越普遍。这些应用包括智能监控、自动驾驶、无人机巡检等。为了在资源受限的边缘设备上实现高效的目标检测,选择合适的算法和工具至关重要。本文将详细介绍几种适用于边缘设备的…

算法刷题day53:树形DP

目录 引言一、没有上司的舞会二、树的重心三、树的最长路径四、树的中心五、数字转换 引言 关于这个树形 D P DP DP 啊,其实感觉就是对树进行 D F S DFS DFS 只不过有一个返回值罢了,这个返回值一般代表的就是以该结点为根的子树的一个属性&#xff0…

[Spring Boot]baomidou 多数据源

文章目录 简述本文涉及代码已开源 项目配置pom引入baomidouyml增加dynamic配置启动类增加注解配置结束 业务调用注解DS()TransactionalDSTransactional自定义数据源注解MySQL2 测试调用查询接口单数据源事务测试多数据源事务如果依然使用Transactional会怎样?测试正…

dubbo复习: (6)和springboot集成时的条件路由

根据指定的条件,对不满足条件的请求进行拦截。 比如拦截ip地址为192.168.31.227的请求。只需要在dubbo admin中的条件路由菜单创建相应的规则 enabled: true force: true runtime: true conditions:- host ! 192.168.31.227

vlan综合实验

一,实验拓扑: 二,实验需求: 1、pc1和pc3所在接口为access;属于vlan 2;P可以骄问pcepces不的一段;其中pc2可以访问pc4/pc5/pc6; 2、pc1/pc3与pc2/pc4/pc5/pc6不在同一网段; 3、所有pc通过DHCP获取Ip地址,且pc1/pc3可以…

Golang框架HTTP客户端框架zdpgo_resty发送表单请求

核心代码 这里通过字典传递了一个简单的表单数据。 发送的是POST请求。 resp, err : client.R().SetFormData(map[string]string{"username": "jeeva","password": "mypass",}).Post("http://127.0.0.1:3333/login")fmt.P…