真要这么卷?某国产大模型定价下调90%,百万 tokens 只需 1 元!

就在刚刚,国内明星AI公司——智谱AI官宣重磅炸弹:

将能力对标GPT3.5-Turbo的GLM-3的大模型API调用价格最高下调90%,价格仅为原来的十分之一!

废话不多说,直接上图:

图片

官网地址:https://open.bigmodel.cn/

一句话解释:在不使用Batch API的情况下,GLM-3 Turbo的模型定价降80%;在使用Batch API的情况下,价格再额外减半,达90%降幅!

即将推出的GLM-3 Turbo Batch 批处理 API(异步任务处理),适用于无需实时响应场景,包括效果评估、数据批处理等任务。

与GLM-3能力接近的主流国产大模型还有百度文心一言ERNIE-3.5、阿里通义千问Qwen-Turbo,这几个都是能力对标GPT3.5的国产大模型。

 GPT-3.5研究测试:

yeschat

GPT-4研究测试:

Hello, LLMs

Claude-3研究测试(全面吊打GPT-4):

AskManyAI

很多人可能对GLM-3 Turbo降价后的1元=200万tokens没什么概念,笔者给大家上了个直观的大模型价格对比图:

图片

可以看到,智谱GLM-3 Turbo的新定价相比其他几家能力相近的模型,简直是低到冷人发指,就差把免费二字贴到脑门上了。

如果你是个小红书博主,平均每篇小红书笔记360字,那么你给GLM-3 Turbo充值 1块钱,你可以写 10000篇 小红书推文...

你能坚持日更的话,得发27年才能把这一块钱花完

图片

ps:对于小红书推文来说,亲测GLM-3 Turbo能力够用了

今天这一刻让笔者恍惚间回到了若干年前的滴滴Uber补贴大战,亦或是更早的外卖补贴大战,面临今天这似曾相识的一幕,笔者心里只有一个声音:

打起来!打起来!

好了,严肃,聊点认真的。

作为AI从业者,笔者深知大模型价格大幅下降所带来的意义有多恐怖。而智谱作为国产大模型技术的领军厂商,率先打响第一枪,放在若干年后回头看,这很可能成为一个里程碑事件。

Sam Altman在一次采访中提到:

“高质量的人工智能的成本会越来越便宜,将持续降低到接近于0”

夕小瑶科技说

,赞31

大模型技术,若要深刻的改变世界,意味着它具备影响全球十亿人的影响力。而要影响全球十亿人,意味着大模型技术的访问成本要足够低,才能支撑起来繁荣、强网络效应的上层应用。

智谱AI的这一枪,让国内的AI产业链比国外更早的迈入“超低成本构建上层AI应用”的时代。尽管国内的大模型基础技术没有国外成熟,但价格却率先卷了下来,这意味着国内在AI应用生态上,有望比国外更早的出现免费的现象级AI应用。

接下来,就得看智谱的友商的表现了。

看到这,你可能会问,为什么是智谱AI打响了价格战第一枪?

这还得从夕小瑶科技说前阵子发表的这篇文章《网传Llama 3比肩GPT-4?别闹了》 说起。

智谱AI此次降价,既不是有钱任性、也不是拼命,而是因为——

技术实力够强所带来的“任性”

笔者通过调研发现,智谱AI研发了一系列的模型推理算子优化、模型压缩及硬件高效适配、高性能系统实现以及精细化集群调度等技术,全链路技术优化下,大幅压缩了GLM-3 Turbo的推理成本。

提一个比较恐怖的数字。

自大模型开放平台上线以来,在模型效果和推理性能不断提升的情况下,据粗略估算,模型的调用价格已累计降价超过100倍

图片

智谱AI大模型开放平台是智谱GLM系列大模型的体验与接入平台,智谱大模型全家桶包括GLM-3-Turbo、GLM-4、视觉理解大模型GLM-4V、文生图模型CogView-3、代码模型 CodeGeeX 、超拟人角色定制模型CharacterGLM,擅长中文的向量模型Embedding-2等,几乎涵盖大模型应用开发的所有场景。

平台传送门:https://open.bigmodel.cn/

在这个恐怖的数字背后,是智谱AI持续的技术创新和积累,从底层算法、预训练框架、到国产硬件适配,GLM系列模型全链路技术不仅安全可控,且已比肩世界先进水平。

笔者深入研究了智谱AI大模型开放平台后发现,bigmodel.cn 上已经聚集了超过数十万的企业和开发者,并且在持续快速增长,过去的半年每日tokens消耗增长超过一百倍

它不仅拥有完整的商业化套件,甚至还提供开箱即用的AI应用开发资源和官方的调用工具,比如:

  • 网页检索web search

  • 函数调用function call

  • 知识库检索retrival

这些工具自1月份上线以来已被累计调用超 3亿次

目前,智谱AI大模型开放平台形成了强大的大模型技术与应用共济生态。

最后,不得不再提一嘴智谱AI领跑业界的技术实力。

在刚刚结束的ICLR2024顶级会议上,智谱AI成为了唯一一家受邀演讲的中国AI厂商,分享了GLM大模型面向AGI的三大技术趋势:

  1. 基于超级认知SuperIntelligence和超级对齐SuperAlignment技术的GLM-4升级版本,在多模态和AI安全方面有很大提升;

  2. 提出以大模型为中心的通用计算系统GLM-OS,目的是解决复杂任务;

  3. 公开了正在探索中的GLM-Zero技术项目,模仿人类的无意识的学习机制,这将是通过AGI必经之路。

在这次演讲中,智谱还透露了一个重要信息:

接下来GLM-4.5会迎来文本能力和多模态能力的升级!

又是卷起价格战,又是在AI顶级会议上受邀演讲,甚至还有这即将到来的GLM“旗舰模型”的重磅升级。智谱AI的这一系列操作已经把国内广大AI开发者的期待值拉满了!

话不多说,flag当立。

等出来后,小编我第一时间给大家测评!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/10947.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

机器视觉技术精准测量点胶高度与宽度:提升生产质量的新利器

在现代化生产线中,点胶工艺是许多产品制造过程中的重要环节。点胶的高度和宽度直接影响到产品的质量和性能。传统的测量方法往往效率低下、精度不高,而机器视觉技术的引入,为点胶高度和宽度的测量带来了革命性的变革。本文将探讨机器视觉如何…

Linux 操作系统MySQL 数据库1

1.MySQL 数据库 数据库是“按照数据结构来组织、 存储和管理数据的仓库”。 是一个长期存储在计算机内的、 有组织的、 可共享的、 统一管理的大量数据的集合。 它的存储空间很大, 可以存放百万条、 千万条、 上亿条数据。 但是数据库并不是随意地将数据进行…

【Qt 学习笔记】Qt常用控件 | 容器类控件 | Group Box的使用及说明

博客主页:Duck Bro 博客主页系列专栏:Qt 专栏关注博主,后期持续更新系列文章如果有错误感谢请大家批评指出,及时修改感谢大家点赞👍收藏⭐评论✍ Qt常用控件 | 容器类控件 | Group Box的使用及说明 文章编号&#xff…

测试萌新三天速通python基础(二)列表,字符串,元组,字典,遍历,容器,集合,函数

python基础 字符串下标(索引)切片字符串的替换 replace()字符串拆分 split()字符串的连接 join列表 list列表的增删改查列表的反转 reverse()排序列表嵌套元组 tuple 排序 升序降序交换变量字典 dict查询遍历容器集合函数参数函数的嵌套调⽤函数的返回值模块导⼊的⽅法____name…

【FFmpeg】Filter 过滤器 ② ( 裁剪过滤器 Crop Filter | 裁剪过滤器语法 | 裁剪过滤器内置变量 | 裁剪过滤器常用用法 )

文章目录 一、裁剪过滤器1、裁剪过滤器简介2、裁剪过滤器语法3、裁剪过滤器内置变量4、裁剪过滤器示例5、裁剪过滤器应用6、裁剪过滤器图示 二、裁剪过滤器常用用法1、裁剪指定像素的视频区域2、裁剪视频区域中心正方形 - 默认裁剪3、裁剪视频区域中心正方形 - 手动计算4、裁剪…

【Linux】轻量级应用服务器如何开放端口 -- 详解

一、测试端口是否开放 1、测试程序 TCP demo 程序(可参考:【Linux 网络】网络编程套接字 -- 详解-CSDN博客) 2、测试工具 Windows - cmd 窗口 输入命令:telnet [云服务器的公网ip] [port] 二、腾讯云安全组开放端口 1、安全组设…

【C++】——string类

前言 在C语言里面我们用的字符串都是以\0结尾的字符合集,为了操作方便所以在c中推出了stirng类 一 string介绍 1.string是表示字符串的字符串类 2.因为是类,所以他会有一些常用的接口,同时也添加了专门用来操作string的常规操作 3.string…

揭秘高效引流获客的艺术:转化技巧大公开

在数字化营销的海洋中,每个企业都如同一艘努力航行的船,而流量便是推动船只前行的风帆。如何有效吸引并获取潜在客户,即所谓的“引流获客”,已成为企业市场营销策略中不可或缺的一环。本文将详细探讨几种实用且高效的引流获客技巧…

Ardupilot开源代码之Rover上路 - 后续1

Ardupilot开源代码之Rover上路 - 后续1 1. 源由2. 问题汇总2.1 问题1:飞控选择2.2 问题2:飞控安装位置和固定2.3 问题3:各种插头、插座配套2.4 问题4:分电板缺陷2.5 问题5:电机编码器接线及正反向问题2.6 问题6&#x…

【C++】stack和queue 适配器

🔥个人主页:北辰水墨 🔥专栏:C学习仓 本节内容我们来讲解栈和队列的模拟实现,文末会赋上模拟实现的代码 一、stack的使用和模拟实现 stack适配器的介绍: 1. stack是一种容器适配器,专门用在具…

基于openEuler22.03 LTS环境的容器项目实训——分布式微服务项目部署

一、说明 本文配置环境为VMware虚拟机(4核CPU,4 GB内存,40GB磁盘),OS为openEuler 22.03 LTS ,虚拟机要求能联网。 二、安装docker环境 2.1 安装docker相关软件包 [rootnode01 ~]# dnf -y install docker…

Windows环境下VSCode加MinGw-W64搭建C/C++开发环境

前言: 本文记录了自己在配置 Windows环境下 VSCode,并安装MinGW-W64来搭建windows操作系统下下的C/C开发环境。本文重点参考了如下链接中知乎上的文章里介绍的方法,在windows上安装 MinGW-W64。 vscode c/c环境配置(MinGW&…

深度学习中的一些概念

训练术语 欠拟合 欠拟合是指模型没有很好地捕获到数据特性,不能完整地表示数据的全部信息,也就是模型的复杂度低于应有的水平。例如,假设一个数据集实际上服从二阶多项式分布,但我们使用一阶线性模型去拟合它,这样的…

开发时如何快速分析代码和生成测试方法(Baidu Comate插件帮我一键分析)

目录 前言 Baidu Comate智能编码助手简介 安装教程 使用RabbitMQ一个绑定队列方法进行演示 进行测试现有功能 使用感觉 测试结果 前言 因为在开发代码的时候,发现有很多都是废话也不是很想写注释 的,毕竟程序员最讨厌的两件事情,一…

AI 重塑产品设计

作者:明明如月学长, CSDN 博客专家,大厂高级 Java 工程师,《性能优化方法论》作者、《解锁大厂思维:剖析《阿里巴巴Java开发手册》》、《再学经典:《Effective Java》独家解析》专栏作者。 热门文章推荐&am…

Chrome的常用操作总结

Chrome的常用操作总结 最近的自己真的好忙啊,好久真好久没有写博客了,今天我就趁着周末的这段时间总结一下最近自己的用的Chrome浏览器常用的命令 不得不说: 就是特么的丝滑!吊打一切浏览器(不接受反驳哈哈哈)因为反驳我也不听嘻嘻 用好快捷键,就是事半功倍!!!重要的事儿说一遍…

【定制化】在Android平台实现自定义的程序启动页

特别说明:以下仅适用于Android平台。 实现原理 创建安卓端自定义的Activity禁用UnityPlayerActivity的启动Logo改用自定义Activity 示例效果 参考简单步骤或详细步骤都可实现。 自定义的启动动画,效果如下: 简单步骤 三步操作实现启动动画…

Vue3项目Easy云盘(二):文件列表+新建目录+文件重命名+文件上传

一、文件列表 1.封装全局组件Table.vue 因为Main.vue等都会用到文件列表table&#xff0c;所以直接封装成组件。 src/components/Table.vue <template><!-- 表格 --><div><el-tableref"dataTable":data"dataSource.list || []":h…

用迭代加深解决加成序列问题

可以看到这个最坏的结果是100层搜索&#xff0c;但是其实1 2 4 8 16 32 64 128&#xff0c;到128的话也只要8&#xff0c;所以大概只需要10几层搜索就可以解决了&#xff0c;这个时候就可以用迭代加深的方法&#xff0c;深度一点点的加&#xff0c;如果大于概深度就舍去。有人说…

用户登录后端:登录密码解密后用PasswordEncoder验证密码是否正确

前置知识: 前端登录加密看用户登录 PasswordEncoder加密看PasswordEncoder详解 项目中因为要判断用户登录密码是否正确&#xff0c;通过输入错误次数锁住用户 1.后端配置rsa私钥 #密码加密传输&#xff0c;前端公钥加密&#xff0c;后端私钥解密 rsa:private_key: xxxx2. 读…