钛媒体首发 | 百度沈抖回应大模型价格战:希望大家别再天天拉表格比价格

ITValue

e55a80a1f00b585a4ba2c270fa234827.jpeg

“有这个时间,不如去卷场景、卷应用。”

作者|张帅

编辑|盖虹达

首发|钛媒体APP

  ITValue

钛媒体App 5月28日消息,在2024智能经济论坛上,百度集团执行副总裁、百度智能云事业群总裁沈抖介绍了文心系列主力大模型免费背后的原因。此外,为了加速行业大模型的落地,百度智能云推出“千帆·行业增强版”,目前已经在政务、交通、工业等行业落地。

“其实我们决定免费的原因特别朴素,就是希望大家别再天天拉表格比价格了,有这个时间,不如去卷场景、卷应用。现在成本更低了,大家创新的胆子可以更大一些、步子可以更快一些,把相关的场景都试一遍,快速验证。跑成功了,就快速复制。”沈抖表示。

此前大模型行业先后开启降价和免费热潮,字节、阿里、百度、腾讯、科大讯飞在内的多家厂商宣布降价或免费,将大模型竞争卷入新的阶段。

但就目前而言,价格并不是用户是否采用大模型的决定性因素,大模型产业链还不完备,降价更大程度起到吸引新客户的作用,是否能够留存客户,还要看大模型厂商的技术整合和生态能力。

一周前,百度智能云宣布ERNIE Speed、ERNIE Lite两款主力模型全面免费。这两个模型是客户在场景应用中经常用到的主力模型,在文案创作、聊天对话、知识问答、内容续写等场景中有较高的调用量。

0309589af8dbea9021015a71b27c24a2.jpeg

沈抖表示,模型免费以及降价,主要是依托于技术能力,尤其是AI异构算力管理平台和“一云多芯”

在AI异构算力管理平台方面,百度百舸·AI异构计算平台能够对不同地点、规模、集群的智能算力进行统一、高效的管理,基于芯片性能优化、自动芯片选型、潮汐混部等技术,大幅提升智能算力效能,万卡集群上的模型有效训练时长占比超过98.8%。相同的大模型任务,百舸能够帮助客户将资源成本降低一半。据推算,百舸每年为企业客户节约的智算成本可达50亿元以上。

在“一云多芯”方面,百舸兼容昆仑芯、昇腾、海光DCU、英伟达、英特尔等国内外主流AI芯片,支持同一智算集群中混合使用不同厂商芯片,最大程度上屏蔽硬件之间差异,帮助企业摆脱单一芯片依赖,打造更有性价比、更安全、更具弹性的供应链体系。在多芯混合训练任务中,百舸能够将单芯片利用率、芯片间通信效率、集群整体效能发挥到极致,百卡规模性能损失不超过3%,千卡规模性能损失不超过5%,均为国内最高水平。

“大家非常关注自主可控。在芯片层,我们有自研的芯片昆仑芯,正在逐步推向市场;当然,如果有其它厂商的芯片,百舸计算平台也能很好地管理起来。在框架层,我们有自研的深度学习框架飞桨,已经成为国内最受欢迎的开源框架。在模型层,我们会保障模型的内容安全可控。”沈抖提到。

此外,在模型层面,千帆ModelBuilder提供的模型路由能力,能够针对任务类型自动分配合适的模型进行处理,让更便宜的小参数模型在特定场景中媲美大参数模型的效果。以小度AI助手为例,通过使用模型路由能力,相比全部任务调用旗舰版文心大模型,成本大幅下降了99%,模型响应速度也提升了200%。“即使是在复杂应用场景下,模型路由也可以节省30%的成本。”沈抖说。

de65631b9585b23fa143457fa6564479.jpeg

此外,为了进一步降低行业大模型的开发门槛,百度智能云此次推出了千帆·行业增强版。

沈抖指出,行业大模型本质上是一个多模型的行业解决方案,由一个通用大模型和多个行业模型组合而成。这些行业模型往往由小模型精调而成,在特定领域具有很强的能力。但企业应用场景十分复杂,如果只是用一个个“孤立”的行业模型去解决特定场景的问题,那么整套工程将会非常复杂,和传统的AI开发没有区别,开发效率极低。

具体来看,千帆·行业增强版主要由资源服务、大模型服务、应用服务三部分组成,它不仅提供千帆、百舸的通用能力,在这个基础上,还做了行业能力的扩展和适配。

在资源服务方面,企业可以结合业务情况,扩展多源数据治理、云边端协同等能力,为业务构建起强大的基础设施;在大模型服务方面,企业可以在千帆平台上自由选择不同参数规模、不同上下文长度、不同细分领域的大模型,然后按需扩展行业模型、行业知识、行业智能体;在应用服务方面,支持添加运营、运维、企业环境内应用开发、应用服务等各类业务逻辑。

沈抖表示,目前,百度文心大模型已经拥有中国最大的产业落地规模,超过半数的央企正在使用百度智能云。


*温馨提示:喜欢ITValue公众号的小伙伴注意啦!根据公众号推送新规,请将ITValue设为“星标”,这样才能第一时间收到推送消息,已设置的小伙伴还需要重新设置“星标”

我知道你在看哦

fba44e8e588c78dcc44b7a9dcad42385.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/844128.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

免费,Python蓝桥杯等级考试真题--第16级(含答案解析和代码)

Python蓝桥杯等级考试真题–第16级 一、 选择题 答案:B 解析:(75)//212//26,故答案为B。 答案:B 解析:因为x15,所以range(2,15),i的取值为2-14&a…

Java+mysql酒店管理系统

1.引言 1.1编写的目的 本文档为酒店管理系统需求分析报告,为酒店管理系统的设计的主要依据,主要针对酒店管理系统的概要设计和详细设计人员,作为项目验收的主要依据。 1.2背景 本软件全称为阳光酒店管理系统。 1.3 参考资料 …

云平台教程 | 手把手教你GSEA富集分析和解读

爱基百客云平台小工具使用 1.1 爱基百客云平台之GSEA分析 1.2 GSEA富集分析原理图 1.3 GSEA富集分析过程 1.4 参数设置 1.5 任务查看 1.6 结果 1.6.1 富集结果表格 1.6.2 富集可视化图解读 01 爱基百客云平台小工具使用 首先,打开爱基百客官网:http://w…

STM32——启动文件选择及启动文件宏定义

文章目录 前提:以STM32F1xx系列芯片为例(有方法,其他系列一样)启动文件选择对应启动文件的寻找方法对应宏定义#define的寻找方法另外 前提:以STM32F1xx系列芯片为例(有方法,其他系列一样&#x…

时间|基于SprinBoot+vue的时间管理系统(源码+数据库+文档)

时间管理系统 目录 基于SprinBootvue的时间管理系统 一、前言 二、系统设计 三、系统功能设计 1管理员功能模块 2用户功能模块 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获取: 博主介绍:✌️大厂码农…

JavaScript数据类型概述及Undefined与Null详解

在JavaScript(简称JS)中,数据类型是构建程序逻辑的基础。ECMAScript标准定义了七种数据类型,包括六种原始(简单)数据类型和一种复杂数据类型。这些类型构成了JS表达和处理信息的核心框架。 数据类型概览 …

VMware vSphere Distributed Services Engine 和利用 DPU 实现网络加速

VMware相关学习专栏:虚拟化技术 vSphere 8.0 通过加速数据处理单元 (DPU) 上的网络功能实现了突破性的工作负载性能。 vSphere 8.0 通过加速 DPU 上的网络功能实现了突破性工作负载性能,从而满足现代分布式工作负载的吞吐量和延迟需求。借助 vSphere Dis…

物联网都有什么优缺点?——青创智通

工业物联网平台解决方案 物联网,这个曾经似乎遥不可及的科技概念,如今已逐渐渗透到我们生活的方方面面。从智能家居到智能工业,从智能医疗到智能城市,物联网技术正在改变着我们的世界。 然而,正如任何一项技术一样&a…

解决 git:OpenSSL SSL_read: SSL_ERROR_SYSCALL, errno 0

解决 git:OpenSSL SSL_read: SSL_ERROR_SYSCALL, errno 0 问题 git pull报错:fatal: unable to access ‘https://github.com/aircrushin/ultrav-music.git/’: Failed to connect to github.com port 443 after 21077 ms: Couldn’t connect to serve…

【Xilinx】MMCM时钟频率合成、相位调整和时钟管理IP核参数的定义及计算方法

前言 MMCM是Xilinx FPGA中用于时钟频率合成、相位调整和时钟管理的IP核。有些参数是用于配置和管理Xilinx FPGA中的MMCM(Mixed-Mode Clock Manager)时钟管理模块的参数。 比如有如下参数 parameter CLKIN_PERIOD_MMCM 10000,parameter…

IPv4组播——组播IP,MAC地址,组播网络基本架构

目录 一.组播的好处 二.组播实现原理 1.组播IP地址 2.组播MAC地址 (1)前24位 (2)第25位 (3)低23位 三.组播网络基本架构 1.源端网络 2.组播转发网络 3.成员端网络 四.组播服务类型 根据组播源…

2024长三角快递物流展即将亮相,致鸿物流器材有限公司值得关注

广东致鸿物流器材有限公司,前身为广州致鸿物流器材有限公司,成立于2002年初,是一家中国专业仓储笼研发制造公司,公司员工约400名,日产仓储笼制造规模近8000个,在全国范围内有五大配送服务中心:江…

一次收获颇丰的Google漏洞挖掘旅程

本文由安全专家Henry N. Caga于2024年03月23日发表在InfoSecWrite-ups网站,本文记录了Henry N. Caga的一次漏洞挖掘过程,此次漏洞挖掘的成果得到了Google官方认可,拿到了4133.70美元的漏洞奖金,并让他成功进入了Google名人堂。本文…

数组和特殊矩阵的压缩存储

文章目录 一维数组二维数组特殊矩阵对称矩阵三角矩阵三对角矩阵稀疏矩阵三元组法十字链表法 一维数组 以一维数组A[0...n-1]为例&#xff0c;其存储结构关系式为 LOC ⁡ ( a i ) LOC ⁡ ( a 0 ) i L ( 0 ⩽ i < n ) \operatorname{LOC}\left(a_i\right)\operatorname{LO…

spark 之数据湖

delta lake 基本使用 可参见&#xff1a; https://docs.delta.io/2.3.0/quick-start.html#language-scala bin/spark-shell --packages io.delta:delta-core_2.12:2.3.0 --conf "spark.sql.extensionsio.delta.sql.DeltaSparkSessionExtension" --conf "spark…

代理IP的几个应用场景

小熊代理IP是采用国际运营商自有纯净IP&#xff0c;高性能、高匿名服务器&#xff0c;稳定且无任何限制的纯净国内跟海外Socks5/HTTP代理IP池&#xff0c;适用于任意种类业务场景访问到世界任何地方的网络数据&#xff0c;高效率的扩展您的在线业务。

python处理EXCEL

python处理EXCEL 在Python中&#xff0c;有多个库可以用来操作Excel文件。其中比较常用的有openpyxl、pandas&#xff0c;以及xlsxwriter。下面我将分别介绍这些库及其使用方法。 一、openpyxl 安装 pip install openpyxl 示例代码 from openpyxl import Workbook, load_workbo…

【Numpy】NumPy数组的切片和索引操作深入详解

深入理解NumPy数组的切片和索引操作 引言 在数据分析和科学计算中&#xff0c;NumPy 是一个非常重要的库。它提供了强大的多维数组对象和丰富的函数库&#xff0c;帮助我们高效地进行数值计算和数据操作。今天&#xff0c;我们将深入探讨 NumPy 数组的切片和索引操作。 什么…

MySQL之性能剖析(四)

性能剖析 使用慢查询 Percona Server对慢查询日志做了哪些改进&#xff1f;比如"使用SHOW PROFILE"执行相同查询后可以抓取到的结果 # Time:110905 17:03:18 # UserHost:root[root] localhost[127.0.01] # Thread_id:7 Schema:saklia Last_errono:0 Killed:0 # Qu…

SSL/TLS协议信息泄露漏洞(CVE-2016-2183)【原理扫描】

2.2 漏洞详情 SSL/TLS协议信息泄露漏洞(CVE-2016-2183)【原理扫描】 【可验证】 详细描述TLS是安全传输层协议&#xff0c;用于在两个通信应用程序之间提供保密性和数据完整性。 TLS, SSH, IPSec协商及其他产品中使用的IDEA、DES及Triple DES密码或者3DES及Triple 3DES存在大约…