大模型落地竞逐,云计算大厂“百舸争流”

作者 | 辰纹

来源 | 洞见新研社

从ChatGPT到Sora,从图文到视频,从通用大模型到垂直大模型……经过了1年多时间的探索,大模型进入到以落地为先的第二阶段。

行业的躁动与资本的狂热相交汇,既造就了信仰派的脚踏实地,也产生了投机者的浑水摸鱼,如今回头,大模型落地到底进行的怎样了,大模型厂商们又是如何实践的?

我们今天选取阿里、百度、腾讯、华为这四个头部云计算厂商,从他们或明或暗的战略路线,来窥视出大模型落地的路径分野。

01 阿里云:闭源开源两线并举 

不久前结束的阿里云AI智领者峰会·北京站上,阿里云CTO周靖人直接亮明了“底牌“,“阿里云是全球唯一一家既在持续做(大)模型开发,又做大量(大)模型开源的公司。”

之所以会两线并举,周靖人的解释是,为了满足用户和开发者生态对基础模型的不通需求,这也是“模型即服务“的内涵之一。

具体实践中,阿里云此次大会发布了闭源SOTA大模型通义千问2.5,根据权威基准OpenCompass的测评结果,通义千问2.5得分追平了GPT-4 Turbo,为国产大模型取得的最高排名。

开源路线上,自2023年8月以来,阿里云陆续开源了十数款模型,据官方公布数据显示,目前通义开源模型下载量已经超过了700万,最新开源的1100亿参数模型在多个基准测评收获最佳成绩,超越Meta的Llama-3-70。

虽然有了基础模型,但是各行各业的需求不同,即便是同一行业中的不同企业,他们之间的需求也很难被统一,因而标准化的基础模型很难被直接用起来,为此,阿里云贴着开发者生态的场景需求,升级了AI Infra平台——百炼,推出了百炼 2.0。

百炼 2.0依托阿里云AI基础设施,同时对模型开发、应用开发和算力底座等工具进行了升级,引入更多模型,还率先兼容LlamaIndex等开源框架,企业可自由替换能力组件来适配自身系统。

作为国内最大的云厂商,阿里云拥有最为庞大的业务规模和覆盖最全面的客户群体,在AI路线还远没有收敛的行业背景下,一面是客户需求的驱动,一面是对技术踏空的隐忧,阿里云在大模型上全面布局也就可以理解了。

如果再将阿里云3月份时的史上最大力度降价相关联,可以看出,阿里云的种种动作都指向一个目标,即实现云和人工智能业务的螺旋上升,暗含着对未来业绩增长的长远考量。

02 百度云:以AI原生应用为矛 

在几家云计算大厂中,百度云的规模最小,但由于大模型与百度一直坚持的AI技术路线强关联,加之去年3月推出文心一言后,又陆续在大模型工具平台、大模型对自身应用重构、大模型生态建设等方面,进行了一系列体系化的出击,使得其成为大模型行业中极为重要的一支力量。

百度的打法并不复杂,一方面通过对文心一言的持续进化,保证文心一言的能力始终处于第一梯队,去年的百度世界大会上推出的文心大模型4.0版本的参数规模达到万亿级别,综合能力不逊色于GPT-4。

另一方面强调原生应用重要性,李彦宏分析大模型应用竞争的本质是表示:“企业竞争,不是大鱼吃小鱼,而是快鱼吃慢鱼,比竞争对手更快决策,很可能你就赢了。”这事实上也是百度在大模型落地上的竞争策略:加速冲刺,多方探索应用可能,尤其看重“AI原生应用”。

百度首先用大模型对自己的产品进行了全面改造和焕新,基于现有的用户基础,获得真实使用反馈后,反过来加速大模型的迭代;然后与云服务相结合,提供智能算力资源和训练工具,帮助其他企业开发自己的模型。

为此,百度智能云推出了一系列平台或工具产品,如帮助生成营销材料的“擎舵”、文心大模型插件开发平台“灵境”,企业级大模型生产平台“千帆”等。

百度云今年春季召开的首届生态大会中,宣布面向三类市场——头部市场、价值市场和高潜市场,厘清与伙伴之间的分工协作边界,实现协同作战,其目的也是为了将场景快速闭环,加速大模型落地。

03 腾讯云:以实用主义落地实体经济 

腾讯入局大模型的时间比较晚,直到去年9月的腾讯全球数字生态大会上才正式发布自研的通用大语言模型混元大模型,在行业中一直是比较低调和另类的存在。

混元大模型发布之前,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生曾阐述过腾讯的大模型价值观,“通用大模型不一定是满足行业场景需求的最优解。企业需要有针对性的行业大模型,结合自己的数据做训练或精调,在合理的成本下,打造实用性更高的智能服务。”

实用主义由此被提炼出来。

一方面是关注大模型解决具体问题而不是参数大小,另一方面是用什么样的技术组合更有效率的解决问题。

腾讯云副总裁、腾讯云智能负责人吴运声曾表示:“几亿、几十亿、几百亿还是一千多亿,我们并不关心模型参数的那个数字,我们更关注的怎么解决客户的问题,希望用最有效,最低成本的手段去解决客户的问题。”

在具体实践上,腾讯云有着非常清晰的思考,第一步,铆钉标杆客户;第二部辐射整个上下游产业链的腰部企业,而破局的关键就是实体经济

目前,腾讯云已经携手政务等行业的头部企业,在20余个行业探索了超50个行业大模型的应用解决方案。以腾讯云数智人工厂为例,腾讯云MaaS能力可以让数智人分身复刻缩短至24小时,大幅降低成本。在文旅领域推出的文旅大模型,金融领域打造的OCR大模型都是已经落地的案例。

04 华为云:以算力底座为基础深入千行百业 

与很多大模型厂商在刚入局时死磕技术,专注于对标ChatGPT的能力有所不通,华为云的大模型战略一开始就是奔着落地去的,去年的世界人工智能大会上,华为轮值董事长胡厚崑演讲时表示,人工智能的发展关键在于“走深向实”,华为的定位是赋能产业升级,服务好千行百业,服务好科学研究。

围绕这个定位,华为的大模型战略出现了两条路径,一是大模型领域,从通用大模型到行业大模型,让人工智能使能行业,助力科研;二是算力领域,打造强有力的算力底座。

华为云盘古大模型3.0发布时,提出了“不作诗只做事”的口号,按照“5+N+X”三层架构,即基础模型、行业模型和场景模型,目前已经落地金融、制造、政务、煤矿、铁路等10多个行业,支撑400多个业务场景的AI应用落地。

一个最典型的场景,煤矿的智能化升级中,盘古矿山大模型只需导入海量无标注的矿山场景数据进行预训练,即可进行无监督自主学习,一个大模型可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景的通用。目前,盘古矿山大模型已在全国8个矿井规模使用。

做强算力底座方面,华为的关键词是“自研”和“开放”

在相对底层的计算效率研究方面,华为的打法是架构创新,基于自研的达芬奇架构,推出昇腾处理器,围绕昇腾芯片打造昇腾AI集群,国内建设的规模最大的AI计算集群深圳鹏城云脑II期不但实现了全栈软硬件的自主可控,还蝉联了多项全球AI性能榜单的冠军,算力达到1000P。

不难看出,华为不但直接卖“鱼”,还传授“捕鱼”技巧。

05 结语 

综上所述,这四家云计算大厂对于大模型的落地虽然在打法上各有侧重,但目标还是非常一致,基本上都是在自身原有业务的基础上进行延展,或继续加长自己的长板,或开发出新的增量。

值得一提的是,除了在大模型的技术和业务层面进行竞争之外,这几家大厂还广泛参与到大模型创业公司的投资之中,目前中国估值前五的生成时AI独角兽(月之暗面、智谱AI、Minmax、零一万物和百川智能),阿里的参投率为100%,腾讯则投了百川智能、智谱 AI 、MiniMax 3家,此外深言科技、无问芯穹等大模型公司也曾进入到腾讯的投资名单。

这也是说,大模型的竞争不仅仅只停留在大模型上,资本层面的暗战同样激烈。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/13656.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

7.从0做一个vue键盘组件

文章目录 1. 从0做一个键盘组件1.1. 最终效果1.2. 分析1.3. 实现1.4. 如何引用 1. 从0做一个键盘组件 首先是why的问题:为什么需要做键盘组件? 我们目前可知的场景: 在新增账单的时候,需要用到键盘在比如从账单列表页&#xff…

保护共享资源的方法(互斥锁)

我最近开了几个专栏,诚信互三! > |||《算法专栏》::刷题教程来自网站《代码随想录》。||| > |||《C专栏》::记录我学习C的经历,看完你一定会有收获。||| > |||《Linux专栏》&#xff1…

MagicAnimate: Temporally Consistent Human Image Animation using Diffusion Model

show lab NUS&bytedancehttps://github.com/magic-research/magic-animate 问题引入 输入参考图片 I r e f I_{ref} Iref​和动作序列 p 1 : N [ p 1 , ⋯ , p N ] p^{1:N}[p_1,\cdots,p_N] p1:N[p1​,⋯,pN​],其中 N N N表示的是帧数,输出的是 …

buuctf的RSA(二)

1.RSA 知道 flag.enc 和 pub.key,典型的加密、解密 将pub,key 改为pub.txt 打开后发现公钥 在RSA公私钥分解 Exponent、Modulus,Rsa公私钥指数、系数(模数)分解--查错网 进行解密 得到e65537 n8693448229604811919066606200349480058890565…

LeetCode 79.单词搜索

原题链接:. - 力扣(LeetCode) 给定一个 m x n 二维字符网格 board 和一个字符串单词 word 。如果 word 存在于网格中,返回 true ;否则,返回 false 。 单词必须按照字母顺序,通过相邻的单元格内…

6款网页表白代码6(附带源码)

6款网页表白代码6 前言效果图及部分源码1.爱心倒计时2.一起看星星3.爱心4.爱心(有鼠标移动特效)5.爱心(高级效果)6.爱心(3D效果) 领取源码下期更新预报 前言 大部分人都有喜欢的人,学会这些表白…

蓝桥杯物联网竞赛_STM32L071KBU6_关于sizo of函数产生的BUG

首先现象是我在用LORA发送信息的时候,左边显示长度是8而右边接收到的数据长度却是4 我以为是OLED显示屏坏了,又或者是我想搞创新用了const char* 类型强制转换数据的原因,结果发现都不是 void Function_SendMsg( unsigned char* data){unsi…

微软Edge

微软Edge浏览器概述 功能介绍 微软Edge是一款基于Chromium开源项目的网页浏览器,旨在提供更快的网页加载速度、更高的安全性和更好的用户体验。它支持多种操作系统,包括Windows、macOS、Android和iOS,能够满足不同用户的需求。Edge浏览器拥…

【Linux】-Zookeeper安装部署[17]

简介 apache ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。 除了为Hadoop和H…

2024最新 Jenkins + Docker 实战教程(四) - 编写自己的Springboot项目实现自动化部署

😄 19年之后由于某些原因断更了三年,23年重新扬帆起航,推出更多优质博文,希望大家多多支持~ 🌷 古之立大事者,不惟有超世之才,亦必有坚忍不拔之志 🎐 个人CSND主页——Mi…

0407放大电路的频率响应

放大电路的频率响应 单时间常数RC电路的频率响应中频响应高频响应低频响应全频域响应 放大电路频率响应概述1. 直接耦合放大电路频域响应阻容耦合放大电路频域响应 4.7.1 单时间常数RC电路的频率响应 4.7.2 放大电路频率响应概述 4.7.3 单级共射极放大电路的频率响应 4.7.4 单级…

TOSHIBA UTLH21 属于Unifi NV系列

TOSHIBA UTLH21 是东芝推出的一款工业控制器,属于Unifi NV系列。 这款控制器代表了东芝在工业自动化领域的一次重要进步,它在功能和性能上都超越了现有的V系列控制器。以下是UTLH21的一些主要特点: 高速逻辑与控制能力:UTLH21具…

Spring框架中获取方法参数名称:DefaultParameterNameDiscoverer

DefaultParameterNameDiscoverer 是Spring框架中用于获取方法参数名称的一个类。在Java中,方法的参数名称通常在编译时会丢失,因为Java字节码并不强制要求保留这些信息。Spring提供了一种机制来恢复这些参数名称,这就是通过DefaultParameterN…

IT行业的现状与未来趋势

这里写目录标题 一、引言二、IT行业的现状三、IT行业面临的挑战四、IT行业的未来趋势五、结论 一、引言 信息技术(IT)行业在过去几十年中经历了飞速发展,从早期的计算机硬件和软件开发,到如今涵盖云计算、人工智能、大数据、物联…

深度学习之基于Django+Tensorflow卷积神经网络实时口罩检测系统

欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。 文章目录 一项目简介 二、功能三、系统四. 总结 一项目简介 一、项目背景 随着全球疫情的持续,佩戴口罩成为了公众日常生活中不可或缺的一部分。特别是在人员密集的…

【python】python社交交友平台系统设计与实现(源码+数据库)【独一无二】

👉博__主👈:米码收割机 👉技__能👈:C/Python语言 👉公众号👈:测试开发自动化【获取源码商业合作】 👉荣__誉👈:阿里云博客专家博主、5…

BEVFuison测试全过程记录

cuda版本10.1 pytorch: 根据cuda版本选择pytorch版本: 1. 创建conda虚拟环境: conda create -y --name mmcv python3.8 conda activate mmcv2. 安装依赖库: pytorch: conda install pytorch1.7.1 torchvision0.8.2 torchaudi…

特征融合篇 | YOLOv8改进之引入轻量级跨尺度特征融合模块CCFM | 源自RT-DETR

前言:Hello大家好,我是小哥谈。CCFM(Cross-Scale Feature Fusion Module)即为跨尺度特征融合模块。这个模块的作用是将不同尺度的特征通过融合操作整合起来,以增强模型对于尺度变化的适应性和对小尺度对象的检测能力。CCFM可以有效地整合细节特征和上下文信息,从而提高模…

2024定制版抢单支付系统源码(开代理自动抢单接单)

随着网络和移动支付技术的不断进步,抢单支付系统已经成为商家和用户进行交易的便利工具。2024定制版抢单支付系统源码为开发者提供了一个可定制化的解决方案,具备开放代理和自动抢单接单功能,帮助用户快速搭建抢单支付平台。本文将为您介绍这…

专题汇编 | ChatGPT引领AIGC新浪潮(一)

ChatGPT的产生与迭代 2022年11月末,美国人工智能研究实验室OpenAI推出ChatGPT。上线的ChatGPT只用了2个月,活跃用户数就突破了1亿,创造了应用增速最快的纪录。 ChatGPT是什么 ChatGPT是一种人工智能技术驱动的自然语言处理(Natural Language Processing,NLP)工具,使用的…