大模型2024规模化场景涌现,加速云计算走出第二增长曲线

导读:2024,大模型第一批规模化应用场景已出现。

如果说“百模大战”是2023年国内AI产业的关键词,那么2024年我们将正式迈进“应用为王”的新阶段。

不少业内观点认为,2024年“百模大战”将逐渐收敛甚至洗牌,而大模型在千行万业的应用将从小规模试水,逐渐走向规模化落地。

展望2024,哪些场景更有可能率先实现大模型的规模化应用?

如果将大模型的应用场景分为互联网和政企两大类,基于产业观察,「智能进化论」认为:

在互联网领域,搜索增强、多媒体内容生成(AIGC推理)、智能NPC、量化投研有望成为第一批规模化应用的场景;

在政企领域,政企AI算力调度平台、智能驾驶、销售预测、柔性制造、国产化AI大模型中心等场景走得更快,同时中小企业大模型体验版也有相当大的潜力。

透过大模型在TOP场景的落地,我们不妨追问,这些场景之间有什么共同之处吗?谁在推动大模型跨越规模化应用的奇点?

TOP场景盘点,大模型下一个杀手级应用在哪?

——大模型在互联网领域的规模化应用场景——

在互联网领域,2023年国内诞生了众多聊天机器人、文生文、文生图AI应用。其实,从搜索引擎、多媒体内容到游戏,中国领先的移动互联网生态与大模型的碰撞藏着无限可能,大模型下一个杀手级应用也许就会从中诞生。

  • 搜索增强

搜索增强/检索增强生成技术(RAG)已成为当前最火热的LLM应用方案,被认为能够有效解决知识的局限性和时效性、幻觉等大模型应用的核心痛点。

此前大模型的知识来自训练数据集,而对实时性、非公开的或离线的数据是无法获取到的。搜索增强能够让大模型与实时互联网信息和垂直专业知识库连接,极大拓展了大模型的应用范围。

比如,过去搜索引擎通过关键词检索的方式返回结果,用户还需要花费大量时间精力去筛选原始网页和内容,才能找到想要的信息。通过搜索增强,大模型可以带来更精准的搜索结果,让搜索引擎变成集知识的发现、处理、分析和重新组织为一身的个人智能助理。

搜索增强同时具备检索和生成两种能力。如果将互联网信息比作一座拥有海量知识的图书馆,搜索增强融合了图书管理员和作家两种角色。图书管理员首先能够精准理解用户意图,然后快速从海量知识库中找到最相关的内容,再由作家将内容生成一个清晰易懂的答案,交付给用户。

搜索增强应用范围极广,包括搜索引擎网站、各类垂直APP内的搜索功能、千行百业的智能客服、企业内部知识库构建等等。

  • 多媒体内容生成(AIGC推理)

麦肯锡数据显示,中国生成式AI市场2020~2025年复合增速将达到84% ,2025年中国市场将占全球市场规模的14%。

多媒体内容生成是普通人最有感知的AI场景,也是大模型最火热的应用领域之一。2023年,从AI孙燕姿到妙鸭相机,多个热门AI应用和现象都来自这一场景。AIGC也推动了影像、设计相关领域公司收入大涨。譬如根据2023年上半年财报,在AIGC推动下,美图公司以VIP订阅为主的影像和设计产品业务成为第一大收入,公司实现净利润同比增长320.4%。

多模态大模型提供的文生图、图生图、文生视频、文生3D、数字人生成等能力,能够快速、生成海量高质量创意内容,颠覆了内容产业的商业模式。此外,大模型结合AI增强、云渲染等技术,还能广泛应用于生成高分辨率图片和视频、噪点消除、老片修复和上色、高精度3D建模和3维重建等场景。

值得注意的是,2023年5月几名B站UP主基于开源模型推出的AI孙燕姿,通过AI歌手演绎翻唱歌曲获得了巨大关注度。这也说明大模型爆款应用,可能不一定来自大公司,也有可能来自初创企业甚至技术达人。

  • 智能NPC

传统游戏中,NPC就像工具人,只能按部就班运行早已设定好的指令。如果NPC变成一个个智能体,具备不同的思想、性格和记忆,游戏世界该有多么精彩?是不是有种《西部世界》的感觉?

在大模型加持下,智能NPC能够在与玩家的交互过程中不断进化,发展出独特的游戏剧情,推动整个游戏世界的自我发展,重塑玩家体验。

目前,Ubisoft、网易等头部游戏公司已经尝试应用智能NPC。2023年,Open AI收购了一家名为Global Illumination的游戏公司,看重的正是其用ChatGPT驱动每个NPC角色的能力。

更重要的是,智能NPC让人们看到大模型+游戏产业背后更大的想象力,未来游戏中的其他元素,会不会也逐渐向AI生成的方向发展?

  • 量化投研

量化投研是指金融机构通过分析大量金融和市场数据,预测市场走势与价格波动,从而提供投资策略和建议。然而金融市场瞬息万变,传统的投研工作面临信息爆炸、数据碎片化、预测准确率低、时效性差等挑战。

大模型投研工具成为金融行业提升投研效率的新解法。2023年已有多家金融科技平台推出大模型投研工具,让投研工作更高效更轻松。量化投研大模型可以通过分析市场行情、量价关系、研究报告、企业财报、舆情和热点等海量数据,为专业人士快速提供投资组合建议和风险管理策略。

——大模型在政企领域的规模化应用场景——

大模型在政企领域的热门应用场景在政企领域,那些率先实现规模化应用的场景将围绕政企客户、重点行业与中小企业展开。

比如,政企AI算力调度平台能够实现本地算力与云上算力的统一管理调度,国产化AI大模型中心为政企客户提供从芯片到平台应用全栈自主可控的基础设施。

在新能源汽车、新零售、新制造等产业,智能驾驶、销售预测、柔性制造是大模型的热门落地场景。

为降低中小企业使用大模型的资金、技术、人才门槛,中小企业大模型体验版可以让中小企业通过快速训练推理出适合自己的大模型,实现跨越式发展。

云计算,大模型走向规模化应用的必经之路

尽管上述场景分散在各行各业,但如果非要找出这些场景的共同点,它们背后都有同一个不可忽视的驱动力,那就是云计算。

观察最头部的大模型应用创新,从ChatGPT到MidJourney,不难发现一流的大模型初创公司都背靠强大的云厂商。

如今,大模型领域的竞争已经转化为“云+AI”的体系化技术竞争。尤其是当大模型步入规模化应用阶段,云计算已经成为AI大模型创新发展的土壤。换句话说,大模型在千行万业能不能用得好,关键在于云计算。

我们也是时候重新认识云计算对于AI的价值了。

首先,弹性、可靠、高效的云上算力支持

大模型是算力无底洞,此前业界曾预测OpenAI训练GPT-4可能使用了大约10000-25000张GPU,这背后离不开微软云上算力的支撑。而且,大模型不仅需要海量算力,还要求算力具备灵活、弹性、可靠、高效等特性,云计算可以给到最佳解决方案。

国内云上AI算力供给,不得不提到华为云。华为云在贵安、乌兰察布、芜湖3大AI云算力中心及30多分节点,能够为企业提供澎湃昇腾AI算力。目前,昇腾AI算力可实现千卡训练30天长稳率达到90%,训练作业故障自动恢复,非自动场景下恢复时长小于30分钟,为千行百业使用大模型提供了稳定可靠、高质量的云底座。

此外,云上AI算力的可用性也是中国AI企业面临的新挑战。面对美国商务部抛出的“云上AI算力禁令”,华为云提供了充沛的昇腾算力,大大降低了中国企业云上AI算力被卡脖子的风险。

其次,基于系统级优化能力,实现降本增效

大模型也是吞金兽。大模型要想取得突破,消耗的算力资源每3-4个月就要翻一番。不久前,马斯克称参与AI军备竞赛的企业每年需要在AI硬件上投入数十亿美元,才能保持竞争力。

云计算是解决大模型成本问题的必由之路。一方面,云计算可以通过容器或Serverless技术,能够极大提升资源的复用率,让客户无需为闲置资源付费。另一方面,近年来云计算还在不断产生大量细分领域技术创新,专门针对AI、大模型的降本增效而生。

以前面提到的搜索增强场景为例,要构建搜索大模型增强能力,需要海量数据和AI算力资源,资金和时间成本巨大。解决这些痛点必须靠云基础设施层面的系统性优化。比如,华为云SFS Turbo可以大幅提升数据加载、训练数据读取速度,而且故障备份恢复快,实现千亿大模型ckpt文件秒级保存,让企业省钱更省心。华为云ModelArts AI加速套件,通过AI训练组网、集合通信算子及训练框架优化,可实现6千卡集群并行训练性能领先业界30%。

在AIGC场景下,华为云针对该场景的算子优化,能将整体性能提升30%。在某客户案例中,将图像生成模型迁移到昇腾后,通过AIGC生成一张图片的时间从6.2秒减少到5.2秒,并且通过AI渲染加速可以提升渲染效率2-4倍,大幅降低了内容生成时间和成本。


第三、海量AI应用创新的平台

云服务商不仅是底层资源的提供者,也是创新服务的构建者。如今越来越多的云厂商在MaaS新商业模式下不断探索,将AI和大模型能力作为创新云服务对外赋能。

比如,高峰期智能NPC每天都要面临海量玩家的实时交互,这让智能NPC对实时交互的时延和推理算力弹性扩缩容要求非常高。华为云与网易伏羲进行联合创新,通过网易伏羲构AI多云平台与华为云昇腾AI云服务的适配,在算子层和框架层进行大量性能优化。满足了交互场景的秒级时延要求,让智能NPC做到“忙时不慌,闲时不废”,保障了各时段玩家的体验。

Cloud for AI,云厂商破局的新机会

AI已经成为云计算产业发展的第二增长曲线。

得益于AI技术的发展,全球云计算行业实现再次加速。Synergy Research数据显示,全球企业2023年四季度在云计算的总支出达740亿美元,环比增长56亿美元,环比增速创下历史新高。预计2023年全球云计算行业收入将达到2700亿美元。

Synergy分析师John Dinsdale表示:“云计算是一个规模很大的市场,需要付出很大努力才能获得进展,但人工智能已经做到了这点。”他认为,在AI的助力下,接下来云计算市场规模还会继续增长。

2023年,大模型与生成式AI的火爆,让一个大趋势日益明晰:未来,几乎所有应用都会接入AI/大模型能力,我们将迎来一个AI原生应用的时代。

大模型给千行万业带来了新的生产方式、交互方式、业务范式、商业模式,未来各个产业对AI的需求(包括大模型产业链、云上算力、生成式AI)一定是大规模增长,这也给云计算产业带来了新的增长点。

在这样的大趋势下,Cloud for AI不仅是云厂商的新机会,也是必答题。纵观全球头部云厂商,都在探索如何基于AI重塑云计算技术和服务体系,开辟出全新的服务场景和服务内容。

国际云厂商方面,微软是AI助力云业务腾飞的典型案例。在2024财年第二财季(截至2023年12月31日),微软智能云Azure和其他云业务实现营收同比增长30%。目前,在微软智能云的5.3万名客户中,有三分之一都是2023年新加入的。

在国内,华为云则是Cloud for AI的深度践行者。华为云提供了从昇腾AI云服务、盘古系列大模型以及一系列AI研发工具套件在内的完整AI全栈技术平台。可以预见的是,在Cloud for AI的时代,AI将成为华为云一张独特的名片。

过去,大模型高高在上,很难落地。在经过一番痛苦的摸索与实践后,人们才发现,大模型落地的解法不在大模型本身,而在Cloud for AI。当Cloud for AI已就绪,当第一批TOP场景诞生,大模型才能真正驶向规模化应用的广阔星空。

文中图片来自摄图网

END

本文为「智能进化论」原创作品。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/677356.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

幻兽帕鲁专用服务器,多人游戏(专用服务器)搭建

玩转幻兽帕鲁服务器,阿里云推出新手0基础一键部署幻兽帕鲁服务器教程,傻瓜式一键部署,3分钟即可成功创建一台Palworld专属服务器,成本仅需26元,阿里云服务器网aliyunfuwuqi.com分享2024年新版基于阿里云搭建幻兽帕鲁服…

如何用Hexo搭建一个优雅的博客

引言 在数字化时代,拥有一个个人博客已经成为许多人展示自己技能、分享知识和与世界互动的重要方式。而在众多博客平台中,Hexo因其简洁、高效和易于定制的特点而备受青睐。本文将详细介绍如何从零开始搭建一个Hexo博客,让你的个人博客在互联…

Tuxera NTFS2024永久免费版磁盘读写软件

Tuxera NTFS 2024由Tuxera公司开发,是一款专为Mac系统设计的NTFS磁盘读写软件。以下是这款软件的具体优势: 全面的读写功能:Tuxera NTFS 2024允许Mac用户全面读写NTFS格式的硬盘、U盘、SD卡等存储设备。这意味着用户可以在Mac上自由读取和写…

【JavaEE Spring 项目】博客系统

博客系统 前⾔项⽬介绍1. 准备⼯作1.1 数据准备1.2 创建项⽬1.3 准备前端⻚⾯1.4 配置配置⽂件1.5 测试 2. 项⽬公共模块2.1 实体类的编写2.2 公共层 3. 业务代码3.1 持久层3.2 实现博客列表3.3 实现博客详情3.4 实现登陆令牌技术JWT令牌介绍JWT令牌⽣成和校验 3.5 实现强制要求…

Netty应用(四) 之 Reactor模型 零拷贝

目录 6.Reactor模型 6.1 单线程Reactor 6.2 主从多线程Reactor (主--->Boss | 从--->Worker | 一主多从机制) 7.扩展与补充 8.Reactor模型的实现 8.1 多线程Reactor模型的实现(一个Boss线程,一个Worker线程) 8.2 多线程Reactor模…

SolidWorks学习笔记——入门知识1

目录 1、固定最近文档 2、根据需要自定义菜单栏 3、根据需要增添选项卡 4、命令搜索框 5、鼠标右键长按快速切换视图 6、鼠标笔势 自定义鼠标笔势 1、固定最近文档 图1 固定最近文档 2、根据需要自定义菜单栏 图2 根据需要自定义菜单栏 3、根据需要增添选项卡 图3 根据…

架构(十二)动态Excel

一、引言 作者最近的平台项目需要生成excel,excel的导入导出是常用的功能,但是作者想做成动态的,不要固定模板,那就看看怎么实现。 二、后端 先捋一下原理,前后端的交互看起来是制定好的接口,其实根本上是…

OCP使用CLI创建和构建应用

文章目录 环境登录创建project赋予查看权限部署第一个image创建route检查pod扩展应用 部署一个Python应用连接数据库创建secret加载数据并显示国家公园地图 清理参考 环境 RHEL 9.3Red Hat OpenShift Local 2.32 登录 通过 crc console --credentials 可以查看登录信息&…

Stable Video Diffusion图片转视频——Stability AI开源视频模型

我们前期介绍过Stable Diffusion,stable diffusion模型是Stability AI开源的一个text-to-image的扩散模型,其模型在速度与质量上面有了质的突破,玩家们可以在自己消费级GPU上面来运行此模型。 文生图大模型已经火了很长一段时间了&#xff0c…

专业130+总分410+苏州大学837信号系统与数字逻辑考研经验电子信息与通信,真题,大纲,参考书

今年考研总分410,专业837信号系统与数字逻辑130,整体每门相对比较均衡,没有明显的短板,顺利上岸苏大,总结一下自己这大半年的复习经历,希望可以对大家有所帮助,也算是对自己考研做个总结。 专业…

Java:常用API接上篇 --黑马笔记

一、 StringBuilder类 StringBuilder代表可变字符串对象,相当于是一个容器,它里面的字符串是可以改变的,就是用来操作字符串的。 好处:StringBuilder比String更合适做字符串的修改操作,效率更高,代码也更…

Idea里自定义封装数据警告解决 Spring Boot Configuration Annotation Processor not configured

我们自定对象封装指定数据&#xff0c;封装类上面一个红色警告&#xff0c;虽然不影响我们的执行&#xff0c;但是有强迫症看着不舒服&#xff0c; 去除方式&#xff1a; 在pom文件加上坐标刷新 <dependency><groupId>org.springframework.boot</groupId><…

11 插入排序和希尔排序

1. 插入排序 基本思想 直接插入排序是一种简单的插入排序法&#xff0c;基本思想&#xff1a; 把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中&#xff0c;直到所有的记录插入完为止&#xff0c;得到一个新的有序序列 在玩扑克牌时&#xff0c;就用…

【知识整理】招人理念、组织结构、招聘

1、个人思考 几个方面&#xff1a; 新人&#xff1a;选、育、用、留 老人&#xff1a;如何甄别&#xff1f; 团队怎么演进&#xff1f; 有没有什么注意事项 怎么做招聘&#xff1f; 2、 他人考虑 重点&#xff1a; 1、从零开始&#xff0c;讲一个搭建团队的流程 2、标…

Python pandas中read_csv函数的io参数

前言 在数据分析和处理中&#xff0c;经常需要读取外部数据源&#xff0c;例如CSV文件。Python的pandas库提供了一个强大的 read_csv() 函数&#xff0c;用于读取CSV文件并将其转换成DataFrame对象&#xff0c;方便进一步分析和处理数据。在本文中&#xff0c;将深入探讨 read…

【网页设计】春节页面背景模板

无偿下载地址&#xff1a;https://download.csdn.net/download/weixin_47040861/88811143 1.实现效果 2.代码 1.html <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content&q…

【超高效!保护隐私的新方法】针对图像到图像(l2l)生成模型遗忘学习:超高效且不需要重新训练就能从生成模型中移除特定数据

针对图像到图像生成模型遗忘学习&#xff1a;超高效且不需要重新训练就能从生成模型中移除特定数据 提出背景如何在不重训练模型的情况下从I2I生成模型中移除特定数据&#xff1f; 超高效的机器遗忘方法子问题1: 如何在图像到图像&#xff08;I2I&#xff09;生成模型中进行高效…

推荐系统|召回04_离散特征处理

离散特征处理 离散特征是什么 怎么处理离散特征 One-hot编码 Embedding嵌入 从one-hot到Embedding&#xff0c;已经节省了很多的存储空间&#xff0c;但当数据量大的时候&#xff0c;还是占空间&#xff0c;所以工业界仍会对Embedding进行优化 而一个物品所对应的Embedding参数…

基于JSP的网上购书系统

点击以下链接获取源码&#xff1a; https://download.csdn.net/download/qq_64505944/88825694?spm1001.2014.3001.5503 Java项目-15 源码论文数据库配置文件 基于JSP的网上购书系统 摘要 在当今的社会中&#xff0c; 随着社会经济的快速发展以及计算机网络技术和通讯技术…

8种基本类型的包装类(与String的转换)

java针对8种基本数据类型&#xff0c;定义了相应的引用类型&#xff1a;包装类(封装类)&#xff0c;有了类的特点&#xff0c;就能调用类中的方法&#xff0c;java才是真正的面向对象。 基本数据类型 包装类byte Byteshort Shortint Integerlong Longfloat Floa…