大模型“诸神之战”,落地才是赛点

ChatGPT 诞生已经快一年,你还在与它对话吗?

有的人用来写报告、改代码,让它成为得力帮手;有的人却只是“调戏”个两三回,让它创作诗歌或故事,便不再“宠幸”。

根据网站分析工具 SimilarWeb 的数据,后者情况似乎更多。目前 ChatGPT 的月活数据已经连续三个月下滑,浏览量从四月的 17.6 亿下滑至八月的 14.3 亿,似乎开始有些过气。

一边是 ChatGPT 这样的通用大模型在退烧,一边是行业大模型研发热度只增不减。

国产大模型正在掀起一场“诸神之战”,然而不少企业都被卡在关键一步,那就是落地。

技术仅是门槛,落地才是赛点

和当年互联网“百团大战”比起来,这一回正在上演的“百模大战”要更内卷,也更烧钱。赛迪顾问数据显示,截至 2023 年 7 月,中国已累计有 130 个大模型问世 [1]。

《中国人工智能模型大地图研究报告》也指出,全国正有 14 个省(市)开展大模型研发。研发主体里,既有国内大学、科研机构,也有包括互联网巨头在内的企业,大佬们纷纷披甲上阵,准备迎接狂热的未来 [2]。

比起专业性弱的通用大模型,国内偏爱的行业大模型,基于各行业数据训练,结合专有知识和经验,更适用于具体场景的工作,能真正服务好千行万业。

但如果将大模型的问世比喻成研发的阶段性毕业,如今的现实情况是,没几个行业大模型能成功“上岗”。大模型能重塑行业,听起来似乎还是“空中楼阁”。

这其中最大的拦路石便是“落地难”。因为像“吞金兽”一样的 AI 大模型,训练成本真不是一般的高。没有雄厚的资金做支撑,很难商业落地。

由斯坦福大学发布的 2023 AI Index 年度报告,基于已有大模型披露的硬件和训练时间,对其训练成本进行了估算。

图片

2019 年发布的 GPT-2,被认为是第一个大型语言模型,拥有 15 亿个参数,估计需要五万美元的训练费用 [3]。

仅仅三年时间,2022 年推出的旗舰大型语言模型之一的 PaLM 拥有 5400 亿个参数,估计成本在 800 万美元。它比 GPT-2 大了约 360 倍,成本也高出了 160 倍 [3]。大模型规模变得越来越庞大,但也愈发昂贵。

落地难的原因除了成本高昂,还有 AI 发展的基础“燃料”算力比较有限。

如果把大模型比较一辆车,那它能走多远,正是取决于算力这个引擎。训练大模型,需要将数据集进行重复多轮计算处理,算力大小就代表着数据处理能力的强弱。

面对大模型数量成倍的增长,这几年中国智能算力规模也正在经历井喷式高速增长。

根据 IDC 发布的《2022-2023 中国人工智能计算力发展评估报告》,2023 年中国智能算力规模已达到 427 每秒百亿亿次浮点运算。预计到 2026 年,智能算力规模将进入每秒十万亿亿次浮点运算级别 [4]。

图片

早在今年 4 月 5 日,OpenAI 就以需求量过大为由,暂时关闭了 ChatGPT Plus 的付费渠道,这意味着仅发布几个月,OpenAI 就开始面临算力缺口 [5]。

大模型这场豪华游戏,能留在牌桌的玩家,注定只是少数。

所以别看大模型喧嚣盛极一时,但当面对成本、算力等现实问题时,国内外市场也正在出现更多理智思考——无法落地商用的通用大模型只能是玩具,成为企业应用的行业大模型才有产业价值 [6]。

AI 深入行业,

知识计算是关键

在国内,从华为云盘古大模型、阿里通义千问,再到 360 智慧大脑、智谱 AI ChatGLM 等,AI 大模型层出不穷。

不少人开始好奇《流浪地球》里不断学习,变得无所不能的最高人工智能莫斯是不是要走进现实了?

也有人担心有朝一日自己的饭碗会不会被 AI 抢走?但从麦肯锡全球研究院调研数据看,下此定论为时尚早。在 2020 年的人工智能全球调研中,AI 在不同行业的平均渗透率为 12.8%,处于较低水平 [7]。

更关键的是,AI 大模型和打工人并非互相取代的关系。而是大模型带来的新机会,能够提升工作效率、释放员工做更多高价值的事情。

图片

为何现阶段的 AI 深入行业程度还不够?

原因是不同行业都有自己数十上百年的专业积累,却缺乏高效利用的方法。解决这个难题的关键,在知识计算。

所谓知识计算,华为云认为就是把各种形态的知识,通过 AI 技术进行抽取、表达后,协同大量数据进行计算,进而产生更为精准的 AI 模型,从而提高行业效率。

为了能提供满足行业场景的多项技能,华为云团队使用 40TB 的文本数据,包含大量通用知识与行业经验,训练盘古自然语言大模型,为行业大模型打下坚实基础。

下一个问题接踵而至——行业专家与 AI 专家合作时,双方如何互相听得懂?华为云的做法是派 200 个博士深入客户现场,“走田头、跑工地、下矿井、进车间”,抓住 AI 技术创新与业务需求的结合点,解决行业难题。

图片

图片

200 多个博士深入行业现场,抓住 Al 技术创新与业务需求的结合点

像汽车领域,为了找到盘古大模型和自动驾驶行业的切入点,华为云深入一线交流请教,梳理行业业务和技术痛点。

现有自动驾驶技术能应对 95% 的常见驾驶场景,剩余 5% 是各类不常见却不断出现的“长尾问题”,阻碍更高智能化的自动驾驶落地。

盘古汽车大模型基于超车线路构建不同的光照、天气、建筑,快速生成近百个样本,生成灵活编辑的虚拟空间,重塑自动驾驶的训练,让模型更好学习应对“长尾问题”。现在学习一个新的复杂场景,时间能从两周以上缩短到两天内。

图片

除了汽车行业,华为云已陆续推出矿山、药物分子、电力、气象、海浪、铁路、政务、金融、制造等大模型,贡献先进的算法和解决方案,在行业内大展身手。

今年夏天,台风“泰利”“杜苏芮”“苏拉”“海葵”先后接棒登陆沿海地区,路径复杂,影响范围广,致灾程度高。如果能精准预测台风路径、级别和经过的地方,就能提早做准备。

但气象预测一直是科研领域的重难点。而盘古气象大模型,不仅将预测时间从 4-5 小时缩短到十秒内,而且在精度上超过传统数值预报方法。

可以说,AI 预报的出现,给天气预报带来了全新可能。

大模型落地,

盘古还使哪些力

前面提到,训练大模型一天也离不开海量的算力。有人形容算力就像我们日常用的水和电一样,要“一点接入、即取即用”。

大模型热潮下,面对企业算力需求的爆发式增长,“算力饥渴”成为了亟待解决的问题。

华为云基于系统性的创新,升级现有数据中心架构,突破单台服务器部件的限制,拆解和重新组合原来以 CPU 为中心的主从架构,升级为各种资源对等的全互联架构——分布式 QingTian 架构。

分布式 QingTian 架构打破了算力、存储和网络的边界,不仅实现高性能 AI 算力,轻松应对万亿级大模型训练,还将助力各行各业直接上云,一步到位搭建业务,更快更稳更高效。

图片

图片

QingTian 架构是基于高速网络协议的分布式对等全互联架构

得益于这一 AI 算力基础设施 ,企业使用华为云昇腾 AI 云服务时,只需要通过一根光纤,便能直接在云上获取算力,随取随用,让大模型算力触手可及。

今年七月,华为云海宣布在乌兰察布和贵安上线昇腾 AI 云服务,提供更长稳的 AI 算力服务;还发布了乌兰察布汽车专区,为自动驾驶开发提供澎湃算力。

开放性是昇腾 AI 云服务的重要优势之一,除了支持盘古大模型,更适配业界主流的近一百个开源大模型。

例如,美图仅用一个月就将 70 个模型迁移到了华为云昇腾 AI 云服务,同时华为云和美图团队一起进行了算子的优化,AI 性能提升了 30%。

图片

如何将大模型应用到行业具体业务和场景中?除了自己做落地,华为还希望构建起一个繁荣的生态。

大模型的创新,从来都不仅仅是模型自身的创新以及各项 AI 根技术的创新,在算力、算法、平台、应用、服务等方面都需要全链条生态伙伴和客户的参与。

打个比方,盘古大模型就像是各个行业通用的“轮子”,加入生态的伙伴都可以在车上找到自己的位置,共同助力,让这辆车跑得更快,行得更远。

为此,华为云开放了全方位的生态合作路径,希望团结伙伴加入盘古大模型全域协同生态体系,真正让 AI 重塑千行万业。

图片

一直以来,华为云践行的就是做实事、做最难的事。

一方面深耕算力,打造强有力的算力底座,支撑人工智能事业发展;另一方面结合大模型,从通用大模型到行业大模型的研究创新,来让人工智能真正服务好千行万业。

9 月 20-22 日,华为全联接大会在上海举办,大会以“加速行业智能化”为主题,汇聚业界思想领袖、商业精英、技术大咖、先锋企业、运营商、生态伙伴以及开发者等产业伙伴,共同探讨智能化技术的发展方向和未来机遇,加速行业智能化。

华为云认为,人工智能的发展,关键要“走深向实”,赋能产业升级,服务好千行万业、服务好科学研究,唯有这样,才能共赢人工智能新时代。

如何学习大模型

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍

在这里插入图片描述

四、AI大模型各大场景实战案例

在这里插入图片描述

五、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/30124.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

delphi 如何使用TEdgeBrowser组件以及打包环境在其他主机上运行

不管开发环境还是第三方环境先安装运行时库:Microsoft Edge WebView2 | Microsoft Edge Developer 开发环境可以直接通过: delphi IDE安装 安装完毕后进入到指定路径,复制里面的WebView2Loader.dll到你要开发的程序根目录: 大致路…

未来工牌:蓝牙智联的彩色墨水屏工牌

在快节奏的现代职场中,传统的工牌已无法满足人们对于个性化和智能化的需求。为此,我们创新研发了一款4寸电子墨水屏工牌,它不仅仅是一个身份的象征,更是一个集蓝牙通信、智能显示、节能环保于一体的未来工具。 这款工牌拥有600*4…

电压模式R-2R DAC的工作原理和特性

本文将探讨电压模式R-2R DAC结构。 在本文中,我们将探索什么是R-2R DAC以及如何实现它们。 首先,我们将简要回顾一下开尔文分压器DAC。这种结构很简单,但它们需要大量的电阻和开关来实现高分辨率DAC。这个问题的一个解决方案是称为R-2R DAC…

用友YonSuite打通招银云直联,让企业收付款更便利

在当今数智化浪潮席卷全球的背景下,企业对于高效、便捷的管理系统需求日益增加。作为全球领先的企业云服务与软件提供商,用友始终站在技术前沿,致力于为成长型企业提供全方位的数智化解决方案。 用友网络与招商银行通过联通双方系统&#xf…

YOLOv8改进 | 卷积模块 | 用坐标卷积CoordConv替换Conv

💡💡💡本专栏所有程序均经过测试,可成功执行💡💡💡 专栏目录:《YOLOv8改进有效涨点》专栏介绍 & 专栏目录 | 目前已有40篇内容,内含各种Head检测头、损失函数Loss、B…

期货的心态

1.跌倒之后爬起过程中的收获 失败跌倒了,一定不要自暴自弃,而是要有跌倒不要紧,要相信爬起来的过程中都会有一定的收获,从交易错误中走出并升华,这就会一步步的使我们迈向更高层次的交易。 2.不要让今天的交易影响到明…

用Selenium自动化Web应用测试!

在开发和维护Web应用时,测试是确保应用正常运行的关键环节。手动测试不仅费时费力,而且容易出错。而通过使用Selenium,程序员可以轻松模拟用户交互、验证页面元素,从而自动化测试过程,提升测试效率和准确性。 解决的问…

第十五章 观察者模式

目录 1 观察者模式介绍 2 观察者模式原理 3 观察者模式实现 4 观察者模式应用实例 5 观察者模式总结 1 观察者模式介绍 观察者模式的应用场景非常广泛,小到代码层面的解耦,大到架构层面的系统解耦,再或者 一些产品的设计思路&#xff0c…

FREERTOS中,队列按键捕获

队列消息获取的按键任务优先级 < 队列消息释放的按键任务优先级 会出现错误&#xff0c;必须先按KEY1&#xff0c;才能按KEY0 解决方法&#xff1a;修改任务的优先级&#xff0c;队列消息获取的按键任务优先级 > 队列消息释放的按键任务优先级

Javaweb之web开发概述

一、Javaweb简介 用Java技术来解决相关web互联网领域的技术栈.使用JAVAEE技术体系开发企业级互联网项目. 项目规模和架构模式与JAVASE阶段有着很大的差别. 在互联网项目下,首先需要明白客户端和服务器的概念 客户端 :与用户进行交互&#xff0c;用于接收用户的输入(操作)、展示…

❤️‍❤️‍❤️‍FlyFlow 工作流:支持字典管理并支持表单引用

FlyFlow 介绍 官网地址&#xff1a;www.flyflow.cc 演示网址&#xff1a;pro.flyflow.cc FlyFlow 借鉴了钉钉与飞书的界面设计理念&#xff0c;致力于打造一款用户友好、快速上手的工作流程工具。相较于传统的基于 BPMN.js 的工作流引擎&#xff0c;我们提供的解决方案显著简…

20240619每日小程序-------朋友想开发微信小程序,那就搞一把demo

下载开发工具 hbuildX 微信开发者工具 随便搞个开源项目 会员小程序 下载后导入到hbuildX 安装依赖 npm i 安装hbuildX插件 工具—》插件安装 推荐安装&#xff1a; 微信小程序一键打包插件sass编译 启动 选择5.用微信开发者工具启动 报错不要怕 比如&#xff1a…

微信小程序生命周期分为3种:页面级别,应用级别,组件级别

应用级别&#xff1a; onLaunch&#xff0c;onShow&#xff0c;onHide 页面级别&#xff1a;onLoad&#xff0c;onShow&#xff0c;onReady&#xff0c;onHide&#xff0c;onUnload 组件级别&#xff1a;

硕思闪客精灵_2024最新版下载-闪客精灵软件下载_闪客精灵应用软件

​不同领域的应用证明了能够解析Flash动画片中的视频文件并以*.fla格式进行导出。人所共知的是支持预览和播放所选的Flash动画片或元素。我们都知道除了将静态文字恢复为文本外&#xff0c;硕思闪客精灵提供了将它转换为矢量图的功能。相信大家都认同闪客精灵专业版的优势&…

【3】Mcgs屏幕脚本程序

目录 1.脚本程序概述1.1 脚本程序简介1.2 脚本程序编辑环境 2.脚本程序语言要素2.1 变量和常量2.2 对象2.3 事件2.4 表达式2.5 联行符2.6 运算符2.7 系统函数 3. 基本语句3.1 赋值语句3.2 条件语句3.3 循环语句3.4 跳出语句3.5 退出语句3.6 注释语句3.7 声明语句3.6 命名规则 1…

AI从云端到边缘:人员入侵检测算法的技术原理和视频监控方案应用

在当今数字化、智能化的时代&#xff0c;安全已成为社会发展的重要基石。特别是在一些关键领域&#xff0c;如公共安全、智能化监管以及智慧园区/社区管理等&#xff0c;确保安全无虞至关重要。而人员入侵检测AI算法作为一种先进的安全技术&#xff0c;正逐渐在这些领域发挥着不…

Web后端Javaee企业级开发之定时任务 Springboot整合任务框架Quartz和Task详解

定时任务 在Java EE企业级开发中&#xff0c;定时任务&#xff08;也称为后台调度或周期性任务&#xff09;是非常常见的一种功能&#xff0c;主要用于执行那些不需要用户交互&#xff0c;但需要按照预定时间间隔或事件触发的任务。Java EE提供了几个框架和API来处理这种需求&…

如何制作 PDF 文件

本文概述了如何使用 Microsoft Word、GeekerPDF、Google Docs 和 Mac Pages 创建 PDF。您还可以使用免费的 PDF 创建器&#xff1b;有许多可供下载或在线使用的创建器。 如何使用 Microsoft Word 创建 PDF 如果您拥有 2007 或更高版本的 Microsoft Word&#xff0c;创建 PDF 的…

深入解析软件架构中的分层架构

目录 前言1. 什么是分层架构1.1 分层架构的基本概念1.2 分层架构的优势 2. 分层架构的具体实现2.1 表示层2.2 应用层2.3 数据访问层2.4 数据层 3. 分层架构的实践与挑战3.1 分层架构的实践经验3.2 分层架构的常见挑战 结语 前言 在软件开发过程中&#xff0c;架构设计是决定项…

【 ClickHouse】 ClickHouse数据类型(整型、浮点型、布尔型、Decimal型、字符串、数组、时间类型)(二)

ClickHouse数据类型 整型 固定长度的整型&#xff0c;包括有符号整型或无符号整型。 1)整型范围&#xff1a; Int8 - [-128 : 127] Int16 - [-32768 : 32767] Int32 - [-2147483648 : 2147483647] Int64 - [-9223372036854775808 : 9223372036854775807]2)无符号整型范围&…