重构云计算,打造 AI 原生时代的云计算产品与技术体系,实现 AI 零距离

概述

自 ChatGPT 大模型横空出世以来,文心一言、通义千问等诸多大模型接踵而来,感觉这个世界每天都在发生着翻天覆地的变化。

今年很有幸,参与了云栖的盛宴,当时被震惊到瞠目结舌,12 月 20 日百度云智能云智算大会,又给我一记重拳,这让我不由得开始重新评估 AI 与我们的距离,AIGC 的时代或许已经开始吹响冲锋的号角,而我们也应该做好充足的准备,迎接新的挑战。

在此次百度智能云智算大会上,我细致的听了全程,受益匪浅,学习到很多先进的概念,例如云智一体、智算、数据"智"理、模型即服务等。这都不由得让我感叹 AI 发展的迅速,新的信息风暴已经在爆发的前夕,不日,必将石破天惊。

百度智能云此次地主题是"重构云计算,打造 AI 原生时代地云计算产品与技术体系"。重构这个词通常与解构并行出现,解构最早来源于海德格尔的《存在与时间》,为分解、消解、拆解、揭示等;重构是对解构的扩展和延伸,在程序设计中所用甚广,通常意指调整代码结构,使其设计模式和架构更趋合理。

毫无疑问,在计算机的领域,这是一个非常的词,更何况后续还附带了体系两字,这不由得让我欣喜,也让我好奇,本次大会又会有何等惊涛骇浪的创新。

重构——云原生时代

在长驱直入本次智算大会之前,我想先聊一下 AI 重构的意义。

不知道大家有没有切身实地的训练过 AI 模型,尝试过 AI 模型的部署,如果你是一个初学者,你会发现这整个过程每个步骤都会让你头痛。

作为浪漫主义和完美主义熏陶的国人,精益求精是我们的核心驱动力,AI 模型也是这样,我们无时无刻不试图突破 AI 模型的精度极限,做到最优、最好。在这个过程中模型参数量也在同步快速的膨胀,越来越大,大模型就这么出现了。

大模型带来了更大的计算复杂度,训练对算力以及基础设施的要求越来越高,训练所需的资源成本也随之飙升。我们不可能停下前进的脚步,那么我们就必须解决两个核心问题:如果稳定的训练模型,如何持续的降本增效。

在一次百度智能云的线上公开课中,针对于当下的 AI 的痛点问题,主要总结了亮点:

  • 资源效能: 资源利用率、异构芯片调度等
  • 工程效能:大模型落地、训练/推理任务的效率等

AI 工程效率低下,是当下亟待解决的核心问题。那我们又该如何优化那?

云原生,没错,云原生。

云原生 CNCF 定义:云原生是构建应用程序一类技术的统称,通过云原生技术可以构建出可弹性扩展的应用程序,这些应用程序可以被运行在不同环境当中,比如公有云、私有云、混合云等新型动态环境中。

定义非常晦涩,难以理解,但我们可以从中捕获到两个关键词:可弹性扩展和动态环境。借助云原生,应用的开发者不再需要考虑底层的环境,可以实现快速部署、按需弹性扩伸缩的应用程序。云原生 AI 则是更贴近 AI 场景的重构设计,以容器服务为核心,以云原生技术为基础架构的 AI 工程解决方案,整合云计算、存储等服务,贯穿 AI 任务的全周期。

听起来是不是有些困难,在互联网界,越是基础、越是核心的基础设施,解决方案,越是卷,百度智能云又会如何展开自己的重构之路,搭建云原生AI基础设施那?

智算时代

百舸 3.0

云原生 AI 可以帮助 AI 任务实现资源的高效利用和无缝迁移等问题,在此次百度智能云智算大会中,百度进一步重构了智算基础设施,针对大模型场景进行了专项优化。全新发布百度百舸· AI 异构计算平台 3.0,百舸 3.0 承载了百度智能云的云原生 AI,是一套专注于 AI 工程化建设,提供软硬一体的异构计算平台。

百舸 3.0 对原生 AI 应用和大模型的训练、推理等环节进行了全面、专向优化升级,可以看一组官方的参数,你就可以估量此次更新的厚重。其一最高可提升模型训、推吞吐 30% 和 60%;其二,在资源利用方面,能够实现 98% 的超高集群有效训练时间占比,95% 的网络带宽有效利用率,充分释放集群有效算力,大幅降低客户的资源与时间成本;其三,提供了一套完备的体系,包含丰富的运维和可观测工具、自动化容错保障能力等。

在这里插入图片描述

我们可以清晰的发现,百舸 3.0 正是针对于当下 AI 的痛点问题,做出的有效应对,百舸 3.0 构建的体系真的很庞大健全,能满足工程的所需。遇到问题,分析问题,解决问题,我相信也是整个百度智能云发展的核心思路,致敬。

极致性价比的基础云服务

AI 应用不止需要模型、服务等软件层面的繁荣,更需要强大硬件的支撑。作为 AI 应用的硬件基础设施,我认为要具备以下几点:性能高、成本低、高可靠。

百度智能云在基础设施方面做了很多努力,致力于打造极致性价比的基础云服务,也就是百度太行系列。

太行这个名字我非常喜爱,太行山脉,就彷佛有一种厚重、扎实、可靠的感觉。没错,百度太行系列也是如此。

  • 百度太行 DPU(Data Processing Unit),打造了统一的高性能云原生基础设施架构,可以有效提高资源利用率,能够将 CPU、GPU 的算力资源应用满格 100%。
  • 百度太行·计算作为高性能、高弹性、高可靠的云服务算力底座,此次推出三款全新计算实例
    • 提供更高效的算力服务的通用计算型云服务器实例 G7,搭载英特尔最新的第五代至强可扩展处理器,综合性能较上一代产品提升 10%。
    • 大模型推理场景综合性能较业界主流加速卡可提升达 50% NKL5 实例,搭载了百度自研的昆仑芯 R300 加速处理器,加强了显存规格与 AI 加速处理器互联通信性能,在;
    • 综合性能较业界主流加速卡提升可达 40% ,使能大模型开发提速的弹性性能计算实例 NH6T,支持 3.2Tbps RDMA 高速互联带宽。
  • 百度太行计算新一代高性能网关平台,提高网络性能,支持百度网盘、百度地图等百度生图的内网便捷访问,降低数据泄露、时延抖动的危险,大幅度降低数据传输成本和数据处理效率。

分布式云基础设施

云边互联是前段时间我非常关注的话题,在边缘节点上实现智能化,能有效提高数据实时性,降低数据传递泄露的风险。特别是在一些 IOT 领域,云边互联能有效推动其发展,在这个 AIGC 迅速发展的时期,我有时就在想,如果 AIGC 碰撞 IOT,会出现那些让人眼前一亮的改变那?

此次百度智能云智算大会,我特别喜欢官方提出一个理念:让智算无处不在,智能无所不及(改成触手可及是否更大气一些)。这完美响应了我的智能理念,无所不在,触手可及。那么这就需要无数的端、边缘节点,共同搭建起繁荣的云边架构。

百度智能云对此也做出了诸多升级

  • 边缘计算节点(类似理解成端就行)覆盖范围扩大,智算能力升级,构建愈加完善的云边一体
  • ABC Stack 支持本地部署百度智能云千帆大模型平台,为企业构建专属大模型按下加速键
  • 本地计算机成 LCC 新能力发布

数据"智"理

这个词真的有点说到我的心坎上了,数据治理,但更要智理,这不仅是字面意思的改变,更是思维层面的跨越,智慧化可以漫步我们的日常,这是一个非常振奋的进步。

对于都模型和 AI 应用,数据的存储也是至关重要的,如何高效的存、高效的取是我们需要关注的关键之一。

百度智能云敏锐的捕捉到了这一点,在云存储、云数据库等基础领域进行了一系列重磅更新,还有我最害怕的一集。

  • 百度沧海·存储,又是一个很雅致的名字,海洋辽阔无疆,有容乃大,沧海是百度智能云的存储的同意技术底座,支持各类存储产品,存储高性能、低成本。
  • 云原生数据库 GaiaDB 4.0 版本性能大幅度提升,增强并行查询能力,突破单机计算瓶颈,实现跨机多核并行查询,在混合负载和实时分析业务场景中性能提升超过 10 倍。此外,通过共识协议优化、链路优化、自适应动态回放存储多版本等一些列数据流深度优化,大幅提升 GaiaDB 整体性能 60% 以上

还有最害怕的一集,百度智能云发布了一款数据库智能驾驶舱,通过引入大模型能力,能够实现对数据库进行自动的智能化的洞察、评估和优化。蛤?自动智能化洞察,我没听错吧。此款智能仓可以媲美专业的 DBA 水平,复杂问题回复的准确率超过 80%,我有点开始担心未来了,如果此类产品的价位比较适合,很可能可以替换部分基础的工作,再不卷,岗位都要被替代了。

模型即服务——千帆大模型平台

大模型将作为新的通用服务能力,我不由一惊,大模型都已经开始作为服务了吗,AI 距离我们真的是越来越近了。

百度智能云千帆大模型平台目前已经可以提供包括百度文心大模型在内的、国内最多的 54 个主流基础大模型和行业大模型,还为大模型的持续预训练、精调、评估、压缩和部署等环节提供最完善易用的工具链,据官方统计,相较于自建系统训练大模型,使用千帆平台训练的成本最高可以下降 90%。

千帆平台提供一个完整、庞大的模型工具链,初次听到这消息我有些吃惊,大会结束后,我连忙去官网体验了一番,没错,千帆提供了免费的体验,这点真的大大的好评。

在这里插入图片描述

如果日常中实践过 AI 应用,你会发现千帆把你想到的都想到了,没想到的也都实现了,它提供了一组标准化的流程,按照它的思路走,可以省无数的功夫,这都是血淋淋的经验,盲人摸象真的会晕,会乱。

下面是千帆平台的模型广场和体验中心。

在这里插入图片描述

上面看到 54 个模型只是个单调的数字,当我真正看到模型的列表时,才深深的感慨百度智能云的发展,54 个大模型啊,这得多久才能调试、测试出来,它蕴涵了百度人的辛勤劳动。

在这里插入图片描述

体验中心可以体验对话类(Gpt)和绘画类,绘画类挺让我惊喜的,虽然它只提供了 Stable diffusion XL 模型,也不支持一些微调模型,但是它给提供了 500 次免费在线的体验过程。我有好多小伙伴,都想体验 AI 绘画,但是迫于环境难搭,性能不足,只能望洋兴叹。千帆平台不只为企业提供了完备的功能,还为个人开发者提供了学习和尝试的平台,更多人参与 AI 不是梦想。此外,还提供了丰富的 prompt 模板,真是不能再赞了。

千帆 AppBuilder

按照以往以我对百度的了解,百度喜欢把产品由繁化简,提高使用者的开发效率,降低开发者的使用门槛,以此来推动行业的进步。

AI 应用开发目前来看门槛还是甚高,社会的舆论以及人们的错判都是阻挡当下 AI 发展的因素,AI 普适化还需要很长的路。百度智能云千帆 AppBuilder 就是一个很好的尝试,它迈出了关键的异步,该平台提供了一套基于 Web 的 AI 应用开发工具,将基于大模型开发 AI 原生应用的常见模式、工具、流程,沉淀成一个工作台,帮助开发者聚焦业务本身,而无需为开发过程牵扯多余精力,让开发者可以快速的进行 AI 应用的开发。

AppBuilder 由组件和框架构成,其中组件主要包含一些能力服务,例如文字识别、文生图、长文总结等;框架则是将组件按照应用所需串联起来,构建一个特定场景。目前 AppBuilder 官方提供了几个在线体验的应用,配置起来特别简单,我甚至都感觉我并不是在开发 AI 应用,只不过在做简单的网站,AppBuilder 用起来实现太简单轻便了,我不由得有点憧憬 AI 的未来。

在这里插入图片描述

最后附赠一句侯震宇老师的预测,2024 年将成为 AI 原生应用的元年,迎来AI原生应用的爆发式增长。我也隐隐的感觉到,AI距离我们越来越近了,那就让我们一起跟随着百度智能云的脚步,好风凭借力,送我上青云,一起见证AI的辉煌时代。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/241466.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Flink实时电商数仓(五)

FlinkSQL的join Regular join普通join,两条流的数据都时存放在内存的状态中,如果两条流数据都很大,对内存压力很大。Interval Join: 适合两条流到达时间有先后关系的;一条流的存活时间短,一条流的存活时间长。Lookup …

(一)深入理解Mysql底层数据结构和算法

什么是索引 索引是帮助MySQL高效获取数据的排好序的数据结构 数据结构有哪些 数据结构模拟网站:Data Structure Visualization 二叉树 不适合做自增ID的数据结构。如下示意图,假设采用二叉树作为表自增主键ID的数据存储结果如下:当查询i…

docker笔记1-安装与基础命令

docker的用途: 可以把应用程序代码及运行依赖环境打包成镜像,作为交付介质,在各种环境部署。可以将镜像(image)启动成容器(container),并提供多容器的生命周期进行管理(…

异常处理和单元测试python

一、实验题目 异常处理和单元测试 二、实验目的 了解异常的基本概念和常用异常类。掌握异常处理的格式、处理方法。掌握断言语句的作用和使用方法。了解单元测试的基本概念和作用。掌握在Python中使用测试模块进行单元测试的方法和步骤。 三、实验内容 编程实现如下功能&a…

HTTP小记1

目录 post不一定比get安全 HTTP与HTTPS区别 HTTP/1.1的优点 长连接的好处 HTTP/1.1性能 post不一定比get安全 post用bady传输数据,get用url传输数据,但这并不能说get就是比post安全的。 在浏览器地址栏可以看到使用get请求明文传输的数据&#xff…

C++11并发与多线程

C11并发与多线程 1. 线程是进程中的实际运作单位 并发:两个或者更多的任务(独立的活动)同时发生(进行):一个程序同时执行多个独立的任务 进程:一个可执行程序运行起来了,就叫创建了…

蓝桥杯2019年11月青少组Python程序设计省赛真题

1、试编写一个程序,输入一个整数,输出它的各个数位之和。 2、试编写一个程序,输入一个带有小数的数字,输出它的各个数位之和。 3、小兰要为1-2020住户制作门牌号,例如制作1107号门牌,需要制作2块1字符,一块0"字符一块7"字符,求制作1-2020需要多少块2. 4、编程画…

【量化金融】证券投资学

韭菜的自我修养 第一章: 基本框架和概念1.1 大盘底部形成的技术条件1.2 牛市与熊市1.3 交易系统1.3.1 树懒型交易系统1.3.2 止损止损的4个技术 第二章:证券家族4兄弟2.1 债券(1)债券,是伟大的创新(2&#x…

【零基础入门Python】Python参数

✍面向读者:所有人 ✍所属专栏:零基础入门Pythonhttps://blog.csdn.net/arthas777/category_12455877.html 目录 print()中的Python结束参数 print()中的Python|sep参数 Python的格式转换规则 使用格式…

【数据结构入门精讲 | 第十五篇】散列表知识点及考研408、企业面试练习(2)

在上一篇文章中我们学习了散列表的相关知识点及进行了选择题、编程题的练习,这篇文章中我们将进行编程题的练习,带领读者以练代学、更好地掌握知识点。 目录 R7-1 QQ帐户的申请与登陆R7-2 词频统计R7-3 新浪微博热门话题R7-4 航空公司VIP客户查询R7-1 字…

生成allure报告出现:ALLURE REPORT UNKNOWN

问题:点击浏览器查看时无法查看到报告 错误代码: if __name__ "__main__":pytest.main([./test_study/test_fixture.py])os.system("allure generate ./temps -o ./temps --clean") 结果导向: 解决:因为…

Hadoop入门学习笔记——四、MapReduce的框架配置和YARN的部署

视频课程地址:https://www.bilibili.com/video/BV1WY4y197g7 课程资料链接:https://pan.baidu.com/s/15KpnWeKpvExpKmOC8xjmtQ?pwd5ay8 Hadoop入门学习笔记(汇总) 目录 四、MapReduce的框架配置和YARN的部署4.1. 配置MapReduce…

缓存高可用:缓存如何保证高可用?

前面我们提到了缓存集群的负载均衡策略,保证缓存服务的高可用,集群策略是最常用的,本文我们以 Redis 为例,分析一下单点缓存如何扩展到集群,以及集群部署的几种常见模式。 Redis 的主从复制 集群实现依靠副本&#x…

爬虫字典生成工具,CeWL使用教程

爬虫字典生成工具,CeWL使用教程 1.工具概述2.参数解析3.使用实例1.工具概述 CeWL 是一个 ruby 应用程序,它将给定的 URL 爬到指定的深度,可以选择跟随外部链接,并返回一个单词列表,然后可用于密码破解者 Cewl 是黑客武器库中的强大工具,因为它允许创建有针对性的单词列…

使用 Spring Boot + MyBatis开发需要注意的事项以及开发模版

前言: 注意,本篇不适用于有相关开发经验的开发者,作为一个在职开发者,我经常在完成从0-1的模块,也就是从数据库表开始到创建实体类,以及dao层,Service层等业务需要添加相关注解,这样…

nn.LSTM个人记录

简介 nn.LSTM参数 torch.nn.lstm(input_size, "输入的嵌入向量维度,例如每个单词用50维向量表示,input_size就是50"hidden_size, "隐藏层节点数量,也是输出的嵌入向量维度"num_layers, "lstm 隐层的层数,默认…

计算机网络——网络层(四)

前言: 前面我们已经对物理层和数据链路层有了一个简单的认识与了解,现在我们需要对数据链路层再往上的一个层,网络层进行一个简单的学习与认识,网络层有着极其重要的作用,让我们对网络层进行一个简单的认识与学习吧 目…

Ubuntu:VS Code上C++的环境配置

使用 VSCode 开发 C/C 程序 , 涉及到 工作区的.vscode文件夹下的3个配置文件(均可以手动创建) : ① tasks.json : 编译器构建 配置文件 ; ② launch.json : 调试器设置 配置文件 ; ③ c_cpp_properties.json : 编译器路径和智能代码提示 配置文件 ; …

神经网络:机器学习基础

【一】什么是模型的偏差和方差? 误差(Error) 偏差(Bias) 方差(Variance) 噪声(Noise),一般地,我们把机器学习模型的预测输出与样本的真实label…

Python中json模块的使用与pyecharts绘图的基本介绍

文章目录 json模块json与Python数据的相互转化 pyecharts模块pyecharts基本操作基础折线图配置选项全局配置选项 json模块的数据处理折线图示例示例代码 json模块 json实际上是一种数据存储格式,是一种轻量级的数据交互格式,可以把他理解成一个特定格式…