引领企业未来数字基础架构浪潮,中国铁塔探索超大规模分布式算力

分布式算力被中国信通院列入“2024政企数智化转型十大关键词”。中国信通院指出,随着新一代通信规模建设和边缘计算应用的持续部署,越来越多的应用运行和数据生产处理在边端侧开展,这对于传统算力基础设施的部署、调度提出了新要求,分布式算力通过不同范围部署不同规模算力,为政企数智化转型各场景随需获取算力提供新思路。

作为全球最大的通信基础设施服务商,成立十年的中国铁塔拥有210万站址资源、能源设施和近百万处机房,升级22万现有“通信塔”为“数字塔”……依托自有超大规模分布式算力资源,中国铁塔在2024年启动了分布式算力池建设,打造超大规模分布式资源池,该项目是国内通信行业首个集云计算、云原生、大数据、AI、边缘计算等多元算力于一体,覆盖范围最广、开放兼容性最好、一云多芯的自有资源分布式节点项目。

中国铁塔信息技术研究院院长叶臻强调,中国铁塔分布式资源池项目取得的成绩,说明整个行业都处于从集中大型云到边端小型云的发展过程中。当前,算力正从集中式向“云边端”分布式范式转变,根据中国铁塔、中国信息通信研究院等二十余家单位共同编写的《2024边缘算力蓝皮书》,边缘算力的多项技术目前还在处于研究阶段,仍需进一步展开技术研究和概念验证工作。

随着大型语言模型、工业大模型等智能化应用热度不断高涨,边缘算力作为产业智能化发展的数字化底座将迎来战略机遇期。而中国铁塔分布式资源池项目,实践了超大规模分布式节点建设,对推动边缘算力发展和技术落地,有着重大技术价值和产业意义。

发展数字经济,向边缘算力要业务创新力

2014年7月,中国铁塔成立,负责统筹建设通信铁塔设施,进一步提高基础设施共建共享水平。2019年,中国铁塔正式开启了“一体两翼”业务布局,即以面向通信行业的业务为“一体”,以依托独特资源优势面向社会的智联业务和能源业务为“两翼”。

十年来,中国铁塔不仅成为全球最大的通信基础设施服务商,也成为数字经济的创新领军者。在发展“两翼”业务过程中,中国铁塔推进“一塔多用”,将“通信塔”升级为“数字塔”,即在铁塔上挂载环境监测仪、气象监测仪、基站CDN、传感器等多种信息化设备,可以满足行业企业视觉感知、数据采集、图像分析、信息处理等数字化需求。

此外,中国铁塔还推进从“通信机房”变“数据机房”,布局边缘算力网络。中国铁塔拥有近100万分布式机房,具备完备的电力供应和维护体系,打造了一流的分布式算力网络,大力发展具有“分布式、低时延、低成本、小带宽、一定的算力储力”5个特点的边缘算力网络。

在数字塔和数据机房的边缘端与边缘算力配合下,中国铁塔建立了开放的算法仓,构建了中高点位场景国内领先的AI算法生态。通过铁塔算法仓平台+多种自研AI算法,就近为行业客户提供一站式人工智能服务,通过算法的快速部署、资源灵活调度、多种算法智能分析、告警实时推送等服务进行业务创新,例如船只识别、道路识别、机械施工、烟火侦测等。

目前,中国铁塔已经形成了“前端视频采集+边缘AI计算+云端AI计算”的“端边云”技术架构体系,自主研发了分布式视频监测平台、自主定制边缘网关、自研AI算法等,实现多个领域的技术创新。在“端边云”技术架构和遍布全国的边缘算力资源支持下,中国铁塔已经为40多个行业数字化转型赋智赋能。

启动分布式资源池建设,深入推进数字中国

随着“一体两翼”战略的深入实施,中国铁塔启动了分布式资源池建设项目,目标是将遍布数百万平方公里的海量数字基础设施组建成一张“数字天网”,通过新一代信息通信技术赋能千行百业实现数字化转型,服务“数字中国”战略蓝图实现。

叶臻院长介绍,中国铁塔的信息化和数字化建设十年历程经历了三个阶段的发展,伴随企业业务创新的推进,不断提升相关资源和能力建设。

2014年7月伴随中国铁塔的挂牌,中国铁塔也相应建立了初期的IT能力。2015年10月,中国铁塔承接了145万座铁塔,开始了数字化的第一个阶段建设。在第一阶段,公司明确了信息化系统一级平台、一点支撑全国的原则,这个阶段主要支撑“一体”业务,采用的IT资源主要以租用为主。

在第二阶段,内部“一体”业务的数字化能力建设基本完成,开始发展智联业务等对外服务的能力。在运维方面服务于第一阶段中的运维监控,在全国一级平台的调度能力、铁塔站址资源和全国八万多合作伙伴的支持下,让中国铁塔的运维能力更具优势。在业务方面,中国铁塔数字化能力由内向外发展,按照公司整体战略要求,变“通信塔”为“数字塔”。

第三阶段,中国铁塔提出“五型五化”的发展要求,即共享型、服务型、科技型、创新型、价值型以及专业化、集约化、精益化、高效化、数字化,其中数字化贯穿于其他“四化”的全过程,也对数字化能力提出了更高要求。例如,在网络安全上面,不仅仅是按照传统的网络架构建设,还要建设防攻击的安全能力和运维能力等高阶网安能力等。

此外,由于中国铁塔两百多万座铁塔分布在全国,从数据采集的压力来看,集中资源池的模式面临很大挑战。中国铁塔从2020年开始尝试利用分布在全国的自有小型机房,建设分布式节点,并且与浪潮云海合作,将云平台的分布建设、逻辑集中的管理模式,应用到实际数字化底座的建设中。

实际上,随着数字塔业务的发展,中国铁塔越来越面临业务创新的挑战。例如,中国铁塔每数据中心每日新增数据量数十TB,预计2025年每数据中心接入约二十万站,未来数据规模将达数十PB级别,且存在大量的视频、图像等非结构化数据。

此外,中国铁塔的设备数量极多,所有设施都需要接入平台中实现统一纳管。由于基础设施分布地域跨度极大,同时要求在算力下沉的同时,实现多数据中心的统一运维管理和“云边端”协同。

叶臻院长强调,中国铁塔启动自有资源分布式算力池建设主要基于三个方面的考虑。

第一是基于业务特点考虑,基础设施资源分散在全国各地,而且也面临地方数据数据不出省或不出地市的需求,因此既要解决客户需求又要实现统一管理。而分布式算力的业务逻辑和管理逻辑的相对分离,恰好满足这两个需求,可以将用户侧的管理结果留在省内,资源侧的管理则集中到总部,实现IT建设随业务发展而行。

第二,从经济性考虑。由于中国铁塔在各地的都是小型机房,大多数位于中国铁塔属地分公司购置的综合楼内,不需要专门征用大型土地以及增加管理难度。而将综合楼用于机房建设,也节约了成本,从经济性角度来看,加强了对自身资产的有效使用。

第三,从业务前瞻性考虑。在发展数字经济当中,中国铁塔依托丰富的分布式资源,可能成为数据采集方面最有优势的企业,将来在数据的采集、存储和通过边缘网络传送到其他数字资源进行处理时,分布式中间节点将对企业未来的发展带来很大便利。

中国铁塔分布式资源池建成后,将带来显著的经济和社会价值。中国铁塔基站分布在全国各地,对基站的数据源采集后可用于社会治理的方方面面,例如可以采集道路、农田等各行各业的数据,用于耕地保护、治安、森林防火、河流监控、大气污染防控、地震强度预警预报等,对数字经济的发展提供强有力支撑。目前铁塔的智联业务按行业开展,一旦实现数据共享,产生的经济和社会价值就可能翻倍。

战略再升级,分布式节点支撑边缘算力大发展

作为目前国内超大规模的分布式资源池,中国铁塔分布式资源池项目的建设难点在于地域跨度极大、设备数量极多、数据类型复杂,需要解决单数据中心跨类别多元异构资源统一管理、多数据中心高效调度运维以及可持续建设等严峻挑战。这一项目由浪潮云海负责实施,浪潮云海以可演进的私有云理念,打造面向未来的“云数智、云网安一体化”云底座,确保中国铁塔技术架构的升级迭代以及全国数据中心的持续建设。

中国铁塔分布式资源池项目在接入并纳管海量数字基础设施的同时,进一步融合人工智能、大数据、物联网等多样化的数字技术,实现从独立系统到融合系统的转变、从被动记录型系统到主动决策型系统的转变、从业务管控到场景赋能的转变,支撑企业全面的数字化、智能化转型。中国铁塔期望通过建设分布式资源池项目,发挥自有资源优势、自主掌控技术架构、调整算力资源费用组成、保证业务可控,持续打造具有中国铁塔特色的混合资源体系。

中国铁塔分布式算力池建设项目的目标为实现“全国一朵云、两级多中心”,在各省建立满足虚拟化、云原生、AI识别等场景智算中心,实现算力的就近调度、就近服务。

分布式算力池的建设,希望通过自建的方式降低资源成本的投入,将自有机房的能力共享出来,增加业务的灵活性和创新能力满足“一体两翼”对资源的快速、低成本、高可控需求。配合中国铁塔“十四五”规划,中国铁塔分布式算力池项目启动了首期山东、辽宁、湖南等6个省的骨干节点建设,后续将推进到更多省份。

浪潮云海基于中国铁塔的项目建设需求,明确了软硬解耦、存算分离、IaaS异构兼容、PaaS生态融合等建设原则。InCloud OS通过分层解耦、开放标准和一云多芯的创新架构设计,实现以云为核心的数字化基础设施的模块化、组件化封装,帮助客户构建持续演进的下一代私有云数据中心,为企业业务创新提供多元融合和高效便捷的私有云平台,云海OS的最新特色包括精细化基础设施管理、云原生PaaS、智算融合、一云多芯等。

浪潮云海方案为中国铁塔提供了四大方案价值:

第一,提升信息化服务水平、提升资源方法效率、实现数智化运维,通过分布式数据中心,信息化支撑响应效率由数天缩短至2小时,资源管理效率大幅提升,采用“末端视频采集+云端AI计算+边缘AI计算”等手段,基本实现了自动巡检、自主派单、智能资管等功能,做到了远程管理、不上站管理,支撑了遍布全国的铁塔站址的智能化、数字化运维。

第二,降本增效、经济效益增加,自有资源分布式节点数据中心的持续建设助力节约信息化投入。

第三,多元融合、推动数据中心持续演进、支撑铁塔未来战略,浪潮云海云平台的可演进理念,未来将伴随中国铁塔围绕新基建、空间数智化治理、人工智能、边缘算力网络、低空经济等多个方面,加速推进战略性新兴产业和未来产业发展,加快形成新质生产力。

第四,助力数字中国建设、提升社会安全性,建设云网融合、智能敏捷、绿色低碳、安全可靠的智能化综合性数字信息基础设施,有力支撑网络强国。

针对首批建成的6个省级分布式算力节点,中国铁塔信息技术研究院副院长王江峰介绍:中国铁塔在分布式算力资源池建立以后具备统一云管平台,通过统一的云管平台实现了对已建成的六个节点的统一管理、统一监控、统一调度和统一运营,资源在哪里、有多少、谁在用,都一览无余、掌控自如,实现了资源高效和精准利用;从安全层面看,平台采用了分布式架构,避免了硬件故障带来的数据损失;同时,以容灾备份机制实现容灾数据的安全性、完整性;此外,中国铁塔还结合国内顶尖的安全厂商技术构建了网络安全机制,实现网络平台数据的完全可用。

超大规模分布式云,打造边缘算力新样板

中国铁塔信息技术研究院逐年滚动规划,特别是在“十四五”伊始正式发布数字化建设规划和IT能力建设规划,以匹配公司1+N的规划目标。“十四五”即将收官,中国铁塔整体数字化能力、数字化底座、安全保障和满足业务发展能力,达到了新阶段。中国铁塔自有资源分布式算力池,基于超大规模分布式云,为数字经济打造了边缘算力新样板,将承接“十四五”、开启“十五五”。

浪潮云海首席科学家张东介绍,从分布式算力的角度来看,中国铁塔分布式算力资源在中国甚至在全球都算超大规模,这为实践超大规模分布式节点、发展边缘算力和边缘计算技术,提供了难得的机会。

中国铁塔分布式算力池浪潮云海方案的整体技术特色包括:以IaaS、PaaS分层解耦的原则建设云平台,融合云上安全生态,面向未来构建云数智、云网安一体化的数字化底座;边缘计算能力增强,进一步完善多协议端设备的生命周期管理功能,增强异构边缘资源的统一管理及多地域边缘应用按需编排能力;构建面向分布式、大规模场景的智能化运维能力,实现巡检工具化、管理自动化、运维智能化,提升数据中心自治能力;在存储先进性方面,按照中国铁塔业务需求实现块存储、文件存储、对象存储分级建设,面向高速IO场景构建全闪资源池,满足及时响应需求,面向海量存储场景构建混闪资源池,采用领先的RDMA技术提升分布式存储性能,实现NVMe-OF、ISCSI、FC等多协议类型全兼容。

由于中国铁塔算力资源的超大规模特性,浪潮云海在提供方案时,双方也进行了联合技术攻关。浪潮云海云计算方案总监刘健介绍,中国铁塔自有分布式资源具有环境复杂、跨度大、规模大等特点,对于解决方案提出了特殊的挑战。双方在项目推进过程中组成了联合项目组,共同解决技术挑战、落实技术方案。

中国铁塔信息技术研究院维护室经理王焱介绍,中国铁塔分布式算力资源池首期项目推进过程遇到了很多挑战:首先是异构,不同节点具有不同厂商、不同类型的设备,需要考虑异构设备的兼容性;其次是可靠性问题,特别是系统连续性的要求,对自建分布式资源平台提出了较大挑战,最终双方合作解决了挑战,包括在架构设计初期对容错方面进行了较大的投入;第三是网络可靠性,因为分布式算力节点分布在不同的地理位置上,网络比较复杂,还有I/O性能的挑战,浪潮云海通过专题优化,结合硬件的I/O能力和网络SDN的能力,最终解决了大规模并发场景的问题;最后是网络安全,因为云平台上承载的是企业敏感数据,如何保证不被未授权的人访问、抵御外部攻击和内部泄露,中国铁塔与包括浪潮云海在内的业界网络安全企业合作。

叶臻院长介绍,与浪潮云海双方合作的分布式资源池建设项目,既提高了工作效率,也加强了资源管理能力。同时,浪潮云海在网络安全支撑方面也给予了全面支持。

【展望未来】中国铁塔分布式资源池将成为中国乃至全球超大规模分布式节点和边缘算力的样板工程,为探索和发展分布式云、边缘算力与边缘计算和分布式AI等提供了广阔的空间和机会。中国铁塔分布式资源池在推动通信业数字化转型的同时,也将为深入推进数实融合、发展数字经济、提速数字中国,提供源源不断的动力和动能。正如叶臻院长强调,中国铁塔和浪潮云海双方强强联合,不仅有过去的成果,还有更加辉煌的未来!(文/宁川)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/59362.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【数据结构】快排之三路划分

目录 一、前言 二、 快排性能的关键点分析 三、 三路划分基本思想 四、 思路分析 五、提醒 六、代码实现 一、前言 继续对快速排序的深入优化进行探讨 二、 快排性能的关键点分析 决定快排性能的关键点是每次单趟排序后,key对数组的分割。 如果每次选key都能…

Kafka面试题解答(一)

1.kafka消息发送的流程? 生产者:在消息发送的过程中涉及到了两个线程:main线程和sender线程。在main线程中创建了一个双端队列RecordAccumulator(默认32m)。main线程将消息发送RecordAccumulator,sender线程不断地从R…

基于yolov8、yolov5的番茄成熟度检测识别系统(含UI界面、训练好的模型、Python代码、数据集)

摘要:番茄成熟度检测在农业生产及质量控制中起着至关重要的作用,不仅能帮助农民及时采摘成熟的番茄,还为自动化农业监测提供了可靠的数据支撑。本文介绍了一款基于YOLOv8、YOLOv5等深度学习框架的番茄成熟度检测模型,该模型使用了…

Oracle 数据库创建导入

注意:本教程中的有些命令您可能并不熟悉,但没关系,只需按照说明一步一步创建示例数据库即可。在之后的教程中,会详细介绍每个命令。 1.创建新用户并授予权限 1.1.打开 首先,启动 SQL plus 程序的命令行:…

为centos7分配ip

前提: 安装好centos7 编辑文件 进入编辑模式[dmdbalocalhost ~]$ vim /etc/sysconfig/network-scripts/ifcfg-ens33 修改 BOOTPROTOstatic DNBOOTyes IPADDR192.168.152.11 NETMASK255.255.255.0 GATEWAY192.168.152.2 DNS18.8.8.8 点击esc .输入“:wq” 保存退…

内网安全-代理技术-socket协议

小迪安全网络架构图: 背景:当前获取window7 出网主机的shell。 1.使用msf上线,查看路由 run autoroute -p 添加路由: run post/multi/manage/autoroute 使用socks模块开启节点,作为流量跳板 msf6 exploit(multi/ha…

如何使用.bat实现电脑自动重启?

1、在电脑桌面新建一个记事本文档,将如下内容写进去: echo off shutdown /r /t 02、然后,保存一下,再把桌面此文件重命名为电脑重启.bat 3、双击此程序,可以立刻重启电脑。 PS:① 此程序会不保存任何当前…

YOLOv11融合CVPR[2024]自适应扩张卷积FADC模块及相关改进思路|YOLO改进最简教程

YOLOv11v10v8使用教程: YOLOv11入门到入土使用教程 YOLOv11改进汇总贴:YOLOv11及自研模型更新汇总 《Frequency-Adaptive Dilated Convolution for Semantic Segmentation》 一、 模块介绍 论文链接:https://arxiv.org/abs/2403.05369 代码…

Python 数据文件读写教程

Python 数据文件读写教程 在数据科学和软件开发中,文件的读写操作是至关重要的。Python 作为一门功能强大的编程语言,提供了多种方式来处理文件,包括文本文件、CSV 文件、JSON 文件等。在本教程中,我们将深入探讨 Python 中的数据…

模拟实现优先级队列

目录 定义 特点 构造函数 常用方法 关于扩容的问题 关于建堆的问题 向上调整和向下调整的比较 (向上调整)代码 (向下调整)代码 关于入队列和出队列问题 模拟实现优先级队列代码 关于堆排序的问题 堆排序代码 关于对…

Autosar CP DDS规范导读

Autosar CP DDS 主要用途 数据通信 中间件协议:作为一种中间件协议,DDS实现了应用程序之间的高效数据通信,能够在不同的软件组件和ECU之间传输数据,确保数据的实时性和可靠性。跨平台通信:支持在AUTOSAR CP平台上的不同…

数字IC实践项目(10)—基于System Verilog的DDR4 Model/Tb 及基础Verification IP的设计与验证(付费项目)

数字IC实践项目(10)—基于System Verilog的DDR4 Model/Tb 及基础Verification IP的设计与验证(付费项目) 前言项目框图1)DDR4 Verification IP2)DDR4 JEDEC Model & Tb 项目文件1)DDR4 Veri…

Jmeter中的监听器(三)

9--断言结果 功能特点 显示断言结果:列出所有断言的结果,包括通过和失败的断言。详细信息:显示每个断言的详细信息,如断言类型、实际结果和期望结果。错误信息:显示断言失败时的错误信息,帮助调试。颜色编…

人工智能大比拼(3)

已知x-,y-6,且下述表达式的值与x的取值无关,求y -10x2y7xy 上述这个很简单的数学题,可是在各家AI之间出现了争议,本期我使用了四个AI:kimi,商量,文心一言,chatyy 先来看一下kimi的表…

Xilinx Aurora 8B/10B IP介绍以及下板验证

文章目录 一、什么是Aurora协议?二、Aurora 8B/10B IP核的结构原理三、Aurora 8B/10B IP核 延迟开销四、用户数据接口格式4.1 AXI4-Stream 位排序4.2 帧传输用户端口说明4.3 帧传输数据流程4.4 Aurora 8B/10B 帧格式4.5 帧格式数据传输时序4.5.1 简单数据传输4.5.2 …

Redis8:商户查询缓存2

欢迎来到“雪碧聊技术”CSDN博客! 在这里,您将踏入一个专注于Java开发技术的知识殿堂。无论您是Java编程的初学者,还是具有一定经验的开发者,相信我的博客都能为您提供宝贵的学习资源和实用技巧。作为您的技术向导,我将…

Camera Tuning中AE/AWB/AF基础知识介绍

3A定义 3A是Camera ISP控制算法的一个重要组成部分,通常分为自动曝光(AE)、自动聚焦(AF)、自动白平衡(AWB)三个组件。 自动曝光(Auto Exposure) AE基本概念 曝光概念…

数据库中的用户管理和权限管理

​ 我们进行数据库操作的地方其实是数据库的客户端,是我们在客户端将操作发送给数据库的服务器(MySQL的服务器是mysqld),由数据库处理之后发送回来处理结果(其实就是一种网络服务)。所以可以存在多个客户端…

ubuntu24.04安装matlab失败

又是摸鱼摆烂的一天,好难过~ 官方教程:https://ww2.mathworks.cn/help/install/ug/install-products-with-internet-connection.html 问题描述:https://ww2.mathworks.cn/matlabcentral/answers/2158925-cannot-install-matlab-r2…

Hive1.2.1与Hbase1.4.13集成---版本不兼容问题

hive与hbase集成失败,汗流夹背了吧老弟......哈哈哈哈,刷到这篇文章,那你可真是太幸运啦~ 常见错误一: FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. org.apache.hadoop.hbase.HTableDescriptor.addFamily(Lorg/apache/hadoop/h…