作者:刘佳旭 谢乘胜 贤维
引言
2023 年,第 19 届杭州亚运会在杭州成功举办。在亚运之光和科技之光的交相辉映下,这届亚运会成为亚运史上首届“云上亚运”,用云计算创造了历史,赛事核心系统和转播全面上云,为大型赛事的数字化普及奠定了坚实基础,杭州亚运会乘着科技的翅膀取得圆满成功。在这次赛事的多个核心项目中,阿里云原生技术发挥了重要的支撑作用,如容器服务 Kubernetes 版 ACK、容器镜像服务 ACR 等通过高效稳定、极致弹性、安全智能等能力的输出 ,再次推动国际体育赛事以云原生的方式加速向数字化演进发展。
容器服务 Kubernetes 版 ACK 整合了阿里云的虚拟化、存储、网络和安全能力,提供高性能且可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理,助力企业高效运行云端 Kubernetes 容器化应用。阿里云容器服务 ACK 在 2023 年成为 Gartner 容器管理魔力象限报告中亚洲唯一的全球领导者,2022 年成为国内唯一进入 Forrester 领导者象限的产品。容器镜像服务 ACR 作为云原生领域重要的制品资产管理平台,为企业提供云原生制品安全托管与高效分发能力,加速企业的云原生化迭代创新。
正如体育精神体现出的进步与超越一样,阿里云容器服务也在不断向极致的能力发起挑战。在这次亚洲瞩目的体育盛会服务保障中,容器服务专业版 ACK Pro,容器镜像服务企业版 ACR EE,都凭借出色的发挥,为更多上层的项目应用构建和运行提供强大的能力基座,更向世界证明了来自中国的云原生基石能力。
下面让我们一起回顾阿里云云原生容器服务 ACK 和 ACR 是如何助力精彩亚运的。
稳如磐石,为赛事核心系统保驾护航
赛会期间,杭州亚运会赛事信息系统 AGIS 扮演了非常核心的作用,具体包括赛事管理系统(GMS)、成绩发布系统(RDS)和赛事支持系统(GSS),支撑 56 个竞赛场馆及信息技术指挥中心、主媒体中心及亚运村等重要设施的全天候运营,服务超过 10 万名注册用户,包括来自全球 45 个国家和地区的运动员、转播商、记者、工作人员及志愿者。以赛事成绩发布系统为例,它是亚运会赛事期间最重要的信息系统群之一。每一场赛事结束,在赛事成绩发布类系统群的调度下,比赛成绩从场馆的计时记分设备导入场馆成绩系统、向中央成绩系统汇集,以打印分发、信息发布、数据接口等不同模式向外界呈现。
如此核心的系统需要系统具有极高的稳定性和高可用性,不容任何差错。凭借 ACK 稳如磐石的稳定性,赛事管理系统和成绩发布系统,均以 ACK 为云原生底座,构建了跨 AZ 高可用的多个 ACK 集群,构建了 DMZ/Trusted 隔离的架构(DMZ/Trusted 架构是一种网络安全架构设计,用于保护企业内部网络与外部网络之间的通信)。ACR 稳定支持赛事信息系统、浙江政务云云平台在亚运期间提供应用部署丝滑体验。赛事期间在云原生领域报障数为 0。
2023 年 7 月,ACK 成为首批通过中国信通院“云服务稳定运行能力-容器集群稳定性”评估的产品,并荣获“先进级”认证。这是对 ACK 稳定性的高度认可。
ACK 稳定性源于大规模实践经验沉淀:
-
ACK 全网管理了数万个 K8s 集群,对线上丰富的客户和业务场景提供全面的支持。
-
ACK 与 ACR 作为底座承载了历届阿里双十一、618 等超大规模的电商业务,具有丰富的阿里电商场景的极限压力锤炼经验。
-
对社区原生 K8s 做参数、性能、架构等优化,并形成产品能力和稳定性功能。
-
ACR EE 产品集成全链路高可用、DevSecOps 安全交付链能力,稳定支撑月均镜像拉取数十亿次,服务数千家企业级客户在生产环境深度使用。
极致弹性、极致高可用,保障亚运一站通
杭州第 19 届亚运会组委会推出的国际大型综合性运动会史上首个一站式数字观赛服务平台,通过运用区块链、大数据、人工智能等高新技术,对接数字城市各类资源,整合亚运城市各类场景应用,杭州亚组委围绕“食、住、行、游、购、娱”六个方面需求,结合票务功能,为观众提供从购票、出行、观赛到住宿、用餐和旅游等一站式服务。亚运一站通累计用户 1.19 亿,日均访问人次超过 1 亿,累计访问人次超过 60 亿。部分关键应用包括:
亚运 PASS
“亚运 PASS”整合景区入园、文博场馆预约、公共交通出行等各类应用场景,为游客提供“一码通行”的便捷服务。
赛事查询
赛事查询整合赛事日程、竞赛项目、亚运场馆等信息,为用户提供比赛成绩展示、亚运奖牌榜、亚运场馆查询等赛事一体化服务。
线上火炬传递
在杭州亚运会倒计时 100 天之际,智能亚运一站通全新升级,开展“线上火炬传递”,全球网民身着亚运数字火炬手服装,手持亚运会数字火炬,聚力亚运取火,将亚运之火传遍亚洲 45 个国家与地区,深化亚洲多元文明交流互鉴。
亚运一站通的后台服务正是基于 ACK 集群构建, 在赛会全程安全、稳定、可靠,顺利完成保障亚运服务精彩、高效运行的任务。
在高可用方面,亚运一站通依托于 ACK 云原生底座和高可用产品功能,实现了同城高可用、异地灾备、数据同步的高可用架构,真正实现两地多中心金融级容灾架构。 亚运一站通基于 ACR EE 提供的异地容灾最佳实践,实现业务镜像跨地域高可用,进一步提升容器镜像抵抗未知潜在风险的容灾能力。
在快速弹性方面,亚运一站通是面向 C 端的应用,在开幕式/闭幕式/薪火相传/售票等场景,需要有高效稳定的快速弹性能力保障。亚运一站通采取集群内弹性和集群外弹性相结合的弹性策略:
集群内弹性: 弹性技术手段依赖 HPA 方案,快速自适应扩容缩容 Pod。
集群外弹性: 集群内部资源弹性耗尽之后,将开始外部弹性,方案包括弹节点和弹 ECI 容器。利用阿里云资源快速弹性 ECI Pod,可实现分钟级创建万量级 Pod 的能力。通过配置 ECI Pod 拉取 ACR 镜像缓存,实现 ECI Pod 秒级启动。集群通过安装 ACR EE 按需加载、P2P 分发套件,解决集群大规模应用部署时出现的流量洪峰问题,享受极致的弹性体验。
亚运一站通作为国际大型综合性运动会史上首个一站式数字观赛服务平台,为今后的赛事举办树立了标杆作用,ACK 与 ACR 有幸参加遇到这一历史活动中,并充分证明了高可用、弹性等灵活、丰富的产品能力。
Serverless,让“一部手机掌上办赛”成为现实
智能化底座支撑了亚运会的多种智能化服务,其中,“亚运钉”是杭州亚组委和钉钉联合打造的全球首个大型体育赛事一体化智能办赛平台,为十万赛事工作人员提供服务。
亚运钉接入了行政审批、气象服务、会议服务、医疗服务等各业务领域的 293 个应用,并接入阿里云上的多种亚运核心系统应用,包括竞赛视频系统、IT事件跟踪与管理系统、志愿者管理系统等等;工作人员和志愿者近 10 万人使用,每日消息量超过 25 万条,每日视频会议数超过 5000 次。
亚运期间,近十万工作人员通过亚运钉实现了在线扁平化沟通协同。此外,亚运钉还能支持汉英日泰等 13 种语言的实时翻译,方便不同国家工作人员的相互交流。
作为统一的业务协同平台,亚运钉接入了行政审批、气象服务、会议服务、医疗服务等各业务领域的 293 个应用,并接入阿里云上的多种亚运核心系统应用,包括竞赛视频系统、IT 事件跟踪与管理系统、志愿者管理系统等等。同时,亚运钉采用宜搭低代码开发新应用,高效便捷地满足亚运在筹办和运行阶段所出现的新业务流程。
不仅如此,亚运钉还解决了亚运会的知识资产沉淀问题,为解决赛事文件收集、厘清繁多的数字资产、实现数字资产沉淀提供支持,既能保障赛事的顺利举办,也能为后续举办亚运、奥运等大型体育赛事提供经验参考。
如此丰富的功能,均依托于 ACK Serverless 形态部署。 对 Serverless Container 的支持是 K8s 演进的重要方向,基于弹性容器实例 ECI 的 ACK Serverless 在客户场景中得到了广泛的应用,如在微博热搜、钉钉会议等大家熟悉的在线应用中发挥极致弹性伸缩能力,更在助力越来越多 AI 和大数据客户降本增效。在亚运钉系统应用发布方面,ACR EE 全球同步能力助力亚运钉高质量、高效率地交付业务应用,实现全链路云原生应用发布。通过将 ACR EE 全球同步能力与亚运钉自建 CI/CD 工具深度结合,亚运钉平台实现了本地一次构建,全球多个地域应用镜像自动分发,进而打通全球各业务地域发布系统的发版流程,极大地提升了亚运钉系统应用交付速率。
展望
在本次杭州亚运前,阿里云容器服务产品家族已积累了丰富的大型体育赛事应用场景和案例沉淀,例如在 2020 年东京夏季奥运会、2022 年北京冬季奥运会等均为核心系统的云原生底座。
本次亚运会中,阿里云 ACK 和 ACR 再次深度参与到赛事项目和活动中,稳如磐石地承担了亚运信息系统 AGIS、亚运一站通、亚运钉等核心项目,为体育赛会带来了业界领先的云原生技术、产品和服务,与阿里云各个产品线通力协作顺利完成了亚运会的支持和保障工作。
未来,阿里云 ACK 和 ACR 也会在即将举办的巴黎奥运会中提供服务保障,我们将持续构建安全、稳定、性能、成本持续优化的云原生技术能力和稳如磐石的服务品质,促进阿里云的科技之光与五环之光交相辉映,帮助全球更多行业、企业加化数字化转型进程。