在当前云计算和微服务架构日益普及的背景下,企业和开发者对云资源的依赖日益加深。Elastic Compute Service(ECS)作为提供计算能力的核心服务,承担着众多的业务。随着微服务架构的广泛应用,任务的部署和执行变得更为灵活和动态,资源的动态伸缩成为常态,能够根据业务需求实时调整,提升资源利用效率和应用的可用性。
在这种动态变化的环境中,如何有效地监控和预测 ECS 主机的性能变化,以及如何在保证服务质量的前提下智能地进行资源调度和优化,例如判断一个微服务容器(POD)是否可以迁移到一个指定的 ECS 机器上,以及迁移后对该机器性能指标的影响,都成为了保障服务稳定性、提升运营效率和降低成本的关键任务。
然而,由于微服务的动态伸缩性和不同类型任务对资源的不同需求,使得 ECS 主机的性能指标(例如 CPU 使用率、内存占用等)展现出高度的波动性。加之云计算环境本身的动态性和计算任务负载的不确定性,使得对 ECS 机器性能的准确预测变得更加挑战。
鉴于此,“基于任务序列对主机观测指标进行生成”的赛题应运而生。本次比赛旨在如何通过分析 ECS 性能数据和任务信息,综合利用深度学习、序列分析等先进技术,生成特定机器的性能指标。 参赛者的解决方案将为云资源管理和优化决策提供重要参考,助力云计算资源的高效稳定运行和智能化调度。
选手将面对的主要挑战包括但不限于:
- 高频率数据处理:处理和分析秒粒度的高维度观测数据序列。
- 时间序列预测:在时间序列数据上训练模型,预测未来的监控指标变化。
- 深入理解机器观测数据:秒级别的机器核心组件的性能数据。
- 多模态模型设计:根据任务序列生成对应的时间序列。
赛题描述及流程
在云计算领域,对 ECS(Elastic Compute Service)主机进行性能监控和资源配置优化是确保服务稳定性和提升资源利用效率的关键。本次挑战赛旨在借助大规模 ECS 主机的实时监控指标数据及任务事件序列数据,探索和研发先进的预测模型。
参赛选手需构建机器学习模型,基于给定的 ECS 监控指标历史数据和任务事件数据进行建模,并能在一定时间段内指定任务序列数据,对该段时间内的 ECS 机器所有监控指标数据进行生成预测。(赛题数据说明请点击阅读原文查看。)
比赛分为初赛和决赛,初赛采用 AB 榜,AB 榜期间均可报名参赛。在比赛 A 榜期间启用 A 数据集评测;B 榜期间采用 B 数据集进行评测,最后排名以 B 榜为准。
- 初赛 A 榜提交时间:6 月 12 日 11:00 至 7 月 16 日 12:00。
- 初赛 B 榜提交时间:7 月 17 日 10:00 至 8 月 22 日 18:00。
- 代码审核:B 榜成绩 TOP 6 团队请于 8 月 24 日 18:00 前提交代码审核,8 月 28 日 18:00 产生最后排行,通过代码审核的排名前 6 名的参赛队伍将受邀进行决赛答辩。
进入决赛后,总决赛的评分标准为:初赛成绩(50%) + 代码(25%)+ 答辩(25%),最终奖项如下:
- 冠军:1 支队伍/赛道,每支队伍奖金叁万,颁发获奖证书。
- 亚军:1 支队伍/赛道,每支队伍奖金贰万,颁发获奖证书。
- 季军:1 支队伍/赛道,每支队伍奖金壹万,颁发获奖证书。
- 优胜奖:3 支队伍/赛道,每支队伍奖金伍仟元,颁发获奖证书。
- 参与奖:初赛 B 榜最终排名每赛道入围 TOP100 所在队伍的选手将获得大赛限量版纪念 T 恤一件。
🔔 注: 在 2024 天池云原生编程挑战赛的三个赛道中,同一选手只能获得一个参赛奖(奖金奖项)。如超出一个奖项,则由选手及团队自行协商选择其一获奖,其余赛道该选手所在团队名次作废,获奖资格顺延。
点击此处,报名参加本赛道。