2024年7月5日,ZStack Cloud正式发布最新版本——ZStack Cloud 5.1.8,涵盖一系列重要功能,以下为您进行详细介绍。
亮点速览
- GPU运维管理增强:新增GPU设备统一管理界面;支持GPU工作状态和实时负载监控报警
- 三层网络运维管理增强:支持修改三层网络DHCP服务配置,并设置保留网络段
- 支持物理机硬件健康状态监控:支持检测、展示物理机硬件健康状态,并针对异常状况发送报警
- 日志、审计优化:支持查看审计事件中英文名称;支持查看操作日志、审计日志真实客户端IP
版本总览
云主机
1.1云主机列表支持按IP地址排序
1.2云主机性能优化工具适配更多GuestOS
云网络
2.1三层网络运维管理增强
1)支持修改三层网络DHCP服务IP和启用状态
2)支持为三层网络设置保留网络段
3)支持云主机IP地址冲突检测
2.2克隆云主机支持指定IP地址、启停网卡和其他网络配置
平台运维
3.1GPU运维管理增强
1)新增“GPU设备”界面,统一管理物理GPU和vGPU设备
2)支持查看GPU厂商、型号等详情信息
3)支持监控GPU工作状态和实时负载,并针对异常状况发送报警
4)弹性裸金属详情页新增物理GPU设备信息
3.2支持物理机硬件健康状态监控
1)支持检测并展示物理机硬件设备状态
2)新增更多物理机硬件报警条目,硬件异常及时发送报警
3.3消息日志优化
1)操作日志、审计日志支持查看真实客户端IP
2)审计日志同时展示事件中英文名称
3)取消审计日志展示300条限制,UI可展示全部审计记录
4)日志服务器日志级别设置优化
3.4监控报警增强
1)新增亿美软通短信通知对象;原“HTTP应用”通知对象更名为“Webhook”
2)通知对象可用性检测增强
1.支持向邮箱、短信、Webhook通知对象发送测试消息
2.主列表支持展示通知对象与云平台连通状态
3.添加邮箱服务器时支持测试连接
3)支持通知对象更多配置项修改
租户管理
4.1统一认证SSO增强
1)“第三方认证”更名为“统一认证SSO”
2)支持为OIDC、OAuth2认证服务器指定Scope
3)支持对接正方、阿里IDaaS(私有化)、MaxKey认证服务
灾备管理
5.1灾备任务备份方式支持“仅全量备份”
密评合规
6.1支持中电信量子密码服务平台
6.2支持渔翁、三未信安、弗兰科签名验签服务器
许可授权
7.1 支持上传、管理模块许可证:容器服务-CPU、容器服务-vCPU,使用企业级容器服务功能
版本详情
云主机
1.1云主机列表支持按IP地址排序
ZStack Cloud 5.1.8开始,云主机列表支持选择按IPv4地址排序,帮助用户更高效、直观地查看云主机列表,优化大规模云主机管理体验。
- 支持顺序、倒序排序。
- 多网卡云主机以“默认网卡”为排序依据。
- IPv4地址为空的云主机在顺序排序时排在最后,在倒序排序时排在最前。
云主机按IP地址排序
1.2 云主机性能优化工具适配更多GuestOS
在之前版本中,ZStack Cloud已提供云主机性能优化工具,集成多个帮助云主机性能提升和功能扩展的工具/程序,如QGA、内部监控agent等。安装性能优化工具,可实现云主机内部监控、配置下发、配置读取等扩展功能。
ZStack Cloud 5.1.8中,性能优化工具适配更多云主机操作系统。截至目前,已适配的云主机操作系统包括:
云网络
2.1三层网络运维管理增强
1)支持修改三层网络DHCP服务IP和启用状态
ZStack Cloud 5.1.8开始,扁平网络和公有网络支持启用或停用DHCP服务,启停结果即时生效,用户可根据具体网络需求或维护计划动态调整DHCP服务状态。同时,扁平网络和公有网络支持修改DHCP服务IP,增强网络管理灵活性。
修改DHCP 服务
2)支持为三层网络设置保留网络段
ZStack Cloud 5.1.8开始,支持为三层网络添加保留网络段。添加后,此网络段中的IP地址将不再被平台自动分配给其他新建资源或服务,有助于实现更加精细的网络规划和IP资源管理。
保留IPv4网络段
3)支持云主机IP地址冲突检测
ZStack Cloud 5.1.8开始,支持在创建单台云主机指定IP时、克隆单台云主机指定IP时、以及修改DHCP服务IP时,检测指定的IP是否已被占用,以避免IP冲突对业务的影响。IP冲突检测仅限于IPv4类型地址。
IP地址冲突检测
2.2 克隆云主机支持指定IP地址、启停网卡和其他网络配置
ZStack Cloud 5.1.8开始,克隆云主机时新增支持网络配置。克隆时,默认继承源云主机网络及配置,用户可添加多个网络,或根据需求灵活调整网络配置。
- 支持启用或停用克隆云主机的网卡,用户可以根据部署要求灵活配置。
- 支持克隆单台云主机时指定IP地址,并自动检测IP冲突,提升用户在使用DHCP和静态IP环境下的操作效率。
克隆云主机配置网络
平台运维
3.1GPU运维管理增强
ZStack Cloud 5.1.8对GPU运维管理进行以下增强:
1)新增“GPU设备”界面,统一管理物理GPU和vGPU设备
ZStack Cloud 5.1.8开始,云平台“资源中心>硬件设施”菜单新增“GPU设备”界面。该界面集中展示当前区域内所有KVM集群/弹性裸金属集群下的物理GPU、vGPU设备。用户可展开页面左侧的资源目录树,按所属集群、物理机/弹性裸金属节点,或加载实例分组查看GPU信息,并在界面上方获取GPU整体工作状态和分布情况。
“GPU设备”界面提供物理GPU/vGPU统一运维入口,用户可在该界面便捷进行GPU编辑、启用/停用、设置共享模式、虚拟化切割/还原、列表项自定义、列表导出等操作,有效提高GPU运维效率。
GPU设备界面-集群/物理机/云主机目录树
GPU设备界面-弹性裸金属目录树
2)支持查看GPU厂商、型号等详情信息
“GPU设备”界面提供丰富、详细的GPU信息,包括GPU厂商、型号、类型、显存大小、所属物理机/弹性裸金属节点、加载实例等,帮助运维人员了解GPU设备基本情况并在故障发生时及时定位排查。
丰富、详细的GPU信息
3)支持监控GPU工作状态和实时负载,并针对异常状况发送报警
ZStack Cloud实时监测并展示GPU设备状态和负载情况,提供GPU温度、利用率、显存利用率、功耗、温度、风扇转速、PCIe RX吞吐量、PCIe TX吞吐量等监控数据,用户可在GPU主列表或详情页查看,了解GPU实时状况。
此外,针对多维度的GPU监控,ZStack Cloud提供对应报警条目,以便在异常场景下向用户发送报警通知,例如GPU设备故障、温度过高、负载过高等,帮助运维人员及时掌握、预防和修复GPU问题,避免造成业务影响。GPU温度/负载报警阈值可根据实际业务需求灵活设置。
GPU工作状态和负载监控
新增GPU资源报警
新增GPU事件报警
GPU报警消息推送
4)弹性裸金属详情页新增物理GPU设备信息
ZStack Cloud 5.1.8开始,弹性裸金属节点和弹性裸金属实例详情页配置信息新增物理GPU设备列表。与总GPU设备界面的集中管理不同,该入口用于单独管理某个弹性裸金属节点/实例上的GPU设备。在之前版本中,物理机详情页已支持了这项GPU单独管理功能。
3.2 支持物理机硬件健康状态监控
1)支持检测并展示物理机硬件设备状态
ZStack Cloud 5.1.8开始,云平台支持获取物理机硬件设备信息并监测硬件健康状态。用户进入物理机详情页即可查看硬件概览、硬件数量和硬件健康,包括CPU、内存、硬盘、RAID卡、电源槽位、风扇、温度传感器、物理GPU设备、vGPU设备。针对存在故障的硬件类目,可点击查看故障详情。
物理机硬件信息
物理机硬件健康状态
物理机硬件故障详情
2)新增更多物理机硬件报警条目,硬件异常及时发送报警
ZStack Cloud 5.1.8新增多项物理机硬件报警条目,包括:CPU状态异常、内存状态异常、内存ECC告警、磁盘状态异常、磁盘插入/拔出、RAID卡状态异常、GPU/vGPU故障、GPU拔出或失联、电源槽位状态异常、风扇状态异常等,全面覆盖各种物理机硬件异常场景。异常发生时,云平台将及时推送报警通知,帮助运维人员及时掌握、预防和修复硬件问题,避免造成业务影响。
物理机硬件事件报警
物理机硬件资源报警(以CPU温度为例)
3.3 消息日志优化
ZStack Cloud 5.1.8对消息日志进行以下优化:
1)操作日志、审计日志支持查看真实客户端IP
ZStack Cloud 5.1.8开始,操作日志、审计日志(登录操作)原“浏览器”字段修改为“客户端IP”,审计日志(资源操作)新增“客户端IP”字段。云平台可获取并展示发起操作请求的真实客户端IP地址(包括UI和API/CLI操作),并根据IP黑/白名单准确进行访问拦截/放行,进一步提升平台和资源安全性。
注意:如使用负载均衡转发请求到云平台,请在负载均衡设备上正确配置X-Forwarded-For字段,使云平台能获取真实客户端IP,如未正确配置,云平台会将负载均衡IP识别为客户端IP,影响日志信息展示和访问控制。
操作日志客户端IP
审计日志客户端IP
2)审计日志同时展示事件中英文名称
ZStack Cloud 5.1.8开始,中文环境下,审计日志可同时展示中英事件名称,帮助中文用户快速阅读、理解调用API和所对应的操作。
审计日志展示中英文事件名称
3)取消审计日志展示300条限制,UI可展示所有审计日志
在之前版本中,ZStack Cloud UI仅支持展示300条审计日志。ZStack Cloud 5.1.8开始,取消审计日志数量限制,用户可在UI查看平台所有审计日志,支持千万日志规模。用户可通过翻页、指定时间范围,或搜索事件名称、操作资源、操作员、客户端IP的方式快速定位需要查看的日志。
4)日志服务器日志级别设置优化
ZStack Cloud 5.1.8优化日志服务器日志级别设置。本版本起,添加日志服务器支持7种日志级别(由低到高):ALL、TRACE、DEBUG、INFO、WARN、ERROR、FATAL。日志级别根据内容严重程度划分,用户可选择仅接收某个级别及以上级别的日志。例如,选择WARN,表示接收WARN、ERROR和FATAL级别的日志;选择ALL,表示接收所有日志。
原”日志级别”参数更名为“日志设备”,可选项为LOCAL0~LOCAL7,用于匹配接收日志的设备,该选项需和日志服务rsyslog.conf 文件中设置的一致,以保证日志服务器正常接收来自云平台的日志消息。
日志服务器日志设备和日志级别
3.4 监控报警增强
1)新增亿美软通短信通知对象;原“HTTP应用”通知对象更名为“Webhook”
ZStack Cloud 5.1.8开始,支持使用亿美软通短信网关向移动终端推送短信类报警消息,用户可创建“通用短信”类消息模板,使亿美软通短信以统一格式发出。
此外,原“HTTP应用”通知对象和消息模板均更名为Webhook,继续支持以HTTP POST方式发送报警消息到自定义Webhook地址。
亿美软通短信通知对象
通用短信消息模板
Webhook通知对象
Webhook消息模板
2)通知对象可用性检测增强
ZStack Cloud 5.1.8对通知对象可用性进行以下检测增强:
- 支持向邮箱、短信、Webhook、SNMP Trap接收端通知对象发送测试消息
在之前版本中,已支持向钉钉、企业微信、飞书、Microsoft Teams等通知对象发送测试消息。ZStack Cloud 5.1.8开始,发送测试消息功能适配更多通知对象类型,包括:邮箱、短信、Webhook、SNMP Trap接收端。用户可在正式使用通知对象前,测试平台消息能否被正常发送和接收,避免投入使用后,因消息不通造成的报警通知遗漏。
发送测试消息
- 主列表支持展示通知对象与云平台连通状态
ZStack Cloud 5.1.8开始,通知对象主列表新增状态列,直观展示云平台是否与通知对象连通。UP表示通知对象与云平台已连通;DOWN表示通知对象与云平台管理节点IP、VIP,或UI服务端口未连通,无法正常通信,用户应及时调整通知对象网络配置。
通知对象连通状态
- 添加邮箱服务器时支持测试连接
ZStack Cloud 5.1.8开始,添加邮箱服务器时增加“测试连接”按钮,邮箱服务器必须通过连接测试才能被成功添加,进一步降低邮箱类通知对象无法正常接收报警消息的风险。
添加邮箱服务器支持测试连接
3)支持通知对象更多配置项修改
ZStack Cloud 5.1.8开始,用户可进入通知对象详情页修改多项配置,提高报警运维灵活性。支持修改的配置项包括:
- 钉钉:修改通知语言、提示群成员、地址、安全设置。
- 企业微信:修改通知语言、提示群成员、地址。
- 飞书:修改通知语言、提示群成员、地址、安全设置。
- Microsoft Teams:修改通知语言、地址。
- 邮箱:修改通知语言;增加/删除邮箱地址;更换邮箱服务器。
- Webhook:修改地址、用户名、密码。
- 阿里云短信:修改Accesskey;增加/删除手机号码。
- 亿美软通短信:修改AppId、SecretKey;增加/删除手机号码。
- SNMP Trap接收端:更换SNMP Trap接收端。
租户管理
4.1统一认证SSO增强
1)“第三方认证”更名为“统一认证SSO”
ZStack Cloud 5.1.8优化了租户管理和子账户管理相关术语,将第三方认证更名为统一认证SSO。
2)支持为OIDC、OAuth2认证服务器指定Scope
ZStack Cloud 5.1.8开始,添加OIDC或OAuth2类型统一认证服务器时,支持配置Scope参数,用于指定请求访问令牌或ID令牌时,获取的用户属性范围,如用户名(name)、电子邮件地址(email)等。指定Scope后,返回的令牌将包含对应属性。管理员可更容易地管理和控制不同用户的访问属性。
添加统一认证服务器指定Scope
3)支持对接正方、阿里IDaaS(私有化)、MaxKey认证服务
ZStack Cloud 5.1.8开始,添加OIDC和OAuth2类型统一认证服务器时,支持指定认证供应商,减少特定行业中的认证厂商适配成本。当前支持主流认证服务器场景:标准协议、正方单点登录SSO、阿里IDaaS(私有化)、MaxKey单点登录SSO。
添加统一认证服务器指定认证供应商
灾备管理
5.1灾备任务备份方式支持“仅全量备份”
ZStack Cloud 5.1.8开始,备份任务新增一种仅全量备份的备份方式,用户设置备份策略时,选择“全量备份策略”即可。该备份方式可满足特定用户在低频备份场景下,不希望备份链过长的需求。
灾备支持仅全量备份
密评合规
6.1支持中电信量子密码服务平台
ZStack Cloud 5.1.8开始,密评合规支持对接中电信量子密码服务平台,提供证书登录和数据保护服务。
支持中电信量子密码服务平台
6.2 支持渔翁、三未信安、弗兰科签名验签服务器
ZStack Cloud 5.1.8开始,密评合规支持对接渔翁、三未信安、弗兰科签名验签服务器,提供证书登录和数据保护服务。
支持渔翁、三未信安、弗兰科签名验签服务器
许可授权
7.1 支持上传、管理模块许可证:容器服务-CPU、容器服务-vCPU,使用企业级容器服务功能
ZStack Cloud 5.1.8开始,新增支持模块许可证:容器服务-CPU、容器服务-vCPU,用户可在许可证管理界面上传、管理这两种模块许可证,上传后,可使用多租户、多集群、资源配额、CI/CD、微服务治理等企业级容器服务功能。
新增模块许可证:容器服务-CPU、容器服务-vCPU