在当前的数据中心运维实践中,运维人员在部署服务器时常被“飞机起飞”般的开机噪音所困扰。服务器刚刚接通电源,其内部元件尚处于预热待命状态,而风扇却已全速运转,这不仅加剧了噪音污染,还拖慢了启动速度,有时开机甚至需要数分钟之久,严重制约了运维效率。
浪潮信息敏锐洞察这一实践难题,并凭借其在技术创新领域的深厚积累为数据中心运维带来了有效解决方案。通过BMC Linux/RTOS异构双系统并行管理技术,浪潮信息首创「开机3秒智能控温技术」,能够在服务器上电后,BMC的Linux系统启动之前,3秒内即时接管风扇转速调控策略,通过实时感知环境温度,实现对温度与散热的动态把控,噪音比优化前最大下降30.4%,提升数据中心运维体验,开机功耗相比传统风扇转速拉满策略也可降低一半以上。同时,通过BMC RTOS系统与Linux系统的同时启动,及BIOS系统优化,可实现上电即开机,开机时间缩短一半以上,减少时间敏感型业务部署上线时间,有效降低因为运维重启服务器对于业务的不良影响。
浪潮信息首创服务器开机3秒智能控温技术
服务器启动时间过长且风扇噪音过高的症结在于,服务器传统控温策略中为了尽可能满足散热安全性要求,上电之后会以覆盖最大配置的方式来进行风扇速度调节,而此时BMC Linux系统尚未启动,热量传感器数据无法采集,导致风扇满载状态会持续较长时间,带来能耗、噪音的攀升和稳定性的降低。而且为了避免开机过程中散热风险一般会设置等待BMC Linux 系统启动完成后再启动 POST 过程,导致服务器从 AC 上电到进入 OS 的时间被拉长。
除了启动过程中服务器风扇满转,噪音过高,在BMC的Linux故障情况下,由于没有合理机制能够保证风扇的可靠接管,也会造成风扇满转噪音瞬间达到峰值,服务器始终在功耗峰值运行,运维环境恶劣,不仅不符合节能降碳趋势,还会影响系统稳定性和风扇寿命。
为了化解服务器启动等过程中的风扇控制难题,浪潮信息首创开机3秒智能控温技术。该技术通过解决BMC异构双系统核间通信的难题,实现BMC内部RTOS 3秒智能控温技术和Linux管理技术的双系统并行,有效利用RTOS实时操作系统采集传感器数据,实现毫秒级的信号采集控制,确保风扇控制的高效、精准,同时也优化了服务器开机管理流程。
创新一:创新RTOS系统 精准控制风扇转速
浪潮信息充分利用BMC芯片算力资源,创新性开发RTOS实时操作系统,通过PECI总线对环境温度以及部分核心部件温度进行采集,开机即可实现毫秒级的信号采集控制,随后通过闭环反馈实现对温度与散热的动态把控,从而精确掌控散热资源,以满足散热需求的最小化资源,降低无效功耗。
在通过RTOS系统实时获取传感器温度数据的基础上,浪潮信息独家提出BMC Linux/RTOS异构双系统并行技术,成功攻克多核多系统之间数据交换难题,构建了开机期间,全新的风扇控制策略:
− BMC Linux系统启动前,RTOS进行系统温度收集及控制;
− 在BMC Linux系统启动阶段,由Linux收集传感器温度信息,之后通过共享内存传递给RTOS,由RTOS进行风扇调控
− 当BMC Linux系统完全启动后,由Linux系统收集传感器温度并亲自实现温度调控。同时在BMC Linux系统故障或重启时RTOS能迅速接管散热系统并精确控制风扇转速。
创新二:阶梯性散热策略 散热需求实时动态响应
开机过程中,一般服务器内部各部件会相继启动,带来的散热需求应该是阶梯式增长的。但此时BMC Linux系统尚未启动,无法控制风扇转速,为保障服务器高可用性,风扇只能按照极端环境下的极限负载高转速运行,造成能耗、噪音的提升和稳定性的降低。
浪潮信息基于深耕多年的服务器行业经验,结合电子设备在上电后热量逐渐累积并向外传递的散热数据,构建服务器散热策略专家库,与业界开机即风扇拉满的策略不同,创造性的提出基于服务器温度感知的阶梯性风量提升控制技术。
借助毫秒级的信号检测和梯度散热模型,浪潮信息了实现对散热需求的动态响应,使风扇转速能够阶梯式上升,不仅更符合硬件散热规律,也使得开机过程中的噪音得到有效控制。实测数据证实,在环境温度为20°时,浪潮信息的解决方案可将风扇转速值控制在25%,开机噪声值降低至44.7dBA,噪音下降30.4%。在BMC重启或挂死情况下,其能够将风扇转速值优化40%,噪声由71.8dBA降低至57.2dBA。
创新三:上电即开机 开机时间缩短一半以上
RTOS作为轻量级实时系统,任务负载量小,可先于BMC Linux启动,同时搭配浪潮信息独有的BMC Linux与服务器BIOS系统同步启动技术,可实现上电即开机,从而大幅度提升开机速度。
测试数据显示,部署RTOS实时操作系统和BIOS快速启动技术的服务器,进入操作系统时间可较业界缩短一半以上,不但可以快速执行时间敏感型任务,还能有效加快常规业务部署上线,并减少因为运维重启服务器对于业务时效的影响。
开机智能控温,大规模数据中心高效绿色发展利器
浪潮信息服务器开机3秒智能控温技术,从根本上解决了数据中心运维中服务器启动缓慢与风扇噪音过大的难题。该技术实现了上电即刻启动,开机速度远超业界平均水平,最高提升可达1.2倍,极大加速了业务部署流程,缩减了因运维导致的业务停滞时间。其创新的阶梯式转速控制与闭环反馈机制,依据实时环境及散热需求动态调整风扇速度,噪音降低高达30.4%,为运维人员营造了更为宁静的工作环境。
此外,该技术确保了风扇全周期转速的精细管理,不仅延长了风扇使用寿命,还降低了整体运维成本。面对BMC Linux异常,RTOS能即时接管散热系统,保障设备稳定运行,进一步提升系统可靠性,为数据中心运维带来了全面升级。未来,浪潮信息将继续深耕技术创新,为数据中心的高效、绿色、可持续发展贡献更多力量。