在AI算力呈几何倍数增长的趋势下,算力逐渐朝着“高性能、高密度、高耗能“发展。在高耗能的算力下,AI服务器功率已逐步逼近风冷散热极限,而液冷作为更加高效、低能耗的制冷技术,逐渐成为了高密度算力散热场景的首选方案。
液冷的优势
第一、它能够快速散热。从物理学来理解,液体具有高导热、高比热容以及高相变潜热的特性,在同体积液体带走的热量是同体积空气的3000倍以上,因而液体散热效率更优于风冷散热。第二是它节能环保。在国家大力推行的碳中和政策目标引导下,PUE指数成为是衡量设备能耗的一个重要指标。在实际应用当中,液冷系统中没有压缩机、风机等高耗电器件,仅需要水泵、传感器等少量耗电器件,能够显著降低PUE。
第三是更高的空间利用率,例如浸没式液冷可以大幅提高数据中心单位空间的服务器密度,从而更好地支持高密度计算。
市场主流液冷技术
▪ 冷板式液冷:通过冷板贴在发热器件上为发热器件散热,如同睡凉席。在这种液冷服务器中,只有像CPU、GPU这样的高功耗、高发热部件,才会覆盖液冷板,而其他发热部件,还需要依赖风扇散热,风液混合散热。
▪ 淋喷式液冷:在机箱顶部储液和开孔,根据发热体位置和发热量大小不同,让冷却液对发热体进行喷淋,达到设备冷却的目的,好比冲淋浴。
▪ 浸没式液冷:将发热器件完全“泡”在冷却液中,依靠冷却液吸收设备产生的热量,类似泡冷水澡。其中,按照冷却液在循环散热过程中是否发生相变,可以分为单相浸没式液冷和双相浸没式液冷。
据统计目前市场上冷板式液冷占总体液冷份额的90%以上,原因在于它的成本低,并且技术以及配套的产业链更为成熟,同时,冷板式与风冷在运维上差异较小,使用习惯一致,市场接受程度更高。考虑到成本与后续维护,目前冷板式液冷更适用于小型数据中心,而大型的数据中心可以配备专门的液冷运维操作间,更适用于使用浸没式。从更长远的角度考虑,浸没式液冷的散热效率远优于冷板式液冷,随着服务器功率的攀升,未来液冷的终极一定是浸没式液冷。
液冷的局限性
技术尚未稳定,比如冷板式液冷技术相对其他冷却方法相对工艺成熟却仍旧存在板冷的对流通道里,液冷挥发两相沸腾流动,汽化相变产生的气泡存在不稳定性,致通道内的“气塞”和“返流”现象,进而导致流动不稳定引起传热恶化的现象。
成本过高也是阻碍液冷大规模应用的障碍之一。这里不仅包含液冷设备罐体和冷却液的价格以及后续的维护成本,还包括泵、换热器、过滤器、传感器等一系列用来满足液冷系统设计实践的其它设施的改造和维护成本。
产业链尚未成熟。液冷关键核心在于将冷源、热源紧密耦合。目前市场上冷、热源场景的供应商割裂,因此需要厂家同时具备冷、热源技术处理的系统集成能力,并了解ICT架构。液冷产业可按照服务器内部和外部进行划分,对于服务器内部,液冷系统部署关键是液冷零部件(冷板式:液冷板、管路、QDC等;浸没式:冷却液等)与服务器的适配,IT设备商和温控设备商需要进行产品适配及耦合;对于服务器外部,主要是Manifold、CDU、冷源等液冷基础配套设施的适配。目前这些产业链配套上下游壁垒尚未完全打通。
从目前市场价格来看,液冷的应用成本明显高于传统风冷,但从技术迭代材料设备改进等长远角度来看,随着单千瓦散热成本快速下降,成本拐点或将不久将来出现,液冷TCO优势逐渐显著,随之迎来的将会是液冷市场大规模应用大爆发。