2024年初,苹果推出了M4处理器,令人意外的是,它的发布距离M3发布仅仅过去了半年时间。更让人惊讶的是,M4首次亮相于iPad Pro。这一新处理器不仅仅是M3的简单升级版本,而是一次全面的架构优化。本文将详细分析M4处理器的架构、性能和能效,探讨其在未来Mac和iPhone上的潜力。
M4芯片简介
工艺与架构
M4处理器采用台积电的第二代3nm工艺(N3E),成为首款使用N3E工艺的处理器。相比M3使用的N3B工艺,N3E理论上能提供更高的性能上限。苹果在发布会上提到,M4的CPU部分再次提升了大核架构。这次的改进不仅是M3的简单改良,而是对微架构进行了进一步优化。
性能与频率
M4在被动冷却设备中的峰值频率达到了4.5GHz,这对于iPad来说是前所未有的。小核的频率也达到了2.88GHz,与英特尔当前一代Core Ultra 5的水平相当。GPU方面,M4基本上是M3 GPU的优化版,频率从1.34GHz提升至1.47GHz。NPU(神经处理单元)部分,苹果首次在发布会上大量提及“AI”,并声称其NPU性能优于市场上所有的“AIPC”。
M4还采用了频率更高的LPDDR5-7500内存,而非预期的LPDDR5X内存,可能是为了降低延迟。内存带宽对于NPU和GPU都至关重要,这一提升为AI应用提供了更好的支持。
CPU微架构分析
前端与后端改进
M4的大核相比M3有显著提升。其解码单元宽度从M3的9扩大到10,这意味着每个时钟周期可以解码更多指令。前端解码单元的扩大通常对应着更强的后端处理能力,M4的新架构显著增加了Dispatch Buffer和浮点单元的调度队列,提高了内核的并行性。
SME单元的引入
M4引入了SME单元,相当于ARM版本的AVX512,P核和E核簇各有一个SME单元,共享L2缓存。支持SME的程序在性能上将有大幅提升。这一改进主要是为了加速未来的AI应用。
内存与缓存性能
M4的内存延迟显著低于M3,从约96ns降低到88ns,主要得益于LPDDR5-7500内存的使用。小核部分,M4仍采用A17 Pro和M3的小核微架构,但频率更高。
性能测试
SPEC2017测试
在SPEC2017测试中,M4的大核峰值性能相比M3提高了近20%。然而,这种性能提升也带来了显著更高的功耗,峰值功耗比M3高出60%。在常温下,M4的频率策略会更保守,单线程频率为4.4GHz,多线程频率为3.94GHz。这种频率策略类似于Intel和AMD的PC处理器。
GeekBench测试
在GeekBench 6.3中,M4的表现显著提升,增加SME支持后,M4的跑分大幅提高。在GeekBench 5中,M4的单核性能比M3高17%,多核性能比M3高25%。与M2相比,M4的单核和多核性能分别提高了近50%。
能效分析
同频能效方面,M4的大核在高频能效上没有显著改善,但在低频能效上有小幅提升。总体来看,M4在性能上的提升主要得益于架构改进,而非工艺优化。
游戏性能
我们测试了M4在《原神》和《崩坏:星穹铁道》中的表现。在高分辨率下,M4的iPad Pro能以60fps稳定运行,但在解锁120fps后,帧率有所下降。M4的GPU频率提升了10%,带来了相应的性能提升,但能效改善不大。
电池续航
在300nit屏幕亮度下,M4 iPad Pro的电池续航相比上一代有显著提升,特别是13英寸版本的续航几乎翻倍。这主要得益于新一代OLED屏幕显著降低了整机功耗。
总结
M4在性能上有显著提升,但能效改善有限,表明半导体工艺的进步可能快到头了。未来,我们需要更多的架构改进来继续提升性能和能效。总体来看,M4处理器在架构和性能上有了显著的进步,但N3E工艺并未带来预期的能效提升,未来的性能提升将更多依赖于架构优化。