Apple的M1之旅:M1 Pro与M1 Max

Astroys Astroys

Apple继发布M1 SoC一年后,前不久随着新款MacBook Pro的发布,推出了M1 Pro和M1 Max SoC。

由于多年来为手机和平板设计RISC SoC的经验,Apple已经掌握了软件(OS和APP)和硬件系统架构。M1是Apple首个适用于入门级Mac的高性能SoC,成功促使该公司加快了更先进的SoC的开发。

与Intel的通用处理器不同,苹果的M1系列SoC是一种ASIC,只能用于Apple设计的PC。M1 Pro和M1 Max拥有更多的性能核,但能效核从M1的4个减少到2个。两者基于TSMC的5nm技术。

M1 Pro、M1 Max、M1和A15的比较

Apple没有透露有关新CPU内核或频率的信息。根据TSMC在第26届技术研讨会上提供的信息,N5P比N5快5%,能效高10%,尽管晶体管密度没有提高。据Apple称,M1 Pro和M1 Max的晶体管分别为33.7亿和57亿个。因此,M1 Pro和M1 Max的芯片尺寸将分别接近251.3mm²和425.1mm²。两者都打破了过往Apple芯片的尺寸和晶体管数量记录。


M系列芯片的这种演变符合Apple处理器的发展战略。通过与TSMC密切合作,每两年Apple的芯片会有一次重大的改进。除了手机的Ax芯片外,苹果在2020年为PC推出了M系列芯片,目标是在两年内取代所有Intel芯片。iPhone、iPad和Mac中的SoC架构相似,但Mx芯片的内核更多,cache内存更大。换句话说,Apple最新和最先进的处理器将是PC的Mx,而不是手机的Ax。Ax将继承Mx的功能和创新,并成为其定制版本。

SLC(system-level cache)

从M1 Pro和M1 Max的die shot来看,SLC估计达到了48MB和96MB,远大于A15的32MB和M1的24MB。Apple提高了cache容量,以提高系统性能,同时牺牲了芯片尺寸以降低功耗。为了提高系统效率,SLC可以在多个SoC子系统(如CPU和GPU)之间共享。此外,更大的cache可以降低SoC访问DRAM的频率,降低系统功耗,降低对DRAM的要求,进而降低BOM。

Apple一直在扩展其新应用的API,包括游戏、ray tracing和AR/VR。所有这些应用都需要SoC具有多个相互通信和协作的内核,以及巨大的SLC来提高响应能力。

强大的GPU
GPU是新款芯片性能的关键。M1 Pro和M1 Max分别有16个和32个GPU内核。与CPU不同,GPU由大量微型核构成。最初,GPU旨在加快特定的3D图形操作,但现在它们能够渲染越来越逼真的3D视觉效果,如light tracing。自3D图形学引入以来,light tracing一直是图形技术领域最重要的进步之一。这也是设计AR/VR/XR场景的关键技术。light tracing可用于移动、可穿戴设备、游戏和汽车等嵌入式领域,现在对任何3D环境的真实性都至关重要。

M1 Pro的GPU有16个内核,只有5.2 TFLOP。然而,Apple声称,M1 Pro的GPU在某些功耗范围内提供与独立GeForce RTX 3050 Ti 4GB相当的性能,同时功耗低70%。这可能是由于SoC在L2 cache和SLC中都有大量的共享cache。此外,GPU可以使用共享的32GB LPDDR5,这大大高于RTX 3050的4GB GDDR6。

Ray tracing是在2020年和2021年WWDC上重点强调的技术。在2021年WWDC上,与将其纳入游戏相关的培训占所有技术培训课程的32.4%,成为了最热门的培训主题。为了充分实现ray tracing的能力,这些API需要GPU支持。

GPU也可以用作更灵活的并行处理器,支持广泛的AI应用。在2017年WWDC上,Apple宣布了Core ML,允许开发人员为Apple设备创建捆绑的应用。Core ML需要GPU支持。AR、游戏和成像等特定应用是Apple当前和近期将聚焦的应用。


内存架构

M1 Pro和M1 Max都采用了LPDDR5,带宽分别为200GB/s和400GB/s,明显快于M1的68.2GB/s。Apple的内存架构无疑是其最大的优势之一。M1 Pro和M1 Max共享相同的UMA,将高带宽和低延迟DRAM嵌入定制包中的单个池中。因此,所有核都可以同时检索内存中的数据,系统可以动态排列宝贵的内存资源。这极大地提高了系统性能,减少了功耗大的DRAM的使用,从而延长了电池寿命。


M1 Pro和M1 Max的目标群体

内容创作者无疑是M1 Pro和M1 Max的最大目标群体。大多数Mac视频/照片编辑软件都可以支持M1系列Mac。大多数第三方软件,如Adobe Photoshop和Lightroom,在Rosetta2兼容性下性能更快,同时在M1 Pro和M1 Max上功耗更低。


游戏开发人员是M1 Pro和M1 Max的潜在客户。如前所述,Apple Store服务的主要收入来源之一是游戏。然而,之前基于Intel的Mac曾被认为不适合玩高质量的游戏,因为它们的硬件无法满足游戏的需求,更不用说AR/VR/XR游戏了。由于M1 Pro和M1 Max大幅改进的GPU,经典游戏将移植到原生ARM架构中,这将鼓励更多开发人员也这样做。Apple还为最近的WWDC中的light tracing等3D情况提供了API和培训。这些是游戏制作以及AR/VR/XR场景构建的关键技术。


结论

Apple的M1 Pro和M1 Max满足了该公司对多任务处理、高性能和高能效的中高端笔记本电脑的要求。目前Apple的芯片大概已覆盖了93%的Mac产品,未来这一比例肯定会继续增长。


Apple的新Mac旨在吸引广泛的客户,包括内容创作者、游戏设计师、游戏玩家和早期用户。Apple的下一次芯片升级可能包括额外的高性能CPU内核,改进多任务处理,更多的GPU内核来提高视频编辑和游戏的性能,以及AI训练的能力。




[参考文章]

M1 Pro, M1 Max Give Definitive Push to Apple’s M1 Journey — Brady Wang





from A to B

文章推荐