硬件指南 » 教程 » 为什么 AMD 的异构多核与其他产品不同?它好太多了!
您可能知道,AMD 还创建了自己的设计 异构多核就像 Arm 多年来所做的那样,或者像英特尔最近在其 P-core 和 E-core 上所做的那样。然而,AMD 的混合架构 与我们迄今为止所见的任何东西都不同,这里我们解释一下原因。
异构多核的出现解决了一些问题,但并未解决 x86 世界中的全部问题。
首先,假设异构多核 CPU 具有 一些优点 与传统多核相比,例如:
改进的性能: 它们允许每个核心专门执行特定任务,与单个 CPU 相比,这可以提高整体性能。例如,某些核心可能针对计算密集型任务进行了优化,而其他核心则可能更擅长处理低功耗任务。
能源效率: 通过配备专用核心,异构多核 CPU 可以提高能效。这意味着它可以在低功耗核心上执行低功耗任务,从而延长便携式设备的电池寿命。
更好地处理各种工作负载: 与前两点相关,应该说,由于异构核心可以适应不同类型的任务,这些 CPU 非常适合处理不同的工作负载,根据工作负载的重重程度,将任务分配给最合适的核心。
改进的多任务处理: 它们可以改进多任务处理,因为不同的核心可以同时处理不同的任务,从而提高系统响应速度。此外,高效的核心通常更小,从而允许在同一芯片上集成更多核心。不仅如此,它还可以实现更多物理核心,并取消逻辑核心,即同步多线程 (SMT),因为正如我们所见,这项技术可能会产生许多漏洞。
当然,也有一些 缺点 在这些设计中,例如:
编程复杂性: 异构多核 CPU 的编程可能比同构 CPU 更复杂。开发人员必须能够充分利用不同类型的核心,并高效地管理每个核心的任务分配。此外,在操作系统调度程序层面,实现这些功能也相当复杂,难以正常工作。另一方面,需要注意的是,如果核心不支持相同的指令,则意味着某些核心无法执行某些软件,而只能由其他核心来执行。
兼容性和软件: 并非所有程序都针对异构核心进行了优化,这可能会限制潜在的性能优势。此外,它还可能与旧版软件存在兼容性问题。
成本和硬件设计: 与同构 CPU 相比,实现异构多核 CPU 在硬件设计方面可能更加昂贵且复杂。
x86 案例
上述情况也适用于 Arm 处理器领域,例如高通、三星、联发科等公司的移动 SoC,以及苹果的 A 系列移动设备处理器和 M 系列计算机处理器。然而,我们目前在 x86 世界,与英特尔,没有充分发挥异构多核的优势。
我指的是英特尔的 E 核(高效的 E 核)不支持超线程技术,这意味着它们缺乏同步多线程 (SMT)。然而,P 核可以同时处理两个线程,因此每个 P 核被拆分成两个逻辑核。因此,可能的 漏洞 E 核中存在风险,但 P 核中仍然存在风险。因此,Arm 世界中已经淘汰的一件事,在 x86 世界中并没有以同样的方式去做。
盒装处理器与托盘处理器:有何区别?AMD 是否已注意到在其处理器中改进这一点? 看来他们不仅没有走 Arm 的路,也没有走英特尔的路。AMD 的情况非常特殊,他们的做法是让两种类型的内核都兼容 SMT。因此,大核心 Zen 4 和小核心 Zen 4c 都被拆分成两个逻辑核心,每个核心执行一个线程。
AMD EPYC 9004“Bergamo”:第一个到达
AMD 于 2023 年 XNUMX 月推出了面向 HPC 和服务器领域的处理器, EPYC 9004“贝加莫”这款处理器拥有 128 个核心和 256 个线程。但这款微处理器的一大亮点在于,它搭载了名为 Zen 4c 的全新创新 CPU 微架构。换句话说,它并非全新的微架构;它仍然是 Zen 4,但有一些变化,我将在下文中解释。
在 Zen 4c 发布之前,就有很多关于它的传言,比如说它是 Zen 4 的“精简版”,处理能力较低,因此 IPC 也较低;还有说 Zen 4c 是 AMD 对英特尔 E 核心架构“Gracemont”和“Crestmont”的回应。事实证明, 它既不是 Zen 4 的精简版,也不是类似 E-core 的东西。,而是 Zen 4 核心的物理紧凑实现,并且在所有其他因素上都相同。
我们首先要强调的是 Zen 4c 的 IPC 与 Zen 4 完全相同也就是说,如果以相同的时钟频率比较两个核心,Zen 4 和 Zen 4c 都会具有相同的 IPC性能这是因为它的前端(获取和解码指令的部分)、后端(执行单元)、L/S 组件和内部缓存层次结构完全相同。
也就是说,要 分析 Zen 4c令人惊讶的是,我们发现它具有相同的 88 路加载队列、64 路存储队列、相同的 675.000 条微操作缓存、相同的 10+6 INT+FP 执行带宽、完全相同的 INT 寄存器文件、相同的调度程序以及相同的缓存延迟。L1I 和 L1D 缓存的大小与 Zen 4 相同,均为 32 KB,专用 L2 缓存也为 1 MB。唯一的变化是,每个核心的有效 L3 缓存已减少到 2 MB,而 4 核 Zen 8 CCD 上为 4 MB。
而 防治荒漠化公约 常规的 8 核 Zen 4 拥有八个 Zen 4 核心和 3MB L32 缓存,AMD 推出的“Bergamo”系列新 16 核 Zen 4c CCD 芯片组包含两个 8核CCX (CPU 核心复合体),每个核心都拥有 16MB 的 L3 缓存,由 8 个 CCX 核心共享。从这个意义上讲,Zen 4c CCD 中末级缓存和 CPU 核心的组织方式与 Zen 2 CCD(使用两个 4 核 CCX)有一些相似之处。但除此之外,它就像一个传统的 Zen 4。最有趣的是,16 核 Zen 4c CCD 并不是 AMD 本世代第一款每个核心末级缓存较小的产品。Project Phoenix 也是如此,即专为 Ryzen 7040 系列笔记本电脑设计的 APU,它有 8 个 Zen 4 核心,共享 3MB 的 L16 缓存。
AMD Ryzen 9 9950X3D 游戏性能对比 Intel 285K 及之前的 X3D至 计算密集型工作负载 Zen 4c 占用的内存较少,但性能与 Zen 4 相同。然而,较小的 L3 缓存会影响具有大型数据集的带宽敏感工作负载的性能。
不,核心尺寸最小化不是来自制造节点,因为 Zen 4c CCD 是在同一节点上构建的。 台积电 5nm EUV 该公司用于常规 4 核 Zen 8 CCD 的架构。然而,Zen 4c CPU 核心比 Zen 35 核心小 4%,每个核心的芯片面积仅为 2.48 平方毫米,而 Zen 3.84 核心的芯片面积为 XNUMX 平方毫米。这很神奇吗?AMD 是如何做到的?
那么,核心尺寸的节省可能来自于 压实 不同核心组件的集成,且不以任何方式降低其形式或功能,即优化这些核心的设计、布线和布局。因此,凭借这些更优化的核心,在相同的 ISA、指令扩展支持和 SMT 架构下,可以集成更多核心。例如,AMD EPYC 9004 “Bergamo” 可以集成 128 个核心,并配备 16 核 Zen 4c 架构的 CCD。而基于 9004 核 Zen 8 架构的 AMD EPYC 4 “Genoa” 只能集成 96 个核心。令人印象深刻!
AMD Zen 4c 与英特尔 E-core:差异
英特尔一直在销售混合 CPU 自 12 年 2021 月推出第 512 代 Alder Lake CPU 以来,它一直采用称为 P 核的高性能内核和高效 E 核的组合。这有点类似于 Arm 的 big.LITTLE,但正如我之前所说,它们之间存在差异,例如 P 核可以具有 HT 或超线程技术,此外还支持 E 核不支持的一些指令,尽管英特尔似乎在 AVX-XNUMX 问题上退缩了,它们已被禁用。
现在 AMD 有了自己的高效核心。但是 AMD 的做法有所不同,事实上非常不同。我之前解释过,AMD 较小的 Zen 4c 核心在功能上与完整的 Zen 4 核心完全相同,只是 L3 缓存减少了一半。然而,它们却只占用了 Zen 4 核心一半的空间——这并非完全归因于缓存大小的减少,而是其他原因。也就是说,在重新编译后,Zen 4c 核心会执行与 Zen 4 相同的指令,并且还支持 SMT,而英特尔的 E 核心则没有。
这一切都归结于物理设计目标,正如我提到的,多层次的优化导致了这一点 缩小尺寸另外,需要注意的是,虽然 Zen 4 可以支持高达 5.5 GHz 及以上的工作频率,但 Zen 4c 的目标时钟速度被降低到了 3 GHz 左右。事实证明,这对 CPU 核心的设计方式产生了巨大的影响。在较低的时钟速度下,内部结构可以做得更小,而不必担心高工作频率带来的干扰和功率损耗。这才是关键所在。
新款 AMD Ryzen 9000X3D:两款配备 192MB L3 缓存的全新 Granite Ridge 型号泄露
而 英特尔所做的是为其 P 核开发一个微架构,为其 E 核开发另一个微架构。 E 型核心部分继承了英特尔凌动处理器(Atom)的发展路线,凌动处理器最初是顺序执行核心,但在最新设计中变成了乱序执行(OoOE)核心。因此,尺寸和功耗的降低主要源于架构本身,核心性能较低,且 IPC 也有所不同。
另一方面,虽然 英特尔的 E-core 核心尺寸明显较小 与 P 核相比,Zen 4 和 Zen 4c 之间的差异可能不像英特尔那样明显,因为英特尔的 P 核尺寸与 4 个 E 核相似。然而,英特尔异构核心之间的这种差异也使得工作负载分配和负载平衡的管理比 AMD 复杂得多。
AMD Ryzen“Phoenix 2”:搭载 Zen 4 + Zen 4c 的 APU
AMD 不仅将这款 Zen 4c 用于 EPYC 高性能计算机,还宣布将其用于 A便携式设备的PU, 并将其代号为 Phoenix 2,这是基于 Zen 1 的 Phoenix 4 的第二个版本。这些核心将用于 Ryzen 3 7440U 等产品。
该 Phoenix 2 技术规格与Phoenix 1相比,主要变化如下:
SOC凤凰2凤凰1制造节点或流程4nm4nm模具尺寸137mm2178mm2晶体管数量 - - 微架构禅4+禅4CZen 4内核/线程8/16 或 6/12(禁用两个核心)8 / 16最大时钟频率4.7 GHz5.1 GHzGPU架构脱氧核糖核酸3脱氧核糖核酸3GPU计算单元4 个 CU(256 个 SP)12(768)GPU时钟频率2500 MHz2800 MHz支持的内存LPDDR5-6400LPDDR5X-7500DDR5-5600LPDDR5x-7500TDP15 30W15 30W适用产品手持设备笔记本电脑/手持设备fecha的lanzamiento20242024
正如你所见,采用混合核心的Phoenix 2将面向低功耗设备,例如笔记本电脑。在已确认的6核版本中,将有 2 个 Zen 4 核心和 4 个 Zen 4c 核心这种提供两种不同 APU 的策略有些奇怪,但我们必须拭目以待,看看最终市场上会出现什么,但可能会有惊喜......
结论
尽管 AMD 继续使用 SMT,但这可能会带来某些漏洞,将每个物理核心分成两个逻辑核心,以便每个核心同时处理一个线程,但它也确实成功设计出了英特尔无法解决的问题,例如由于核心差异太大而导致的负载分配问题。
凭借 Zen 4/Zen 4c,AMD 标志着其统一核心设计的重大转变,并拥抱未来:将不同版本的 CPU 核心组合在一起,将比竞争对手的异构多核架构(Arm、Apple 和 Intel)更具竞争优势。通过为两种类型的 CPU 核心使用相同的微架构,AMD 可以提供额外的优势,例如 更好的兼容性和减少碎片化 在应用程序/驱动程序开发方面。“凭借 Zen 4/Zen 4c,AMD 正在从其统一核心设计模式中实现重大转变,并拥抱未来:通过组合不同的 CPU 核心变体,AMD 将比竞争对手的异构多核架构(例如 Arm、Apple 和 Intel)更具竞争优势。通过为两种类型的 CPU 核心使用相同的微架构,AMD 可以提供额外的优势,例如 更好的兼容性和减少碎片化 在应用程序/驱动程序开发中。
小心,AMD 是最后一个到达的,而且可能已经找到了关键!我们会密切关注这些芯片……