英特尔正式推出了全球首款配备 HBM 内存的 x86 CPU——Intel Xeon Max 系列,也就是之前我们称之为 Sapphire Rapids(HBM)的旗舰级产品线。
新至强中的 56 个内核均为 P 核,可提供 112 个线程和 350W TDP。它采用基于 EMIB 的设计,分为四个集群。但最有趣的是,它还具有 64 GB 的 HBM2e 内存,分为 4 个 16 GB 的集群,总内存带宽为 1 TB / s,每个内核的 HBM 都超过 1 GB。
英特尔还表示,HBM 内存的集成不需要更改代码,并且应该对用户实现无缝透明。
据介绍,这 56 个内核由四个 Die 构成,并使用英特尔的多芯片互连桥 (EMIB) 进行连接,其中封装了 64GB HBM 内存,该平台将采用 PCIe 5.0 和 CXL 1.1 I / O 接口。
在 HCPG 性能相同的情况下,功耗比 AMD Milan-X 集群低 68%。
AMX 扩展可提高 AI 性能,并为 INT8 和 INT32 累积操作提供比 AVX-512 高 8 倍的峰值吞吐量。
提供在不同 HBM 和 DDR 内存配置中运行的灵活性。
工作负载基准:
气候建模:仅使用 HBM 在 MPAS-A 上比 AMD Milan-X 快 2.4 倍。
分子动力学:在 DeePMD 上,与具有 DDR5 内存的竞争产品相比,性能提高了 2.8 倍。
在性能方面。它与旧的英特尔至强 8380 系列处理器或 AMD EPYC 7773X 相比,可在某些工作负载中提供 5 倍的性能。
值得注意的是,AMD 明天将发布基于 Genoa 的数据中心 CPU,两大系列 CPU 均已向 OEM 交付,因此这些数值对比其实没什么用。
新 CPU 中还包含 20 个加速引擎,主要是用于 AVX-512、AMX、DSA 和英特尔 DL Boost 工作负载。据称,英特尔在 MLPerf DeepCAM 训练中的性能比 AMD 7763 提升了 3.6 倍,比 NVIDIA 的 A100 提升了 1.2 倍。
据介绍,英特尔至强 Max CPU 将在 Aurora 超级计算机中首次亮相,目前正在阿贡国家实验室建造。IT之家了解到,Aurora 有望成为第一台超过 2 exaflops 峰值双精度计算性能的超级计算机。
此外,Aurora 还将率先展示在单个系统中将 Max 系列 GPU 和 CPU 配对的强大功能,拥有超过 10000 个“刀片”,每个“刀片”包含六个 Max 系列 GPU 和两个至强 Max CPU。