HPE 力挺 AMD Helios,将为之搭配专用Scale up交换机

作者: CBISMB

责任编辑: 邹大斌

来源: CBISMB

时间: 2025-12-03 10:57

关键字: HPE,AMD,超节点,交换机

浏览: 500

点赞: 29

收藏: 4

HPE正全力支持 AMD 的 Helios 超节点,并计划于明年将其纳入自家 AI 产品组合,其中包括一款专为该架构打造的 Juniper Networks 纵向扩展交换机。

在本周于巴塞罗那举行的 HPE Discover 大会前夕,该公司宣布将成为首批提供基于 AMD 参考设计的“交钥匙”(turnkey)机架系统的厂商之一,用于大规模 AI 训练和推理任务。

Helios 的设计理念是将整机架内配备加速器的多个节点整合起来,使其如同一块超大 GPU 运行——类似于英伟达的 DGX GB200 NVL72 系统。Helios 正是作为该系统的竞品而推出的。

对 AMD 而言,Helios 将成为其下一代 Instinct MI455X GPU 和代号为 “Venice” 的第六代 EPYC CPU 的重要载体。这两款芯片均预计于明年发布,因此 HPE 目前仅表示将在 2026 年某个时间在全球范围内推出其 Helios AI 机架系统。

该系统的网络部分将采用一种纵向扩展的以太网实现方案,通过以太网运行 UALink 协议,并配备一款由 Juniper Networks 定制、基于 Broadcom Tomahawk 6 网络芯片的交换机。该芯片聚合带宽高达 102.4 Tbps。

UALink(Ultra Accelerator Link)是一种开放标准,旨在替代英伟达的 NVLink 技术,用于连接 GPU 集群。其规范已于今年早些时候发布。

然而,HPE 与同样参与开发该纵向扩展交换机的 Broadcom 似乎认为:只要能在标准以太网上运行 UALink 协议,就不必专门构建基于 UALink 硬件的网络——这正是当前方案所采取的做法。

HPE 网络业务总裁兼总经理、Juniper Networks 前 CEO Rami Rahim 表示:“这是业界首个基于以太网(标准以太网)的纵向扩展解决方案。这意味着它完全基于开放标准,避免了厂商锁定,同时充分利用了 HPE 与 Juniper 成熟可靠的网络技术,为 AI 工作负载提供卓越的扩展能力和性能。”

HPE 声称,这一架构将能够支持万亿参数模型训练所需的通信流量,并实现高吞吐推理能力。

据 Rahim 介绍,Helios 基于 Meta 在开放计算项目(OCP)中制定的双宽 Open Rack Wide(ORW)规范,支持模块化托盘设计,具备液冷能力,特别适合电力受限的数据中心环境。

HPE 表示,每个机架可容纳 72 块 Instinct MI455X GPU,整个机架级系统将实现高达 260 TB/s 的聚合带宽,以及最高 2.9 exaFLOPS 的 4 位浮点运算性能,足以应对超大规模 AI 模型的处理需求。

当然,这样的系统价格不菲。据报道,英伟达的同类竞品 GB200 NVL72 系统每套售价接近 350 万美元。或许正因如此,HPE 明确将云服务提供商(尤其是新兴的“新云”服务商,neoclouds)列为此类设备的主要目标客户,而非传统企业用户。

©本站发布的所有内容,包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等,除特别标明外,均来源于网络或用户投稿,版权归原作者或原出处所有。我们致力于保护原作者版权,若涉及版权问题,请及时联系我们进行处理。