Nvidia将推出一款新GPU: Rubin CPX
作者: CBISMB
责任编辑: 邹大斌
来源: ISMB
时间: 2025-09-10 12:07
关键字: 英伟达,GPU,NVL
浏览: 1827
点赞: 101
收藏: 13
周二,Nvidia公布了一款其即将推出的Vera Rubin NVL144计算平台的替代版本。该版本将大幅增加芯片数量,并采用一种“新型GPU”,旨在加速复杂AI应用的运行。
这款名为Rubin CPX的新GPU在AI Infra峰会上发布。Nvidia称,它将使AI系统能更好地处理软件编码和生成式视频应用,这些应用可接收多达百万级以上的输入token,并将信息保留在所谓的“长上下文窗口”中,以执行复杂的操作任务。
Rubin CPX及其配套的Vera Rubin NVL144 CPX平台计划于明年年底前推出,时间上晚于标准版Rubin GPU及其相关Vera Rubin NVL144平台(预计于2026年下半年发布)。Nvidia还计划为希望复用现有基础设施的客户提供“其他灵活配置”的Rubin CPX选项。
这家总部位于加州圣塔克拉拉的公司表示,前沿AI企业已开始评估Rubin CPX,包括AI驱动代码编辑工具提供商Cursor、生成式视频平台Runway以及软件工程平台Magic。
Nvidia提供的一份声明中,Cursor首席执行官Michael Truell表示:“借助Nvidia Rubin CPX,Cursor将能够实现闪电般的代码生成和开发者洞察,彻底改变软件开发流程。这将解锁前所未有的生产力水平,让用户得以实现过去无法触及的创意。”
在与记者和分析师的简报会上,Nvidia数据中心产品总监Shar Narasimhan表示,百万级token以上的大型上下文窗口,使AI代理能够“超越简单的代码错误修复,支持高级软件应用和系统开发”。他还补充说,这也能实现“上下文感知、时间稳定的视频生成”。
Narasimhan指出,Rubin CPX将作为上下文与预填充计算的专用GPU,在Nvidia解耦式推理服务流程的两个步骤中承担第一步任务,从而显著加速这些“大规模上下文”AI应用的性能。而标准版Rubin GPU则负责第二步,即生成与解码计算。
他表示:“这将极大提升AI工厂的生产效率和性能。”
据Nvidia介绍,Vera Rubin NVL144 CPX平台通过在每个计算托盘中增加四块Rubin CPX GPU,使独立GPU总数相比标准版Vera Rubin NVL144平台翻倍。(尽管该平台包含72个双光罩Rubin GPU,但Nvidia将每个光罩计为一块GPU,从而达到144的数量——这与将双光罩Blackwell和Blackwell Ultra GPU视为单个GPU的计数方式不同。)
Nvidia表示,每个计算托盘内含四块Rubin CPX GPU、四块Rubin GPU和两块基于Arm架构的Vera CPU,使得Vera Rubin NVL144 CPX平台具备8 exaflops的NVFP4计算能力。NVFP4是Nvidia近期推出的一种新型4位浮点格式,旨在为AI模型保持更高精度,通常只有更大数值格式才能实现这种精度。
据Nvidia称,该平台8 exaflops的性能指标,超过了标准版Vera Rubin NVL144平台预计提供的3.6 exaflops NVFP4算力的两倍以上,也比今年发布的基于Blackwell Ultra的GB300 NVL72平台快7.5倍。
此外,Vera Rubin NVL144 CPX平台还将配备1.7 PBps的内存带宽和100 TB高速内存,高于标准版平台的1.4 PBps和75 TB。该公司表示,这些规格也分别比GB300 NVL72平台高出三倍带宽和2.5倍容量。
Nvidia预计将推出一种双机架配置,将Vera Rubin NVL144与Vera Rubin NVL144 CPX机架结合,使高速内存容量达到150 TB。该配置预计也将在明年年底前发布。
在硬件层面,Rubin CPX单芯片具备30 petaflops的NVFP4算力,指数运算能力是GB300 Superchip的三倍,配备128 GB GDDR7内存,以及四个Nvidia视频编码器和四个Nvidia视频解码器,这些组件专为增强生成式视频应用而设计。
相比之下,标准版Rubin GPU配备288 GB HBM4高带宽内存(成本高于GDDR7)。今年3月Nvidia发布Rubin时曾表示,该GPU在FP4计算下可达50 petaflops算力——这一数据是在Nvidia于6月公布NVFP4格式之前公布的。