英伟达发布Rubin CPX，开创AI GPU新类别 | ATYUN.COM 官网-人工智能教程资讯全方位服务平台

tr-09092025-news-nvidia-vera-rubin-cpx-770x440

英伟达正准备在AI硬件领域迈出重要一步。公司在9月8日宣布，其Vera Rubin微架构正在进行流片，计划于2026年推出。根据英伟达加速计算产品总监Dave Salvator的说法，一种名为Rubin CPX的新变体将专注于需要海量上下文窗口的AI工作负载。

“Vera Rubin平台将标志着AI计算前沿的又一次飞跃——推出下一代Rubin GPU和一种名为CPX的新类别处理器，”英伟达创始人兼CEO黄仁勋在新闻稿中表示。“就像RTX革新了图形和物理AI一样，Rubin CPX是首款专为海量上下文AI设计的CUDA GPU，能够同时处理数百万个知识符号。”

这一宣布是在英伟达于9月9日公布最新MLPerf推理结果之前。

英伟达宣布新硬件和架构

一些AI应用场景涉及超过一百万个符号的上下文窗口，例如包含超过10万行代码的软件开发或高清晰度视频生成。对于这些应用场景，英伟达将在2026年底推出Vera Rubin NDL 144 CPX类GPU。

Vera Rubin NDL 144的一个变体专为需要长上下文窗口的应用而设计，CPX型号提供8 exaflops的AI性能，30 PF NVFP4用于上下文计算，与英伟达GB300 NVL72系统相比，指数运算能力提升3倍。它还包括128GB的GDDR7内存，4个NVENC（编码器）和4个NVDEC（解码器）用于生成视频，以及100TB的快速内存。

“它解锁了新的高端应用场景，如智能编码和视频生成……”英伟达AI和数据中心GPU产品营销总监Shar Narasimhan在预发布会上表示。

数据中心千兆规模参考设计可为AI工厂建设提供指导

Vera Rubin NDL 144 CPX可以被视为更大AI工厂的一部分。9月9日，英伟达还宣布计划为大型数据中心提供千兆规模的参考设计。

“这要求我们与广泛的基础设施合作伙伴进行创新和共同设计，”Narasimhan说。

Narasimhan补充说，英伟达正进入一个从计算角度设计数据中心的新纪元，与基础设施公司合作。公司将提供涵盖架构、工程和施工；设计、仿真和运营；发电和存储；以及机械、电气和管道的参考设计。

Blackwell GPU在MLPerf基准测试中创下纪录

MLPerf基准测试是由MLCommons联盟组织的测试，一些公司用来衡量硬件和软件在生成AI工作负载上的性能。

英伟达Blackwell GPU通过一种名为分离服务的新技术，在Llama 3.1 405B Interactive上创下了性能新纪录，超越了Blackwell基线。这种方法允许在相同硬件上提高性能。

“你可以在同一平台上提供更多的性能，”Salvator在预发布会上说。“这种性能可以为已经部署解决方案的组织带来额外收入。”

与此同时，微软展示了其加速AI的实验结果，使用一种模拟光学计算机。