英伟达发布Rubin CPX,开创AI GPU新类别

2025年09月10日 由 佚名 发表 133 0

tr-09092025-news-nvidia-vera-rubin-cpx-770x440


英伟达正准备在AI硬件领域迈出重要一步。公司在9月8日宣布,其Vera Rubin微架构正在进行流片,计划于2026年推出。根据英伟达加速计算产品总监Dave Salvator的说法,一种名为Rubin CPX的新变体将专注于需要海量上下文窗口的AI工作负载。


“Vera Rubin平台将标志着AI计算前沿的又一次飞跃——推出下一代Rubin GPU和一种名为CPX的新类别处理器,”英伟达创始人兼CEO黄仁勋在新闻稿中表示。“就像RTX革新了图形和物理AI一样,Rubin CPX是首款专为海量上下文AI设计的CUDA GPU,能够同时处理数百万个知识符号。”


这一宣布是在英伟达于9月9日公布最新MLPerf推理结果之前。


英伟达宣布新硬件和架构


一些AI应用场景涉及超过一百万个符号的上下文窗口,例如包含超过10万行代码的软件开发或高清晰度视频生成。对于这些应用场景,英伟达将在2026年底推出Vera Rubin NDL 144 CPX类GPU。


Vera Rubin NDL 144的一个变体专为需要长上下文窗口的应用而设计,CPX型号提供8 exaflops的AI性能,30 PF NVFP4用于上下文计算,与英伟达GB300 NVL72系统相比,指数运算能力提升3倍。它还包括128GB的GDDR7内存,4个NVENC(编码器)和4个NVDEC(解码器)用于生成视频,以及100TB的快速内存。


“它解锁了新的高端应用场景,如智能编码和视频生成……”英伟达AI和数据中心GPU产品营销总监Shar Narasimhan在预发布会上表示。


数据中心千兆规模参考设计可为AI工厂建设提供指导

Vera Rubin NDL 144 CPX可以被视为更大AI工厂的一部分。9月9日,英伟达还宣布计划为大型数据中心提供千兆规模的参考设计。


“这要求我们与广泛的基础设施合作伙伴进行创新和共同设计,”Narasimhan说。


Narasimhan补充说,英伟达正进入一个从计算角度设计数据中心的新纪元,与基础设施公司合作。公司将提供涵盖架构、工程和施工;设计、仿真和运营;发电和存储;以及机械、电气和管道的参考设计。


Blackwell GPU在MLPerf基准测试中创下纪录


MLPerf基准测试是由MLCommons联盟组织的测试,一些公司用来衡量硬件和软件在生成AI工作负载上的性能。


英伟达Blackwell GPU通过一种名为分离服务的新技术,在Llama 3.1 405B Interactive上创下了性能新纪录,超越了Blackwell基线。这种方法允许在相同硬件上提高性能。


“你可以在同一平台上提供更多的性能,”Salvator在预发布会上说。“这种性能可以为已经部署解决方案的组织带来额外收入。”


与此同时,微软展示了其加速AI的实验结果,使用一种模拟光学计算机


文章来源:https://www.techrepublic.com/article/news-nvidia-vera-rubin-cpx/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消