​Nvidia 发布全新 Rubin CPX GPU,助力 「海量上下文」 人工智能应用

Nvidia 近日宣布,其全新的 VeraRubin 微架构正处于研发阶段,计划于 2026 年正式推出。该架构下的 RubinCPX 变体将专注于满足那些需要处理海量上下文窗口的工作负载。Nvidia 首席执行官黄仁勋在新闻发布会上表示:「VeraRubin 平台将标志着人工智能计算的新飞跃,推出下一代 RubinGPU 和名为 CPX 的新类别处理器。」

RubinCPX 特别适用于需要处理超过一百万个 token 的应用场景,例如复杂的软件开发和高清晰度视频生成。根据 Nvidia 的计划,VeraRubinNDL144CPX 类 GPU 将于 2026 年底上市。CPX 模型是针对需要长上下文窗口的应用而特别设计的,能够提供 8exaflops 的人工智能性能、30PFNVFP4 的上下文计算能力,以及相较于 NvidiaGB300NVL72 系统提升了三倍的指数运算能力。此外,CPX 模型还配备了 128GBGDDR7 内存、4 个编码器和 4 个解码器,专为生成视频而设计,并提供 100TB 的快速内存。

Nvidia 的高管表示,VeraRubinNDL144CPX 可被视为大型人工智能工厂的一部分。为了支持大规模的构建,Nvidia 还计划推出千兆规模的参考设计。这意味着,Nvidia 将与基础设施公司密切合作,从计算的角度重新设计数据中心,以提供覆盖建筑、设计、模拟、运营等各个方面的参考设计。

在此次发布前,Nvidia 还公布了最新的 MLPerf 推理测试结果,黑威尔 GPU 在该基准测试中创下了新记录,超越了 Llama3.1405B 交互模型的基线。此项创新技术被称为 「解耦服务」,能够使相同硬件在性能上得到提升,这为已经部署解决方案的企业带来了额外的收入机会。

划重点:

🔍**Nvidia 发布 RubinCPXGPU,旨在支持海量上下文 应用。**

🚀**该 GPU 将于 2026 年底上市,具备强大的 AI 性能和内存配置。**

🏢**Nvidia 计划推出数据中心的千兆规模参考设计,助力 AI 工厂建设。**

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

80 亿参数只用 3 亿!阿里千问 3 新模型推理速度暴增 10 倍

2025-9-11 1:22:05

AI 资讯

Freepik 重磅接入 Seedream 4.0!Premium+会员无限生图

2025-9-11 1:22:22

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索