Nvidia 发布全新 Rubin CPX GPU，助力「海量上下文」人工智能应用

AI 资讯
25 年 9 月 11 日
编辑

小强

Nvidia 近日宣布，其全新的 VeraRubin 微架构正处于研发阶段，计划于 2026 年正式推出。该架构下的 RubinCPX 变体将专注于满足那些需要处理海量上下文窗口的人工智能工作负载。Nvidia 首席执行官黄仁勋在新闻发布会上表示:「VeraRubin 平台将标志着人工智能计算的新飞跃，推出下一代 RubinGPU 和名为 CPX 的新类别处理器。」

RubinCPX 特别适用于需要处理超过一百万个 token 的应用场景，例如复杂的软件开发和高清晰度视频生成。根据 Nvidia 的计划，VeraRubinNDL144CPX 类 GPU 将于 2026 年底上市。CPX 模型是针对需要长上下文窗口的应用而特别设计的，能够提供 8exaflops 的人工智能性能、30PFNVFP4 的上下文计算能力，以及相较于 NvidiaGB300NVL72 系统提升了三倍的指数运算能力。此外，CPX 模型还配备了 128GBGDDR7 内存、4 个编码器和 4 个解码器，专为生成视频而设计，并提供 100TB 的快速内存。

Nvidia 的高管表示，VeraRubinNDL144CPX 可被视为大型人工智能工厂的一部分。为了支持大规模数据中心的构建，Nvidia 还计划推出千兆规模的参考设计。这意味着，Nvidia 将与基础设施公司密切合作，从计算的角度重新设计数据中心，以提供覆盖建筑、设计、模拟、运营等各个方面的参考设计。

在此次发布前，Nvidia 还公布了最新的 MLPerf 推理测试结果，黑威尔 GPU 在该基准测试中创下了新记录，超越了 Llama3.1405B 交互模型的基线。此项创新技术被称为「解耦服务」，能够使相同硬件在性能上得到提升，这为已经部署解决方案的企业带来了额外的收入机会。

划重点:

🔍**Nvidia 发布 RubinCPXGPU，旨在支持海量上下文 AI 应用。**

🚀**该 GPU 将于 2026 年底上市，具备强大的 AI 性能和内存配置。**

🏢**Nvidia 计划推出数据中心的千兆规模参考设计，助力 AI 工厂建设。**

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

Nvidia 发布全新 Rubin CPX GPU，助力「海量上下文」人工智能应用

80 亿参数只用 3 亿！阿里千问 3 新模型推理速度暴增 10 倍

Freepik 重磅接入 Seedream 4.0！Premium+会员无限生图

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

{{userData.name}} 已认证

相关文章：

80 亿参数只用 3 亿！阿里千问 3 新模型推理速度暴增 10 倍

Freepik 重磅接入 Seedream 4.0！Premium+会员无限生图

如何在本地部署 DeepSeek 模型？

​亚马逊计划测试人形机器人，探索包裹配送自动化

面壁智能推出 MiniCPM 4.0 端侧大模型 可实现 220 倍速度提升

美团王兴详解 AI 布局:No Code 平台免费开放，1680 个应用已上线

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

亚马逊计划测试人形机器人，探索包裹配送自动化

面壁智能推出 MiniCPM 4.0 端侧大模型可实现 220 倍速度提升