​Nvidia 推出小型开放模型 Nemotron-Nano-9B-v2:可切换的推理功能

近日,Nvidia 正式发布了一款新型小型语言模型 Nemotron-Nano-9B-v2,标志着小型模型的热潮再度升温。

该模型具备 9 亿个参数,虽然相较于其他数百万参数的小型模型而言规模更大,但较原始的 12 亿参数已大幅缩减,旨在能够在一台 NvidiaA10GPU 上高效运行。Nvidia 的 后训练总监 OleksiiKuchiaev 在社交平台上表示,减少参数的目的在于更好地适应部署需求,并且该模型采用了混合架构,可以在处理较大批量时比类似尺寸的变换模型快 6 倍。

Nemotron-Nano-9B-v2 支持多种语言,包括英语、德语、西班牙语、法语、意大利语、日语等,适用于指令跟随和代码生成等任务。该模型的设计还包括一项创新功能——用户可以通过简单的控制令牌来切换 的 「推理」 过程,即在给出答案之前进行自我检查。系统默认会生成推理痕迹,但用户可通过如/think 或/no_think 等命令来控制此过程。此外,模型还引入了 「思考预算」 管理机制,允许开发者设定推理过程中所使用的标记数量,以在准确性与响应速度之间取得平衡。

根据测试结果,Nemotron-Nano-9B-v2 在多个基准测试中表现优异。在 「推理开启」 模式下,该模型在 AIME25、MATH500、GPQA 和 LiveCodeBench 等测试中都取得了令人满意的成绩。此外,它在指令跟随和长上下文基准测试中同样表现出色,显示出相较于其他开放小型模型更高的准确性。

Nvidia 为这一模型设定了开放许可协议,允许开发者在商业上自由使用与分发,并明确不对生成的输出声索所有权。这意味着企业可以在无需额外协商的情况下立即将该模型投入生产,而不必担心使用门槛或费用。

Nvidia 的 Nemotron-Nano-9B-v2 模型为需要在小规模上实现推理能力与高效部署的开发者提供了新工具。其运行预算控制和推理切换功能为系统构建者提供了灵活性,旨在提高准确性和响应速度,进一步推动小型语言模型的发展。

划重点:

🌟Nemotron-Nano-9B-v2 是 Nvidia 新推出的小型语言模型,具有 9 亿个参数,专为高效部署设计。

🧠模型支持多种语言,具备切换推理功能,可帮助用户根据需求调整响应方式。

📈开放许可协议使开发者能够自由使用与分发模型,无需担心额外费用或许可协议。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

​昆仑万维响应 《人工智能生成合成内容标识办法》,启动 AI 内容双重标识体系

2025-9-2 1:20:59

AI 资讯

美团发布 LongCat-Flash-Chat:560B 参数模型再创新高,智能体表现惊艳!

2025-9-2 1:21:15

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索