蚂蚁开源轻量级 MoE 推理模型 Ring-lite

AI 资讯
25 年 6 月 22 日
编辑

小强

近日，蚂蚁技术团队宣布正式开源其轻量级推理模型 Ring-lite。该模型在多项推理榜单上取得了显著成绩，实现了轻量级推理模型的 SOTA 效果，再次验证了 MoE 架构的推理潜力。

Ring-lite 以蚂蚁技术此前发布的 Ling-lite-1.5 为起点，该模型采用 MoE 架构，总参数为 16.8B，但激活参数仅 2.75B。凭借独创的 C3PO 强化学习训练方法，Ring-lite 在 AIME24/25、LiveCodeBench、CodeForce、GPQA-diamond 等多项推理榜单上表现优异，比肩 3 倍激活参数大小的 10B 以下 Dense 模型。

在技术实现上，Ring-lite 团队进行了多项创新。首创的 C3PO 强化学习训练方法有效解决了 RL 训练中回复长度波动导致的优化难题，显著改善了训练不稳定和吞吐波动问题。同时，团队还探讨了 Long-CoTSFT 与 RL 的黄金训练比重，从 tokenefficiency 角度提出了基于 entropyloss 来平衡训练效果和样本效率的方案，进一步提升了模型性能。

此外，Ring-lite 还直面了多领域数据联合训练的难题，系统验证了混合训练与分阶段训练的优劣边界，在数学、代码、科学三重领域实现了协同增益。在多项复杂推理任务中，Ring-lite 均展现出了出色的性能，尤其在数学推理和编程竞赛方面，得分领先于对比模型。

为了验证 Ring-lite 的实际应用效果，团队还进行了高考数学和物理题的测试。结果显示，Ring-lite 在数学全国一卷上可以获得 130 分左右的成绩，表现优异。

蚂蚁技术团队表示，Ring-lite 的开源不仅包含了模型权重和训练代码，还将逐步公开所有训练数据集、超参配置乃至实验记录。这可能是轻量级 MoE 推理模型首次实现全链路透明化，为相关领域的研究人员提供了宝贵的参考资源。

GitHub:

https://github.com/inclusionAI/Ring

HuggingFace:

https://huggingface.co/inclusionAI/Ring-lite

ModelScope:

https://modelscope.cn/models/inclusionAI/Ring-lite

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

蚂蚁开源轻量级 MoE 推理模型 Ring-lite

腾讯云推出全链路 AI 驱动应用开发平台「AI Builder」

月之暗面 Kimi 推出 Kimi-Researcher 深度研究 Agent 并开启内测

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

{{userData.name}} 已认证

相关文章：

腾讯云推出全链路 AI 驱动应用开发平台 「AI Builder」

月之暗面 Kimi 推出 Kimi-Researcher 深度研究 Agent 并开启内测

字节跳动发布图像编辑模型 SeedEdit 3.0 细节保持能力进一步提升

蚂蚁数科加速推进 AI 战略，设立 「AI+产业创新」 实验室

阿里开源 MaskSearch！AI 学会主动搜索+多步推理，复杂问题精准破解

博世联手阿里云，AI 智能座舱技术迈入新纪元！

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

腾讯云推出全链路 AI 驱动应用开发平台「AI Builder」

蚂蚁数科加速推进 AI 战略，设立「AI+产业创新」实验室