蚂蚁百灵推出开源高效思考模型,推理成本大幅降低

蚂蚁百灵团队近日宣布,正式两款全新的高效思考模型:Ring-flash-linear-2.0 和 Ring-mini-linear-2.0。这些模型专为提高深度推理效率而设计,同时发布的还有两款自主研发的高性能融合算子,分别是 FP8 融合算子和线性 Attention 推理融合算子,旨在实现 「大参数、低激活」 的高效推理与超长上下文支持。

根据团队介绍,得益于架构的优化与高性能算子的协同工作,这两款新模型在深度推理场景下的成本仅为同等规模的密集模型的十分之一,而与之前的 Ring 系列相比,推理成本也降低了超过 50%。这意味着,用户在进行复杂推理时,可以大幅降低计算资源的消耗,提升工作效率。

新模型的优势不仅在于成本的降低,另外一个重要因素是其训练与推理引擎算子的高度对齐。这种对齐允许模型在强化学习阶段进行长周期、稳定且高效的优化,使得这些模型在多个高难度推理榜单中持续保持最佳表现 (SOTA)。这无疑为使用者在需要进行复杂推理任务时提供了更强大的工具。

作为,Ring-flash-linear-2.0 和 Ring-mini-linear-2.0 已在多个平台上发布,包括 和 ModelScope。对此,开发者们可以在这些平台上获取更多信息并进行尝试。

随着这次开源,蚂蚁百灵大模型团队不仅展示了其在 领域的技术实力,也为广大开发者提供了更为高效的工具,助力他们在未来的 AI 开发与研究中取得更大的突破。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

LLM 编码幻觉终结者!Exa Code 发布,亿级代码索引让 AI 代理零失误

2025-9-27 1:23:18

AI 资讯

京东重磅发布开源安全框架 JoySafety,助力 AI 应用守护安全

2025-9-29 1:20:42

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索