蚂蚁百灵团队全新开源高性能思考模型 Ring-flash-2.0

蚂蚁百灵团队近日宣布,正式最新的高性能思考模型——Ring-flash-2.0。这款模型是在 Ling-flash-2.0-base 基础上经过深度优化而成,标志着领域的一次重大进步。Ring-flash-2.0 的总参数达到 100 亿,但在每次推理时,仅激活其中 6.1 亿,这种高效的激活机制为模型提供了强大的计算能力,同时也节省了大量资源。

从团队的介绍来看,Ring-flash-2.0 在多个高难度基准测试中表现出色,包括数学竞赛、代码生成以及逻辑推理等。其性能不仅超越了同类的 40 亿参数模型,甚至能够与更大规模的开源稀疏模型 (MoE) 以及一些闭源的高性能思考模型 API 相媲美,显示出其卓越的竞争力。

为了全面提升 Ring-flash-2.0 的模型能力,蚂蚁百灵团队设计了一套创新的两阶段强化学习 (RL) 训练流程。首先,通过轻量化的 Long-CoT(长序列链式思考)SFT(有监督微调),使 Ling-flash-2.0-base 模型能够掌握多种思考方式。接着,采用可验证奖励的 RLVR(强化学习可验证奖励) 训练,持续激发模型的推理潜能。最后,加入了强化学习人类反馈 (RLHF) 阶段,以增强模型的通用能力。

值得一提的是,Ring-flash-2.0 的模型权重、强化学习训练方案和数据配方都将完全开源,为广大开发者和研究者提供了宝贵的资源。感兴趣的用户可以在 和 ModelScope 上获取相关资料,开始探索这款强大的模型。

随着 的不断发展,Ring-flash-2.0 无疑为未来的智能应用开辟了新的可能,期待它在各个领域的广泛应用和更进一步的突破!

模型地址:

https://huggingface.co/inclusionAI/Ring-flash-2.0

https://modelscope.cn/models/inclusionAI/Ring-flash-2.0

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

京东重磅推出国产芯片驱动的 xLLM 推理引擎

2025-9-30 1:20:57

AI 资讯

YouTube 音乐推出 AI 主播,打破音乐聆听的沉默

2025-9-30 1:21:15

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索