蚂蚁百灵团队全新开源高性能思考模型 Ring-flash-2.0

AI 资讯
25 年 9 月 30 日
编辑

小强

蚂蚁百灵大模型团队近日宣布，正式开源其最新的高性能思考模型——Ring-flash-2.0。这款模型是在 Ling-flash-2.0-base 基础上经过深度优化而成，标志着人工智能领域的一次重大进步。Ring-flash-2.0 的总参数达到 100 亿，但在每次推理时，仅激活其中 6.1 亿，这种高效的激活机制为模型提供了强大的计算能力，同时也节省了大量资源。

从团队的介绍来看，Ring-flash-2.0 在多个高难度基准测试中表现出色，包括数学竞赛、代码生成以及逻辑推理等。其性能不仅超越了同类的 40 亿参数模型，甚至能够与更大规模的开源稀疏模型（MoE）以及一些闭源的高性能思考模型 API 相媲美，显示出其卓越的竞争力。

为了全面提升 Ring-flash-2.0 的模型能力，蚂蚁百灵团队设计了一套创新的两阶段强化学习（RL）训练流程。首先，通过轻量化的 Long-CoT(长序列链式思考)SFT(有监督微调)，使 Ling-flash-2.0-base 模型能够掌握多种思考方式。接着，采用可验证奖励的 RLVR(强化学习可验证奖励) 训练，持续激发模型的推理潜能。最后，加入了强化学习人类反馈 (RLHF) 阶段，以增强模型的通用能力。

值得一提的是，Ring-flash-2.0 的模型权重、强化学习训练方案和数据配方都将完全开源，为广大开发者和研究者提供了宝贵的资源。感兴趣的用户可以在 HuggingFace 和 ModelScope 上获取相关资料，开始探索这款强大的模型。

随着 AI 技术的不断发展，Ring-flash-2.0 无疑为未来的智能应用开辟了新的可能，期待它在各个领域的广泛应用和更进一步的突破!

模型地址:

https://huggingface.co/inclusionAI/Ring-flash-2.0

https://modelscope.cn/models/inclusionAI/Ring-flash-2.0

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

蚂蚁百灵团队全新开源高性能思考模型 Ring-flash-2.0

京东重磅推出国产芯片驱动的 xLLM 推理引擎

YouTube 音乐推出 AI 主播，打破音乐聆听的沉默

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国广电 DNS 服务器地址大全

{{userData.name}} 已认证

相关文章：

京东重磅推出国产芯片驱动的 xLLM 推理引擎

YouTube 音乐推出 AI 主播，打破音乐聆听的沉默

港大携手快手可灵突破长视频一致性瓶颈，"记忆检索"技术震撼发布

​在代理 AI 和物理 AI 推动下，全球芯片市场预计将突破 1 万亿美元大关

NotebookLM 视频概览新增支持 80 多种语言，支持中文

​清华与东北大学联合推出 UltraRAG 2.0：50 行代码实现高性能检索增强生成系统

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国广电 DNS 服务器地址大全

在代理 AI 和物理 AI 推动下，全球芯片市场预计将突破 1 万亿美元大关

清华与东北大学联合推出 UltraRAG 2.0：50 行代码实现高性能检索增强生成系统