​月之暗面推出新型混合线性注意力架构 「Kimi Linear」

近日,月之暗面发布了一种全新的混合线性注意力架构,名为 「KimiLinear」。这一架构据称在处理短距离、长距离信息以及强化学习 (RL) 等多种场景中,性能优于传统的全注意力方法。其核心技术 KimiDeltaAttention(KDA) 是对 GatedDeltaNet 的一次优化,特别引入了一种更高效的门控机制,以更好地管理有限状态 RNN 的记忆使用。

KimiLinear 的设计由三份 KimiDeltaAttention 和一份全局 MLA 组成。这种结构通过细粒度的门控来压缩有限状态 RNN 的记忆,使得模型在处理信息时更加高效。官方指出,在处理 1Mtoken 的数据场景中,KimiLinear 的 KVcache 占用降低了 75%,而解码吞吐量最高可提升 6 倍,TPOT 相较于传统 MLA 加速了 6.3 倍。

这种新的架构为各种 场景提供了更强的支持,无论是在信息密集型的任务还是在动态环境中的强化学习,KimiLinear 都有着显著的优势。随着 技术的不断发展,这种高效的注意力机制可能会为未来的智能应用带来新的突破。

更多技术细节可以在 KimiLinear 的技术报告中找到,https://github.com/MoonshotAI/Kimi-Linear/blob/master/tech_report.pdf。

划重点:

🌟KimiLinear 是一种新型的混合线性注意力架构,优化了信息处理性能。

🚀该架构在 1Mtoken 场景下,KVcache 占用减少 75%,解码吞吐量提升 6 倍。

🔍KimiDeltaAttention 是其核心技术,通过细粒度门控优化了 RNN 的记忆管理。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

OpenAI CEO 回应马斯克质疑: 我只想在宇宙中留下印记

2025-11-1 1:20:41

AI 资讯

新一代 AI 视频生成模型 LTX-2 发布: 完整叙事高清视频一键生成

2025-11-1 1:21:00

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索