月之暗面推出新型混合线性注意力架构「Kimi Linear」

AI 资讯
25 年 11 月 1 日
编辑

小强

近日，月之暗面发布了一种全新的混合线性注意力架构，名为「KimiLinear」。这一架构据称在处理短距离、长距离信息以及强化学习（RL）等多种场景中，性能优于传统的全注意力方法。其核心技术 KimiDeltaAttention(KDA) 是对 GatedDeltaNet 的一次优化，特别引入了一种更高效的门控机制，以更好地管理有限状态 RNN 的记忆使用。

KimiLinear 的设计由三份 KimiDeltaAttention 和一份全局 MLA 组成。这种结构通过细粒度的门控来压缩有限状态 RNN 的记忆，使得模型在处理信息时更加高效。官方指出，在处理 1Mtoken 的数据场景中，KimiLinear 的 KVcache 占用降低了 75%，而解码吞吐量最高可提升 6 倍，TPOT 相较于传统 MLA 加速了 6.3 倍。

这种新的架构为各种 AI 应用场景提供了更强的支持，无论是在信息密集型的自然语言处理任务还是在动态环境中的强化学习，KimiLinear 都有着显著的优势。随着 AI 技术的不断发展，这种高效的注意力机制可能会为未来的智能应用带来新的突破。

更多技术细节可以在 KimiLinear 的技术报告中找到，https://github.com/MoonshotAI/Kimi-Linear/blob/master/tech_report.pdf。

划重点:

🌟KimiLinear 是一种新型的混合线性注意力架构，优化了信息处理性能。

🚀该架构在 1Mtoken 场景下，KVcache 占用减少 75%，解码吞吐量提升 6 倍。

🔍KimiDeltaAttention 是其核心技术，通过细粒度门控优化了 RNN 的记忆管理。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

月之暗面推出新型混合线性注意力架构「Kimi Linear」

OpenAI CEO 回应马斯克质疑: 我只想在宇宙中留下印记

新一代 AI 视频生成模型 LTX-2 发布: 完整叙事高清视频一键生成

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

{{userData.name}} 已认证

相关文章：

OpenAI CEO 回应马斯克质疑: 我只想在宇宙中留下印记

新一代 AI 视频生成模型 LTX-2 发布: 完整叙事高清视频一键生成

Lovable7 个月年收入 8000 万美元 团队半数竟是 AI 原生员工

阿里开源 WebSailor，具备强大的推理和检索能力

墨刀 AI 重磅上线：输入想法 30 秒生成高保真、可编辑原型

PixVerse「拍我 AI」 上线多关键帧生成功能

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

Lovable7 个月年收入 8000 万美元团队半数竟是 AI 原生员工

PixVerse「拍我 AI」上线多关键帧生成功能