月之暗面推 Kimi Linear 模型：处理长上下文速度提高了 2.9 倍

AI 资讯
25 年 11 月 5 日
编辑

小强

在人工智能生成内容（AIGC）领域，月之暗面团队推出的 KimiLinear 模型取得了显著的技术进展。这一创新模型在处理长上下文时的速度提高了 2.9 倍，解码速度提升了 6 倍，突破了传统全注意力机制的性能瓶颈。KimiLinear 采用了一种混合线性注意力架构，特别是在上下文处理和强化学习等多个场景中，表现超过了常用的 Softmax 注意力机制。

传统的 Transformer 模型使用 Softmax 注意力机制，计算复杂度高达 O（n²），这使得处理长文本时计算量和内存消耗呈指数级增长，严重影响模型的实际应用。而线性注意力的提出将这一复杂度降低至 O(n)，使得处理效率有了大幅提升。然而，早期的线性注意力在性能上并不理想，尤其是在长序列的记忆管理方面存在局限性。

KimiLinear 模型的核心创新是 KimiDeltaAttention（KDA），它通过引入细粒度的门控机制，改善了模型的记忆管理能力。KDA 能够根据输入动态调整记忆状态，有效地控制信息的遗忘与保留，从而更好地处理长时间交互中的信息。

此外，KimiLinear 还采用了 Moonlight 架构，将 KDA 与全注意力层进行混合，按照 3:1 的比例配置，以在效率与模型能力之间取得平衡。这种设计使得 KimiLinear 在长上下文处理上展现出优异的性能，同时有效降低了计算成本。

经过一系列实验验证，KimiLinear 在多个任务上表现出色，尤其是在需要长上下文记忆的回文和多查询关联回忆任务中，其准确度远超前代模型，展现出细粒度控制的优势。

划重点:

🌟KimiLinear 模型在长上下文处理上速度提高 2.9 倍，解码速度提升 6 倍。

🔍采用 KimiDeltaAttention（KDA）创新机制，优化记忆管理与信息遗忘。

📈通过 3:1 混合架构设计，平衡计算效率与模型性能，实验结果显示出卓越能力。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

月之暗面推 Kimi Linear 模型：处理长上下文速度提高了 2.9 倍

Lambda 与微软达成数十亿美元 AI 基础设施合作协议

钉钉 AI 表格一举突破 1000 万容量，双 11 准备迎接数据洪流

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

{{userData.name}} 已认证

相关文章：

Lambda 与微软达成数十亿美元 AI 基础设施合作协议

钉钉 AI 表格一举突破 1000 万容量，双 11 准备迎接数据洪流

Anthropic 推出 Claude for Excel，助力金融服务更高效分析

​xAI 升级 Grok Imagine iOS 版: 新增视频生成与提示重混

Bevel 获得 1000 万美元 A 轮融资，致力于 AI 健康助手创新

字节跳动 AI 编程工具 Trae 下架 Claude 模型，Pro 会员获补偿

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

xAI 升级 Grok Imagine iOS 版: 新增视频生成与提示重混