月之暗面发布全新开源模型 Kimi-Dev-72B，打破编程基准记录

AI 资讯
25 年 6 月 18 日
编辑

小强

月之暗面（MoonshotAI）宣布推出其新开源模型 Kimi-Dev-72B，这一模型专注于软件工程任务，并在 AI 编程基准测试 SWE-benchVerified 中创下了全球最高的开源模型成绩。Kimi-Dev-72B 以仅 72 亿参数量的设计，成功超越了刚发布不久的 DeepSeek-R1，后者的参数量高达 671 亿。

在 SWE-benchVerified 测试中，Kimi-Dev-72B 获得了 60.4% 的高分，成为当前开源模型中的新标杆。该模型的优化过程包括大规模强化学习，使其能够自动修复 Docker 环境中的真实存储库。Kimi-Dev-72B 在测试中仅在所有测试用例通过后才能获得奖励，从而确保所生成解决方案的正确性和稳健性，符合现实开发的高标准。

Kimi-Dev-72B 目前已在 HuggingFace 和 GitHub 平台上开放下载，用户可获取模型权重、源代码，技术报告也即将发布。HuggingFace 链接为:huggingface.co/moonshotai/Kimi-Dev-72B，GitHub 链接为:github.com/MoonshotAI/Kimi-Dev。

在设计理念方面，Kimi-Dev-72B 结合了 BugFixer 和 TestWriter 的双重角色。BugFixer 负责修复错误，TestWriter 则编写相应的单元测试。这两个部分相互补充，确保模型在编程任务中的有效性。Kimi-Dev-72B 的工作流程简单明确，主要分为文件本地化和代码编辑两个阶段。

为了增强模型的能力，月之暗面使用了约 1500 亿个高质量数据进行中期训练，数据来自 GitHub 的真实问题和 PR 提交。通过严格的数据净化，该模型能够学习人类开发者如何解决问题并编写代码。强化学习阶段则重点提升其代码编辑能力，通过基于结果的奖励系统，逐步优化模型的表现。

在测试环节，Kimi-Dev-72B 能够协调 BugFixer 和 TestWriter 的角色，采用自我博弈机制，从而提升模型的性能和效果。每个问题最多可以生成 40 个补丁候选和测试候选，显示了自博弈机制的强大效应。

未来，月之暗面计划进一步扩展 Kimi-Dev-72B 的功能，探索与流行开发工具的深度集成，使其更无缝地融入开发者的工作流程。公司承诺将持续改进这一模型，进行严谨的红队测试，以便向社区推出更强大的版本。

HuggingFace 地址:huggingface.co/moonshotai/Kimi-Dev-72B

GitHub 地址:github.com/MoonshotAI/Kimi-Dev

划重点:

🔍Kimi-Dev-72B 是新发布的开源模型，创下了编程基准测试的全球最高分。

🚀该模型结合了 BugFixer 和 TestWriter 的功能，以提升编程效率和代码质量。

💡月之暗面将继续优化 Kimi-Dev-72B，未来计划与流行开发工具进行更深入的整合。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

月之暗面发布全新开源模型 Kimi-Dev-72B，打破编程基准记录

前谷歌 CEO 投资的初创公司发布 240 亿参数化学推理模型，准确率超越多种领先模型

腾讯 LeVo 来袭！媲美 Suno 4.5 的 AI 唱歌模型，支持零样本音色克隆

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国广电 DNS 服务器地址大全

{{userData.name}} 已认证

相关文章：

​前谷歌 CEO 投资的初创公司发布 240 亿参数化学推理模型，准确率超越多种领先模型

腾讯 LeVo 来袭！媲美 Suno 4.5 的 AI 唱歌模型，支持零样本音色克隆

科大讯飞发布全球首款本地大模型办公本 X5 售价 4999 元起

Kimi K2 技术报告重磅发布！这款模型如何在全球开源赛场上独占鳌头？

讯飞星火 X1 升级版发布：翻译、推理、文本生成能力大幅跃升！

阿里国际 AI 服务成跨境电商新宠，生态伙伴调用量激增 23 倍

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国广电 DNS 服务器地址大全

前谷歌 CEO 投资的初创公司发布 240 亿参数化学推理模型，准确率超越多种领先模型