来自中国初创公司 MoonshotAI 的开源大语言模型 KimiK2 在 OpenRouter 平台的 token 消耗量 (市场份额指标) 上迅速攀升,超越 xAI 的 Grok4 和 OpenAI 的 GPT-4.1,成为近期 AI 领域的焦点。这一现象被业内称为 「又一个 DeepSeek 时刻」,标志着开源模型在全球 AI 竞争中的强势崛起。
KimiK2 的爆发式增长
KimiK2 是一款基于混合专家 (MoE) 架构的大语言模型,拥有 1 万亿总参数和 320 亿活跃参数,专为代理智能 (agenticintelligence) 优化,支持
这种快速增长得益于 KimiK2 的开源策略和低成本定价。OpenRouter 平台上,KimiK2 的输入 token 价格为每百万 0.15 美元 (缓存命中) 和 0.60 美元 (缓存未命中),输出 token 为每百万 2.50 美元,远低于 Claude4Sonnet 和 GPT-4.1 的推理成本。这种价格优势吸引了大量开发者尝试和集成 KimiK2,推动其市场份额迅速扩大。
性能与特性:KimiK2 的竞争优势
KimiK2 在多个基准测试中表现出色,尤其在编码、推理和工具使用领域。以下是其核心亮点:
- 编码能力: 在 SWE-benchVerified 测试中,KimiK2 取得 65.8% 的通过率,接近 Claude4Sonnet(领先),远超 GPT-4.1 的 54.6%。在 LiveCodeBench 和 OJBench 等实时编码和算法测试中,KimiK2 分别取得 53.7% 和 27.1% 的成绩,展现了其在交互式编程和复杂算法任务中的实力。
- 代理智能:KimiK2 专为代理任务设计,支持多步骤任务处理、工具调用和复杂推理。例如,它能从单一提示生成完整的引力波可视化工具,或通过 16 个 Python 操作完成薪资数据的统计分析和交互式网页生成。
- 开源与可访问性:KimiK2 的模型权重在 HuggingFace 上免费提供,开发者可通过 OpenRouter 的免费 API 端点或官方网页界面 (kimi.com) 体验,无需订阅或复杂设置。
社交媒体反馈显示,开发者对其 「无需长思考」 的快速响应和高质量输出印象深刻,尤其在 EQ(情感智能) 和创意写作基准测试中,KimiK2 表现堪称 「
OpenRouter 市场格局:KimiK2vs.xAI
OpenRouter 作为一个统一 API 平台,允许开发者访问包括 KimiK2、Grok4 和 GPT-4.1 在内的 400 多个模型。KimiK2 的 token 消耗量在发布后迅速超越 Grok4,部分原因是其开源性质和低成本吸引了大量开发者试用。相比之下,xAI 的 Grok4 虽然在发布时凭借高性能基准测试引发关注,但其高昂的推理成本 (SuperGrok 订阅高达每月 300 美元) 以及品牌风险 (如较宽松的内容审核策略) 可能限制了其在 OpenRouter 上的普及。
社交媒体上,有开发者表示:「KimiK2 就像是 Claude3.5Sonnet 发布时的震撼体验,开源和低价让它成为生产环境的
行业影响: 开源模型的崛起
KimiK2 的成功不仅是对 xAI 和 OpenAI 的挑战,也反映了开源模型在全球 AI 市场的崛起趋势。MoonshotAI 通过开源 KimiK2 并提供低成本 API,采取了类似 DeepSeek 的策略: 通过社区贡献降低开发成本,同时吸引潜在企业客户。这种 「双轨」 模式 (开源+商业 API) 让 Moonshot 在市场竞争中占据主动。
相比之下,xAI 的 Grok4 虽然在基准测试中表现优异,但其商业模式更依赖高价订阅和企业级 SOC2 合规认证,目标市场偏向需要宽松内容审核的特定场景。KimiK2 的低门槛和广泛适用性使其更易被开发者社区采纳,尤其是在中小型企业和独立开发者中。
从 AIbase 的视角来看,KimiK2 超越 xAI 在 OpenRouter 的市场份额,标志着开源模型在性能、成本和社区支持上的综合优势。其代理智能和编码能力使其在开发工具领域具有巨大潜力,尤其适合自动化工作流和复杂项目。然而,KimiK2 也面临挑战,例如部分用户报告的生成内容偶尔出现 「幻觉」 问题,以及其商业成功条款 (月活跃用户超 1 亿或收入超 2000 万美元需显示 「KimiK2」 标识) 可能对某些企业造成限制。
随着 OpenRouter 上 KimiK2 的使用量持续增长,xAI 可能需要通过优化 Grok 的定价或增强其差异化功能来应对竞争。AIbase 将持续关注 KimiK2 的市场表现及其对全球 AI 生态的影响。









