知名 AI 模型评测平台 LmArena 近日发布重大更新,上线了两款全新的 DeepSeek 模型,分别以"非常秘密且有趣的模型"和"高度机密且快乐的机器人"这样极具趣味性的名称命名。这一神秘发布立即在 AI 社区引发了广泛关注和热烈讨论。
虽然目前关于这两款模型的具体技术细节尚未完全公开,但其独特的命名风格和 DeepSeek 一贯的技术创新实力已足以点燃整个业界的期待情绪。这种幽默而神秘的命名方式不仅展现了 DeepSeek 的独特企业文化,也暗示着这两款模型可能在功能特性或应用场景上具有突破性创新。
DeepSeek 作为中国领先的 AI 研究公司,自 2023 年成立以来,凭借其开源模型策略和高效训练技术在全球 AI 领域迅速崭露头角。该公司的旗舰模型 DeepSeek-R1 和 V3 在数学、编程和通用推理等多个基准测试中表现出色,性能甚至可以媲美 OpenAI 的 o1 和谷歌的 Gemini2.5Pro 等
特别值得关注的是,DeepSeek-R1-0528 在 AIME2025 数学测试中的准确率从 70% 大幅提升至 87.5%,充分展现了其在复杂推理任务上的显著进步。此次发布的两款新模型延续了 DeepSeek 的创新传统,有望在特定应用领域进一步巩固其市场竞争力。
LmArena 作为开放透明的 AI 模型评测平台,以其可靠性和公正性受到业界广泛认可。该平台通过用户真实交互和实际任务测试,为开发者选择合适模型提供了重要参考依据。此前,DeepSeek 的 V3-0324 模型已在 LmArena 的数学测试中表现优异,超越了 Qwen 和 Gemini2.5 等强劲竞争对手。
虽然"非常秘密且有趣的模型"和"高度机密且快乐的机器人"的具体功能规格尚未公布,但其富有创意的命名已经引发了社区的广泛猜测。有分析认为,"有趣的模型"可能针对创意写作或娱乐应用场景进行了专门优化,而"快乐的机器人"则可能专注于提供更加自然、友好的对话交互体验。
DeepSeek 一直以开源战略为核心发展理念,其模型如 R1 和 V3 均采用 MIT 许可证,允许开发者自由修改和商业化应用。这种开放策略使得 DeepSeek 在开源 AI 领域建立了强有力的领先地位。
更令人印象深刻的是 DeepSeek 的成本控制能力。据悉,其 V3 模型的训练成本仅约 600 万美元,远低于 GPT-4 的 1 亿美元训练成本,这使得 DeepSeek 成为性价比
不过,近期有报道称 DeepSeek 因芯片供应限制推迟了 R2 模型的发布计划,这可能对其后续技术发展带来一定程度的挑战。在这种背景下,新模型的推出是否能够延续 DeepSeek 的成功轨迹,仍需要通过实际测试和应用验证来判断。
随着这两款神秘模型在 LmArena 平台的正式亮相,DeepSeek 无疑再次点燃了整个 AI 社区的创新热情。虽然具体的性能指标和应用场景细节仍待官方进一步披露,但其背后蕴藏的技术创新潜力已经让业界充满期待。
这次发布也进一步强化了开源 AI 模型在全球人工智能生态中的重要地位,展示了中国 AI 企业在技术创新和产品开发方面的强劲实力。











