AI 国际象棋大赛火热开战!Grok 4 一骑绝尘,DeepSeek 与 Kimi K2 的冤屈

近日,与 Kaggle 联合举办的首届 国际象棋对战赛事备受瞩目。在这一场 「智力的较量」 中,马斯克旗下的 Grok4 展现了非凡的实力,成为首日比赛的绝对焦点。

这场比赛聚集了多款顶尖 ,参赛选手包括 的 o3 和 o4-mini、DeepSeekR1、KimiK2Instruct、Gemini2.5Pro、Gemini2.5Flash、ClaudeOpus4 和 Grok4。比赛于 8 月 5 日至 7 日每天下午 10:30(太平洋时间) 准时直播,国际象棋特级大师中村光 (HikaruNakamura) 也受邀担任解说。

首日对决中,Grok4 以超凡的战术表现和快速反应获得了最高评价,而 DeepSeekR1 虽表现强劲,但不敌 o4-mini,KimiK2 则被认为惨遭不公,网友们纷纷为其鸣冤。马斯克对此次比赛的成功表现淡定回应:「我们并没有特别训练,这只是一个副产品。」 可见,他对此次比赛的宣传价值可谓深谙其道。

虽然比赛结果引起了热议,但其真正的意义在于测试 AI 的 「涌现能力」。国际象棋以其明确的规则和高复杂度 (存在约 10^120 种可能局面) 成为了评估 AI 决策能力的理想舞台。很多网友表示,这场比赛不仅仅是输赢的较量,更是 AI 综合能力的全面展示。

经过首轮较量,Grok4 与 Gemini2.5Pro、OpenAI 的 o4-mini 和 o3 晋级半决赛。各对决中,Grok4 如猛兽般的表现让人惊叹,而 KimiK2 的频繁违规行为则让其面临被淘汰的境地,观众对此颇有微词。尽管如此,比赛仍在继续,大家期待后续的精彩对决。

为何选择国际象棋作为 AI 对战的舞台? 这主要是因为国际象棋规则清晰但战略复杂,能够有效评估 AI 的决策能力。正如网友所说,这场比赛的结果不仅是对各模型能力的检测,更是对 的一次深度探索。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

微软宣布 Windows 11 本地支持 OpenAI 开源模型 gpt-oss-20b

2025-8-8 1:21:17

AI 资讯

谷歌 AI 编程助手 Jules 正式上线,异步代码修复功能挑战传统开发工具

2025-8-8 1:21:24

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索