在 2025 年的国际大学生程序设计竞赛 (ICPC) 世界总决赛上,OpenAI 的系统表现出色,成功解决了比赛中所有 12 个编程问题,超越了人类选手和谷歌的 DeepMind 模型。根据 OpenAI 的说法,该系统若以人类团队身份参赛,毫无疑问会夺得
OpenAI 表示,该系统在比赛中遵循与学生相同的规则。它在标准的 PDF 格式中获取问题集,并在五个小时的时间限制内提交解决方案。所有的提交都是直接发送给官方评审,评审与人类参赛队伍的解答并行进行评估。公司强调,比赛期间没有对系统进行特别调整。
这一消息发布不久后,谷歌 DeepMind 声称其升级版的 Gemini2.5DeepThink 系统在同一比赛中达到了金牌水平,成功解决了 12 个问题中的 10 个,其中包括人类队伍未能解决的 C 问题。不过,Gemini 在另外两个问题上未能取得成功。相较之下,OpenAI 的系统以完美的 12/12 成绩超越了 DeepMind 的表现。
OpenAI 解释称,该系统是由多个通用推理模型组成的集成体,这些模型并没有特别针对 ICPC 进行训练。它使用了 GPT-5 和一个内部实验性推理模型。GPT-5 为 12 个问题中的 11 个提供了正确答案,而实验性模型负责选择最终提交的答案。最后一个也是最难的问题是由实验模型独立解决的,这个问题经过了九次提交才最终被接受。与此对比,表现
OpenAI 强调,这一胜利证明了更复杂的模型在深度推理和长时间计算能力方面的潜力。GPT-5 承担了大部分工作,突显了它作为当前公众可用的
划重点:
-🏆OpenAI 的系统在 2025 年 ICPC 总决赛中完美解决所有 12 个问题,超越人类和谷歌 DeepMind。
-🤖系统结合了 GPT-5 和一个实验性模型,展现了其在复杂推理任务中的优势。
-📈OpenAI 将此胜利视为 AI 能力提升的标志,未来将继续探索新知识的发现。