OpenAI 系统在全球顶级编程大赛中战胜人类和谷歌

AI 资讯
25 年 9 月 19 日
编辑

小强

在 2025 年的国际大学生程序设计竞赛（ICPC）世界总决赛上，OpenAI 的系统表现出色，成功解决了比赛中所有 12 个编程问题，超越了人类选手和谷歌的 DeepMind 模型。根据 OpenAI 的说法，该系统若以人类团队身份参赛，毫无疑问会夺得第一名。

图源备注: 图片由 AI 生成，图片授权服务商 Midjourney

OpenAI 表示，该系统在比赛中遵循与学生相同的规则。它在标准的 PDF 格式中获取问题集，并在五个小时的时间限制内提交解决方案。所有的提交都是直接发送给官方评审，评审与人类参赛队伍的解答并行进行评估。公司强调，比赛期间没有对系统进行特别调整。

这一消息发布不久后，谷歌 DeepMind 声称其升级版的 Gemini2.5DeepThink 系统在同一比赛中达到了金牌水平，成功解决了 12 个问题中的 10 个，其中包括人类队伍未能解决的 C 问题。不过，Gemini 在另外两个问题上未能取得成功。相较之下，OpenAI 的系统以完美的 12/12 成绩超越了 DeepMind 的表现。

OpenAI 解释称，该系统是由多个通用推理模型组成的集成体，这些模型并没有特别针对 ICPC 进行训练。它使用了 GPT-5 和一个内部实验性推理模型。GPT-5 为 12 个问题中的 11 个提供了正确答案，而实验性模型负责选择最终提交的答案。最后一个也是最难的问题是由实验模型独立解决的，这个问题经过了九次提交才最终被接受。与此对比，表现最佳的人类团队仅解决了 11 个问题。

OpenAI 强调，这一胜利证明了更复杂的模型在深度推理和长时间计算能力方面的潜力。GPT-5 承担了大部分工作，突显了它作为当前公众可用的最强大 AI 模型之一的地位。公司将这一成就视为持续进步的结果。这些模型已经在国际数学奥林匹克和国际信息学奥林匹克等重要学术比赛中获得了金级成绩。项目参与者穆斯塔法・罗哈尼贾德表示，ICPC 的表现是这一成功系列的恰当总结，并指出系统的多功能性。他还补充说，下一步将是开发能够发现新知识的系统，这被认为是一个真正的里程碑。

划重点:

-🏆OpenAI 的系统在 2025 年 ICPC 总决赛中完美解决所有 12 个问题，超越人类和谷歌 DeepMind。

-🤖系统结合了 GPT-5 和一个实验性模型，展现了其在复杂推理任务中的优势。

-📈OpenAI 将此胜利视为 AI 能力提升的标志，未来将继续探索新知识的发现。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

OpenAI 系统在全球顶级编程大赛中战胜人类和谷歌

GPT-4o 复活！OpenAI 如何应对用户对新模型的情感依赖

DeepSeek R1 登上《Nature》封面：AI 大模型首获同行评审认可

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

{{userData.name}} 已认证

相关文章：

GPT-4o 复活！OpenAI 如何应对用户对新模型的情感依赖

DeepSeek R1 登上 《Nature》 封面：AI 大模型首获同行评审认可

谷歌支付 1 亿美元和解 14 年广告收费诉讼，涉及超 91 万页证据材料

OpenAI 宣布付费 ChatGPT 用户突破 300 万，增长势头强劲

Google AI Studio 政策变动:Gemini2.5Pro 模型免费访问遭 「限流」

ElevenLabs 推出 Studio 3.0，一站搞定 AI 语音、配乐、音效等

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

DeepSeek R1 登上《Nature》封面：AI 大模型首获同行评审认可

Google AI Studio 政策变动:Gemini2.5Pro 模型免费访问遭「限流」