在刚刚结束的 2025 年国际数学奥林匹克 (IMO) 比赛中,OpenAI 和谷歌的 AI 模型表现出色,双双获得金牌。这场比赛是世界上历史最悠久、难度
去年,谷歌在 IMO 比赛中获得了银牌,使用的是一种 「正式」 系统,这意味着需要人类将问题转化为机器可读的格式。而今年,OpenAI 和谷歌都使用了 「非正式」 系统,能够直接处理问题并生成自然语言的证明性答案。他们声称,各自的 AI 模型在比赛中成功回答了六道题目中的五道,成绩超越了大多数参赛高中生以及谷歌去年使用的 AI 模型。
在接受采访时,两家公司的研究人员表示,这一金牌成绩代表了在非可验证领域中 AI 推理模型的重大突破。然而,谷歌对 OpenAI 的得分公告提出了质疑,认为 OpenAI 过早宣布了这一成绩,并未经过 IMO 的官方评估。
谷歌 DeepMind 的 CEO 和研究人员们在社交媒体上对 OpenAI 进行了批评,认为其在 IMO 宣布成绩时并没有遵循比赛的正式程序。谷歌的研究人员强调,他们在公布成绩前与 IMO 组织者进行了充分沟通,以尊重参赛学生。
OpenAI 方面则回应称,他们聘请了三位前 IMO 奖牌得主作为第三方评估人员,对模型表现进行了打分,认为自己完全符合比赛的标准。
尽管谷歌的质疑不无道理,但这场争论可能掩盖了更大的背景: 多家
随着 OpenAI 预计在未来几个月内推出 GPT-5,AI 行业的竞争将进一步升级。尽管 OpenAI 曾一度领先,但如今的局面显示出竞争的紧迫感与激烈。