2025 年高考刚落下帷幕,一场关于 「AI 能否解数学高考题」 的实战测试同步上演。在专业媒体的两轮测评中,夸克分别以 145 分和 146 分位列第一,超越豆包,成为国产 AI 数学能力的新标杆。
在公开测评中,参赛模型包括夸克、豆包、元宝以及 ChatGPT,统一使用 2025 年全国一卷数学试题,全部关闭联网搜索,仅开启深度思考模式。
在知名媒体蓝鲸财经的评测中,夸克以 145 分成功登顶。其中,在选择题、填空题方面,夸克的正确率高达 93%,位居第一。在 8 道单项选择题中,所有 AI 产品都没有答对第六题,通过思维链发现,答错原因是为 AI 在识别图中的向量坐标和箭头方向时出现偏差。
而在 「四木相对论」 的评测中,夸克更是以 146 分,再次登顶。在答题速度上,夸克位列第一,豆包位列第二。以做解答题为例,夸克能在 4 分钟内完成一道题,其他产品的平均时间在 6 分钟左右。
支撑夸克解题能力的是 「夸克学习灵知大模型」。该模型以通义千问为基础,依托百亿级学习资料库和后训练能力,尤其擅长解决理科类复杂问题,能为用户带来启发式学习的全新体验。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。