阿里巴巴通义 Qwen3 上线非思考模型，核心能力与 GPT-4o 相当

AI 资讯
25 年 7 月 31 日
编辑

小强

7 月 30 日，阿里巴巴的通义千问团队正式推出了 Qwen3 系列模型的最新成员——Qwen3-30B-A3B-Instruct-2507。这一全新的开源模型采用非思考模式（non-thinkingmode），仅需激活 3B 参数，就能在多个核心能力上与 Gemini2.5-Flash 和 GPT-4o 等知名闭源模型相媲美。此外，Qwen3-30B-A3B-Instruct-2507 在多语言支持、用户偏好对齐和长文本处理等方面也实现了显著突破。

该模型现已在魔搭社区（ModelScope）和 HuggingFace 平台上全面开源。作为 Qwen3-30B-A3B 系列中的新版本，Qwen3-30B-A3B-Instruct-2507 不仅继承了通义千问团队在架构创新方面的优势，还大幅降低了计算成本，力求与千亿级闭源模型的性能相对接。

根据官方数据，Qwen3-30B-A3B-Instruct-2507 在数学推理（AIME25 测试得分 61.3）、代码生成 (LiveCodeBenchv6 得分 43.2)、研究生级物理与天文学问题 (GPQA 测试得分 70.4) 及人类偏好对齐 (Arena-Hardv2 得分 69) 等多个关键基准测试中表现出色，甚至在部分指标上超越了 GPT-4o。这一成就标志着该模型在逻辑推理、数学、科学和编程等多个领域的全面能力得到了显著提升。

更值得一提的是，Qwen3-30B-A3B-Instruct-2507 在多语言的长尾知识覆盖上也表现优异，并在主观和开放任务中更好地对齐用户的偏好，生成更高质量的文本，为用户提供更有价值的答案。同时，其长文本理解能力也提升至 256K，意味着用户能够处理更加复杂的文本内容。

自 2023 年发布以来，通义千问系列模型已开源超过 200 个，全球下载量突破 3 亿次，衍生模型数量超过 10 万个，展现了强大的市场影响力和技术潜力。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

阿里巴巴通义 Qwen3 上线非思考模型，核心能力与 GPT-4o 相当

理想 i8 发布，首搭智能司机大模型，售价 32.18 万元起！

苹果 AI 团队再遭重创，四名专家被 Meta 挖走

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国广电 DNS 服务器地址大全

{{userData.name}} 已认证

相关文章：

理想 i8 发布，首搭智能司机大模型，售价 32.18 万元起！

苹果 AI 团队再遭重创，四名专家被 Meta 挖走

李开复预测：中国大模型未来或只剩三大巨头

英伟达发布 Llama Nemotron Nano VL AI：登顶 OCRBench，高精度文档处理解决方案

英国电影协会警告：AI 技术对影视行业构成直接威胁

豆包 App「一句话 P 图」 功能全新升级 基于 SeedEdit 3.0 实现全面优化

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国广电 DNS 服务器地址大全

豆包 App「一句话 P 图」功能全新升级基于 SeedEdit 3.0 实现全面优化