Qwen 发布全新 AI 模型 Qwen3-Max:不仅能写代码,还能自主思考

旗下的 Qwen 团队宣布推出其最新 模型——Qwen3-Max。这款模型以其超大规模和强大能力,标志着技术的新突破。Qwen3-Max 的发布不仅在 LMArena 文本排行榜上位列第三,超越了竞争对手 -5-Chat,还在多个基准测试中表现出色,尤其是在代码生成和能力方面。

Qwen3-Max 模型的总参数超过 1 万亿,预训练使用了 36 万亿个 tokens。得益于 Qwen3 系列的先进 MoE 模型结构设计,Qwen3-Max 在训练稳定性和高效性方面取得了显著进展。通过创新的 PAI-FlashMoE 多级流水并行策略,该模型的训练效率比之前的版本提升了 30%。在长序列训练场景中,Qwen3-Max 采用的 ChunkFlow 策略使得吞吐量提升了 3 倍,支持 1 百万长上下文的训练。

Qwen3-Max-Instruct 是这一系列模型中的重要组成部分,其在编程基准测试 SWE-BenchVerified 中取得了 69.6 分的优异成绩,证明了其在实际编程挑战中的卓越能力。此外,该模型在 Tau2-Bench 基准测试中以 74.8 分的成绩,超越了 ClaudeOpus4 和 -V3.1,显示了其在智能体工具调用能力方面的突破性表现。

值得一提的是,Qwen3-Max 的推理增强版本——Qwen3-Max-Thinking,凭借集成的代码解释器和并行计算技术,在极具挑战性的数学推理基准测试 AIME25 和 HMMT 中取得了满分的优异成绩。团队对这一版本的前景充满信心,并期待尽快将其推向市场。

Qwen 团队表示,用户现在可以通过阿里云 API 直接体验 Qwen3-Max-Instruct 模型的强大能力。相关 API 已开放,使用者只需简单的步骤即可注册和获取 API 密钥,便可调用 Qwen3-Max 进行开发。

Qwen3-Max 的发布不仅推动了 的发展,还为开发者提供了更加强大的工具,助力其在各行各业中创造更多的价值。随着这一技术的普及,Qwen 团队相信,人工智能的未来将更加光明。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

Perplexity 新助手一键搞定会议、回复与收件箱,月费 200 刀值不值?

2025-9-25 1:23:08

AI 资讯

IDC:2029 年全球 AI 投资将达到 12619 亿美元

2025-9-26 1:20:32

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索