Qwen3-Max 模型的总参数超过 1 万亿,预训练使用了 36 万亿个 tokens。得益于 Qwen3 系列的先进 MoE 模型结构设计,Qwen3-Max 在训练稳定性和高效性方面取得了显著进展。通过创新的 PAI-FlashMoE 多级流水并行策略,该模型的训练效率比之前的版本提升了 30%。在长序列训练场景中,Qwen3-Max 采用的 ChunkFlow 策略使得吞吐量提升了 3 倍,支持 1 百万长上下文的训练。
Qwen3-Max-Instruct 是这一系列模型中的重要组成部分,其在编程基准测试 SWE-BenchVerified 中取得了 69.6 分的优异成绩,证明了其在实际编程挑战中的卓越能力。此外,该模型在 Tau2-Bench 基准测试中以 74.8 分的成绩,超越了 ClaudeOpus4 和 DeepSeek-V3.1,显示了其在智能体工具调用能力方面的突破性表现。
值得一提的是,Qwen3-Max 的推理增强版本——Qwen3-Max-Thinking,凭借集成的代码解释器和并行计算技术,在极具挑战性的数学推理基准测试 AIME25 和 HMMT 中取得了满分的优异成绩。团队对这一版本的前景充满信心,并期待尽快将其推向市场。
Qwen 团队表示,用户现在可以通过阿里云 API 直接体验 Qwen3-Max-Instruct 模型的强大能力。相关 API 已开放,使用者只需简单的步骤即可注册和获取 API 密钥,便可调用 Qwen3-Max 进行开发。
Qwen3-Max 的发布不仅推动了 AI 技术的发展,还为开发者提供了更加强大的工具,助力其在各行各业中创造更多的价值。随着这一技术的普及,Qwen 团队相信,人工智能的未来将更加光明。











