阿里 Qwen-VL-30B-A3B 新模型发布数学、视频处理性能获称更强

小强

阿里巴巴**Qwen（通义千问）**团队近日发布了两个新的小规模多模态模型:Qwen3-VL-30B-A3B-Instruct 和 Qwen3-VL-30B-A3B-Thinking。每个模型拥有 30 亿个活跃参数，但在性能上却有着巨大的野心。

据 Qwen 团队介绍，这两个新版本旨在与 GPT-5-Mini 和 Claude4Sonnet 等顶尖模型竞争，并在某些基准测试中，在数学、图像识别、文本识别、视频处理和代理控制等关键领域展现出更强的性能。

这一系列产品还包括一个用于更快推理的 FP8 版本，以及 Qwen3-VL-235B-A22B 模型的 FP8 变体。

这些模型已全面开放获取，用户和开发者可以通过 HuggingFace、ModelScope 和 GitHub 下载使用，也可通过阿里云 API 调用。此外，Qwen 也提供了一个可直接使用的网页聊天界面。这一发布强调了 Qwen 团队在推动高效、高性能小模型普及化方面的努力。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证