阿里 Qwen-VL-30B-A3B 新模型发布 数学、视频处理性能获称更强

阿里巴巴**Qwen()**团队近日发布了两个新的小规模多模态模型:Qwen3-VL-30B-A3B-Instruct 和 Qwen3-VL-30B-A3B-Thinking。每个模型拥有 30 亿个活跃参数,但在性能上却有着巨大的野心。

据 Qwen 团队介绍,这两个新版本旨在与 -5-Mini 和 Claude4Sonnet 等顶尖模型竞争,并在某些基准测试中,在数学、图像识别、文本识别、视频处理和代理控制等关键领域展现出更强的性能。

这一系列产品还包括一个用于更快推理的 FP8 版本,以及 Qwen3-VL-235B-A22B 模型的 FP8 变体。

这些模型已全面开放获取,用户和开发者可以通过 、ModelScope 和 GitHub 下载使用,也可通过阿里云 API 调用。此外,Qwen 也提供了一个可直接使用的网页聊天界面。这一发布强调了 Qwen 团队在推动高效、高性能小模型普及化方面的努力。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

Synthesia3.0 重磅升级: 推出 「视频代理」 可与观众实时互动、对话和问答

2025-10-7 1:20:50

AI 资讯

OpenAI 欲将 ChatGPT 打造为社交平台: 内置私信功能测试中

2025-10-7 1:21:06

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索