阿里通义千问推出 Qwen3-VL 轻量级模型:4B 和 8B 参数版本性能逼近此前 72B 旗舰

阿里巴巴团队近日发布了 Qwen3-VL 系列的两款轻量级模型——4B 和 8B 参数版本。Qwen3-VL 系列于上月首次亮相,是通义千问迄今推出的能力最强的视觉语言模型家族。此次新增的小参数版本旨在降低部署门槛,同时保持强劲的性能表现。

新发布的模型包含 4B 和 8B 两种参数规模,每种规模均提供 Instruct(指令遵循) 和 Thinking(思维链推理) 两个版本,为开发者提供了更灵活的选择空间。从功能定位来看,这两款模型在保持完整能力的前提下显著压缩了体积。

在技术实现上,新模型达成了三个核心目标。首先是大幅降低了硬件资源要求,参数规模的缩减使得显存占用明显减少,让开发者能够在更多类型的消费级和边缘设备上部署运行。其次,尽管模型尺寸大幅缩小,但完整继承了 Qwen3-VL 系列的所有核心能力,包括多模态理解、长文本处理和复杂推理等功能模块。

从性能表现来看,这两款轻量级模型在多项权威基准测试中展现出超越同等规模竞品的实力。在 STEM 学科问答、视觉问答 (VQA)、光学字符识别 (OCR)、视频理解以及 Agent 任务等场景中,4B 和 8B 模型不仅超过了 GoogleGemini2.5FlashLite 和 OpenAIGPT-5Nano 等同类轻量级模型,在部分任务上甚至能够接近半年前发布的 72B 参数旗舰模型 Qwen2.5-VL-72B 的水平。

这一发布标志着"小型化"趋势的又一进展。通过模型压缩和优化技术,开发团队在保持能力完整性的前提下实现了参数量与计算成本的大幅削减,为视觉语言模型在移动端、物联网设备等资源受限场景的应用铺平了道路。对于需要在本地部署或对推理成本敏感的企业用户而言,这两款新模型提供了更具性价比的解决方案。

模型地址:https://huggingface.co/collections/Qwen/qwen3-vl-68d2a7c1b8a8afce4ebd2dbe

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

马斯克宣布:X 平台本周将发布 AI 算法更新,信息流全面转向人工智能推荐

2025-10-16 1:21:33

AI 资讯

​百度搜索推出 AI 短剧平台,开启公测助力创作者

2025-10-17 1:20:32

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索