vivo 新多模态模型登场，AI 理解 GUI 界面能力再升级！

小强

近日，vivoAILab 发布了其最新的端侧多模态模型——BlueLM-2.5-3B。这款模型不仅小巧高效，更具备了理解图形用户界面（GUI）的能力，标志着人工智能在处理文本和图像方面迈出了重要一步。

BlueLM-2.5-3B 的独特之处在于它可以灵活切换长短思考模式，并引入了思考预算控制机制，帮助 AI 更好地平衡思考的深度与效率。这使得该模型在多项文本和多模态评测任务中表现优异，尤其在理解和推理方面，有望超过许多同类产品。

在 20 余项评测中，BlueLM-2.5-3B 显示出了强大的文本处理能力，成功缓解了多模态模型常见的「遗忘问题」。在长思考模式下，模型在推理类任务中，如数学和逻辑推理，的表现显著优于其他同规模的模型。此外，其在多模态理解方面也表现不俗，能够与更大规模的模型媲美，体现了它的强大。

不仅如此，BlueLM-2.5-3B 在理解 GUI 方面的表现尤为突出，得益于对大量中文应用程序截屏数据的训练。在这方面，它的得分超过了许多竞争对手，展示了 vivo 在人工智能领域的实力。

为了支撑如此出色的表现，BlueLM-2.5-3B 采用了精巧的模型结构，参数量仅为 2.9B，且训练和推理成本相对较低。通过优化的数据利用策略和高效的训练流程，该模型在数据利用效率上有了显著提升，为 AI 的普及和应用打下了坚实的基础。

BlueLM-2.5-3B 的发布不仅为用户带来了更加智能的应用体验，也为人工智能技术的进步增添了新的动力。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证