小米开源最新多模态大模型 Xiaomi MiMo-VL-7B-2508

小强

小米大模型团队宣布开源最新一代多模态大模型 XiaomiMiMo-VL-7B-2508，包含 RL 与 SFT 两个版本。

官方数据显示，新版模型在学科推理、文档理解、图形界面定位及视频理解四项核心能力上全面刷新纪录，其中 MMMU 基准首次突破 70 分大关，ChartQA 升至 94.4，ScreenSpot-v2 达 92.5，VideoMME 提升至 70.8。

此番迭代通过优化强化学习稳定性与监督微调流程，使模型在内部 VLMArena 评分从 1093.9 跃升至 1131.2。

尤为引人关注的是，用户可在提问时通过「/no_think」指令自由切换「思考」与「非思考」模式: 前者全程展示推理链条，控制成功率 100%，后者直接生成答案，响应更快，成功率 99.84%。

推荐用户在大多数情况下体验使用该模型。

开源地址:https://huggingface.co/XiaomiMiMo/MiMo-VL-7B-RL-2508

MiMo-VL-7B-SFT-2508

用户可以根据实际需求，基于此模型进行 SFT 以及 RL。相比于上一版 SFT 模型，该模型的 RL 稳定性更高。

开源地址:https://huggingface.co/XiaomiMiMo/MiMo-VL-7B-SFT-2508

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证