小米开源最新多模态大模型 Xiaomi MiMo-VL-7B-2508

小米团队宣布最新一代多模态大模型 XiaomiMiMo-VL-7B-2508,包含 RL 与 SFT 两个版本。

官方数据显示,新版模型在学科推理、文档理解、图形界面定位及视频理解四项核心能力上全面刷新纪录,其中 MMMU 基准首次突破 70 分大关,ChartQA 升至 94.4,ScreenSpot-v2 达 92.5,VideoMME 提升至 70.8。

此番迭代通过优化强化学习稳定性与监督微调流程,使模型在内部 VLMArena 评分从 1093.9 跃升至 1131.2。

尤为引人关注的是,用户可在提问时通过 「/no_think」 指令自由切换 「思考」 与 「非思考」 模式: 前者全程展示推理链条,控制成功率 100%,后者直接生成答案,响应更快,成功率 99.84%。

  • MiMo-VL-7B-RL-2508

  • 推荐用户在大多数情况下体验使用该模型。

  • 开源地址:https://huggingface.co/XiaomiMiMo/MiMo-VL-7B-RL-2508

  • MiMo-VL-7B-SFT-2508

  • 用户可以根据实际需求,基于此模型进行 SFT 以及 RL。相比于上一版 SFT 模型,该模型的 RL 稳定性更高。

  • 开源地址:https://huggingface.co/XiaomiMiMo/MiMo-VL-7B-SFT-2508

  • 声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

    给 TA 打赏
    共 {{data.count}} 人
    人已打赏
    AI 资讯

    OpenAI 发布 GPT-5 微软旗下生态宣布已全面接入

    2025-8-9 1:21:31

    AI 资讯

    虚拟试穿工具 Voost,能还原服装的纹理、褶皱细节

    2025-8-12 1:20:33

    个人中心
    购物车
    优惠劵
    今日签到
    有新私信 私信列表
    搜索