小钢炮 4.0 视觉模型 MiniCPM-V 4.0,手机端应用更流畅

的持续发展中,最近一款新模型 MiniCPM-V4.0 引起了广泛关注。该模型是 MiniCPM-V 系列的最新版本,具有 4.1 亿参数,基于 SigLIP2-400M 和 MiniCPM4-3B 进行构建。与之前的版本相比,MiniCPM-V4.0 在单图、多图及视频理解方面表现出色,并且在效率上有了显著提升。

MiniCPM-V4.0 以其强大的视觉能力而自豪。在众多评测基准中,该模型在 OpenCompass 的综合评估中取得了 69.0 的平均分,超越了 -4.1-mini-20250414、MiniCPM-V2.6(8.1 亿参数,得分 65.2) 和 Qwen2.5-VL-3B-Instruct(3.8 亿参数,得分 64.5)。在多图理解和视频理解领域,它也展现了良好的性能。

针对移动设备的设计是 MiniCPM-V4.0 的一大亮点。该模型在 iPhone16ProMax 上运行顺畅,首次响应延迟不到 2 秒,解码速度超过每秒 17 个 token,且没有发热问题。即便在高并发请求下,它也表现出优越的吞吐能力。

为了让更多用户轻松上手,MiniCPM-V4.0 提供了多种使用方式,包括与多种平台兼容的工具,如 llama.cpp、Ollama、vLLM 等。为了更好地服务用户,开发团队还了一款可以在 iPhone 和 iPad 上运行的 iOS 应用,帮助用户轻松上手。配套的 Cookbook 也提供了详细的使用指南和实用示例,进一步简化了操作过程。

项目:https://huggingface.co/openbmb/MiniCPM-V-4

划重点:

🌟MiniCPM-V4.0 在 OpenCompass 评测中得分 69.0,超越多款同类模型。

📱该模型专为移动设备设计,响应快且无发热问题。

📚开源 iOS 应用及详细使用指南,让用户更轻松上手。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

通义千问 Qwen Code 每日免费调用 2000 次,比 Gemini 更大方

2025-8-12 1:21:17

AI 资讯

超小的 TTS 模型 Kitten TTS:参数量仅为 1500 万

2025-8-12 1:21:24

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索