MiniCPM4.0 系列包含两款重量级产品: 一款是 8B 闪电稀疏版,以其创新稀疏架构掀起高效风暴; 另一款则是仅 0.5B 的轻巧灵动版,被誉为 「
在速度方面,MiniCPM4.0 实现了极限情况下 220 倍、常规 5 倍的速度提升,这一突破得益于系统级稀疏创新的层层加速。通过高效双频换挡技术,模型能够根据文本长度自动切换稀疏与稠密注意力机制,确保长文本处理快速且高效,同时大幅减少端侧存储需求,相较于同类模型 Qwen3-8B,仅需 1/4 的缓存存储空间。
效能上,MiniCPM4.0 贡献了行业首例全开源的系统级上下文稀疏化高效创新,以 5% 的
性能方面,MiniCPM4.0 延续了 「以小博大」 的传统,0.5B 版本仅以 2.7% 的训练开销便达到了一半参数、性能翻倍的效果; 而 8B 稀疏版则以 22% 的训练开销对标并超越 Qwen3 及 Gemma312B,巩固了其在端侧领域的领先地位。
落地应用上,MiniCPM4.0 展现出强悍的实力。通过自研 CPM.cu 极速端侧推理框架,结合投机采样创新、模型压缩量化创新及端侧部署框架创新,实现了模型瘦身 90% 的同时
目前,该模型已成功适配 Intel、高通、MTK、华为昇腾等主流芯片,并在多个开源框架上实现部署,进一步拓展了其应用潜力。
模型合集:
https://www.modelscope.cn/collections/MiniCPM-4-ec015560e8c84d
Github:
https://github.com/openbmb/minicpm