面壁智能推出 MiniCPM 4.0 端侧大模型 可实现 220 倍速度提升

6 月 6 日,面壁智能正式推出其最新力作——MiniCPM4.0 系列模型,这一系列被誉为 「有史以来最具想象力的小钢炮」,不仅在端侧性能上实现了飞跃,更在技术创新上树立了新的标杆。

MiniCPM4.0 系列包含两款重量级产品: 一款是 8B 闪电稀疏版,以其创新稀疏架构掀起高效风暴; 另一款则是仅 0.5B 的轻巧灵动版,被誉为 「最强小小钢炮」。这两款模型在速度、效能、性能及落地应用上均展现出卓越表现。

在速度方面,MiniCPM4.0 实现了极限情况下 220 倍、常规 5 倍的速度提升,这一突破得益于系统级稀疏创新的层层加速。通过高效双频换挡技术,模型能够根据文本长度自动切换稀疏与稠密注意力机制,确保长文本处理快速且高效,同时大幅减少端侧存储需求,相较于同类模型 Qwen3-8B,仅需 1/4 的缓存存储空间。

效能上,MiniCPM4.0 贡献了行业首例全的系统级上下文稀疏化高效创新,以 5% 的极高稀疏度实现极限加速,并融合自研创新技术,从架构层、系统层、推理层到数据层进行全面优化,真正做到系统级软硬件稀疏化高效落地。

性能方面,MiniCPM4.0 延续了 「以小博大」 的传统,0.5B 版本仅以 2.7% 的训练开销便达到了一半参数、性能翻倍的效果; 而 8B 稀疏版则以 22% 的训练开销对标并超越 Qwen3 及 Gemma312B,巩固了其在端侧领域的领先地位。

落地应用上,MiniCPM4.0 展现出强悍的实力。通过自研 CPM.cu 极速端侧推理框架,结合投机采样创新、模型压缩量化创新及端侧部署框架创新,实现了模型瘦身 90% 的同时极致提升速度,确保端侧推理从天生到终生的丝滑体验。

目前,该模型已成功适配 Intel、高通、MTK、华为昇腾等主流芯片,并在多个开源框架上实现部署,进一步拓展了其应用潜力。

模型合集:

https://www.modelscope.cn/collections/MiniCPM-4-ec015560e8c84d

Github:

https://github.com/openbmb/minicpm

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

亚马逊借助人工智能提升仓库自动化与同日送达效率

2025-6-6 21:15:01

AI 资讯

​复古游戏机打败现代 AI!Atari 2600 在国际象棋对战中轻松取胜 ChatGPT

2025-6-10 1:20:30

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索