面壁智能推出 MiniCPM 4.0 端侧大模型可实现 220 倍速度提升

AI 资讯
25 年 6 月 9 日
编辑

小强

6 月 6 日，面壁智能正式推出其最新力作——MiniCPM4.0 系列模型，这一系列被誉为「有史以来最具想象力的小钢炮」，不仅在端侧性能上实现了飞跃，更在技术创新上树立了新的标杆。

MiniCPM4.0 系列包含两款重量级产品: 一款是 8B 闪电稀疏版，以其创新稀疏架构掀起高效风暴; 另一款则是仅 0.5B 的轻巧灵动版，被誉为「最强小小钢炮」。这两款模型在速度、效能、性能及落地应用上均展现出卓越表现。

在速度方面，MiniCPM4.0 实现了极限情况下 220 倍、常规 5 倍的速度提升，这一突破得益于系统级稀疏创新的层层加速。通过高效双频换挡技术，模型能够根据文本长度自动切换稀疏与稠密注意力机制，确保长文本处理快速且高效，同时大幅减少端侧存储需求，相较于同类模型 Qwen3-8B，仅需 1/4 的缓存存储空间。

效能上，MiniCPM4.0 贡献了行业首例全开源的系统级上下文稀疏化高效创新，以 5% 的极高稀疏度实现极限加速，并融合自研创新技术，从架构层、系统层、推理层到数据层进行全面优化，真正做到系统级软硬件稀疏化高效落地。

性能方面，MiniCPM4.0 延续了「以小博大」的传统，0.5B 版本仅以 2.7% 的训练开销便达到了一半参数、性能翻倍的效果; 而 8B 稀疏版则以 22% 的训练开销对标并超越 Qwen3 及 Gemma312B，巩固了其在端侧领域的领先地位。

落地应用上，MiniCPM4.0 展现出强悍的实力。通过自研 CPM.cu 极速端侧推理框架，结合投机采样创新、模型压缩量化创新及端侧部署框架创新，实现了模型瘦身 90% 的同时极致提升速度，确保端侧推理从天生到终生的丝滑体验。

目前，该模型已成功适配 Intel、高通、MTK、华为昇腾等主流芯片，并在多个开源框架上实现部署，进一步拓展了其应用潜力。

模型合集:

https://www.modelscope.cn/collections/MiniCPM-4-ec015560e8c84d

Github:

https://github.com/openbmb/minicpm

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

面壁智能推出 MiniCPM 4.0 端侧大模型可实现 220 倍速度提升

亚马逊借助人工智能提升仓库自动化与同日送达效率

复古游戏机打败现代 AI！Atari 2600 在国际象棋对战中轻松取胜 ChatGPT

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国广电 DNS 服务器地址大全

{{userData.name}} 已认证

相关文章：

亚马逊借助人工智能提升仓库自动化与同日送达效率

​复古游戏机打败现代 AI！Atari 2600 在国际象棋对战中轻松取胜 ChatGPT

2025 免费的 AI 大模型 API 接口推荐

RF-DETR：开源实时目标检测模型，精准高效赋能多领域

腾讯公益首次引入 AI 大模型，提升公益项目互动体验

ElevenLabs 推出 V3 声音模型: 支持 70 多种语言，可通过标签控制情感、语气

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国广电 DNS 服务器地址大全

复古游戏机打败现代 AI！Atari 2600 在国际象棋对战中轻松取胜 ChatGPT