近日,DeepSeek 的关联公司——杭州深度求索人工智能基础技术研究有限公司,公开了一项名为 「一种大语言模型的部署方法及系统」 的专利。这项专利的公布,标志着该公司在人工智能领域的又一重要进展,尤其是在大语言模型的部署方面。
根据专利的摘要,该发明主要涉及到人工智能的核心技术。其创新之处在于将大语言模型的两个关键阶段——预填充阶段和解码阶段,分别部署在高性能计算能力和大内存的机器上。这种分布式的部署方式能够有效均衡负载任务,
在当前的 AI 技术发展中,系统的扩展性和容错性显得尤为重要。DeepSeek 的这一专利,正是通过优化资源配置,增强了系统在面对不同工作负载时的适应能力。这种创新部署方法,预示着未来的 AI 模型将更高效、更智能,有望为各类应用场景提供更好的支持。
值得一提的是,DeepSeek-V3 作为该公司的核心产品之一,其强大的 Mixture-of-Experts(MoE) 语言模型,拥有 671B 个参数,每个 token 的激活参数达到 37B。这一技术的进步,无疑将推动 AI 技术的普及和应用,助力各行各业的数字化转型。
划重点:
🌟DeepSeek 发布新专利,创新部署大语言模型的方法,提高系统性能。
🚀分布式部署实现硬件资源的
最大化利用,减少整体延迟。 📈增强系统的扩展性和容错性,助力未来 AI 技术的发展。









