京东重磅推出国产芯片驱动的 xLLM 推理引擎

京东最近宣布了一项令人振奋的技术进展——基于国产芯片自主研发的推理引擎 xLLM。这一引擎的推出旨在帮助企业在部署) 应用时,能够以更高的性能和更低的成本运作,进一步推动行业的智能化转型。

xLLM 引擎的核心功能亮点众多,首先是其基于请求优先级的动态调度器。这一功能能够根据不同请求的重要性,智能分配计算资源,确保关键任务优先完成。此外,该引擎还具备动态自适应的 PD 分离架构,可以根据实时负载情况调整处理实例的比例,以实现资源的最佳利用。值得一提的是,xLLM 特别适配多模态场景,配备了 EPD 混合分离调度器,为复杂的 提供了更灵活的解决方案。

在技术架构方面,xLLM 拥有基于硬件特性的多级流水线执行引擎,确保高效处理不同类型的任务。同时,开发者们还设计了包含图融合、投机推理和动态负载均衡的计算优化套件,这将大幅提升 AI 推理的效率。为了进一步提升系统性能,xLLM 还利用 Mooncake 构建了多级 KV 缓存的全局管理系统,为数据处理提供了更加顺畅的体验。

京东表示,这一技术源自其零售核心业务,并已成功应用于京东 AI 助手、智能客服、风控和供应链助手等多个场景。通过这一系统,效率提升超过 5 倍,而机器成本则降低了 90%,这一切都表明了 xLLM 的强大潜力。

「我们坚信,AI 基础设施的生态建设离不开每位开发者的贡献。开源只是第一步,未来京东将继续根据社区的需求,开放更多高级功能,并与清华、北大、中科大等产学研合作伙伴共同推动国产 AI 基础设施技术的创新与发展。」 京东零售 AI 基础设施团队表示。

随着 xLLM 的开源,开发者们将有机会体验这一强大的推理引擎,并为推动中国的 生态做出贡献。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

DeepSeek 突袭更新 V3.2 后紧急下架

2025-9-30 1:20:49

AI 资讯

蚂蚁百灵团队全新开源高性能思考模型 Ring-flash-2.0

2025-9-30 1:21:06

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索