近日,AIbase 从网络信息获悉,京东正式开源了一款产品级端到端通用多智能体系统 JoyAgent-JDGenie,在 GAIA 基准测试中以 75.15% 的准确率超越 OWL、OpenManus 等竞品,位居行业前列。这款开源框架以其强大的多智能体协作能力和开箱即用的特性,为开发者提供了快速构建 AI 应用的利器。
GAIA 基准领跑,性能卓越
JoyAgent-JDGenie 在 GAIA 基准测试中表现亮眼,以 75.15% 的总体准确率刷新了多智能体系统的性能纪录。根据 GAIA 基准的评估标准,该系统在难度分级的任务中展现了优异的能力:Level1 任务准确率达 85% 以上,Level2 任务接近 78%,而在最复杂的 Level3 任务中也取得了 55% 的出色成绩,显著超越其他开源框架如 OWL(约 65%) 和 OpenManus(约 65%)。AIbase 注意到,GAIA 基准以其强调真实世界任务 (如多模态处理、工具使用和复杂推理) 的设计,成为评估 AI 智能体能力的 「金标准」,而 JoyAgent-JDGenie 的高分表现彰显了其在通用场景下的强大潜力。
端到端多智能体框架,开箱即用
JoyAgent-JDGenie 是一款完整的端到端多智能体系统,支持用户通过简单查询或任务输入直接获得答案或解决方案。该框架集成了前端、后端、核心引擎以及多个子智能体模块,包括报告生成智能体、代码智能体、PPT 智能体和文件智能体,覆盖了从文档处理到代码生成、演示文稿制作等多样化场景。AIbase 了解到,开发者可通过挂载自定义子智能体或外部工具 (如 Web 搜索 API 或 Python 解释器) 进一步扩展功能,满足特定业务需求。
与传统单一智能体系统不同,JoyAgent-JDGenie 采用多层级协作设计,通过任务分解和智能体协同,高效处理复杂任务。例如,用户输入 「生成一份关于 2025 年 AI 趋势的 PPT」,系统会自动分配任务给 PPT 智能体和数据分析智能体,生成包含图表和内容的演示文稿。这种开箱即用的特性极大降低了开发门槛,适合企业快速部署 AI 应用。
多模态与记忆优化,智能更进一步
JoyAgent-JDGenie 的多模态与记忆设计是其核心亮点。系统支持文本、图像、代码等多种输入和输出形式,能够处理 GAIA 基准中的多模态任务,如解析 PDF 文件、分析图像内容或处理音频数据。此外,框架引入了跨任务级别的相似任务记忆机制,允许系统根据历史任务记录优化当前任务的处理效率。例如,在重复生成类似报告时,系统可调用历史数据,减少重复计算,提升响应速度。
AIbase 从社区反馈中获悉,JoyAgent-JDGenie 的多模态能力在处理复杂任务时表现出色。例如,在 GAIALevel3 任务中,系统能够通过链式推理 (Chain-of-Thought) 结合外部工具,准确回答涉及多源数据整合的问题,如 「根据某幅画作和历史记录提取特定信息」。这种能力使其在数据分析、内容创作和自动化工作流中具有广泛应用前景。
开源生态,助力开发者创新
JoyAgent-JDGenie 的完全开源 (Apache2.0 许可证) 为开发者提供了极大的灵活性。AIbase 了解到,该项目公开了前端、后端、框架、引擎以及核心子智能体的完整代码,开发者可基于此进行二次开发或直接部署。项目还提供了详细的文档和快速入门指南,支持在 Windows、Linux 等多个平台上运行,兼容主流硬件环境。
社区反馈显示,JoyAgent-JDGenie 的模块化设计便于扩展。例如,开发者可通过添加新的子智能体 (如专用于金融分析或医疗数据处理的智能体) 快速定制系统。此外,京东团队表示将持续优化框架,计划引入本地化 LLM 支持和更高效的推理加速技术,以降低对云端 API 的依赖,进一步提升性能和成本效益。
多智能体系统的未来风向
JoyAgent-JDGenie 的发布标志着多智能体系统在开源领域的重大突破。其在 GAIA 基准中的领先表现,不仅体现了京东在 AI 技术领域的深厚积累,也为企业级 AI 应用的快速落地提供了范例。AIbase 认为,随着多智能体系统在任务协作、工具整合和多模态处理能力的持续提升,类似 JoyAgent-JDGenie 的框架将成为推动 AI 普及化的重要力量。
对于希望尝试 JoyAgent-JDGenie 的开发者,只需访问其 GitHub 仓库获取源码,按照指引配置环境即可快速部署。无论是构建智能客服、自动化报告生成还是复杂数据分析工具,这款框架都值得一试。
项目地址:https://github.com/jd-opensource/joyagent-jdgenie










