颠覆传统！新多智能体框架 OWL 获 17K Star，超越 OpenAI 开创智能协作新时代

AI 资讯
25 年 6 月 18 日
编辑

小强

随着大型语言模型（LLM）的迅猛发展，单一智能体在应对复杂现实任务时显露出诸多局限。为了解决这个问题，香港大学与 camel-ai 等多家机构联合推出了一种名为 Workforce 的全新多智能体框架，并配套了一种名为 OWL(OptimizedWorkforceLearning) 的训练方法。最近，这一创新成果在权威基准测试 GAIA 上获得了 69.70% 的准确率，不仅刷新了开源系统的记录，还超越了 OpenAIDeepResearch 等多家商业系统。

这一研究成果的所有代码已在 GitHub 上开源，当前已获得超过 17，000 个 Star 的点赞，标志着社区对这一创新的认可。

那么，Workforce 框架是如何突破多智能体系统的局限性的呢? 其核心在于创新的「解耦设计」。框架将整个系统拆分为三个关键组成部分: 领域无关的规划器（PlannerAgent）、智能协调器 (CoordinatorAgent) 和专业工作节点 (WorkerNodes)。这种设计不仅提升了系统的灵活性，还显著降低了跨领域迁移的复杂性。尤其是在需要适应新领域时，用户只需替换或添加工作节点，而不必对核心系统进行全面修改。

OWL 训练方法则是这一框架的另一大亮点。该方法采用了两阶段的训练策略，第一阶段是监督微调，通过专家演示数据对规划器进行初步训练; 第二阶段则是强化学习优化，通过直接偏好优化（DPO）算法进一步提升决策能力。这一系列优化确保了规划器能够处理现实世界中的多样化任务。

在 GAIA 基准测试中，Workforce 框架展示了其显著的优势，尤其是在多智能体推理方面，达到了 69.70% 的准确率，远超以往的开源系统。同时，OWL 训练方法也在测试中取得了显著成果，提升了 Qwen2.5-32B-Instruct 模型的性能。这一突破使得多智能体系统在处理复杂任务时，不再受限于以往的设计思路，展现出强大的自我纠错和进化能力。

Workforce 框架的推出不仅提升了多智能体系统的整体性能，也为智能助手的未来发展指明了方向。

论文地址：https://arxiv.org/pdf/2505.23885

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

颠覆传统！新多智能体框架 OWL 获 17K Star，超越 OpenAI 开创智能协作新时代

POE 平台上线即梦 3.0 图像与 Seedance1.0Lite 视频模型

剑指反垄断:OpenAI 或将微软告上联邦法庭，AI 合作蒙上阴影

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国广电 DNS 服务器地址大全

{{userData.name}} 已认证

相关文章：

POE 平台上线即梦 3.0 图像与 Seedance1.0Lite 视频模型

剑指反垄断:OpenAI 或将微软告上联邦法庭，AI 合作蒙上阴影

一文读懂大语言模型：从原理到应用

日本 AI 逆袭全球！Shisa V2 405B 开源发布，碾压 GPT-4 的日语神器来了！

打破碎片化！Eywa 携手 CrossCurve 重塑去中心化金融流动性格局

Grok 接管推特算法！小号也能爆红，新人起号迎来黄金时代？

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国广电 DNS 服务器地址大全