GoogleDeepMind 重磅推出新一代机器人 AI 模型——GeminiRoboticsOn-Device,引发行业热议。这款模型以其完全本地化运行、强大的任务适应能力和低样本学习特性,展现了机器人 AI 技术的全新突破。AIbase 整理
完全本地化运行: 摆脱云端束缚
GeminiRoboticsOn-Device 的
多任务能力: 从拉拉链到叠衣服
这款模型集成了视觉、语言和动作控制,具备出色的多模态能力。它能通过自然语言指令理解人类意图,并转化为精准的机器人动作。演示中,机器人成功完成了拉拉链、倒液体、叠衣服等复杂任务,甚至在未 「见过」 的场景中表现出色,例如在工业流水线上进行组装。GoogleDeepMind 表示,该模型在双臂机器人 (如 FrankaFR3 和 Apollo 人形机器人) 上的表现尤为突出,展现了通用灵巧性和任务泛化能力。
低样本学习:50-100 次示范即可上手
GeminiRoboticsOn-Device 的另一大创新是其低样本学习能力。开发者只需通过 50 至 100 次任务示范,即可让机器人快速适应新任务。这种高效的微调方式得益于模型基于 Gemini2.0 的架构,结合了强大的视觉感知、语义理解和行为生成能力。GoogleDeepMind 还发布了 GeminiRoboticsSDK,允许开发者在 MuJoCo 物理模拟器中测试模型,并通过 「可信测试者」 计划获取开发权限,极大降低了机器人 AI 的部署门槛。
行业前景: 重新定义机器人应用
GeminiRoboticsOn-Device 的发布标志着机器人 AI 迈向 「可用、可部署、可泛化」 的新阶段。其本地化运行和低样本学习的特性,不仅降低了企业的部署成本,还推动了机器人技术在制造业、物流、安保等领域的广泛应用。然而,模型在复杂环境下的泛化能力和安全性仍需进一步验证。AIbase 认为,随着 GoogleDeepMind 持续优化,这一技术有望重塑机器人行业的未来格局。
GoogleDeepMind 的 GeminiRoboticsOn-Device 以其本地化运行、多任务能力和低样本学习特性,展现了机器人 AI 技术的突破性进展。从拉拉链到工业组装,这款模型为机器人赋予了前所未有的灵活性和智能性。未来,随着 SDK 的开放和技术的迭代,机器人或将成为各行业不可或缺的 「全能助手」。