Generalizing from individual skill executions to solving long-horizon tasks remains a core challenge in building autonomous agents. A promising direction is learning high-level, symbolic abstractions of the low-level skills of the agents, enabling reasoning and planning independent of the low-level state space. Among possible high-level representations, object-centric skill abstraction with symbolic predicates has been proven to be efficient because of its compatibility with domain-independent planners. Recent advances in foundation models have made it possible to generate symbolic predicates that operate on raw sensory inputs, a process we call generative predicate invention, to facilitate downstream abstraction learning. However, it remains unclear which formal properties the learned representations must satisfy, and how they can be learned to guarantee these properties. In this paper, we address both questions by presenting a formal theory of generative predicate invention for skill abstraction, resulting in symbolic operators that can be used for provably sound and complete planning. Within this framework, we propose SkillWrapper, a method that leverages foundation models to actively collect robot data and learn human-interpretable, plannable representations of black-box skills, using only RGB image observations. Our extensive empirical evaluation in simulation and on real robots shows that SkillWrapper learns abstract representations that enable solving unseen, long-horizon tasks in the real world with black-box skills.


翻译:从个体技能执行泛化至解决长时程任务,仍是构建自主智能体的核心挑战。一种前景广阔的方向是学习智能体底层技能的高层符号化抽象,从而实现独立于底层状态空间的推理与规划。在可能的高层表示中,采用符号谓词的对象中心技能抽象因其与领域无关规划器的兼容性已被证明是高效的。基础模型的最新进展使得直接从原始感官输入生成符号谓词成为可能,我们将这一过程称为生成式谓词发明,以促进下游抽象学习。然而,学习到的表示必须满足哪些形式化属性,以及如何通过学习保证这些属性,目前仍不明确。本文通过提出一套用于技能抽象的生成式谓词发明形式化理论,同时回应了这两个问题,最终得到可用于可证明完备且可靠规划的符号化操作符。在此框架内,我们提出SkillWrapper方法,该方法利用基础模型主动收集机器人数据,并仅使用RGB图像观测,学习黑盒技能的可人为解释、可规划表示。我们在仿真与真实机器人上的大量实验评估表明,SkillWrapper学习的抽象表示能够使真实世界中的黑盒技能解决未见的长时程任务。

0
下载
关闭预览

相关内容

数据驱动的具身学习探索
专知会员服务
10+阅读 · 2025年2月26日
任务级兵棋智能决策技术框架设计与关键问题分析
专知会员服务
67+阅读 · 2024年5月13日
作战任务智能规划系统设计及关键技术研究
专知会员服务
103+阅读 · 2024年4月25日
大语言模型视角下的智能规划方法综述
专知会员服务
136+阅读 · 2024年4月20日
战术级任务规划方法研究综述
专知会员服务
149+阅读 · 2024年1月11日
强化学习《奖励函数设计: Reward Shaping》详细解读
深度强化学习实验室
18+阅读 · 2020年9月1日
浅谈主动学习(Active Learning)
凡人机器学习
32+阅读 · 2020年6月18日
尽早跑通深度学习的实践代码,是入门深度学习的最快途径
算法与数据结构
22+阅读 · 2017年12月13日
NLP中自动生产文摘(auto text summarization)
机器学习研究会
14+阅读 · 2017年10月10日
全解:目标检测,图像分类、分割、生成……
全球人工智能
20+阅读 · 2017年9月15日
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员