任意房屋任意任务：面向抽象人类任务的可扩展长程规划 (Any House Any Task: Scalable Long-Horizon Planning for Abstract Human Tasks) - 专知论文

会员服务 ·

0

算法 · 任务规划 · 大语言模型 · 扩展性 · 模糊性 ·

Any House Any Task: Scalable Long-Horizon Planning for Abstract Human Tasks

翻译：任意房屋任意任务：面向抽象人类任务的可扩展长程规划

Zhihong Liu,Yang Li,Rengming Huang,Cewu Lu,Panpan Cai

Open world language conditioned task planning is crucial for robots operating in large-scale household environments. While many recent works attempt to address this problem using Large Language Models (LLMs) via prompting or training, a key challenge remains scalability. Performance often degrades rapidly with increasing environment size, plan length, instruction ambiguity, and constraint complexity. In this work, we propose Any House Any Task (AHAT), a household task planner optimized for long-horizon planning in large environments given ambiguous human instructions. At its core, AHAT utilizes an LLM trained to map task instructions and textual scene graphs into grounded subgoals defined in the Planning Domain Definition Language (PDDL). These subgoals are subsequently solved to generate feasible and optimal long-horizon plans through explicit symbolic reasoning. To enhance the model's ability to decompose complex and ambiguous intentions, we introduce TGPO, a novel reinforcement learning algorithm that integrates external correction of intermediate reasoning traces into Group Relative Policy Optimization (GRPO). Experiments demonstrate that AHAT achieves significant performance gains over state-of-the-art prompting, planning, and learning methods, particularly in human-style household tasks characterized by brief instructions but requiring complex execution plans.

翻译：开放世界语言条件任务规划对于机器人在大规模家庭环境中运行至关重要。尽管近期许多研究尝试通过提示或训练使用大型语言模型（LLM）解决此问题，可扩展性仍是核心挑战。随着环境规模扩大、规划长度增加、指令模糊性增强以及约束复杂度提高，系统性能往往急剧下降。本研究提出任意房屋任意任务（AHAT）——一种针对大规模环境中模糊人类指令进行长程规划优化的家庭任务规划器。其核心在于利用一个经过训练的LLM，将任务指令与文本场景图映射为基于规划领域定义语言（PDDL）的具象化子目标。随后通过显式符号推理求解这些子目标，生成可行且最优的长程规划方案。为提升模型分解复杂模糊意图的能力，我们提出TGPO算法：一种将中间推理轨迹的外部校正机制整合到群组相对策略优化（GRPO）中的新型强化学习算法。实验表明，AHAT在性能上显著优于当前最先进的提示、规划与学习方法，尤其在以简短指令为特征但需复杂执行计划的人类风格家庭任务中表现突出。

0

相关内容

在数学和计算机科学之中，算法（Algorithm）为一个计算的具体步骤，常用于计算、数据处理和自动推理。精确而言，算法是一个表示为有限长列表的有效方法。算法应包含清晰定义的指令用于计算函数。来自维基百科：算法

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

专知会员服务

4+阅读 · 2月27日

《面向空军的知识图谱即解决方案：领域知识有效融入大语言模型》

《面向空军的知识图谱即解决方案：领域知识有效融入大语言模型》

专知会员服务

45+阅读 · 2025年11月8日

PlanGenLLMs：大型语言模型规划能力的最新综述

PlanGenLLMs：大型语言模型规划能力的最新综述

专知会员服务

33+阅读 · 2025年5月18日

【NeurIPS2024】《AmoebaLLM：构建任意形状的大型语言模型以实现高效和即时部署》

【NeurIPS2024】《AmoebaLLM：构建任意形状的大型语言模型以实现高效和即时部署》

专知会员服务

22+阅读 · 2024年11月21日

基于大语言模型的复杂任务自主规划处理框架

基于大语言模型的复杂任务自主规划处理框架

专知会员服务

101+阅读 · 2024年4月12日

大模型如何构建和部署？微软等最新《大型语言模型》综述，详述GPT, LLaMA, PaLM技术细节，Tomas等大牛撰写

大模型如何构建和部署？微软等最新《大型语言模型》综述，详述GPT, LLaMA, PaLM技术细节，Tomas等大牛撰写

专知会员服务

91+阅读 · 2024年2月12日

大模型如何应对安全性？清华等最新《大型语言模型系统的风险分类、缓解措施及评估基准》论文

大模型如何应对安全性？清华等最新《大型语言模型系统的风险分类、缓解措施及评估基准》论文

专知会员服务

49+阅读 · 2024年1月17日

西工大等最新《大型语言模型机器人技术》综述，详述多模态 GPT-4V 机器人技术

西工大等最新《大型语言模型机器人技术》综述，详述多模态 GPT-4V 机器人技术

专知会员服务

78+阅读 · 2024年1月10日

【NeurIPS 2023】大型语言模型的规划能力——一项关键性研究

【NeurIPS 2023】大型语言模型的规划能力——一项关键性研究

专知会员服务

46+阅读 · 2023年9月22日

大模型如何可解释？新泽西理工学院等最新《大型语言模型可解释性》综述

大模型如何可解释？新泽西理工学院等最新《大型语言模型可解释性》综述

专知会员服务

98+阅读 · 2023年9月11日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

25+阅读 · 2023年4月4日

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

专知

71+阅读 · 2022年11月19日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

专知

11+阅读 · 2022年4月10日

中文自然语言处理开放任务介绍、数据集、当前最佳结果分享

中文自然语言处理开放任务介绍、数据集、当前最佳结果分享

深度学习与NLP

14+阅读 · 2019年8月15日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

【泡泡一分钟】RoomNet：端到端房屋布局估计

【泡泡一分钟】RoomNet：端到端房屋布局估计

泡泡机器人SLAM

18+阅读 · 2018年12月4日

综述：Image Caption 任务之语句多样性

综述：Image Caption 任务之语句多样性

PaperWeekly

22+阅读 · 2018年11月30日

共享相关任务表征，一文读懂深度神经网络多任务学习

共享相关任务表征，一文读懂深度神经网络多任务学习

深度学习世界

16+阅读 · 2017年6月23日

基于复杂耦合时间线的深空探测器自主任务规划方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于三维激光测距的移动机器人室外环境语义地图构建

国家自然科学基金

2+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

一类大规模实对称锥规划算法

国家自然科学基金

0+阅读 · 2015年12月31日

基于语义推理的船舶舱室布置进化设计方法

国家自然科学基金

0+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

未知环境中移动机器人探索式路径规划方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向任务成功性的可修系统重要度分析及优化

国家自然科学基金

0+阅读 · 2014年12月31日

城市群空间交互情景分析与多尺度协同模拟

国家自然科学基金

0+阅读 · 2014年12月31日

高动态环境下低可探测性飞行器自主任务规划方法研究

国家自然科学基金

18+阅读 · 2013年12月31日

Plan-MCTS: Plan Exploration for Action Exploitation in Web Navigation

Arxiv

0+阅读 · 2月15日

A Pragmatist Robot: Learning to Plan Tasks by Experiencing the Real World

Arxiv

0+阅读 · 2月14日

One Demo Is All It Takes: Planning Domain Derivation with LLMs from A Single Demonstration

Arxiv

0+阅读 · 2月12日

IMAGINE: Integrating Multi-Agent System into One Model for Complex Reasoning and Planning

Arxiv

0+阅读 · 2月10日

LLM-Grounded Dynamic Task Planning with Hierarchical Temporal Logic for Human-Aware Multi-Robot Collaboration

Arxiv

0+阅读 · 2月10日

Decentralized Intent-Based Multi-Robot Task Planner with LLM Oracles on Hyperledger Fabric

Arxiv

0+阅读 · 2月9日

Self-CriTeach: LLM Self-Teaching and Self-Critiquing for Improving Robotic Planning via Automated Domain Generation

Arxiv

0+阅读 · 2月3日

Embodied Task Planning via Graph-Informed Action Generation with Large Lanaguage Model

Arxiv

0+阅读 · 1月29日

Programming over Thinking: Efficient and Robust Multi-Constraint Planning

Arxiv

0+阅读 · 1月23日

SAGE: Tool-Augmented LLM Task Solving Strategies in Scalable Multi-Agent Environments

Arxiv

0+阅读 · 1月12日

VIP会员

文章信息

相关主题

大语言模型

相关VIP内容

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

专知会员服务

4+阅读 · 2月27日

《面向空军的知识图谱即解决方案：领域知识有效融入大语言模型》

《面向空军的知识图谱即解决方案：领域知识有效融入大语言模型》

专知会员服务

45+阅读 · 2025年11月8日

PlanGenLLMs：大型语言模型规划能力的最新综述

PlanGenLLMs：大型语言模型规划能力的最新综述

专知会员服务

33+阅读 · 2025年5月18日

【NeurIPS2024】《AmoebaLLM：构建任意形状的大型语言模型以实现高效和即时部署》

【NeurIPS2024】《AmoebaLLM：构建任意形状的大型语言模型以实现高效和即时部署》

专知会员服务

22+阅读 · 2024年11月21日

基于大语言模型的复杂任务自主规划处理框架

基于大语言模型的复杂任务自主规划处理框架

专知会员服务

101+阅读 · 2024年4月12日

大模型如何构建和部署？微软等最新《大型语言模型》综述，详述GPT, LLaMA, PaLM技术细节，Tomas等大牛撰写

大模型如何构建和部署？微软等最新《大型语言模型》综述，详述GPT, LLaMA, PaLM技术细节，Tomas等大牛撰写

专知会员服务

91+阅读 · 2024年2月12日

大模型如何应对安全性？清华等最新《大型语言模型系统的风险分类、缓解措施及评估基准》论文

大模型如何应对安全性？清华等最新《大型语言模型系统的风险分类、缓解措施及评估基准》论文

专知会员服务

49+阅读 · 2024年1月17日

西工大等最新《大型语言模型机器人技术》综述，详述多模态 GPT-4V 机器人技术

西工大等最新《大型语言模型机器人技术》综述，详述多模态 GPT-4V 机器人技术

专知会员服务

78+阅读 · 2024年1月10日

【NeurIPS 2023】大型语言模型的规划能力——一项关键性研究

【NeurIPS 2023】大型语言模型的规划能力——一项关键性研究

专知会员服务

46+阅读 · 2023年9月22日

大模型如何可解释？新泽西理工学院等最新《大型语言模型可解释性》综述

大模型如何可解释？新泽西理工学院等最新《大型语言模型可解释性》综述

专知会员服务

98+阅读 · 2023年9月11日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人机与战争：被忽视的环境影响及无人机保护潜力》

俄罗斯规划未来无人机驱动军队

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

《人工智能、武器与影响力：前沿模型在模拟核危机中展现复杂推理》2026最新46页报告

相关资讯

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

25+阅读 · 2023年4月4日

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

专知

71+阅读 · 2022年11月19日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

专知

11+阅读 · 2022年4月10日

中文自然语言处理开放任务介绍、数据集、当前最佳结果分享

中文自然语言处理开放任务介绍、数据集、当前最佳结果分享

深度学习与NLP

14+阅读 · 2019年8月15日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

【泡泡一分钟】RoomNet：端到端房屋布局估计

【泡泡一分钟】RoomNet：端到端房屋布局估计

泡泡机器人SLAM

18+阅读 · 2018年12月4日

综述：Image Caption 任务之语句多样性

综述：Image Caption 任务之语句多样性

PaperWeekly

22+阅读 · 2018年11月30日

共享相关任务表征，一文读懂深度神经网络多任务学习

共享相关任务表征，一文读懂深度神经网络多任务学习

深度学习世界

16+阅读 · 2017年6月23日

相关论文

Plan-MCTS: Plan Exploration for Action Exploitation in Web Navigation

Arxiv

0+阅读 · 2月15日

A Pragmatist Robot: Learning to Plan Tasks by Experiencing the Real World

Arxiv

0+阅读 · 2月14日

One Demo Is All It Takes: Planning Domain Derivation with LLMs from A Single Demonstration

Arxiv

0+阅读 · 2月12日

IMAGINE: Integrating Multi-Agent System into One Model for Complex Reasoning and Planning

Arxiv

0+阅读 · 2月10日

LLM-Grounded Dynamic Task Planning with Hierarchical Temporal Logic for Human-Aware Multi-Robot Collaboration

Arxiv

0+阅读 · 2月10日

Decentralized Intent-Based Multi-Robot Task Planner with LLM Oracles on Hyperledger Fabric

Arxiv

0+阅读 · 2月9日

Self-CriTeach: LLM Self-Teaching and Self-Critiquing for Improving Robotic Planning via Automated Domain Generation

Arxiv

0+阅读 · 2月3日

Embodied Task Planning via Graph-Informed Action Generation with Large Lanaguage Model

Arxiv

0+阅读 · 1月29日

Programming over Thinking: Efficient and Robust Multi-Constraint Planning

Arxiv

0+阅读 · 1月23日

SAGE: Tool-Augmented LLM Task Solving Strategies in Scalable Multi-Agent Environments

Arxiv

0+阅读 · 1月12日

相关基金

基于复杂耦合时间线的深空探测器自主任务规划方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于三维激光测距的移动机器人室外环境语义地图构建

国家自然科学基金

2+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

一类大规模实对称锥规划算法

国家自然科学基金

0+阅读 · 2015年12月31日

基于语义推理的船舶舱室布置进化设计方法

国家自然科学基金

0+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

未知环境中移动机器人探索式路径规划方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向任务成功性的可修系统重要度分析及优化

国家自然科学基金

0+阅读 · 2014年12月31日

城市群空间交互情景分析与多尺度协同模拟

国家自然科学基金

0+阅读 · 2014年12月31日

高动态环境下低可探测性飞行器自主任务规划方法研究

国家自然科学基金

18+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员