Generating low-level robot task plans from high-level natural language instructions remains a challenging problem. Although large language models have shown promising results in generating plans, the accuracy of the output remains unverified. Furthermore, the lack of domain-specific language data poses a limitation on the applicability of these models. In this paper, we propose CLAIRIFY, a novel approach that combines automatic iterative prompting with program verification to ensure programs written in data-scarce domain-specific language are syntactically valid and incorporate environment constraints. Our approach provides effective guidance to the language model on generating structured-like task plans by incorporating any errors as feedback, while the verifier ensures the syntactic accuracy of the generated plans. We demonstrate the effectiveness of CLAIRIFY in planning chemistry experiments by achieving state-of-the-art results. We also show that the generated plans can be executed on a real robot by integrating them with a task and motion planner.


翻译:从高层自然语言指令生成低层机器人任务计划仍是一个具有挑战性的问题。尽管大语言模型在生成计划方面展现出有前景的结果,但输出结果的准确性尚未得到验证。此外,特定领域语言的训练数据匮乏限制了这些模型的适用性。本文提出CLAIRIFY方法——一种结合自动迭代提示与程序验证的创新方案,确保用数据稀缺的领域特定语言编写的程序在语法上有效,并融入环境约束。该方法通过将任何错误作为反馈纳入,为语言模型生成结构化任务计划提供有效引导,同时通过验证器确保生成计划的语法准确性。我们通过规划化学实验展示了CLAIRIFY的有效性,取得了当前最优结果。此外,结合任务与运动规划器,我们证明了所生成的计划可在真实机器人上执行。

0
下载
关闭预览

相关内容

程序员从早期程序设计起,就面临要证明他们的程序达到某种预定目的的任务,这就是程序验证。早期计算机主要用于数学计算,人们通过对数据的某一子集用人工复杂的简单过程验证他们的程序。随着计算机应用的推广,程序验证的任务变得非常困难,这就导致了对基于测试的精巧技术的研究,即它基于计算机程序是一种人工制品,通过实验过程一定能揭示它的多种属性这种思想基础。程序员从早期程序设计起,就面临要证明他们的程序达到某种预定目的的任务,这就是程序验证。早期计算机主要用于数学计算,人们通过对数据的某一子集用人工复杂的简单过程验证他们的程序。随着计算机应用的推广,程序验证的任务变得非常困难,这就导致了对基于测试的精巧技术的研究,即它基于计算机程序是一种人工制品,通过实验过程一定能揭示它的多种属性这种思想基础。
百篇论文纵览大型语言模型最新研究进展
专知会员服务
70+阅读 · 2023年3月31日
专知会员服务
19+阅读 · 2021年9月13日
专知会员服务
33+阅读 · 2021年3月7日
IJCAI 2022 | 使用陈述句进行视觉问答的Prompt Tuning
NAACL 2022 | 基于Prompt的文本生成迁移学习
PaperWeekly
1+阅读 · 2022年8月31日
ACL‘22杰出论文:Prompt范式有bug!
夕小瑶的卖萌屋
2+阅读 · 2022年7月10日
VCIP 2022 Call for Demos
CCF多媒体专委会
1+阅读 · 2022年6月6日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2023年5月15日
Arxiv
2+阅读 · 2023年5月10日
Arxiv
0+阅读 · 2023年5月10日
A Survey of Large Language Models
Arxiv
501+阅读 · 2023年3月31日
VIP会员
最新内容
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
1+阅读 · 5月30日
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
3+阅读 · 5月30日
《Palantir任务保障性软件安全标准(MA-S2)》
专知会员服务
8+阅读 · 5月30日
基于声学的无人机检测技术综述
专知会员服务
5+阅读 · 5月30日
《当代混合战争分析框架:俄乌战争经验教训》
战略前沿人工智能的再思考(中文)
专知会员服务
7+阅读 · 5月29日
《量化地基防空系统间接效应的博弈论方法》
专知会员服务
5+阅读 · 5月29日
相关VIP内容
百篇论文纵览大型语言模型最新研究进展
专知会员服务
70+阅读 · 2023年3月31日
专知会员服务
19+阅读 · 2021年9月13日
专知会员服务
33+阅读 · 2021年3月7日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员