While Vision-Language-Action (VLA) models show strong generalizability in various tasks, real-world deployment of robotic policy still requires large-scale, high-quality human expert demonstrations. However, data collection via human teleoperation requires continuous operator attention, which is costly, hard to scale. To address this, we propose Genie Centurion (GCENT), a scalable and general data collection paradigm based on human rewind-and-refine guidance, enabling robots' interactive learning in deployment. GCENT starts at an imperfect policy and improves over time. When the robot execution failures occur, GCENT allows robots to revert to a previous state with a rewind mechanism, after which a teleoperator provides corrective demonstrations to refine the policy. This framework supports a one-human-to-many-robots supervision scheme with a Task Sentinel module, which autonomously predicts task success and solicits human intervention when necessary. Empirical results show that GCENT achieves up to 40% higher task success rates than state-of-the-art data collection methods, and reaches comparable performance using less than half the data in long-horizon and precise tasks. We also quantify the data yield-to-effort ratio under multi-robot scenarios, demonstrating GCENT's potential for scalable and cost-efficient robot policy training in real-world environments.


翻译:尽管视觉-语言-动作(VLA)模型在各种任务中展现出强大的泛化能力,但机器人策略在现实世界中的部署仍需要大规模、高质量的人类专家示范数据。然而,通过人类遥操作收集数据需要操作者持续保持注意力,这成本高昂且难以扩展。为解决此问题,我们提出了Genie Centurion(GCENT),一种基于人类回滚与精修指导的可扩展通用数据收集范式,使机器人能够在部署中进行交互式学习。GCENT从一个不完美的策略开始,并随时间推移不断改进。当机器人执行失败时,GCENT允许机器人通过回滚机制恢复到先前状态,随后由遥操作员提供纠正性示范以精修策略。该框架通过一个任务哨兵模块支持“一人监督多机器人”的方案,该模块能自主预测任务成功与否,并在必要时请求人工干预。实证结果表明,GCENT相比最先进的数据收集方法,任务成功率最高可提升40%,并且在长时程和精确任务中,使用不到一半的数据即可达到相当的性能。我们还量化了多机器人场景下的数据产出-投入比,证明了GCENT在现实环境中进行可扩展、高性价比机器人策略训练的潜力。

0
下载
关闭预览

相关内容

机器人(英语:Robot)包括一切模拟人类行为或思想与模拟其他生物的机械(如机器狗,机器猫等)。狭义上对机器人的定义还有很多分类法及争议,有些电脑程序甚至也被称为机器人。在当代工业中,机器人指能自动运行任务的人造机器设备,用以取代或协助人类工作,一般会是机电设备,由计算机程序或是电子电路控制。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
伯克利最新《机器人》课程
专知会员服务
35+阅读 · 2025年1月6日
一文读懂最强中文NLP预训练模型ERNIE
AINLP
25+阅读 · 2019年10月22日
ERNIE Tutorial(论文笔记 + 实践指南)
AINLP
30+阅读 · 2019年8月28日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
22+阅读 · 2009年12月31日
VIP会员
相关VIP内容
伯克利最新《机器人》课程
专知会员服务
35+阅读 · 2025年1月6日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
22+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员