Endowing robots with the ability to rearrange various large and heavy objects, such as furniture, can substantially alleviate human workload. However, this task is extremely challenging due to the need to interact with diverse objects and efficiently rearrange multiple objects in complex environments while ensuring collision-free loco-manipulation. In this work, we present ALORE, an autonomous large-object rearrangement system for a legged manipulator that can rearrange various large objects across diverse scenarios. The proposed system is characterized by three main features: (i) a hierarchical reinforcement learning training pipeline for multi-object environment learning, where a high-level object velocity controller is trained on top of a low-level whole-body controller to achieve efficient and stable joint learning across multiple objects; (ii) two key modules, a unified interaction configuration representation and an object velocity estimator, that allow a single policy to regulate planar velocity of diverse objects accurately; and (iii) a task-and-motion planning framework that jointly optimizes object visitation order and object-to-target assignment, improving task efficiency while enabling online replanning. Comparisons against strong baselines show consistent superiority in policy generalization, object-velocity tracking accuracy, and multi-object rearrangement efficiency. Key modules are systematically evaluated, and extensive simulations and real-world experiments are conducted to validate the robustness and effectiveness of the entire system, which successfully completes 8 continuous loops to rearrange 32 chairs over nearly 40 minutes without a single failure, and executes long-distance autonomous rearrangement over an approximately 40 m route. The open-source packages are available at https://zhihaibi.github.io/Alore/.


翻译:赋予机器人重排各种大型重物(如家具)的能力,可显著减轻人类工作负担。然而,由于需与多样物体交互、在复杂环境中高效重排多个物体,并确保无碰撞的移动-操作协同,该任务极具挑战性。本研究提出ALORE,一种面向腿式操纵器的自主大物体重排系统,能够在多样化场景中重排各类大型物体。该系统的核心特征包括:(i)面向多物体环境学习的分层强化学习训练框架,其中在底层全身控制器之上训练高层物体速度控制器,以实现跨多个物体的高效稳定联合学习;(ii)两个关键模块——统一交互配置表示与物体速度估计器,使单一策略能够精确调控多样物体的平面速度;(iii)任务与运动规划框架,联合优化物体访问顺序与物体-目标分配关系,在提升任务效率的同时支持在线重规划。与强基线方法的对比实验表明,本系统在策略泛化性、物体速度跟踪精度及多物体重排效率方面均具有持续优势。通过对关键模块的系统性评估,以及大量仿真与实物实验,验证了整体系统的鲁棒性与有效性:系统成功完成8个连续循环,在近40分钟内无故障地重排了32把椅子,并在约40米的路线上实现了长距离自主重排。开源代码包发布于 https://zhihaibi.github.io/Alore/。

0
下载
关闭预览

相关内容

空间模块化机器人自重构机理与算法研究现状
专知会员服务
16+阅读 · 1月31日
AlphaMosaic:人工智能赋能的作战管理系统
专知会员服务
39+阅读 · 2025年8月19日
多智能体自主系统《群体自主系统的实时路径规划》248页
概述自动机器学习(AutoML)
人工智能学家
19+阅读 · 2019年8月11日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
49+阅读 · 2009年12月31日
VIP会员
最新内容
人工智能赋能无人机:俄乌战争(万字长文)
专知会员服务
2+阅读 · 今天6:56
国外海军作战管理系统与作战训练系统
专知会员服务
1+阅读 · 今天4:16
美军条令《海军陆战队规划流程(2026版)》
专知会员服务
7+阅读 · 今天3:36
《压缩式分布式交互仿真标准》120页
专知会员服务
4+阅读 · 今天3:21
《电子战数据交换模型研究报告》
专知会员服务
6+阅读 · 今天3:13
《基于Transformer的异常舰船导航识别与跟踪》80页
《低数据领域军事目标检测模型研究》
专知会员服务
5+阅读 · 今天2:37
【CMU博士论文】物理世界的视觉感知与深度理解
伊朗战争停火期间美军关键弹药状况分析
专知会员服务
8+阅读 · 4月22日
电子战革命:塑造战场的十年突破(2015–2025)
相关VIP内容
空间模块化机器人自重构机理与算法研究现状
专知会员服务
16+阅读 · 1月31日
AlphaMosaic:人工智能赋能的作战管理系统
专知会员服务
39+阅读 · 2025年8月19日
多智能体自主系统《群体自主系统的实时路径规划》248页
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
49+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员