Humanoid robotics has strong potential to transform daily service and caregiving applications. Although recent advances in general motion tracking within physics engines (GMT) have enabled virtual characters and humanoid robots to reproduce a broad range of human motions, these behaviors are primarily limited to contact-less social interactions or isolated movements. Assistive scenarios, by contrast, require continuous awareness of a human partner and rapid adaptation to their evolving posture and dynamics. In this paper, we formulate the imitation of closely interacting, force-exchanging human-human motion sequences as a multi-agent reinforcement learning problem. We jointly train partner-aware policies for both the supporter (assistant) agent and the recipient agent in a physics simulator to track assistive motion references. To make this problem tractable, we introduce a partner policies initialization scheme that transfers priors from single-human motion-tracking controllers, greatly improving exploration. We further propose dynamic reference retargeting and contact-promoting reward, which adapt the assistant's reference motion to the recipient's real-time pose and encourage physically meaningful support. We show that AssistMimic is the first method capable of successfully tracking assistive interaction motions on established benchmarks, demonstrating the benefits of a multi-agent RL formulation for physically grounded and socially aware humanoid control.


翻译:人形机器人技术具有改变日常服务和护理应用的巨大潜力。尽管物理引擎中的通用运动跟踪(GMT)技术的最新进展已使虚拟角色和人形机器人能够复现广泛的人类动作,但这些行为主要局限于无接触的社交互动或孤立运动。相比之下,辅助场景需要对人类伙伴保持持续关注,并快速适应其不断变化的姿态和动态。在本文中,我们将紧密交互、力量交换的人类-人类运动序列的模仿构建为一个多智能体强化学习问题。我们在物理模拟器中联合训练支持者(辅助)智能体和接收者智能体的伙伴感知策略,以跟踪辅助运动参考。为使该问题易于处理,我们引入了一种伙伴策略初始化方案,该方案从单人类运动跟踪控制器迁移先验知识,显著改善了探索过程。我们进一步提出了动态参考重定向和接触促进奖励机制,使辅助者的参考运动适应接收者的实时姿态,并鼓励物理上有意义的支撑。我们证明,AssistMimic是首个能够在已建立的基准测试中成功跟踪辅助交互运动的方法,展示了多智能体强化学习框架在物理基础和社交感知的人形机器人控制方面的优势。

0
下载
关闭预览

相关内容

【斯坦福博士论文】协作多机器人学习算法
专知会员服务
17+阅读 · 2025年1月6日
《用于空战机动的分层多智能体强化学习》
专知会员服务
68+阅读 · 2023年10月5日
基于神经网络的机器人学习与控制:回顾与展望
专知会员服务
33+阅读 · 2023年9月10日
「基于通信的多智能体强化学习」 进展综述
【论文笔记】基于强化学习的人机对话
专知
20+阅读 · 2019年9月21日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
49+阅读 · 2009年12月31日
VIP会员
最新内容
《美陆军条例:陆军指挥政策(2026版)》
专知会员服务
3+阅读 · 今天8:10
《军用自主人工智能系统的治理与安全》
专知会员服务
3+阅读 · 今天8:02
《系统簇式多域作战规划范畴论框架》
专知会员服务
7+阅读 · 4月20日
高效视频扩散模型:进展与挑战
专知会员服务
3+阅读 · 4月20日
乌克兰前线的五项创新
专知会员服务
7+阅读 · 4月20日
 军事通信系统与设备的技术演进综述
专知会员服务
6+阅读 · 4月20日
《北约标准:医疗评估手册》174页
专知会员服务
5+阅读 · 4月20日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
49+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员