Existing humanoid table tennis systems remain limited by their reliance on external sensing and their inability to achieve agile whole-body coordination for precise task execution. These limitations stem from two core challenges: achieving low-latency and robust onboard egocentric perception under fast robot motion, and obtaining sufficiently diverse task-aligned strike motions for learning precise yet natural whole-body behaviors. In this work, we present \methodname, a modular system for agile humanoid table tennis that unifies scalable whole-body skill learning with onboard egocentric perception, eliminating the need for external cameras during deployment. Our work advances prior humanoid table-tennis systems in three key aspects. First, we achieve agile and precise ball interaction with tightly coordinated whole-body control, rather than relying on decoupled upper- and lower-body behaviors. This enables the system to exhibit diverse strike motions, including explosive whole-body smashes and low crouching shots. Second, by augmenting and diversifying strike motions with a generative model, our framework benefits from scalable motion priors and produces natural, robust striking behaviors across a wide workspace. Third, to the best of our knowledge, we demonstrate the first humanoid table-tennis system capable of consecutive strikes using onboard sensing alone, despite the challenges of low-latency perception, ego-motion-induced instability, and limited field of view. Extensive real-world experiments demonstrate stable and precise ball exchanges under high-speed conditions, validating scalable, perception-driven whole-body skill learning for dynamic humanoid interaction tasks.


翻译:现有类人乒乓球系统受限于对外部感知的依赖,以及无法实现敏捷的全身协调以完成精确任务执行。这些局限源于两个核心挑战:在快速机器人运动下实现低延迟且鲁棒的板载自我中心感知,以及获取足够多样化的任务对齐击球动作以学习精确而自然的全身行为。在本工作中,我们提出 SMASH——一个面向敏捷类人乒乓球的模块化系统,它统一了可扩展的全身技能学习与板载自我中心感知,在部署时无需外部相机。我们的工作在前代类人乒乓球系统基础上取得三项关键进展:第一,我们通过紧密协调的全身控制而非依赖解耦的上下半身行为,实现了敏捷且精确的球体交互。这使得系统能够展现多样化的击球动作,包括爆发性全身扣杀和低姿击球。第二,通过生成模型增强并多样化击球动作,我们的框架受益于可扩展的运动先验,并在广阔工作空间内产生自然、鲁棒的击球行为。第三,据我们所知,我们首次展示了仅依赖板载感知即可实现连续击球的类人乒乓球系统,尽管面临低延迟感知、自我运动导致的不稳定性及有限视野的挑战。大量真实世界实验验证了高速条件下稳定精确的球体对打,证实了面向动态类人交互任务的可扩展、感知驱动型全身技能学习。

0
下载
关闭预览

相关内容

面向具身操作的视觉-语言-动作模型综述
专知会员服务
28+阅读 · 2025年8月23日
具身智能学习综述:基于物理模拟器与世界模型的方法
专知会员服务
35+阅读 · 2025年7月2日
【Google】平滑对抗训练,Smooth Adversarial Training
专知会员服务
49+阅读 · 2020年7月4日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
VIP会员
最新内容
智能体技能综合综述:分类、技术与应用
专知会员服务
0+阅读 · 今天15:00
《美战争部人工智能计划》27页slides
专知会员服务
14+阅读 · 今天3:33
下一代高超音速能力
专知会员服务
5+阅读 · 今天3:10
【ICML2026】大型视觉语言模型在注意力中迷失
专知会员服务
9+阅读 · 5月10日
美海军EA-18G“咆哮者”与电子攻击的崛起
专知会员服务
9+阅读 · 5月10日
相关VIP内容
面向具身操作的视觉-语言-动作模型综述
专知会员服务
28+阅读 · 2025年8月23日
具身智能学习综述:基于物理模拟器与世界模型的方法
专知会员服务
35+阅读 · 2025年7月2日
【Google】平滑对抗训练,Smooth Adversarial Training
专知会员服务
49+阅读 · 2020年7月4日
相关资讯
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员