Unmanned aerial vehicles (UAVs) are increasingly being deployed in logistics, service robotics, and other real-world applications, creating a growing demand for autonomous payload acquisition and delivery. Existing approaches typically assume pre-attached payloads or rely on specialized grippers, leaving versatile end-to-end aerial delivery largely unresolved, where different payloads induce highly variable flight dynamics, requiring a single policy to adapt online without manual calibration or explicit system identification. To this end, we study \textbf{A}utonomous \textbf{A}erial Manipulation via \textbf{Co}ntextual \textbf{Co}ntrastive Meta Reinforcement Learning (\textbf{\textit{Aco2}}), a fully autonomous aerial delivery setting in which a quadrotor equipped with a lightweight hook continuously picks up, transports, and delivers diverse handle-equipped objects between randomized locations, all without human intervention. First, we design a contextual observation encoder that infers a compact latent context from recent interaction history, enabling the policy to adapt online to payload-dependent dynamics. To further improve the quality of this context, we introduce a contrastive objective that structures the context embedding around task-relevant variations, improving generalization across diverse payloads without requiring explicit system identification. Trained entirely in simulation with extensive domain randomization, \textit{Aco2} can be directly deployed on a physical quadrotor without real-world fine-tuning.


翻译:无人机正越来越多地部署于物流、服务机器人及其他实际应用中,这催生了对其自主载荷抓取与递送功能的日益增长的需求。现有方法通常假设载荷已预先固定,或依赖专用夹持器,导致通用的端到端空中递送问题尚未得到充分解决——不同载荷会引发高度变化的飞行动力学特性,要求单一策略在不依赖人工校准或明确系统辨识的情况下实现在线自适应。为此,我们研究了基于上下文对比元强化学习的自主空中操纵(Aco2),这是一种全自主空中递送场景:配备轻量化挂钩的四旋翼飞行器在随机位置之间持续执行抓取、运输和递送多种带手柄载荷的任务,全程无需人工干预。首先,我们设计了一个上下文观测编码器,用于从近期交互历史中推断出紧凑的潜在上下文表征,使策略能够在线适应依赖载荷的动力学特性。为进一步提升该上下文表征的质量,我们引入了一个对比学习目标函数,通过围绕任务相关变化构建上下文嵌入结构,从而在无需显式系统辨识的前提下,增强策略对多样化载荷的泛化能力。完全在仿真环境中通过广泛域随机化训练的Aco2能够直接部署于实体四旋翼飞行器,无需任何真实环境微调。

0
下载
关闭预览

相关内容

《复杂场景下自主着陆的模型预测控制技术》92页
专知会员服务
18+阅读 · 2025年8月11日
《迈向全自主超轻型无人机》最新124页论文
专知会员服务
40+阅读 · 2025年8月5日
《基于图神经网络与强化学习的自主空战决策研究》
专知会员服务
32+阅读 · 2025年5月15日
《使用强化学习的自主无人飞行器导航:综述》
专知会员服务
85+阅读 · 2023年6月18日
基于强化学习的空战动作生成
专知会员服务
138+阅读 · 2022年6月19日
概述自动机器学习(AutoML)
人工智能学家
19+阅读 · 2019年8月11日
【综述】自动机器学习AutoML最新65页综述,带你了解最新进展
中国人工智能学会
48+阅读 · 2019年5月3日
【无人机】无人机的自主与智能控制
产业智能官
53+阅读 · 2017年11月27日
无人机飞行控制方法概述
无人机
12+阅读 · 2017年10月7日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
7+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
5+阅读 · 6月17日
相关VIP内容
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员