Autonomous Aerial Manipulation via Contextual Contrastive Meta Reinforcement Learning - 专知论文

会员服务 ·

0

上下文 · 元强化学习 · 动力学特性 · 力学特性 · 系统 ·

Autonomous Aerial Manipulation via Contextual Contrastive Meta Reinforcement Learning

翻译：自主空中操纵：基于上下文对比元强化学习

Lixuan Jin,Bingxuan Lan,Xinyi Bao,Xiangyuan Xie,Chunjie Zhang,Zheng Chen,Tianshuo Liu,Ruijie Tian,Jinyu Ru,Gang Wang,Lei Yuan,Yang Yu

Unmanned aerial vehicles (UAVs) are increasingly being deployed in logistics, service robotics, and other real-world applications, creating a growing demand for autonomous payload acquisition and delivery. Existing approaches typically assume pre-attached payloads or rely on specialized grippers, leaving versatile end-to-end aerial delivery largely unresolved, where different payloads induce highly variable flight dynamics, requiring a single policy to adapt online without manual calibration or explicit system identification. To this end, we study \textbf{A}utonomous \textbf{A}erial Manipulation via \textbf{Co}ntextual \textbf{Co}ntrastive Meta Reinforcement Learning (\textbf{\textit{Aco2}}), a fully autonomous aerial delivery setting in which a quadrotor equipped with a lightweight hook continuously picks up, transports, and delivers diverse handle-equipped objects between randomized locations, all without human intervention. First, we design a contextual observation encoder that infers a compact latent context from recent interaction history, enabling the policy to adapt online to payload-dependent dynamics. To further improve the quality of this context, we introduce a contrastive objective that structures the context embedding around task-relevant variations, improving generalization across diverse payloads without requiring explicit system identification. Trained entirely in simulation with extensive domain randomization, \textit{Aco2} can be directly deployed on a physical quadrotor without real-world fine-tuning.

翻译：无人机正越来越多地部署于物流、服务机器人及其他实际应用中，这催生了对其自主载荷抓取与递送功能的日益增长的需求。现有方法通常假设载荷已预先固定，或依赖专用夹持器，导致通用的端到端空中递送问题尚未得到充分解决——不同载荷会引发高度变化的飞行动力学特性，要求单一策略在不依赖人工校准或明确系统辨识的情况下实现在线自适应。为此，我们研究了基于上下文对比元强化学习的自主空中操纵（Aco2），这是一种全自主空中递送场景：配备轻量化挂钩的四旋翼飞行器在随机位置之间持续执行抓取、运输和递送多种带手柄载荷的任务，全程无需人工干预。首先，我们设计了一个上下文观测编码器，用于从近期交互历史中推断出紧凑的潜在上下文表征，使策略能够在线适应依赖载荷的动力学特性。为进一步提升该上下文表征的质量，我们引入了一个对比学习目标函数，通过围绕任务相关变化构建上下文嵌入结构，从而在无需显式系统辨识的前提下，增强策略对多样化载荷的泛化能力。完全在仿真环境中通过广泛域随机化训练的Aco2能够直接部署于实体四旋翼飞行器，无需任何真实环境微调。

0

相关内容

上下文

《面向多智能体系统管理的混合人工智能架构：无人机集群控制的模块化强化学习框架研究》2026最新185页

《面向多智能体系统管理的混合人工智能架构：无人机集群控制的模块化强化学习框架研究》2026最新185页

专知会员服务

33+阅读 · 6月29日

《模拟空域：释放人工智能实现自适应空中防御》2025年最新文献

《模拟空域：释放人工智能实现自适应空中防御》2025年最新文献

专知会员服务

52+阅读 · 2025年9月27日

《复杂场景下自主着陆的模型预测控制技术》92页

《复杂场景下自主着陆的模型预测控制技术》92页

专知会员服务

18+阅读 · 2025年8月11日

《迈向全自主超轻型无人机》最新124页论文

《迈向全自主超轻型无人机》最新124页论文

专知会员服务

40+阅读 · 2025年8月5日

《基于图神经网络与强化学习的自主空战决策研究》

《基于图神经网络与强化学习的自主空战决策研究》

专知会员服务

33+阅读 · 2025年5月15日

《自主先进空中机动性——无人机及其他飞行器的端到端自主框架》

《自主先进空中机动性——无人机及其他飞行器的端到端自主框架》

专知会员服务

81+阅读 · 2024年3月6日

《使用强化学习的自主无人飞行器导航：综述》

《使用强化学习的自主无人飞行器导航：综述》

专知会员服务

86+阅读 · 2023年6月18日

《综述：自主无人机竞赛》2023最新20页论文，苏黎世大学

《综述：自主无人机竞赛》2023最新20页论文，苏黎世大学

专知会员服务

44+阅读 · 2023年2月2日

基于强化学习的空战动作生成

基于强化学习的空战动作生成

专知会员服务

139+阅读 · 2022年6月19日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

123+阅读 · 2020年5月18日

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

27+阅读 · 2022年11月24日

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

专知

75+阅读 · 2022年11月19日

推荐！《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》【博士论文】2022最新325页论文

推荐！《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》【博士论文】2022最新325页论文

专知

28+阅读 · 2022年10月22日

国防军工行业航空装备深度报告：军用无人机，45页pdf

国防军工行业航空装备深度报告：军用无人机，45页pdf

专知

34+阅读 · 2022年8月14日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

111+阅读 · 2022年4月28日

概述自动机器学习（AutoML）

概述自动机器学习（AutoML）

人工智能学家

19+阅读 · 2019年8月11日

【综述】自动机器学习AutoML最新65页综述，带你了解最新进展

【综述】自动机器学习AutoML最新65页综述，带你了解最新进展

中国人工智能学会

48+阅读 · 2019年5月3日

【无人机】无人机的自主与智能控制

【无人机】无人机的自主与智能控制

产业智能官

54+阅读 · 2017年11月27日

无人机飞行控制方法概述

无人机飞行控制方法概述

无人机

13+阅读 · 2017年10月7日

高超声速飞行器超紧耦合自主可靠导航方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

多旋翼无人飞行器大机动轨迹跟踪飞行非线性鲁棒控制

国家自然科学基金

2+阅读 · 2015年12月31日

多旋翼空中操作机器人的一体化设计及动态运动规划

国家自然科学基金

1+阅读 · 2015年12月31日

倾转旋翼飞行器模态转换阶段非线性控制方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

几何/拓扑混合空间中的仿生导航方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

机器灵巧手基于触滑觉信息协同的自适应力控制方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

Memory-Efficient Meta-Reinforcement Learning for Adaptive Safety-Critical Control in Adversarial Spacecraft Proximity Operations

Arxiv

0+阅读 · 6月16日

Reinforcement Learning with Inner-loop Dynamics Estimator for Aerial Manipulation under Uncertainty

Arxiv

0+阅读 · 6月15日

Learning Context-Aware Neural ODE Dynamics for Adaptive Robotic Control

Arxiv

0+阅读 · 6月13日

AerialClaw: An Open-Source Framework for LLM-Driven Autonomous Aerial Agents

Arxiv

2+阅读 · 6月10日

RAPTOR: Rapid Aerial Pickup and Transport of Objects by Robots

Arxiv

0+阅读 · 6月9日

IMPACT: Learning Internal-Model Predictive Control for Forceful Robotic Manipulation

Arxiv

0+阅读 · 6月9日

Decentralized End-to-End Multi-AAV Pursuit Using Predictive Spatio-Temporal Observation via Deep Reinforcement Learning

Arxiv

0+阅读 · 6月7日

Towards End to End Motion Planning and Execution for Autonomous Underwater Vehicles Using Reinforcement Learning

Arxiv

0+阅读 · 6月7日

CrazyMARL: Decentralized Direct Motor Control Policies for Cooperative Aerial Transport of Cable-Suspended Payloads

Arxiv

0+阅读 · 5月31日

Hierarchical Multi-Agent Reinforcement Learning for Air Combat Maneuvering

Arxiv

49+阅读 · 2023年9月20日

VIP会员

文章信息

相关主题

元强化学习

动力学特性

最新内容

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

专知会员服务

2+阅读 · 今天7:13

俄乌无人机战争的六大启示

俄乌无人机战争的六大启示

专知会员服务

4+阅读 · 今天7:07

《无人机空中监控：通信实验洞察》

《无人机空中监控：通信实验洞察》

专知会员服务

3+阅读 · 今天7:05

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

专知会员服务

3+阅读 · 今天6:59

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

12+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

5+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

10+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

12+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

6+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

10+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

8+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

9+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

8+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

6+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

相关VIP内容

《面向多智能体系统管理的混合人工智能架构：无人机集群控制的模块化强化学习框架研究》2026最新185页

《面向多智能体系统管理的混合人工智能架构：无人机集群控制的模块化强化学习框架研究》2026最新185页

专知会员服务

33+阅读 · 6月29日

《模拟空域：释放人工智能实现自适应空中防御》2025年最新文献

《模拟空域：释放人工智能实现自适应空中防御》2025年最新文献

专知会员服务

52+阅读 · 2025年9月27日

《复杂场景下自主着陆的模型预测控制技术》92页

《复杂场景下自主着陆的模型预测控制技术》92页

专知会员服务

18+阅读 · 2025年8月11日

《迈向全自主超轻型无人机》最新124页论文

《迈向全自主超轻型无人机》最新124页论文

专知会员服务

40+阅读 · 2025年8月5日

《基于图神经网络与强化学习的自主空战决策研究》

《基于图神经网络与强化学习的自主空战决策研究》

专知会员服务

33+阅读 · 2025年5月15日

《自主先进空中机动性——无人机及其他飞行器的端到端自主框架》

《自主先进空中机动性——无人机及其他飞行器的端到端自主框架》

专知会员服务

81+阅读 · 2024年3月6日

《使用强化学习的自主无人飞行器导航：综述》

《使用强化学习的自主无人飞行器导航：综述》

专知会员服务

86+阅读 · 2023年6月18日

《综述：自主无人机竞赛》2023最新20页论文，苏黎世大学

《综述：自主无人机竞赛》2023最新20页论文，苏黎世大学

专知会员服务

44+阅读 · 2023年2月2日

基于强化学习的空战动作生成

基于强化学习的空战动作生成

专知会员服务

139+阅读 · 2022年6月19日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

123+阅读 · 2020年5月18日

热门VIP内容

开通专知VIP会员享更多权益服务

俄乌无人机战争的六大启示

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《无人机空中监控：通信实验洞察》

相关资讯

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

27+阅读 · 2022年11月24日

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

专知

75+阅读 · 2022年11月19日

推荐！《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》【博士论文】2022最新325页论文

推荐！《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》【博士论文】2022最新325页论文

专知

28+阅读 · 2022年10月22日

国防军工行业航空装备深度报告：军用无人机，45页pdf

国防军工行业航空装备深度报告：军用无人机，45页pdf

专知

34+阅读 · 2022年8月14日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

111+阅读 · 2022年4月28日

概述自动机器学习（AutoML）

概述自动机器学习（AutoML）

人工智能学家

19+阅读 · 2019年8月11日

【综述】自动机器学习AutoML最新65页综述，带你了解最新进展

【综述】自动机器学习AutoML最新65页综述，带你了解最新进展

中国人工智能学会

48+阅读 · 2019年5月3日

【无人机】无人机的自主与智能控制

【无人机】无人机的自主与智能控制

产业智能官

54+阅读 · 2017年11月27日

无人机飞行控制方法概述

无人机飞行控制方法概述

无人机

13+阅读 · 2017年10月7日

相关论文

Memory-Efficient Meta-Reinforcement Learning for Adaptive Safety-Critical Control in Adversarial Spacecraft Proximity Operations

Arxiv

0+阅读 · 6月16日

Reinforcement Learning with Inner-loop Dynamics Estimator for Aerial Manipulation under Uncertainty

Arxiv

0+阅读 · 6月15日

Learning Context-Aware Neural ODE Dynamics for Adaptive Robotic Control

Arxiv

0+阅读 · 6月13日

AerialClaw: An Open-Source Framework for LLM-Driven Autonomous Aerial Agents

Arxiv

2+阅读 · 6月10日

RAPTOR: Rapid Aerial Pickup and Transport of Objects by Robots

Arxiv

0+阅读 · 6月9日

IMPACT: Learning Internal-Model Predictive Control for Forceful Robotic Manipulation

Arxiv

0+阅读 · 6月9日

Decentralized End-to-End Multi-AAV Pursuit Using Predictive Spatio-Temporal Observation via Deep Reinforcement Learning

Arxiv

0+阅读 · 6月7日

Towards End to End Motion Planning and Execution for Autonomous Underwater Vehicles Using Reinforcement Learning

Arxiv

0+阅读 · 6月7日

CrazyMARL: Decentralized Direct Motor Control Policies for Cooperative Aerial Transport of Cable-Suspended Payloads

Arxiv

0+阅读 · 5月31日

Hierarchical Multi-Agent Reinforcement Learning for Air Combat Maneuvering

Arxiv

49+阅读 · 2023年9月20日

相关基金

高超声速飞行器超紧耦合自主可靠导航方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

多旋翼无人飞行器大机动轨迹跟踪飞行非线性鲁棒控制

国家自然科学基金

2+阅读 · 2015年12月31日

多旋翼空中操作机器人的一体化设计及动态运动规划

国家自然科学基金

1+阅读 · 2015年12月31日

倾转旋翼飞行器模态转换阶段非线性控制方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

几何/拓扑混合空间中的仿生导航方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

机器灵巧手基于触滑觉信息协同的自适应力控制方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员