E2E-Fly: An Integrated Training-to-Deployment System for End-to-End Quadrotor Autonomy - 专知论文

会员服务 ·

0

系统 · 端到端 · 集成 · E2E · 物理学 ·

E2E-Fly: An Integrated Training-to-Deployment System for End-to-End Quadrotor Autonomy

翻译：E2E-Fly：面向端到端四旋翼自主飞行的集成训练到部署系统

Fangyu Sun,Fanxing Li,Linzuo Zhang,Yu Hu,Renbiao Jin,Shuyu Wu,Wenxian Yu,Danping Zou

Training and transferring learning-based policies for quadrotors from simulation to reality remains challenging due to inefficient visual rendering, physical modeling inaccuracies, unmodeled sensor discrepancies, and the absence of a unified platform integrating differentiable physics learning into end-to-end training. While recent work has demonstrated various end-to-end quadrotor control tasks, few systems provide a systematic, zero-shot transfer pipeline, hindering reproducibility and real-world deployment. To bridge this gap, we introduce E2E-Fly, an integrated framework featuring an agile quadrotor platform coupled with a full-stack training, validation, and deployment workflow. The training framework incorporates a high-performance simulator with support for differentiable physics learning and reinforcement learning, alongside structured reward design tailored to common quadrotor tasks. We further introduce a two-stage validation strategy using sim-to-sim transfer and hardware-in-the-loop testing, and deploy policies onto two physical quadrotor platforms via a dedicated low-level control interface and a comprehensive sim-to-real alignment methodology, encompassing system identification, domain randomization, latency compensation, and noise modeling. To the best of our knowledge, this is the first work to systematically unify differentiable physical learning with training, validation, and real-world deployment for quadrotors. Finally, we demonstrate the effectiveness of our framework for training six end-to-end control tasks and deploy them in the real world.

翻译：由于低效的视觉渲染、物理建模不准确、未建模的传感器差异，以及缺乏将可微物理学习集成到端到端训练中的统一平台，训练并迁移基于学习的四旋翼策略从仿真到现实仍具挑战性。尽管近期工作展示了多种端到端四旋翼控制任务，但很少有系统提供系统化的零样本迁移管线，阻碍了可复现性与实际部署。为弥补这一差距，我们提出E2E-Fly——一个集成了敏捷四旋翼平台与全栈训练、验证及部署工作流的统一框架。训练框架包含高性能仿真器，支持可微物理学习与强化学习，并配备针对常见四旋翼任务设计的结构化奖励函数。我们进一步引入两阶段验证策略（仿真到仿真迁移与硬件在环测试），并通过专用底层控制接口及涵盖系统辨识、域随机化、延迟补偿与噪声建模的综合仿真到现实对齐方法，将策略部署至两个实体四旋翼平台。据我们所知，这是首个系统性地将可微物理学习与四旋翼训练、验证及实际部署相统一的工作。最后，我们展示该框架在训练六项端到端控制任务中的有效性，并完成实际环境部署。

0

相关内容

全面的反无人机系统培训计划

全面的反无人机系统培训计划

专知会员服务

13+阅读 · 4月27日

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

专知会员服务

15+阅读 · 4月24日

《基于多智能体强化学习的异构平台数据驱动分布式共同作战图》最新论文

《基于多智能体强化学习的异构平台数据驱动分布式共同作战图》最新论文

专知会员服务

72+阅读 · 2025年2月21日

端到端自动驾驶系统研究综述

端到端自动驾驶系统研究综述

专知会员服务

31+阅读 · 2024年11月29日

《驾驶舱还是指挥中心？协同作战飞机的 C2 选项》

《驾驶舱还是指挥中心？协同作战飞机的 C2 选项》

专知会员服务

43+阅读 · 2024年11月9日

基于四旋翼无人机的协同跟踪系统

基于四旋翼无人机的协同跟踪系统

专知会员服务

20+阅读 · 2024年9月25日

《用于水下目标定位的平台便携式强化学习方法》

《用于水下目标定位的平台便携式强化学习方法》

专知会员服务

28+阅读 · 2024年1月2日

推荐！【DARPA终身学习机器（L2M）项目支持】《自主系统中用于感知和行动的终身学习》美国空军、宾夕法尼亚大学2022最新234页技术总结报告

推荐！【DARPA终身学习机器（L2M）项目支持】《自主系统中用于感知和行动的终身学习》美国空军、宾夕法尼亚大学2022最新234页技术总结报告

专知会员服务

139+阅读 · 2022年11月23日

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

专知会员服务

70+阅读 · 2022年10月29日

《强风下四轴飞行器的自适应非线性控制》美国陆军研究实验室2022最新28页技术报告

《强风下四轴飞行器的自适应非线性控制》美国陆军研究实验室2022最新28页技术报告

专知会员服务

33+阅读 · 2022年10月21日

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

27+阅读 · 2022年11月24日

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

专知

39+阅读 · 2022年10月30日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

66+阅读 · 2022年8月25日

干货教程！百度AutoDL「自动深度学习: 理论、算法、平台和应用」132PPT

干货教程！百度AutoDL「自动深度学习: 理论、算法、平台和应用」132PPT

专知

21+阅读 · 2020年2月5日

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

专知

21+阅读 · 2019年12月31日

八千字长文深度解读，迁移学习在强化学习中的应用及最新进展

八千字长文深度解读，迁移学习在强化学习中的应用及最新进展

机器之心

13+阅读 · 2019年10月17日

国外有人/无人平台协同作战概述

国外有人/无人平台协同作战概述

无人机

124+阅读 · 2019年5月28日

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

AINLP

35+阅读 · 2018年11月6日

【智能制造】见识一下某航空企业的智能制造技术架构！

【智能制造】见识一下某航空企业的智能制造技术架构！

产业智能官

13+阅读 · 2017年12月7日

无人机飞行控制方法概述

无人机飞行控制方法概述

无人机

13+阅读 · 2017年10月7日

基于自动导航的旋翼式微小型无人机农作物遥感信息解析方法

国家自然科学基金

4+阅读 · 2015年12月31日

高超声速飞行器超紧耦合自主可靠导航方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

多旋翼无人飞行器大机动轨迹跟踪飞行非线性鲁棒控制

国家自然科学基金

2+阅读 · 2015年12月31日

非平面式多旋翼系统气动布局优化及可修正补偿的控制方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

多旋翼空中操作机器人的一体化设计及动态运动规划

国家自然科学基金

1+阅读 · 2015年12月31日

倾转旋翼飞行器模态转换阶段非线性控制方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

CARLA-Air: Fly Drones Inside a CARLA World -- A Unified Infrastructure for Air-Ground Embodied Intelligence

Arxiv

0+阅读 · 4月22日

Goal2Skill: Long-Horizon Manipulation with Adaptive Planning and Reflection

Arxiv

0+阅读 · 4月15日

INCRT: An Incremental Transformer That Determines Its Own Architecture

Arxiv

0+阅读 · 4月12日

Fail2Drive: Benchmarking Closed-Loop Driving Generalization

Arxiv

0+阅读 · 4月9日

E2Edev: Benchmarking Large Language Models in End-to-End Software Development Task

Arxiv

0+阅读 · 4月9日

DreamerAD: Efficient Reinforcement Learning via Latent World Model for Autonomous Driving

Arxiv

0+阅读 · 3月25日

Decentralized End-to-End Multi-AAV Pursuit Using Predictive Spatio-Temporal Observation via Deep Reinforcement Learning

Arxiv

0+阅读 · 3月25日

Latent Action Diffusion for Cross-Embodiment Manipulation

Arxiv

0+阅读 · 3月20日

AGILE: A Comprehensive Workflow for Humanoid Loco-Manipulation Learning

Arxiv

0+阅读 · 3月20日

GustPilot: A Hierarchical DRL-INDI Framework for Wind-Resilient Quadrotor Navigation

Arxiv

0+阅读 · 3月20日

VIP会员

文章信息

相关主题

最新内容

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

12+阅读 · 7月19日

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

7+阅读 · 7月19日

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

7+阅读 · 7月19日

《无人机蜂群通信技术研究》50页

《无人机蜂群通信技术研究》50页

专知会员服务

8+阅读 · 7月19日

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

专知会员服务

10+阅读 · 7月18日

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

专知会员服务

8+阅读 · 7月18日

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

专知会员服务

13+阅读 · 7月18日

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

专知会员服务

9+阅读 · 7月18日

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

专知会员服务

10+阅读 · 7月17日

《边缘端实时无线感知赋能现场多机器人部署》200页

《边缘端实时无线感知赋能现场多机器人部署》200页

专知会员服务

10+阅读 · 7月17日

战力倍增器：自主武器系统与乌克兰及加沙冲突

战力倍增器：自主武器系统与乌克兰及加沙冲突

专知会员服务

6+阅读 · 7月17日

人工智能赋能战场情报：提速决策进程

人工智能赋能战场情报：提速决策进程

专知会员服务

6+阅读 · 7月17日

《拥抱新兴技术：面向未来军官的教育革新》

《拥抱新兴技术：面向未来军官的教育革新》

专知会员服务

8+阅读 · 7月17日

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

专知会员服务

6+阅读 · 7月17日

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

专知会员服务

7+阅读 · 7月17日

相关VIP内容

全面的反无人机系统培训计划

全面的反无人机系统培训计划

专知会员服务

13+阅读 · 4月27日

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

专知会员服务

15+阅读 · 4月24日

《基于多智能体强化学习的异构平台数据驱动分布式共同作战图》最新论文

《基于多智能体强化学习的异构平台数据驱动分布式共同作战图》最新论文

专知会员服务

72+阅读 · 2025年2月21日

端到端自动驾驶系统研究综述

端到端自动驾驶系统研究综述

专知会员服务

31+阅读 · 2024年11月29日

《驾驶舱还是指挥中心？协同作战飞机的 C2 选项》

《驾驶舱还是指挥中心？协同作战飞机的 C2 选项》

专知会员服务

43+阅读 · 2024年11月9日

基于四旋翼无人机的协同跟踪系统

基于四旋翼无人机的协同跟踪系统

专知会员服务

20+阅读 · 2024年9月25日

《用于水下目标定位的平台便携式强化学习方法》

《用于水下目标定位的平台便携式强化学习方法》

专知会员服务

28+阅读 · 2024年1月2日

推荐！【DARPA终身学习机器（L2M）项目支持】《自主系统中用于感知和行动的终身学习》美国空军、宾夕法尼亚大学2022最新234页技术总结报告

推荐！【DARPA终身学习机器（L2M）项目支持】《自主系统中用于感知和行动的终身学习》美国空军、宾夕法尼亚大学2022最新234页技术总结报告

专知会员服务

139+阅读 · 2022年11月23日

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

专知会员服务

70+阅读 · 2022年10月29日

《强风下四轴飞行器的自适应非线性控制》美国陆军研究实验室2022最新28页技术报告

《强风下四轴飞行器的自适应非线性控制》美国陆军研究实验室2022最新28页技术报告

专知会员服务

33+阅读 · 2022年10月21日

热门VIP内容

开通专知VIP会员享更多权益服务

锻造未来士兵：外骨骼、基因工程与赛博格

《无人机蜂群通信技术研究》50页

深入Project Maven：为何人工智能在战场上依然失灵

《无人机系统（UAS）通信网状网络试验性部署》50页报告

相关资讯

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

27+阅读 · 2022年11月24日

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

专知

39+阅读 · 2022年10月30日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

66+阅读 · 2022年8月25日

干货教程！百度AutoDL「自动深度学习: 理论、算法、平台和应用」132PPT

干货教程！百度AutoDL「自动深度学习: 理论、算法、平台和应用」132PPT

专知

21+阅读 · 2020年2月5日

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

专知

21+阅读 · 2019年12月31日

八千字长文深度解读，迁移学习在强化学习中的应用及最新进展

八千字长文深度解读，迁移学习在强化学习中的应用及最新进展

机器之心

13+阅读 · 2019年10月17日

国外有人/无人平台协同作战概述

国外有人/无人平台协同作战概述

无人机

124+阅读 · 2019年5月28日

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

AINLP

35+阅读 · 2018年11月6日

【智能制造】见识一下某航空企业的智能制造技术架构！

【智能制造】见识一下某航空企业的智能制造技术架构！

产业智能官

13+阅读 · 2017年12月7日

无人机飞行控制方法概述

无人机飞行控制方法概述

无人机

13+阅读 · 2017年10月7日

相关论文

CARLA-Air: Fly Drones Inside a CARLA World -- A Unified Infrastructure for Air-Ground Embodied Intelligence

Arxiv

0+阅读 · 4月22日

Goal2Skill: Long-Horizon Manipulation with Adaptive Planning and Reflection

Arxiv

0+阅读 · 4月15日

INCRT: An Incremental Transformer That Determines Its Own Architecture

Arxiv

0+阅读 · 4月12日

Fail2Drive: Benchmarking Closed-Loop Driving Generalization

Arxiv

0+阅读 · 4月9日

E2Edev: Benchmarking Large Language Models in End-to-End Software Development Task

Arxiv

0+阅读 · 4月9日

DreamerAD: Efficient Reinforcement Learning via Latent World Model for Autonomous Driving

Arxiv

0+阅读 · 3月25日

Decentralized End-to-End Multi-AAV Pursuit Using Predictive Spatio-Temporal Observation via Deep Reinforcement Learning

Arxiv

0+阅读 · 3月25日

Latent Action Diffusion for Cross-Embodiment Manipulation

Arxiv

0+阅读 · 3月20日

AGILE: A Comprehensive Workflow for Humanoid Loco-Manipulation Learning

Arxiv

0+阅读 · 3月20日

GustPilot: A Hierarchical DRL-INDI Framework for Wind-Resilient Quadrotor Navigation

Arxiv

0+阅读 · 3月20日

相关基金

基于自动导航的旋翼式微小型无人机农作物遥感信息解析方法

国家自然科学基金

4+阅读 · 2015年12月31日

高超声速飞行器超紧耦合自主可靠导航方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

多旋翼无人飞行器大机动轨迹跟踪飞行非线性鲁棒控制

国家自然科学基金

2+阅读 · 2015年12月31日

非平面式多旋翼系统气动布局优化及可修正补偿的控制方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

多旋翼空中操作机器人的一体化设计及动态运动规划

国家自然科学基金

1+阅读 · 2015年12月31日

倾转旋翼飞行器模态转换阶段非线性控制方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员