基于改进噪声深度Q网络的无人机轨迹优化 (UAV Trajectory Optimization via Improved Noisy Deep Q-Network) - 专知论文

会员服务 ·

0

噪声 · 深度Q网络 · 轨迹优化 · DQN · 无人机 ·

UAV Trajectory Optimization via Improved Noisy Deep Q-Network

翻译：基于改进噪声深度Q网络的无人机轨迹优化

Zhang Hengyu,Maryam Cheraghy,Liu Wei,Armin Farhadi,Meysam Soltanpour,Zhong Zhuoqing

This paper proposes an Improved Noisy Deep Q-Network (Noisy DQN) to enhance the exploration and stability of Unmanned Aerial Vehicle (UAV) when applying deep reinforcement learning in simulated environments. This method enhances the exploration ability by combining the residual NoisyLinear layer with an adaptive noise scheduling mechanism, while improving training stability through smooth loss and soft target network updates. Experiments show that the proposed model achieves faster convergence and up to $+40$ higher rewards compared to standard DQN and quickly reach to the minimum number of steps required for the task 28 in the 15 * 15 grid navigation environment set up. The results show that our comprehensive improvements to the network structure of NoisyNet, exploration control, and training stability contribute to enhancing the efficiency and reliability of deep Q-learning.

翻译：本文提出一种改进的噪声深度Q网络（Noisy DQN），用于增强无人机在模拟环境中应用深度强化学习时的探索能力与稳定性。该方法通过将残差噪声线性层与自适应噪声调度机制相结合来提升探索能力，同时通过平滑损失函数和柔性目标网络更新来提高训练稳定性。实验表明，在15*15网格导航环境设定中，所提模型相比标准DQN实现了更快的收敛速度，奖励值最高提升$+40$，并能快速达到任务所需的最小步数28。结果表明，我们对NoisyNet网络结构、探索控制及训练稳定性的综合改进，有助于提升深度Q学习的效率与可靠性。

0

相关内容

《无人机飞行控制中的人工智能：基于深度强化学习的固定翼无人机高度保持策略》

《无人机飞行控制中的人工智能：基于深度强化学习的固定翼无人机高度保持策略》

专知会员服务

23+阅读 · 2025年9月7日

人工智能控制系统助力自主无人机在不确定环境中保持目标航迹：MIT最新研究成果（付论文）

人工智能控制系统助力自主无人机在不确定环境中保持目标航迹：MIT最新研究成果（付论文）

专知会员服务

24+阅读 · 2025年6月10日

改进型深度确定性策略梯度的无人机路径规划

改进型深度确定性策略梯度的无人机路径规划

专知会员服务

14+阅读 · 2025年5月1日

《用于预测和优化无人机蜂群轨迹的人工智能算法》最新论文

《用于预测和优化无人机蜂群轨迹的人工智能算法》最新论文

专知会员服务

40+阅读 · 2024年6月20日

基于强化学习的无人机自组网路由研究综述

基于强化学习的无人机自组网路由研究综述

专知会员服务

48+阅读 · 2023年9月9日

基于深度强化学习算法的无人机智能规避决策

基于深度强化学习算法的无人机智能规避决策

专知会员服务

83+阅读 · 2023年6月27日

基于深度学习的无人机目标检测研究综述

基于深度学习的无人机目标检测研究综述

专知会员服务

106+阅读 · 2023年6月22日

《小型无人机实时多模态定位和识别的深度学习》2023最新论文（含讲解PPT、演示视频），北约科技组织“分布式多光谱和多静态传感”会议

《小型无人机实时多模态定位和识别的深度学习》2023最新论文（含讲解PPT、演示视频），北约科技组织“分布式多光谱和多静态传感”会议

专知会员服务

75+阅读 · 2023年2月6日

【AI+军事】附论文《通过处理多通道声学和无线电频率信号实现无人机的识别和定位：一种深度学习方法》

【AI+军事】附论文《通过处理多通道声学和无线电频率信号实现无人机的识别和定位：一种深度学习方法》

专知会员服务

40+阅读 · 2022年4月24日

北理工最新《基于深度学习的无人机UAV目标检测与跟踪》研究综述论文，24页pdf227篇文献概述深度无人机目标检测进展

北理工最新《基于深度学习的无人机UAV目标检测与跟踪》研究综述论文，24页pdf227篇文献概述深度无人机目标检测进展

专知会员服务

163+阅读 · 2021年10月28日

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知

69+阅读 · 2022年12月3日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

专知

21+阅读 · 2019年12月31日

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

GAN生成式对抗网络

14+阅读 · 2019年5月23日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

【干货】Batch Normalization: 如何更快地训练深度神经网络

【干货】Batch Normalization: 如何更快地训练深度神经网络

专知

13+阅读 · 2018年3月6日

深度学习中的五大正则化方法和七大优化策略

深度学习中的五大正则化方法和七大优化策略

全球人工智能

11+阅读 · 2017年12月25日

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

量子位

10+阅读 · 2017年12月10日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

无人机飞行控制方法概述

无人机飞行控制方法概述

无人机

12+阅读 · 2017年10月7日

网络化非线性系统的协调控制及其在分布式可重构航天器中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于伴随方法、改进文化基因算法和kriging代理模型的涡扇发动机短舱减噪优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

无人机视频快速4-D重建及时空自适应索引方法研究

国家自然科学基金

8+阅读 · 2015年12月31日

噪声不确定下基于计算智能的多跳认知无线电网络协作频谱感知优化

国家自然科学基金

0+阅读 · 2015年12月31日

高动态编队无人机自主高精度时间同步方法研究

国家自然科学基金

11+阅读 · 2013年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

无人机协同组网感知融合与传感器管理关键技术研究

国家自然科学基金

27+阅读 · 2011年12月31日

非确定环境下基于分层理论的无人机多机协同控制算法研究

国家自然科学基金

12+阅读 · 2010年12月31日

Voice-Driven Semantic Perception for UAV-Assisted Emergency Networks

Arxiv

0+阅读 · 2月19日

Deep Reinforcement Learning based Autonomous Decision-Making for Cooperative UAVs: A Search and Rescue Real World Application

Arxiv

0+阅读 · 2月16日

A two-step approach for speech enhancement in low-SNR scenarios using cyclostationary beamforming and DNNs

Arxiv

0+阅读 · 2月13日

Quantum Takes Flight: Two-Stage Resilient Topology Optimization for UAV Networks

Arxiv

0+阅读 · 2月12日

Multi-UAV Trajectory Optimization for Bearing-Only Localization in GPS Denied Environments

Arxiv

0+阅读 · 2月11日

UAV-Assisted Resilience in 6G and Beyond Network Energy Saving: A Multi-Agent DRL Approach

Arxiv

0+阅读 · 2月9日

Deep Transformer Network for Monocular Pose Estimation of Shipborne Unmanned Aerial Vehicle

Arxiv

0+阅读 · 2月2日

Quantum Takes Flight: Two-Stage Resilient Topology Optimization for UAV Networks

Arxiv

0+阅读 · 1月27日

3D UAV Trajectory Design for Fair and Energy-Efficient Communication: A Deep Reinforcement Learning Technique

Arxiv

0+阅读 · 1月16日

UAV-enabled Computing Power Networks: Task Completion Probability Analysis

Arxiv

0+阅读 · 1月15日

VIP会员

文章信息

相关主题

相关VIP内容

《无人机飞行控制中的人工智能：基于深度强化学习的固定翼无人机高度保持策略》

《无人机飞行控制中的人工智能：基于深度强化学习的固定翼无人机高度保持策略》

专知会员服务

23+阅读 · 2025年9月7日

人工智能控制系统助力自主无人机在不确定环境中保持目标航迹：MIT最新研究成果（付论文）

人工智能控制系统助力自主无人机在不确定环境中保持目标航迹：MIT最新研究成果（付论文）

专知会员服务

24+阅读 · 2025年6月10日

改进型深度确定性策略梯度的无人机路径规划

改进型深度确定性策略梯度的无人机路径规划

专知会员服务

14+阅读 · 2025年5月1日

《用于预测和优化无人机蜂群轨迹的人工智能算法》最新论文

《用于预测和优化无人机蜂群轨迹的人工智能算法》最新论文

专知会员服务

40+阅读 · 2024年6月20日

基于强化学习的无人机自组网路由研究综述

基于强化学习的无人机自组网路由研究综述

专知会员服务

48+阅读 · 2023年9月9日

基于深度强化学习算法的无人机智能规避决策

基于深度强化学习算法的无人机智能规避决策

专知会员服务

83+阅读 · 2023年6月27日

基于深度学习的无人机目标检测研究综述

基于深度学习的无人机目标检测研究综述

专知会员服务

106+阅读 · 2023年6月22日

《小型无人机实时多模态定位和识别的深度学习》2023最新论文（含讲解PPT、演示视频），北约科技组织“分布式多光谱和多静态传感”会议

《小型无人机实时多模态定位和识别的深度学习》2023最新论文（含讲解PPT、演示视频），北约科技组织“分布式多光谱和多静态传感”会议

专知会员服务

75+阅读 · 2023年2月6日

【AI+军事】附论文《通过处理多通道声学和无线电频率信号实现无人机的识别和定位：一种深度学习方法》

【AI+军事】附论文《通过处理多通道声学和无线电频率信号实现无人机的识别和定位：一种深度学习方法》

专知会员服务

40+阅读 · 2022年4月24日

北理工最新《基于深度学习的无人机UAV目标检测与跟踪》研究综述论文，24页pdf227篇文献概述深度无人机目标检测进展

北理工最新《基于深度学习的无人机UAV目标检测与跟踪》研究综述论文，24页pdf227篇文献概述深度无人机目标检测进展

专知会员服务

163+阅读 · 2021年10月28日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知

69+阅读 · 2022年12月3日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

专知

21+阅读 · 2019年12月31日

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

GAN生成式对抗网络

14+阅读 · 2019年5月23日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

【干货】Batch Normalization: 如何更快地训练深度神经网络

【干货】Batch Normalization: 如何更快地训练深度神经网络

专知

13+阅读 · 2018年3月6日

深度学习中的五大正则化方法和七大优化策略

深度学习中的五大正则化方法和七大优化策略

全球人工智能

11+阅读 · 2017年12月25日

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

量子位

10+阅读 · 2017年12月10日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

无人机飞行控制方法概述

无人机飞行控制方法概述

无人机

12+阅读 · 2017年10月7日

相关论文

Voice-Driven Semantic Perception for UAV-Assisted Emergency Networks

Arxiv

0+阅读 · 2月19日

Deep Reinforcement Learning based Autonomous Decision-Making for Cooperative UAVs: A Search and Rescue Real World Application

Arxiv

0+阅读 · 2月16日

A two-step approach for speech enhancement in low-SNR scenarios using cyclostationary beamforming and DNNs

Arxiv

0+阅读 · 2月13日

Quantum Takes Flight: Two-Stage Resilient Topology Optimization for UAV Networks

Arxiv

0+阅读 · 2月12日

Multi-UAV Trajectory Optimization for Bearing-Only Localization in GPS Denied Environments

Arxiv

0+阅读 · 2月11日

UAV-Assisted Resilience in 6G and Beyond Network Energy Saving: A Multi-Agent DRL Approach

Arxiv

0+阅读 · 2月9日

Deep Transformer Network for Monocular Pose Estimation of Shipborne Unmanned Aerial Vehicle

Arxiv

0+阅读 · 2月2日

Quantum Takes Flight: Two-Stage Resilient Topology Optimization for UAV Networks

Arxiv

0+阅读 · 1月27日

3D UAV Trajectory Design for Fair and Energy-Efficient Communication: A Deep Reinforcement Learning Technique

Arxiv

0+阅读 · 1月16日

UAV-enabled Computing Power Networks: Task Completion Probability Analysis

Arxiv

0+阅读 · 1月15日

相关基金

网络化非线性系统的协调控制及其在分布式可重构航天器中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于伴随方法、改进文化基因算法和kriging代理模型的涡扇发动机短舱减噪优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

无人机视频快速4-D重建及时空自适应索引方法研究

国家自然科学基金

8+阅读 · 2015年12月31日

噪声不确定下基于计算智能的多跳认知无线电网络协作频谱感知优化

国家自然科学基金

0+阅读 · 2015年12月31日

高动态编队无人机自主高精度时间同步方法研究

国家自然科学基金

11+阅读 · 2013年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

无人机协同组网感知融合与传感器管理关键技术研究

国家自然科学基金

27+阅读 · 2011年12月31日

非确定环境下基于分层理论的无人机多机协同控制算法研究

国家自然科学基金

12+阅读 · 2010年12月31日

微信扫码咨询专知VIP会员