Diffusion Offline Reinforcement Learning for Fair and Energy-Efficient UAV-Assisted Wireless Networks - 专知论文

会员服务 ·

0

离线强化学习 · 系统 · SAC · 鲁棒 · 数据集 ·

Diffusion Offline Reinforcement Learning for Fair and Energy-Efficient UAV-Assisted Wireless Networks

翻译：扩散离线强化学习用于公平节能的无人机辅助无线网络

Eslam Eldeeb,Hirley Alves

The integration of generative artificial intelligence with wireless communication and signal processing systems has opened new avenues for intelligent, data-driven decision-making in future 6G networks. This work proposes a diffusion soft actor-critic (Diffusion-SAC) approach that leverages offline reinforcement learning (RL) enhanced by denoising diffusion probabilistic models (DDPMs) to optimize trajectory and scheduling control in unmanned aerial vehicle (UAV) networks. While offline RL methods, such as conservative Q-learning (CQL), can learn from static datasets, they often struggle to generalize in low-data or dynamic conditions. To address this, we combine the robustness of CQL with the generative power of diffusion models, enabling expressive and signal-aware policy learning that generalizes beyond behavior policies. Applied to a UAV-assisted wireless network, the proposed framework minimizes transmission energy and improves fairness among devices. Simulations show that Diffusion-SAC outperforms standard offline RL baselines, achieving more stable convergence and higher rewards even with limited datasets. The method enhances data efficiency, reduces energy consumption, and increases throughput by more than 35 % compared to existing algorithms, demonstrating its potential for robust policy learning in next-generation wireless control systems.

翻译：生成式人工智能与无线通信及信号处理系统的融合，为未来6G网络中智能、数据驱动的决策开辟了新途径。本文提出一种扩散软演员-评论家（Diffusion-SAC）方法，利用去噪扩散概率模型（DDPMs）增强的离线强化学习（RL）来优化无人机（UAV）网络中的轨迹与调度控制。虽然离线RL方法（如保守Q学习（CQL））能够从静态数据集中学习，但它们在低数据或动态条件下常难以泛化。为解决这一问题，我们将CQL的鲁棒性与扩散模型的生成能力相结合，实现了超越行为策略的、富有表现力且感知信号的策略学习。将该框架应用于无人机辅助无线网络，可最小化传输能量并提升设备间的公平性。仿真表明，Diffusion-SAC优于标准离线RL基线，即使数据集有限也能实现更稳定的收敛和更高的奖励。与现有算法相比，该方法提升了数据效率，降低了能耗，并将吞吐量提高了35%以上，展示了其在下一代无线控制系统中的鲁棒策略学习潜力。

0

相关内容

离线强化学习

离线强化学习

《强化学习在无人机作战应用中的现存差距》2025最新29页综述

《强化学习在无人机作战应用中的现存差距》2025最新29页综述

专知会员服务

48+阅读 · 2025年5月17日

《无人机辅助的天空地一体化网络：学习算法技术综述》

《无人机辅助的天空地一体化网络：学习算法技术综述》

专知会员服务

51+阅读 · 2025年3月11日

《智能无人机扩散模型：决策与建模》最新论文

《智能无人机扩散模型：决策与建模》最新论文

专知会员服务

43+阅读 · 2025年1月19日

《用于预测和优化无人机蜂群轨迹的人工智能算法》最新论文

《用于预测和优化无人机蜂群轨迹的人工智能算法》最新论文

专知会员服务

41+阅读 · 2024年6月20日

《多无人机智能反射面辅助通信：通过深度强化学习进行多节点信道建模和公平和率优化》

《多无人机智能反射面辅助通信：通过深度强化学习进行多节点信道建模和公平和率优化》

专知会员服务

29+阅读 · 2024年2月1日

扩散模型和强化学习如何结合？上交最新《强化学习中的扩散模型》综述

扩散模型和强化学习如何结合？上交最新《强化学习中的扩散模型》综述

专知会员服务

83+阅读 · 2023年11月3日

基于强化学习的无人机自组网路由研究综述

基于强化学习的无人机自组网路由研究综述

专知会员服务

48+阅读 · 2023年9月9日

基于深度强化学习算法的无人机智能规避决策

基于深度强化学习算法的无人机智能规避决策

专知会员服务

84+阅读 · 2023年6月27日

「强化学习在无人车领域」的应用与展望

「强化学习在无人车领域」的应用与展望

专知会员服务

58+阅读 · 2022年12月8日

【AI+军事】附论文《通过处理多通道声学和无线电频率信号实现无人机的识别和定位：一种深度学习方法》

【AI+军事】附论文《通过处理多通道声学和无线电频率信号实现无人机的识别和定位：一种深度学习方法》

专知会员服务

42+阅读 · 2022年4月24日

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知

69+阅读 · 2022年12月3日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

33+阅读 · 2022年11月12日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

111+阅读 · 2022年4月28日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

PlaNet 简介：用于强化学习的深度规划网络

PlaNet 简介：用于强化学习的深度规划网络

谷歌开发者

13+阅读 · 2019年3月16日

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

产业智能官

16+阅读 · 2018年12月27日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

智能无人作战系统的发展

智能无人作战系统的发展

科技导报

36+阅读 · 2018年6月29日

【强化学习】强化学习/增强学习/再励学习介绍

【强化学习】强化学习/增强学习/再励学习介绍

产业智能官

10+阅读 · 2018年2月23日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

面向多用户行为的无线识别关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

扩展空频自由度的机会式无干扰传输新技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向无线多媒体传感器网络的高效压缩视频感知

国家自然科学基金

0+阅读 · 2015年12月31日

噪声不确定下基于计算智能的多跳认知无线电网络协作频谱感知优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于跨层网络编码感知的无线传感器网络节能路由协议研究

国家自然科学基金

0+阅读 · 2015年12月31日

无线传感器网络中高效的虚假数据过滤方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

传感器网络能量有效空中重编程协议研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

无人机协同组网感知融合与传感器管理关键技术研究

国家自然科学基金

29+阅读 · 2011年12月31日

Asynchronous Decentralized Federated Learning over Lossy Wireless Links via Reception- and Age-Aware Aggregation

Arxiv

0+阅读 · 6月16日

Improving Generalization and Data Efficiency with Diffusion in Offline Multi-agent RL

Arxiv

0+阅读 · 6月10日

Maximizing Connectivity of Uplink RIS-Assisted UAV Networks

Arxiv

0+阅读 · 6月10日

X-Band UAV-enabled Integrated Sensing and Communications for Vehicular Networks

Arxiv

0+阅读 · 6月3日

Generalizable Multi-Task Learning for Wireless Networks Using Prompt Decision Transformers

Arxiv

0+阅读 · 6月3日

Digital Twin-Assisted Adaptive Multi-Agent DRL for Intelligent Spectrum and Resource Management in Open-RAN UAV-Enabled 6G Networks

Arxiv

0+阅读 · 5月31日

Hybrid Bit and Semantic Communications for UAV-Enabled Wireless Power Transfer Networks: A Decision-Assisted Deep Reinforcement Learning Approach

Arxiv

0+阅读 · 5月30日

Scaling up Energy-Aware Multi-Agent Reinforcement Learning for Mission-Oriented Drone Networks with Individual Reward

Arxiv

0+阅读 · 5月24日

Generative AI for Advanced UAV Networking

Arxiv

12+阅读 · 2024年4月16日

Diffusion Models for Reinforcement Learning: A Survey

Arxiv

22+阅读 · 2023年11月2日

VIP会员

文章信息

相关主题

离线强化学习

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

2+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

4+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

7+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

4+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

7+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

5+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

3+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

8+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

6+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

9+阅读 · 6月22日

相关VIP内容

《强化学习在无人机作战应用中的现存差距》2025最新29页综述

《强化学习在无人机作战应用中的现存差距》2025最新29页综述

专知会员服务

48+阅读 · 2025年5月17日

《无人机辅助的天空地一体化网络：学习算法技术综述》

《无人机辅助的天空地一体化网络：学习算法技术综述》

专知会员服务

51+阅读 · 2025年3月11日

《智能无人机扩散模型：决策与建模》最新论文

《智能无人机扩散模型：决策与建模》最新论文

专知会员服务

43+阅读 · 2025年1月19日

《用于预测和优化无人机蜂群轨迹的人工智能算法》最新论文

《用于预测和优化无人机蜂群轨迹的人工智能算法》最新论文

专知会员服务

41+阅读 · 2024年6月20日

《多无人机智能反射面辅助通信：通过深度强化学习进行多节点信道建模和公平和率优化》

《多无人机智能反射面辅助通信：通过深度强化学习进行多节点信道建模和公平和率优化》

专知会员服务

29+阅读 · 2024年2月1日

扩散模型和强化学习如何结合？上交最新《强化学习中的扩散模型》综述

扩散模型和强化学习如何结合？上交最新《强化学习中的扩散模型》综述

专知会员服务

83+阅读 · 2023年11月3日

基于强化学习的无人机自组网路由研究综述

基于强化学习的无人机自组网路由研究综述

专知会员服务

48+阅读 · 2023年9月9日

基于深度强化学习算法的无人机智能规避决策

基于深度强化学习算法的无人机智能规避决策

专知会员服务

84+阅读 · 2023年6月27日

「强化学习在无人车领域」的应用与展望

「强化学习在无人车领域」的应用与展望

专知会员服务

58+阅读 · 2022年12月8日

【AI+军事】附论文《通过处理多通道声学和无线电频率信号实现无人机的识别和定位：一种深度学习方法》

【AI+军事】附论文《通过处理多通道声学和无线电频率信号实现无人机的识别和定位：一种深度学习方法》

专知会员服务

42+阅读 · 2022年4月24日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知

69+阅读 · 2022年12月3日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

33+阅读 · 2022年11月12日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

111+阅读 · 2022年4月28日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

PlaNet 简介：用于强化学习的深度规划网络

PlaNet 简介：用于强化学习的深度规划网络

谷歌开发者

13+阅读 · 2019年3月16日

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

产业智能官

16+阅读 · 2018年12月27日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

智能无人作战系统的发展

智能无人作战系统的发展

科技导报

36+阅读 · 2018年6月29日

【强化学习】强化学习/增强学习/再励学习介绍

【强化学习】强化学习/增强学习/再励学习介绍

产业智能官

10+阅读 · 2018年2月23日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关论文

Asynchronous Decentralized Federated Learning over Lossy Wireless Links via Reception- and Age-Aware Aggregation

Arxiv

0+阅读 · 6月16日

Improving Generalization and Data Efficiency with Diffusion in Offline Multi-agent RL

Arxiv

0+阅读 · 6月10日

Maximizing Connectivity of Uplink RIS-Assisted UAV Networks

Arxiv

0+阅读 · 6月10日

X-Band UAV-enabled Integrated Sensing and Communications for Vehicular Networks

Arxiv

0+阅读 · 6月3日

Generalizable Multi-Task Learning for Wireless Networks Using Prompt Decision Transformers

Arxiv

0+阅读 · 6月3日

Digital Twin-Assisted Adaptive Multi-Agent DRL for Intelligent Spectrum and Resource Management in Open-RAN UAV-Enabled 6G Networks

Arxiv

0+阅读 · 5月31日

Hybrid Bit and Semantic Communications for UAV-Enabled Wireless Power Transfer Networks: A Decision-Assisted Deep Reinforcement Learning Approach

Arxiv

0+阅读 · 5月30日

Scaling up Energy-Aware Multi-Agent Reinforcement Learning for Mission-Oriented Drone Networks with Individual Reward

Arxiv

0+阅读 · 5月24日

Generative AI for Advanced UAV Networking

Arxiv

12+阅读 · 2024年4月16日

Diffusion Models for Reinforcement Learning: A Survey

Arxiv

22+阅读 · 2023年11月2日

相关基金

面向多用户行为的无线识别关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

扩展空频自由度的机会式无干扰传输新技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向无线多媒体传感器网络的高效压缩视频感知

国家自然科学基金

0+阅读 · 2015年12月31日

噪声不确定下基于计算智能的多跳认知无线电网络协作频谱感知优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于跨层网络编码感知的无线传感器网络节能路由协议研究

国家自然科学基金

0+阅读 · 2015年12月31日

无线传感器网络中高效的虚假数据过滤方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

传感器网络能量有效空中重编程协议研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

无人机协同组网感知融合与传感器管理关键技术研究

国家自然科学基金

29+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员