The integration of generative artificial intelligence with wireless communication and signal processing systems has opened new avenues for intelligent, data-driven decision-making in future 6G networks. This work proposes a diffusion soft actor-critic (Diffusion-SAC) approach that leverages offline reinforcement learning (RL) enhanced by denoising diffusion probabilistic models (DDPMs) to optimize trajectory and scheduling control in unmanned aerial vehicle (UAV) networks. While offline RL methods, such as conservative Q-learning (CQL), can learn from static datasets, they often struggle to generalize in low-data or dynamic conditions. To address this, we combine the robustness of CQL with the generative power of diffusion models, enabling expressive and signal-aware policy learning that generalizes beyond behavior policies. Applied to a UAV-assisted wireless network, the proposed framework minimizes transmission energy and improves fairness among devices. Simulations show that Diffusion-SAC outperforms standard offline RL baselines, achieving more stable convergence and higher rewards even with limited datasets. The method enhances data efficiency, reduces energy consumption, and increases throughput by more than 35 % compared to existing algorithms, demonstrating its potential for robust policy learning in next-generation wireless control systems.


翻译:生成式人工智能与无线通信及信号处理系统的融合,为未来6G网络中智能、数据驱动的决策开辟了新途径。本文提出一种扩散软演员-评论家(Diffusion-SAC)方法,利用去噪扩散概率模型(DDPMs)增强的离线强化学习(RL)来优化无人机(UAV)网络中的轨迹与调度控制。虽然离线RL方法(如保守Q学习(CQL))能够从静态数据集中学习,但它们在低数据或动态条件下常难以泛化。为解决这一问题,我们将CQL的鲁棒性与扩散模型的生成能力相结合,实现了超越行为策略的、富有表现力且感知信号的策略学习。将该框架应用于无人机辅助无线网络,可最小化传输能量并提升设备间的公平性。仿真表明,Diffusion-SAC优于标准离线RL基线,即使数据集有限也能实现更稳定的收敛和更高的奖励。与现有算法相比,该方法提升了数据效率,降低了能耗,并将吞吐量提高了35%以上,展示了其在下一代无线控制系统中的鲁棒策略学习潜力。

0
下载
关闭预览

相关内容

《无人机辅助的天空地一体化网络:学习算法技术综述》
《智能无人机扩散模型:决策与建模》最新论文
专知会员服务
43+阅读 · 2025年1月19日
基于强化学习的无人机自组网路由研究综述
专知会员服务
48+阅读 · 2023年9月9日
基于深度强化学习算法的无人机智能规避决策
专知会员服务
84+阅读 · 2023年6月27日
「强化学习在无人车领域」的应用与展望
专知会员服务
58+阅读 · 2022年12月8日
「基于通信的多智能体强化学习」 进展综述
PlaNet 简介:用于强化学习的深度规划网络
谷歌开发者
13+阅读 · 2019年3月16日
智能无人作战系统的发展
科技导报
36+阅读 · 2018年6月29日
【强化学习】强化学习/增强学习/再励学习介绍
产业智能官
10+阅读 · 2018年2月23日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
29+阅读 · 2011年12月31日
Arxiv
12+阅读 · 2024年4月16日
Arxiv
22+阅读 · 2023年11月2日
VIP会员
最新内容
综述 | 世界动作模型:少做梦,多行动
专知会员服务
4+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
7+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
4+阅读 · 6月23日
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
29+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员