This paper investigates online power control for point-to-point energy harvesting communications over wireless fading channels. A linear-policy-based approximation is derived for the relative-value function in the Bellman equation of the power control problem. This approximation leads to two fundamental power control policies: optimistic and robust clipped affine policies, both taking the form of a clipped affine function of the battery level and the reciprocal of channel signal-to-noise ratio coefficient. They are essentially battery-limited weighted directional waterfilling policies operating between adjacent time slots. By leveraging the relative-value approximation and derived policies, a domain-knowledge-enhanced reinforcement learning (RL) algorithm is proposed for online power control. The proposed approach is further extended to scenarios with energy and/or channel lookahead. Comprehensive simulation results demonstrate that the proposed methods achieve a good balance between computational complexity and optimality. In particular, the robust clipped affine policy (combined with RL, using at most five parameters) outperforms all existing approaches across various scenarios, with less than 2\% performance loss relative to the optimal policy.


翻译:本文研究无线衰落信道下点对点能量收集通信的在线功率控制问题。针对功率控制问题贝尔曼方程中的相对值函数,推导了一种基于线性策略的近似方法。该近似引出了两种基本功率控制策略:乐观型和鲁棒型截断仿射策略,二者均采用电池电量与信道信噪比系数倒数之截断仿射函数的形式。它们本质上是相邻时隙间运行的电池受限加权定向注水策略。通过利用相对值近似与所推导的策略,提出了一种面向在线功率控制的领域知识增强强化学习算法。所提方法进一步扩展至具备能量和/或信道前瞻信息的场景。综合仿真结果表明,所提方法在计算复杂度与最优性之间取得了良好平衡。特别地,鲁棒截断仿射策略(结合强化学习,最多使用五个参数)在多种场景下均优于现有所有方法,其性能损失相对于最优策略小于2%。

0
下载
关闭预览

相关内容

《采用智能弹药的仿生无人机蜂群实施目标压制》
专知会员服务
21+阅读 · 2025年12月4日
航天器非脆弱控制理论及应用研究进展
专知会员服务
9+阅读 · 2025年7月8日
无人集群协同控制策略及军事应用
专知会员服务
120+阅读 · 2023年11月13日
EKF常用于目标跟踪系统的扩展卡尔曼滤波器
无人机
10+阅读 · 2017年7月25日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
美国当前高超音速导弹发展概述
专知会员服务
0+阅读 · 今天15:03
《高超音速武器:一项再度兴起的技术》120页slides
无人机蜂群建模与仿真方法
专知会员服务
1+阅读 · 今天14:08
澳大利亚发布《国防战略(2026年)》
专知会员服务
0+阅读 · 今天13:42
【CMU博士论文】迈向基于基础先验的 4D 感知研究
专知会员服务
0+阅读 · 今天13:46
全球高超音速武器最新发展趋势
专知会员服务
1+阅读 · 今天13:17
相关VIP内容
《采用智能弹药的仿生无人机蜂群实施目标压制》
专知会员服务
21+阅读 · 2025年12月4日
航天器非脆弱控制理论及应用研究进展
专知会员服务
9+阅读 · 2025年7月8日
无人集群协同控制策略及军事应用
专知会员服务
120+阅读 · 2023年11月13日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员