DRL-Based Beam Positioning for LEO Satellite Constellations with Weighted Least Squares - 专知论文

会员服务 ·

0

精度 · 卫星星座 · 深度强化学习 · 强化学习 · 信道状态信息 ·

DRL-Based Beam Positioning for LEO Satellite Constellations with Weighted Least Squares

翻译：基于深度强化学习的低轨卫星星座波束定位与加权最小二乘法

Po-Heng Chou,Chiapin Wang,Kuan-Hao Chen,Wei-Chen Hsiao

from arxiv, 6 pages, 3 figures, 1 table, accepted by 2026 IEEE ICC Workshops

This paper investigates a lightweight deep reinforcement learning (DRL)-assisted weighting framework for CSI-free multi-satellite positioning in LEO constellations, where each visible satellite provides one serving beam (one pilot response) per epoch. A discrete-action Deep Q-Network (DQN) learns satellite weights directly from received pilot measurements and geometric features, while an augmented weighted least squares (WLS) estimator provides physics-consistent localization and jointly estimates the receiver clock bias. The proposed hybrid design targets an accuracy-runtime trade-off rather than absolute supervised optimality. In a representative 2-D setting with 10 visible satellites, the proposed approach achieves sub-meter accuracy (0.395m RMSE) with low computational overhead, supporting practical deployment for resource-constrained LEO payloads.

翻译：本文研究了一种轻量级深度强化学习辅助的加权框架，用于低轨星座中无需信道状态信息的多卫星定位，其中每颗可见卫星每历元提供一个服务波束（一个导频响应）。离散动作深度Q网络直接从接收的导频测量值和几何特征中学习卫星权重，而增强的加权最小二乘估计器则提供物理一致性的定位并联合估计接收机时钟偏差。所提出的混合设计旨在实现精度与运行时间的权衡，而非追求绝对监督最优性。在具有10颗可见卫星的代表性二维场景中，该方法以较低的计算开销实现了亚米级精度（均方根误差0.395米），为资源受限的低轨卫星有效载荷的实际部署提供了支持。

0

相关内容

《卫星编队最优制导与导航的分层控制架构》45页

《卫星编队最优制导与导航的分层控制架构》45页

专知会员服务

21+阅读 · 2月12日

《卫星星座任务规划新方法》

《卫星星座任务规划新方法》

专知会员服务

21+阅读 · 2025年11月27日

《国防低地球轨道（LEO）卫星通信弹性研究》最新79页报告

《国防低地球轨道（LEO）卫星通信弹性研究》最新79页报告

专知会员服务

30+阅读 · 2025年6月5日

《利用商用 5G 和低轨道(LEO)卫星技术加强陆军-海军传感器-射手网络》83页

《利用商用 5G 和低轨道(LEO)卫星技术加强陆军-海军传感器-射手网络》83页

专知会员服务

53+阅读 · 2024年7月14日

《利用深度学习进行目标姿态估计》2023最新63页论文

《利用深度学习进行目标姿态估计》2023最新63页论文

专知会员服务

48+阅读 · 2023年8月29日

自动空中加油《用深度学习技术来估计立体图像中的3D位置》美空军94页论文

自动空中加油《用深度学习技术来估计立体图像中的3D位置》美空军94页论文

专知会员服务

36+阅读 · 2023年6月24日

《综述：强化学习在航空中的应用》第一份调查航空领域RL方法的研究论文，2022最新论文

《综述：强化学习在航空中的应用》第一份调查航空领域RL方法的研究论文，2022最新论文

专知会员服务

49+阅读 · 2022年11月15日

【估计定位、导航和授时（PNT）传感器和系统的目标位置误差】《多用途通用简化目标位置误差（TLE）计算器（MUSTC）》2022最新112页技术报告，美国陆军研究实验室

【估计定位、导航和授时（PNT）传感器和系统的目标位置误差】《多用途通用简化目标位置误差（TLE）计算器（MUSTC）》2022最新112页技术报告，美国陆军研究实验室

专知会员服务

47+阅读 · 2022年10月25日

浙大最新「深度学习弱目标检测定位」综述论文，13页pdf概述WSOD最新进展

浙大最新「深度学习弱目标检测定位」综述论文，13页pdf概述WSOD最新进展

专知会员服务

47+阅读 · 2021年5月30日

深度强化学习算法与应用研究现状综述

专知会员服务

139+阅读 · 2021年1月13日

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知

13+阅读 · 2022年11月25日

17种深度强化学习算法用Pytorch实现

17种深度强化学习算法用Pytorch实现

新智元

31+阅读 · 2019年9月16日

LinkTrack UWB高精度定位系统首发，一套可以随时搭建的"小卫星"定位系统，集定位|导航|授时|通信于一体

LinkTrack UWB高精度定位系统首发，一套可以随时搭建的"小卫星"定位系统，集定位|导航|授时|通信于一体

无人机

10+阅读 · 2019年7月18日

PlaNet 简介：用于强化学习的深度规划网络

PlaNet 简介：用于强化学习的深度规划网络

谷歌开发者

13+阅读 · 2019年3月16日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

论智

26+阅读 · 2018年10月30日

深度学习时代的目标检测算法

深度学习时代的目标检测算法

炼数成金订阅号

40+阅读 · 2018年3月19日

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

量子位

10+阅读 · 2017年12月10日

基于位置注意力机制模型和带标签数据来提升槽填充（EMNLP outstanding paper）

基于位置注意力机制模型和带标签数据来提升槽填充（EMNLP outstanding paper）

科技创新与创业

17+阅读 · 2017年11月17日

【ICCV 目标跟踪性能最优】首个应用残差学习的深度目标跟踪算法

【ICCV 目标跟踪性能最优】首个应用残差学习的深度目标跟踪算法

新智元

35+阅读 · 2017年9月10日

多波束卫星通信中基于压缩感知的预编码设计与干扰消除技术

国家自然科学基金

1+阅读 · 2017年12月31日

高动态环境下的多普勒测速脉冲星导航方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于在轨测量误差补偿的卫星高精度姿态确定方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

星载多基线与升降轨InSAR提取DEM方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

星载压缩采样数字阵列天线阵元信息重构与快速波束赋形研究

国家自然科学基金

2+阅读 · 2015年12月31日

弹性QoS的快速多目标优化软件定义卫星网络流控制方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

脉冲星计时阵列中连续引力波探测和估计的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于长距离参考站网的GPS/BDS高精度实时动态定位算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

卫星重力测量反演高精度高分辨率局部地表质量变化的方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

Dueling DDQN-Based Adaptive Multi-Objective Handover Optimization for LEO Satellite Networks

Arxiv

0+阅读 · 5月4日

Spatial-Temporal Learning-Based Distributed Routing for Dynamic LEO Satellite Networks

Arxiv

0+阅读 · 5月4日

StarLoc: Pinpointing Transmitting LEO Satellites from a Single Passive Array

Arxiv

0+阅读 · 4月22日

Validated Intent Compilation for Constrained Routing in LEO Mega-Constellations

Arxiv

0+阅读 · 4月8日

LeLaR: The First In-Orbit Demonstration of an AI-Based Satellite Attitude Controller

Arxiv

0+阅读 · 3月31日

Energy-Efficient and High-Performance Data Transfers with DRL Agents

Arxiv

0+阅读 · 3月26日

LEO-based Carrier-Phase Positioning for 6G: Design Insights and Comparison with GNSS

Arxiv

0+阅读 · 3月18日

DRL-Based Beam Positioning for LEO Satellite Constellations with Weighted Least Squares

Arxiv

0+阅读 · 3月17日

Federated Learning-driven Beam Management in LEO 6G Non-Terrestrial Networks

Arxiv

0+阅读 · 3月11日

Energy Efficient Traffic Scheduling For Optical LEO Satellite Downlinks

Arxiv

0+阅读 · 3月7日

VIP会员

文章信息

相关主题

深度强化学习

信道状态信息

最新内容

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

4+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

5+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

5+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

5+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

3+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

5+阅读 · 7月20日

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

专知会员服务

5+阅读 · 7月20日

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

14+阅读 · 7月19日

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

7+阅读 · 7月19日

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

7+阅读 · 7月19日

《无人机蜂群通信技术研究》50页

《无人机蜂群通信技术研究》50页

专知会员服务

8+阅读 · 7月19日

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

专知会员服务

12+阅读 · 7月18日

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

专知会员服务

8+阅读 · 7月18日

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

专知会员服务

13+阅读 · 7月18日

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

专知会员服务

10+阅读 · 7月18日

相关VIP内容

《卫星编队最优制导与导航的分层控制架构》45页

《卫星编队最优制导与导航的分层控制架构》45页

专知会员服务

21+阅读 · 2月12日

《卫星星座任务规划新方法》

《卫星星座任务规划新方法》

专知会员服务

21+阅读 · 2025年11月27日

《国防低地球轨道（LEO）卫星通信弹性研究》最新79页报告

《国防低地球轨道（LEO）卫星通信弹性研究》最新79页报告

专知会员服务

30+阅读 · 2025年6月5日

《利用商用 5G 和低轨道(LEO)卫星技术加强陆军-海军传感器-射手网络》83页

《利用商用 5G 和低轨道(LEO)卫星技术加强陆军-海军传感器-射手网络》83页

专知会员服务

53+阅读 · 2024年7月14日

《利用深度学习进行目标姿态估计》2023最新63页论文

《利用深度学习进行目标姿态估计》2023最新63页论文

专知会员服务

48+阅读 · 2023年8月29日

自动空中加油《用深度学习技术来估计立体图像中的3D位置》美空军94页论文

自动空中加油《用深度学习技术来估计立体图像中的3D位置》美空军94页论文

专知会员服务

36+阅读 · 2023年6月24日

《综述：强化学习在航空中的应用》第一份调查航空领域RL方法的研究论文，2022最新论文

《综述：强化学习在航空中的应用》第一份调查航空领域RL方法的研究论文，2022最新论文

专知会员服务

49+阅读 · 2022年11月15日

【估计定位、导航和授时（PNT）传感器和系统的目标位置误差】《多用途通用简化目标位置误差（TLE）计算器（MUSTC）》2022最新112页技术报告，美国陆军研究实验室

【估计定位、导航和授时（PNT）传感器和系统的目标位置误差】《多用途通用简化目标位置误差（TLE）计算器（MUSTC）》2022最新112页技术报告，美国陆军研究实验室

专知会员服务

47+阅读 · 2022年10月25日

浙大最新「深度学习弱目标检测定位」综述论文，13页pdf概述WSOD最新进展

浙大最新「深度学习弱目标检测定位」综述论文，13页pdf概述WSOD最新进展

专知会员服务

47+阅读 · 2021年5月30日

深度强化学习算法与应用研究现状综述

专知会员服务

139+阅读 · 2021年1月13日

热门VIP内容

开通专知VIP会员享更多权益服务

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

印度精确打击与指挥架构的断层

美空军AI完成F-16战斗机自主空战历史性试飞

相关资讯

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知

13+阅读 · 2022年11月25日

17种深度强化学习算法用Pytorch实现

17种深度强化学习算法用Pytorch实现

新智元

31+阅读 · 2019年9月16日

LinkTrack UWB高精度定位系统首发，一套可以随时搭建的"小卫星"定位系统，集定位|导航|授时|通信于一体

LinkTrack UWB高精度定位系统首发，一套可以随时搭建的"小卫星"定位系统，集定位|导航|授时|通信于一体

无人机

10+阅读 · 2019年7月18日

PlaNet 简介：用于强化学习的深度规划网络

PlaNet 简介：用于强化学习的深度规划网络

谷歌开发者

13+阅读 · 2019年3月16日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

论智

26+阅读 · 2018年10月30日

深度学习时代的目标检测算法

深度学习时代的目标检测算法

炼数成金订阅号

40+阅读 · 2018年3月19日

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

量子位

10+阅读 · 2017年12月10日

基于位置注意力机制模型和带标签数据来提升槽填充（EMNLP outstanding paper）

基于位置注意力机制模型和带标签数据来提升槽填充（EMNLP outstanding paper）

科技创新与创业

17+阅读 · 2017年11月17日

【ICCV 目标跟踪性能最优】首个应用残差学习的深度目标跟踪算法

【ICCV 目标跟踪性能最优】首个应用残差学习的深度目标跟踪算法

新智元

35+阅读 · 2017年9月10日

相关论文

Dueling DDQN-Based Adaptive Multi-Objective Handover Optimization for LEO Satellite Networks

Arxiv

0+阅读 · 5月4日

Spatial-Temporal Learning-Based Distributed Routing for Dynamic LEO Satellite Networks

Arxiv

0+阅读 · 5月4日

StarLoc: Pinpointing Transmitting LEO Satellites from a Single Passive Array

Arxiv

0+阅读 · 4月22日

Validated Intent Compilation for Constrained Routing in LEO Mega-Constellations

Arxiv

0+阅读 · 4月8日

LeLaR: The First In-Orbit Demonstration of an AI-Based Satellite Attitude Controller

Arxiv

0+阅读 · 3月31日

Energy-Efficient and High-Performance Data Transfers with DRL Agents

Arxiv

0+阅读 · 3月26日

LEO-based Carrier-Phase Positioning for 6G: Design Insights and Comparison with GNSS

Arxiv

0+阅读 · 3月18日

DRL-Based Beam Positioning for LEO Satellite Constellations with Weighted Least Squares

Arxiv

0+阅读 · 3月17日

Federated Learning-driven Beam Management in LEO 6G Non-Terrestrial Networks

Arxiv

0+阅读 · 3月11日

Energy Efficient Traffic Scheduling For Optical LEO Satellite Downlinks

Arxiv

0+阅读 · 3月7日

相关基金

多波束卫星通信中基于压缩感知的预编码设计与干扰消除技术

国家自然科学基金

1+阅读 · 2017年12月31日

高动态环境下的多普勒测速脉冲星导航方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于在轨测量误差补偿的卫星高精度姿态确定方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

星载多基线与升降轨InSAR提取DEM方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

星载压缩采样数字阵列天线阵元信息重构与快速波束赋形研究

国家自然科学基金

2+阅读 · 2015年12月31日

弹性QoS的快速多目标优化软件定义卫星网络流控制方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

脉冲星计时阵列中连续引力波探测和估计的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于长距离参考站网的GPS/BDS高精度实时动态定位算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

卫星重力测量反演高精度高分辨率局部地表质量变化的方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员