Plasticity-Enhanced Multi-Agent Mixture of Experts for Dynamic Objective Adaptation in UAVs-Assisted Emergency Communication Networks - 专知论文

会员服务 ·

0

混合 · 增强型 · 相位 · 应急 · 通信网 ·

Plasticity-Enhanced Multi-Agent Mixture of Experts for Dynamic Objective Adaptation in UAVs-Assisted Emergency Communication Networks

翻译：面向无人机辅助应急通信网络中动态目标适应的塑性增强型多专家混合体

Wen Qiu,Zhiqiang He,Wei Zhao,Hiroshi Masui

from arxiv, 20 pages, 12 figures, 3 tables

Unmanned aerial vehicles serving as aerial base stations can rapidly restore connectivity after disasters, yet abrupt changes in user mobility and traffic demands shift the quality of service trade-offs and induce strong non-stationarity. Deep reinforcement learning policies suffer from plasticity loss under such shifts, as representation collapse and neuron dormancy impair adaptation. We propose plasticity enhanced multi-agent mixture of experts (PE-MAMoE), a centralized training with decentralized execution framework built on multi-agent proximal policy optimization. PE-MAMoE equips each UAV with a sparsely gated mixture of experts actor whose router selects a single specialist per step. A non-parametric Phase Controller injects brief, expert-only stochastic perturbations after phase switches, resets the action log-standard-deviation, anneals entropy and learning rate, and schedules the router temperature, all to re-plasticize the policy without destabilizing safe behaviors. We derive a dynamic regret bound showing the tracking error scales with both environment variation and cumulative noise energy. In a phase-driven simulator with mobile users and 3GPP-style channels, PE-MAMoE improves normalized interquartile mean return by 26.3\% over the best baseline, increases served-user capacity by 12.8\%, and reduces collisions by approximately 75\%. Diagnostics confirm persistently higher expert feature rank and periodic dormant-neuron recovery at regime switches.

翻译：作为空中基站的无人机能够在灾难后快速恢复通信，但用户移动性和流量需求的突变会改变服务质量权衡，并引发强非平稳性。在此类变化下，深度强化学习策略因表征坍缩和神经元休眠导致塑性丧失，从而削弱其适应能力。我们提出塑性增强型多专家混合体（PE-MAMoE），这是一种基于多智能体近端策略优化的集中训练与分散执行框架。PE-MAMoE为每架无人机配备稀疏门控的混合专家执行器，其路由器每一步仅选择单一专家。一个参数化相位控制器在相位切换后注入短暂的、仅针对专家的随机扰动，重置动作对数标准差，退火熵与学习率，并调度路由器温度，以在不破坏安全行为的前提下重新塑性策略。我们推导了动态遗憾界，表明跟踪误差与环境变化和累积噪声能量均成比例。在包含移动用户和3GPP标准信道的相位驱动仿真器中，PE-MAMoE将标准化四分位均值回报相比最佳基线提升26.3%，增加服务用户容量12.8%，并减少约75%的碰撞。诊断结果证实，在状态转换时专家特征秩持续升高且休眠神经元周期性恢复。

0

相关内容

《面向国防应用的无人机选型：一种对比性多模糊多准则决策框架》

《面向国防应用的无人机选型：一种对比性多模糊多准则决策框架》

专知会员服务

15+阅读 · 6月9日

《抗干扰协同无人机中继网络的多智能体深度强化学习》

《抗干扰协同无人机中继网络的多智能体深度强化学习》

专知会员服务

28+阅读 · 2025年12月31日

《空战战术中多智能体强化学习战略决策的可解释性研究》最新报告

《空战战术中多智能体强化学习战略决策的可解释性研究》最新报告

专知会员服务

41+阅读 · 2025年9月12日

《基于优化的复杂多无人机任务自动分配技术》

《基于优化的复杂多无人机任务自动分配技术》

专知会员服务

34+阅读 · 2025年8月29日

中文版 | 无人机系统（UAS）：军事技术的颠覆性变革

中文版 | 无人机系统（UAS）：军事技术的颠覆性变革

专知会员服务

24+阅读 · 2025年4月17日

《基于智能自适应混合控制实现自主性：采用自适应协作/控制技术的智能跨域多无人系统规划器》107页干货

《基于智能自适应混合控制实现自主性：采用自适应协作/控制技术的智能跨域多无人系统规划器》107页干货

专知会员服务

58+阅读 · 2024年11月12日

《用于军事行动实时三维场景分析的人工智能无人智能体》

《用于军事行动实时三维场景分析的人工智能无人智能体》

专知会员服务

69+阅读 · 2024年8月13日

基于多智能体博弈强化学习的无人机智能攻击策略生成模型

基于多智能体博弈强化学习的无人机智能攻击策略生成模型

专知会员服务

108+阅读 · 2023年10月16日

《用于空战机动的分层多智能体强化学习》

《用于空战机动的分层多智能体强化学习》

专知会员服务

69+阅读 · 2023年10月5日

《城市地形下武器化无人系统有人-无人协同作战效能分析》2022最新84页报告，美海军

《城市地形下武器化无人系统有人-无人协同作战效能分析》2022最新84页报告，美海军

专知会员服务

130+阅读 · 2022年12月9日

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知

69+阅读 · 2022年12月3日

《重新设计反无人机系统架构》2022最新160页论文，美国海军研究生院

《重新设计反无人机系统架构》2022最新160页论文，美国海军研究生院

专知

62+阅读 · 2022年10月26日

《作战无人机系统（UAS）概念开发和实验的性能测量》加拿大国防研究与发展部2022最新35页报告

《作战无人机系统（UAS）概念开发和实验的性能测量》加拿大国防研究与发展部2022最新35页报告

专知

34+阅读 · 2022年10月11日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

55+阅读 · 2022年10月6日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

66+阅读 · 2022年8月25日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

国外有人/无人平台协同作战概述

国外有人/无人平台协同作战概述

无人机

123+阅读 · 2019年5月28日

智能无人作战系统的发展

智能无人作战系统的发展

科技导报

36+阅读 · 2018年6月29日

智能无人机集群技术概述

智能无人机集群技术概述

无人机

46+阅读 · 2018年2月28日

无人机小型蜂窝网络系统设计与优化控制关键技术研究

国家自然科学基金

33+阅读 · 2017年12月31日

基于弱监督贝叶斯推断模型的多无人机协同跟踪技术研究

国家自然科学基金

14+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

基于动态增益非线性干扰观测器的多智能体系统协调跟踪和干扰抑制

国家自然科学基金

1+阅读 · 2015年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

无人机协同组网感知融合与传感器管理关键技术研究

国家自然科学基金

29+阅读 · 2011年12月31日

非确定环境下基于分层理论的无人机多机协同控制算法研究

国家自然科学基金

12+阅读 · 2010年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

Wireless Communication for Low-Altitude Economy with UAV Swarm Enabled Two-Level Movable Antenna System

Arxiv

0+阅读 · 4月27日

Scaling Multi-Node Mixture-of-Experts Inference Using Expert Activation Patterns

Arxiv

0+阅读 · 4月25日

Self-Supervised Multisensory Pretraining for Contact-Rich Robot Reinforcement Learning

Arxiv

0+阅读 · 4月24日

Aerial Multi-Functional RIS in Fluid Antennas-Aided Full-Duplex Networks: A Self-Optimized Hybrid Deep Reinforcement Learning Approach

Arxiv

0+阅读 · 4月17日

Beyond Conservative Automated Driving in Multi-Agent Scenarios via Coupled Model Predictive Control and Deep Reinforcement Learning

Arxiv

0+阅读 · 4月15日

DeepFleet: Multi-Agent Foundation Models for Mobile Robots

Arxiv

0+阅读 · 4月13日

Force Polytope-Based Cant-Angle Selection for Tilting Hexarotor UAVs

Arxiv

0+阅读 · 4月7日

UAV Control and Communication Enabled Low-Altitude Economy: Challenges, Resilient Architecture and Co-design Strategies

Arxiv

1+阅读 · 4月5日

Spatio-Temporal Attention Enhanced Multi-Agent DRL for UAV-Assisted Wireless Networks with Limited Communications

Arxiv

0+阅读 · 3月23日

Hierarchical Multi-Agent Reinforcement Learning for Air Combat Maneuvering

Arxiv

49+阅读 · 2023年9月20日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

2+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

1+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

3+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

3+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

3+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

3+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

3+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

20+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

《面向国防应用的无人机选型：一种对比性多模糊多准则决策框架》

《面向国防应用的无人机选型：一种对比性多模糊多准则决策框架》

专知会员服务

15+阅读 · 6月9日

《抗干扰协同无人机中继网络的多智能体深度强化学习》

《抗干扰协同无人机中继网络的多智能体深度强化学习》

专知会员服务

28+阅读 · 2025年12月31日

《空战战术中多智能体强化学习战略决策的可解释性研究》最新报告

《空战战术中多智能体强化学习战略决策的可解释性研究》最新报告

专知会员服务

41+阅读 · 2025年9月12日

《基于优化的复杂多无人机任务自动分配技术》

《基于优化的复杂多无人机任务自动分配技术》

专知会员服务

34+阅读 · 2025年8月29日

中文版 | 无人机系统（UAS）：军事技术的颠覆性变革

中文版 | 无人机系统（UAS）：军事技术的颠覆性变革

专知会员服务

24+阅读 · 2025年4月17日

《基于智能自适应混合控制实现自主性：采用自适应协作/控制技术的智能跨域多无人系统规划器》107页干货

《基于智能自适应混合控制实现自主性：采用自适应协作/控制技术的智能跨域多无人系统规划器》107页干货

专知会员服务

58+阅读 · 2024年11月12日

《用于军事行动实时三维场景分析的人工智能无人智能体》

《用于军事行动实时三维场景分析的人工智能无人智能体》

专知会员服务

69+阅读 · 2024年8月13日

基于多智能体博弈强化学习的无人机智能攻击策略生成模型

基于多智能体博弈强化学习的无人机智能攻击策略生成模型

专知会员服务

108+阅读 · 2023年10月16日

《用于空战机动的分层多智能体强化学习》

《用于空战机动的分层多智能体强化学习》

专知会员服务

69+阅读 · 2023年10月5日

《城市地形下武器化无人系统有人-无人协同作战效能分析》2022最新84页报告，美海军

《城市地形下武器化无人系统有人-无人协同作战效能分析》2022最新84页报告，美海军

专知会员服务

130+阅读 · 2022年12月9日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知

69+阅读 · 2022年12月3日

《重新设计反无人机系统架构》2022最新160页论文，美国海军研究生院

《重新设计反无人机系统架构》2022最新160页论文，美国海军研究生院

专知

62+阅读 · 2022年10月26日

《作战无人机系统（UAS）概念开发和实验的性能测量》加拿大国防研究与发展部2022最新35页报告

《作战无人机系统（UAS）概念开发和实验的性能测量》加拿大国防研究与发展部2022最新35页报告

专知

34+阅读 · 2022年10月11日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

55+阅读 · 2022年10月6日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

66+阅读 · 2022年8月25日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

国外有人/无人平台协同作战概述

国外有人/无人平台协同作战概述

无人机

123+阅读 · 2019年5月28日

智能无人作战系统的发展

智能无人作战系统的发展

科技导报

36+阅读 · 2018年6月29日

智能无人机集群技术概述

智能无人机集群技术概述

无人机

46+阅读 · 2018年2月28日

相关论文

Wireless Communication for Low-Altitude Economy with UAV Swarm Enabled Two-Level Movable Antenna System

Arxiv

0+阅读 · 4月27日

Scaling Multi-Node Mixture-of-Experts Inference Using Expert Activation Patterns

Arxiv

0+阅读 · 4月25日

Self-Supervised Multisensory Pretraining for Contact-Rich Robot Reinforcement Learning

Arxiv

0+阅读 · 4月24日

Aerial Multi-Functional RIS in Fluid Antennas-Aided Full-Duplex Networks: A Self-Optimized Hybrid Deep Reinforcement Learning Approach

Arxiv

0+阅读 · 4月17日

Beyond Conservative Automated Driving in Multi-Agent Scenarios via Coupled Model Predictive Control and Deep Reinforcement Learning

Arxiv

0+阅读 · 4月15日

DeepFleet: Multi-Agent Foundation Models for Mobile Robots

Arxiv

0+阅读 · 4月13日

Force Polytope-Based Cant-Angle Selection for Tilting Hexarotor UAVs

Arxiv

0+阅读 · 4月7日

UAV Control and Communication Enabled Low-Altitude Economy: Challenges, Resilient Architecture and Co-design Strategies

Arxiv

1+阅读 · 4月5日

Spatio-Temporal Attention Enhanced Multi-Agent DRL for UAV-Assisted Wireless Networks with Limited Communications

Arxiv

0+阅读 · 3月23日

Hierarchical Multi-Agent Reinforcement Learning for Air Combat Maneuvering

Arxiv

49+阅读 · 2023年9月20日

相关基金

无人机小型蜂窝网络系统设计与优化控制关键技术研究

国家自然科学基金

33+阅读 · 2017年12月31日

基于弱监督贝叶斯推断模型的多无人机协同跟踪技术研究

国家自然科学基金

14+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

基于动态增益非线性干扰观测器的多智能体系统协调跟踪和干扰抑制

国家自然科学基金

1+阅读 · 2015年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

无人机协同组网感知融合与传感器管理关键技术研究

国家自然科学基金

29+阅读 · 2011年12月31日

非确定环境下基于分层理论的无人机多机协同控制算法研究

国家自然科学基金

12+阅读 · 2010年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员