Distributed online learning in Internet of Things(IoT)-enabled multi-agent systems(MASs) is highly vulnerable to persistent adversarial interactions, particularly when malicious agents cannot be fully isolated during the transient learning stage. Existing resilient learning methods mainly focus on convergence preservation or malicious suppression, while the resulting evolution inefficiency caused by repeated corrective adaptation remains largely unexplored. To address this issue, this paper develops a cost-aware distributed online learning framework with a strict rejection behavior against adversarial agents. The proposed mechanism suppresses harmful assimilation of suspicious neighboring information and reveals a previously overlooked side effect, that is, the strict rejection may induce heterogeneous transient evolution among neighboring normal agents, leading to evolution desynchronization across the network. To mitigate this effect, a two-time-scale adaptive evolution regulation architecture is further developed, in which the outer layer dynamically adjusts the long-term evolution-rate schedule while the inner layer preserves robust online learning. Theoretical analysis establishes the dynamic tracking property of the outer-layer update and proves that the proposed regulation mechanism attenuates the propagation of strict-rejection-induced evolution desynchronization. Numerical simulations and a satellite-assisted IoT monitoring scenario demonstrate that the proposed method achieves robust and low-cost distributed online learning under persistent malicious interference.


翻译:在物联网赋能的多智能体系统中,分布式在线学习极易受到持续性对抗交互的影响,特别是在瞬态学习阶段无法完全隔离恶意智能体的情况下。现有弹性学习方法主要聚焦于收敛性保持或恶意抑制,但由反复纠正性适应导致的演化效率损失问题尚未得到充分探索。针对该问题,本文提出一种具有严格拒绝行为的代价感知分布式在线学习框架。所提机制可抑制可疑邻居信息的有害同化,并揭示了一个此前被忽视的副作用:严格拒绝行为可能引发相邻正常智能体之间的异质瞬态演化,进而导致网络级演化失同步。为缓解该效应,进一步开发了双时间尺度自适应演化调节架构,其中外层动态调整长期演化速率调度,内层保持鲁棒在线学习。理论分析建立了外层更新的动态追踪特性,并证明所提调节机制能削弱严格拒绝行为诱发的演化失同步传播。数值仿真与卫星辅助物联网监控场景表明,该方法在持续恶意干扰下可实现鲁棒且低成本的分布式在线学习。

0
下载
关闭预览

相关内容

作战 Agent 的学习算法研究进展与发展趋势
专知会员服务
72+阅读 · 2023年10月3日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
60+阅读 · 2019年10月17日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
联邦学习或将助力IoT走出“数据孤岛”?
中国计算机学会
20+阅读 · 2019年3月16日
强化学习的Unsupervised Meta-Learning
CreateAMind
18+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
44+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
李宏毅-201806-中文-Deep Reinforcement Learning精品课程分享
深度学习与NLP
15+阅读 · 2018年6月20日
Representation Learning on Network 网络表示学习
全球人工智能
10+阅读 · 2017年10月19日
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
最新内容
《通过小型无人机系统将情报能力“作战化”》
专知会员服务
3+阅读 · 今天7:28
消耗优势:美军的“精确规模化”概念
专知会员服务
8+阅读 · 6月15日
《离线语言支持系统:面向空战战术决策》
专知会员服务
8+阅读 · 6月15日
相关VIP内容
作战 Agent 的学习算法研究进展与发展趋势
专知会员服务
72+阅读 · 2023年10月3日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
60+阅读 · 2019年10月17日
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
联邦学习或将助力IoT走出“数据孤岛”?
中国计算机学会
20+阅读 · 2019年3月16日
强化学习的Unsupervised Meta-Learning
CreateAMind
18+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
44+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
李宏毅-201806-中文-Deep Reinforcement Learning精品课程分享
深度学习与NLP
15+阅读 · 2018年6月20日
Representation Learning on Network 网络表示学习
全球人工智能
10+阅读 · 2017年10月19日
相关基金
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员