Dynamic and Distributed Routing in IoT Networks based on Multi-Objective Q-Learning - 专知论文

会员服务 ·

0

多目标 · 最优 · Q学习 · 物联网 · 分析 ·

Dynamic and Distributed Routing in IoT Networks based on Multi-Objective Q-Learning

翻译：基于多目标Q学习的物联网网络动态分布式路由

Shubham Vaishnav,Praveen Kumar Donta,Sindri Magnússon

IoT networks often face conflicting routing goals such as maximizing packet delivery, minimizing delay, and conserving limited battery energy. These priorities can also change dynamically: for example, an emergency alert requires high reliability, while routine monitoring prioritizes energy efficiency to prolong network lifetime. Existing works, including many deep reinforcement learning approaches, are typically centralized and assume static objectives, making them slow to adapt when preferences shift. We propose a dynamic and fully distributed multi-objective Q-learning routing algorithm that learns multiple per-preference Q-tables in parallel and introduces a novel greedy interpolation policy to act near-optimally for unseen preferences without retraining or central coordination. A theoretical analysis further shows that the optimal value function is Lipschitz-continuous in the preference parameter, ensuring that the proposed greedy interpolation policy yields provably near-optimal behavior. Simulations show that our approach adapts in real time to shifting priorities and achieves up to 80-90\% lower energy consumption and more than 2-5x higher cumulative rewards and packet delivery compared to six baseline protocols, under dynamic and distributed settings. Sensitivity analysis across varying preference window lengths confirms that the proposed DPQ framework consistently achieves higher composite reward than all baseline methods, demonstrating robustness to changes in operating conditions.

翻译：物联网网络常面临相互冲突的路由目标，例如最大化数据包投递率、最小化延迟以及节约有限的电池能量。这些优先级也可能动态变化：例如，紧急警报需要高可靠性，而常规监测则优先考虑能源效率以延长网络寿命。现有研究（包括许多深度强化学习方法）通常是集中式的，并假设静态目标，导致其在偏好变化时适应缓慢。我们提出了一种动态且完全分布式的多目标Q学习路由算法，该算法并行学习多个针对不同偏好的Q表，并引入一种新颖的贪婪插值策略，使其能够针对未见过的偏好实现近乎最优的行为，而无需重新训练或中央协调。理论分析进一步表明，最优值函数在偏好参数上是Lipschitz连续的，这确保了所提出的贪婪插值策略可产生可证明的近乎最优行为。仿真结果表明，我们的方法能够实时适应优先级变化，在动态分布式环境下，与六种基线协议相比，能耗降低高达80-90%，累积奖励和数据包投递率提高超过2-5倍。对不同偏好窗口长度的敏感性分析证实，所提出的DPQ框架始终比所有基线方法获得更高的复合奖励，表明其对运行条件变化具有鲁棒性。

0

相关内容

多目标

《基于深度学习的软件定义网络模型用于物联网网络威胁检测》

《基于深度学习的软件定义网络模型用于物联网网络威胁检测》

专知会员服务

12+阅读 · 3月16日

《国防和安全系统中的物联网 (IoT)：文献综述》

《国防和安全系统中的物联网 (IoT)：文献综述》

专知会员服务

34+阅读 · 2023年11月22日

《利用边缘计算为物联网系统提供分布式智能》2023最新博士论文

《利用边缘计算为物联网系统提供分布式智能》2023最新博士论文

专知会员服务

50+阅读 · 2023年10月30日

普渡大学2022年博士论文《构建智能物联网边缘：使用深度强化学习平衡安全性和功能性》

普渡大学2022年博士论文《构建智能物联网边缘：使用深度强化学习平衡安全性和功能性》

专知会员服务

48+阅读 · 2022年4月9日

最新论文《基于无人机基站的下一代物联网：群体智能方法的比较》西马其顿大学等高校6位 Senior Member, IEEE，Drone-Base-Station for Next-Generation Internet-of-Things: A Comparison of Swarm Intelligence Approaches

最新论文《基于无人机基站的下一代物联网：群体智能方法的比较》西马其顿大学等高校6位 Senior Member, IEEE，Drone-Base-Station for Next-Generation Internet-of-Things: A Comparison of Swarm Intelligence Approaches

专知会员服务

33+阅读 · 2022年4月7日

GNN+IoT=？弗吉尼亚大学最新《图神经网络与物联网》综述论文，45页pdf全面阐述GNN在IoT中的进展，包括算法与代码数据

GNN+IoT=？弗吉尼亚大学最新《图神经网络与物联网》综述论文，45页pdf全面阐述GNN在IoT中的进展，包括算法与代码数据

专知会员服务

61+阅读 · 2022年4月2日

物联网时代分布式深度学习新方向

物联网时代分布式深度学习新方向

专知会员服务

55+阅读 · 2020年8月30日

【综述论文】A Survey on Dynamic Network Embedding，动态网络嵌入综述论文

【综述论文】A Survey on Dynamic Network Embedding，动态网络嵌入综述论文

专知会员服务

102+阅读 · 2020年6月16日

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

专知会员服务

27+阅读 · 2020年3月24日

深度学习增强物联网应用调查，A Survey on Deep Learning Empowered IoT Applications

深度学习增强物联网应用调查，A Survey on Deep Learning Empowered IoT Applications

专知会员服务

44+阅读 · 2019年12月29日

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

39+阅读 · 2023年4月11日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

33+阅读 · 2022年10月17日

「工业物联网异常检测技术」最新2022研究综述

「工业物联网异常检测技术」最新2022研究综述

专知

12+阅读 · 2022年5月3日

最新《动态网络嵌入》综述论文，25页pdf

最新《动态网络嵌入》综述论文，25页pdf

专知

37+阅读 · 2020年6月17日

AIoT重磅报告：四大关键助力，AI+IoT重新定义未来的可能性【附下载】

AIoT重磅报告：四大关键助力，AI+IoT重新定义未来的可能性【附下载】

物联网智库

13+阅读 · 2019年5月8日

联邦学习或将助力IoT走出“数据孤岛”？

联邦学习或将助力IoT走出“数据孤岛”？

中国计算机学会

20+阅读 · 2019年3月16日

我所了解的物联网设备测试方法（硬件篇）

我所了解的物联网设备测试方法（硬件篇）

FreeBuf

12+阅读 · 2019年2月12日

【物联网】物联网产业现状与技术发展

【物联网】物联网产业现状与技术发展

产业智能官

15+阅读 · 2018年12月17日

网络表示学习介绍

网络表示学习介绍

人工智能前沿讲习班

18+阅读 · 2018年11月26日

物联网安全搜索技术研究

国家自然科学基金

3+阅读 · 2017年12月31日

支持智能终端通信的物联网管控机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

多路径通信网络关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于混合多址的物与物通信资源分配技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

分布式认知协同无线网络物理层安全理论与传输方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

部分可充电的无线传感器网络的布置、路由和无线充电

国家自然科学基金

1+阅读 · 2015年12月31日

支持资源自适配接入的物联网服务提供方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于可再生能源的互联网节能路由研究

国家自然科学基金

0+阅读 · 2015年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

Incremental Federated Learning for Intrusion Detection in IoT Networks under Evolving Threat Landscape

Incremental Federated Learning for Intrusion Detection in IoT Networks under Evolving Threat Landscape

Arxiv

0+阅读 · 3月12日

Resource Allocation in Hybrid Radio-Optical IoT Networks using GNN with Multi-task Learning

Arxiv

0+阅读 · 3月11日

Incremental Federated Learning for Intrusion Detection in IoT Networks under Evolving Threat Landscape

Arxiv

0+阅读 · 3月11日

Self-Evolving Multi-Agent Network for Industrial IoT Predictive Maintenance

Arxiv

0+阅读 · 2月17日

Energy-Efficient Routing Protocol in Vehicular Opportunistic Networks: A Dynamic Cluster-based Routing Using Deep Reinforcement Learning

Arxiv

0+阅读 · 2月17日

Lightweight Cluster-Based Federated Learning for Intrusion Detection in Heterogeneous IoT Networks

Arxiv

0+阅读 · 2月13日

Adaptive Meta-Aggregation Federated Learning for Intrusion Detection in Heterogeneous Internet of Things

Arxiv

0+阅读 · 2月13日

Efficient IoT Intrusion Detection with an Improved Attention-Based CNN-BiLSTM Architecture

Arxiv

0+阅读 · 2月11日

Dynamic and Distributed Routing in IoT Networks based on Multi-Objective Q-Learning

Arxiv

0+阅读 · 2月6日

Contrastive Continual Learning for Model Adaptability in Internet of Things

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

最新内容

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

专知会员服务

3+阅读 · 7月23日

《基于强化学习的自动化红队测试》

《基于强化学习的自动化红队测试》

专知会员服务

3+阅读 · 7月23日

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

专知会员服务

4+阅读 · 7月23日

“天降毒雾”：无人机如何使化学战重返乌克兰战场

“天降毒雾”：无人机如何使化学战重返乌克兰战场

专知会员服务

1+阅读 · 7月23日

伊朗不对称防空战略的演进

伊朗不对称防空战略的演进

专知会员服务

3+阅读 · 7月23日

对抗环境下超视距目标打击的情报支援

对抗环境下超视距目标打击的情报支援

专知会员服务

10+阅读 · 7月22日

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

专知会员服务

4+阅读 · 7月22日

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

专知会员服务

8+阅读 · 7月22日

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

专知会员服务

10+阅读 · 7月22日

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

15+阅读 · 7月21日

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

14+阅读 · 7月21日

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

4+阅读 · 7月21日

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

6+阅读 · 7月21日

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

9+阅读 · 7月21日

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

7+阅读 · 7月20日

相关VIP内容

《基于深度学习的软件定义网络模型用于物联网网络威胁检测》

《基于深度学习的软件定义网络模型用于物联网网络威胁检测》

专知会员服务

12+阅读 · 3月16日

《国防和安全系统中的物联网 (IoT)：文献综述》

《国防和安全系统中的物联网 (IoT)：文献综述》

专知会员服务

34+阅读 · 2023年11月22日

《利用边缘计算为物联网系统提供分布式智能》2023最新博士论文

《利用边缘计算为物联网系统提供分布式智能》2023最新博士论文

专知会员服务

50+阅读 · 2023年10月30日

普渡大学2022年博士论文《构建智能物联网边缘：使用深度强化学习平衡安全性和功能性》

普渡大学2022年博士论文《构建智能物联网边缘：使用深度强化学习平衡安全性和功能性》

专知会员服务

48+阅读 · 2022年4月9日

最新论文《基于无人机基站的下一代物联网：群体智能方法的比较》西马其顿大学等高校6位 Senior Member, IEEE，Drone-Base-Station for Next-Generation Internet-of-Things: A Comparison of Swarm Intelligence Approaches

最新论文《基于无人机基站的下一代物联网：群体智能方法的比较》西马其顿大学等高校6位 Senior Member, IEEE，Drone-Base-Station for Next-Generation Internet-of-Things: A Comparison of Swarm Intelligence Approaches

专知会员服务

33+阅读 · 2022年4月7日

GNN+IoT=？弗吉尼亚大学最新《图神经网络与物联网》综述论文，45页pdf全面阐述GNN在IoT中的进展，包括算法与代码数据

GNN+IoT=？弗吉尼亚大学最新《图神经网络与物联网》综述论文，45页pdf全面阐述GNN在IoT中的进展，包括算法与代码数据

专知会员服务

61+阅读 · 2022年4月2日

物联网时代分布式深度学习新方向

物联网时代分布式深度学习新方向

专知会员服务

55+阅读 · 2020年8月30日

【综述论文】A Survey on Dynamic Network Embedding，动态网络嵌入综述论文

【综述论文】A Survey on Dynamic Network Embedding，动态网络嵌入综述论文

专知会员服务

102+阅读 · 2020年6月16日

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

专知会员服务

27+阅读 · 2020年3月24日

深度学习增强物联网应用调查，A Survey on Deep Learning Empowered IoT Applications

深度学习增强物联网应用调查，A Survey on Deep Learning Empowered IoT Applications

专知会员服务

44+阅读 · 2019年12月29日

热门VIP内容

开通专知VIP会员享更多权益服务

《基于强化学习的自动化红队测试》

“天降毒雾”：无人机如何使化学战重返乌克兰战场

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

相关资讯

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

39+阅读 · 2023年4月11日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

33+阅读 · 2022年10月17日

「工业物联网异常检测技术」最新2022研究综述

「工业物联网异常检测技术」最新2022研究综述

专知

12+阅读 · 2022年5月3日

最新《动态网络嵌入》综述论文，25页pdf

最新《动态网络嵌入》综述论文，25页pdf

专知

37+阅读 · 2020年6月17日

AIoT重磅报告：四大关键助力，AI+IoT重新定义未来的可能性【附下载】

AIoT重磅报告：四大关键助力，AI+IoT重新定义未来的可能性【附下载】

物联网智库

13+阅读 · 2019年5月8日

联邦学习或将助力IoT走出“数据孤岛”？

联邦学习或将助力IoT走出“数据孤岛”？

中国计算机学会

20+阅读 · 2019年3月16日

我所了解的物联网设备测试方法（硬件篇）

我所了解的物联网设备测试方法（硬件篇）

FreeBuf

12+阅读 · 2019年2月12日

【物联网】物联网产业现状与技术发展

【物联网】物联网产业现状与技术发展

产业智能官

15+阅读 · 2018年12月17日

网络表示学习介绍

网络表示学习介绍

人工智能前沿讲习班

18+阅读 · 2018年11月26日

相关论文

Incremental Federated Learning for Intrusion Detection in IoT Networks under Evolving Threat Landscape

Incremental Federated Learning for Intrusion Detection in IoT Networks under Evolving Threat Landscape

Arxiv

0+阅读 · 3月12日

Resource Allocation in Hybrid Radio-Optical IoT Networks using GNN with Multi-task Learning

Arxiv

0+阅读 · 3月11日

Incremental Federated Learning for Intrusion Detection in IoT Networks under Evolving Threat Landscape

Arxiv

0+阅读 · 3月11日

Self-Evolving Multi-Agent Network for Industrial IoT Predictive Maintenance

Arxiv

0+阅读 · 2月17日

Energy-Efficient Routing Protocol in Vehicular Opportunistic Networks: A Dynamic Cluster-based Routing Using Deep Reinforcement Learning

Arxiv

0+阅读 · 2月17日

Lightweight Cluster-Based Federated Learning for Intrusion Detection in Heterogeneous IoT Networks

Arxiv

0+阅读 · 2月13日

Adaptive Meta-Aggregation Federated Learning for Intrusion Detection in Heterogeneous Internet of Things

Arxiv

0+阅读 · 2月13日

Efficient IoT Intrusion Detection with an Improved Attention-Based CNN-BiLSTM Architecture

Arxiv

0+阅读 · 2月11日

Dynamic and Distributed Routing in IoT Networks based on Multi-Objective Q-Learning

Arxiv

0+阅读 · 2月6日

Contrastive Continual Learning for Model Adaptability in Internet of Things

Arxiv

0+阅读 · 2月4日

相关基金

物联网安全搜索技术研究

国家自然科学基金

3+阅读 · 2017年12月31日

支持智能终端通信的物联网管控机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

多路径通信网络关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于混合多址的物与物通信资源分配技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

分布式认知协同无线网络物理层安全理论与传输方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

部分可充电的无线传感器网络的布置、路由和无线充电

国家自然科学基金

1+阅读 · 2015年12月31日

支持资源自适配接入的物联网服务提供方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于可再生能源的互联网节能路由研究

国家自然科学基金

0+阅读 · 2015年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员