《不确定性下基础设施维修与更换决策的深度强化学习方法》2026最新89页 - 专知VIP

会员服务 ·

3

军事防务 · 作战装备维护 · 深度强化学习 ·

《不确定性下基础设施维修与更换决策的深度强化学习方法》2026最新89页

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

关键基础设施系统是一个复杂的组件网络，易受环境因素、老化及攻击影响而发生故障。最优的资产维修与更换维护策略能够增强其支撑军事任务和社区功能的能力。然而在实践中，由于需要大量数据及指数级庞大的优化模型，难以制定出真正最优的关键基础设施系统维护策略。当前研究通常采用简化模型复杂度但仍试图生成近似最优策略的强化学习算法来规避此问题。本研究在一个简单的三组件基础设施网络上，评估了由线性规划生成的最优维护策略与由基于神经网络的深度强化学习生成的策略之间的差异。结果表明，即使使用理想的超参数进行调整，所评估的强化学习算法生成的策略性能也显著差于真实最优策略。此外，当模型参数变化时，最优策略的表现优于所有神经网络模型，这表明其对底层系统数据的不确定性敏感度较低。

本文其余部分结构如下。第2章回顾了用于生成分析维护策略的马尔可夫决策过程与机器学习算法。第3章概述了模型构建，并总结了线性规划与机器学习算法的数学基础。第4章详述了模型测试的设置、执行与结果。第5章给出了结论、项目总结以及对未来工作的建议。

成为VIP会员查看完整内容

7

相关内容

军事防务

军事防务数据板块介绍：系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块，其核心在于整合全球新兴国防技术（军事人工智能、无人系统等）、热点案例（俄乌战争、美以伊战争）等方面的最新时讯、研究报告/论文、条令法规、案例分析，为战略研判、情报分析、决策支持等提供知识支撑。

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

专知会员服务

26+阅读 · 2025年11月17日

《先进优化与机器学习技术赋能高效无线通信网络》最新225页

《先进优化与机器学习技术赋能高效无线通信网络》最新225页

专知会员服务

35+阅读 · 2025年4月29日

数字大动脉未来新底座——数字基础设施评估体系研究报告（2024年）

数字大动脉未来新底座——数字基础设施评估体系研究报告（2024年）

专知会员服务

36+阅读 · 2024年3月31日

数据中心智能化运维发展研究报告 (2023 年)，35页pdf

数据中心智能化运维发展研究报告 (2023 年)，35页pdf

专知会员服务

63+阅读 · 2023年3月25日

第六届未来网络发展大会《确定性网络技术发展与产业应用白皮书》

第六届未来网络发展大会《确定性网络技术发展与产业应用白皮书》

专知会员服务

36+阅读 · 2022年9月21日

新基建产品手册4.0，72页pdf

专知会员服务

54+阅读 · 2021年9月11日

新基建产品手册: 人工智能、5G、车联网、数据中心等，72页pdf

新基建产品手册: 人工智能、5G、车联网、数据中心等，72页pdf

专知会员服务

100+阅读 · 2021年5月9日

区块链赋能新基建领域应用白皮书, 41页ppt

区块链赋能新基建领域应用白皮书, 41页ppt

专知会员服务

111+阅读 · 2021年3月17日

《AI新基建发展白皮书》，国家工信安全中心

《AI新基建发展白皮书》，国家工信安全中心

专知会员服务

194+阅读 · 2021年1月23日

【德勤】新基建战略规划及投资新机会，16页pdf，新型基础建设投资机遇的初步解读

【德勤】新基建战略规划及投资新机会，16页pdf，新型基础建设投资机遇的初步解读

专知会员服务

98+阅读 · 2020年5月18日

【2022新书】强化学习基础及其在金融中的应用，522页pdf

【2022新书】强化学习基础及其在金融中的应用，522页pdf

专知

10+阅读 · 2022年11月6日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

《“边缘计算+”技术白皮书》，82页pdf

《“边缘计算+”技术白皮书》，82页pdf

专知

11+阅读 · 2022年8月28日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知

17+阅读 · 2021年1月18日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

深度学习模型不确定性方法对比

深度学习模型不确定性方法对比

PaperWeekly

20+阅读 · 2020年2月10日

八千字长文深度解读，迁移学习在强化学习中的应用及最新进展

八千字长文深度解读，迁移学习在强化学习中的应用及最新进展

机器之心

13+阅读 · 2019年10月17日

分布式核心技术知识图谱，带走不谢

分布式核心技术知识图谱，带走不谢

架构师之路

12+阅读 · 2019年9月23日

最全的智慧工地解决方案

最全的智慧工地解决方案

智能交通技术

11+阅读 · 2019年8月30日

【知识图谱】知识图谱+人工智能=新型网络信息体系

【知识图谱】知识图谱+人工智能=新型网络信息体系

产业智能官

14+阅读 · 2018年11月18日

面向智能电网多元储能系统的信息综合利用及自学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

不确定环境荷载作用下地铁盾构隧道结构易损性评价及设计优化方法

国家自然科学基金

0+阅读 · 2015年12月31日

互连网络条件路覆盖与综合诊断策略下的故障诊断性研究

国家自然科学基金

0+阅读 · 2015年12月31日

具有重构特征的系统可靠性建模方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

富信息环境下复杂可修系统动态维修决策研究

国家自然科学基金

3+阅读 · 2015年12月31日

网络化控制系统安全理论与关键技术

国家自然科学基金

1+阅读 · 2014年12月31日

面向任务成功性的可修系统重要度分析及优化

国家自然科学基金

0+阅读 · 2014年12月31日

不确定与动态信息环境下基于预规划-重规划集成建模的应急物流选址-调度鲁棒优化研究

国家自然科学基金

3+阅读 · 2014年12月31日

不确定结构可靠寿命设计的时变高精度模型和序列优化问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于大数据分析的输变电设备状态评估基础理论与方法

国家自然科学基金

1+阅读 · 2014年12月31日

Probabilistic Hazard Analysis Framework with Stochastic Optimal Control for Deteriorating Civil Infrastructure Systems

Arxiv

0+阅读 · 4月24日

Heterogeneity-Aware Personalized Federated Learning for Industrial Predictive Analytics

Arxiv

0+阅读 · 4月21日

Hierarchical DLO Routing with Reinforcement Learning and In-Context Vision-language Models

Arxiv

0+阅读 · 4月15日

From Incomplete Architecture to Quantified Risk: Multimodal LLM-Driven Security Assessment for Cyber-Physical Systems

Arxiv

0+阅读 · 4月7日

Large Language Models for Combinatorial Optimization of Design Structure Matrix

Arxiv

0+阅读 · 4月5日

Risk-Constrained Belief-Space Optimization for Safe Control under Latent Uncertainty

Arxiv

0+阅读 · 4月4日

Agentic Link Construction for Environment and Intent Aware 6G Communication

Arxiv

0+阅读 · 4月3日

Decentralized Task Scheduling in Distributed Systems: A Deep Reinforcement Learning Approach

Arxiv

0+阅读 · 3月25日

Multi-agent deep reinforcement learning with centralized training and decentralized execution for transportation infrastructure management

Arxiv

0+阅读 · 2月25日

A Survey on Uncertainty Reasoning and Quantification for Decision Making: Belief Theory Meets Deep Learning

Arxiv

30+阅读 · 2022年6月12日

VIP会员

相关主题

作战装备维护

深度强化学习

最新内容

《不确定性下基础设施维修与更换决策的深度强化学习方法》2026最新89页

《不确定性下基础设施维修与更换决策的深度强化学习方法》2026最新89页

专知会员服务

7+阅读 · 今天3:25

Palantir测试“战争操作系统” ：管理乌克兰对俄作战

Palantir测试“战争操作系统” ：管理乌克兰对俄作战

专知会员服务

7+阅读 · 今天3:16

《算法背后的力量：Palantir与全球AI监控及军事行动的兴起》

《算法背后的力量：Palantir与全球AI监控及军事行动的兴起》

专知会员服务

9+阅读 · 今天3:13

无人机系统对海军舰艇的战略威胁评估：基于任务分析的脆弱性与应对措施研究（2026最新90页）

无人机系统对海军舰艇的战略威胁评估：基于任务分析的脆弱性与应对措施研究（2026最新90页）

专知会员服务

11+阅读 · 今天3:10

战争算法：Palantir与Anthropic如何成为美国对伊行动中的共同交战方

战争算法：Palantir与Anthropic如何成为美国对伊行动中的共同交战方

专知会员服务

4+阅读 · 今天3:05

《军事任务为中心网络安全风险评估中的不确定性》

《军事任务为中心网络安全风险评估中的不确定性》

专知会员服务

5+阅读 · 今天2:39

[ICML 2026] 训练-推理一致的片段级执行：长上下文LLM的高效可扩展方法

[ICML 2026] 训练-推理一致的片段级执行：长上下文LLM的高效可扩展方法

专知会员服务

4+阅读 · 5月17日

从看见到认知世界：视觉世界模型综述

从看见到认知世界：视觉世界模型综述

专知会员服务

7+阅读 · 5月17日

《高超声速打击武器引发的战略影响》116页

《高超声速打击武器引发的战略影响》116页

专知会员服务

8+阅读 · 5月17日

《美军不对称战略选择》28页slides

《美军不对称战略选择》28页slides

专知会员服务

9+阅读 · 5月17日

《审视 Palantir 监控平台》

《审视 Palantir 监控平台》

专知会员服务

20+阅读 · 5月17日

《美海军研究报告：利用认知模型为机器学习模型生成数据》

《美海军研究报告：利用认知模型为机器学习模型生成数据》

专知会员服务

10+阅读 · 5月17日

PALANTIR GOTHAM平台：人工智能赋能作战

PALANTIR GOTHAM平台：人工智能赋能作战

专知会员服务

17+阅读 · 5月17日

集成式人工智能：Palantir与认知维度

集成式人工智能：Palantir与认知维度

专知会员服务

11+阅读 · 5月17日

AI原生数据库发展趋势白皮书

AI原生数据库发展趋势白皮书

专知会员服务

13+阅读 · 5月16日

相关VIP内容

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

专知会员服务

26+阅读 · 2025年11月17日

《先进优化与机器学习技术赋能高效无线通信网络》最新225页

《先进优化与机器学习技术赋能高效无线通信网络》最新225页

专知会员服务

35+阅读 · 2025年4月29日

数字大动脉未来新底座——数字基础设施评估体系研究报告（2024年）

数字大动脉未来新底座——数字基础设施评估体系研究报告（2024年）

专知会员服务

36+阅读 · 2024年3月31日

数据中心智能化运维发展研究报告 (2023 年)，35页pdf

数据中心智能化运维发展研究报告 (2023 年)，35页pdf

专知会员服务

63+阅读 · 2023年3月25日

第六届未来网络发展大会《确定性网络技术发展与产业应用白皮书》

第六届未来网络发展大会《确定性网络技术发展与产业应用白皮书》

专知会员服务

36+阅读 · 2022年9月21日

新基建产品手册4.0，72页pdf

专知会员服务

54+阅读 · 2021年9月11日

新基建产品手册: 人工智能、5G、车联网、数据中心等，72页pdf

新基建产品手册: 人工智能、5G、车联网、数据中心等，72页pdf

专知会员服务

100+阅读 · 2021年5月9日

区块链赋能新基建领域应用白皮书, 41页ppt

区块链赋能新基建领域应用白皮书, 41页ppt

专知会员服务

111+阅读 · 2021年3月17日

《AI新基建发展白皮书》，国家工信安全中心

《AI新基建发展白皮书》，国家工信安全中心

专知会员服务

194+阅读 · 2021年1月23日

【德勤】新基建战略规划及投资新机会，16页pdf，新型基础建设投资机遇的初步解读

【德勤】新基建战略规划及投资新机会，16页pdf，新型基础建设投资机遇的初步解读

专知会员服务

98+阅读 · 2020年5月18日

热门VIP内容

开通专知VIP会员享更多权益服务

Palantir测试“战争操作系统” ：管理乌克兰对俄作战

无人机系统对海军舰艇的战略威胁评估：基于任务分析的脆弱性与应对措施研究（2026最新90页）

《不确定性下基础设施维修与更换决策的深度强化学习方法》2026最新89页

《算法背后的力量：Palantir与全球AI监控及军事行动的兴起》

相关资讯

【2022新书】强化学习基础及其在金融中的应用，522页pdf

【2022新书】强化学习基础及其在金融中的应用，522页pdf

专知

10+阅读 · 2022年11月6日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

《“边缘计算+”技术白皮书》，82页pdf

《“边缘计算+”技术白皮书》，82页pdf

专知

11+阅读 · 2022年8月28日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知

17+阅读 · 2021年1月18日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

深度学习模型不确定性方法对比

深度学习模型不确定性方法对比

PaperWeekly

20+阅读 · 2020年2月10日

八千字长文深度解读，迁移学习在强化学习中的应用及最新进展

八千字长文深度解读，迁移学习在强化学习中的应用及最新进展

机器之心

13+阅读 · 2019年10月17日

分布式核心技术知识图谱，带走不谢

分布式核心技术知识图谱，带走不谢

架构师之路

12+阅读 · 2019年9月23日

最全的智慧工地解决方案

最全的智慧工地解决方案

智能交通技术

11+阅读 · 2019年8月30日

【知识图谱】知识图谱+人工智能=新型网络信息体系

【知识图谱】知识图谱+人工智能=新型网络信息体系

产业智能官

14+阅读 · 2018年11月18日

相关基金

面向智能电网多元储能系统的信息综合利用及自学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

不确定环境荷载作用下地铁盾构隧道结构易损性评价及设计优化方法

国家自然科学基金

0+阅读 · 2015年12月31日

互连网络条件路覆盖与综合诊断策略下的故障诊断性研究

国家自然科学基金

0+阅读 · 2015年12月31日

具有重构特征的系统可靠性建模方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

富信息环境下复杂可修系统动态维修决策研究

国家自然科学基金

3+阅读 · 2015年12月31日

网络化控制系统安全理论与关键技术

国家自然科学基金

1+阅读 · 2014年12月31日

面向任务成功性的可修系统重要度分析及优化

国家自然科学基金

0+阅读 · 2014年12月31日

不确定与动态信息环境下基于预规划-重规划集成建模的应急物流选址-调度鲁棒优化研究

国家自然科学基金

3+阅读 · 2014年12月31日

不确定结构可靠寿命设计的时变高精度模型和序列优化问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于大数据分析的输变电设备状态评估基础理论与方法

国家自然科学基金

1+阅读 · 2014年12月31日

相关论文

Probabilistic Hazard Analysis Framework with Stochastic Optimal Control for Deteriorating Civil Infrastructure Systems

Arxiv

0+阅读 · 4月24日

Heterogeneity-Aware Personalized Federated Learning for Industrial Predictive Analytics

Arxiv

0+阅读 · 4月21日

Hierarchical DLO Routing with Reinforcement Learning and In-Context Vision-language Models

Arxiv

0+阅读 · 4月15日

From Incomplete Architecture to Quantified Risk: Multimodal LLM-Driven Security Assessment for Cyber-Physical Systems

Arxiv

0+阅读 · 4月7日

Large Language Models for Combinatorial Optimization of Design Structure Matrix

Arxiv

0+阅读 · 4月5日

Risk-Constrained Belief-Space Optimization for Safe Control under Latent Uncertainty

Arxiv

0+阅读 · 4月4日

Agentic Link Construction for Environment and Intent Aware 6G Communication

Arxiv

0+阅读 · 4月3日

Decentralized Task Scheduling in Distributed Systems: A Deep Reinforcement Learning Approach

Arxiv

0+阅读 · 3月25日

Multi-agent deep reinforcement learning with centralized training and decentralized execution for transportation infrastructure management

Arxiv

0+阅读 · 2月25日

A Survey on Uncertainty Reasoning and Quantification for Decision Making: Belief Theory Meets Deep Learning

Arxiv

30+阅读 · 2022年6月12日

微信扫码咨询专知VIP会员