Multi-Agent Reinforcement Learning Simulation for Environmental Policy Synthesis - 专知论文

会员服务 ·

0

系统 · 不确定 · 不确定性 · 智能体 · 多智能体强化学习 ·

Multi-Agent Reinforcement Learning Simulation for Environmental Policy Synthesis

翻译：多智能体强化学习模拟在环境政策综合中的应用

James Rudd-Jones,Mirco Musolesi,María Pérez-Ortiz

from arxiv, Published in AAMAS'25 Blue Sky Ideas Track

Climate policy development faces significant challenges due to deep uncertainty, complex system dynamics, and competing stakeholder interests. Climate simulation methods, such as Earth System Models, have become valuable tools for policy exploration. However, their typical use is for evaluating potential polices, rather than directly synthesizing them. The problem can be inverted to optimize for policy pathways, but the traditional optimization approaches often struggle with non-linear dynamics, heterogeneous agents, and comprehensive uncertainty quantification. We propose a framework for augmenting climate simulations with Multi-Agent Reinforcement Learning (MARL) to address these limitations. We identify key challenges at the interface between climate simulations and the application of MARL in the context of policy synthesis, including reward definition, scalability with increasing agents and state spaces, uncertainty propagation across linked systems, and solution validation. Additionally, we discuss challenges in making MARL-derived solutions interpretable and useful for policy-makers. Our framework provides a foundation for more sophisticated climate policy exploration while acknowledging important limitations and areas for future research.

翻译：气候政策制定面临着深度不确定性、复杂系统动态以及利益相关者竞争等多重挑战。以地球系统模型为代表的气候模拟方法已成为政策探索的重要工具。然而，这些模型通常用于评估潜在政策，而非直接生成政策方案。虽然可以通过逆向优化来寻求政策路径，但传统优化方法在处理非线性动态、异质智能体及综合不确定性量化方面存在明显局限。本文提出一种将多智能体强化学习与气候模拟相结合的框架以应对这些挑战。我们系统阐述了在政策综合背景下，气候模拟与MARL方法融合面临的核心难题，包括奖励函数定义、智能体数量与状态空间扩展的可扩展性、关联系统间的不确定性传递以及解决方案验证等问题。同时，我们深入探讨了如何使MARL生成的解决方案对政策制定者更具可解释性与实用性。本框架为开展更深入的气候政策探索奠定了基础，同时也明确了当前方法的局限性与未来研究方向。

0

相关内容

《多智能体影响图在混合威胁建模中的应用》最新30页报告

《多智能体影响图在混合威胁建模中的应用》最新30页报告

专知会员服务

21+阅读 · 3月15日

【博士论文】将核学习器转化为融入气候科学领域知识的模型

【博士论文】将核学习器转化为融入气候科学领域知识的模型

专知会员服务

13+阅读 · 2025年2月19日

深度学习与基础模型在天气预测中的应用：综述

深度学习与基础模型在天气预测中的应用：综述

专知会员服务

24+阅读 · 2025年1月15日

多智能体强化学习控制与决策研究综述

多智能体强化学习控制与决策研究综述

专知会员服务

48+阅读 · 2024年11月23日

基于学习机制的多智能体强化学习综述

基于学习机制的多智能体强化学习综述

专知会员服务

63+阅读 · 2024年4月16日

《基于认知、多智能体和知识平台的有限理性决策建模》316页

《基于认知、多智能体和知识平台的有限理性决策建模》316页

专知会员服务

101+阅读 · 2024年4月8日

《用于空战机动的分层多智能体强化学习》

《用于空战机动的分层多智能体强化学习》

专知会员服务

68+阅读 · 2023年10月5日

多智能体协同决策方法研究

多智能体协同决策方法研究

专知会员服务

134+阅读 · 2022年12月15日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知会员服务

260+阅读 · 2022年8月23日

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

专知会员服务

140+阅读 · 2022年5月17日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

32+阅读 · 2022年11月12日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

推荐！【中文版】《人工智能和仿真技术在军事决策中的作用》北约技术报告

推荐！【中文版】《人工智能和仿真技术在军事决策中的作用》北约技术报告

专知

111+阅读 · 2022年8月20日

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

专知

14+阅读 · 2022年5月31日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

深度多模态表示学习综述论文，22页pdf

深度多模态表示学习综述论文，22页pdf

专知

33+阅读 · 2020年6月21日

多模态深度学习综述，18页pdf

多模态深度学习综述，18页pdf

专知

51+阅读 · 2020年3月29日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

每日论文 | 用循环世界模型改良策略进化；轻量级CNN：ChannelNets；强化学习知识点总结

每日论文 | 用循环世界模型改良策略进化；轻量级CNN：ChannelNets；强化学习知识点总结

论智

14+阅读 · 2018年9月7日

多层动态网络的建模、群体动力学分析与控制

国家自然科学基金

3+阅读 · 2015年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

复杂决策环境下面向共识的群体评价模型与方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向智能电网多元储能系统的信息综合利用及自学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

能源经济环境集成系统中的多重内生技术演化建模与政策优化设计

国家自然科学基金

2+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

低碳目标的城市多模式复合交通网络模型及组合出行路径优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

49+阅读 · 2009年12月31日

Imagine-then-Plan: Agent Learning from Adaptive Lookahead with World Models

Arxiv

0+阅读 · 3月16日

Enhancing Computational Efficiency in Multiscale Systems Using Deep Learning of Coordinates and Flow Maps

Arxiv

0+阅读 · 3月10日

Agentic Scientific Simulation: Execution-Grounded Model Construction and Reconstruction

Arxiv

0+阅读 · 2月27日

Multi-agent deep reinforcement learning with centralized training and decentralized execution for transportation infrastructure management

Arxiv

0+阅读 · 2月25日

Density correction for multivariate spatial fields of global climate model output using deep learning

Arxiv

0+阅读 · 2月20日

Environmental policy in the context of complex systems: Statistical optimization and sensitivity analysis for ABMs

Arxiv

0+阅读 · 2月19日

Multi-Agent Model-Based Reinforcement Learning with Joint State-Action Learned Embeddings

Arxiv

0+阅读 · 2月13日

Using predictive multiplicity to measure individual performance within the AI Act

Arxiv

0+阅读 · 2月12日

Decentralized Reinforcement Learning for Multi-Agent Multi-Resource Allocation via Dynamic Cluster Agreements

Arxiv

0+阅读 · 2月11日

What Makes LLM Agent Simulations Useful for Policy Practice? An Iterative Design Study in Emergency Preparedness

Arxiv

0+阅读 · 2月8日

VIP会员

文章信息

相关主题

多智能体强化学习

最新内容

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

专知会员服务

1+阅读 · 19分钟前

《深度强化学习在兵棋推演中的应用》40页报告

《深度强化学习在兵棋推演中的应用》40页报告

专知会员服务

1+阅读 · 46分钟前

《多域作战面临复杂现实》

《多域作战面临复杂现实》

专知会员服务

1+阅读 · 48分钟前

《印度的多域作战：条令与能力发展》报告

《印度的多域作战：条令与能力发展》报告

专知会员服务

0+阅读 · 59分钟前

《是“修复情报”还是修复部队？阿富汗反叛乱行动中的美军情报调整》400页

《是“修复情报”还是修复部队？阿富汗反叛乱行动中的美军情报调整》400页

专知会员服务

0+阅读 · 今天5:18

美军的算法化军备库：无人机优势计划（DDP）、复制者倡议（Replicator）与联合全域指挥控制（JADC2）如何重写战争规则

美军的算法化军备库：无人机优势计划（DDP）、复制者倡议（Replicator）与联合全域指挥控制（JADC2）如何重写战争规则

专知会员服务

0+阅读 · 今天3:25

（中文版）美空军部发布《空军部数据战略》与《人工智能战略》两份战略：旨在加速建立军事优势

（中文版）美空军部发布《空军部数据战略》与《人工智能战略》两份战略：旨在加速建立军事优势

专知会员服务

5+阅读 · 今天2:55

【斯坦福博士论文】语言模型的机械可解释性与控制

【斯坦福博士论文】语言模型的机械可解释性与控制

专知会员服务

2+阅读 · 4月23日

大语言模型智能体长期记忆安全性综述：迈向记忆主权

大语言模型智能体长期记忆安全性综述：迈向记忆主权

专知会员服务

1+阅读 · 4月23日

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

专知会员服务

4+阅读 · 4月23日

人工智能赋能无人机：俄乌战争（万字长文）

人工智能赋能无人机：俄乌战争（万字长文）

专知会员服务

6+阅读 · 4月23日

国外海军作战管理系统与作战训练系统

国外海军作战管理系统与作战训练系统

专知会员服务

3+阅读 · 4月23日

美军条令《海军陆战队规划流程（2026版）》

美军条令《海军陆战队规划流程（2026版）》

专知会员服务

10+阅读 · 4月23日

《压缩式分布式交互仿真标准》120页

《压缩式分布式交互仿真标准》120页

专知会员服务

4+阅读 · 4月23日

《电子战数据交换模型研究报告》

《电子战数据交换模型研究报告》

专知会员服务

6+阅读 · 4月23日

相关VIP内容

《多智能体影响图在混合威胁建模中的应用》最新30页报告

《多智能体影响图在混合威胁建模中的应用》最新30页报告

专知会员服务

21+阅读 · 3月15日

【博士论文】将核学习器转化为融入气候科学领域知识的模型

【博士论文】将核学习器转化为融入气候科学领域知识的模型

专知会员服务

13+阅读 · 2025年2月19日

深度学习与基础模型在天气预测中的应用：综述

深度学习与基础模型在天气预测中的应用：综述

专知会员服务

24+阅读 · 2025年1月15日

多智能体强化学习控制与决策研究综述

多智能体强化学习控制与决策研究综述

专知会员服务

48+阅读 · 2024年11月23日

基于学习机制的多智能体强化学习综述

基于学习机制的多智能体强化学习综述

专知会员服务

63+阅读 · 2024年4月16日

《基于认知、多智能体和知识平台的有限理性决策建模》316页

《基于认知、多智能体和知识平台的有限理性决策建模》316页

专知会员服务

101+阅读 · 2024年4月8日

《用于空战机动的分层多智能体强化学习》

《用于空战机动的分层多智能体强化学习》

专知会员服务

68+阅读 · 2023年10月5日

多智能体协同决策方法研究

多智能体协同决策方法研究

专知会员服务

134+阅读 · 2022年12月15日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知会员服务

260+阅读 · 2022年8月23日

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

专知会员服务

140+阅读 · 2022年5月17日

热门VIP内容

开通专知VIP会员享更多权益服务

《深度强化学习在兵棋推演中的应用》40页报告

《印度的多域作战：条令与能力发展》报告

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

《多域作战面临复杂现实》

相关资讯

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

32+阅读 · 2022年11月12日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

推荐！【中文版】《人工智能和仿真技术在军事决策中的作用》北约技术报告

推荐！【中文版】《人工智能和仿真技术在军事决策中的作用》北约技术报告

专知

111+阅读 · 2022年8月20日

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

专知

14+阅读 · 2022年5月31日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

深度多模态表示学习综述论文，22页pdf

深度多模态表示学习综述论文，22页pdf

专知

33+阅读 · 2020年6月21日

多模态深度学习综述，18页pdf

多模态深度学习综述，18页pdf

专知

51+阅读 · 2020年3月29日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

每日论文 | 用循环世界模型改良策略进化；轻量级CNN：ChannelNets；强化学习知识点总结

每日论文 | 用循环世界模型改良策略进化；轻量级CNN：ChannelNets；强化学习知识点总结

论智

14+阅读 · 2018年9月7日

相关论文

Imagine-then-Plan: Agent Learning from Adaptive Lookahead with World Models

Arxiv

0+阅读 · 3月16日

Enhancing Computational Efficiency in Multiscale Systems Using Deep Learning of Coordinates and Flow Maps

Arxiv

0+阅读 · 3月10日

Agentic Scientific Simulation: Execution-Grounded Model Construction and Reconstruction

Arxiv

0+阅读 · 2月27日

Multi-agent deep reinforcement learning with centralized training and decentralized execution for transportation infrastructure management

Arxiv

0+阅读 · 2月25日

Density correction for multivariate spatial fields of global climate model output using deep learning

Arxiv

0+阅读 · 2月20日

Environmental policy in the context of complex systems: Statistical optimization and sensitivity analysis for ABMs

Arxiv

0+阅读 · 2月19日

Multi-Agent Model-Based Reinforcement Learning with Joint State-Action Learned Embeddings

Arxiv

0+阅读 · 2月13日

Using predictive multiplicity to measure individual performance within the AI Act

Arxiv

0+阅读 · 2月12日

Decentralized Reinforcement Learning for Multi-Agent Multi-Resource Allocation via Dynamic Cluster Agreements

Arxiv

0+阅读 · 2月11日

What Makes LLM Agent Simulations Useful for Policy Practice? An Iterative Design Study in Emergency Preparedness

Arxiv

0+阅读 · 2月8日

相关基金

多层动态网络的建模、群体动力学分析与控制

国家自然科学基金

3+阅读 · 2015年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

复杂决策环境下面向共识的群体评价模型与方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向智能电网多元储能系统的信息综合利用及自学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

能源经济环境集成系统中的多重内生技术演化建模与政策优化设计

国家自然科学基金

2+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

低碳目标的城市多模式复合交通网络模型及组合出行路径优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

49+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员