面向可持续投资政策：基于对手塑造的启示 (Towards Sustainable Investment Policies Informed by Opponent Shaping) - 专知论文

会员服务 ·

0

塑造 · 投资 · 体模 · 交互 · 呈现 ·

Towards Sustainable Investment Policies Informed by Opponent Shaping

翻译：面向可持续投资政策：基于对手塑造的启示

Juan Agustin Duque,Razvan Ciuca,Ayoub Echchahed,Hugo Larochelle,Aaron Courville

from arxiv, Accepted at ICLR 2026

Addressing climate change requires global coordination, yet rational economic actors often prioritize immediate gains over collective welfare, resulting in social dilemmas. InvestESG is a recently proposed multi-agent simulation that captures the dynamic interplay between investors and companies under climate risk. We provide a formal characterization of the conditions under which InvestESG exhibits an intertemporal social dilemma, deriving theoretical thresholds at which individual incentives diverge from collective welfare. Building on this, we apply Advantage Alignment, a scalable opponent shaping algorithm shown to be effective in general-sum games, to influence agent learning in InvestESG. We offer theoretical insights into why Advantage Alignment systematically favors socially beneficial equilibria by biasing learning dynamics toward cooperative outcomes. Our results demonstrate that strategically shaping the learning processes of economic agents can result in better outcomes that could inform policy mechanisms to better align market incentives with long-term sustainability goals.

翻译：应对气候变化需要全球协调，然而理性的经济主体往往优先考虑即时收益而非集体福祉，从而导致社会困境。InvestESG 是近期提出的一种多智能体模拟框架，用于刻画气候风险下投资者与企业之间的动态交互。我们对 InvestESG 呈现跨期社会困境的条件进行了形式化刻画，推导出个体激励与集体福利发生背离的理论阈值。在此基础上，我们应用 Advantage Alignment——一种在一般和博弈中被证明有效的可扩展对手塑造算法——来影响 InvestESG 中智能体的学习过程。我们从理论上阐释了 Advantage Alignment 如何通过将学习动态偏向合作性结果，从而系统性地促进社会有益均衡。研究结果表明，策略性地塑造经济主体的学习过程能够产生更优的结果，这可为设计政策机制提供参考，以更好地使市场激励与长期可持续性目标相一致。

0

相关内容

《多智能体大语言模型系统的可靠决策研究》

《多智能体大语言模型系统的可靠决策研究》

专知会员服务

32+阅读 · 2月2日

《基于Transformer的智能体的战术决策解释》

《基于Transformer的智能体的战术决策解释》

专知会员服务

39+阅读 · 2025年12月28日

面向应用的智能体 AI 系统价值对齐：综述与展望

面向应用的智能体 AI 系统价值对齐：综述与展望

专知会员服务

23+阅读 · 2025年6月12日

《国防投资不确定性和风险的可视化设计》最新168页

《国防投资不确定性和风险的可视化设计》最新168页

专知会员服务

17+阅读 · 2024年10月25日

《改进国防投资组合决策：来自文献和国家实践的见解》北约科技组织2022最新278页报告

《改进国防投资组合决策：来自文献和国家实践的见解》北约科技组织2022最新278页报告

专知会员服务

30+阅读 · 2022年10月31日

《IMPACTS：一个人机协作的信任模型》加拿大国防研级与发展部

《IMPACTS：一个人机协作的信任模型》加拿大国防研级与发展部

专知会员服务

29+阅读 · 2022年7月20日

【决策Transformers 导论】Introducing Decision Transformers on Hugging Face 🤗

【决策Transformers 导论】Introducing Decision Transformers on Hugging Face 🤗

专知会员服务

68+阅读 · 2022年3月29日

《迈向“碳中和2060” 迎接低碳发展新机遇》，高瓴产业与创新研究院和北京绿色金融与可持续发展研究院联合发布，38页pdf

专知会员服务

72+阅读 · 2021年4月1日

【德勤】新基建战略规划及投资新机会，16页pdf，新型基础建设投资机遇的初步解读

【德勤】新基建战略规划及投资新机会，16页pdf，新型基础建设投资机遇的初步解读

专知会员服务

98+阅读 · 2020年5月18日

Risk Sensitive Portfolio Optimization with Regime-Switching and Default Contagion，香港理工大学应用数学系余翔助理教授，第八届全国社会媒体处理大会SMP2019

Risk Sensitive Portfolio Optimization with Regime-Switching and Default Contagion，香港理工大学应用数学系余翔助理教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

10+阅读 · 2019年10月24日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

47+阅读 · 2022年11月16日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

18+阅读 · 2022年9月28日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

强化学习《奖励函数设计: Reward Shaping》详细解读

强化学习《奖励函数设计: Reward Shaping》详细解读

深度强化学习实验室

18+阅读 · 2020年9月1日

【KDD2020】动态知识图谱的多事件预测

【KDD2020】动态知识图谱的多事件预测

专知

88+阅读 · 2020年8月31日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

每日论文 | 用循环世界模型改良策略进化；轻量级CNN：ChannelNets；强化学习知识点总结

每日论文 | 用循环世界模型改良策略进化；轻量级CNN：ChannelNets；强化学习知识点总结

论智

14+阅读 · 2018年9月7日

智能时代如何构建金融反欺诈体系？

智能时代如何构建金融反欺诈体系？

数据猿

12+阅读 · 2018年3月26日

【技术贴】面对无孔不入的黑产，如何搭建反欺诈策略与模型？

【技术贴】面对无孔不入的黑产，如何搭建反欺诈策略与模型？

互联网金融

10+阅读 · 2017年7月13日

知识提取的一种应用，从上市公司年报中抽取因果关系

知识提取的一种应用，从上市公司年报中抽取因果关系

文因互联

10+阅读 · 2017年7月7日

创业投资后创业投资家与创业者冲突的动态演化机制及影响因素研究：过程观视角

国家自然科学基金

0+阅读 · 2015年12月31日

基于反射理论的信息驱动金融市场模型研究

国家自然科学基金

2+阅读 · 2015年12月31日

具有重构特征的系统可靠性建模方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

小微企业互联网平台融资模式研究—基于双向拍卖和信号博弈双重视角

国家自然科学基金

4+阅读 · 2015年12月31日

信任、投资者参与模式与股票市场发展研究

国家自然科学基金

0+阅读 · 2014年12月31日

Forward-Looking与Backward-Looking相结合的投资组合管理

国家自然科学基金

1+阅读 · 2014年12月31日

产业政策与公司投资：政府监管与企业之间的一个博弈

国家自然科学基金

1+阅读 · 2014年12月31日

绿色供应链环境投入协作影响机制及决策优化研究

国家自然科学基金

1+阅读 · 2014年12月31日

PPP项目特许经营合同再谈判与补偿机制研究

国家自然科学基金

1+阅读 · 2014年12月31日

中国企业对外直接投资空间网络布局构建及其对企业海外运营的影响

国家自然科学基金

0+阅读 · 2014年12月31日

Cooperative Game Theory Model for Sustainable UN Financing: Addressing Global Public Goods Provision

Arxiv

0+阅读 · 2月13日

Funding AI for Good: A Call for Meaningful Engagement

Arxiv

0+阅读 · 2月6日

Efficient Investment in Multi-Agent Models of Public Transportation

Arxiv

0+阅读 · 2月3日

FinEvo: From Isolated Backtests to Ecological Market Games for Multi-Agent Financial Strategy Evolution

Arxiv

0+阅读 · 2月1日

Towards Trustworthy Multimodal Recommendation

Arxiv

0+阅读 · 1月31日

Helios: A Foundational Language Model for Smart Energy Knowledge Reasoning and Application

Arxiv

0+阅读 · 1月30日

More at Stake: How Payoff and Language Shape LLM Agent Strategies in Cooperation Dilemmas

Arxiv

0+阅读 · 1月27日

Learning long term climate-resilient transport adaptation pathways under direct and indirect flood impacts using reinforcement learning

Arxiv

0+阅读 · 1月26日

Disentangling trust from cooperation: Trust as reduced monitoring across social dilemmas

Arxiv

0+阅读 · 1月22日

Advancing ESG Intelligence: An Expert-level Agent and Comprehensive Benchmark for Sustainable Finance

Arxiv

0+阅读 · 1月13日

VIP会员

文章信息

相关主题

相关VIP内容

《多智能体大语言模型系统的可靠决策研究》

《多智能体大语言模型系统的可靠决策研究》

专知会员服务

32+阅读 · 2月2日

《基于Transformer的智能体的战术决策解释》

《基于Transformer的智能体的战术决策解释》

专知会员服务

39+阅读 · 2025年12月28日

面向应用的智能体 AI 系统价值对齐：综述与展望

面向应用的智能体 AI 系统价值对齐：综述与展望

专知会员服务

23+阅读 · 2025年6月12日

《国防投资不确定性和风险的可视化设计》最新168页

《国防投资不确定性和风险的可视化设计》最新168页

专知会员服务

17+阅读 · 2024年10月25日

《改进国防投资组合决策：来自文献和国家实践的见解》北约科技组织2022最新278页报告

《改进国防投资组合决策：来自文献和国家实践的见解》北约科技组织2022最新278页报告

专知会员服务

30+阅读 · 2022年10月31日

《IMPACTS：一个人机协作的信任模型》加拿大国防研级与发展部

《IMPACTS：一个人机协作的信任模型》加拿大国防研级与发展部

专知会员服务

29+阅读 · 2022年7月20日

【决策Transformers 导论】Introducing Decision Transformers on Hugging Face 🤗

【决策Transformers 导论】Introducing Decision Transformers on Hugging Face 🤗

专知会员服务

68+阅读 · 2022年3月29日

《迈向“碳中和2060” 迎接低碳发展新机遇》，高瓴产业与创新研究院和北京绿色金融与可持续发展研究院联合发布，38页pdf

专知会员服务

72+阅读 · 2021年4月1日

【德勤】新基建战略规划及投资新机会，16页pdf，新型基础建设投资机遇的初步解读

【德勤】新基建战略规划及投资新机会，16页pdf，新型基础建设投资机遇的初步解读

专知会员服务

98+阅读 · 2020年5月18日

Risk Sensitive Portfolio Optimization with Regime-Switching and Default Contagion，香港理工大学应用数学系余翔助理教授，第八届全国社会媒体处理大会SMP2019

Risk Sensitive Portfolio Optimization with Regime-Switching and Default Contagion，香港理工大学应用数学系余翔助理教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

10+阅读 · 2019年10月24日

热门VIP内容

开通专知VIP会员享更多权益服务

论学习、公平性与复杂度

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

2025中国人工智能学会系列白皮书⸺棋盘上的人工智能|附下载

通用智能体评估的逻辑架构

相关资讯

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

47+阅读 · 2022年11月16日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

18+阅读 · 2022年9月28日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

强化学习《奖励函数设计: Reward Shaping》详细解读

强化学习《奖励函数设计: Reward Shaping》详细解读

深度强化学习实验室

18+阅读 · 2020年9月1日

【KDD2020】动态知识图谱的多事件预测

【KDD2020】动态知识图谱的多事件预测

专知

88+阅读 · 2020年8月31日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

每日论文 | 用循环世界模型改良策略进化；轻量级CNN：ChannelNets；强化学习知识点总结

每日论文 | 用循环世界模型改良策略进化；轻量级CNN：ChannelNets；强化学习知识点总结

论智

14+阅读 · 2018年9月7日

智能时代如何构建金融反欺诈体系？

智能时代如何构建金融反欺诈体系？

数据猿

12+阅读 · 2018年3月26日

【技术贴】面对无孔不入的黑产，如何搭建反欺诈策略与模型？

【技术贴】面对无孔不入的黑产，如何搭建反欺诈策略与模型？

互联网金融

10+阅读 · 2017年7月13日

知识提取的一种应用，从上市公司年报中抽取因果关系

知识提取的一种应用，从上市公司年报中抽取因果关系

文因互联

10+阅读 · 2017年7月7日

相关论文

Cooperative Game Theory Model for Sustainable UN Financing: Addressing Global Public Goods Provision

Arxiv

0+阅读 · 2月13日

Funding AI for Good: A Call for Meaningful Engagement

Arxiv

0+阅读 · 2月6日

Efficient Investment in Multi-Agent Models of Public Transportation

Arxiv

0+阅读 · 2月3日

FinEvo: From Isolated Backtests to Ecological Market Games for Multi-Agent Financial Strategy Evolution

Arxiv

0+阅读 · 2月1日

Towards Trustworthy Multimodal Recommendation

Arxiv

0+阅读 · 1月31日

Helios: A Foundational Language Model for Smart Energy Knowledge Reasoning and Application

Arxiv

0+阅读 · 1月30日

More at Stake: How Payoff and Language Shape LLM Agent Strategies in Cooperation Dilemmas

Arxiv

0+阅读 · 1月27日

Learning long term climate-resilient transport adaptation pathways under direct and indirect flood impacts using reinforcement learning

Arxiv

0+阅读 · 1月26日

Disentangling trust from cooperation: Trust as reduced monitoring across social dilemmas

Arxiv

0+阅读 · 1月22日

Advancing ESG Intelligence: An Expert-level Agent and Comprehensive Benchmark for Sustainable Finance

Arxiv

0+阅读 · 1月13日

相关基金

创业投资后创业投资家与创业者冲突的动态演化机制及影响因素研究：过程观视角

国家自然科学基金

0+阅读 · 2015年12月31日

基于反射理论的信息驱动金融市场模型研究

国家自然科学基金

2+阅读 · 2015年12月31日

具有重构特征的系统可靠性建模方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

小微企业互联网平台融资模式研究—基于双向拍卖和信号博弈双重视角

国家自然科学基金

4+阅读 · 2015年12月31日

信任、投资者参与模式与股票市场发展研究

国家自然科学基金

0+阅读 · 2014年12月31日

Forward-Looking与Backward-Looking相结合的投资组合管理

国家自然科学基金

1+阅读 · 2014年12月31日

产业政策与公司投资：政府监管与企业之间的一个博弈

国家自然科学基金

1+阅读 · 2014年12月31日

绿色供应链环境投入协作影响机制及决策优化研究

国家自然科学基金

1+阅读 · 2014年12月31日

PPP项目特许经营合同再谈判与补偿机制研究

国家自然科学基金

1+阅读 · 2014年12月31日

中国企业对外直接投资空间网络布局构建及其对企业海外运营的影响

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员