This study develops and evaluates a deep reinforcement learning framework for dynamic portfolio allocation across global equity markets. The Soft Actor-Critic algorithm is used to learn continuous portfolio weights within a Markov Decision Process, incorporating transaction costs, turnover penalties, and diversification constraints into the reward function. Five model configurations are compared, varying in reward formulation, policy structure (flat versus hierarchical Dirichlet), portfolio constraints, and temporal encoder (LSTM versus Transformer), and evaluated via walk-forward optimization across sixteen out-of-sample folds spanning 2003-2026 on the Nasdaq-100, Nikkei 225, and Euro Stoxx 50. Results show that RL strategies achieve competitive risk-adjusted performance primarily in the Euro Stoxx 50, where statistically significant abnormal returns are observed, but the central hypothesis is only partially confirmed: no strategy achieves statistically significant excess returns relative to Buy and Hold under HAC-robust inference across all markets. Regime analysis reveals that RL adds the most value during periods of elevated uncertainty, while ensemble aggregation across markets improves risk-adjusted performance and confirms the benefits of geographic diversification.


翻译:本研究开发并评估了一种用于全球股票市场动态投资组合配置的深度强化学习框架。采用软演员-评论家算法在马尔可夫决策过程中学习连续的投资组合权重,并将交易成本、换手率惩罚以及多样化约束纳入奖励函数。我们比较了五种模型配置,它们在奖励函数设计、策略结构(平面型与层次狄利克雷型)、投资组合约束以及时序编码器(LSTM与Transformer)方面存在差异,并通过向前优化方法在涵盖2003年至2026年期间纳斯达克100、日经225和欧洲斯托克50指数的十六个样本外折叠中进行评估。结果表明,强化学习策略主要在欧洲斯托克50指数上实现了具有竞争力的风险调整后收益,并观察到统计显著的超额收益,但核心假设仅得到部分证实:在基于异方差自相关一致性稳健推断下,没有任何策略在所有市场中能够相对于买入并持有策略获得统计显著的超额收益。市场制度分析揭示,强化学习在市场不确定性高企时期创造最大价值,而跨市场的集成聚合方法则提升了风险调整后收益,并证实了地域多样化的益处。

0
下载
关闭预览

相关内容

在透彻的分析基础之上,购买某种资产以期待未来能保证本金的安全并获得固定的或者非固定的满意回报的理性行为称之投资
《基于深度强化学习的战场策略》
专知会员服务
38+阅读 · 2025年1月13日
专知会员服务
139+阅读 · 2021年1月13日
基于模型的强化学习综述
专知
42+阅读 · 2022年7月13日
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
16+阅读 · 2020年9月9日
量化金融强化学习论文集合
专知
14+阅读 · 2019年12月18日
深度强化学习简介
专知
30+阅读 · 2018年12月3日
基于强化学习的量化交易框架
机器学习研究会
30+阅读 · 2018年2月22日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
24+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
国家自然科学基金
50+阅读 · 2009年12月31日
国家自然科学基金
12+阅读 · 2008年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
1+阅读 · 今天14:45
定向能反无人机系统最新发展动态
专知会员服务
5+阅读 · 今天13:50
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
3+阅读 · 今天13:33
相关VIP内容
《基于深度强化学习的战场策略》
专知会员服务
38+阅读 · 2025年1月13日
专知会员服务
139+阅读 · 2021年1月13日
相关资讯
基于模型的强化学习综述
专知
42+阅读 · 2022年7月13日
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
16+阅读 · 2020年9月9日
量化金融强化学习论文集合
专知
14+阅读 · 2019年12月18日
深度强化学习简介
专知
30+阅读 · 2018年12月3日
基于强化学习的量化交易框架
机器学习研究会
30+阅读 · 2018年2月22日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
相关基金
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
24+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
国家自然科学基金
50+阅读 · 2009年12月31日
国家自然科学基金
12+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员