Generating synthetic financial time series that preserve the statistical properties of real market data is essential for stress testing, risk model validation, and scenario design. Existing approaches struggle to simultaneously reproduce heavy-tailed distributions, negligible linear autocorrelation, and persistent volatility clustering. We developed a hybrid hidden Markov framework that discretized excess growth rates into Laplace quantile-defined states and augmented regime switching with a Poisson jump-duration mechanism to enforce realistic tail-state dwell times. Parameters were estimated by direct transition counting, bypassing the Baum-Welch EM algorithm and scaling to a 424-asset pipeline. Applied to ten years of daily equity data, the framework achieved high distributional pass rates both in-sample and out-of-sample while partially reproducing the volatility clustering that standard regime-switching models miss. No single model was best at everything: GARCH(1,1) better reproduced volatility clustering but failed distributional tests, while the standard HMM without jumps passed more distributional tests but could not generate volatility clustering. The proposed framework delivered the most balanced performance overall. For multi-asset generation, copula-based dependence models that preserved each asset's marginal HMM distribution substantially outperformed a Single-Index Model factor baseline on both per-asset distributional accuracy and correlation reproduction.


翻译:生成保持真实市场数据统计特性的合成金融时间序列对于压力测试、风险模型验证和情景设计至关重要。现有方法难以同时复现重尾分布、可忽略的线性自相关和持续的波动率聚集。我们开发了一种混合隐马尔可夫框架,将超额增长率离散化为拉普拉斯分位数定义的状态,并通过泊松跳跃-持续时间机制增强状态切换,以强制实现真实的尾部状态驻留时间。参数通过直接转移计数估计,绕过了鲍姆-韦尔奇期望最大化算法,并可扩展到包含424个资产的流水线。将该框架应用于十年日度股票数据后,其在样本内和样本外均实现了较高的分布通过率,同时部分复现了标准状态切换模型无法捕捉的波动率聚集。没有单一模型在所有方面表现最佳:GARCH(1,1)能更好复现波动率聚集但未能通过分布检验,而无跳跃的标准隐马尔可夫模型虽通过更多分布检验却无法生成波动率聚集。提出的框架整体上实现了最均衡的性能。对于多资产生成,保留各资产边际隐马尔可夫分布的基于连接函数的相关性模型在单资产分布精度和相关性复现方面均显著优于单指数模型因子基准。

0
下载
关闭预览

相关内容

【ICML2025】用于概率时间序列预测的非平稳扩散方法
专知会员服务
10+阅读 · 2025年5月10日
多模态可控扩散模型综述
专知会员服务
39+阅读 · 2024年7月20日
「深度时间序列模型」综述
专知会员服务
44+阅读 · 2024年7月19日
时间序列和时空数据扩散模型综述
专知会员服务
64+阅读 · 2024年5月1日
NeurIPS 2021 | 微观特征混合进行宏观时间序列预测
专知会员服务
43+阅读 · 2021年11月12日
使用LSTM模型预测股价基于Keras
量化投资与机器学习
35+阅读 · 2018年11月17日
从Seq2seq到Attention模型到Self Attention(一)
量化投资与机器学习
76+阅读 · 2018年10月8日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 4月18日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
6+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员