Standard risk models reduce the rich dependence structure of financial markets to scalar volatility estimates, discarding the topological information encoded in cross-asset correlation networks. We present ORCA (Online Regime Correlation Analyzer), an end-to-end framework that fuses spectral graph theory, random matrix theory, and supervised machine learning to deliver calibrated probability estimates for both rally and crash events over a ten-day forward horizon. ORCA constructs rolling correlation matrices from 24 diversified exchange-traded instruments using three parallel estimators at different time scales, and extracts 127 spectral features (absorption ratios, eigenvalue entropy, effective rank, spectral gap, eigenvector concentration, and graph-topological descriptors at multiple correlation thresholds), concatenated with 79 traditional price-derived indicators to form a 206-dimensional feature vector. A depth-limited Random Forest with balanced sub-sample weighting is evaluated under a strict eight-fold walk-forward protocol with ten-day anti-leakage gaps spanning fifteen years of daily US market data. ORCA achieves a Balanced Crisis Detection AUC (BCD-AUC, the geometric mean of rally and crash AUC) of 0.741, ranking first against all baselines. Ablation studies show that spectral features contribute +10.3 percentage points of AUC for crash detection and +5.2 for rally detection over traditional features alone, with SHAP analysis revealing that graph-topological descriptors (clustering coefficient, edge density, and dominant-eigenvalue percentile rank) are the three most important crash predictors. A backtested walk-forward strategy mapping the joint rally-crash signal to dynamic equity exposure with risk-on/risk-off rotation achieves a Sharpe ratio of 1.13, a CAGR of 15.6%, and a maximum drawdown of only -7.5%, versus 3.7% CAGR and -33.7% drawdown for buy-and-hold.


翻译:摘要:标准风险模型将金融市场丰富的依赖结构简化为标量波动率估计,从而丢弃了跨资产相关性网络中编码的拓扑信息。我们提出ORCA(在线市场状态相关性分析器),这是一个融合谱图论、随机矩阵理论与监督机器学习的端到端框架,能够针对未来十天的上涨与下跌事件提供校准后的概率估计。ORCA利用三种并行估计器在不同时间尺度上,从24种多样化交易所交易工具构建滚动相关性矩阵,并提取127个谱特征(包括吸收比、特征值熵、有效秩、谱隙、特征向量集中度以及多相关性阈值下的图拓扑描述符),同时结合79个传统价格衍生指标,形成206维特征向量。采用深度受限的随机森林与平衡子样本加权方法,在严格的八折滚动验证协议下进行评估,其间设置十天防泄漏间隔,涵盖十五年的美国市场日频数据。ORCA的平衡危机检测AUC(BCD-AUC,即上涨与下跌AUC的几何均值)达到0.741,在所有基线方法中排名第一。消融研究表明,相比仅使用传统特征,谱特征为下跌检测贡献了+10.3个百分点的AUC,为上涨检测贡献了+5.2个百分点。SHAP分析揭示,图拓扑描述符(聚类系数、边密度和主特征值百分位排名)是三个最重要的下跌预测因子。基于回测的滚动验证策略将联合上涨-下跌信号转化为动态权益敞口,并执行风险偏好/规避轮动,实现了1.13的夏普比率、15.6%的年化复合增长率,最大回撤仅为-7.5%;相比之下,买入并持有策略的年化复合增长率为3.7%,最大回撤为-33.7%。

0
下载
关闭预览

相关内容

《通过聚类和 ORBAT 地图进行战场态势感知》
专知会员服务
35+阅读 · 2025年2月9日
腾讯等发布《2023产业互联网安全十大趋势》报告,26页pdf
《中国网络安全产业分析报告(2022年)》发布
专知会员服务
35+阅读 · 2022年9月8日
《数据安全风险分析及应对策略研究(2022年)》
专知会员服务
44+阅读 · 2022年2月5日
专知会员服务
15+阅读 · 2021年9月11日
《2021—2022中国大数据产业发展报告》
专知
12+阅读 · 2022年1月23日
半监督学习加速AI产业数据标注
QCon
13+阅读 · 2019年4月2日
NetworkMiner - 网络取证分析工具
黑白之道
16+阅读 · 2018年6月29日
【团队新作】连续情感识别,精准捕捉你的小情绪!
中国科学院自动化研究所
16+阅读 · 2018年4月17日
推荐|caffe-orc主流ocr算法:CNN+BLSTM+CTC架构实现!
全球人工智能
19+阅读 · 2017年10月29日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Arxiv
0+阅读 · 3月18日
VIP会员
最新内容
美国军方使用的10种反无人机武器(2026年更新)
专知会员服务
4+阅读 · 今天4:07
认知战与交战性质的改变:神经战略视角
专知会员服务
5+阅读 · 5月8日
相关资讯
《2021—2022中国大数据产业发展报告》
专知
12+阅读 · 2022年1月23日
半监督学习加速AI产业数据标注
QCon
13+阅读 · 2019年4月2日
NetworkMiner - 网络取证分析工具
黑白之道
16+阅读 · 2018年6月29日
【团队新作】连续情感识别,精准捕捉你的小情绪!
中国科学院自动化研究所
16+阅读 · 2018年4月17日
推荐|caffe-orc主流ocr算法:CNN+BLSTM+CTC架构实现!
全球人工智能
19+阅读 · 2017年10月29日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员