Interpretable Factor Decomposition for Decision Intelligence in Large-Scale Financial Markets: Evidence from China's A-Share Market - 专知论文

会员服务 ·

0

因子 · 分解 · 中国 · 金融 · 解释因子 ·

Interpretable Factor Decomposition for Decision Intelligence in Large-Scale Financial Markets: Evidence from China's A-Share Market

翻译：面向大规模金融市场决策智能的可解释因子分解：来自中国A股市场的证据

Xiao Han,Yao Xiao,Zhen Zhang,Moxuan Zheng

We present an interpretable machine learning pipeline to decompose Cross-Sectional Equity Return Predictability into auditable factor contribution. We apply an XGBoost model with TreeSHAP attribution and conduct stress testing on 3632 Chinese A-share stocks from 2009 until 2019. Using 60-month, rolling windows over 55 months of out-of-sample data, XGBoost obtains a mean AUC of 0.547 and +2.38%/month (Newey-West t = 5.94; Annualized Sharpe 2.23) long-short spread for the top vs bottom quintiles. This alpha is persistent after adjusting for the Carhart four-factor model (+2.31%/month; t = 7.48). SHAP Decomposition indicates that behavioral signals (turnover and momentum) account for 58.2% of predictive attribution compared to 10.7% for valuation ratios, on average, across 55 industry groups. Ablation analysis serves to cross-validate this ranking and provides evidence that SHAP and ablation diverge in a manner that highlights feature substitutability structure that is largely invisible to either method used in isolation.

翻译：我们提出了一种可解释的机器学习流程，将截面股票收益可预测性分解为可审计的因子贡献。我们采用基于TreeSHAP归因的XGBoost模型，对2009年至2019年间3632只中国A股股票进行了压力测试。使用60个月滚动窗口及55个月样本外数据，XGBoost模型在最优与最差五分位组合中实现了平均AUC为0.547，月度多空收益价差为+2.38%（Newey-West t统计量=5.94；年化夏普比率2.23）。在经Carhart四因子模型调整后，该Alpha仍保持持续性（月度收益+2.31%；t=7.48）。SHAP分解表明，在55个行业组中，行为信号（换手率与动量）平均占预测归因的58.2%，而估值比率仅占10.7%。消融分析交叉验证了这一排序，并揭示了SHAP与消融方法在特征可替代性结构上的差异性——这种结构在单独使用任一方法时均难以察觉。

0

相关内容

股票市场预测的机器学习技术与数据：文献综述

股票市场预测的机器学习技术与数据：文献综述

专知会员服务

18+阅读 · 2025年7月14日

SORA底层模型用好了也能赚钱！DiffsFormer：基于扩散模型的股票因子生成

SORA底层模型用好了也能赚钱！DiffsFormer：基于扩散模型的股票因子生成

专知会员服务

37+阅读 · 2024年2月29日

【WWW2024】使用自反射大型语言模型学习生成可解释的股票预测

【WWW2024】使用自反射大型语言模型学习生成可解释的股票预测

专知会员服务

27+阅读 · 2024年2月11日

《可解释人工智能在人工智能辅助决策中的作用综述》

《可解释人工智能在人工智能辅助决策中的作用综述》

专知会员服务

63+阅读 · 2024年1月4日

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

专知会员服务

70+阅读 · 2022年9月14日

TAMU最新《图神经网络可解释》综述论文，19页pdf阐述实例级与模型级解释

TAMU最新《图神经网络可解释》综述论文，19页pdf阐述实例级与模型级解释

专知会员服务

94+阅读 · 2022年8月23日

【哈佛大学】最新《理解模型可解释性》综述报告，45页ppt

专知会员服务

77+阅读 · 2020年12月4日

【哈佛大学Hima】最新《可解释的机器学习:概述和解决方案》综述报告，94页ppt

【哈佛大学Hima】最新《可解释的机器学习:概述和解决方案》综述报告，94页ppt

专知会员服务

127+阅读 · 2020年12月3日

机器学习的可解释性

机器学习的可解释性

专知会员服务

181+阅读 · 2020年8月27日

【哈佛大学商学院课程Fall 2019】机器学习可解释性

【哈佛大学商学院课程Fall 2019】机器学习可解释性

专知会员服务

106+阅读 · 2019年10月9日

【DSAA教程】可解释人工智能金融服务，325页ppt，Explainable AI in Financial Services

【DSAA教程】可解释人工智能金融服务，325页ppt，Explainable AI in Financial Services

专知

14+阅读 · 2021年10月21日

【资源推荐】AI可解释性资源汇总

【资源推荐】AI可解释性资源汇总

专知

47+阅读 · 2019年4月24日

程序员如何借助 AI 开挂股票神预测？| 技术头条

程序员如何借助 AI 开挂股票神预测？| 技术头条

程序人生

13+阅读 · 2019年4月22日

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

专知

29+阅读 · 2019年3月1日

可解释的机器学习

可解释的机器学习

平均机器

25+阅读 · 2019年2月25日

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

量子位

23+阅读 · 2019年2月23日

独家 | 利用深度学习和机器学习预测股票市场（附代码）

独家 | 利用深度学习和机器学习预测股票市场（附代码）

数据派THU

21+阅读 · 2019年1月3日

【知识图谱】肖仰华：基于知识图谱的可解释人工智能：机遇与挑战

【知识图谱】肖仰华：基于知识图谱的可解释人工智能：机遇与挑战

产业智能官

14+阅读 · 2017年11月2日

分别基于SVM和ARIMA模型的股票预测 Python实现附Github源码

分别基于SVM和ARIMA模型的股票预测 Python实现附Github源码

数据挖掘入门与实战

15+阅读 · 2017年9月9日

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

全球人工智能

14+阅读 · 2017年7月26日

中国资本市场的投资者信息解读：基于实验研究的心理学探索

国家自然科学基金

1+阅读 · 2015年12月31日

集成专家意见的在线投资组合策略设计及竞争性能分析

国家自然科学基金

0+阅读 · 2015年12月31日

面向金融市场走势预测的在线论坛公众情绪挖掘与演化分析算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于反射理论的信息驱动金融市场模型研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

6+阅读 · 2014年12月31日

信任、投资者参与模式与股票市场发展研究

国家自然科学基金

0+阅读 · 2014年12月31日

上市公司文本信息分析研究：基于大数据的视角

国家自然科学基金

8+阅读 · 2014年12月31日

机制转化下的最优停时问题研究---以金融中投资决策分析为例

国家自然科学基金

2+阅读 · 2014年12月31日

基于中智集的模糊多属性决策理论、方法与应用研究

国家自然科学基金

2+阅读 · 2014年12月31日

Can News Predict the Market? Limits of Zero-Shot Financial NLP and the Role of Explainable AI

Arxiv

0+阅读 · 6月10日

Factor-Based Conditional Diffusion Model for Contextual Portfolio Optimization

Arxiv

0+阅读 · 6月2日

Causally-interpretable meta-analysis using aggregate data

Arxiv

0+阅读 · 5月26日

Deep Reinforcement Learning Framework for Diversified Portfolio Management Across Global Equity Markets

Arxiv

0+阅读 · 5月17日

ECHO: Elastic Speculative Decoding with Sparse Gating for High-Concurrency Scenarios

Arxiv

0+阅读 · 5月14日

Vector-Quantized Discrete Latent Factors Meet Financial Priors: Dynamic Cross-Sectional Stock Ranking Prediction for Portfolio Construction

Arxiv

0+阅读 · 5月13日

Game-Theoretic Modeling of Heterogeneous Investor Interactions for Stock Price Forecasting

Arxiv

0+阅读 · 5月11日

Machine Learning Enhanced Multi-Factor Quantitative Trading: A Cross-Sectional Portfolio Optimization Approach with Bias Correction

Arxiv

0+阅读 · 5月9日

Towards Explainable Artificial Intelligence (XAI): A Data Mining Perspective

Arxiv

14+阅读 · 2024年1月9日

A Comprehensive Review on Financial Explainable AI

Arxiv

12+阅读 · 2023年9月21日

VIP会员

文章信息

相关主题

最新内容

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

专知会员服务

2+阅读 · 今天7:13

俄乌无人机战争的六大启示

俄乌无人机战争的六大启示

专知会员服务

4+阅读 · 今天7:07

《无人机空中监控：通信实验洞察》

《无人机空中监控：通信实验洞察》

专知会员服务

3+阅读 · 今天7:05

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

专知会员服务

3+阅读 · 今天6:59

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

12+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

5+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

10+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

12+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

6+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

10+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

8+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

9+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

8+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

6+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

相关VIP内容

股票市场预测的机器学习技术与数据：文献综述

股票市场预测的机器学习技术与数据：文献综述

专知会员服务

18+阅读 · 2025年7月14日

SORA底层模型用好了也能赚钱！DiffsFormer：基于扩散模型的股票因子生成

SORA底层模型用好了也能赚钱！DiffsFormer：基于扩散模型的股票因子生成

专知会员服务

37+阅读 · 2024年2月29日

【WWW2024】使用自反射大型语言模型学习生成可解释的股票预测

【WWW2024】使用自反射大型语言模型学习生成可解释的股票预测

专知会员服务

27+阅读 · 2024年2月11日

《可解释人工智能在人工智能辅助决策中的作用综述》

《可解释人工智能在人工智能辅助决策中的作用综述》

专知会员服务

63+阅读 · 2024年1月4日

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

专知会员服务

70+阅读 · 2022年9月14日

TAMU最新《图神经网络可解释》综述论文，19页pdf阐述实例级与模型级解释

TAMU最新《图神经网络可解释》综述论文，19页pdf阐述实例级与模型级解释

专知会员服务

94+阅读 · 2022年8月23日

【哈佛大学】最新《理解模型可解释性》综述报告，45页ppt

专知会员服务

77+阅读 · 2020年12月4日

【哈佛大学Hima】最新《可解释的机器学习:概述和解决方案》综述报告，94页ppt

【哈佛大学Hima】最新《可解释的机器学习:概述和解决方案》综述报告，94页ppt

专知会员服务

127+阅读 · 2020年12月3日

机器学习的可解释性

机器学习的可解释性

专知会员服务

181+阅读 · 2020年8月27日

【哈佛大学商学院课程Fall 2019】机器学习可解释性

【哈佛大学商学院课程Fall 2019】机器学习可解释性

专知会员服务

106+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

俄乌无人机战争的六大启示

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《无人机空中监控：通信实验洞察》

相关资讯

【DSAA教程】可解释人工智能金融服务，325页ppt，Explainable AI in Financial Services

【DSAA教程】可解释人工智能金融服务，325页ppt，Explainable AI in Financial Services

专知

14+阅读 · 2021年10月21日

【资源推荐】AI可解释性资源汇总

【资源推荐】AI可解释性资源汇总

专知

47+阅读 · 2019年4月24日

程序员如何借助 AI 开挂股票神预测？| 技术头条

程序员如何借助 AI 开挂股票神预测？| 技术头条

程序人生

13+阅读 · 2019年4月22日

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

专知

29+阅读 · 2019年3月1日

可解释的机器学习

可解释的机器学习

平均机器

25+阅读 · 2019年2月25日

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

量子位

23+阅读 · 2019年2月23日

独家 | 利用深度学习和机器学习预测股票市场（附代码）

独家 | 利用深度学习和机器学习预测股票市场（附代码）

数据派THU

21+阅读 · 2019年1月3日

【知识图谱】肖仰华：基于知识图谱的可解释人工智能：机遇与挑战

【知识图谱】肖仰华：基于知识图谱的可解释人工智能：机遇与挑战

产业智能官

14+阅读 · 2017年11月2日

分别基于SVM和ARIMA模型的股票预测 Python实现附Github源码

分别基于SVM和ARIMA模型的股票预测 Python实现附Github源码

数据挖掘入门与实战

15+阅读 · 2017年9月9日

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

全球人工智能

14+阅读 · 2017年7月26日

相关论文

Can News Predict the Market? Limits of Zero-Shot Financial NLP and the Role of Explainable AI

Arxiv

0+阅读 · 6月10日

Factor-Based Conditional Diffusion Model for Contextual Portfolio Optimization

Arxiv

0+阅读 · 6月2日

Causally-interpretable meta-analysis using aggregate data

Arxiv

0+阅读 · 5月26日

Deep Reinforcement Learning Framework for Diversified Portfolio Management Across Global Equity Markets

Arxiv

0+阅读 · 5月17日

ECHO: Elastic Speculative Decoding with Sparse Gating for High-Concurrency Scenarios

Arxiv

0+阅读 · 5月14日

Vector-Quantized Discrete Latent Factors Meet Financial Priors: Dynamic Cross-Sectional Stock Ranking Prediction for Portfolio Construction

Arxiv

0+阅读 · 5月13日

Game-Theoretic Modeling of Heterogeneous Investor Interactions for Stock Price Forecasting

Arxiv

0+阅读 · 5月11日

Machine Learning Enhanced Multi-Factor Quantitative Trading: A Cross-Sectional Portfolio Optimization Approach with Bias Correction

Arxiv

0+阅读 · 5月9日

Towards Explainable Artificial Intelligence (XAI): A Data Mining Perspective

Arxiv

14+阅读 · 2024年1月9日

A Comprehensive Review on Financial Explainable AI

Arxiv

12+阅读 · 2023年9月21日

相关基金

中国资本市场的投资者信息解读：基于实验研究的心理学探索

国家自然科学基金

1+阅读 · 2015年12月31日

集成专家意见的在线投资组合策略设计及竞争性能分析

国家自然科学基金

0+阅读 · 2015年12月31日

面向金融市场走势预测的在线论坛公众情绪挖掘与演化分析算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于反射理论的信息驱动金融市场模型研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

6+阅读 · 2014年12月31日

信任、投资者参与模式与股票市场发展研究

国家自然科学基金

0+阅读 · 2014年12月31日

上市公司文本信息分析研究：基于大数据的视角

国家自然科学基金

8+阅读 · 2014年12月31日

机制转化下的最优停时问题研究---以金融中投资决策分析为例

国家自然科学基金

2+阅读 · 2014年12月31日

基于中智集的模糊多属性决策理论、方法与应用研究

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员