This paper addresses the challenge of forecasting corporate distress, a problem marked by three key statistical hurdles: (i) right censoring, (ii) high-dimensional predictors, and (iii) mixed-frequency data. To overcome these complexities, we introduce a novel high-dimensional censored MIDAS (Mixed Data Sampling) logistic regression. Our approach handles censoring through inverse probability weighting and achieves accurate estimation with numerous mixed-frequency predictors by employing a sparse-group penalty. We establish finite-sample bounds for the estimation error, accounting for censoring, MIDAS approximation error, and heavy tails. For statistical inference, we develop a de-sparsified version of the proposed penalized estimator and establish its asymptotic theory, which enables valid statistical inference in high-dimensional settings with censoring. We show that censoring induces a nonstandard variance structure for the de-sparsified estimator, a feature that, to the best of our knowledge, has not been studied in the existing literature. The superior performance of the method is demonstrated through Monte Carlo simulations. Finally, we present an extensive application of our methodology to predict the financial distress of Chinese-listed firms and to identify covariates that are statistically significant for predicting distress. Our novel procedure is implemented in the R package \texttt{Survivalml}.


翻译:本文针对企业困境预测这一挑战展开研究,该问题存在三个关键统计难点:(i) 右删失,(ii) 高维预测变量,以及(iii) 混合频率数据。为克服这些复杂性,我们提出了一种新颖的高维删失MIDAS(混合数据抽样)逻辑回归模型。我们的方法通过逆概率加权处理删失问题,并采用稀疏群组惩罚实现对大量混合频率预测变量的精确估计。我们建立了估计误差的有限样本界,该界同时考虑了删失、MIDAS近似误差和重尾分布的影响。在统计推断方面,我们开发了所提出的惩罚估计量的去稀疏化版本,并建立了其渐近理论,从而能够在存在删失的高维设定下进行有效的统计推断。我们证明了删失会导致去稀疏化估计量产生非标准的方差结构,据我们所知,这一特性在现有文献中尚未被研究。通过蒙特卡洛模拟,我们验证了该方法的优越性能。最后,我们将该方法广泛应用于预测中国上市公司的财务困境,并识别对困境预测具有统计显著性的协变量。这一新颖方法已通过R包 \texttt{Survivalml} 实现。

0
下载
关闭预览

相关内容

从信息论的角度来理解损失函数
深度学习每日摘要
17+阅读 · 2019年4月7日
数据分析师应该知道的16种回归方法:泊松回归
数萃大数据
35+阅读 · 2018年9月13日
数据分析师应该知道的16种回归方法:定序回归
数萃大数据
16+阅读 · 2018年9月9日
15款免费预测分析软件!收藏好,别丢了!
七月在线实验室
11+阅读 · 2018年2月27日
回归预测&时间序列预测
GBASE数据工程部数据团队
44+阅读 · 2017年5月17日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关VIP内容
相关资讯
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员