Injury occurrence in football poses significant challenges for athletes and teams, carrying personal, competitive, and financial consequences. While machine learning has been applied to injury prediction before, existing approaches often rely on static pre-season data and binary outcomes, limiting their real-world utility. This study investigates the feasibility of using a DeepHit neural network to forecast time-to-injury from longitudinal athlete monitoring data, while providing interpretable predictions. The analysis utilised the publicly available SoccerMon dataset, containing two seasons of training, match, and wellness records from elite female footballers. Data was pre-processed through cleaning, feature engineering, and the application of three imputation strategies. Baseline models (Random Forest, XGBoost, Logistic Regression) were optimised via grid search for benchmarking, while the DeepHit model, implemented with a multilayer perceptron backbone, was evaluated using chronological and leave-one-player-out (LOPO) validation. DeepHit achieved a concordance index of 0.762, outperforming baseline models and delivering individualised, time-varying risk estimates. Shapley Additive Explanations (SHAP) identified clinically relevant predictors consistent with established risk factors, enhancing interpretability. Overall, this study provides a novel proof of concept: survival modelling with DeepHit shows strong potential to advance injury forecasting in football, offering accurate, explainable, and actionable insights for injury prevention across competitive levels.


翻译:足球运动中的损伤发生对运动员和团队构成重大挑战,带来个人、竞技及财务层面的多重影响。尽管机器学习此前已应用于损伤预测,但现有方法通常依赖于静态的季前数据与二元结果,限制了其实际应用价值。本研究探讨了利用DeepHit神经网络从纵向运动员监测数据中预测损伤发生时间的可行性,同时提供可解释的预测结果。分析采用公开的SoccerMon数据集,该数据集包含精英女子足球运动员两个赛季的训练、比赛及健康状态记录。数据通过清洗、特征工程及三种插补策略进行预处理。基准模型(随机森林、XGBoost、逻辑回归)通过网格搜索优化进行性能对比,而以前馈神经网络为架构的DeepHit模型则采用时间序列验证与留一球员交叉验证(LOPO)进行评估。DeepHit模型取得0.762的一致性指数,优于基准模型,并能提供个体化、时变的风险评估。沙普利加性解释(SHAP)识别出与既定风险因素一致的临床相关预测变量,增强了模型可解释性。总体而言,本研究提出了创新性的概念验证:基于DeepHit的生存分析模型在足球损伤预测领域展现出巨大潜力,能够为不同竞技水平的损伤预防提供精准、可解释且具可操作性的见解。

0
下载
关闭预览

相关内容

图深度学习在时间序列处理中的应用:预测、重构与分析
专知会员服务
34+阅读 · 2024年11月30日
深度学习和基础模型在时间序列预测中的综述
专知会员服务
50+阅读 · 2024年1月26日
深度学习在体育应用中的研究概览:感知、理解和决策
专知会员服务
39+阅读 · 2023年7月17日
【Google-BryanLim等】可解释深度学习时序预测
专知会员服务
64+阅读 · 2021年12月19日
专知会员服务
68+阅读 · 2021年6月3日
专知会员服务
84+阅读 · 2020年12月18日
金融时序预测中的深度学习方法:2005到2019
专知会员服务
168+阅读 · 2019年12月4日
基于 Keras 用深度学习预测时间序列
R语言中文社区
23+阅读 · 2018年7月27日
深度学习在CTR预估中的应用 | CTR深度模型大盘点
PaperWeekly
15+阅读 · 2018年4月11日
【深度学习】深度学习的核心:掌握训练数据的方法
产业智能官
12+阅读 · 2018年1月14日
LibRec 每周算法:DeepFM
LibRec智能推荐
14+阅读 · 2017年11月6日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
14+阅读 · 2023年9月27日
VIP会员
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员