Despite the fact that cancer survivability rates vary greatly between stages, traditional survival prediction models have frequently been trained and assessed using examples from all combined phases of the disease. This method may result in an overestimation of performance and ignore the stage-specific variations. Using the SEER dataset, we created and verified explainable machine learning (ML) models to predict stage-specific cancer survivability in colorectal, stomach, and liver cancers. ML-based cancer survival analysis has been a long-standing topic in the literature; however, studies involving the explainability and transparency of ML survivability models are limited. Our use of explainability techniques, including SHapley Additive exPlanations (SHAP) and Local Interpretable Model-agnostic Explanations (LIME), enabled us to illustrate significant feature-cancer stage interactions that would have remained hidden in traditional black-box models. We identified how certain demographic and clinical variables influenced survival differently across cancer stages and types. These insights provide not only transparency but also clinical relevance, supporting personalized treatment planning. By focusing on stage-specific models, this study provides new insights into the most important factors at each stage of cancer, offering transparency and potential clinical relevance to support personalized treatment planning.


翻译:尽管癌症生存率在不同阶段差异显著,但传统的生存预测模型通常使用所有疾病阶段合并的样本进行训练和评估。这种方法可能导致性能的高估,并忽视阶段特异性差异。利用SEER数据集,我们构建并验证了可解释机器学习模型,用于预测结直肠癌、胃癌和肝癌的阶段特异性生存率。基于机器学习的癌症生存分析在文献中是一个长期存在的主题;然而,涉及机器学习生存模型可解释性与透明度的研究仍然有限。我们采用包括SHapley Additive exPlanations和Local Interpretable Model-agnostic Explanations在内的可解释性技术,揭示了在传统黑盒模型中可能被掩盖的重要特征-癌症阶段交互作用。我们识别了某些人口统计学和临床变量如何在不同癌症阶段和类型中对生存产生差异化影响。这些见解不仅提供了透明度,还具有临床相关性,有助于支持个性化治疗规划。通过聚焦于阶段特异性模型,本研究为癌症各阶段最重要的影响因素提供了新的见解,在提供透明度的同时展现出潜在的临床价值,以支持个性化治疗策略的制定。

0
下载
关闭预览

相关内容

癌症是医学术语,其为最常见的恶性肿瘤,亦有人将癌症和恶性肿瘤混合使用。中医学中称岩,为由控制细胞分裂增殖机制失常而引起的疾病。癌细胞除了分裂失控外,还会局部侵入周遭正常组织甚至经由体内循环系统或淋巴系统转移到身体其他部分。
深度学习在癌症诊断、预后和治疗选择中的应用
专知会员服务
56+阅读 · 2022年6月18日
机器学习的可解释性
专知会员服务
69+阅读 · 2020年12月18日
【华侨大学】基于混合深度学习算法的疾病预测模型
专知会员服务
97+阅读 · 2020年1月21日
【AI与医学】多模态机器学习精准医疗健康
机器学习的可解释性:因果推理和稳定学习
DataFunTalk
13+阅读 · 2020年3月3日
8月最新-《可解释机器学习-Christoph Molnar》-新书分享
深度学习与NLP
10+阅读 · 2019年8月12日
医疗中的自动机器学习和可解释性
专知
24+阅读 · 2019年4月1日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
17+阅读 · 2019年1月24日
大讲堂 | 基于医疗知识的疾病诊断预测
AI科技评论
10+阅读 · 2019年1月22日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员