The validation of a data-driven model is the process of assessing the model's ability to generalize to new, unseen data in the population of interest. This paper proposes a set of general rules for model validation. These rules are designed to help practitioners create reliable validation plans and report their results transparently. While no validation scheme is flawless, these rules can help practitioners ensure their strategy is sufficient for practical use, openly discuss any limitations of their validation strategy, and report clear, comparable performance metrics.


翻译:数据驱动模型的验证是评估模型在目标群体中泛化至新的、未见数据能力的过程。本文提出了一套通用的模型验证规则。这些规则旨在帮助实践者制定可靠的验证方案并透明地报告结果。尽管不存在完美的验证方案,但这些规则可帮助实践者确保其策略在实际应用中足够充分,公开讨论验证策略的任何局限性,并报告清晰、可比较的性能指标。

0
下载
关闭预览

相关内容

高质量数据集实践指南(1.0)
专知会员服务
30+阅读 · 2025年7月25日
大模型数据建设探索与实践
专知会员服务
21+阅读 · 2024年9月8日
动态数据驱动仿真综述
专知会员服务
52+阅读 · 2024年5月17日
一文教你如何处理不平衡数据集(附代码)
大数据文摘
11+阅读 · 2019年6月2日
常用的模型集成方法介绍:bagging、boosting 、stacking
超全总结:神经网络加速之量化模型 | 附带代码
不要担心没数据!史上最全数据集网站汇总
展望:模型驱动的深度学习
人工智能学家
12+阅读 · 2018年1月23日
【入门】数据分析六部曲
36大数据
18+阅读 · 2017年12月6日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
Arxiv
0+阅读 · 1月22日
VIP会员
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员