Learning curves model a classifier's test error as a function of the number of training samples. Prior works show that learning curves can be used to select model parameters and extrapolate performance. We investigate how to use learning curves to evaluate design choices, such as pretraining, architecture, and data augmentation. We propose a method to robustly estimate learning curves, abstract their parameters into error and data-reliance, and evaluate the effectiveness of different parameterizations. Our experiments exemplify use of learning curves for analysis and yield several interesting observations.


翻译:学习曲线模型 分类器的测试错误, 取决于培训样本的数量。 先前的工程显示, 学习曲线可用于选择模型参数和外推性能 。 我们研究如何使用学习曲线来评价设计选择, 如培训前、 建筑和数据扩增 。 我们提出了一种方法, 以强力估计学习曲线, 将其参数抽象成错误和数据依赖性, 并评估不同参数化的效果 。 我们的实验用学习曲线作为分析的范例, 并得出一些有趣的观察结果 。

0
下载
关闭预览

相关内容

专知会员服务
51+阅读 · 2020年12月14日
神经网络的拓扑结构,TOPOLOGY OF DEEP NEURAL NETWORKS
专知会员服务
35+阅读 · 2020年4月15日
强化学习的Unsupervised Meta-Learning
CreateAMind
18+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
44+阅读 · 2019年1月3日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
Arxiv
32+阅读 · 2021年3月8日
A Survey of Deep Learning for Scientific Discovery
Arxiv
29+阅读 · 2020年3月26日
Deep Learning for Energy Markets
Arxiv
11+阅读 · 2019年4月10日
Arxiv
25+阅读 · 2018年1月24日
VIP会员
相关资讯
强化学习的Unsupervised Meta-Learning
CreateAMind
18+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
44+阅读 · 2019年1月3日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
相关论文
Arxiv
32+阅读 · 2021年3月8日
A Survey of Deep Learning for Scientific Discovery
Arxiv
29+阅读 · 2020年3月26日
Deep Learning for Energy Markets
Arxiv
11+阅读 · 2019年4月10日
Arxiv
25+阅读 · 2018年1月24日
Top
微信扫码咨询专知VIP会员