Inspired by the concept of active learning, we propose active inference$\unicode{x2013}$a methodology for statistical inference with machine-learning-assisted data collection. Assuming a budget on the number of labels that can be collected, the methodology uses a machine learning model to identify which data points would be most beneficial to label, thus effectively utilizing the budget. It operates on a simple yet powerful intuition: prioritize the collection of labels for data points where the model exhibits uncertainty, and rely on the model's predictions where it is confident. Active inference constructs provably valid confidence intervals and hypothesis tests while leveraging any black-box machine learning model and handling any data distribution. The key point is that it achieves the same level of accuracy with far fewer samples than existing baselines relying on non-adaptively-collected data. This means that for the same number of collected samples, active inference enables smaller confidence intervals and more powerful p-values. We evaluate active inference on datasets from public opinion research, census analysis, and proteomics.


翻译:受主动学习概念的启发,我们提出了主动推断——一种借助机器学习辅助数据收集的统计推断方法。假设可用于收集标签的预算有限,该方法利用机器学习模型识别哪些数据点最有益于标记,从而有效利用预算。其运作基于一个简单而强大的直觉:优先收集模型表现出不确定性的数据点的标签,而对于模型确信的标签则依赖其预测。主动推断在利用任意黑盒机器学习模型并处理任意数据分布的同时,能够构造出具有理论保证的置信区间和假设检验。关键在于,相比依赖非自适应收集数据的现有基准方法,它能用少得多的样本达到相同的准确度。这意味着,在收集样本数量相同的情况下,主动推断能够实现更窄的置信区间和更强大的p值。我们在来自民意调查、人口普查分析和蛋白质组学的数据集上评估了主动推断方法。

0
下载
关闭预览

相关内容

基于因果推断的推荐系统去偏研究
专知会员服务
21+阅读 · 2024年11月10日
具有组合结构的统计推断和在线算法
专知会员服务
12+阅读 · 2022年12月13日
237页ppt《主动学习》最新概述,Stefano Teso讲授!
专知会员服务
66+阅读 · 2022年8月28日
【NeurIPS2021】对比主动推理
专知会员服务
30+阅读 · 2021年10月21日
【经典书】主动学习理论,226页pdf,Theory of Active Learning
专知会员服务
129+阅读 · 2021年7月14日
西北大学等最新《深度主动学习》全面综述论文,30页pdf
自动结构变分推理,Automatic structured variational inference
专知会员服务
41+阅读 · 2020年2月10日
基于深度元学习的因果推断新方法
图与推荐
12+阅读 · 2020年7月21日
浅谈主动学习(Active Learning)
凡人机器学习
32+阅读 · 2020年6月18日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
17+阅读 · 2019年1月24日
推荐系统
炼数成金订阅号
28+阅读 · 2019年1月17日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
Arxiv
0+阅读 · 6月11日
Arxiv
0+阅读 · 6月4日
Arxiv
0+阅读 · 6月2日
Arxiv
0+阅读 · 5月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
8+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
10+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关VIP内容
基于因果推断的推荐系统去偏研究
专知会员服务
21+阅读 · 2024年11月10日
具有组合结构的统计推断和在线算法
专知会员服务
12+阅读 · 2022年12月13日
237页ppt《主动学习》最新概述,Stefano Teso讲授!
专知会员服务
66+阅读 · 2022年8月28日
【NeurIPS2021】对比主动推理
专知会员服务
30+阅读 · 2021年10月21日
【经典书】主动学习理论,226页pdf,Theory of Active Learning
专知会员服务
129+阅读 · 2021年7月14日
西北大学等最新《深度主动学习》全面综述论文,30页pdf
自动结构变分推理,Automatic structured variational inference
专知会员服务
41+阅读 · 2020年2月10日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员