Representative, Informative, and De-Amplifying: Requirements for Robust Bayesian Active Learning under Model Misspecification - 专知论文

会员服务 ·

0

样本 · 泛化 · 泛化误差 · 贝叶斯 · 协变量偏移 ·

Representative, Informative, and De-Amplifying: Requirements for Robust Bayesian Active Learning under Model Misspecification

翻译：代表性、信息性与去放大：模型误设下鲁棒贝叶斯主动学习的要求

Roubing Tang,Sabina J. Sloman,Samuel Kaski

from arxiv, Accepted at AISTATS 2026. Camera-ready version

In many settings in science and industry, such as drug discovery and clinical trials, a central challenge is designing experiments under time and budget constraints. Bayesian Optimal Experimental Design (BOED) is a paradigm to pick maximally informative designs that has been increasingly applied to such problems. During training, BOED selects inputs according to a pre-determined acquisition criterion to target informativeness. During testing, the model learned during training encounters a naturally occurring distribution of test samples. This leads to an instance of covariate shift, where the train and test samples are drawn from different distributions (the training samples are not representative of the test distribution). Prior work has shown that in the presence of model misspecification, covariate shift amplifies generalization error. Our first contribution is to provide a mathematical analysis of generalization error that reveals key contributors to generalization error in the presence of model misspecification. We show that generalization error under misspecification is the result of, in addition to covariate shift, a phenomenon we term error (de-)amplification which has not been identified or studied in prior work. We then develop a new acquisition function that mitigates the effects of model misspecification by including terms for representativeness, informativeness, and de-amplification (R-IDeA). Our experimental results demonstrate that the proposed method performs better than methods that target either only informativeness, representativeness, or both.

翻译：在科学与工业的诸多领域，如药物发现与临床试验中，一个核心挑战是在时间和预算约束下设计实验。贝叶斯最优实验设计（BOED）是一种选择最大化信息性设计的范式，已日益应用于此类问题。在训练阶段，BOED根据预设的获取准则选择输入以针对信息性。在测试阶段，训练期间学得的模型会遇到自然出现的测试样本分布。这导致了协变量偏移的一个实例，即训练样本与测试样本来自不同的分布（训练样本不能代表测试分布）。先前研究表明，在模型误设存在的情况下，协变量偏移会放大泛化误差。我们的第一个贡献是提供了一个泛化误差的数学分析，揭示了模型误设下影响泛化误差的关键因素。我们证明，误设下的泛化误差除了源于协变量偏移外，还源于一种我们称为误差（去）放大的现象，该现象在先前工作中未被识别或研究。随后，我们开发了一种新的获取函数，通过纳入代表性、信息性与去放大（R-IDeA）项来减轻模型误设的影响。我们的实验结果表明，所提方法优于仅针对信息性、代表性或两者兼顾的方法。

0

相关内容

【CMU博士论文】基于深度学习的高效贝叶斯实验设计

【CMU博士论文】基于深度学习的高效贝叶斯实验设计

专知会员服务

17+阅读 · 2025年8月19日

【博士论文】自适应、鲁棒且可扩展的贝叶斯滤波方法用于在线学习

【博士论文】自适应、鲁棒且可扩展的贝叶斯滤波方法用于在线学习

专知会员服务

10+阅读 · 2025年5月20日

【牛津大学博士论文】通过贝叶斯实验设计实现自动化数据采集

【牛津大学博士论文】通过贝叶斯实验设计实现自动化数据采集

专知会员服务

31+阅读 · 2024年11月4日

【牛津大学】贝叶斯优化用于自动化机器学习，321页pdf

【牛津大学】贝叶斯优化用于自动化机器学习，321页pdf

专知会员服务

31+阅读 · 2024年5月17日

【牛津大学博士论文】在不利情境下的贝叶斯优化，269页pdf

【牛津大学博士论文】在不利情境下的贝叶斯优化，269页pdf

专知会员服务

45+阅读 · 2024年3月17日

AAAI2023最新「贝叶斯优化」教程报告，220+页PPT阐述BO基础到高级主题

AAAI2023最新「贝叶斯优化」教程报告，220+页PPT阐述BO基础到高级主题

专知会员服务

50+阅读 · 2023年2月17日

《通过最优传输失配措施进行鲁棒性贝叶斯推断：应用和算法》麻省理工学院2022最新博士论文

《通过最优传输失配措施进行鲁棒性贝叶斯推断：应用和算法》麻省理工学院2022最新博士论文

专知会员服务

15+阅读 · 2022年6月21日

【Nature论文】定量和定性变量混合的材料设计的贝叶斯优化

【Nature论文】定量和定性变量混合的材料设计的贝叶斯优化

专知会员服务

21+阅读 · 2020年3月19日

最大均方差正则化贝叶斯神经网络，Bayesian Neural Networks With Maximum Mean Discrepancy Regularization

最大均方差正则化贝叶斯神经网络，Bayesian Neural Networks With Maximum Mean Discrepancy Regularization

专知会员服务

54+阅读 · 2020年3月5日

【AAAI2020】拓扑贝叶斯优化与持久性图：Topological Bayesian Optimization with Persistence Diagrams

【AAAI2020】拓扑贝叶斯优化与持久性图：Topological Bayesian Optimization with Persistence Diagrams

专知会员服务

11+阅读 · 2020年1月17日

【干货书】贝叶斯推断随机过程，449页pdf

【干货书】贝叶斯推断随机过程，449页pdf

专知

31+阅读 · 2020年8月27日

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

专知

27+阅读 · 2020年2月25日

一文读懂机器学习中的贝叶斯统计学

一文读懂机器学习中的贝叶斯统计学

数据分析

26+阅读 · 2019年5月8日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

最新36页《贝叶斯非参学习综述》，机器学习内功修炼手册

最新36页《贝叶斯非参学习综述》，机器学习内功修炼手册

专知

25+阅读 · 2019年2月27日

【深度】让DL可解释？这一份66页贝叶斯深度学习教程告诉你

【深度】让DL可解释？这一份66页贝叶斯深度学习教程告诉你

GAN生成式对抗网络

15+阅读 · 2018年8月11日

让DL可解释？这一份66页贝叶斯深度学习教程告诉你

让DL可解释？这一份66页贝叶斯深度学习教程告诉你

专知

19+阅读 · 2018年8月4日

入门 | 什么是最大似然估计、最大后验估计以及贝叶斯参数估计

入门 | 什么是最大似然估计、最大后验估计以及贝叶斯参数估计

机器之心

11+阅读 · 2018年4月15日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

贝叶斯机器学习前沿进展

贝叶斯机器学习前沿进展

机器学习研究会

21+阅读 · 2018年1月21日

贝叶斯网分解理论及其应用

国家自然科学基金

16+阅读 · 2017年12月31日

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

通信网络在不确定业务流量需求下的路由鲁棒性优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于贝叶斯观点的分数阶扩散方程反问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

基于贝叶斯网络的城市公交动态调度决策方法

国家自然科学基金

3+阅读 · 2015年12月31日

贝叶斯博弈关于信息结构的比较静态分析及应用

国家自然科学基金

1+阅读 · 2014年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

Surrogate-Based Bayesian Inference: Uncertainty Quantification and Active Learning

Arxiv

0+阅读 · 3月13日

Wasserstein Gradient Flows for Batch Bayesian Optimal Experimental Design

Arxiv

0+阅读 · 3月12日

Bayesian Active Learning for Bayesian Model Updating: the Art of Acquisition Functions and Beyond

Arxiv

0+阅读 · 2月24日

Bayesian Optimality of In-Context Learning with Selective State Spaces

Arxiv

0+阅读 · 2月19日

Batch-based Bayesian Optimal Experimental Design in Linear Inverse Problems

Arxiv

0+阅读 · 2月12日

Uncertainty-Aware Bayes' Rule and Its Applications

Arxiv

0+阅读 · 2月12日

Default Machine Learning Hyperparameters Do Not Provide Informative Initialization for Bayesian Optimization

Arxiv

0+阅读 · 2月9日

BONSAI: Bayesian Optimization with Natural Simplicity and Interpretability

Arxiv

0+阅读 · 2月6日

Supercharging Simulation-Based Inference for Bayesian Optimal Experimental Design

Arxiv

0+阅读 · 2月6日

Pragmatic Curiosity: A Hybrid Learning-Optimization Paradigm via Active Inference

Arxiv

0+阅读 · 2月5日

VIP会员

文章信息

相关主题

协变量偏移

最新内容

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

专知会员服务

10+阅读 · 今天6:39

《人工智能在全球军事与武器工业中的应用、方法论与影响》

《人工智能在全球军事与武器工业中的应用、方法论与影响》

专知会员服务

3+阅读 · 今天6:36

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

专知会员服务

7+阅读 · 今天6:28

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

专知会员服务

4+阅读 · 今天0:51

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

专知会员服务

4+阅读 · 4月29日

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

专知会员服务

7+阅读 · 4月29日

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

专知会员服务

6+阅读 · 4月29日

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

专知会员服务

6+阅读 · 4月29日

《化繁为简：军事模拟器配置的对话式方法》报告

《化繁为简：军事模拟器配置的对话式方法》报告

专知会员服务

10+阅读 · 4月29日

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

专知会员服务

12+阅读 · 4月29日

《新兴技术武器化及其对全球风险的影响》

《新兴技术武器化及其对全球风险的影响》

专知会员服务

8+阅读 · 4月29日

《帕兰泰尔平台介绍：信息分析平台》

《帕兰泰尔平台介绍：信息分析平台》

专知会员服务

19+阅读 · 4月29日

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

专知会员服务

11+阅读 · 4月29日

【伯克利博士论文】深度解析 AI 智能体的失配问题

【伯克利博士论文】深度解析 AI 智能体的失配问题

专知会员服务

8+阅读 · 4月28日

智能体化世界建模：基础、能力、规律及展望

智能体化世界建模：基础、能力、规律及展望

专知会员服务

11+阅读 · 4月28日

相关VIP内容

【CMU博士论文】基于深度学习的高效贝叶斯实验设计

【CMU博士论文】基于深度学习的高效贝叶斯实验设计

专知会员服务

17+阅读 · 2025年8月19日

【博士论文】自适应、鲁棒且可扩展的贝叶斯滤波方法用于在线学习

【博士论文】自适应、鲁棒且可扩展的贝叶斯滤波方法用于在线学习

专知会员服务

10+阅读 · 2025年5月20日

【牛津大学博士论文】通过贝叶斯实验设计实现自动化数据采集

【牛津大学博士论文】通过贝叶斯实验设计实现自动化数据采集

专知会员服务

31+阅读 · 2024年11月4日

【牛津大学】贝叶斯优化用于自动化机器学习，321页pdf

【牛津大学】贝叶斯优化用于自动化机器学习，321页pdf

专知会员服务

31+阅读 · 2024年5月17日

【牛津大学博士论文】在不利情境下的贝叶斯优化，269页pdf

【牛津大学博士论文】在不利情境下的贝叶斯优化，269页pdf

专知会员服务

45+阅读 · 2024年3月17日

AAAI2023最新「贝叶斯优化」教程报告，220+页PPT阐述BO基础到高级主题

AAAI2023最新「贝叶斯优化」教程报告，220+页PPT阐述BO基础到高级主题

专知会员服务

50+阅读 · 2023年2月17日

《通过最优传输失配措施进行鲁棒性贝叶斯推断：应用和算法》麻省理工学院2022最新博士论文

《通过最优传输失配措施进行鲁棒性贝叶斯推断：应用和算法》麻省理工学院2022最新博士论文

专知会员服务

15+阅读 · 2022年6月21日

【Nature论文】定量和定性变量混合的材料设计的贝叶斯优化

【Nature论文】定量和定性变量混合的材料设计的贝叶斯优化

专知会员服务

21+阅读 · 2020年3月19日

最大均方差正则化贝叶斯神经网络，Bayesian Neural Networks With Maximum Mean Discrepancy Regularization

最大均方差正则化贝叶斯神经网络，Bayesian Neural Networks With Maximum Mean Discrepancy Regularization

专知会员服务

54+阅读 · 2020年3月5日

【AAAI2020】拓扑贝叶斯优化与持久性图：Topological Bayesian Optimization with Persistence Diagrams

【AAAI2020】拓扑贝叶斯优化与持久性图：Topological Bayesian Optimization with Persistence Diagrams

专知会员服务

11+阅读 · 2020年1月17日

热门VIP内容

开通专知VIP会员享更多权益服务

《人工智能在全球军事与武器工业中的应用、方法论与影响》

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

相关资讯

【干货书】贝叶斯推断随机过程，449页pdf

【干货书】贝叶斯推断随机过程，449页pdf

专知

31+阅读 · 2020年8月27日

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

专知

27+阅读 · 2020年2月25日

一文读懂机器学习中的贝叶斯统计学

一文读懂机器学习中的贝叶斯统计学

数据分析

26+阅读 · 2019年5月8日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

最新36页《贝叶斯非参学习综述》，机器学习内功修炼手册

最新36页《贝叶斯非参学习综述》，机器学习内功修炼手册

专知

25+阅读 · 2019年2月27日

【深度】让DL可解释？这一份66页贝叶斯深度学习教程告诉你

【深度】让DL可解释？这一份66页贝叶斯深度学习教程告诉你

GAN生成式对抗网络

15+阅读 · 2018年8月11日

让DL可解释？这一份66页贝叶斯深度学习教程告诉你

让DL可解释？这一份66页贝叶斯深度学习教程告诉你

专知

19+阅读 · 2018年8月4日

入门 | 什么是最大似然估计、最大后验估计以及贝叶斯参数估计

入门 | 什么是最大似然估计、最大后验估计以及贝叶斯参数估计

机器之心

11+阅读 · 2018年4月15日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

贝叶斯机器学习前沿进展

贝叶斯机器学习前沿进展

机器学习研究会

21+阅读 · 2018年1月21日

相关论文

Surrogate-Based Bayesian Inference: Uncertainty Quantification and Active Learning

Arxiv

0+阅读 · 3月13日

Wasserstein Gradient Flows for Batch Bayesian Optimal Experimental Design

Arxiv

0+阅读 · 3月12日

Bayesian Active Learning for Bayesian Model Updating: the Art of Acquisition Functions and Beyond

Arxiv

0+阅读 · 2月24日

Bayesian Optimality of In-Context Learning with Selective State Spaces

Arxiv

0+阅读 · 2月19日

Batch-based Bayesian Optimal Experimental Design in Linear Inverse Problems

Arxiv

0+阅读 · 2月12日

Uncertainty-Aware Bayes' Rule and Its Applications

Arxiv

0+阅读 · 2月12日

Default Machine Learning Hyperparameters Do Not Provide Informative Initialization for Bayesian Optimization

Arxiv

0+阅读 · 2月9日

BONSAI: Bayesian Optimization with Natural Simplicity and Interpretability

Arxiv

0+阅读 · 2月6日

Supercharging Simulation-Based Inference for Bayesian Optimal Experimental Design

Arxiv

0+阅读 · 2月6日

Pragmatic Curiosity: A Hybrid Learning-Optimization Paradigm via Active Inference

Arxiv

0+阅读 · 2月5日

相关基金

贝叶斯网分解理论及其应用

国家自然科学基金

16+阅读 · 2017年12月31日

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

通信网络在不确定业务流量需求下的路由鲁棒性优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于贝叶斯观点的分数阶扩散方程反问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

基于贝叶斯网络的城市公交动态调度决策方法

国家自然科学基金

3+阅读 · 2015年12月31日

贝叶斯博弈关于信息结构的比较静态分析及应用

国家自然科学基金

1+阅读 · 2014年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员