Trustworthy scientific inference with generative models - 专知论文

会员服务 ·

0

推断 · 生成模型 · AI · 似然 · 一致 ·

Trustworthy scientific inference with generative models

翻译：基于生成模型的可靠科学推断

James Carzon,Luca Masserano,Joshua D. Ingram,Alex Shen,Antonio Carlos Herling Ribeiro Junior,Tommaso Dorigo,Michele Doro,Joshua S. Speagle,Rafael Izbicki,Ann B. Lee

Generative artificial intelligence (AI) excels at producing complex data structures (text, images, videos) by learning patterns from training examples. Across scientific disciplines, researchers are now applying generative models to "inverse problems" to directly predict hidden parameters from observed data along with measures of uncertainty. While these predictive or posterior-based methods can handle intractable likelihoods and large-scale studies, they can also produce biased or overconfident conclusions even without model misspecifications. We present a solution with Frequentist-Bayes (FreB), a mathematically rigorous protocol that reshapes AI-generated posterior probability distributions into (locally valid) confidence regions that consistently include true parameters with the expected probability, while achieving minimum size when training and target data align. We demonstrate FreB's effectiveness by tackling diverse case studies in the physical sciences: identifying unknown sources under dataset shift, reconciling competing theoretical models, and mitigating selection bias and systematics in observational studies. By providing validity guarantees with interpretable diagnostics, FreB enables trustworthy scientific inference across fields where direct likelihood evaluation remains impossible or prohibitively expensive.

翻译：生成式人工智能（AI）通过从训练样本中学习模式，擅长生成复杂的数据结构（文本、图像、视频）。在各个科学领域，研究人员正将生成模型应用于“逆问题”，以直接从观测数据中预测隐藏参数并量化不确定性。尽管这些基于预测或后验分布的方法能够处理难以处理的似然函数和大规模研究，但即使在模型设定无误的情况下，它们也可能产生有偏或过度自信的结论。我们提出了一种解决方案——频率主义-贝叶斯（FreB）方法，这是一种数学上严谨的协议，可将AI生成的后验概率分布重塑为（局部有效的）置信区域，这些区域能以预期概率一致地包含真实参数，并在训练数据与目标数据一致时达到最小尺寸。我们通过物理科学中的多个案例研究证明了FreB的有效性：在数据集偏移下识别未知源、调和相互竞争的理论模型，以及在观测研究中减轻选择偏差和系统误差。通过提供具有可解释诊断的有效性保证，FreB能够在直接似然评估仍不可能或成本过高的领域实现可靠的科学推断。

0

相关内容

【CMU博士论文】基于机器学习的可信科学推理

【CMU博士论文】基于机器学习的可信科学推理

专知会员服务

16+阅读 · 2025年5月26日

【新书】生成式人工智能：概念与应用

【新书】生成式人工智能：概念与应用

专知会员服务

47+阅读 · 2025年3月18日

生成式建模：综述

生成式建模：综述

专知会员服务

33+阅读 · 2025年1月13日

《利用合成数据生成加强军事决策支持》

《利用合成数据生成加强军事决策支持》

专知会员服务

42+阅读 · 2024年12月30日

生成模型如何做推荐？203页最新《基于生成模型的推荐系统》书册

生成模型如何做推荐？203页最新《基于生成模型的推荐系统》书册

专知会员服务

36+阅读 · 2024年9月28日

《生成式人工智能模型：机遇与风险》

《生成式人工智能模型：机遇与风险》

专知会员服务

78+阅读 · 2024年4月22日

【牛津大学博士论文】深度生成模型：表示、预测、设计在生物学领域的应用

【牛津大学博士论文】深度生成模型：表示、预测、设计在生物学领域的应用

专知会员服务

26+阅读 · 2023年12月22日

从AIGC到AIGS？南洋理工等最新《人工智能生成的图像作为数据源》综述，详述AI生成数据集方法

从AIGC到AIGS？南洋理工等最新《人工智能生成的图像作为数据源》综述，详述AI生成数据集方法

专知会员服务

68+阅读 · 2023年10月5日

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

专知会员服务

67+阅读 · 2022年11月30日

英国杜伦大学「深度生成建模」大综述论文，21页pdf

英国杜伦大学「深度生成建模」大综述论文，21页pdf

专知会员服务

49+阅读 · 2021年3月16日

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

29+阅读 · 2021年1月25日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

斯坦福CS236-深度生成模型2019-全套课程资料分享

斯坦福CS236-深度生成模型2019-全套课程资料分享

深度学习与NLP

20+阅读 · 2019年8月20日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

视频生成的前沿论文，看我们推荐的7篇就够了

视频生成的前沿论文，看我们推荐的7篇就够了

人工智能前沿讲习班

34+阅读 · 2018年12月30日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

3+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

生物网络的可计算建模

国家自然科学基金

2+阅读 · 2014年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

Reliable Thinking with Images

Arxiv

0+阅读 · 2月16日

A Survey on Generative Modeling with Limited Data, Few Shots, and Zero Shot

Arxiv

0+阅读 · 2月14日

Verification of the Implicit World Model in a Generative Model via Adversarial Sequences

Arxiv

0+阅读 · 2月5日

AI-generated data contamination erodes pathological variability and diagnostic reliability

Arxiv

0+阅读 · 2月2日

Generative Modeling with Bayesian Sample Inference

Arxiv

0+阅读 · 1月27日

Towards Interpretable Deep Generative Models via Causal Representation Learning

Arxiv

0+阅读 · 1月26日

AI-generated data contamination erodes pathological variability and diagnostic reliability

Arxiv

0+阅读 · 1月21日

Human-AI Collaborative Inductive Thematic Analysis: AI Guided Analysis and Human Interpretive Authority

Arxiv

0+阅读 · 1月17日

Controllable Video Generation: A Survey

Arxiv

0+阅读 · 1月16日

Hallucination, reliability, and the role of generative AI in science

Arxiv

0+阅读 · 1月13日

VIP会员

文章信息

相关主题

最新内容

《Palantir的科技生态系统》

《Palantir的科技生态系统》

专知会员服务

4+阅读 · 6月2日

《脑机接口：拓展神经前沿及其战略意涵》最新报告

《脑机接口：拓展神经前沿及其战略意涵》最新报告

专知会员服务

4+阅读 · 6月2日

《美军联合跨部门特遣部队401：反无人机系统表征通用标准（C4）》最新报告（中文版）

《美军联合跨部门特遣部队401：反无人机系统表征通用标准（C4）》最新报告（中文版）

专知会员服务

8+阅读 · 6月2日

《反无人机系统传感器融合》90页报告

《反无人机系统传感器融合》90页报告

专知会员服务

8+阅读 · 6月2日

运用人工智能与卫星通信驱散“战争迷雾”

运用人工智能与卫星通信驱散“战争迷雾”

专知会员服务

3+阅读 · 6月2日

ACL 2026 | LLMSurgeon：从生成文本诊断大模型训练数据

ACL 2026 | LLMSurgeon：从生成文本诊断大模型训练数据

专知会员服务

1+阅读 · 6月2日

【综述】世界模型：架构、方法、推理与应用全景

【综述】世界模型：架构、方法、推理与应用全景

专知会员服务

1+阅读 · 6月2日

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

专知会员服务

5+阅读 · 6月1日

综述 | OPSD：大语言模型的在线策略自蒸馏

综述 | OPSD：大语言模型的在线策略自蒸馏

专知会员服务

4+阅读 · 6月1日

算法化战争：人工智能时代的新范式（万字长文）

算法化战争：人工智能时代的新范式（万字长文）

专知会员服务

12+阅读 · 6月1日

帕兰蒂尔Maven：军事人工智能的新纪元

帕兰蒂尔Maven：军事人工智能的新纪元

专知会员服务

9+阅读 · 6月1日

《军事网络取证系统中的人工智能驱动情报融合：帕兰蒂尔公司“Maven智能系统”案例研究》

《军事网络取证系统中的人工智能驱动情报融合：帕兰蒂尔公司“Maven智能系统”案例研究》

专知会员服务

11+阅读 · 6月1日

《扩展主权人工智能操作系统：将Symphony作为帕兰蒂尔Foundry与英伟达的计算本体》

《扩展主权人工智能操作系统：将Symphony作为帕兰蒂尔Foundry与英伟达的计算本体》

专知会员服务

12+阅读 · 6月1日

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

专知会员服务

14+阅读 · 5月31日

比利时发布用于实时战场军事装备识别的离线人工智能系统

比利时发布用于实时战场军事装备识别的离线人工智能系统

专知会员服务

6+阅读 · 5月31日

相关VIP内容

【CMU博士论文】基于机器学习的可信科学推理

【CMU博士论文】基于机器学习的可信科学推理

专知会员服务

16+阅读 · 2025年5月26日

【新书】生成式人工智能：概念与应用

【新书】生成式人工智能：概念与应用

专知会员服务

47+阅读 · 2025年3月18日

生成式建模：综述

生成式建模：综述

专知会员服务

33+阅读 · 2025年1月13日

《利用合成数据生成加强军事决策支持》

《利用合成数据生成加强军事决策支持》

专知会员服务

42+阅读 · 2024年12月30日

生成模型如何做推荐？203页最新《基于生成模型的推荐系统》书册

生成模型如何做推荐？203页最新《基于生成模型的推荐系统》书册

专知会员服务

36+阅读 · 2024年9月28日

《生成式人工智能模型：机遇与风险》

《生成式人工智能模型：机遇与风险》

专知会员服务

78+阅读 · 2024年4月22日

【牛津大学博士论文】深度生成模型：表示、预测、设计在生物学领域的应用

【牛津大学博士论文】深度生成模型：表示、预测、设计在生物学领域的应用

专知会员服务

26+阅读 · 2023年12月22日

从AIGC到AIGS？南洋理工等最新《人工智能生成的图像作为数据源》综述，详述AI生成数据集方法

从AIGC到AIGS？南洋理工等最新《人工智能生成的图像作为数据源》综述，详述AI生成数据集方法

专知会员服务

68+阅读 · 2023年10月5日

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

专知会员服务

67+阅读 · 2022年11月30日

英国杜伦大学「深度生成建模」大综述论文，21页pdf

英国杜伦大学「深度生成建模」大综述论文，21页pdf

专知会员服务

49+阅读 · 2021年3月16日

热门VIP内容

开通专知VIP会员享更多权益服务

《脑机接口：拓展神经前沿及其战略意涵》最新报告

《反无人机系统传感器融合》90页报告

《Palantir的科技生态系统》

《美军联合跨部门特遣部队401：反无人机系统表征通用标准（C4）》最新报告（中文版）

相关资讯

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

29+阅读 · 2021年1月25日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

斯坦福CS236-深度生成模型2019-全套课程资料分享

斯坦福CS236-深度生成模型2019-全套课程资料分享

深度学习与NLP

20+阅读 · 2019年8月20日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

视频生成的前沿论文，看我们推荐的7篇就够了

视频生成的前沿论文，看我们推荐的7篇就够了

人工智能前沿讲习班

34+阅读 · 2018年12月30日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

相关论文

Reliable Thinking with Images

Arxiv

0+阅读 · 2月16日

A Survey on Generative Modeling with Limited Data, Few Shots, and Zero Shot

Arxiv

0+阅读 · 2月14日

Verification of the Implicit World Model in a Generative Model via Adversarial Sequences

Arxiv

0+阅读 · 2月5日

AI-generated data contamination erodes pathological variability and diagnostic reliability

Arxiv

0+阅读 · 2月2日

Generative Modeling with Bayesian Sample Inference

Arxiv

0+阅读 · 1月27日

Towards Interpretable Deep Generative Models via Causal Representation Learning

Arxiv

0+阅读 · 1月26日

AI-generated data contamination erodes pathological variability and diagnostic reliability

Arxiv

0+阅读 · 1月21日

Human-AI Collaborative Inductive Thematic Analysis: AI Guided Analysis and Human Interpretive Authority

Arxiv

0+阅读 · 1月17日

Controllable Video Generation: A Survey

Arxiv

0+阅读 · 1月16日

Hallucination, reliability, and the role of generative AI in science

Arxiv

0+阅读 · 1月13日

相关基金

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

3+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

生物网络的可计算建模

国家自然科学基金

2+阅读 · 2014年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员