Bridging the Simulation-to-Experiment Gap with Generative Models using Adversarial Distribution Alignment - 专知论文

会员服务 ·

0

对齐 · 生成模型 · 对抗 · 系统 · 先验知识 ·

Bridging the Simulation-to-Experiment Gap with Generative Models using Adversarial Distribution Alignment

翻译：使用生成模型通过对抗分布对齐弥合模拟与实验之间的差距

Kai Nelson,Tobias Kreiman,Sergey Levine,Aditi S. Krishnapriyan

A fundamental challenge in science and engineering is the simulation-to-experiment gap. While we often possess prior knowledge of physical laws, these physical laws can be too difficult to solve exactly for complex systems. Such systems are commonly modeled using simulators, which impose computational approximations. Meanwhile, experimental measurements more faithfully represent the real world, but experimental data typically consists of observations that only partially reflect the system's full underlying state. We propose a data-driven distribution alignment framework that bridges this simulation-to-experiment gap by pre-training a generative model on fully observed (but imperfect) simulation data, then aligning it with partial (but real) observations of experimental data. While our method is domain-agnostic, we ground our approach in the physical sciences by introducing Adversarial Distribution Alignment (ADA). This method aligns a generative model of atomic positions -- initially trained on a simulated Boltzmann distribution -- with the distribution of experimental observations. We prove that our method recovers the target observable distribution, even with multiple, potentially correlated observables. We also empirically validate our framework on synthetic, molecular, and experimental protein data, demonstrating that it can align generative models with diverse observables. Our code is available at https://kaityrusnelson.com/ada/.

翻译：科学与工程中的一个基本挑战是模拟与实验之间的差距。尽管我们通常掌握物理定律的先验知识，但这些定律对于复杂系统而言可能难以精确求解。此类系统通常通过模拟器建模，这引入了计算近似。与此同时，实验测量更忠实地反映现实世界，但实验数据通常仅包含部分反映系统完整潜在状态的观测值。我们提出一种数据驱动的分布对齐框架，通过在全观测（但不完美）的模拟数据上预训练生成模型，然后将其与部分（但真实）的实验观测数据对齐，从而弥合模拟与实验之间的差距。尽管我们的方法具有领域无关性，我们通过引入对抗分布对齐（ADA）将其扎根于物理科学领域。该方法将原子位置的生成模型——最初基于模拟玻尔兹曼分布训练——与实验观测的分布对齐。我们证明，即使存在多个可能相关的观测量，该方法也能恢复目标可观测分布。我们还在合成数据、分子数据和实验蛋白质数据上进行了实证验证，表明该方法能够将生成模型与多种观测量对齐。我们的代码可在 https://kaityrusnelson.com/ada/ 获取。

0

相关内容

《美海军研究报告：利用认知模型为机器学习模型生成数据》

《美海军研究报告：利用认知模型为机器学习模型生成数据》

专知会员服务

21+阅读 · 5月17日

【博士论文】弥合多模态基础模型与世界模型之间的鸿沟

【博士论文】弥合多模态基础模型与世界模型之间的鸿沟

专知会员服务

33+阅读 · 2025年10月9日

【AAAI2025教程】面向科学发现的多模态基础模型：在化学、材料和生物学中的应用，176页ppt

【AAAI2025教程】面向科学发现的多模态基础模型：在化学、材料和生物学中的应用，176页ppt

专知会员服务

29+阅读 · 2025年3月7日

模拟真实世界：多模态生成模型的统一综述

模拟真实世界：多模态生成模型的统一综述

专知会员服务

34+阅读 · 2025年3月7日

【阿姆斯特丹博士论文】科学模拟的机器学习：推理与生成模型

【阿姆斯特丹博士论文】科学模拟的机器学习：推理与生成模型

专知会员服务

36+阅读 · 2024年11月6日

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

专知会员服务

67+阅读 · 2022年11月30日

《模糊系统分析中的因果假设》美国空军研究实验室93页技术总结报告

《模糊系统分析中的因果假设》美国空军研究实验室93页技术总结报告

专知会员服务

21+阅读 · 2022年10月31日

【剑桥大学博士论文】《脑科学中的数据驱动表示：基因表达和神经成像领域的建模方法》2022最新160页论文

【剑桥大学博士论文】《脑科学中的数据驱动表示：基因表达和神经成像领域的建模方法》2022最新160页论文

专知会员服务

41+阅读 · 2022年8月28日

《量化、可视化和跟踪作战能力差距》美国海军研究生院最新报告

《量化、可视化和跟踪作战能力差距》美国海军研究生院最新报告

专知会员服务

61+阅读 · 2022年5月23日

基于生成对抗网络的模仿学习综述, 苏州大学，计算机学报

专知会员服务

47+阅读 · 2020年2月1日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

基于虚拟现实环境的深度学习模型构建

基于虚拟现实环境的深度学习模型构建

MOOC

24+阅读 · 2019年9月28日

一文读懂机器学习模型的选择与取舍

一文读懂机器学习模型的选择与取舍

DBAplus社群

13+阅读 · 2019年8月25日

基于模型系统的系统设计

基于模型系统的系统设计

科技导报

10+阅读 · 2019年4月25日

如何理解模型的过拟合与欠拟合，以及如何解决？

如何理解模型的过拟合与欠拟合，以及如何解决？

七月在线实验室

12+阅读 · 2019年4月23日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

机器学习中如何处理不平衡数据？

机器学习中如何处理不平衡数据？

机器之心

13+阅读 · 2019年2月17日

【机器学习】深入剖析机器学习中的统计思想

【机器学习】深入剖析机器学习中的统计思想

产业智能官

17+阅读 · 2019年1月24日

用模型不确定性理解模型

用模型不确定性理解模型

论智

11+阅读 · 2018年9月5日

FCS 论坛 | 孟德宇：误差建模原理

FCS 论坛 | 孟德宇：误差建模原理

FCS

15+阅读 · 2017年8月17日

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

高维晶格动力学的准确数值界面条件研究

国家自然科学基金

0+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

试验设计中的模型选择

国家自然科学基金

6+阅读 · 2014年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

面向地理模型集成与运行的数据适配方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

密度调制法近距离牛顿反平方定律实验检验

国家自然科学基金

0+阅读 · 2014年12月31日

碰撞接触中的尺度缩放效应

国家自然科学基金

0+阅读 · 2014年12月31日

Exploiting Differential Flatness for Efficient Learning-based Model Predictive Control of Constrained Multi-Input Control Affine Systems

Arxiv

0+阅读 · 4月27日

Closing the Domain Gap in Biomedical Imaging by In-Context Control Samples

Arxiv

0+阅读 · 4月22日

Statistical Validation of Computer Models: Global and Subdomain Hypothesis Testing

Arxiv

0+阅读 · 4月18日

Shapes are not enough: CONSERVAttack and its use for finding vulnerabilities and uncertainties in machine learning applications

Arxiv

0+阅读 · 4月8日

Understanding Performance Gap Between Parallel and Sequential Sampling in Large Reasoning Models

Arxiv

0+阅读 · 4月7日

Bridging the Semantic Gap for Categorical Data Clustering via Large Language Models

Arxiv

0+阅读 · 4月5日

Many Wrongs Make a Right: Leveraging Biased Simulations Towards Unbiased Parameter Inference

Arxiv

0+阅读 · 4月2日

Addressing Ambiguity in Imitation Learning through Product of Experts based Negative Feedback

Arxiv

0+阅读 · 3月27日

Enabling topography-resolving structural dynamic contact simulation

Arxiv

0+阅读 · 3月27日

MolmoB0T: Large-Scale Simulation Enables Zero-Shot Manipulation

Arxiv

0+阅读 · 3月26日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

2+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

2+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

3+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

3+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

3+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

3+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

4+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

21+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

《美海军研究报告：利用认知模型为机器学习模型生成数据》

《美海军研究报告：利用认知模型为机器学习模型生成数据》

专知会员服务

21+阅读 · 5月17日

【博士论文】弥合多模态基础模型与世界模型之间的鸿沟

【博士论文】弥合多模态基础模型与世界模型之间的鸿沟

专知会员服务

33+阅读 · 2025年10月9日

【AAAI2025教程】面向科学发现的多模态基础模型：在化学、材料和生物学中的应用，176页ppt

【AAAI2025教程】面向科学发现的多模态基础模型：在化学、材料和生物学中的应用，176页ppt

专知会员服务

29+阅读 · 2025年3月7日

模拟真实世界：多模态生成模型的统一综述

模拟真实世界：多模态生成模型的统一综述

专知会员服务

34+阅读 · 2025年3月7日

【阿姆斯特丹博士论文】科学模拟的机器学习：推理与生成模型

【阿姆斯特丹博士论文】科学模拟的机器学习：推理与生成模型

专知会员服务

36+阅读 · 2024年11月6日

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

专知会员服务

67+阅读 · 2022年11月30日

《模糊系统分析中的因果假设》美国空军研究实验室93页技术总结报告

《模糊系统分析中的因果假设》美国空军研究实验室93页技术总结报告

专知会员服务

21+阅读 · 2022年10月31日

【剑桥大学博士论文】《脑科学中的数据驱动表示：基因表达和神经成像领域的建模方法》2022最新160页论文

【剑桥大学博士论文】《脑科学中的数据驱动表示：基因表达和神经成像领域的建模方法》2022最新160页论文

专知会员服务

41+阅读 · 2022年8月28日

《量化、可视化和跟踪作战能力差距》美国海军研究生院最新报告

《量化、可视化和跟踪作战能力差距》美国海军研究生院最新报告

专知会员服务

61+阅读 · 2022年5月23日

基于生成对抗网络的模仿学习综述, 苏州大学，计算机学报

专知会员服务

47+阅读 · 2020年2月1日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

基于虚拟现实环境的深度学习模型构建

基于虚拟现实环境的深度学习模型构建

MOOC

24+阅读 · 2019年9月28日

一文读懂机器学习模型的选择与取舍

一文读懂机器学习模型的选择与取舍

DBAplus社群

13+阅读 · 2019年8月25日

基于模型系统的系统设计

基于模型系统的系统设计

科技导报

10+阅读 · 2019年4月25日

如何理解模型的过拟合与欠拟合，以及如何解决？

如何理解模型的过拟合与欠拟合，以及如何解决？

七月在线实验室

12+阅读 · 2019年4月23日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

机器学习中如何处理不平衡数据？

机器学习中如何处理不平衡数据？

机器之心

13+阅读 · 2019年2月17日

【机器学习】深入剖析机器学习中的统计思想

【机器学习】深入剖析机器学习中的统计思想

产业智能官

17+阅读 · 2019年1月24日

用模型不确定性理解模型

用模型不确定性理解模型

论智

11+阅读 · 2018年9月5日

FCS 论坛 | 孟德宇：误差建模原理

FCS 论坛 | 孟德宇：误差建模原理

FCS

15+阅读 · 2017年8月17日

相关论文

Exploiting Differential Flatness for Efficient Learning-based Model Predictive Control of Constrained Multi-Input Control Affine Systems

Arxiv

0+阅读 · 4月27日

Closing the Domain Gap in Biomedical Imaging by In-Context Control Samples

Arxiv

0+阅读 · 4月22日

Statistical Validation of Computer Models: Global and Subdomain Hypothesis Testing

Arxiv

0+阅读 · 4月18日

Shapes are not enough: CONSERVAttack and its use for finding vulnerabilities and uncertainties in machine learning applications

Arxiv

0+阅读 · 4月8日

Understanding Performance Gap Between Parallel and Sequential Sampling in Large Reasoning Models

Arxiv

0+阅读 · 4月7日

Bridging the Semantic Gap for Categorical Data Clustering via Large Language Models

Arxiv

0+阅读 · 4月5日

Many Wrongs Make a Right: Leveraging Biased Simulations Towards Unbiased Parameter Inference

Arxiv

0+阅读 · 4月2日

Addressing Ambiguity in Imitation Learning through Product of Experts based Negative Feedback

Arxiv

0+阅读 · 3月27日

Enabling topography-resolving structural dynamic contact simulation

Arxiv

0+阅读 · 3月27日

MolmoB0T: Large-Scale Simulation Enables Zero-Shot Manipulation

Arxiv

0+阅读 · 3月26日

相关基金

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

高维晶格动力学的准确数值界面条件研究

国家自然科学基金

0+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

试验设计中的模型选择

国家自然科学基金

6+阅读 · 2014年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

面向地理模型集成与运行的数据适配方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

密度调制法近距离牛顿反平方定律实验检验

国家自然科学基金

0+阅读 · 2014年12月31日

碰撞接触中的尺度缩放效应

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员