Towards a Physics Foundation Model - 专知论文

会员服务 ·

0

系统 · 泛化 · 上下文 · 大模型 · 语言处理 ·

Towards a Physics Foundation Model

翻译：迈向物理基础模型

Florian Wiesner,Matthias Wessling,Stephen Baek

Foundation models have revolutionized natural language processing through a ``train once, deploy anywhere'' paradigm, where a single pre-trained model adapts to countless downstream tasks without retraining. Access to a Physics Foundation Model (PFM) would be transformative - democratizing access to high-fidelity simulations, accelerating scientific discovery, and eliminating the need for specialized solver development. Yet current physics-aware machine learning approaches remain fundamentally limited to single, narrow domains and require retraining for each new system. We present the General Physics Transformer (GPhyT), trained on 1.8 TB of diverse simulation data, that demonstrates foundation model capabilities are achievable for physics. Our key insight is that transformers can learn to infer governing dynamics from context, enabling a single model to simulate fluid-solid interactions, shock waves, thermal convection, and multi-phase dynamics without being told the underlying equations. GPhyT achieves three critical breakthroughs: (1) superior performance across multiple physics domains, outperforming specialized architectures by more than 7x, (2) plausible zero-shot generalization to entirely unseen physical systems through in-context learning, and (3) more stable long-term predictions through long-horizon rollouts. By establishing that a single model can learn generalizable physical principles from data alone, this work opens the path toward a universal PFM that could transform computational science and engineering.

翻译：基础模型通过“一次训练，随处部署”的范式彻底改变了自然语言处理，其中单个预训练模型无需重新训练即可适应无数下游任务。获得一个物理基础模型将是变革性的——它能够普及高保真模拟的使用，加速科学发现，并消除对专门求解器开发的需求。然而，当前具有物理感知的机器学习方法从根本上仍然局限于单一、狭窄的领域，并且每个新系统都需要重新训练。我们提出了通用物理Transformer，该模型在1.8 TB的多样化模拟数据上训练，证明了基础模型的能力在物理学领域是可以实现的。我们的核心见解是，Transformer能够学会从上下文中推断支配性动力学，使得单个模型能够模拟流固相互作用、冲击波、热对流和多相动力学，而无需被告知底层方程。GPhyT实现了三个关键突破：在多个物理领域中均表现出卓越性能，其表现超过专用架构7倍以上；通过上下文学习，能够对完全未见过的物理系统进行合理的零样本泛化；通过长时程推演，实现了更稳定的长期预测。通过证明单个模型能够仅从数据中学习可泛化的物理原理，这项工作为通向可能改变计算科学与工程的通用PFM开辟了道路。

0

相关内容

【斯坦福博士论文】多模态基础模型：从科学理解到科学发现

【斯坦福博士论文】多模态基础模型：从科学理解到科学发现

专知会员服务

31+阅读 · 2025年11月9日

【新书】基于物理的模拟

【新书】基于物理的模拟

专知会员服务

22+阅读 · 2025年7月25日

【AAAI2025教程】面向科学发现的多模态基础模型：在化学、材料和生物学中的应用，176页ppt

【AAAI2025教程】面向科学发现的多模态基础模型：在化学、材料和生物学中的应用，176页ppt

专知会员服务

29+阅读 · 2025年3月7日

大模型走向物理世界，TeleAI 发布大模型驱动的具身智能综述，覆盖300篇文献

大模型走向物理世界，TeleAI 发布大模型驱动的具身智能综述，覆盖300篇文献

专知会员服务

48+阅读 · 2024年9月4日

遥感基础模型发展综述与未来设想

遥感基础模型发展综述与未来设想

专知会员服务

20+阅读 · 2024年8月13日

大模型+遥感？最新《遥感中的人工智能基础模型》综述

大模型+遥感？最新《遥感中的人工智能基础模型》综述

专知会员服务

63+阅读 · 2024年8月10日

【斯坦福博士论文】基础模型的数据分布视角，321页pdf

【斯坦福博士论文】基础模型的数据分布视角，321页pdf

专知会员服务

42+阅读 · 2024年7月8日

【斯坦福博士论文】大模型(基础模型)现实应用，178页pdf

【斯坦福博士论文】大模型(基础模型)现实应用，178页pdf

专知会员服务

120+阅读 · 2023年7月9日

【斯坦福课程】基础模型进展

【斯坦福课程】基础模型进展

专知会员服务

52+阅读 · 2023年1月15日

基于物理信息的机器学习

专知会员服务

140+阅读 · 2021年11月21日

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

专知

29+阅读 · 2023年4月11日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

25+阅读 · 2023年4月4日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

28+阅读 · 2022年9月11日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

FewRel 2.0数据集：以近知远，以一知万，少次学习新挑战

FewRel 2.0数据集：以近知远，以一知万，少次学习新挑战

PaperWeekly

24+阅读 · 2019年11月6日

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

专知

14+阅读 · 2019年10月9日

这可能是「多模态机器学习」最通俗易懂的介绍

这可能是「多模态机器学习」最通俗易懂的介绍

计算机视觉life

113+阅读 · 2018年12月20日

展望：模型驱动的深度学习

展望：模型驱动的深度学习

人工智能学家

12+阅读 · 2018年1月23日

【干货】谷歌一个模型解决所有问题《One Model to Learn Them All》论文深度解读

【干货】谷歌一个模型解决所有问题《One Model to Learn Them All》论文深度解读

专知

10+阅读 · 2018年1月14日

大型射电望远镜重力模型构建关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

粒子物理的拓扑模型及其在量子时空非交换性中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

拟线性抛物方程及微机电系统新动力学模型的基础理论研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向地理模型集成与运行的数据适配方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向时空变化的GIS数据模型

国家自然科学基金

6+阅读 · 2014年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

超光谱、全偏振、立体形貌的多模态成像研究

国家自然科学基金

0+阅读 · 2014年12月31日

From PhysioNet to Foundation Models -- A history and potential futures

Arxiv

0+阅读 · 2月17日

Rethinking Scientific Modeling: Toward Physically Consistent and Simulation-Executable Programmatic Generation

Arxiv

0+阅读 · 2月6日

Towards Scientific Intelligence: A Survey of LLM-based Scientific Agents

Arxiv

0+阅读 · 2月2日

Towards Building Non-Fine-Tunable Foundation Models

Arxiv

0+阅读 · 1月31日

Making Foundation Models Probabilistic via Singular Value Ensembles

Arxiv

0+阅读 · 1月29日

Learning and Transferring Physical Models through Derivatives

Arxiv

0+阅读 · 1月23日

PhysicsMind: Sim and Real Mechanics Benchmarking for Physical Reasoning and Prediction in Foundational VLMs and World Models

Arxiv

0+阅读 · 1月22日

Understanding the Transfer Limits of Vision Foundation Models

Arxiv

0+阅读 · 1月22日

On Foundation Models for Temporal Point Processes to Accelerate Scientific Discovery

Arxiv

0+阅读 · 1月20日

PhysicsSolutionAgent: Towards Multimodal Explanations for Numerical Physics Problem Solving

Arxiv

0+阅读 · 1月19日

VIP会员

文章信息

相关主题

最新内容

美国当前高超音速导弹发展概述

美国当前高超音速导弹发展概述

专知会员服务

4+阅读 · 4月19日

《高超音速武器：一项再度兴起的技术》120页slides

《高超音速武器：一项再度兴起的技术》120页slides

专知会员服务

8+阅读 · 4月19日

无人机蜂群建模与仿真方法

无人机蜂群建模与仿真方法

专知会员服务

7+阅读 · 4月19日

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

专知会员服务

3+阅读 · 4月19日

《量化反无人机系统对抗无人机蜂群效能的创新方法》

《量化反无人机系统对抗无人机蜂群效能的创新方法》

专知会员服务

7+阅读 · 4月19日

澳大利亚发布《国防战略（2026年）》

澳大利亚发布《国防战略（2026年）》

专知会员服务

2+阅读 · 4月19日

【CMU博士论文】迈向基于基础先验的 4D 感知研究

【CMU博士论文】迈向基于基础先验的 4D 感知研究

专知会员服务

2+阅读 · 4月19日

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

专知会员服务

8+阅读 · 4月19日

全球高超音速武器最新发展趋势

全球高超音速武器最新发展趋势

专知会员服务

2+阅读 · 4月19日

《利用大语言模型增强多域作战兵棋推演》（报告）

《利用大语言模型增强多域作战兵棋推演》（报告）

专知会员服务

12+阅读 · 4月18日

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

专知会员服务

12+阅读 · 4月18日

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

专知会员服务

9+阅读 · 4月18日

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

专知会员服务

17+阅读 · 4月18日

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

专知会员服务

8+阅读 · 4月18日

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

专知会员服务

10+阅读 · 4月18日

相关VIP内容

【斯坦福博士论文】多模态基础模型：从科学理解到科学发现

【斯坦福博士论文】多模态基础模型：从科学理解到科学发现

专知会员服务

31+阅读 · 2025年11月9日

【新书】基于物理的模拟

【新书】基于物理的模拟

专知会员服务

22+阅读 · 2025年7月25日

【AAAI2025教程】面向科学发现的多模态基础模型：在化学、材料和生物学中的应用，176页ppt

【AAAI2025教程】面向科学发现的多模态基础模型：在化学、材料和生物学中的应用，176页ppt

专知会员服务

29+阅读 · 2025年3月7日

大模型走向物理世界，TeleAI 发布大模型驱动的具身智能综述，覆盖300篇文献

大模型走向物理世界，TeleAI 发布大模型驱动的具身智能综述，覆盖300篇文献

专知会员服务

48+阅读 · 2024年9月4日

遥感基础模型发展综述与未来设想

遥感基础模型发展综述与未来设想

专知会员服务

20+阅读 · 2024年8月13日

大模型+遥感？最新《遥感中的人工智能基础模型》综述

大模型+遥感？最新《遥感中的人工智能基础模型》综述

专知会员服务

63+阅读 · 2024年8月10日

【斯坦福博士论文】基础模型的数据分布视角，321页pdf

【斯坦福博士论文】基础模型的数据分布视角，321页pdf

专知会员服务

42+阅读 · 2024年7月8日

【斯坦福博士论文】大模型(基础模型)现实应用，178页pdf

【斯坦福博士论文】大模型(基础模型)现实应用，178页pdf

专知会员服务

120+阅读 · 2023年7月9日

【斯坦福课程】基础模型进展

【斯坦福课程】基础模型进展

专知会员服务

52+阅读 · 2023年1月15日

基于物理信息的机器学习

专知会员服务

140+阅读 · 2021年11月21日

热门VIP内容

开通专知VIP会员享更多权益服务

《高超音速武器：一项再度兴起的技术》120页slides

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

美国当前高超音速导弹发展概述

无人机蜂群建模与仿真方法

相关资讯

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

专知

29+阅读 · 2023年4月11日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

25+阅读 · 2023年4月4日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

28+阅读 · 2022年9月11日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

FewRel 2.0数据集：以近知远，以一知万，少次学习新挑战

FewRel 2.0数据集：以近知远，以一知万，少次学习新挑战

PaperWeekly

24+阅读 · 2019年11月6日

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

专知

14+阅读 · 2019年10月9日

这可能是「多模态机器学习」最通俗易懂的介绍

这可能是「多模态机器学习」最通俗易懂的介绍

计算机视觉life

113+阅读 · 2018年12月20日

展望：模型驱动的深度学习

展望：模型驱动的深度学习

人工智能学家

12+阅读 · 2018年1月23日

【干货】谷歌一个模型解决所有问题《One Model to Learn Them All》论文深度解读

【干货】谷歌一个模型解决所有问题《One Model to Learn Them All》论文深度解读

专知

10+阅读 · 2018年1月14日

相关论文

From PhysioNet to Foundation Models -- A history and potential futures

Arxiv

0+阅读 · 2月17日

Rethinking Scientific Modeling: Toward Physically Consistent and Simulation-Executable Programmatic Generation

Arxiv

0+阅读 · 2月6日

Towards Scientific Intelligence: A Survey of LLM-based Scientific Agents

Arxiv

0+阅读 · 2月2日

Towards Building Non-Fine-Tunable Foundation Models

Arxiv

0+阅读 · 1月31日

Making Foundation Models Probabilistic via Singular Value Ensembles

Arxiv

0+阅读 · 1月29日

Learning and Transferring Physical Models through Derivatives

Arxiv

0+阅读 · 1月23日

PhysicsMind: Sim and Real Mechanics Benchmarking for Physical Reasoning and Prediction in Foundational VLMs and World Models

Arxiv

0+阅读 · 1月22日

Understanding the Transfer Limits of Vision Foundation Models

Arxiv

0+阅读 · 1月22日

On Foundation Models for Temporal Point Processes to Accelerate Scientific Discovery

Arxiv

0+阅读 · 1月20日

PhysicsSolutionAgent: Towards Multimodal Explanations for Numerical Physics Problem Solving

Arxiv

0+阅读 · 1月19日

相关基金

大型射电望远镜重力模型构建关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

粒子物理的拓扑模型及其在量子时空非交换性中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

拟线性抛物方程及微机电系统新动力学模型的基础理论研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向地理模型集成与运行的数据适配方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向时空变化的GIS数据模型

国家自然科学基金

6+阅读 · 2014年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

超光谱、全偏振、立体形貌的多模态成像研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员