Large Language Models (LLMs) are rapidly advancing across diverse domains, yet their application in theoretical physics remains inadequate. While current models show competence in mathematical reasoning and code generation, we identify critical gaps in physical intuition, constraint satisfaction, and reliable reasoning that cannot be addressed through prompting alone. Physics demands approximation judgment, symmetry exploitation, and physical grounding that require AI agents specifically trained on physics reasoning patterns and equipped with physics-aware verification tools. We argue that LLM would require such domain-specialized training and tooling to be useful in real-world for physics research. We envision physics-specialized AI agents that seamlessly handle multimodal data, propose physically consistent hypotheses, and autonomously verify theoretical results. Realizing this vision requires developing physics-specific training datasets, reward signals that capture physical reasoning quality, and verification frameworks encoding fundamental principles. We call for collaborative efforts between physics and AI communities to build the specialized infrastructure necessary for AI-driven scientific discovery.


翻译:大型语言模型(LLM)正在众多领域快速发展,但其在理论物理中的应用仍显不足。尽管当前模型在数学推理和代码生成方面展现出一定能力,我们发现了其在物理直觉、约束满足和可靠推理方面存在关键缺陷,这些缺陷无法仅通过提示工程解决。物理学需要近似判断、对称性利用和物理基础,这要求AI智能体必须经过专门针对物理推理模式的训练,并配备具备物理感知能力的验证工具。我们认为,LLM需要此类领域专门化的训练和工具支持,方能在真实世界的物理研究中发挥作用。我们设想一种专门面向物理学的AI智能体,能够无缝处理多模态数据、提出物理一致的假设,并自主验证理论结果。实现这一愿景需要开发物理学专用的训练数据集、能够捕捉物理推理质量的奖励信号,以及编码基本原理的验证框架。我们呼吁物理学与人工智能学界开展合作,共同构建AI驱动科学发现所必需的专门化基础设施。

0
下载
关闭预览

相关内容

物理学(Physics)是一门形式科学,主要研究的是时空中的物质及其运动的模型,包括能量和作用力等所有相关概念。更广义地说,物理学探索分析大自然所发生的现象,目的是要了解其规则。 话题图片由 张明明 知友制作。
大语言模型的智能体化推理
专知会员服务
35+阅读 · 1月21日
大型语言模型的规模效应局限
专知会员服务
14+阅读 · 2025年11月18日
基于大语言模型的智能体优化研究综述
专知会员服务
63+阅读 · 2025年3月25日
关于大语言模型驱动的推荐系统智能体的综述
专知会员服务
29+阅读 · 2025年2月17日
「知识增强预训练语言模型」最新研究综述
专知
18+阅读 · 2022年11月18日
自然语言处理中的语言模型预训练方法
PaperWeekly
14+阅读 · 2018年10月21日
自然语言处理(二)机器翻译 篇 (NLP: machine translation)
DeepLearning中文论坛
12+阅读 · 2015年7月1日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Semantic Invariance in Agentic AI
Arxiv
0+阅读 · 3月13日
VIP会员
最新内容
《深度强化学习在兵棋推演中的应用》40页报告
专知会员服务
5+阅读 · 今天5:37
《多域作战面临复杂现实》
专知会员服务
4+阅读 · 今天5:35
《印度的多域作战:条令与能力发展》报告
专知会员服务
2+阅读 · 今天5:24
人工智能赋能无人机:俄乌战争(万字长文)
专知会员服务
6+阅读 · 4月23日
国外海军作战管理系统与作战训练系统
专知会员服务
3+阅读 · 4月23日
美军条令《海军陆战队规划流程(2026版)》
专知会员服务
11+阅读 · 4月23日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员