As AI systems move from generating text to accomplishing goals through sustained interaction, the ability to model environment dynamics becomes a central bottleneck. Agents that manipulate objects, navigate software, coordinate with others, or design experiments require predictive environment models, yet the term world model carries different meanings across research communities. We introduce a "levels x laws" taxonomy organized along two axes. The first defines three capability levels: L1 Predictor, which learns one-step local transition operators; L2 Simulator, which composes them into multi-step, action-conditioned rollouts that respect domain laws; and L3 Evolver, which autonomously revises its own model when predictions fail against new evidence. The second identifies four governing-law regimes: physical, digital, social, and scientific. These regimes determine what constraints a world model must satisfy and where it is most likely to fail. Using this framework, we synthesize over 400 works and summarize more than 100 representative systems spanning model-based reinforcement learning, video generation, web and GUI agents, multi-agent social simulation, and AI-driven scientific discovery. We analyze methods, failure modes, and evaluation practices across level-regime pairs, propose decision-centric evaluation principles and a minimal reproducible evaluation package, and outline architectural guidance, open problems, and governance challenges. The resulting roadmap connects previously isolated communities and charts a path from passive next-step prediction toward world models that can simulate, and ultimately reshape, the environments in which agents operate.


翻译:随着人工智能系统从文本生成转向通过持续交互实现目标,对环境动力学建模的能力成为核心瓶颈。操作物体、导航软件、与他人协作或设计实验的智能体需要预测性环境模型,但"世界模型"一词在不同研究领域中含义各异。本文提出一种"能力层级×规律类型"的分类框架,沿两个维度展开:第一维度定义三个能力层级——L1预测器(学习单步局部转移算子)、L2模拟器(将算子组合为遵循领域规律的多步行动条件化推演)与L3演化器(当预测与新的证据不符时自主修正自身模型);第二维度识别四种规律控制领域:物理规律、数字规律、社会规律与科学规律。这些领域决定了世界模型必须满足的约束条件及其最可能失效的场景。借助该框架,我们综合分析了400余篇文献,总结了超过100个代表性系统,涵盖基于模型的强化学习、视频生成、网页与图形用户界面智能体、多智能体社会模拟以及人工智能驱动的科学发现。我们针对不同层级-规律组合下的方法、失效模式与评估实践进行剖析,提出以决策为中心的评估原则与可复现的最小化评估工具包,并勾勒出架构指引、开放问题与治理挑战。由此形成的路线图将先前孤立的研究社群联系起来,描绘了一条从被动式下一步预测迈向能够模拟并最终重塑智能体运行环境的世界模型的路径。

0
下载
关闭预览

相关内容

智能体,顾名思义,就是具有智能的实体,英文名是Agent。
《图世界模型:概念、分类体系与未来方向》
专知会员服务
21+阅读 · 5月1日
智能体化世界建模:基础、能力、规律及展望
专知会员服务
23+阅读 · 4月28日
具身智能中的心理世界建模:深度综述
专知会员服务
39+阅读 · 1月10日
AI 智能体系统:体系架构、应用场景及评估范式
具身智能中的世界模型:全面综述
专知会员服务
53+阅读 · 2025年10月21日
三维与四维世界建模综述
专知会员服务
31+阅读 · 2025年9月12日
【ICML2025】通用智能体需要世界模型
专知会员服务
27+阅读 · 2025年6月4日
大模型智能体:概念、前沿和产业实践
专知会员服务
79+阅读 · 2024年8月20日
面向多智能体博弈对抗的对手建模框架
专知
18+阅读 · 2022年9月28日
群体智能:新一代人工智能的重要方向
走向智能论坛
12+阅读 · 2017年8月16日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
50+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
0+阅读 · 18分钟前
21世纪的无人机战争
专知会员服务
1+阅读 · 今天14:05
《量子技术的军事任务技术适配与利用》
专知会员服务
1+阅读 · 今天13:51
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关VIP内容
《图世界模型:概念、分类体系与未来方向》
专知会员服务
21+阅读 · 5月1日
智能体化世界建模:基础、能力、规律及展望
专知会员服务
23+阅读 · 4月28日
具身智能中的心理世界建模:深度综述
专知会员服务
39+阅读 · 1月10日
AI 智能体系统:体系架构、应用场景及评估范式
具身智能中的世界模型:全面综述
专知会员服务
53+阅读 · 2025年10月21日
三维与四维世界建模综述
专知会员服务
31+阅读 · 2025年9月12日
【ICML2025】通用智能体需要世界模型
专知会员服务
27+阅读 · 2025年6月4日
大模型智能体:概念、前沿和产业实践
专知会员服务
79+阅读 · 2024年8月20日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
50+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员