Web agents require massive trajectories to generalize, yet real-world training is constrained by network latency, rate limits, and safety risks. We introduce \textbf{WebWorld} series, the first open-web simulator trained at scale. While existing simulators are restricted to closed environments with thousands of trajectories, WebWorld leverages a scalable data pipeline to train on 1M+ open-web interactions, supporting reasoning, multi-format data, and long-horizon simulations of 30+ steps. For intrinsic evaluation, we introduce WebWorld-Bench with dual metrics spanning nine dimensions, where WebWorld achieves simulation performance comparable to Gemini-3-Pro. For extrinsic evaluation, Qwen3-14B trained on WebWorld-synthesized trajectories improves by +9.2\% on WebArena, reaching performance comparable to GPT-4o. WebWorld enables effective inference-time search, outperforming GPT-5 as a world model. Beyond web simulation, WebWorld exhibits cross-domain generalization to code, GUI, and game environments, providing a replicable recipe for world model construction.


翻译:网络智能体需要海量轨迹以实现泛化,然而现实世界的训练受到网络延迟、速率限制和安全风险的制约。我们推出\textbf{WebWorld}系列,这是首个大规模训练的开源网络模拟器。现有模拟器局限于封闭环境,仅能处理数千条轨迹,而WebWorld利用可扩展的数据流水线,在超过100万次的开放网络交互上进行训练,支持推理、多格式数据以及超过30步的长时程模拟。在内在评估方面,我们引入WebWorld-Bench,其包含覆盖九个维度的双重指标,WebWorld在该基准上达到了与Gemini-3-Pro相当的模拟性能。在外在评估方面,基于WebWorld合成轨迹训练的Qwen3-14B模型在WebArena上的性能提升了+9.2\%,达到与GPT-4o相当的水平。WebWorld支持高效的推理时搜索,作为世界模型其性能超越了GPT-5。除了网络模拟,WebWorld还展现出对代码、图形用户界面和游戏环境的跨领域泛化能力,为世界模型的构建提供了一个可复现的方案。

0
下载
关闭预览

相关内容

具身智能中的心理世界建模:深度综述
专知会员服务
28+阅读 · 1月10日
具身智能中的世界模型:全面综述
专知会员服务
44+阅读 · 2025年10月21日
走向通用人工智能之路,世界模型为何不可或缺?
专知会员服务
17+阅读 · 2025年7月1日
【ICML2025】通用智能体需要世界模型
专知会员服务
24+阅读 · 2025年6月4日
【知识图谱】知识图谱+人工智能=新型网络信息体系
产业智能官
14+阅读 · 2018年11月18日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员