Controllable driving scene generation is critical for realistic and scalable autonomous driving simulation, yet existing approaches struggle to jointly achieve photorealism and precise control. We introduce HorizonForge, a unified framework that reconstructs scenes as editable Gaussian Splats and Meshes, enabling fine-grained 3D manipulation and language-driven vehicle insertion. Edits are rendered through a noise-aware video diffusion process that enforces spatial and temporal consistency, producing diverse scene variations in a single feed-forward pass without per-trajectory optimization. To standardize evaluation, we further propose HorizonSuite, a comprehensive benchmark spanning ego- and agent-level editing tasks such as trajectory modifications and object manipulation. Extensive experiments show that Gaussian-Mesh representation delivers substantially higher fidelity than alternative 3D representations, and that temporal priors from video diffusion are essential for coherent synthesis. Combining these findings, HorizonForge establishes a simple yet powerful paradigm for photorealistic, controllable driving simulation, achieving an 83.4% user-preference gain and a 25.19% FID improvement over the second best state-of-the-art method. Project page: https://horizonforge.github.io/ .


翻译:可控驾驶场景生成对于实现真实且可扩展的自动驾驶仿真至关重要,然而现有方法难以同时达成照片级真实感与精确控制。我们提出了HorizonForge,一个统一框架,将场景重建为可编辑的高斯泼溅与网格,支持细粒度三维操控与语言驱动的车辆插入。编辑通过一个具备噪声感知的视频扩散过程进行渲染,该过程强制保持空间与时间一致性,仅需单次前向传播即可生成多样化的场景变体,无需针对每条轨迹进行优化。为了标准化评估,我们进一步提出了HorizonSuite,一个涵盖自车层面与智能体层面编辑任务(如轨迹修改与物体操控)的综合基准。大量实验表明,高斯-网格表示相比其他三维表示能提供显著更高的保真度,并且来自视频扩散的时间先验对于连贯的合成至关重要。综合这些发现,HorizonForge为照片级真实感、可控的驾驶仿真建立了一个简洁而强大的范式,相较于次优的现有最佳方法,实现了83.4%的用户偏好增益与25.19%的FID改进。项目页面:https://horizonforge.github.io/ 。

0
下载
关闭预览

相关内容

《大语言模型辅助生成军事训练场景》
专知会员服务
40+阅读 · 2025年11月13日
自动驾驶中的基础模型:场景生成与场景分析综述
专知会员服务
28+阅读 · 2025年6月16日
智驾地图市场研究报告(2025)
专知会员服务
13+阅读 · 2025年6月3日
三维场景生成:综述
专知会员服务
21+阅读 · 2025年5月9日
LargeAD:面向自动驾驶的大规模跨传感器数据预训练
专知会员服务
17+阅读 · 2025年1月8日
自动驾驶车辆定位技术概述|厚势汽车
厚势
10+阅读 · 2019年5月16日
全景分割任务介绍及其最新进展【附PPT与视频资料】
人工智能前沿讲习班
11+阅读 · 2018年12月5日
Image Captioning 36页最新综述, 161篇参考文献
专知
90+阅读 · 2018年10月23日
一种轻量级在线多目标车辆跟踪方法
极市平台
15+阅读 · 2018年8月18日
【学界】 李飞飞学生最新论文:利用场景图生成图像
GAN生成式对抗网络
15+阅读 · 2018年4月9日
国家自然科学基金
12+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
12+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员