ReactSim-Bench: Benchmarking Reactive Behavior World Model Simulation in Autonomous Driving - 专知论文

会员服务 ·

0

自动驾驶汽车 · 汽车 · 自动驾驶 · 基准 · 基准测试 ·

ReactSim-Bench: Benchmarking Reactive Behavior World Model Simulation in Autonomous Driving

翻译：ReactSim-Bench：自动驾驶中反应性行为世界模型模拟的基准测试

Zhiyuan Zhang,Yanlun Peng,Jianing Zhang,Xianda Guo,Zehan Huang,Haoran Liu,Qifeng Li,Shaofeng Zhang,Xiaosong Jia,Junchi Yan

Reactive capability is a key property of data-driven behavior world model simulators for autonomous driving simulation systems. With this capability, simulated world agents can respond feasibly to autonomous vehicle (AV) behaviors that differ from the log. However, existing behavior simulation benchmarks do not directly measure reactive capability. They often let the simulator jointly control the AV and surrounding agents and evaluate realism through log similarity or open-loop prediction metrics. In this work, we introduce ReactSim-Bench for evaluating the reactive capability of behavior world model simulation in autonomous driving. We decouple the control of agents and the AV, using AV behaviors that differ from the log and require agents to respond as independent AV inputs. To obtain these AV behaviors, we construct a pipeline that uses an AV planner model to generate candidate behaviors and filters the data using rules and manual verification. Collision metrics, map-based metrics, and kinematic feasibility metrics are used to evaluate the safety and rule compliance of reactive responses. We construct 2,636 test scenarios with three categories and conduct a systematic evaluation of state-of-the-art models across multiple architectures, including Transformer-based, diffusion-based, and next-token-prediction-based models. We further analyze how replan frequency affects performance and provide insights for future studies.

翻译：反应能力是用于自动驾驶模拟系统的数据驱动行为世界模型模拟器的一个关键属性。具备这种能力后，模拟世界中的智能体能够对与日志记录不同的自动驾驶汽车行为做出可行的响应。然而，现有的行为模拟基准测试并未直接测量反应能力。它们通常让模拟器联合控制自动驾驶汽车和周围智能体，并通过日志相似性或开环预测指标来评估真实性。在这项工作中，我们引入了ReactSim-Bench，用于评估自动驾驶中行为世界模型模拟的反应能力。我们将智能体与自动驾驶汽车的控制解耦，使用与日志记录不同的自动驾驶汽车行为作为独立输入，要求智能体对此做出响应。为了获取这些自动驾驶汽车行为，我们构建了一个流水线，利用自动驾驶汽车规划器模型生成候选行为，并通过规则和手动验证对数据进行筛选。采用碰撞指标、基于地图的指标和运动学可行性指标来评估反应性响应的安全性和规则合规性。我们构建了包含三类共2636个测试场景，并对多个架构（包括基于Transformer、基于扩散和基于下一令牌预测的模型）中的最先进模型进行了系统评估。我们还进一步分析了重新规划频率如何影响性能，并为未来研究提供了见解。

0

相关内容

自动驾驶汽车

自动驾驶汽车

自动驾驶中的3D目标检测研究进展

自动驾驶中的3D目标检测研究进展

专知会员服务

12+阅读 · 2025年7月20日

自动驾驶中的基础模型：场景生成与场景分析综述

自动驾驶中的基础模型：场景生成与场景分析综述

专知会员服务

28+阅读 · 2025年6月16日

自动驾驶的世界模型综述

自动驾驶的世界模型综述

专知会员服务

48+阅读 · 2025年1月22日

【伯克利博士论文】高效的自动驾驶3D视觉，108页pdf

【伯克利博士论文】高效的自动驾驶3D视觉，108页pdf

专知会员服务

24+阅读 · 2024年9月1日

博士论文《用于自动驾驶虚拟测试的雷达模拟验证方法》2023最新135页，斯图加特大学

博士论文《用于自动驾驶虚拟测试的雷达模拟验证方法》2023最新135页，斯图加特大学

专知会员服务

24+阅读 · 2023年3月22日

最新！《智能网联汽车自动驾驶功能道路试验方法及要求》国家标准意见稿

最新！《智能网联汽车自动驾驶功能道路试验方法及要求》国家标准意见稿

专知会员服务

20+阅读 · 2022年8月9日

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

专知会员服务

45+阅读 · 2022年6月23日

【AI+军事】附论文+PPT 《建立在复杂海上作业中训练自动驾驶汽车的建模与仿真能力》

【AI+军事】附论文+PPT 《建立在复杂海上作业中训练自动驾驶汽车的建模与仿真能力》

专知会员服务

69+阅读 · 2022年4月16日

自动驾驶智能系统测试研究综述

专知会员服务

98+阅读 · 2021年1月24日

深度学习在自动车辆控制中的应用研究综述（A Survey of Deep Learning Applications to Autonomous Vehicle Control）

深度学习在自动车辆控制中的应用研究综述（A Survey of Deep Learning Applications to Autonomous Vehicle Control）

专知会员服务

34+阅读 · 2019年12月25日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

30+阅读 · 2022年9月19日

深度学习技术在自动驾驶中的应用

深度学习技术在自动驾驶中的应用

智能交通技术

26+阅读 · 2019年10月27日

概述自动机器学习（AutoML）

概述自动机器学习（AutoML）

人工智能学家

19+阅读 · 2019年8月11日

自动驾驶技术解读——自动驾驶汽车决策控制系统

自动驾驶技术解读——自动驾驶汽车决策控制系统

智能交通技术

30+阅读 · 2019年7月7日

无人驾驶仿真软件

无人驾驶仿真软件

智能交通技术

22+阅读 · 2019年5月9日

自动驾驶仿真软件列表

自动驾驶仿真软件列表

智能交通技术

13+阅读 · 2019年5月9日

【人工智能】【智能驾驶】人工智能在汽车自动驾驶系统中的应用分析

【人工智能】【智能驾驶】人工智能在汽车自动驾驶系统中的应用分析

产业智能官

18+阅读 · 2018年11月22日

从Seq2seq到Attention模型到Self Attention（一）

从Seq2seq到Attention模型到Self Attention（一）

量化投资与机器学习

76+阅读 · 2018年10月8日

基于模型的系统工程——自动驾驶汽车（20180928更新）

基于模型的系统工程——自动驾驶汽车（20180928更新）

UMLChina

20+阅读 · 2018年9月28日

【浅析】自动驾驶汽车传感器融合系统及多传感器数据融合算法浅析

【浅析】自动驾驶汽车传感器融合系统及多传感器数据融合算法浅析

中国自动化学会

15+阅读 · 2018年7月5日

无人驾驶中4D场景实时解析算法研究

国家自然科学基金

12+阅读 · 2017年12月31日

面向逆反射体检测的特征显著性研究

国家自然科学基金

0+阅读 · 2015年12月31日

心理与教育测量中项目反应时间数据的统计建模及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

混合交通环境中自动驾驶汽车安全可达性分析与优化控制研究

国家自然科学基金

1+阅读 · 2015年12月31日

无人驾驶车辆智能测试评估与环境设计

国家自然科学基金

28+阅读 · 2014年12月31日

核反应动力学高效数值模拟软件集成开发与应用

国家自然科学基金

1+阅读 · 2014年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

老年驾驶人风险感知及临界反应能力研究

国家自然科学基金

0+阅读 · 2014年12月31日

混入自动驾驶汽车的高速公路交通流微观建模与仿真方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

数据和模型混合驱动的虚拟人群行为仿真技术研究及其在军事中的应用

国家自然科学基金

10+阅读 · 2011年12月31日

ActWorld: From Explorable to Interactive World Model via Action-Aware Memory

Arxiv

0+阅读 · 6月16日

DriveJudge: Rethinking Autonomous Driving Evaluation with Vision-Language Models

Arxiv

0+阅读 · 6月15日

DRIVESPATIAL: A Benchmark for Spatiotemporal Intelligence in VLMs for Autonomous Driving

Arxiv

0+阅读 · 6月15日

CoIRL-AD: Collaborative-Competitive Imitation-Reinforcement Learning in Latent World Models for Autonomous Driving

Arxiv

0+阅读 · 6月15日

EvoMemBench: Benchmarking Agent Memory from a Self-Evolving Perspective

Arxiv

0+阅读 · 6月15日

DriveReward: A Comprehensive Dataset and Generative Vision-Language Reward Model for Autonomous Driving

Arxiv

0+阅读 · 6月14日

CausalDrive: Real-time Causal World Models for Autonomous Driving

Arxiv

0+阅读 · 6月13日

Self-Supervised Relevance Modelling in Autonomous Driving via Counterfactual Analysis

Arxiv

0+阅读 · 6月9日

ScenicRules: An Autonomous Driving Benchmark with Multi-Objective Specifications and Abstract Scenarios

Arxiv

0+阅读 · 6月4日

Simulation Distillation: Pretraining World Models in Simulation for Rapid Real-World Adaptation

Arxiv

0+阅读 · 5月12日

VIP会员

文章信息

相关主题

自动驾驶汽车

最新内容

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

9+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

3+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

7+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

9+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

4+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

8+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

6+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

6+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

6+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

4+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

12+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

9+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

11+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

6+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

9+阅读 · 7月31日

相关VIP内容

自动驾驶中的3D目标检测研究进展

自动驾驶中的3D目标检测研究进展

专知会员服务

12+阅读 · 2025年7月20日

自动驾驶中的基础模型：场景生成与场景分析综述

自动驾驶中的基础模型：场景生成与场景分析综述

专知会员服务

28+阅读 · 2025年6月16日

自动驾驶的世界模型综述

自动驾驶的世界模型综述

专知会员服务

48+阅读 · 2025年1月22日

【伯克利博士论文】高效的自动驾驶3D视觉，108页pdf

【伯克利博士论文】高效的自动驾驶3D视觉，108页pdf

专知会员服务

24+阅读 · 2024年9月1日

博士论文《用于自动驾驶虚拟测试的雷达模拟验证方法》2023最新135页，斯图加特大学

博士论文《用于自动驾驶虚拟测试的雷达模拟验证方法》2023最新135页，斯图加特大学

专知会员服务

24+阅读 · 2023年3月22日

最新！《智能网联汽车自动驾驶功能道路试验方法及要求》国家标准意见稿

最新！《智能网联汽车自动驾驶功能道路试验方法及要求》国家标准意见稿

专知会员服务

20+阅读 · 2022年8月9日

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

专知会员服务

45+阅读 · 2022年6月23日

【AI+军事】附论文+PPT 《建立在复杂海上作业中训练自动驾驶汽车的建模与仿真能力》

【AI+军事】附论文+PPT 《建立在复杂海上作业中训练自动驾驶汽车的建模与仿真能力》

专知会员服务

69+阅读 · 2022年4月16日

自动驾驶智能系统测试研究综述

专知会员服务

98+阅读 · 2021年1月24日

深度学习在自动车辆控制中的应用研究综述（A Survey of Deep Learning Applications to Autonomous Vehicle Control）

深度学习在自动车辆控制中的应用研究综述（A Survey of Deep Learning Applications to Autonomous Vehicle Control）

专知会员服务

34+阅读 · 2019年12月25日

热门VIP内容

开通专知VIP会员享更多权益服务

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

从采集到决策：美军视角下的战术情报范式重构

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

相关资讯

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

30+阅读 · 2022年9月19日

深度学习技术在自动驾驶中的应用

深度学习技术在自动驾驶中的应用

智能交通技术

26+阅读 · 2019年10月27日

概述自动机器学习（AutoML）

概述自动机器学习（AutoML）

人工智能学家

19+阅读 · 2019年8月11日

自动驾驶技术解读——自动驾驶汽车决策控制系统

自动驾驶技术解读——自动驾驶汽车决策控制系统

智能交通技术

30+阅读 · 2019年7月7日

无人驾驶仿真软件

无人驾驶仿真软件

智能交通技术

22+阅读 · 2019年5月9日

自动驾驶仿真软件列表

自动驾驶仿真软件列表

智能交通技术

13+阅读 · 2019年5月9日

【人工智能】【智能驾驶】人工智能在汽车自动驾驶系统中的应用分析

【人工智能】【智能驾驶】人工智能在汽车自动驾驶系统中的应用分析

产业智能官

18+阅读 · 2018年11月22日

从Seq2seq到Attention模型到Self Attention（一）

从Seq2seq到Attention模型到Self Attention（一）

量化投资与机器学习

76+阅读 · 2018年10月8日

基于模型的系统工程——自动驾驶汽车（20180928更新）

基于模型的系统工程——自动驾驶汽车（20180928更新）

UMLChina

20+阅读 · 2018年9月28日

【浅析】自动驾驶汽车传感器融合系统及多传感器数据融合算法浅析

【浅析】自动驾驶汽车传感器融合系统及多传感器数据融合算法浅析

中国自动化学会

15+阅读 · 2018年7月5日

相关论文

ActWorld: From Explorable to Interactive World Model via Action-Aware Memory

Arxiv

0+阅读 · 6月16日

DriveJudge: Rethinking Autonomous Driving Evaluation with Vision-Language Models

Arxiv

0+阅读 · 6月15日

DRIVESPATIAL: A Benchmark for Spatiotemporal Intelligence in VLMs for Autonomous Driving

Arxiv

0+阅读 · 6月15日

CoIRL-AD: Collaborative-Competitive Imitation-Reinforcement Learning in Latent World Models for Autonomous Driving

Arxiv

0+阅读 · 6月15日

EvoMemBench: Benchmarking Agent Memory from a Self-Evolving Perspective

Arxiv

0+阅读 · 6月15日

DriveReward: A Comprehensive Dataset and Generative Vision-Language Reward Model for Autonomous Driving

Arxiv

0+阅读 · 6月14日

CausalDrive: Real-time Causal World Models for Autonomous Driving

Arxiv

0+阅读 · 6月13日

Self-Supervised Relevance Modelling in Autonomous Driving via Counterfactual Analysis

Arxiv

0+阅读 · 6月9日

ScenicRules: An Autonomous Driving Benchmark with Multi-Objective Specifications and Abstract Scenarios

Arxiv

0+阅读 · 6月4日

Simulation Distillation: Pretraining World Models in Simulation for Rapid Real-World Adaptation

Arxiv

0+阅读 · 5月12日

相关基金

无人驾驶中4D场景实时解析算法研究

国家自然科学基金

12+阅读 · 2017年12月31日

面向逆反射体检测的特征显著性研究

国家自然科学基金

0+阅读 · 2015年12月31日

心理与教育测量中项目反应时间数据的统计建模及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

混合交通环境中自动驾驶汽车安全可达性分析与优化控制研究

国家自然科学基金

1+阅读 · 2015年12月31日

无人驾驶车辆智能测试评估与环境设计

国家自然科学基金

28+阅读 · 2014年12月31日

核反应动力学高效数值模拟软件集成开发与应用

国家自然科学基金

1+阅读 · 2014年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

老年驾驶人风险感知及临界反应能力研究

国家自然科学基金

0+阅读 · 2014年12月31日

混入自动驾驶汽车的高速公路交通流微观建模与仿真方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

数据和模型混合驱动的虚拟人群行为仿真技术研究及其在军事中的应用

国家自然科学基金

10+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员