Is Your Trajectory Displacement Safe in Long-tail? - 专知论文

会员服务 ·

0

包含 · 标注 · 数据集 · 饱和 · 设计 ·

Is Your Trajectory Displacement Safe in Long-tail?

翻译：长尾场景下的轨迹位移是否安全？

Qiao Sun,Weicheng Zheng,Yixin Huang,Hang Zhao

from arxiv, 20 pages, 15 figures

Long-tail scenarios remain a major bottleneck for autonomous driving evaluation, even as datasets grow by orders of magnitude. Existing evaluation pipelines are rarely human-aligned, safety-aware, verifiable, and explainable at the same time: closed-loop metrics often saturate among strong planners, while unstructured human ratings can be noisy without a carefully designed protocol. We formulate planning evaluation as additional-threat detection: given a planner trajectory and an expert reference, does the planner's displacement introduce new unsafe driving behavior? We propose FluidTest, an evaluation pipeline with three components: a pairwise WebUI protocol for reliable human annotation; a taxonomy of 32 semantic threats with evidence-grounded decision graphs; and a three-agent verification system with reflection for precision and auditability. Experiments on the WOD-E2E dataset show that FluidTest produces consistent labels among trained annotators and identifies additional threats in 65% of Poutine trajectories and 51% of RAP trajectories. These results show that state-of-the-art planners can still exhibit substantial safety-relevant failures despite high Rater Feedback Scores (RFS) and low Average Displacement Error (ADE). Additional details, guidance, and code are available at https://fluidtest.web.app.

翻译：长尾场景仍是自动驾驶评估的主要瓶颈，即便数据集规模呈数量级增长。现有评估流程难以同时实现与人类对齐、安全感知、可验证及可解释性：闭环指标在强规划器中往往趋于饱和，而缺乏精心设计协议的非结构化人类评分则可能引入噪声。我们将规划评估构建为额外威胁检测任务：给定规划器轨迹与专家参考轨迹，规划器的位移是否引入了新的不安全驾驶行为？为此提出FluidTest评估流程，包含三个组件：用于可靠人工标注的配对WebUI协议；包含32种语义威胁及证据驱动决策图的分类体系；以及具备反思机制的三智能体验证系统，确保精度与可审计性。在WOD-E2E数据集上的实验表明，FluidTest能在受过训练的标注者间产生一致性标签，并在65%的Poutine轨迹与51%的RAP轨迹中识别出额外威胁。这些结果表明，尽管最先进的规划器具有较高的Rater反馈评分（RFS）与较低的平均位移误差（ADE），其仍可能表现出显著的安全相关故障。更多细节、指南及代码请访问https://fluidtest.web.app。

0

相关内容

《美空军技术学院：自动驾驶系统中的决策支持问题》

《美空军技术学院：自动驾驶系统中的决策支持问题》

专知会员服务

11+阅读 · 4月8日

自动驾驶中的轨迹预测大型基础模型：全面综述

自动驾驶中的轨迹预测大型基础模型：全面综述

专知会员服务

16+阅读 · 2025年9月18日

自动驾驶中的基础模型：场景生成与场景分析综述

自动驾驶中的基础模型：场景生成与场景分析综述

专知会员服务

28+阅读 · 2025年6月16日

深度长尾学习研究综述

深度长尾学习研究综述

专知会员服务

29+阅读 · 2025年2月12日

非结构化环境中的自动驾驶：我们已走多远？

非结构化环境中的自动驾驶：我们已走多远？

专知会员服务

27+阅读 · 2024年10月13日

《长尾学习》最新2024年综述

《长尾学习》最新2024年综述

专知会员服务

31+阅读 · 2024年8月3日

万字长文 | 看看GPT-4V是怎么开车的，必须围观，大模型真的大有作为！！！

万字长文 | 看看GPT-4V是怎么开车的，必须围观，大模型真的大有作为！！！

专知会员服务

48+阅读 · 2023年11月21日

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

专知会员服务

22+阅读 · 2022年3月29日

【ICCV2021】自监督蒸馏的长尾视觉识别

专知会员服务

24+阅读 · 2021年9月16日

自动驾驶渐行渐近，卫惯导航大有可为

专知会员服务

39+阅读 · 2021年9月7日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

Long-Tailed Classification：长尾(不均衡)分布下的分类问题简介

Long-Tailed Classification：长尾(不均衡)分布下的分类问题简介

极市平台

11+阅读 · 2020年7月11日

自动驾驶高精度定位如何在复杂环境进行

自动驾驶高精度定位如何在复杂环境进行

智能交通技术

18+阅读 · 2019年9月27日

无人驾驶仿真软件

无人驾驶仿真软件

智能交通技术

22+阅读 · 2019年5月9日

SLAM的动态地图和语义问题

SLAM的动态地图和语义问题

计算机视觉life

24+阅读 · 2019年4月27日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

自动驾驶汽车技术路线简介

自动驾驶汽车技术路线简介

智能交通技术

15+阅读 · 2019年4月25日

全景分割任务介绍及其最新进展【附PPT与视频资料】

全景分割任务介绍及其最新进展【附PPT与视频资料】

人工智能前沿讲习班

11+阅读 · 2018年12月5日

基于计算机视觉的自动驾驶算法研究综述 | 厚势

基于计算机视觉的自动驾驶算法研究综述 | 厚势

厚势

10+阅读 · 2018年2月8日

无人驾驶中4D场景实时解析算法研究

国家自然科学基金

12+阅读 · 2017年12月31日

云计算平台中大规模交互式服务长尾延迟消减关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多源证据的繁忙水域交管雷达异常目标识别方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

长寿命空间机械臂在轨故障诊断、容错和预测策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

混合交通环境中自动驾驶汽车安全可达性分析与优化控制研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向长尾现象的数据缓存技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

未知环境中移动机器人探索式路径规划方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于排队模型的动态车辆路径问题实时优化策略及算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

驾驶行为与交通安全状态交互作用机理研究

国家自然科学基金

2+阅读 · 2014年12月31日

老年驾驶人风险感知及临界反应能力研究

国家自然科学基金

0+阅读 · 2014年12月31日

AlignDrive: Aligned Lateral-Longitudinal Planning for End-to-End Autonomous Driving

Arxiv

0+阅读 · 6月16日

RealityBridge: Bridging Editable 3D Gaussian Splatting Driving Simulations and Real-World Videos

Arxiv

0+阅读 · 6月15日

Models That Know How Evaluations Are Designed Score Safer

Arxiv

0+阅读 · 6月12日

Synthetic-to-Real Pipeline for Safe Landing Zone Detection

Arxiv

0+阅读 · 6月9日

Uncertainty-Aware Motion Planning for Autonomous Driving in Mixed Traffic Environment

Arxiv

0+阅读 · 6月8日

One Adaptive Trailing Head Can Outperform Many Oblivious Trailing Heads

Arxiv

0+阅读 · 5月28日

From Head to Tail: Asymmetric Knowledge Transfer in Long-tail Recommendation with Generative Semantic IDs

Arxiv

0+阅读 · 5月22日

Differentiable Model Predictive Safety for Heterogeneous Mobility at Urban Intersections

Arxiv

0+阅读 · 5月19日

CLOVER: Closed-Loop Value Estimation \& Ranking for End-to-End Autonomous Driving Planning

Arxiv

0+阅读 · 5月14日

Beyond Long Tail POIs: Transition-Centered Generalization for Human Mobility Prediction

Arxiv

0+阅读 · 5月7日

VIP会员

文章信息

相关主题

最新内容

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

5+阅读 · 今天8:00

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

3+阅读 · 今天7:44

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

3+阅读 · 今天7:28

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

4+阅读 · 今天7:18

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

5+阅读 · 今天7:07

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

4+阅读 · 今天7:03

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

4+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

5+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

10+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

4+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

5+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

8+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

7+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

4+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

相关VIP内容

《美空军技术学院：自动驾驶系统中的决策支持问题》

《美空军技术学院：自动驾驶系统中的决策支持问题》

专知会员服务

11+阅读 · 4月8日

自动驾驶中的轨迹预测大型基础模型：全面综述

自动驾驶中的轨迹预测大型基础模型：全面综述

专知会员服务

16+阅读 · 2025年9月18日

自动驾驶中的基础模型：场景生成与场景分析综述

自动驾驶中的基础模型：场景生成与场景分析综述

专知会员服务

28+阅读 · 2025年6月16日

深度长尾学习研究综述

深度长尾学习研究综述

专知会员服务

29+阅读 · 2025年2月12日

非结构化环境中的自动驾驶：我们已走多远？

非结构化环境中的自动驾驶：我们已走多远？

专知会员服务

27+阅读 · 2024年10月13日

《长尾学习》最新2024年综述

《长尾学习》最新2024年综述

专知会员服务

31+阅读 · 2024年8月3日

万字长文 | 看看GPT-4V是怎么开车的，必须围观，大模型真的大有作为！！！

万字长文 | 看看GPT-4V是怎么开车的，必须围观，大模型真的大有作为！！！

专知会员服务

48+阅读 · 2023年11月21日

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

专知会员服务

22+阅读 · 2022年3月29日

【ICCV2021】自监督蒸馏的长尾视觉识别

专知会员服务

24+阅读 · 2021年9月16日

自动驾驶渐行渐近，卫惯导航大有可为

专知会员服务

39+阅读 · 2021年9月7日

热门VIP内容

开通专知VIP会员享更多权益服务

重新思考无人机时代的生存能力

在人工智能加速决策环境中拓展OODA循环

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

装甲突击旅：现代战争思考、战斗与组织

相关资讯

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

Long-Tailed Classification：长尾(不均衡)分布下的分类问题简介

Long-Tailed Classification：长尾(不均衡)分布下的分类问题简介

极市平台

11+阅读 · 2020年7月11日

自动驾驶高精度定位如何在复杂环境进行

自动驾驶高精度定位如何在复杂环境进行

智能交通技术

18+阅读 · 2019年9月27日

无人驾驶仿真软件

无人驾驶仿真软件

智能交通技术

22+阅读 · 2019年5月9日

SLAM的动态地图和语义问题

SLAM的动态地图和语义问题

计算机视觉life

24+阅读 · 2019年4月27日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

自动驾驶汽车技术路线简介

自动驾驶汽车技术路线简介

智能交通技术

15+阅读 · 2019年4月25日

全景分割任务介绍及其最新进展【附PPT与视频资料】

全景分割任务介绍及其最新进展【附PPT与视频资料】

人工智能前沿讲习班

11+阅读 · 2018年12月5日

基于计算机视觉的自动驾驶算法研究综述 | 厚势

基于计算机视觉的自动驾驶算法研究综述 | 厚势

厚势

10+阅读 · 2018年2月8日

相关论文

AlignDrive: Aligned Lateral-Longitudinal Planning for End-to-End Autonomous Driving

Arxiv

0+阅读 · 6月16日

RealityBridge: Bridging Editable 3D Gaussian Splatting Driving Simulations and Real-World Videos

Arxiv

0+阅读 · 6月15日

Models That Know How Evaluations Are Designed Score Safer

Arxiv

0+阅读 · 6月12日

Synthetic-to-Real Pipeline for Safe Landing Zone Detection

Arxiv

0+阅读 · 6月9日

Uncertainty-Aware Motion Planning for Autonomous Driving in Mixed Traffic Environment

Arxiv

0+阅读 · 6月8日

One Adaptive Trailing Head Can Outperform Many Oblivious Trailing Heads

Arxiv

0+阅读 · 5月28日

From Head to Tail: Asymmetric Knowledge Transfer in Long-tail Recommendation with Generative Semantic IDs

Arxiv

0+阅读 · 5月22日

Differentiable Model Predictive Safety for Heterogeneous Mobility at Urban Intersections

Arxiv

0+阅读 · 5月19日

CLOVER: Closed-Loop Value Estimation \& Ranking for End-to-End Autonomous Driving Planning

Arxiv

0+阅读 · 5月14日

Beyond Long Tail POIs: Transition-Centered Generalization for Human Mobility Prediction

Arxiv

0+阅读 · 5月7日

相关基金

无人驾驶中4D场景实时解析算法研究

国家自然科学基金

12+阅读 · 2017年12月31日

云计算平台中大规模交互式服务长尾延迟消减关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多源证据的繁忙水域交管雷达异常目标识别方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

长寿命空间机械臂在轨故障诊断、容错和预测策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

混合交通环境中自动驾驶汽车安全可达性分析与优化控制研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向长尾现象的数据缓存技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

未知环境中移动机器人探索式路径规划方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于排队模型的动态车辆路径问题实时优化策略及算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

驾驶行为与交通安全状态交互作用机理研究

国家自然科学基金

2+阅读 · 2014年12月31日

老年驾驶人风险感知及临界反应能力研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员