Automated parking is a challenging operational domain for advanced driver assistance systems, requiring robust scene understanding and interaction reasoning. The key challenge is twofold: (i) predict multiple plausible ego intentions according to context and (ii) for each intention, predict the joint responses of surrounding agents, enabling effective what-if decision-making. However, existing methods often fall short, typically treating these interdependent problems in isolation. We propose ParkDiffusion++, which jointly learns a multi-modal ego intention predictor and an ego-conditioned multi-agent joint trajectory predictor for automated parking. Our approach makes several key contributions. First, we introduce an ego intention tokenizer that predicts a small set of discrete endpoint intentions from agent histories and vectorized map polylines. Second, we perform ego-intention-conditioned joint prediction, yielding socially consistent predictions of the surrounding agents for each possible ego intention. Third, we employ a lightweight safety-guided denoiser with different constraints to refine joint scenes during training, thus improving accuracy and safety. Fourth, we propose counterfactual knowledge distillation, where an EMA teacher refined by a frozen safety-guided denoiser provides pseudo-targets that capture how agents react to alternative ego intentions. Extensive evaluations demonstrate that ParkDiffusion++ achieves state-of-the-art performance on the Dragon Lake Parking (DLP) dataset and the Intersections Drone (inD) dataset. Importantly, qualitative what-if visualizations show that other agents react appropriately to different ego intentions.


翻译:自动泊车是高级驾驶辅助系统面临的一个具有挑战性的运行领域,需要鲁棒的场景理解与交互推理。其核心挑战在于双重性:(i) 根据上下文预测多种合理的自车意图;(ii) 针对每种意图,预测周围智能体的联合响应,从而实现有效的假设性决策。然而,现有方法通常存在不足,往往将这两个相互依赖的问题孤立处理。我们提出了ParkDiffusion++,该方法联合学习一个多模态自车意图预测器和一个自车条件化的多智能体联合轨迹预测器,用于自动泊车。我们的方法做出了若干关键贡献。首先,我们引入了一个自车意图分词器,它从智能体历史轨迹和矢量化地图折线中预测一小组离散的终点意图。其次,我们执行自车意图条件化的联合预测,针对每个可能的自车意图,生成周围智能体在社交层面一致的预测轨迹。第三,我们采用一个轻量级的安全引导去噪器,该去噪器配备不同的约束条件,在训练过程中对联合场景进行细化,从而提升准确性与安全性。第四,我们提出了反事实知识蒸馏,其中由一个经冻结的安全引导去噪器优化的EMA教师模型提供伪目标,这些伪目标捕捉了智能体对不同自车替代意图的反应。广泛的评估表明,ParkDiffusion++在Dragon Lake Parking (DLP) 数据集和Intersections Drone (inD) 数据集上均达到了最先进的性能。重要的是,定性的假设性可视化结果表明,其他智能体能够针对不同的自车意图做出恰当的反应。

0
下载
关闭预览

相关内容

自动驾驶中的轨迹预测大型基础模型:全面综述
专知会员服务
16+阅读 · 2025年9月18日
自动驾驶中的基础模型:场景生成与场景分析综述
专知会员服务
28+阅读 · 2025年6月16日
自动驾驶产业链的现状与发展趋势
专知会员服务
47+阅读 · 2022年11月20日
【综述】交通流量预测,附15页论文下载
专知
23+阅读 · 2020年4月23日
自动驾驶高精度定位如何在复杂环境进行
智能交通技术
18+阅读 · 2019年9月27日
自动驾驶技术解读——自动驾驶汽车决策控制系统
智能交通技术
30+阅读 · 2019年7月7日
自动驾驶车辆定位技术概述|厚势汽车
厚势
10+阅读 · 2019年5月16日
自动驾驶汽车技术路线简介
智能交通技术
15+阅读 · 2019年4月25日
车路协同应用场景分析
智能交通技术
24+阅读 · 2019年4月13日
基于车路协同的群体智能协同
智能交通技术
10+阅读 · 2019年1月23日
自动泊车系统发展现状及前景分析 | 厚势
厚势
22+阅读 · 2018年1月22日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
最新内容
全球高超音速武器最新发展趋势
专知会员服务
0+阅读 · 16分钟前
人工智能在战场行动中的演进及伊朗案例
专知会员服务
7+阅读 · 4月18日
美AI公司Anthropic推出网络安全模型“Mythos”
专知会员服务
4+阅读 · 4月18日
【博士论文】面向城市环境的可解释计算机视觉
大语言模型的自改进机制:技术综述与未来展望
《第四代军事特种作战部队选拔与评估》
专知会员服务
3+阅读 · 4月18日
相关资讯
【综述】交通流量预测,附15页论文下载
专知
23+阅读 · 2020年4月23日
自动驾驶高精度定位如何在复杂环境进行
智能交通技术
18+阅读 · 2019年9月27日
自动驾驶技术解读——自动驾驶汽车决策控制系统
智能交通技术
30+阅读 · 2019年7月7日
自动驾驶车辆定位技术概述|厚势汽车
厚势
10+阅读 · 2019年5月16日
自动驾驶汽车技术路线简介
智能交通技术
15+阅读 · 2019年4月25日
车路协同应用场景分析
智能交通技术
24+阅读 · 2019年4月13日
基于车路协同的群体智能协同
智能交通技术
10+阅读 · 2019年1月23日
自动泊车系统发展现状及前景分析 | 厚势
厚势
22+阅读 · 2018年1月22日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员