When Digital Twins Meet Large Language Models: Realistic, Interactive, and Editable Simulation for Autonomous Driving - 专知论文

会员服务 ·

0

自动驾驶 · 语言模型 · 数字孪生 · 交互 · 大语言模型 ·

When Digital Twins Meet Large Language Models: Realistic, Interactive, and Editable Simulation for Autonomous Driving

翻译：当数字孪生遇见大语言模型：面向自动驾驶的逼真、交互式与可编辑仿真

Tanmay Vilas Samak,Chinmay Vilas Samak,Bing Li,Venkat Krovi

from arxiv, Accepted in IEEE Robotics & Automation Magazine (RAM)

Simulation frameworks have been key enablers for the development and validation of autonomous driving systems. However, existing methods struggle to comprehensively address the autonomy-oriented requirements of balancing: (i) dynamical fidelity, (ii) photorealistic rendering, (iii) context-relevant scenario orchestration, and (iv) real-time performance. To address these limitations, we present a unified framework for creating and curating high-fidelity digital twins to accelerate advancements in autonomous driving research. Our framework leverages a mix of physics-based and data-driven techniques for developing and simulating digital twins of autonomous vehicles and their operating environments. It is capable of reconstructing real-world scenes and assets with geometric and photorealistic accuracy (~97% structural similarity) and infusing them with physical properties to enable real-time (>60 Hz) dynamical simulation of the ensuing driving scenarios. Additionally, it incorporates a large language model (LLM) interface to flexibly edit the driving scenarios online via natural language prompts, with ~85% generalizability and ~95% repeatability. Finally, an optional vision language model (VLM) provides ~80% visual enhancement by blending the hybrid scene composition.

翻译：仿真框架一直是自动驾驶系统开发与验证的关键使能技术。然而，现有方法难以全面满足自动驾驶导向的需求，这些需求需要在以下方面取得平衡：(i) 动力学保真度，(ii) 照片级真实感渲染，(iii) 上下文相关的场景编排，以及 (iv) 实时性能。为应对这些局限性，我们提出了一个用于创建与管理高保真数字孪生的统一框架，以加速自动驾驶研究的进展。我们的框架综合利用基于物理和数据驱动的方法，来开发与仿真自动驾驶车辆及其运行环境的数字孪生。它能够以几何与视觉上的逼真度（结构相似度约97%）重建真实世界的场景与资产，并为其注入物理属性，从而实现对后续驾驶场景的实时（>60 Hz）动力学仿真。此外，该框架集成了一个大语言模型接口，可通过自然语言指令在线灵活地编辑驾驶场景，其泛化能力约达85%，可重复性约达95%。最后，一个可选的视觉语言模型通过融合混合场景构图，提供了约80%的视觉增强效果。

0

相关内容

自动驾驶

自动驾驶汽车，又称为无人驾驶汽车、电脑驾驶汽车或轮式移动机器人，是自动化载具的一种，具有传统汽车的运输能力。作为自动化载具，自动驾驶汽车不需要人为操作即能感测其环境及导航。完全的自动驾驶汽车仍未全面商用化，大多数均为原型机及展示系统，部分可靠技术才下放至商用车型，但有关于自驾车逐渐成为现实，已经引起了很多有关于道德的讨论。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

自动驾驶中的基础模型：场景生成与场景分析综述

自动驾驶中的基础模型：场景生成与场景分析综述

专知会员服务

28+阅读 · 2025年6月16日

大语言模型在多智能体自动驾驶系统中的应用：近期进展综述

大语言模型在多智能体自动驾驶系统中的应用：近期进展综述

专知会员服务

29+阅读 · 2025年2月25日

自动驾驶的世界模型综述

自动驾驶的世界模型综述

专知会员服务

45+阅读 · 2025年1月22日

【伯克利博士论文】高效的自动驾驶3D视觉，108页pdf

【伯克利博士论文】高效的自动驾驶3D视觉，108页pdf

专知会员服务

24+阅读 · 2024年9月1日

《数据驱动的自动驾驶》最新综述，详述大数据系统、数据挖掘和闭环技术

《数据驱动的自动驾驶》最新综述，详述大数据系统、数据挖掘和闭环技术

专知会员服务

35+阅读 · 2024年1月28日

大模型+自动驾驶？华为等最新《为自动驾驶打造视觉基础模型》综述，涵盖250篇文献详述其挑战、方法论和机遇

大模型+自动驾驶？华为等最新《为自动驾驶打造视觉基础模型》综述，涵盖250篇文献详述其挑战、方法论和机遇

专知会员服务

51+阅读 · 2024年1月23日

大模型用于制造业？东北大学等《大型语言模型智能制造业应用》综述，详述大模型制造业技术路线图

大模型用于制造业？东北大学等《大型语言模型智能制造业应用》综述，详述大模型制造业技术路线图

专知会员服务

102+阅读 · 2023年12月13日

大模型+自动驾驶=？普渡大学等最新《自动驾驶领域多模态大型语言模型》综述

大模型+自动驾驶=？普渡大学等最新《自动驾驶领域多模态大型语言模型》综述

专知会员服务

76+阅读 · 2023年11月27日

博士论文《用于自动驾驶虚拟测试的雷达模拟验证方法》2023最新135页，斯图加特大学

博士论文《用于自动驾驶虚拟测试的雷达模拟验证方法》2023最新135页，斯图加特大学

专知会员服务

24+阅读 · 2023年3月22日

强化学习与模仿学习的自动驾驶，CMU-Xinshuo Weng博士生，57页ppt

强化学习与模仿学习的自动驾驶，CMU-Xinshuo Weng博士生，57页ppt

专知会员服务

34+阅读 · 2022年5月6日

【数字孪生】面向智能制造的数字孪生

【数字孪生】面向智能制造的数字孪生

产业智能官

52+阅读 · 2020年5月10日

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

专知

14+阅读 · 2019年10月9日

自动驾驶技术解读——自动驾驶汽车决策控制系统

自动驾驶技术解读——自动驾驶汽车决策控制系统

智能交通技术

30+阅读 · 2019年7月7日

无人驾驶仿真软件

无人驾驶仿真软件

智能交通技术

22+阅读 · 2019年5月9日

自动驾驶仿真软件列表

自动驾驶仿真软件列表

智能交通技术

13+阅读 · 2019年5月9日

自动驾驶汽车技术路线简介

自动驾驶汽车技术路线简介

智能交通技术

15+阅读 · 2019年4月25日

【数字孪生】超棒PPT解读Digital Twin十大领域应用！

【数字孪生】超棒PPT解读Digital Twin十大领域应用！

产业智能官

103+阅读 · 2019年3月26日

基于模型的系统工程——自动驾驶汽车（20180928更新）

基于模型的系统工程——自动驾驶汽车（20180928更新）

UMLChina

20+阅读 · 2018年9月28日

基于计算机视觉的自动驾驶算法研究综述 | 厚势

基于计算机视觉的自动驾驶算法研究综述 | 厚势

厚势

10+阅读 · 2018年2月8日

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

机器人圈

35+阅读 · 2017年7月18日

无人驾驶中4D场景实时解析算法研究

国家自然科学基金

12+阅读 · 2017年12月31日

面向车联网的交通网络涌现行为建模

国家自然科学基金

8+阅读 · 2015年12月31日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

多船协同环境下船舶交通流建模及仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

混合交通环境中自动驾驶汽车安全可达性分析与优化控制研究

国家自然科学基金

1+阅读 · 2015年12月31日

无人驾驶车辆智能测试评估与环境设计

国家自然科学基金

28+阅读 · 2014年12月31日

城市群空间交互情景分析与多尺度协同模拟

国家自然科学基金

0+阅读 · 2014年12月31日

混入自动驾驶汽车的高速公路交通流微观建模与仿真方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

数据和模型混合驱动的虚拟人群行为仿真技术研究及其在军事中的应用

国家自然科学基金

10+阅读 · 2011年12月31日

From Seeing to Simulating: Generative High-Fidelity Simulation with Digital Cousins for Generalizable Robot Learning and Evaluation

Arxiv

0+阅读 · 4月17日

Generative Models and Connected and Automated Vehicles: A Survey in Exploring the Intersection of Transportation and AI

Arxiv

0+阅读 · 4月16日

Beyond Conservative Automated Driving in Multi-Agent Scenarios via Coupled Model Predictive Control and Deep Reinforcement Learning

Arxiv

0+阅读 · 4月15日

Artificial Intelligence for Modeling and Simulation of Mixed Automated and Human Traffic

Arxiv

0+阅读 · 4月14日

Bridging the Gap between Micro-scale Traffic Simulation and 4D Digital Cityscapes

Arxiv

0+阅读 · 4月9日

Near-Field Integrated Sensing, Computing and Semantic Communication in Digital Twin-Assisted Vehicular Networks

Arxiv

0+阅读 · 4月7日

Steering through Time: Blending Longitudinal Data with Simulation to Rethink Human-Autonomous Vehicle Interaction

Arxiv

0+阅读 · 4月1日

LLM4AD: Large Language Models for Autonomous Driving -- Concept, Review, Benchmark, Experiments, and Future Trends

Arxiv

0+阅读 · 3月26日

Traffic Scene Generation from Natural Language Description for Autonomous Vehicles with Large Language Model

Arxiv

0+阅读 · 3月26日

Large Language Models Empowered Agent-based Modeling and Simulation: A Survey and Perspectives

Arxiv

26+阅读 · 2023年12月19日

VIP会员

文章信息

相关主题

大语言模型

最新内容

[ICML26] 破局长视频理解！快手推出统一框架实现视频定位与深度理解，多项基准测试性能全面提升

[ICML26] 破局长视频理解！快手推出统一框架实现视频定位与深度理解，多项基准测试性能全面提升

专知会员服务

1+阅读 · 5月24日

Claw AI Lab：从自动写论文到交互式AI研究实验室

Claw AI Lab：从自动写论文到交互式AI研究实验室

专知会员服务

1+阅读 · 5月24日

美军“沙赫德-136”自杀式无人机仿制型号将获得集群能力

美军“沙赫德-136”自杀式无人机仿制型号将获得集群能力

专知会员服务

8+阅读 · 5月24日

【ICML 2026】MotiMotion：用视觉推理增强运动可控视频生成

【ICML 2026】MotiMotion：用视觉推理增强运动可控视频生成

专知会员服务

4+阅读 · 5月23日

AI能预测科学突破吗？CUSP基准揭示前沿模型能力边界

AI能预测科学突破吗？CUSP基准揭示前沿模型能力边界

专知会员服务

5+阅读 · 5月23日

美以伊冲突中的无人机反防空作战

美以伊冲突中的无人机反防空作战

专知会员服务

7+阅读 · 5月23日

【ICML 2026】面向视野外操作的VLA空间记忆框架SOMA

【ICML 2026】面向视野外操作的VLA空间记忆框架SOMA

专知会员服务

5+阅读 · 5月22日

【综述】大语言模型驱动的多模态情感识别综述：挑战、分类与未来方向

【综述】大语言模型驱动的多模态情感识别综述：挑战、分类与未来方向

专知会员服务

6+阅读 · 5月22日

安杜里尔与Meta研发军用智能眼镜的内幕

安杜里尔与Meta研发军用智能眼镜的内幕

专知会员服务

7+阅读 · 5月22日

《GPS拒止环境中的网络化赋能目标锁定》总结报告

《GPS拒止环境中的网络化赋能目标锁定》总结报告

专知会员服务

8+阅读 · 5月22日

超越步调威胁：整合人工智能以加速指挥决策

超越步调威胁：整合人工智能以加速指挥决策

专知会员服务

12+阅读 · 5月22日

连接供应链与杀伤链：Palantir 保障与对抗性后勤解决方案

连接供应链与杀伤链：Palantir 保障与对抗性后勤解决方案

专知会员服务

8+阅读 · 5月22日

Nature三连发AI自主科学发现论文

Nature三连发AI自主科学发现论文

专知会员服务

9+阅读 · 5月21日

【综述】大型音频语言模型综述：泛化、可信与未来展望

【综述】大型音频语言模型综述：泛化、可信与未来展望

专知会员服务

9+阅读 · 5月21日

安杜里尔与人工智能驱动防务的崛起

安杜里尔与人工智能驱动防务的崛起

专知会员服务

14+阅读 · 5月21日

相关VIP内容

自动驾驶中的基础模型：场景生成与场景分析综述

自动驾驶中的基础模型：场景生成与场景分析综述

专知会员服务

28+阅读 · 2025年6月16日

大语言模型在多智能体自动驾驶系统中的应用：近期进展综述

大语言模型在多智能体自动驾驶系统中的应用：近期进展综述

专知会员服务

29+阅读 · 2025年2月25日

自动驾驶的世界模型综述

自动驾驶的世界模型综述

专知会员服务

45+阅读 · 2025年1月22日

【伯克利博士论文】高效的自动驾驶3D视觉，108页pdf

【伯克利博士论文】高效的自动驾驶3D视觉，108页pdf

专知会员服务

24+阅读 · 2024年9月1日

《数据驱动的自动驾驶》最新综述，详述大数据系统、数据挖掘和闭环技术

《数据驱动的自动驾驶》最新综述，详述大数据系统、数据挖掘和闭环技术

专知会员服务

35+阅读 · 2024年1月28日

大模型+自动驾驶？华为等最新《为自动驾驶打造视觉基础模型》综述，涵盖250篇文献详述其挑战、方法论和机遇

大模型+自动驾驶？华为等最新《为自动驾驶打造视觉基础模型》综述，涵盖250篇文献详述其挑战、方法论和机遇

专知会员服务

51+阅读 · 2024年1月23日

大模型用于制造业？东北大学等《大型语言模型智能制造业应用》综述，详述大模型制造业技术路线图

大模型用于制造业？东北大学等《大型语言模型智能制造业应用》综述，详述大模型制造业技术路线图

专知会员服务

102+阅读 · 2023年12月13日

大模型+自动驾驶=？普渡大学等最新《自动驾驶领域多模态大型语言模型》综述

大模型+自动驾驶=？普渡大学等最新《自动驾驶领域多模态大型语言模型》综述

专知会员服务

76+阅读 · 2023年11月27日

博士论文《用于自动驾驶虚拟测试的雷达模拟验证方法》2023最新135页，斯图加特大学

博士论文《用于自动驾驶虚拟测试的雷达模拟验证方法》2023最新135页，斯图加特大学

专知会员服务

24+阅读 · 2023年3月22日

强化学习与模仿学习的自动驾驶，CMU-Xinshuo Weng博士生，57页ppt

强化学习与模仿学习的自动驾驶，CMU-Xinshuo Weng博士生，57页ppt

专知会员服务

34+阅读 · 2022年5月6日

热门VIP内容

开通专知VIP会员享更多权益服务

Claw AI Lab：从自动写论文到交互式AI研究实验室

【ICML 2026】MotiMotion：用视觉推理增强运动可控视频生成

[ICML26] 破局长视频理解！快手推出统一框架实现视频定位与深度理解，多项基准测试性能全面提升

美军“沙赫德-136”自杀式无人机仿制型号将获得集群能力

相关资讯

【数字孪生】面向智能制造的数字孪生

【数字孪生】面向智能制造的数字孪生

产业智能官

52+阅读 · 2020年5月10日

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

专知

14+阅读 · 2019年10月9日

自动驾驶技术解读——自动驾驶汽车决策控制系统

自动驾驶技术解读——自动驾驶汽车决策控制系统

智能交通技术

30+阅读 · 2019年7月7日

无人驾驶仿真软件

无人驾驶仿真软件

智能交通技术

22+阅读 · 2019年5月9日

自动驾驶仿真软件列表

自动驾驶仿真软件列表

智能交通技术

13+阅读 · 2019年5月9日

自动驾驶汽车技术路线简介

自动驾驶汽车技术路线简介

智能交通技术

15+阅读 · 2019年4月25日

【数字孪生】超棒PPT解读Digital Twin十大领域应用！

【数字孪生】超棒PPT解读Digital Twin十大领域应用！

产业智能官

103+阅读 · 2019年3月26日

基于模型的系统工程——自动驾驶汽车（20180928更新）

基于模型的系统工程——自动驾驶汽车（20180928更新）

UMLChina

20+阅读 · 2018年9月28日

基于计算机视觉的自动驾驶算法研究综述 | 厚势

基于计算机视觉的自动驾驶算法研究综述 | 厚势

厚势

10+阅读 · 2018年2月8日

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

机器人圈

35+阅读 · 2017年7月18日

相关论文

From Seeing to Simulating: Generative High-Fidelity Simulation with Digital Cousins for Generalizable Robot Learning and Evaluation

Arxiv

0+阅读 · 4月17日

Generative Models and Connected and Automated Vehicles: A Survey in Exploring the Intersection of Transportation and AI

Arxiv

0+阅读 · 4月16日

Beyond Conservative Automated Driving in Multi-Agent Scenarios via Coupled Model Predictive Control and Deep Reinforcement Learning

Arxiv

0+阅读 · 4月15日

Artificial Intelligence for Modeling and Simulation of Mixed Automated and Human Traffic

Arxiv

0+阅读 · 4月14日

Bridging the Gap between Micro-scale Traffic Simulation and 4D Digital Cityscapes

Arxiv

0+阅读 · 4月9日

Near-Field Integrated Sensing, Computing and Semantic Communication in Digital Twin-Assisted Vehicular Networks

Arxiv

0+阅读 · 4月7日

Steering through Time: Blending Longitudinal Data with Simulation to Rethink Human-Autonomous Vehicle Interaction

Arxiv

0+阅读 · 4月1日

LLM4AD: Large Language Models for Autonomous Driving -- Concept, Review, Benchmark, Experiments, and Future Trends

Arxiv

0+阅读 · 3月26日

Traffic Scene Generation from Natural Language Description for Autonomous Vehicles with Large Language Model

Arxiv

0+阅读 · 3月26日

Large Language Models Empowered Agent-based Modeling and Simulation: A Survey and Perspectives

Arxiv

26+阅读 · 2023年12月19日

相关基金

无人驾驶中4D场景实时解析算法研究

国家自然科学基金

12+阅读 · 2017年12月31日

面向车联网的交通网络涌现行为建模

国家自然科学基金

8+阅读 · 2015年12月31日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

多船协同环境下船舶交通流建模及仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

混合交通环境中自动驾驶汽车安全可达性分析与优化控制研究

国家自然科学基金

1+阅读 · 2015年12月31日

无人驾驶车辆智能测试评估与环境设计

国家自然科学基金

28+阅读 · 2014年12月31日

城市群空间交互情景分析与多尺度协同模拟

国家自然科学基金

0+阅读 · 2014年12月31日

混入自动驾驶汽车的高速公路交通流微观建模与仿真方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

数据和模型混合驱动的虚拟人群行为仿真技术研究及其在军事中的应用

国家自然科学基金

10+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员