Req2Road：面向软件定义汽车测试工件生成与车载执行的生成式人工智能流水线 (Req2Road: A GenAI Pipeline for SDV Test Artifact Generation and On-Vehicle Execution) - 专知论文

会员服务 ·

0

软件 · 汽车 · 系统 · 子系统 · 映射 ·

Req2Road: A GenAI Pipeline for SDV Test Artifact Generation and On-Vehicle Execution

翻译：Req2Road：面向软件定义汽车测试工件生成与车载执行的生成式人工智能流水线

Denesa Zyberaj,Lukasz Mazur,Pascal Hirmer,Nenad Petrovic,Marco Aiello,Alois Knoll

from arxiv, accepted at CAiSE 2026 main

Testing functionality in Software-Defined Vehicles is challenging because requirements are written in natural language, specifications combine text, tables, and diagrams, while test assets are scattered across heterogeneous toolchains. Large Language Models and Vision-Language Models are used to extract signals and behavioral logic to automatically generate Gherkin scenarios, which are then converted into runnable test scripts. The Vehicle Signal Specification (VSS) integration standardizes signal references, supporting portability across subsystems and test benches. The pipeline uses retrieval-augmented generation to preselect candidate VSS signals before mapping. We evaluate the approach on the safety-relevant Child Presence Detection System, executing the generated tests in a virtual environment and on an actual vehicle. Our evaluation covers Gherkin validity, VSS mapping quality, and end-to-end executability. Results show that 32 of 36 requirements (89\%) can be transformed into executable scenarios in our setting, while human review and targeted substitutions remain necessary. This paper is a feasibility and architectural demonstration of an end-to-end requirements-to-test pipeline for SDV subsystems, evaluated on a CPDS case in simulation and Vehicle-in-the-Loop settings.

翻译：软件定义汽车的功能测试具有挑战性，因为需求以自然语言编写，规范结合了文本、表格和图表，而测试资产分散在异构的工具链中。本研究利用大型语言模型和视觉语言模型提取信号与行为逻辑，自动生成Gherkin场景，并将其转换为可运行的测试脚本。车辆信号规范（VSS）集成通过标准化信号引用，支持跨子系统与测试台的移植性。该流水线采用检索增强生成技术，在映射前预选候选VSS信号。我们在安全相关的儿童存在检测系统上评估该方法，在虚拟环境和实车上执行生成的测试。评估涵盖Gherkin有效性、VSS映射质量和端到端可执行性。结果表明，在我们的设定中，36项需求中有32项（89%）可转化为可执行场景，但仍需人工审查与针对性替换。本文通过仿真和车辆在环环境中的CPDS案例，论证了面向SDV子系统的端到端需求至测试流水线的可行性与架构设计。

0

相关内容

软件（中国大陆及香港用语，台湾作软体，英文：Software）是一系列按照特定顺序组织的计算机数据和指令的集合。一般来讲软件被划分为编程语言、系统软件、应用软件和介于这两者之间的中间件。软件就是程序加文档的集合体。

用于单元测试生成的大型语言模型：成果、挑战与未来方向

用于单元测试生成的大型语言模型：成果、挑战与未来方向

专知会员服务

17+阅读 · 2025年11月27日

用于自动驾驶系统测试的生成式人工智能：综述

用于自动驾驶系统测试的生成式人工智能：综述

专知会员服务

17+阅读 · 2025年8月28日

【新书】使用生成式人工智能进行软件测试

【新书】使用生成式人工智能进行软件测试

专知会员服务

44+阅读 · 2025年1月6日

大语言模型对汽车行业的影响和实践探索

大语言模型对汽车行业的影响和实践探索

专知会员服务

24+阅读 · 2024年4月27日

生成式AI如何用于交通？清华最新《生成式智能交通》综述，详述生成式AI在交通感知、交通预测、交通仿真和交通决策制定的作用

生成式AI如何用于交通？清华最新《生成式智能交通》综述，详述生成式AI在交通感知、交通预测、交通仿真和交通决策制定的作用

专知会员服务

57+阅读 · 2023年12月17日

最新！《智能网联汽车自动驾驶功能道路试验方法及要求》国家标准意见稿

最新！《智能网联汽车自动驾驶功能道路试验方法及要求》国家标准意见稿

专知会员服务

20+阅读 · 2022年8月9日

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

《智能制造机器视觉在线检测测试方法》国家标准意见稿

《智能制造机器视觉在线检测测试方法》国家标准意见稿

专知会员服务

64+阅读 · 2022年2月22日

自动驾驶软件测试技术研究综述

自动驾驶软件测试技术研究综述

专知会员服务

61+阅读 · 2021年2月19日

自动驾驶智能系统测试研究综述

专知会员服务

98+阅读 · 2021年1月24日

《智能制造机器视觉在线检测测试方法》国家标准意见稿

《智能制造机器视觉在线检测测试方法》国家标准意见稿

专知

13+阅读 · 2022年2月22日

【智能制造】汽车整车制造工厂智能制造系统解决方案

【智能制造】汽车整车制造工厂智能制造系统解决方案

产业智能官

19+阅读 · 2019年6月13日

无人驾驶仿真软件

无人驾驶仿真软件

智能交通技术

22+阅读 · 2019年5月9日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

自动驾驶汽车技术路线简介

自动驾驶汽车技术路线简介

智能交通技术

15+阅读 · 2019年4月25日

【人工智能】【智能驾驶】人工智能在汽车自动驾驶系统中的应用分析

【人工智能】【智能驾驶】人工智能在汽车自动驾驶系统中的应用分析

产业智能官

18+阅读 · 2018年11月22日

基于模型的系统工程——自动驾驶汽车（20180928更新）

基于模型的系统工程——自动驾驶汽车（20180928更新）

UMLChina

20+阅读 · 2018年9月28日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

车辆目标检测

车辆目标检测

数据挖掘入门与实战

30+阅读 · 2018年3月30日

面向车联网海量高速移动终端的高效信道信息获取机制

国家自然科学基金

0+阅读 · 2017年12月31日

面向传感网的软件定义测量技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向用户体验的无线异构软件定义网络资源管理研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向Bug报告的软件故障重现方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向智能交通的车联网时空数据流异常分析研究

国家自然科学基金

7+阅读 · 2015年12月31日

软件定义的VANET动态QoS路由及流表更新机制研究

国家自然科学基金

1+阅读 · 2015年12月31日

无人驾驶车辆智能测试评估与环境设计

国家自然科学基金

28+阅读 · 2014年12月31日

面向全生命周期的可信软件测度模型和过程改进工具研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于构件的可信软件构造及其行为动态可信测评

国家自然科学基金

1+阅读 · 2014年12月31日

混入自动驾驶汽车的高速公路交通流微观建模与仿真方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

SPARC: Scenario Planning and Reasoning for Automated C Unit Test Generation

SPARC: Scenario Planning and Reasoning for Automated C Unit Test Generation

Arxiv

0+阅读 · 2月18日

FuncDroid: Towards Inter-Functional Flows for Comprehensive Mobile App GUI Testing

Arxiv

0+阅读 · 2月13日

HerAgent: Rethinking the Automated Environment Deployment via Hierarchical Test Pyramid

Arxiv

0+阅读 · 2月13日

PALM: Path-aware LLM-based Test Generation with Comprehension

Arxiv

0+阅读 · 2月11日

HerAgent: Rethinking the Automated Environment Deployment via Hierarchical Test Pyramid

Arxiv

0+阅读 · 2月8日

SWE-Dev: Evaluating and Training Autonomous Feature-Driven Software Development

Arxiv

0+阅读 · 2月6日

ROMAN: Reward-Orchestrated Multi-Head Attention Network for Autonomous Driving System Testing

Arxiv

0+阅读 · 2月5日

Auto-Comp: An Automated Pipeline for Scalable Compositional Probing of Contrastive Vision-Language Models

Arxiv

0+阅读 · 2月2日

TestWeaver: Execution-aware, Feedback-driven Regression Testing Generation with Large Language Models

Arxiv

0+阅读 · 1月27日

AutoDriDM: An Explainable Benchmark for Decision-Making of Vision-Language Models in Autonomous Driving

Arxiv

0+阅读 · 1月21日

VIP会员

文章信息

相关主题

相关VIP内容

用于单元测试生成的大型语言模型：成果、挑战与未来方向

用于单元测试生成的大型语言模型：成果、挑战与未来方向

专知会员服务

17+阅读 · 2025年11月27日

用于自动驾驶系统测试的生成式人工智能：综述

用于自动驾驶系统测试的生成式人工智能：综述

专知会员服务

17+阅读 · 2025年8月28日

【新书】使用生成式人工智能进行软件测试

【新书】使用生成式人工智能进行软件测试

专知会员服务

44+阅读 · 2025年1月6日

大语言模型对汽车行业的影响和实践探索

大语言模型对汽车行业的影响和实践探索

专知会员服务

24+阅读 · 2024年4月27日

生成式AI如何用于交通？清华最新《生成式智能交通》综述，详述生成式AI在交通感知、交通预测、交通仿真和交通决策制定的作用

生成式AI如何用于交通？清华最新《生成式智能交通》综述，详述生成式AI在交通感知、交通预测、交通仿真和交通决策制定的作用

专知会员服务

57+阅读 · 2023年12月17日

最新！《智能网联汽车自动驾驶功能道路试验方法及要求》国家标准意见稿

最新！《智能网联汽车自动驾驶功能道路试验方法及要求》国家标准意见稿

专知会员服务

20+阅读 · 2022年8月9日

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

《智能制造机器视觉在线检测测试方法》国家标准意见稿

《智能制造机器视觉在线检测测试方法》国家标准意见稿

专知会员服务

64+阅读 · 2022年2月22日

自动驾驶软件测试技术研究综述

自动驾驶软件测试技术研究综述

专知会员服务

61+阅读 · 2021年2月19日

自动驾驶智能系统测试研究综述

专知会员服务

98+阅读 · 2021年1月24日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

《智能制造机器视觉在线检测测试方法》国家标准意见稿

《智能制造机器视觉在线检测测试方法》国家标准意见稿

专知

13+阅读 · 2022年2月22日

【智能制造】汽车整车制造工厂智能制造系统解决方案

【智能制造】汽车整车制造工厂智能制造系统解决方案

产业智能官

19+阅读 · 2019年6月13日

无人驾驶仿真软件

无人驾驶仿真软件

智能交通技术

22+阅读 · 2019年5月9日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

自动驾驶汽车技术路线简介

自动驾驶汽车技术路线简介

智能交通技术

15+阅读 · 2019年4月25日

【人工智能】【智能驾驶】人工智能在汽车自动驾驶系统中的应用分析

【人工智能】【智能驾驶】人工智能在汽车自动驾驶系统中的应用分析

产业智能官

18+阅读 · 2018年11月22日

基于模型的系统工程——自动驾驶汽车（20180928更新）

基于模型的系统工程——自动驾驶汽车（20180928更新）

UMLChina

20+阅读 · 2018年9月28日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

车辆目标检测

车辆目标检测

数据挖掘入门与实战

30+阅读 · 2018年3月30日

相关论文

SPARC: Scenario Planning and Reasoning for Automated C Unit Test Generation

SPARC: Scenario Planning and Reasoning for Automated C Unit Test Generation

Arxiv

0+阅读 · 2月18日

FuncDroid: Towards Inter-Functional Flows for Comprehensive Mobile App GUI Testing

Arxiv

0+阅读 · 2月13日

HerAgent: Rethinking the Automated Environment Deployment via Hierarchical Test Pyramid

Arxiv

0+阅读 · 2月13日

PALM: Path-aware LLM-based Test Generation with Comprehension

Arxiv

0+阅读 · 2月11日

HerAgent: Rethinking the Automated Environment Deployment via Hierarchical Test Pyramid

Arxiv

0+阅读 · 2月8日

SWE-Dev: Evaluating and Training Autonomous Feature-Driven Software Development

Arxiv

0+阅读 · 2月6日

ROMAN: Reward-Orchestrated Multi-Head Attention Network for Autonomous Driving System Testing

Arxiv

0+阅读 · 2月5日

Auto-Comp: An Automated Pipeline for Scalable Compositional Probing of Contrastive Vision-Language Models

Arxiv

0+阅读 · 2月2日

TestWeaver: Execution-aware, Feedback-driven Regression Testing Generation with Large Language Models

Arxiv

0+阅读 · 1月27日

AutoDriDM: An Explainable Benchmark for Decision-Making of Vision-Language Models in Autonomous Driving

Arxiv

0+阅读 · 1月21日

相关基金

面向车联网海量高速移动终端的高效信道信息获取机制

国家自然科学基金

0+阅读 · 2017年12月31日

面向传感网的软件定义测量技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向用户体验的无线异构软件定义网络资源管理研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向Bug报告的软件故障重现方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向智能交通的车联网时空数据流异常分析研究

国家自然科学基金

7+阅读 · 2015年12月31日

软件定义的VANET动态QoS路由及流表更新机制研究

国家自然科学基金

1+阅读 · 2015年12月31日

无人驾驶车辆智能测试评估与环境设计

国家自然科学基金

28+阅读 · 2014年12月31日

面向全生命周期的可信软件测度模型和过程改进工具研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于构件的可信软件构造及其行为动态可信测评

国家自然科学基金

1+阅读 · 2014年12月31日

混入自动驾驶汽车的高速公路交通流微观建模与仿真方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员