基于人机协作的情境自适应需求缺陷预测 (Context-Adaptive Requirements Defect Prediction through Human-LLM Collaboration) - 专知论文

会员服务 ·

0

自适应 · 协作 · 情境 · 缺陷预测 · 示例 ·

Context-Adaptive Requirements Defect Prediction through Human-LLM Collaboration

翻译：基于人机协作的情境自适应需求缺陷预测

Max Unterbusch,Andreas Vogelsang

from arxiv, Accepted at ICSE-NIER 2026

Automated requirements assessment traditionally relies on universal patterns as proxies for defectiveness, implemented through rule-based heuristics or machine learning classifiers trained on large annotated datasets. However, what constitutes a "defect" is inherently context-dependent and varies across projects, domains, and stakeholder interpretations. In this paper, we propose a Human-LLM Collaboration (HLC) approach that treats defect prediction as an adaptive process rather than a static classification task. HLC leverages LLM Chain-of-Thought reasoning in a feedback loop: users validate predictions alongside their explanations, and these validated examples adaptively guide future predictions through few-shot learning. We evaluate this approach using the weak word smell on the QuRE benchmark of 1,266 annotated Mercedes-Benz requirements. Our results show that HLC effectively adapts to the provision of validated examples, with rapid performance gains from as few as 20 validated examples. Incorporating validated explanations, not just labels, enables HLC to substantially outperform both standard few-shot prompting and fine-tuned BERT models while maintaining high recall. These results highlight how the in-context and Chain-of-Thought learning capabilities of LLMs enable adaptive classification approaches that move beyond one-size-fits-all models, creating opportunities for tools that learn continuously from stakeholder feedback.

翻译：自动化需求评估传统上依赖于通用模式作为缺陷的代理，通过基于规则的启发式方法或在大型标注数据集上训练的机器学习分类器实现。然而，"缺陷"的构成本质上是情境依赖的，会因项目、领域和利益相关者解释的不同而存在差异。本文提出一种人机协作方法，将缺陷预测视为自适应过程而非静态分类任务。该方法通过反馈循环利用大语言模型的思维链推理机制：用户验证预测结果及其解释说明，这些经过验证的示例通过小样本学习自适应地指导未来预测。我们在包含1,266条梅赛德斯-奔驰标注需求的QuRE基准上使用弱词异味进行评估。结果表明，该方法能有效适应已验证示例的输入，仅需20个验证示例即可实现性能快速提升。通过整合验证解释（而不仅是标签），该方法在保持高召回率的同时，显著优于标准小样本提示方法和微调BERT模型。这些发现揭示了大语言模型的上下文学习与思维链学习能力如何推动自适应分类方法超越通用模型，为持续从利益相关者反馈中学习的工具创造了发展机遇。

0

相关内容

自适应

《任务线索检测条件约束模型下运用人工智能实现战场感知、准备、建模与影响》

《任务线索检测条件约束模型下运用人工智能实现战场感知、准备、建模与影响》

专知会员服务

26+阅读 · 2月3日

《人机协作中的自适应任务规划与动态角色分配》最新30页报告

《人机协作中的自适应任务规划与动态角色分配》最新30页报告

专知会员服务

25+阅读 · 2025年11月21日

中文万字长文《灾难场景中支持决策的人机协作模式综述》

中文万字长文《灾难场景中支持决策的人机协作模式综述》

专知会员服务

20+阅读 · 2025年9月20日

【CMU博士论文】资源受限场景下探索语言结构预测，228页pdf

【CMU博士论文】资源受限场景下探索语言结构预测，228页pdf

专知会员服务

30+阅读 · 2023年9月3日

【CMU博士论文】在资源受限的情境下探索语言结构化预测, 228页pdf

【CMU博士论文】在资源受限的情境下探索语言结构化预测, 228页pdf

专知会员服务

25+阅读 · 2023年8月5日

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

专知会员服务

36+阅读 · 2023年7月22日

人机协作《评估影响信任校准的因素：信任战略和风险的影响》美空军21页报告

人机协作《评估影响信任校准的因素：信任战略和风险的影响》美空军21页报告

专知会员服务

31+阅读 · 2023年7月18日

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

专知会员服务

137+阅读 · 2023年7月10日

《人类与自动机器学习系统交互的角色和模式：综述与展望》98页长综述论文（2022），悉尼科技大学

《人类与自动机器学习系统交互的角色和模式：综述与展望》98页长综述论文（2022），悉尼科技大学

专知会员服务

64+阅读 · 2022年10月28日

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

专知会员服务

22+阅读 · 2022年3月29日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

90+阅读 · 2022年4月17日

【资源】领域自适应相关论文、代码分享

【资源】领域自适应相关论文、代码分享

专知

32+阅读 · 2019年10月12日

概述自动机器学习（AutoML）

概述自动机器学习（AutoML）

人工智能学家

19+阅读 · 2019年8月11日

领域自适应学习论文大列表

领域自适应学习论文大列表

专知

71+阅读 · 2019年3月2日

【机器视觉】人工智能检测设备实现手机外观缺陷全自动检测、基于人工智能的PCB表面瑕疵检测

【机器视觉】人工智能检测设备实现手机外观缺陷全自动检测、基于人工智能的PCB表面瑕疵检测

产业智能官

15+阅读 · 2019年2月1日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

自然语言处理中的语言模型预训练方法

自然语言处理中的语言模型预训练方法

PaperWeekly

14+阅读 · 2018年10月21日

【机器视觉】表面缺陷检测：机器视觉检测技术

【机器视觉】表面缺陷检测：机器视觉检测技术

产业智能官

25+阅读 · 2018年5月30日

CCCF专栏文章：人机共融智能

CCCF专栏文章：人机共融智能

中国计算机学会

15+阅读 · 2017年12月21日

基于机器学习的KPI自动化异常检测系统

基于机器学习的KPI自动化异常检测系统

运维帮

13+阅读 · 2017年8月16日

基于抽象语义切片和后向求精分析的静态分析警报自动确认研究

国家自然科学基金

1+阅读 · 2015年12月31日

故障机理的不确定传播及系统故障自动推演建模方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于WEB信息的信息错误自动检测与修复技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向主体行为网的自适应作战机理研究

国家自然科学基金

24+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

支持软件可信演化的故障定位研究

国家自然科学基金

0+阅读 · 2014年12月31日

供应商入侵下考虑成员风险规避行为的供应链决策与协调研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

Human-in-the-Loop Failure Recovery with Adaptive Task Allocation

Arxiv

0+阅读 · 2月3日

Compatibility of Missing Data Handling Methods across the Stages of Producing Clinical Prediction Models

Arxiv

0+阅读 · 2月3日

Estimating Trust in Human-Robot Collaboration through Behavioral Indicators and Explainability

Arxiv

0+阅读 · 1月27日

An Audit of Machine Learning Experiments on Software Defect Prediction

Arxiv

0+阅读 · 1月26日

Efficient Human-in-the-Loop Optimization via Priors Learned from User Models

Arxiv

0+阅读 · 1月25日

Past, Present, and Future of Bug Tracking in the Generative AI Era

Arxiv

0+阅读 · 1月23日

Adaptive Reinforcement and Model Predictive Control Switching for Safe Human-Robot Cooperative Navigation

Arxiv

0+阅读 · 1月23日

Stochastic Decision-Making Framework for Human-Robot Collaboration in Industrial Applications

Arxiv

0+阅读 · 1月21日

Human-AI Co-design for Clinical Prediction Models

Arxiv

0+阅读 · 1月14日

A Data-Driven Predictive Framework for Inventory Optimization Using Context-Augmented Machine Learning Models

Arxiv

0+阅读 · 1月8日

VIP会员

文章信息

相关主题

相关VIP内容

《任务线索检测条件约束模型下运用人工智能实现战场感知、准备、建模与影响》

《任务线索检测条件约束模型下运用人工智能实现战场感知、准备、建模与影响》

专知会员服务

26+阅读 · 2月3日

《人机协作中的自适应任务规划与动态角色分配》最新30页报告

《人机协作中的自适应任务规划与动态角色分配》最新30页报告

专知会员服务

25+阅读 · 2025年11月21日

中文万字长文《灾难场景中支持决策的人机协作模式综述》

中文万字长文《灾难场景中支持决策的人机协作模式综述》

专知会员服务

20+阅读 · 2025年9月20日

【CMU博士论文】资源受限场景下探索语言结构预测，228页pdf

【CMU博士论文】资源受限场景下探索语言结构预测，228页pdf

专知会员服务

30+阅读 · 2023年9月3日

【CMU博士论文】在资源受限的情境下探索语言结构化预测, 228页pdf

【CMU博士论文】在资源受限的情境下探索语言结构化预测, 228页pdf

专知会员服务

25+阅读 · 2023年8月5日

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

专知会员服务

36+阅读 · 2023年7月22日

人机协作《评估影响信任校准的因素：信任战略和风险的影响》美空军21页报告

人机协作《评估影响信任校准的因素：信任战略和风险的影响》美空军21页报告

专知会员服务

31+阅读 · 2023年7月18日

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

专知会员服务

137+阅读 · 2023年7月10日

《人类与自动机器学习系统交互的角色和模式：综述与展望》98页长综述论文（2022），悉尼科技大学

《人类与自动机器学习系统交互的角色和模式：综述与展望》98页长综述论文（2022），悉尼科技大学

专知会员服务

64+阅读 · 2022年10月28日

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

专知会员服务

22+阅读 · 2022年3月29日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

90+阅读 · 2022年4月17日

【资源】领域自适应相关论文、代码分享

【资源】领域自适应相关论文、代码分享

专知

32+阅读 · 2019年10月12日

概述自动机器学习（AutoML）

概述自动机器学习（AutoML）

人工智能学家

19+阅读 · 2019年8月11日

领域自适应学习论文大列表

领域自适应学习论文大列表

专知

71+阅读 · 2019年3月2日

【机器视觉】人工智能检测设备实现手机外观缺陷全自动检测、基于人工智能的PCB表面瑕疵检测

【机器视觉】人工智能检测设备实现手机外观缺陷全自动检测、基于人工智能的PCB表面瑕疵检测

产业智能官

15+阅读 · 2019年2月1日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

自然语言处理中的语言模型预训练方法

自然语言处理中的语言模型预训练方法

PaperWeekly

14+阅读 · 2018年10月21日

【机器视觉】表面缺陷检测：机器视觉检测技术

【机器视觉】表面缺陷检测：机器视觉检测技术

产业智能官

25+阅读 · 2018年5月30日

CCCF专栏文章：人机共融智能

CCCF专栏文章：人机共融智能

中国计算机学会

15+阅读 · 2017年12月21日

基于机器学习的KPI自动化异常检测系统

基于机器学习的KPI自动化异常检测系统

运维帮

13+阅读 · 2017年8月16日

相关论文

Human-in-the-Loop Failure Recovery with Adaptive Task Allocation

Arxiv

0+阅读 · 2月3日

Compatibility of Missing Data Handling Methods across the Stages of Producing Clinical Prediction Models

Arxiv

0+阅读 · 2月3日

Estimating Trust in Human-Robot Collaboration through Behavioral Indicators and Explainability

Arxiv

0+阅读 · 1月27日

An Audit of Machine Learning Experiments on Software Defect Prediction

Arxiv

0+阅读 · 1月26日

Efficient Human-in-the-Loop Optimization via Priors Learned from User Models

Arxiv

0+阅读 · 1月25日

Past, Present, and Future of Bug Tracking in the Generative AI Era

Arxiv

0+阅读 · 1月23日

Adaptive Reinforcement and Model Predictive Control Switching for Safe Human-Robot Cooperative Navigation

Arxiv

0+阅读 · 1月23日

Stochastic Decision-Making Framework for Human-Robot Collaboration in Industrial Applications

Arxiv

0+阅读 · 1月21日

Human-AI Co-design for Clinical Prediction Models

Arxiv

0+阅读 · 1月14日

A Data-Driven Predictive Framework for Inventory Optimization Using Context-Augmented Machine Learning Models

Arxiv

0+阅读 · 1月8日

相关基金

基于抽象语义切片和后向求精分析的静态分析警报自动确认研究

国家自然科学基金

1+阅读 · 2015年12月31日

故障机理的不确定传播及系统故障自动推演建模方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于WEB信息的信息错误自动检测与修复技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向主体行为网的自适应作战机理研究

国家自然科学基金

24+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

支持软件可信演化的故障定位研究

国家自然科学基金

0+阅读 · 2014年12月31日

供应商入侵下考虑成员风险规避行为的供应链决策与协调研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员