XR环境中开放集目标检测的用户提示策略与提示增强方法 (User Prompting Strategies and Prompt Enhancement Methods for Open-Set Object Detection in XR Environments) - 专知论文

会员服务 ·

0

开放集 · 鲁棒 · 目标检测 · 识别 · 类别 ·

User Prompting Strategies and Prompt Enhancement Methods for Open-Set Object Detection in XR Environments

翻译：XR环境中开放集目标检测的用户提示策略与提示增强方法

Junfeng Lin,Yanming Xiu,Maria Gorlatova

from arxiv, Accepted by IEEE VR 2026: GenAI-XR workshop

Open-set object detection (OSOD) localizes objects while identifying and rejecting unknown classes at inference. While recent OSOD models perform well on benchmarks, their behavior under realistic user prompting remains underexplored. In interactive XR settings, user-generated prompts are often ambiguous, underspecified, or overly detailed. To study prompt-conditioned robustness, we evaluate two OSOD models, GroundingDINO and YOLO-E, on real-world XR images and simulate diverse user prompting behaviors using vision-language models. We consider four prompt types: standard, underdetailed, overdetailed, and pragmatically ambiguous, and examine the impact of two enhancement strategies on these prompts. Results show that both models exhibit stable performance under underdetailed and standard prompts, while they suffer degradation under ambiguous prompts. Overdetailed prompts primarily affect GroundingDINO. Prompt enhancement substantially improves robustness under ambiguity, yielding gains exceeding 55% mIoU and 41% average confidence. Based on the findings, we propose several prompting strategies and prompt enhancement methods for OSOD models in XR environments.

翻译：开放集目标检测（OSOD）能够在推理过程中定位目标，同时识别并拒识未知类别。尽管近期的OSOD模型在基准测试上表现良好，但它们在真实用户提示下的行为仍未得到充分探索。在交互式XR环境中，用户生成的提示往往存在模糊性、描述不足或过度详细的问题。为研究提示条件下的鲁棒性，我们在真实世界XR图像上评估了GroundingDINO和YOLO-E两种OSOD模型，并利用视觉语言模型模拟了多样化的用户提示行为。我们考虑了四种提示类型：标准提示、描述不足提示、过度详细提示以及语用模糊提示，并检验了两种增强策略对这些提示的影响。结果表明，两种模型在描述不足提示和标准提示下均表现出稳定的性能，而在模糊提示下性能则出现下降。过度详细提示主要影响GroundingDINO模型。提示增强能显著提升模型在模糊提示下的鲁棒性，使mIoU提升超过55%，平均置信度提升超过41%。基于这些发现，我们为XR环境中的OSOD模型提出了若干提示策略与提示增强方法。

0

相关内容

开放集

【NeurIPS2024】DA-Ada：学习领域感知适配器以进行领域自适应目标检测

【NeurIPS2024】DA-Ada：学习领域感知适配器以进行领域自适应目标检测

专知会员服务

20+阅读 · 2024年10月15日

开放环境目标检测：挑战、解决方案与展望

开放环境目标检测：挑战、解决方案与展望

专知会员服务

44+阅读 · 2024年3月28日

遥感目标检测进展如何？西电等最新《深度学习遥感目标检测》综述，涵盖300多篇文献详述五大类型技术

遥感目标检测进展如何？西电等最新《深度学习遥感目标检测》综述，涵盖300多篇文献详述五大类型技术

专知会员服务

55+阅读 · 2023年9月15日

面向移动增强现实的实时深度学习目标检测方法综述

专知会员服务

22+阅读 · 2021年10月9日

【CVPR2021】面向开放世界的目标检测

专知会员服务

27+阅读 · 2021年3月5日

深度学习目标检测方法综述

深度学习目标检测方法综述

专知会员服务

280+阅读 · 2020年8月1日

【显著性目标检测| 2019最新综述】深度学习时代的显著目标检测（Salient Object Detection in the Deep Learning Era: An In-Depth Survey），附PDF

【显著性目标检测| 2019最新综述】深度学习时代的显著目标检测（Salient Object Detection in the Deep Learning Era: An In-Depth Survey），附PDF

专知会员服务

42+阅读 · 2019年11月23日

【目标检测 | 2019最新综述】目标检测的最新进展，附40页PDF，Recent Advances in Deep Learning for Object Detection

【目标检测 | 2019最新综述】目标检测的最新进展，附40页PDF，Recent Advances in Deep Learning for Object Detection

专知会员服务

86+阅读 · 2019年11月15日

【目标检测 | 2019最新综述】目标检测的20年，附39页PDF，Object Detection in 20 Years: A Survey

【目标检测 | 2019最新综述】目标检测的20年，附39页PDF，Object Detection in 20 Years: A Survey

专知会员服务

60+阅读 · 2019年11月15日

【目标检测 | 2019最新综述】基于深度学习的目标检测综述，附30页PDF， A Survey of Deep Learning-based Object Detection（From Fast R-CNN to NAS-FPN）

【目标检测 | 2019最新综述】基于深度学习的目标检测综述，附30页PDF， A Survey of Deep Learning-based Object Detection（From Fast R-CNN to NAS-FPN）

专知会员服务

56+阅读 · 2019年11月15日

成熟的目标检测，也该自己学习数据增强策略达到SOTA了

成熟的目标检测，也该自己学习数据增强策略达到SOTA了

机器之心

17+阅读 · 2019年6月28日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

干货 | 基于深度学习的目标检测算法综述：常见问题及解决方案

干货 | 基于深度学习的目标检测算法综述：常见问题及解决方案

AI前线

10+阅读 · 2018年11月2日

干货 | 基于深度学习的目标检测算法综述

干货 | 基于深度学习的目标检测算法综述

AI科技评论

18+阅读 · 2018年9月1日

干货 | 基于深度学习的目标检测算法综述（二）

干货 | 基于深度学习的目标检测算法综述（二）

AI科技评论

21+阅读 · 2018年8月20日

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

七月在线实验室

11+阅读 · 2018年7月18日

【深度学习】增加检测类别？这是一份目标检测的一般指南

【深度学习】增加检测类别？这是一份目标检测的一般指南

产业智能官

13+阅读 · 2018年5月27日

【论文推荐】最新九篇目标检测相关论文—常识性知识转移、尺度不敏感、多尺度位置感知、渐进式域适应、时间感知特征图、人机合作

【论文推荐】最新九篇目标检测相关论文—常识性知识转移、尺度不敏感、多尺度位置感知、渐进式域适应、时间感知特征图、人机合作

专知

17+阅读 · 2018年4月11日

【论文推荐】最新6篇目标检测相关论文—场景文本检测、显著对象、语义知识转移、混合监督目标检测、域自适应、车牌识别

【论文推荐】最新6篇目标检测相关论文—场景文本检测、显著对象、语义知识转移、混合监督目标检测、域自适应、车牌识别

专知

19+阅读 · 2018年3月16日

基于视觉特性的目标检测算法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向应用商店的移动智能终端恶意软件检测关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于生物视觉启发特征和遮挡模型的复杂道路环境目标检测方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于语义模型的高分辨率卫星遥感图像人造目标检测方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于深度神经网络的雷达目标高分辨距离像稳健识别方法

国家自然科学基金

6+阅读 · 2015年12月31日

场景深度关系下的视频遮挡目标检测

国家自然科学基金

1+阅读 · 2015年12月31日

基于自学习对比度视觉注意模型和自适应深度特征的无分类目标检测

国家自然科学基金

2+阅读 · 2015年12月31日

融合目标感知与对比度的图像和视频显著性检测技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

Self-Classification Enhancement and Correction for Weakly Supervised Object Detection

Arxiv

0+阅读 · 3月16日

Partial Weakly-Supervised Oriented Object Detection

Arxiv

0+阅读 · 3月3日

EW-DETR: Evolving World Object Detection via Incremental Low-Rank DEtection TRansformer

Arxiv

0+阅读 · 2月24日

Improving Data Quality via Pre-Task Participant Screening in Crowdsourced GUI Experiments

Arxiv

0+阅读 · 2月24日

From Subtle to Significant: Prompt-Driven Self-Improving Optimization in Test-Time Graph OOD Detection

Arxiv

0+阅读 · 2月19日

Benchmarking Adversarial Robustness and Adversarial Training Strategies for Object Detection

Arxiv

0+阅读 · 2月18日

A Self-Supervised Approach for Enhanced Feature Representations in Object Detection Tasks

Arxiv

0+阅读 · 2月18日

AffectGPT-R1: Leveraging Reinforcement Learning for Open-Vocabulary Multimodal Emotion Recognition

Arxiv

0+阅读 · 2月9日

Instance-Free Domain Adaptive Object Detection

Arxiv

0+阅读 · 2月6日

Defending Against Prompt Injection with DataFilter

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

最新内容

《面向大语言模型引导规划、Bandit算法驱动探索与多智能体导航的分层决策问题研究》180页

《面向大语言模型引导规划、Bandit算法驱动探索与多智能体导航的分层决策问题研究》180页

专知会员服务

2+阅读 · 52分钟前

《自动化战略情报管控》

《自动化战略情报管控》

专知会员服务

1+阅读 · 55分钟前

《反无人机蜂群技术研究：基于小队策略构建大规模无人机防御》

《反无人机蜂群技术研究：基于小队策略构建大规模无人机防御》

专知会员服务

2+阅读 · 今天14:23

得失评估：审视对伊朗战争的轨迹（简报）

得失评估：审视对伊朗战争的轨迹（简报）

专知会员服务

1+阅读 · 今天14:19

【CMU博士论文】迈向可解释机器学习的理论基础

【CMU博士论文】迈向可解释机器学习的理论基础

专知会员服务

1+阅读 · 今天12:23

CVPR 2026 | HulluEdit：基于正交子空间编辑的多模态大语言模型幻觉缓解框架

CVPR 2026 | HulluEdit：基于正交子空间编辑的多模态大语言模型幻觉缓解框架

专知会员服务

1+阅读 · 今天12:21

无人机视觉语言导航：研究进展、挑战与技术路线图

无人机视觉语言导航：研究进展、挑战与技术路线图

专知会员服务

0+阅读 · 今天12:13

《基于强化学习的反无人机蜂群拦截优先级排序》

《基于强化学习的反无人机蜂群拦截优先级排序》

专知会员服务

7+阅读 · 今天8:20

乌克兰反无人机方案“天穹哨兵”解析：一款人工智能驱动的近程防空系统

乌克兰反无人机方案“天穹哨兵”解析：一款人工智能驱动的近程防空系统

专知会员服务

2+阅读 · 今天7:30

美军2026条令《指挥官装甲装备维护技能测试计划》

美军2026条令《指挥官装甲装备维护技能测试计划》

专知会员服务

5+阅读 · 今天7:28

《俄罗斯构建服务于人工智能驱动自主性的主权无人机生态系统》（2026报告）

《俄罗斯构建服务于人工智能驱动自主性的主权无人机生态系统》（2026报告）

专知会员服务

6+阅读 · 今天3:09

2026年俄罗斯新型喷气动力无人机Geran-5的技术规格

2026年俄罗斯新型喷气动力无人机Geran-5的技术规格

专知会员服务

3+阅读 · 今天2:50

基于数据优化的人机协同与机器人僚机

基于数据优化的人机协同与机器人僚机

专知会员服务

4+阅读 · 今天2:08

美太空军发布两份聚焦2040年规划的文件：《2040年未来作战环境》和《2040年目标部队》（附文件）

美太空军发布两份聚焦2040年规划的文件：《2040年未来作战环境》和《2040年目标部队》（附文件）

专知会员服务

13+阅读 · 今天1:51

《为码头高价值舰艇提供反无人机系统防御方案研究》80页

《为码头高价值舰艇提供反无人机系统防御方案研究》80页

专知会员服务

8+阅读 · 4月15日

相关VIP内容

【NeurIPS2024】DA-Ada：学习领域感知适配器以进行领域自适应目标检测

【NeurIPS2024】DA-Ada：学习领域感知适配器以进行领域自适应目标检测

专知会员服务

20+阅读 · 2024年10月15日

开放环境目标检测：挑战、解决方案与展望

开放环境目标检测：挑战、解决方案与展望

专知会员服务

44+阅读 · 2024年3月28日

遥感目标检测进展如何？西电等最新《深度学习遥感目标检测》综述，涵盖300多篇文献详述五大类型技术

遥感目标检测进展如何？西电等最新《深度学习遥感目标检测》综述，涵盖300多篇文献详述五大类型技术

专知会员服务

55+阅读 · 2023年9月15日

面向移动增强现实的实时深度学习目标检测方法综述

专知会员服务

22+阅读 · 2021年10月9日

【CVPR2021】面向开放世界的目标检测

专知会员服务

27+阅读 · 2021年3月5日

深度学习目标检测方法综述

深度学习目标检测方法综述

专知会员服务

280+阅读 · 2020年8月1日

【显著性目标检测| 2019最新综述】深度学习时代的显著目标检测（Salient Object Detection in the Deep Learning Era: An In-Depth Survey），附PDF

【显著性目标检测| 2019最新综述】深度学习时代的显著目标检测（Salient Object Detection in the Deep Learning Era: An In-Depth Survey），附PDF

专知会员服务

42+阅读 · 2019年11月23日

【目标检测 | 2019最新综述】目标检测的最新进展，附40页PDF，Recent Advances in Deep Learning for Object Detection

【目标检测 | 2019最新综述】目标检测的最新进展，附40页PDF，Recent Advances in Deep Learning for Object Detection

专知会员服务

86+阅读 · 2019年11月15日

【目标检测 | 2019最新综述】目标检测的20年，附39页PDF，Object Detection in 20 Years: A Survey

【目标检测 | 2019最新综述】目标检测的20年，附39页PDF，Object Detection in 20 Years: A Survey

专知会员服务

60+阅读 · 2019年11月15日

【目标检测 | 2019最新综述】基于深度学习的目标检测综述，附30页PDF， A Survey of Deep Learning-based Object Detection（From Fast R-CNN to NAS-FPN）

【目标检测 | 2019最新综述】基于深度学习的目标检测综述，附30页PDF， A Survey of Deep Learning-based Object Detection（From Fast R-CNN to NAS-FPN）

专知会员服务

56+阅读 · 2019年11月15日

热门VIP内容

开通专知VIP会员享更多权益服务

《自动化战略情报管控》

得失评估：审视对伊朗战争的轨迹（简报）

《面向大语言模型引导规划、Bandit算法驱动探索与多智能体导航的分层决策问题研究》180页

《反无人机蜂群技术研究：基于小队策略构建大规模无人机防御》

相关资讯

成熟的目标检测，也该自己学习数据增强策略达到SOTA了

成熟的目标检测，也该自己学习数据增强策略达到SOTA了

机器之心

17+阅读 · 2019年6月28日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

干货 | 基于深度学习的目标检测算法综述：常见问题及解决方案

干货 | 基于深度学习的目标检测算法综述：常见问题及解决方案

AI前线

10+阅读 · 2018年11月2日

干货 | 基于深度学习的目标检测算法综述

干货 | 基于深度学习的目标检测算法综述

AI科技评论

18+阅读 · 2018年9月1日

干货 | 基于深度学习的目标检测算法综述（二）

干货 | 基于深度学习的目标检测算法综述（二）

AI科技评论

21+阅读 · 2018年8月20日

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

七月在线实验室

11+阅读 · 2018年7月18日

【深度学习】增加检测类别？这是一份目标检测的一般指南

【深度学习】增加检测类别？这是一份目标检测的一般指南

产业智能官

13+阅读 · 2018年5月27日

【论文推荐】最新九篇目标检测相关论文—常识性知识转移、尺度不敏感、多尺度位置感知、渐进式域适应、时间感知特征图、人机合作

【论文推荐】最新九篇目标检测相关论文—常识性知识转移、尺度不敏感、多尺度位置感知、渐进式域适应、时间感知特征图、人机合作

专知

17+阅读 · 2018年4月11日

【论文推荐】最新6篇目标检测相关论文—场景文本检测、显著对象、语义知识转移、混合监督目标检测、域自适应、车牌识别

【论文推荐】最新6篇目标检测相关论文—场景文本检测、显著对象、语义知识转移、混合监督目标检测、域自适应、车牌识别

专知

19+阅读 · 2018年3月16日

相关论文

Self-Classification Enhancement and Correction for Weakly Supervised Object Detection

Arxiv

0+阅读 · 3月16日

Partial Weakly-Supervised Oriented Object Detection

Arxiv

0+阅读 · 3月3日

EW-DETR: Evolving World Object Detection via Incremental Low-Rank DEtection TRansformer

Arxiv

0+阅读 · 2月24日

Improving Data Quality via Pre-Task Participant Screening in Crowdsourced GUI Experiments

Arxiv

0+阅读 · 2月24日

From Subtle to Significant: Prompt-Driven Self-Improving Optimization in Test-Time Graph OOD Detection

Arxiv

0+阅读 · 2月19日

Benchmarking Adversarial Robustness and Adversarial Training Strategies for Object Detection

Arxiv

0+阅读 · 2月18日

A Self-Supervised Approach for Enhanced Feature Representations in Object Detection Tasks

Arxiv

0+阅读 · 2月18日

AffectGPT-R1: Leveraging Reinforcement Learning for Open-Vocabulary Multimodal Emotion Recognition

Arxiv

0+阅读 · 2月9日

Instance-Free Domain Adaptive Object Detection

Arxiv

0+阅读 · 2月6日

Defending Against Prompt Injection with DataFilter

Arxiv

0+阅读 · 2月4日

相关基金

基于视觉特性的目标检测算法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向应用商店的移动智能终端恶意软件检测关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于生物视觉启发特征和遮挡模型的复杂道路环境目标检测方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于语义模型的高分辨率卫星遥感图像人造目标检测方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于深度神经网络的雷达目标高分辨距离像稳健识别方法

国家自然科学基金

6+阅读 · 2015年12月31日

场景深度关系下的视频遮挡目标检测

国家自然科学基金

1+阅读 · 2015年12月31日

基于自学习对比度视觉注意模型和自适应深度特征的无分类目标检测

国家自然科学基金

2+阅读 · 2015年12月31日

融合目标感知与对比度的图像和视频显著性检测技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员