BREPS: Bounding-Box Robustness Evaluation of Promptable Segmentation - 专知论文

会员服务 ·

0

边界框 · 分割 · 鲁棒 · 标注 · 泛化 ·

BREPS: Bounding-Box Robustness Evaluation of Promptable Segmentation

翻译：BREPS：可提示分割模型的边界框鲁棒性评估

Andrey Moskalenko,Danil Kuznetsov,Irina Dudko,Anastasiia Iasakova,Nikita Boldyrev,Denis Shepelev,Andrei Spiridonov,Andrey Kuznetsov,Vlad Shakhuro

from arxiv, Accepted by AAAI2026

Promptable segmentation models such as SAM have established a powerful paradigm, enabling strong generalization to unseen objects and domains with minimal user input, including points, bounding boxes, and text prompts. Among these, bounding boxes stand out as particularly effective, often outperforming points while significantly reducing annotation costs. However, current training and evaluation protocols typically rely on synthetic prompts generated through simple heuristics, offering limited insight into real-world robustness. In this paper, we investigate the robustness of promptable segmentation models to natural variations in bounding box prompts. First, we conduct a controlled user study and collect thousands of real bounding box annotations. Our analysis reveals substantial variability in segmentation quality across users for the same model and instance, indicating that SAM-like models are highly sensitive to natural prompt noise. Then, since exhaustive testing of all possible user inputs is computationally prohibitive, we reformulate robustness evaluation as a white-box optimization problem over the bounding box prompt space. We introduce BREPS, a method for generating adversarial bounding boxes that minimize or maximize segmentation error while adhering to naturalness constraints. Finally, we benchmark state-of-the-art models across 10 datasets, spanning everyday scenes to medical imaging. Code - https://github.com/emb-ai/BREPS.

翻译：诸如SAM之类的可提示分割模型已建立起强大的范式，能够通过极少的用户输入（包括点、边界框和文本提示）实现对未见对象和领域的强大泛化能力。其中，边界框因其特别高效而脱颖而出，其性能通常优于点提示，同时显著降低了标注成本。然而，当前的训练与评估协议通常依赖于通过简单启发式方法生成的合成提示，对现实世界中的鲁棒性洞察有限。本文研究了可提示分割模型对边界框提示自然变化的鲁棒性。首先，我们进行了一项受控用户研究，收集了数千个真实的边界框标注。我们的分析表明，对于同一模型和实例，不同用户之间的分割质量存在显著差异，这表明类SAM模型对自然提示噪声高度敏感。随后，由于穷举测试所有可能的用户输入在计算上不可行，我们将鲁棒性评估重新表述为边界框提示空间上的白盒优化问题。我们提出了BREPS方法，用于生成在遵循自然性约束的同时最小化或最大化分割误差的对抗性边界框。最后，我们在涵盖日常场景到医学影像的10个数据集上对最先进的模型进行了基准测试。代码 - https://github.com/emb-ai/BREPS。

0

相关内容

边界框

Google发布69 页《提示工程》白皮书，介绍 Prompt Engineering 及其最佳实践

Google发布69 页《提示工程》白皮书，介绍 Prompt Engineering 及其最佳实践

专知会员服务

52+阅读 · 2025年4月10日

【CVPR2025】通过高效提示与偏好优化增强SAM，实现半监督医学图像分割

【CVPR2025】通过高效提示与偏好优化增强SAM，实现半监督医学图像分割

专知会员服务

11+阅读 · 2025年3月8日

【NeurIPS2024】IPO: 面向视觉-语言模型的可解释提示优化

【NeurIPS2024】IPO: 面向视觉-语言模型的可解释提示优化

专知会员服务

22+阅读 · 2024年10月23日

Segment Anything模型的高效变体：综述

Segment Anything模型的高效变体：综述

专知会员服务

27+阅读 · 2024年10月11日

《视频任意分割Segment Anything》系统性综述

《视频任意分割Segment Anything》系统性综述

专知会员服务

23+阅读 · 2024年8月19日

【NeurIPS2023】从视觉-语言基础模型中提取分布外鲁棒性

【NeurIPS2023】从视觉-语言基础模型中提取分布外鲁棒性

专知会员服务

21+阅读 · 2023年11月4日

分割任何模型(SAM)综述: 视觉基础模型与提示工程的结合

分割任何模型(SAM)综述: 视觉基础模型与提示工程的结合

专知会员服务

53+阅读 · 2023年6月16日

上海交大最新《标签高效深度分割》研究进展综述，全面阐述无监督、粗监督、不完全监督和噪声监督的深度分割方法

上海交大最新《标签高效深度分割》研究进展综述，全面阐述无监督、粗监督、不完全监督和噪声监督的深度分割方法

专知会员服务

42+阅读 · 2022年7月7日

NLP新范式-预训练，提示(Prompt)，预测！CMU刘鹏飞等论文综述预训练语言模型提示学习进展

NLP新范式-预训练，提示(Prompt)，预测！CMU刘鹏飞等论文综述预训练语言模型提示学习进展

专知会员服务

71+阅读 · 2021年7月31日

【微软亚研】预训练文本表示作为元学习，Pre-training Text Representations

【微软亚研】预训练文本表示作为元学习，Pre-training Text Representations

专知会员服务

40+阅读 · 2020年4月17日

【TPAMI2022】「深度学习图像分割」最新综述论文，带你全面了解100个10大类深度图像分割算法

【TPAMI2022】「深度学习图像分割」最新综述论文，带你全面了解100个10大类深度图像分割算法

专知

10+阅读 · 2022年4月11日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

GAN生成式对抗网络

14+阅读 · 2019年5月20日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

语义分割如何「拉关系」?

语义分割如何「拉关系」?

计算机视觉life

11+阅读 · 2019年2月15日

【干货】用BRET进行多标签文本分类（附代码）

【干货】用BRET进行多标签文本分类（附代码）

专知

276+阅读 · 2019年2月9日

【论文推荐】最新七篇图像分割相关论文—Attention U-Net、对抗结构匹配损失、卷积CRFs、对抗样本、弱监督分割

【论文推荐】最新七篇图像分割相关论文—Attention U-Net、对抗结构匹配损失、卷积CRFs、对抗样本、弱监督分割

专知

19+阅读 · 2018年5月31日

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

专知

13+阅读 · 2018年1月23日

基于区分型码本的图像表示的研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于部件结构的图像协同分割方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

材料与加工敏感的形状分析与建模

国家自然科学基金

0+阅读 · 2015年12月31日

基于形状信息和结果反馈的多图谱图像分割方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于不确定性计算的鲁棒风险评估关键技术研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于非监督决策树的模糊图割模型的彩色图像分割研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于上下文感知和异质特征集成的SAR图像分割与评价

国家自然科学基金

2+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

面向生物特征识别的鲁棒判别结构化特征表示方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

3+阅读 · 2014年12月31日

Efficient Segment Anything with Depth-Aware Fusion and Limited Training Data

Arxiv

0+阅读 · 2月12日

SNAP: Towards Segmenting Anything in Any Point Cloud

Arxiv

0+阅读 · 2月10日

Bagging-Based Model Merging for Robust General Text Embeddings

Arxiv

0+阅读 · 2月9日

PromptSplit: Revealing Prompt-Level Disagreement in Generative Models

Arxiv

0+阅读 · 2月6日

Bagging-Based Model Merging for Robust General Text Embeddings

Arxiv

0+阅读 · 2月5日

No time to train! Training-Free Reference-Based Instance Segmentation

Arxiv

0+阅读 · 2月3日

No time to train! Training-Free Reference-Based Instance Segmentation

Arxiv

0+阅读 · 2月2日

Breaking the Adversarial Robustness-Performance Trade-off in Text Classification via Manifold Purification

Arxiv

0+阅读 · 1月30日

A Dialectic Pipeline for Improving LLM Robustness

Arxiv

0+阅读 · 1月28日

MV-SAM: Multi-view Promptable Segmentation using Pointmap Guidance

Arxiv

0+阅读 · 1月25日

VIP会员

文章信息

相关主题

最新内容

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

1+阅读 · 今天6:14

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

1+阅读 · 今天5:59

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

1+阅读 · 今天5:54

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

1+阅读 · 今天5:51

《提升生成模型的安全性与保障》博士论文

《提升生成模型的安全性与保障》博士论文

专知会员服务

0+阅读 · 今天5:47

美国当前高超音速导弹发展概述

美国当前高超音速导弹发展概述

专知会员服务

4+阅读 · 4月19日

《高超音速武器：一项再度兴起的技术》120页slides

《高超音速武器：一项再度兴起的技术》120页slides

专知会员服务

8+阅读 · 4月19日

无人机蜂群建模与仿真方法

无人机蜂群建模与仿真方法

专知会员服务

9+阅读 · 4月19日

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

专知会员服务

3+阅读 · 4月19日

《量化反无人机系统对抗无人机蜂群效能的创新方法》

《量化反无人机系统对抗无人机蜂群效能的创新方法》

专知会员服务

12+阅读 · 4月19日

澳大利亚发布《国防战略（2026年）》

澳大利亚发布《国防战略（2026年）》

专知会员服务

4+阅读 · 4月19日

【CMU博士论文】迈向基于基础先验的 4D 感知研究

【CMU博士论文】迈向基于基础先验的 4D 感知研究

专知会员服务

4+阅读 · 4月19日

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

专知会员服务

14+阅读 · 4月19日

全球高超音速武器最新发展趋势

全球高超音速武器最新发展趋势

专知会员服务

3+阅读 · 4月19日

《利用大语言模型增强多域作战兵棋推演》（报告）

《利用大语言模型增强多域作战兵棋推演》（报告）

专知会员服务

14+阅读 · 4月18日

相关VIP内容

Google发布69 页《提示工程》白皮书，介绍 Prompt Engineering 及其最佳实践

Google发布69 页《提示工程》白皮书，介绍 Prompt Engineering 及其最佳实践

专知会员服务

52+阅读 · 2025年4月10日

【CVPR2025】通过高效提示与偏好优化增强SAM，实现半监督医学图像分割

【CVPR2025】通过高效提示与偏好优化增强SAM，实现半监督医学图像分割

专知会员服务

11+阅读 · 2025年3月8日

【NeurIPS2024】IPO: 面向视觉-语言模型的可解释提示优化

【NeurIPS2024】IPO: 面向视觉-语言模型的可解释提示优化

专知会员服务

22+阅读 · 2024年10月23日

Segment Anything模型的高效变体：综述

Segment Anything模型的高效变体：综述

专知会员服务

27+阅读 · 2024年10月11日

《视频任意分割Segment Anything》系统性综述

《视频任意分割Segment Anything》系统性综述

专知会员服务

23+阅读 · 2024年8月19日

【NeurIPS2023】从视觉-语言基础模型中提取分布外鲁棒性

【NeurIPS2023】从视觉-语言基础模型中提取分布外鲁棒性

专知会员服务

21+阅读 · 2023年11月4日

分割任何模型(SAM)综述: 视觉基础模型与提示工程的结合

分割任何模型(SAM)综述: 视觉基础模型与提示工程的结合

专知会员服务

53+阅读 · 2023年6月16日

上海交大最新《标签高效深度分割》研究进展综述，全面阐述无监督、粗监督、不完全监督和噪声监督的深度分割方法

上海交大最新《标签高效深度分割》研究进展综述，全面阐述无监督、粗监督、不完全监督和噪声监督的深度分割方法

专知会员服务

42+阅读 · 2022年7月7日

NLP新范式-预训练，提示(Prompt)，预测！CMU刘鹏飞等论文综述预训练语言模型提示学习进展

NLP新范式-预训练，提示(Prompt)，预测！CMU刘鹏飞等论文综述预训练语言模型提示学习进展

专知会员服务

71+阅读 · 2021年7月31日

【微软亚研】预训练文本表示作为元学习，Pre-training Text Representations

【微软亚研】预训练文本表示作为元学习，Pre-training Text Representations

专知会员服务

40+阅读 · 2020年4月17日

热门VIP内容

开通专知VIP会员享更多权益服务

军事通信系统与设备的技术演进综述

《北约标准：医疗评估手册》174页

乌克兰前线的五项创新

《北约 AI手册：作战人员的实用考量》（2026最新64页）

相关资讯

【TPAMI2022】「深度学习图像分割」最新综述论文，带你全面了解100个10大类深度图像分割算法

【TPAMI2022】「深度学习图像分割」最新综述论文，带你全面了解100个10大类深度图像分割算法

专知

10+阅读 · 2022年4月11日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

GAN生成式对抗网络

14+阅读 · 2019年5月20日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

语义分割如何「拉关系」?

语义分割如何「拉关系」?

计算机视觉life

11+阅读 · 2019年2月15日

【干货】用BRET进行多标签文本分类（附代码）

【干货】用BRET进行多标签文本分类（附代码）

专知

276+阅读 · 2019年2月9日

【论文推荐】最新七篇图像分割相关论文—Attention U-Net、对抗结构匹配损失、卷积CRFs、对抗样本、弱监督分割

【论文推荐】最新七篇图像分割相关论文—Attention U-Net、对抗结构匹配损失、卷积CRFs、对抗样本、弱监督分割

专知

19+阅读 · 2018年5月31日

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

专知

13+阅读 · 2018年1月23日

相关论文

Efficient Segment Anything with Depth-Aware Fusion and Limited Training Data

Arxiv

0+阅读 · 2月12日

SNAP: Towards Segmenting Anything in Any Point Cloud

Arxiv

0+阅读 · 2月10日

Bagging-Based Model Merging for Robust General Text Embeddings

Arxiv

0+阅读 · 2月9日

PromptSplit: Revealing Prompt-Level Disagreement in Generative Models

Arxiv

0+阅读 · 2月6日

Bagging-Based Model Merging for Robust General Text Embeddings

Arxiv

0+阅读 · 2月5日

No time to train! Training-Free Reference-Based Instance Segmentation

Arxiv

0+阅读 · 2月3日

No time to train! Training-Free Reference-Based Instance Segmentation

Arxiv

0+阅读 · 2月2日

Breaking the Adversarial Robustness-Performance Trade-off in Text Classification via Manifold Purification

Arxiv

0+阅读 · 1月30日

A Dialectic Pipeline for Improving LLM Robustness

Arxiv

0+阅读 · 1月28日

MV-SAM: Multi-view Promptable Segmentation using Pointmap Guidance

Arxiv

0+阅读 · 1月25日

相关基金

基于区分型码本的图像表示的研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于部件结构的图像协同分割方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

材料与加工敏感的形状分析与建模

国家自然科学基金

0+阅读 · 2015年12月31日

基于形状信息和结果反馈的多图谱图像分割方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于不确定性计算的鲁棒风险评估关键技术研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于非监督决策树的模糊图割模型的彩色图像分割研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于上下文感知和异质特征集成的SAR图像分割与评价

国家自然科学基金

2+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

面向生物特征识别的鲁棒判别结构化特征表示方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

3+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员