Unlocking Generalization in Polyp Segmentation with DINO Self-Attention "keys" - 专知论文

会员服务 ·

0

泛化 · 分割 · 泛化能力 · 自注意力 · 复杂场景 ·

Unlocking Generalization in Polyp Segmentation with DINO Self-Attention "keys"

翻译：利用DINO自注意力"键"解锁息肉分割的泛化能力

Carla Monteiro,Valentina Corbetta,Regina Beets-Tan,Luís F. Teixeira,Wilson Silva

from arxiv, We have found a bug in our codebase. The DINO vision encoder was not properly frozen, therefore the results and claims are not fully valid. We are working on new results

Automatic polyp segmentation is crucial for improving the clinical identification of colorectal cancer (CRC). While Deep Learning (DL) techniques have been extensively researched for this problem, current methods frequently struggle with generalization, particularly in data-constrained or challenging settings. Moreover, many existing polyp segmentation methods rely on complex, task-specific architectures. To address these limitations, we present a framework that leverages the intrinsic robustness of DINO self-attention "key" features for robust segmentation. Unlike traditional methods that extract tokens from the deepest layers of the Vision Transformer (ViT), our approach leverages the key features of the self-attention module with a simple convolutional decoder to predict polyp masks, resulting in enhanced performance and better generalizability. We validate our approach using a multi-center dataset under two rigorous protocols: Domain Generalization (DG) and Extreme Single Domain Generalization (ESDG). Our results, supported by a comprehensive statistical analysis, demonstrate that this pipeline achieves state-of-the-art (SOTA) performance, significantly enhancing generalization, particularly in data-scarce and challenging scenarios. While avoiding a polyp-specific architecture, we surpass well-established models like nnU-Net and UM-Net. Additionally, we provide a systematic benchmark of the DINO framework's evolution, quantifying the specific impact of architectural advancements on downstream polyp segmentation performance.

翻译：自动息肉分割对于提升结直肠癌（CRC）的临床识别至关重要。尽管深度学习（DL）技术在该问题上已得到广泛研究，但现有方法常面临泛化能力不足的挑战，尤其在数据受限或复杂场景中。此外，许多现有息肉分割方法依赖于复杂的任务专用架构。为突破这些局限，我们提出一种利用DINO自注意力"键"特征内在鲁棒性实现稳健分割的框架。与传统方法从Vision Transformer（ViT）最深层次提取令牌不同，本方法通过自注意力模块的键特征结合简易卷积解码器预测息肉掩膜，从而提升性能并增强泛化能力。我们在多中心数据集上采用两种严格协议——领域泛化（DG）与极端单领域泛化（ESDG）——验证本方法。综合统计分析表明，该流程实现了最先进的性能，显著增强了在数据稀缺和复杂场景下的泛化能力。在避免使用息肉专用架构的同时，本方法超越了nnU-Net和UM-Net等成熟模型。此外，我们系统性地评估了DINO框架的演进历程，量化了架构改进对下游息肉分割性能的具体影响。

0

相关内容

118页纽约大学《深度学习模型训练优化方法综述：收敛性与泛化性的理论视角》

118页纽约大学《深度学习模型训练优化方法综述：收敛性与泛化性的理论视角》

专知会员服务

29+阅读 · 2025年1月27日

【伦敦国王学院博士论文】可信深度学习医学图像分割，270页pdf

【伦敦国王学院博士论文】可信深度学习医学图像分割，270页pdf

专知会员服务

44+阅读 · 2023年6月1日

【DTU博士论文】结构化表示学习的泛化

【DTU博士论文】结构化表示学习的泛化

专知会员服务

53+阅读 · 2023年4月27日

Transformer如何做视觉分割？南洋理工最新《基于Transformer的视觉分割》综述，详述120多个深度分割模型

Transformer如何做视觉分割？南洋理工最新《基于Transformer的视觉分割》综述，详述120多个深度分割模型

专知会员服务

56+阅读 · 2023年4月27日

北航等最新《深度半监督学习医学图像分割》综述，16页pdf阐述医学图像分割的半监督学习方法体系

北航等最新《深度半监督学习医学图像分割》综述，16页pdf阐述医学图像分割的半监督学习方法体系

专知会员服务

64+阅读 · 2022年8月2日

上海交大最新《标签高效深度分割》研究进展综述，全面阐述无监督、粗监督、不完全监督和噪声监督的深度分割方法

上海交大最新《标签高效深度分割》研究进展综述，全面阐述无监督、粗监督、不完全监督和噪声监督的深度分割方法

专知会员服务

42+阅读 · 2022年7月7日

南洋理工阿里巴巴等首篇《神经开放信息抽取》综述论文，系统阐述最新神经信息抽取关键技术

南洋理工阿里巴巴等首篇《神经开放信息抽取》综述论文，系统阐述最新神经信息抽取关键技术

专知会员服务

17+阅读 · 2022年5月30日

清华孙茂松等自然·通讯杂志发表生物医学知识计算研究《深度学习系统桥接分子结构和生物医学文本，具有与人类专业相当的理解力》

清华孙茂松等自然·通讯杂志发表生物医学知识计算研究《深度学习系统桥接分子结构和生物医学文本，具有与人类专业相当的理解力》

专知会员服务

22+阅读 · 2022年2月23日

深度学习下的医学影像分割算法综述

专知会员服务

116+阅读 · 2021年1月11日

【英国帝国理工学院】心脏图像分割的深度学习:综述，47页pdf，Deep learning for cardiac image segmentation: A review

【英国帝国理工学院】心脏图像分割的深度学习:综述，47页pdf，Deep learning for cardiac image segmentation: A review

专知会员服务

56+阅读 · 2019年11月14日

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

专知

14+阅读 · 2022年5月31日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

【论文笔记】自注意力图池化

【论文笔记】自注意力图池化

专知

82+阅读 · 2019年11月18日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

【强化学习】叶志豪：介绍强化学习及其在 NLP 上的应用｜分享总结

【强化学习】叶志豪：介绍强化学习及其在 NLP 上的应用｜分享总结

产业智能官

20+阅读 · 2018年7月24日

入门 | 一文了解什么是语义分割及常用的语义分割方法有哪些

入门 | 一文了解什么是语义分割及常用的语义分割方法有哪些

机器之心

10+阅读 · 2018年6月4日

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

专知

13+阅读 · 2018年1月23日

见微知著：语义分割中的弱监督学习

见微知著：语义分割中的弱监督学习

深度学习大讲堂

11+阅读 · 2017年12月6日

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

专知

18+阅读 · 2017年11月24日

基于光遗传学和CRISPR技术研究组蛋白乙酰化调控Fas表达水平在维持大肠癌干细胞特性中的作用及机制

国家自然科学基金

0+阅读 · 2015年12月31日

基于定量磷酸化蛋白质组学的脯氨酰顺反异构酶Pin1介导肝癌发生的关键信号通路的筛选

国家自然科学基金

0+阅读 · 2015年12月31日

Skp2泛素化RIPK1参与结直肠癌细胞5-Fu耐药的分子机制

国家自然科学基金

0+阅读 · 2015年12月31日

一种乳腺癌分子特异性手术导航成像方法

国家自然科学基金

1+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

以基因功能研究为基础的结直肠癌易感区段10q22.3的精细定位

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习与声影校正的全乳房超声解剖层分割新方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

一个长链非编码RNA的鉴定及其调节血管内皮细胞自噬的机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于Nonlocal的MRI脑肿瘤图像分割方法的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于分子靶向和多模融合的肝癌边界精准定位方法关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

Bladder Vessel Segmentation using a Hybrid Attention-Convolution Framework

Arxiv

0+阅读 · 2月10日

DINO-Mix: Distilling Foundational Knowledge with Cross-Domain CutMix for Semi-supervised Class-imbalanced Medical Image Segmentation

Arxiv

0+阅读 · 2月8日

XtraLight-MedMamba for Classification of Neoplastic Tubular Adenomas

Arxiv

0+阅读 · 2月4日

Enabling Real-Time Colonoscopic Polyp Segmentation on Commodity CPUs via Ultra-Lightweight Architecture

Arxiv

0+阅读 · 2月4日

Cut to the Mix: Simple Data Augmentation Outperforms Elaborate Ones in Limited Organ Segmentation Datasets

Arxiv

0+阅读 · 2月3日

GRITHopper: Decomposition-Free Multi-Hop Dense Retrieval

Arxiv

0+阅读 · 1月22日

Using Multi-Instance Learning to Identify Unique Polyps in Colon Capsule Endoscopy Images

Arxiv

0+阅读 · 1月21日

Transfer Learning from One Cancer to Another via Deep Learning Domain Adaptation

Arxiv

0+阅读 · 1月21日

Improved Segmentation of Polyps and Visual Explainability Analysis

Arxiv

0+阅读 · 1月14日

Exploiting DINOv3-Based Self-Supervised Features for Robust Few-Shot Medical Image Segmentation

Arxiv

0+阅读 · 1月12日

VIP会员

文章信息

相关主题

最新内容

面向特种部队的、以操作员为中心的人工智能决策支持系统框架

面向特种部队的、以操作员为中心的人工智能决策支持系统框架

专知会员服务

0+阅读 · 20分钟前

《多域战场上反制小型无人机系统》150页

《多域战场上反制小型无人机系统》150页

专知会员服务

2+阅读 · 27分钟前

《基于成果军事教育框架下的军官联合职业军事教育认证程序》2026最新170页

《基于成果军事教育框架下的军官联合职业军事教育认证程序》2026最新170页

专知会员服务

1+阅读 · 31分钟前

战场人工智能：增强陆地作战能力的发现与要求

战场人工智能：增强陆地作战能力的发现与要求

专知会员服务

0+阅读 · 37分钟前

人工智能赋能指挥所：以人工智能为中心的指挥控制的核心要素

人工智能赋能指挥所：以人工智能为中心的指挥控制的核心要素

专知会员服务

0+阅读 · 41分钟前

以人工智能为中心的指挥控制

以人工智能为中心的指挥控制

专知会员服务

0+阅读 · 刚刚

《通过适应复杂环境与特殊作战行动动态来变革情报周期》

《通过适应复杂环境与特殊作战行动动态来变革情报周期》

专知会员服务

2+阅读 · 今天4:15

俄乌冲突背景下军事特种公路运输日益增长的重要性

俄乌冲突背景下军事特种公路运输日益增长的重要性

专知会员服务

2+阅读 · 今天3:44

速度优先于谨慎：NSPM-11意味着什么（将人工智能融入美国国防和情报行动最全面的声明）

速度优先于谨慎：NSPM-11意味着什么（将人工智能融入美国国防和情报行动最全面的声明）

专知会员服务

7+阅读 · 6月10日

《基于深度强化学习的反无人机技术研究》178页

《基于深度强化学习的反无人机技术研究》178页

专知会员服务

10+阅读 · 6月10日

技术突破与战略优势竞争：美军人工智能技术运用阶段分析

技术突破与战略优势竞争：美军人工智能技术运用阶段分析

专知会员服务

5+阅读 · 6月10日

“史诗怒火”行动与“AI中心战”模式的浮现

“史诗怒火”行动与“AI中心战”模式的浮现

专知会员服务

9+阅读 · 6月10日

【CVPR2026教程】扩散模型的解析理解

【CVPR2026教程】扩散模型的解析理解

专知会员服务

3+阅读 · 6月10日

【CVPR2026教程】从感知到模拟：多模态推理中世界模型的涌现

【CVPR2026教程】从感知到模拟：多模态推理中世界模型的涌现

专知会员服务

4+阅读 · 6月10日

马赛克战：俄乌战场透析

马赛克战：俄乌战场透析

专知会员服务

16+阅读 · 6月10日

相关VIP内容

118页纽约大学《深度学习模型训练优化方法综述：收敛性与泛化性的理论视角》

118页纽约大学《深度学习模型训练优化方法综述：收敛性与泛化性的理论视角》

专知会员服务

29+阅读 · 2025年1月27日

【伦敦国王学院博士论文】可信深度学习医学图像分割，270页pdf

【伦敦国王学院博士论文】可信深度学习医学图像分割，270页pdf

专知会员服务

44+阅读 · 2023年6月1日

【DTU博士论文】结构化表示学习的泛化

【DTU博士论文】结构化表示学习的泛化

专知会员服务

53+阅读 · 2023年4月27日

Transformer如何做视觉分割？南洋理工最新《基于Transformer的视觉分割》综述，详述120多个深度分割模型

Transformer如何做视觉分割？南洋理工最新《基于Transformer的视觉分割》综述，详述120多个深度分割模型

专知会员服务

56+阅读 · 2023年4月27日

北航等最新《深度半监督学习医学图像分割》综述，16页pdf阐述医学图像分割的半监督学习方法体系

北航等最新《深度半监督学习医学图像分割》综述，16页pdf阐述医学图像分割的半监督学习方法体系

专知会员服务

64+阅读 · 2022年8月2日

上海交大最新《标签高效深度分割》研究进展综述，全面阐述无监督、粗监督、不完全监督和噪声监督的深度分割方法

上海交大最新《标签高效深度分割》研究进展综述，全面阐述无监督、粗监督、不完全监督和噪声监督的深度分割方法

专知会员服务

42+阅读 · 2022年7月7日

南洋理工阿里巴巴等首篇《神经开放信息抽取》综述论文，系统阐述最新神经信息抽取关键技术

南洋理工阿里巴巴等首篇《神经开放信息抽取》综述论文，系统阐述最新神经信息抽取关键技术

专知会员服务

17+阅读 · 2022年5月30日

清华孙茂松等自然·通讯杂志发表生物医学知识计算研究《深度学习系统桥接分子结构和生物医学文本，具有与人类专业相当的理解力》

清华孙茂松等自然·通讯杂志发表生物医学知识计算研究《深度学习系统桥接分子结构和生物医学文本，具有与人类专业相当的理解力》

专知会员服务

22+阅读 · 2022年2月23日

深度学习下的医学影像分割算法综述

专知会员服务

116+阅读 · 2021年1月11日

【英国帝国理工学院】心脏图像分割的深度学习:综述，47页pdf，Deep learning for cardiac image segmentation: A review

【英国帝国理工学院】心脏图像分割的深度学习:综述，47页pdf，Deep learning for cardiac image segmentation: A review

专知会员服务

56+阅读 · 2019年11月14日

热门VIP内容

开通专知VIP会员享更多权益服务

《多域战场上反制小型无人机系统》150页

战场人工智能：增强陆地作战能力的发现与要求

面向特种部队的、以操作员为中心的人工智能决策支持系统框架

《基于成果军事教育框架下的军官联合职业军事教育认证程序》2026最新170页

相关资讯

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

专知

14+阅读 · 2022年5月31日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

【论文笔记】自注意力图池化

【论文笔记】自注意力图池化

专知

82+阅读 · 2019年11月18日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

【强化学习】叶志豪：介绍强化学习及其在 NLP 上的应用｜分享总结

【强化学习】叶志豪：介绍强化学习及其在 NLP 上的应用｜分享总结

产业智能官

20+阅读 · 2018年7月24日

入门 | 一文了解什么是语义分割及常用的语义分割方法有哪些

入门 | 一文了解什么是语义分割及常用的语义分割方法有哪些

机器之心

10+阅读 · 2018年6月4日

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

专知

13+阅读 · 2018年1月23日

见微知著：语义分割中的弱监督学习

见微知著：语义分割中的弱监督学习

深度学习大讲堂

11+阅读 · 2017年12月6日

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

专知

18+阅读 · 2017年11月24日

相关论文

Bladder Vessel Segmentation using a Hybrid Attention-Convolution Framework

Arxiv

0+阅读 · 2月10日

DINO-Mix: Distilling Foundational Knowledge with Cross-Domain CutMix for Semi-supervised Class-imbalanced Medical Image Segmentation

Arxiv

0+阅读 · 2月8日

XtraLight-MedMamba for Classification of Neoplastic Tubular Adenomas

Arxiv

0+阅读 · 2月4日

Enabling Real-Time Colonoscopic Polyp Segmentation on Commodity CPUs via Ultra-Lightweight Architecture

Arxiv

0+阅读 · 2月4日

Cut to the Mix: Simple Data Augmentation Outperforms Elaborate Ones in Limited Organ Segmentation Datasets

Arxiv

0+阅读 · 2月3日

GRITHopper: Decomposition-Free Multi-Hop Dense Retrieval

Arxiv

0+阅读 · 1月22日

Using Multi-Instance Learning to Identify Unique Polyps in Colon Capsule Endoscopy Images

Arxiv

0+阅读 · 1月21日

Transfer Learning from One Cancer to Another via Deep Learning Domain Adaptation

Arxiv

0+阅读 · 1月21日

Improved Segmentation of Polyps and Visual Explainability Analysis

Arxiv

0+阅读 · 1月14日

Exploiting DINOv3-Based Self-Supervised Features for Robust Few-Shot Medical Image Segmentation

Arxiv

0+阅读 · 1月12日

相关基金

基于光遗传学和CRISPR技术研究组蛋白乙酰化调控Fas表达水平在维持大肠癌干细胞特性中的作用及机制

国家自然科学基金

0+阅读 · 2015年12月31日

基于定量磷酸化蛋白质组学的脯氨酰顺反异构酶Pin1介导肝癌发生的关键信号通路的筛选

国家自然科学基金

0+阅读 · 2015年12月31日

Skp2泛素化RIPK1参与结直肠癌细胞5-Fu耐药的分子机制

国家自然科学基金

0+阅读 · 2015年12月31日

一种乳腺癌分子特异性手术导航成像方法

国家自然科学基金

1+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

以基因功能研究为基础的结直肠癌易感区段10q22.3的精细定位

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习与声影校正的全乳房超声解剖层分割新方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

一个长链非编码RNA的鉴定及其调节血管内皮细胞自噬的机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于Nonlocal的MRI脑肿瘤图像分割方法的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于分子靶向和多模融合的肝癌边界精准定位方法关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员