Enabling Real-Time Colonoscopic Polyp Segmentation on Commodity CPUs via Ultra-Lightweight Architecture - 专知论文

会员服务 ·

0

中央处理器 (CPU) · 分割 · 精度 · 基准 · 识别 ·

Enabling Real-Time Colonoscopic Polyp Segmentation on Commodity CPUs via Ultra-Lightweight Architecture

翻译：在商用CPU上通过超轻量级架构实现实时结肠镜息肉分割

Weihao Gao,Zhuo Deng,Zheng Gong,Lan Ma

from arxiv, 19pages, 5 figures

Early detection of colorectal cancer hinges on real-time, accurate polyp identification and resection. Yet current high-precision segmentation models rely on GPUs, making them impractical to deploy in primary hospitals, mobile endoscopy units, or capsule robots. To bridge this gap, we present the UltraSeg family, operating in an extreme-compression regime (<0.3 M parameters). UltraSeg-108K (0.108 M parameters) is optimized for single-center data, while UltraSeg-130K (0.13 M parameters) generalizes to multi-center, multi-modal images. By jointly optimizing encoder-decoder widths, incorporating constrained dilated convolutions to enlarge receptive fields, and integrating a cross-layer lightweight fusion module, the models achieve 90 FPS on a single CPU core without sacrificing accuracy. Evaluated on seven public datasets, UltraSeg retains >94% of the Dice score of a 31 M-parameter U-Net while utilizing only 0.4% of its parameters, establishing a strong, clinically viable baseline for the extreme-compression domain and offering an immediately deployable solution for resource-constrained settings. This work provides not only a CPU-native solution for colonoscopy but also a reproducible blueprint for broader minimally invasive surgical vision applications. Source code is publicly available to ensure reproducibility and facilitate future benchmarking.

翻译：结直肠癌的早期发现依赖于实时、准确的息肉识别与切除。然而，当前的高精度分割模型依赖GPU，使其难以在基层医院、移动内窥镜单元或胶囊机器人中部署。为弥补这一差距，我们提出了在极端压缩机制下（<0.3 M参数）运行的UltraSeg系列模型。UltraSeg-108K（0.108 M参数）针对单中心数据进行了优化，而UltraSeg-130K（0.13 M参数）则能泛化至多中心、多模态图像。通过联合优化编码器-解码器宽度、引入约束扩张卷积以扩大感受野，并集成跨层轻量级融合模块，该模型在单个CPU核心上实现了90 FPS的推理速度，且未牺牲精度。在七个公共数据集上的评估表明，UltraSeg在仅使用31 M参数U-Net的0.4%参数量的情况下，保持了其Dice分数94%以上的性能，为极端压缩领域建立了一个强大且临床可行的基准，并为资源受限环境提供了一个可立即部署的解决方案。这项工作不仅为结肠镜检查提供了一种CPU原生解决方案，也为更广泛的微创手术视觉应用提供了一个可复现的蓝图。源代码已公开，以确保可复现性并促进未来的基准测试。

0

相关内容

中央处理器 (CPU)

中央处理器 (CPU)

中央处理器（CPU，Central Processing Unit），电子计算机的主要设备之一。其功能主要是解释计算机指令以及处理计算机软件中的数据。

【CVPR2025】通过高效提示与偏好优化增强SAM，实现半监督医学图像分割

【CVPR2025】通过高效提示与偏好优化增强SAM，实现半监督医学图像分割

专知会员服务

11+阅读 · 2025年3月8日

Mamba 架构在医学图像分析中的全面综述：分类、分割、重建及其他应用

Mamba 架构在医学图像分析中的全面综述：分类、分割、重建及其他应用

专知会员服务

29+阅读 · 2024年10月4日

Stable Diffusion 3论文终于发布，架构细节大揭秘，对复现Sora有帮助？附中英文报告

Stable Diffusion 3论文终于发布，架构细节大揭秘，对复现Sora有帮助？附中英文报告

专知会员服务

53+阅读 · 2024年3月7日

适配还是提示？微软最新《通用大模型是否超过专业领域微调大模型》论文，GPT-4多种策略提示超越医学大模型

适配还是提示？微软最新《通用大模型是否超过专业领域微调大模型》论文，GPT-4多种策略提示超越医学大模型

专知会员服务

59+阅读 · 2023年12月3日

U-Net如何用在医学图像分割？德国亚琛工大等最新《医学图像分割》综述，详述六大类100多个算法

U-Net如何用在医学图像分割？德国亚琛工大等最新《医学图像分割》综述，详述六大类100多个算法

专知会员服务

52+阅读 · 2022年11月29日

Cancer Cell综述｜AI用于肿瘤学中的多模态数据集成

Cancer Cell综述｜AI用于肿瘤学中的多模态数据集成

专知会员服务

35+阅读 · 2022年10月13日

港科大最新《深度学习医学图像分割MedISeg》综述论文，21页pdf涵盖212篇文献阐述MedISeg技巧、挑战和未来方向

港科大最新《深度学习医学图像分割MedISeg》综述论文，21页pdf涵盖212篇文献阐述MedISeg技巧、挑战和未来方向

专知会员服务

42+阅读 · 2022年9月22日

清华孙茂松等自然·通讯杂志发表生物医学知识计算研究《深度学习系统桥接分子结构和生物医学文本，具有与人类专业相当的理解力》

清华孙茂松等自然·通讯杂志发表生物医学知识计算研究《深度学习系统桥接分子结构和生物医学文本，具有与人类专业相当的理解力》

专知会员服务

22+阅读 · 2022年2月23日

【ICCV 2021】HCFlow：使用一个统一的框架处理图像超分辨率和图像再缩放

专知会员服务

15+阅读 · 2021年10月4日

【北京智源大会2019】活体高时空分辨率成像以及大数据分析，北京大学分子医学研究所教授陈良怡

【北京智源大会2019】活体高时空分辨率成像以及大数据分析，北京大学分子医学研究所教授陈良怡

专知会员服务

18+阅读 · 2019年11月22日

BiSeNet V2来了！156 FPS，72.6%mIoU！让语义分割飞起来！

BiSeNet V2来了！156 FPS，72.6%mIoU！让语义分割飞起来！

CVer

13+阅读 · 2020年4月14日

谷歌EfficientNet缩放模型，PyTorch实现登热榜

谷歌EfficientNet缩放模型，PyTorch实现登热榜

机器学习算法与Python学习

11+阅读 · 2019年6月4日

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

GAN生成式对抗网络

14+阅读 · 2019年5月23日

【泡泡一分钟】在CPU上进行实时无监督单目深度估计

【泡泡一分钟】在CPU上进行实时无监督单目深度估计

泡泡机器人SLAM

17+阅读 · 2019年5月10日

小米开源FALSR算法：快速精确轻量级的超分辨率模型

小米开源FALSR算法：快速精确轻量级的超分辨率模型

AI100

11+阅读 · 2019年1月31日

BiSeNet：双向分割网络进行实时语义分割

BiSeNet：双向分割网络进行实时语义分割

统计学习与视觉计算组

22+阅读 · 2018年8月23日

深度 | 语义分割网络DeepLab-v3的架构设计思想和TensorFlow实现

深度 | 语义分割网络DeepLab-v3的架构设计思想和TensorFlow实现

机器之心

11+阅读 · 2018年3月26日

一文概览基于深度学习的超分辨率重建架构

一文概览基于深度学习的超分辨率重建架构

论智

23+阅读 · 2018年3月24日

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

机器之心

16+阅读 · 2018年3月12日

全球肝脏肿瘤病灶区CT图像分割挑战大赛，联想E-Health夺得冠军

全球肝脏肿瘤病灶区CT图像分割挑战大赛，联想E-Health夺得冠军

新智元

10+阅读 · 2017年9月22日

面向癌症精准诊疗的高密度微腔阵列式多重数字PCR芯片

国家自然科学基金

2+阅读 · 2017年12月31日

结直肠癌多种microRNA的单分子检测研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于汽凝法的生物芯片的开发与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

发展适用于肿瘤细胞实时快速拉曼成像的光谱信号处理方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于荧光纳米簇的“关开”型FRET传感器用于血清中多种肿瘤标志物同时检测

国家自然科学基金

0+阅读 · 2015年12月31日

构建预测直肠癌新辅助治疗后病理学完全缓解（pCR）的多模态、多参数诊断模型

国家自然科学基金

1+阅读 · 2015年12月31日

一种乳腺癌分子特异性手术导航成像方法

国家自然科学基金

1+阅读 · 2015年12月31日

以基因功能研究为基础的结直肠癌易感区段10q22.3的精细定位

国家自然科学基金

0+阅读 · 2015年12月31日

智能化双靶向肿瘤光学/核素/MRI多模态分子探针的合成及其性能研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于Nonlocal的MRI脑肿瘤图像分割方法的研究

国家自然科学基金

0+阅读 · 2014年12月31日

Weakly Supervised Teacher-Student Framework with Progressive Pseudo-mask Refinement for Gland Segmentation

Arxiv

0+阅读 · 3月9日

Accelerating Multi-Scale Deformable Attention Using Near-Memory-Processing Architecture

Arxiv

0+阅读 · 3月1日

ColoDiff: Integrating Dynamic Consistency With Content Awareness for Colonoscopy Video Generation

Arxiv

0+阅读 · 2月26日

XMorph: Explainable Brain Tumor Analysis Via LLM-Assisted Hybrid Deep Intelligence

Arxiv

0+阅读 · 2月24日

FoundationPose-Initialized 3D-2D Liver Registration for Surgical Augmented Reality

FoundationPose-Initialized 3D-2D Liver Registration for Surgical Augmented Reality

Arxiv

0+阅读 · 2月19日

Real-time Monocular 2D and 3D Perception of Endoluminal Scenes for Controlling Flexible Robotic Endoscopic Instruments

Arxiv

0+阅读 · 2月16日

Neural-Augmented Kelvinlet for Real-Time Soft Tissue Deformation Modeling

Arxiv

0+阅读 · 2月11日

Bladder Vessel Segmentation using a Hybrid Attention-Convolution Framework

Arxiv

0+阅读 · 2月10日

XtraLight-MedMamba for Classification of Neoplastic Tubular Adenomas

Arxiv

0+阅读 · 2月4日

Physics Informed Generative AI Enabling Labour Free Segmentation For Microscopy Analysis

Arxiv

0+阅读 · 2月2日

VIP会员

文章信息

相关主题

中央处理器 (CPU)

最新内容

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

8+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

4+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

6+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

7+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

11+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

12+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

8+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

20+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

10+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

相关VIP内容

【CVPR2025】通过高效提示与偏好优化增强SAM，实现半监督医学图像分割

【CVPR2025】通过高效提示与偏好优化增强SAM，实现半监督医学图像分割

专知会员服务

11+阅读 · 2025年3月8日

Mamba 架构在医学图像分析中的全面综述：分类、分割、重建及其他应用

Mamba 架构在医学图像分析中的全面综述：分类、分割、重建及其他应用

专知会员服务

29+阅读 · 2024年10月4日

Stable Diffusion 3论文终于发布，架构细节大揭秘，对复现Sora有帮助？附中英文报告

Stable Diffusion 3论文终于发布，架构细节大揭秘，对复现Sora有帮助？附中英文报告

专知会员服务

53+阅读 · 2024年3月7日

适配还是提示？微软最新《通用大模型是否超过专业领域微调大模型》论文，GPT-4多种策略提示超越医学大模型

适配还是提示？微软最新《通用大模型是否超过专业领域微调大模型》论文，GPT-4多种策略提示超越医学大模型

专知会员服务

59+阅读 · 2023年12月3日

U-Net如何用在医学图像分割？德国亚琛工大等最新《医学图像分割》综述，详述六大类100多个算法

U-Net如何用在医学图像分割？德国亚琛工大等最新《医学图像分割》综述，详述六大类100多个算法

专知会员服务

52+阅读 · 2022年11月29日

Cancer Cell综述｜AI用于肿瘤学中的多模态数据集成

Cancer Cell综述｜AI用于肿瘤学中的多模态数据集成

专知会员服务

35+阅读 · 2022年10月13日

港科大最新《深度学习医学图像分割MedISeg》综述论文，21页pdf涵盖212篇文献阐述MedISeg技巧、挑战和未来方向

港科大最新《深度学习医学图像分割MedISeg》综述论文，21页pdf涵盖212篇文献阐述MedISeg技巧、挑战和未来方向

专知会员服务

42+阅读 · 2022年9月22日

清华孙茂松等自然·通讯杂志发表生物医学知识计算研究《深度学习系统桥接分子结构和生物医学文本，具有与人类专业相当的理解力》

清华孙茂松等自然·通讯杂志发表生物医学知识计算研究《深度学习系统桥接分子结构和生物医学文本，具有与人类专业相当的理解力》

专知会员服务

22+阅读 · 2022年2月23日

【ICCV 2021】HCFlow：使用一个统一的框架处理图像超分辨率和图像再缩放

专知会员服务

15+阅读 · 2021年10月4日

【北京智源大会2019】活体高时空分辨率成像以及大数据分析，北京大学分子医学研究所教授陈良怡

【北京智源大会2019】活体高时空分辨率成像以及大数据分析，北京大学分子医学研究所教授陈良怡

专知会员服务

18+阅读 · 2019年11月22日

热门VIP内容

开通专知VIP会员享更多权益服务

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

相关资讯

BiSeNet V2来了！156 FPS，72.6%mIoU！让语义分割飞起来！

BiSeNet V2来了！156 FPS，72.6%mIoU！让语义分割飞起来！

CVer

13+阅读 · 2020年4月14日

谷歌EfficientNet缩放模型，PyTorch实现登热榜

谷歌EfficientNet缩放模型，PyTorch实现登热榜

机器学习算法与Python学习

11+阅读 · 2019年6月4日

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

GAN生成式对抗网络

14+阅读 · 2019年5月23日

【泡泡一分钟】在CPU上进行实时无监督单目深度估计

【泡泡一分钟】在CPU上进行实时无监督单目深度估计

泡泡机器人SLAM

17+阅读 · 2019年5月10日

小米开源FALSR算法：快速精确轻量级的超分辨率模型

小米开源FALSR算法：快速精确轻量级的超分辨率模型

AI100

11+阅读 · 2019年1月31日

BiSeNet：双向分割网络进行实时语义分割

BiSeNet：双向分割网络进行实时语义分割

统计学习与视觉计算组

22+阅读 · 2018年8月23日

深度 | 语义分割网络DeepLab-v3的架构设计思想和TensorFlow实现

深度 | 语义分割网络DeepLab-v3的架构设计思想和TensorFlow实现

机器之心

11+阅读 · 2018年3月26日

一文概览基于深度学习的超分辨率重建架构

一文概览基于深度学习的超分辨率重建架构

论智

23+阅读 · 2018年3月24日

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

机器之心

16+阅读 · 2018年3月12日

全球肝脏肿瘤病灶区CT图像分割挑战大赛，联想E-Health夺得冠军

全球肝脏肿瘤病灶区CT图像分割挑战大赛，联想E-Health夺得冠军

新智元

10+阅读 · 2017年9月22日

相关论文

Weakly Supervised Teacher-Student Framework with Progressive Pseudo-mask Refinement for Gland Segmentation

Arxiv

0+阅读 · 3月9日

Accelerating Multi-Scale Deformable Attention Using Near-Memory-Processing Architecture

Arxiv

0+阅读 · 3月1日

ColoDiff: Integrating Dynamic Consistency With Content Awareness for Colonoscopy Video Generation

Arxiv

0+阅读 · 2月26日

XMorph: Explainable Brain Tumor Analysis Via LLM-Assisted Hybrid Deep Intelligence

Arxiv

0+阅读 · 2月24日

FoundationPose-Initialized 3D-2D Liver Registration for Surgical Augmented Reality

FoundationPose-Initialized 3D-2D Liver Registration for Surgical Augmented Reality

Arxiv

0+阅读 · 2月19日

Real-time Monocular 2D and 3D Perception of Endoluminal Scenes for Controlling Flexible Robotic Endoscopic Instruments

Arxiv

0+阅读 · 2月16日

Neural-Augmented Kelvinlet for Real-Time Soft Tissue Deformation Modeling

Arxiv

0+阅读 · 2月11日

Bladder Vessel Segmentation using a Hybrid Attention-Convolution Framework

Arxiv

0+阅读 · 2月10日

XtraLight-MedMamba for Classification of Neoplastic Tubular Adenomas

Arxiv

0+阅读 · 2月4日

Physics Informed Generative AI Enabling Labour Free Segmentation For Microscopy Analysis

Arxiv

0+阅读 · 2月2日

相关基金

面向癌症精准诊疗的高密度微腔阵列式多重数字PCR芯片

国家自然科学基金

2+阅读 · 2017年12月31日

结直肠癌多种microRNA的单分子检测研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于汽凝法的生物芯片的开发与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

发展适用于肿瘤细胞实时快速拉曼成像的光谱信号处理方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于荧光纳米簇的“关开”型FRET传感器用于血清中多种肿瘤标志物同时检测

国家自然科学基金

0+阅读 · 2015年12月31日

构建预测直肠癌新辅助治疗后病理学完全缓解（pCR）的多模态、多参数诊断模型

国家自然科学基金

1+阅读 · 2015年12月31日

一种乳腺癌分子特异性手术导航成像方法

国家自然科学基金

1+阅读 · 2015年12月31日

以基因功能研究为基础的结直肠癌易感区段10q22.3的精细定位

国家自然科学基金

0+阅读 · 2015年12月31日

智能化双靶向肿瘤光学/核素/MRI多模态分子探针的合成及其性能研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于Nonlocal的MRI脑肿瘤图像分割方法的研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员