Fully Kolmogorov-Arnold Deep Model in Medical Image Segmentation - 专知论文

会员服务 ·

0

深度模型 · 分割 · 内存 · 医学图像 · 医学图像分割 ·

Fully Kolmogorov-Arnold Deep Model in Medical Image Segmentation

翻译：完全基于Kolmogorov-Arnold的深度模型在医学图像分割中的应用

Xingyu Qiu,Xinghua Ma,Dong Liang,Gongning Luo,Wei Wang,Kuanquan Wang,Shuo Li

from arxiv, 11 pages, 5 figures, conference

Deeply stacked KANs are practically impossible due to high training difficulties and substantial memory requirements. Consequently, existing studies can only incorporate few KAN layers, hindering the comprehensive exploration of KANs. This study overcomes these limitations and introduces the first fully KA-based deep model, demonstrating that KA-based layers can entirely replace traditional architectures in deep learning and achieve superior learning capacity. Specifically, (1) the proposed Share-activation KAN (SaKAN) reformulates Sprecher's variant of Kolmogorov-Arnold representation theorem, which achieves better optimization due to its simplified parameterization and denser training samples, to ease training difficulty, (2) this paper indicates that spline gradients contribute negligibly to training while consuming huge GPU memory, thus proposes the Grad-Free Spline to significantly reduce memory usage and computational overhead. (3) Building on these two innovations, our ALL U-KAN is the first representative implementation of fully KA-based deep model, where the proposed KA and KAonv layers completely replace FC and Conv layers. Extensive evaluations on three medical image segmentation tasks confirm the superiority of the full KA-based architecture compared to partial KA-based and traditional architectures, achieving all higher segmentation accuracy. Compared to directly deeply stacked KAN, ALL U-KAN achieves 10 times reduction in parameter count and reduces memory consumption by more than 20 times, unlocking the new explorations into deep KAN architectures.

翻译：由于训练难度极高且内存需求巨大，深度堆叠的KAN在实践中几乎无法实现。因此，现有研究只能纳入少量KAN层，阻碍了对KAN的全面探索。本研究克服了这些限制，首次引入了完全基于KA的深度模型，证明了基于KA的层可以完全替代深度学习中的传统架构，并实现更优的学习能力。具体而言：（1）提出的共享激活KAN（SaKAN）重新表述了Sprecher版本的Kolmogorov-Arnold表示定理，该定理因其简化的参数化和更密集的训练样本而实现了更好的优化，从而缓解了训练难度；（2）本文指出样条梯度对训练的贡献微乎其微，同时消耗大量GPU内存，因此提出了无梯度样条，显著降低了内存使用和计算开销。（3）基于这两项创新，我们的ALL U-KAN是首个完全基于KA的深度模型的代表性实现，其中提出的KA和KAonv层完全替代了全连接层和卷积层。在三个医学图像分割任务上的广泛评估证实了完全基于KA的架构相较于部分基于KA的架构和传统架构的优越性，实现了更高的分割精度。与直接深度堆叠的KAN相比，ALL U-KAN实现了参数数量减少10倍，内存消耗降低超过20倍，为深度KAN架构的探索开辟了新的道路。

0

相关内容

深度模型

医学图像分割中的通用模型：与任务特定方法的综述与性能比较

医学图像分割中的通用模型：与任务特定方法的综述与性能比较

专知会员服务

13+阅读 · 2025年6月13日

【阿姆斯特丹博士论文】深度学习在医疗数据中的应用

【阿姆斯特丹博士论文】深度学习在医疗数据中的应用

专知会员服务

25+阅读 · 2024年7月18日

【阿姆斯特丹博士论文】医学数据的深度学习

【阿姆斯特丹博士论文】医学数据的深度学习

专知会员服务

25+阅读 · 2024年6月24日

【斯坦福博士论文】高效鲁棒的深度学习在医学影像和自然语言处理中的应用，112页pdf

【斯坦福博士论文】高效鲁棒的深度学习在医学影像和自然语言处理中的应用，112页pdf

专知会员服务

22+阅读 · 2024年1月27日

【NUS博士论文】深度表示学习的视频基础模型，236页pdf

【NUS博士论文】深度表示学习的视频基础模型，236页pdf

专知会员服务

33+阅读 · 2023年12月26日

「可解释深度学习在神经影像学」中的应用全面综述，109页pdf

「可解释深度学习在神经影像学」中的应用全面综述，109页pdf

专知会员服务

58+阅读 · 2023年7月20日

什么是深度图生成模型？剑桥大学博士生Chaitanya K. Joshi最新讲授! 附17页ppt

什么是深度图生成模型？剑桥大学博士生Chaitanya K. Joshi最新讲授! 附17页ppt

专知会员服务

35+阅读 · 2023年2月23日

【滑铁卢大学】医学图像分析中可解释的深度学习模型，18页pdf

【滑铁卢大学】医学图像分析中可解释的深度学习模型，18页pdf

专知会员服务

121+阅读 · 2020年5月31日

【贝叶斯深度学习：一种基于模型的可解释方法】Bayesian deep learning: A model-based interpretable approach

【贝叶斯深度学习：一种基于模型的可解释方法】Bayesian deep learning: A model-based interpretable approach

专知会员服务

49+阅读 · 2020年1月1日

【图像分割| 2019最新综述】理解图像分割的深度学习技术，附58页PDF（Understanding Deep Learning Techniques for Image Segmentation）

【图像分割| 2019最新综述】理解图像分割的深度学习技术，附58页PDF（Understanding Deep Learning Techniques for Image Segmentation）

专知会员服务

59+阅读 · 2019年11月16日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

一网打尽！深度学习100+经典模型TensorFlow与Pytorch代码实现大集合

一网打尽！深度学习100+经典模型TensorFlow与Pytorch代码实现大集合

专知

34+阅读 · 2020年1月3日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

专知

14+阅读 · 2019年10月31日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

高赞人气资源！集结数百篇顶会论文，由浅入深让你吃透图深度学习

高赞人气资源！集结数百篇顶会论文，由浅入深让你吃透图深度学习

量子位

10+阅读 · 2019年7月7日

深度学习与医学图像分析

深度学习与医学图像分析

人工智能前沿讲习班

40+阅读 · 2019年6月8日

收藏 | Tensorflow实现的深度NLP模型集锦（附资源）

收藏 | Tensorflow实现的深度NLP模型集锦（附资源）

THU数据派

12+阅读 · 2019年4月28日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

干货｜基于图卷积网络的图深度学习

干货｜基于图卷积网络的图深度学习

DataCanvas大数据云平台

10+阅读 · 2017年6月8日

基于压缩感知理论的图像采样、编码和重建研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于高阶信息和深度表示的图像复原研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于极限学习单元的多生物特征图像深度学习建模与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于草图的几何处理和应用

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

云平台中可优化分析操作的海量医学图像存储管理技术

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

Concurrent training methods for Kolmogorov-Arnold networks: Disjoint datasets and FPGA implementation

Arxiv

0+阅读 · 3月7日

FEKAN: Feature-Enriched Kolmogorov-Arnold Networks

Arxiv

0+阅读 · 2月18日

Batch-CAM: Introduction to better reasoning in convolutional deep learning models

Arxiv

0+阅读 · 2月13日

Efficient Graph Knowledge Distillation from GNNs to Kolmogorov--Arnold Networks via Self-Attention Dynamic Sampling

Arxiv

0+阅读 · 2月9日

A hybrid Kolmogorov-Arnold network for medical image segmentation

Arxiv

0+阅读 · 2月7日

Physical Analog Kolmogorov-Arnold Networks based on Reconfigurable Nonlinear-Processing Units

Arxiv

0+阅读 · 2月7日

MedMO: Grounding and Understanding Multimodal Large Language Model for Medical Images

Arxiv

1+阅读 · 2月6日

MRD: Using Physically Based Differentiable Rendering to Probe Vision Models for 3D Scene Understanding

Arxiv

0+阅读 · 2月5日

Ultrafast On-chip Online Learning via Spline Locality in Kolmogorov-Arnold Networks

Arxiv

0+阅读 · 2月2日

Optimization, Generalization and Differential Privacy Bounds for Gradient Descent on Kolmogorov-Arnold Networks

Arxiv

0+阅读 · 1月29日

VIP会员

文章信息

相关主题

医学图像分割

最新内容

以色列军事技术对美国军力发展的持续性赋能

以色列军事技术对美国军力发展的持续性赋能

专知会员服务

1+阅读 · 39分钟前

战场之外的较量：美伊冲突中的认知战与心理博弈

战场之外的较量：美伊冲突中的认知战与心理博弈

专知会员服务

1+阅读 · 今天7:41

俄乌战争中乌克兰防空能力演变与见解（中文版）

俄乌战争中乌克兰防空能力演变与见解（中文版）

专知会员服务

0+阅读 · 今天7:22

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

专知会员服务

6+阅读 · 今天6:04

《深度强化学习在兵棋推演中的应用》40页报告

《深度强化学习在兵棋推演中的应用》40页报告

专知会员服务

6+阅读 · 今天5:37

《多域作战面临复杂现实》

《多域作战面临复杂现实》

专知会员服务

5+阅读 · 今天5:35

《印度的多域作战：条令与能力发展》报告

《印度的多域作战：条令与能力发展》报告

专知会员服务

2+阅读 · 今天5:24

《是“修复情报”还是修复部队？阿富汗反叛乱行动中的美军情报调整》400页

《是“修复情报”还是修复部队？阿富汗反叛乱行动中的美军情报调整》400页

专知会员服务

2+阅读 · 今天5:18

美军的算法化军备库：无人机优势计划（DDP）、复制者倡议（Replicator）与联合全域指挥控制（JADC2）如何重写战争规则

美军的算法化军备库：无人机优势计划（DDP）、复制者倡议（Replicator）与联合全域指挥控制（JADC2）如何重写战争规则

专知会员服务

2+阅读 · 今天3:25

（中文版）美空军部发布《空军部数据战略》与《人工智能战略》两份战略：旨在加速建立军事优势

（中文版）美空军部发布《空军部数据战略》与《人工智能战略》两份战略：旨在加速建立军事优势

专知会员服务

13+阅读 · 今天2:55

【斯坦福博士论文】语言模型的机械可解释性与控制

【斯坦福博士论文】语言模型的机械可解释性与控制

专知会员服务

3+阅读 · 4月23日

大语言模型智能体长期记忆安全性综述：迈向记忆主权

大语言模型智能体长期记忆安全性综述：迈向记忆主权

专知会员服务

3+阅读 · 4月23日

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

专知会员服务

4+阅读 · 4月23日

人工智能赋能无人机：俄乌战争（万字长文）

人工智能赋能无人机：俄乌战争（万字长文）

专知会员服务

6+阅读 · 4月23日

国外海军作战管理系统与作战训练系统

国外海军作战管理系统与作战训练系统

专知会员服务

3+阅读 · 4月23日

相关VIP内容

医学图像分割中的通用模型：与任务特定方法的综述与性能比较

医学图像分割中的通用模型：与任务特定方法的综述与性能比较

专知会员服务

13+阅读 · 2025年6月13日

【阿姆斯特丹博士论文】深度学习在医疗数据中的应用

【阿姆斯特丹博士论文】深度学习在医疗数据中的应用

专知会员服务

25+阅读 · 2024年7月18日

【阿姆斯特丹博士论文】医学数据的深度学习

【阿姆斯特丹博士论文】医学数据的深度学习

专知会员服务

25+阅读 · 2024年6月24日

【斯坦福博士论文】高效鲁棒的深度学习在医学影像和自然语言处理中的应用，112页pdf

【斯坦福博士论文】高效鲁棒的深度学习在医学影像和自然语言处理中的应用，112页pdf

专知会员服务

22+阅读 · 2024年1月27日

【NUS博士论文】深度表示学习的视频基础模型，236页pdf

【NUS博士论文】深度表示学习的视频基础模型，236页pdf

专知会员服务

33+阅读 · 2023年12月26日

「可解释深度学习在神经影像学」中的应用全面综述，109页pdf

「可解释深度学习在神经影像学」中的应用全面综述，109页pdf

专知会员服务

58+阅读 · 2023年7月20日

什么是深度图生成模型？剑桥大学博士生Chaitanya K. Joshi最新讲授! 附17页ppt

什么是深度图生成模型？剑桥大学博士生Chaitanya K. Joshi最新讲授! 附17页ppt

专知会员服务

35+阅读 · 2023年2月23日

【滑铁卢大学】医学图像分析中可解释的深度学习模型，18页pdf

【滑铁卢大学】医学图像分析中可解释的深度学习模型，18页pdf

专知会员服务

121+阅读 · 2020年5月31日

【贝叶斯深度学习：一种基于模型的可解释方法】Bayesian deep learning: A model-based interpretable approach

【贝叶斯深度学习：一种基于模型的可解释方法】Bayesian deep learning: A model-based interpretable approach

专知会员服务

49+阅读 · 2020年1月1日

【图像分割| 2019最新综述】理解图像分割的深度学习技术，附58页PDF（Understanding Deep Learning Techniques for Image Segmentation）

【图像分割| 2019最新综述】理解图像分割的深度学习技术，附58页PDF（Understanding Deep Learning Techniques for Image Segmentation）

专知会员服务

59+阅读 · 2019年11月16日

热门VIP内容

开通专知VIP会员享更多权益服务

战场之外的较量：美伊冲突中的认知战与心理博弈

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

以色列军事技术对美国军力发展的持续性赋能

俄乌战争中乌克兰防空能力演变与见解（中文版）

相关资讯

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

一网打尽！深度学习100+经典模型TensorFlow与Pytorch代码实现大集合

一网打尽！深度学习100+经典模型TensorFlow与Pytorch代码实现大集合

专知

34+阅读 · 2020年1月3日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

专知

14+阅读 · 2019年10月31日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

高赞人气资源！集结数百篇顶会论文，由浅入深让你吃透图深度学习

高赞人气资源！集结数百篇顶会论文，由浅入深让你吃透图深度学习

量子位

10+阅读 · 2019年7月7日

深度学习与医学图像分析

深度学习与医学图像分析

人工智能前沿讲习班

40+阅读 · 2019年6月8日

收藏 | Tensorflow实现的深度NLP模型集锦（附资源）

收藏 | Tensorflow实现的深度NLP模型集锦（附资源）

THU数据派

12+阅读 · 2019年4月28日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

干货｜基于图卷积网络的图深度学习

干货｜基于图卷积网络的图深度学习

DataCanvas大数据云平台

10+阅读 · 2017年6月8日

相关论文

Concurrent training methods for Kolmogorov-Arnold networks: Disjoint datasets and FPGA implementation

Arxiv

0+阅读 · 3月7日

FEKAN: Feature-Enriched Kolmogorov-Arnold Networks

Arxiv

0+阅读 · 2月18日

Batch-CAM: Introduction to better reasoning in convolutional deep learning models

Arxiv

0+阅读 · 2月13日

Efficient Graph Knowledge Distillation from GNNs to Kolmogorov--Arnold Networks via Self-Attention Dynamic Sampling

Arxiv

0+阅读 · 2月9日

A hybrid Kolmogorov-Arnold network for medical image segmentation

Arxiv

0+阅读 · 2月7日

Physical Analog Kolmogorov-Arnold Networks based on Reconfigurable Nonlinear-Processing Units

Arxiv

0+阅读 · 2月7日

MedMO: Grounding and Understanding Multimodal Large Language Model for Medical Images

Arxiv

1+阅读 · 2月6日

MRD: Using Physically Based Differentiable Rendering to Probe Vision Models for 3D Scene Understanding

Arxiv

0+阅读 · 2月5日

Ultrafast On-chip Online Learning via Spline Locality in Kolmogorov-Arnold Networks

Arxiv

0+阅读 · 2月2日

Optimization, Generalization and Differential Privacy Bounds for Gradient Descent on Kolmogorov-Arnold Networks

Arxiv

0+阅读 · 1月29日

相关基金

基于压缩感知理论的图像采样、编码和重建研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于高阶信息和深度表示的图像复原研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于极限学习单元的多生物特征图像深度学习建模与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于草图的几何处理和应用

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

云平台中可优化分析操作的海量医学图像存储管理技术

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员