Increasing evidence supports watch-and-wait (WW) surveillance for patients with rectal cancer who show clinical complete response (cCR) at restaging following total neoadjuvant treatment (TNT). However, accurate methods to early detect local regrowth (LR) from follow-up endoscopy images during WW are essential to manage care and prevent distant metastases. Hence, we developed a Siamese Swin Transformer with Dual Cross-Attention (SSDCA) to combine longitudinal endoscopic images at restaging and follow-up and distinguish cCR from LR. SSDCA leverages pretrained Swin Transformers to extract domain agnostic features and enhance robustness to imaging variations. Dual cross attention is implemented to emphasize features from the paired scans without requiring any spatial alignment to predict response. SSDCA as well as Swin-based baselines were trained using image pairs from 135 patients and evaluated on a held-out set of image pairs from 62 patients. SSDCA produced the best balanced accuracy (81.76% $\pm$ 0.04), sensitivity (90.07% $\pm$ 0.08), and specificity (72.86% $\pm$ 0.05). Robustness analysis showed stable performance irrespective of artifacts including blood, stool, telangiectasia, and poor image quality. UMAP clustering of extracted features showed maximal inter-cluster separation (1.45 $\pm$ 0.18) and minimal intra-cluster dispersion (1.07 $\pm$ 0.19) with SSDCA, confirming discriminative representation learning. Code and weights available at: https://github.com/Jotanator/SSDCA


翻译:越来越多的证据支持接受全程新辅助治疗(TNT)后再次分期显示临床完全缓解(cCR)的直肠癌患者采用观察等待(WW)监测方案。然而,在WW期间通过随访内镜图像早期准确检测局部再生长(LR)对于管理治疗和预防远处转移至关重要。为此,我们开发了具有双交叉注意力机制的孪生Swin Transformer(SSDCA),用于结合再分期和随访时的纵向内镜图像,以区分cCR与LR。SSDCA利用预训练的Swin Transformer提取领域无关特征,增强对成像变化的鲁棒性。通过实现双交叉注意力机制,在无需任何空间配准的情况下突出配对扫描图像中的关键特征以预测应答。我们使用135例患者的图像对训练SSDCA及基于Swin的基线模型,并在62例患者的独立图像对测试集上进行评估。SSDCA取得了最佳平衡准确率(81.76% ± 0.04)、灵敏度(90.07% ± 0.08)和特异度(72.86% ± 0.05)。鲁棒性分析显示,无论存在血液、粪便、毛细血管扩张还是图像质量差的伪影,模型均保持稳定性能。对提取特征的UMAP聚类分析表明,SSDCA实现了最大簇间分离度(1.45 ± 0.18)和最小簇内离散度(1.07 ± 0.19),证实了其判别性表示学习能力。代码和权重可在https://github.com/Jotanator/SSDCA获取。

0
下载
关闭预览

相关内容

TransMLA:多头潜在注意力(MLA)即为所需
专知会员服务
23+阅读 · 2025年2月13日
【NeurIPS2024】注意力迁移对视觉Transformer的惊人有效性研究
《视觉Transformers自监督学习机制综述》
专知会员服务
29+阅读 · 2024年9月2日
【CVPR2023】BiFormer:基于双层路由注意力的视觉Transformer
专知会员服务
35+阅读 · 2023年3月20日
深度学习的下一步:Transformer和注意力机制
云头条
56+阅读 · 2019年9月14日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
综述 | 世界动作模型:少做梦,多行动
专知会员服务
4+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
7+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
4+阅读 · 6月23日
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
Top
微信扫码咨询专知VIP会员