基于数据增强的多模态特征融合用于口腔癌病变多类别视觉识别 (Data-Augmented Multimodal Feature Fusion for Multiclass Visual Recognition of Oral Cancer Lesions) - 专知论文

会员服务 ·

0

模态 · 多模 · 融合 · 识别 · 特征融合 ·

Data-Augmented Multimodal Feature Fusion for Multiclass Visual Recognition of Oral Cancer Lesions

翻译：基于数据增强的多模态特征融合用于口腔癌病变多类别视觉识别

Joy Naoum,Revana Salama,Ali Hamdi

Oral cancer is frequently diagnosed at later stages due to its similarity to other lesions. Existing research on computer aided diagnosis has made progress using deep learning; however, most approaches remain limited by small, imbalanced datasets and a dependence on single-modality features, which restricts model generalization in real-world clinical settings. To address these limitations, this study proposes a novel data-augmentation driven multimodal feature-fusion framework integrated within a (Vision Recognition)VR assisted oral cancer recognition system. Our method combines extensive data centric augmentation with fused clinical and image-based representations to enhance model robustness and reduce diagnostic ambiguity. Using a stratified training pipeline and an EfficientNetV2 B1 backbone, the system improves feature diversity, mitigates imbalance, and strengthens the learned multimodal embeddings. Experimental evaluation demonstrates that the proposed framework achieves an overall accuracy of 82.57 percent on 2 classes, 65.13 percent on 3 classes, and 54.97 percent on 4 classes, outperforming traditional single stream CNN models. These results highlight the effectiveness of multimodal feature fusion combined with strategic augmentation for reliable early oral cancer lesion recognition and serve as a foundation for immersive VR based clinical decision support tools.

翻译：口腔癌因其与其他病变的相似性，常在晚期才被诊断。现有计算机辅助诊断研究利用深度学习已取得进展；然而，大多数方法仍受限于小型、不平衡的数据集以及对单模态特征的依赖，这限制了模型在真实临床环境中的泛化能力。为解决这些局限，本研究提出一种新颖的数据增强驱动的多模态特征融合框架，并将其集成于（视觉识别）VR辅助的口腔癌识别系统中。我们的方法结合了以数据为中心的大规模增强与融合的临床及基于图像的表征，以增强模型鲁棒性并减少诊断歧义。通过采用分层训练流程和EfficientNetV2 B1主干网络，该系统提升了特征多样性，缓解了数据不平衡问题，并强化了学习到的多模态嵌入。实验评估表明，所提框架在2分类任务上达到82.57%的整体准确率，在3分类任务上达到65.13%，在4分类任务上达到54.97%，性能优于传统的单流CNN模型。这些结果凸显了多模态特征融合与策略性数据增强相结合对于实现可靠早期口腔癌病变识别的有效性，并为基于沉浸式VR的临床决策支持工具奠定了基础。

0

相关内容

使用多模态大语言模型进行深度学习的图像、文本和语音数据增强：综述

使用多模态大语言模型进行深度学习的图像、文本和语音数据增强：综述

专知会员服务

28+阅读 · 2025年2月4日

深度多模态数据融合

深度多模态数据融合

专知会员服务

55+阅读 · 2024年11月9日

【ETHZ博士论文】利用多模态数据在计算机视觉中的应用，涉及超分辨率和分类

【ETHZ博士论文】利用多模态数据在计算机视觉中的应用，涉及超分辨率和分类

专知会员服务

42+阅读 · 2023年11月16日

Cancer Cell综述｜AI用于肿瘤学中的多模态数据集成

Cancer Cell综述｜AI用于肿瘤学中的多模态数据集成

专知会员服务

35+阅读 · 2022年10月13日

【Scientific Reports】《多中心影像诊断的联邦学习：心血管疾病的模拟研究》

【Scientific Reports】《多中心影像诊断的联邦学习：心血管疾病的模拟研究》

专知会员服务

20+阅读 · 2022年8月4日

视觉Transformer预训练模型的胸腔X线影像多标签分类

视觉Transformer预训练模型的胸腔X线影像多标签分类

专知会员服务

14+阅读 · 2022年7月29日

深度学习在癌症诊断、预后和治疗选择中的应用

深度学习在癌症诊断、预后和治疗选择中的应用

专知会员服务

56+阅读 · 2022年6月18日

多模态深度学习在生物医学数据融合中的应用研究进展

多模态深度学习在生物医学数据融合中的应用研究进展

专知会员服务

62+阅读 · 2022年5月31日

人工智能技术在口腔正畸诊疗中的应用研究进展

人工智能技术在口腔正畸诊疗中的应用研究进展

专知会员服务

14+阅读 · 2022年5月1日

【AI与医学】多模态机器学习精准医疗健康

【AI与医学】多模态机器学习精准医疗健康

专知会员服务

82+阅读 · 2022年4月25日

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

专知

14+阅读 · 2022年5月31日

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

专知

16+阅读 · 2022年5月3日

【AI与医学】多模态机器学习精准医疗健康

【AI与医学】多模态机器学习精准医疗健康

专知

17+阅读 · 2022年4月25日

基于深度学习的数据融合方法研究综述

基于深度学习的数据融合方法研究综述

专知

37+阅读 · 2020年12月10日

专家报告 | 融合数据先验知识的智能图像增强

专家报告 | 融合数据先验知识的智能图像增强

中国图象图形学报

16+阅读 · 2020年5月25日

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

专知

53+阅读 · 2019年12月1日

专家报告|深度学习+图像多模态融合

专家报告|深度学习+图像多模态融合

中国图象图形学报

12+阅读 · 2019年10月23日

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

专知

43+阅读 · 2019年7月10日

CVPR最新医学影像AI论文：利用学习图像变换进行数据增强

CVPR最新医学影像AI论文：利用学习图像变换进行数据增强

AI掘金志

36+阅读 · 2019年3月4日

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

专知

18+阅读 · 2017年11月24日

面向癌症精准诊疗的高密度微腔阵列式多重数字PCR芯片

国家自然科学基金

2+阅读 · 2017年12月31日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

基于多关联数据融合的疾病相似度算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

3D平移不变剪切波域统计相关性驱动的多模态医学图像融合方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向肺癌临床辅助诊疗决策的多模态数据融合分析关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

融合多组学数据优化筛选恶性肿瘤中表观失调非编码RNA及其功能研究

国家自然科学基金

0+阅读 · 2015年12月31日

一种乳腺癌分子特异性手术导航成像方法

国家自然科学基金

1+阅读 · 2015年12月31日

基于多模态脑影像处理和多维可视化的辅助诊疗技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

基于多模态医学图像处理的多维可视化辅助诊疗关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于诊疗一体化智能纳米探针的影像导航的肿瘤光热治疗研究

国家自然科学基金

0+阅读 · 2014年12月31日

A Unified Multimodal Framework for Dataset Construction and Model-Based Diagnosis of Ameloblastoma

Arxiv

0+阅读 · 2月5日

Patient-Aware Multimodal RGB-HSI Fusion via Incremental Heuristic Meta-Learning for Oral Lesion Classification

Arxiv

0+阅读 · 2月4日

Glance and Focus Reinforcement for Pan-cancer Screening

Arxiv

0+阅读 · 2月2日

Knowledge-enhanced Pretraining for Vision-language Pathology Foundation Model on Cancer Diagnosis

Arxiv

0+阅读 · 1月27日

Generative Diffusion Augmentation with Quantum-Enhanced Discrimination for Medical Image Diagnosis

Arxiv

0+阅读 · 1月26日

Transfer Learning from One Cancer to Another via Deep Learning Domain Adaptation

Arxiv

0+阅读 · 1月21日

MMedExpert-R1: Strengthening Multimodal Medical Reasoning via Domain-Specific Adaptation and Clinical Guideline Reinforcement

Arxiv

0+阅读 · 1月16日

Generating crossmodal gene expression from cancer histopathology improves multimodal AI predictions

Arxiv

0+阅读 · 1月13日

Multi-Modal AI for Remote Patient Monitoring in Cancer Care

Arxiv

0+阅读 · 1月8日

G2L:From Giga-Scale to Cancer-Specific Large-Scale Pathology Foundation Models via Knowledge Distillation

G2L:From Giga-Scale to Cancer-Specific Large-Scale Pathology Foundation Models via Knowledge Distillation

Arxiv

0+阅读 · 1月5日

VIP会员

文章信息

相关主题

相关VIP内容

使用多模态大语言模型进行深度学习的图像、文本和语音数据增强：综述

使用多模态大语言模型进行深度学习的图像、文本和语音数据增强：综述

专知会员服务

28+阅读 · 2025年2月4日

深度多模态数据融合

深度多模态数据融合

专知会员服务

55+阅读 · 2024年11月9日

【ETHZ博士论文】利用多模态数据在计算机视觉中的应用，涉及超分辨率和分类

【ETHZ博士论文】利用多模态数据在计算机视觉中的应用，涉及超分辨率和分类

专知会员服务

42+阅读 · 2023年11月16日

Cancer Cell综述｜AI用于肿瘤学中的多模态数据集成

Cancer Cell综述｜AI用于肿瘤学中的多模态数据集成

专知会员服务

35+阅读 · 2022年10月13日

【Scientific Reports】《多中心影像诊断的联邦学习：心血管疾病的模拟研究》

【Scientific Reports】《多中心影像诊断的联邦学习：心血管疾病的模拟研究》

专知会员服务

20+阅读 · 2022年8月4日

视觉Transformer预训练模型的胸腔X线影像多标签分类

视觉Transformer预训练模型的胸腔X线影像多标签分类

专知会员服务

14+阅读 · 2022年7月29日

深度学习在癌症诊断、预后和治疗选择中的应用

深度学习在癌症诊断、预后和治疗选择中的应用

专知会员服务

56+阅读 · 2022年6月18日

多模态深度学习在生物医学数据融合中的应用研究进展

多模态深度学习在生物医学数据融合中的应用研究进展

专知会员服务

62+阅读 · 2022年5月31日

人工智能技术在口腔正畸诊疗中的应用研究进展

人工智能技术在口腔正畸诊疗中的应用研究进展

专知会员服务

14+阅读 · 2022年5月1日

【AI与医学】多模态机器学习精准医疗健康

【AI与医学】多模态机器学习精准医疗健康

专知会员服务

82+阅读 · 2022年4月25日

热门VIP内容

开通专知VIP会员享更多权益服务

论学习、公平性与复杂度

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

2025中国人工智能学会系列白皮书⸺棋盘上的人工智能|附下载

通用智能体评估的逻辑架构

相关资讯

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

专知

14+阅读 · 2022年5月31日

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

专知

16+阅读 · 2022年5月3日

【AI与医学】多模态机器学习精准医疗健康

【AI与医学】多模态机器学习精准医疗健康

专知

17+阅读 · 2022年4月25日

基于深度学习的数据融合方法研究综述

基于深度学习的数据融合方法研究综述

专知

37+阅读 · 2020年12月10日

专家报告 | 融合数据先验知识的智能图像增强

专家报告 | 融合数据先验知识的智能图像增强

中国图象图形学报

16+阅读 · 2020年5月25日

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

专知

53+阅读 · 2019年12月1日

专家报告|深度学习+图像多模态融合

专家报告|深度学习+图像多模态融合

中国图象图形学报

12+阅读 · 2019年10月23日

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

专知

43+阅读 · 2019年7月10日

CVPR最新医学影像AI论文：利用学习图像变换进行数据增强

CVPR最新医学影像AI论文：利用学习图像变换进行数据增强

AI掘金志

36+阅读 · 2019年3月4日

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

专知

18+阅读 · 2017年11月24日

相关论文

A Unified Multimodal Framework for Dataset Construction and Model-Based Diagnosis of Ameloblastoma

Arxiv

0+阅读 · 2月5日

Patient-Aware Multimodal RGB-HSI Fusion via Incremental Heuristic Meta-Learning for Oral Lesion Classification

Arxiv

0+阅读 · 2月4日

Glance and Focus Reinforcement for Pan-cancer Screening

Arxiv

0+阅读 · 2月2日

Knowledge-enhanced Pretraining for Vision-language Pathology Foundation Model on Cancer Diagnosis

Arxiv

0+阅读 · 1月27日

Generative Diffusion Augmentation with Quantum-Enhanced Discrimination for Medical Image Diagnosis

Arxiv

0+阅读 · 1月26日

Transfer Learning from One Cancer to Another via Deep Learning Domain Adaptation

Arxiv

0+阅读 · 1月21日

MMedExpert-R1: Strengthening Multimodal Medical Reasoning via Domain-Specific Adaptation and Clinical Guideline Reinforcement

Arxiv

0+阅读 · 1月16日

Generating crossmodal gene expression from cancer histopathology improves multimodal AI predictions

Arxiv

0+阅读 · 1月13日

Multi-Modal AI for Remote Patient Monitoring in Cancer Care

Arxiv

0+阅读 · 1月8日

G2L:From Giga-Scale to Cancer-Specific Large-Scale Pathology Foundation Models via Knowledge Distillation

G2L:From Giga-Scale to Cancer-Specific Large-Scale Pathology Foundation Models via Knowledge Distillation

Arxiv

0+阅读 · 1月5日

相关基金

面向癌症精准诊疗的高密度微腔阵列式多重数字PCR芯片

国家自然科学基金

2+阅读 · 2017年12月31日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

基于多关联数据融合的疾病相似度算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

3D平移不变剪切波域统计相关性驱动的多模态医学图像融合方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向肺癌临床辅助诊疗决策的多模态数据融合分析关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

融合多组学数据优化筛选恶性肿瘤中表观失调非编码RNA及其功能研究

国家自然科学基金

0+阅读 · 2015年12月31日

一种乳腺癌分子特异性手术导航成像方法

国家自然科学基金

1+阅读 · 2015年12月31日

基于多模态脑影像处理和多维可视化的辅助诊疗技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

基于多模态医学图像处理的多维可视化辅助诊疗关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于诊疗一体化智能纳米探针的影像导航的肿瘤光热治疗研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员