Patient-Aware Multimodal RGB-HSI Fusion via Incremental Heuristic Meta-Learning for Oral Lesion Classification - 专知论文

会员服务 ·

0

融合 · 启发式 · 多模 · 模态 · 提取 ·

Patient-Aware Multimodal RGB-HSI Fusion via Incremental Heuristic Meta-Learning for Oral Lesion Classification

翻译：基于增量启发式元学习的患者感知多模态RGB-HSI融合用于口腔病灶分类

Rupam Mukherjee,Rajkumar Daniel,Soujanya Hazra,Shirin Dasgupta,Subhamoy Mandal

from arxiv, 6 pages, 3 figures, 2 tables

Early detection of oral cancer and potentially malignant diseases is a major challenge in low-resource settings due to the scarcity of annotated data. We provide a unified approach for four-class oral lesion classification that incorporates deep learning, spectral analysis, and demographic data. A pathologist-verified subset of oral cavity images was curated from a publicly available dataset. Oral cavity pictures were processed using a fine-tuned ConvNeXt-v2 network for deep embeddings before being translated into the hyperspectral domain using a reconstruction algorithm. Haemoglobin-sensitive, textural, and spectral descriptors were obtained from the reconstructed hyperspectral cubes and combined with demographic data. Multiple machine-learning models were evaluated using patient-specific validation. Finally, an incremental heuristic meta-learner (IHML) was developed that merged calibrated base classifiers via probabilistic feature stacking and uncertainty-aware abstraction of multimodal representations with patient-level smoothing. By decoupling evidence extraction from decision fusion, IHML stabilizes predictions in heterogeneous, small-sample medical datasets. On an unseen test set, our proposed model achieved a macro F1 of 66.23% and an overall accuracy of 64.56%. The findings demonstrate that RGB-to-hyperspectral reconstruction and ensemble meta-learning improve diagnostic robustness in real-world oral lesion screening.

翻译：在低资源环境中，由于标注数据稀缺，口腔癌及潜在恶性疾病的早期检测是一项重大挑战。本文提出了一种融合深度学习、光谱分析和人口统计学数据的四类口腔病灶分类统一方法。我们从公开数据集中筛选出经病理学家验证的口腔图像子集。口腔图像首先通过微调的ConvNeXt-v2网络提取深度嵌入特征，随后利用重建算法将其转换至高光谱域。从重建的高光谱立方体中提取血红蛋白敏感特征、纹理特征和光谱描述符，并与人口统计学数据相结合。采用患者特异性验证策略评估了多种机器学习模型。最终，我们提出了一种增量启发式元学习器（IHML），该模型通过概率特征堆叠与多模态表征的不确定性感知抽象，结合患者级平滑技术，融合了经过校准的基础分类器。IHML通过将证据提取与决策融合解耦，稳定了异构小样本医学数据集中的预测结果。在未见测试集上，我们提出的模型取得了66.23%的宏F1分数和64.56%的总准确率。研究结果表明，RGB至高光谱重建与集成元学习方法能够提升实际口腔病灶筛查中的诊断鲁棒性。

0

相关内容

Transformer 驱动的图像分类研究进展综述

Transformer 驱动的图像分类研究进展综述

专知会员服务

55+阅读 · 2023年2月24日

Cancer Cell综述｜AI用于肿瘤学中的多模态数据集成

Cancer Cell综述｜AI用于肿瘤学中的多模态数据集成

专知会员服务

35+阅读 · 2022年10月13日

视觉Transformer预训练模型的胸腔X线影像多标签分类

视觉Transformer预训练模型的胸腔X线影像多标签分类

专知会员服务

14+阅读 · 2022年7月29日

多模态深度学习在生物医学数据融合中的应用研究进展

多模态深度学习在生物医学数据融合中的应用研究进展

专知会员服务

62+阅读 · 2022年5月31日

人工智能技术在口腔正畸诊疗中的应用研究进展

人工智能技术在口腔正畸诊疗中的应用研究进展

专知会员服务

14+阅读 · 2022年5月1日

【北理&哈佛】图多模态学习的疾病关系提取

【北理&哈佛】图多模态学习的疾病关系提取

专知会员服务

33+阅读 · 2022年4月15日

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

专知会员服务

27+阅读 · 2022年3月22日

细粒度图像分类的深度学习方法

细粒度图像分类的深度学习方法

专知会员服务

43+阅读 · 2021年10月18日

【论文推荐】用于低资源药物发现的元学习初始化，Meta-Learning Initializations for Low-Resource Drug Discovery

【论文推荐】用于低资源药物发现的元学习初始化，Meta-Learning Initializations for Low-Resource Drug Discovery

专知会员服务

27+阅读 · 2020年3月26日

【元学习 | 论文】元学习聚类，Meta-Learning to Cluster，哥伦比亚大学

【元学习 | 论文】元学习聚类，Meta-Learning to Cluster，哥伦比亚大学

专知会员服务

42+阅读 · 2019年11月21日

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

专知

14+阅读 · 2022年5月31日

【AI与医学】多模态机器学习精准医疗健康

【AI与医学】多模态机器学习精准医疗健康

专知

17+阅读 · 2022年4月25日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

基于深度学习的医学图像半监督分割

基于深度学习的医学图像半监督分割

CVer

14+阅读 · 2020年9月24日

小样本也能增量学习？CVPR 2020 Oral最新干货：小样本类增量学习

小样本也能增量学习？CVPR 2020 Oral最新干货：小样本类增量学习

CVer

54+阅读 · 2020年5月1日

【CVPR2020-中科院-腾讯优图】基于注意力卷积二叉神经树的细粒度视觉分类

【CVPR2020-中科院-腾讯优图】基于注意力卷积二叉神经树的细粒度视觉分类

专知

12+阅读 · 2020年3月29日

美国埃默里大学医学院发布最新「医学图像配准深度学习」综述论文

美国埃默里大学医学院发布最新「医学图像配准深度学习」综述论文

专知

15+阅读 · 2020年1月7日

专家报告|深度学习+图像多模态融合

专家报告|深度学习+图像多模态融合

中国图象图形学报

12+阅读 · 2019年10月23日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

专知

17+阅读 · 2018年3月3日

面向癌症精准诊疗的高密度微腔阵列式多重数字PCR芯片

国家自然科学基金

2+阅读 · 2017年12月31日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

釉原蛋白Exons 8和9联合编码多肽促进口腔黏膜创伤愈合的机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多关联数据融合的疾病相似度算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于核酸分子门控染料释放的多色荧光信号同时获取传感器阵列用于肿瘤标志物检测

国家自然科学基金

0+阅读 · 2015年12月31日

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于荧光纳米簇的“关开”型FRET传感器用于血清中多种肿瘤标志物同时检测

国家自然科学基金

0+阅读 · 2015年12月31日

基于多色银纳米簇-石墨烯组装体系的多通道特异性癌细胞检测

国家自然科学基金

0+阅读 · 2015年12月31日

VEGFA rs2010963多态性与放射性口腔黏膜炎的关联机制及应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于自学习对比度视觉注意模型和自适应深度特征的无分类目标检测

国家自然科学基金

2+阅读 · 2015年12月31日

IOSVLM: A 3D Vision-Language Model for Unified Dental Diagnosis from Intraoral Scans

Arxiv

0+阅读 · 3月17日

A multimodal slice discovery framework for systematic failure detection and explanation in medical image classification

Arxiv

0+阅读 · 2月27日

Multi-Modal Representation Learning via Semi-Supervised Rate Reduction for Generalized Category Discovery

Arxiv

0+阅读 · 2月23日

RetinaVision: XAI-Driven Augmented Regulation for Precise Retinal Disease Classification using deep learning framework

Arxiv

0+阅读 · 2月22日

HyPCA-Net: Advancing Multimodal Fusion in Medical Image Analysis

Arxiv

0+阅读 · 2月18日

Scalable Residual Feature Aggregation Framework with Hybrid Metaheuristic Optimization for Robust Early Pancreatic Neoplasm Detection in Multimodal CT Imaging

Arxiv

0+阅读 · 2月18日

Multiscale Vector-Quantized Variational Autoencoder for Endoscopic Image Synthesis

Arxiv

0+阅读 · 2月12日

Unbalanced optimal transport for robust longitudinal lesion evolution with registration-aware and appearance-guided priors

Arxiv

0+阅读 · 2月10日

A Unified Multimodal Framework for Dataset Construction and Model-Based Diagnosis of Ameloblastoma

Arxiv

0+阅读 · 2月5日

Quasi-multimodal-based pathophysiological feature learning for retinal disease diagnosis

Arxiv

0+阅读 · 2月3日

VIP会员

文章信息

相关主题

最新内容

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

1+阅读 · 今天15:03

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

0+阅读 · 今天14:31

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

0+阅读 · 今天14:29

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

12+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

4+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

7+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

8+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

11+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

12+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

8+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

21+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

10+阅读 · 6月17日

相关VIP内容

Transformer 驱动的图像分类研究进展综述

Transformer 驱动的图像分类研究进展综述

专知会员服务

55+阅读 · 2023年2月24日

Cancer Cell综述｜AI用于肿瘤学中的多模态数据集成

Cancer Cell综述｜AI用于肿瘤学中的多模态数据集成

专知会员服务

35+阅读 · 2022年10月13日

视觉Transformer预训练模型的胸腔X线影像多标签分类

视觉Transformer预训练模型的胸腔X线影像多标签分类

专知会员服务

14+阅读 · 2022年7月29日

多模态深度学习在生物医学数据融合中的应用研究进展

多模态深度学习在生物医学数据融合中的应用研究进展

专知会员服务

62+阅读 · 2022年5月31日

人工智能技术在口腔正畸诊疗中的应用研究进展

人工智能技术在口腔正畸诊疗中的应用研究进展

专知会员服务

14+阅读 · 2022年5月1日

【北理&哈佛】图多模态学习的疾病关系提取

【北理&哈佛】图多模态学习的疾病关系提取

专知会员服务

33+阅读 · 2022年4月15日

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

专知会员服务

27+阅读 · 2022年3月22日

细粒度图像分类的深度学习方法

细粒度图像分类的深度学习方法

专知会员服务

43+阅读 · 2021年10月18日

【论文推荐】用于低资源药物发现的元学习初始化，Meta-Learning Initializations for Low-Resource Drug Discovery

【论文推荐】用于低资源药物发现的元学习初始化，Meta-Learning Initializations for Low-Resource Drug Discovery

专知会员服务

27+阅读 · 2020年3月26日

【元学习 | 论文】元学习聚类，Meta-Learning to Cluster，哥伦比亚大学

【元学习 | 论文】元学习聚类，Meta-Learning to Cluster，哥伦比亚大学

专知会员服务

42+阅读 · 2019年11月21日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

美国从乌克兰无人机战争中学习经验

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

相关资讯

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

专知

14+阅读 · 2022年5月31日

【AI与医学】多模态机器学习精准医疗健康

【AI与医学】多模态机器学习精准医疗健康

专知

17+阅读 · 2022年4月25日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

基于深度学习的医学图像半监督分割

基于深度学习的医学图像半监督分割

CVer

14+阅读 · 2020年9月24日

小样本也能增量学习？CVPR 2020 Oral最新干货：小样本类增量学习

小样本也能增量学习？CVPR 2020 Oral最新干货：小样本类增量学习

CVer

54+阅读 · 2020年5月1日

【CVPR2020-中科院-腾讯优图】基于注意力卷积二叉神经树的细粒度视觉分类

【CVPR2020-中科院-腾讯优图】基于注意力卷积二叉神经树的细粒度视觉分类

专知

12+阅读 · 2020年3月29日

美国埃默里大学医学院发布最新「医学图像配准深度学习」综述论文

美国埃默里大学医学院发布最新「医学图像配准深度学习」综述论文

专知

15+阅读 · 2020年1月7日

专家报告|深度学习+图像多模态融合

专家报告|深度学习+图像多模态融合

中国图象图形学报

12+阅读 · 2019年10月23日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

专知

17+阅读 · 2018年3月3日

相关论文

IOSVLM: A 3D Vision-Language Model for Unified Dental Diagnosis from Intraoral Scans

Arxiv

0+阅读 · 3月17日

A multimodal slice discovery framework for systematic failure detection and explanation in medical image classification

Arxiv

0+阅读 · 2月27日

Multi-Modal Representation Learning via Semi-Supervised Rate Reduction for Generalized Category Discovery

Arxiv

0+阅读 · 2月23日

RetinaVision: XAI-Driven Augmented Regulation for Precise Retinal Disease Classification using deep learning framework

Arxiv

0+阅读 · 2月22日

HyPCA-Net: Advancing Multimodal Fusion in Medical Image Analysis

Arxiv

0+阅读 · 2月18日

Scalable Residual Feature Aggregation Framework with Hybrid Metaheuristic Optimization for Robust Early Pancreatic Neoplasm Detection in Multimodal CT Imaging

Arxiv

0+阅读 · 2月18日

Multiscale Vector-Quantized Variational Autoencoder for Endoscopic Image Synthesis

Arxiv

0+阅读 · 2月12日

Unbalanced optimal transport for robust longitudinal lesion evolution with registration-aware and appearance-guided priors

Arxiv

0+阅读 · 2月10日

A Unified Multimodal Framework for Dataset Construction and Model-Based Diagnosis of Ameloblastoma

Arxiv

0+阅读 · 2月5日

Quasi-multimodal-based pathophysiological feature learning for retinal disease diagnosis

Arxiv

0+阅读 · 2月3日

相关基金

面向癌症精准诊疗的高密度微腔阵列式多重数字PCR芯片

国家自然科学基金

2+阅读 · 2017年12月31日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

釉原蛋白Exons 8和9联合编码多肽促进口腔黏膜创伤愈合的机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多关联数据融合的疾病相似度算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于核酸分子门控染料释放的多色荧光信号同时获取传感器阵列用于肿瘤标志物检测

国家自然科学基金

0+阅读 · 2015年12月31日

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于荧光纳米簇的“关开”型FRET传感器用于血清中多种肿瘤标志物同时检测

国家自然科学基金

0+阅读 · 2015年12月31日

基于多色银纳米簇-石墨烯组装体系的多通道特异性癌细胞检测

国家自然科学基金

0+阅读 · 2015年12月31日

VEGFA rs2010963多态性与放射性口腔黏膜炎的关联机制及应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于自学习对比度视觉注意模型和自适应深度特征的无分类目标检测

国家自然科学基金

2+阅读 · 2015年12月31日

微信扫码咨询专知VIP会员