知识增强的预训练用于癌症诊断的视觉-语言病理学基础模型 (Knowledge-enhanced Pretraining for Vision-language Pathology Foundation Model on Cancer Diagnosis) - 专知论文

会员服务 ·

0

知识 · 病理 · 癌症 · 知识增强 · 预训练 ·

Knowledge-enhanced Pretraining for Vision-language Pathology Foundation Model on Cancer Diagnosis

翻译：知识增强的预训练用于癌症诊断的视觉-语言病理学基础模型

Xiao Zhou,Luoyi Sun,Dexuan He,Wenbin Guan,Ge Wang,Ruifen Wang,Lifeng Wang,Xiaojun Yuan,Xin Sun,Ya Zhang,Kun Sun,Yanfeng Wang,Weidi Xie

from arxiv, V2: fixed typos, updated experimental results, added ablation

Vision-language foundation models have shown great promise in computational pathology but remain primarily data-driven, lacking explicit integration of medical knowledge. We introduce KEEP (KnowledgE-Enhanced Pathology), a foundation model that systematically incorporates disease knowledge into pretraining for cancer diagnosis. KEEP leverages a comprehensive disease knowledge graph encompassing 11,454 diseases and 139,143 attributes to reorganize millions of pathology image-text pairs into 143,000 semantically structured groups aligned with disease ontology hierarchies. This knowledge-enhanced pretraining aligns visual and textual representations within hierarchical semantic spaces, enabling deeper understanding of disease relationships and morphological patterns. Across 18 public benchmarks (over 14,000 whole-slide images) and 4 institutional rare cancer datasets (926 cases), KEEP consistently outperformed existing foundation models, showing substantial gains for rare subtypes. These results establish knowledge-enhanced vision-language modeling as a powerful paradigm for advancing computational pathology.

翻译：视觉-语言基础模型在计算病理学中展现出巨大潜力，但目前仍主要依赖数据驱动，缺乏对医学知识的显式整合。我们提出了KEEP（知识增强的病理学模型），这是一种在预训练中系统性地融入疾病知识以用于癌症诊断的基础模型。KEEP利用一个涵盖11,454种疾病和139,143个属性的全面疾病知识图谱，将数百万个病理图像-文本对重组为143,000个与疾病本体层次结构对齐的语义结构化组。这种知识增强的预训练在层次化语义空间内对齐视觉与文本表示，从而实现对疾病关系和形态学模式的更深入理解。在18个公共基准数据集（超过14,000张全切片图像）和4个机构罕见癌症数据集（926个病例）上，KEEP均持续优于现有基础模型，在罕见亚型上显示出显著提升。这些结果表明，知识增强的视觉-语言建模是推动计算病理学发展的强大范式。

0

相关内容

用于三维医学影像理解的综合语言–图像预训练

用于三维医学影像理解的综合语言–图像预训练

专知会员服务

7+阅读 · 2025年11月5日

基础模型促进医疗保健：挑战、机遇与未来发展方向

基础模型促进医疗保健：挑战、机遇与未来发展方向

专知会员服务

32+阅读 · 2024年4月5日

预训练模型如何用在视觉任务？南洋理工最新《视觉语言模型》综述，全面概述视觉语言模型方法体系

预训练模型如何用在视觉任务？南洋理工最新《视觉语言模型》综述，全面概述视觉语言模型方法体系

专知会员服务

53+阅读 · 2023年4月4日

「知识增强预训练语言模型」最新研究综述

「知识增强预训练语言模型」最新研究综述

专知会员服务

62+阅读 · 2022年11月18日

深度学习在癌症诊断、预后和治疗选择中的应用

深度学习在癌症诊断、预后和治疗选择中的应用

专知会员服务

56+阅读 · 2022年6月18日

【CIKM2021】用领域知识增强预训练语言模型的问题回答

【CIKM2021】用领域知识增强预训练语言模型的问题回答

专知会员服务

17+阅读 · 2021年11月18日

知识感知的预训练语言模型综述

专知会员服务

51+阅读 · 2021年9月25日

语言视觉预训练语言模型揭密，Behind the Scene: Revealing the Secrets of Pre-trained Vision-and-Language Models

语言视觉预训练语言模型揭密，Behind the Scene: Revealing the Secrets of Pre-trained Vision-and-Language Models

专知会员服务

36+阅读 · 2020年5月20日

【清华大学】知识增强的常识性故事生成预训练模型，A Knowledge-Enhanced Pretraining Model for Commonsense Story Generation

【清华大学】知识增强的常识性故事生成预训练模型，A Knowledge-Enhanced Pretraining Model for Commonsense Story Generation

专知会员服务

52+阅读 · 2020年1月20日

【ICLR2020 预训练的百科全书】弱监督的知识-预训练的语言模型（PRETRAINED ENCYCLOPEDIA: WEAKLY SUPERVISED KNOWLEDGE-PRETRAINED LANGUAGE MODEL）

【ICLR2020 预训练的百科全书】弱监督的知识-预训练的语言模型（PRETRAINED ENCYCLOPEDIA: WEAKLY SUPERVISED KNOWLEDGE-PRETRAINED LANGUAGE MODEL）

专知会员服务

25+阅读 · 2019年12月26日

「知识增强预训练语言模型」最新研究综述

「知识增强预训练语言模型」最新研究综述

专知

18+阅读 · 2022年11月18日

哈佛大学｜构建知识图谱PrimeKG以实现精准医疗--数据与代码全部公开，帮你从零开始复现知识图谱

哈佛大学｜构建知识图谱PrimeKG以实现精准医疗--数据与代码全部公开，帮你从零开始复现知识图谱

GenomicAI

29+阅读 · 2022年5月4日

专家报告 | 融合数据先验知识的智能图像增强

专家报告 | 融合数据先验知识的智能图像增强

中国图象图形学报

16+阅读 · 2020年5月25日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

预训练语言模型关系图+必读论文列表，清华荣誉出品

预训练语言模型关系图+必读论文列表，清华荣誉出品

机器之心

18+阅读 · 2019年10月11日

大讲堂 | 基于医疗知识的疾病诊断预测

大讲堂 | 基于医疗知识的疾病诊断预测

AI科技评论

10+阅读 · 2019年1月22日

自然语言处理中的语言模型预训练方法

自然语言处理中的语言模型预训练方法

PaperWeekly

14+阅读 · 2018年10月21日

深度学习在CTR预估中的应用 | CTR深度模型大盘点

深度学习在CTR预估中的应用 | CTR深度模型大盘点

PaperWeekly

15+阅读 · 2018年4月11日

【智能医疗】【知识图谱】中文电子病历命名实体识别的主动学习方法 | 病历智能分析系统的研究与实现 | 临床路径知识建模研究

【智能医疗】【知识图谱】中文电子病历命名实体识别的主动学习方法 | 病历智能分析系统的研究与实现 | 临床路径知识建模研究

产业智能官

29+阅读 · 2017年12月10日

医学知识图谱构建技术与研究进展

医学知识图谱构建技术与研究进展

全球人工智能

19+阅读 · 2017年11月13日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

视觉媒体的结构感知处理与分析模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于奇点光学的乳腺癌诊断技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

定量模型及在线智能引导的癌症筛查咨询方案优化验证

国家自然科学基金

2+阅读 · 2015年12月31日

基于磁共振动态增强灌注成像的肝癌血管生成拟态图像纹理特征提取与定量

国家自然科学基金

0+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

乳腺癌自我管理的行为机制及移动医疗智能管理模式的实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

癌症基因组中关键驱动突变信号通路的理论问题研究及算法设计

国家自然科学基金

0+阅读 · 2014年12月31日

社会化媒体环境下电子健康知识挖掘研究

国家自然科学基金

0+阅读 · 2014年12月31日

Boosting Medical Visual Understanding From Multi-Granular Language Learning

Boosting Medical Visual Understanding From Multi-Granular Language Learning

Arxiv

0+阅读 · 2月19日

Integrating Chain-of-Thought and Retrieval Augmented Generation Enhances Rare Disease Diagnosis from Clinical Notes

Integrating Chain-of-Thought and Retrieval Augmented Generation Enhances Rare Disease Diagnosis from Clinical Notes

Arxiv

0+阅读 · 2月18日

Fusing Pixels and Genes: Spatially-Aware Learning in Computational Pathology

Arxiv

0+阅读 · 2月15日

Unifying Multiple Foundation Models for Advanced Computational Pathology

Arxiv

0+阅读 · 2月13日

Improving Medical Visual Reinforcement Fine-Tuning via Perception and Reasoning Augmentation

Arxiv

0+阅读 · 2月11日

StainNet: Scaling Self-Supervised Foundation Models on Immunohistochemistry and Special Stains for Computational Pathology

Arxiv

0+阅读 · 2月4日

A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine

A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine

Arxiv

0+阅读 · 1月29日

PathReasoner-R1: Instilling Structured Reasoning into Pathology Vision-Language Model via Knowledge-Guided Policy Optimization

Arxiv

0+阅读 · 1月29日

Transfer Learning from One Cancer to Another via Deep Learning Domain Adaptation

Arxiv

0+阅读 · 1月21日

Generating crossmodal gene expression from cancer histopathology improves multimodal AI predictions

Arxiv

0+阅读 · 1月13日

VIP会员

文章信息

相关主题

最新内容

美国与以色列如何在攻击伊朗中使用人工智能

美国与以色列如何在攻击伊朗中使用人工智能

专知会员服务

2+阅读 · 今天16:20

《面向大语言模型引导规划、Bandit算法驱动探索与多智能体导航的分层决策问题研究》180页

《面向大语言模型引导规划、Bandit算法驱动探索与多智能体导航的分层决策问题研究》180页

专知会员服务

2+阅读 · 今天14:34

《自动化战略情报管控》

《自动化战略情报管控》

专知会员服务

1+阅读 · 今天14:31

《反无人机蜂群技术研究：基于小队策略构建大规模无人机防御》

《反无人机蜂群技术研究：基于小队策略构建大规模无人机防御》

专知会员服务

3+阅读 · 今天14:23

得失评估：审视对伊朗战争的轨迹（简报）

得失评估：审视对伊朗战争的轨迹（简报）

专知会员服务

2+阅读 · 今天14:19

【CMU博士论文】迈向可解释机器学习的理论基础

【CMU博士论文】迈向可解释机器学习的理论基础

专知会员服务

2+阅读 · 今天12:23

CVPR 2026 | HulluEdit：基于正交子空间编辑的多模态大语言模型幻觉缓解框架

CVPR 2026 | HulluEdit：基于正交子空间编辑的多模态大语言模型幻觉缓解框架

专知会员服务

2+阅读 · 今天12:21

无人机视觉语言导航：研究进展、挑战与技术路线图

无人机视觉语言导航：研究进展、挑战与技术路线图

专知会员服务

2+阅读 · 今天12:13

《基于强化学习的反无人机蜂群拦截优先级排序》

《基于强化学习的反无人机蜂群拦截优先级排序》

专知会员服务

8+阅读 · 今天8:20

乌克兰反无人机方案“天穹哨兵”解析：一款人工智能驱动的近程防空系统

乌克兰反无人机方案“天穹哨兵”解析：一款人工智能驱动的近程防空系统

专知会员服务

3+阅读 · 今天7:30

美军2026条令《指挥官装甲装备维护技能测试计划》

美军2026条令《指挥官装甲装备维护技能测试计划》

专知会员服务

6+阅读 · 今天7:28

《俄罗斯构建服务于人工智能驱动自主性的主权无人机生态系统》（2026报告）

《俄罗斯构建服务于人工智能驱动自主性的主权无人机生态系统》（2026报告）

专知会员服务

7+阅读 · 今天3:09

2026年俄罗斯新型喷气动力无人机Geran-5的技术规格

2026年俄罗斯新型喷气动力无人机Geran-5的技术规格

专知会员服务

4+阅读 · 今天2:50

基于数据优化的人机协同与机器人僚机

基于数据优化的人机协同与机器人僚机

专知会员服务

5+阅读 · 今天2:08

美太空军发布两份聚焦2040年规划的文件：《2040年未来作战环境》和《2040年目标部队》（附文件）

美太空军发布两份聚焦2040年规划的文件：《2040年未来作战环境》和《2040年目标部队》（附文件）

专知会员服务

14+阅读 · 今天1:51

相关VIP内容

用于三维医学影像理解的综合语言–图像预训练

用于三维医学影像理解的综合语言–图像预训练

专知会员服务

7+阅读 · 2025年11月5日

基础模型促进医疗保健：挑战、机遇与未来发展方向

基础模型促进医疗保健：挑战、机遇与未来发展方向

专知会员服务

32+阅读 · 2024年4月5日

预训练模型如何用在视觉任务？南洋理工最新《视觉语言模型》综述，全面概述视觉语言模型方法体系

预训练模型如何用在视觉任务？南洋理工最新《视觉语言模型》综述，全面概述视觉语言模型方法体系

专知会员服务

53+阅读 · 2023年4月4日

「知识增强预训练语言模型」最新研究综述

「知识增强预训练语言模型」最新研究综述

专知会员服务

62+阅读 · 2022年11月18日

深度学习在癌症诊断、预后和治疗选择中的应用

深度学习在癌症诊断、预后和治疗选择中的应用

专知会员服务

56+阅读 · 2022年6月18日

【CIKM2021】用领域知识增强预训练语言模型的问题回答

【CIKM2021】用领域知识增强预训练语言模型的问题回答

专知会员服务

17+阅读 · 2021年11月18日

知识感知的预训练语言模型综述

专知会员服务

51+阅读 · 2021年9月25日

语言视觉预训练语言模型揭密，Behind the Scene: Revealing the Secrets of Pre-trained Vision-and-Language Models

语言视觉预训练语言模型揭密，Behind the Scene: Revealing the Secrets of Pre-trained Vision-and-Language Models

专知会员服务

36+阅读 · 2020年5月20日

【清华大学】知识增强的常识性故事生成预训练模型，A Knowledge-Enhanced Pretraining Model for Commonsense Story Generation

【清华大学】知识增强的常识性故事生成预训练模型，A Knowledge-Enhanced Pretraining Model for Commonsense Story Generation

专知会员服务

52+阅读 · 2020年1月20日

【ICLR2020 预训练的百科全书】弱监督的知识-预训练的语言模型（PRETRAINED ENCYCLOPEDIA: WEAKLY SUPERVISED KNOWLEDGE-PRETRAINED LANGUAGE MODEL）

【ICLR2020 预训练的百科全书】弱监督的知识-预训练的语言模型（PRETRAINED ENCYCLOPEDIA: WEAKLY SUPERVISED KNOWLEDGE-PRETRAINED LANGUAGE MODEL）

专知会员服务

25+阅读 · 2019年12月26日

热门VIP内容

开通专知VIP会员享更多权益服务

《面向大语言模型引导规划、Bandit算法驱动探索与多智能体导航的分层决策问题研究》180页

《反无人机蜂群技术研究：基于小队策略构建大规模无人机防御》

美国与以色列如何在攻击伊朗中使用人工智能

《自动化战略情报管控》

相关资讯

「知识增强预训练语言模型」最新研究综述

「知识增强预训练语言模型」最新研究综述

专知

18+阅读 · 2022年11月18日

哈佛大学｜构建知识图谱PrimeKG以实现精准医疗--数据与代码全部公开，帮你从零开始复现知识图谱

哈佛大学｜构建知识图谱PrimeKG以实现精准医疗--数据与代码全部公开，帮你从零开始复现知识图谱

GenomicAI

29+阅读 · 2022年5月4日

专家报告 | 融合数据先验知识的智能图像增强

专家报告 | 融合数据先验知识的智能图像增强

中国图象图形学报

16+阅读 · 2020年5月25日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

预训练语言模型关系图+必读论文列表，清华荣誉出品

预训练语言模型关系图+必读论文列表，清华荣誉出品

机器之心

18+阅读 · 2019年10月11日

大讲堂 | 基于医疗知识的疾病诊断预测

大讲堂 | 基于医疗知识的疾病诊断预测

AI科技评论

10+阅读 · 2019年1月22日

自然语言处理中的语言模型预训练方法

自然语言处理中的语言模型预训练方法

PaperWeekly

14+阅读 · 2018年10月21日

深度学习在CTR预估中的应用 | CTR深度模型大盘点

深度学习在CTR预估中的应用 | CTR深度模型大盘点

PaperWeekly

15+阅读 · 2018年4月11日

【智能医疗】【知识图谱】中文电子病历命名实体识别的主动学习方法 | 病历智能分析系统的研究与实现 | 临床路径知识建模研究

【智能医疗】【知识图谱】中文电子病历命名实体识别的主动学习方法 | 病历智能分析系统的研究与实现 | 临床路径知识建模研究

产业智能官

29+阅读 · 2017年12月10日

医学知识图谱构建技术与研究进展

医学知识图谱构建技术与研究进展

全球人工智能

19+阅读 · 2017年11月13日

相关论文

Boosting Medical Visual Understanding From Multi-Granular Language Learning

Boosting Medical Visual Understanding From Multi-Granular Language Learning

Arxiv

0+阅读 · 2月19日

Integrating Chain-of-Thought and Retrieval Augmented Generation Enhances Rare Disease Diagnosis from Clinical Notes

Integrating Chain-of-Thought and Retrieval Augmented Generation Enhances Rare Disease Diagnosis from Clinical Notes

Arxiv

0+阅读 · 2月18日

Fusing Pixels and Genes: Spatially-Aware Learning in Computational Pathology

Arxiv

0+阅读 · 2月15日

Unifying Multiple Foundation Models for Advanced Computational Pathology

Arxiv

0+阅读 · 2月13日

Improving Medical Visual Reinforcement Fine-Tuning via Perception and Reasoning Augmentation

Arxiv

0+阅读 · 2月11日

StainNet: Scaling Self-Supervised Foundation Models on Immunohistochemistry and Special Stains for Computational Pathology

Arxiv

0+阅读 · 2月4日

A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine

A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine

Arxiv

0+阅读 · 1月29日

PathReasoner-R1: Instilling Structured Reasoning into Pathology Vision-Language Model via Knowledge-Guided Policy Optimization

Arxiv

0+阅读 · 1月29日

Transfer Learning from One Cancer to Another via Deep Learning Domain Adaptation

Arxiv

0+阅读 · 1月21日

Generating crossmodal gene expression from cancer histopathology improves multimodal AI predictions

Arxiv

0+阅读 · 1月13日

相关基金

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

视觉媒体的结构感知处理与分析模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于奇点光学的乳腺癌诊断技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

定量模型及在线智能引导的癌症筛查咨询方案优化验证

国家自然科学基金

2+阅读 · 2015年12月31日

基于磁共振动态增强灌注成像的肝癌血管生成拟态图像纹理特征提取与定量

国家自然科学基金

0+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

乳腺癌自我管理的行为机制及移动医疗智能管理模式的实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

癌症基因组中关键驱动突变信号通路的理论问题研究及算法设计

国家自然科学基金

0+阅读 · 2014年12月31日

社会化媒体环境下电子健康知识挖掘研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员