From Trajectories to Phenotypes: Disease Progression as Structural Priors for Multi-organ Imaging Representation Learning - 专知论文

会员服务 ·

0

结构 · 表型 · 对齐 · 表征学习 · 知识 ·

From Trajectories to Phenotypes: Disease Progression as Structural Priors for Multi-organ Imaging Representation Learning

翻译：从轨迹到表型：疾病进展作为多器官影像表征学习的结构先验

Zian Wang,Lizhen Lan,Guangming Wang,Haosen Zhang,Minxuan Xu,Qing Li,Tianxing He,Mo Yang,Wenyue Mao,Yajing Zhang,Yan Li,Chengyan Wang

Imaging-derived phenotypes (IDPs) summarize multi-organ physiology but provide only static snapshots of diseases that evolve over time. In contrast, longitudinal electronic health records encode disease trajectories through temporal dependencies among past diagnosis events and comorbidity structure. We hypothesize that IDPs and disease trajectories contain partially shared disease-relevant structure. We propose a trajectory-aware distillation framework that transfers structural knowledge from a generative disease trajectory Transformer into an organ-wise IDP encoder. A population-scale trajectory model trained on longitudinal diagnosis sequences produces subject-level embeddings that supervise IDP representation learning via geometry-preserving alignment. During downstream prediction, trajectory and imaging representations can also be fused via cross-attention. Across 159 diseases in the UK Biobank cohort, trajectory-aware pretraining consistently improves both discrimination (AUC) and time-to-onset prediction (MAE), with the largest gains for low-prevalence diseases. Similarity relationships in IDP embedding space also align with those in trajectory space, providing supportive evidence for partially aligned representation geometry. These results suggest that population-scale generative disease models can serve as structural priors for data-limited imaging modalities, improving robustness under realistic cohort constraints.

翻译：影像衍生表型（IDP）总结了多器官生理特征，但仅能提供随时间演变的疾病的静态快照。相反，纵向电子健康记录通过既往诊断事件的时间依赖性和共病结构编码了疾病轨迹。我们假设IDP和疾病轨迹包含部分共享的疾病相关结构。我们提出了一种轨迹感知知识蒸馏框架，将生成式疾病轨迹Transformer的结构知识迁移到器官级IDP编码器中。基于纵向诊断序列训练的人群尺度轨迹模型产生受试者级嵌入，通过几何保持对齐监督IDP表征学习。在下游预测过程中，轨迹和影像表征还可通过交叉注意力进行融合。在英国生物银行队列的159种疾病中，轨迹感知的预训练持续改善了区分能力（AUC）和发病时间预测（MAE），其中对低患病率疾病的提升最大。IDP嵌入空间中的相似性关系也与轨迹空间中的关系对齐，为部分对齐的表征几何提供了支持性证据。这些结果表明，人群尺度的生成式疾病模型可作为数据有限影像模态的结构先验，在现实队列约束下提高鲁棒性。

0

相关内容

利用表示学习推动多机构电子健康记录数据研究

利用表示学习推动多机构电子健康记录数据研究

专知会员服务

16+阅读 · 2025年2月17日

多模态知识图谱表示学习综述

多模态知识图谱表示学习综述

专知会员服务

72+阅读 · 2024年7月4日

【斯坦福大学博士论文】通过建模多维依赖性改进医学时间序列数据的深度学习，124页pdf

【斯坦福大学博士论文】通过建模多维依赖性改进医学时间序列数据的深度学习，124页pdf

专知会员服务

50+阅读 · 2023年3月23日

【MIT博士论文】利用临床和生物医学表征学习的结构和知识，223页pdf

【MIT博士论文】利用临床和生物医学表征学习的结构和知识，223页pdf

专知会员服务

32+阅读 · 2022年9月5日

【Scientific Reports】《多中心影像诊断的联邦学习：心血管疾病的模拟研究》

【Scientific Reports】《多中心影像诊断的联邦学习：心血管疾病的模拟研究》

专知会员服务

20+阅读 · 2022年8月4日

【北理&哈佛】图多模态学习的疾病关系提取

【北理&哈佛】图多模态学习的疾病关系提取

专知会员服务

33+阅读 · 2022年4月15日

AAAI2022最新「时序数据处理」报告，127页PPT阐述时序数据处理以及医疗应用进展

AAAI2022最新「时序数据处理」报告，127页PPT阐述时序数据处理以及医疗应用进展

专知会员服务

89+阅读 · 2022年3月1日

哈佛大学「生物医学网络表示学习」最新综述论文，44页pdf阐述表示学习在医学中应用

哈佛大学「生物医学网络表示学习」最新综述论文，44页pdf阐述表示学习在医学中应用

专知会员服务

61+阅读 · 2021年4月16日

【斯坦福】从电子病历EHR构建知识图谱，Robustly Extracting Medical Knowledge from EHRs:A Case Study of Learning a Health Knowledge Graph

【斯坦福】从电子病历EHR构建知识图谱，Robustly Extracting Medical Knowledge from EHRs:A Case Study of Learning a Health Knowledge Graph

专知会员服务

56+阅读 · 2020年6月2日

【华侨大学】基于混合深度学习算法的疾病预测模型

【华侨大学】基于混合深度学习算法的疾病预测模型

专知会员服务

97+阅读 · 2020年1月21日

哈佛大学｜构建知识图谱PrimeKG以实现精准医疗--数据与代码全部公开，帮你从零开始复现知识图谱

哈佛大学｜构建知识图谱PrimeKG以实现精准医疗--数据与代码全部公开，帮你从零开始复现知识图谱

GenomicAI

29+阅读 · 2022年5月4日

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

专知

16+阅读 · 2022年5月3日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN

深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN

数据挖掘入门与实战

13+阅读 · 2018年4月6日

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

专知

17+阅读 · 2018年3月3日

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

专知

66+阅读 · 2018年1月31日

【智能医疗】【知识图谱】中文电子病历命名实体识别的主动学习方法 | 病历智能分析系统的研究与实现 | 临床路径知识建模研究

【智能医疗】【知识图谱】中文电子病历命名实体识别的主动学习方法 | 病历智能分析系统的研究与实现 | 临床路径知识建模研究

产业智能官

29+阅读 · 2017年12月10日

【知识图谱】医学知识图谱构建技术与研究进展

【知识图谱】医学知识图谱构建技术与研究进展

产业智能官

44+阅读 · 2017年11月16日

医学知识图谱构建技术与研究进展

医学知识图谱构建技术与研究进展

全球人工智能

19+阅读 · 2017年11月13日

基于深度学习的医疗影像论文汇总（Deep Learning Papers on Medical Image Analysis）

基于深度学习的医疗影像论文汇总（Deep Learning Papers on Medical Image Analysis）

AI研习社

17+阅读 · 2017年10月21日

多视角识别长非编码RNA和人类复杂疾病关联预测研究

国家自然科学基金

4+阅读 · 2017年12月31日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

基于多关联数据融合的疾病相似度算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

复杂疾病的全基因组SNP互作网络构建与分析

国家自然科学基金

0+阅读 · 2015年12月31日

面向在线检索的医学影像多特征降维方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于网络的复杂疾病动态表观修饰模块挖掘

国家自然科学基金

0+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

生命起源过程中“标签介导的遗传信息复制和表达的出现及演化”的计算机模拟研究

国家自然科学基金

0+阅读 · 2014年12月31日

动态重叠网络上疾病与信息传播动力学建模与分析

国家自然科学基金

1+阅读 · 2014年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

Enhancing Pathological VLMs with Cross-scale Reasoning

Arxiv

0+阅读 · 6月16日

SPATIA: Multimodal Generation and Prediction of Spatial Cell Phenotypes

Arxiv

0+阅读 · 6月15日

Hierarchical Modeling of ICD Codes in EHR Foundation Models

Arxiv

0+阅读 · 6月13日

RECTOR: Masked Region-Channel-Temporal Modeling for Affective and Cognitive Representation Learning

Arxiv

0+阅读 · 6月13日

From Prediction to Intervention: The Evolution of AI in Biomedicine

Arxiv

0+阅读 · 5月26日

Vital Trace: Protocol-Constrained Patient-State Reasoning for Longitudinal Clinical Trajectories

Arxiv

0+阅读 · 5月26日

ChronoMedKG: A Temporally-Grounded Biomedical Knowledge Graph and Benchmark for Clinical Reasoning

Arxiv

0+阅读 · 5月21日

ProtoPathway: Biologically Structured Prototype-Pathway Fusion for Multimodal Cancer Survival Prediction

Arxiv

0+阅读 · 5月20日

PathoSage: Towards Multi-Source Evidence Adjudication in Pathology via Experience-Aware Agentic Workflow

Arxiv

0+阅读 · 5月18日

Combining longitudinal cohort studies to examine cardiovascular risk factor trajectories across the adult lifespan

Arxiv

0+阅读 · 5月12日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

0+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

2+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

5+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

6+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

9+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

6+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

9+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

7+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

13+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

9+阅读 · 6月17日

相关VIP内容

利用表示学习推动多机构电子健康记录数据研究

利用表示学习推动多机构电子健康记录数据研究

专知会员服务

16+阅读 · 2025年2月17日

多模态知识图谱表示学习综述

多模态知识图谱表示学习综述

专知会员服务

72+阅读 · 2024年7月4日

【斯坦福大学博士论文】通过建模多维依赖性改进医学时间序列数据的深度学习，124页pdf

【斯坦福大学博士论文】通过建模多维依赖性改进医学时间序列数据的深度学习，124页pdf

专知会员服务

50+阅读 · 2023年3月23日

【MIT博士论文】利用临床和生物医学表征学习的结构和知识，223页pdf

【MIT博士论文】利用临床和生物医学表征学习的结构和知识，223页pdf

专知会员服务

32+阅读 · 2022年9月5日

【Scientific Reports】《多中心影像诊断的联邦学习：心血管疾病的模拟研究》

【Scientific Reports】《多中心影像诊断的联邦学习：心血管疾病的模拟研究》

专知会员服务

20+阅读 · 2022年8月4日

【北理&哈佛】图多模态学习的疾病关系提取

【北理&哈佛】图多模态学习的疾病关系提取

专知会员服务

33+阅读 · 2022年4月15日

AAAI2022最新「时序数据处理」报告，127页PPT阐述时序数据处理以及医疗应用进展

AAAI2022最新「时序数据处理」报告，127页PPT阐述时序数据处理以及医疗应用进展

专知会员服务

89+阅读 · 2022年3月1日

哈佛大学「生物医学网络表示学习」最新综述论文，44页pdf阐述表示学习在医学中应用

哈佛大学「生物医学网络表示学习」最新综述论文，44页pdf阐述表示学习在医学中应用

专知会员服务

61+阅读 · 2021年4月16日

【斯坦福】从电子病历EHR构建知识图谱，Robustly Extracting Medical Knowledge from EHRs:A Case Study of Learning a Health Knowledge Graph

【斯坦福】从电子病历EHR构建知识图谱，Robustly Extracting Medical Knowledge from EHRs:A Case Study of Learning a Health Knowledge Graph

专知会员服务

56+阅读 · 2020年6月2日

【华侨大学】基于混合深度学习算法的疾病预测模型

【华侨大学】基于混合深度学习算法的疾病预测模型

专知会员服务

97+阅读 · 2020年1月21日

热门VIP内容

开通专知VIP会员享更多权益服务

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

相关资讯

哈佛大学｜构建知识图谱PrimeKG以实现精准医疗--数据与代码全部公开，帮你从零开始复现知识图谱

哈佛大学｜构建知识图谱PrimeKG以实现精准医疗--数据与代码全部公开，帮你从零开始复现知识图谱

GenomicAI

29+阅读 · 2022年5月4日

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

专知

16+阅读 · 2022年5月3日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN

深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN

数据挖掘入门与实战

13+阅读 · 2018年4月6日

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

专知

17+阅读 · 2018年3月3日

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

专知

66+阅读 · 2018年1月31日

【智能医疗】【知识图谱】中文电子病历命名实体识别的主动学习方法 | 病历智能分析系统的研究与实现 | 临床路径知识建模研究

【智能医疗】【知识图谱】中文电子病历命名实体识别的主动学习方法 | 病历智能分析系统的研究与实现 | 临床路径知识建模研究

产业智能官

29+阅读 · 2017年12月10日

【知识图谱】医学知识图谱构建技术与研究进展

【知识图谱】医学知识图谱构建技术与研究进展

产业智能官

44+阅读 · 2017年11月16日

医学知识图谱构建技术与研究进展

医学知识图谱构建技术与研究进展

全球人工智能

19+阅读 · 2017年11月13日

基于深度学习的医疗影像论文汇总（Deep Learning Papers on Medical Image Analysis）

基于深度学习的医疗影像论文汇总（Deep Learning Papers on Medical Image Analysis）

AI研习社

17+阅读 · 2017年10月21日

相关论文

Enhancing Pathological VLMs with Cross-scale Reasoning

Arxiv

0+阅读 · 6月16日

SPATIA: Multimodal Generation and Prediction of Spatial Cell Phenotypes

Arxiv

0+阅读 · 6月15日

Hierarchical Modeling of ICD Codes in EHR Foundation Models

Arxiv

0+阅读 · 6月13日

RECTOR: Masked Region-Channel-Temporal Modeling for Affective and Cognitive Representation Learning

Arxiv

0+阅读 · 6月13日

From Prediction to Intervention: The Evolution of AI in Biomedicine

Arxiv

0+阅读 · 5月26日

Vital Trace: Protocol-Constrained Patient-State Reasoning for Longitudinal Clinical Trajectories

Arxiv

0+阅读 · 5月26日

ChronoMedKG: A Temporally-Grounded Biomedical Knowledge Graph and Benchmark for Clinical Reasoning

Arxiv

0+阅读 · 5月21日

ProtoPathway: Biologically Structured Prototype-Pathway Fusion for Multimodal Cancer Survival Prediction

Arxiv

0+阅读 · 5月20日

PathoSage: Towards Multi-Source Evidence Adjudication in Pathology via Experience-Aware Agentic Workflow

Arxiv

0+阅读 · 5月18日

Combining longitudinal cohort studies to examine cardiovascular risk factor trajectories across the adult lifespan

Arxiv

0+阅读 · 5月12日

相关基金

多视角识别长非编码RNA和人类复杂疾病关联预测研究

国家自然科学基金

4+阅读 · 2017年12月31日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

基于多关联数据融合的疾病相似度算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

复杂疾病的全基因组SNP互作网络构建与分析

国家自然科学基金

0+阅读 · 2015年12月31日

面向在线检索的医学影像多特征降维方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于网络的复杂疾病动态表观修饰模块挖掘

国家自然科学基金

0+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

生命起源过程中“标签介导的遗传信息复制和表达的出现及演化”的计算机模拟研究

国家自然科学基金

0+阅读 · 2014年12月31日

动态重叠网络上疾病与信息传播动力学建模与分析

国家自然科学基金

1+阅读 · 2014年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员