We propose a spectral-based, unsupervised representation learning framework to derive low-dimensional embeddings for clinical concepts and patients in rare disease cohorts from electronic health records, where data are high-dimensional but sample sizes are limited. To overcome this challenge, we incorporate a knowledge matrix extracted from a broader population that shares a partially overlapping subspace with the rare-disease cohort. Our method departs from existing approaches by relaxing restrictive one-to-one signal-alignment assumptions between the latent data matrix and knowledge matrix, allowing more flexible and realistic forms of structured sharing. We introduce a novel two-step spectral embedding procedure: first, we identify and remove irrelevant components from the knowledge matrix; then, we apply a projection-based method to separately recover shared and heterogeneous components. Simulations and an analysis of a real-world multiple sclerosis cohort show that the proposed method outperforms competing approaches, particularly in challenging scenarios where shared signals are weak and only partially aligned, as is common in rare-disease data.


翻译:我们提出一种基于谱的无监督表示学习框架,用于从电子健康记录中为罕见疾病队列的临床概念和患者推导低维嵌入。在此场景中,数据呈现高维特性但样本量有限。为克服这一挑战,我们引入来自较大规模人群的知识矩阵,该人群与罕见疾病队列共享部分重叠子空间。本方法突破现有方法对潜在数据矩阵与知识矩阵之间严格一对一信号对齐假设的限制,允许更灵活、更现实的共享结构形式。我们提出一种新颖的两步谱嵌入流程:首先识别并移除知识矩阵中的无关成分,随后采用基于投影的方法分别恢复共享成分与异质成分。模拟实验与真实多发性硬化症队列分析表明,本方法在共享信号微弱且仅部分对齐(这在罕见疾病数据中常见)等具有挑战性的场景中,其性能显著优于现有方法。

0
下载
关闭预览

相关内容

利用表示学习推动多机构电子健康记录数据研究
专知会员服务
16+阅读 · 2025年2月17日
【AAAI2023】终身嵌入学习和迁移的知识图谱增长
专知会员服务
20+阅读 · 2022年12月1日
面向自然语言处理的知识图谱嵌入:从理论到实践
专知会员服务
53+阅读 · 2022年10月16日
专知会员服务
38+阅读 · 2021年4月25日
知识图谱嵌入的Translate模型汇总(TransE,TransH,TransR,TransD)
深度学习自然语言处理
31+阅读 · 2020年6月12日
知识图谱嵌入(KGE):方法和应用的综述
专知
56+阅读 · 2019年8月25日
大讲堂 | 知识图谱的嵌入:更好更快的负采样
AI研习社
13+阅读 · 2019年3月6日
【知识图谱】医学知识图谱构建技术与研究进展
产业智能官
44+阅读 · 2017年11月16日
医学知识图谱构建技术与研究进展
全球人工智能
19+阅读 · 2017年11月13日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
5+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关基金
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员