知识嵌入的潜在投影：面向鲁棒表示学习的模型 (Knowledge-Embedded Latent Projection for Robust Representation Learning) - 专知论文

会员服务 ·

0

嵌入 · 投影 · 潜在 · 健康 · 知识 ·

Knowledge-Embedded Latent Projection for Robust Representation Learning

翻译：知识嵌入的潜在投影：面向鲁棒表示学习的模型

Weijing Tang,Ming Yuan,Zongqi Xia,Tianxi Cai

Latent space models are widely used for analyzing high-dimensional discrete data matrices, such as patient-feature matrices in electronic health records (EHRs), by capturing complex dependence structures through low-dimensional embeddings. However, estimation becomes challenging in the imbalanced regime, where one matrix dimension is much larger than the other. In EHR applications, cohort sizes are often limited by disease prevalence or data availability, whereas the feature space remains extremely large due to the breadth of medical coding system. Motivated by the increasing availability of external semantic embeddings, such as pre-trained embeddings of clinical concepts in EHRs, we propose a knowledge-embedded latent projection model that leverages semantic side information to regularize representation learning. Specifically, we model column embeddings as smooth functions of semantic embeddings via a mapping in a reproducing kernel Hilbert space. We develop a computationally efficient two-step estimation procedure that combines semantically guided subspace construction via kernel principal component analysis with scalable projected gradient descent. We establish estimation error bounds that characterize the trade-off between statistical error and approximation error induced by the kernel projection. Furthermore, we provide local convergence guarantees for our non-convex optimization procedure. Extensive simulation studies and a real-world EHR application demonstrate the effectiveness of the proposed method.

翻译：潜在空间模型通过低维嵌入捕捉复杂依赖结构，被广泛用于分析高维离散数据矩阵（如电子健康记录中的患者-特征矩阵）。然而，在矩阵维度严重不平衡的场景下——即一个维度远大于另一个维度时——参数估计面临挑战。在电子健康记录应用中，队列规模常受疾病流行率或数据可用性限制，而由于医学编码体系的广度，特征空间却极为庞大。受日益丰富的外部语义嵌入资源（如电子健康记录中临床概念的预训练嵌入）的启发，我们提出一种知识嵌入的潜在投影模型，该模型利用语义侧信息对表示学习进行正则化。具体而言，我们通过再生核希尔伯特空间中的映射，将列嵌入建模为语义嵌入的平滑函数。我们开发了一种计算高效的两步估计流程：首先通过核主成分分析构建语义引导的子空间，再结合可扩展的投影梯度下降法进行优化。我们建立了估计误差界，以刻画核投影引起的统计误差与近似误差之间的权衡关系。此外，我们为非凸优化过程提供了局部收敛性保证。大量的模拟研究和真实世界电子健康记录应用验证了所提方法的有效性。

0

相关内容

用于多模态对齐的基础模型表征潜力：一项综述

用于多模态对齐的基础模型表征潜力：一项综述

专知会员服务

18+阅读 · 2025年10月8日

知识图谱基础模型的数学基础

知识图谱基础模型的数学基础

专知会员服务

41+阅读 · 2025年1月12日

【NTU博士论文】朝着鲁棒且标签高效的时间序列表示学习

【NTU博士论文】朝着鲁棒且标签高效的时间序列表示学习

专知会员服务

28+阅读 · 2024年2月29日

【NeurIPS 2023教程】隐扩散模型:生成式AI革命正在隐空间中发生吗?，133页ppt

【NeurIPS 2023教程】隐扩散模型:生成式AI革命正在隐空间中发生吗?，133页ppt

专知会员服务

54+阅读 · 2023年12月15日

知识图谱表示学习的对抗鲁棒性

知识图谱表示学习的对抗鲁棒性

专知会员服务

40+阅读 · 2022年10月7日

【NeurIPS 2021】基于投影变换建模传递关系的知识图谱表示学习

【NeurIPS 2021】基于投影变换建模传递关系的知识图谱表示学习

专知会员服务

20+阅读 · 2021年12月3日

面向知识图谱的图嵌入学习研究进展

面向知识图谱的图嵌入学习研究进展

专知会员服务

61+阅读 · 2021年11月3日

Query2box: 使用盒嵌入对向量空间中的知识图谱进行推理，Query2box: Reasoning over Knowledge Graphs in Vector Space Using Box Embeddings

专知会员服务

46+阅读 · 2020年5月11日

【论文】将符号知识嵌入到深层网络中（Embedding Symbolic Knowledge into Deep Networks）

【论文】将符号知识嵌入到深层网络中（Embedding Symbolic Knowledge into Deep Networks）

专知会员服务

33+阅读 · 2019年12月30日

From Data to Model Programming: Injecting Structured Priors for Knowledge Extraction，南加州大学计算机科学系任翔助理教授，CIPS ATT 16（2019）

From Data to Model Programming: Injecting Structured Priors for Knowledge Extraction，南加州大学计算机科学系任翔助理教授，CIPS ATT 16（2019）

专知会员服务

14+阅读 · 2019年10月25日

如何在深度学习嵌入知识？美国佛蒙特大学196页博士论文《在深度学习系统中利用领域知识》讲解

如何在深度学习嵌入知识？美国佛蒙特大学196页博士论文《在深度学习系统中利用领域知识》讲解

专知

32+阅读 · 2022年4月28日

知识图谱嵌入的Translate模型汇总（TransE，TransH，TransR，TransD）

知识图谱嵌入的Translate模型汇总（TransE，TransH，TransR，TransD）

深度学习自然语言处理

31+阅读 · 2020年6月12日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

AmpliGraph：知识图谱表示学习工具包

AmpliGraph：知识图谱表示学习工具包

专知

40+阅读 · 2019年4月6日

【知识图谱】基于知识图谱的用户画像技术

【知识图谱】基于知识图谱的用户画像技术

产业智能官

103+阅读 · 2019年1月9日

网络表示学习介绍

网络表示学习介绍

人工智能前沿讲习班

18+阅读 · 2018年11月26日

从Seq2seq到Attention模型到Self Attention（一）

从Seq2seq到Attention模型到Self Attention（一）

量化投资与机器学习

76+阅读 · 2018年10月8日

论文浅尝 | 嵌入常识知识的注意力 LSTM 模型用于特定目标的基于侧面的情感分析

论文浅尝 | 嵌入常识知识的注意力 LSTM 模型用于特定目标的基于侧面的情感分析

开放知识图谱

28+阅读 · 2018年6月11日

【论文读书笔记】个性化序列推荐：卷积序列嵌入方法

【论文读书笔记】个性化序列推荐：卷积序列嵌入方法

专知

17+阅读 · 2018年2月8日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

视觉识别中的实用鲁棒回归技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于个体分析的投影式非线性非负张量分解在高维非结构化数据模式分析中的研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向光谱-空间特征集合的高光谱遥感影像度量学习与分类研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

3+阅读 · 2014年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

面向地图综合的多尺度空间聚类理论与方法

国家自然科学基金

1+阅读 · 2014年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

GDR-learners: Orthogonal Learning of Generative Models for Potential Outcomes

Arxiv

0+阅读 · 3月11日

Latent Equivariant Operators for Robust Object Recognition: Promises and Challenges

Arxiv

0+阅读 · 3月10日

Latent Sculpting for Zero-Shot Generalization: A Manifold Learning Approach to Out-of-Distribution Anomaly Detection

Arxiv

0+阅读 · 3月9日

Projection depth for functional data: Practical issues, computation and applications

Arxiv

0+阅读 · 2月26日

Latent Equivariant Operators for Robust Object Recognition: Promise and Challenges

Arxiv

0+阅读 · 2月23日

Benchmarking Pretrained Molecular Embedding Models For Molecular Representation Learning

Arxiv

0+阅读 · 2月23日

SeqRisk: Transformer-augmented latent variable model for robust survival prediction with longitudinal data

Arxiv

0+阅读 · 2月12日

Hyperbolic Network Latent Space Model with Learnable Curvature

Arxiv

0+阅读 · 2月10日

Continuous Input Embedding Size Search For Recommender Systems

Arxiv

0+阅读 · 2月10日

Latent Structure Emergence in Diffusion Models via Confidence-Based Filtering

Arxiv

0+阅读 · 2月5日

VIP会员

文章信息

相关主题

最新内容

《反小型无人机系统的雷达高度估计相干干扰研究》60页

《反小型无人机系统的雷达高度估计相干干扰研究》60页

专知会员服务

0+阅读 · 今天9:52

人工智能战争迷雾：洞悉乌克兰、加沙和伊朗三战区

人工智能战争迷雾：洞悉乌克兰、加沙和伊朗三战区

专知会员服务

3+阅读 · 今天9:28

（中文）以机器速度作战：来自Maven特遣队主任的见解

（中文）以机器速度作战：来自Maven特遣队主任的见解

专知会员服务

7+阅读 · 今天3:42

（中文）AUKUS第二支柱中的人工智能与自主性方案

（中文）AUKUS第二支柱中的人工智能与自主性方案

专知会员服务

3+阅读 · 今天3:24

（译文）认知战：以士兵为目标，塑造战略

（译文）认知战：以士兵为目标，塑造战略

专知会员服务

2+阅读 · 今天3:12

（中文）认知战的本体论基础（2026报告）

（中文）认知战的本体论基础（2026报告）

专知会员服务

17+阅读 · 今天1:45

美空军条令（2026）：外国对内防御

美空军条令（2026）：外国对内防御

专知会员服务

3+阅读 · 今天1:32

美国与以色列如何在攻击伊朗中使用人工智能

美国与以色列如何在攻击伊朗中使用人工智能

专知会员服务

7+阅读 · 4月16日

《面向大语言模型引导规划、Bandit算法驱动探索与多智能体导航的分层决策问题研究》180页

《面向大语言模型引导规划、Bandit算法驱动探索与多智能体导航的分层决策问题研究》180页

专知会员服务

7+阅读 · 4月16日

《自动化战略情报管控》

《自动化战略情报管控》

专知会员服务

3+阅读 · 4月16日

《反无人机蜂群技术研究：基于小队策略构建大规模无人机防御》

《反无人机蜂群技术研究：基于小队策略构建大规模无人机防御》

专知会员服务

13+阅读 · 4月16日

得失评估：审视对伊朗战争的轨迹（简报）

得失评估：审视对伊朗战争的轨迹（简报）

专知会员服务

3+阅读 · 4月16日

【CMU博士论文】迈向可解释机器学习的理论基础

【CMU博士论文】迈向可解释机器学习的理论基础

专知会员服务

5+阅读 · 4月16日

CVPR 2026 | HulluEdit：基于正交子空间编辑的多模态大语言模型幻觉缓解框架

CVPR 2026 | HulluEdit：基于正交子空间编辑的多模态大语言模型幻觉缓解框架

专知会员服务

4+阅读 · 4月16日

无人机视觉语言导航：研究进展、挑战与技术路线图

无人机视觉语言导航：研究进展、挑战与技术路线图

专知会员服务

6+阅读 · 4月16日

相关VIP内容

用于多模态对齐的基础模型表征潜力：一项综述

用于多模态对齐的基础模型表征潜力：一项综述

专知会员服务

18+阅读 · 2025年10月8日

知识图谱基础模型的数学基础

知识图谱基础模型的数学基础

专知会员服务

41+阅读 · 2025年1月12日

【NTU博士论文】朝着鲁棒且标签高效的时间序列表示学习

【NTU博士论文】朝着鲁棒且标签高效的时间序列表示学习

专知会员服务

28+阅读 · 2024年2月29日

【NeurIPS 2023教程】隐扩散模型:生成式AI革命正在隐空间中发生吗?，133页ppt

【NeurIPS 2023教程】隐扩散模型:生成式AI革命正在隐空间中发生吗?，133页ppt

专知会员服务

54+阅读 · 2023年12月15日

知识图谱表示学习的对抗鲁棒性

知识图谱表示学习的对抗鲁棒性

专知会员服务

40+阅读 · 2022年10月7日

【NeurIPS 2021】基于投影变换建模传递关系的知识图谱表示学习

【NeurIPS 2021】基于投影变换建模传递关系的知识图谱表示学习

专知会员服务

20+阅读 · 2021年12月3日

面向知识图谱的图嵌入学习研究进展

面向知识图谱的图嵌入学习研究进展

专知会员服务

61+阅读 · 2021年11月3日

Query2box: 使用盒嵌入对向量空间中的知识图谱进行推理，Query2box: Reasoning over Knowledge Graphs in Vector Space Using Box Embeddings

专知会员服务

46+阅读 · 2020年5月11日

【论文】将符号知识嵌入到深层网络中（Embedding Symbolic Knowledge into Deep Networks）

【论文】将符号知识嵌入到深层网络中（Embedding Symbolic Knowledge into Deep Networks）

专知会员服务

33+阅读 · 2019年12月30日

From Data to Model Programming: Injecting Structured Priors for Knowledge Extraction，南加州大学计算机科学系任翔助理教授，CIPS ATT 16（2019）

From Data to Model Programming: Injecting Structured Priors for Knowledge Extraction，南加州大学计算机科学系任翔助理教授，CIPS ATT 16（2019）

专知会员服务

14+阅读 · 2019年10月25日

热门VIP内容

开通专知VIP会员享更多权益服务

人工智能战争迷雾：洞悉乌克兰、加沙和伊朗三战区

（中文）AUKUS第二支柱中的人工智能与自主性方案

《反小型无人机系统的雷达高度估计相干干扰研究》60页

（中文）以机器速度作战：来自Maven特遣队主任的见解

相关资讯

如何在深度学习嵌入知识？美国佛蒙特大学196页博士论文《在深度学习系统中利用领域知识》讲解

如何在深度学习嵌入知识？美国佛蒙特大学196页博士论文《在深度学习系统中利用领域知识》讲解

专知

32+阅读 · 2022年4月28日

知识图谱嵌入的Translate模型汇总（TransE，TransH，TransR，TransD）

知识图谱嵌入的Translate模型汇总（TransE，TransH，TransR，TransD）

深度学习自然语言处理

31+阅读 · 2020年6月12日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

AmpliGraph：知识图谱表示学习工具包

AmpliGraph：知识图谱表示学习工具包

专知

40+阅读 · 2019年4月6日

【知识图谱】基于知识图谱的用户画像技术

【知识图谱】基于知识图谱的用户画像技术

产业智能官

103+阅读 · 2019年1月9日

网络表示学习介绍

网络表示学习介绍

人工智能前沿讲习班

18+阅读 · 2018年11月26日

从Seq2seq到Attention模型到Self Attention（一）

从Seq2seq到Attention模型到Self Attention（一）

量化投资与机器学习

76+阅读 · 2018年10月8日

论文浅尝 | 嵌入常识知识的注意力 LSTM 模型用于特定目标的基于侧面的情感分析

论文浅尝 | 嵌入常识知识的注意力 LSTM 模型用于特定目标的基于侧面的情感分析

开放知识图谱

28+阅读 · 2018年6月11日

【论文读书笔记】个性化序列推荐：卷积序列嵌入方法

【论文读书笔记】个性化序列推荐：卷积序列嵌入方法

专知

17+阅读 · 2018年2月8日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

相关论文

GDR-learners: Orthogonal Learning of Generative Models for Potential Outcomes

Arxiv

0+阅读 · 3月11日

Latent Equivariant Operators for Robust Object Recognition: Promises and Challenges

Arxiv

0+阅读 · 3月10日

Latent Sculpting for Zero-Shot Generalization: A Manifold Learning Approach to Out-of-Distribution Anomaly Detection

Arxiv

0+阅读 · 3月9日

Projection depth for functional data: Practical issues, computation and applications

Arxiv

0+阅读 · 2月26日

Latent Equivariant Operators for Robust Object Recognition: Promise and Challenges

Arxiv

0+阅读 · 2月23日

Benchmarking Pretrained Molecular Embedding Models For Molecular Representation Learning

Arxiv

0+阅读 · 2月23日

SeqRisk: Transformer-augmented latent variable model for robust survival prediction with longitudinal data

Arxiv

0+阅读 · 2月12日

Hyperbolic Network Latent Space Model with Learnable Curvature

Arxiv

0+阅读 · 2月10日

Continuous Input Embedding Size Search For Recommender Systems

Arxiv

0+阅读 · 2月10日

Latent Structure Emergence in Diffusion Models via Confidence-Based Filtering

Arxiv

0+阅读 · 2月5日

相关基金

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

视觉识别中的实用鲁棒回归技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于个体分析的投影式非线性非负张量分解在高维非结构化数据模式分析中的研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向光谱-空间特征集合的高光谱遥感影像度量学习与分类研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

3+阅读 · 2014年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

面向地图综合的多尺度空间聚类理论与方法

国家自然科学基金

1+阅读 · 2014年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员