Cell-JEPA: Latent Representation Learning for Single-Cell Transcriptomics - 专知论文

会员服务 ·

0

单元 · 重建 · 单细胞 · 潜在 · 表征学习 ·

Cell-JEPA: Latent Representation Learning for Single-Cell Transcriptomics

翻译：Cell-JEPA：单细胞转录组学的潜在表征学习

Ali ElSheikh,Rui-Xi Wang,Weimin Wu,Yibo Wen,Payam Dibaeinia,Jennifer Yuntong Zhang,Jerry Yao-Chieh Hu,Mei Knudson,Sudarshan Babu,Shao-Hua Sun,Aly A. Khan,Han Liu

from arxiv, 26 pages, 3 figures

Single-cell foundation models learn by reconstructing masked gene expression, implicitly treating technical noise as signal. With dropout rates exceeding 90%, reconstruction objectives encourage models to encode measurement artifacts rather than stable cellular programs. We introduce Cell-JEPA, a joint-embedding predictive architecture that shifts learning from reconstructing sparse counts to predicting in latent space. The key insight is that cell identity is redundantly encoded across genes. We show predicting cell-level embeddings from partial observations forces the model to learn dropout-robust features. On cell-type clustering, Cell-JEPA achieves 0.72 AvgBIO in zero-shot transfer versus 0.53 for scGPT, a 36% relative improvement. On perturbation prediction within a single cell line, Cell-JEPA improves absolute-state reconstruction but not effect-size estimation, suggesting that representation learning and perturbation modeling address complementary aspects of cellular prediction.

翻译：单细胞基础模型通过重建被遮蔽的基因表达进行学习，这隐含地将技术噪声视为信号。在丢失率超过90%的情况下，重建目标会促使模型编码测量伪影，而非稳定的细胞程序。我们提出了Cell-JEPA，一种联合嵌入预测架构，它将学习重点从重建稀疏计数转向在潜在空间中进行预测。其关键洞见在于，细胞身份在多个基因间存在冗余编码。我们证明，从部分观测中预测细胞级别的嵌入会迫使模型学习对丢失鲁棒的特征。在细胞类型聚类任务中，Cell-JEPA在零样本迁移上实现了0.72的AvgBIO，而scGPT为0.53，相对提升了36%。在单个细胞系内的扰动预测任务中，Cell-JEPA改善了绝对状态的重建，但未提升效应大小的估计，这表明表征学习与扰动建模处理的是细胞预测中互补的方面。

0

相关内容

TransMLA：多头潜在注意力（MLA）即为所需

TransMLA：多头潜在注意力（MLA）即为所需

专知会员服务

23+阅读 · 2025年2月13日

Nat. Commun. | 基于最优传输的单细胞数据集成统一计算框架

Nat. Commun. | 基于最优传输的单细胞数据集成统一计算框架

专知会员服务

12+阅读 · 2022年12月19日

【北京大学PCM论文】单细胞测序技术最新进展（Recent Advances in Single-cell Sequencing Technologies）

【北京大学PCM论文】单细胞测序技术最新进展（Recent Advances in Single-cell Sequencing Technologies）

专知会员服务

14+阅读 · 2022年3月10日

【伯克利JD Co-Reyes博士论文】建立强化学习算法泛化:从潜在动力学模型到元学习，Building Reinforcement Learning Algorithms that Generalize: From Latent Dynamics Models to Meta-Learning

【伯克利JD Co-Reyes博士论文】建立强化学习算法泛化:从潜在动力学模型到元学习，Building Reinforcement Learning Algorithms that Generalize: From Latent Dynamics Models to Meta-Learning

专知会员服务

45+阅读 · 2022年3月6日

香港浸会大学最新《标签噪声表示学习》综述论文，全面阐述LNRL的数据、目标函数与优化策略

香港浸会大学最新《标签噪声表示学习》综述论文，全面阐述LNRL的数据、目标函数与优化策略

专知会员服务

32+阅读 · 2022年2月15日

南理工最新「深度学习细粒度图像分析」综述论文，带你全面了解细粒度图像识别与检索方法

南理工最新「深度学习细粒度图像分析」综述论文，带你全面了解细粒度图像识别与检索方法

专知会员服务

23+阅读 · 2021年11月21日

【单样本(One-shot)学习】《One-shot learning》by Pragati Baheti Part 1/2: Definitions and fundamental techniques

【单样本(One-shot)学习】《One-shot learning》by Pragati Baheti Part 1/2: Definitions and fundamental techniques

专知会员服务

30+阅读 · 2020年4月22日

【微软亚研】预训练文本表示作为元学习，Pre-training Text Representations

【微软亚研】预训练文本表示作为元学习，Pre-training Text Representations

专知会员服务

40+阅读 · 2020年4月17日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning

专知会员服务

159+阅读 · 2020年2月29日

【论文强烈推荐】基于卷积神经网络的基因组序列基序的表示学习，Representation learning of genomic sequence motifs with convolutional neural networks

【论文强烈推荐】基于卷积神经网络的基因组序列基序的表示学习，Representation learning of genomic sequence motifs with convolutional neural networks

专知会员服务

12+阅读 · 2019年12月21日

南理工最新「深度学习细粒度图像分析」综述论文，带你全面了解细粒度图像识别与检索方法

南理工最新「深度学习细粒度图像分析」综述论文，带你全面了解细粒度图像识别与检索方法

专知

12+阅读 · 2021年11月21日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

专知

72+阅读 · 2020年2月29日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

KAUST高欣组研发基于深度学习的研究RNA和RBP相互作用的全新方法｜Nat. Commun.

KAUST高欣组研发基于深度学习的研究RNA和RBP相互作用的全新方法｜Nat. Commun.

科研圈

17+阅读 · 2019年10月30日

【微软ICLR2020提交论文】多模态预训练表示UNITER：通用图像-文本语言表示学习

【微软ICLR2020提交论文】多模态预训练表示UNITER：通用图像-文本语言表示学习

专知

50+阅读 · 2019年10月20日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

专知

12+阅读 · 2018年1月12日

什么是迁移学习？它都用在深度学习的哪些场景上？这篇文章替你讲清楚了

什么是迁移学习？它都用在深度学习的哪些场景上？这篇文章替你讲清楚了

AI100

16+阅读 · 2017年12月23日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

基于单细胞转录组测序的垂体腺瘤增殖异质性评价及与侵袭表型相关性研究

国家自然科学基金

0+阅读 · 2016年12月31日

内源性逆转录病毒在小鼠胚胎干细胞中的转录抑制机制

国家自然科学基金

0+阅读 · 2016年12月31日

单颗粒病毒实时示踪方法研究杆状病毒AcMNPV转导不同组织来源人源细胞的机制

国家自然科学基金

0+阅读 · 2015年12月31日

H2B泛素化在细胞重编程过程中的作用机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

微流控阵列单细胞电化学分析新方法及其在癌症干细胞识别中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

利用禽双链RNA病毒感染瞬间的细胞转录组测序挖掘协助或抵抗病毒进入的基因表达调控网络

国家自然科学基金

0+阅读 · 2015年12月31日

活体单细胞电/力学本征信息自动获取方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

转录中介体在体细胞重编程中的表观遗传学调控作用

国家自然科学基金

0+阅读 · 2015年12月31日

干细胞的干性维持与分化过程中表观遗传修饰“编码” 的功能与调控机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

组蛋白赖氨酸甲基化修饰对癌干细胞重编程的作用机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

HarmonyCell: Automating Single-Cell Perturbation Modeling under Semantic and Distribution Shifts

Arxiv

0+阅读 · 3月8日

SC-Arena: A Natural Language Benchmark for Single-Cell Reasoning with Knowledge-Augmented Evaluation

Arxiv

0+阅读 · 2月26日

Systematic Evaluation of Single-Cell Foundation Model Interpretability Reveals Attention Captures Co-Expression Rather Than Unique Regulatory Signal

Systematic Evaluation of Single-Cell Foundation Model Interpretability Reveals Attention Captures Co-Expression Rather Than Unique Regulatory Signal

Arxiv

0+阅读 · 2月19日

Parameter-free representations outperform single-cell foundation models on downstream benchmarks

Arxiv

0+阅读 · 2月18日

SPATIA: Multimodal Generation and Prediction of Spatial Cell Phenotypes

Arxiv

0+阅读 · 2月16日

VLA-JEPA: Enhancing Vision-Language-Action Model with Latent World Model

Arxiv

0+阅读 · 2月14日

The Cell Ontology in the age of single-cell omics

Arxiv

0+阅读 · 2月13日

ScDiVa: Masked Discrete Diffusion for Joint Modeling of Single-Cell Identity and Expression

Arxiv

0+阅读 · 2月3日

VL-JEPA: Joint Embedding Predictive Architecture for Vision-language

Arxiv

0+阅读 · 2月2日

DOGMA: Weaving Structural Information into Data-centric Single-cell Transcriptomics Analysis

Arxiv

0+阅读 · 2月2日

VIP会员

文章信息

相关主题

最新内容

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

专知会员服务

1+阅读 · 今天4:55

《化繁为简：军事模拟器配置的对话式方法》报告

《化繁为简：军事模拟器配置的对话式方法》报告

专知会员服务

3+阅读 · 今天4:33

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

专知会员服务

6+阅读 · 今天4:29

《新兴技术武器化及其对全球风险的影响》

《新兴技术武器化及其对全球风险的影响》

专知会员服务

3+阅读 · 今天4:27

《帕兰泰尔平台介绍：信息分析平台》

《帕兰泰尔平台介绍：信息分析平台》

专知会员服务

10+阅读 · 今天4:20

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

专知会员服务

5+阅读 · 今天2:39

【伯克利博士论文】深度解析 AI 智能体的失配问题

【伯克利博士论文】深度解析 AI 智能体的失配问题

专知会员服务

3+阅读 · 4月28日

智能体化世界建模：基础、能力、规律及展望

智能体化世界建模：基础、能力、规律及展望

专知会员服务

6+阅读 · 4月28日

MIT人机协同水下作业关键技术研究——集成适配至美国海军现役AUV

MIT人机协同水下作业关键技术研究——集成适配至美国海军现役AUV

专知会员服务

8+阅读 · 4月28日

美海警海上态势感知无人系统

美海警海上态势感知无人系统

专知会员服务

6+阅读 · 4月28日

安杜里尔Lattice平台的发展演变：美军多域自主作战的核心软件架构

安杜里尔Lattice平台的发展演变：美军多域自主作战的核心软件架构

专知会员服务

10+阅读 · 4月28日

《释放自主力量：将人工智能驱动无人机融入现代军事战略》

《释放自主力量：将人工智能驱动无人机融入现代军事战略》

专知会员服务

14+阅读 · 4月28日

《智能作战任务规划技术：实验流程与发现》50页报告

《智能作战任务规划技术：实验流程与发现》50页报告

专知会员服务

25+阅读 · 4月28日

《复杂系统数据驱动预测建模的数值框架》报告

《复杂系统数据驱动预测建模的数值框架》报告

专知会员服务

12+阅读 · 4月28日

从“会话式人工智能”角度看“Maven智能系统”

从“会话式人工智能”角度看“Maven智能系统”

专知会员服务

11+阅读 · 4月28日

相关VIP内容

TransMLA：多头潜在注意力（MLA）即为所需

TransMLA：多头潜在注意力（MLA）即为所需

专知会员服务

23+阅读 · 2025年2月13日

Nat. Commun. | 基于最优传输的单细胞数据集成统一计算框架

Nat. Commun. | 基于最优传输的单细胞数据集成统一计算框架

专知会员服务

12+阅读 · 2022年12月19日

【北京大学PCM论文】单细胞测序技术最新进展（Recent Advances in Single-cell Sequencing Technologies）

【北京大学PCM论文】单细胞测序技术最新进展（Recent Advances in Single-cell Sequencing Technologies）

专知会员服务

14+阅读 · 2022年3月10日

【伯克利JD Co-Reyes博士论文】建立强化学习算法泛化:从潜在动力学模型到元学习，Building Reinforcement Learning Algorithms that Generalize: From Latent Dynamics Models to Meta-Learning

【伯克利JD Co-Reyes博士论文】建立强化学习算法泛化:从潜在动力学模型到元学习，Building Reinforcement Learning Algorithms that Generalize: From Latent Dynamics Models to Meta-Learning

专知会员服务

45+阅读 · 2022年3月6日

香港浸会大学最新《标签噪声表示学习》综述论文，全面阐述LNRL的数据、目标函数与优化策略

香港浸会大学最新《标签噪声表示学习》综述论文，全面阐述LNRL的数据、目标函数与优化策略

专知会员服务

32+阅读 · 2022年2月15日

南理工最新「深度学习细粒度图像分析」综述论文，带你全面了解细粒度图像识别与检索方法

南理工最新「深度学习细粒度图像分析」综述论文，带你全面了解细粒度图像识别与检索方法

专知会员服务

23+阅读 · 2021年11月21日

【单样本(One-shot)学习】《One-shot learning》by Pragati Baheti Part 1/2: Definitions and fundamental techniques

【单样本(One-shot)学习】《One-shot learning》by Pragati Baheti Part 1/2: Definitions and fundamental techniques

专知会员服务

30+阅读 · 2020年4月22日

【微软亚研】预训练文本表示作为元学习，Pre-training Text Representations

【微软亚研】预训练文本表示作为元学习，Pre-training Text Representations

专知会员服务

40+阅读 · 2020年4月17日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning

专知会员服务

159+阅读 · 2020年2月29日

【论文强烈推荐】基于卷积神经网络的基因组序列基序的表示学习，Representation learning of genomic sequence motifs with convolutional neural networks

【论文强烈推荐】基于卷积神经网络的基因组序列基序的表示学习，Representation learning of genomic sequence motifs with convolutional neural networks

专知会员服务

12+阅读 · 2019年12月21日

热门VIP内容

开通专知VIP会员享更多权益服务

《化繁为简：军事模拟器配置的对话式方法》报告

《新兴技术武器化及其对全球风险的影响》

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

相关资讯

南理工最新「深度学习细粒度图像分析」综述论文，带你全面了解细粒度图像识别与检索方法

南理工最新「深度学习细粒度图像分析」综述论文，带你全面了解细粒度图像识别与检索方法

专知

12+阅读 · 2021年11月21日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

专知

72+阅读 · 2020年2月29日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

KAUST高欣组研发基于深度学习的研究RNA和RBP相互作用的全新方法｜Nat. Commun.

KAUST高欣组研发基于深度学习的研究RNA和RBP相互作用的全新方法｜Nat. Commun.

科研圈

17+阅读 · 2019年10月30日

【微软ICLR2020提交论文】多模态预训练表示UNITER：通用图像-文本语言表示学习

【微软ICLR2020提交论文】多模态预训练表示UNITER：通用图像-文本语言表示学习

专知

50+阅读 · 2019年10月20日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

专知

12+阅读 · 2018年1月12日

什么是迁移学习？它都用在深度学习的哪些场景上？这篇文章替你讲清楚了

什么是迁移学习？它都用在深度学习的哪些场景上？这篇文章替你讲清楚了

AI100

16+阅读 · 2017年12月23日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

相关论文

HarmonyCell: Automating Single-Cell Perturbation Modeling under Semantic and Distribution Shifts

Arxiv

0+阅读 · 3月8日

SC-Arena: A Natural Language Benchmark for Single-Cell Reasoning with Knowledge-Augmented Evaluation

Arxiv

0+阅读 · 2月26日

Systematic Evaluation of Single-Cell Foundation Model Interpretability Reveals Attention Captures Co-Expression Rather Than Unique Regulatory Signal

Systematic Evaluation of Single-Cell Foundation Model Interpretability Reveals Attention Captures Co-Expression Rather Than Unique Regulatory Signal

Arxiv

0+阅读 · 2月19日

Parameter-free representations outperform single-cell foundation models on downstream benchmarks

Arxiv

0+阅读 · 2月18日

SPATIA: Multimodal Generation and Prediction of Spatial Cell Phenotypes

Arxiv

0+阅读 · 2月16日

VLA-JEPA: Enhancing Vision-Language-Action Model with Latent World Model

Arxiv

0+阅读 · 2月14日

The Cell Ontology in the age of single-cell omics

Arxiv

0+阅读 · 2月13日

ScDiVa: Masked Discrete Diffusion for Joint Modeling of Single-Cell Identity and Expression

Arxiv

0+阅读 · 2月3日

VL-JEPA: Joint Embedding Predictive Architecture for Vision-language

Arxiv

0+阅读 · 2月2日

DOGMA: Weaving Structural Information into Data-centric Single-cell Transcriptomics Analysis

Arxiv

0+阅读 · 2月2日

相关基金

基于单细胞转录组测序的垂体腺瘤增殖异质性评价及与侵袭表型相关性研究

国家自然科学基金

0+阅读 · 2016年12月31日

内源性逆转录病毒在小鼠胚胎干细胞中的转录抑制机制

国家自然科学基金

0+阅读 · 2016年12月31日

单颗粒病毒实时示踪方法研究杆状病毒AcMNPV转导不同组织来源人源细胞的机制

国家自然科学基金

0+阅读 · 2015年12月31日

H2B泛素化在细胞重编程过程中的作用机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

微流控阵列单细胞电化学分析新方法及其在癌症干细胞识别中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

利用禽双链RNA病毒感染瞬间的细胞转录组测序挖掘协助或抵抗病毒进入的基因表达调控网络

国家自然科学基金

0+阅读 · 2015年12月31日

活体单细胞电/力学本征信息自动获取方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

转录中介体在体细胞重编程中的表观遗传学调控作用

国家自然科学基金

0+阅读 · 2015年12月31日

干细胞的干性维持与分化过程中表观遗传修饰“编码” 的功能与调控机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

组蛋白赖氨酸甲基化修饰对癌干细胞重编程的作用机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员