Systematic Evaluation of Single-Cell Foundation Model Interpretability Reveals Attention Captures Co-Expression Rather Than Unique Regulatory Signal - 专知论文

会员服务 ·

0

捕获 · 注意力机制 · 单细胞 · 系统 · 可解释性 ·

Systematic Evaluation of Single-Cell Foundation Model Interpretability Reveals Attention Captures Co-Expression Rather Than Unique Regulatory Signal

翻译：单细胞基础模型可解释性系统评估揭示注意力机制捕获共表达而非独特调控信号

Ihor Kendiukhov

We present a systematic evaluation framework - thirty-seven analyses, 153 statistical tests, four cell types, two perturbation modalities - for assessing mechanistic interpretability in single-cell foundation models. Applying this framework to scGPT and Geneformer, we find that attention patterns encode structured biological information with layer-specific organisation - protein-protein interactions in early layers, transcriptional regulation in late layers - but this structure provides no incremental value for perturbation prediction: trivial gene-level baselines outperform both attention and correlation edges (AUROC 0.81-0.88 versus 0.70), pairwise edge scores add zero predictive contribution, and causal ablation of regulatory heads produces no degradation. These findings generalise from K562 to RPE1 cells; the attention-correlation relationship is context-dependent, but gene-level dominance is universal. Cell-State Stratified Interpretability (CSSI) addresses an attention-specific scaling failure, improving GRN recovery up to 1.85x. The framework establishes reusable quality-control standards for the field.

翻译：我们提出了一个系统性评估框架——包含37项分析、153项统计检验、四种细胞类型、两种扰动模式——用于评估单细胞基础模型的机制可解释性。将该框架应用于scGPT和Geneformer，我们发现注意力模式编码了具有层级特异性组织的结构化生物学信息：早期层捕获蛋白质-蛋白质相互作用，晚期层捕获转录调控，但这种结构并未为扰动预测提供增量价值：简单的基因水平基线模型在性能上超越注意力机制与相关性边（AUROC 0.81-0.88对比0.70），成对边评分未增加任何预测贡献，且调控头部的因果消融未导致性能下降。这些发现在从K562细胞到RPE1细胞中具有普适性；注意力-相关性关系具有情境依赖性，但基因水平的主导地位是普遍存在的。细胞状态分层可解释性（CSSI）方法解决了注意力机制特有的尺度失效问题，将基因调控网络重建性能提升达1.85倍。该框架为该领域建立了可复用的质量控制标准。

0

相关内容

扩散模型中的注意力机制：综述

扩散模型中的注意力机制：综述

专知会员服务

24+阅读 · 2025年4月10日

多模态基础模型的机制可解释性综述

多模态基础模型的机制可解释性综述

专知会员服务

43+阅读 · 2025年2月28日

视觉基础模型的可解释性：综述

视觉基础模型的可解释性：综述

专知会员服务

26+阅读 · 2025年1月24日

可解释图推荐系统

可解释图推荐系统

专知会员服务

25+阅读 · 2024年8月4日

【万字长文】注意力机制可解释大论述

专知会员服务

56+阅读 · 2020年11月17日

替换Transformer！谷歌提出 Performer 模型，全面提升注意力机制！

替换Transformer！谷歌提出 Performer 模型，全面提升注意力机制！

专知会员服务

43+阅读 · 2020年10月29日

基于双注意力机制和迁移学习的跨领域推荐模型

专知会员服务

48+阅读 · 2020年10月20日

【论文翻译】NLP注意力机制综述论文翻译，Attention, please! A Critical Review of Neural Attention Models in Natural Language Processing

【论文翻译】NLP注意力机制综述论文翻译，Attention, please! A Critical Review of Neural Attention Models in Natural Language Processing

专知会员服务

96+阅读 · 2020年4月18日

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

19+阅读 · 2019年10月22日

注意力机制模型最新综述

注意力机制模型最新综述

专知会员服务

271+阅读 · 2019年10月20日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

【NIPS2019】Infidelity and Sensitivity：模型可解释性方法的定量评估

【NIPS2019】Infidelity and Sensitivity：模型可解释性方法的定量评估

AINLP

19+阅读 · 2020年6月14日

注意力机制可解释吗？这篇ACL 2019论文说……

注意力机制可解释吗？这篇ACL 2019论文说……

机器之心

11+阅读 · 2019年6月16日

注意力模型深度综述：注意力类型和网络架构都有什么

注意力模型深度综述：注意力类型和网络架构都有什么

机器之心

19+阅读 · 2019年4月10日

Attention！注意力机制模型最新综述

Attention！注意力机制模型最新综述

专知

65+阅读 · 2019年4月8日

专栏 | 深入理解图注意力机制

专栏 | 深入理解图注意力机制

机器之心

25+阅读 · 2019年2月19日

注意力机制(Attention)最新综述论文及相关源码

注意力机制(Attention)最新综述论文及相关源码

人工智能学家

30+阅读 · 2018年11月17日

Attention模型方法综述 | 多篇经典论文解读

Attention模型方法综述 | 多篇经典论文解读

PaperWeekly

107+阅读 · 2018年6月11日

【论文推荐】最新六篇推荐系统相关论文—注意力机制、多任务、协同跨网络、非结构化文本、TransRev、章节推荐

【论文推荐】最新六篇推荐系统相关论文—注意力机制、多任务、协同跨网络、非结构化文本、TransRev、章节推荐

专知

12+阅读 · 2018年4月26日

自然语言处理中的自注意力机制（Self-Attention Mechanism）

自然语言处理中的自注意力机制（Self-Attention Mechanism）

PaperWeekly

22+阅读 · 2018年3月28日

树突膜特异性表达的syndecan-2通过调节actin细胞骨架聚集参与神经病理性痛的机制研究

国家自然科学基金

0+阅读 · 2016年12月31日

基于脉冲神经膜系统的细胞核输出信号识别方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂决策环境下面向共识的群体评价模型与方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

“模块化自组装”DNA计算模型的研究

国家自然科学基金

3+阅读 · 2015年12月31日

多级可控组装模拟生物体系的功能

国家自然科学基金

0+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

活体单细胞电/力学本征信息自动获取方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于Phase-type分布的多状态系统可靠性模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

来源于放线多孢菌的CRISPR/Cas系统的分析及功能鉴定

国家自然科学基金

0+阅读 · 2015年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

Double projection for reconstructing dynamical systems: between stochastic and deterministic regimes

Arxiv

0+阅读 · 3月9日

SC-Arena: A Natural Language Benchmark for Single-Cell Reasoning with Knowledge-Augmented Evaluation

Arxiv

0+阅读 · 2月26日

Projective Psychological Assessment of Large Multimodal Models Using Thematic Apperception Tests

Arxiv

0+阅读 · 2月19日

Parameter-free representations outperform single-cell foundation models on downstream benchmarks

Arxiv

0+阅读 · 2月18日

Explainable AI: Context-Aware Layer-Wise Integrated Gradients for Explaining Transformer Models

Arxiv

0+阅读 · 2月18日

Selective Synchronization Attention

Arxiv

0+阅读 · 2月16日

Efficient Attention Mechanisms for Large Language Models: A Survey

Arxiv

0+阅读 · 2月7日

ScDiVa: Masked Discrete Diffusion for Joint Modeling of Single-Cell Identity and Expression

Arxiv

0+阅读 · 2月3日

Mechanistic Interpretability as Statistical Estimation: A Variance Analysis

Arxiv

0+阅读 · 2月3日

Attention Isn't All You Need for Emotion Recognition:Domain Features Outperform Transformers on the EAV Dataset

Arxiv

0+阅读 · 2月2日

VIP会员

文章信息

相关主题

注意力机制

最新内容

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

6+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

5+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

7+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

7+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

7+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

9+阅读 · 6月25日

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

8+阅读 · 6月25日

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

8+阅读 · 6月25日

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

9+阅读 · 6月24日

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

10+阅读 · 6月24日

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

11+阅读 · 6月24日

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

10+阅读 · 6月24日

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

7+阅读 · 6月24日

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

10+阅读 · 6月24日

相关VIP内容

扩散模型中的注意力机制：综述

扩散模型中的注意力机制：综述

专知会员服务

24+阅读 · 2025年4月10日

多模态基础模型的机制可解释性综述

多模态基础模型的机制可解释性综述

专知会员服务

43+阅读 · 2025年2月28日

视觉基础模型的可解释性：综述

视觉基础模型的可解释性：综述

专知会员服务

26+阅读 · 2025年1月24日

可解释图推荐系统

可解释图推荐系统

专知会员服务

25+阅读 · 2024年8月4日

【万字长文】注意力机制可解释大论述

专知会员服务

56+阅读 · 2020年11月17日

替换Transformer！谷歌提出 Performer 模型，全面提升注意力机制！

替换Transformer！谷歌提出 Performer 模型，全面提升注意力机制！

专知会员服务

43+阅读 · 2020年10月29日

基于双注意力机制和迁移学习的跨领域推荐模型

专知会员服务

48+阅读 · 2020年10月20日

【论文翻译】NLP注意力机制综述论文翻译，Attention, please! A Critical Review of Neural Attention Models in Natural Language Processing

【论文翻译】NLP注意力机制综述论文翻译，Attention, please! A Critical Review of Neural Attention Models in Natural Language Processing

专知会员服务

96+阅读 · 2020年4月18日

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

19+阅读 · 2019年10月22日

注意力机制模型最新综述

注意力机制模型最新综述

专知会员服务

271+阅读 · 2019年10月20日

热门VIP内容

开通专知VIP会员享更多权益服务

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

网状网络及其在军事领域的运用

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

相关资讯

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

【NIPS2019】Infidelity and Sensitivity：模型可解释性方法的定量评估

【NIPS2019】Infidelity and Sensitivity：模型可解释性方法的定量评估

AINLP

19+阅读 · 2020年6月14日

注意力机制可解释吗？这篇ACL 2019论文说……

注意力机制可解释吗？这篇ACL 2019论文说……

机器之心

11+阅读 · 2019年6月16日

注意力模型深度综述：注意力类型和网络架构都有什么

注意力模型深度综述：注意力类型和网络架构都有什么

机器之心

19+阅读 · 2019年4月10日

Attention！注意力机制模型最新综述

Attention！注意力机制模型最新综述

专知

65+阅读 · 2019年4月8日

专栏 | 深入理解图注意力机制

专栏 | 深入理解图注意力机制

机器之心

25+阅读 · 2019年2月19日

注意力机制(Attention)最新综述论文及相关源码

注意力机制(Attention)最新综述论文及相关源码

人工智能学家

30+阅读 · 2018年11月17日

Attention模型方法综述 | 多篇经典论文解读

Attention模型方法综述 | 多篇经典论文解读

PaperWeekly

107+阅读 · 2018年6月11日

【论文推荐】最新六篇推荐系统相关论文—注意力机制、多任务、协同跨网络、非结构化文本、TransRev、章节推荐

【论文推荐】最新六篇推荐系统相关论文—注意力机制、多任务、协同跨网络、非结构化文本、TransRev、章节推荐

专知

12+阅读 · 2018年4月26日

自然语言处理中的自注意力机制（Self-Attention Mechanism）

自然语言处理中的自注意力机制（Self-Attention Mechanism）

PaperWeekly

22+阅读 · 2018年3月28日

相关论文

Double projection for reconstructing dynamical systems: between stochastic and deterministic regimes

Arxiv

0+阅读 · 3月9日

SC-Arena: A Natural Language Benchmark for Single-Cell Reasoning with Knowledge-Augmented Evaluation

Arxiv

0+阅读 · 2月26日

Projective Psychological Assessment of Large Multimodal Models Using Thematic Apperception Tests

Arxiv

0+阅读 · 2月19日

Parameter-free representations outperform single-cell foundation models on downstream benchmarks

Arxiv

0+阅读 · 2月18日

Explainable AI: Context-Aware Layer-Wise Integrated Gradients for Explaining Transformer Models

Arxiv

0+阅读 · 2月18日

Selective Synchronization Attention

Arxiv

0+阅读 · 2月16日

Efficient Attention Mechanisms for Large Language Models: A Survey

Arxiv

0+阅读 · 2月7日

ScDiVa: Masked Discrete Diffusion for Joint Modeling of Single-Cell Identity and Expression

Arxiv

0+阅读 · 2月3日

Mechanistic Interpretability as Statistical Estimation: A Variance Analysis

Arxiv

0+阅读 · 2月3日

Attention Isn't All You Need for Emotion Recognition:Domain Features Outperform Transformers on the EAV Dataset

Arxiv

0+阅读 · 2月2日

相关基金

树突膜特异性表达的syndecan-2通过调节actin细胞骨架聚集参与神经病理性痛的机制研究

国家自然科学基金

0+阅读 · 2016年12月31日

基于脉冲神经膜系统的细胞核输出信号识别方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂决策环境下面向共识的群体评价模型与方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

“模块化自组装”DNA计算模型的研究

国家自然科学基金

3+阅读 · 2015年12月31日

多级可控组装模拟生物体系的功能

国家自然科学基金

0+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

活体单细胞电/力学本征信息自动获取方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于Phase-type分布的多状态系统可靠性模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

来源于放线多孢菌的CRISPR/Cas系统的分析及功能鉴定

国家自然科学基金

0+阅读 · 2015年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员