Predicting transcriptional responses to genetic perturbations is a central problem in functional genomics. In practice, perturbation responses are rarely gene-independent but instead manifest as coordinated, program-level transcriptional changes among functionally related genes. However, most existing methods do not explicitly model such coordination, due to gene-wise modeling paradigms and reliance on static biological priors that cannot capture dynamic program reorganization. To address these limitations, we propose scBIG, a module-inductive perturbation prediction framework that explicitly models coordinated gene programs. scBIG induces coherent gene programs from data via Gene-Relation Clustering, captures inter-program interactions through a Gene-Cluster-Aware Encoder, and preserves modular coordination using structure-aware alignment objectives. These structured representations are then modeled using conditional flow matching to enable flexible and generalizable perturbation prediction. Extensive experiments on multiple single-cell perturbation benchmarks show that scBIG consistently outperforms state-of-the-art methods, particularly on unseen and combinatorial perturbation settings, achieving an average improvement of 6.7% over the strongest baselines. The code is available at https://github.com/ttruan2426-dot/scBIG.


翻译:预测基因扰动引发的转录响应是功能基因组学中的一个核心问题。实际中,扰动响应很少表现为基因独立的作用,而是以协调的程序级转录变化形式,在功能相关的基因间显现。然而,由于现有方法大多基于逐基因建模范式,并依赖无法捕捉动态程序重组的静态生物学先验知识,因此未能显式建模这种协调性。为克服这些局限,我们提出scBIG——一种模块归纳式扰动预测框架,可显式建模协调的基因程序。scBIG通过基因关系聚类从数据中归纳出连贯的基因程序,借助基因聚类感知编码器捕获程序间相互作用,并利用结构感知对齐目标保持模块的协调性。随后,通过条件流匹配对这些结构化表示进行建模,以实现灵活且泛化能力强的扰动预测。在多个单细胞扰动基准数据集上的大量实验表明,scBIG持续优于现有先进方法,尤其是在未见过的扰动及组合扰动场景下,相较于最强基线平均性能提升达6.7%。代码已开源:https://github.com/ttruan2426-dot/scBIG。

0
下载
关闭预览

相关内容

MIT设计深度学习框架登Nature封面,预测非编码区DNA突变
专知会员服务
15+阅读 · 2022年3月18日
基于模型的强化学习综述
专知
42+阅读 · 2022年7月13日
论文浅尝 | 基于局内去噪和迁移学习的关系抽取
开放知识图谱
16+阅读 · 2018年12月2日
NLP-Progress记录NLP最新数据集、论文和代码: 助你紧跟NLP前沿
中国人工智能学会
12+阅读 · 2018年11月15日
深度 | 迁移学习全面概述:从基本概念到相关研究
七月在线实验室
15+阅读 · 2017年8月15日
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
6+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关VIP内容
MIT设计深度学习框架登Nature封面,预测非编码区DNA突变
专知会员服务
15+阅读 · 2022年3月18日
相关基金
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员