Efficient design of genomic perturbation experiments is crucial for accelerating drug discovery and therapeutic target identification, yet exhaustive perturbation of the human genome remains infeasible due to the vast search space of potential genetic interactions and experimental constraints. Bayesian optimization (BO) has emerged as a powerful framework for selecting informative interventions, but existing approaches often fail to exploit domain-specific biological prior knowledge. We propose Biology-Informed Bayesian Optimization (BioBO), a method that integrates Bayesian optimization with multimodal gene embeddings and enrichment analysis, a widely used tool for gene prioritization in biology, to enhance surrogate modeling and acquisition strategies. BioBO combines biologically grounded priors with acquisition functions in a principled framework, which biases the search toward promising genes while maintaining the ability to explore uncertain regions. Through experiments on established public benchmarks and datasets, we demonstrate that BioBO improves labeling efficiency by 25-40%, and consistently outperforms conventional BO by identifying top-performing perturbations more effectively. Moreover, by incorporating enrichment analysis, BioBO yields pathway-level explanations for selected perturbations, offering mechanistic interpretability that links designs to biologically coherent regulatory circuits.


翻译:基因组扰动实验的高效设计对于加速药物发现和治疗靶点识别至关重要,但由于潜在遗传相互作用的庞大搜索空间及实验约束,对人类基因组进行穷举扰动仍不可行。贝叶斯优化已成为选择信息性干预措施的有力框架,但现有方法往往未能充分利用生物领域的特异性先验知识。我们提出基于生物学信息的贝叶斯优化方法BioBO,通过将贝叶斯优化与多模态基因嵌入及富集分析(生物学中广泛用于基因优先级排序的工具)相结合,增强代理建模与采集策略。BioBO以理论化的框架将生物学先验与采集函数相融合,在保持探索不确定区域能力的同时,引导搜索向有前景的基因倾斜。通过在公开标准基准与数据集上的实验,我们证明BioBO可将标注效率提升25-40%,并能更有效地识别高性能扰动方案,持续优于传统贝叶斯优化方法。此外,通过引入富集分析,BioBO为所选扰动提供通路层面的解释,赋予设计结果与生物学相关调控回路相关联的机制可解释性。

0
下载
关闭预览

相关内容

具有动能的生命体。
AI药物研发发展研究报告(附报告)
专知会员服务
91+阅读 · 2022年2月11日
专知会员服务
10+阅读 · 2021年10月1日
以BERT为例,如何优化机器学习模型性能?
专知
10+阅读 · 2019年10月3日
面试题:简单说说贝叶斯定理
七月在线实验室
12+阅读 · 2019年6月12日
一文读懂机器学习中的贝叶斯统计学
数据分析
26+阅读 · 2019年5月8日
BERT相关论文、文章和代码资源汇总
AINLP
19+阅读 · 2018年11月17日
【学科发展报告】生物信息学
中国自动化学会
11+阅读 · 2018年10月22日
贝叶斯机器学习前沿进展
机器学习研究会
21+阅读 · 2018年1月21日
GAFT:一个使用 Python 实现的遗传算法框架
Python开发者
10+阅读 · 2017年8月1日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
45+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
6+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关VIP内容
AI药物研发发展研究报告(附报告)
专知会员服务
91+阅读 · 2022年2月11日
专知会员服务
10+阅读 · 2021年10月1日
相关资讯
以BERT为例,如何优化机器学习模型性能?
专知
10+阅读 · 2019年10月3日
面试题:简单说说贝叶斯定理
七月在线实验室
12+阅读 · 2019年6月12日
一文读懂机器学习中的贝叶斯统计学
数据分析
26+阅读 · 2019年5月8日
BERT相关论文、文章和代码资源汇总
AINLP
19+阅读 · 2018年11月17日
【学科发展报告】生物信息学
中国自动化学会
11+阅读 · 2018年10月22日
贝叶斯机器学习前沿进展
机器学习研究会
21+阅读 · 2018年1月21日
GAFT:一个使用 Python 实现的遗传算法框架
Python开发者
10+阅读 · 2017年8月1日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
45+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员