Designing molecules that are both property-optimal and readily synthesizable is a central challenge in drug discovery. Existing works that do consider synthesizability can jointly output predicted synthesis routes for generated molecules. However, there has been minimal attention in addressing the ease of synthesis and with flexibility to incorporate desired reaction constraints. On the other hand, virtual screening searches for commercially available compounds, but imposes challenges when scaling to ultra-large (billion-size and beyond) chemical spaces. Here, we propose a generative design framework that unifies synthesis-constrained molecular design and ultra-large-scale virtual screening through steerable and granular synthesizability control. Generated molecules satisfy arbitrary multi-parameter optimization objectives with predicted synthesis routes satisfying mix-and-match constraints: including or avoiding certain reactions, incorporating specific building blocks, and minimizing synthesis route length. In an end-to-end in-house campaign targeting BRD4, we designed molecules synthesizable with specific selected reactions and building blocks, synthesized all six selected compounds, and identified two micromolar binders. We further demonstrate that reaction control enables efficient navigation of ultra-large make-on-demand chemical spaces to identify property-optimal candidates. By applying our framework to Chemspace's Freedom 4.0 make-on-demand space (142 billion molecules), we generated ~320k molecules (0.00023% of the library) on a single consumer-grade GPU (with only 8 GB GPU memory) and identified a micromolar Wee1 binder amongst 60 synthesized candidates. The single unified framework thus enables generating novel synthesizable molecules and retrieving catalogue-ready candidates, offering a flexible solution to mitigating the synthesizability bottleneck.


翻译:设计兼具最优性质与易合成性的分子是药物发现中的核心挑战。现有考虑可合成性的研究虽能联合输出生成分子的预测合成路线,但在处理合成难易度及灵活融入所需反应约束方面关注甚少。另一方面,虚拟筛选可搜索市售化合物,但在扩展至超大规模(数十亿级及以上)化学空间时面临挑战。本文提出一种统一合成约束分子设计与超大规模虚拟筛选的生成式设计框架,通过可操控且粒度可控的可合成性控制实现。生成的分子可满足任意多参数优化目标,其预测合成路线能适配混合匹配约束:包含或避免特定反应、整合特定构建模块、最小化合成路线长度。在针对BRD4的终端到终端内部活动中,我们设计了可通过特定选定反应与构建模块合成的分子,合成了全部六种候选化合物,并识别出两种微摩尔级结合物。我们进一步证明,反应控制能有效导航超大规模按需制造化学空间以识别最优性质候选物。将本框架应用于Chemspace的Freedom 4.0按需制造空间(1420亿分子),我们仅用单块消费级GPU(8 GB显存)即生成约32万分子(占库容量的0.00023%),并在60个合成候选物中识别出一种微摩尔级Wee1结合物。这一统一框架既能生成新型可合成分子,又可检索目录候选物,为缓解可合成性瓶颈提供了灵活解决方案。

0
下载
关闭预览

相关内容

基于深度学习的全新药物设计研究进展
专知会员服务
29+阅读 · 2023年10月27日
AI药物设计前沿进展探讨,智药公开课今晚19:30开播!
专知会员服务
15+阅读 · 2022年6月22日
深度学习在分子生成和分子性质预测中的应用
专知会员服务
36+阅读 · 2022年6月19日
AI药物研发发展研究报告(附报告)
专知会员服务
91+阅读 · 2022年2月11日
视线估计(Gaze Estimation)简介(一):概述
CVer
10+阅读 · 2020年3月18日
Nature子刊:电催化合成氨领域获得突破!
材料科学与工程
10+阅读 · 2019年3月9日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
【学科发展报告】生物信息学
中国自动化学会
11+阅读 · 2018年10月22日
高分子材料领域的十大院士!
材料科学与工程
20+阅读 · 2018年9月18日
【AAAI专题】论文分享:以生物可塑性为核心的类脑脉冲神经网络
中国科学院自动化研究所
15+阅读 · 2018年1月23日
国家自然科学基金
0+阅读 · 2017年6月30日
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
4+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关基金
国家自然科学基金
0+阅读 · 2017年6月30日
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员