Drug discovery is a time-consuming and expensive process, with traditional high-throughput and docking-based virtual screening hampered by low success rates and limited scalability. Recent advances in generative modelling, including autoregressive, diffusion, and flow-based approaches, have enabled de novo ligand design beyond the limits of enumerative screening. Yet these models often suffer from inadequate generalization, limited interpretability, and an overemphasis on binding affinity at the expense of key pharmacological properties, thereby restricting their translational utility. Here we present Trio, a molecular generation framework integrating fragment-based molecular language modeling, reinforcement learning, and Monte Carlo tree search, for effective and interpretable closed-loop targeted molecular design. Through the three key components, Trio enables context-aware fragment assembly, enforces physicochemical and synthetic feasibility, and guides a balanced search between the exploration of novel chemotypes and the exploitation of promising intermediates within protein binding pockets. Experimental results show that Trio reliably achieves chemically valid and pharmacologically enhanced ligands, outperforming state-of-the-art approaches with improved binding affinity (+7.85%), drug-likeness (+11.10%) and synthetic accessibility (+12.05%), while expanding molecular diversity more than fourfold. By combining generalization, plausibility, and interpretability, Trio establishes a closed-loop generative paradigm that redefines how chemical space can be navigated, offering a transformative foundation for the next era of AI-driven drug discovery.


翻译:药物发现是一个耗时且昂贵的过程,传统的高通量筛选和基于对接的虚拟筛选受限于成功率低和可扩展性有限。近年来,生成建模的进展,包括自回归、扩散和基于流的方法,已能够实现超越枚举筛选限制的从头配体设计。然而,这些模型通常存在泛化能力不足、可解释性有限,以及过度强调结合亲和力而忽视关键药理学性质的问题,从而限制了其转化应用。本文提出Trio,一个集成了基于片段的分子语言建模、强化学习和蒙特卡洛树搜索的分子生成框架,用于实现高效且可解释的闭环靶向分子设计。通过这三个关键组件,Trio能够实现上下文感知的片段组装,强制执行物理化学和合成可行性,并在探索新型化学类型与利用蛋白质结合口袋内有前景的中间体之间引导平衡搜索。实验结果表明,Trio能够可靠地生成化学有效且药理学增强的配体,在结合亲和力(+7.85%)、类药性(+11.10%)和合成可及性(+12.05%)方面优于现有先进方法,同时将分子多样性扩展了四倍以上。通过结合泛化性、合理性和可解释性,Trio建立了一种闭环生成范式,重新定义了化学空间的导航方式,为人工智能驱动的药物发现新时代提供了变革性基础。

0
下载
关闭预览

相关内容

【MIT博士论文】分子图表示学习与生成的药物发现
专知会员服务
49+阅读 · 2022年6月28日
深度学习药物发现综述
专知会员服务
59+阅读 · 2022年6月2日
人工智能到深度学习:药物发现的机器智能方法
专知会员服务
37+阅读 · 2022年5月6日
图表示学习在药物发现中的应用,48页ppt
专知会员服务
102+阅读 · 2021年4月30日
深度学习时代的图模型,清华发文综述图网络
GAN生成式对抗网络
13+阅读 · 2018年12月23日
推荐|机器学习中的模型评价、模型选择和算法选择!
全球人工智能
10+阅读 · 2018年2月5日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
VIP会员
最新内容
最新“指挥控制”领域出版物合集(简介)
专知会员服务
3+阅读 · 4月12日
面向军事作战需求开发的人工智能(RAIMOND)
专知会员服务
10+阅读 · 4月12日
远程空中优势:新一代超视距导弹的兴起
专知会员服务
2+阅读 · 4月12日
大语言模型溯因推理的统一分类学与综述
专知会员服务
1+阅读 · 4月12日
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员