生成式人工智能的兴起正在迅速改变药物研发的格局。生成式人工智能模型既能直接设计新药,也能为从事药物研发的研究人员提供支持。本论文通过几种生成式人工智能方法及相关应用,阐述了生成式人工智能对药物研发的影响。首先,我将提出用于设计易于合成的小分子候选药物的新型生成式人工智能方法,并将其应用于抗生素设计和荧光小分子设计。然后,我将讨论将大语言模型(LLMs,一种使用自然语言的生成式人工智能)应用于药物研发以辅助科学研究的方法,应用范围包括药物毒性分析和针对 SARS-CoV-2 的纳米抗体设计。通过这些案例,我将展示各种生成式人工智能方法在加速药物研发方面的潜力。 药物研发对于发现患者的新疗法至关重要,但其过程极其复杂,导致研发速度缓慢且成本高昂。许多药物从实验室走向临床需要超过 10 年的时间;截至 2014 年,单只药物的平均研发成本已达 26 亿美元。因此,亟需新技术来缩短研发周期并降低成本。在过去几年中,生成式人工智能(Generative AI)作为一种极具前景的技术脱颖而出,具有彻底变革广泛科学研究、尤其是药物研发领域的潜力。虽然像 ChatGPT 这样的大语言模型(LLMs)是最为人所熟知且应用最广泛的生成式 AI 形式,并可用于设计药物研发工作流,但研究人员还开发了专门针对药物研发的生成式方法,例如能够生成蛋白质或小分子而非文本的模型。这些生成式 AI 技术正飞速演进,并在药物研发管线中得到了广泛应用。 我的博士研究主要聚焦于用于药物研发的生成式 AI,包括开发新型生成式 AI 方法以及针对药物研发不同维度的深度应用。本论文分为两个主要部分:(1) 用于小分子药物设计的生成式 AI(2) 作为药物研发科学辅助手段的生成式 AI(特别是 LLMs)

**用于小分子药物设计的生成式 AI

我们为小分子药物设计开发的核心方法是 SyntheMol [3](第二章),这是一种能够确保所生成分子具有高可合成性(easy synthesizability)的生成式 AI 模型。该模型实现了对 AI 生成分子的快速体外(in vitro)实验验证。我们将 SyntheMol 应用于针对鲍曼不动杆菌(Acinetobacter baumannii的数种有效候选抗生素的设计。尽管我们成功识别出几种高效的候选抗生素,但面临的一个挑战是:AI 生成的分子虽然对细菌具有强大的抑制活性,但缺乏关键的成药性(druglike properties)(如水溶性),而这是药物在人体内发挥疗效的必要条件。 为了识别具有成药性的分子,首先需要一种能够预测药物性质的方法。为此,我们开发了 ADMET-AI [4](第三章),这是一种经过训练的图神经网络(GNN),能够准确、快速地预测包括水溶性在内的多种成药性质。随后,我们开发了 SyntheMol 的显著改进版本 SyntheMol-RL [5](第四章),该版本具备**多参数药物优化(MPO)能力。我们将 SyntheMol-RL 应用于金黄色葡萄球菌(Staphylococcus aureus)**候选抗生素的生成,通过对“金黄色葡萄球菌活性”和“水溶性”(利用 ADMET-AI 的溶解度模型)进行双参数优化。最后,我们将 SyntheMol-RL 的能力从抗生素设计扩展到荧光小分子设计,开发了 SyntheFluor-RL(第五章),并成功应用于新型荧光染料的设计。

**作为药物研发科学辅助手段的生成式 AI

除小分子药物设计外,我们还探索了 LLMs 作为科学助手在药物研发中的应用。首先,我们利用 UniTox [6](第六章)测试了 LLMs 从大规模、相对非结构化的 FDA 药物标签中提取药物毒性信息的能力;在该研究中,我们利用 GPT-4o 构建了一个涵盖多种毒性类型(如心脏毒性、肝毒性等)的统一药物毒性数据库。鉴于 UniTox 的成功,我们将 LLMs 的应用扩展到药物研发流程本身。具体而言,我们构建了 Virtual Lab [7](第七章),这是一个旨在作为人类研究人员科学协作伙伴的 AI 智能体(AI agents)框架。我们展示了如何应用 Virtual Lab 来设计针对近期 SARS-CoV-2 变异株的结合纳米抗体,并进行了实验验证。虽然 AI 智能体能够成功处理从高层研究设计到低层代码编写的多个环节,但仍缺乏某些关键的领域知识。因此,我们进一步实验了微调(finetuning) LLMs 的方法,以增强其在生物医学领域的知识储备 [8](第八章)。 通过这些不同的项目,我展示了生成式 AI 在药物研发中的优势与局限性,并指出了未来在生成式 AI 方法及应用方面亟待开展的研究工作。

成为VIP会员查看完整内容
11

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
《医学中的生成式人工智能》
专知会员服务
45+阅读 · 2024年12月16日
《Engineering》:从数据到AI药物研发
专知会员服务
46+阅读 · 2023年5月17日
AI药物设计前沿进展探讨,智药公开课今晚19:30开播!
专知会员服务
15+阅读 · 2022年6月22日
人工智能到深度学习:药物发现的机器智能方法
专知会员服务
37+阅读 · 2022年5月6日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员