科学发现的推进依赖于科学家针对复杂问题提出新颖假设,并通过严格的实验验证来检验这些假设。为增强这一过程,我们提出了 Co-Scientist:一个基于 Gemini 构建的多智能体 AI 系统,用于结构化科学思维与假设生成。Co-Scientist 旨在帮助科学家发现新的原创性知识。基于用户给定的研究目标和既有科学证据,该系统能够形成可被证明具有新颖性的研究假设,并供后续实验验证。
该系统的设计包括多个智能体,它们持续生成、批判并优化假设,同时通过扩展测试时计算来加速这一过程。 本文的主要贡献包括:
自动化评估表明,测试时计算扩展能够持续带来收益,使假设质量随时间不断提升。尽管 Co-Scientist 具有通用性,本文重点在三个生物医学应用场景中进行了验证:药物重定位、新靶点发现,以及解释抗微生物耐药机制。具体而言,Co-Scientist 帮助识别了急性髓系白血病的新型药物重定位候选药物和协同联合疗法,并通过体外实验得到了验证。这些真实世界验证结果展示了 Co-Scientist 加速科学发现的潜力,并有望开启一个由 AI 赋能科学家的新时代。
https://www.nature.com/articles/s41586-026-10644-y
科学发现由观察、假设生成、实验和数据分析这一迭代过程所驱动。尽管近年来人工智能在生物学领域的应用取得了进展,但目前尚无系统能够自动化完成所有这些阶段 [1, 2, 3]。在此,我们提出 Robin,这是首个能够在实验生物学中完全自动化假设生成与数据分析的多智能体系统。通过整合文献检索智能体与数据分析智能体,Robin 能够生成假设、提出实验方案、解释实验结果,并生成更新后的假设,从而实现一种半自主的科学发现方法。
通过应用该系统,我们识别出了用于治疗干性年龄相关性黄斑变性(dry age-related macular degeneration, dAMD)的有前景治疗候选物。dAMD 是发达国家导致失明的主要原因 [4, 5]。Robin 提出将增强视网膜色素上皮细胞吞噬作用作为一种治疗策略,并识别和确认了 ripasudil 与 KL001 在体外实验中的有效性。Ripasudil 是一种临床使用的 Rho 激酶(ROCK)抑制剂,此前从未被提出用于治疗 dAMD。
为阐明 ripasudil 诱导吞噬作用上调的机制,Robin 随后提出并分析了一项后续 RNA-seq 实验。该实验揭示了 ABCA1 的上调;ABCA1 是一种脂质外排泵,也可能是一个新的潜在治疗靶点。本报告正文中的所有假设、实验方向、数据分析和数据图均由 Robin 生成。作为首个能够在“实验室人在环”(lab-in-the-loop)迭代框架中自主发现并验证新型治疗候选物的 AI 系统,Robin 为 AI 驱动的科学发现建立了一种新的范式。
科学发现的循环过程经常受限于为支持计算实验而缓慢、手工创建软件这一瓶颈。为解决这一问题,我们提出 Empirical Research Assistance(ERA),这是一个能够创建专家级科学软件的 AI 系统,其目标是最大化某一质量指标。该系统结合大语言模型(Large Language Model, LLM)与树搜索(Tree Search, TS)方法,系统性地提升质量指标,并智能地探索庞大的潜在解决方案空间。
当 ERA 从外部来源探索并整合复杂研究思想时,它能够达到专家级结果。树搜索的有效性在多种任务中得到了验证。在生物信息学领域,ERA 发现了 40 种用于单细胞数据分析的新方法,这些方法在公开排行榜上优于顶尖的人类开发方法。在流行病学领域,ERA 生成了 14 个模型,在 COVID-19 住院人数预测任务中超过了 CDC 集成模型以及所有其他单一模型。ERA 还为地理空间分析、斑马鱼神经活动预测、积分数值求解等任务生成了专家级软件,并提出了一种用于时间序列预测的新型基于规则的构造方法。
通过为多样化任务设计并实现新的解决方案,ERA 代表了迈向加速科学进步的重要一步。