Rethinking the AI Scientist: Interactive Multi-Agent Workflows for Scientific Discovery - 专知论文

会员服务 ·

0

系统 · 交互 · 科学发现 · AI · 科学家 ·

Rethinking the AI Scientist: Interactive Multi-Agent Workflows for Scientific Discovery

翻译：重新思考AI科学家：面向科学发现的多智能体交互工作流

Lukas Weidener,Marko Brkić,Mihailo Jovanović,Ritvik Singh,Chiara Baccin,Emre Ulgac,Alex Dobrin,Aakaash Meduri

Artificial intelligence systems for scientific discovery have demonstrated remarkable potential, yet existing approaches remain largely proprietary and operate in batch-processing modes requiring hours per research cycle, precluding real-time researcher guidance. This paper introduces Deep Research, a multi-agent system enabling interactive scientific investigation with turnaround times measured in minutes. The architecture comprises specialized agents for planning, data analysis, literature search, and novelty detection, unified through a persistent world state that maintains context across iterative research cycles. Two operational modes support different workflows: semi-autonomous mode with selective human checkpoints, and fully autonomous mode for extended investigations. Evaluation on the BixBench computational biology benchmark demonstrated state-of-the-art performance, achieving 48.8% accuracy on open response and 64.4% on multiple-choice evaluation, exceeding existing baselines by 14 to 26 percentage points. Analysis of architectural constraints, including open access literature limitations and challenges inherent to automated novelty assessment, informs practical deployment considerations for AI-assisted scientific workflows.

翻译：科学发现人工智能系统已展现出显著潜力，但现有方法仍主要采用专有架构并以批处理模式运行，每个研究周期需耗时数小时，无法实现研究人员的实时指导。本文提出Deep Research多智能体系统，该系统支持分钟级响应的交互式科学研究。该架构包含规划、数据分析、文献检索和新颖性检测等专用智能体，通过持久化世界状态进行统一协调，在迭代研究周期中保持上下文连贯性。系统提供两种运行模式以支持不同工作流：包含选择性人工检查点的半自主模式，以及适用于长期探索的全自主模式。在BixBench计算生物学基准测试中的评估表明，系统在开放回答任务上达到48.8%准确率，多项选择任务上达到64.4%准确率，较现有基线提升14至26个百分点，实现了最先进的性能表现。通过对架构约束（包括开放获取文献的局限性及自动化新颖性评估的固有挑战）的分析，为人工智能辅助科学工作流的实际部署提供了实践指导。

0

相关内容

从面向科学的人工智能到智能体科学：自主科学发现综述

从面向科学的人工智能到智能体科学：自主科学发现综述

专知会员服务

54+阅读 · 2025年8月21日

Agent AI：多模态交互的新地平线

Agent AI：多模态交互的新地平线

专知会员服务

22+阅读 · 2025年5月26日

《面向科学发现的智能体人工智能：进展、挑战与未来方向综述》

《面向科学发现的智能体人工智能：进展、挑战与未来方向综述》

专知会员服务

60+阅读 · 2025年3月14日

【AI4Science】利用大型语言模型变革科学：关于人工智能辅助科学发现、实验、内容生成与评估的调研

【AI4Science】利用大型语言模型变革科学：关于人工智能辅助科学发现、实验、内容生成与评估的调研

专知会员服务

33+阅读 · 2025年2月10日

【NUS博士论文】面向交互的多智能体行为预测，156页pdf

【NUS博士论文】面向交互的多智能体行为预测，156页pdf

专知会员服务

32+阅读 · 2024年11月17日

多模态智能体AI开启新浪潮！李飞飞等14位斯坦福微软大牛等撰写 80页《AGENT AI: 综述多模态交互的前沿展望》

多模态智能体AI开启新浪潮！李飞飞等14位斯坦福微软大牛等撰写 80页《AGENT AI: 综述多模态交互的前沿展望》

专知会员服务

203+阅读 · 2024年1月9日

【AI4Science】《人工智能科学：深度学习革命》2023新书，

【AI4Science】《人工智能科学：深度学习革命》2023新书，

专知会员服务

214+阅读 · 2023年6月15日

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

专知会员服务

204+阅读 · 2023年4月5日

《多智能体交互的深度强化学习》爱丁堡大学10余为作者2022最新论文

《多智能体交互的深度强化学习》爱丁堡大学10余为作者2022最新论文

专知会员服务

53+阅读 · 2022年11月22日

《人工智能之人机交互》报告重磅发布，展示AI+人机交互的酷炫现状与未来

《人工智能之人机交互》报告重磅发布，展示AI+人机交互的酷炫现状与未来

专知会员服务

53+阅读 · 2022年4月30日

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

专知

62+阅读 · 2023年4月5日

【2022新书】使用Scikit-Learn、Keras和TensorFlow实践机器学习:构建智能系统的概念、工具和技术第三版

【2022新书】使用Scikit-Learn、Keras和TensorFlow实践机器学习:构建智能系统的概念、工具和技术第三版

专知

15+阅读 · 2022年11月8日

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

专知

53+阅读 · 2019年12月1日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

综述AI未来：神经科学启发的类脑计算

综述AI未来：神经科学启发的类脑计算

人工智能学家

11+阅读 · 2018年4月24日

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

AI研习社

11+阅读 · 2018年1月4日

Deepmind 新成果，让机器挑战更复杂阅读理解问题

Deepmind 新成果，让机器挑战更复杂阅读理解问题

AI掘金志

11+阅读 · 2018年1月3日

Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 回顾

Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 回顾

AI研习社

11+阅读 · 2017年12月16日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

基于深度学习技术的视神经系统研究

国家自然科学基金

7+阅读 · 2017年12月31日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向物联网搜索的群智感知关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

From Labor to Collaboration: A Methodological Experiment Using AI Agents to Augment Research Perspectives in Taiwan's Humanities and Social Sciences

From Labor to Collaboration: A Methodological Experiment Using AI Agents to Augment Research Perspectives in Taiwan's Humanities and Social Sciences

Arxiv

0+阅读 · 2月19日

Anagent For Enhancing Scientific Table & Figure Analysis

Arxiv

0+阅读 · 2月10日

Rethinking Memory Mechanisms of Foundation Agents in the Second Half: A Survey

Arxiv

0+阅读 · 2月10日

Towards Agentic Intelligence for Materials Science

Arxiv

0+阅读 · 2月6日

DeepAgent: A General Reasoning Agent with Scalable Toolsets

Arxiv

0+阅读 · 2月5日

Internet of Agentic AI: Incentive-Compatible Distributed Teaming and Workflow

Arxiv

0+阅读 · 2月3日

Towards AI as Colleagues: Multi-Agent System Improves Structured Ideation Processes

Arxiv

0+阅读 · 1月31日

Beyond Retrieval: A Modular Benchmark for Academic Deep Research Agents

Arxiv

0+阅读 · 1月30日

Empowering Scientific Workflows with Federated Agents

Arxiv

0+阅读 · 1月29日

TrustResearcher: Automating Knowledge-Grounded and Transparent Research Ideation with Multi-Agent Collaboration

Arxiv

0+阅读 · 1月25日

VIP会员

文章信息

相关主题

最新内容

《在指挥链中通过多准则决策分析传达指挥官意图：空战实验》

《在指挥链中通过多准则决策分析传达指挥官意图：空战实验》

专知会员服务

9+阅读 · 今天10:44

消耗优势：美军的“精确规模化”概念

消耗优势：美军的“精确规模化”概念

专知会员服务

5+阅读 · 今天10:12

五角大楼的AI优先战略及其对现代战争的启示：来自与伊朗冲突的经验教训

五角大楼的AI优先战略及其对现代战争的启示：来自与伊朗冲突的经验教训

专知会员服务

6+阅读 · 今天9:56

《网络空间兵棋推演：挑战、局限性与混合路径》报告

《网络空间兵棋推演：挑战、局限性与混合路径》报告

专知会员服务

5+阅读 · 今天10:09

《离线语言支持系统：面向空战战术决策》

《离线语言支持系统：面向空战战术决策》

专知会员服务

5+阅读 · 今天9:53

《以通信为中心的6G–LLM架构：面向可扩展的战术自主防御车辆网络》

《以通信为中心的6G–LLM架构：面向可扩展的战术自主防御车辆网络》

专知会员服务

4+阅读 · 今天9:51

ICML 2026｜ECA：面向开放式图文生成的高效持续对齐

ICML 2026｜ECA：面向开放式图文生成的高效持续对齐

专知会员服务

4+阅读 · 6月14日

可信智能体AI综述：安全、鲁棒性、隐私与系统安全

可信智能体AI综述：安全、鲁棒性、隐私与系统安全

专知会员服务

4+阅读 · 6月14日

俄乌战场地面机器人如何改写战争规则

俄乌战场地面机器人如何改写战争规则

专知会员服务

9+阅读 · 6月14日

美国海军研究生院第23届年度采购研究研讨会与创新峰会：主题“加速作战能力”，附会议报告论文集1300页

美国海军研究生院第23届年度采购研究研讨会与创新峰会：主题“加速作战能力”，附会议报告论文集1300页

专知会员服务

9+阅读 · 6月14日

《新空中力量概念：来自敏捷战斗运用的启示》2026最新50页报告

《新空中力量概念：来自敏捷战斗运用的启示》2026最新50页报告

专知会员服务

12+阅读 · 6月14日

《无人水面艇文献综述与结构设计》135页

《无人水面艇文献综述与结构设计》135页

专知会员服务

13+阅读 · 6月13日

《自主蜂群系统的战略架构：多域一体化、抗毁韧性及海上作战框架（2025—2035）》46页报告

《自主蜂群系统的战略架构：多域一体化、抗毁韧性及海上作战框架（2025—2035）》46页报告

专知会员服务

11+阅读 · 6月13日

ICML 2026｜MEMOPILOT：用强化学习训练会进化的智能体记忆

ICML 2026｜MEMOPILOT：用强化学习训练会进化的智能体记忆

专知会员服务

2+阅读 · 6月13日

智能体时间序列系统全景综述：架构、可靠性与研究前沿

智能体时间序列系统全景综述：架构、可靠性与研究前沿

专知会员服务

11+阅读 · 6月13日

相关VIP内容

从面向科学的人工智能到智能体科学：自主科学发现综述

从面向科学的人工智能到智能体科学：自主科学发现综述

专知会员服务

54+阅读 · 2025年8月21日

Agent AI：多模态交互的新地平线

Agent AI：多模态交互的新地平线

专知会员服务

22+阅读 · 2025年5月26日

《面向科学发现的智能体人工智能：进展、挑战与未来方向综述》

《面向科学发现的智能体人工智能：进展、挑战与未来方向综述》

专知会员服务

60+阅读 · 2025年3月14日

【AI4Science】利用大型语言模型变革科学：关于人工智能辅助科学发现、实验、内容生成与评估的调研

【AI4Science】利用大型语言模型变革科学：关于人工智能辅助科学发现、实验、内容生成与评估的调研

专知会员服务

33+阅读 · 2025年2月10日

【NUS博士论文】面向交互的多智能体行为预测，156页pdf

【NUS博士论文】面向交互的多智能体行为预测，156页pdf

专知会员服务

32+阅读 · 2024年11月17日

多模态智能体AI开启新浪潮！李飞飞等14位斯坦福微软大牛等撰写 80页《AGENT AI: 综述多模态交互的前沿展望》

多模态智能体AI开启新浪潮！李飞飞等14位斯坦福微软大牛等撰写 80页《AGENT AI: 综述多模态交互的前沿展望》

专知会员服务

203+阅读 · 2024年1月9日

【AI4Science】《人工智能科学：深度学习革命》2023新书，

【AI4Science】《人工智能科学：深度学习革命》2023新书，

专知会员服务

214+阅读 · 2023年6月15日

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

专知会员服务

204+阅读 · 2023年4月5日

《多智能体交互的深度强化学习》爱丁堡大学10余为作者2022最新论文

《多智能体交互的深度强化学习》爱丁堡大学10余为作者2022最新论文

专知会员服务

53+阅读 · 2022年11月22日

《人工智能之人机交互》报告重磅发布，展示AI+人机交互的酷炫现状与未来

《人工智能之人机交互》报告重磅发布，展示AI+人机交互的酷炫现状与未来

专知会员服务

53+阅读 · 2022年4月30日

热门VIP内容

开通专知VIP会员享更多权益服务

消耗优势：美军的“精确规模化”概念

《网络空间兵棋推演：挑战、局限性与混合路径》报告

《在指挥链中通过多准则决策分析传达指挥官意图：空战实验》

五角大楼的AI优先战略及其对现代战争的启示：来自与伊朗冲突的经验教训

相关资讯

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

专知

62+阅读 · 2023年4月5日

【2022新书】使用Scikit-Learn、Keras和TensorFlow实践机器学习:构建智能系统的概念、工具和技术第三版

【2022新书】使用Scikit-Learn、Keras和TensorFlow实践机器学习:构建智能系统的概念、工具和技术第三版

专知

15+阅读 · 2022年11月8日

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

专知

53+阅读 · 2019年12月1日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

综述AI未来：神经科学启发的类脑计算

综述AI未来：神经科学启发的类脑计算

人工智能学家

11+阅读 · 2018年4月24日

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

AI研习社

11+阅读 · 2018年1月4日

Deepmind 新成果，让机器挑战更复杂阅读理解问题

Deepmind 新成果，让机器挑战更复杂阅读理解问题

AI掘金志

11+阅读 · 2018年1月3日

Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 回顾

Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 回顾

AI研习社

11+阅读 · 2017年12月16日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

相关论文

From Labor to Collaboration: A Methodological Experiment Using AI Agents to Augment Research Perspectives in Taiwan's Humanities and Social Sciences

From Labor to Collaboration: A Methodological Experiment Using AI Agents to Augment Research Perspectives in Taiwan's Humanities and Social Sciences

Arxiv

0+阅读 · 2月19日

Anagent For Enhancing Scientific Table & Figure Analysis

Arxiv

0+阅读 · 2月10日

Rethinking Memory Mechanisms of Foundation Agents in the Second Half: A Survey

Arxiv

0+阅读 · 2月10日

Towards Agentic Intelligence for Materials Science

Arxiv

0+阅读 · 2月6日

DeepAgent: A General Reasoning Agent with Scalable Toolsets

Arxiv

0+阅读 · 2月5日

Internet of Agentic AI: Incentive-Compatible Distributed Teaming and Workflow

Arxiv

0+阅读 · 2月3日

Towards AI as Colleagues: Multi-Agent System Improves Structured Ideation Processes

Arxiv

0+阅读 · 1月31日

Beyond Retrieval: A Modular Benchmark for Academic Deep Research Agents

Arxiv

0+阅读 · 1月30日

Empowering Scientific Workflows with Federated Agents

Arxiv

0+阅读 · 1月29日

TrustResearcher: Automating Knowledge-Grounded and Transparent Research Ideation with Multi-Agent Collaboration

Arxiv

0+阅读 · 1月25日

相关基金

基于深度学习技术的视神经系统研究

国家自然科学基金

7+阅读 · 2017年12月31日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向物联网搜索的群智感知关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员