EvoClinician: A Self-Evolving Agent for Multi-Turn Medical Diagnosis via Test-Time Evolutionary Learning - 专知论文

会员服务 ·

0

智能体 · 进化学习 · 基准 · 行者 · IR ·

EvoClinician: A Self-Evolving Agent for Multi-Turn Medical Diagnosis via Test-Time Evolutionary Learning

翻译：EvoClinician：一种通过测试时进化学习实现多轮医疗诊断的自进化智能体

Yufei He,Juncheng Liu,Zhiyuan Hu,Yulin Chen,Yue Liu,Yuan Sui,Yibo Li,Nuo Chen,Jun Hu,Bryan Hooi,Xinxing Xu,Jiang Bian

Prevailing medical AI operates on an unrealistic ''one-shot'' model, diagnosing from a complete patient file. However, real-world diagnosis is an iterative inquiry where Clinicians sequentially ask questions and order tests to strategically gather information while managing cost and time. To address this, we first propose Med-Inquire, a new benchmark designed to evaluate an agent's ability to perform multi-turn diagnosis. Built upon a dataset of real-world clinical cases, Med-Inquire simulates the diagnostic process by hiding a complete patient file behind specialized Patient and Examination agents. They force the agent to proactively ask questions and order tests to gather information piece by piece. To tackle the challenges posed by Med-Inquire, we then introduce EvoClinician, a self-evolving agent that learns efficient diagnostic strategies at test time. Its core is a ''Diagnose-Grade-Evolve'' loop: an Actor agent attempts a diagnosis; a Process Grader agent performs credit assignment by evaluating each action for both clinical yield and resource efficiency; finally, an Evolver agent uses this feedback to update the Actor's strategy by evolving its prompt and memory. Our experiments show EvoClinician outperforms continual learning baselines and other self-evolving agents like memory agents. The code is available at https://github.com/yf-he/EvoClinician

翻译：主流的医疗人工智能运行在一种不现实的“一次性”模型上，即从一份完整的患者档案中进行诊断。然而，现实世界的诊断是一个迭代的询问过程，临床医生会依次提问并安排检查，以策略性地收集信息，同时管理成本和时间。为了解决这个问题，我们首先提出了Med-Inquire，这是一个旨在评估智能体执行多轮诊断能力的新基准。该基准基于真实世界临床病例数据集构建，通过将完整的患者档案隐藏在专门的“患者”和“检查”智能体之后，来模拟诊断过程。这些智能体迫使诊断智能体主动提问并安排检查，以逐条收集信息。为了应对Med-Inquire带来的挑战，我们随后引入了EvoClinician，这是一种在测试时学习高效诊断策略的自进化智能体。其核心是一个“诊断-评分-进化”循环：一个执行者智能体尝试进行诊断；一个过程评分者智能体通过评估每个行动的临床收益和资源效率来执行信用分配；最后，一个进化者智能体利用此反馈，通过进化执行者的提示和记忆来更新其策略。我们的实验表明，EvoClinician的表现优于持续学习基线模型以及其他自进化智能体（如记忆智能体）。代码可在 https://github.com/yf-he/EvoClinician 获取。

0

相关内容

智能体

智能体，顾名思义，就是具有智能的实体，英文名是Agent。

自进化人工智能体的全面综述：连接基础模型与终身自主智能系统的新范式

自进化人工智能体的全面综述：连接基础模型与终身自主智能系统的新范式

专知会员服务

36+阅读 · 2025年12月28日

超越生成式人工智能：用于临床预测、反事实推断与规划的世界模型

超越生成式人工智能：用于临床预测、反事实推断与规划的世界模型

专知会员服务

23+阅读 · 2025年11月23日

《医疗领域中的具身人工智能综述：技术、应用与机会》

《医疗领域中的具身人工智能综述：技术、应用与机会》

专知会员服务

30+阅读 · 2025年1月14日

谷歌《智能体Agent》白皮书，42页pdf

谷歌《智能体Agent》白皮书，42页pdf

专知会员服务

108+阅读 · 2025年1月5日

AI Agent：基于大模型的自主智能体

AI Agent：基于大模型的自主智能体

专知会员服务

250+阅读 · 2023年9月9日

Nature Medicine | 多模态的生物医学AI

Nature Medicine | 多模态的生物医学AI

专知会员服务

31+阅读 · 2022年9月25日

AI医学趋势？香港城市大学最新《人工智能与医学》文献综述，六大类27篇代表性论文全面叙述最新进展：专业化、问题导向、以患者为中心

AI医学趋势？香港城市大学最新《人工智能与医学》文献综述，六大类27篇代表性论文全面叙述最新进展：专业化、问题导向、以患者为中心

专知会员服务

84+阅读 · 2022年5月17日

【AI与医学】多模态机器学习精准医疗健康

【AI与医学】多模态机器学习精准医疗健康

专知会员服务

83+阅读 · 2022年4月25日

【AAAI2022】Diaformer: 采用症状序列生成的方式做自动诊断

【AAAI2022】Diaformer: 采用症状序列生成的方式做自动诊断

专知会员服务

12+阅读 · 2022年2月1日

【Nature Medicine】人工智能与医学结合的最新综述，附13页PDF

专知会员服务

109+阅读 · 2019年1月7日

不可错过！斯坦福《人工智能医学健康》课程，全面阐述AI在医学的应用，附Slides

不可错过！斯坦福《人工智能医学健康》课程，全面阐述AI在医学的应用，附Slides

专知

11+阅读 · 2022年10月24日

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

专知

14+阅读 · 2022年5月31日

【AI与医学】多模态机器学习精准医疗健康

【AI与医学】多模态机器学习精准医疗健康

专知

17+阅读 · 2022年4月25日

联邦学习如何用于医疗？Deakin最新《联邦学习智慧医疗》综述论文全面阐述联邦学习在医疗的应用

联邦学习如何用于医疗？Deakin最新《联邦学习智慧医疗》综述论文全面阐述联邦学习在医疗的应用

专知

14+阅读 · 2021年11月27日

【综述】智能医疗综述，48页论文详述医学AI最新进展

【综述】智能医疗综述，48页论文详述医学AI最新进展

专知

41+阅读 · 2019年9月11日

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

专知

15+阅读 · 2019年4月6日

医疗中的自动机器学习和可解释性

医疗中的自动机器学习和可解释性

专知

24+阅读 · 2019年4月1日

基于知识图谱的智能医疗诊断系统（提供医生机器人的实现方案）

基于知识图谱的智能医疗诊断系统（提供医生机器人的实现方案）

专知

12+阅读 · 2019年3月25日

AI+医疗真正落地？Nature Medicine同时刊登9篇论文，聚焦人工智能在医学领域的应用

AI+医疗真正落地？Nature Medicine同时刊登9篇论文，聚焦人工智能在医学领域的应用

专知

14+阅读 · 2019年1月12日

【智能医疗】【知识图谱】中文电子病历命名实体识别的主动学习方法 | 病历智能分析系统的研究与实现 | 临床路径知识建模研究

【智能医疗】【知识图谱】中文电子病历命名实体识别的主动学习方法 | 病历智能分析系统的研究与实现 | 临床路径知识建模研究

产业智能官

29+阅读 · 2017年12月10日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

精神分裂症的多尺度动态功能连接研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于深度表达和迁移学习的人体检测研究

国家自然科学基金

6+阅读 · 2015年12月31日

多级可控组装模拟生物体系的功能

国家自然科学基金

0+阅读 · 2015年12月31日

基于计算智能的心系基础证量化诊断方法学研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多模态脑影像处理和多维可视化的辅助诊疗技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

基于多模态医学图像处理的多维可视化辅助诊疗关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

乳腺癌自我管理的行为机制及移动医疗智能管理模式的实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

集核酸纯化、多病原体LAMP反应及在线检测为一体的床旁检测芯片研制

国家自然科学基金

0+阅读 · 2014年12月31日

ABM-UDE: Developing Surrogates for Epidemic Agent-Based Models via Scientific Machine Learning

Arxiv

0+阅读 · 2月25日

MedClarify: An information-seeking AI agent for medical diagnosis with case-specific follow-up questions

Arxiv

0+阅读 · 2月19日

MemRL: Self-Evolving Agents via Runtime Reinforcement Learning on Episodic Memory

Arxiv

0+阅读 · 2月12日

Evolving Interactive Diagnostic Agents in a Virtual Clinical Environment

Arxiv

0+阅读 · 2月10日

EvoFSM: Controllable Self-Evolution for Deep Research with Finite State Machines

Arxiv

0+阅读 · 2月4日

DEEPMED: Building a Medical DeepResearch Agent via Multi-hop Med-Search Data and Turn-Controlled Agentic Training & Inference

Arxiv

0+阅读 · 2月4日

Self-evolving Embodied AI

Arxiv

0+阅读 · 2月4日

MemSkill: Learning and Evolving Memory Skills for Self-Evolving Agents

Arxiv

0+阅读 · 2月2日

SIDiffAgent: Self-Improving Diffusion Agent

Arxiv

0+阅读 · 2月2日

AgentScore: Autoformulation of Deployable Clinical Scoring Systems

Arxiv

0+阅读 · 1月29日

VIP会员

文章信息

相关主题

最新内容

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

专知会员服务

2+阅读 · 7月17日

《边缘端实时无线感知赋能现场多机器人部署》200页

《边缘端实时无线感知赋能现场多机器人部署》200页

专知会员服务

3+阅读 · 7月17日

战力倍增器：自主武器系统与乌克兰及加沙冲突

战力倍增器：自主武器系统与乌克兰及加沙冲突

专知会员服务

2+阅读 · 7月17日

人工智能赋能战场情报：提速决策进程

人工智能赋能战场情报：提速决策进程

专知会员服务

1+阅读 · 7月17日

《拥抱新兴技术：面向未来军官的教育革新》

《拥抱新兴技术：面向未来军官的教育革新》

专知会员服务

4+阅读 · 7月17日

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

专知会员服务

1+阅读 · 7月17日

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

专知会员服务

1+阅读 · 7月17日

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

专知会员服务

11+阅读 · 7月16日

《无人地面战车（UGV）的崛起》报告

《无人地面战车（UGV）的崛起》报告

专知会员服务

7+阅读 · 7月16日

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

专知会员服务

6+阅读 · 7月16日

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

专知会员服务

12+阅读 · 7月16日

美陆军任务式指挥人工智能解决方案

美陆军任务式指挥人工智能解决方案

专知会员服务

12+阅读 · 7月16日

ICML 2026 | 理论级自动形式化：从孤立命题到统一形式化知识库

ICML 2026 | 理论级自动形式化：从孤立命题到统一形式化知识库

专知会员服务

9+阅读 · 7月16日

综述 | 现代智能体自我改进，从模型更新到脚手架演化

综述 | 现代智能体自我改进，从模型更新到脚手架演化

专知会员服务

15+阅读 · 7月16日

美国陆军宣布“项目融合-顶点6”：现代化进程的关键里程碑

美国陆军宣布“项目融合-顶点6”：现代化进程的关键里程碑

专知会员服务

13+阅读 · 7月15日

相关VIP内容

自进化人工智能体的全面综述：连接基础模型与终身自主智能系统的新范式

自进化人工智能体的全面综述：连接基础模型与终身自主智能系统的新范式

专知会员服务

36+阅读 · 2025年12月28日

超越生成式人工智能：用于临床预测、反事实推断与规划的世界模型

超越生成式人工智能：用于临床预测、反事实推断与规划的世界模型

专知会员服务

23+阅读 · 2025年11月23日

《医疗领域中的具身人工智能综述：技术、应用与机会》

《医疗领域中的具身人工智能综述：技术、应用与机会》

专知会员服务

30+阅读 · 2025年1月14日

谷歌《智能体Agent》白皮书，42页pdf

谷歌《智能体Agent》白皮书，42页pdf

专知会员服务

108+阅读 · 2025年1月5日

AI Agent：基于大模型的自主智能体

AI Agent：基于大模型的自主智能体

专知会员服务

250+阅读 · 2023年9月9日

Nature Medicine | 多模态的生物医学AI

Nature Medicine | 多模态的生物医学AI

专知会员服务

31+阅读 · 2022年9月25日

AI医学趋势？香港城市大学最新《人工智能与医学》文献综述，六大类27篇代表性论文全面叙述最新进展：专业化、问题导向、以患者为中心

AI医学趋势？香港城市大学最新《人工智能与医学》文献综述，六大类27篇代表性论文全面叙述最新进展：专业化、问题导向、以患者为中心

专知会员服务

84+阅读 · 2022年5月17日

【AI与医学】多模态机器学习精准医疗健康

【AI与医学】多模态机器学习精准医疗健康

专知会员服务

83+阅读 · 2022年4月25日

【AAAI2022】Diaformer: 采用症状序列生成的方式做自动诊断

【AAAI2022】Diaformer: 采用症状序列生成的方式做自动诊断

专知会员服务

12+阅读 · 2022年2月1日

【Nature Medicine】人工智能与医学结合的最新综述，附13页PDF

专知会员服务

109+阅读 · 2019年1月7日

热门VIP内容

开通专知VIP会员享更多权益服务

《边缘端实时无线感知赋能现场多机器人部署》200页

人工智能赋能战场情报：提速决策进程

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

战力倍增器：自主武器系统与乌克兰及加沙冲突

相关资讯

不可错过！斯坦福《人工智能医学健康》课程，全面阐述AI在医学的应用，附Slides

不可错过！斯坦福《人工智能医学健康》课程，全面阐述AI在医学的应用，附Slides

专知

11+阅读 · 2022年10月24日

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

专知

14+阅读 · 2022年5月31日

【AI与医学】多模态机器学习精准医疗健康

【AI与医学】多模态机器学习精准医疗健康

专知

17+阅读 · 2022年4月25日

联邦学习如何用于医疗？Deakin最新《联邦学习智慧医疗》综述论文全面阐述联邦学习在医疗的应用

联邦学习如何用于医疗？Deakin最新《联邦学习智慧医疗》综述论文全面阐述联邦学习在医疗的应用

专知

14+阅读 · 2021年11月27日

【综述】智能医疗综述，48页论文详述医学AI最新进展

【综述】智能医疗综述，48页论文详述医学AI最新进展

专知

41+阅读 · 2019年9月11日

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

专知

15+阅读 · 2019年4月6日

医疗中的自动机器学习和可解释性

医疗中的自动机器学习和可解释性

专知

24+阅读 · 2019年4月1日

基于知识图谱的智能医疗诊断系统（提供医生机器人的实现方案）

基于知识图谱的智能医疗诊断系统（提供医生机器人的实现方案）

专知

12+阅读 · 2019年3月25日

AI+医疗真正落地？Nature Medicine同时刊登9篇论文，聚焦人工智能在医学领域的应用

AI+医疗真正落地？Nature Medicine同时刊登9篇论文，聚焦人工智能在医学领域的应用

专知

14+阅读 · 2019年1月12日

【智能医疗】【知识图谱】中文电子病历命名实体识别的主动学习方法 | 病历智能分析系统的研究与实现 | 临床路径知识建模研究

【智能医疗】【知识图谱】中文电子病历命名实体识别的主动学习方法 | 病历智能分析系统的研究与实现 | 临床路径知识建模研究

产业智能官

29+阅读 · 2017年12月10日

相关论文

ABM-UDE: Developing Surrogates for Epidemic Agent-Based Models via Scientific Machine Learning

Arxiv

0+阅读 · 2月25日

MedClarify: An information-seeking AI agent for medical diagnosis with case-specific follow-up questions

Arxiv

0+阅读 · 2月19日

MemRL: Self-Evolving Agents via Runtime Reinforcement Learning on Episodic Memory

Arxiv

0+阅读 · 2月12日

Evolving Interactive Diagnostic Agents in a Virtual Clinical Environment

Arxiv

0+阅读 · 2月10日

EvoFSM: Controllable Self-Evolution for Deep Research with Finite State Machines

Arxiv

0+阅读 · 2月4日

DEEPMED: Building a Medical DeepResearch Agent via Multi-hop Med-Search Data and Turn-Controlled Agentic Training & Inference

Arxiv

0+阅读 · 2月4日

Self-evolving Embodied AI

Arxiv

0+阅读 · 2月4日

MemSkill: Learning and Evolving Memory Skills for Self-Evolving Agents

Arxiv

0+阅读 · 2月2日

SIDiffAgent: Self-Improving Diffusion Agent

Arxiv

0+阅读 · 2月2日

AgentScore: Autoformulation of Deployable Clinical Scoring Systems

Arxiv

0+阅读 · 1月29日

相关基金

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

精神分裂症的多尺度动态功能连接研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于深度表达和迁移学习的人体检测研究

国家自然科学基金

6+阅读 · 2015年12月31日

多级可控组装模拟生物体系的功能

国家自然科学基金

0+阅读 · 2015年12月31日

基于计算智能的心系基础证量化诊断方法学研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多模态脑影像处理和多维可视化的辅助诊疗技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

基于多模态医学图像处理的多维可视化辅助诊疗关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

乳腺癌自我管理的行为机制及移动医疗智能管理模式的实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

集核酸纯化、多病原体LAMP反应及在线检测为一体的床旁检测芯片研制

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员