Picking the Right Specialist: Attentive Neural Process-based Selection of Task-Specialized Models as Tools for Agentic Healthcare Systems - 专知论文

会员服务 ·

0

工具 · 系统 · 智能医疗 · 神经过程 · 报告生成 ·

Picking the Right Specialist: Attentive Neural Process-based Selection of Task-Specialized Models as Tools for Agentic Healthcare Systems

翻译：为智能医疗系统选择合适专家：基于注意力神经过程的任务专用模型工具选择

Pramit Saha,Joshua Strong,Mohammad Alsharid,Divyanshu Mishra,J. Alison Noble

Task-specialized models form the backbone of agentic healthcare systems, enabling the agents to answer clinical queries across tasks such as disease diagnosis, localization, and report generation. Yet, for a given task, a single "best" model rarely exists. In practice, each task is better served by multiple competing specialist models where different models excel on different data samples. As a result, for any given query, agents must reliably select the right specialist model from a heterogeneous pool of tool candidates. To this end, we introduce ToolSelect, which adaptively learns model selection for tools by minimizing a population risk over sampled specialist tool candidates using a consistent surrogate of the task-conditional selection loss. Concretely, we propose an Attentive Neural Process-based selector conditioned on the query and per-model behavioral summaries to choose among the specialist models. Motivated by the absence of any established testbed, we, for the first time, introduce an agentic Chest X-ray environment equipped with a diverse suite of task-specialized models (17 disease detection, 19 report generation, 6 visual grounding, and 13 VQA) and develop ToolSelectBench, a benchmark of 1448 queries. Our results demonstrate that ToolSelect consistently outperforms 10 SOTA methods across four different task families.

翻译：任务专用模型构成了智能医疗系统的核心支柱，使智能体能够应对疾病诊断、病灶定位及报告生成等临床任务中的查询。然而，对于特定任务，单一"最优"模型几乎不存在。实践中，每个任务往往由多个相互竞争的专家模型共同支撑，不同模型在不同数据样本上表现优异。因此，针对任意给定查询，智能体必须从异构的工具候选池中可靠地选择恰当的专家模型。为此，我们提出ToolSelect方法，该方法通过使用任务条件选择损失的一致性代理函数最小化采样专家工具候选集的总体风险，从而自适应地学习工具模型选择机制。具体而言，我们设计了一种基于注意力神经过程的选择器，该选择器以查询和单模型行为摘要为条件，在专家模型中进行择优选择。鉴于现有测试平台的缺失，我们首次构建了配备多样化任务专用模型套件（17个疾病检测模型、19个报告生成模型、6个视觉定位模型及13个视觉问答模型）的智能胸片X光分析环境，并开发了包含1448个查询的基准测试集ToolSelectBench。实验结果表明，ToolSelect在四大任务类别中持续优于10种前沿方法。

0

相关内容

AI 智能体系统：体系架构、应用场景及评估范式

AI 智能体系统：体系架构、应用场景及评估范式

专知会员服务

70+阅读 · 1月6日

【AAAI2026】AutoTool：面向大语言模型智能体的高效工具选择方法

【AAAI2026】AutoTool：面向大语言模型智能体的高效工具选择方法

专知会员服务

19+阅读 · 2025年11月19日

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

专知会员服务

27+阅读 · 2025年11月17日

【斯坦福博士论文】为人类使用优化人工智能模型

【斯坦福博士论文】为人类使用优化人工智能模型

专知会员服务

17+阅读 · 2025年6月20日

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

专知会员服务

27+阅读 · 2025年5月7日

作战任务智能规划系统设计及关键技术研究

作战任务智能规划系统设计及关键技术研究

专知会员服务

108+阅读 · 2024年4月25日

【ChatGPT系列报告】AI+医疗：智医助理，40页ppt

【ChatGPT系列报告】AI+医疗：智医助理，40页ppt

专知会员服务

107+阅读 · 2023年6月30日

医疗人工智能：知识引导与数据挖掘联合驱动

医疗人工智能：知识引导与数据挖掘联合驱动

专知会员服务

70+阅读 · 2023年2月15日

36氪研究院 | 2021年中国医疗AI行业研究报告，40页pdf

36氪研究院 | 2021年中国医疗AI行业研究报告，40页pdf

专知会员服务

84+阅读 · 2021年12月22日

【南洋理工大学课程】注意力神经网络，Attention Neural Networks，附78页PPT

【南洋理工大学课程】注意力神经网络，Attention Neural Networks，附78页PPT

专知会员服务

157+阅读 · 2019年11月9日

不可错过！斯坦福《人工智能医学健康》课程，全面阐述AI在医学的应用，附Slides

不可错过！斯坦福《人工智能医学健康》课程，全面阐述AI在医学的应用，附Slides

专知

11+阅读 · 2022年10月24日

专家报告|深度学习+图像多模态融合

专家报告|深度学习+图像多模态融合

中国图象图形学报

12+阅读 · 2019年10月23日

MSRA开源基于注意力机制的全新推荐模型，融合用户长短期偏好

MSRA开源基于注意力机制的全新推荐模型，融合用户长短期偏好

AI前线

15+阅读 · 2019年9月22日

基于知识图谱的智能医疗诊断系统（提供医生机器人的实现方案）

基于知识图谱的智能医疗诊断系统（提供医生机器人的实现方案）

专知

12+阅读 · 2019年3月25日

目标检测集成框架在医学图像 AI 辅助分析中的应用

目标检测集成框架在医学图像 AI 辅助分析中的应用

AI掘金志

11+阅读 · 2019年3月1日

沈定刚教授：深度学习在医学影像分析中的应用丨2018医学影像AI经典演讲回顾（二）

沈定刚教授：深度学习在医学影像分析中的应用丨2018医学影像AI经典演讲回顾（二）

AI掘金志

17+阅读 · 2019年2月3日

上海交大发布：《中国人工智能医疗白皮书》-附207页PDF

上海交大发布：《中国人工智能医疗白皮书》-附207页PDF

专知

23+阅读 · 2019年1月29日

【知识图谱】【智能医疗】病历智能处理引擎的设计、实现和应用

【知识图谱】【智能医疗】病历智能处理引擎的设计、实现和应用

产业智能官

11+阅读 · 2018年1月6日

深度学习中的注意力机制

深度学习中的注意力机制

人工智能头条

16+阅读 · 2017年11月2日

【分享】专知：快速专业一图了解人工智能知识体系大全（附人工智能主题知识树）

【分享】专知：快速专业一图了解人工智能知识体系大全（附人工智能主题知识树）

中国科学院自动化研究所

19+阅读 · 2017年9月19日

保留时域精细结构的高生物拟真全植入式神经形态人工耳蜗芯片设计

国家自然科学基金

0+阅读 · 2015年12月31日

定量模型及在线智能引导的癌症筛查咨询方案优化验证

国家自然科学基金

2+阅读 · 2015年12月31日

基于计算智能的心系基础证量化诊断方法学研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于潜在类别回归模型的失眠中医人群特征分类方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多模态脑影像处理和多维可视化的辅助诊疗技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

面向任务成功性的可修系统重要度分析及优化

国家自然科学基金

0+阅读 · 2014年12月31日

基于视频图像处理的神经导航空间配准方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

基于多模态医学图像处理的多维可视化辅助诊疗关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

指挥控制任务共同体的机制和模型研究

国家自然科学基金

36+阅读 · 2013年12月31日

PAuth - Precise Task-Scoped Authorization For Agents

PAuth - Precise Task-Scoped Authorization For Agents

Arxiv

0+阅读 · 3月17日

Surg$Σ$: A Spectrum of Large-Scale Multimodal Data and Foundation Models for Surgical Intelligence

Arxiv

0+阅读 · 3月17日

Efficient LLM Serving for Agentic Workflows: A Data Systems Perspective

Arxiv

0+阅读 · 3月17日

Imagine-then-Plan: Agent Learning from Adaptive Lookahead with World Models

Arxiv

0+阅读 · 3月16日

Justitia: Fair and Efficient Scheduling of Task-parallel LLM Agents with Selective Pampering

Arxiv

0+阅读 · 3月14日

EyeAgent: An Agentic AI System for Multimodal Clinical Decision Support in Ophthalmology

Arxiv

0+阅读 · 3月11日

A Multi-Agent Framework for Medical AI: Leveraging Fine-Tuned GPT, LLaMA, and DeepSeek R1 for Evidence-Based and Bias-Aware Clinical Query Processing

Arxiv

0+阅读 · 2月15日

AgentSkiller: Scaling Generalist Agent Intelligence through Semantically Integrated Cross-Domain Data Synthesis

Arxiv

1+阅读 · 2月10日

AgentRx: Diagnosing AI Agent Failures from Execution Trajectories

Arxiv

0+阅读 · 2月2日

MedBeads: An Agent-Native, Immutable Data Substrate for Trustworthy Medical AI

Arxiv

0+阅读 · 2月1日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

2+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

4+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

7+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

4+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

6+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

5+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

3+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

8+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

6+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

9+阅读 · 6月22日

相关VIP内容

AI 智能体系统：体系架构、应用场景及评估范式

AI 智能体系统：体系架构、应用场景及评估范式

专知会员服务

70+阅读 · 1月6日

【AAAI2026】AutoTool：面向大语言模型智能体的高效工具选择方法

【AAAI2026】AutoTool：面向大语言模型智能体的高效工具选择方法

专知会员服务

19+阅读 · 2025年11月19日

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

专知会员服务

27+阅读 · 2025年11月17日

【斯坦福博士论文】为人类使用优化人工智能模型

【斯坦福博士论文】为人类使用优化人工智能模型

专知会员服务

17+阅读 · 2025年6月20日

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

专知会员服务

27+阅读 · 2025年5月7日

作战任务智能规划系统设计及关键技术研究

作战任务智能规划系统设计及关键技术研究

专知会员服务

108+阅读 · 2024年4月25日

【ChatGPT系列报告】AI+医疗：智医助理，40页ppt

【ChatGPT系列报告】AI+医疗：智医助理，40页ppt

专知会员服务

107+阅读 · 2023年6月30日

医疗人工智能：知识引导与数据挖掘联合驱动

医疗人工智能：知识引导与数据挖掘联合驱动

专知会员服务

70+阅读 · 2023年2月15日

36氪研究院 | 2021年中国医疗AI行业研究报告，40页pdf

36氪研究院 | 2021年中国医疗AI行业研究报告，40页pdf

专知会员服务

84+阅读 · 2021年12月22日

【南洋理工大学课程】注意力神经网络，Attention Neural Networks，附78页PPT

【南洋理工大学课程】注意力神经网络，Attention Neural Networks，附78页PPT

专知会员服务

157+阅读 · 2019年11月9日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

不可错过！斯坦福《人工智能医学健康》课程，全面阐述AI在医学的应用，附Slides

不可错过！斯坦福《人工智能医学健康》课程，全面阐述AI在医学的应用，附Slides

专知

11+阅读 · 2022年10月24日

专家报告|深度学习+图像多模态融合

专家报告|深度学习+图像多模态融合

中国图象图形学报

12+阅读 · 2019年10月23日

MSRA开源基于注意力机制的全新推荐模型，融合用户长短期偏好

MSRA开源基于注意力机制的全新推荐模型，融合用户长短期偏好

AI前线

15+阅读 · 2019年9月22日

基于知识图谱的智能医疗诊断系统（提供医生机器人的实现方案）

基于知识图谱的智能医疗诊断系统（提供医生机器人的实现方案）

专知

12+阅读 · 2019年3月25日

目标检测集成框架在医学图像 AI 辅助分析中的应用

目标检测集成框架在医学图像 AI 辅助分析中的应用

AI掘金志

11+阅读 · 2019年3月1日

沈定刚教授：深度学习在医学影像分析中的应用丨2018医学影像AI经典演讲回顾（二）

沈定刚教授：深度学习在医学影像分析中的应用丨2018医学影像AI经典演讲回顾（二）

AI掘金志

17+阅读 · 2019年2月3日

上海交大发布：《中国人工智能医疗白皮书》-附207页PDF

上海交大发布：《中国人工智能医疗白皮书》-附207页PDF

专知

23+阅读 · 2019年1月29日

【知识图谱】【智能医疗】病历智能处理引擎的设计、实现和应用

【知识图谱】【智能医疗】病历智能处理引擎的设计、实现和应用

产业智能官

11+阅读 · 2018年1月6日

深度学习中的注意力机制

深度学习中的注意力机制

人工智能头条

16+阅读 · 2017年11月2日

【分享】专知：快速专业一图了解人工智能知识体系大全（附人工智能主题知识树）

【分享】专知：快速专业一图了解人工智能知识体系大全（附人工智能主题知识树）

中国科学院自动化研究所

19+阅读 · 2017年9月19日

相关论文

PAuth - Precise Task-Scoped Authorization For Agents

PAuth - Precise Task-Scoped Authorization For Agents

Arxiv

0+阅读 · 3月17日

Surg$Σ$: A Spectrum of Large-Scale Multimodal Data and Foundation Models for Surgical Intelligence

Arxiv

0+阅读 · 3月17日

Efficient LLM Serving for Agentic Workflows: A Data Systems Perspective

Arxiv

0+阅读 · 3月17日

Imagine-then-Plan: Agent Learning from Adaptive Lookahead with World Models

Arxiv

0+阅读 · 3月16日

Justitia: Fair and Efficient Scheduling of Task-parallel LLM Agents with Selective Pampering

Arxiv

0+阅读 · 3月14日

EyeAgent: An Agentic AI System for Multimodal Clinical Decision Support in Ophthalmology

Arxiv

0+阅读 · 3月11日

A Multi-Agent Framework for Medical AI: Leveraging Fine-Tuned GPT, LLaMA, and DeepSeek R1 for Evidence-Based and Bias-Aware Clinical Query Processing

Arxiv

0+阅读 · 2月15日

AgentSkiller: Scaling Generalist Agent Intelligence through Semantically Integrated Cross-Domain Data Synthesis

Arxiv

1+阅读 · 2月10日

AgentRx: Diagnosing AI Agent Failures from Execution Trajectories

Arxiv

0+阅读 · 2月2日

MedBeads: An Agent-Native, Immutable Data Substrate for Trustworthy Medical AI

Arxiv

0+阅读 · 2月1日

相关基金

保留时域精细结构的高生物拟真全植入式神经形态人工耳蜗芯片设计

国家自然科学基金

0+阅读 · 2015年12月31日

定量模型及在线智能引导的癌症筛查咨询方案优化验证

国家自然科学基金

2+阅读 · 2015年12月31日

基于计算智能的心系基础证量化诊断方法学研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于潜在类别回归模型的失眠中医人群特征分类方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多模态脑影像处理和多维可视化的辅助诊疗技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

面向任务成功性的可修系统重要度分析及优化

国家自然科学基金

0+阅读 · 2014年12月31日

基于视频图像处理的神经导航空间配准方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

基于多模态医学图像处理的多维可视化辅助诊疗关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

指挥控制任务共同体的机制和模型研究

国家自然科学基金

36+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员