Lung cancer clinical decision support demands precise reasoning across complex, multi-stage oncological workflows. Existing multimodal large language models (MLLMs) fail to handle guideline-constrained staging and treatment reasoning. We formalize three oncological precision treatment (OPT) tasks for lung cancer, spanning TNM staging, treatment recommendation, and end-to-end clinical decision support. We introduce LungCURE, the first standardized multimodal benchmark built from 1,000 real-world, clinician-labeled cases across more than 10 hospitals. We further propose LCAgent, a multi-agent framework that ensures guideline-compliant lung cancer clinical decision-making by suppressing cascading reasoning errors across the clinical pathway. Experiments reveal large differences across various large language models (LLMs) in their capabilities for complex medical reasoning, when given precise treatment requirements. We further verify that LCAgent, as a simple yet effective plugin, enhances the reasoning performance of LLMs in real-world medical scenarios.


翻译:肺癌临床决策支持需要在复杂、多阶段的肿瘤诊疗流程中进行精确推理。现有的多模态大语言模型(MLLMs)难以处理受指南约束的分期和治疗推理任务。我们形式化定义了肺癌的三个肿瘤精准治疗(OPT)任务,涵盖TNM分期、治疗推荐和端到端临床决策支持。我们提出了LungCURE,这是首个基于1000例来自超过10家医院的真实世界、经临床医生标注的病例构建的标准化多模态基准。此外,我们提出了LCAgent,一种多智能体框架,通过抑制临床路径中的级联推理错误,确保符合指南规范的肺癌临床决策。实验表明,在给定精准治疗需求的条件下,各类大语言模型(LLMs)在复杂医学推理能力上存在显著差异。我们进一步验证了LCAgent作为一个简单而有效的插件,能够增强LLMs在真实医疗场景中的推理性能。

0
下载
关闭预览

相关内容

LLM in Medical Domain: 大语言模型在医学领域的应用
专知会员服务
103+阅读 · 2023年6月17日
【AI与医学】多模态机器学习精准医疗健康
肿瘤微环境评分: 预测肿瘤免疫治疗疗效的新方法
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
7+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
8+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关VIP内容
LLM in Medical Domain: 大语言模型在医学领域的应用
专知会员服务
103+阅读 · 2023年6月17日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员