Traditionally, AI research in medical diagnosis has largely centered on image analysis. While this has led to notable advancements, the absence of patient-reported symptoms continues to hinder diagnostic accuracy. To address this, we propose a Pre-Consultation Dialogue Framework (PCDF) that mimics real-world diagnostic procedures, where doctors iteratively query patients before reaching a conclusion. Specifically, we simulate diagnostic dialogues between two vision-language models (VLMs): a DocVLM, which generates follow-up questions based on the image and dialogue history, and a PatientVLM, which responds using a symptom profile derived from the ground-truth diagnosis. We additionally conducted a small-scale clinical validation of the synthetic symptoms generated by our framework, with licensed clinicians confirming their clinical relevance, symptom coverage, and overall realism. These findings indicate that the resulting DocVLM-PatientVLM interactions form coherent, multi-turn consultations paired with images and diagnoses, which we then use to fine-tune the DocVLM. This dialogue-based supervision leads to substantial gains over image-only training, highlighting the value of realistic symptom elicitation for diagnosis.


翻译:传统上,医学诊断领域的人工智能研究主要集中于图像分析。尽管这一方向已取得显著进展,但患者自述症状的缺失仍持续制约着诊断准确性的提升。为解决此问题,我们提出了一种预咨询对话框架,该框架模拟现实世界中的诊断流程——医生在得出结论前会与患者进行多轮交互询问。具体而言,我们构建了两个视觉语言模型间的诊断对话模拟系统:DocVLM基于医学影像和对话历史生成后续追问,PatientVLM则依据真实诊断结果构建的症状特征库进行应答。此外,我们对框架生成的合成症状开展了小规模临床验证,持照临床医生确认了这些症状的临床相关性、症状覆盖度及整体真实性。研究结果表明,由此产生的DocVLM-PatientVLM交互形成了与影像和诊断配对的连贯多轮咨询对话。我们随后利用这些对话数据对DocVLM进行微调,这种基于对话的监督机制相比纯图像训练取得了显著性能提升,凸显了真实症状采集对于诊断的重要价值。

0
下载
关闭预览

相关内容

用于三维医学影像理解的综合语言–图像预训练
专知会员服务
7+阅读 · 2025年11月5日
【博士论文】结合图像与文本以提升医学图像理解
专知会员服务
30+阅读 · 2025年3月1日
大型语言模型疾病诊断综述
专知会员服务
32+阅读 · 2024年9月21日
LLM in Medical Domain: 大语言模型在医学领域的应用
专知会员服务
103+阅读 · 2023年6月17日
【AAAI2022】Diaformer: 采用症状序列生成的方式做自动诊断
专知会员服务
68+阅读 · 2021年6月3日
【AAAI2021】低资源医疗对话生成的图演化元学习
专知会员服务
48+阅读 · 2020年12月26日
【AI与医学】多模态机器学习精准医疗健康
深度学习与医学图像分析
人工智能前沿讲习班
40+阅读 · 2019年6月8日
大讲堂 | 基于医疗知识的疾病诊断预测
AI科技评论
10+阅读 · 2019年1月22日
一文读懂智能对话系统
数据派THU
16+阅读 · 2018年1月27日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员