ECG-R1: Protocol-Guided and Modality-Agnostic MLLM for Reliable ECG Interpretation - 专知论文

会员服务 ·

0

心电 · 模态 · 多模 · 多模态 · 语言模型 ·

ECG-R1: Protocol-Guided and Modality-Agnostic MLLM for Reliable ECG Interpretation

翻译：ECG-R1：基于协议引导与模态无关的多模态大语言模型实现可靠心电图解读

Jiarui Jin,Haoyu Wang,Xingliang Wu,Xiaocheng Fang,Xiang Lan,Zihan Wang,Deyun Zhang,Bo Liu,Yingying Zhang,Xian Wu,Hongyan Li,Shenda Hong

Electrocardiography (ECG) serves as an indispensable diagnostic tool in clinical practice, yet existing multimodal large language models (MLLMs) remain unreliable for ECG interpretation, often producing plausible but clinically incorrect analyses. To address this, we propose ECG-R1, the first reasoning MLLM designed for reliable ECG interpretation via three innovations. First, we construct the interpretation corpus using \textit{Protocol-Guided Instruction Data Generation}, grounding interpretation in measurable ECG features and monograph-defined quantitative thresholds and diagnostic logic. Second, we present a modality-decoupled architecture with \textit{Interleaved Modality Dropout} to improve robustness and cross-modal consistency when either the ECG signal or ECG image is missing. Third, we present \textit{Reinforcement Learning with ECG Diagnostic Evidence Rewards} to strengthen evidence-grounded ECG interpretation. Additionally, we systematically evaluate the ECG interpretation capabilities of proprietary, open-source, and medical MLLMs, and provide the first quantitative evidence that severe hallucinations are widespread, suggesting that the public should not directly trust these outputs without independent verification. Code and data are publicly available at \href{https://github.com/PKUDigitalHealth/ECG-R1}{here}, and an online platform can be accessed at \href{http://ai.heartvoice.com.cn/ECG-R1/}{here}.

翻译：心电图（ECG）是临床实践中不可或缺的诊断工具，然而现有的多模态大语言模型（MLLMs）在心电图解读方面仍不可靠，常生成看似合理但临床错误的分析。为解决这一问题，我们提出ECG-R1，这是首个通过三项创新实现可靠心电图解读的推理型多模态大语言模型。首先，我们采用《协议引导的指令数据生成》方法构建解读语料库，将解读过程建立在可测量的心电图特征、专著定义的量化阈值及诊断逻辑之上。其次，我们提出一种模态解耦架构，结合《交错模态丢弃》技术，以提升在心电图信号或心电图图像缺失情况下的模型鲁棒性与跨模态一致性。第三，我们引入《基于心电图诊断证据奖励的强化学习》机制，以强化基于证据的心电图解读。此外，我们系统评估了专有、开源及医学领域的多模态大语言模型的心电图解读能力，并首次提供定量证据表明严重幻觉现象普遍存在，提示公众在未经独立验证前不应直接信任这些模型的输出。代码与数据已公开于\href{https://github.com/PKUDigitalHealth/ECG-R1}{此处}，在线平台可通过\href{http://ai.heartvoice.com.cn/ECG-R1/}{此链接}访问。

0

相关内容

面向医学的多模态大型语言模型：全面综述

面向医学的多模态大型语言模型：全面综述

专知会员服务

25+阅读 · 2025年5月1日

Vision-R1：激励多模态大语言模型中的推理能力

Vision-R1：激励多模态大语言模型中的推理能力

专知会员服务

24+阅读 · 2025年3月12日

多模态大规模语言模型基准的综述

多模态大规模语言模型基准的综述

专知会员服务

41+阅读 · 2024年8月25日

从数据中心视角看多模态大型语言模型的综述

从数据中心视角看多模态大型语言模型的综述

专知会员服务

58+阅读 · 2024年5月28日

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

专知会员服务

35+阅读 · 2024年5月26日

【ICML2024】VisionGraph：利用大型多模态模型解决视觉环境中的图论问题

【ICML2024】VisionGraph：利用大型多模态模型解决视觉环境中的图论问题

专知会员服务

27+阅读 · 2024年5月11日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

111+阅读 · 2023年12月19日

多模态对齐如何做？国防科大等最新《如何弥合模态间的差距：多模态大型语言模型》综述四大类型多模态对齐方法

多模态对齐如何做？国防科大等最新《如何弥合模态间的差距：多模态大型语言模型》综述四大类型多模态对齐方法

专知会员服务

74+阅读 · 2023年11月18日

中科大腾讯最新《多模态大型语言模型》综述，详述多模态指令微调、上下文学习、思维链和辅助视觉推理技术

中科大腾讯最新《多模态大型语言模型》综述，详述多模态指令微调、上下文学习、思维链和辅助视觉推理技术

专知会员服务

105+阅读 · 2023年6月27日

【IJCAI2021】医学AI新坑：心电全景图及其生成网络

专知会员服务

21+阅读 · 2021年6月18日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

25+阅读 · 2023年4月4日

预训练语言模型关系图+必读论文列表，清华荣誉出品

预训练语言模型关系图+必读论文列表，清华荣誉出品

机器之心

18+阅读 · 2019年10月11日

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

专知

36+阅读 · 2019年9月29日

【清华大学NLP】预训练语言模型（PLM）必读论文清单，附论文PDF、源码和模型链接

【清华大学NLP】预训练语言模型（PLM）必读论文清单，附论文PDF、源码和模型链接

专知

40+阅读 · 2019年9月27日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

近期必读的10篇 ICML 2019【图神经网络（GNN）】相关论文和代码

近期必读的10篇 ICML 2019【图神经网络（GNN）】相关论文和代码

专知

131+阅读 · 2019年5月28日

近期必读的6篇【图神经网络的推荐（GNN+R）】相关论文和代码（WWW、SIGIR、WSDM）

近期必读的6篇【图神经网络的推荐（GNN+R）】相关论文和代码（WWW、SIGIR、WSDM）

专知

199+阅读 · 2019年5月7日

LeCun推荐：最新PyTorch图神经网络库，速度快15倍（GitHub+论文）

LeCun推荐：最新PyTorch图神经网络库，速度快15倍（GitHub+论文）

未来产业促进会

18+阅读 · 2019年3月10日

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

量子位

11+阅读 · 2019年2月28日

基于范数熵的冠状动脉狭窄心音研究

国家自然科学基金

0+阅读 · 2015年12月31日

心脏的多形态耦合与层级级联计算可视化方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于隐式建模方法的个性化冠状动脉几何模型重建与再塑研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于个体化心血管系统耦合模型的中心动脉压形成机制与无创检测研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于心血管优化耦合原理的左心辅助生理控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于生存树的急性心肌梗死早期预警及其多生理参数建模

国家自然科学基金

0+阅读 · 2015年12月31日

缺氧促进心肌细胞exosome分泌介导miR-22调控血管新生的作用机制

国家自然科学基金

0+阅读 · 2014年12月31日

Wnt信号通路介导老龄心肌缺血损伤的分子机制及其临床意义

国家自然科学基金

0+阅读 · 2014年12月31日

基于多模态医学图像处理的多维可视化辅助诊疗关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

运动防治扩张型心肌病的微小RNA-30d机制

国家自然科学基金

0+阅读 · 2014年12月31日

Detecting Structural Heart Disease from Electrocardiograms via a Generalized Additive Model of Interpretable Foundation-Model Predictors

Arxiv

0+阅读 · 3月3日

MediX-R1: Open Ended Medical Reinforcement Learning

Arxiv

0+阅读 · 2月26日

CG-DMER: Hybrid Contrastive-Generative Framework for Disentangled Multimodal ECG Representation Learning

Arxiv

0+阅读 · 2月24日

CAMEL: An ECG Language Model for Forecasting Cardiac Events

Arxiv

0+阅读 · 2月17日

Dual-Phase Cross-Modal Contrastive Learning for CMR-Guided ECG Representations for Cardiovascular Disease Assessment

Arxiv

0+阅读 · 2月13日

RSHallu: Dual-Mode Hallucination Evaluation for Remote-Sensing Multimodal Large Language Models with Domain-Tailored Mitigation

Arxiv

0+阅读 · 2月11日

ECG-IMN: Interpretable Mesomorphic Neural Networks for 12-Lead Electrocardiogram Interpretation

Arxiv

0+阅读 · 2月10日

Fine-tuning an ECG Foundation Model to Predict Coronary CT Angiography Outcomes

Arxiv

0+阅读 · 2月8日

Fine-R1: Make Multi-modal LLMs Excel in Fine-Grained Visual Recognition by Chain-of-Thought Reasoning

Arxiv

0+阅读 · 2月7日

Verification and Identification in ECG biometric on large-scale

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

最新内容

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

3+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

3+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

4+阅读 · 5月30日

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

4+阅读 · 5月30日

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

10+阅读 · 5月30日

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

6+阅读 · 5月30日

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

7+阅读 · 5月30日

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

8+阅读 · 5月30日

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

11+阅读 · 5月29日

AutoScientists：自组织智能体团队驱动长期科学实验

AutoScientists：自组织智能体团队驱动长期科学实验

专知会员服务

6+阅读 · 5月29日

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

专知会员服务

6+阅读 · 5月29日

战略前沿人工智能的再思考（中文）

战略前沿人工智能的再思考（中文）

专知会员服务

8+阅读 · 5月29日

《量化地基防空系统间接效应的博弈论方法》

《量化地基防空系统间接效应的博弈论方法》

专知会员服务

6+阅读 · 5月29日

传感器网络：美国如何探测来自伊朗的导弹与无人机

传感器网络：美国如何探测来自伊朗的导弹与无人机

专知会员服务

6+阅读 · 5月29日

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

专知会员服务

9+阅读 · 5月29日

相关VIP内容

面向医学的多模态大型语言模型：全面综述

面向医学的多模态大型语言模型：全面综述

专知会员服务

25+阅读 · 2025年5月1日

Vision-R1：激励多模态大语言模型中的推理能力

Vision-R1：激励多模态大语言模型中的推理能力

专知会员服务

24+阅读 · 2025年3月12日

多模态大规模语言模型基准的综述

多模态大规模语言模型基准的综述

专知会员服务

41+阅读 · 2024年8月25日

从数据中心视角看多模态大型语言模型的综述

从数据中心视角看多模态大型语言模型的综述

专知会员服务

58+阅读 · 2024年5月28日

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

专知会员服务

35+阅读 · 2024年5月26日

【ICML2024】VisionGraph：利用大型多模态模型解决视觉环境中的图论问题

【ICML2024】VisionGraph：利用大型多模态模型解决视觉环境中的图论问题

专知会员服务

27+阅读 · 2024年5月11日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

111+阅读 · 2023年12月19日

多模态对齐如何做？国防科大等最新《如何弥合模态间的差距：多模态大型语言模型》综述四大类型多模态对齐方法

多模态对齐如何做？国防科大等最新《如何弥合模态间的差距：多模态大型语言模型》综述四大类型多模态对齐方法

专知会员服务

74+阅读 · 2023年11月18日

中科大腾讯最新《多模态大型语言模型》综述，详述多模态指令微调、上下文学习、思维链和辅助视觉推理技术

中科大腾讯最新《多模态大型语言模型》综述，详述多模态指令微调、上下文学习、思维链和辅助视觉推理技术

专知会员服务

105+阅读 · 2023年6月27日

【IJCAI2021】医学AI新坑：心电全景图及其生成网络

专知会员服务

21+阅读 · 2021年6月18日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

美以伊战争：首次人工智能战争——军事自主性困境

BES：让语言模型通过双向进化搜索自我改进

以色列-美国-伊朗战争中的无人机：关键要点

相关资讯

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

25+阅读 · 2023年4月4日

预训练语言模型关系图+必读论文列表，清华荣誉出品

预训练语言模型关系图+必读论文列表，清华荣誉出品

机器之心

18+阅读 · 2019年10月11日

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

专知

36+阅读 · 2019年9月29日

【清华大学NLP】预训练语言模型（PLM）必读论文清单，附论文PDF、源码和模型链接

【清华大学NLP】预训练语言模型（PLM）必读论文清单，附论文PDF、源码和模型链接

专知

40+阅读 · 2019年9月27日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

近期必读的10篇 ICML 2019【图神经网络（GNN）】相关论文和代码

近期必读的10篇 ICML 2019【图神经网络（GNN）】相关论文和代码

专知

131+阅读 · 2019年5月28日

近期必读的6篇【图神经网络的推荐（GNN+R）】相关论文和代码（WWW、SIGIR、WSDM）

近期必读的6篇【图神经网络的推荐（GNN+R）】相关论文和代码（WWW、SIGIR、WSDM）

专知

199+阅读 · 2019年5月7日

LeCun推荐：最新PyTorch图神经网络库，速度快15倍（GitHub+论文）

LeCun推荐：最新PyTorch图神经网络库，速度快15倍（GitHub+论文）

未来产业促进会

18+阅读 · 2019年3月10日

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

量子位

11+阅读 · 2019年2月28日

相关论文

Detecting Structural Heart Disease from Electrocardiograms via a Generalized Additive Model of Interpretable Foundation-Model Predictors

Arxiv

0+阅读 · 3月3日

MediX-R1: Open Ended Medical Reinforcement Learning

Arxiv

0+阅读 · 2月26日

CG-DMER: Hybrid Contrastive-Generative Framework for Disentangled Multimodal ECG Representation Learning

Arxiv

0+阅读 · 2月24日

CAMEL: An ECG Language Model for Forecasting Cardiac Events

Arxiv

0+阅读 · 2月17日

Dual-Phase Cross-Modal Contrastive Learning for CMR-Guided ECG Representations for Cardiovascular Disease Assessment

Arxiv

0+阅读 · 2月13日

RSHallu: Dual-Mode Hallucination Evaluation for Remote-Sensing Multimodal Large Language Models with Domain-Tailored Mitigation

Arxiv

0+阅读 · 2月11日

ECG-IMN: Interpretable Mesomorphic Neural Networks for 12-Lead Electrocardiogram Interpretation

Arxiv

0+阅读 · 2月10日

Fine-tuning an ECG Foundation Model to Predict Coronary CT Angiography Outcomes

Arxiv

0+阅读 · 2月8日

Fine-R1: Make Multi-modal LLMs Excel in Fine-Grained Visual Recognition by Chain-of-Thought Reasoning

Arxiv

0+阅读 · 2月7日

Verification and Identification in ECG biometric on large-scale

Arxiv

0+阅读 · 2月4日

相关基金

基于范数熵的冠状动脉狭窄心音研究

国家自然科学基金

0+阅读 · 2015年12月31日

心脏的多形态耦合与层级级联计算可视化方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于隐式建模方法的个性化冠状动脉几何模型重建与再塑研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于个体化心血管系统耦合模型的中心动脉压形成机制与无创检测研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于心血管优化耦合原理的左心辅助生理控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于生存树的急性心肌梗死早期预警及其多生理参数建模

国家自然科学基金

0+阅读 · 2015年12月31日

缺氧促进心肌细胞exosome分泌介导miR-22调控血管新生的作用机制

国家自然科学基金

0+阅读 · 2014年12月31日

Wnt信号通路介导老龄心肌缺血损伤的分子机制及其临床意义

国家自然科学基金

0+阅读 · 2014年12月31日

基于多模态医学图像处理的多维可视化辅助诊疗关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

运动防治扩张型心肌病的微小RNA-30d机制

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员