ECHO: Efficient Chest X-ray Report Generation with One-step Block Diffusion - 专知论文

会员服务 ·

0

echo回声（移动应用） · 报告生成 · 词元 · 报告 · 去噪 ·

ECHO: Efficient Chest X-ray Report Generation with One-step Block Diffusion

翻译：标题：ECHO：基于单步块扩散的高效胸部X光报告生成

Lifeng Chen,Tianqi You,Hao Liu,Zhimin Bao,Jile Jiao,Xiao Han,Zhicai Ou,Tao Sun,Xiaofeng Mou,Xiaojie Jin,Yi Xu

Chest X-ray report generation (CXR-RG) has the potential to substantially alleviate radiologists' workload. However, conventional autoregressive vision--language models (VLMs) suffer from high inference latency due to sequential token decoding. Diffusion-based models offer a promising alternative through parallel generation, but they still require multiple denoising iterations. Compressing multi-step denoising to a single step could further reduce latency, but often degrades textual coherence due to the mean-field bias introduced by token-factorized denoisers. To address this challenge, we propose \textbf{ECHO}, an efficient diffusion-based VLM (dVLM) for chest X-ray report generation. ECHO enables stable one-step-per-block inference via a novel Direct Conditional Distillation (DCD) framework, which mitigates the mean-field limitation by constructing unfactorized supervision from on-policy diffusion trajectories to encode joint token dependencies. In addition, we introduce a Response-Asymmetric Diffusion (RAD) training strategy that further improves training efficiency while maintaining model effectiveness. Extensive experiments demonstrate that ECHO surpasses state-of-the-art autoregressive methods, improving RaTE and SemScore by \textbf{64.33\%} and \textbf{60.58\%} respectively, while achieving an \textbf{$8\times$} inference speedup without compromising clinical accuracy.

翻译：摘要：胸部X光报告生成（CXR-RG）有望大幅减轻放射科医生的工作负担。然而，传统自回归视觉-语言模型（VLM）由于采用顺序式词元解码，存在高推理延迟的问题。基于扩散的模型通过并行生成提供了有前景的替代方案，但仍需要多次去噪迭代。将多步去噪压缩为单步可进一步降低延迟，但词元因子化解噪器引入的平均场偏差常导致文本连贯性下降。为解决这一挑战，我们提出用于胸部X光报告生成的高效扩散型VLM（dVLM）——**ECHO**。ECHO通过新颖的直接条件蒸馏（DCD）框架实现稳定的每步单步推理，该框架利用基于策略的扩散轨迹构建非因子化监督，编码联合词元依赖关系，从而缓解平均场限制。此外，我们提出响应非对称扩散（RAD）训练策略，在保持模型有效性的同时进一步提升训练效率。大量实验表明，ECHO超越现有最优自回归方法，将RaTE和SemScore分别提升**64.33%**和**60.58%**，同时实现**8倍**推理加速且不牺牲临床准确性。

0

相关内容

echo回声（移动应用）

echo回声（移动应用）

echo回声官网

【CVPR2025】基于离散扩散时间步令牌的生成式多模态预训练

【CVPR2025】基于离散扩散时间步令牌的生成式多模态预训练

专知会员服务

11+阅读 · 2025年4月26日

【CMU博士论文】分析多模态机器学习模型性能及其在医学报告生成中的评估指标

【CMU博士论文】分析多模态机器学习模型性能及其在医学报告生成中的评估指标

专知会员服务

23+阅读 · 2024年12月16日

《基于扩散模型的条件图像生成》综述

《基于扩散模型的条件图像生成》综述

专知会员服务

44+阅读 · 2024年10月1日

何恺明等最新步步解构扩散模型，最后竟成经典去噪自编码器

何恺明等最新步步解构扩散模型，最后竟成经典去噪自编码器

专知会员服务

33+阅读 · 2024年1月28日

KDD 2023 | GPT时代医学AI新赛道：16万张图片、70万问答对的临床问答数据集MIMIC-Diff-VQA发布

KDD 2023 | GPT时代医学AI新赛道：16万张图片、70万问答对的临床问答数据集MIMIC-Diff-VQA发布

专知会员服务

32+阅读 · 2023年7月31日

英伟达斯坦福CVPR2023等最新《去噪扩散模型：生成学习的大爆炸》教程，附300多页ppt

英伟达斯坦福CVPR2023等最新《去噪扩散模型：生成学习的大爆炸》教程，附300多页ppt

专知会员服务

54+阅读 · 2023年6月27日

《生成式模型: 变分自编码器与扩散模型》，75页ppt，Google DeepMind科学家Ruiqi Gao

《生成式模型: 变分自编码器与扩散模型》，75页ppt，Google DeepMind科学家Ruiqi Gao

专知会员服务

66+阅读 · 2023年6月10日

【CVPR2023】基于动态图增强对比学习的胸部X光报告生成

【CVPR2023】基于动态图增强对比学习的胸部X光报告生成

专知会员服务

21+阅读 · 2023年3月23日

视觉Transformer预训练模型的胸腔X线影像多标签分类

视觉Transformer预训练模型的胸腔X线影像多标签分类

专知会员服务

14+阅读 · 2022年7月29日

《用于胸部 X 射线自动肺部疾病分析的深度学习》汉堡科技大学博士论文

《用于胸部 X 射线自动肺部疾病分析的深度学习》汉堡科技大学博士论文

专知会员服务

35+阅读 · 2022年4月17日

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

高效的文本生成方法 — LaserTagger 现已开源

高效的文本生成方法 — LaserTagger 现已开源

TensorFlow

30+阅读 · 2020年2月27日

最新《生成式对抗网络GAN进展》论文

最新《生成式对抗网络GAN进展》论文

专知

95+阅读 · 2019年4月5日

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

专知

11+阅读 · 2018年6月4日

【论文推荐】最新七篇图像描述生成相关论文—CNN+CNN、对抗样本、显著性和上下文注意力、条件生成对抗网络、风格化

【论文推荐】最新七篇图像描述生成相关论文—CNN+CNN、对抗样本、显著性和上下文注意力、条件生成对抗网络、风格化

专知

25+阅读 · 2018年5月28日

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

GAN生成式对抗网络

10+阅读 · 2018年4月25日

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

AI研习社

14+阅读 · 2018年2月17日

最新5篇生成对抗网络相关论文推荐—FusedGAN、DeblurGAN、AdvGAN、CipherGAN、MMD GANS

最新5篇生成对抗网络相关论文推荐—FusedGAN、DeblurGAN、AdvGAN、CipherGAN、MMD GANS

专知

23+阅读 · 2018年1月18日

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

专知

18+阅读 · 2017年11月24日

纳米荧光开关的构建及其乳腺癌早期诊断和分期系统建立研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于纳米胶束的肿瘤治疗和成像一体化的多功能药物传递系统的构建与评价

国家自然科学基金

0+阅读 · 2015年12月31日

基于声光光谱成像的反激光窃听告警系统关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

高能激光驱动的X射线成像与X射线衍射实验技术探索

国家自然科学基金

0+阅读 · 2015年12月31日

任务导向的X射线光栅相位衬度成像方法的定量评价

国家自然科学基金

0+阅读 · 2015年12月31日

基于吲哚菁绿的多功能分子探针超声光声双模态成像及靶向乳腺癌光热治疗研究

国家自然科学基金

0+阅读 · 2015年12月31日

3D纳米纤维支架作为乳腺癌循环肿瘤细胞捕获/鉴定装置的制备及应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

用于低剂量X射线成像的双栅极光电薄膜晶体管“智能”像素的研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向X-CT应用的(Ce, Lu)3(Cr, Al)5O12闪烁陶瓷中过渡金属离子的光谱展宽效应研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于同步辐射X射线多元标记蛋白成像新方法的研究

国家自然科学基金

0+阅读 · 2014年12月31日

EasyLens: A Training-Free Plug-and-Play Subtle-Lesion Representation Amplifier for Medical Vision-Language Models

Arxiv

0+阅读 · 6月4日

RadAgent: A tool-using AI agent for stepwise interpretation of chest computed tomography

Arxiv

0+阅读 · 4月16日

Accelerating Speculative Decoding with Block Diffusion Draft Trees

Arxiv

0+阅读 · 4月14日

Distilling Photon-Counting CT into Routine Chest CT through Clinically Validated Degradation Modeling

Arxiv

0+阅读 · 4月8日

HyperCT: Low-Rank Hypernet for Unified Chest CT Analysis

Arxiv

0+阅读 · 4月3日

Ran Score: a LLM-based Evaluation Score for Radiology Report Generation

Arxiv

0+阅读 · 3月24日

Assessing the Distributional Fidelity of Synthetic Chest X-rays using the Embedded Characteristic Score

Arxiv

0+阅读 · 3月19日

Lumos-1: On Autoregressive Video Generation with Discrete Diffusion from a Unified Model Perspective

Arxiv

0+阅读 · 3月15日

Controllable Generation with Text-to-Image Diffusion Models: A Survey

Arxiv

14+阅读 · 2024年3月7日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

43+阅读 · 2023年4月19日

VIP会员

文章信息

相关主题

echo回声（移动应用）

最新内容

无人机自主控制与人工智能：系统性综述

无人机自主控制与人工智能：系统性综述

专知会员服务

6+阅读 · 今天7:25

巡飞弹与反无人机系统——现代战场的两大支柱

巡飞弹与反无人机系统——现代战场的两大支柱

专知会员服务

2+阅读 · 今天6:54

《打造“黄金舰队”》57页报告

《打造“黄金舰队”》57页报告

专知会员服务

1+阅读 · 今天6:52

《北约数字教官网络发展路径》128页报告

《北约数字教官网络发展路径》128页报告

专知会员服务

1+阅读 · 今天6:33

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

6+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

5+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

9+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

7+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

8+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

10+阅读 · 6月25日

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

9+阅读 · 6月25日

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

9+阅读 · 6月25日

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

10+阅读 · 6月24日

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

10+阅读 · 6月24日

相关VIP内容

【CVPR2025】基于离散扩散时间步令牌的生成式多模态预训练

【CVPR2025】基于离散扩散时间步令牌的生成式多模态预训练

专知会员服务

11+阅读 · 2025年4月26日

【CMU博士论文】分析多模态机器学习模型性能及其在医学报告生成中的评估指标

【CMU博士论文】分析多模态机器学习模型性能及其在医学报告生成中的评估指标

专知会员服务

23+阅读 · 2024年12月16日

《基于扩散模型的条件图像生成》综述

《基于扩散模型的条件图像生成》综述

专知会员服务

44+阅读 · 2024年10月1日

何恺明等最新步步解构扩散模型，最后竟成经典去噪自编码器

何恺明等最新步步解构扩散模型，最后竟成经典去噪自编码器

专知会员服务

33+阅读 · 2024年1月28日

KDD 2023 | GPT时代医学AI新赛道：16万张图片、70万问答对的临床问答数据集MIMIC-Diff-VQA发布

KDD 2023 | GPT时代医学AI新赛道：16万张图片、70万问答对的临床问答数据集MIMIC-Diff-VQA发布

专知会员服务

32+阅读 · 2023年7月31日

英伟达斯坦福CVPR2023等最新《去噪扩散模型：生成学习的大爆炸》教程，附300多页ppt

英伟达斯坦福CVPR2023等最新《去噪扩散模型：生成学习的大爆炸》教程，附300多页ppt

专知会员服务

54+阅读 · 2023年6月27日

《生成式模型: 变分自编码器与扩散模型》，75页ppt，Google DeepMind科学家Ruiqi Gao

《生成式模型: 变分自编码器与扩散模型》，75页ppt，Google DeepMind科学家Ruiqi Gao

专知会员服务

66+阅读 · 2023年6月10日

【CVPR2023】基于动态图增强对比学习的胸部X光报告生成

【CVPR2023】基于动态图增强对比学习的胸部X光报告生成

专知会员服务

21+阅读 · 2023年3月23日

视觉Transformer预训练模型的胸腔X线影像多标签分类

视觉Transformer预训练模型的胸腔X线影像多标签分类

专知会员服务

14+阅读 · 2022年7月29日

《用于胸部 X 射线自动肺部疾病分析的深度学习》汉堡科技大学博士论文

《用于胸部 X 射线自动肺部疾病分析的深度学习》汉堡科技大学博士论文

专知会员服务

35+阅读 · 2022年4月17日

热门VIP内容

开通专知VIP会员享更多权益服务

巡飞弹与反无人机系统——现代战场的两大支柱

《北约数字教官网络发展路径》128页报告

无人机自主控制与人工智能：系统性综述

《打造“黄金舰队”》57页报告

相关资讯

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

高效的文本生成方法 — LaserTagger 现已开源

高效的文本生成方法 — LaserTagger 现已开源

TensorFlow

30+阅读 · 2020年2月27日

最新《生成式对抗网络GAN进展》论文

最新《生成式对抗网络GAN进展》论文

专知

95+阅读 · 2019年4月5日

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

专知

11+阅读 · 2018年6月4日

【论文推荐】最新七篇图像描述生成相关论文—CNN+CNN、对抗样本、显著性和上下文注意力、条件生成对抗网络、风格化

【论文推荐】最新七篇图像描述生成相关论文—CNN+CNN、对抗样本、显著性和上下文注意力、条件生成对抗网络、风格化

专知

25+阅读 · 2018年5月28日

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

GAN生成式对抗网络

10+阅读 · 2018年4月25日

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

AI研习社

14+阅读 · 2018年2月17日

最新5篇生成对抗网络相关论文推荐—FusedGAN、DeblurGAN、AdvGAN、CipherGAN、MMD GANS

最新5篇生成对抗网络相关论文推荐—FusedGAN、DeblurGAN、AdvGAN、CipherGAN、MMD GANS

专知

23+阅读 · 2018年1月18日

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

专知

18+阅读 · 2017年11月24日

相关论文

EasyLens: A Training-Free Plug-and-Play Subtle-Lesion Representation Amplifier for Medical Vision-Language Models

Arxiv

0+阅读 · 6月4日

RadAgent: A tool-using AI agent for stepwise interpretation of chest computed tomography

Arxiv

0+阅读 · 4月16日

Accelerating Speculative Decoding with Block Diffusion Draft Trees

Arxiv

0+阅读 · 4月14日

Distilling Photon-Counting CT into Routine Chest CT through Clinically Validated Degradation Modeling

Arxiv

0+阅读 · 4月8日

HyperCT: Low-Rank Hypernet for Unified Chest CT Analysis

Arxiv

0+阅读 · 4月3日

Ran Score: a LLM-based Evaluation Score for Radiology Report Generation

Arxiv

0+阅读 · 3月24日

Assessing the Distributional Fidelity of Synthetic Chest X-rays using the Embedded Characteristic Score

Arxiv

0+阅读 · 3月19日

Lumos-1: On Autoregressive Video Generation with Discrete Diffusion from a Unified Model Perspective

Arxiv

0+阅读 · 3月15日

Controllable Generation with Text-to-Image Diffusion Models: A Survey

Arxiv

14+阅读 · 2024年3月7日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

43+阅读 · 2023年4月19日

相关基金

纳米荧光开关的构建及其乳腺癌早期诊断和分期系统建立研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于纳米胶束的肿瘤治疗和成像一体化的多功能药物传递系统的构建与评价

国家自然科学基金

0+阅读 · 2015年12月31日

基于声光光谱成像的反激光窃听告警系统关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

高能激光驱动的X射线成像与X射线衍射实验技术探索

国家自然科学基金

0+阅读 · 2015年12月31日

任务导向的X射线光栅相位衬度成像方法的定量评价

国家自然科学基金

0+阅读 · 2015年12月31日

基于吲哚菁绿的多功能分子探针超声光声双模态成像及靶向乳腺癌光热治疗研究

国家自然科学基金

0+阅读 · 2015年12月31日

3D纳米纤维支架作为乳腺癌循环肿瘤细胞捕获/鉴定装置的制备及应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

用于低剂量X射线成像的双栅极光电薄膜晶体管“智能”像素的研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向X-CT应用的(Ce, Lu)3(Cr, Al)5O12闪烁陶瓷中过渡金属离子的光谱展宽效应研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于同步辐射X射线多元标记蛋白成像新方法的研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员