【牛津博士论文】以语言为接口的医学影像表示学习 - 专知VIP

会员服务 ·

8

医学影像表示学习 · 博士论文 ·

【牛津博士论文】以语言为接口的医学影像表示学习

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

自然语言本质上编码了人类的知识与推理逻辑。本论文探讨了语言如何作为人类与医学影像人工智能（AI）方法之间的接口。语言既可以作为一种监督信号或约束，用以学习捕捉人类对医学影像理解的深层表示；同时，语言也可以作为一种媒介，使 AI 系统能够向用户传达其决策过程。 * 视觉语言解释基准（e-ViL Benchmark）：首先，我引入了 e-ViL 基准，用于系统性地评估视觉语言模型生成自然语言解释（NLEs）的能力。通过引入目前规模最大的数据集、整合现有数据并提出一种新颖的架构，我证明了文本解释能够有效约束模型推理，并提供一种符合人类认知过程的可解释性接口。此外，本项工作揭示了自动评价指标在评估 NLE 质量方面的局限性，并据此提出了一个人工评估框架。 * 医学影像中的 NLE 扩展：基于上述见解，我将 NLE 的概念扩展至医学影像领域（特别是胸部 X 光分析）。通过直接从放射科报告中提取解释，我构建了新型数据集。在该数据集上训练的模型不仅能生成镜像模拟放射科医生推理逻辑的解释，且通过强调模型规模与思维链（Chain-of-Thought, CoT）提示词，显著提升了诊断准确率。 * 临床应用中的双重影响：第三，为进一步理解语言作为 AI 决策沟通媒介的作用，我组织了一项大规模用户研究，邀请 85 名临床医生在不同的可解释性（XAI）条件下与 AI 进行交互。研究揭示了一个关键的矛盾现象：临床医生强烈倾向于使用基于语言的解释，但往往对其产生过度依赖（Overrely），导致诊断错误率升高。这些发现强调了将此类基于语言的 AI 系统整合至临床环境时所需的复杂性与谨慎态度。 * 语言引导的监督学习泛化：最后，我将语言作为监督信号的方法泛化至脑部 MRI 模型的从头训练（Training from scratch）中。该方法有效解决了该领域标注医学数据稀缺的问题，并提升了一系列下游任务的性能，展示了语言引导学习在医学影像中的广泛适用性与巨大潜力。

本论文深化了我们对语言与医学 AI 模型集成的理解。研究表明，该集成在提升模型性能与可解释性方面具有显著优势，同时也指出了为确保临床部署的安全性和有效性所必须解决的关键问题。

成为VIP会员查看完整内容

15

相关内容

医学影像表示学习

医学影像表示学习

【MIT博士论文】以语言为中心的医学影像理解

【MIT博士论文】以语言为中心的医学影像理解

专知会员服务

17+阅读 · 2025年12月23日

用于三维医学影像理解的综合语言–图像预训练

用于三维医学影像理解的综合语言–图像预训练

专知会员服务

7+阅读 · 2025年11月5日

【博士论文】学习视觉-语言表示以实现多模态理解

【博士论文】学习视觉-语言表示以实现多模态理解

专知会员服务

28+阅读 · 2025年2月8日

【牛津大学博士论文】自然语言处理的鲁棒性研究，194页pdf

【牛津大学博士论文】自然语言处理的鲁棒性研究，194页pdf

专知会员服务

26+阅读 · 2024年2月26日

【伯克利博士论文】通过生成式模型实现视觉与语言理解，109页pdf

【伯克利博士论文】通过生成式模型实现视觉与语言理解，109页pdf

专知会员服务

41+阅读 · 2024年1月20日

【NTU博士论文】语言模型自适应迁移学习

【NTU博士论文】语言模型自适应迁移学习

专知会员服务

38+阅读 · 2023年12月20日

【牛津大学博士论文】学习用几何和语义表示场景，149页pdf

【牛津大学博士论文】学习用几何和语义表示场景，149页pdf

专知会员服务

63+阅读 · 2022年11月27日

【新书】自然语言处理表示学习技术，349页pdf，清华大学

【新书】自然语言处理表示学习技术，349页pdf，清华大学

专知会员服务

174+阅读 · 2020年7月11日

深度学习自然语言处理进展综述论文

专知会员服务

201+阅读 · 2020年3月6日

【BAAI北京智源大会】自然语言处理Knowledge-Guided NLP ，清华大学刘知远，附45页PDF

【BAAI北京智源大会】自然语言处理Knowledge-Guided NLP ，清华大学刘知远，附45页PDF

专知会员服务

84+阅读 · 2019年11月20日

【综述论文】2020年最新深度学习自然语言处理进展综述论文！！！

【综述论文】2020年最新深度学习自然语言处理进展综述论文！！！

深度学习自然语言处理

13+阅读 · 2020年4月6日

阿尔伯塔大学博士毕业论文：基于图结构的自然语言处理

阿尔伯塔大学博士毕业论文：基于图结构的自然语言处理

机器之心

15+阅读 · 2020年3月25日

【CMU博士论文2019】建立知识感知的自然语言理解系统，附118页论文全文下载

【CMU博士论文2019】建立知识感知的自然语言理解系统，附118页论文全文下载

专知

22+阅读 · 2019年10月23日

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

专知

36+阅读 · 2019年7月7日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

自然语言处理NLP快速入门

自然语言处理NLP快速入门

专知

20+阅读 · 2018年10月8日

从NLP到CV+NLP: 计算机视觉和自然语言处理结合介绍 | 公开课

从NLP到CV+NLP: 计算机视觉和自然语言处理结合介绍 | 公开课

AI研习社

14+阅读 · 2018年1月28日

从语言学到深度学习NLP，一文概述自然语言处理

从语言学到深度学习NLP，一文概述自然语言处理

人工智能学家

13+阅读 · 2018年1月28日

微软研究院Jianfeng Gao：基于深度学习的自然语言处理导论（课程，附PPT下载链接）

微软研究院Jianfeng Gao：基于深度学习的自然语言处理导论（课程，附PPT下载链接）

专知

17+阅读 · 2018年1月24日

基于深度学习的医疗影像论文汇总（Deep Learning Papers on Medical Image Analysis）

基于深度学习的医疗影像论文汇总（Deep Learning Papers on Medical Image Analysis）

AI研习社

17+阅读 · 2017年10月21日

基于深度学习技术的视神经系统研究

国家自然科学基金

7+阅读 · 2017年12月31日

基于因子分析的会话语音说话人识别研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于知识库构建的图像和视频角色语义关系的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度表达和迁移学习的人体检测研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于视觉上下文与文字显著性的复杂自然场景中文字检测研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机映射框架下的图像语义分析与提取技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

中文句子语义概念图自动构建方法及应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

5+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

MediTools -- Medical Education Powered by LLMs

Arxiv

0+阅读 · 3月8日

Speak in Context: Multilingual ASR with Speech Context Alignment via Contrastive Learning

Arxiv

0+阅读 · 3月6日

Seeing Through Words: Controlling Visual Retrieval Quality with Language Models

Arxiv

0+阅读 · 2月24日

Learning to Retrieve Navigable Candidates for Efficient Vision-and-Language Navigation

Arxiv

0+阅读 · 2月17日

Language Modeling and Understanding Through Paraphrase Generation and Detection

Arxiv

0+阅读 · 2月15日

Linguistics and Human Brain: A Perspective of Computational Neuroscience

Arxiv

0+阅读 · 2月13日

Universal computation is intrinsic to language model decoding

Arxiv

0+阅读 · 2月10日

Pre-trained Language Models in Biomedical Domain: A Systematic Survey

Arxiv

10+阅读 · 2021年10月12日

Learning Conceptual-Contextual Embeddings for Medical Text

Arxiv

15+阅读 · 2020年3月12日

Learning Conceptual-Contexual Embeddings for Medical Text

Arxiv

28+阅读 · 2019年8月16日

VIP会员

相关主题

医学影像表示学习

最新内容

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

0+阅读 · 29分钟前

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

0+阅读 · 34分钟前

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

0+阅读 · 37分钟前

《提升生成模型的安全性与保障》博士论文

《提升生成模型的安全性与保障》博士论文

专知会员服务

0+阅读 · 41分钟前

美国当前高超音速导弹发展概述

美国当前高超音速导弹发展概述

专知会员服务

4+阅读 · 4月19日

《高超音速武器：一项再度兴起的技术》120页slides

《高超音速武器：一项再度兴起的技术》120页slides

专知会员服务

8+阅读 · 4月19日

无人机蜂群建模与仿真方法

无人机蜂群建模与仿真方法

专知会员服务

8+阅读 · 4月19日

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

专知会员服务

3+阅读 · 4月19日

《量化反无人机系统对抗无人机蜂群效能的创新方法》

《量化反无人机系统对抗无人机蜂群效能的创新方法》

专知会员服务

12+阅读 · 4月19日

澳大利亚发布《国防战略（2026年）》

澳大利亚发布《国防战略（2026年）》

专知会员服务

2+阅读 · 4月19日

【CMU博士论文】迈向基于基础先验的 4D 感知研究

【CMU博士论文】迈向基于基础先验的 4D 感知研究

专知会员服务

3+阅读 · 4月19日

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

专知会员服务

12+阅读 · 4月19日

全球高超音速武器最新发展趋势

全球高超音速武器最新发展趋势

专知会员服务

3+阅读 · 4月19日

《利用大语言模型增强多域作战兵棋推演》（报告）

《利用大语言模型增强多域作战兵棋推演》（报告）

专知会员服务

14+阅读 · 4月18日

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

专知会员服务

12+阅读 · 4月18日

相关VIP内容

【MIT博士论文】以语言为中心的医学影像理解

【MIT博士论文】以语言为中心的医学影像理解

专知会员服务

17+阅读 · 2025年12月23日

用于三维医学影像理解的综合语言–图像预训练

用于三维医学影像理解的综合语言–图像预训练

专知会员服务

7+阅读 · 2025年11月5日

【博士论文】学习视觉-语言表示以实现多模态理解

【博士论文】学习视觉-语言表示以实现多模态理解

专知会员服务

28+阅读 · 2025年2月8日

【牛津大学博士论文】自然语言处理的鲁棒性研究，194页pdf

【牛津大学博士论文】自然语言处理的鲁棒性研究，194页pdf

专知会员服务

26+阅读 · 2024年2月26日

【伯克利博士论文】通过生成式模型实现视觉与语言理解，109页pdf

【伯克利博士论文】通过生成式模型实现视觉与语言理解，109页pdf

专知会员服务

41+阅读 · 2024年1月20日

【NTU博士论文】语言模型自适应迁移学习

【NTU博士论文】语言模型自适应迁移学习

专知会员服务

38+阅读 · 2023年12月20日

【牛津大学博士论文】学习用几何和语义表示场景，149页pdf

【牛津大学博士论文】学习用几何和语义表示场景，149页pdf

专知会员服务

63+阅读 · 2022年11月27日

【新书】自然语言处理表示学习技术，349页pdf，清华大学

【新书】自然语言处理表示学习技术，349页pdf，清华大学

专知会员服务

174+阅读 · 2020年7月11日

深度学习自然语言处理进展综述论文

专知会员服务

201+阅读 · 2020年3月6日

【BAAI北京智源大会】自然语言处理Knowledge-Guided NLP ，清华大学刘知远，附45页PDF

【BAAI北京智源大会】自然语言处理Knowledge-Guided NLP ，清华大学刘知远，附45页PDF

专知会员服务

84+阅读 · 2019年11月20日

热门VIP内容

开通专知VIP会员享更多权益服务

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《提升生成模型的安全性与保障》博士论文

军事通信系统与设备的技术演进综述

《北约标准：医疗评估手册》174页

相关资讯

【综述论文】2020年最新深度学习自然语言处理进展综述论文！！！

【综述论文】2020年最新深度学习自然语言处理进展综述论文！！！

深度学习自然语言处理

13+阅读 · 2020年4月6日

阿尔伯塔大学博士毕业论文：基于图结构的自然语言处理

阿尔伯塔大学博士毕业论文：基于图结构的自然语言处理

机器之心

15+阅读 · 2020年3月25日

【CMU博士论文2019】建立知识感知的自然语言理解系统，附118页论文全文下载

【CMU博士论文2019】建立知识感知的自然语言理解系统，附118页论文全文下载

专知

22+阅读 · 2019年10月23日

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

专知

36+阅读 · 2019年7月7日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

自然语言处理NLP快速入门

自然语言处理NLP快速入门

专知

20+阅读 · 2018年10月8日

从NLP到CV+NLP: 计算机视觉和自然语言处理结合介绍 | 公开课

从NLP到CV+NLP: 计算机视觉和自然语言处理结合介绍 | 公开课

AI研习社

14+阅读 · 2018年1月28日

从语言学到深度学习NLP，一文概述自然语言处理

从语言学到深度学习NLP，一文概述自然语言处理

人工智能学家

13+阅读 · 2018年1月28日

微软研究院Jianfeng Gao：基于深度学习的自然语言处理导论（课程，附PPT下载链接）

微软研究院Jianfeng Gao：基于深度学习的自然语言处理导论（课程，附PPT下载链接）

专知

17+阅读 · 2018年1月24日

基于深度学习的医疗影像论文汇总（Deep Learning Papers on Medical Image Analysis）

基于深度学习的医疗影像论文汇总（Deep Learning Papers on Medical Image Analysis）

AI研习社

17+阅读 · 2017年10月21日

相关基金

基于深度学习技术的视神经系统研究

国家自然科学基金

7+阅读 · 2017年12月31日

基于因子分析的会话语音说话人识别研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于知识库构建的图像和视频角色语义关系的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度表达和迁移学习的人体检测研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于视觉上下文与文字显著性的复杂自然场景中文字检测研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机映射框架下的图像语义分析与提取技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

中文句子语义概念图自动构建方法及应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

5+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

相关论文

MediTools -- Medical Education Powered by LLMs

Arxiv

0+阅读 · 3月8日

Speak in Context: Multilingual ASR with Speech Context Alignment via Contrastive Learning

Arxiv

0+阅读 · 3月6日

Seeing Through Words: Controlling Visual Retrieval Quality with Language Models

Arxiv

0+阅读 · 2月24日

Learning to Retrieve Navigable Candidates for Efficient Vision-and-Language Navigation

Arxiv

0+阅读 · 2月17日

Language Modeling and Understanding Through Paraphrase Generation and Detection

Arxiv

0+阅读 · 2月15日

Linguistics and Human Brain: A Perspective of Computational Neuroscience

Arxiv

0+阅读 · 2月13日

Universal computation is intrinsic to language model decoding

Arxiv

0+阅读 · 2月10日

Pre-trained Language Models in Biomedical Domain: A Systematic Survey

Arxiv

10+阅读 · 2021年10月12日

Learning Conceptual-Contextual Embeddings for Medical Text

Arxiv

15+阅读 · 2020年3月12日

Learning Conceptual-Contexual Embeddings for Medical Text

Arxiv

28+阅读 · 2019年8月16日

微信扫码咨询专知VIP会员