MMed-Bench-IR: A Heterogeneous Benchmark for Multilingual Medical Information Retrieval - 专知论文

会员服务 ·

0

INFORMS · 设计 · 得分 · 信息检索 · 情景 ·

MMed-Bench-IR: A Heterogeneous Benchmark for Multilingual Medical Information Retrieval

翻译：暂无翻译

Junhyeok Lee,Han Jang,Hyeonjin Goh,Kyu Sung Choi

from arxiv, Under review. 15 pages, 3 figures

Retrieval-augmented generation (RAG) in clinical settings increasingly requires multilingual retrieval against predominantly English evidence corpora. Multilingual medical retrieval demands three capabilities: cross-lingual alignment, concept discrimination, and evidence retrieval. However, existing benchmarks evaluate these only in isolation, leaving the interaction between biomedical expertise and multilingual coverage unmeasured. We introduce MMed-Bench-IR, a benchmark designed to disentangle these axes across 6 languages and three structurally heterogeneous tasks: (1) cross-lingual medical QA retrieval with 6,127 queries grounded in the Unified Medical Language System (UMLS), (2) concept discrimination over 4,975 confusion sets at three difficulty tiers, and (3) multilingual evidence retrieval for RAG with 2,040 quality-assured queries. The three tasks share zero concept and query overlap by design, ensuring that aggregate scores reflect genuine capability breadth. Evaluation of ten systems across six paradigm families reveals severe cross-lingual failure: biomedical encoders that score 0.818 nDCG@10 in English drop to 0.056 in Japanese, a gap that English-only benchmarks cannot detect.

翻译：暂无翻译

0

相关内容

INFORMS

《计算机信息》杂志发表高质量的论文，扩大了运筹学和计算的范围，寻求有关理论、方法、实验、系统和应用方面的原创研究论文、新颖的调查和教程论文，以及描述新的和有用的软件工具的论文。官网链接：https://pubsonline.informs.org/journal/ijoc

【AAAI2026】TruthfulRAG：基于知识图谱解决检索增强生成中的事实层冲突

【AAAI2026】TruthfulRAG：基于知识图谱解决检索增强生成中的事实层冲突

专知会员服务

22+阅读 · 2025年11月15日

利用表示学习推动多机构电子健康记录数据研究

利用表示学习推动多机构电子健康记录数据研究

专知会员服务

16+阅读 · 2025年2月17日

AAAI 25 | 融合分隔：协同专家混合模型用于数据稀缺环境下的药物-靶点相互作用预测

AAAI 25 | 融合分隔：协同专家混合模型用于数据稀缺环境下的药物-靶点相互作用预测

专知会员服务

12+阅读 · 2025年1月13日

ICML 2024 | Med-ST：解锁时空信息在医学多模态预训练中的能力

ICML 2024 | Med-ST：解锁时空信息在医学多模态预训练中的能力

专知会员服务

13+阅读 · 2024年7月10日

ICLR2023：通过提示学习的蛋白质多级结构预训练

ICLR2023：通过提示学习的蛋白质多级结构预训练

专知会员服务

12+阅读 · 2023年11月26日

Cancer Cell综述｜AI用于肿瘤学中的多模态数据集成

Cancer Cell综述｜AI用于肿瘤学中的多模态数据集成

专知会员服务

35+阅读 · 2022年10月13日

J. Med. Chem. | RELATION: 一种基于靶标结构的深度学习全新药物设计模型

J. Med. Chem. | RELATION: 一种基于靶标结构的深度学习全新药物设计模型

专知会员服务

11+阅读 · 2022年6月23日

【斯坦福】从电子病历EHR构建知识图谱，Robustly Extracting Medical Knowledge from EHRs:A Case Study of Learning a Health Knowledge Graph

【斯坦福】从电子病历EHR构建知识图谱，Robustly Extracting Medical Knowledge from EHRs:A Case Study of Learning a Health Knowledge Graph

专知会员服务

56+阅读 · 2020年6月2日

【MICCAI 2019 】Generative adversarial networks and adversarial methods in biomedical image analysis（基于生成对抗网络和对抗方法的生物医学图像分析），附223页PPT免费下载

【MICCAI 2019 】Generative adversarial networks and adversarial methods in biomedical image analysis（基于生成对抗网络和对抗方法的生物医学图像分析），附223页PPT免费下载

专知会员服务

32+阅读 · 2019年11月4日

Risk Sensitive Portfolio Optimization with Regime-Switching and Default Contagion，香港理工大学应用数学系余翔助理教授，第八届全国社会媒体处理大会SMP2019

Risk Sensitive Portfolio Optimization with Regime-Switching and Default Contagion，香港理工大学应用数学系余翔助理教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

10+阅读 · 2019年10月24日

MMDetection v2.0 训练自己的数据集

MMDetection v2.0 训练自己的数据集

CVer

30+阅读 · 2020年8月9日

美国埃默里大学医学院发布最新「医学图像配准深度学习」综述论文

美国埃默里大学医学院发布最新「医学图像配准深度学习」综述论文

专知

15+阅读 · 2020年1月7日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Nature Medicine连发9篇论文，Jeff Dean、吴恩达等最新研究入列

Nature Medicine连发9篇论文，Jeff Dean、吴恩达等最新研究入列

新智元

15+阅读 · 2019年1月14日

disentangled-representation-papers

disentangled-representation-papers

CreateAMind

26+阅读 · 2018年9月12日

论文浅尝 | Improved Neural Relation Detection for KBQA

论文浅尝 | Improved Neural Relation Detection for KBQA

开放知识图谱

13+阅读 · 2018年1月21日

读书报告 | Deep Learning for Extreme Multi-label Text Classification

读书报告 | Deep Learning for Extreme Multi-label Text Classification

科技创新与创业

48+阅读 · 2018年1月10日

论文 | 基于RNN的在线多目标跟踪

论文 | 基于RNN的在线多目标跟踪

七月在线实验室

31+阅读 · 2017年12月27日

论文 | 深度学习实现目标跟踪

论文 | 深度学习实现目标跟踪

七月在线实验室

48+阅读 · 2017年12月8日

基于深度学习的医疗影像论文汇总（Deep Learning Papers on Medical Image Analysis）

基于深度学习的医疗影像论文汇总（Deep Learning Papers on Medical Image Analysis）

AI研习社

17+阅读 · 2017年10月21日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

细胞外基质蛋白reelin对多发性骨髓瘤增殖和分化的影响及其机制

国家自然科学基金

0+阅读 · 2016年12月31日

釉原蛋白Exons 8和9联合编码多肽促进口腔黏膜创伤愈合的机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

具有肿瘤双重靶向及内涵体逃逸功能的高siRNA载量纳米粒的制备及形成机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

miR-143调控MSC及通过MSC来源囊泡参与肿瘤抑制的机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

超声介导转铁蛋白修饰共载表阿霉素和薯蓣皂苷脂质体微泡复合物双靶向给药系统的构建及其逆转多药耐药研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于纳米胶束的肿瘤治疗和成像一体化的多功能药物传递系统的构建与评价

国家自然科学基金

0+阅读 · 2015年12月31日

基于荧光纳米簇的“关开”型FRET传感器用于血清中多种肿瘤标志物同时检测

国家自然科学基金

0+阅读 · 2015年12月31日

MFG-E8诱导前列腺肿瘤细胞血管新生表型转换调控肿瘤休眠机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

多模态“影像”集成个体化预测急性DebakeyⅠ型主动脉夹层外科治疗后的再发破裂

国家自然科学基金

0+阅读 · 2015年12月31日

Predict the Retrieval! Test time adaptation for Retrieval Augmented Generation

Arxiv

0+阅读 · 6月22日

Beyond Relevance: On the Relationship Between Retrieval and RAG Information Coverage

Arxiv

0+阅读 · 6月20日

Dissecting Agentic RAG: A Component Ablation for Multi-Hop QA with a Local 7B Model

Arxiv

0+阅读 · 6月19日

MEDLAYXPLAIN: Benchmarking the Expert-Lay Gap in Medical Vision-Language Models

Arxiv

0+阅读 · 6月19日

Med-R2: Perception and Reflection-driven Complex Reasoning for Medical Report Generation

Arxiv

0+阅读 · 6月18日

An approach with Visual and Tabular Mamba to multimodal medical data using Mixed Fusion

Arxiv

0+阅读 · 6月17日

MCompassRAG: Topic Metadata as a Semantic Compass for Paragraph-Level Retrieval

Arxiv

0+阅读 · 6月16日

MedicalAgentsBench for Complex Medical Reasoning: Comparing Internalized Reasoning Models versus Externalized Agent-based Frameworks

Arxiv

0+阅读 · 6月16日

HistoRAG: Embedding Historical Methodology in Retrieval-Augmented Generation Through Critical Technical Practice

Arxiv

0+阅读 · 6月16日

Understanding and Debugging Failures in N-Gram-Based Generative Retrieval

Arxiv

0+阅读 · 6月16日

VIP会员

文章信息

相关主题

最新内容

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

2+阅读 · 今天16:54

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

1+阅读 · 今天16:52

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

6+阅读 · 今天8:00

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

5+阅读 · 今天7:44

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

4+阅读 · 今天7:28

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

4+阅读 · 今天7:18

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

5+阅读 · 今天7:07

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

4+阅读 · 今天7:03

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

4+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

6+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

10+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

4+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

5+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

8+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

7+阅读 · 6月23日

相关VIP内容

【AAAI2026】TruthfulRAG：基于知识图谱解决检索增强生成中的事实层冲突

【AAAI2026】TruthfulRAG：基于知识图谱解决检索增强生成中的事实层冲突

专知会员服务

22+阅读 · 2025年11月15日

利用表示学习推动多机构电子健康记录数据研究

利用表示学习推动多机构电子健康记录数据研究

专知会员服务

16+阅读 · 2025年2月17日

AAAI 25 | 融合分隔：协同专家混合模型用于数据稀缺环境下的药物-靶点相互作用预测

AAAI 25 | 融合分隔：协同专家混合模型用于数据稀缺环境下的药物-靶点相互作用预测

专知会员服务

12+阅读 · 2025年1月13日

ICML 2024 | Med-ST：解锁时空信息在医学多模态预训练中的能力

ICML 2024 | Med-ST：解锁时空信息在医学多模态预训练中的能力

专知会员服务

13+阅读 · 2024年7月10日

ICLR2023：通过提示学习的蛋白质多级结构预训练

ICLR2023：通过提示学习的蛋白质多级结构预训练

专知会员服务

12+阅读 · 2023年11月26日

Cancer Cell综述｜AI用于肿瘤学中的多模态数据集成

Cancer Cell综述｜AI用于肿瘤学中的多模态数据集成

专知会员服务

35+阅读 · 2022年10月13日

J. Med. Chem. | RELATION: 一种基于靶标结构的深度学习全新药物设计模型

J. Med. Chem. | RELATION: 一种基于靶标结构的深度学习全新药物设计模型

专知会员服务

11+阅读 · 2022年6月23日

【斯坦福】从电子病历EHR构建知识图谱，Robustly Extracting Medical Knowledge from EHRs:A Case Study of Learning a Health Knowledge Graph

【斯坦福】从电子病历EHR构建知识图谱，Robustly Extracting Medical Knowledge from EHRs:A Case Study of Learning a Health Knowledge Graph

专知会员服务

56+阅读 · 2020年6月2日

【MICCAI 2019 】Generative adversarial networks and adversarial methods in biomedical image analysis（基于生成对抗网络和对抗方法的生物医学图像分析），附223页PPT免费下载

【MICCAI 2019 】Generative adversarial networks and adversarial methods in biomedical image analysis（基于生成对抗网络和对抗方法的生物医学图像分析），附223页PPT免费下载

专知会员服务

32+阅读 · 2019年11月4日

Risk Sensitive Portfolio Optimization with Regime-Switching and Default Contagion，香港理工大学应用数学系余翔助理教授，第八届全国社会媒体处理大会SMP2019

Risk Sensitive Portfolio Optimization with Regime-Switching and Default Contagion，香港理工大学应用数学系余翔助理教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

10+阅读 · 2019年10月24日

热门VIP内容

开通专知VIP会员享更多权益服务

Agentic RL：框架、实践与长程智能体训练

重新思考无人机时代的生存能力

综述 | 从问答到任务完成：Agent系统与Harness设计

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

相关资讯

MMDetection v2.0 训练自己的数据集

MMDetection v2.0 训练自己的数据集

CVer

30+阅读 · 2020年8月9日

美国埃默里大学医学院发布最新「医学图像配准深度学习」综述论文

美国埃默里大学医学院发布最新「医学图像配准深度学习」综述论文

专知

15+阅读 · 2020年1月7日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Nature Medicine连发9篇论文，Jeff Dean、吴恩达等最新研究入列

Nature Medicine连发9篇论文，Jeff Dean、吴恩达等最新研究入列

新智元

15+阅读 · 2019年1月14日

disentangled-representation-papers

disentangled-representation-papers

CreateAMind

26+阅读 · 2018年9月12日

论文浅尝 | Improved Neural Relation Detection for KBQA

论文浅尝 | Improved Neural Relation Detection for KBQA

开放知识图谱

13+阅读 · 2018年1月21日

读书报告 | Deep Learning for Extreme Multi-label Text Classification

读书报告 | Deep Learning for Extreme Multi-label Text Classification

科技创新与创业

48+阅读 · 2018年1月10日

论文 | 基于RNN的在线多目标跟踪

论文 | 基于RNN的在线多目标跟踪

七月在线实验室

31+阅读 · 2017年12月27日

论文 | 深度学习实现目标跟踪

论文 | 深度学习实现目标跟踪

七月在线实验室

48+阅读 · 2017年12月8日

基于深度学习的医疗影像论文汇总（Deep Learning Papers on Medical Image Analysis）

基于深度学习的医疗影像论文汇总（Deep Learning Papers on Medical Image Analysis）

AI研习社

17+阅读 · 2017年10月21日

相关论文

Predict the Retrieval! Test time adaptation for Retrieval Augmented Generation

Arxiv

0+阅读 · 6月22日

Beyond Relevance: On the Relationship Between Retrieval and RAG Information Coverage

Arxiv

0+阅读 · 6月20日

Dissecting Agentic RAG: A Component Ablation for Multi-Hop QA with a Local 7B Model

Arxiv

0+阅读 · 6月19日

MEDLAYXPLAIN: Benchmarking the Expert-Lay Gap in Medical Vision-Language Models

Arxiv

0+阅读 · 6月19日

Med-R2: Perception and Reflection-driven Complex Reasoning for Medical Report Generation

Arxiv

0+阅读 · 6月18日

An approach with Visual and Tabular Mamba to multimodal medical data using Mixed Fusion

Arxiv

0+阅读 · 6月17日

MCompassRAG: Topic Metadata as a Semantic Compass for Paragraph-Level Retrieval

Arxiv

0+阅读 · 6月16日

MedicalAgentsBench for Complex Medical Reasoning: Comparing Internalized Reasoning Models versus Externalized Agent-based Frameworks

Arxiv

0+阅读 · 6月16日

HistoRAG: Embedding Historical Methodology in Retrieval-Augmented Generation Through Critical Technical Practice

Arxiv

0+阅读 · 6月16日

Understanding and Debugging Failures in N-Gram-Based Generative Retrieval

Arxiv

0+阅读 · 6月16日

相关基金

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

细胞外基质蛋白reelin对多发性骨髓瘤增殖和分化的影响及其机制

国家自然科学基金

0+阅读 · 2016年12月31日

釉原蛋白Exons 8和9联合编码多肽促进口腔黏膜创伤愈合的机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

具有肿瘤双重靶向及内涵体逃逸功能的高siRNA载量纳米粒的制备及形成机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

miR-143调控MSC及通过MSC来源囊泡参与肿瘤抑制的机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

超声介导转铁蛋白修饰共载表阿霉素和薯蓣皂苷脂质体微泡复合物双靶向给药系统的构建及其逆转多药耐药研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于纳米胶束的肿瘤治疗和成像一体化的多功能药物传递系统的构建与评价

国家自然科学基金

0+阅读 · 2015年12月31日

基于荧光纳米簇的“关开”型FRET传感器用于血清中多种肿瘤标志物同时检测

国家自然科学基金

0+阅读 · 2015年12月31日

MFG-E8诱导前列腺肿瘤细胞血管新生表型转换调控肿瘤休眠机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

多模态“影像”集成个体化预测急性DebakeyⅠ型主动脉夹层外科治疗后的再发破裂

国家自然科学基金

0+阅读 · 2015年12月31日

微信扫码咨询专知VIP会员