Feature attribution methods typically provide minimal sufficient evidence justifying a model decision. However, in many applications, such as compliance and cataloging, the full set of contributing features must be identified: complete evidence. We present a case study using existing language models and a medical dataset which contains human-annotated complete evidence. Our findings show that an ensemble approach, aggregating evidence from several models, improves evidence recall over individual models. We examine different ensemble sizes, the effect of evidence-guided training, and provide qualitative insights.


翻译:特征归因方法通常仅提供证明模型决策所需的最小充分证据。然而,在许多应用场景(如合规审查与信息编目)中,必须识别出所有贡献特征:即完整证据。本文通过一项案例研究,利用现有语言模型和包含人工标注完整证据的医学数据集展开分析。研究发现,集成方法通过聚合多个模型的证据,相较于单一模型能够提升证据召回率。我们考察了不同集成规模的影响,探讨了证据引导训练的效果,并提供了定性分析见解。

0
下载
关闭预览

相关内容

【MIT博士论文】基于数据的模型可靠性视角,322页pdf
专知会员服务
39+阅读 · 2024年3月25日
集成学习研究现状及展望
专知会员服务
58+阅读 · 2023年7月20日
【2023新书】机器学习集成方法,354页pdf
专知
40+阅读 · 2023年4月11日
基于深度学习的数据融合方法研究综述
专知
37+阅读 · 2020年12月10日
基于深度元学习的因果推断新方法
图与推荐
12+阅读 · 2020年7月21日
【资源推荐】公开数据集收集汇总
专知
19+阅读 · 2019年6月5日
一文教你如何处理不平衡数据集(附代码)
大数据文摘
11+阅读 · 2019年6月2日
常用的模型集成方法介绍:bagging、boosting 、stacking
机器学习数据集哪里找:优秀数据集来源盘点
云栖社区
12+阅读 · 2019年1月30日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2025年12月30日
VIP会员
相关VIP内容
【MIT博士论文】基于数据的模型可靠性视角,322页pdf
专知会员服务
39+阅读 · 2024年3月25日
集成学习研究现状及展望
专知会员服务
58+阅读 · 2023年7月20日
相关基金
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员