Methods addressing Learning with Noisy Labels (LNL) and multi-source Domain Generalization (DG) use training techniques to improve downstream task performance in the presence of label noise or domain shifts, respectively. Prior work often explores these tasks in isolation, and the limited work that does investigate their intersection, which we refer to as Noise-Aware Generalization (NAG), only benchmarks existing methods without also proposing an approach to reduce its effect. We find that this is likely due, in part, to the new challenges that arise when exploring NAG, which does not appear in LNL or DG alone. For example, we show that the effectiveness of DG methods is compromised in the presence of label noise, making them largely ineffective. Similarly, LNL methods often overfit to easy-to-learn domains as they confuse domain shifts for label noise. Instead, we propose Domain Labels for Noise Detection (DL4ND), the first direct method developed for NAG which uses our observation that noisy samples that may appear indistinguishable within a single domain often show greater variation when compared across domains. We find DL4ND outperforms DG and LNL methods, including their combinations, even when simplifying the NAG challenge by using domain labels to isolate domain shifts from noise. Performance gains up to 12.5% over seven diverse datasets with three noise types demonstrates DL4ND's ability to generalize to a wide variety of settings.


翻译:针对含噪标签学习与多源域泛化的方法分别通过训练技术提升模型在标签噪声或域偏移存在时的下游任务性能。先前研究常孤立探讨这两类任务,而有限的相关交叉研究(我们称之为噪声感知泛化)仅对现有方法进行基准测试,未提出缓解其影响的解决方案。我们发现这在一定程度上源于探索噪声感知泛化时出现的新挑战,这些挑战在单独的含噪标签学习或域泛化中并不显著。例如,我们证明域泛化方法在标签噪声存在时效果受损,基本失效;而含噪标签学习方法常将域偏移误判为标签噪声,导致对易学习域的过拟合。为此,我们提出首个直接面向噪声感知泛化的方法——基于域标签的噪声检测,该方法利用我们的关键发现:在单域内难以区分的噪声样本,在跨域对比中往往表现出更大变异度。实验表明,即使通过域标签分离域偏移与噪声以简化噪声感知泛化挑战,基于域标签的噪声检测仍优于各类域泛化及含噪标签学习方法(包括其组合方案)。在涵盖三种噪声类型的七个异构数据集上实现最高12.5%的性能提升,验证了基于域标签的噪声检测对多样化场景的泛化能力。

0
下载
关闭预览

相关内容

深度学习中泛化的量化、理解与改进
专知会员服务
17+阅读 · 2025年9月13日
【NeurIPS2023】多样化的时空感知用于视频域泛化
专知会员服务
21+阅读 · 2023年10月30日
【KDD2023】对领域泛化的异质性进行定量度量和对比分析
专知会员服务
24+阅读 · 2023年5月29日
专知会员服务
26+阅读 · 2021年10月20日
专知会员服务
101+阅读 · 2020年7月20日
【ICML2021】因果匹配领域泛化
专知
12+阅读 · 2021年8月12日
领域自适应学习论文大列表
专知
71+阅读 · 2019年3月2日
论文浅尝 | 基于深度强化学习的远程监督数据集的降噪
开放知识图谱
29+阅读 · 2019年1月17日
迁移学习之Domain Adaptation
全球人工智能
18+阅读 · 2018年4月11日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
VIP会员
最新内容
最新“指挥控制”领域出版物合集(16份)
专知会员服务
7+阅读 · 4月12日
面向军事作战需求开发的人工智能(RAIMOND)
专知会员服务
15+阅读 · 4月12日
远程空中优势:新一代超视距导弹的兴起
专知会员服务
2+阅读 · 4月12日
大语言模型溯因推理的统一分类学与综述
专知会员服务
4+阅读 · 4月12日
相关基金
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员