MIND: Decoupling Model-Induced Label Noise via Latent Manifold Disentanglement - 专知论文

会员服务 ·

0

噪声 · 流形 · 潜在 · 解耦 · 鲁棒 ·

MIND: Decoupling Model-Induced Label Noise via Latent Manifold Disentanglement

翻译：MIND：通过潜在流形解耦消除模型诱导的标签噪声

from arxiv, Accepted, to appear in ICML2026

The paradigm of learning from automatic annotations driven by pre-trained experts and Foundation Models dominates data-hungry applications. However, it introduces a critical challenge: model-induced label noise. Unlike stochastic noise in classical robust learning, this noise stems from annotator inductive biases, manifesting as systematic errors tightly coupled with local feature manifolds. Existing methods relying on global transition matrices underfit these structural patterns, while learning instance-specific matrices remains mathematically intractable. We propose Model-Induced Noise Decoupling (MIND), a theoretically grounded framework addressing this dilemma. We demonstrate that the high-dimensional noise manifold can be decoupled into tractable, subspace-dependent components via Latent Manifold Disentanglement. Specifically, our Latent Decoupling Estimator (LDE) dynamically projects samples into latent structural clusters with consistent error modes, facilitating noise identifiability without ground-truth anchor points. To rigorously evaluate robustness, we adopt a hierarchical protocol: moving from controlled noise on CIFAR-100 to a structural stress test on large-scale real-world 3D datasets (S3DIS, ScanNet), where error patterns explicitly couple with geometric manifolds. Empirically, MIND significantly outperforms state-of-the-art methods on these complex benchmarks and effectively corrects zero-shot hallucinations from Vision-Language Models (e.g., OpenSeg), highlighting its potential as a robust distillation framework for Foundation Models.

翻译：由预训练专家和基础模型驱动的自动标注学习范式主导了数据密集型应用。然而，这引入了一个关键挑战：模型诱导的标签噪声。与经典鲁棒学习中的随机噪声不同，此噪声源于标注者的归纳偏差，表现为与局部特征流形紧密耦合的系统性错误。依赖全局转移矩阵的现有方法无法充分拟合这些结构模式，而学习实例特定的转移矩阵在数学上仍然难以处理。我们提出模型诱导噪声解耦（MIND），一个从理论上解决此困境的框架。我们证明高维噪声流形可通过潜在流形解耦被分解为可处理的子空间依赖分量。具体而言，我们的潜在解耦估计器（LDE）将样本动态投影到具有一致错误模式的潜在结构聚类中，从而在无需真实锚点的情况下促进噪声可识别性。为严格评估鲁棒性，我们采用分层协议：从CIFAR-100上的可控噪声过渡到大规模真实世界3D数据集（S3DIS、ScanNet）的结构压力测试，其中错误模式与几何流形显式耦合。实验表明，MIND在这些复杂基准上显著优于现有最优方法，并能有效纠正视觉-语言模型（如OpenSeg）的零样本幻觉，凸显其作为基础模型鲁棒蒸馏框架的潜力。

0

相关内容

【WWW2025】释放大型语言模型在去噪推荐中的强大能力

【WWW2025】释放大型语言模型在去噪推荐中的强大能力

专知会员服务

14+阅读 · 2025年2月18日

【CVPR2024】DiffusionMTL: 从部分标注数据学习多任务去噪扩散模型

【CVPR2024】DiffusionMTL: 从部分标注数据学习多任务去噪扩散模型

专知会员服务

34+阅读 · 2024年3月25日

去噪:有监督、自监督和无监督，57页ppt

去噪:有监督、自监督和无监督，57页ppt

专知会员服务

59+阅读 · 2023年5月3日

【CVPR2023】带有噪声标签的孪生对比学习

【CVPR2023】带有噪声标签的孪生对比学习

专知会员服务

33+阅读 · 2023年3月16日

香港浸会大学最新《标签噪声表示学习》综述论文，全面阐述LNRL的数据、目标函数与优化策略

香港浸会大学最新《标签噪声表示学习》综述论文，全面阐述LNRL的数据、目标函数与优化策略

专知会员服务

32+阅读 · 2022年2月15日

图像去噪方法概述

专知会员服务

43+阅读 · 2021年8月30日

【AAAI2021】元标签校正的噪声标签学习

专知会员服务

31+阅读 · 2020年12月7日

最新《标签噪声表示学习的研究:过去、现在和将来》2020综述论文，24页pdf

最新《标签噪声表示学习的研究:过去、现在和将来》2020综述论文，24页pdf

专知会员服务

37+阅读 · 2020年11月11日

最新《深度学习噪声标签学习》综述论文，14页pdf

专知会员服务

101+阅读 · 2020年7月20日

【CVPR2020-上海交大】自组织记忆模块来解决网络图片中的标签噪声和背景噪声

【CVPR2020-上海交大】自组织记忆模块来解决网络图片中的标签噪声和背景噪声

专知会员服务

28+阅读 · 2020年3月18日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

无所不能的Self-Attention！洛桑理工ICLR2020论文验证「自注意力可以表达任何CNN卷积滤波层」

无所不能的Self-Attention！洛桑理工ICLR2020论文验证「自注意力可以表达任何CNN卷积滤波层」

专知

24+阅读 · 2020年1月12日

Attention！注意力机制模型最新综述（附下载）

Attention！注意力机制模型最新综述（附下载）

数据派THU

36+阅读 · 2019年4月14日

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

开放知识图谱

29+阅读 · 2019年1月17日

论文浅尝 | 基于局内去噪和迁移学习的关系抽取

论文浅尝 | 基于局内去噪和迁移学习的关系抽取

开放知识图谱

16+阅读 · 2018年12月2日

ICASSP最佳学生论文：深度对抗声学模型训练框架

ICASSP最佳学生论文：深度对抗声学模型训练框架

专知

14+阅读 · 2018年4月28日

【好文解析】ICASSP最佳学生论文：深度对抗声学模型训练框架

【好文解析】ICASSP最佳学生论文：深度对抗声学模型训练框架

中国科学院自动化研究所

13+阅读 · 2018年4月28日

基于位置注意力机制模型和带标签数据来提升槽填充（EMNLP outstanding paper）

基于位置注意力机制模型和带标签数据来提升槽填充（EMNLP outstanding paper）

科技创新与创业

17+阅读 · 2017年11月17日

FCS 论坛 | 孟德宇：误差建模原理

FCS 论坛 | 孟德宇：误差建模原理

FCS

15+阅读 · 2017年8月17日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

随机振动响应预测中的模型形式不确定性量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

分数阶随机共振行为机制及其自适应控制与强色噪声背景中的微弱信号检测

国家自然科学基金

0+阅读 · 2015年12月31日

多标签降维中的多重代价敏感学习问题研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

9+阅读 · 2015年12月31日

基于自适应稀疏算子的图像乘性噪声移除方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂场景下目标跟踪的表观建模研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于稀疏理论和图Laplacian矩阵的图像去噪理论与方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

高阶图像去噪模型的快速数值算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

Federated Medical Image Segmentation under Real-World Label Noise: A Benchmark Suite for Noisy Label Learning Method Selection

Arxiv

0+阅读 · 6月15日

Intrinsic Gradient Suppression for Label-Noise Prompt Tuning in Vision-Language Models

Arxiv

0+阅读 · 6月15日

Learning Earthquake Wave Arrival Time Picking from Labels with Inaccuracies

Arxiv

0+阅读 · 6月13日

An Adaptive Data cleaning Framework for Noisy Label Detection

Arxiv

0+阅读 · 6月13日

JetParticle-JEPA: An Efficient Self-Supervised Representation Learning method for Jet Tagging in High-Energy Physics

Arxiv

0+阅读 · 6月12日

When Recommendation Denoising Meets Popularity Bias: Understanding and Mitigating Their Interaction

Arxiv

0+阅读 · 6月12日

Symmetrization of Loss Functions for Robust Training of Neural Networks in the Presence of Noisy Labels

Arxiv

0+阅读 · 6月8日

ANCHOR: Agentic Noise Creation Framework for Human Simulation and Denoising Recommendation

Arxiv

0+阅读 · 6月4日

Random Erasing vs. Model Inversion: A Promising Defense or a False Hope?

Arxiv

0+阅读 · 6月1日

Training data attribution in diffusion models via mirrored unlearning and noise-consistent skew

Arxiv

0+阅读 · 5月18日

VIP会员

文章信息

相关主题

最新内容

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

4+阅读 · 今天2:42

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

1+阅读 · 今天2:37

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

5+阅读 · 今天2:23

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

6+阅读 · 今天2:21

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

2+阅读 · 今天1:46

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

6+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

4+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

4+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

8+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

8+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

8+阅读 · 7月31日

相关VIP内容

【WWW2025】释放大型语言模型在去噪推荐中的强大能力

【WWW2025】释放大型语言模型在去噪推荐中的强大能力

专知会员服务

14+阅读 · 2025年2月18日

【CVPR2024】DiffusionMTL: 从部分标注数据学习多任务去噪扩散模型

【CVPR2024】DiffusionMTL: 从部分标注数据学习多任务去噪扩散模型

专知会员服务

34+阅读 · 2024年3月25日

去噪:有监督、自监督和无监督，57页ppt

去噪:有监督、自监督和无监督，57页ppt

专知会员服务

59+阅读 · 2023年5月3日

【CVPR2023】带有噪声标签的孪生对比学习

【CVPR2023】带有噪声标签的孪生对比学习

专知会员服务

33+阅读 · 2023年3月16日

香港浸会大学最新《标签噪声表示学习》综述论文，全面阐述LNRL的数据、目标函数与优化策略

香港浸会大学最新《标签噪声表示学习》综述论文，全面阐述LNRL的数据、目标函数与优化策略

专知会员服务

32+阅读 · 2022年2月15日

图像去噪方法概述

专知会员服务

43+阅读 · 2021年8月30日

【AAAI2021】元标签校正的噪声标签学习

专知会员服务

31+阅读 · 2020年12月7日

最新《标签噪声表示学习的研究:过去、现在和将来》2020综述论文，24页pdf

最新《标签噪声表示学习的研究:过去、现在和将来》2020综述论文，24页pdf

专知会员服务

37+阅读 · 2020年11月11日

最新《深度学习噪声标签学习》综述论文，14页pdf

专知会员服务

101+阅读 · 2020年7月20日

【CVPR2020-上海交大】自组织记忆模块来解决网络图片中的标签噪声和背景噪声

【CVPR2020-上海交大】自组织记忆模块来解决网络图片中的标签噪声和背景噪声

专知会员服务

28+阅读 · 2020年3月18日

热门VIP内容

开通专知VIP会员享更多权益服务

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

从采集到决策：美军视角下的战术情报范式重构

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

相关资讯

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

无所不能的Self-Attention！洛桑理工ICLR2020论文验证「自注意力可以表达任何CNN卷积滤波层」

无所不能的Self-Attention！洛桑理工ICLR2020论文验证「自注意力可以表达任何CNN卷积滤波层」

专知

24+阅读 · 2020年1月12日

Attention！注意力机制模型最新综述（附下载）

Attention！注意力机制模型最新综述（附下载）

数据派THU

36+阅读 · 2019年4月14日

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

开放知识图谱

29+阅读 · 2019年1月17日

论文浅尝 | 基于局内去噪和迁移学习的关系抽取

论文浅尝 | 基于局内去噪和迁移学习的关系抽取

开放知识图谱

16+阅读 · 2018年12月2日

ICASSP最佳学生论文：深度对抗声学模型训练框架

ICASSP最佳学生论文：深度对抗声学模型训练框架

专知

14+阅读 · 2018年4月28日

【好文解析】ICASSP最佳学生论文：深度对抗声学模型训练框架

【好文解析】ICASSP最佳学生论文：深度对抗声学模型训练框架

中国科学院自动化研究所

13+阅读 · 2018年4月28日

基于位置注意力机制模型和带标签数据来提升槽填充（EMNLP outstanding paper）

基于位置注意力机制模型和带标签数据来提升槽填充（EMNLP outstanding paper）

科技创新与创业

17+阅读 · 2017年11月17日

FCS 论坛 | 孟德宇：误差建模原理

FCS 论坛 | 孟德宇：误差建模原理

FCS

15+阅读 · 2017年8月17日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

相关论文

Federated Medical Image Segmentation under Real-World Label Noise: A Benchmark Suite for Noisy Label Learning Method Selection

Arxiv

0+阅读 · 6月15日

Intrinsic Gradient Suppression for Label-Noise Prompt Tuning in Vision-Language Models

Arxiv

0+阅读 · 6月15日

Learning Earthquake Wave Arrival Time Picking from Labels with Inaccuracies

Arxiv

0+阅读 · 6月13日

An Adaptive Data cleaning Framework for Noisy Label Detection

Arxiv

0+阅读 · 6月13日

JetParticle-JEPA: An Efficient Self-Supervised Representation Learning method for Jet Tagging in High-Energy Physics

Arxiv

0+阅读 · 6月12日

When Recommendation Denoising Meets Popularity Bias: Understanding and Mitigating Their Interaction

Arxiv

0+阅读 · 6月12日

Symmetrization of Loss Functions for Robust Training of Neural Networks in the Presence of Noisy Labels

Arxiv

0+阅读 · 6月8日

ANCHOR: Agentic Noise Creation Framework for Human Simulation and Denoising Recommendation

Arxiv

0+阅读 · 6月4日

Random Erasing vs. Model Inversion: A Promising Defense or a False Hope?

Arxiv

0+阅读 · 6月1日

Training data attribution in diffusion models via mirrored unlearning and noise-consistent skew

Arxiv

0+阅读 · 5月18日

相关基金

随机振动响应预测中的模型形式不确定性量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

分数阶随机共振行为机制及其自适应控制与强色噪声背景中的微弱信号检测

国家自然科学基金

0+阅读 · 2015年12月31日

多标签降维中的多重代价敏感学习问题研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

9+阅读 · 2015年12月31日

基于自适应稀疏算子的图像乘性噪声移除方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂场景下目标跟踪的表观建模研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于稀疏理论和图Laplacian矩阵的图像去噪理论与方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

高阶图像去噪模型的快速数值算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

微信扫码咨询专知VIP会员