噪声监督下的学习受反馈-真相差距调控 (Learning under noisy supervision is governed by a feedback-truth gap) - 专知论文

会员服务 ·

0

噪声 · 监督 · 系统 · 脑电 · 脑电图 ·

Learning under noisy supervision is governed by a feedback-truth gap

翻译：噪声监督下的学习受反馈-真相差距调控

Elan Schonfeld,Elias Wisnia

from arxiv, 33 pages, 5 figures, 10 extended data figures, 4 extended data tables; 10-page supplementary information

When feedback is absorbed faster than task structure can be evaluated, the learner will favor feedback over truth. A two-timescale model shows this feedback-truth gap is inevitable whenever the two rates differ and vanishes only when they match. We test this prediction across neural networks trained with noisy labels (30 datasets, 2,700 runs), human probabilistic reversal learning (N = 292), and human reward/punishment learning with concurrent EEG (N = 25). In each system, truth is defined operationally: held-out labels, the objectively correct option, or the participant's pre-feedback expectation - the only non-circular reference decodable from post-feedback EEG. The gap appeared universally but was regulated differently: dense networks accumulated it as memorization; sparse-residual scaffolding suppressed it; humans generated transient over-commitment that was actively recovered. Neural over-commitment (~0.04-0.10) was amplified tenfold into behavioral commitment (d = 3.3-3.9). The gap is a fundamental constraint on learning under noisy supervision; its consequences depend on the regulation each system employs.

翻译：当反馈吸收速度超过任务结构评估速度时，学习者将更倾向于依赖反馈而非真相。一个双时间尺度模型表明，只要这两种速率存在差异，反馈-真相差距就不可避免，仅当二者匹配时才会消失。我们在带噪声标签训练的神经网络（30个数据集，2,700次运行）、人类概率反转学习（N = 292）以及同步采集脑电图的人类奖赏/惩罚学习（N = 25）中验证了这一预测。在每个系统中，真相均被操作化定义：留出标签、客观正确选项或参与者反馈前的预期——后者是唯一可从反馈后脑电图中解码的非循环参照。该差距在所有系统中普遍存在，但受不同机制调控：稠密网络通过记忆化积累该差距；稀疏残差架构抑制该差距；人类则产生瞬态过度承诺并通过主动机制恢复。神经层面的过度承诺（约0.04-0.10）被放大十倍转化为行为承诺（d = 3.3-3.9）。该差距是噪声监督下学习的基本约束条件，其具体影响取决于各系统采用的调控机制。

0

相关内容

【ETHZ博士论文】监督学习中的频谱偏差，149页pdf

【ETHZ博士论文】监督学习中的频谱偏差，149页pdf

专知会员服务

22+阅读 · 2024年3月16日

《基于超视距空战模拟的有效导弹发射监督机器学习》

《基于超视距空战模拟的有效导弹发射监督机器学习》

专知会员服务

46+阅读 · 2023年7月10日

自监督为何有效？243页普林斯顿博士论文《理解自监督表示学习》，全面阐述对比学习、语言模型和自我预测三类方法

自监督为何有效？243页普林斯顿博士论文《理解自监督表示学习》，全面阐述对比学习、语言模型和自我预测三类方法

专知会员服务

69+阅读 · 2023年1月29日

当SVM碰上对比学习？霍普金斯/MIT学者在AAAI2022提出《最大化间隔对比学习》选择更好的负样例提升对比性能

当SVM碰上对比学习？霍普金斯/MIT学者在AAAI2022提出《最大化间隔对比学习》选择更好的负样例提升对比性能

专知会员服务

48+阅读 · 2021年12月22日

最新《大间隔学习》综述论文，清华大学张长水老师等

专知会员服务

19+阅读 · 2021年4月3日

最新《对比监督学习》综述论文，20页pdf

最新《对比监督学习》综述论文，20页pdf

专知会员服务

86+阅读 · 2020年11月5日

【MIT】反偏差对比学习，Debiased Contrastive Learning

【MIT】反偏差对比学习，Debiased Contrastive Learning

专知会员服务

91+阅读 · 2020年7月4日

【Google】监督对比学习，Supervised Contrastive Learning

【Google】监督对比学习，Supervised Contrastive Learning

专知会员服务

75+阅读 · 2020年4月24日

【google】监督对比学习，Supervised Contrastive Learning

【google】监督对比学习，Supervised Contrastive Learning

专知会员服务

32+阅读 · 2020年4月23日

图解FixMatch的半监督学习，The Illustrated FixMatch for Semi-Supervised Learning

图解FixMatch的半监督学习，The Illustrated FixMatch for Semi-Supervised Learning

专知会员服务

26+阅读 · 2020年4月2日

对比自监督学习

对比自监督学习

深度学习自然语言处理

35+阅读 · 2020年7月15日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知

16+阅读 · 2020年5月29日

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

专知

16+阅读 · 2020年4月27日

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

专知

133+阅读 · 2020年3月18日

ACL 2019论文分享：ARNOR增强模型注意力，降低远监督学习中的噪声

ACL 2019论文分享：ARNOR增强模型注意力，降低远监督学习中的噪声

AINLP

53+阅读 · 2019年8月15日

基于LSTM模型的学生反馈文本学业情绪识别方法

基于LSTM模型的学生反馈文本学业情绪识别方法

MOOC

17+阅读 · 2019年5月18日

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

开放知识图谱

29+阅读 · 2019年1月17日

半监督多任务学习：Semisupervised Multitask Learning

半监督多任务学习：Semisupervised Multitask Learning

我爱读PAMI

18+阅读 · 2018年4月29日

【干货】监督学习与无监督学习简介

【干货】监督学习与无监督学习简介

专知

14+阅读 · 2018年4月4日

什么是学习率，以及它是如何影响深度学习的

什么是学习率，以及它是如何影响深度学习的

论智

85+阅读 · 2018年2月3日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

面向推荐系统中异构隐式反馈建模的迁移学习技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

视知觉学习中的脑功能网络变化及其与学习效果的关系

国家自然科学基金

0+阅读 · 2015年12月31日

排序与半监督学习的误差分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于时序相似性的机场噪声监测点交互预测

国家自然科学基金

1+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

Mind the Gap: Learning Implicit Impedance in Visuomotor Policies via Intent-Execution Mismatch

Arxiv

0+阅读 · 2月9日

Feature, Alignment, and Supervision in Category Learning: A Comparative Approach with Children and Neural Networks

Arxiv

0+阅读 · 2月3日

How Well Can Preference Optimization Generalize Under Noisy Feedback?

Arxiv

0+阅读 · 1月30日

Causal Imitation Learning Under Measurement Error and Distribution Shift

Arxiv

0+阅读 · 1月29日

Mind the Gap: How Elicitation Protocols Shape the Stated-Revealed Preference Gap in Language Models

Arxiv

0+阅读 · 1月29日

Partial Feedback Online Learning

Arxiv

0+阅读 · 1月29日

Regularized Gradient Temporal-Difference Learning

Arxiv

0+阅读 · 1月28日

Noise-based reward-modulated learning

Arxiv

0+阅读 · 1月26日

Bridging the Gap Between Simulated and Real Network Data Using Transfer Learning

Arxiv

0+阅读 · 1月21日

Training Large Neural Networks With Low-Dimensional Error Feedback

Arxiv

0+阅读 · 1月14日

VIP会员

文章信息

相关主题

相关VIP内容

【ETHZ博士论文】监督学习中的频谱偏差，149页pdf

【ETHZ博士论文】监督学习中的频谱偏差，149页pdf

专知会员服务

22+阅读 · 2024年3月16日

《基于超视距空战模拟的有效导弹发射监督机器学习》

《基于超视距空战模拟的有效导弹发射监督机器学习》

专知会员服务

46+阅读 · 2023年7月10日

自监督为何有效？243页普林斯顿博士论文《理解自监督表示学习》，全面阐述对比学习、语言模型和自我预测三类方法

自监督为何有效？243页普林斯顿博士论文《理解自监督表示学习》，全面阐述对比学习、语言模型和自我预测三类方法

专知会员服务

69+阅读 · 2023年1月29日

当SVM碰上对比学习？霍普金斯/MIT学者在AAAI2022提出《最大化间隔对比学习》选择更好的负样例提升对比性能

当SVM碰上对比学习？霍普金斯/MIT学者在AAAI2022提出《最大化间隔对比学习》选择更好的负样例提升对比性能

专知会员服务

48+阅读 · 2021年12月22日

最新《大间隔学习》综述论文，清华大学张长水老师等

专知会员服务

19+阅读 · 2021年4月3日

最新《对比监督学习》综述论文，20页pdf

最新《对比监督学习》综述论文，20页pdf

专知会员服务

86+阅读 · 2020年11月5日

【MIT】反偏差对比学习，Debiased Contrastive Learning

【MIT】反偏差对比学习，Debiased Contrastive Learning

专知会员服务

91+阅读 · 2020年7月4日

【Google】监督对比学习，Supervised Contrastive Learning

【Google】监督对比学习，Supervised Contrastive Learning

专知会员服务

75+阅读 · 2020年4月24日

【google】监督对比学习，Supervised Contrastive Learning

【google】监督对比学习，Supervised Contrastive Learning

专知会员服务

32+阅读 · 2020年4月23日

图解FixMatch的半监督学习，The Illustrated FixMatch for Semi-Supervised Learning

图解FixMatch的半监督学习，The Illustrated FixMatch for Semi-Supervised Learning

专知会员服务

26+阅读 · 2020年4月2日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

对比自监督学习

对比自监督学习

深度学习自然语言处理

35+阅读 · 2020年7月15日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知

16+阅读 · 2020年5月29日

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

专知

16+阅读 · 2020年4月27日

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

专知

133+阅读 · 2020年3月18日

ACL 2019论文分享：ARNOR增强模型注意力，降低远监督学习中的噪声

ACL 2019论文分享：ARNOR增强模型注意力，降低远监督学习中的噪声

AINLP

53+阅读 · 2019年8月15日

基于LSTM模型的学生反馈文本学业情绪识别方法

基于LSTM模型的学生反馈文本学业情绪识别方法

MOOC

17+阅读 · 2019年5月18日

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

开放知识图谱

29+阅读 · 2019年1月17日

半监督多任务学习：Semisupervised Multitask Learning

半监督多任务学习：Semisupervised Multitask Learning

我爱读PAMI

18+阅读 · 2018年4月29日

【干货】监督学习与无监督学习简介

【干货】监督学习与无监督学习简介

专知

14+阅读 · 2018年4月4日

什么是学习率，以及它是如何影响深度学习的

什么是学习率，以及它是如何影响深度学习的

论智

85+阅读 · 2018年2月3日

相关论文

Mind the Gap: Learning Implicit Impedance in Visuomotor Policies via Intent-Execution Mismatch

Arxiv

0+阅读 · 2月9日

Feature, Alignment, and Supervision in Category Learning: A Comparative Approach with Children and Neural Networks

Arxiv

0+阅读 · 2月3日

How Well Can Preference Optimization Generalize Under Noisy Feedback?

Arxiv

0+阅读 · 1月30日

Causal Imitation Learning Under Measurement Error and Distribution Shift

Arxiv

0+阅读 · 1月29日

Mind the Gap: How Elicitation Protocols Shape the Stated-Revealed Preference Gap in Language Models

Arxiv

0+阅读 · 1月29日

Partial Feedback Online Learning

Arxiv

0+阅读 · 1月29日

Regularized Gradient Temporal-Difference Learning

Arxiv

0+阅读 · 1月28日

Noise-based reward-modulated learning

Arxiv

0+阅读 · 1月26日

Bridging the Gap Between Simulated and Real Network Data Using Transfer Learning

Arxiv

0+阅读 · 1月21日

Training Large Neural Networks With Low-Dimensional Error Feedback

Arxiv

0+阅读 · 1月14日

相关基金

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

面向推荐系统中异构隐式反馈建模的迁移学习技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

视知觉学习中的脑功能网络变化及其与学习效果的关系

国家自然科学基金

0+阅读 · 2015年12月31日

排序与半监督学习的误差分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于时序相似性的机场噪声监测点交互预测

国家自然科学基金

1+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员