Semi-Supervised Learning with Noisy Proxy Covariates: Generalization Bounds and Distribution Regression - 专知论文

会员服务 ·

0

监督 · 半监督 · 监督学习 · 噪声 · 分布回归 ·

Semi-Supervised Learning with Noisy Proxy Covariates: Generalization Bounds and Distribution Regression

翻译：带噪声代理协变量的半监督学习：泛化界与分布回归

Kwangho Kim,Jisu Kim

In many modern machine learning pipelines, abundant pretrained representations serve as noisy proxy covariates, while task-specific labels remain scarce. We study semi-supervised regression in this setting, and propose a simple two stage estimator that learns kernel eigenfeatures from all proxy covariates and fits a ridge predictor on labeled data. We derive finite sample bounds showing that fast labeled sample rates are recovered when proxy perturbation is controlled and unlabeled proxy covariates are sufficiently abundant. We also show that distribution regression is a direct special case, with analogous guarantees when the finite bag size is large enough. Experiments show consistent gains over supervised and semi-supervised baselines, especially in low label regimes.

翻译：在许多现代机器学习流程中，丰富的预训练表示充当了带噪声的代理协变量，而特定任务的标签却仍然稀缺。我们在此背景下研究半监督回归问题，并提出一种简单的两阶段估计器：先从所有代理协变量中学习核本征特征，再在带标签数据上拟合岭回归预测器。我们推导了有限样本界，表明当代理扰动得到控制且无标签代理协变量足够丰富时，标签样本的快速收敛率可被恢复。我们还指出，分布回归是这一框架的直接特例，当有限包容量足够大时可获得类似的保证。实验结果表明，该方法在监督学习和半监督学习基线上均持续取得改进，尤其在低标签率场景下表现突出。

0

相关内容

德国蒂宾根大学最新《半监督和无监督深度视觉学习》综述，22页pdf涵盖322篇文献阐述SSL与UL分类

德国蒂宾根大学最新《半监督和无监督深度视觉学习》综述，22页pdf涵盖322篇文献阐述SSL与UL分类

专知会员服务

38+阅读 · 2022年8月26日

监督和半监督学习下的多标签分类综述

监督和半监督学习下的多标签分类综述

专知会员服务

46+阅读 · 2022年8月3日

香港浸会大学最新《标签噪声表示学习》综述论文，全面阐述LNRL的数据、目标函数与优化策略

香港浸会大学最新《标签噪声表示学习》综述论文，全面阐述LNRL的数据、目标函数与优化策略

专知会员服务

32+阅读 · 2022年2月15日

【CVPR2021】基于跨领域自适应聚类的半监督领域自适应算法

专知会员服务

58+阅读 · 2021年5月19日

【CVPR2021】在类别不平衡的数据上施展半监督学习

专知会员服务

38+阅读 · 2021年3月29日

最新《标签噪声表示学习的研究:过去、现在和将来》2020综述论文，24页pdf

最新《标签噪声表示学习的研究:过去、现在和将来》2020综述论文，24页pdf

专知会员服务

37+阅读 · 2020年11月11日

【NeurIPS 2020-Hinton论文】大型自监督模型是强有力的半监督学习器

【NeurIPS 2020-Hinton论文】大型自监督模型是强有力的半监督学习器

专知会员服务

25+阅读 · 2020年11月4日

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

专知会员服务

185+阅读 · 2020年2月22日

Google研究院提出FixMatch，简单粗暴却极其有效的半监督学习方法，附14页PDF下载

Google研究院提出FixMatch，简单粗暴却极其有效的半监督学习方法，附14页PDF下载

专知会员服务

54+阅读 · 2020年1月24日

【上海交大】半监督学习理论及其研究进展概述

【上海交大】半监督学习理论及其研究进展概述

专知会员服务

71+阅读 · 2019年10月18日

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

专知

16+阅读 · 2020年4月27日

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

专知

133+阅读 · 2020年3月18日

让半监督学习再次伟大！谷歌最新无监督数据增强研究，全面超越现有半监督学习方法

让半监督学习再次伟大！谷歌最新无监督数据增强研究，全面超越现有半监督学习方法

新智元

20+阅读 · 2019年7月11日

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

机器之心

11+阅读 · 2019年6月3日

【上海交大】半监督学习理论及其研究进展概述

【上海交大】半监督学习理论及其研究进展概述

专知

43+阅读 · 2019年6月2日

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

开放知识图谱

29+阅读 · 2019年1月17日

半监督深度学习小结：类协同训练和一致性正则化

半监督深度学习小结：类协同训练和一致性正则化

PaperWeekly

15+阅读 · 2018年12月24日

一文概览能生成代理标签的半监督学习算法

一文概览能生成代理标签的半监督学习算法

论智

12+阅读 · 2018年6月5日

半监督多任务学习：Semisupervised Multitask Learning

半监督多任务学习：Semisupervised Multitask Learning

我爱读PAMI

18+阅读 · 2018年4月29日

AAAI 2018 | 南京大学提出SSWL：从半监督弱标注数据中学习多标签学习问题

AAAI 2018 | 南京大学提出SSWL：从半监督弱标注数据中学习多标签学习问题

机器之心

21+阅读 · 2018年1月7日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

分数阶随机共振行为机制及其自适应控制与强色噪声背景中的微弱信号检测

国家自然科学基金

0+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

排序与半监督学习的误差分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

一般半群和广义正则半群的代数理论

国家自然科学基金

0+阅读 · 2014年12月31日

半监督进化文本聚类算法在动态多源文本分析上的研究

国家自然科学基金

2+阅读 · 2014年12月31日

一般误差分布下若干半参数模型的复合分位数方法

国家自然科学基金

0+阅读 · 2014年12月31日

基于稀疏表示和流形理论的半监督分类研究

国家自然科学基金

0+阅读 · 2014年12月31日

AnomalyMatch: Discovering Rare Objects of Interest with Semi-supervised and Active Learning

Arxiv

0+阅读 · 6月16日

Self-Supervised Learning of Iterative Solvers for Constrained Optimization

Arxiv

0+阅读 · 6月15日

Semi-Supervised Noise Adaptation: Transferring Knowledge from Noise Domain

Arxiv

0+阅读 · 6月15日

Unsupervised Learning of Efficient Exploration: Pre-training Adaptive Policies via Self-Imposed Goals

Arxiv

0+阅读 · 6月12日

Beyond the Training Distribution: Evaluating Predictions Under Distribution Shift and Selection Bias

Arxiv

0+阅读 · 6月12日

Realistic noise synthesis reduces bias and improves tissue microstructure estimation with supervised machine learning

Arxiv

0+阅读 · 6月11日

Limits of spectral learning under noise

Arxiv

0+阅读 · 6月11日

Supervised Learning as Lossy Compression: Characterizing Generalization and Sample Complexity via Finite Blocklength Analysis

Arxiv

0+阅读 · 5月29日

Iterative Chow Filtering for Learning with Distribution Shift

Arxiv

0+阅读 · 5月17日

Efficient distributional regression trees learning algorithms for calibrated non-parametric probabilistic forecasts

Arxiv

0+阅读 · 5月13日

VIP会员

文章信息

相关主题

最新内容

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

专知会员服务

2+阅读 · 今天7:13

俄乌无人机战争的六大启示

俄乌无人机战争的六大启示

专知会员服务

4+阅读 · 今天7:07

《无人机空中监控：通信实验洞察》

《无人机空中监控：通信实验洞察》

专知会员服务

3+阅读 · 今天7:05

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

专知会员服务

3+阅读 · 今天6:59

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

12+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

5+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

10+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

12+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

6+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

10+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

8+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

9+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

8+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

6+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

相关VIP内容

德国蒂宾根大学最新《半监督和无监督深度视觉学习》综述，22页pdf涵盖322篇文献阐述SSL与UL分类

德国蒂宾根大学最新《半监督和无监督深度视觉学习》综述，22页pdf涵盖322篇文献阐述SSL与UL分类

专知会员服务

38+阅读 · 2022年8月26日

监督和半监督学习下的多标签分类综述

监督和半监督学习下的多标签分类综述

专知会员服务

46+阅读 · 2022年8月3日

香港浸会大学最新《标签噪声表示学习》综述论文，全面阐述LNRL的数据、目标函数与优化策略

香港浸会大学最新《标签噪声表示学习》综述论文，全面阐述LNRL的数据、目标函数与优化策略

专知会员服务

32+阅读 · 2022年2月15日

【CVPR2021】基于跨领域自适应聚类的半监督领域自适应算法

专知会员服务

58+阅读 · 2021年5月19日

【CVPR2021】在类别不平衡的数据上施展半监督学习

专知会员服务

38+阅读 · 2021年3月29日

最新《标签噪声表示学习的研究:过去、现在和将来》2020综述论文，24页pdf

最新《标签噪声表示学习的研究:过去、现在和将来》2020综述论文，24页pdf

专知会员服务

37+阅读 · 2020年11月11日

【NeurIPS 2020-Hinton论文】大型自监督模型是强有力的半监督学习器

【NeurIPS 2020-Hinton论文】大型自监督模型是强有力的半监督学习器

专知会员服务

25+阅读 · 2020年11月4日

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

专知会员服务

185+阅读 · 2020年2月22日

Google研究院提出FixMatch，简单粗暴却极其有效的半监督学习方法，附14页PDF下载

Google研究院提出FixMatch，简单粗暴却极其有效的半监督学习方法，附14页PDF下载

专知会员服务

54+阅读 · 2020年1月24日

【上海交大】半监督学习理论及其研究进展概述

【上海交大】半监督学习理论及其研究进展概述

专知会员服务

71+阅读 · 2019年10月18日

热门VIP内容

开通专知VIP会员享更多权益服务

俄乌无人机战争的六大启示

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《无人机空中监控：通信实验洞察》

相关资讯

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

专知

16+阅读 · 2020年4月27日

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

专知

133+阅读 · 2020年3月18日

让半监督学习再次伟大！谷歌最新无监督数据增强研究，全面超越现有半监督学习方法

让半监督学习再次伟大！谷歌最新无监督数据增强研究，全面超越现有半监督学习方法

新智元

20+阅读 · 2019年7月11日

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

机器之心

11+阅读 · 2019年6月3日

【上海交大】半监督学习理论及其研究进展概述

【上海交大】半监督学习理论及其研究进展概述

专知

43+阅读 · 2019年6月2日

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

开放知识图谱

29+阅读 · 2019年1月17日

半监督深度学习小结：类协同训练和一致性正则化

半监督深度学习小结：类协同训练和一致性正则化

PaperWeekly

15+阅读 · 2018年12月24日

一文概览能生成代理标签的半监督学习算法

一文概览能生成代理标签的半监督学习算法

论智

12+阅读 · 2018年6月5日

半监督多任务学习：Semisupervised Multitask Learning

半监督多任务学习：Semisupervised Multitask Learning

我爱读PAMI

18+阅读 · 2018年4月29日

AAAI 2018 | 南京大学提出SSWL：从半监督弱标注数据中学习多标签学习问题

AAAI 2018 | 南京大学提出SSWL：从半监督弱标注数据中学习多标签学习问题

机器之心

21+阅读 · 2018年1月7日

相关论文

AnomalyMatch: Discovering Rare Objects of Interest with Semi-supervised and Active Learning

Arxiv

0+阅读 · 6月16日

Self-Supervised Learning of Iterative Solvers for Constrained Optimization

Arxiv

0+阅读 · 6月15日

Semi-Supervised Noise Adaptation: Transferring Knowledge from Noise Domain

Arxiv

0+阅读 · 6月15日

Unsupervised Learning of Efficient Exploration: Pre-training Adaptive Policies via Self-Imposed Goals

Arxiv

0+阅读 · 6月12日

Beyond the Training Distribution: Evaluating Predictions Under Distribution Shift and Selection Bias

Arxiv

0+阅读 · 6月12日

Realistic noise synthesis reduces bias and improves tissue microstructure estimation with supervised machine learning

Arxiv

0+阅读 · 6月11日

Limits of spectral learning under noise

Arxiv

0+阅读 · 6月11日

Supervised Learning as Lossy Compression: Characterizing Generalization and Sample Complexity via Finite Blocklength Analysis

Arxiv

0+阅读 · 5月29日

Iterative Chow Filtering for Learning with Distribution Shift

Arxiv

0+阅读 · 5月17日

Efficient distributional regression trees learning algorithms for calibrated non-parametric probabilistic forecasts

Arxiv

0+阅读 · 5月13日

相关基金

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

分数阶随机共振行为机制及其自适应控制与强色噪声背景中的微弱信号检测

国家自然科学基金

0+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

排序与半监督学习的误差分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

一般半群和广义正则半群的代数理论

国家自然科学基金

0+阅读 · 2014年12月31日

半监督进化文本聚类算法在动态多源文本分析上的研究

国家自然科学基金

2+阅读 · 2014年12月31日

一般误差分布下若干半参数模型的复合分位数方法

国家自然科学基金

0+阅读 · 2014年12月31日

基于稀疏表示和流形理论的半监督分类研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员