Understanding Self-Supervised Learning via Latent Distribution Matching - 专知论文

会员服务 ·

0

潜在 · Learning · SSL · 表示 · 可理解性 ·

Understanding Self-Supervised Learning via Latent Distribution Matching

翻译：通过潜在分布匹配理解自监督学习

Fabian A Mikulasch,Friedemann Zenke

from arxiv, Accepted to ICML 2026 (Spotlight)

Self-supervised learning (SSL) excels at finding general-purpose latent representations from complex data, yet lacks a unifying theoretical framework that explains the diverse existing methods and guides the design of new ones. We cast SSL as latent distribution matching (LDM): learning representations that maximize their log-probability under an assumed latent model (alignment), while maximizing latent entropy to prevent collapse (uniformity). This view unifies independent component analysis with contrastive, non-contrastive, and predictive SSL methods, including stop gradient approaches. Leveraging LDM, we derive a nonlinear, sampling-free Bayesian filtering model with a Kalman-based predictor for high-dimensional timeseries. We further prove that predictive LDM yields identifiable latent representations under mild assumptions, even with nonlinear predictors. Overall, LDM clarifies the assumptions behind established SSL methods and provides principled guidance for developing new approaches.

翻译：自监督学习（SSL）擅长从复杂数据中发现通用潜在表示，但缺乏统一的理论框架来解释现有各类方法并指导新方法的设计。本文将SSL视为潜在分布匹配（LDM）：学习使假设潜在模型下的对数概率最大化的表示（对齐），同时最大化潜在熵以防止坍塌（均匀性）。这一观点将独立成分分析与对比式、非对比式和预测式SSL方法（包括停止梯度方法）统一起来。借助LDM，我们推导出一种基于卡尔曼预测器的非线性无采样贝叶斯滤波模型，适用于高维时间序列。我们进一步证明，在温和假设下，即使使用非线性预测器，预测式LDM也能产生可识别的潜在表示。总之，LDM阐明了现有SSL方法背后的假设，并为开发新方法提供了基于原理的指导。

0

相关内容

面向图像分割的自监督学习：全面综述

面向图像分割的自监督学习：全面综述

专知会员服务

13+阅读 · 2025年5月26日

《视觉Transformers自监督学习机制综述》

《视觉Transformers自监督学习机制综述》

专知会员服务

29+阅读 · 2024年9月2日

时间序列如何用自监督？浙大最新《自监督学习时间序列分析：分类、进展与展望》

时间序列如何用自监督？浙大最新《自监督学习时间序列分析：分类、进展与展望》

专知会员服务

72+阅读 · 2023年6月24日

70页《自监督学习》最新简明指南，图灵奖LeCun等编著

70页《自监督学习》最新简明指南，图灵奖LeCun等编著

专知会员服务

76+阅读 · 2023年4月26日

【CVPR2023】基于多模态在线知识蒸馏的自监督视觉表示学习

【CVPR2023】基于多模态在线知识蒸馏的自监督视觉表示学习

专知会员服务

42+阅读 · 2023年4月15日

东南大学等最新《自监督学习》最新进展，26页pdf356篇文献阐述自监督学习算法、理论与应用

东南大学等最新《自监督学习》最新进展，26页pdf356篇文献阐述自监督学习算法、理论与应用

专知会员服务

68+阅读 · 2023年1月20日

自监督如何做推荐？昆士兰大学最新《自监督学习推荐系统》综述论文，阐述对比、生成、预测和混合四大类方法

自监督如何做推荐？昆士兰大学最新《自监督学习推荐系统》综述论文，阐述对比、生成、预测和混合四大类方法

专知会员服务

32+阅读 · 2022年4月5日

【YannLecun最新报告】自监督学习与能量模型，附99页ppt与视频

【YannLecun最新报告】自监督学习与能量模型，附99页ppt与视频

专知会员服务

56+阅读 · 2021年6月19日

GNN如何自监督学习？TAMU首篇《图神经网络自监督学习》综述论文，17页pdf

GNN如何自监督学习？TAMU首篇《图神经网络自监督学习》综述论文，17页pdf

专知会员服务

74+阅读 · 2021年2月28日

Google研究院提出FixMatch，简单粗暴却极其有效的半监督学习方法，附14页PDF下载

Google研究院提出FixMatch，简单粗暴却极其有效的半监督学习方法，附14页PDF下载

专知会员服务

54+阅读 · 2020年1月24日

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

【AAAI2021】自监督对应学习的对比转换

【AAAI2021】自监督对应学习的对比转换

专知

12+阅读 · 2020年12月11日

对比自监督学习

对比自监督学习

深度学习自然语言处理

35+阅读 · 2020年7月15日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知

16+阅读 · 2020年5月29日

【自监督学习】OpenAI科学家一文详解自监督学习

【自监督学习】OpenAI科学家一文详解自监督学习

产业智能官

25+阅读 · 2020年3月18日

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

专知

133+阅读 · 2020年3月18日

解读自监督学习(Self-Supervised Learning)几篇相关paper

解读自监督学习(Self-Supervised Learning)几篇相关paper

CVer

25+阅读 · 2020年2月21日

【图灵奖得主Yann Lecun最新演讲】基于能量的自监督学习，68页ppt，了解后深度学习发展趋势

【图灵奖得主Yann Lecun最新演讲】基于能量的自监督学习，68页ppt，了解后深度学习发展趋势

专知

42+阅读 · 2019年11月25日

OpenAI科学家一文详解自监督学习

OpenAI科学家一文详解自监督学习

新智元

18+阅读 · 2019年11月20日

最新《深度神经网络自监督视觉特征学习综述》论文（附24页全文下载）

最新《深度神经网络自监督视觉特征学习综述》论文（附24页全文下载）

专知

36+阅读 · 2019年2月20日

面向移动互联网流量的行为特征和自适应分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

排序与半监督学习的误差分析

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

31+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

自检测型量子密钥分配研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

半监督进化文本聚类算法在动态多源文本分析上的研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

Supervised Graph Contrastive Learning for Gene Regulatory Networks

Arxiv

0+阅读 · 6月15日

Self-Supervised Learning as Discrete Communication

Arxiv

0+阅读 · 6月15日

Interpretable Self-Supervised Learning via Representer Landmarks and Nyström Approximation

Arxiv

0+阅读 · 6月8日

Leveraging Soft Distributions of SSL-Derived Discrete Speech Tokens for Downstream Inference

Arxiv

0+阅读 · 6月5日

Geometric Second-Order Feature Correlation Learning for Self-Supervised Speech Emotion Recognition

Arxiv

0+阅读 · 6月4日

Self-supervised local learning rules learn the hidden hierarchical structure of high-dimensional data

Arxiv

0+阅读 · 5月18日

A Refined Generalization Analysis for Extreme Multi-class Supervised Contrastive Representation Learning

Arxiv

0+阅读 · 5月11日

Rethinking Masking Strategies for Masked Prediction-based Audio Self-supervised Learning

Arxiv

0+阅读 · 3月25日

Towards Graph Contrastive Learning: A Survey and Beyond

Arxiv

10+阅读 · 2024年5月20日

Self-Supervised Learning for Time Series Analysis: Taxonomy, Progress, and Prospects

Arxiv

18+阅读 · 2023年6月16日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

3+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

4+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

9+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

8+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

4+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

7+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

6+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

9+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

7+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

6+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

5+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

面向图像分割的自监督学习：全面综述

面向图像分割的自监督学习：全面综述

专知会员服务

13+阅读 · 2025年5月26日

《视觉Transformers自监督学习机制综述》

《视觉Transformers自监督学习机制综述》

专知会员服务

29+阅读 · 2024年9月2日

时间序列如何用自监督？浙大最新《自监督学习时间序列分析：分类、进展与展望》

时间序列如何用自监督？浙大最新《自监督学习时间序列分析：分类、进展与展望》

专知会员服务

72+阅读 · 2023年6月24日

70页《自监督学习》最新简明指南，图灵奖LeCun等编著

70页《自监督学习》最新简明指南，图灵奖LeCun等编著

专知会员服务

76+阅读 · 2023年4月26日

【CVPR2023】基于多模态在线知识蒸馏的自监督视觉表示学习

【CVPR2023】基于多模态在线知识蒸馏的自监督视觉表示学习

专知会员服务

42+阅读 · 2023年4月15日

东南大学等最新《自监督学习》最新进展，26页pdf356篇文献阐述自监督学习算法、理论与应用

东南大学等最新《自监督学习》最新进展，26页pdf356篇文献阐述自监督学习算法、理论与应用

专知会员服务

68+阅读 · 2023年1月20日

自监督如何做推荐？昆士兰大学最新《自监督学习推荐系统》综述论文，阐述对比、生成、预测和混合四大类方法

自监督如何做推荐？昆士兰大学最新《自监督学习推荐系统》综述论文，阐述对比、生成、预测和混合四大类方法

专知会员服务

32+阅读 · 2022年4月5日

【YannLecun最新报告】自监督学习与能量模型，附99页ppt与视频

【YannLecun最新报告】自监督学习与能量模型，附99页ppt与视频

专知会员服务

56+阅读 · 2021年6月19日

GNN如何自监督学习？TAMU首篇《图神经网络自监督学习》综述论文，17页pdf

GNN如何自监督学习？TAMU首篇《图神经网络自监督学习》综述论文，17页pdf

专知会员服务

74+阅读 · 2021年2月28日

Google研究院提出FixMatch，简单粗暴却极其有效的半监督学习方法，附14页PDF下载

Google研究院提出FixMatch，简单粗暴却极其有效的半监督学习方法，附14页PDF下载

专知会员服务

54+阅读 · 2020年1月24日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

【AAAI2021】自监督对应学习的对比转换

【AAAI2021】自监督对应学习的对比转换

专知

12+阅读 · 2020年12月11日

对比自监督学习

对比自监督学习

深度学习自然语言处理

35+阅读 · 2020年7月15日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知

16+阅读 · 2020年5月29日

【自监督学习】OpenAI科学家一文详解自监督学习

【自监督学习】OpenAI科学家一文详解自监督学习

产业智能官

25+阅读 · 2020年3月18日

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

专知

133+阅读 · 2020年3月18日

解读自监督学习(Self-Supervised Learning)几篇相关paper

解读自监督学习(Self-Supervised Learning)几篇相关paper

CVer

25+阅读 · 2020年2月21日

【图灵奖得主Yann Lecun最新演讲】基于能量的自监督学习，68页ppt，了解后深度学习发展趋势

【图灵奖得主Yann Lecun最新演讲】基于能量的自监督学习，68页ppt，了解后深度学习发展趋势

专知

42+阅读 · 2019年11月25日

OpenAI科学家一文详解自监督学习

OpenAI科学家一文详解自监督学习

新智元

18+阅读 · 2019年11月20日

最新《深度神经网络自监督视觉特征学习综述》论文（附24页全文下载）

最新《深度神经网络自监督视觉特征学习综述》论文（附24页全文下载）

专知

36+阅读 · 2019年2月20日

相关论文

Supervised Graph Contrastive Learning for Gene Regulatory Networks

Arxiv

0+阅读 · 6月15日

Self-Supervised Learning as Discrete Communication

Arxiv

0+阅读 · 6月15日

Interpretable Self-Supervised Learning via Representer Landmarks and Nyström Approximation

Arxiv

0+阅读 · 6月8日

Leveraging Soft Distributions of SSL-Derived Discrete Speech Tokens for Downstream Inference

Arxiv

0+阅读 · 6月5日

Geometric Second-Order Feature Correlation Learning for Self-Supervised Speech Emotion Recognition

Arxiv

0+阅读 · 6月4日

Self-supervised local learning rules learn the hidden hierarchical structure of high-dimensional data

Arxiv

0+阅读 · 5月18日

A Refined Generalization Analysis for Extreme Multi-class Supervised Contrastive Representation Learning

Arxiv

0+阅读 · 5月11日

Rethinking Masking Strategies for Masked Prediction-based Audio Self-supervised Learning

Arxiv

0+阅读 · 3月25日

Towards Graph Contrastive Learning: A Survey and Beyond

Arxiv

10+阅读 · 2024年5月20日

Self-Supervised Learning for Time Series Analysis: Taxonomy, Progress, and Prospects

Arxiv

18+阅读 · 2023年6月16日

相关基金

面向移动互联网流量的行为特征和自适应分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

排序与半监督学习的误差分析

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

31+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

自检测型量子密钥分配研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

半监督进化文本聚类算法在动态多源文本分析上的研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员