Asymptotic and Finite-Time Guarantees for Langevin-Based Temperature Annealing in InfoNCE - 专知论文

会员服务 ·

0

退火 · 调度 · 有限时间 · 模拟退火 · 对比学习 ·

Asymptotic and Finite-Time Guarantees for Langevin-Based Temperature Annealing in InfoNCE

翻译：基于 Langevin 的温度退火在 InfoNCE 中的渐近与有限时间保证

from arxiv, Accepted at the Optimization for Machine Learning Workshop (NeurIPS 2025)

The InfoNCE loss in contrastive learning depends critically on a temperature parameter, yet its dynamics under fixed versus annealed schedules remain poorly understood. We provide a theoretical analysis by modeling embedding evolution under Langevin dynamics on a compact Riemannian manifold. Under mild smoothness and energy-barrier assumptions, we show that classical simulated annealing guarantees extend to this setting: slow logarithmic inverse-temperature schedules ensure convergence in probability to a set of globally optimal representations, while faster schedules risk becoming trapped in suboptimal minima. Our results establish a link between contrastive learning and simulated annealing, providing a principled basis for understanding and tuning temperature schedules.

翻译：对比学习中的 InfoNCE 损失函数严重依赖于温度参数，然而其在固定与退火调度下的动力学行为仍未得到充分理解。我们通过在紧致黎曼流形上对 Langevin 动力学下的嵌入演化进行建模，提供了理论分析。在温和的光滑性和能量势垒假设下，我们证明了经典的模拟退火保证可推广至此场景：缓慢的对数反温度调度确保了以概率收敛到一组全局最优表示，而更快的调度则可能陷入次优极小值。我们的结果建立了对比学习与模拟退火之间的联系，为理解和调整温度调度提供了理论基础。

0

相关内容

【普林斯顿博士论文】理解神经网络的训练动态：局部优化轨迹与特征学习视角

【普林斯顿博士论文】理解神经网络的训练动态：局部优化轨迹与特征学习视角

专知会员服务

22+阅读 · 2025年7月17日

中文版《通过自动化和协调推进零信任成熟度》美国国家安全局最新报告

中文版《通过自动化和协调推进零信任成熟度》美国国家安全局最新报告

专知会员服务

28+阅读 · 2024年7月29日

【牛津大学博士论文】深度学习算法的渐近分析，186页pdf

【牛津大学博士论文】深度学习算法的渐近分析，186页pdf

专知会员服务

29+阅读 · 2024年6月27日

【CMU博士论文】稳定模型与时间差分学习，97页pdf

【CMU博士论文】稳定模型与时间差分学习，97页pdf

专知会员服务

24+阅读 · 2023年6月17日

阿姆斯特丹大学博士论文《深度表示中的不变性》，96和pdf

阿姆斯特丹大学博士论文《深度表示中的不变性》，96和pdf

专知会员服务

38+阅读 · 2022年11月3日

最新「无监督网络表示学习」综述论文，12页pdf概述九种典型网络嵌入表示方法优劣

最新「无监督网络表示学习」综述论文，12页pdf概述九种典型网络嵌入表示方法优劣

专知会员服务

35+阅读 · 2021年4月10日

【纽约大学Sean】神经文本退化:一致性和学习，93页ppt

【纽约大学Sean】神经文本退化:一致性和学习，93页ppt

专知会员服务

16+阅读 · 2020年10月18日

【ICML2020-伯克利】稳定非策略强化学习的表示，Representations for Stable Off-Policy Reinforcement Learning

【ICML2020-伯克利】稳定非策略强化学习的表示，Representations for Stable Off-Policy Reinforcement Learning

专知会员服务

17+阅读 · 2020年7月14日

【ICML2020投稿论文-DeepMind】时序差分学习的推理与泛化，Temporal Difference Learning

专知会员服务

26+阅读 · 2020年3月16日

【Nature论文】深度网络中的梯度下降复杂度控制

【Nature论文】深度网络中的梯度下降复杂度控制

专知会员服务

41+阅读 · 2020年3月9日

Keras新增TextVectorization层，可直接将文本字符串作为模型输入

Keras新增TextVectorization层，可直接将文本字符串作为模型输入

专知

19+阅读 · 2019年11月22日

荐文 | 时序预测中的深度学习：以电力负载预测为例

荐文 | 时序预测中的深度学习：以电力负载预测为例

德先生

32+阅读 · 2019年9月18日

ACL 2019论文分享：ARNOR增强模型注意力，降低远监督学习中的噪声

ACL 2019论文分享：ARNOR增强模型注意力，降低远监督学习中的噪声

AINLP

53+阅读 · 2019年8月15日

你的TextGAN调出来了么？来看看人在怎么调的

你的TextGAN调出来了么？来看看人在怎么调的

专知

85+阅读 · 2019年6月6日

【干货】GAN最新进展：8大技巧提高稳定性

【干货】GAN最新进展：8大技巧提高稳定性

GAN生成式对抗网络

31+阅读 · 2019年2月12日

ESRGAN：基于GAN的增强超分辨率方法（附代码解析）

ESRGAN：基于GAN的增强超分辨率方法（附代码解析）

PaperWeekly

18+阅读 · 2019年1月18日

换个角度看GAN：另一种损失函数

换个角度看GAN：另一种损失函数

机器之心

16+阅读 · 2019年1月1日

【SIGIR2018】 IRGAN Tutorial：上交张伟楠老师-GAN在信息检索的应用【附下载】

【SIGIR2018】 IRGAN Tutorial：上交张伟楠老师-GAN在信息检索的应用【附下载】

专知

12+阅读 · 2018年7月7日

网络表示学习领域（NRL/NE）必读论文汇总

网络表示学习领域（NRL/NE）必读论文汇总

AI科技评论

16+阅读 · 2018年2月18日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

基于全寿命周期退化信息的高速列车轮对轴承剩余寿命预测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

顾及混合像元的遥感地表温度时空变分融合方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

从互信息角度研究分子/纳米机器中基于信息传递的热功变换机制

国家自然科学基金

1+阅读 · 2015年12月31日

基于Xampling的Gabor框架条件下的窄脉冲信号采集方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

混沌时间序列Volterra建模及其在语音信号处理中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

可信工业控制系统中信任冷启动方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于迹距离的有限温度下的量子相变理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

完全可压Navier-Stokes方程流入问题强粘性接触间断波的渐近稳定性

国家自然科学基金

0+阅读 · 2014年12月31日

关于 Finsler 流形上调和映射与 Laplacian 的若干问题研究

国家自然科学基金

1+阅读 · 2014年12月31日

AlGaN/GaN MIS-HEMT器件在质子辐射下的退化机理，寿命预测模型与加固技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

Annealed Langevin Monte Carlo for Flow ODE Sampling

Arxiv

0+阅读 · 4月30日

Time-Scale Coupling Between States and Parameters in Recurrent Neural Networks

Arxiv

0+阅读 · 4月21日

Weighted Unequal Error Protection over a Rayleigh Fading Channel

Arxiv

0+阅读 · 4月8日

Adaptive Encoding Strategy for Quantum Annealing in Mixed-Variable Engineering Optimization

Arxiv

0+阅读 · 3月18日

Population Annealing as a Discrete-Time Schrödinger Bridge

Arxiv

0+阅读 · 3月17日

Constrained Dikin-Langevin diffusion for polyhedra

Arxiv

0+阅读 · 3月15日

MM-TS: Multi-Modal Temperature and Margin Schedules for Contrastive Learning with Long-Tail Data

Arxiv

0+阅读 · 3月9日

Navigating with Annealing Guidance Scale in Diffusion Space

Arxiv

0+阅读 · 3月3日

Weighted Unequal Error Protection over a Rayleigh Fading Channel

Arxiv

0+阅读 · 2月27日

Stopping Rules for Stochastic Gradient Descent via Anytime-Valid Confidence Sequences

Arxiv

0+阅读 · 2月20日

VIP会员

文章信息

相关主题

最新内容

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

0+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

0+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

3+阅读 · 5月30日

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

3+阅读 · 5月30日

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

7+阅读 · 5月30日

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

4+阅读 · 5月30日

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

5+阅读 · 5月30日

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

5+阅读 · 5月30日

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

10+阅读 · 5月29日

AutoScientists：自组织智能体团队驱动长期科学实验

AutoScientists：自组织智能体团队驱动长期科学实验

专知会员服务

5+阅读 · 5月29日

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

专知会员服务

5+阅读 · 5月29日

战略前沿人工智能的再思考（中文）

战略前沿人工智能的再思考（中文）

专知会员服务

7+阅读 · 5月29日

《量化地基防空系统间接效应的博弈论方法》

《量化地基防空系统间接效应的博弈论方法》

专知会员服务

5+阅读 · 5月29日

传感器网络：美国如何探测来自伊朗的导弹与无人机

传感器网络：美国如何探测来自伊朗的导弹与无人机

专知会员服务

6+阅读 · 5月29日

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

专知会员服务

8+阅读 · 5月29日

相关VIP内容

【普林斯顿博士论文】理解神经网络的训练动态：局部优化轨迹与特征学习视角

【普林斯顿博士论文】理解神经网络的训练动态：局部优化轨迹与特征学习视角

专知会员服务

22+阅读 · 2025年7月17日

中文版《通过自动化和协调推进零信任成熟度》美国国家安全局最新报告

中文版《通过自动化和协调推进零信任成熟度》美国国家安全局最新报告

专知会员服务

28+阅读 · 2024年7月29日

【牛津大学博士论文】深度学习算法的渐近分析，186页pdf

【牛津大学博士论文】深度学习算法的渐近分析，186页pdf

专知会员服务

29+阅读 · 2024年6月27日

【CMU博士论文】稳定模型与时间差分学习，97页pdf

【CMU博士论文】稳定模型与时间差分学习，97页pdf

专知会员服务

24+阅读 · 2023年6月17日

阿姆斯特丹大学博士论文《深度表示中的不变性》，96和pdf

阿姆斯特丹大学博士论文《深度表示中的不变性》，96和pdf

专知会员服务

38+阅读 · 2022年11月3日

最新「无监督网络表示学习」综述论文，12页pdf概述九种典型网络嵌入表示方法优劣

最新「无监督网络表示学习」综述论文，12页pdf概述九种典型网络嵌入表示方法优劣

专知会员服务

35+阅读 · 2021年4月10日

【纽约大学Sean】神经文本退化:一致性和学习，93页ppt

【纽约大学Sean】神经文本退化:一致性和学习，93页ppt

专知会员服务

16+阅读 · 2020年10月18日

【ICML2020-伯克利】稳定非策略强化学习的表示，Representations for Stable Off-Policy Reinforcement Learning

【ICML2020-伯克利】稳定非策略强化学习的表示，Representations for Stable Off-Policy Reinforcement Learning

专知会员服务

17+阅读 · 2020年7月14日

【ICML2020投稿论文-DeepMind】时序差分学习的推理与泛化，Temporal Difference Learning

专知会员服务

26+阅读 · 2020年3月16日

【Nature论文】深度网络中的梯度下降复杂度控制

【Nature论文】深度网络中的梯度下降复杂度控制

专知会员服务

41+阅读 · 2020年3月9日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

美以伊战争：首次人工智能战争——军事自主性困境

BES：让语言模型通过双向进化搜索自我改进

以色列-美国-伊朗战争中的无人机：关键要点

相关资讯

Keras新增TextVectorization层，可直接将文本字符串作为模型输入

Keras新增TextVectorization层，可直接将文本字符串作为模型输入

专知

19+阅读 · 2019年11月22日

荐文 | 时序预测中的深度学习：以电力负载预测为例

荐文 | 时序预测中的深度学习：以电力负载预测为例

德先生

32+阅读 · 2019年9月18日

ACL 2019论文分享：ARNOR增强模型注意力，降低远监督学习中的噪声

ACL 2019论文分享：ARNOR增强模型注意力，降低远监督学习中的噪声

AINLP

53+阅读 · 2019年8月15日

你的TextGAN调出来了么？来看看人在怎么调的

你的TextGAN调出来了么？来看看人在怎么调的

专知

85+阅读 · 2019年6月6日

【干货】GAN最新进展：8大技巧提高稳定性

【干货】GAN最新进展：8大技巧提高稳定性

GAN生成式对抗网络

31+阅读 · 2019年2月12日

ESRGAN：基于GAN的增强超分辨率方法（附代码解析）

ESRGAN：基于GAN的增强超分辨率方法（附代码解析）

PaperWeekly

18+阅读 · 2019年1月18日

换个角度看GAN：另一种损失函数

换个角度看GAN：另一种损失函数

机器之心

16+阅读 · 2019年1月1日

【SIGIR2018】 IRGAN Tutorial：上交张伟楠老师-GAN在信息检索的应用【附下载】

【SIGIR2018】 IRGAN Tutorial：上交张伟楠老师-GAN在信息检索的应用【附下载】

专知

12+阅读 · 2018年7月7日

网络表示学习领域（NRL/NE）必读论文汇总

网络表示学习领域（NRL/NE）必读论文汇总

AI科技评论

16+阅读 · 2018年2月18日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

相关论文

Annealed Langevin Monte Carlo for Flow ODE Sampling

Arxiv

0+阅读 · 4月30日

Time-Scale Coupling Between States and Parameters in Recurrent Neural Networks

Arxiv

0+阅读 · 4月21日

Weighted Unequal Error Protection over a Rayleigh Fading Channel

Arxiv

0+阅读 · 4月8日

Adaptive Encoding Strategy for Quantum Annealing in Mixed-Variable Engineering Optimization

Arxiv

0+阅读 · 3月18日

Population Annealing as a Discrete-Time Schrödinger Bridge

Arxiv

0+阅读 · 3月17日

Constrained Dikin-Langevin diffusion for polyhedra

Arxiv

0+阅读 · 3月15日

MM-TS: Multi-Modal Temperature and Margin Schedules for Contrastive Learning with Long-Tail Data

Arxiv

0+阅读 · 3月9日

Navigating with Annealing Guidance Scale in Diffusion Space

Arxiv

0+阅读 · 3月3日

Weighted Unequal Error Protection over a Rayleigh Fading Channel

Arxiv

0+阅读 · 2月27日

Stopping Rules for Stochastic Gradient Descent via Anytime-Valid Confidence Sequences

Arxiv

0+阅读 · 2月20日

相关基金

基于全寿命周期退化信息的高速列车轮对轴承剩余寿命预测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

顾及混合像元的遥感地表温度时空变分融合方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

从互信息角度研究分子/纳米机器中基于信息传递的热功变换机制

国家自然科学基金

1+阅读 · 2015年12月31日

基于Xampling的Gabor框架条件下的窄脉冲信号采集方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

混沌时间序列Volterra建模及其在语音信号处理中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

可信工业控制系统中信任冷启动方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于迹距离的有限温度下的量子相变理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

完全可压Navier-Stokes方程流入问题强粘性接触间断波的渐近稳定性

国家自然科学基金

0+阅读 · 2014年12月31日

关于 Finsler 流形上调和映射与 Laplacian 的若干问题研究

国家自然科学基金

1+阅读 · 2014年12月31日

AlGaN/GaN MIS-HEMT器件在质子辐射下的退化机理，寿命预测模型与加固技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员