Iterated Population Based Training with Task-Agnostic Restarts - 专知论文

会员服务 ·

0

超参数 · PBT · 参数优化 · 超参数优化 · 算法 ·

Iterated Population Based Training with Task-Agnostic Restarts

翻译：基于迭代式人口训练与任务无关重启的超参数优化

Alexander Chebykin,Tanja Alderliesten,Peter A. N. Bosman

Hyperparameter Optimization (HPO) can lift the burden of tuning hyperparameters (HPs) of neural networks. HPO algorithms from the Population Based Training (PBT) family are efficient thanks to dynamically adjusting HPs every few steps of the weight optimization. Recent results indicate that the number of steps between HP updates is an important meta-HP of all PBT variants that can substantially affect their performance. Yet, no method or intuition is available for efficiently setting its value. We introduce Iterated Population Based Training (IPBT), a novel PBT variant that automatically adjusts this HP via restarts that reuse weight information in a task-agnostic way and leverage time-varying Bayesian optimization to reinitialize HPs. Evaluation on 8 image classification and reinforcement learning tasks shows that, on average, our algorithm matches or outperforms 5 previous PBT variants and other HPO algorithms (random search, ASHA, SMAC3), without requiring a budget increase or any changes to its HPs. The source code is available at https://github.com/AwesomeLemon/IPBT.

翻译：超参数优化方法能够减轻神经网络超参数调优的负担。基于人口训练（PBT）家族的优化算法通过在权重优化过程中每隔若干步动态调整超参数，展现出高效性。最新研究表明，超参数更新间隔步数是所有PBT变体的关键元超参数，其取值会显著影响算法性能。然而，目前缺乏有效设置该参数值的系统方法或直觉依据。本文提出迭代式人口训练（IPBT）这一新型PBT变体，通过任务无关方式复用权重信息进行重启，并利用时变贝叶斯优化重新初始化超参数，从而自动调整该超参数。在8项图像分类与强化学习任务上的评估表明：在不增加计算预算且无需修改算法超参数的前提下，本方法平均性能持平或超越5种既有PBT变体及其他超参数优化算法（随机搜索、ASHA、SMAC3）。源代码已开源至https://github.com/AwesomeLemon/IPBT。

0

相关内容

超参数

在贝叶斯统计中，超参数是先验分布的参数；该术语用于将它们与所分析的基础系统的模型参数区分开。

《机器学习超参数优化》最新综述

《机器学习超参数优化》最新综述

专知会员服务

39+阅读 · 2024年10月31日

【普林斯顿博士论文】深度学习优化的隐性偏差：数学考察，391页pdf

【普林斯顿博士论文】深度学习优化的隐性偏差：数学考察，391页pdf

专知会员服务

29+阅读 · 2024年10月4日

参数高效微调方法有哪些？岭大等最新《预训练语言模型的参数高效微调》综述，

参数高效微调方法有哪些？岭大等最新《预训练语言模型的参数高效微调》综述，

专知会员服务

70+阅读 · 2023年12月21日

【MIT博士论文】机器学习基础：超参数化与特征学习，170页pdf

【MIT博士论文】机器学习基础：超参数化与特征学习，170页pdf

专知会员服务

41+阅读 · 2023年8月8日

用Transformer学习通用超参数优化器，DeepMind Yutian Chen博士讲授，附Slides与视频

用Transformer学习通用超参数优化器，DeepMind Yutian Chen博士讲授，附Slides与视频

专知会员服务

40+阅读 · 2023年3月12日

【CVPR 2022】AME：超参数优化中的注意力和记忆增强，AME: Attention and Memory Enhancement in Hyper-Parameter Optimization

【CVPR 2022】AME：超参数优化中的注意力和记忆增强，AME: Attention and Memory Enhancement in Hyper-Parameter Optimization

专知会员服务

11+阅读 · 2022年3月19日

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

专知会员服务

26+阅读 · 2022年3月15日

【2021新书】机器学习超参数优化，177页pdf

【2021新书】机器学习超参数优化，177页pdf

专知会员服务

163+阅读 · 2021年5月18日

2020新书《机器学习中的超参数优化》，177页pdf阐述如何使您的机器学习和深度学习模型更有效

2020新书《机器学习中的超参数优化》，177页pdf阐述如何使您的机器学习和深度学习模型更有效

专知会员服务

158+阅读 · 2020年11月30日

【Google-普林斯顿】从学习速率中解开自适应梯度法，Disentangling Adaptive Gradient

专知会员服务

19+阅读 · 2020年3月5日

使用 Keras Tuner 调节超参数

使用 Keras Tuner 调节超参数

TensorFlow

15+阅读 · 2020年2月6日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

让半监督学习再次伟大！谷歌最新无监督数据增强研究，全面超越现有半监督学习方法

让半监督学习再次伟大！谷歌最新无监督数据增强研究，全面超越现有半监督学习方法

新智元

20+阅读 · 2019年7月11日

深度学习超参数搜索实用指南

深度学习超参数搜索实用指南

云栖社区

28+阅读 · 2018年10月14日

简述多种降维算法

简述多种降维算法

算法与数学之美

11+阅读 · 2018年9月23日

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

AI100

11+阅读 · 2018年9月4日

【人工智能】神经网络常用优化算法概览、一文了解迁移学习经典算法

【人工智能】神经网络常用优化算法概览、一文了解迁移学习经典算法

产业智能官

13+阅读 · 2018年8月18日

什么是学习率，以及它是如何影响深度学习的

什么是学习率，以及它是如何影响深度学习的

论智

85+阅读 · 2018年2月3日

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

专知

12+阅读 · 2018年1月12日

如何找到最优学习率？

如何找到最优学习率？

AI研习社

11+阅读 · 2017年11月29日

删失数据超高维共线性模型的变量选择

国家自然科学基金

0+阅读 · 2017年12月31日

基于参数和结构优化的置信规则库推理方法研究

国家自然科学基金

5+阅读 · 2015年12月31日

人类转录因子基因家族调控网络进化模式研究

国家自然科学基金

0+阅读 · 2015年12月31日

大规模参数估计的约束无导数优化信赖域方法

国家自然科学基金

1+阅读 · 2015年12月31日

基于Memetic多目标时变优化的全基因代谢网络重构算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于适应度值的信息反馈型群智能算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向动态优化问题的参数自适应及变结构生物地理学优化算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于神经网络的无约束0-1二次规划全局最优算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

实时排队控制下超市网络的非线性马氏过程与超指数结构

国家自然科学基金

0+阅读 · 2014年12月31日

Scale-Invariant Neural Network Optimization: Norm Geometry and Heavy-Tailed Noise

Arxiv

0+阅读 · 6月15日

Taming Curvature: Architecture Warm-Up for Stable Transformer Training

Arxiv

0+阅读 · 6月15日

Small Data, Big Noise: Adversarial Training for Robust Parameter-Efficient Fine-Tuning

Arxiv

0+阅读 · 6月9日

Twin: Tuning Learning Rate and Weight Decay of Deep Homogeneous Classifiers without Validation

Arxiv

0+阅读 · 6月5日

Pretraining Recurrent Networks without Recurrence

Arxiv

0+阅读 · 6月4日

Mildly Overparameterized ReLU Networks on Orthogonal Data: Incremental Learning and Implicit Bias

Arxiv

0+阅读 · 5月26日

Convergence rates for gradient descent in the training of overparameterized artificial neural networks with piecewise affine activation

Arxiv

0+阅读 · 5月19日

Training Neural Networks with Optimal Double-Bayesian Learning

Arxiv

0+阅读 · 5月19日

Gradient-Free Training of Spiking Neural Networks via Low-Rank Evolution Strategies

Arxiv

0+阅读 · 5月14日

Globally Optimal Training of Spiking Neural Networks via Parameter Reconstruction

Arxiv

0+阅读 · 5月8日

VIP会员

文章信息

相关主题

超参数优化

最新内容

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

5+阅读 · 今天8:00

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

3+阅读 · 今天7:44

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

3+阅读 · 今天7:28

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

4+阅读 · 今天7:18

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

5+阅读 · 今天7:07

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

4+阅读 · 今天7:03

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

4+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

5+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

10+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

4+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

5+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

8+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

7+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

4+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

相关VIP内容

《机器学习超参数优化》最新综述

《机器学习超参数优化》最新综述

专知会员服务

39+阅读 · 2024年10月31日

【普林斯顿博士论文】深度学习优化的隐性偏差：数学考察，391页pdf

【普林斯顿博士论文】深度学习优化的隐性偏差：数学考察，391页pdf

专知会员服务

29+阅读 · 2024年10月4日

参数高效微调方法有哪些？岭大等最新《预训练语言模型的参数高效微调》综述，

参数高效微调方法有哪些？岭大等最新《预训练语言模型的参数高效微调》综述，

专知会员服务

70+阅读 · 2023年12月21日

【MIT博士论文】机器学习基础：超参数化与特征学习，170页pdf

【MIT博士论文】机器学习基础：超参数化与特征学习，170页pdf

专知会员服务

41+阅读 · 2023年8月8日

用Transformer学习通用超参数优化器，DeepMind Yutian Chen博士讲授，附Slides与视频

用Transformer学习通用超参数优化器，DeepMind Yutian Chen博士讲授，附Slides与视频

专知会员服务

40+阅读 · 2023年3月12日

【CVPR 2022】AME：超参数优化中的注意力和记忆增强，AME: Attention and Memory Enhancement in Hyper-Parameter Optimization

【CVPR 2022】AME：超参数优化中的注意力和记忆增强，AME: Attention and Memory Enhancement in Hyper-Parameter Optimization

专知会员服务

11+阅读 · 2022年3月19日

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

专知会员服务

26+阅读 · 2022年3月15日

【2021新书】机器学习超参数优化，177页pdf

【2021新书】机器学习超参数优化，177页pdf

专知会员服务

163+阅读 · 2021年5月18日

2020新书《机器学习中的超参数优化》，177页pdf阐述如何使您的机器学习和深度学习模型更有效

2020新书《机器学习中的超参数优化》，177页pdf阐述如何使您的机器学习和深度学习模型更有效

专知会员服务

158+阅读 · 2020年11月30日

【Google-普林斯顿】从学习速率中解开自适应梯度法，Disentangling Adaptive Gradient

专知会员服务

19+阅读 · 2020年3月5日

热门VIP内容

开通专知VIP会员享更多权益服务

重新思考无人机时代的生存能力

在人工智能加速决策环境中拓展OODA循环

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

装甲突击旅：现代战争思考、战斗与组织

相关资讯

使用 Keras Tuner 调节超参数

使用 Keras Tuner 调节超参数

TensorFlow

15+阅读 · 2020年2月6日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

让半监督学习再次伟大！谷歌最新无监督数据增强研究，全面超越现有半监督学习方法

让半监督学习再次伟大！谷歌最新无监督数据增强研究，全面超越现有半监督学习方法

新智元

20+阅读 · 2019年7月11日

深度学习超参数搜索实用指南

深度学习超参数搜索实用指南

云栖社区

28+阅读 · 2018年10月14日

简述多种降维算法

简述多种降维算法

算法与数学之美

11+阅读 · 2018年9月23日

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

AI100

11+阅读 · 2018年9月4日

【人工智能】神经网络常用优化算法概览、一文了解迁移学习经典算法

【人工智能】神经网络常用优化算法概览、一文了解迁移学习经典算法

产业智能官

13+阅读 · 2018年8月18日

什么是学习率，以及它是如何影响深度学习的

什么是学习率，以及它是如何影响深度学习的

论智

85+阅读 · 2018年2月3日

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

专知

12+阅读 · 2018年1月12日

如何找到最优学习率？

如何找到最优学习率？

AI研习社

11+阅读 · 2017年11月29日

相关论文

Scale-Invariant Neural Network Optimization: Norm Geometry and Heavy-Tailed Noise

Arxiv

0+阅读 · 6月15日

Taming Curvature: Architecture Warm-Up for Stable Transformer Training

Arxiv

0+阅读 · 6月15日

Small Data, Big Noise: Adversarial Training for Robust Parameter-Efficient Fine-Tuning

Arxiv

0+阅读 · 6月9日

Twin: Tuning Learning Rate and Weight Decay of Deep Homogeneous Classifiers without Validation

Arxiv

0+阅读 · 6月5日

Pretraining Recurrent Networks without Recurrence

Arxiv

0+阅读 · 6月4日

Mildly Overparameterized ReLU Networks on Orthogonal Data: Incremental Learning and Implicit Bias

Arxiv

0+阅读 · 5月26日

Convergence rates for gradient descent in the training of overparameterized artificial neural networks with piecewise affine activation

Arxiv

0+阅读 · 5月19日

Training Neural Networks with Optimal Double-Bayesian Learning

Arxiv

0+阅读 · 5月19日

Gradient-Free Training of Spiking Neural Networks via Low-Rank Evolution Strategies

Arxiv

0+阅读 · 5月14日

Globally Optimal Training of Spiking Neural Networks via Parameter Reconstruction

Arxiv

0+阅读 · 5月8日

相关基金

删失数据超高维共线性模型的变量选择

国家自然科学基金

0+阅读 · 2017年12月31日

基于参数和结构优化的置信规则库推理方法研究

国家自然科学基金

5+阅读 · 2015年12月31日

人类转录因子基因家族调控网络进化模式研究

国家自然科学基金

0+阅读 · 2015年12月31日

大规模参数估计的约束无导数优化信赖域方法

国家自然科学基金

1+阅读 · 2015年12月31日

基于Memetic多目标时变优化的全基因代谢网络重构算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于适应度值的信息反馈型群智能算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向动态优化问题的参数自适应及变结构生物地理学优化算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于神经网络的无约束0-1二次规划全局最优算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

实时排队控制下超市网络的非线性马氏过程与超指数结构

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员