Proper parameter configuration is a prerequisite for the success of Evolutionary Algorithms (EAs). While various adaptive strategies have been proposed, it remains an open question whether all control dimensions contribute equally to algorithmic scalability. To investigate this, we categorize control variables into numerical parameters (e.g., crossover and mutation rates) and structural parameters (e.g., population size and operator switching), hypothesizing that they play distinct roles. This paper presents an empirical study utilizing a dual-level Deep Reinforcement Learning (DRL) framework to decouple and analyze the impact of these two dimensions on the Traveling Salesman Problem (TSP). We employ a Recurrent PPO agent to dynamically regulate these parameters, treating the DRL model as a probe to reveal evolutionary dynamics. Experimental results confirm the effectiveness of this approach: the learned policies outperform static baselines, reducing the optimality gap by approximately 45% on the largest tested instance (rl5915). Building on this validated framework, our ablation analysis reveals a fundamental insight: while numerical tuning offers local refinement, structural plasticity is the decisive factor in preventing stagnation and facilitating escape from local optima. These findings suggest that future automated algorithm design should prioritize dynamic structural reconfiguration over fine-grained probability adjustment. To facilitate reproducibility, the source code is available at https://github.com/StarDream1314/DRLGA-TSP


翻译:合理的参数配置是进化算法(Evolutionary Algorithms, EAs)成功的前提。尽管已有多种自适应策略被提出,但所有控制维度是否对算法可扩展性具有同等贡献仍是一个开放问题。为探究此问题,我们将控制变量分为数值参数(如交叉率与变异率)和结构参数(如种群规模与算子切换),并提出假设:二者扮演不同角色。本文通过双层深度强化学习(Deep Reinforcement Learning, DRL)框架进行实证研究,以解耦并分析这两个维度对旅行商问题(Traveling Salesman Problem, TSP)的影响。我们采用循环PPO智能体动态调节这些参数,将DRL模型作为探针揭示进化动态。实验结果验证了该方法有效性:学习得到的策略优于静态基线,在最大测试实例(rl5915)上将最优性差距降低约45%。基于这一经过验证的框架,我们的消融分析揭示了一个根本性发现:数值调优仅提供局部改进,而结构可塑性则是防止早熟停滞、促进逃离局部最优的关键因素。这些结果表明,未来自动化算法设计应优先考虑动态结构重构而非细粒度概率调整。为促进可重复性,源代码已发布于 https://github.com/StarDream1314/DRLGA-TSP

0
下载
关闭预览

相关内容

《机器学习超参数优化》最新综述
专知会员服务
39+阅读 · 2024年10月31日
专知会员服务
41+阅读 · 2021年3月3日
专知会员服务
139+阅读 · 2021年1月13日
综述:军事应用中使用的一些重要算法
专知
13+阅读 · 2022年7月3日
基于深度学习的数据融合方法研究综述
专知
37+阅读 · 2020年12月10日
深度学习网络调参技巧
AINLP
15+阅读 · 2019年11月15日
深度学习超参数搜索实用指南
云栖社区
28+阅读 · 2018年10月14日
简述多种降维算法
算法与数学之美
11+阅读 · 2018年9月23日
从浅层模型到深度模型:概览机器学习优化算法
机器之心
27+阅读 · 2017年7月9日
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
2+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
3+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
3+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关VIP内容
相关基金
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员