This paper proposes a policy-based deep reinforcement learning hyper-heuristic framework for solving the Job Shop Scheduling Problem. The hyper-heuristic agent learns to switch scheduling rules based on the system state dynamically. We extend the hyper-heuristic framework with two key mechanisms. First, action prefiltering restricts decision-making to feasible low-level actions, enabling low-level heuristics to be evaluated independently of environmental constraints and providing an unbiased assessment. Second, a commitment mechanism regulates the frequency of heuristic switching. We investigate the impact of different commitment strategies, from step-wise switching to full-episode commitment, on both training behavior and makespan. Additionally, we compare two action selection strategies at the policy level: deterministic greedy selection and stochastic sampling. Computational experiments on standard JSSP benchmarks demonstrate that the proposed approach outperforms traditional heuristics, metaheuristics, and recent neural network-based scheduling methods


翻译:本文提出一种基于策略的深度强化学习超启发式框架,用于求解作业车间调度问题。该超启发式智能体能够根据系统状态动态切换调度规则。我们通过两个关键机制扩展了该超启发式框架:首先,动作预过滤机制将决策限制在可行的底层动作空间内,使得底层启发式算法能够独立于环境约束进行评估,从而提供无偏估计;其次,承诺机制通过调节启发式规则切换频率来优化决策过程。我们系统研究了从逐步切换到全周期承诺等不同承诺策略对训练行为和完工时间的影响。此外,我们在策略层面比较了两种动作选择策略:确定性贪婪选择与随机采样策略。在标准JSSP基准测试集上的计算实验表明,所提方法在性能上优于传统启发式算法、元启发式算法以及近期基于神经网络的调度方法。

0
下载
关闭预览

相关内容

深度强化学习与模仿学习导论
专知会员服务
25+阅读 · 2025年12月10日
《基于深度强化学习的战场策略》
专知会员服务
37+阅读 · 2025年1月13日
基于内在动机的深度强化学习探索方法综述
专知会员服务
40+阅读 · 2023年5月13日
基于深度强化学习的对手建模方法研究综述
专知会员服务
83+阅读 · 2023年4月17日
基于课程学习的深度强化学习研究综述
专知会员服务
58+阅读 · 2022年11月28日
结合进化算法的深度强化学习方法研究综述
专知会员服务
81+阅读 · 2022年7月16日
基于深度强化学习的作战辅助决策研究
专知会员服务
172+阅读 · 2022年6月8日
专知会员服务
139+阅读 · 2021年1月13日
探索(Exploration)还是利用(Exploitation)?强化学习如何tradeoff?
深度强化学习实验室
13+阅读 · 2020年8月23日
深度学习超参数搜索实用指南
云栖社区
28+阅读 · 2018年10月14日
深度学习时代的目标检测算法
炼数成金订阅号
40+阅读 · 2018年3月19日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
VIP会员
相关VIP内容
深度强化学习与模仿学习导论
专知会员服务
25+阅读 · 2025年12月10日
《基于深度强化学习的战场策略》
专知会员服务
37+阅读 · 2025年1月13日
基于内在动机的深度强化学习探索方法综述
专知会员服务
40+阅读 · 2023年5月13日
基于深度强化学习的对手建模方法研究综述
专知会员服务
83+阅读 · 2023年4月17日
基于课程学习的深度强化学习研究综述
专知会员服务
58+阅读 · 2022年11月28日
结合进化算法的深度强化学习方法研究综述
专知会员服务
81+阅读 · 2022年7月16日
基于深度强化学习的作战辅助决策研究
专知会员服务
172+阅读 · 2022年6月8日
专知会员服务
139+阅读 · 2021年1月13日
相关基金
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员