Efficiently solving the Job Shop Scheduling Problem in real-world industrial applications requires policies that are both computationally lean and topologically robust. While Reinforcement Learning has shown potential in automating dispatching rules, existing models often struggle with a scalability bottleneck caused by quadratic graph complexity or the architectural overhead of heterogeneous layers. We introduce a unified graph framework that employs feature-based homogenization to project distinct node roles into a shared latent space. This allows a standard homogeneous Graph Isomorphism Network to capture complex resource contention with linear complexity, ensuring low-latency inference for large-scale industrial applications. Our empirical results demonstrate that our framework achieves state-of-the-art performance while exhibiting consistent zero-shot generalization. We identify the job-to-machine ratio as the primary driver of policy effectiveness, rather than absolute problem size. Based on this, we propose a hypothesis of structural saturation, demonstrating that policies trained on critically congested instances ($\mathcal{J} \approx \mathcal{M}$) learn scale-invariant resolution strategies. Agents trained at this saturation point internalize invariant conflict-resolution logic, allowing them to treat massive rectangular instances as a sequential concatenation of saturated sub-problems. This approach eliminates the need for expensive scale-specific retraining and prevents overfitting to statistical shortcuts, providing a robust and efficient pathway for deploying RL solutions in dynamic production environments.


翻译:高效解决实际工业应用中的作业车间调度问题,需要兼具计算精简性与拓扑鲁棒性的策略。尽管强化学习在自动化调度规则方面展现出潜力,但现有模型常受限于二次图复杂度或异构层架构开销造成的可扩展性瓶颈。我们提出一种统一图框架,通过基于特征的均质化方法将不同节点角色映射至共享潜在空间。这使得标准同构图同构网络能以线性复杂度捕捉复杂的资源竞争关系,确保大规模工业应用中的低延迟推理。实验结果表明,我们的框架在实现最先进性能的同时,展现出一致的零样本泛化能力。我们提出作业与机器比例是影响策略有效性的核心要素,而非问题的绝对规模。基于此,我们构建结构饱和假说,证明在临界拥挤实例($\mathcal{J} \approx \mathcal{M}$)上训练的策略能学习尺度不变的分辨策略。在此饱和点训练的智能体内化冲突解决逻辑的不变性,可将大规模矩形实例视为饱和子问题的顺序拼接。该方法无需昂贵的规模特定重训练,并避免对统计捷径的过拟合,为动态生产环境中部署强化学习解决方案提供了稳健高效的路径。

0
下载
关闭预览

相关内容

【博士论文】利用图结构加速稀疏计算
专知会员服务
18+阅读 · 2025年3月6日
《图强化学习在组合优化中的应用》综述
专知会员服务
60+阅读 · 2024年4月10日
【KAUST博士论文】朝向可扩展的深度3D感知与生成,109页pdf
图机器学习峰会 | 复杂图的研究与应用探索
图与推荐
10+阅读 · 2022年6月23日
用 LDA 和 LSA 两种方法来降维和做 Topic 建模
AI研习社
13+阅读 · 2018年8月24日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
4+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员