检测与行动：基于元黑盒优化的自动化动态优化器 (Detect and Act: Automated Dynamic Optimizer through Meta-Black-Box Optimization) - 专知论文

会员服务 ·

0

动态优化 · 自动化 · 黑盒 · 自适应 · 黑盒优化 ·

Detect and Act: Automated Dynamic Optimizer through Meta-Black-Box Optimization

翻译：检测与行动：基于元黑盒优化的自动化动态优化器

Zijian Gao,Yuanting Zhong,Zeyuan Ma,Yue-Jiao Gong,Hongshu Guo

Dynamic Optimization Problems (DOPs) are challenging to address due to their complex nature, i.e., dynamic environment variation. Evolutionary Computation methods are generally advantaged in solving DOPs since they resemble dynamic biological evolution. However, existing evolutionary dynamic optimization methods rely heavily on human-crafted adaptive strategy to detect environment variation in DOPs, and then adapt the searching strategy accordingly. These hand-crafted strategies may perform ineffectively at out-of-box scenarios. In this paper, we propose a reinforcement learning-assisted approach to enable automated variation detection and self-adaption in evolutionary algorithms. This is achieved by borrowing the bi-level learning-to-optimize idea from recent Meta-Black-Box Optimization works. We use a deep Q-network as optimization dynamics detector and searching strategy adapter: It is fed as input with current-step optimization state and then dictates desired control parameters to underlying evolutionary algorithms for next-step optimization. The learning objective is to maximize the expected performance gain across a problem distribution. Once trained, our approach could generalize toward unseen DOPs with automated environment variation detection and self-adaption. To facilitate comprehensive validation, we further construct an easy-to-difficult DOPs testbed with diverse synthetic instances. Extensive benchmark results demonstrate flexible searching behavior and superior performance of our approach in solving DOPs, compared to state-of-the-art baselines.

翻译：动态优化问题（DOPs）因其动态环境变化的复杂性而极具挑战性。进化计算方法因其模拟动态生物进化的特性，通常在求解DOPs时具有优势。然而，现有的进化动态优化方法严重依赖人工设计的自适应策略来检测DOPs中的环境变化，并据此调整搜索策略。这些手工设计的策略在未知场景中可能表现不佳。本文提出一种强化学习辅助的方法，以实现进化算法中自动化的变化检测与自适应。该方法借鉴了近期元黑盒优化工作中双层学习优化思想，采用深度Q网络作为优化动态检测器与搜索策略适配器：它以当前步的优化状态作为输入，进而为底层进化算法指定下一步优化所需的控制参数。学习目标是在问题分布上最大化期望性能增益。一旦训练完成，我们的方法能够泛化至未见过的DOPs，实现自动化的环境变化检测与自适应。为进行全面验证，我们进一步构建了一个包含多样化合成实例的由易至难DOPs测试集。大量基准实验结果表明，相较于最先进的基线方法，我们的方法在求解DOPs时展现出灵活的搜索行为与卓越的性能。

0

相关内容

动态优化

《基于二元优化与图学习的多智能体行动方案自动生成》

《基于二元优化与图学习的多智能体行动方案自动生成》

专知会员服务

25+阅读 · 2025年6月26日

多样化偏好优化

多样化偏好优化

专知会员服务

12+阅读 · 2025年2月3日

【新书】优化算法:用于设计、规划和控制问题的人工智能技术，669页pdf

【新书】优化算法:用于设计、规划和控制问题的人工智能技术，669页pdf

专知会员服务

95+阅读 · 2024年8月28日

【CMU博士论文】机器学习自动化算法设计实用方法，153页pdf

【CMU博士论文】机器学习自动化算法设计实用方法，153页pdf

专知会员服务

47+阅读 · 2023年11月18日

【伯克利博士论文】优化与机器学习中的结构驱动算法设计，420页pdf

【伯克利博士论文】优化与机器学习中的结构驱动算法设计，420页pdf

专知会员服务

45+阅读 · 2023年5月10日

【CVPR2023】DynamicDet:目标检测的统一动态架构

【CVPR2023】DynamicDet:目标检测的统一动态架构

专知会员服务

26+阅读 · 2023年4月15日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知会员服务

53+阅读 · 2022年11月24日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知会员服务

259+阅读 · 2022年8月23日

【干货书】优化与机器学习，Optimization and Machine Learning Optimization for Machine Learning and Machine Learning for Optimization

【干货书】优化与机器学习，Optimization and Machine Learning Optimization for Machine Learning and Machine Learning for Optimization

专知会员服务

40+阅读 · 2022年4月8日

【Mila-Google】使用元学习动态调整源代码模型，On-the-Fly Adaptation of Source Code Models using Meta-Learning

【Mila-Google】使用元学习动态调整源代码模型，On-the-Fly Adaptation of Source Code Models using Meta-Learning

专知会员服务

21+阅读 · 2020年3月28日

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知

13+阅读 · 2022年11月25日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知

13+阅读 · 2022年11月24日

《军事行动自动化》【译文】2022最新报告

《军事行动自动化》【译文】2022最新报告

专知

67+阅读 · 2022年11月13日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

机器学习中的最优化算法总结

机器学习中的最优化算法总结

人工智能前沿讲习班

22+阅读 · 2019年3月22日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

七月在线实验室

11+阅读 · 2018年7月18日

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

大数据文摘

19+阅读 · 2018年4月29日

面向动态演化的网构软件失效机理与测评方法

国家自然科学基金

1+阅读 · 2015年12月31日

面向动态优化问题的参数自适应及变结构生物地理学优化算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于元胞自动机的动态多目标优化算法在地下轨道交通无线信道检测问题中的研究

国家自然科学基金

0+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

演化优化的自适应约束处理机理及在生化过程中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

进化算法行为分析及应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于排队模型的动态车辆路径问题实时优化策略及算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

多项式优化的最优性条件与最优化算法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

动态环境下基于耗散结构的新型粒子群算法及应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于生物网络的高维多目标算法及其在分布式调度中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

Efficient Robot Design with Multi-Objective Black-Box Optimization and Large Language Models

Arxiv

0+阅读 · 2月18日

Automating UI Optimization through Multi-Agentic Reasoning

Arxiv

0+阅读 · 2月13日

Evolutionary Generative Optimization: Towards Fully Data-Driven Evolutionary Optimization via Generative Learning

Arxiv

0+阅读 · 2月13日

Controlled Self-Evolution for Algorithmic Code Optimization

Arxiv

0+阅读 · 2月12日

Multi-Objective Bayesian Optimization for Networked Black-Box Systems: A Path to Greener Profits and Smarter Designs

Arxiv

0+阅读 · 2月10日

Task-free Adaptive Meta Black-box Optimization

Arxiv

0+阅读 · 2月7日

Evolution of Benchmark: Black-Box Optimization Benchmark Design through Large Language Model

Arxiv

0+阅读 · 1月31日

Evolution of Benchmark: Black-Box Optimization Benchmark Design through Large Language Model

Arxiv

0+阅读 · 1月29日

Let the Optimizers Optimize Themselves

Arxiv

0+阅读 · 1月29日

Online Operator Design in Evolutionary Optimization for Flexible Job Shop Scheduling via Large Language Models

Arxiv

0+阅读 · 1月22日

VIP会员

文章信息

相关主题

相关VIP内容

《基于二元优化与图学习的多智能体行动方案自动生成》

《基于二元优化与图学习的多智能体行动方案自动生成》

专知会员服务

25+阅读 · 2025年6月26日

多样化偏好优化

多样化偏好优化

专知会员服务

12+阅读 · 2025年2月3日

【新书】优化算法:用于设计、规划和控制问题的人工智能技术，669页pdf

【新书】优化算法:用于设计、规划和控制问题的人工智能技术，669页pdf

专知会员服务

95+阅读 · 2024年8月28日

【CMU博士论文】机器学习自动化算法设计实用方法，153页pdf

【CMU博士论文】机器学习自动化算法设计实用方法，153页pdf

专知会员服务

47+阅读 · 2023年11月18日

【伯克利博士论文】优化与机器学习中的结构驱动算法设计，420页pdf

【伯克利博士论文】优化与机器学习中的结构驱动算法设计，420页pdf

专知会员服务

45+阅读 · 2023年5月10日

【CVPR2023】DynamicDet:目标检测的统一动态架构

【CVPR2023】DynamicDet:目标检测的统一动态架构

专知会员服务

26+阅读 · 2023年4月15日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知会员服务

53+阅读 · 2022年11月24日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知会员服务

259+阅读 · 2022年8月23日

【干货书】优化与机器学习，Optimization and Machine Learning Optimization for Machine Learning and Machine Learning for Optimization

【干货书】优化与机器学习，Optimization and Machine Learning Optimization for Machine Learning and Machine Learning for Optimization

专知会员服务

40+阅读 · 2022年4月8日

【Mila-Google】使用元学习动态调整源代码模型，On-the-Fly Adaptation of Source Code Models using Meta-Learning

【Mila-Google】使用元学习动态调整源代码模型，On-the-Fly Adaptation of Source Code Models using Meta-Learning

专知会员服务

21+阅读 · 2020年3月28日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人机与战争：被忽视的环境影响及无人机保护潜力》

俄罗斯规划未来无人机驱动军队

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

《人工智能、武器与影响力：前沿模型在模拟核危机中展现复杂推理》2026最新46页报告

相关资讯

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知

13+阅读 · 2022年11月25日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知

13+阅读 · 2022年11月24日

《军事行动自动化》【译文】2022最新报告

《军事行动自动化》【译文】2022最新报告

专知

67+阅读 · 2022年11月13日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

机器学习中的最优化算法总结

机器学习中的最优化算法总结

人工智能前沿讲习班

22+阅读 · 2019年3月22日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

七月在线实验室

11+阅读 · 2018年7月18日

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

大数据文摘

19+阅读 · 2018年4月29日

相关论文

Efficient Robot Design with Multi-Objective Black-Box Optimization and Large Language Models

Arxiv

0+阅读 · 2月18日

Automating UI Optimization through Multi-Agentic Reasoning

Arxiv

0+阅读 · 2月13日

Evolutionary Generative Optimization: Towards Fully Data-Driven Evolutionary Optimization via Generative Learning

Arxiv

0+阅读 · 2月13日

Controlled Self-Evolution for Algorithmic Code Optimization

Arxiv

0+阅读 · 2月12日

Multi-Objective Bayesian Optimization for Networked Black-Box Systems: A Path to Greener Profits and Smarter Designs

Arxiv

0+阅读 · 2月10日

Task-free Adaptive Meta Black-box Optimization

Arxiv

0+阅读 · 2月7日

Evolution of Benchmark: Black-Box Optimization Benchmark Design through Large Language Model

Arxiv

0+阅读 · 1月31日

Evolution of Benchmark: Black-Box Optimization Benchmark Design through Large Language Model

Arxiv

0+阅读 · 1月29日

Let the Optimizers Optimize Themselves

Arxiv

0+阅读 · 1月29日

Online Operator Design in Evolutionary Optimization for Flexible Job Shop Scheduling via Large Language Models

Arxiv

0+阅读 · 1月22日

相关基金

面向动态演化的网构软件失效机理与测评方法

国家自然科学基金

1+阅读 · 2015年12月31日

面向动态优化问题的参数自适应及变结构生物地理学优化算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于元胞自动机的动态多目标优化算法在地下轨道交通无线信道检测问题中的研究

国家自然科学基金

0+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

演化优化的自适应约束处理机理及在生化过程中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

进化算法行为分析及应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于排队模型的动态车辆路径问题实时优化策略及算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

多项式优化的最优性条件与最优化算法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

动态环境下基于耗散结构的新型粒子群算法及应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于生物网络的高维多目标算法及其在分布式调度中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员