Modern optimization problems in scientific and engineering domains often rely on expensive black-box evaluations, such as those arising in physical simulations or deep learning pipelines, where gradient information is unavailable or unreliable. In these settings, conventional optimization methods quickly become impractical due to prohibitive computational costs and poor scalability. We propose ALMAB-DC, a unified and modular framework for scalable black-box optimization that integrates active learning, multi-armed bandits, and distributed computing, with optional GPU acceleration. The framework leverages surrogate modeling and information-theoretic acquisition functions to guide informative sample selection, while bandit-based controllers dynamically allocate computational resources across candidate evaluations in a statistically principled manner. These decisions are executed asynchronously within a distributed multi-agent system, enabling high-throughput parallel evaluation. We establish theoretical regret bounds for both UCB-based and Thompson-sampling-based variants and develop a scalability analysis grounded in Amdahl's and Gustafson's laws. Empirical results across synthetic benchmarks, reinforcement learning tasks, and scientific simulation problems demonstrate that ALMAB-DC consistently outperforms state-of-the-art black-box optimizers. By design, ALMAB-DC is modular, uncertainty-aware, and extensible, making it particularly well suited for high-dimensional, resource-intensive optimization challenges.


翻译:科学与工程领域的现代优化问题通常依赖于昂贵的黑箱评估,例如物理仿真或深度学习流程中的评估,这些场景中梯度信息不可用或不可靠。在此类情境下,由于高昂的计算成本和较差的可扩展性,传统优化方法很快变得不切实际。我们提出了ALMAB-DC——一个统一且模块化的可扩展黑箱优化框架,它集成了主动学习、多臂赌博机和分布式计算,并支持可选的GPU加速。该框架利用代理模型和信息论采集函数来指导信息性样本的选择,同时基于赌博机的控制器以统计原则性方式动态分配候选评估的计算资源。这些决策在分布式多智能体系统中异步执行,实现了高吞吐量的并行评估。我们为基于UCB和基于Thompson采样的变体建立了理论遗憾界,并基于Amdahl定律和Gustafson定律进行了可扩展性分析。在合成基准测试、强化学习任务和科学仿真问题上的实证结果表明,ALMAB-DC始终优于最先进的黑箱优化器。通过设计,ALMAB-DC具有模块化、不确定性感知和可扩展的特点,使其特别适用于高维度、资源密集型的优化挑战。

0
下载
关闭预览

相关内容

【CMU博士论文】用于提升含优化层学习的算法与体系结构
【CMU博士论文】黑盒和多目标优化策略,151页pdf
专知会员服务
53+阅读 · 2022年11月24日
《分布式多智能体强化学习的编码》加州大学等
专知会员服务
55+阅读 · 2022年11月2日
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
15+阅读 · 2020年9月9日
2018年深度学习优化算法最新综述
计算机视觉战队
10+阅读 · 2018年12月11日
深度强化学习简介
专知
30+阅读 · 2018年12月3日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员