Machine learning models, and deep neural networks in particular, are increasingly deployed in risk-sensitive domains such as healthcare, environmental forecasting, and finance, where reliable quantification of predictive uncertainty is essential. However, many uncertainty quantification (UQ) methods remain difficult to apply due to their substantial computational cost. Sampling-based Bayesian learning approaches, such as Bayesian neural networks (BNNs), are particularly expensive since drawing and evaluating multiple parameter samples rapidly exhausts memory and compute resources. These constraints have limited the accessibility and exploration of Bayesian techniques thus far. To address these challenges, we introduce sampling parallelism, a simple yet powerful parallelization strategy that targets the primary bottleneck of sampling-based Bayesian learning: the samples themselves. By distributing sample evaluations across multiple GPUs, our method reduces memory pressure and training time without requiring architectural changes or extensive hyperparameter tuning. We detail the methodology and evaluate its performance on a few example tasks and architectures, comparing against distributed data parallelism (DDP) as a baseline. We further demonstrate that sampling parallelism is complementary to existing strategies by implementing a hybrid approach that combines sample and data parallelism. Our experiments show near-perfect scaling when the sample number is scaled proportionally to the computational resources, confirming that sample evaluations parallelize cleanly. Although DDP achieves better raw speedups under scaling with constant workload, sampling parallelism has a notable advantage: by applying independent stochastic augmentations to the same batch on each GPU, it increases augmentation diversity and thus reduces the number of epochs required for convergence.


翻译:机器学习模型,尤其是深度神经网络,越来越多地部署在医疗、环境预测和金融等风险敏感领域,这些领域对预测不确定性的可靠量化至关重要。然而,许多不确定性量化方法因其高昂的计算成本而难以应用。基于采样的贝叶斯学习方法(如贝叶斯神经网络)尤其昂贵,因为生成和评估多个参数样本会迅速耗尽内存和计算资源。这些限制迄今为止影响了贝叶斯技术的可及性与探索。为解决这些挑战,我们提出了采样并行化——一种简单而强大的并行化策略,直击基于采样的贝叶斯学习的主要瓶颈:样本本身。通过将样本评估分布到多个GPU上,我们的方法减少了内存压力并缩短了训练时间,无需修改架构或进行大量超参数调优。我们详细阐述了该方法论,并在若干示例任务和架构上评估其性能,以分布式数据并行化作为基线进行比较。我们进一步通过实现一种结合样本并行化与数据并行化的混合方法,证明了采样并行化与现有策略的互补性。实验表明,当样本数量与计算资源成比例扩展时,可实现近乎完美的扩展性,证实了样本评估的并行化非常干净利落。尽管在恒定工作负载扩展下,分布式数据并行化能实现更优的原始加速比,但采样并行化有一个显著优势:通过在每个GPU上对同一批次应用独立的随机增广,它增加了增广多样性,从而减少了收敛所需的训练轮次。

0
下载
关闭预览

相关内容

【ETH博士论文】贝叶斯深度学习,241页pdf
专知会员服务
131+阅读 · 2022年1月16日
【NYU-WESLEY MADDOX】贝叶斯神经网络教程,83页ppt
专知会员服务
61+阅读 · 2021年4月15日
MIT最新《贝叶斯深度学习》综述论文,37页pdf
专知会员服务
55+阅读 · 2021年1月4日
【ETH博士论文】贝叶斯深度学习,241页pdf
专知
10+阅读 · 2022年1月16日
【新书册】贝叶斯神经网络,41页pdf
专知
29+阅读 · 2020年6月3日
【深度】让DL可解释?这一份66页贝叶斯深度学习教程告诉你
GAN生成式对抗网络
15+阅读 · 2018年8月11日
贝叶斯机器学习前沿进展
机器学习研究会
21+阅读 · 2018年1月21日
国家自然科学基金
16+阅读 · 2017年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
24+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
Arxiv
0+阅读 · 3月17日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
7+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
8+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关基金
国家自然科学基金
16+阅读 · 2017年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
24+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员