首个针对同构与异构数据的可证明最优异步随机梯度下降算法 - 专知VIP

会员服务 ·

8

随机梯度下降 · 人工智能 ·

首个针对同构与异构数据的可证明最优异步随机梯度下降算法

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

人工智能在语言建模、视觉及自主系统等领域取得了卓越成就。这些突破主要源于使用数千个 GPU 或 TPU 在海量数据集上训练规模日益扩大的神经网络。此类训练任务往往占用整个数据中心长达数周甚至数月，消耗巨大的计算与能源资源。尽管硬件进步和数据可用性使这种规模化扩展（Scaling）成为可能，但用于训练的优化算法演进速度却相对滞后。大多数大规模训练仍依赖于同步方法，即所有工作节点（Workers）必须在下一轮迭代开始前完成各自任务。随着设备数量的增加，由同步引起的低效问题也随之加剧：较快的节点在等待较慢节点时处于闲置状态，造成了计算资源和能源的浪费。在实践中，所有节点几乎不可能以完全相同的速度运行——硬件故障和网络延迟不可避免地导致了计算异构性。

直观来看，移除同步似乎是一个简单的解决方案，它允许所有节点持续运行。然而，异步性会引入迟滞性（Staleness）——即部分计算结果是基于过时的模型版本生成的——这使得算法分析变得异常困难，尤其是当延迟源于系统级波动而非算法本身时。尽管已有大量研究，但异步方法的时间复杂度仍未得到充分理解。本论文旨在填补这一空白。我们为异步一阶随机优化开发了一个严谨的框架，孤立并处理了这些方法所针对的核心挑战：异构的节点速度。在此框架下，我们研究了随机梯度下降（SGD），并证明通过合理设计，异步 SGD 在时间复杂度上可以达到理论最优，匹配了近期同步 SGD 变体才实现的最优性结果。本文的第一项贡献是 Ringmaster ASGD，它通过选择性地丢弃过时更新，在同构数据设定下实现了最优时间复杂度。第二项贡献 Ringleader ASGD，利用协调模型更新的结构化梯度表机制，将上述结果扩展到了异构数据体制（联邦学习中的典型场景）。最后，ATA 通过学习节点的计算时间分布并自适应地分配任务，显著提升了资源效率，以远少的计算量实现了近乎最优的实际运行时间。综上所述，这些研究结果确立了异步优化在并行与分布式学习中作为理论完备且实际高效的基础地位——证明了“无须同步的协调”不仅可行，而且此类策略在理论上享有最优时间复杂度，同时在实践中优于竞争性的同步方法。

成为VIP会员查看完整内容

10

相关内容

随机梯度下降

随机梯度下降

随机梯度下降，按照数据生成分布抽取m个样本，通过计算他们梯度的平均值来更新梯度。

【CMU博士论文】异构数据导航：构建面向多样化数据类型、领域及复杂性的 AI 系统

【CMU博士论文】异构数据导航：构建面向多样化数据类型、领域及复杂性的 AI 系统

专知会员服务

18+阅读 · 2月12日

【博士论文】低维与高维空间中潜在表征的分析、建模与变换

【博士论文】低维与高维空间中潜在表征的分析、建模与变换

专知会员服务

23+阅读 · 2025年8月23日

【牛津大学博士论文】将归纳偏差融入机器学习算法，146页pdf

【牛津大学博士论文】将归纳偏差融入机器学习算法，146页pdf

专知会员服务

18+阅读 · 2024年9月11日

【阿姆斯特丹博士论文】神经符号学习系统重的优化，211页pdf

【阿姆斯特丹博士论文】神经符号学习系统重的优化，211页pdf

专知会员服务

37+阅读 · 2023年12月21日

【斯坦福博士论文】以数据为中心的机器学习的理论和算法，209页pdf

【斯坦福博士论文】以数据为中心的机器学习的理论和算法，209页pdf

专知会员服务

55+阅读 · 2023年9月10日

【斯坦福博士论文】以数据为中心机器学习的理论与算法，209页pdf

【斯坦福博士论文】以数据为中心机器学习的理论与算法，209页pdf

专知会员服务

85+阅读 · 2023年7月17日

《深度学习的集体智能：近期发展综述》谷歌2022最新16页论文

《深度学习的集体智能：近期发展综述》谷歌2022最新16页论文

专知会员服务

94+阅读 · 2022年11月7日

LLNL国家实验室《计算高效深度学习:算法趋势和机遇》，52页pdf

LLNL国家实验室《计算高效深度学习:算法趋势和机遇》，52页pdf

专知会员服务

43+阅读 · 2022年10月26日

深度学习批归一化及其相关算法研究进展

深度学习批归一化及其相关算法研究进展

专知会员服务

52+阅读 · 2020年7月17日

基于深度网络的自监督视觉特征学习综述，附24页论文下载

基于深度网络的自监督视觉特征学习综述，附24页论文下载

专知会员服务

66+阅读 · 2020年1月15日

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知

14+阅读 · 2023年4月6日

最新《可解释机器学习》报告，164页ppt建模阐述XAI进展

最新《可解释机器学习》报告，164页ppt建模阐述XAI进展

专知

10+阅读 · 2022年8月25日

【论文综述】深度卷积神经网络架构最新进展综述（附60页全文下载）

【论文综述】深度卷积神经网络架构最新进展综述（附60页全文下载）

专知

29+阅读 · 2019年1月23日

南洋理工最新《命名实体识别深度学习方法》综述论文，25页pdf

南洋理工最新《命名实体识别深度学习方法》综述论文，25页pdf

专知

46+阅读 · 2018年12月28日

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

AI研习社

11+阅读 · 2018年1月4日

深度学习中的五大正则化方法和七大优化策略

深度学习中的五大正则化方法和七大优化策略

全球人工智能

11+阅读 · 2017年12月25日

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

算法与数据结构

22+阅读 · 2017年12月13日

【下载】最新TensorFlow深度学习教程指引《Learning TensorFlow，构建深度学习系统指引》

【下载】最新TensorFlow深度学习教程指引《Learning TensorFlow，构建深度学习系统指引》

专知

28+阅读 · 2017年12月6日

绝对干货 | 随机梯度下降算法综述

绝对干货 | 随机梯度下降算法综述

菜鸟的机器学习

15+阅读 · 2017年10月30日

干货｜基于图卷积网络的图深度学习

干货｜基于图卷积网络的图深度学习

DataCanvas大数据云平台

10+阅读 · 2017年6月8日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

异构车联网协作数据传输关键技术的建模分析及优化算法研究

国家自然科学基金

4+阅读 · 2015年12月31日

随机映射框架下的图像语义分析与提取技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

数据分析算法的融合与人才培养

国家自然科学基金

7+阅读 · 2015年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

高维复杂结构数据降维

国家自然科学基金

10+阅读 · 2014年12月31日

FHAIM: Fully Homomorphic AIM For Private Synthetic Data Generation

Arxiv

0+阅读 · 2月5日

Provable Learning of Random Hierarchy Models and Hierarchical Shallow-to-Deep Chaining

Arxiv

0+阅读 · 1月27日

A Reconfigurable Framework for AI-FPGA Agent Integration and Acceleration

Arxiv

0+阅读 · 1月27日

Towards Interpretable Deep Generative Models via Causal Representation Learning

Arxiv

0+阅读 · 1月26日

A Distributed Generative AI Approach for Heterogeneous Multi-Domain Environments under Data Sharing constraints

Arxiv

0+阅读 · 1月16日

A Comparative Study of 3D Model Acquisition Methods for Synthetic Data Generation of Agricultural Products

Arxiv

0+阅读 · 1月7日

First Provably Optimal Asynchronous SGD for Homogeneous and Heterogeneous Data

Arxiv

0+阅读 · 1月5日

Single- and Multi-Objective Stochastic Optimization for Next-Generation Networks in the Generative AI and Quantum Computing Era

Arxiv

0+阅读 · 1月5日

Large-Scale Deep Learning Optimizations: A Comprehensive Survey

Arxiv

23+阅读 · 2021年11月2日

A Survey of Methods for Low-Power Deep Learning and Computer Vision

A Survey of Methods for Low-Power Deep Learning and Computer Vision

Arxiv

14+阅读 · 2020年3月24日

VIP会员

相关主题

随机梯度下降

最新内容

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

7+阅读 · 今天8:10

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

7+阅读 · 今天8:06

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

5+阅读 · 今天8:02

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

5+阅读 · 今天7:32

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

11+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

9+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

6+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

4+阅读 · 4月20日

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

专知会员服务

8+阅读 · 4月20日

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

专知会员服务

4+阅读 · 4月20日

高效视频扩散模型：进展与挑战

高效视频扩散模型：进展与挑战

专知会员服务

4+阅读 · 4月20日

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

8+阅读 · 4月20日

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

7+阅读 · 4月20日

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

12+阅读 · 4月20日

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

6+阅读 · 4月20日

相关VIP内容

【CMU博士论文】异构数据导航：构建面向多样化数据类型、领域及复杂性的 AI 系统

【CMU博士论文】异构数据导航：构建面向多样化数据类型、领域及复杂性的 AI 系统

专知会员服务

18+阅读 · 2月12日

【博士论文】低维与高维空间中潜在表征的分析、建模与变换

【博士论文】低维与高维空间中潜在表征的分析、建模与变换

专知会员服务

23+阅读 · 2025年8月23日

【牛津大学博士论文】将归纳偏差融入机器学习算法，146页pdf

【牛津大学博士论文】将归纳偏差融入机器学习算法，146页pdf

专知会员服务

18+阅读 · 2024年9月11日

【阿姆斯特丹博士论文】神经符号学习系统重的优化，211页pdf

【阿姆斯特丹博士论文】神经符号学习系统重的优化，211页pdf

专知会员服务

37+阅读 · 2023年12月21日

【斯坦福博士论文】以数据为中心的机器学习的理论和算法，209页pdf

【斯坦福博士论文】以数据为中心的机器学习的理论和算法，209页pdf

专知会员服务

55+阅读 · 2023年9月10日

【斯坦福博士论文】以数据为中心机器学习的理论与算法，209页pdf

【斯坦福博士论文】以数据为中心机器学习的理论与算法，209页pdf

专知会员服务

85+阅读 · 2023年7月17日

《深度学习的集体智能：近期发展综述》谷歌2022最新16页论文

《深度学习的集体智能：近期发展综述》谷歌2022最新16页论文

专知会员服务

94+阅读 · 2022年11月7日

LLNL国家实验室《计算高效深度学习:算法趋势和机遇》，52页pdf

LLNL国家实验室《计算高效深度学习:算法趋势和机遇》，52页pdf

专知会员服务

43+阅读 · 2022年10月26日

深度学习批归一化及其相关算法研究进展

深度学习批归一化及其相关算法研究进展

专知会员服务

52+阅读 · 2020年7月17日

基于深度网络的自监督视觉特征学习综述，附24页论文下载

基于深度网络的自监督视觉特征学习综述，附24页论文下载

专知会员服务

66+阅读 · 2020年1月15日

热门VIP内容

开通专知VIP会员享更多权益服务

《提升美军全域城市作战训练最佳实践的案例研究》366页

美海军数字作战负责人：如何利用数据快速生成战斗力

《美陆军条例：陆军指挥政策（2026版）》

《军用自主人工智能系统的治理与安全》

相关资讯

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知

14+阅读 · 2023年4月6日

最新《可解释机器学习》报告，164页ppt建模阐述XAI进展

最新《可解释机器学习》报告，164页ppt建模阐述XAI进展

专知

10+阅读 · 2022年8月25日

【论文综述】深度卷积神经网络架构最新进展综述（附60页全文下载）

【论文综述】深度卷积神经网络架构最新进展综述（附60页全文下载）

专知

29+阅读 · 2019年1月23日

南洋理工最新《命名实体识别深度学习方法》综述论文，25页pdf

南洋理工最新《命名实体识别深度学习方法》综述论文，25页pdf

专知

46+阅读 · 2018年12月28日

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

AI研习社

11+阅读 · 2018年1月4日

深度学习中的五大正则化方法和七大优化策略

深度学习中的五大正则化方法和七大优化策略

全球人工智能

11+阅读 · 2017年12月25日

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

算法与数据结构

22+阅读 · 2017年12月13日

【下载】最新TensorFlow深度学习教程指引《Learning TensorFlow，构建深度学习系统指引》

【下载】最新TensorFlow深度学习教程指引《Learning TensorFlow，构建深度学习系统指引》

专知

28+阅读 · 2017年12月6日

绝对干货 | 随机梯度下降算法综述

绝对干货 | 随机梯度下降算法综述

菜鸟的机器学习

15+阅读 · 2017年10月30日

干货｜基于图卷积网络的图深度学习

干货｜基于图卷积网络的图深度学习

DataCanvas大数据云平台

10+阅读 · 2017年6月8日

相关基金

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

异构车联网协作数据传输关键技术的建模分析及优化算法研究

国家自然科学基金

4+阅读 · 2015年12月31日

随机映射框架下的图像语义分析与提取技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

数据分析算法的融合与人才培养

国家自然科学基金

7+阅读 · 2015年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

高维复杂结构数据降维

国家自然科学基金

10+阅读 · 2014年12月31日

相关论文

FHAIM: Fully Homomorphic AIM For Private Synthetic Data Generation

Arxiv

0+阅读 · 2月5日

Provable Learning of Random Hierarchy Models and Hierarchical Shallow-to-Deep Chaining

Arxiv

0+阅读 · 1月27日

A Reconfigurable Framework for AI-FPGA Agent Integration and Acceleration

Arxiv

0+阅读 · 1月27日

Towards Interpretable Deep Generative Models via Causal Representation Learning

Arxiv

0+阅读 · 1月26日

A Distributed Generative AI Approach for Heterogeneous Multi-Domain Environments under Data Sharing constraints

Arxiv

0+阅读 · 1月16日

A Comparative Study of 3D Model Acquisition Methods for Synthetic Data Generation of Agricultural Products

Arxiv

0+阅读 · 1月7日

First Provably Optimal Asynchronous SGD for Homogeneous and Heterogeneous Data

Arxiv

0+阅读 · 1月5日

Single- and Multi-Objective Stochastic Optimization for Next-Generation Networks in the Generative AI and Quantum Computing Era

Arxiv

0+阅读 · 1月5日

Large-Scale Deep Learning Optimizations: A Comprehensive Survey

Arxiv

23+阅读 · 2021年11月2日

A Survey of Methods for Low-Power Deep Learning and Computer Vision

A Survey of Methods for Low-Power Deep Learning and Computer Vision

Arxiv

14+阅读 · 2020年3月24日

微信扫码咨询专知VIP会员