G-ICSO-NAS: Shifting Gears between Gradient and Swarm for Robust Neural Architecture Search - 专知论文

会员服务 ·

0

梯度 · 搜索 · 神经架构 · 神经架构搜索 · 群智 ·

G-ICSO-NAS: Shifting Gears between Gradient and Swarm for Robust Neural Architecture Search

翻译：G-ICSO-NAS：在梯度与群智能之间换挡实现鲁棒神经架构搜索

Xingbang Du,Enzhi Zhang,Rui Zhong,Yang Cao,Masaharu Munetomo

from arxiv, Accepted at the International Joint Conference on Neural Networks (IJCNN), WCCI 2026. This is a preprint version

Neural Architecture Search (NAS) has become a pivotal technique in automated machine learning. Evolutionary Algorithm (EA)-based methods demonstrate superior search quality but suffer from prohibitive computational costs, while gradient-based approaches like DARTS offer high efficiency but are prone to premature convergence and performance collapse. To bridge this gap, we propose G-ICSO-NAS, a hybrid framework implementing a three-stage optimization strategy. The Warm-up Phase pre-trains supernet weights ($w$) via differentiable methods while architecture parameters ($α$) remain frozen. The Exploration Phase adopts a hybrid co-optimization mechanism: an Improved Competitive Swarm Optimizer (ICSO) with diversity-aware fitness navigates the architecture space to update $α$, while gradient descent concurrently updates $w$. The Stability Phase employs fine-grained gradient-based search with early stopping to converge to the optimal architecture. By synergizing ICSO's global navigation capability with differentiable methods' efficiency, G-ICSO-NAS achieves remarkable performance with minimal cost. In the context of the DARTS search space, an accuracy of 97.46\% is achieved on CIFAR-10 with a computational budget of just 0.15 GPU-Days. The method also exhibits strong transfer potential, recording accuracies of 83.1\% (CIFAR-100) and 75.02\% (ImageNet). Furthermore, regarding the NAS-Bench-201 benchmark, G-ICSO-NAS is shown to deliver state-of-the-art results across all evaluated datasets.

翻译：神经架构搜索（NAS）已成为自动机器学习中的关键技术。基于进化算法（EA）的方法展现出优异的搜索质量，但面临高昂的计算成本；而基于梯度的方法（如DARTS）虽具有高效率，却容易陷入早熟收敛和性能崩溃。为弥合这一差距，我们提出G-ICSO-NAS，一种实现三阶段优化策略的混合框架。热身阶段通过可微分方法预训练超级网络权重（$w$），同时冻结架构参数（$α$）。探索阶段采用混合协同优化机制：具有多样性感知能力的改进竞争群优化器（ICSO）在架构空间中导航以更新$α$，而梯度下降则同步更新$w$。稳定阶段采用带有早停策略的细粒度梯度搜索，收敛至最优架构。通过将ICSO的全局导航能力与可微分方法的高效性相结合，G-ICSO-NAS以极低代价实现了卓越性能。在DARTS搜索空间背景下，该方法仅以0.15 GPU天的计算预算即在CIFAR-10上达到97.46%的准确率。该方法还展现出强大的迁移潜力，在CIFAR-100和ImageNet上分别取得83.1%和75.02%的准确率。此外，在NAS-Bench-201基准测试中，G-ICSO-NAS在所有评估数据集上均取得了最先进的结果。

0

相关内容

梯度的本意是一个向量（矢量），表示某一函数在该点处的方向导数沿着该方向取得最大值，即函数在该点处沿着该方向（此梯度的方向）变化最快，变化率最大（为该梯度的模）。

【CMU博士论文】神经架构搜索的搜索算法和搜索空间，141页pdf

【CMU博士论文】神经架构搜索的搜索算法和搜索空间，141页pdf

专知会员服务

39+阅读 · 2022年12月7日

105页ppt! Abacus.AI&微软最新《神经体系结构搜索NAS: 基础与趋势》教程

105页ppt! Abacus.AI&微软最新《神经体系结构搜索NAS: 基础与趋势》教程

专知会员服务

34+阅读 · 2022年8月13日

【Google AI】鲁棒图神经网络，Robust Graph Neural Networks

【Google AI】鲁棒图神经网络，Robust Graph Neural Networks

专知会员服务

38+阅读 · 2022年3月9日

【ICML2021】无训练神经架构搜索

专知会员服务

20+阅读 · 2021年9月16日

【ICML2021】使用Transformers编码的计算感知神经架构

专知会员服务

18+阅读 · 2021年9月15日

【ICML2021-北大阿里】KNAS：绿色神经架构搜索

专知会员服务

23+阅读 · 2021年8月18日

【ICML2021】 One-shot 权重共享神经网络结构搜索算法

专知会员服务

18+阅读 · 2021年8月4日

最新《神经架构搜索NAS》报告，附46页ppt与视频

最新《神经架构搜索NAS》报告，附46页ppt与视频

专知会员服务

37+阅读 · 2020年12月30日

【NeurIPS 2020 】神经网络结构生成优化

【NeurIPS 2020 】神经网络结构生成优化

专知会员服务

21+阅读 · 2020年10月24日

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

专知会员服务

31+阅读 · 2019年11月25日

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

专知

20+阅读 · 2020年10月5日

【Google出品】神经网络结构搜索NAS，41页ppt了解最新进展

【Google出品】神经网络结构搜索NAS，41页ppt了解最新进展

专知

27+阅读 · 2019年11月21日

最新246篇自动化神经网络搜索（NAS）论文，附完整列表PDF下载

最新246篇自动化神经网络搜索（NAS）论文，附完整列表PDF下载

专知

17+阅读 · 2019年9月20日

【NeurIPS 2019】7篇自动化神经网络搜索(NAS)论文简读

【NeurIPS 2019】7篇自动化神经网络搜索(NAS)论文简读

中国人工智能学会

15+阅读 · 2019年9月13日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

谷歌大脑重磅研究：神经结构搜索发现全新特征金字塔架构，超越Mask R-CNN等

谷歌大脑重磅研究：神经结构搜索发现全新特征金字塔架构，超越Mask R-CNN等

新智元

12+阅读 · 2019年4月19日

【学界】基于GNN，强于GNN：胶囊图神经网络的PyTorch实现 | ICLR 2019

【学界】基于GNN，强于GNN：胶囊图神经网络的PyTorch实现 | ICLR 2019

GAN生成式对抗网络

31+阅读 · 2019年3月26日

专栏 | 神经网络架构搜索（NAS）综述（附AutoML资料推荐）

专栏 | 神经网络架构搜索（NAS）综述（附AutoML资料推荐）

机器之心

13+阅读 · 2018年9月1日

基础 | GRU神经网络

基础 | GRU神经网络

黑龙江大学自然语言处理实验室

27+阅读 · 2018年3月5日

高性能低比特视觉搜索及芯片结构研究

国家自然科学基金

1+阅读 · 2016年12月31日

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

面向物联网搜索的群智感知关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

利用连续变量多组份纠缠态实现经典和量子算法

国家自然科学基金

0+阅读 · 2015年12月31日

基于金纳米棒的高性能微纳传感阵列的结构设计和机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

9+阅读 · 2015年12月31日

神经形态多核处理器的架构模型研究

国家自然科学基金

3+阅读 · 2015年12月31日

状态空间搜索的anytime模式及其高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

动态Gr？bner 基与GVW算法

国家自然科学基金

0+阅读 · 2014年12月31日

elasticAI.explorer: Towards a Unified End-to-End Framework for Hardware-Aware Neural Architecture Search

Arxiv

0+阅读 · 5月28日

NAVIS: Concurrent Search and Update with Low Position-Seeking Overhead in On-SSD Graph-Based Vector Search

Arxiv

0+阅读 · 5月12日

HERCULES: Hardware-Efficient, Robust, Continual Learning Neural Architecture Search

Arxiv

0+阅读 · 5月3日

An LLM-Guided Query-Aware Inference System for GNN Models on Large Knowledge Graphs

Arxiv

0+阅读 · 4月20日

HiPreNets: High-Precision Neural Networks through Progressive Training

Arxiv

0+阅读 · 4月17日

EMGFlow: Robust and Efficient Surface Electromyography Synthesis via Flow Matching

Arxiv

0+阅读 · 4月15日

Ge$^\text{2}$mS-T: Multi-Dimensional Grouping for Ultra-High Energy Efficiency in Spiking Transformer

Arxiv

0+阅读 · 4月10日

Morphling: Fast, Fused, and Flexible GNN Training at Scale

Arxiv

0+阅读 · 3月26日

Layered Quantum Architecture Search for 3D Point Cloud Classification

Arxiv

0+阅读 · 3月20日

The Expressive Power of Graph Neural Networks: A Survey

Arxiv

10+阅读 · 2023年8月16日

VIP会员

文章信息

相关主题

神经架构搜索

最新内容

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

3+阅读 · 6月24日

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

2+阅读 · 6月24日

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

8+阅读 · 6月24日

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

6+阅读 · 6月24日

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

5+阅读 · 6月24日

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

6+阅读 · 6月24日

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

6+阅读 · 6月24日

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

5+阅读 · 6月24日

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

4+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

7+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

12+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

6+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

5+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

9+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

8+阅读 · 6月23日

相关VIP内容

【CMU博士论文】神经架构搜索的搜索算法和搜索空间，141页pdf

【CMU博士论文】神经架构搜索的搜索算法和搜索空间，141页pdf

专知会员服务

39+阅读 · 2022年12月7日

105页ppt! Abacus.AI&微软最新《神经体系结构搜索NAS: 基础与趋势》教程

105页ppt! Abacus.AI&微软最新《神经体系结构搜索NAS: 基础与趋势》教程

专知会员服务

34+阅读 · 2022年8月13日

【Google AI】鲁棒图神经网络，Robust Graph Neural Networks

【Google AI】鲁棒图神经网络，Robust Graph Neural Networks

专知会员服务

38+阅读 · 2022年3月9日

【ICML2021】无训练神经架构搜索

专知会员服务

20+阅读 · 2021年9月16日

【ICML2021】使用Transformers编码的计算感知神经架构

专知会员服务

18+阅读 · 2021年9月15日

【ICML2021-北大阿里】KNAS：绿色神经架构搜索

专知会员服务

23+阅读 · 2021年8月18日

【ICML2021】 One-shot 权重共享神经网络结构搜索算法

专知会员服务

18+阅读 · 2021年8月4日

最新《神经架构搜索NAS》报告，附46页ppt与视频

最新《神经架构搜索NAS》报告，附46页ppt与视频

专知会员服务

37+阅读 · 2020年12月30日

【NeurIPS 2020 】神经网络结构生成优化

【NeurIPS 2020 】神经网络结构生成优化

专知会员服务

21+阅读 · 2020年10月24日

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

专知会员服务

31+阅读 · 2019年11月25日

热门VIP内容

开通专知VIP会员享更多权益服务

Agentic RL：框架、实践与长程智能体训练

重新思考无人机时代的生存能力

综述 | 从问答到任务完成：Agent系统与Harness设计

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

相关资讯

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

专知

20+阅读 · 2020年10月5日

【Google出品】神经网络结构搜索NAS，41页ppt了解最新进展

【Google出品】神经网络结构搜索NAS，41页ppt了解最新进展

专知

27+阅读 · 2019年11月21日

最新246篇自动化神经网络搜索（NAS）论文，附完整列表PDF下载

最新246篇自动化神经网络搜索（NAS）论文，附完整列表PDF下载

专知

17+阅读 · 2019年9月20日

【NeurIPS 2019】7篇自动化神经网络搜索(NAS)论文简读

【NeurIPS 2019】7篇自动化神经网络搜索(NAS)论文简读

中国人工智能学会

15+阅读 · 2019年9月13日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

谷歌大脑重磅研究：神经结构搜索发现全新特征金字塔架构，超越Mask R-CNN等

谷歌大脑重磅研究：神经结构搜索发现全新特征金字塔架构，超越Mask R-CNN等

新智元

12+阅读 · 2019年4月19日

【学界】基于GNN，强于GNN：胶囊图神经网络的PyTorch实现 | ICLR 2019

【学界】基于GNN，强于GNN：胶囊图神经网络的PyTorch实现 | ICLR 2019

GAN生成式对抗网络

31+阅读 · 2019年3月26日

专栏 | 神经网络架构搜索（NAS）综述（附AutoML资料推荐）

专栏 | 神经网络架构搜索（NAS）综述（附AutoML资料推荐）

机器之心

13+阅读 · 2018年9月1日

基础 | GRU神经网络

基础 | GRU神经网络

黑龙江大学自然语言处理实验室

27+阅读 · 2018年3月5日

相关论文

elasticAI.explorer: Towards a Unified End-to-End Framework for Hardware-Aware Neural Architecture Search

Arxiv

0+阅读 · 5月28日

NAVIS: Concurrent Search and Update with Low Position-Seeking Overhead in On-SSD Graph-Based Vector Search

Arxiv

0+阅读 · 5月12日

HERCULES: Hardware-Efficient, Robust, Continual Learning Neural Architecture Search

Arxiv

0+阅读 · 5月3日

An LLM-Guided Query-Aware Inference System for GNN Models on Large Knowledge Graphs

Arxiv

0+阅读 · 4月20日

HiPreNets: High-Precision Neural Networks through Progressive Training

Arxiv

0+阅读 · 4月17日

EMGFlow: Robust and Efficient Surface Electromyography Synthesis via Flow Matching

Arxiv

0+阅读 · 4月15日

Ge$^\text{2}$mS-T: Multi-Dimensional Grouping for Ultra-High Energy Efficiency in Spiking Transformer

Arxiv

0+阅读 · 4月10日

Morphling: Fast, Fused, and Flexible GNN Training at Scale

Arxiv

0+阅读 · 3月26日

Layered Quantum Architecture Search for 3D Point Cloud Classification

Arxiv

0+阅读 · 3月20日

The Expressive Power of Graph Neural Networks: A Survey

Arxiv

10+阅读 · 2023年8月16日

相关基金

高性能低比特视觉搜索及芯片结构研究

国家自然科学基金

1+阅读 · 2016年12月31日

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

面向物联网搜索的群智感知关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

利用连续变量多组份纠缠态实现经典和量子算法

国家自然科学基金

0+阅读 · 2015年12月31日

基于金纳米棒的高性能微纳传感阵列的结构设计和机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

9+阅读 · 2015年12月31日

神经形态多核处理器的架构模型研究

国家自然科学基金

3+阅读 · 2015年12月31日

状态空间搜索的anytime模式及其高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

动态Gr？bner 基与GVW算法

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员