MIDAS: Mosaic Input-Specific Differentiable Architecture Search - 专知论文

会员服务 ·

0

搜索 · 搜索空间 · CIFAR-10 · DARTS · 神经架构 ·

MIDAS: Mosaic Input-Specific Differentiable Architecture Search

翻译：MIDAS：面向马赛克输入的可微分架构搜索

Konstanty Subbotko

Differentiable Neural Architecture Search (NAS) provides efficient, gradient-based methods for automatically designing neural networks, yet its adoption remains limited in practice. We present MIDAS, a novel approach that modernizes DARTS by replacing static architecture parameters with dynamic, input-specific parameters computed via self-attention. To improve robustness, MIDAS (i) localizes the architecture selection by computing it separately for each spatial patch of the activation map, and (ii) introduces a parameter-free, topology-aware search space that models node connectivity and simplifies selecting the two incoming edges per node. We evaluate MIDAS on the DARTS, NAS-Bench-201, and RDARTS search spaces. In DARTS, it reaches 97.42% top-1 on CIFAR-10 and 83.38% on CIFAR-100. In NAS-Bench-201, it consistently finds globally optimal architectures. In RDARTS, it sets the state of the art on two of four search spaces on CIFAR-10. We further analyze why MIDAS works, showing that patchwise attention improves discrimination among candidate operations, and the resulting input-specific parameter distributions are class-aware and predominantly unimodal, providing reliable guidance for decoding.

翻译：可微分神经架构搜索（NAS）提供了基于梯度的有效方法来自动设计神经网络，但其在实际应用中的采用仍然有限。我们提出MIDAS，这是一种新颖的方法，它通过将静态架构参数替换为由自注意力计算的动态、输入特定参数，从而现代化DARTS。为提高鲁棒性，MIDAS（i）通过为激活图的每个空间补丁单独计算架构选择来实现局部化选择；（ii）引入了一种无参数、拓扑感知的搜索空间，该空间建模节点连接性并简化了每个节点的两条入边的选择。我们在DARTS、NAS-Bench-201和RDARTS搜索空间上评估MIDAS。在DARTS中，它在CIFAR-10上达到97.42%的top-1准确率，在CIFAR-100上达到83.38%。在NAS-Bench-201中，它始终能找到全局最优架构。在RDARTS中，它在CIFAR-10的四个搜索空间中的两个上取得了最先进的性能。我们进一步分析了MIDAS有效的原因，表明补丁级注意力提高了候选操作之间的区分度，并且产生的输入特定参数分布具有类别感知性且主要为单峰分布，为解码提供了可靠的指导。

0

相关内容

互联网

【NeurIPS2025】MIDAS：一种基于错配的用于失衡多模态学习的数据增强策略

【NeurIPS2025】MIDAS：一种基于错配的用于失衡多模态学习的数据增强策略

专知会员服务

10+阅读 · 2025年10月1日

DARPA“对不同方案的主动解释”（AIDA）计划《Opera：面向运行的概率提取、推理和分析》美国空军2023最新70页技术报告

DARPA“对不同方案的主动解释”（AIDA）计划《Opera：面向运行的概率提取、推理和分析》美国空军2023最新70页技术报告

专知会员服务

58+阅读 · 2023年4月21日

【CMU博士论文】神经架构搜索的搜索算法和搜索空间，141页pdf

【CMU博士论文】神经架构搜索的搜索算法和搜索空间，141页pdf

专知会员服务

39+阅读 · 2022年12月7日

【美国DARPA资助、多模态知识图谱构建】《通过深度图生成和推理实现人类活动的多模态语义映射》美国空军研究实验室技术报告

【美国DARPA资助、多模态知识图谱构建】《通过深度图生成和推理实现人类活动的多模态语义映射》美国空军研究实验室技术报告

专知会员服务

76+阅读 · 2022年8月25日

【Google AI-Yi Tay】Transformer记忆为可微搜索索引”(DSI)

【Google AI-Yi Tay】Transformer记忆为可微搜索索引”(DSI)

专知会员服务

10+阅读 · 2022年3月4日

【ICML2021】无训练神经架构搜索

专知会员服务

20+阅读 · 2021年9月16日

最新《神经架构搜索NAS》报告，附46页ppt与视频

最新《神经架构搜索NAS》报告，附46页ppt与视频

专知会员服务

37+阅读 · 2020年12月30日

DARPA可解释人工智能

DARPA可解释人工智能

专知会员服务

134+阅读 · 2020年12月22日

【NeurIPS 2020 】神经网络结构生成优化

【NeurIPS 2020 】神经网络结构生成优化

专知会员服务

21+阅读 · 2020年10月24日

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

专知会员服务

31+阅读 · 2019年11月25日

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

27+阅读 · 2022年11月24日

【WWW2020】结构深度聚类网络， Structural Deep Clustering Network，北京邮电大学

【WWW2020】结构深度聚类网络， Structural Deep Clustering Network，北京邮电大学

专知

31+阅读 · 2020年2月19日

【Google出品】神经网络结构搜索NAS，41页ppt了解最新进展

【Google出品】神经网络结构搜索NAS，41页ppt了解最新进展

专知

27+阅读 · 2019年11月21日

最新246篇自动化神经网络搜索（NAS）论文，附完整列表PDF下载

最新246篇自动化神经网络搜索（NAS）论文，附完整列表PDF下载

专知

17+阅读 · 2019年9月20日

【NeurIPS 2019】7篇自动化神经网络搜索(NAS)论文简读

【NeurIPS 2019】7篇自动化神经网络搜索(NAS)论文简读

专知

31+阅读 · 2019年9月12日

深度解读：小米AI实验室AutoML团队最新成果FairNAS

深度解读：小米AI实验室AutoML团队最新成果FairNAS

PaperWeekly

32+阅读 · 2019年7月11日

谷歌大脑重磅研究：神经结构搜索发现全新特征金字塔架构，超越Mask R-CNN等

谷歌大脑重磅研究：神经结构搜索发现全新特征金字塔架构，超越Mask R-CNN等

新智元

12+阅读 · 2019年4月19日

Github项目推荐 | Manopth - PyTorch的MANO层，生成手部网格作为可微分层

Github项目推荐 | Manopth - PyTorch的MANO层，生成手部网格作为可微分层

AI研习社

10+阅读 · 2019年3月20日

小米开源FALSR算法：快速精确轻量级的超分辨率模型

小米开源FALSR算法：快速精确轻量级的超分辨率模型

AI100

11+阅读 · 2019年1月31日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

面向图像网状结构体的蚁群分割算法

国家自然科学基金

0+阅读 · 2017年12月31日

从仿生的角度设计用于指导构建组织支架的单元细胞模块、有限元分析以及3D打印工艺路径规划

国家自然科学基金

0+阅读 · 2015年12月31日

纳米分辨率显微视频的像素级数据挖掘研究

国家自然科学基金

0+阅读 · 2015年12月31日

CS-MIMO雷达中测量矩阵的构造方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于分布式压缩感知的MIMO雷达弱小目标定位与跟踪方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

零辅助数据MIMO雷达自适应检测问题研究

国家自然科学基金

7+阅读 · 2015年12月31日

Massive MIMO 系统中接收端低复杂度检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

声场驱动的纳米马达的结构特征及操控技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于分层稀疏表示的微动目标ISAR三维层析成像技术

国家自然科学基金

1+阅读 · 2015年12月31日

微分代数方程中的误差可控计算理论与算法

国家自然科学基金

0+阅读 · 2014年12月31日

JAX-BEM: Gradient-Based Acoustic Shape Optimisation via a Differentiable Boundary Element Method

Arxiv

0+阅读 · 4月23日

G-ICSO-NAS: Shifting Gears between Gradient and Swarm for Robust Neural Architecture Search

Arxiv

0+阅读 · 4月1日

DaiSy: A Library for Scalable Data Series Similarity Search

Arxiv

0+阅读 · 3月29日

MorphoNAS: Embryogenic Neural Architecture Search Through Morphogen-Guided Development

Arxiv

0+阅读 · 3月24日

MINISA: Minimal Instruction Set Architecture for Next-gen Reconfigurable Inference Accelerator

Arxiv

0+阅读 · 3月21日

AgenticRS-EnsNAS: Ensemble-Decoupled Self-Evolving Architecture Search

Arxiv

0+阅读 · 3月20日

Resource-Efficient Iterative LLM-Based NAS with Feedback Memory

Arxiv

0+阅读 · 3月12日

RADAR: Closed-Loop Robotic Data Generation via Semantic Planning and Autonomous Causal Environment Reset

Arxiv

0+阅读 · 3月12日

MIDAS: Multi-Image Dispersion and Semantic Reconstruction for Jailbreaking MLLMs

Arxiv

0+阅读 · 2月28日

GauS: Differentiable Scheduling Optimization via Gaussian Reparameterization

Arxiv

0+阅读 · 2月23日

VIP会员

文章信息

相关主题

最新内容

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

专知会员服务

10+阅读 · 7月16日

《无人地面战车（UGV）的崛起》报告

《无人地面战车（UGV）的崛起》报告

专知会员服务

6+阅读 · 7月16日

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

专知会员服务

5+阅读 · 7月16日

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

专知会员服务

11+阅读 · 7月16日

美陆军任务式指挥人工智能解决方案

美陆军任务式指挥人工智能解决方案

专知会员服务

10+阅读 · 7月16日

ICML 2026 | 理论级自动形式化：从孤立命题到统一形式化知识库

ICML 2026 | 理论级自动形式化：从孤立命题到统一形式化知识库

专知会员服务

7+阅读 · 7月16日

综述 | 现代智能体自我改进，从模型更新到脚手架演化

综述 | 现代智能体自我改进，从模型更新到脚手架演化

专知会员服务

13+阅读 · 7月16日

美国陆军宣布“项目融合-顶点6”：现代化进程的关键里程碑

美国陆军宣布“项目融合-顶点6”：现代化进程的关键里程碑

专知会员服务

12+阅读 · 7月15日

五角大楼新版反无人机手册：内容解析与战略影响（附手册100页原件）

五角大楼新版反无人机手册：内容解析与战略影响（附手册100页原件）

专知会员服务

15+阅读 · 7月15日

《军事基地能源韧性与经济性权衡评估方法研究》

《军事基地能源韧性与经济性权衡评估方法研究》

专知会员服务

7+阅读 · 7月15日

ACM MM 2026 | UNIT：释放大语言模型在图持续学习中的潜力

ACM MM 2026 | UNIT：释放大语言模型在图持续学习中的潜力

专知会员服务

9+阅读 · 7月15日

综述 | 具身视觉语言导航：系统综述与真实世界评测

综述 | 具身视觉语言导航：系统综述与真实世界评测

专知会员服务

12+阅读 · 7月15日

应对第1、2类无人机威胁的推荐战术、技术与程序

应对第1、2类无人机威胁的推荐战术、技术与程序

专知会员服务

11+阅读 · 7月15日

《反制多无人机集群攻城：序贯斯塔克伯格安全博弈方法研究》59页

《反制多无人机集群攻城：序贯斯塔克伯格安全博弈方法研究》59页

专知会员服务

13+阅读 · 7月15日

博士论文 | 可扩展、自我改进的大语言模型智能体

博士论文 | 可扩展、自我改进的大语言模型智能体

专知会员服务

15+阅读 · 7月14日

相关VIP内容

【NeurIPS2025】MIDAS：一种基于错配的用于失衡多模态学习的数据增强策略

【NeurIPS2025】MIDAS：一种基于错配的用于失衡多模态学习的数据增强策略

专知会员服务

10+阅读 · 2025年10月1日

DARPA“对不同方案的主动解释”（AIDA）计划《Opera：面向运行的概率提取、推理和分析》美国空军2023最新70页技术报告

DARPA“对不同方案的主动解释”（AIDA）计划《Opera：面向运行的概率提取、推理和分析》美国空军2023最新70页技术报告

专知会员服务

58+阅读 · 2023年4月21日

【CMU博士论文】神经架构搜索的搜索算法和搜索空间，141页pdf

【CMU博士论文】神经架构搜索的搜索算法和搜索空间，141页pdf

专知会员服务

39+阅读 · 2022年12月7日

【美国DARPA资助、多模态知识图谱构建】《通过深度图生成和推理实现人类活动的多模态语义映射》美国空军研究实验室技术报告

【美国DARPA资助、多模态知识图谱构建】《通过深度图生成和推理实现人类活动的多模态语义映射》美国空军研究实验室技术报告

专知会员服务

76+阅读 · 2022年8月25日

【Google AI-Yi Tay】Transformer记忆为可微搜索索引”(DSI)

【Google AI-Yi Tay】Transformer记忆为可微搜索索引”(DSI)

专知会员服务

10+阅读 · 2022年3月4日

【ICML2021】无训练神经架构搜索

专知会员服务

20+阅读 · 2021年9月16日

最新《神经架构搜索NAS》报告，附46页ppt与视频

最新《神经架构搜索NAS》报告，附46页ppt与视频

专知会员服务

37+阅读 · 2020年12月30日

DARPA可解释人工智能

DARPA可解释人工智能

专知会员服务

134+阅读 · 2020年12月22日

【NeurIPS 2020 】神经网络结构生成优化

【NeurIPS 2020 】神经网络结构生成优化

专知会员服务

21+阅读 · 2020年10月24日

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

专知会员服务

31+阅读 · 2019年11月25日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人地面战车（UGV）的崛起》报告

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

相关资讯

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

27+阅读 · 2022年11月24日

【WWW2020】结构深度聚类网络， Structural Deep Clustering Network，北京邮电大学

【WWW2020】结构深度聚类网络， Structural Deep Clustering Network，北京邮电大学

专知

31+阅读 · 2020年2月19日

【Google出品】神经网络结构搜索NAS，41页ppt了解最新进展

【Google出品】神经网络结构搜索NAS，41页ppt了解最新进展

专知

27+阅读 · 2019年11月21日

最新246篇自动化神经网络搜索（NAS）论文，附完整列表PDF下载

最新246篇自动化神经网络搜索（NAS）论文，附完整列表PDF下载

专知

17+阅读 · 2019年9月20日

【NeurIPS 2019】7篇自动化神经网络搜索(NAS)论文简读

【NeurIPS 2019】7篇自动化神经网络搜索(NAS)论文简读

专知

31+阅读 · 2019年9月12日

深度解读：小米AI实验室AutoML团队最新成果FairNAS

深度解读：小米AI实验室AutoML团队最新成果FairNAS

PaperWeekly

32+阅读 · 2019年7月11日

谷歌大脑重磅研究：神经结构搜索发现全新特征金字塔架构，超越Mask R-CNN等

谷歌大脑重磅研究：神经结构搜索发现全新特征金字塔架构，超越Mask R-CNN等

新智元

12+阅读 · 2019年4月19日

Github项目推荐 | Manopth - PyTorch的MANO层，生成手部网格作为可微分层

Github项目推荐 | Manopth - PyTorch的MANO层，生成手部网格作为可微分层

AI研习社

10+阅读 · 2019年3月20日

小米开源FALSR算法：快速精确轻量级的超分辨率模型

小米开源FALSR算法：快速精确轻量级的超分辨率模型

AI100

11+阅读 · 2019年1月31日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

相关论文

JAX-BEM: Gradient-Based Acoustic Shape Optimisation via a Differentiable Boundary Element Method

Arxiv

0+阅读 · 4月23日

G-ICSO-NAS: Shifting Gears between Gradient and Swarm for Robust Neural Architecture Search

Arxiv

0+阅读 · 4月1日

DaiSy: A Library for Scalable Data Series Similarity Search

Arxiv

0+阅读 · 3月29日

MorphoNAS: Embryogenic Neural Architecture Search Through Morphogen-Guided Development

Arxiv

0+阅读 · 3月24日

MINISA: Minimal Instruction Set Architecture for Next-gen Reconfigurable Inference Accelerator

Arxiv

0+阅读 · 3月21日

AgenticRS-EnsNAS: Ensemble-Decoupled Self-Evolving Architecture Search

Arxiv

0+阅读 · 3月20日

Resource-Efficient Iterative LLM-Based NAS with Feedback Memory

Arxiv

0+阅读 · 3月12日

RADAR: Closed-Loop Robotic Data Generation via Semantic Planning and Autonomous Causal Environment Reset

Arxiv

0+阅读 · 3月12日

MIDAS: Multi-Image Dispersion and Semantic Reconstruction for Jailbreaking MLLMs

Arxiv

0+阅读 · 2月28日

GauS: Differentiable Scheduling Optimization via Gaussian Reparameterization

Arxiv

0+阅读 · 2月23日

相关基金

面向图像网状结构体的蚁群分割算法

国家自然科学基金

0+阅读 · 2017年12月31日

从仿生的角度设计用于指导构建组织支架的单元细胞模块、有限元分析以及3D打印工艺路径规划

国家自然科学基金

0+阅读 · 2015年12月31日

纳米分辨率显微视频的像素级数据挖掘研究

国家自然科学基金

0+阅读 · 2015年12月31日

CS-MIMO雷达中测量矩阵的构造方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于分布式压缩感知的MIMO雷达弱小目标定位与跟踪方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

零辅助数据MIMO雷达自适应检测问题研究

国家自然科学基金

7+阅读 · 2015年12月31日

Massive MIMO 系统中接收端低复杂度检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

声场驱动的纳米马达的结构特征及操控技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于分层稀疏表示的微动目标ISAR三维层析成像技术

国家自然科学基金

1+阅读 · 2015年12月31日

微分代数方程中的误差可控计算理论与算法

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员