DGPO: RL-Steered Graph Diffusion for Neural Architecture Generation - 专知论文

会员服务 ·

0

神经架构 · 结构 · 有向 · 微调 · 强化学习 ·

DGPO: RL-Steered Graph Diffusion for Neural Architecture Generation

翻译：DGPO：基于强化学习引导的图扩散用于神经架构生成

Aleksei Liuliakov,Luca Hermes,Barbara Hammer

from arxiv, Submitted to IJCNN 2026 (IEEE WCCI). 6 pages, 4 figures

Reinforcement learning fine-tuning has proven effective for steering generative diffusion models toward desired properties in image and molecular domains. Graph diffusion models have similarly been applied to combinatorial structure generation, including neural architecture search (NAS). However, neural architectures are directed acyclic graphs (DAGs) where edge direction encodes functional semantics such as data flow-information that existing graph diffusion methods, designed for undirected structures, discard. We propose Directed Graph Policy Optimization (DGPO), which extends reinforcement learning fine-tuning of discrete graph diffusion models to DAGs via topological node ordering and positional encoding. Validated on NAS-Bench-101 and NAS-Bench-201, DGPO matches the benchmark optimum on all three NAS-Bench-201 tasks (91.61%, 73.49%, 46.77%). The central finding is that the model learns transferable structural priors: pretrained on only 7% of the search space, it generates near-oracle architectures after fine-tuning, within 0.32 percentage points of the full-data model and extrapolating 7.3 percentage points beyond its training ceiling. Bidirectional control experiments confirm genuine reward-driven steering, with inverse optimization reaching near random-chance accuracy (9.5%). These results demonstrate that reinforcement learning-steered discrete diffusion, once extended to handle directionality, provides a controllable generative framework for directed combinatorial structures.

翻译：强化学习微调已被证明能有效引导生成式扩散模型在图像和分子领域朝向期望的属性发展。图扩散模型同样被应用于组合结构生成，包括神经架构搜索（NAS）。然而，神经架构是有向无环图（DAGs），其中边的方向编码了功能语义（如数据流信息），而现有的、为无向结构设计的图扩散方法丢弃了这些信息。我们提出了有向图策略优化（DGPO），它通过拓扑节点排序和位置编码，将离散图扩散模型的强化学习微调扩展至DAGs。在NAS-Bench-101和NAS-Bench-201上的验证表明，DGPO在所有三项NAS-Bench-201任务（91.61%、73.49%、46.77%）上均达到了基准最优值。核心发现是，该模型学习了可迁移的结构先验：仅在7%的搜索空间上进行预训练后，经过微调便能生成接近最优的架构，其性能与全数据模型相差仅0.32个百分点，并超越了其训练上限7.3个百分点。双向控制实验证实了真正的奖励驱动引导，逆向优化达到了接近随机猜测的准确率（9.5%）。这些结果表明，强化学习引导的离散扩散方法一旦扩展至能够处理方向性，便为有向组合结构提供了一个可控的生成框架。

1

相关内容

神经架构

【KDD2024】面向课程图稀疏化的轻量级图神经网络搜索

【KDD2024】面向课程图稀疏化的轻量级图神经网络搜索

专知会员服务

19+阅读 · 2024年6月25日

【KDD2023】GraphGLOW：面向图神经网络的通用和可泛化的结构学习

【KDD2023】GraphGLOW：面向图神经网络的通用和可泛化的结构学习

专知会员服务

30+阅读 · 2023年6月24日

【AI4Science】生成式AI怎么做图生成？KAIST等最新《图扩散模型》综述，详述生成式AI在分子、蛋白质和材料科学的应用

【AI4Science】生成式AI怎么做图生成？KAIST等最新《图扩散模型》综述，详述生成式AI在分子、蛋白质和材料科学的应用

专知会员服务

72+阅读 · 2023年4月10日

【芝加博士论文】图表示学习，图上的深度生成模型，组等变分子神经网络和多分辨率机器学习

【芝加博士论文】图表示学习，图上的深度生成模型，组等变分子神经网络和多分辨率机器学习

专知会员服务

33+阅读 · 2022年11月5日

GNN与RL如何结合？KSU大学最新《基于图神经网络的强化学习》综述，阐述RL+GNN算法与应用

GNN与RL如何结合？KSU大学最新《基于图神经网络的强化学习》综述，阐述RL+GNN算法与应用

专知会员服务

84+阅读 · 2022年6月29日

[ICML2021]. GRAND：图神经扩散

专知会员服务

27+阅读 · 2021年7月11日

到底什么是GNN？《图神经网络理论基础》这份DeepMind大牛Petar讲授，附96页ppt与视频

到底什么是GNN？《图神经网络理论基础》这份DeepMind大牛Petar讲授，附96页ppt与视频

专知会员服务

87+阅读 · 2021年2月26日

具有组合核的图神经网络，Graph Neural Networks with Composite Kernels

具有组合核的图神经网络，Graph Neural Networks with Composite Kernels

专知会员服务

59+阅读 · 2020年5月20日

【论文】图神经网络有多强大？（How Powerful are Graph Neural Networks?），麻省理工学院研究生| Keyulu Xu，哈尔滨工业大学（深圳）助理教授| WeiHua Hu

【论文】图神经网络有多强大？（How Powerful are Graph Neural Networks?），麻省理工学院研究生| Keyulu Xu，哈尔滨工业大学（深圳）助理教授| WeiHua Hu

专知会员服务

65+阅读 · 2019年12月12日

【CCL 2019】表示学习--自然语言处理中的图神经网络（Graph Neural Networks in NLP），西湖大学长聘副教授张岳

【CCL 2019】表示学习--自然语言处理中的图神经网络（Graph Neural Networks in NLP），西湖大学长聘副教授张岳

专知会员服务

64+阅读 · 2019年11月12日

综述| 当图神经网络遇上强化学习

综述| 当图神经网络遇上强化学习

图与推荐

35+阅读 · 2022年7月1日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

17+阅读 · 2021年1月24日

【NeurIPS 2020】通过双向传播的可扩展图神经网络

【NeurIPS 2020】通过双向传播的可扩展图神经网络

专知

12+阅读 · 2020年11月3日

【KDD2020】更深的图神经网络，Towards Deeper Graph Neural Networks

【KDD2020】更深的图神经网络，Towards Deeper Graph Neural Networks

专知

45+阅读 · 2020年7月22日

当深度强化学习遇见图神经网络

当深度强化学习遇见图神经网络

专知

227+阅读 · 2019年10月21日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

专知

45+阅读 · 2019年3月26日

Github上热门图深度学习（GraphDL）源码与工业级框架

Github上热门图深度学习（GraphDL）源码与工业级框架

专知

15+阅读 · 2019年3月15日

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

论智

26+阅读 · 2018年10月30日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

40+阅读 · 2015年12月31日

从仿生的角度设计用于指导构建组织支架的单元细胞模块、有限元分析以及3D打印工艺路径规划

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度卷积神经网络的多源遥感图像时空融合方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

基于3D稀疏表示的多模态神经导航关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

有向图谱理论在图像匹配中应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

DGPO: RL-Steered Graph Diffusion for Neural Architecture Generation

Arxiv

0+阅读 · 3月30日

Controllable Graph Generation with Diffusion Models via Inference-Time Tree Search Guidance

Arxiv

0+阅读 · 3月17日

Diffusion Reinforcement Learning via Centered Reward Distillation

Arxiv

0+阅读 · 3月14日

HOG-Diff: Higher-Order Guided Diffusion for Graph Generation

Arxiv

0+阅读 · 3月12日

GraphKeeper: Graph Domain-Incremental Learning via Knowledge Disentanglement and Preservation

Arxiv

0+阅读 · 3月10日

Do We Need All the Synthetic Data? Targeted Image Augmentation via Diffusion Models

Arxiv

0+阅读 · 3月4日

Revisiting Graph Neural Networks for Graph-level Tasks: Taxonomy, Empirical Study, and Future Directions

Arxiv

0+阅读 · 2月22日

Graph Neural Networks Powered by Encoder Embedding for Improved Node Learning

Arxiv

0+阅读 · 2月21日

Diffusion Models for Reinforcement Learning: A Survey

Arxiv

22+阅读 · 2023年11月2日

The Expressive Power of Graph Neural Networks: A Survey

Arxiv

10+阅读 · 2023年8月16日

VIP会员

文章信息

相关主题

最新内容

DeepSeek 版Claude Code，免费小白安装教程来了！

DeepSeek 版Claude Code，免费小白安装教程来了！

专知会员服务

9+阅读 · 5月5日

【ICML Spotlight 2026】 T²PO: 不确定性引导的探索控制框架，实现稳定多轮Agentic强化学习

【ICML Spotlight 2026】 T²PO: 不确定性引导的探索控制框架，实现稳定多轮Agentic强化学习

专知会员服务

5+阅读 · 5月5日

基础模型驱动的工业智能体：技术成熟度、能力变迁与未竟之挑战

基础模型驱动的工业智能体：技术成熟度、能力变迁与未竟之挑战

专知会员服务

6+阅读 · 5月5日

《机动炮兵的演进与未来：技术进步、历史沿革与炮兵作战前瞻》

《机动炮兵的演进与未来：技术进步、历史沿革与炮兵作战前瞻》

专知会员服务

7+阅读 · 5月5日

《火炮弹药快速效能建模：提升互操作性与技术优势》（报告）

《火炮弹药快速效能建模：提升互操作性与技术优势》（报告）

专知会员服务

9+阅读 · 5月5日

《美空军条令出版物 2-0：情报（2026版）》

《美空军条令出版物 2-0：情报（2026版）》

专知会员服务

14+阅读 · 5月5日

美陆军“飞蝇陷阱5.0”项目将新兴技术交到作战人员手中

美陆军“飞蝇陷阱5.0”项目将新兴技术交到作战人员手中

专知会员服务

6+阅读 · 5月5日

帕兰提尔 Gotham：一个游戏规则改变器

帕兰提尔 Gotham：一个游戏规则改变器

专知会员服务

9+阅读 · 5月5日

【ICML 2026】用测试时训练线性化视觉Transformer：T⁵ 实现 Softmax 注意力到线性复杂度的快速转换

【ICML 2026】用测试时训练线性化视觉Transformer：T⁵ 实现 Softmax 注意力到线性复杂度的快速转换

专知会员服务

3+阅读 · 5月5日

【AAAI 2026】大模型做知识蒸馏：CMM将LLM特征拆解给小模型协同学习

【AAAI 2026】大模型做知识蒸馏：CMM将LLM特征拆解给小模型协同学习

专知会员服务

3+阅读 · 5月5日

【ICML Spotlight 2026 】NonZero：交互引导探索的多智能体蒙特卡洛树搜索

【ICML Spotlight 2026 】NonZero：交互引导探索的多智能体蒙特卡洛树搜索

专知会员服务

8+阅读 · 5月4日

【综述】机器人学习中的世界模型：全面综述

【综述】机器人学习中的世界模型：全面综述

专知会员服务

13+阅读 · 5月4日

伊朗的导弹-无人机行动及其对美国威慑的影响

伊朗的导弹-无人机行动及其对美国威慑的影响

专知会员服务

9+阅读 · 5月4日

《未来战术无人机系统案例研究：量身定制采办策略方法》100页报告

《未来战术无人机系统案例研究：量身定制采办策略方法》100页报告

专知会员服务

10+阅读 · 5月4日

战争贩子：2026年第一季度美国对中东潜在军售激增

战争贩子：2026年第一季度美国对中东潜在军售激增

专知会员服务

7+阅读 · 5月4日

相关VIP内容

【KDD2024】面向课程图稀疏化的轻量级图神经网络搜索

【KDD2024】面向课程图稀疏化的轻量级图神经网络搜索

专知会员服务

19+阅读 · 2024年6月25日

【KDD2023】GraphGLOW：面向图神经网络的通用和可泛化的结构学习

【KDD2023】GraphGLOW：面向图神经网络的通用和可泛化的结构学习

专知会员服务

30+阅读 · 2023年6月24日

【AI4Science】生成式AI怎么做图生成？KAIST等最新《图扩散模型》综述，详述生成式AI在分子、蛋白质和材料科学的应用

【AI4Science】生成式AI怎么做图生成？KAIST等最新《图扩散模型》综述，详述生成式AI在分子、蛋白质和材料科学的应用

专知会员服务

72+阅读 · 2023年4月10日

【芝加博士论文】图表示学习，图上的深度生成模型，组等变分子神经网络和多分辨率机器学习

【芝加博士论文】图表示学习，图上的深度生成模型，组等变分子神经网络和多分辨率机器学习

专知会员服务

33+阅读 · 2022年11月5日

GNN与RL如何结合？KSU大学最新《基于图神经网络的强化学习》综述，阐述RL+GNN算法与应用

GNN与RL如何结合？KSU大学最新《基于图神经网络的强化学习》综述，阐述RL+GNN算法与应用

专知会员服务

84+阅读 · 2022年6月29日

[ICML2021]. GRAND：图神经扩散

专知会员服务

27+阅读 · 2021年7月11日

到底什么是GNN？《图神经网络理论基础》这份DeepMind大牛Petar讲授，附96页ppt与视频

到底什么是GNN？《图神经网络理论基础》这份DeepMind大牛Petar讲授，附96页ppt与视频

专知会员服务

87+阅读 · 2021年2月26日

具有组合核的图神经网络，Graph Neural Networks with Composite Kernels

具有组合核的图神经网络，Graph Neural Networks with Composite Kernels

专知会员服务

59+阅读 · 2020年5月20日

【论文】图神经网络有多强大？（How Powerful are Graph Neural Networks?），麻省理工学院研究生| Keyulu Xu，哈尔滨工业大学（深圳）助理教授| WeiHua Hu

【论文】图神经网络有多强大？（How Powerful are Graph Neural Networks?），麻省理工学院研究生| Keyulu Xu，哈尔滨工业大学（深圳）助理教授| WeiHua Hu

专知会员服务

65+阅读 · 2019年12月12日

【CCL 2019】表示学习--自然语言处理中的图神经网络（Graph Neural Networks in NLP），西湖大学长聘副教授张岳

【CCL 2019】表示学习--自然语言处理中的图神经网络（Graph Neural Networks in NLP），西湖大学长聘副教授张岳

专知会员服务

64+阅读 · 2019年11月12日

热门VIP内容

开通专知VIP会员享更多权益服务

【ICML Spotlight 2026】 T²PO: 不确定性引导的探索控制框架，实现稳定多轮Agentic强化学习

《机动炮兵的演进与未来：技术进步、历史沿革与炮兵作战前瞻》

DeepSeek 版Claude Code，免费小白安装教程来了！

基础模型驱动的工业智能体：技术成熟度、能力变迁与未竟之挑战

相关资讯

综述| 当图神经网络遇上强化学习

综述| 当图神经网络遇上强化学习

图与推荐

35+阅读 · 2022年7月1日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

17+阅读 · 2021年1月24日

【NeurIPS 2020】通过双向传播的可扩展图神经网络

【NeurIPS 2020】通过双向传播的可扩展图神经网络

专知

12+阅读 · 2020年11月3日

【KDD2020】更深的图神经网络，Towards Deeper Graph Neural Networks

【KDD2020】更深的图神经网络，Towards Deeper Graph Neural Networks

专知

45+阅读 · 2020年7月22日

当深度强化学习遇见图神经网络

当深度强化学习遇见图神经网络

专知

227+阅读 · 2019年10月21日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

专知

45+阅读 · 2019年3月26日

Github上热门图深度学习（GraphDL）源码与工业级框架

Github上热门图深度学习（GraphDL）源码与工业级框架

专知

15+阅读 · 2019年3月15日

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

论智

26+阅读 · 2018年10月30日

相关论文

DGPO: RL-Steered Graph Diffusion for Neural Architecture Generation

Arxiv

0+阅读 · 3月30日

Controllable Graph Generation with Diffusion Models via Inference-Time Tree Search Guidance

Arxiv

0+阅读 · 3月17日

Diffusion Reinforcement Learning via Centered Reward Distillation

Arxiv

0+阅读 · 3月14日

HOG-Diff: Higher-Order Guided Diffusion for Graph Generation

Arxiv

0+阅读 · 3月12日

GraphKeeper: Graph Domain-Incremental Learning via Knowledge Disentanglement and Preservation

Arxiv

0+阅读 · 3月10日

Do We Need All the Synthetic Data? Targeted Image Augmentation via Diffusion Models

Arxiv

0+阅读 · 3月4日

Revisiting Graph Neural Networks for Graph-level Tasks: Taxonomy, Empirical Study, and Future Directions

Arxiv

0+阅读 · 2月22日

Graph Neural Networks Powered by Encoder Embedding for Improved Node Learning

Arxiv

0+阅读 · 2月21日

Diffusion Models for Reinforcement Learning: A Survey

Arxiv

22+阅读 · 2023年11月2日

The Expressive Power of Graph Neural Networks: A Survey

Arxiv

10+阅读 · 2023年8月16日

相关基金

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

40+阅读 · 2015年12月31日

从仿生的角度设计用于指导构建组织支架的单元细胞模块、有限元分析以及3D打印工艺路径规划

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度卷积神经网络的多源遥感图像时空融合方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

基于3D稀疏表示的多模态神经导航关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

有向图谱理论在图像匹配中应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员