Unifying Masked Diffusion Models with Various Generation Orders and Beyond - 专知论文

会员服务 ·

0

掩码 · International Conference on Mobile Data Management · 扩散模型 · 潜在 · ARM ·

Unifying Masked Diffusion Models with Various Generation Orders and Beyond

翻译：统一具有多种生成顺序的掩码扩散模型及其扩展

Chunsan Hong,Sanghyun Lee,Jong Chul Ye

from arxiv, Preprint

Masked diffusion models (MDMs) are a potential alternative to autoregressive models (ARMs) for language generation, but generation quality depends critically on the generation order. Prior work either hard-codes an ordering (e.g., blockwise left-to-right) or learns an ordering policy for a pretrained MDM, which incurs extra cost and can yield suboptimal solutions due to the two-stage optimization. Motivated by this, we propose order-expressive masked diffusion model (OeMDM) for a broad class of diffusion generative processes with various generation orders, enabling the interpretation of MDM, ARM, and block diffusion in a single framework. Furthermore, building on OeMDM, we introduce learnable-order masked diffusion model (LoMDM), which jointly learns the generation ordering and diffusion backbone through a single objective from scratch, enabling the diffusion model to generate text in context-dependent ordering. Empirically, we confirm that LoMDM outperforms various discrete diffusion models across multiple language modeling benchmarks.

翻译：掩码扩散模型（MDMs）是自回归模型（ARMs）在语言生成领域的一种潜在替代方案，但其生成质量严重依赖于生成顺序。先前的研究要么硬编码一种顺序（例如，块状从左到右），要么为预训练的MDM学习一个顺序策略，这会产生额外成本，并且由于两阶段优化可能导致次优解。受此启发，我们提出了顺序可表达的掩码扩散模型（OeMDM），适用于具有多种生成顺序的广泛扩散生成过程，从而能够在单一框架内解释MDM、ARM和块扩散。此外，基于OeMDM，我们引入了可学习顺序的掩码扩散模型（LoMDM），它通过单一目标从头开始联合学习生成顺序和扩散主干网络，使扩散模型能够根据上下文相关的顺序生成文本。实证结果表明，LoMDM在多个语言建模基准测试中优于各种离散扩散模型。

0

相关内容

内省扩散语言模型

内省扩散语言模型

专知会员服务

11+阅读 · 4月14日

用于强化学习的扩散模型：基础、分类与发展

用于强化学习的扩散模型：基础、分类与发展

专知会员服务

23+阅读 · 2025年10月15日

【NeurIPS2025】基于卷积解码与拒斥式微调的快速流畅扩散语言模型

【NeurIPS2025】基于卷积解码与拒斥式微调的快速流畅扩散语言模型

专知会员服务

12+阅读 · 2025年9月21日

扩散语言模型综述

扩散语言模型综述

专知会员服务

19+阅读 · 2025年8月15日

用于语言生成的离散扩散模型

用于语言生成的离散扩散模型

专知会员服务

12+阅读 · 2025年7月10日

统一的多模态理解与生成模型：进展、挑战与机遇

统一的多模态理解与生成模型：进展、挑战与机遇

专知会员服务

31+阅读 · 2025年5月6日

生成式人工智能的扩散模型概述

生成式人工智能的扩散模型概述

专知会员服务

66+阅读 · 2024年12月8日

多模态可控扩散模型综述

多模态可控扩散模型综述

专知会员服务

39+阅读 · 2024年7月20日

扩散模型概述：应用、引导生成、统计率和优化

扩散模型概述：应用、引导生成、统计率和优化

专知会员服务

47+阅读 · 2024年4月14日

视觉的有效扩散模型综述

视觉的有效扩散模型综述

专知会员服务

97+阅读 · 2022年10月20日

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

知识图谱嵌入的Translate模型汇总（TransE，TransH，TransR，TransD）

知识图谱嵌入的Translate模型汇总（TransE，TransH，TransR，TransD）

深度学习自然语言处理

31+阅读 · 2020年6月12日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

一文看懂AutoEncoder模型演进图谱

一文看懂AutoEncoder模型演进图谱

AINLP

12+阅读 · 2019年6月17日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

变分自编码器VAE：一步到位的聚类方案

变分自编码器VAE：一步到位的聚类方案

PaperWeekly

25+阅读 · 2018年9月18日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

高容错能力的阵列纠删码模型研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于有限元方法的反应扩散种群模型斑图数值模拟研究

国家自然科学基金

0+阅读 · 2015年12月31日

几类密码方案的格分析优化技术

国家自然科学基金

1+阅读 · 2015年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

一类带对流项的反应扩散系统的定性分析

国家自然科学基金

0+阅读 · 2015年12月31日

随机文法作为通用统计模型的扩展

国家自然科学基金

1+阅读 · 2015年12月31日

基于Phase-type分布的多状态系统可靠性模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

量子码的构造

国家自然科学基金

1+阅读 · 2015年12月31日

扩散过程离散化形式下的若干统计问题的大偏差原理

国家自然科学基金

0+阅读 · 2014年12月31日

随机反应扩散种群模型动力学研究

国家自然科学基金

0+阅读 · 2014年12月31日

Improving Sampling for Masked Diffusion Models via Information Gain

Arxiv

0+阅读 · 3月18日

Omni-Diffusion: Unified Multimodal Understanding and Generation with Masked Discrete Diffusion

Arxiv

0+阅读 · 3月6日

Adaptation to Intrinsic Dependence in Diffusion Language Models

Arxiv

0+阅读 · 2月23日

Improving Sampling for Masked Diffusion Models via Information Gain

Arxiv

0+阅读 · 2月20日

Scaling Beyond Masked Diffusion Language Models

Arxiv

0+阅读 · 2月16日

TABES: Trajectory-Aware Backward-on-Entropy Steering for Masked Diffusion Models

Arxiv

0+阅读 · 2月11日

Remasking Discrete Diffusion Models with Inference-Time Scaling

Arxiv

0+阅读 · 2月7日

Diffusion-State Policy Optimization for Masked Diffusion Language Models

Arxiv

0+阅读 · 2月6日

Improving Diffusion Language Model Decoding through Joint Search in Generation Order and Token Space

Arxiv

0+阅读 · 2月5日

Understanding the Reversal Curse Mitigation in Masked Diffusion Models through Attention and Training Dynamics

Arxiv

0+阅读 · 2月2日

VIP会员

文章信息

相关主题

International Conference on Mobile Data Management

最新内容

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

专知会员服务

0+阅读 · 23分钟前

高效视频扩散模型：进展与挑战

高效视频扩散模型：进展与挑战

专知会员服务

0+阅读 · 25分钟前

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

3+阅读 · 今天6:14

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

2+阅读 · 今天5:59

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

4+阅读 · 今天5:54

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

3+阅读 · 今天5:51

《提升生成模型的安全性与保障》博士论文

《提升生成模型的安全性与保障》博士论文

专知会员服务

3+阅读 · 今天5:47

美国当前高超音速导弹发展概述

美国当前高超音速导弹发展概述

专知会员服务

4+阅读 · 4月19日

《高超音速武器：一项再度兴起的技术》120页slides

《高超音速武器：一项再度兴起的技术》120页slides

专知会员服务

10+阅读 · 4月19日

无人机蜂群建模与仿真方法

无人机蜂群建模与仿真方法

专知会员服务

11+阅读 · 4月19日

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

专知会员服务

4+阅读 · 4月19日

《量化反无人机系统对抗无人机蜂群效能的创新方法》

《量化反无人机系统对抗无人机蜂群效能的创新方法》

专知会员服务

13+阅读 · 4月19日

澳大利亚发布《国防战略（2026年）》

澳大利亚发布《国防战略（2026年）》

专知会员服务

6+阅读 · 4月19日

【CMU博士论文】迈向基于基础先验的 4D 感知研究

【CMU博士论文】迈向基于基础先验的 4D 感知研究

专知会员服务

8+阅读 · 4月19日

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

专知会员服务

19+阅读 · 4月19日

相关VIP内容

内省扩散语言模型

内省扩散语言模型

专知会员服务

11+阅读 · 4月14日

用于强化学习的扩散模型：基础、分类与发展

用于强化学习的扩散模型：基础、分类与发展

专知会员服务

23+阅读 · 2025年10月15日

【NeurIPS2025】基于卷积解码与拒斥式微调的快速流畅扩散语言模型

【NeurIPS2025】基于卷积解码与拒斥式微调的快速流畅扩散语言模型

专知会员服务

12+阅读 · 2025年9月21日

扩散语言模型综述

扩散语言模型综述

专知会员服务

19+阅读 · 2025年8月15日

用于语言生成的离散扩散模型

用于语言生成的离散扩散模型

专知会员服务

12+阅读 · 2025年7月10日

统一的多模态理解与生成模型：进展、挑战与机遇

统一的多模态理解与生成模型：进展、挑战与机遇

专知会员服务

31+阅读 · 2025年5月6日

生成式人工智能的扩散模型概述

生成式人工智能的扩散模型概述

专知会员服务

66+阅读 · 2024年12月8日

多模态可控扩散模型综述

多模态可控扩散模型综述

专知会员服务

39+阅读 · 2024年7月20日

扩散模型概述：应用、引导生成、统计率和优化

扩散模型概述：应用、引导生成、统计率和优化

专知会员服务

47+阅读 · 2024年4月14日

视觉的有效扩散模型综述

视觉的有效扩散模型综述

专知会员服务

97+阅读 · 2022年10月20日

热门VIP内容

开通专知VIP会员享更多权益服务

高效视频扩散模型：进展与挑战

军事通信系统与设备的技术演进综述

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

乌克兰前线的五项创新

相关资讯

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

知识图谱嵌入的Translate模型汇总（TransE，TransH，TransR，TransD）

知识图谱嵌入的Translate模型汇总（TransE，TransH，TransR，TransD）

深度学习自然语言处理

31+阅读 · 2020年6月12日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

一文看懂AutoEncoder模型演进图谱

一文看懂AutoEncoder模型演进图谱

AINLP

12+阅读 · 2019年6月17日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

变分自编码器VAE：一步到位的聚类方案

变分自编码器VAE：一步到位的聚类方案

PaperWeekly

25+阅读 · 2018年9月18日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

相关论文

Improving Sampling for Masked Diffusion Models via Information Gain

Arxiv

0+阅读 · 3月18日

Omni-Diffusion: Unified Multimodal Understanding and Generation with Masked Discrete Diffusion

Arxiv

0+阅读 · 3月6日

Adaptation to Intrinsic Dependence in Diffusion Language Models

Arxiv

0+阅读 · 2月23日

Improving Sampling for Masked Diffusion Models via Information Gain

Arxiv

0+阅读 · 2月20日

Scaling Beyond Masked Diffusion Language Models

Arxiv

0+阅读 · 2月16日

TABES: Trajectory-Aware Backward-on-Entropy Steering for Masked Diffusion Models

Arxiv

0+阅读 · 2月11日

Remasking Discrete Diffusion Models with Inference-Time Scaling

Arxiv

0+阅读 · 2月7日

Diffusion-State Policy Optimization for Masked Diffusion Language Models

Arxiv

0+阅读 · 2月6日

Improving Diffusion Language Model Decoding through Joint Search in Generation Order and Token Space

Arxiv

0+阅读 · 2月5日

Understanding the Reversal Curse Mitigation in Masked Diffusion Models through Attention and Training Dynamics

Arxiv

0+阅读 · 2月2日

相关基金

高容错能力的阵列纠删码模型研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于有限元方法的反应扩散种群模型斑图数值模拟研究

国家自然科学基金

0+阅读 · 2015年12月31日

几类密码方案的格分析优化技术

国家自然科学基金

1+阅读 · 2015年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

一类带对流项的反应扩散系统的定性分析

国家自然科学基金

0+阅读 · 2015年12月31日

随机文法作为通用统计模型的扩展

国家自然科学基金

1+阅读 · 2015年12月31日

基于Phase-type分布的多状态系统可靠性模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

量子码的构造

国家自然科学基金

1+阅读 · 2015年12月31日

扩散过程离散化形式下的若干统计问题的大偏差原理

国家自然科学基金

0+阅读 · 2014年12月31日

随机反应扩散种群模型动力学研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员