Generating high-quality structured data such as JSON records, remains a fundamental challenge for large language models (LLMs), particularly when semantic richness must coexist with strict schema adherence. While autoregressive LLMs offer strong structural consistency, they often struggle with semantic variation and output diversity. In contrast, diffusion language models (DLMs) introduce powerful mechanisms for semantic richness and bidirectional decoding, yet lack the inductive biases needed for reliable structure preservation. We present Agents of Diffusion (AoD), a novel framework that unifies the generative flexibility of DLMs with the reasoning capabilities of autoregressive models through language-mediated reinforcement learning. AoD frames structured text generation as a multi-agent alignment process, where a prompt optimization agent collaborates with a judge agent to iteratively guide a DLM using natural language feedback. This approach enables controllable, schema-consistent generation without modifying model parameters or relying on handcrafted constraints. AoD advances the state of controllable generation by demonstrating that diffusion models, when supervised by cooperative agents, can achieve both high semantic novelty and structural fidelity. Across multiple structured data benchmarks, AoD consistently outperforms diffusion and autoregressive baselines, establishing a new path forward for structure-aware, diversity-enhanced text synthesis.


翻译:生成高质量的结构化数据(如JSON记录)仍然是大型语言模型(LLM)面临的一项基本挑战,尤其是在语义丰富性与严格模式遵循必须共存的情况下。自回归LLM虽能提供较强的结构一致性,但常难以实现语义变化和输出多样性。相比之下,扩散语言模型(DLM)引入了实现语义丰富性和双向解码的强大机制,却缺乏可靠保持结构所需的归纳偏置。我们提出扩散智能体(AoD)这一新颖框架,它通过语言介导的强化学习,将DLM的生成灵活性与自回归模型的推理能力相统一。AoD将结构化文本生成构建为一个多智能体对齐过程:提示优化智能体与评判智能体协作,利用自然语言反馈迭代引导DLM。该方法无需修改模型参数或依赖人工约束,即可实现可控、模式一致的生成。AoD通过证明扩散模型在协作智能体监督下能同时实现高语义新颖性与结构保真度,推动了可控生成技术的发展。在多个结构化数据基准测试中,AoD持续优于扩散模型与自回归基线模型,为结构感知、多样性增强的文本合成开辟了新路径。

0
下载
关闭预览

相关内容

智能体评判者(Agent-as-a-Judge)研究综述
专知会员服务
37+阅读 · 1月9日
大语言模型中的检索与结构化增强生成综述
专知会员服务
33+阅读 · 2025年9月17日
扩散语言模型综述
专知会员服务
19+阅读 · 2025年8月15日
定制化大型语言模型的图检索增强生成综述
专知会员服务
38+阅读 · 2025年1月28日
智能体检索增强生成:关于智能体RAG的综述
专知会员服务
91+阅读 · 2025年1月21日
强化学习增强的大型语言模型:综述
专知会员服务
52+阅读 · 2024年12月17日
《大语言模型的数据合成与增强综述》
专知会员服务
43+阅读 · 2024年10月19日
基于大型语言模型的多智能体:进展与挑战综述
专知会员服务
139+阅读 · 2024年2月6日
「基于通信的多智能体强化学习」 进展综述
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
15+阅读 · 2020年9月9日
强化学习与文本生成
微信AI
41+阅读 · 2019年4月4日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
VIP会员
相关VIP内容
智能体评判者(Agent-as-a-Judge)研究综述
专知会员服务
37+阅读 · 1月9日
大语言模型中的检索与结构化增强生成综述
专知会员服务
33+阅读 · 2025年9月17日
扩散语言模型综述
专知会员服务
19+阅读 · 2025年8月15日
定制化大型语言模型的图检索增强生成综述
专知会员服务
38+阅读 · 2025年1月28日
智能体检索增强生成:关于智能体RAG的综述
专知会员服务
91+阅读 · 2025年1月21日
强化学习增强的大型语言模型:综述
专知会员服务
52+阅读 · 2024年12月17日
《大语言模型的数据合成与增强综述》
专知会员服务
43+阅读 · 2024年10月19日
基于大型语言模型的多智能体:进展与挑战综述
专知会员服务
139+阅读 · 2024年2月6日
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员