离散费曼-卡克校正器 (Discrete Feynman-Kac Correctors) - 专知论文

会员服务 ·

0

离散 · 序列 · 样本 · 掩码 · 退火 ·

Discrete Feynman-Kac Correctors

翻译：离散费曼-卡克校正器

Mohsin Hasan,Viktor Ohanesian,Artem Gazizov,Yoshua Bengio,Alán Aspuru-Guzik,Roberto Bondesan,Marta Skreta,Kirill Neklyudov

from arxiv, Code: https://github.com/hasanmohsin/discrete_fkc

Discrete diffusion models have recently emerged as a promising alternative to the autoregressive approach for generating discrete sequences. Sample generation via gradual denoising or demasking processes allows them to capture hierarchical non-sequential interdependencies in the data. These custom processes, however, do not assume a flexible control over the distribution of generated samples. We propose Discrete Feynman-Kac Correctors, a framework that allows for controlling the generated distribution of discrete masked diffusion models at inference time. We derive Sequential Monte Carlo (SMC) algorithms that, given a trained discrete diffusion model, control the temperature of the sampled distribution (i.e. perform annealing), sample from the product of marginals of several diffusion processes (e.g. differently conditioned processes), and sample from the product of the marginal with an external reward function, producing likely samples from the target distribution that also have high reward. Notably, our framework does not require any training of additional models or fine-tuning of the original model. We illustrate the utility of our framework in several applications including: efficient sampling from the annealed Boltzmann distribution of the Ising model, improving the performance of language models for code generation and amortized learning, as well as reward-tilted protein sequence generation.

翻译：离散扩散模型最近作为一种有前景的替代方案出现，用于生成离散序列，以取代自回归方法。通过逐步去噪或去掩码过程的样本生成，使它们能够捕捉数据中分层的非序列相互依赖关系。然而，这些定制过程并未对生成样本的分布提供灵活的控制。我们提出了离散费曼-卡克校正器，这是一个允许在推理时控制离散掩码扩散模型生成分布的框架。我们推导了序贯蒙特卡洛算法，该算法在给定一个已训练的离散扩散模型的情况下，能够控制采样分布的温度（即执行退火），从多个扩散过程（例如不同条件的过程）的边缘分布乘积中采样，以及从边缘分布与外部奖励函数的乘积中采样，从而从目标分布中生成既具有高可能性又具有高奖励的样本。值得注意的是，我们的框架不需要训练任何额外模型或对原始模型进行微调。我们在多个应用中展示了我们框架的实用性，包括：从伊辛模型的退火玻尔兹曼分布中进行高效采样，提高代码生成和摊销学习的语言模型性能，以及奖励倾斜的蛋白质序列生成。

0

相关内容

144页ppt《扩散模型》，Google DeepMind Sander Dieleman

144页ppt《扩散模型》，Google DeepMind Sander Dieleman

专知会员服务

51+阅读 · 2025年11月21日

如何理解扩散模型？ICML2025最新《利用扩散模型中的低维性：从理论到实践》。300页ppt

如何理解扩散模型？ICML2025最新《利用扩散模型中的低维性：从理论到实践》。300页ppt

专知会员服务

59+阅读 · 2025年7月20日

用于语言生成的离散扩散模型

用于语言生成的离散扩散模型

专知会员服务

12+阅读 · 2025年7月10日

《扩散模型》最新教程，141页ppt

《扩散模型》最新教程，141页ppt

专知会员服务

79+阅读 · 2024年12月2日

【CVPR2024】扩散模型的结构指导对抗训练

【CVPR2024】扩散模型的结构指导对抗训练

专知会员服务

27+阅读 · 2024年2月28日

何恺明等最新步步解构扩散模型，最后竟成经典去噪自编码器

何恺明等最新步步解构扩散模型，最后竟成经典去噪自编码器

专知会员服务

33+阅读 · 2024年1月28日

英伟达斯坦福CVPR2023等最新《去噪扩散模型：生成学习的大爆炸》教程，附300多页ppt

英伟达斯坦福CVPR2023等最新《去噪扩散模型：生成学习的大爆炸》教程，附300多页ppt

专知会员服务

54+阅读 · 2023年6月27日

NLP+Diffusion=？UMN最新《NLP中的扩散模型》综述，全面阐述离散和嵌入扩散模型方法

NLP+Diffusion=？UMN最新《NLP中的扩散模型》综述，全面阐述离散和嵌入扩散模型方法

专知会员服务

54+阅读 · 2023年5月26日

详解扩散模型：从DDPM到稳定扩散，附Slides与视频

详解扩散模型：从DDPM到稳定扩散，附Slides与视频

专知会员服务

87+阅读 · 2022年10月9日

大“火”的扩散模型综述又一弹！UCF等《视觉扩散模型》综述，20页pdf详述三种通用的扩散建模框架

大“火”的扩散模型综述又一弹！UCF等《视觉扩散模型》综述，20页pdf详述三种通用的扩散建模框架

专知会员服务

87+阅读 · 2022年9月13日

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

【干货书】计算机科学离散数学，627页pdf

【干货书】计算机科学离散数学，627页pdf

专知

65+阅读 · 2020年8月31日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

学界 | 受压缩感知启发，斯坦福 AI 研究院提出新的无监督表示学习框架！

学界 | 受压缩感知启发，斯坦福 AI 研究院提出新的无监督表示学习框架！

AI科技评论

10+阅读 · 2019年6月18日

《变分自编码器（VAE）导论》93页书册，附PDF下载

《变分自编码器（VAE）导论》93页书册，附PDF下载

专知

61+阅读 · 2019年6月14日

【SIGIR2018】 IRGAN Tutorial：上交张伟楠老师-GAN在信息检索的应用【附下载】

【SIGIR2018】 IRGAN Tutorial：上交张伟楠老师-GAN在信息检索的应用【附下载】

专知

12+阅读 · 2018年7月7日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

EKF常用于目标跟踪系统的扩展卡尔曼滤波器

EKF常用于目标跟踪系统的扩展卡尔曼滤波器

无人机

10+阅读 · 2017年7月25日

侦测欺诈交易（异常点检测）

侦测欺诈交易（异常点检测）

GBASE数据工程部数据团队

20+阅读 · 2017年5月10日

端频率信号的离散频谱校正方法及应用基础研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于有限元方法的反应扩散种群模型斑图数值模拟研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于调度协议的离散系统网络控制：时滞系统方法

国家自然科学基金

0+阅读 · 2015年12月31日

时滞正Markov跳变系统的分布式控制与滤波

国家自然科学基金

0+阅读 · 2015年12月31日

切换离散非线性系统的耗散性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

高阶图像去噪模型的快速数值算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

扩散过程离散化形式下的若干统计问题的大偏差原理

国家自然科学基金

0+阅读 · 2014年12月31日

复杂腔体上电磁散射大波数问题非协调元逼近及加速技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

非局部总变差正则化图像恢复模型的快速子空间校正算法

国家自然科学基金

0+阅读 · 2014年12月31日

分数阶扩散方程反向问题的正则化理论与算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

Scaling Beyond Masked Diffusion Language Models

Arxiv

0+阅读 · 2月16日

Discrete Adjoint Schrödinger Bridge Sampler

Arxiv

0+阅读 · 2月9日

Remasking Discrete Diffusion Models with Inference-Time Scaling

Arxiv

0+阅读 · 2月7日

Stopping Computation for Converged Tokens in Masked Diffusion-LM Decoding

Arxiv

0+阅读 · 2月6日

Training-Free Self-Correction for Multimodal Masked Diffusion Models

Arxiv

0+阅读 · 2月2日

Error Analysis of Discrete Flow with Generator Matching

Arxiv

0+阅读 · 1月30日

Corrected Samplers for Discrete Flow Models

Arxiv

0+阅读 · 1月30日

Test-Time Anchoring for Discrete Diffusion Posterior Sampling

Arxiv

0+阅读 · 1月30日

Diffusion Path Samplers via Sequential Monte Carlo

Arxiv

0+阅读 · 1月29日

Single-Step Reconstruction-Free Anomaly Detection and Segmentation via Diffusion Models

Arxiv

0+阅读 · 1月19日

VIP会员

文章信息

相关主题

最新内容

《面向大语言模型引导规划、Bandit算法驱动探索与多智能体导航的分层决策问题研究》180页

《面向大语言模型引导规划、Bandit算法驱动探索与多智能体导航的分层决策问题研究》180页

专知会员服务

0+阅读 · 8分钟前

《自动化战略情报管控》

《自动化战略情报管控》

专知会员服务

0+阅读 · 11分钟前

《反无人机蜂群技术研究：基于小队策略构建大规模无人机防御》

《反无人机蜂群技术研究：基于小队策略构建大规模无人机防御》

专知会员服务

0+阅读 · 19分钟前

得失评估：审视对伊朗战争的轨迹（简报）

得失评估：审视对伊朗战争的轨迹（简报）

专知会员服务

0+阅读 · 23分钟前

【CMU博士论文】迈向可解释机器学习的理论基础

【CMU博士论文】迈向可解释机器学习的理论基础

专知会员服务

0+阅读 · 今天12:23

CVPR 2026 | HulluEdit：基于正交子空间编辑的多模态大语言模型幻觉缓解框架

CVPR 2026 | HulluEdit：基于正交子空间编辑的多模态大语言模型幻觉缓解框架

专知会员服务

0+阅读 · 今天12:21

无人机视觉语言导航：研究进展、挑战与技术路线图

无人机视觉语言导航：研究进展、挑战与技术路线图

专知会员服务

0+阅读 · 今天12:13

《基于强化学习的反无人机蜂群拦截优先级排序》

《基于强化学习的反无人机蜂群拦截优先级排序》

专知会员服务

7+阅读 · 今天8:20

乌克兰反无人机方案“天穹哨兵”解析：一款人工智能驱动的近程防空系统

乌克兰反无人机方案“天穹哨兵”解析：一款人工智能驱动的近程防空系统

专知会员服务

2+阅读 · 今天7:30

美军2026条令《指挥官装甲装备维护技能测试计划》

美军2026条令《指挥官装甲装备维护技能测试计划》

专知会员服务

5+阅读 · 今天7:28

《俄罗斯构建服务于人工智能驱动自主性的主权无人机生态系统》（2026报告）

《俄罗斯构建服务于人工智能驱动自主性的主权无人机生态系统》（2026报告）

专知会员服务

6+阅读 · 今天3:09

2026年俄罗斯新型喷气动力无人机Geran-5的技术规格

2026年俄罗斯新型喷气动力无人机Geran-5的技术规格

专知会员服务

3+阅读 · 今天2:50

基于数据优化的人机协同与机器人僚机

基于数据优化的人机协同与机器人僚机

专知会员服务

4+阅读 · 今天2:08

美太空军发布两份聚焦2040年规划的文件：《2040年未来作战环境》和《2040年目标部队》（附文件）

美太空军发布两份聚焦2040年规划的文件：《2040年未来作战环境》和《2040年目标部队》（附文件）

专知会员服务

13+阅读 · 今天1:51

《为码头高价值舰艇提供反无人机系统防御方案研究》80页

《为码头高价值舰艇提供反无人机系统防御方案研究》80页

专知会员服务

8+阅读 · 4月15日

相关VIP内容

144页ppt《扩散模型》，Google DeepMind Sander Dieleman

144页ppt《扩散模型》，Google DeepMind Sander Dieleman

专知会员服务

51+阅读 · 2025年11月21日

如何理解扩散模型？ICML2025最新《利用扩散模型中的低维性：从理论到实践》。300页ppt

如何理解扩散模型？ICML2025最新《利用扩散模型中的低维性：从理论到实践》。300页ppt

专知会员服务

59+阅读 · 2025年7月20日

用于语言生成的离散扩散模型

用于语言生成的离散扩散模型

专知会员服务

12+阅读 · 2025年7月10日

《扩散模型》最新教程，141页ppt

《扩散模型》最新教程，141页ppt

专知会员服务

79+阅读 · 2024年12月2日

【CVPR2024】扩散模型的结构指导对抗训练

【CVPR2024】扩散模型的结构指导对抗训练

专知会员服务

27+阅读 · 2024年2月28日

何恺明等最新步步解构扩散模型，最后竟成经典去噪自编码器

何恺明等最新步步解构扩散模型，最后竟成经典去噪自编码器

专知会员服务

33+阅读 · 2024年1月28日

英伟达斯坦福CVPR2023等最新《去噪扩散模型：生成学习的大爆炸》教程，附300多页ppt

英伟达斯坦福CVPR2023等最新《去噪扩散模型：生成学习的大爆炸》教程，附300多页ppt

专知会员服务

54+阅读 · 2023年6月27日

NLP+Diffusion=？UMN最新《NLP中的扩散模型》综述，全面阐述离散和嵌入扩散模型方法

NLP+Diffusion=？UMN最新《NLP中的扩散模型》综述，全面阐述离散和嵌入扩散模型方法

专知会员服务

54+阅读 · 2023年5月26日

详解扩散模型：从DDPM到稳定扩散，附Slides与视频

详解扩散模型：从DDPM到稳定扩散，附Slides与视频

专知会员服务

87+阅读 · 2022年10月9日

大“火”的扩散模型综述又一弹！UCF等《视觉扩散模型》综述，20页pdf详述三种通用的扩散建模框架

大“火”的扩散模型综述又一弹！UCF等《视觉扩散模型》综述，20页pdf详述三种通用的扩散建模框架

专知会员服务

87+阅读 · 2022年9月13日

热门VIP内容

开通专知VIP会员享更多权益服务

《自动化战略情报管控》

得失评估：审视对伊朗战争的轨迹（简报）

《面向大语言模型引导规划、Bandit算法驱动探索与多智能体导航的分层决策问题研究》180页

《反无人机蜂群技术研究：基于小队策略构建大规模无人机防御》

相关资讯

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

【干货书】计算机科学离散数学，627页pdf

【干货书】计算机科学离散数学，627页pdf

专知

65+阅读 · 2020年8月31日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

学界 | 受压缩感知启发，斯坦福 AI 研究院提出新的无监督表示学习框架！

学界 | 受压缩感知启发，斯坦福 AI 研究院提出新的无监督表示学习框架！

AI科技评论

10+阅读 · 2019年6月18日

《变分自编码器（VAE）导论》93页书册，附PDF下载

《变分自编码器（VAE）导论》93页书册，附PDF下载

专知

61+阅读 · 2019年6月14日

【SIGIR2018】 IRGAN Tutorial：上交张伟楠老师-GAN在信息检索的应用【附下载】

【SIGIR2018】 IRGAN Tutorial：上交张伟楠老师-GAN在信息检索的应用【附下载】

专知

12+阅读 · 2018年7月7日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

EKF常用于目标跟踪系统的扩展卡尔曼滤波器

EKF常用于目标跟踪系统的扩展卡尔曼滤波器

无人机

10+阅读 · 2017年7月25日

侦测欺诈交易（异常点检测）

侦测欺诈交易（异常点检测）

GBASE数据工程部数据团队

20+阅读 · 2017年5月10日

相关论文

Scaling Beyond Masked Diffusion Language Models

Arxiv

0+阅读 · 2月16日

Discrete Adjoint Schrödinger Bridge Sampler

Arxiv

0+阅读 · 2月9日

Remasking Discrete Diffusion Models with Inference-Time Scaling

Arxiv

0+阅读 · 2月7日

Stopping Computation for Converged Tokens in Masked Diffusion-LM Decoding

Arxiv

0+阅读 · 2月6日

Training-Free Self-Correction for Multimodal Masked Diffusion Models

Arxiv

0+阅读 · 2月2日

Error Analysis of Discrete Flow with Generator Matching

Arxiv

0+阅读 · 1月30日

Corrected Samplers for Discrete Flow Models

Arxiv

0+阅读 · 1月30日

Test-Time Anchoring for Discrete Diffusion Posterior Sampling

Arxiv

0+阅读 · 1月30日

Diffusion Path Samplers via Sequential Monte Carlo

Arxiv

0+阅读 · 1月29日

Single-Step Reconstruction-Free Anomaly Detection and Segmentation via Diffusion Models

Arxiv

0+阅读 · 1月19日

相关基金

端频率信号的离散频谱校正方法及应用基础研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于有限元方法的反应扩散种群模型斑图数值模拟研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于调度协议的离散系统网络控制：时滞系统方法

国家自然科学基金

0+阅读 · 2015年12月31日

时滞正Markov跳变系统的分布式控制与滤波

国家自然科学基金

0+阅读 · 2015年12月31日

切换离散非线性系统的耗散性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

高阶图像去噪模型的快速数值算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

扩散过程离散化形式下的若干统计问题的大偏差原理

国家自然科学基金

0+阅读 · 2014年12月31日

复杂腔体上电磁散射大波数问题非协调元逼近及加速技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

非局部总变差正则化图像恢复模型的快速子空间校正算法

国家自然科学基金

0+阅读 · 2014年12月31日

分数阶扩散方程反向问题的正则化理论与算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员