无监督分解与重组：基于判别器驱动的扩散模型 (Unsupervised Decomposition and Recombination with Discriminator-Driven Diffusion Models) - 专知论文

会员服务 ·

0

因子 · 判别器 · 监督 · 分解 · 样本 ·

Unsupervised Decomposition and Recombination with Discriminator-Driven Diffusion Models

翻译：无监督分解与重组：基于判别器驱动的扩散模型

Archer Wang,Emile Anand,Yilun Du,Marin Soljačić

from arxiv, 28 pages, 16 figures, 4 tables

Decomposing complex data into factorized representations can reveal reusable components and enable synthesizing new samples via component recombination. We investigate this in the context of diffusion-based models that learn factorized latent spaces without factor-level supervision. In images, factors can capture background, illumination, and object attributes; in robotic videos, they can capture reusable motion components. To improve both latent factor discovery and quality of compositional generation, we introduce an adversarial training signal via a discriminator trained to distinguish between single-source samples and those generated by recombining factors across sources. By optimizing the generator to fool this discriminator, we encourage physical and semantic consistency in the resulting recombinations. Our method outperforms implementations of prior baselines on CelebA-HQ, Virtual KITTI, CLEVR, and Falcor3D, achieving lower FID scores and better disentanglement as measured by MIG and MCC. Furthermore, we demonstrate a novel application to robotic video trajectories: by recombining learned action components, we generate diverse sequences that significantly increase state-space coverage for exploration on the LIBERO benchmark.

翻译：将复杂数据分解为因子化表示可以揭示可复用组件，并支持通过组件重组合成新样本。本研究在基于扩散的模型框架下探讨此问题，该模型可在无因子级监督的情况下学习因子化潜在空间。在图像中，因子可捕捉背景、光照与物体属性；在机器人视频中，则可捕捉可复用的运动组件。为提升潜在因子发现能力与组合生成质量，我们引入通过判别器实现的对抗训练信号：该判别器经训练可区分单源样本与跨源因子重组生成的样本。通过优化生成器以欺骗该判别器，我们促使重组结果具有物理与语义一致性。在CelebA-HQ、Virtual KITTI、CLEVR和Falcor3D数据集上，本方法优于现有基线实现，获得了更低的FID分数，并通过MIG和MCC指标测得更好的解耦效果。此外，我们展示了在机器人视频轨迹中的创新应用：通过重组已学习的动作组件，可生成多样化序列，显著提升LIBERO基准测试中探索任务的状态空间覆盖率。

0

相关内容

[ICML2025]当模型知识遇见扩散模型：扩散辅助的无数据图像合成及域与类别对齐

[ICML2025]当模型知识遇见扩散模型：扩散辅助的无数据图像合成及域与类别对齐

专知会员服务

12+阅读 · 2025年6月19日

重审扩散模型：从生成式预训练到一步生成

重审扩散模型：从生成式预训练到一步生成

专知会员服务

14+阅读 · 2025年6月12日

机器人操作扩散模型综述

机器人操作扩散模型综述

专知会员服务

21+阅读 · 2025年4月14日

高效扩散模型：从原理到实践的全面综述

高效扩散模型：从原理到实践的全面综述

专知会员服务

41+阅读 · 2024年10月16日

《基于扩散模型的条件图像生成》综述

《基于扩散模型的条件图像生成》综述

专知会员服务

44+阅读 · 2024年10月1日

扩散模型概述：应用、引导生成、统计率和优化

扩散模型概述：应用、引导生成、统计率和优化

专知会员服务

47+阅读 · 2024年4月14日

扩散模型和强化学习如何结合？上交最新《强化学习中的扩散模型》综述

扩散模型和强化学习如何结合？上交最新《强化学习中的扩散模型》综述

专知会员服务

83+阅读 · 2023年11月3日

【CVPR2023】DiffCollage:用扩散模型并行生成大量内容

【CVPR2023】DiffCollage:用扩散模型并行生成大量内容

专知会员服务

28+阅读 · 2023年4月4日

【柏林工业大学博士论文】可解释结构化机器学习:对相似性、图和Transformer模型的洞察，143页pdf

【柏林工业大学博士论文】可解释结构化机器学习:对相似性、图和Transformer模型的洞察，143页pdf

专知会员服务

46+阅读 · 2023年2月28日

详解扩散模型：从DDPM到稳定扩散，附Slides与视频

详解扩散模型：从DDPM到稳定扩散，附Slides与视频

专知会员服务

87+阅读 · 2022年10月9日

[IEEE TPAMI 2021]卷积原型网络在开放集识别中的应用

[IEEE TPAMI 2021]卷积原型网络在开放集识别中的应用

专知

11+阅读 · 2021年2月19日

最新《图嵌入组合优化》综述论文，40页pdf

最新《图嵌入组合优化》综述论文，40页pdf

专知

41+阅读 · 2020年8月31日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

开发 | 谷歌对无监督解耦方法进行了大规模评估，还开源了用来实验的开发库！

开发 | 谷歌对无监督解耦方法进行了大规模评估，还开源了用来实验的开发库！

AI科技评论

10+阅读 · 2019年5月13日

CVPR 2019 | 无监督领域特定单图像去模糊

CVPR 2019 | 无监督领域特定单图像去模糊

PaperWeekly

14+阅读 · 2019年3月20日

学界 | FAIR提出用聚类方法结合卷积网络，实现无监督端到端图像分类

学界 | FAIR提出用聚类方法结合卷积网络，实现无监督端到端图像分类

机器之心

11+阅读 · 2018年8月6日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

【干货】Python无监督学习的4大聚类算法

【干货】Python无监督学习的4大聚类算法

新智元

14+阅读 · 2018年5月26日

【学界】机器学习模型的“可解释性”到底有多重要？

【学界】机器学习模型的“可解释性”到底有多重要？

GAN生成式对抗网络

12+阅读 · 2018年3月3日

贝叶斯网分解理论及其应用

国家自然科学基金

9+阅读 · 2017年12月31日

分布式工业自动化系统可重构混合计算模型研究

国家自然科学基金

4+阅读 · 2015年12月31日

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于主动异构监督的重叠社区发现及其模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于非监督决策树的模糊图割模型的彩色图像分割研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于个体分析的投影式非线性非负张量分解在高维非结构化数据模式分析中的研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向实时复杂数据的信息扩散模型和分析算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

随机反应扩散种群模型动力学研究

国家自然科学基金

0+阅读 · 2014年12月31日

动态群稀疏约束场景知识建模的感兴趣监控目标超分辨率重建

国家自然科学基金

1+阅读 · 2014年12月31日

Categorical Reparameterization with Denoising Diffusion models

Arxiv

0+阅读 · 2月9日

Diffusion-based Layer-wise Semantic Reconstruction for Unsupervised Out-of-Distribution Detection

Arxiv

0+阅读 · 2月2日

On the Separability of Information in Diffusion Models

Arxiv

0+阅读 · 1月30日

Zero-Shot Video Restoration and Enhancement with Assistance of Video Diffusion Models

Arxiv

0+阅读 · 1月29日

Diffusion Models in Simulation-Based Inference: A Tutorial Review

Arxiv

0+阅读 · 1月29日

Diffusion differentiable resampling

Arxiv

0+阅读 · 1月29日

Supervised Guidance Training for Infinite-Dimensional Diffusion Models

Arxiv

0+阅读 · 1月28日

Detecting and Mitigating Memorization in Diffusion Models through Anisotropy of the Log-Probability

Arxiv

0+阅读 · 1月28日

Divergence-Free Diffusion Models for Incompressible Fluid Flows

Arxiv

0+阅读 · 1月27日

Single-Step Reconstruction-Free Anomaly Detection and Segmentation via Diffusion Models

Arxiv

0+阅读 · 1月19日

VIP会员

文章信息

相关主题

相关VIP内容

[ICML2025]当模型知识遇见扩散模型：扩散辅助的无数据图像合成及域与类别对齐

[ICML2025]当模型知识遇见扩散模型：扩散辅助的无数据图像合成及域与类别对齐

专知会员服务

12+阅读 · 2025年6月19日

重审扩散模型：从生成式预训练到一步生成

重审扩散模型：从生成式预训练到一步生成

专知会员服务

14+阅读 · 2025年6月12日

机器人操作扩散模型综述

机器人操作扩散模型综述

专知会员服务

21+阅读 · 2025年4月14日

高效扩散模型：从原理到实践的全面综述

高效扩散模型：从原理到实践的全面综述

专知会员服务

41+阅读 · 2024年10月16日

《基于扩散模型的条件图像生成》综述

《基于扩散模型的条件图像生成》综述

专知会员服务

44+阅读 · 2024年10月1日

扩散模型概述：应用、引导生成、统计率和优化

扩散模型概述：应用、引导生成、统计率和优化

专知会员服务

47+阅读 · 2024年4月14日

扩散模型和强化学习如何结合？上交最新《强化学习中的扩散模型》综述

扩散模型和强化学习如何结合？上交最新《强化学习中的扩散模型》综述

专知会员服务

83+阅读 · 2023年11月3日

【CVPR2023】DiffCollage:用扩散模型并行生成大量内容

【CVPR2023】DiffCollage:用扩散模型并行生成大量内容

专知会员服务

28+阅读 · 2023年4月4日

【柏林工业大学博士论文】可解释结构化机器学习:对相似性、图和Transformer模型的洞察，143页pdf

【柏林工业大学博士论文】可解释结构化机器学习:对相似性、图和Transformer模型的洞察，143页pdf

专知会员服务

46+阅读 · 2023年2月28日

详解扩散模型：从DDPM到稳定扩散，附Slides与视频

详解扩散模型：从DDPM到稳定扩散，附Slides与视频

专知会员服务

87+阅读 · 2022年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】基于自适应表征的高效视觉建模

《多域作战中融合网络、电子战与动能机动》

AI智能体时代大模型安全风险与攻防新挑战

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

相关资讯

[IEEE TPAMI 2021]卷积原型网络在开放集识别中的应用

[IEEE TPAMI 2021]卷积原型网络在开放集识别中的应用

专知

11+阅读 · 2021年2月19日

最新《图嵌入组合优化》综述论文，40页pdf

最新《图嵌入组合优化》综述论文，40页pdf

专知

41+阅读 · 2020年8月31日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

开发 | 谷歌对无监督解耦方法进行了大规模评估，还开源了用来实验的开发库！

开发 | 谷歌对无监督解耦方法进行了大规模评估，还开源了用来实验的开发库！

AI科技评论

10+阅读 · 2019年5月13日

CVPR 2019 | 无监督领域特定单图像去模糊

CVPR 2019 | 无监督领域特定单图像去模糊

PaperWeekly

14+阅读 · 2019年3月20日

学界 | FAIR提出用聚类方法结合卷积网络，实现无监督端到端图像分类

学界 | FAIR提出用聚类方法结合卷积网络，实现无监督端到端图像分类

机器之心

11+阅读 · 2018年8月6日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

【干货】Python无监督学习的4大聚类算法

【干货】Python无监督学习的4大聚类算法

新智元

14+阅读 · 2018年5月26日

【学界】机器学习模型的“可解释性”到底有多重要？

【学界】机器学习模型的“可解释性”到底有多重要？

GAN生成式对抗网络

12+阅读 · 2018年3月3日

相关论文

Categorical Reparameterization with Denoising Diffusion models

Arxiv

0+阅读 · 2月9日

Diffusion-based Layer-wise Semantic Reconstruction for Unsupervised Out-of-Distribution Detection

Arxiv

0+阅读 · 2月2日

On the Separability of Information in Diffusion Models

Arxiv

0+阅读 · 1月30日

Zero-Shot Video Restoration and Enhancement with Assistance of Video Diffusion Models

Arxiv

0+阅读 · 1月29日

Diffusion Models in Simulation-Based Inference: A Tutorial Review

Arxiv

0+阅读 · 1月29日

Diffusion differentiable resampling

Arxiv

0+阅读 · 1月29日

Supervised Guidance Training for Infinite-Dimensional Diffusion Models

Arxiv

0+阅读 · 1月28日

Detecting and Mitigating Memorization in Diffusion Models through Anisotropy of the Log-Probability

Arxiv

0+阅读 · 1月28日

Divergence-Free Diffusion Models for Incompressible Fluid Flows

Arxiv

0+阅读 · 1月27日

Single-Step Reconstruction-Free Anomaly Detection and Segmentation via Diffusion Models

Arxiv

0+阅读 · 1月19日

相关基金

贝叶斯网分解理论及其应用

国家自然科学基金

9+阅读 · 2017年12月31日

分布式工业自动化系统可重构混合计算模型研究

国家自然科学基金

4+阅读 · 2015年12月31日

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于主动异构监督的重叠社区发现及其模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于非监督决策树的模糊图割模型的彩色图像分割研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于个体分析的投影式非线性非负张量分解在高维非结构化数据模式分析中的研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向实时复杂数据的信息扩散模型和分析算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

随机反应扩散种群模型动力学研究

国家自然科学基金

0+阅读 · 2014年12月31日

动态群稀疏约束场景知识建模的感兴趣监控目标超分辨率重建

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员