Recently, CLIP-guided image synthesis has shown appealing performance on adapting a pre-trained source-domain generator to an unseen target domain. It does not require any target-domain samples but only the textual domain labels. The training is highly efficient, e.g., a few minutes. However, existing methods still have some limitations in the quality of generated images and may suffer from the mode collapse issue. A key reason is that a fixed adaptation direction is applied for all cross-domain image pairs, which leads to identical supervision signals. To address this issue, we propose an Image-specific Prompt Learning (IPL) method, which learns specific prompt vectors for each source-domain image. This produces a more precise adaptation direction for every cross-domain image pair, endowing the target-domain generator with greatly enhanced flexibility. Qualitative and quantitative evaluations on various domains demonstrate that IPL effectively improves the quality and diversity of synthesized images and alleviates the mode collapse. Moreover, IPL is independent of the structure of the generative model, such as generative adversarial networks or diffusion models. Code is available at https://github.com/Picsart-AI-Research/IPL-Zero-Shot-Generative-Model-Adaptation.


翻译:近期,基于CLIP引导的图像合成技术在将预训练的源域生成器迁移至未见过的目标域方面展现出令人瞩目的性能。该方法无需目标域样本,仅需文本形式的域标签,且训练效率极高(例如数分钟)。然而,现有方法在生成图像质量上仍存在局限,并可能面临模式坍缩问题。其核心原因在于,所有跨域图像对共享固定的自适应方向,导致监督信号同质化。为解决该问题,我们提出图像特定提示学习(Image-specific Prompt Learning, IPL)方法,即为每个源域图像学习专属的提示向量。这为每个跨域图像对生成更精确的自适应方向,显著增强目标域生成器的灵活性。在多个域上的定性与定量评估表明,IPL有效提升了合成图像的质量与多样性,并缓解了模式坍缩现象。此外,IPL与生成模型的具体架构(如生成对抗网络或扩散模型)无关。代码开源地址:https://github.com/Picsart-AI-Research/IPL-Zero-Shot-Generative-Model-Adaptation。

0
下载
关闭预览

相关内容

信息处理快报(IPL)致力于快速发表对信息处理的简短贡献。注重于原创研究文章,并且 这些文章着重于信息处理和计算方面,包括在计算机理论科学领域广为人知的工作以及高质量实验论文。 官网地址:http://dblp.uni-trier.de/db/journals/ipl/
专知会员服务
30+阅读 · 2021年5月6日
100+篇《自监督学习(Self-Supervised Learning)》论文最新合集
专知会员服务
167+阅读 · 2020年3月18日
IJCAI 2022 | 使用陈述句进行视觉问答的Prompt Tuning
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
18+阅读 · 2019年1月7日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
Unsupervised Learning via Meta-Learning
CreateAMind
44+阅读 · 2019年1月3日
Zero-Shot Learning相关资源大列表
专知
52+阅读 · 2019年1月1日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
Conditional Prompt Learning for Vision-Language Models
Arxiv
13+阅读 · 2022年3月10日
Arxiv
21+阅读 · 2021年12月31日
Arxiv
17+阅读 · 2021年2月15日
Learning Embedding Adaptation for Few-Shot Learning
Arxiv
17+阅读 · 2018年12月10日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
1+阅读 · 今天14:45
定向能反无人机系统最新发展动态
专知会员服务
4+阅读 · 今天13:50
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
3+阅读 · 今天13:33
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员