自适应领域偏移在扩散模型中实现跨模态图像翻译 (Adaptive Domain Shift in Diffusion Models for Cross-Modality Image Translation) - 专知论文

会员服务 ·

0

模态 · 图像翻译 · 一致 · 跨模态 · 自适应 ·

Adaptive Domain Shift in Diffusion Models for Cross-Modality Image Translation

翻译：自适应领域偏移在扩散模型中实现跨模态图像翻译

Zihao Wang,Yuzhou Chen,Shaogang Ren

from arxiv, Paper accepted as a conference paper at ICLR 2026

Cross-modal image translation remains brittle and inefficient. Standard diffusion approaches often rely on a single, global linear transfer between domains. We find that this shortcut forces the sampler to traverse off-manifold, high-cost regions, inflating the correction burden and inviting semantic drift. We refer to this shared failure mode as fixed-schedule domain transfer. In this paper, we embed domain-shift dynamics directly into the generative process. Our model predicts a spatially varying mixing field at every reverse step and injects an explicit, target-consistent restoration term into the drift. This in-step guidance keeps large updates on-manifold and shifts the model's role from global alignment to local residual correction. We provide a continuous-time formulation with an exact solution form and derive a practical first-order sampler that preserves marginal consistency. Empirically, across translation tasks in medical imaging, remote sensing, and electroluminescence semantic mapping, our framework improves structural fidelity and semantic consistency while converging in fewer denoising steps.

翻译：跨模态图像翻译仍然存在脆弱性和低效性问题。标准的扩散方法通常依赖于域间单一的全局线性转换。我们发现这种捷径迫使采样器穿越流形外的高成本区域，增加了校正负担并引发语义漂移。我们将这种共有的失效模式称为固定调度域转换。本文中，我们将领域偏移动态直接嵌入生成过程。我们的模型在每次反向步骤中预测空间变化的混合场，并向漂移项注入显式的目标一致性恢复项。这种步内引导使大幅更新保持在流形上，并将模型的作用从全局对齐转变为局部残差校正。我们提出了具有精确解形式的连续时间公式，并推导出保持边缘一致性的实用一阶采样器。在医学影像、遥感和电致发光语义映射等翻译任务的实证实验中，我们的框架在更少去噪步骤内收敛的同时，提高了结构保真度和语义一致性。

0

相关内容

【NeurIPS2025】Seg4Diff：揭示文本到图像扩散 Transformer 中的开放词汇分割

【NeurIPS2025】Seg4Diff：揭示文本到图像扩散 Transformer 中的开放词汇分割

专知会员服务

10+阅读 · 2025年9月23日

扩散模型中的 Transformer：图像生成及其延展应用询问 ChatGPT

扩散模型中的 Transformer：图像生成及其延展应用询问 ChatGPT

专知会员服务

11+阅读 · 2025年7月5日

【ICML2025】GCAL：使图模型适应不断演变的领域偏移

【ICML2025】GCAL：使图模型适应不断演变的领域偏移

专知会员服务

9+阅读 · 2025年5月23日

【AAAI2025】穿越多模态领域：通过低秩序列多模态适配器实现高效迁移学习

【AAAI2025】穿越多模态领域：通过低秩序列多模态适配器实现高效迁移学习

专知会员服务

14+阅读 · 2024年12月13日

深度图学习在分布偏移下的综述：从图的分布外泛化到自适应

深度图学习在分布偏移下的综述：从图的分布外泛化到自适应

专知会员服务

18+阅读 · 2024年10月28日

跨域遥感场景解译研究进展

跨域遥感场景解译研究进展

专知会员服务

42+阅读 · 2024年3月19日

遥感跨模态智能解译：模型、数据与应用

遥感跨模态智能解译：模型、数据与应用

专知会员服务

84+阅读 · 2023年6月4日

神经机器翻译的域自适应综述论文，64页pdf

专知会员服务

17+阅读 · 2021年4月16日

基于双注意力机制和迁移学习的跨领域推荐模型

专知会员服务

48+阅读 · 2020年10月20日

【NLP模型的跨语言/跨领域迁移】《Transferring NLP models across languages and domains》

【NLP模型的跨语言/跨领域迁移】《Transferring NLP models across languages and domains》

专知会员服务

43+阅读 · 2019年11月25日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

17+阅读 · 2021年3月2日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

14+阅读 · 2020年8月30日

【DeepMind】CrossTransformers: 空间感知的小样本迁移

【DeepMind】CrossTransformers: 空间感知的小样本迁移

专知

37+阅读 · 2020年7月26日

【资源】领域自适应相关论文、代码分享

【资源】领域自适应相关论文、代码分享

专知

32+阅读 · 2019年10月12日

综述：基于GAN的图像翻译模型盘点

综述：基于GAN的图像翻译模型盘点

GAN生成式对抗网络

21+阅读 · 2019年9月2日

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

GAN生成式对抗网络

10+阅读 · 2019年8月17日

迁移自适应学习最新综述，附21页论文下载

迁移自适应学习最新综述，附21页论文下载

专知

34+阅读 · 2019年3月13日

领域自适应学习论文大列表

领域自适应学习论文大列表

专知

71+阅读 · 2019年3月2日

迁移学习之Domain Adaptation

迁移学习之Domain Adaptation

全球人工智能

18+阅读 · 2018年4月11日

极市分享|王晋东迁移学习中的领域自适应方法

极市分享|王晋东迁移学习中的领域自适应方法

极市平台

10+阅读 · 2017年12月11日

图文混合跨媒体知识单元的模糊分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

3D平移不变剪切波域统计相关性驱动的多模态医学图像融合方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

总变差正则化模型的区域分解算法及其医学图像应用

国家自然科学基金

2+阅读 · 2015年12月31日

基于非独立同分布学习理论的图模型词义消歧及领域适应方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于尺度集的高分辨率遥感影像多尺度分类

国家自然科学基金

0+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂纵向数据的分位回归建模及其在生物医学大数据中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

扩散过程离散化形式下的若干统计问题的大偏差原理

国家自然科学基金

0+阅读 · 2014年12月31日

跨网络社会学习对移动用户创新扩散的影响研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于潜在语义对偶空间的新词翻译自动识别方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

xTED: Cross-Domain Adaptation via Diffusion-Based Trajectory Editing

Arxiv

0+阅读 · 3月7日

RegionRoute: Regional Style Transfer with Diffusion Model

Arxiv

0+阅读 · 2月22日

Unpaired Image-to-Image Translation via a Self-Supervised Semantic Bridge

Arxiv

0+阅读 · 2月18日

Cross-Modal Mapping: Mitigating the Modality Gap for Few-Shot Image Classification

Arxiv

0+阅读 · 2月15日

The Entropic Signature of Class Speciation in Diffusion Models

Arxiv

0+阅读 · 2月10日

Latent Domain Modeling Improves Robustness to Geographic Shifts

Arxiv

0+阅读 · 2月9日

A-FloPS: Accelerating Diffusion Models via Adaptive Flow Path Sampler

Arxiv

0+阅读 · 2月8日

Image-to-Image Translation with Diffusion Transformers and CLIP-Based Image Conditioning

Arxiv

0+阅读 · 2月5日

Cross-Domain Offline Policy Adaptation via Selective Transition Correction

Arxiv

0+阅读 · 2月5日

Consensus-Aligned Neuron Efficient Fine-Tuning Large Language Models for Multi-Domain Machine Translation

Arxiv

0+阅读 · 2月5日

VIP会员

文章信息

相关主题

最新内容

《为码头高价值舰艇提供反无人机系统防御方案研究》80页

《为码头高价值舰艇提供反无人机系统防御方案研究》80页

专知会员服务

2+阅读 · 今天14:59

《认知战作为一个战略域：媒体生态系统、社交网络与社会韧性的侵蚀》

《认知战作为一个战略域：媒体生态系统、社交网络与社会韧性的侵蚀》

专知会员服务

2+阅读 · 今天14:21

美陆军设想无人系统司令部

美陆军设想无人系统司令部

专知会员服务

1+阅读 · 今天13:45

【博士论文】已对齐人工智能系统的持久脆弱性

【博士论文】已对齐人工智能系统的持久脆弱性

专知会员服务

0+阅读 · 今天13:52

人工智能对指挥控制的加速及其对陆军的影响（中文报告）

人工智能对指挥控制的加速及其对陆军的影响（中文报告）

专知会员服务

2+阅读 · 今天13:39

扭曲还是编造？视频大语言模型幻觉研究综述

扭曲还是编造？视频大语言模型幻觉研究综述

专知会员服务

0+阅读 · 今天13:41

美欧最新（2026）反无人机系统选项、技术与获取一览

美欧最新（2026）反无人机系统选项、技术与获取一览

专知会员服务

2+阅读 · 今天13:13

《大语言模型作为战术规划支持工具——来自两项应用研究的结论》2026最新100页报告

《大语言模型作为战术规划支持工具——来自两项应用研究的结论》2026最新100页报告

专知会员服务

2+阅读 · 今天13:11

《采用系统思维应对混合战争》125页

《采用系统思维应对混合战争》125页

专知会员服务

2+阅读 · 今天12:47

战争机器学习：数据生态系统构建（155页）

战争机器学习：数据生态系统构建（155页）

专知会员服务

6+阅读 · 今天8:10

乌克兰军事人工智能助手：NeoLens军事装备人工智能辅助维护平台

乌克兰军事人工智能助手：NeoLens军事装备人工智能辅助维护平台

专知会员服务

2+阅读 · 今天7:40

2026 年 Agentic AI 工程师完全指南：一份系统化的学习路线图

2026 年 Agentic AI 工程师完全指南：一份系统化的学习路线图

专知会员服务

14+阅读 · 4月14日

内省扩散语言模型

内省扩散语言模型

专知会员服务

6+阅读 · 4月14日

美伊停火协议：评估、各方反应及美国会面临的问题

美伊停火协议：评估、各方反应及美国会面临的问题

专知会员服务

4+阅读 · 4月14日

国外反无人机系统与技术动态

国外反无人机系统与技术动态

专知会员服务

4+阅读 · 4月14日

相关VIP内容

【NeurIPS2025】Seg4Diff：揭示文本到图像扩散 Transformer 中的开放词汇分割

【NeurIPS2025】Seg4Diff：揭示文本到图像扩散 Transformer 中的开放词汇分割

专知会员服务

10+阅读 · 2025年9月23日

扩散模型中的 Transformer：图像生成及其延展应用询问 ChatGPT

扩散模型中的 Transformer：图像生成及其延展应用询问 ChatGPT

专知会员服务

11+阅读 · 2025年7月5日

【ICML2025】GCAL：使图模型适应不断演变的领域偏移

【ICML2025】GCAL：使图模型适应不断演变的领域偏移

专知会员服务

9+阅读 · 2025年5月23日

【AAAI2025】穿越多模态领域：通过低秩序列多模态适配器实现高效迁移学习

【AAAI2025】穿越多模态领域：通过低秩序列多模态适配器实现高效迁移学习

专知会员服务

14+阅读 · 2024年12月13日

深度图学习在分布偏移下的综述：从图的分布外泛化到自适应

深度图学习在分布偏移下的综述：从图的分布外泛化到自适应

专知会员服务

18+阅读 · 2024年10月28日

跨域遥感场景解译研究进展

跨域遥感场景解译研究进展

专知会员服务

42+阅读 · 2024年3月19日

遥感跨模态智能解译：模型、数据与应用

遥感跨模态智能解译：模型、数据与应用

专知会员服务

84+阅读 · 2023年6月4日

神经机器翻译的域自适应综述论文，64页pdf

专知会员服务

17+阅读 · 2021年4月16日

基于双注意力机制和迁移学习的跨领域推荐模型

专知会员服务

48+阅读 · 2020年10月20日

【NLP模型的跨语言/跨领域迁移】《Transferring NLP models across languages and domains》

【NLP模型的跨语言/跨领域迁移】《Transferring NLP models across languages and domains》

专知会员服务

43+阅读 · 2019年11月25日

热门VIP内容

开通专知VIP会员享更多权益服务

《认知战作为一个战略域：媒体生态系统、社交网络与社会韧性的侵蚀》

【博士论文】已对齐人工智能系统的持久脆弱性

《为码头高价值舰艇提供反无人机系统防御方案研究》80页

美陆军设想无人系统司令部

相关资讯

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

17+阅读 · 2021年3月2日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

14+阅读 · 2020年8月30日

【DeepMind】CrossTransformers: 空间感知的小样本迁移

【DeepMind】CrossTransformers: 空间感知的小样本迁移

专知

37+阅读 · 2020年7月26日

【资源】领域自适应相关论文、代码分享

【资源】领域自适应相关论文、代码分享

专知

32+阅读 · 2019年10月12日

综述：基于GAN的图像翻译模型盘点

综述：基于GAN的图像翻译模型盘点

GAN生成式对抗网络

21+阅读 · 2019年9月2日

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

GAN生成式对抗网络

10+阅读 · 2019年8月17日

迁移自适应学习最新综述，附21页论文下载

迁移自适应学习最新综述，附21页论文下载

专知

34+阅读 · 2019年3月13日

领域自适应学习论文大列表

领域自适应学习论文大列表

专知

71+阅读 · 2019年3月2日

迁移学习之Domain Adaptation

迁移学习之Domain Adaptation

全球人工智能

18+阅读 · 2018年4月11日

极市分享|王晋东迁移学习中的领域自适应方法

极市分享|王晋东迁移学习中的领域自适应方法

极市平台

10+阅读 · 2017年12月11日

相关论文

xTED: Cross-Domain Adaptation via Diffusion-Based Trajectory Editing

Arxiv

0+阅读 · 3月7日

RegionRoute: Regional Style Transfer with Diffusion Model

Arxiv

0+阅读 · 2月22日

Unpaired Image-to-Image Translation via a Self-Supervised Semantic Bridge

Arxiv

0+阅读 · 2月18日

Cross-Modal Mapping: Mitigating the Modality Gap for Few-Shot Image Classification

Arxiv

0+阅读 · 2月15日

The Entropic Signature of Class Speciation in Diffusion Models

Arxiv

0+阅读 · 2月10日

Latent Domain Modeling Improves Robustness to Geographic Shifts

Arxiv

0+阅读 · 2月9日

A-FloPS: Accelerating Diffusion Models via Adaptive Flow Path Sampler

Arxiv

0+阅读 · 2月8日

Image-to-Image Translation with Diffusion Transformers and CLIP-Based Image Conditioning

Arxiv

0+阅读 · 2月5日

Cross-Domain Offline Policy Adaptation via Selective Transition Correction

Arxiv

0+阅读 · 2月5日

Consensus-Aligned Neuron Efficient Fine-Tuning Large Language Models for Multi-Domain Machine Translation

Arxiv

0+阅读 · 2月5日

相关基金

图文混合跨媒体知识单元的模糊分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

3D平移不变剪切波域统计相关性驱动的多模态医学图像融合方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

总变差正则化模型的区域分解算法及其医学图像应用

国家自然科学基金

2+阅读 · 2015年12月31日

基于非独立同分布学习理论的图模型词义消歧及领域适应方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于尺度集的高分辨率遥感影像多尺度分类

国家自然科学基金

0+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂纵向数据的分位回归建模及其在生物医学大数据中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

扩散过程离散化形式下的若干统计问题的大偏差原理

国家自然科学基金

0+阅读 · 2014年12月31日

跨网络社会学习对移动用户创新扩散的影响研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于潜在语义对偶空间的新词翻译自动识别方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员