DADP: Domain Adaptive Diffusion Policy - 专知论文

会员服务 ·

0

表示 · 域自适应 · 自适应 · 领域自适应 · 上下文 ·

DADP: Domain Adaptive Diffusion Policy

翻译：DADP：领域自适应扩散策略

Pengcheng Wang,Qinghang Liu,Haotian Lin,Yiheng Li,Guojian Zhan,Masayoshi Tomizuka,Yixiao Wang

Learning domain adaptive policies that can generalize to unseen transition dynamics, remains a fundamental challenge in learning-based control. Substantial progress has been made through domain representation learning to capture domain-specific information, thus enabling domain-aware decision making. We analyze the process of learning domain representations through dynamical prediction and find that selecting contexts adjacent to the current step causes the learned representations to entangle static domain information with varying dynamical properties. Such mixture can confuse the conditioned policy, thereby constraining zero-shot adaptation. To tackle the challenge, we propose DADP (Domain Adaptive Diffusion Policy), which achieves robust adaptation through unsupervised disentanglement and domain-aware diffusion injection. First, we introduce Lagged Context Dynamical Prediction, a strategy that conditions future state estimation on a historical offset context; by increasing this temporal gap, we unsupervisedly disentangle static domain representations by filtering out transient properties. Second, we integrate the learned domain representations directly into the generative process by biasing the prior distribution and reformulating the diffusion target. Extensive experiments on challenging benchmarks across locomotion and manipulation demonstrate the superior performance, and the generalizability of DADP over prior methods. More visualization results are available on the https://outsider86.github.io/DomainAdaptiveDiffusionPolicy/.

翻译：学习能够泛化到未见过的转移动力学的领域自适应策略，仍然是基于学习的控制中的一个根本性挑战。通过领域表示学习来捕获领域特定信息，从而实现领域感知决策，已经取得了实质性进展。我们分析了通过动力学预测学习领域表示的过程，发现选择与当前步骤相邻的上下文会导致学习到的表示将静态领域信息与变化的动力学特性纠缠在一起。这种混合会混淆条件策略，从而限制零样本适应能力。为了应对这一挑战，我们提出了DADP（领域自适应扩散策略），它通过无监督解耦和领域感知扩散注入实现鲁棒适应。首先，我们引入了滞后上下文动力学预测策略，该策略基于历史偏移上下文对未来状态估计进行条件化；通过增加这种时间间隔，我们通过过滤掉瞬态特性，以无监督方式解耦出静态领域表示。其次，我们通过偏置先验分布和重新表述扩散目标，将学习到的领域表示直接集成到生成过程中。在涵盖运动与操作的多个具有挑战性的基准测试上进行的大量实验表明，DADP相比先前方法具有优越的性能和泛化能力。更多可视化结果可在 https://outsider86.github.io/DomainAdaptiveDiffusionPolicy/ 上获取。

0

相关内容

源域无数据域适应怎么做? 电子科大最新《无源域数据域适应》综述论文，详述基于数据和基于模型SFDA技术进展

源域无数据域适应怎么做? 电子科大最新《无源域数据域适应》综述论文，详述基于数据和基于模型SFDA技术进展

专知会员服务

24+阅读 · 2023年3月8日

【AAAI2022】领域自适应的主动学习:一种基于能量的方法

【AAAI2022】领域自适应的主动学习:一种基于能量的方法

专知会员服务

45+阅读 · 2021年12月6日

NeurIPS2021 | Cycle Self-Training：领域自适应的循环自训练方法与理论

NeurIPS2021 | Cycle Self-Training：领域自适应的循环自训练方法与理论

专知会员服务

20+阅读 · 2021年11月13日

【ICML2021】 RSD: 一种基于几何距离的可迁移回归表征学习方法

专知会员服务

18+阅读 · 2021年7月30日

最新《计算机视觉领域泛化Domain Generalization》综述论文，18页pdf229篇文献

专知会员服务

58+阅读 · 2021年7月27日

【ICML2021】域自适应回归的子空间距离表示

专知会员服务

23+阅读 · 2021年6月28日

【CVPR2021】面向通用领域自适应的领域共识聚类

专知会员服务

30+阅读 · 2021年5月6日

领域自适应研究综述

领域自适应研究综述

专知会员服务

55+阅读 · 2021年5月5日

【CVPR2021】DAML：针对开放领域泛化的领域增广元学习方法

【CVPR2021】DAML：针对开放领域泛化的领域增广元学习方法

专知会员服务

20+阅读 · 2021年4月21日

【浙江大学-AAAI2020】领域自适应的对抗损失，Adversarial-Learned Loss for Domain Adaptation

【浙江大学-AAAI2020】领域自适应的对抗损失，Adversarial-Learned Loss for Domain Adaptation

专知会员服务

62+阅读 · 2020年1月11日

【ICML2021】因果匹配领域泛化

【ICML2021】因果匹配领域泛化

专知

12+阅读 · 2021年8月12日

【CVPR2021】面向通用领域自适应的领域共识聚类

【CVPR2021】面向通用领域自适应的领域共识聚类

专知

24+阅读 · 2021年5月6日

ICML 2020 | 小样本学习首次引入领域迁移技术，屡获新SOTA结果！

ICML 2020 | 小样本学习首次引入领域迁移技术，屡获新SOTA结果！

AI科技评论

19+阅读 · 2020年6月21日

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

专知

16+阅读 · 2020年4月27日

【资源】领域自适应相关论文、代码分享

【资源】领域自适应相关论文、代码分享

专知

32+阅读 · 2019年10月12日

迁移自适应学习最新综述，附21页论文下载

迁移自适应学习最新综述，附21页论文下载

专知

34+阅读 · 2019年3月13日

领域自适应学习论文大列表

领域自适应学习论文大列表

专知

71+阅读 · 2019年3月2日

迁移学习之Domain Adaptation

迁移学习之Domain Adaptation

全球人工智能

18+阅读 · 2018年4月11日

自然语言处理中的自注意力机制（Self-Attention Mechanism）

自然语言处理中的自注意力机制（Self-Attention Mechanism）

PaperWeekly

22+阅读 · 2018年3月28日

极市分享|王晋东迁移学习中的领域自适应方法

极市分享|王晋东迁移学习中的领域自适应方法

极市平台

10+阅读 · 2017年12月11日

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

随机非线性量化反馈系统的自适应模糊控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

延迟容忍网络中自适应社会感知路由研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向多自治域环境的信息中心网络缓存策略和机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

解决地图要素空间冲突的智能化协同模型和算法

国家自然科学基金

6+阅读 · 2014年12月31日

基于合作博弈的互联网域间多路径路由关键技术研究

国家自然科学基金

2+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

Cross-Domain Policy Optimization via Bellman Consistency and Hybrid Critics

Arxiv

0+阅读 · 3月12日

PPGuide: Steering Diffusion Policies with Performance Predictive Guidance

Arxiv

0+阅读 · 3月11日

xTED: Cross-Domain Adaptation via Diffusion-Based Trajectory Editing

Arxiv

0+阅读 · 3月7日

DAWA: Dynamic Ambiguity-Wise Adaptation for Real-Time Domain Adaptive Semantic Segmentation

Arxiv

0+阅读 · 3月2日

AdaWorldPolicy: World-Model-Driven Diffusion Policy with Online Adaptive Learning for Robotic Manipulation

Arxiv

0+阅读 · 2月23日

FedSDAF: Leveraging Source Domain Awareness for Enhanced Federated Domain Generalization

Arxiv

0+阅读 · 2月22日

Diffusing to Coordinate: Efficient Online Multi-Agent Diffusion Policies

Arxiv

0+阅读 · 2月20日

Efficiently Assemble Normalization Layers and Regularization for Federated Domain Generalization

Arxiv

0+阅读 · 2月16日

Cross-Domain Offline Policy Adaptation via Selective Transition Correction

Arxiv

0+阅读 · 2月5日

A Unified Candidate Set with Scene-Adaptive Refinement via Diffusion for End-to-End Autonomous Driving

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

领域自适应

最新内容

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

3+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

3+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

4+阅读 · 5月30日

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

5+阅读 · 5月30日

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

12+阅读 · 5月30日

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

6+阅读 · 5月30日

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

8+阅读 · 5月30日

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

8+阅读 · 5月30日

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

11+阅读 · 5月29日

AutoScientists：自组织智能体团队驱动长期科学实验

AutoScientists：自组织智能体团队驱动长期科学实验

专知会员服务

6+阅读 · 5月29日

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

专知会员服务

6+阅读 · 5月29日

战略前沿人工智能的再思考（中文）

战略前沿人工智能的再思考（中文）

专知会员服务

8+阅读 · 5月29日

《量化地基防空系统间接效应的博弈论方法》

《量化地基防空系统间接效应的博弈论方法》

专知会员服务

6+阅读 · 5月29日

传感器网络：美国如何探测来自伊朗的导弹与无人机

传感器网络：美国如何探测来自伊朗的导弹与无人机

专知会员服务

6+阅读 · 5月29日

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

专知会员服务

10+阅读 · 5月29日

相关VIP内容

源域无数据域适应怎么做? 电子科大最新《无源域数据域适应》综述论文，详述基于数据和基于模型SFDA技术进展

源域无数据域适应怎么做? 电子科大最新《无源域数据域适应》综述论文，详述基于数据和基于模型SFDA技术进展

专知会员服务

24+阅读 · 2023年3月8日

【AAAI2022】领域自适应的主动学习:一种基于能量的方法

【AAAI2022】领域自适应的主动学习:一种基于能量的方法

专知会员服务

45+阅读 · 2021年12月6日

NeurIPS2021 | Cycle Self-Training：领域自适应的循环自训练方法与理论

NeurIPS2021 | Cycle Self-Training：领域自适应的循环自训练方法与理论

专知会员服务

20+阅读 · 2021年11月13日

【ICML2021】 RSD: 一种基于几何距离的可迁移回归表征学习方法

专知会员服务

18+阅读 · 2021年7月30日

最新《计算机视觉领域泛化Domain Generalization》综述论文，18页pdf229篇文献

专知会员服务

58+阅读 · 2021年7月27日

【ICML2021】域自适应回归的子空间距离表示

专知会员服务

23+阅读 · 2021年6月28日

【CVPR2021】面向通用领域自适应的领域共识聚类

专知会员服务

30+阅读 · 2021年5月6日

领域自适应研究综述

领域自适应研究综述

专知会员服务

55+阅读 · 2021年5月5日

【CVPR2021】DAML：针对开放领域泛化的领域增广元学习方法

【CVPR2021】DAML：针对开放领域泛化的领域增广元学习方法

专知会员服务

20+阅读 · 2021年4月21日

【浙江大学-AAAI2020】领域自适应的对抗损失，Adversarial-Learned Loss for Domain Adaptation

【浙江大学-AAAI2020】领域自适应的对抗损失，Adversarial-Learned Loss for Domain Adaptation

专知会员服务

62+阅读 · 2020年1月11日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

美以伊战争：首次人工智能战争——军事自主性困境

BES：让语言模型通过双向进化搜索自我改进

以色列-美国-伊朗战争中的无人机：关键要点

相关资讯

【ICML2021】因果匹配领域泛化

【ICML2021】因果匹配领域泛化

专知

12+阅读 · 2021年8月12日

【CVPR2021】面向通用领域自适应的领域共识聚类

【CVPR2021】面向通用领域自适应的领域共识聚类

专知

24+阅读 · 2021年5月6日

ICML 2020 | 小样本学习首次引入领域迁移技术，屡获新SOTA结果！

ICML 2020 | 小样本学习首次引入领域迁移技术，屡获新SOTA结果！

AI科技评论

19+阅读 · 2020年6月21日

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

专知

16+阅读 · 2020年4月27日

【资源】领域自适应相关论文、代码分享

【资源】领域自适应相关论文、代码分享

专知

32+阅读 · 2019年10月12日

迁移自适应学习最新综述，附21页论文下载

迁移自适应学习最新综述，附21页论文下载

专知

34+阅读 · 2019年3月13日

领域自适应学习论文大列表

领域自适应学习论文大列表

专知

71+阅读 · 2019年3月2日

迁移学习之Domain Adaptation

迁移学习之Domain Adaptation

全球人工智能

18+阅读 · 2018年4月11日

自然语言处理中的自注意力机制（Self-Attention Mechanism）

自然语言处理中的自注意力机制（Self-Attention Mechanism）

PaperWeekly

22+阅读 · 2018年3月28日

极市分享|王晋东迁移学习中的领域自适应方法

极市分享|王晋东迁移学习中的领域自适应方法

极市平台

10+阅读 · 2017年12月11日

相关论文

Cross-Domain Policy Optimization via Bellman Consistency and Hybrid Critics

Arxiv

0+阅读 · 3月12日

PPGuide: Steering Diffusion Policies with Performance Predictive Guidance

Arxiv

0+阅读 · 3月11日

xTED: Cross-Domain Adaptation via Diffusion-Based Trajectory Editing

Arxiv

0+阅读 · 3月7日

DAWA: Dynamic Ambiguity-Wise Adaptation for Real-Time Domain Adaptive Semantic Segmentation

Arxiv

0+阅读 · 3月2日

AdaWorldPolicy: World-Model-Driven Diffusion Policy with Online Adaptive Learning for Robotic Manipulation

Arxiv

0+阅读 · 2月23日

FedSDAF: Leveraging Source Domain Awareness for Enhanced Federated Domain Generalization

Arxiv

0+阅读 · 2月22日

Diffusing to Coordinate: Efficient Online Multi-Agent Diffusion Policies

Arxiv

0+阅读 · 2月20日

Efficiently Assemble Normalization Layers and Regularization for Federated Domain Generalization

Arxiv

0+阅读 · 2月16日

Cross-Domain Offline Policy Adaptation via Selective Transition Correction

Arxiv

0+阅读 · 2月5日

A Unified Candidate Set with Scene-Adaptive Refinement via Diffusion for End-to-End Autonomous Driving

Arxiv

0+阅读 · 2月4日

相关基金

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

随机非线性量化反馈系统的自适应模糊控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

延迟容忍网络中自适应社会感知路由研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向多自治域环境的信息中心网络缓存策略和机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

解决地图要素空间冲突的智能化协同模型和算法

国家自然科学基金

6+阅读 · 2014年12月31日

基于合作博弈的互联网域间多路径路由关键技术研究

国家自然科学基金

2+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员