Training-Free Test-Time Adaptation with Brownian Distance Covariance in Vision-Language Models - 专知论文

会员服务 ·

0

适配 · 方差 · 测试时适配 · 语言模型 · 计算成本 ·

Training-Free Test-Time Adaptation with Brownian Distance Covariance in Vision-Language Models

翻译：基于布朗距离协方差的免训练测试时适配方法在视觉语言模型中的应用

Yi Zhang,Chun-Wun Cheng,Angelica I. Aviles-Rivero,Zhihai He,Liang-Jie Zhang

from arxiv, Accepted in ICASSP 2026

Vision-language models suffer performance degradation under domain shift, limiting real-world applicability. Existing test-time adaptation methods are computationally intensive, rely on back-propagation, and often focus on single modalities. To address these issues, we propose Training-free Test-Time Adaptation with Brownian Distance Covariance (TaTa). TaTa leverages Brownian Distance Covariance-a powerful statistical measure that captures both linear and nonlinear dependencies via pairwise distances-to dynamically adapt VLMs to new domains without training or back-propagation. This not only improves efficiency but also enhances stability by avoiding disruptive weight updates. TaTa further integrates attribute-enhanced prompting to improve vision-language inference with descriptive visual cues. Combined with dynamic clustering and pseudo-label refinement, it effectively recalibrates the model for novel visual contexts. Experiments across diverse datasets show that TaTa significantly reduces computational cost while achieving state-of-the-art performance in domain and cross-dataset generalization.

翻译：视觉语言模型在领域偏移下存在性能退化问题，这限制了其实际应用。现有的测试时适配方法计算成本高、依赖反向传播，且通常仅关注单一模态。为解决这些问题，我们提出基于布朗距离协方差的免训练测试时适配方法（TaTa）。TaTa利用布朗距离协方差——一种通过成对距离同时捕捉线性和非线性依赖关系的强大统计度量——在无需训练或反向传播的情况下，动态地将视觉语言模型适配到新领域。这不仅提升了效率，还通过避免破坏性的权重更新增强了稳定性。TaTa进一步整合属性增强提示，利用描述性视觉线索改进视觉语言推理。结合动态聚类与伪标签优化，该方法能有效针对新颖视觉上下文重新校准模型。跨多个数据集的实验表明，TaTa在显著降低计算成本的同时，在领域泛化与跨数据集泛化任务中达到了最先进的性能水平。

0

相关内容

【NTU博士论文】缓解视觉及视觉-语言模型中的捷径学习并提升分布外泛化能力

【NTU博士论文】缓解视觉及视觉-语言模型中的捷径学习并提升分布外泛化能力

专知会员服务

14+阅读 · 4月6日

【NTU博士论文】缓解捷径学习并提升视觉及视觉-语言模型的分布外泛化能力

【NTU博士论文】缓解捷径学习并提升视觉及视觉-语言模型的分布外泛化能力

专知会员服务

11+阅读 · 3月29日

【博士论文】视觉处理中的时域适应：人类与视觉模型带来的启示

【博士论文】视觉处理中的时域适应：人类与视觉模型带来的启示

专知会员服务

32+阅读 · 1月29日

【AAAI2026】TOFA：面向视觉-语言模型的免训练一次性联邦自适应方法

【AAAI2026】TOFA：面向视觉-语言模型的免训练一次性联邦自适应方法

专知会员服务

13+阅读 · 2025年11月23日

【CVPR2025】用于视觉-语言基础模型模态对齐的后预训练方法

【CVPR2025】用于视觉-语言基础模型模态对齐的后预训练方法

专知会员服务

15+阅读 · 2025年4月18日

迁移学习在计算机视觉问题中的应用：当前进展、局限性与机会综述

迁移学习在计算机视觉问题中的应用：当前进展、局限性与机会综述

专知会员服务

24+阅读 · 2024年9月13日

具身智能中模型如何自适应更新？中科院ICML2024 | 基于快-慢测试时自适应的在线视觉-语言导航方法

具身智能中模型如何自适应更新？中科院ICML2024 | 基于快-慢测试时自适应的在线视觉-语言导航方法

专知会员服务

20+阅读 · 2024年5月29日

【CVPR2024】视觉-语言模型的高效测试时间调整

【CVPR2024】视觉-语言模型的高效测试时间调整

专知会员服务

20+阅读 · 2024年3月30日

【CVPR2023】用于无监督域适应的Patch-Mix Transformer: 博弈视角

【CVPR2023】用于无监督域适应的Patch-Mix Transformer: 博弈视角

专知会员服务

30+阅读 · 2023年3月27日

【IBM】在视觉和关系推理中迁移学习，Transfer Learning in Visual and Relational Reasoning

【IBM】在视觉和关系推理中迁移学习，Transfer Learning in Visual and Relational Reasoning

专知会员服务

45+阅读 · 2020年1月15日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知

12+阅读 · 2020年6月9日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

【AAAI 2020论文】一种面向推荐的自适应margin对称度量学习方法

【AAAI 2020论文】一种面向推荐的自适应margin对称度量学习方法

专知

16+阅读 · 2019年12月29日

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

专知

20+阅读 · 2019年11月24日

NLP+CV《桥接视觉与语言的研究综述》，带你全面了解视觉+语言最新应用和方法

NLP+CV《桥接视觉与语言的研究综述》，带你全面了解视觉+语言最新应用和方法

中国人工智能学会

27+阅读 · 2019年7月24日

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

新智元

10+阅读 · 2019年7月2日

【学界】虚拟对抗训练：一种新颖的半监督学习正则化方法

【学界】虚拟对抗训练：一种新颖的半监督学习正则化方法

GAN生成式对抗网络

10+阅读 · 2019年6月9日

领域自适应学习论文大列表

领域自适应学习论文大列表

专知

71+阅读 · 2019年3月2日

自然语言处理中的语言模型预训练方法

自然语言处理中的语言模型预训练方法

PaperWeekly

14+阅读 · 2018年10月21日

【论文推荐】最新5篇视觉目标跟踪相关论文—递归神经网络、深度适应计算策略、视觉目标跟踪基准、深度核化相关滤波、检测并跟踪

【论文推荐】最新5篇视觉目标跟踪相关论文—递归神经网络、深度适应计算策略、视觉目标跟踪基准、深度核化相关滤波、检测并跟踪

专知

14+阅读 · 2018年1月22日

面向计算机视觉问题的图匹配算法研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

光学自由曲面的像散补偿型动态差分干涉检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于非独立同分布学习理论的图模型词义消歧及领域适应方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于特征学习的空间非合作目标单目视觉位姿测量研究

国家自然科学基金

2+阅读 · 2015年12月31日

协方差融合算法在时滞系统中的应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于模型的无波前传感器自适应光学关键理论和方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于自学习对比度视觉注意模型和自适应深度特征的无分类目标检测

国家自然科学基金

2+阅读 · 2015年12月31日

稀疏性多维联合优化在线视觉跟踪方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

协方差阵的推断及在方向数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

DAWA: Dynamic Ambiguity-Wise Adaptation for Real-Time Domain Adaptive Semantic Segmentation

Arxiv

0+阅读 · 3月2日

E-BATS: Efficient Backpropagation-Free Test-Time Adaptation for Speech Foundation Models

Arxiv

0+阅读 · 2月23日

Audio-Visual Continual Test-Time Adaptation without Forgetting

Arxiv

0+阅读 · 2月20日

Stabilizing Test-Time Adaptation of High-Dimensional Simulation Surrogates via D-Optimal Statistics

Arxiv

0+阅读 · 2月17日

Efficient Test-Time Scaling for Small Vision-Language Models

Arxiv

0+阅读 · 2月16日

Unsupervised Layer-Wise Dynamic Test Time Adaptation for LLMs

Arxiv

0+阅读 · 2月10日

LookSharp: Attention Entropy Minimization for Test-Time Adaptation

Arxiv

0+阅读 · 2月7日

Multi-Scale Global-Instance Prompt Tuning for Continual Test-time Adaptation in Medical Image Segmentation

Arxiv

0+阅读 · 2月5日

Fine-tuning Pre-trained Vision-Language Models in a Human-Annotation-Free Manner

Arxiv

0+阅读 · 2月4日

SCALE: Self-uncertainty Conditioned Adaptive Looking and Execution for Vision-Language-Action Models

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

测试时适配

最新内容

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

9+阅读 · 5月29日

AutoScientists：自组织智能体团队驱动长期科学实验

AutoScientists：自组织智能体团队驱动长期科学实验

专知会员服务

4+阅读 · 5月29日

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

专知会员服务

5+阅读 · 5月29日

战略前沿人工智能的再思考（中文）

战略前沿人工智能的再思考（中文）

专知会员服务

5+阅读 · 5月29日

《量化地基防空系统间接效应的博弈论方法》

《量化地基防空系统间接效应的博弈论方法》

专知会员服务

5+阅读 · 5月29日

传感器网络：美国如何探测来自伊朗的导弹与无人机

传感器网络：美国如何探测来自伊朗的导弹与无人机

专知会员服务

5+阅读 · 5月29日

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

专知会员服务

7+阅读 · 5月29日

“史诗怒火行动”中美军损失的作战飞机

“史诗怒火行动”中美军损失的作战飞机

专知会员服务

5+阅读 · 5月29日

ICML 2026 | 理解上下文持续学习中的泛化与遗忘

ICML 2026 | 理解上下文持续学习中的泛化与遗忘

专知会员服务

5+阅读 · 5月28日

Agent Harness综述：大模型智能体执行器工程全景

Agent Harness综述：大模型智能体执行器工程全景

专知会员服务

15+阅读 · 5月28日

审视现代战争中的 AI 赋能杀伤链系统及印度防务的战略要务（中文版）

审视现代战争中的 AI 赋能杀伤链系统及印度防务的战略要务（中文版）

专知会员服务

14+阅读 · 5月28日

分布式作战效能：乌克兰如何在战术层面重新定义火力打击、电子战与防空（中文版）

分布式作战效能：乌克兰如何在战术层面重新定义火力打击、电子战与防空（中文版）

专知会员服务

9+阅读 · 5月28日

马赛克防御与分布式指挥：伊朗的回击（中文版）

马赛克防御与分布式指挥：伊朗的回击（中文版）

专知会员服务

10+阅读 · 5月28日

《基于理论的威慑效能评估》

《基于理论的威慑效能评估》

专知会员服务

8+阅读 · 5月28日

《移动旅级战斗队转型中的支援单元指挥控制挑战》

《移动旅级战斗队转型中的支援单元指挥控制挑战》

专知会员服务

15+阅读 · 5月27日

相关VIP内容

【NTU博士论文】缓解视觉及视觉-语言模型中的捷径学习并提升分布外泛化能力

【NTU博士论文】缓解视觉及视觉-语言模型中的捷径学习并提升分布外泛化能力

专知会员服务

14+阅读 · 4月6日

【NTU博士论文】缓解捷径学习并提升视觉及视觉-语言模型的分布外泛化能力

【NTU博士论文】缓解捷径学习并提升视觉及视觉-语言模型的分布外泛化能力

专知会员服务

11+阅读 · 3月29日

【博士论文】视觉处理中的时域适应：人类与视觉模型带来的启示

【博士论文】视觉处理中的时域适应：人类与视觉模型带来的启示

专知会员服务

32+阅读 · 1月29日

【AAAI2026】TOFA：面向视觉-语言模型的免训练一次性联邦自适应方法

【AAAI2026】TOFA：面向视觉-语言模型的免训练一次性联邦自适应方法

专知会员服务

13+阅读 · 2025年11月23日

【CVPR2025】用于视觉-语言基础模型模态对齐的后预训练方法

【CVPR2025】用于视觉-语言基础模型模态对齐的后预训练方法

专知会员服务

15+阅读 · 2025年4月18日

迁移学习在计算机视觉问题中的应用：当前进展、局限性与机会综述

迁移学习在计算机视觉问题中的应用：当前进展、局限性与机会综述

专知会员服务

24+阅读 · 2024年9月13日

具身智能中模型如何自适应更新？中科院ICML2024 | 基于快-慢测试时自适应的在线视觉-语言导航方法

具身智能中模型如何自适应更新？中科院ICML2024 | 基于快-慢测试时自适应的在线视觉-语言导航方法

专知会员服务

20+阅读 · 2024年5月29日

【CVPR2024】视觉-语言模型的高效测试时间调整

【CVPR2024】视觉-语言模型的高效测试时间调整

专知会员服务

20+阅读 · 2024年3月30日

【CVPR2023】用于无监督域适应的Patch-Mix Transformer: 博弈视角

【CVPR2023】用于无监督域适应的Patch-Mix Transformer: 博弈视角

专知会员服务

30+阅读 · 2023年3月27日

【IBM】在视觉和关系推理中迁移学习，Transfer Learning in Visual and Relational Reasoning

【IBM】在视觉和关系推理中迁移学习，Transfer Learning in Visual and Relational Reasoning

专知会员服务

45+阅读 · 2020年1月15日

热门VIP内容

开通专知VIP会员享更多权益服务

AutoScientists：自组织智能体团队驱动长期科学实验

战略前沿人工智能的再思考（中文）

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

相关资讯

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知

12+阅读 · 2020年6月9日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

【AAAI 2020论文】一种面向推荐的自适应margin对称度量学习方法

【AAAI 2020论文】一种面向推荐的自适应margin对称度量学习方法

专知

16+阅读 · 2019年12月29日

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

专知

20+阅读 · 2019年11月24日

NLP+CV《桥接视觉与语言的研究综述》，带你全面了解视觉+语言最新应用和方法

NLP+CV《桥接视觉与语言的研究综述》，带你全面了解视觉+语言最新应用和方法

中国人工智能学会

27+阅读 · 2019年7月24日

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

新智元

10+阅读 · 2019年7月2日

【学界】虚拟对抗训练：一种新颖的半监督学习正则化方法

【学界】虚拟对抗训练：一种新颖的半监督学习正则化方法

GAN生成式对抗网络

10+阅读 · 2019年6月9日

领域自适应学习论文大列表

领域自适应学习论文大列表

专知

71+阅读 · 2019年3月2日

自然语言处理中的语言模型预训练方法

自然语言处理中的语言模型预训练方法

PaperWeekly

14+阅读 · 2018年10月21日

【论文推荐】最新5篇视觉目标跟踪相关论文—递归神经网络、深度适应计算策略、视觉目标跟踪基准、深度核化相关滤波、检测并跟踪

【论文推荐】最新5篇视觉目标跟踪相关论文—递归神经网络、深度适应计算策略、视觉目标跟踪基准、深度核化相关滤波、检测并跟踪

专知

14+阅读 · 2018年1月22日

相关论文

DAWA: Dynamic Ambiguity-Wise Adaptation for Real-Time Domain Adaptive Semantic Segmentation

Arxiv

0+阅读 · 3月2日

E-BATS: Efficient Backpropagation-Free Test-Time Adaptation for Speech Foundation Models

Arxiv

0+阅读 · 2月23日

Audio-Visual Continual Test-Time Adaptation without Forgetting

Arxiv

0+阅读 · 2月20日

Stabilizing Test-Time Adaptation of High-Dimensional Simulation Surrogates via D-Optimal Statistics

Arxiv

0+阅读 · 2月17日

Efficient Test-Time Scaling for Small Vision-Language Models

Arxiv

0+阅读 · 2月16日

Unsupervised Layer-Wise Dynamic Test Time Adaptation for LLMs

Arxiv

0+阅读 · 2月10日

LookSharp: Attention Entropy Minimization for Test-Time Adaptation

Arxiv

0+阅读 · 2月7日

Multi-Scale Global-Instance Prompt Tuning for Continual Test-time Adaptation in Medical Image Segmentation

Arxiv

0+阅读 · 2月5日

Fine-tuning Pre-trained Vision-Language Models in a Human-Annotation-Free Manner

Arxiv

0+阅读 · 2月4日

SCALE: Self-uncertainty Conditioned Adaptive Looking and Execution for Vision-Language-Action Models

Arxiv

0+阅读 · 2月4日

相关基金

面向计算机视觉问题的图匹配算法研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

光学自由曲面的像散补偿型动态差分干涉检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于非独立同分布学习理论的图模型词义消歧及领域适应方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于特征学习的空间非合作目标单目视觉位姿测量研究

国家自然科学基金

2+阅读 · 2015年12月31日

协方差融合算法在时滞系统中的应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于模型的无波前传感器自适应光学关键理论和方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于自学习对比度视觉注意模型和自适应深度特征的无分类目标检测

国家自然科学基金

2+阅读 · 2015年12月31日

稀疏性多维联合优化在线视觉跟踪方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

协方差阵的推断及在方向数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员