Channel-Aware Probing for Multi-Channel Imaging - 专知论文

会员服务 ·

0

通道 · CAP · 多通道 · 预训练 · 微调 ·

Channel-Aware Probing for Multi-Channel Imaging

翻译：通道感知探测在多通道成像中的应用

Umar Marikkar,Syed Sameed Husain,Muhammad Awais,Sara Atito

Training and evaluating vision encoders on Multi-Channel Imaging (MCI) data remains challenging as channel configurations vary across datasets, preventing fixed-channel training and limiting reuse of pre-trained encoders on new channel settings. Prior work trains MCI encoders but typically evaluates them via full fine-tuning, leaving probing with frozen pre-trained encoders comparatively underexplored. Existing studies that perform probing largely focus on improving representations, rather than how to best leverage fixed representations for downstream tasks. Although the latter problem has been studied in other domains, directly transferring those strategies to MCI yields weak results, even worse than training from scratch. We therefore propose Channel-Aware Probing (CAP), which exploits the intrinsic inter-channel diversity in MCI datasets by controlling feature flow at both the encoder and probe levels. CAP uses Independent Feature Encoding (IFE) to encode each channel separately, and Decoupled Pooling (DCP) to pool within channels before aggregating across channels. Across three MCI benchmarks, CAP consistently improves probing performance over the default probing protocol, matches fine-tuning from scratch, and largely reduces the gap to full fine-tuning from the same MCI pre-trained checkpoints. Code can be found in https://github.com/umarikkar/CAP.

翻译：在多通道成像（MCI）数据上训练和评估视觉编码器仍然具有挑战性，因为不同数据集之间的通道配置各不相同，这阻碍了固定通道训练，并限制了预训练编码器在新通道设置上的复用。先前的研究虽然训练了MCI编码器，但通常通过完全微调进行评估，相比之下，使用冻结的预训练编码器进行探测的研究则相对不足。现有进行探测的研究主要集中于改进表征，而非如何最佳地利用固定表征进行下游任务。尽管后一问题已在其他领域得到研究，但直接将那些策略迁移到MCI中效果不佳，甚至比从头开始训练更差。因此，我们提出了通道感知探测（CAP），该方法通过在编码器和探测层两个层面控制特征流，利用MCI数据中固有的通道间多样性。CAP使用独立特征编码（IFE）分别编码每个通道，并采用解耦池化（DCP）在跨通道聚合之前先在通道内进行池化。在三个MCI基准测试中，与默认探测协议相比，CAP持续提升了探测性能，与从头开始的微调结果相当，并显著缩小了与基于相同MCI预训练检查点进行完全微调之间的差距。代码可在 https://github.com/umarikkar/CAP 找到。

0

相关内容

面向具身智能的多传感器融合感知综述：背景、方法、挑战与前景

面向具身智能的多传感器融合感知综述：背景、方法、挑战与前景

专知会员服务

20+阅读 · 2025年6月29日

视觉通用模型综述

视觉通用模型综述

专知会员服务

28+阅读 · 2025年6月12日

《多功能雷达中的自适应雷达资源管理：开发雷达调度、探测和跟踪的认知方法》最新77页

《多功能雷达中的自适应雷达资源管理：开发雷达调度、探测和跟踪的认知方法》最新77页

专知会员服务

38+阅读 · 2024年12月4日

《通用多模态模型的视觉指令微调》综述

《通用多模态模型的视觉指令微调》综述

专知会员服务

40+阅读 · 2023年12月29日

使用多模态语言模型生成图像

使用多模态语言模型生成图像

专知会员服务

32+阅读 · 2023年8月23日

《多域作战中用于人工智能（AI）和机器学习（ML）的合成环境》（中文版）美国陆军研究实验室报告

《多域作战中用于人工智能（AI）和机器学习（ML）的合成环境》（中文版）美国陆军研究实验室报告

专知会员服务

162+阅读 · 2023年7月12日

【Meta AI】多模态理解研究进展，Advances in multimodal understanding research at Meta AI

【Meta AI】多模态理解研究进展，Advances in multimodal understanding research at Meta AI

专知会员服务

68+阅读 · 2022年3月20日

基于深度学习的视觉多目标跟踪算法综述

专知会员服务

50+阅读 · 2021年4月15日

机器学习在信道建模中的应用综述

机器学习在信道建模中的应用综述

专知会员服务

29+阅读 · 2021年3月16日

【推荐论文】多通道注意力选择GAN的图像到图像转换，Multi-Channel Attention Selection GANs for Guided Image-to-Image Translation

【推荐论文】多通道注意力选择GAN的图像到图像转换，Multi-Channel Attention Selection GANs for Guided Image-to-Image Translation

专知会员服务

30+阅读 · 2020年2月6日

【DeepMind】CrossTransformers: 空间感知的小样本迁移

【DeepMind】CrossTransformers: 空间感知的小样本迁移

专知

37+阅读 · 2020年7月26日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

GAN生成式对抗网络

10+阅读 · 2019年8月17日

【综述】深度学习在视频多目标跟踪上的应用

【综述】深度学习在视频多目标跟踪上的应用

专知

14+阅读 · 2019年8月8日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

视频中的多目标跟踪【附PPT与视频资料】

视频中的多目标跟踪【附PPT与视频资料】

人工智能前沿讲习班

30+阅读 · 2018年11月29日

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

极市平台

14+阅读 · 2018年3月21日

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

专知

27+阅读 · 2018年2月7日

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

炼数成金订阅号

11+阅读 · 2017年9月20日

【分析】图像分类、目标检测、图像分割、图像生成……一文「计算机视觉」全分析

【分析】图像分类、目标检测、图像分割、图像生成……一文「计算机视觉」全分析

GAN生成式对抗网络

23+阅读 · 2017年9月14日

多波束卫星通信中基于压缩感知的预编码设计与干扰消除技术

国家自然科学基金

1+阅读 · 2017年12月31日

多天线接收信号联合信道参数估计与符号检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于张量的高维多通道图像压缩感知重建理论与算法及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向无线多媒体传感器网络的高效压缩视频感知

国家自然科学基金

0+阅读 · 2015年12月31日

多信道压缩采样实现多维射频层析成像的理论与方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向可穿戴设备的压缩感知关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多视图协同训练的高光谱遥感影像分类

国家自然科学基金

3+阅读 · 2014年12月31日

多变量形态学分水岭理论及其在多通道图像处理中的应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

远紫外感应电荷交叉延迟线阳极光子计数成像探测器关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于融合先验知识的机器学习的多传感器融合研究

国家自然科学基金

16+阅读 · 2013年12月31日

Improving Channel Estimation via Multimodal Diffusion Models with Flow Matching

Arxiv

0+阅读 · 3月13日

Generative Diffusion Models for High Dimensional Channel Estimation

Arxiv

0+阅读 · 3月9日

Monitoring Covariance in Multichannel Profiles via Functional Graphical Models

Arxiv

0+阅读 · 3月5日

Search Multilayer Perceptron-Based Fusion for Efficient and Accurate Siamese Tracking

Arxiv

0+阅读 · 3月2日

Enabling Large-Scale Channel Sounding for 6G: A Framework for Sparse Sampling and Multipath Component Extraction

Arxiv

0+阅读 · 2月26日

Studying the Separability of Visual Channel Pairs in Symbol Maps

Arxiv

0+阅读 · 2月23日

Multi-View Wireless Sensing via Conditional Generative Learning: Framework and Model Design

Arxiv

0+阅读 · 2月20日

Multimodal Integrated Knowledge Transfer to Large Language Models through Preference Optimization with Biomedical Applications

Arxiv

0+阅读 · 2月16日

Evolving Multi-Channel Confidence-Aware Activation Functions for Missing Data with Channel Propagation

Arxiv

0+阅读 · 2月14日

Multi-Cue Anomaly Detection and Localization under Data Contamination

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

2+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

3+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

5+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

4+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

4+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

5+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

3+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

6+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

9+阅读 · 6月22日

相关VIP内容

面向具身智能的多传感器融合感知综述：背景、方法、挑战与前景

面向具身智能的多传感器融合感知综述：背景、方法、挑战与前景

专知会员服务

20+阅读 · 2025年6月29日

视觉通用模型综述

视觉通用模型综述

专知会员服务

28+阅读 · 2025年6月12日

《多功能雷达中的自适应雷达资源管理：开发雷达调度、探测和跟踪的认知方法》最新77页

《多功能雷达中的自适应雷达资源管理：开发雷达调度、探测和跟踪的认知方法》最新77页

专知会员服务

38+阅读 · 2024年12月4日

《通用多模态模型的视觉指令微调》综述

《通用多模态模型的视觉指令微调》综述

专知会员服务

40+阅读 · 2023年12月29日

使用多模态语言模型生成图像

使用多模态语言模型生成图像

专知会员服务

32+阅读 · 2023年8月23日

《多域作战中用于人工智能（AI）和机器学习（ML）的合成环境》（中文版）美国陆军研究实验室报告

《多域作战中用于人工智能（AI）和机器学习（ML）的合成环境》（中文版）美国陆军研究实验室报告

专知会员服务

162+阅读 · 2023年7月12日

【Meta AI】多模态理解研究进展，Advances in multimodal understanding research at Meta AI

【Meta AI】多模态理解研究进展，Advances in multimodal understanding research at Meta AI

专知会员服务

68+阅读 · 2022年3月20日

基于深度学习的视觉多目标跟踪算法综述

专知会员服务

50+阅读 · 2021年4月15日

机器学习在信道建模中的应用综述

机器学习在信道建模中的应用综述

专知会员服务

29+阅读 · 2021年3月16日

【推荐论文】多通道注意力选择GAN的图像到图像转换，Multi-Channel Attention Selection GANs for Guided Image-to-Image Translation

【推荐论文】多通道注意力选择GAN的图像到图像转换，Multi-Channel Attention Selection GANs for Guided Image-to-Image Translation

专知会员服务

30+阅读 · 2020年2月6日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

【DeepMind】CrossTransformers: 空间感知的小样本迁移

【DeepMind】CrossTransformers: 空间感知的小样本迁移

专知

37+阅读 · 2020年7月26日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

GAN生成式对抗网络

10+阅读 · 2019年8月17日

【综述】深度学习在视频多目标跟踪上的应用

【综述】深度学习在视频多目标跟踪上的应用

专知

14+阅读 · 2019年8月8日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

视频中的多目标跟踪【附PPT与视频资料】

视频中的多目标跟踪【附PPT与视频资料】

人工智能前沿讲习班

30+阅读 · 2018年11月29日

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

极市平台

14+阅读 · 2018年3月21日

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

专知

27+阅读 · 2018年2月7日

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

炼数成金订阅号

11+阅读 · 2017年9月20日

【分析】图像分类、目标检测、图像分割、图像生成……一文「计算机视觉」全分析

【分析】图像分类、目标检测、图像分割、图像生成……一文「计算机视觉」全分析

GAN生成式对抗网络

23+阅读 · 2017年9月14日

相关论文

Improving Channel Estimation via Multimodal Diffusion Models with Flow Matching

Arxiv

0+阅读 · 3月13日

Generative Diffusion Models for High Dimensional Channel Estimation

Arxiv

0+阅读 · 3月9日

Monitoring Covariance in Multichannel Profiles via Functional Graphical Models

Arxiv

0+阅读 · 3月5日

Search Multilayer Perceptron-Based Fusion for Efficient and Accurate Siamese Tracking

Arxiv

0+阅读 · 3月2日

Enabling Large-Scale Channel Sounding for 6G: A Framework for Sparse Sampling and Multipath Component Extraction

Arxiv

0+阅读 · 2月26日

Studying the Separability of Visual Channel Pairs in Symbol Maps

Arxiv

0+阅读 · 2月23日

Multi-View Wireless Sensing via Conditional Generative Learning: Framework and Model Design

Arxiv

0+阅读 · 2月20日

Multimodal Integrated Knowledge Transfer to Large Language Models through Preference Optimization with Biomedical Applications

Arxiv

0+阅读 · 2月16日

Evolving Multi-Channel Confidence-Aware Activation Functions for Missing Data with Channel Propagation

Arxiv

0+阅读 · 2月14日

Multi-Cue Anomaly Detection and Localization under Data Contamination

Arxiv

0+阅读 · 2月4日

相关基金

多波束卫星通信中基于压缩感知的预编码设计与干扰消除技术

国家自然科学基金

1+阅读 · 2017年12月31日

多天线接收信号联合信道参数估计与符号检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于张量的高维多通道图像压缩感知重建理论与算法及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向无线多媒体传感器网络的高效压缩视频感知

国家自然科学基金

0+阅读 · 2015年12月31日

多信道压缩采样实现多维射频层析成像的理论与方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向可穿戴设备的压缩感知关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多视图协同训练的高光谱遥感影像分类

国家自然科学基金

3+阅读 · 2014年12月31日

多变量形态学分水岭理论及其在多通道图像处理中的应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

远紫外感应电荷交叉延迟线阳极光子计数成像探测器关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于融合先验知识的机器学习的多传感器融合研究

国家自然科学基金

16+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员