位置感知的场景-外观解耦用于双向光声显微镜配准 (Position-Aware Scene-Appearance Disentanglement for Bidirectional Photoacoustic Microscopy Registration) - 专知论文

会员服务 ·

0

配准 · 微镜 · 解耦 · 位置感知 · PAM ·

Position-Aware Scene-Appearance Disentanglement for Bidirectional Photoacoustic Microscopy Registration

翻译：位置感知的场景-外观解耦用于双向光声显微镜配准

Yiwen Wang,Jiahao Qin

from arxiv, 10 pages, 5 figures

High-speed optical-resolution photoacoustic microscopy (OR-PAM) with bidirectional raster scanning doubles imaging speed but introduces coupled domain shift and geometric misalignment between forward and backward scan lines. Existing registration methods, constrained by brightness constancy assumptions, achieve limited alignment quality, while recent generative approaches address domain shift through complex architectures that lack temporal awareness across frames. We propose GPEReg-Net, a scene-appearance disentanglement framework that separates domain-invariant scene features from domain-specific appearance codes via Adaptive Instance Normalization (AdaIN), enabling direct image-to-image registration without explicit deformation field estimation. To exploit temporal structure in sequential acquisitions, we introduce a Global Position Encoding (GPE) module that combines learnable position embeddings with sinusoidal encoding and cross-frame attention, allowing the network to leverage context from neighboring frames for improved temporal coherence. On the OR-PAM-Reg-4K benchmark (432 test samples), GPEReg-Net achieves NCC of 0.953, SSIM of 0.932, and PSNR of 34.49dB, surpassing the state-of-the-art by 3.8% in SSIM and 1.99dB in PSNR while maintaining competitive NCC. Code is available at https://github.com/JiahaoQin/GPEReg-Net.

翻译：具有双向光栅扫描的高速光学分辨率光声显微镜（OR-PAM）将成像速度提高了一倍，但引入了前向和后向扫描线之间的耦合域偏移和几何错位。现有的配准方法受限于亮度恒定假设，对齐质量有限；而最近的生成方法虽然通过复杂的架构解决了域偏移问题，但缺乏跨帧的时间感知能力。我们提出了GPEReg-Net，这是一种场景-外观解耦框架，通过自适应实例归一化（AdaIN）将域不变场景特征与域特定外观代码分离，从而无需显式形变场估计即可实现直接的图像到图像配准。为了利用序列采集中的时间结构，我们引入了全局位置编码（GPE）模块，该模块将可学习的位置嵌入与正弦编码和跨帧注意力相结合，使网络能够利用相邻帧的上下文信息以改善时间一致性。在OR-PAM-Reg-4K基准测试（432个测试样本）上，GPEReg-Net实现了0.953的归一化互相关（NCC）、0.932的结构相似性指数（SSIM）和34.49dB的峰值信噪比（PSNR），在SSIM上超过现有最佳方法3.8%，在PSNR上超过1.99dB，同时保持了具有竞争力的NCC。代码可在 https://github.com/JiahaoQin/GPEReg-Net 获取。

0

相关内容

【ICML2025】Proxy-FDA：基于代理的特征分布对齐方法，用于无遗忘地微调视觉基础模型

【ICML2025】Proxy-FDA：基于代理的特征分布对齐方法，用于无遗忘地微调视觉基础模型

专知会员服务

9+阅读 · 2025年6月3日

多分辨率SAR与光学遥感影像配准方法：综述、数据集与未来展望

多分辨率SAR与光学遥感影像配准方法：综述、数据集与未来展望

专知会员服务

23+阅读 · 2025年2月5日

针对预训练视觉模型的参数高效微调

针对预训练视觉模型的参数高效微调

专知会员服务

22+阅读 · 2024年2月7日

【NeurIPS2023】通过适配器重新组合的大型视觉Transformer高效适应

【NeurIPS2023】通过适配器重新组合的大型视觉Transformer高效适应

专知会员服务

20+阅读 · 2023年10月16日

《小型无人机实时多模态定位和识别的深度学习》2023最新论文（含讲解PPT、演示视频），北约科技组织“分布式多光谱和多静态传感”会议

《小型无人机实时多模态定位和识别的深度学习》2023最新论文（含讲解PPT、演示视频），北约科技组织“分布式多光谱和多静态传感”会议

专知会员服务

75+阅读 · 2023年2月6日

面向汽车驾驶感知的多模态传感器融合研究综述：一文详解50多种多模态图像融合方法

面向汽车驾驶感知的多模态传感器融合研究综述：一文详解50多种多模态图像融合方法

专知会员服务

60+阅读 · 2023年1月17日

光声层析成像技术的最新进展

光声层析成像技术的最新进展

专知会员服务

11+阅读 · 2022年5月23日

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

专知会员服务

36+阅读 · 2022年4月2日

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

光场显著性检测研究综述

专知会员服务

19+阅读 · 2020年12月23日

基于深度学习的单模医学图像配准综述（附VoxelMorph配准实例和代码）

基于深度学习的单模医学图像配准综述（附VoxelMorph配准实例和代码）

极市平台

12+阅读 · 2020年10月2日

武大提出FarSeg：遥感图像分割新网络，解决前景背景不平衡问题 | CVPR 2020

武大提出FarSeg：遥感图像分割新网络，解决前景背景不平衡问题 | CVPR 2020

CVer

17+阅读 · 2020年7月10日

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

专知

20+阅读 · 2019年11月24日

综述 | 图像配准 Image registration

综述 | 图像配准 Image registration

计算机视觉life

19+阅读 · 2019年9月12日

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

新智元

10+阅读 · 2019年7月2日

深度学习应用在图像匹配的效果如何？

深度学习应用在图像匹配的效果如何？

中国图象图形学报

10+阅读 · 2019年6月11日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

立体匹配技术简介

立体匹配技术简介

计算机视觉life

28+阅读 · 2019年4月22日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

深度相机原理揭秘--双目立体视觉

深度相机原理揭秘--双目立体视觉

计算机视觉life

10+阅读 · 2017年11月7日

基于光场测量的高清晰成像方法探索研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于LED自适应照明优化的可见光通信网多域耦合传输技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

表面等离子体耦合共振发射的近场调控及其新型光学成像技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

光场成像的轴向超分辨率方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

有向图谱理论在图像匹配中应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

调控光场实现超分辨显微成像的理论与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

由偏振标记，由光纤远程柔性、共路传输的二合一固体微片激光回馈干涉仪

国家自然科学基金

0+阅读 · 2014年12月31日

微米透镜的成像改进方法及其机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

双微阵列语音增强与定位方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

An Industrial Dataset for Scene Acquisitions and Functional Schematics Alignment

Arxiv

0+阅读 · 2月17日

Mitigating Pretraining-Induced Attention Asymmetry in 2D+ Electron Microscopy Image Segmentation

Arxiv

0+阅读 · 2月16日

Reconfigurable Intelligent Surfaces-assisted Positioning in Integrated Sensing and Communication Systems

Arxiv

0+阅读 · 2月16日

Differential pose optimization in descriptor space -- Combining Geometric and Photometric Methods for Motion Estimation

Arxiv

0+阅读 · 2月15日

Improving Medical Visual Reinforcement Fine-Tuning via Perception and Reasoning Augmentation

Arxiv

0+阅读 · 2月11日

See Less, See Right: Bi-directional Perceptual Shaping For Multimodal Reasoning

Arxiv

0+阅读 · 2月5日

Beyond Global Scanning: Adaptive Visual State Space Modeling for Salient Object Detection in Optical Remote Sensing Images

Arxiv

0+阅读 · 2月4日

Seeing through Light and Darkness: Sensor-Physics Grounded Deblurring HDR NeRF from Single-Exposure Images and Events

Arxiv

0+阅读 · 2月2日

Learning Domain-Invariant Representations for Cross-Domain Image Registration via Scene-Appearance Disentanglement

Arxiv

0+阅读 · 1月20日

Adaptive Rotary Steering with Joint Autoregression for Robust Extraction of Closely Moving Speakers in Dynamic Scenarios

Arxiv

0+阅读 · 1月18日

VIP会员

文章信息

相关主题

相关VIP内容

【ICML2025】Proxy-FDA：基于代理的特征分布对齐方法，用于无遗忘地微调视觉基础模型

【ICML2025】Proxy-FDA：基于代理的特征分布对齐方法，用于无遗忘地微调视觉基础模型

专知会员服务

9+阅读 · 2025年6月3日

多分辨率SAR与光学遥感影像配准方法：综述、数据集与未来展望

多分辨率SAR与光学遥感影像配准方法：综述、数据集与未来展望

专知会员服务

23+阅读 · 2025年2月5日

针对预训练视觉模型的参数高效微调

针对预训练视觉模型的参数高效微调

专知会员服务

22+阅读 · 2024年2月7日

【NeurIPS2023】通过适配器重新组合的大型视觉Transformer高效适应

【NeurIPS2023】通过适配器重新组合的大型视觉Transformer高效适应

专知会员服务

20+阅读 · 2023年10月16日

《小型无人机实时多模态定位和识别的深度学习》2023最新论文（含讲解PPT、演示视频），北约科技组织“分布式多光谱和多静态传感”会议

《小型无人机实时多模态定位和识别的深度学习》2023最新论文（含讲解PPT、演示视频），北约科技组织“分布式多光谱和多静态传感”会议

专知会员服务

75+阅读 · 2023年2月6日

面向汽车驾驶感知的多模态传感器融合研究综述：一文详解50多种多模态图像融合方法

面向汽车驾驶感知的多模态传感器融合研究综述：一文详解50多种多模态图像融合方法

专知会员服务

60+阅读 · 2023年1月17日

光声层析成像技术的最新进展

光声层析成像技术的最新进展

专知会员服务

11+阅读 · 2022年5月23日

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

专知会员服务

36+阅读 · 2022年4月2日

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

光场显著性检测研究综述

专知会员服务

19+阅读 · 2020年12月23日

热门VIP内容

开通专知VIP会员享更多权益服务

《人工智能、武器与影响力：前沿模型在模拟核危机中展现复杂推理》2026最新46页报告

AI智能体时代大模型安全风险与攻防新挑战

《无人机与战争：被忽视的环境影响及无人机保护潜力》

俄罗斯规划未来无人机驱动军队

相关资讯

基于深度学习的单模医学图像配准综述（附VoxelMorph配准实例和代码）

基于深度学习的单模医学图像配准综述（附VoxelMorph配准实例和代码）

极市平台

12+阅读 · 2020年10月2日

武大提出FarSeg：遥感图像分割新网络，解决前景背景不平衡问题 | CVPR 2020

武大提出FarSeg：遥感图像分割新网络，解决前景背景不平衡问题 | CVPR 2020

CVer

17+阅读 · 2020年7月10日

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

专知

20+阅读 · 2019年11月24日

综述 | 图像配准 Image registration

综述 | 图像配准 Image registration

计算机视觉life

19+阅读 · 2019年9月12日

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

新智元

10+阅读 · 2019年7月2日

深度学习应用在图像匹配的效果如何？

深度学习应用在图像匹配的效果如何？

中国图象图形学报

10+阅读 · 2019年6月11日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

立体匹配技术简介

立体匹配技术简介

计算机视觉life

28+阅读 · 2019年4月22日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

深度相机原理揭秘--双目立体视觉

深度相机原理揭秘--双目立体视觉

计算机视觉life

10+阅读 · 2017年11月7日

相关论文

An Industrial Dataset for Scene Acquisitions and Functional Schematics Alignment

Arxiv

0+阅读 · 2月17日

Mitigating Pretraining-Induced Attention Asymmetry in 2D+ Electron Microscopy Image Segmentation

Arxiv

0+阅读 · 2月16日

Reconfigurable Intelligent Surfaces-assisted Positioning in Integrated Sensing and Communication Systems

Arxiv

0+阅读 · 2月16日

Differential pose optimization in descriptor space -- Combining Geometric and Photometric Methods for Motion Estimation

Arxiv

0+阅读 · 2月15日

Improving Medical Visual Reinforcement Fine-Tuning via Perception and Reasoning Augmentation

Arxiv

0+阅读 · 2月11日

See Less, See Right: Bi-directional Perceptual Shaping For Multimodal Reasoning

Arxiv

0+阅读 · 2月5日

Beyond Global Scanning: Adaptive Visual State Space Modeling for Salient Object Detection in Optical Remote Sensing Images

Arxiv

0+阅读 · 2月4日

Seeing through Light and Darkness: Sensor-Physics Grounded Deblurring HDR NeRF from Single-Exposure Images and Events

Arxiv

0+阅读 · 2月2日

Learning Domain-Invariant Representations for Cross-Domain Image Registration via Scene-Appearance Disentanglement

Arxiv

0+阅读 · 1月20日

Adaptive Rotary Steering with Joint Autoregression for Robust Extraction of Closely Moving Speakers in Dynamic Scenarios

Arxiv

0+阅读 · 1月18日

相关基金

基于光场测量的高清晰成像方法探索研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于LED自适应照明优化的可见光通信网多域耦合传输技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

表面等离子体耦合共振发射的近场调控及其新型光学成像技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

光场成像的轴向超分辨率方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

有向图谱理论在图像匹配中应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

调控光场实现超分辨显微成像的理论与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

由偏振标记，由光纤远程柔性、共路传输的二合一固体微片激光回馈干涉仪

国家自然科学基金

0+阅读 · 2014年12月31日

微米透镜的成像改进方法及其机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

双微阵列语音增强与定位方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员