SAR-RAG: ATR Visual Question Answering by Semantic Search, Retrieval, and MLLM Generation - 专知论文

会员服务 ·

0

识别 · 搜索 · 合成 · 合成孔径 · 样本 ·

SAR-RAG: ATR Visual Question Answering by Semantic Search, Retrieval, and MLLM Generation

翻译：SAR-RAG：基于语义搜索、检索与MLLM生成的合成孔径雷达自动目标识别视觉问答

David F. Ramirez,Tim Overman,Kristen Jaskie,Joe Marvin,Andreas Spanias

from arxiv, Submitted to 2026 IEEE Radar Conference

We present a visual-context image retrieval-augmented generation (ImageRAG) assisted AI agent for automatic target recognition (ATR) of synthetic aperture radar (SAR). SAR is a remote sensing method used in defense and security applications to detect and monitor the positions of military vehicles, which may appear indistinguishable in images. Researchers have extensively studied SAR ATR to improve the differentiation and identification of vehicle types, characteristics, and measurements. Test examples can be compared with known vehicle target types to improve recognition tasks. New methods enhance the capabilities of neural networks, transformer attention, and multimodal large language models. An agentic AI method may be developed to utilize a defined set of tools, such as searching through a library of similar examples. Our proposed method, SAR Retrieval-Augmented Generation (SAR-RAG), combines a multimodal large language model (MLLM) with a vector database of semantic embeddings to support contextual search for image exemplars with known qualities. By recovering past image examples with known true target types, our SAR-RAG system can compare similar vehicle categories, achieving improved ATR prediction accuracy. We evaluate this through search and retrieval metrics, categorical classification accuracy, and numeric regression of vehicle dimensions. These metrics all show improvements when SAR-RAG is added to an MLLM baseline method as an attached ATR memory bank.

翻译：本文提出一种视觉上下文图像检索增强生成（ImageRAG）辅助的AI智能体，用于合成孔径雷达（SAR）的自动目标识别（ATR）。SAR是一种应用于国防与安全领域的遥感方法，用于探测与监控军事载具的位置，这些载具在图像中可能呈现难以区分的特征。为提升载具类型、特性与测量参数的区分与识别能力，学界已对SAR ATR展开广泛研究。通过将测试样本与已知载具目标类型进行比对，可提升识别任务的性能。新方法增强了神经网络、Transformer注意力机制与多模态大语言模型的能力。可开发一种智能体AI方法，利用既定工具集（例如在相似样本库中进行搜索）完成任务。我们提出的SAR检索增强生成（SAR-RAG）方法，将多模态大语言模型（MLLM）与语义嵌入向量数据库相结合，支持对具有已知特性的图像范例进行上下文搜索。通过检索具有已知真实目标类型的历史图像样本，SAR-RAG系统能够比对相似载具类别，从而提升ATR预测准确率。我们通过搜索检索指标、类别分类准确率以及载具尺寸的数值回归进行评估。所有指标均表明，将SAR-RAG作为附加ATR记忆库集成到MLLM基线方法后，性能均获得提升。

0

相关内容

多分辨率SAR与光学遥感影像配准方法：综述、数据集与未来展望

多分辨率SAR与光学遥感影像配准方法：综述、数据集与未来展望

专知会员服务

24+阅读 · 2025年2月5日

SAR干扰技术综述

SAR干扰技术综述

专知会员服务

18+阅读 · 2024年9月26日

视频合成孔径雷达技术发展现状综述

视频合成孔径雷达技术发展现状综述

专知会员服务

22+阅读 · 2024年8月7日

《基于逆合成孔径雷达（SAR）小型航行器自动目标识别数据集的雷达截面建模：第一部分--数据准备》2024最新75页

《基于逆合成孔径雷达（SAR）小型航行器自动目标识别数据集的雷达截面建模：第一部分--数据准备》2024最新75页

专知会员服务

36+阅读 · 2024年6月12日

《基于逆合成孔径雷达（SAR）小型航行器自动目标识别数据集的雷达截面建模：第二部分数据分析》2024最新100页报告

《基于逆合成孔径雷达（SAR）小型航行器自动目标识别数据集的雷达截面建模：第二部分数据分析》2024最新100页报告

专知会员服务

35+阅读 · 2024年6月12日

军事自动目标识别《在合成孔径雷达图像上使用可解释图神经网络进行基于感知-行动的人类决策制定》

军事自动目标识别《在合成孔径雷达图像上使用可解释图神经网络进行基于感知-行动的人类决策制定》

专知会员服务

35+阅读 · 2024年3月23日

《基于alpha混合和深层训练的合成孔径雷达数据增强》2023最新127页论文

《基于alpha混合和深层训练的合成孔径雷达数据增强》2023最新127页论文

专知会员服务

35+阅读 · 2023年5月5日

《基于目标几何特性的合成孔径激光雷达自动目标识别器设计与性能预测》美国空军2022最新89页技术总结报告

《基于目标几何特性的合成孔径激光雷达自动目标识别器设计与性能预测》美国空军2022最新89页技术总结报告

专知会员服务

35+阅读 · 2022年10月31日

【无人机+合成孔径雷达成像】《 LFM 防护带中嵌入 QPSK 通信的 SAR 图像形成和无人机天线表征》美国海军研究生院2022最新论文

【无人机+合成孔径雷达成像】《 LFM 防护带中嵌入 QPSK 通信的 SAR 图像形成和无人机天线表征》美国海军研究生院2022最新论文

专知会员服务

56+阅读 · 2022年9月15日

《超分辨率合成孔径雷达：多波束多通道带状图模式的设计和信号处理》，94页pdf，加拿大国防研究和开发部

《超分辨率合成孔径雷达：多波束多通道带状图模式的设计和信号处理》，94页pdf，加拿大国防研究和开发部

专知会员服务

28+阅读 · 2022年5月17日

【自适应雷达294页】《推进用于实时参数调整和决策的完全自适应雷达概念》美国空军研究实验室赞助

【自适应雷达294页】《推进用于实时参数调整和决策的完全自适应雷达概念》美国空军研究实验室赞助

专知

25+阅读 · 2022年9月4日

【AI+军事】《AI/ML在支持混合军事行动中情报和目标定位方面的优势和挑战》加拿大国防研究和发展部

【AI+军事】《AI/ML在支持混合军事行动中情报和目标定位方面的优势和挑战》加拿大国防研究和发展部

专知

104+阅读 · 2022年4月7日

自动驾驶毫米波雷达物体检测技术-算法

自动驾驶毫米波雷达物体检测技术-算法

CVer

14+阅读 · 2020年5月10日

【泡泡图灵智库】基于视觉深度估计的伪激光雷达: 从2D图像到自动驾驶3D目标检测（IROS）

【泡泡图灵智库】基于视觉深度估计的伪激光雷达: 从2D图像到自动驾驶3D目标检测（IROS）

泡泡机器人SLAM

17+阅读 · 2019年7月8日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

Ian Goodfellow等提出自注意力GAN，ImageNet图像合成获最优结果！

Ian Goodfellow等提出自注意力GAN，ImageNet图像合成获最优结果！

新智元

11+阅读 · 2018年5月24日

深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN

深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN

数据挖掘入门与实战

13+阅读 · 2018年4月6日

雷达海面目标识别技术研究进展

雷达海面目标识别技术研究进展

科技导报

22+阅读 · 2017年11月13日

SAR成像原理及图像鉴赏

SAR成像原理及图像鉴赏

无人机

21+阅读 · 2017年8月14日

基于共性视觉特征与反馈机制的SAR图像目标检测方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于低秩与稀疏矩阵分离的视频合成孔径雷达 GMTI信号处理技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

SAR影像古遗址自动检测方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于深度学习的高分辨率PolSAR影像暗目标判别

国家自然科学基金

3+阅读 · 2015年12月31日

基于缺失数据分析和信息几何理论的SAR图像自动目标识别研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于深度神经网络的雷达目标高分辨距离像稳健识别方法

国家自然科学基金

6+阅读 · 2015年12月31日

基于上下文感知和异质特征集成的SAR图像分割与评价

国家自然科学基金

2+阅读 · 2015年12月31日

基于压缩感知的MCSAR三维高分辨率快速成像研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于先验信息压缩感知SAR成像的信息理论限及实用算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高分辨率宽测绘带合成孔径激光雷达技术的研究

国家自然科学基金

1+阅读 · 2014年12月31日

SoK: Agentic Retrieval-Augmented Generation (RAG): Taxonomy, Architectures, Evaluation, and Research Directions

Arxiv

0+阅读 · 3月7日

ARMOR: Robust and Efficient CNN-Based SAR ATR through Model-Hardware Co-Design

Arxiv

0+阅读 · 3月4日

Sim2Radar: Toward Bridging the Radar Sim-to-Real Gap with VLM-Guided Scene Reconstruction

Arxiv

0+阅读 · 2月20日

Neural Implicit Representations for 3D Synthetic Aperture Radar Imaging

Neural Implicit Representations for 3D Synthetic Aperture Radar Imaging

Arxiv

0+阅读 · 2月19日

ShadAR: LLM-driven shader generation to transform visual perception in Augmented Reality

ShadAR: LLM-driven shader generation to transform visual perception in Augmented Reality

Arxiv

0+阅读 · 2月19日

SAGE: Scalable Agentic 3D Scene Generation for Embodied AI

Arxiv

0+阅读 · 2月10日

Multi-Expert Learning Framework with the State Space Model for Optical and SAR Image Registration

Arxiv

0+阅读 · 2月10日

ImageRAG: Dynamic Image Retrieval for Reference-Guided Image Generation

Arxiv

0+阅读 · 2月8日

M4-SAR: A Multi-Resolution, Multi-Polarization, Multi-Scene, Multi-Source Dataset and Benchmark for Optical-SAR Fusion Object Detection

Arxiv

0+阅读 · 2月6日

SOMA-1M: A Large-Scale SAR-Optical Multi-resolution Alignment Dataset for Multi-Task Remote Sensing

Arxiv

0+阅读 · 2月5日

VIP会员

文章信息

相关主题

最新内容

《在指挥链中通过多准则决策分析传达指挥官意图：空战实验》

《在指挥链中通过多准则决策分析传达指挥官意图：空战实验》

专知会员服务

11+阅读 · 6月15日

消耗优势：美军的“精确规模化”概念

消耗优势：美军的“精确规模化”概念

专知会员服务

6+阅读 · 6月15日

五角大楼的AI优先战略及其对现代战争的启示：来自与伊朗冲突的经验教训

五角大楼的AI优先战略及其对现代战争的启示：来自与伊朗冲突的经验教训

专知会员服务

7+阅读 · 6月15日

《网络空间兵棋推演：挑战、局限性与混合路径》报告

《网络空间兵棋推演：挑战、局限性与混合路径》报告

专知会员服务

6+阅读 · 6月15日

《离线语言支持系统：面向空战战术决策》

《离线语言支持系统：面向空战战术决策》

专知会员服务

7+阅读 · 6月15日

《以通信为中心的6G–LLM架构：面向可扩展的战术自主防御车辆网络》

《以通信为中心的6G–LLM架构：面向可扩展的战术自主防御车辆网络》

专知会员服务

5+阅读 · 6月15日

ICML 2026｜ECA：面向开放式图文生成的高效持续对齐

ICML 2026｜ECA：面向开放式图文生成的高效持续对齐

专知会员服务

5+阅读 · 6月14日

可信智能体AI综述：安全、鲁棒性、隐私与系统安全

可信智能体AI综述：安全、鲁棒性、隐私与系统安全

专知会员服务

5+阅读 · 6月14日

俄乌战场地面机器人如何改写战争规则

俄乌战场地面机器人如何改写战争规则

专知会员服务

9+阅读 · 6月14日

美国海军研究生院第23届年度采购研究研讨会与创新峰会：主题“加速作战能力”，附会议报告论文集1300页

美国海军研究生院第23届年度采购研究研讨会与创新峰会：主题“加速作战能力”，附会议报告论文集1300页

专知会员服务

10+阅读 · 6月14日

《新空中力量概念：来自敏捷战斗运用的启示》2026最新50页报告

《新空中力量概念：来自敏捷战斗运用的启示》2026最新50页报告

专知会员服务

12+阅读 · 6月14日

《无人水面艇文献综述与结构设计》135页

《无人水面艇文献综述与结构设计》135页

专知会员服务

14+阅读 · 6月13日

《自主蜂群系统的战略架构：多域一体化、抗毁韧性及海上作战框架（2025—2035）》46页报告

《自主蜂群系统的战略架构：多域一体化、抗毁韧性及海上作战框架（2025—2035）》46页报告

专知会员服务

12+阅读 · 6月13日

ICML 2026｜MEMOPILOT：用强化学习训练会进化的智能体记忆

ICML 2026｜MEMOPILOT：用强化学习训练会进化的智能体记忆

专知会员服务

2+阅读 · 6月13日

智能体时间序列系统全景综述：架构、可靠性与研究前沿

智能体时间序列系统全景综述：架构、可靠性与研究前沿

专知会员服务

11+阅读 · 6月13日

相关VIP内容

多分辨率SAR与光学遥感影像配准方法：综述、数据集与未来展望

多分辨率SAR与光学遥感影像配准方法：综述、数据集与未来展望

专知会员服务

24+阅读 · 2025年2月5日

SAR干扰技术综述

SAR干扰技术综述

专知会员服务

18+阅读 · 2024年9月26日

视频合成孔径雷达技术发展现状综述

视频合成孔径雷达技术发展现状综述

专知会员服务

22+阅读 · 2024年8月7日

《基于逆合成孔径雷达（SAR）小型航行器自动目标识别数据集的雷达截面建模：第一部分--数据准备》2024最新75页

《基于逆合成孔径雷达（SAR）小型航行器自动目标识别数据集的雷达截面建模：第一部分--数据准备》2024最新75页

专知会员服务

36+阅读 · 2024年6月12日

《基于逆合成孔径雷达（SAR）小型航行器自动目标识别数据集的雷达截面建模：第二部分数据分析》2024最新100页报告

《基于逆合成孔径雷达（SAR）小型航行器自动目标识别数据集的雷达截面建模：第二部分数据分析》2024最新100页报告

专知会员服务

35+阅读 · 2024年6月12日

军事自动目标识别《在合成孔径雷达图像上使用可解释图神经网络进行基于感知-行动的人类决策制定》

军事自动目标识别《在合成孔径雷达图像上使用可解释图神经网络进行基于感知-行动的人类决策制定》

专知会员服务

35+阅读 · 2024年3月23日

《基于alpha混合和深层训练的合成孔径雷达数据增强》2023最新127页论文

《基于alpha混合和深层训练的合成孔径雷达数据增强》2023最新127页论文

专知会员服务

35+阅读 · 2023年5月5日

《基于目标几何特性的合成孔径激光雷达自动目标识别器设计与性能预测》美国空军2022最新89页技术总结报告

《基于目标几何特性的合成孔径激光雷达自动目标识别器设计与性能预测》美国空军2022最新89页技术总结报告

专知会员服务

35+阅读 · 2022年10月31日

【无人机+合成孔径雷达成像】《 LFM 防护带中嵌入 QPSK 通信的 SAR 图像形成和无人机天线表征》美国海军研究生院2022最新论文

【无人机+合成孔径雷达成像】《 LFM 防护带中嵌入 QPSK 通信的 SAR 图像形成和无人机天线表征》美国海军研究生院2022最新论文

专知会员服务

56+阅读 · 2022年9月15日

《超分辨率合成孔径雷达：多波束多通道带状图模式的设计和信号处理》，94页pdf，加拿大国防研究和开发部

《超分辨率合成孔径雷达：多波束多通道带状图模式的设计和信号处理》，94页pdf，加拿大国防研究和开发部

专知会员服务

28+阅读 · 2022年5月17日

热门VIP内容

开通专知VIP会员享更多权益服务

消耗优势：美军的“精确规模化”概念

《网络空间兵棋推演：挑战、局限性与混合路径》报告

《在指挥链中通过多准则决策分析传达指挥官意图：空战实验》

五角大楼的AI优先战略及其对现代战争的启示：来自与伊朗冲突的经验教训

相关资讯

【自适应雷达294页】《推进用于实时参数调整和决策的完全自适应雷达概念》美国空军研究实验室赞助

【自适应雷达294页】《推进用于实时参数调整和决策的完全自适应雷达概念》美国空军研究实验室赞助

专知

25+阅读 · 2022年9月4日

【AI+军事】《AI/ML在支持混合军事行动中情报和目标定位方面的优势和挑战》加拿大国防研究和发展部

【AI+军事】《AI/ML在支持混合军事行动中情报和目标定位方面的优势和挑战》加拿大国防研究和发展部

专知

104+阅读 · 2022年4月7日

自动驾驶毫米波雷达物体检测技术-算法

自动驾驶毫米波雷达物体检测技术-算法

CVer

14+阅读 · 2020年5月10日

【泡泡图灵智库】基于视觉深度估计的伪激光雷达: 从2D图像到自动驾驶3D目标检测（IROS）

【泡泡图灵智库】基于视觉深度估计的伪激光雷达: 从2D图像到自动驾驶3D目标检测（IROS）

泡泡机器人SLAM

17+阅读 · 2019年7月8日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

Ian Goodfellow等提出自注意力GAN，ImageNet图像合成获最优结果！

Ian Goodfellow等提出自注意力GAN，ImageNet图像合成获最优结果！

新智元

11+阅读 · 2018年5月24日

深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN

深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN

数据挖掘入门与实战

13+阅读 · 2018年4月6日

雷达海面目标识别技术研究进展

雷达海面目标识别技术研究进展

科技导报

22+阅读 · 2017年11月13日

SAR成像原理及图像鉴赏

SAR成像原理及图像鉴赏

无人机

21+阅读 · 2017年8月14日

相关论文

SoK: Agentic Retrieval-Augmented Generation (RAG): Taxonomy, Architectures, Evaluation, and Research Directions

Arxiv

0+阅读 · 3月7日

ARMOR: Robust and Efficient CNN-Based SAR ATR through Model-Hardware Co-Design

Arxiv

0+阅读 · 3月4日

Sim2Radar: Toward Bridging the Radar Sim-to-Real Gap with VLM-Guided Scene Reconstruction

Arxiv

0+阅读 · 2月20日

Neural Implicit Representations for 3D Synthetic Aperture Radar Imaging

Neural Implicit Representations for 3D Synthetic Aperture Radar Imaging

Arxiv

0+阅读 · 2月19日

ShadAR: LLM-driven shader generation to transform visual perception in Augmented Reality

ShadAR: LLM-driven shader generation to transform visual perception in Augmented Reality

Arxiv

0+阅读 · 2月19日

SAGE: Scalable Agentic 3D Scene Generation for Embodied AI

Arxiv

0+阅读 · 2月10日

Multi-Expert Learning Framework with the State Space Model for Optical and SAR Image Registration

Arxiv

0+阅读 · 2月10日

ImageRAG: Dynamic Image Retrieval for Reference-Guided Image Generation

Arxiv

0+阅读 · 2月8日

M4-SAR: A Multi-Resolution, Multi-Polarization, Multi-Scene, Multi-Source Dataset and Benchmark for Optical-SAR Fusion Object Detection

Arxiv

0+阅读 · 2月6日

SOMA-1M: A Large-Scale SAR-Optical Multi-resolution Alignment Dataset for Multi-Task Remote Sensing

Arxiv

0+阅读 · 2月5日

相关基金

基于共性视觉特征与反馈机制的SAR图像目标检测方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于低秩与稀疏矩阵分离的视频合成孔径雷达 GMTI信号处理技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

SAR影像古遗址自动检测方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于深度学习的高分辨率PolSAR影像暗目标判别

国家自然科学基金

3+阅读 · 2015年12月31日

基于缺失数据分析和信息几何理论的SAR图像自动目标识别研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于深度神经网络的雷达目标高分辨距离像稳健识别方法

国家自然科学基金

6+阅读 · 2015年12月31日

基于上下文感知和异质特征集成的SAR图像分割与评价

国家自然科学基金

2+阅读 · 2015年12月31日

基于压缩感知的MCSAR三维高分辨率快速成像研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于先验信息压缩感知SAR成像的信息理论限及实用算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高分辨率宽测绘带合成孔径激光雷达技术的研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员