基于扩散的图像合成已成为基于人工智能的目标检测与分类任务中一个有前景的合成训练数据来源。在这项工作中,研究了利用扩散模型生成的图像是否能在低数据条件下改善军用车辆检测。使用LoRA对文生图扩散模型FLUX.1 [dev]进行了微调,每个车辆类别仅使用8张或24张真实图像,覆盖15个车辆类别,从而得到类别专用的扩散模型。这些模型被用来根据自动生成的文本提示生成新样本。相同的真实图像被用于微调RF-DETR检测器,以执行15类目标检测任务。随后,利用扩散模型生成的合成数据集来进一步提升检测器性能。重要的是,这不需要额外的真实数据,因为生成模型利用了同样有限训练样本。FLUX生成的图像提升了检测性能,尤其是在低数据条件下(使用8个真实样本时,mAP50最高提升+8.0%)。为了解决基于文本提示的扩散模型在几何控制上的局限性,额外使用了结合Canny边缘图条件的ControlNet来生成具有结构引导的合成数据,从而得到一个能够明确控制视角和姿态的FLUX-ControlNet(FLUX-CN)数据集。当数据稀缺时,结构引导能进一步提升性能(使用8个真实样本时,mAP50提升+4.1%),但当有更多真实数据可用时,则未观察到额外收益。这项研究表明,针对特定目标的扩散模型可有效改善低数据领域的军事目标检测,并且当真实数据极为有限时,结构引导最为有益。这些结果凸显了生成图像数据可作为训练军事人工智能系统时传统仿真流程的一种替代方案。

图1:使用扩散模型和图文对进行图像合成的基础工作流程。VLM = 视觉语言模型,LLM = 大语言模型,FLUX = 文生图扩散模型。

成为VIP会员查看完整内容
15

相关内容

军事防务数据板块介绍:系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块,其核心在于整合全球新兴国防技术(军事人工智能、无人系统等)、热点案例(俄乌战争、美以伊战争)等方面的最新时讯、研究报告/论文、条令法规、案例分析,为战略研判、情报分析、决策支持等提供知识支撑。
《军事目标检测的合成到真实域自适应研究》
专知会员服务
17+阅读 · 3月16日
基于深度学习模型的图像军事目标检测
专知会员服务
27+阅读 · 2025年10月18日
面向低光照图像增强的扩散模型
专知会员服务
16+阅读 · 2025年10月11日
《基于深度学习模型的图像军事目标检测》
专知会员服务
31+阅读 · 2025年6月28日
《利用合成数据生成加强军事决策支持》
专知会员服务
43+阅读 · 2024年12月30日
低层视觉中的扩散模型:综述
专知会员服务
22+阅读 · 2024年6月18日
《用于军用车辆探测的零样本多模态深度学习模型》
专知会员服务
35+阅读 · 2024年5月9日
最全综述 | 图像目标检测
计算机视觉life
31+阅读 · 2019年6月24日
基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】
人工智能前沿讲习班
12+阅读 · 2018年12月25日
基于视频的目标检测的发展【附PPT与视频资料】
人工智能前沿讲习班
19+阅读 · 2018年12月14日
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Arxiv
0+阅读 · 4月23日
Arxiv
22+阅读 · 2023年11月2日
Deep Learning for Generic Object Detection: A Survey
Arxiv
14+阅读 · 2018年9月6日
VIP会员
最新内容
ICML 2026 | CFPO:用反事实策略优化提升多模态推理
专知会员服务
1+阅读 · 今天14:45
综述 | 世界动作模型:少做梦,多行动
专知会员服务
1+阅读 · 今天14:43
美以伊冲突:无人机与人工智能的运用
专知会员服务
3+阅读 · 今天14:31
《特种部队在透明战场中的生存力》最新报告
专知会员服务
2+阅读 · 今天14:11
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关VIP内容
《军事目标检测的合成到真实域自适应研究》
专知会员服务
17+阅读 · 3月16日
基于深度学习模型的图像军事目标检测
专知会员服务
27+阅读 · 2025年10月18日
面向低光照图像增强的扩散模型
专知会员服务
16+阅读 · 2025年10月11日
《基于深度学习模型的图像军事目标检测》
专知会员服务
31+阅读 · 2025年6月28日
《利用合成数据生成加强军事决策支持》
专知会员服务
43+阅读 · 2024年12月30日
低层视觉中的扩散模型:综述
专知会员服务
22+阅读 · 2024年6月18日
《用于军用车辆探测的零样本多模态深度学习模型》
专知会员服务
35+阅读 · 2024年5月9日
相关基金
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员