Bounding Box-Guided Diffusion for Synthesizing Industrial Images and Segmentation Map - 专知论文

会员服务 ·

0

分割 · 合成 · 边界框 · 工业数据 · 数据集 ·

Bounding Box-Guided Diffusion for Synthesizing Industrial Images and Segmentation Map

翻译：边界框引导扩散用于工业图像与分割图合成

Emanuele Caruso,Alessandro Simoni,Francesco Pelosin

from arxiv, Accepted at Synthetic Data for Computer Vision Workshop - CVPR 2025

Synthetic dataset generation in Computer Vision, particularly for industrial applications, is still underexplored. Industrial defect segmentation, for instance, requires highly accurate labels, yet acquiring such data is costly and time-consuming. To address this challenge, we propose a novel diffusion-based pipeline for generating high-fidelity industrial datasets with minimal supervision. Our approach conditions the diffusion model on enriched bounding box representations to produce precise segmentation masks, ensuring realistic and accurately localized defect synthesis. Compared to existing layout-conditioned generative methods, our approach improves defect consistency and spatial accuracy. We introduce two quantitative metrics to evaluate the effectiveness of our method and assess its impact on a downstream segmentation task trained on real and synthetic data. Our results demonstrate that diffusion-based synthesis can bridge the gap between artificial and real-world industrial data, fostering more reliable and cost-efficient segmentation models. The code is publicly available at https://github.com/covisionlab/diffusion_labeling.

翻译：计算机视觉中的合成数据集生成，尤其在工业应用领域，仍处于探索不足的状态。以工业缺陷分割为例，其需要高度精确的标签，但获取此类数据成本高昂且耗时。为应对这一挑战，我们提出了一种新颖的基于扩散的流程，用于在最小监督下生成高保真度的工业数据集。我们的方法通过丰富的边界框表示对扩散模型进行条件化，以生成精确的分割掩码，确保实现真实且定位准确的缺陷合成。与现有的布局条件生成方法相比，我们的方法提升了缺陷一致性与空间准确性。我们引入了两个量化指标来评估方法的有效性，并评估其在基于真实与合成数据训练的下游分割任务中的影响。我们的结果表明，基于扩散的合成能够弥合人工与真实世界工业数据之间的差距，从而促进更可靠且成本效益更高的分割模型。代码公开于 https://github.com/covisionlab/diffusion_labeling。

0

相关内容

医学影像中的高效扩散模型：全面综述

医学影像中的高效扩散模型：全面综述

专知会员服务

15+阅读 · 2025年5月26日

【新书】图像与视觉领域的扩散模型教程，90页pdf

【新书】图像与视觉领域的扩散模型教程，90页pdf

专知会员服务

48+阅读 · 2025年1月9日

《基于扩散模型的条件图像生成》综述

《基于扩散模型的条件图像生成》综述

专知会员服务

44+阅读 · 2024年10月1日

【简明书】扩散模型在图像和视觉领域的教程，51页pdf

【简明书】扩散模型在图像和视觉领域的教程，51页pdf

专知会员服务

58+阅读 · 2024年3月29日

【CVPR2024】扩散、关注、分割：使用稳定扩散进行无监督零样本分割

【CVPR2024】扩散、关注、分割：使用稳定扩散进行无监督零样本分割

专知会员服务

29+阅读 · 2024年2月27日

扩撒模型如何做医学图像？MICCAI2023最新《扩散模型医学图像分析》综述，134页PPT全面阐述医学图像扩散模型方法体系

扩撒模型如何做医学图像？MICCAI2023最新《扩散模型医学图像分析》综述，134页PPT全面阐述医学图像扩散模型方法体系

专知会员服务

42+阅读 · 2023年10月10日

低资源如何合成图像？华东理工等最新《有限数据下的图像合成》综述，详述图像合成技术进展

低资源如何合成图像？华东理工等最新《有限数据下的图像合成》综述，详述图像合成技术进展

专知会员服务

29+阅读 · 2023年8月7日

如何进行边缘推断？CVPR2023《高效神经网络:从算法设计到实际移动部署》教程, 附slides

如何进行边缘推断？CVPR2023《高效神经网络:从算法设计到实际移动部署》教程, 附slides

专知会员服务

51+阅读 · 2023年7月2日

伦敦大学学院最新《三维图像合成技术》综述，26页pdf阐述3D图像合成技术进展

伦敦大学学院最新《三维图像合成技术》综述，26页pdf阐述3D图像合成技术进展

专知会员服务

34+阅读 · 2022年10月27日

图解FixMatch的半监督学习，The Illustrated FixMatch for Semi-Supervised Learning

图解FixMatch的半监督学习，The Illustrated FixMatch for Semi-Supervised Learning

专知会员服务

26+阅读 · 2020年4月2日

【TPAMI2022】「深度学习图像分割」最新综述论文，带你全面了解100个10大类深度图像分割算法

【TPAMI2022】「深度学习图像分割」最新综述论文，带你全面了解100个10大类深度图像分割算法

专知

10+阅读 · 2022年4月11日

关于GANs在医学图像领域应用的总结

关于GANs在医学图像领域应用的总结

计算机视觉life

13+阅读 · 2019年7月25日

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

人工智能前沿讲习班

144+阅读 · 2019年3月15日

视频生成的前沿论文，看我们推荐的7篇就够了

视频生成的前沿论文，看我们推荐的7篇就够了

人工智能前沿讲习班

34+阅读 · 2018年12月30日

超像素、语义分割、实例分割、全景分割傻傻分不清？

超像素、语义分割、实例分割、全景分割傻傻分不清？

计算机视觉life

19+阅读 · 2018年11月27日

一文概览用于图像分割的CNN

一文概览用于图像分割的CNN

论智

14+阅读 · 2018年10月30日

学界 | FAIR提出用聚类方法结合卷积网络，实现无监督端到端图像分类

学界 | FAIR提出用聚类方法结合卷积网络，实现无监督端到端图像分类

机器之心

11+阅读 · 2018年8月6日

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

GAN生成式对抗网络

10+阅读 · 2018年4月25日

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

专知

27+阅读 · 2018年2月7日

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

炼数成金订阅号

11+阅读 · 2017年9月20日

基于全局阈值分割和局部聚类的自然图像超像素分割技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

全景聚焦合成孔径成像及其遮挡目标提取研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于区分型码本的图像表示的研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于部件结构的图像协同分割方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于形状信息和结果反馈的多图谱图像分割方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于非监督决策树的模糊图割模型的彩色图像分割研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于框架提升变换的多源图像融合研究

国家自然科学基金

1+阅读 · 2015年12月31日

结合图像块联合聚类加权和混合分类器的非对齐稀疏表示识别方法

国家自然科学基金

1+阅读 · 2015年12月31日

图像分割中若干图论问题的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于超像素稀疏表示的图像超分辨率方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

ImageRAGTurbo: Towards One-step Text-to-Image Generation with Retrieval-Augmented Diffusion Models

Arxiv

0+阅读 · 2月13日

Leveraging Latent Vector Prediction for Localized Control in Image Generation via Diffusion Models

Arxiv

0+阅读 · 2月2日

Boundary-Constrained Diffusion Models for Floorplan Generation: Balancing Realism and Diversity

Arxiv

0+阅读 · 2月2日

Creative Image Generation with Diffusion Model

Arxiv

0+阅读 · 1月29日

Cortex-Grounded Diffusion Models for Brain Image Generation

Arxiv

0+阅读 · 1月27日

ProGiDiff: Prompt-Guided Diffusion-Based Medical Image Segmentation

Arxiv

0+阅读 · 1月22日

Semantic Image Synthesis via Diffusion Models

Arxiv

0+阅读 · 1月21日

Paired Image Generation with Diffusion-Guided Diffusion Models

Arxiv

0+阅读 · 1月20日

Diffusion Representations for Fine-Grained Image Classification: A Marine Plankton Case Study

Arxiv

0+阅读 · 1月19日

Continuous Diffusion for Mixed-Type Tabular Data

Arxiv

0+阅读 · 1月15日

VIP会员

文章信息

相关主题

最新内容

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

8+阅读 · 今天8:10

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

7+阅读 · 今天8:06

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

5+阅读 · 今天8:02

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

5+阅读 · 今天7:32

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

11+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

9+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

6+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

4+阅读 · 4月20日

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

专知会员服务

8+阅读 · 4月20日

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

专知会员服务

4+阅读 · 4月20日

高效视频扩散模型：进展与挑战

高效视频扩散模型：进展与挑战

专知会员服务

4+阅读 · 4月20日

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

8+阅读 · 4月20日

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

7+阅读 · 4月20日

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

12+阅读 · 4月20日

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

6+阅读 · 4月20日

相关VIP内容

医学影像中的高效扩散模型：全面综述

医学影像中的高效扩散模型：全面综述

专知会员服务

15+阅读 · 2025年5月26日

【新书】图像与视觉领域的扩散模型教程，90页pdf

【新书】图像与视觉领域的扩散模型教程，90页pdf

专知会员服务

48+阅读 · 2025年1月9日

《基于扩散模型的条件图像生成》综述

《基于扩散模型的条件图像生成》综述

专知会员服务

44+阅读 · 2024年10月1日

【简明书】扩散模型在图像和视觉领域的教程，51页pdf

【简明书】扩散模型在图像和视觉领域的教程，51页pdf

专知会员服务

58+阅读 · 2024年3月29日

【CVPR2024】扩散、关注、分割：使用稳定扩散进行无监督零样本分割

【CVPR2024】扩散、关注、分割：使用稳定扩散进行无监督零样本分割

专知会员服务

29+阅读 · 2024年2月27日

扩撒模型如何做医学图像？MICCAI2023最新《扩散模型医学图像分析》综述，134页PPT全面阐述医学图像扩散模型方法体系

扩撒模型如何做医学图像？MICCAI2023最新《扩散模型医学图像分析》综述，134页PPT全面阐述医学图像扩散模型方法体系

专知会员服务

42+阅读 · 2023年10月10日

低资源如何合成图像？华东理工等最新《有限数据下的图像合成》综述，详述图像合成技术进展

低资源如何合成图像？华东理工等最新《有限数据下的图像合成》综述，详述图像合成技术进展

专知会员服务

29+阅读 · 2023年8月7日

如何进行边缘推断？CVPR2023《高效神经网络:从算法设计到实际移动部署》教程, 附slides

如何进行边缘推断？CVPR2023《高效神经网络:从算法设计到实际移动部署》教程, 附slides

专知会员服务

51+阅读 · 2023年7月2日

伦敦大学学院最新《三维图像合成技术》综述，26页pdf阐述3D图像合成技术进展

伦敦大学学院最新《三维图像合成技术》综述，26页pdf阐述3D图像合成技术进展

专知会员服务

34+阅读 · 2022年10月27日

图解FixMatch的半监督学习，The Illustrated FixMatch for Semi-Supervised Learning

图解FixMatch的半监督学习，The Illustrated FixMatch for Semi-Supervised Learning

专知会员服务

26+阅读 · 2020年4月2日

热门VIP内容

开通专知VIP会员享更多权益服务

《提升美军全域城市作战训练最佳实践的案例研究》366页

美海军数字作战负责人：如何利用数据快速生成战斗力

《美陆军条例：陆军指挥政策（2026版）》

《军用自主人工智能系统的治理与安全》

相关资讯

【TPAMI2022】「深度学习图像分割」最新综述论文，带你全面了解100个10大类深度图像分割算法

【TPAMI2022】「深度学习图像分割」最新综述论文，带你全面了解100个10大类深度图像分割算法

专知

10+阅读 · 2022年4月11日

关于GANs在医学图像领域应用的总结

关于GANs在医学图像领域应用的总结

计算机视觉life

13+阅读 · 2019年7月25日

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

人工智能前沿讲习班

144+阅读 · 2019年3月15日

视频生成的前沿论文，看我们推荐的7篇就够了

视频生成的前沿论文，看我们推荐的7篇就够了

人工智能前沿讲习班

34+阅读 · 2018年12月30日

超像素、语义分割、实例分割、全景分割傻傻分不清？

超像素、语义分割、实例分割、全景分割傻傻分不清？

计算机视觉life

19+阅读 · 2018年11月27日

一文概览用于图像分割的CNN

一文概览用于图像分割的CNN

论智

14+阅读 · 2018年10月30日

学界 | FAIR提出用聚类方法结合卷积网络，实现无监督端到端图像分类

学界 | FAIR提出用聚类方法结合卷积网络，实现无监督端到端图像分类

机器之心

11+阅读 · 2018年8月6日

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

GAN生成式对抗网络

10+阅读 · 2018年4月25日

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

专知

27+阅读 · 2018年2月7日

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

炼数成金订阅号

11+阅读 · 2017年9月20日

相关论文

ImageRAGTurbo: Towards One-step Text-to-Image Generation with Retrieval-Augmented Diffusion Models

Arxiv

0+阅读 · 2月13日

Leveraging Latent Vector Prediction for Localized Control in Image Generation via Diffusion Models

Arxiv

0+阅读 · 2月2日

Boundary-Constrained Diffusion Models for Floorplan Generation: Balancing Realism and Diversity

Arxiv

0+阅读 · 2月2日

Creative Image Generation with Diffusion Model

Arxiv

0+阅读 · 1月29日

Cortex-Grounded Diffusion Models for Brain Image Generation

Arxiv

0+阅读 · 1月27日

ProGiDiff: Prompt-Guided Diffusion-Based Medical Image Segmentation

Arxiv

0+阅读 · 1月22日

Semantic Image Synthesis via Diffusion Models

Arxiv

0+阅读 · 1月21日

Paired Image Generation with Diffusion-Guided Diffusion Models

Arxiv

0+阅读 · 1月20日

Diffusion Representations for Fine-Grained Image Classification: A Marine Plankton Case Study

Arxiv

0+阅读 · 1月19日

Continuous Diffusion for Mixed-Type Tabular Data

Arxiv

0+阅读 · 1月15日

相关基金

基于全局阈值分割和局部聚类的自然图像超像素分割技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

全景聚焦合成孔径成像及其遮挡目标提取研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于区分型码本的图像表示的研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于部件结构的图像协同分割方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于形状信息和结果反馈的多图谱图像分割方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于非监督决策树的模糊图割模型的彩色图像分割研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于框架提升变换的多源图像融合研究

国家自然科学基金

1+阅读 · 2015年12月31日

结合图像块联合聚类加权和混合分类器的非对齐稀疏表示识别方法

国家自然科学基金

1+阅读 · 2015年12月31日

图像分割中若干图论问题的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于超像素稀疏表示的图像超分辨率方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员