Synthetic Data Augmentation for Multi-Task Chinese Porcelain Classification: A Stable Diffusion Approach - 专知论文

会员服务 ·

0

合成 · 稳定扩散 · 中国 · 合成数据 · 数据集 ·

Synthetic Data Augmentation for Multi-Task Chinese Porcelain Classification: A Stable Diffusion Approach

翻译：基于稳定扩散方法的合成数据增强在多任务中国瓷器分类中的应用研究

Ziyao Ling,Silvia Mirri,Paola Salomoni,Giovanni Delnevo

The scarcity of training data presents a fundamental challenge in applying deep learning to archaeological artifact classification, particularly for the rare types of Chinese porcelain. This study investigates whether synthetic images generated through Stable Diffusion with Low-Rank Adaptation (LoRA) can effectively augment limited real datasets for multi-task CNN-based porcelain classification. Using MobileNetV3 with transfer learning, we conducted controlled experiments comparing models trained on pure real data against those trained on mixed real-synthetic datasets (95:5 and 90:10 ratios) across four classification tasks: dynasty, glaze, kiln and type identification. Results demonstrate task-specific benefits: type classification showed the most substantial improvement (5.5\% F1-macro increase with 90:10 ratio), while dynasty and kiln tasks exhibited modest gains (3-4\%), suggesting that synthetic augmentation effectiveness depends on the alignment between generated features and task-relevant visual signatures. Our work contributes practical guidelines for deploying generative AI in archaeological research, demonstrating both the potential and limitations of synthetic data when archaeological authenticity must be balanced with data diversity.

翻译：训练数据的稀缺性是深度学习应用于考古文物分类的根本挑战，尤其对于稀有类型的中国瓷器而言。本研究探讨了通过低秩自适应（LoRA）的稳定扩散技术生成的合成图像，能否有效增强基于CNN的多任务瓷器分类中有限的真实数据集。采用迁移学习的MobileNetV3架构，我们通过控制实验对比了纯真实数据训练模型与混合真实-合成数据集（95:5和90:10比例）训练模型在四项分类任务中的表现：朝代、釉色、窑口和器型鉴定。结果显示任务特异性增益：器型分类提升最为显著（90:10比例下F1-macro指标提高5.5%），朝代与窑口任务则呈现适度改善（3-4%），这表明合成增强的有效性取决于生成特征与任务相关视觉特征之间的匹配程度。本研究为生成式人工智能在考古研究中的部署提供了实用指南，揭示了在考古真实性与数据多样性必须取得平衡时，合成数据既具潜力又存在局限性的双重特性。

0

相关内容

[ICML2025]当模型知识遇见扩散模型：扩散辅助的无数据图像合成及域与类别对齐

[ICML2025]当模型知识遇见扩散模型：扩散辅助的无数据图像合成及域与类别对齐

专知会员服务

12+阅读 · 2025年6月19日

《利用合成数据生成加强军事决策支持》

《利用合成数据生成加强军事决策支持》

专知会员服务

42+阅读 · 2024年12月30日

扩散模型和强化学习如何结合？上交最新《强化学习中的扩散模型》综述

扩散模型和强化学习如何结合？上交最新《强化学习中的扩散模型》综述

专知会员服务

83+阅读 · 2023年11月3日

最新《生成式数据增强的统一框架》综述，85页pdf

最新《生成式数据增强的统一框架》综述，85页pdf

专知会员服务

65+阅读 · 2023年10月8日

中科大等最新《基于扩散模型的图像恢复和增强》综述

中科大等最新《基于扩散模型的图像恢复和增强》综述

专知会员服务

37+阅读 · 2023年8月22日

《基于alpha混合和深层训练的合成孔径雷达数据增强》2023最新127页论文

《基于alpha混合和深层训练的合成孔径雷达数据增强》2023最新127页论文

专知会员服务

34+阅读 · 2023年5月5日

《用生成性对抗网络增强无人机图像分类训练集》美国空军技术学院2022最新209页论文

《用生成性对抗网络增强无人机图像分类训练集》美国空军技术学院2022最新209页论文

专知会员服务

54+阅读 · 2022年11月14日

【深度迁移学习在图像分类中的应用综述】Deep transfer learning for image classification: a survey

【深度迁移学习在图像分类中的应用综述】Deep transfer learning for image classification: a survey

专知会员服务

25+阅读 · 2022年5月24日

哈工大最新《自然语言处理数据增强方法》综述论文，155页pdf阐述复述、噪声和抽样三大数据增强方法

专知会员服务

48+阅读 · 2021年10月16日

深度学习图像数据增广方法研究综述

专知会员服务

53+阅读 · 2021年3月22日

基于深度学习的数据融合方法研究综述

基于深度学习的数据融合方法研究综述

专知

37+阅读 · 2020年12月10日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

专家报告 | 融合数据先验知识的智能图像增强

专家报告 | 融合数据先验知识的智能图像增强

中国图象图形学报

16+阅读 · 2020年5月25日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

专知

43+阅读 · 2019年7月10日

非平衡数据集 focal loss 多类分类

非平衡数据集 focal loss 多类分类

AI研习社

33+阅读 · 2019年4月23日

里昂大学博士学位论文-图像分类中的迁移学习

里昂大学博士学位论文-图像分类中的迁移学习

专知

12+阅读 · 2019年4月10日

学界 | FAIR提出用聚类方法结合卷积网络，实现无监督端到端图像分类

学界 | FAIR提出用聚类方法结合卷积网络，实现无监督端到端图像分类

机器之心

11+阅读 · 2018年8月6日

数据增强：数据有限时如何使用深度学习？（续）

数据增强：数据有限时如何使用深度学习？（续）

AI研习社

14+阅读 · 2018年5月6日

深度学习在文本分类中的应用

深度学习在文本分类中的应用

AI研习社

13+阅读 · 2018年1月7日

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于概率语义分析的多关系图多类标分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

大数据环境下稀有类数据挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

16+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

结合图像块联合聚类加权和混合分类器的非对齐稀疏表示识别方法

国家自然科学基金

1+阅读 · 2015年12月31日

复杂地震环境下多源遥感影像引力智能优化分类模型与算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于复杂网络的商务大数据聚类与关联应用研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

面向社会化媒体异构大数据的快速组合聚类研究

国家自然科学基金

1+阅读 · 2014年12月31日

Modular Multi-Task Learning for Chemical Reaction Prediction

Arxiv

0+阅读 · 2月11日

Semantics-Aware Generative Latent Data Augmentation for Learning in Low-Resource Domains

Arxiv

0+阅读 · 2月9日

Should I use Synthetic Data for That? An Analysis of the Suitability of Synthetic Data for Data Sharing and Augmentation

Arxiv

0+阅读 · 2月3日

Synthetic Data Augmentation for Medical Audio Classification: A Preliminary Evaluation

Arxiv

0+阅读 · 2月3日

Stabilizing Decentralized Federated Fine-Tuning via Topology-Aware Alternating LoRA

Arxiv

0+阅读 · 1月31日

Decomposing and Composing: Towards Efficient Vision-Language Continual Learning via Rank-1 Expert Pool in a Single LoRA

Arxiv

0+阅读 · 1月30日

Diffusion models for multivariate subsurface generation and efficient probabilistic inversion

Arxiv

0+阅读 · 1月27日

Towards Realistic Remote Sensing Dataset Distillation with Discriminative Prototype-guided Diffusion

Arxiv

0+阅读 · 1月22日

Diffusion Representations for Fine-Grained Image Classification: A Marine Plankton Case Study

Arxiv

0+阅读 · 1月19日

Hierarchical Fusion of Local and Global Visual Features with Mixture-of-Experts for Remote Sensing Image Scene Classification

Arxiv

0+阅读 · 1月14日

VIP会员

文章信息

相关主题

最新内容

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

1+阅读 · 今天6:14

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

1+阅读 · 今天5:59

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

3+阅读 · 今天5:54

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

2+阅读 · 今天5:51

《提升生成模型的安全性与保障》博士论文

《提升生成模型的安全性与保障》博士论文

专知会员服务

0+阅读 · 今天5:47

美国当前高超音速导弹发展概述

美国当前高超音速导弹发展概述

专知会员服务

4+阅读 · 4月19日

《高超音速武器：一项再度兴起的技术》120页slides

《高超音速武器：一项再度兴起的技术》120页slides

专知会员服务

9+阅读 · 4月19日

无人机蜂群建模与仿真方法

无人机蜂群建模与仿真方法

专知会员服务

10+阅读 · 4月19日

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

专知会员服务

3+阅读 · 4月19日

《量化反无人机系统对抗无人机蜂群效能的创新方法》

《量化反无人机系统对抗无人机蜂群效能的创新方法》

专知会员服务

12+阅读 · 4月19日

澳大利亚发布《国防战略（2026年）》

澳大利亚发布《国防战略（2026年）》

专知会员服务

4+阅读 · 4月19日

【CMU博士论文】迈向基于基础先验的 4D 感知研究

【CMU博士论文】迈向基于基础先验的 4D 感知研究

专知会员服务

6+阅读 · 4月19日

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

专知会员服务

16+阅读 · 4月19日

全球高超音速武器最新发展趋势

全球高超音速武器最新发展趋势

专知会员服务

4+阅读 · 4月19日

《利用大语言模型增强多域作战兵棋推演》（报告）

《利用大语言模型增强多域作战兵棋推演》（报告）

专知会员服务

14+阅读 · 4月18日

相关VIP内容

[ICML2025]当模型知识遇见扩散模型：扩散辅助的无数据图像合成及域与类别对齐

[ICML2025]当模型知识遇见扩散模型：扩散辅助的无数据图像合成及域与类别对齐

专知会员服务

12+阅读 · 2025年6月19日

《利用合成数据生成加强军事决策支持》

《利用合成数据生成加强军事决策支持》

专知会员服务

42+阅读 · 2024年12月30日

扩散模型和强化学习如何结合？上交最新《强化学习中的扩散模型》综述

扩散模型和强化学习如何结合？上交最新《强化学习中的扩散模型》综述

专知会员服务

83+阅读 · 2023年11月3日

最新《生成式数据增强的统一框架》综述，85页pdf

最新《生成式数据增强的统一框架》综述，85页pdf

专知会员服务

65+阅读 · 2023年10月8日

中科大等最新《基于扩散模型的图像恢复和增强》综述

中科大等最新《基于扩散模型的图像恢复和增强》综述

专知会员服务

37+阅读 · 2023年8月22日

《基于alpha混合和深层训练的合成孔径雷达数据增强》2023最新127页论文

《基于alpha混合和深层训练的合成孔径雷达数据增强》2023最新127页论文

专知会员服务

34+阅读 · 2023年5月5日

《用生成性对抗网络增强无人机图像分类训练集》美国空军技术学院2022最新209页论文

《用生成性对抗网络增强无人机图像分类训练集》美国空军技术学院2022最新209页论文

专知会员服务

54+阅读 · 2022年11月14日

【深度迁移学习在图像分类中的应用综述】Deep transfer learning for image classification: a survey

【深度迁移学习在图像分类中的应用综述】Deep transfer learning for image classification: a survey

专知会员服务

25+阅读 · 2022年5月24日

哈工大最新《自然语言处理数据增强方法》综述论文，155页pdf阐述复述、噪声和抽样三大数据增强方法

专知会员服务

48+阅读 · 2021年10月16日

深度学习图像数据增广方法研究综述

专知会员服务

53+阅读 · 2021年3月22日

热门VIP内容

开通专知VIP会员享更多权益服务

军事通信系统与设备的技术演进综述

《北约标准：医疗评估手册》174页

乌克兰前线的五项创新

《北约 AI手册：作战人员的实用考量》（2026最新64页）

相关资讯

基于深度学习的数据融合方法研究综述

基于深度学习的数据融合方法研究综述

专知

37+阅读 · 2020年12月10日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

专家报告 | 融合数据先验知识的智能图像增强

专家报告 | 融合数据先验知识的智能图像增强

中国图象图形学报

16+阅读 · 2020年5月25日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

专知

43+阅读 · 2019年7月10日

非平衡数据集 focal loss 多类分类

非平衡数据集 focal loss 多类分类

AI研习社

33+阅读 · 2019年4月23日

里昂大学博士学位论文-图像分类中的迁移学习

里昂大学博士学位论文-图像分类中的迁移学习

专知

12+阅读 · 2019年4月10日

学界 | FAIR提出用聚类方法结合卷积网络，实现无监督端到端图像分类

学界 | FAIR提出用聚类方法结合卷积网络，实现无监督端到端图像分类

机器之心

11+阅读 · 2018年8月6日

数据增强：数据有限时如何使用深度学习？（续）

数据增强：数据有限时如何使用深度学习？（续）

AI研习社

14+阅读 · 2018年5月6日

深度学习在文本分类中的应用

深度学习在文本分类中的应用

AI研习社

13+阅读 · 2018年1月7日

相关论文

Modular Multi-Task Learning for Chemical Reaction Prediction

Arxiv

0+阅读 · 2月11日

Semantics-Aware Generative Latent Data Augmentation for Learning in Low-Resource Domains

Arxiv

0+阅读 · 2月9日

Should I use Synthetic Data for That? An Analysis of the Suitability of Synthetic Data for Data Sharing and Augmentation

Arxiv

0+阅读 · 2月3日

Synthetic Data Augmentation for Medical Audio Classification: A Preliminary Evaluation

Arxiv

0+阅读 · 2月3日

Stabilizing Decentralized Federated Fine-Tuning via Topology-Aware Alternating LoRA

Arxiv

0+阅读 · 1月31日

Decomposing and Composing: Towards Efficient Vision-Language Continual Learning via Rank-1 Expert Pool in a Single LoRA

Arxiv

0+阅读 · 1月30日

Diffusion models for multivariate subsurface generation and efficient probabilistic inversion

Arxiv

0+阅读 · 1月27日

Towards Realistic Remote Sensing Dataset Distillation with Discriminative Prototype-guided Diffusion

Arxiv

0+阅读 · 1月22日

Diffusion Representations for Fine-Grained Image Classification: A Marine Plankton Case Study

Arxiv

0+阅读 · 1月19日

Hierarchical Fusion of Local and Global Visual Features with Mixture-of-Experts for Remote Sensing Image Scene Classification

Arxiv

0+阅读 · 1月14日

相关基金

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于概率语义分析的多关系图多类标分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

大数据环境下稀有类数据挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

16+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

结合图像块联合聚类加权和混合分类器的非对齐稀疏表示识别方法

国家自然科学基金

1+阅读 · 2015年12月31日

复杂地震环境下多源遥感影像引力智能优化分类模型与算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于复杂网络的商务大数据聚类与关联应用研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

面向社会化媒体异构大数据的快速组合聚类研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员