Diverse Image Priors for Black-box Data-free Knowledge Distillation - 专知论文

会员服务 ·

0

Diverse Image Priors for Black-box Data-free Knowledge Distillation

翻译：多样化图像先验的黑箱无数据知识蒸馏

Tri-Nhan Vo,Dang Nguyen,Trung Le,Kien Do,Sunil Gupta

Knowledge distillation (KD) represents a vital mechanism to transfer expertise from complex teacher networks to efficient student models. However, in decentralized or secure AI ecosystems, privacy regulations and proprietary interests often restrict access to the teacher's interface and original datasets. These constraints define a challenging black-box data-free KD scenario where only top-1 predictions and no training data are available. While recent approaches utilize synthetic data, they still face limitations in data diversity and distillation signals. We propose Diverse Image Priors Knowledge Distillation (DIP-KD), a framework that addresses these challenges through a three-phase collaborative pipeline: (1) Synthesis of image priors to capture diverse visual patterns and semantics; (2) Contrast to enhance the collective distinction between synthetic samples via contrastive learning; and (3) Distillation via a novel primer student that enables soft-probability KD. Our evaluation across 12 benchmarks shows that DIP-KD achieves state-of-the-art performance, with ablations confirming data diversity as critical for knowledge acquisition in restricted AI environments.

翻译：知识蒸馏（KD）是从复杂教师网络向高效学生模型传递专业知识的关键机制。然而，在去中心化或安全AI生态系统中，隐私法规与商业利益往往限制对教师接口及原始数据集的访问。这些约束定义了一个具有挑战性的黑箱无数据知识蒸馏场景：仅能获取最高类别预测结果，且无训练数据可用。尽管近期方法采用合成数据，但仍面临数据多样性与蒸馏信号不足的局限。本文提出多样化图像先验知识蒸馏（DIP-KD）框架，通过三阶段协作流程解决上述挑战：（1）合成图像先验以捕获多样化视觉模式与语义；（2）通过对比学习增强合成样本间集体区分度的对比机制；（3）借助新型预备学生模型实现软概率蒸馏的新型蒸馏方法。在12个基准测试上的评估表明，DIP-KD达到了最优性能，消融实验证实数据多样性是在受限AI环境中获取知识的关键要素。

0

相关内容

【AAAI2025】多层次最优传输用于语言模型中的通用跨标记器知识蒸馏

【AAAI2025】多层次最优传输用于语言模型中的通用跨标记器知识蒸馏

专知会员服务

27+阅读 · 2024年12月22日

大模型如何蒸馏知识？港大等最新《大型语言模型知识蒸馏》综述

大模型如何蒸馏知识？港大等最新《大型语言模型知识蒸馏》综述

专知会员服务

63+阅读 · 2024年2月25日

【ICML2023】知识蒸馏对模型可解释性的影响

【ICML2023】知识蒸馏对模型可解释性的影响

专知会员服务

37+阅读 · 2023年5月27日

深度学习中知识蒸馏研究综述

深度学习中知识蒸馏研究综述

专知会员服务

109+阅读 · 2022年8月13日

华东师大《无数据知识迁移》综述论文

华东师大《无数据知识迁移》综述论文

专知会员服务

56+阅读 · 2022年1月6日

【AAAI2022】基于秩模仿和预测引导特征模仿的目标检测知识蒸馏

【AAAI2022】基于秩模仿和预测引导特征模仿的目标检测知识蒸馏

专知会员服务

25+阅读 · 2021年12月12日

【微信@CIKM2021 】强化学习推荐模型的知识蒸馏探索之路

【微信@CIKM2021 】强化学习推荐模型的知识蒸馏探索之路

专知会员服务

28+阅读 · 2021年12月4日

【ICCV2021】用图神经网络提取整体知识

专知会员服务

27+阅读 · 2021年8月13日

最新《知识蒸馏》2020综述论文，20页pdf，悉尼大学

最新《知识蒸馏》2020综述论文，20页pdf，悉尼大学

专知会员服务

158+阅读 · 2020年6月14日

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知会员服务

96+阅读 · 2020年3月25日

模型压缩 | 知识蒸馏经典解读

模型压缩 | 知识蒸馏经典解读

AINLP

11+阅读 · 2020年5月31日

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知

41+阅读 · 2020年3月25日

【MIT-伯克利-ICLR2020】对比表示蒸馏，Contrastive Representation Distillation

【MIT-伯克利-ICLR2020】对比表示蒸馏，Contrastive Representation Distillation

专知

54+阅读 · 2020年3月12日

AI新视野 | 数据蒸馏Dataset Distillation

AI新视野 | 数据蒸馏Dataset Distillation

人工智能前沿讲习班

31+阅读 · 2019年6月14日

【专知荟萃24】视频描述生成(Video Captioning)知识资料全集（入门/进阶/论文/综述/代码/专家，附查看）

【专知荟萃24】视频描述生成(Video Captioning)知识资料全集（入门/进阶/论文/综述/代码/专家，附查看）

专知

37+阅读 · 2017年11月30日

【专知荟萃20】图像分割Image Segmentation知识资料全集（入门/进阶/论文/综述/视频/专家，附查看）

【专知荟萃20】图像分割Image Segmentation知识资料全集（入门/进阶/论文/综述/视频/专家，附查看）

专知

41+阅读 · 2017年11月19日

【专知荟萃19】图像识别Image Recognition知识资料全集（入门/进阶/论文/综述/视频/专家，附查看）

【专知荟萃19】图像识别Image Recognition知识资料全集（入门/进阶/论文/综述/视频/专家，附查看）

专知

20+阅读 · 2017年11月18日

【专知荟萃15】图像检索Image Retrieval知识资料全集（入门/进阶/综述/视频/代码/专家，附PDF下载）

【专知荟萃15】图像检索Image Retrieval知识资料全集（入门/进阶/综述/视频/代码/专家，附PDF下载）

专知

65+阅读 · 2017年11月14日

【专知荟萃08】图像描述生成Image Caption知识资料全集（入门/进阶/论文/综述/视频/专家等）

【专知荟萃08】图像描述生成Image Caption知识资料全集（入门/进阶/论文/综述/视频/专家等）

专知

37+阅读 · 2017年11月7日

【专知荟萃01】深度学习知识资料大全集（入门/进阶/论文/代码/数据/综述/领域专家等）（附pdf下载）

【专知荟萃01】深度学习知识资料大全集（入门/进阶/论文/代码/数据/综述/领域专家等）（附pdf下载）

专知

56+阅读 · 2017年10月31日

基于控制器动态线性化的数据驱动控制方法及在精馏过程的应用

国家自然科学基金

1+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

不确定知识图谱中面向结构查询的众包清洗研究

国家自然科学基金

4+阅读 · 2015年12月31日

彩色图像的高保真可逆信息隐藏算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

9+阅读 · 2015年12月31日

关联规则集上的知识发现

国家自然科学基金

9+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

基于先验信息压缩感知SAR成像的信息理论限及实用算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

高维混合数据异常知识发现的粒计算模型关键问题研究

国家自然科学基金

1+阅读 · 2014年12月31日

Improving Diversity in Black-box Few-shot Knowledge Distillation

Arxiv

0+阅读 · 4月28日

Beyond Hard Negatives: The Importance of Score Distribution in Knowledge Distillation for Dense Retrieval

Arxiv

0+阅读 · 4月28日

Beyond Hard Negatives: The Importance of Score Distribution in Knowledge Distillation for Dense Retrieval

Arxiv

0+阅读 · 4月6日

Multi-Aspect Knowledge Distillation for Language Model with Low-rank Factorization

Arxiv

0+阅读 · 4月3日

Zero-shot Cross-domain Knowledge Distillation: A Case study on YouTube Music

Arxiv

0+阅读 · 3月30日

KDFlow: A User-Friendly and Efficient Knowledge Distillation Framework for Large Language Models

Arxiv

0+阅读 · 3月24日

FiGKD: Fine-Grained Knowledge Distillation via High-Frequency Detail Transfer

Arxiv

0+阅读 · 3月24日

Dataset Distillation Efficiently Encodes Low-Dimensional Representations from Gradient-Based Learning of Non-Linear Tasks

Arxiv

0+阅读 · 3月16日

From Images to Words: Efficient Cross-Modal Knowledge Distillation to Language Models from Black-box Teachers

Arxiv

0+阅读 · 3月11日

Decoder-Free Distillation for Quantized Image Restoration

Arxiv

0+阅读 · 3月10日

VIP会员

文章信息

相关主题

最新内容

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

1+阅读 · 今天15:03

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

0+阅读 · 今天14:31

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

0+阅读 · 今天14:29

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

12+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

4+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

7+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

8+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

11+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

12+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

8+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

21+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

10+阅读 · 6月17日

相关VIP内容

【AAAI2025】多层次最优传输用于语言模型中的通用跨标记器知识蒸馏

【AAAI2025】多层次最优传输用于语言模型中的通用跨标记器知识蒸馏

专知会员服务

27+阅读 · 2024年12月22日

大模型如何蒸馏知识？港大等最新《大型语言模型知识蒸馏》综述

大模型如何蒸馏知识？港大等最新《大型语言模型知识蒸馏》综述

专知会员服务

63+阅读 · 2024年2月25日

【ICML2023】知识蒸馏对模型可解释性的影响

【ICML2023】知识蒸馏对模型可解释性的影响

专知会员服务

37+阅读 · 2023年5月27日

深度学习中知识蒸馏研究综述

深度学习中知识蒸馏研究综述

专知会员服务

109+阅读 · 2022年8月13日

华东师大《无数据知识迁移》综述论文

华东师大《无数据知识迁移》综述论文

专知会员服务

56+阅读 · 2022年1月6日

【AAAI2022】基于秩模仿和预测引导特征模仿的目标检测知识蒸馏

【AAAI2022】基于秩模仿和预测引导特征模仿的目标检测知识蒸馏

专知会员服务

25+阅读 · 2021年12月12日

【微信@CIKM2021 】强化学习推荐模型的知识蒸馏探索之路

【微信@CIKM2021 】强化学习推荐模型的知识蒸馏探索之路

专知会员服务

28+阅读 · 2021年12月4日

【ICCV2021】用图神经网络提取整体知识

专知会员服务

27+阅读 · 2021年8月13日

最新《知识蒸馏》2020综述论文，20页pdf，悉尼大学

最新《知识蒸馏》2020综述论文，20页pdf，悉尼大学

专知会员服务

158+阅读 · 2020年6月14日

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知会员服务

96+阅读 · 2020年3月25日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

美国从乌克兰无人机战争中学习经验

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

相关资讯

模型压缩 | 知识蒸馏经典解读

模型压缩 | 知识蒸馏经典解读

AINLP

11+阅读 · 2020年5月31日

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知

41+阅读 · 2020年3月25日

【MIT-伯克利-ICLR2020】对比表示蒸馏，Contrastive Representation Distillation

【MIT-伯克利-ICLR2020】对比表示蒸馏，Contrastive Representation Distillation

专知

54+阅读 · 2020年3月12日

AI新视野 | 数据蒸馏Dataset Distillation

AI新视野 | 数据蒸馏Dataset Distillation

人工智能前沿讲习班

31+阅读 · 2019年6月14日

【专知荟萃24】视频描述生成(Video Captioning)知识资料全集（入门/进阶/论文/综述/代码/专家，附查看）

【专知荟萃24】视频描述生成(Video Captioning)知识资料全集（入门/进阶/论文/综述/代码/专家，附查看）

专知

37+阅读 · 2017年11月30日

【专知荟萃20】图像分割Image Segmentation知识资料全集（入门/进阶/论文/综述/视频/专家，附查看）

【专知荟萃20】图像分割Image Segmentation知识资料全集（入门/进阶/论文/综述/视频/专家，附查看）

专知

41+阅读 · 2017年11月19日

【专知荟萃19】图像识别Image Recognition知识资料全集（入门/进阶/论文/综述/视频/专家，附查看）

【专知荟萃19】图像识别Image Recognition知识资料全集（入门/进阶/论文/综述/视频/专家，附查看）

专知

20+阅读 · 2017年11月18日

【专知荟萃15】图像检索Image Retrieval知识资料全集（入门/进阶/综述/视频/代码/专家，附PDF下载）

【专知荟萃15】图像检索Image Retrieval知识资料全集（入门/进阶/综述/视频/代码/专家，附PDF下载）

专知

65+阅读 · 2017年11月14日

【专知荟萃08】图像描述生成Image Caption知识资料全集（入门/进阶/论文/综述/视频/专家等）

【专知荟萃08】图像描述生成Image Caption知识资料全集（入门/进阶/论文/综述/视频/专家等）

专知

37+阅读 · 2017年11月7日

【专知荟萃01】深度学习知识资料大全集（入门/进阶/论文/代码/数据/综述/领域专家等）（附pdf下载）

【专知荟萃01】深度学习知识资料大全集（入门/进阶/论文/代码/数据/综述/领域专家等）（附pdf下载）

专知

56+阅读 · 2017年10月31日

相关论文

Improving Diversity in Black-box Few-shot Knowledge Distillation

Arxiv

0+阅读 · 4月28日

Beyond Hard Negatives: The Importance of Score Distribution in Knowledge Distillation for Dense Retrieval

Arxiv

0+阅读 · 4月28日

Beyond Hard Negatives: The Importance of Score Distribution in Knowledge Distillation for Dense Retrieval

Arxiv

0+阅读 · 4月6日

Multi-Aspect Knowledge Distillation for Language Model with Low-rank Factorization

Arxiv

0+阅读 · 4月3日

Zero-shot Cross-domain Knowledge Distillation: A Case study on YouTube Music

Arxiv

0+阅读 · 3月30日

KDFlow: A User-Friendly and Efficient Knowledge Distillation Framework for Large Language Models

Arxiv

0+阅读 · 3月24日

FiGKD: Fine-Grained Knowledge Distillation via High-Frequency Detail Transfer

Arxiv

0+阅读 · 3月24日

Dataset Distillation Efficiently Encodes Low-Dimensional Representations from Gradient-Based Learning of Non-Linear Tasks

Arxiv

0+阅读 · 3月16日

From Images to Words: Efficient Cross-Modal Knowledge Distillation to Language Models from Black-box Teachers

Arxiv

0+阅读 · 3月11日

Decoder-Free Distillation for Quantized Image Restoration

Arxiv

0+阅读 · 3月10日

相关基金

基于控制器动态线性化的数据驱动控制方法及在精馏过程的应用

国家自然科学基金

1+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

不确定知识图谱中面向结构查询的众包清洗研究

国家自然科学基金

4+阅读 · 2015年12月31日

彩色图像的高保真可逆信息隐藏算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

9+阅读 · 2015年12月31日

关联规则集上的知识发现

国家自然科学基金

9+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

基于先验信息压缩感知SAR成像的信息理论限及实用算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

高维混合数据异常知识发现的粒计算模型关键问题研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员