黑盒策略蒸馏大型语言模型 (Black-Box On-Policy Distillation of Large Language Models) - 专知论文

会员服务 ·

0

蒸馏 · 黑盒 · 判别器 · 语言模型 · 大语言模型 ·

Black-Box On-Policy Distillation of Large Language Models

翻译：黑盒策略蒸馏大型语言模型

Tianzhu Ye,Li Dong,Zewen Chi,Xun Wu,Shaohan Huang,Furu Wei

Black-box distillation creates student large language models (LLMs) by learning from a proprietary teacher model's text outputs alone, without access to its internal logits or parameters. In this work, we introduce Generative Adversarial Distillation (GAD), which enables on-policy and black-box distillation. GAD frames the student LLM as a generator and trains a discriminator to distinguish its responses from the teacher LLM's, creating a minimax game. The discriminator acts as an on-policy reward model that co-evolves with the student, providing stable, adaptive feedback. Experimental results show that GAD consistently surpasses the commonly used sequence-level knowledge distillation. In particular, Qwen2.5-14B-Instruct (student) trained with GAD becomes comparable to its teacher, GPT-5-Chat, on the LMSYS-Chat automatic evaluation. The results establish GAD as a promising and effective paradigm for black-box LLM distillation.

翻译：黑盒蒸馏通过仅学习专有教师模型的文本输出（无需访问其内部逻辑或参数）来创建学生大型语言模型（LLMs）。本研究提出生成对抗蒸馏（GAD），实现了策略内黑盒蒸馏。GAD将学生LLM构建为生成器，并训练判别器以区分其响应与教师LLM的响应，形成极小极大博弈。判别器作为与学生协同演进的策略内奖励模型，提供稳定、自适应的反馈。实验结果表明，GAD持续超越常用的序列级知识蒸馏方法。特别地，采用GAD训练的Qwen2.5-14B-Instruct（学生模型）在LMSYS-Chat自动评估中达到与教师模型GPT-5-Chat相当的水平。这些结果确立了GAD作为黑盒LLM蒸馏的一种前景广阔且有效的范式。

0

相关内容

跨越黑盒：大语言模型的理论与机制

跨越黑盒：大语言模型的理论与机制

专知会员服务

37+阅读 · 1月7日

【CMU博士论文】大型语言模型的隐性特性

【CMU博士论文】大型语言模型的隐性特性

专知会员服务

15+阅读 · 2025年10月18日

大型语言模型的知识蒸馏与数据集蒸馏：新兴趋势、挑战与未来方向

大型语言模型的知识蒸馏与数据集蒸馏：新兴趋势、挑战与未来方向

专知会员服务

46+阅读 · 2025年4月26日

大型语言模型的知识蒸馏综述：方法、评估与应用

大型语言模型的知识蒸馏综述：方法、评估与应用

专知会员服务

78+阅读 · 2024年7月4日

大模型如何蒸馏知识？港大等最新《大型语言模型知识蒸馏》综述

大模型如何蒸馏知识？港大等最新《大型语言模型知识蒸馏》综述

专知会员服务

62+阅读 · 2024年2月25日

大模型如何可解释？帝国理工最新《大型语言模型的解释性》最新综述

大模型如何可解释？帝国理工最新《大型语言模型的解释性》最新综述

专知会员服务

78+阅读 · 2024年1月24日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

110+阅读 · 2023年12月19日

大模型如何高效？OSU等最新《高效大型语言模型》综述，详述模型压缩、预训练、微调、提示等技术

大模型如何高效？OSU等最新《高效大型语言模型》综述，详述模型压缩、预训练、微调、提示等技术

专知会员服务

70+阅读 · 2023年12月10日

《大型语言模型》最新全面概述

《大型语言模型》最新全面概述

专知会员服务

111+阅读 · 2023年7月14日

【伯克利博士论文】构建鲁棒且可扩展的大型语言模型，102页pdf

【伯克利博士论文】构建鲁棒且可扩展的大型语言模型，102页pdf

专知会员服务

45+阅读 · 2023年5月16日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

25+阅读 · 2023年4月4日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知

13+阅读 · 2022年11月24日

【2022 新版书籍】第2版《可解释的机器学习：黑盒模型可解释性理解指南》，330页pdf

【2022 新版书籍】第2版《可解释的机器学习：黑盒模型可解释性理解指南》，330页pdf

专知

13+阅读 · 2022年11月9日

模型压缩 | 知识蒸馏经典解读

模型压缩 | 知识蒸馏经典解读

AINLP

11+阅读 · 2020年5月31日

预训练语言模型关系图+必读论文列表，清华荣誉出品

预训练语言模型关系图+必读论文列表，清华荣誉出品

机器之心

18+阅读 · 2019年10月11日

独家 | 机器学习解释模型：黑盒VS白盒（附资料链接）

独家 | 机器学习解释模型：黑盒VS白盒（附资料链接）

数据派THU

16+阅读 · 2019年4月11日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

量子位

23+阅读 · 2019年2月23日

可解释机器学习：打开黑盒之谜（238页书籍下载）

可解释机器学习：打开黑盒之谜（238页书籍下载）

专知

29+阅读 · 2019年1月15日

【干货|如何打开黑盒子模型？】41页最新机器学习可解释模型综述论文，143篇参考文献，2300次下载

【干货|如何打开黑盒子模型？】41页最新机器学习可解释模型综述论文，143篇参考文献，2300次下载

专知

25+阅读 · 2018年11月25日

粗糙回归模型与算法研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于控制器动态线性化的数据驱动控制方法及在精馏过程的应用

国家自然科学基金

1+阅读 · 2015年12月31日

量测滞后下的发酵过程状态在线估计方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

大数据背景下面向操作模式的约简算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

几类密码方案的格分析优化技术

国家自然科学基金

1+阅读 · 2015年12月31日

基于稀疏表达理论和RGBD图像的人脸表情识别

国家自然科学基金

0+阅读 · 2015年12月31日

基于形态和多词的有限语料蒙汉互译调序优化方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

黑河流域高分辨率区域气候模式比较

国家自然科学基金

0+阅读 · 2015年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

Quantum Circuit Generation via test-time learning with large language models

Quantum Circuit Generation via test-time learning with large language models

Arxiv

0+阅读 · 2月5日

Quantum Circuit Generation via test-time learning with large language models

Arxiv

0+阅读 · 2月3日

Towards Distillation-Resistant Large Language Models: An Information-Theoretic Perspective

Arxiv

0+阅读 · 2月3日

OVD: On-policy Verbal Distillation

Arxiv

0+阅读 · 1月29日

Self-Distilled Reasoner: On-Policy Self-Distillation for Large Language Models

Arxiv

0+阅读 · 1月26日

Strategies for Span Labeling with Large Language Models

Arxiv

0+阅读 · 1月23日

Crafting Adversarial Inputs for Large Vision-Language Models Using Black-Box Optimization

Arxiv

0+阅读 · 1月22日

Diffusion Large Language Models for Black-Box Optimization

Arxiv

0+阅读 · 1月20日

Crafting Adversarial Inputs for Large Vision-Language Models Using Black-Box Optimization

Arxiv

0+阅读 · 1月19日

Knowledge Distillation and Dataset Distillation of Large Language Models: Emerging Trends, Challenges, and Future Directions

Arxiv

0+阅读 · 1月3日

VIP会员

文章信息

相关主题

大语言模型

相关VIP内容

跨越黑盒：大语言模型的理论与机制

跨越黑盒：大语言模型的理论与机制

专知会员服务

37+阅读 · 1月7日

【CMU博士论文】大型语言模型的隐性特性

【CMU博士论文】大型语言模型的隐性特性

专知会员服务

15+阅读 · 2025年10月18日

大型语言模型的知识蒸馏与数据集蒸馏：新兴趋势、挑战与未来方向

大型语言模型的知识蒸馏与数据集蒸馏：新兴趋势、挑战与未来方向

专知会员服务

46+阅读 · 2025年4月26日

大型语言模型的知识蒸馏综述：方法、评估与应用

大型语言模型的知识蒸馏综述：方法、评估与应用

专知会员服务

78+阅读 · 2024年7月4日

大模型如何蒸馏知识？港大等最新《大型语言模型知识蒸馏》综述

大模型如何蒸馏知识？港大等最新《大型语言模型知识蒸馏》综述

专知会员服务

62+阅读 · 2024年2月25日

大模型如何可解释？帝国理工最新《大型语言模型的解释性》最新综述

大模型如何可解释？帝国理工最新《大型语言模型的解释性》最新综述

专知会员服务

78+阅读 · 2024年1月24日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

110+阅读 · 2023年12月19日

大模型如何高效？OSU等最新《高效大型语言模型》综述，详述模型压缩、预训练、微调、提示等技术

大模型如何高效？OSU等最新《高效大型语言模型》综述，详述模型压缩、预训练、微调、提示等技术

专知会员服务

70+阅读 · 2023年12月10日

《大型语言模型》最新全面概述

《大型语言模型》最新全面概述

专知会员服务

111+阅读 · 2023年7月14日

【伯克利博士论文】构建鲁棒且可扩展的大型语言模型，102页pdf

【伯克利博士论文】构建鲁棒且可扩展的大型语言模型，102页pdf

专知会员服务

45+阅读 · 2023年5月16日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】基于自适应表征的高效视觉建模

《多域作战中融合网络、电子战与动能机动》

AI智能体时代大模型安全风险与攻防新挑战

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

相关资讯

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

25+阅读 · 2023年4月4日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知

13+阅读 · 2022年11月24日

【2022 新版书籍】第2版《可解释的机器学习：黑盒模型可解释性理解指南》，330页pdf

【2022 新版书籍】第2版《可解释的机器学习：黑盒模型可解释性理解指南》，330页pdf

专知

13+阅读 · 2022年11月9日

模型压缩 | 知识蒸馏经典解读

模型压缩 | 知识蒸馏经典解读

AINLP

11+阅读 · 2020年5月31日

预训练语言模型关系图+必读论文列表，清华荣誉出品

预训练语言模型关系图+必读论文列表，清华荣誉出品

机器之心

18+阅读 · 2019年10月11日

独家 | 机器学习解释模型：黑盒VS白盒（附资料链接）

独家 | 机器学习解释模型：黑盒VS白盒（附资料链接）

数据派THU

16+阅读 · 2019年4月11日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

量子位

23+阅读 · 2019年2月23日

可解释机器学习：打开黑盒之谜（238页书籍下载）

可解释机器学习：打开黑盒之谜（238页书籍下载）

专知

29+阅读 · 2019年1月15日

【干货|如何打开黑盒子模型？】41页最新机器学习可解释模型综述论文，143篇参考文献，2300次下载

【干货|如何打开黑盒子模型？】41页最新机器学习可解释模型综述论文，143篇参考文献，2300次下载

专知

25+阅读 · 2018年11月25日

相关论文

Quantum Circuit Generation via test-time learning with large language models

Quantum Circuit Generation via test-time learning with large language models

Arxiv

0+阅读 · 2月5日

Quantum Circuit Generation via test-time learning with large language models

Arxiv

0+阅读 · 2月3日

Towards Distillation-Resistant Large Language Models: An Information-Theoretic Perspective

Arxiv

0+阅读 · 2月3日

OVD: On-policy Verbal Distillation

Arxiv

0+阅读 · 1月29日

Self-Distilled Reasoner: On-Policy Self-Distillation for Large Language Models

Arxiv

0+阅读 · 1月26日

Strategies for Span Labeling with Large Language Models

Arxiv

0+阅读 · 1月23日

Crafting Adversarial Inputs for Large Vision-Language Models Using Black-Box Optimization

Arxiv

0+阅读 · 1月22日

Diffusion Large Language Models for Black-Box Optimization

Arxiv

0+阅读 · 1月20日

Crafting Adversarial Inputs for Large Vision-Language Models Using Black-Box Optimization

Arxiv

0+阅读 · 1月19日

Knowledge Distillation and Dataset Distillation of Large Language Models: Emerging Trends, Challenges, and Future Directions

Arxiv

0+阅读 · 1月3日

相关基金

粗糙回归模型与算法研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于控制器动态线性化的数据驱动控制方法及在精馏过程的应用

国家自然科学基金

1+阅读 · 2015年12月31日

量测滞后下的发酵过程状态在线估计方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

大数据背景下面向操作模式的约简算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

几类密码方案的格分析优化技术

国家自然科学基金

1+阅读 · 2015年12月31日

基于稀疏表达理论和RGBD图像的人脸表情识别

国家自然科学基金

0+阅读 · 2015年12月31日

基于形态和多词的有限语料蒙汉互译调序优化方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

黑河流域高分辨率区域气候模式比较

国家自然科学基金

0+阅读 · 2015年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员