Black-box model classification under the discriminative factorization - 专知论文

会员服务 ·

0

因子 · 因子分解 · 分解 · 黑盒 · 黑盒模型 ·

Black-box model classification under the discriminative factorization

翻译：基于判别因子分解的黑盒模型分类

Hayden Helm,Merrick Ohata,Carey Priebe

Access to modern generative systems is often restricted to querying an API (the ``black-box" setting) and many properties of the system are unknown to the user at inference time. While recent work has shown that low-dimensional representations of models based on the relationship between their embedded responses to a set of queries are useful for inferring model-level properties, the quality of these representations is highly sensitive to the query set. We introduce the \emph{discriminative factorization} to distinguish between high- and low-quality query sets in the context of black-box model-level classification. Under this framework, the probability of chance-level classification decays exponentially in the query budget. On three auditing tasks, estimated factorization parameters predict the empirical performance decay rate. We conclude by showing that query sets selected using the estimated discriminative field reproduce the empirical ordering of oracle query sets.

翻译：现代生成系统的访问通常仅限于通过API进行查询（即“黑盒”设置），且推理时系统的许多属性对用户而言是未知的。尽管近期研究表明，基于模型对一组查询的嵌入响应之间关系所构建的低维表示，有助于推断模型级别的属性，但这些表示的质量对查询集高度敏感。我们引入**判别因子分解**，用于在黑盒模型级分类场景中区分高质量与低质量的查询集。在该框架下，随机分类概率随查询预算呈指数衰减。在三个审计任务中，估计的因子分解参数能够预测经验性能的衰减速率。最后，我们证明，利用估计的判别场选择的查询集可复现真实查询集的实证排序。

0

相关内容

AAAI 2026教程：基于离线数据集的黑盒优化

AAAI 2026教程：基于离线数据集的黑盒优化

专知会员服务

16+阅读 · 1月23日

大型语言模型系统中提示缺陷的分类学

大型语言模型系统中提示缺陷的分类学

专知会员服务

8+阅读 · 2025年9月19日

如何检测大模型“幻觉”？剑桥提出SelfCheckGPT: 针对生成型大型语言模型的零资源黑盒子幻觉检测

如何检测大模型“幻觉”？剑桥提出SelfCheckGPT: 针对生成型大型语言模型的零资源黑盒子幻觉检测

专知会员服务

44+阅读 · 2023年8月22日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知会员服务

53+阅读 · 2022年11月24日

打开黑盒：可解释机器学习在心脏病学中的前景和局限

打开黑盒：可解释机器学习在心脏病学中的前景和局限

专知会员服务

25+阅读 · 2022年7月22日

【NAACL 2022】拆解黑盒模型：从局部解释中推导出广义模型理解的解释摘要框架（ExSum）

【NAACL 2022】拆解黑盒模型：从局部解释中推导出广义模型理解的解释摘要框架（ExSum）

专知会员服务

23+阅读 · 2022年5月6日

《可解释的机器学习》中文版和英文版：226页pdf理解黑盒模型指南，复旦研究生朱明超翻译

《可解释的机器学习》中文版和英文版：226页pdf理解黑盒模型指南，复旦研究生朱明超翻译

专知会员服务

107+阅读 · 2022年3月11日

黑盒机器学习模型的成员推断攻击研究

专知会员服务

23+阅读 · 2021年8月22日

《可解释的机器学习》中文版来了：226页pdf理解黑盒模型指南，复旦研究生翻译

《可解释的机器学习》中文版来了：226页pdf理解黑盒模型指南，复旦研究生翻译

专知会员服务

381+阅读 · 2020年5月10日

可解释机器学习（Interpretable Machine Learning）：打开黑盒之谜（238页书籍下载）

可解释机器学习（Interpretable Machine Learning）：打开黑盒之谜（238页书籍下载）

专知会员服务

152+阅读 · 2019年10月27日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知

13+阅读 · 2022年11月24日

知识图谱构建-关系抽取和属性抽取

知识图谱构建-关系抽取和属性抽取

深度学习自然语言处理

27+阅读 · 2020年3月1日

从模型到应用，一文读懂因子分解机

从模型到应用，一文读懂因子分解机

AI100

10+阅读 · 2019年9月6日

【论文】Awesome Relation Classification Paper（关系分类）（PART II）

【论文】Awesome Relation Classification Paper（关系分类）（PART II）

AINLP

15+阅读 · 2019年8月12日

独家 | 机器学习解释模型：黑盒VS白盒（附资料链接）

独家 | 机器学习解释模型：黑盒VS白盒（附资料链接）

数据派THU

16+阅读 · 2019年4月11日

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

量子位

23+阅读 · 2019年2月23日

可解释机器学习：打开黑盒之谜（238页书籍下载）

可解释机器学习：打开黑盒之谜（238页书籍下载）

专知

29+阅读 · 2019年1月15日

【干货|如何打开黑盒子模型？】41页最新机器学习可解释模型综述论文，143篇参考文献，2300次下载

【干货|如何打开黑盒子模型？】41页最新机器学习可解释模型综述论文，143篇参考文献，2300次下载

专知

25+阅读 · 2018年11月25日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

AAAI 2018 行为识别论文概览

AAAI 2018 行为识别论文概览

极市平台

18+阅读 · 2018年3月20日

几类密码方案的格分析优化技术

国家自然科学基金

1+阅读 · 2015年12月31日

基于矩阵分解的图像表示方法及其应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于稀疏表达理论和RGBD图像的人脸表情识别

国家自然科学基金

0+阅读 · 2015年12月31日

面向异构信息网络中实体归类的模糊聚类

国家自然科学基金

1+阅读 · 2015年12月31日

面向生物特征识别的鲁棒判别结构化特征表示方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于聚类分析的高性能包分类技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

自检测型量子密钥分配研究

国家自然科学基金

0+阅读 · 2014年12月31日

对具有非平衡多标签特性的蛋白质功能类型分类预测研究

国家自然科学基金

0+阅读 · 2014年12月31日

广义线性模型的组变量选择及其在信用评分中的应用

国家自然科学基金

2+阅读 · 2014年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

DoubtProbe: Black-Box Jailbreak Defense via Structural Verification and Semantic Auditing

Arxiv

0+阅读 · 6月15日

Attacking the First-Principle: A Black-Box, Query-Free Targeted Mimicry Attack on Binary Function Classifiers

Arxiv

0+阅读 · 6月11日

Diagnosing Multi-step Reasoning Failures in Black-box LLMs via Stepwise Confidence Attribution

Arxiv

0+阅读 · 6月7日

Optimally taming biases in black-box models for efficient semiparametric estimation

Arxiv

0+阅读 · 6月4日

Randomized separations in black-box TFNP

Arxiv

0+阅读 · 6月3日

Dissecting the Black Box: Circuit-Level Analysis of LLM Vulnerability Detection

Arxiv

0+阅读 · 5月28日

KBF: Knowledge Boundary as Fingerprint for Language Model and Black-Box API Auditing

Arxiv

0+阅读 · 5月28日

Temporal Modeling of Change History for Black-Box Test Suite Minimization

Arxiv

0+阅读 · 5月25日

Training Diffusion Language Models for Black-Box Optimization

Arxiv

0+阅读 · 5月24日

Diagnosing Multi-step Reasoning Failures in Black-box LLMs via Stepwise Confidence Attribution

Arxiv

0+阅读 · 5月19日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

2+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

2+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

3+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

3+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

3+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

3+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

4+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

21+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

AAAI 2026教程：基于离线数据集的黑盒优化

AAAI 2026教程：基于离线数据集的黑盒优化

专知会员服务

16+阅读 · 1月23日

大型语言模型系统中提示缺陷的分类学

大型语言模型系统中提示缺陷的分类学

专知会员服务

8+阅读 · 2025年9月19日

如何检测大模型“幻觉”？剑桥提出SelfCheckGPT: 针对生成型大型语言模型的零资源黑盒子幻觉检测

如何检测大模型“幻觉”？剑桥提出SelfCheckGPT: 针对生成型大型语言模型的零资源黑盒子幻觉检测

专知会员服务

44+阅读 · 2023年8月22日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知会员服务

53+阅读 · 2022年11月24日

打开黑盒：可解释机器学习在心脏病学中的前景和局限

打开黑盒：可解释机器学习在心脏病学中的前景和局限

专知会员服务

25+阅读 · 2022年7月22日

【NAACL 2022】拆解黑盒模型：从局部解释中推导出广义模型理解的解释摘要框架（ExSum）

【NAACL 2022】拆解黑盒模型：从局部解释中推导出广义模型理解的解释摘要框架（ExSum）

专知会员服务

23+阅读 · 2022年5月6日

《可解释的机器学习》中文版和英文版：226页pdf理解黑盒模型指南，复旦研究生朱明超翻译

《可解释的机器学习》中文版和英文版：226页pdf理解黑盒模型指南，复旦研究生朱明超翻译

专知会员服务

107+阅读 · 2022年3月11日

黑盒机器学习模型的成员推断攻击研究

专知会员服务

23+阅读 · 2021年8月22日

《可解释的机器学习》中文版来了：226页pdf理解黑盒模型指南，复旦研究生翻译

《可解释的机器学习》中文版来了：226页pdf理解黑盒模型指南，复旦研究生翻译

专知会员服务

381+阅读 · 2020年5月10日

可解释机器学习（Interpretable Machine Learning）：打开黑盒之谜（238页书籍下载）

可解释机器学习（Interpretable Machine Learning）：打开黑盒之谜（238页书籍下载）

专知会员服务

152+阅读 · 2019年10月27日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知

13+阅读 · 2022年11月24日

知识图谱构建-关系抽取和属性抽取

知识图谱构建-关系抽取和属性抽取

深度学习自然语言处理

27+阅读 · 2020年3月1日

从模型到应用，一文读懂因子分解机

从模型到应用，一文读懂因子分解机

AI100

10+阅读 · 2019年9月6日

【论文】Awesome Relation Classification Paper（关系分类）（PART II）

【论文】Awesome Relation Classification Paper（关系分类）（PART II）

AINLP

15+阅读 · 2019年8月12日

独家 | 机器学习解释模型：黑盒VS白盒（附资料链接）

独家 | 机器学习解释模型：黑盒VS白盒（附资料链接）

数据派THU

16+阅读 · 2019年4月11日

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

量子位

23+阅读 · 2019年2月23日

可解释机器学习：打开黑盒之谜（238页书籍下载）

可解释机器学习：打开黑盒之谜（238页书籍下载）

专知

29+阅读 · 2019年1月15日

【干货|如何打开黑盒子模型？】41页最新机器学习可解释模型综述论文，143篇参考文献，2300次下载

【干货|如何打开黑盒子模型？】41页最新机器学习可解释模型综述论文，143篇参考文献，2300次下载

专知

25+阅读 · 2018年11月25日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

AAAI 2018 行为识别论文概览

AAAI 2018 行为识别论文概览

极市平台

18+阅读 · 2018年3月20日

相关论文

DoubtProbe: Black-Box Jailbreak Defense via Structural Verification and Semantic Auditing

Arxiv

0+阅读 · 6月15日

Attacking the First-Principle: A Black-Box, Query-Free Targeted Mimicry Attack on Binary Function Classifiers

Arxiv

0+阅读 · 6月11日

Diagnosing Multi-step Reasoning Failures in Black-box LLMs via Stepwise Confidence Attribution

Arxiv

0+阅读 · 6月7日

Optimally taming biases in black-box models for efficient semiparametric estimation

Arxiv

0+阅读 · 6月4日

Randomized separations in black-box TFNP

Arxiv

0+阅读 · 6月3日

Dissecting the Black Box: Circuit-Level Analysis of LLM Vulnerability Detection

Arxiv

0+阅读 · 5月28日

KBF: Knowledge Boundary as Fingerprint for Language Model and Black-Box API Auditing

Arxiv

0+阅读 · 5月28日

Temporal Modeling of Change History for Black-Box Test Suite Minimization

Arxiv

0+阅读 · 5月25日

Training Diffusion Language Models for Black-Box Optimization

Arxiv

0+阅读 · 5月24日

Diagnosing Multi-step Reasoning Failures in Black-box LLMs via Stepwise Confidence Attribution

Arxiv

0+阅读 · 5月19日

相关基金

几类密码方案的格分析优化技术

国家自然科学基金

1+阅读 · 2015年12月31日

基于矩阵分解的图像表示方法及其应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于稀疏表达理论和RGBD图像的人脸表情识别

国家自然科学基金

0+阅读 · 2015年12月31日

面向异构信息网络中实体归类的模糊聚类

国家自然科学基金

1+阅读 · 2015年12月31日

面向生物特征识别的鲁棒判别结构化特征表示方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于聚类分析的高性能包分类技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

自检测型量子密钥分配研究

国家自然科学基金

0+阅读 · 2014年12月31日

对具有非平衡多标签特性的蛋白质功能类型分类预测研究

国家自然科学基金

0+阅读 · 2014年12月31日

广义线性模型的组变量选择及其在信用评分中的应用

国家自然科学基金

2+阅读 · 2014年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员