Linear Model Extraction via Factual and Counterfactual Queries - 专知论文

会员服务 ·

0

反事实 · 提取 · 鲁棒 · 线性模型 · 距离度量 ·

Linear Model Extraction via Factual and Counterfactual Queries

翻译：基于事实与反事实查询的线性模型提取

Daan Otto,Jannis Kurtz,Dick den Hertog,Ilker Birbil

In model extraction attacks, the goal is to reveal the parameters of a black-box machine learning model by querying the model for a selected set of data points. Due to an increasing demand for explanations, this may involve counterfactual queries besides the typically considered factual queries. In this work, we consider linear models and three types of queries: factual, counterfactual, and robust counterfactual. First, for an arbitrary set of queries, we derive novel mathematical formulations for the classification regions for which the decision of the unknown model is known, without recovering any of the model parameters. Second, we derive bounds on the number of queries needed to extract the model's parameters for (robust) counterfactual queries under arbitrary norm-based distances. We show that the full model can be recovered using just a single counterfactual query when differentiable distance measures are employed. In contrast, when using polyhedral distances for instance, the number of required queries grows linearly with the dimension of the data space. For robust counterfactuals, the latter number of queries doubles. Consequently, the applied distance function and robustness of counterfactuals have a significant impact on the model's security.

翻译：在模型提取攻击中，目标是通过为选定数据点查询模型来揭示黑盒机器学习模型的参数。由于对解释性需求的日益增长，除了通常考虑的事实查询外，这可能还涉及反事实查询。在本工作中，我们考虑线性模型及三种查询类型：事实查询、反事实查询和鲁棒反事实查询。首先，对于任意查询集，我们推导了分类区域的新数学公式，这些区域中未知模型的决策是已知的，而无需恢复任何模型参数。其次，我们推导了在任意基于范数的距离度量下，提取模型参数所需（鲁棒）反事实查询数量的界限。我们证明，当采用可微距离度量时，仅需单个反事实查询即可完整恢复模型。相反，当使用多面体距离时，所需查询数量随数据空间维度线性增长。对于鲁棒反事实，后者的查询数量会翻倍。因此，所采用的距离函数和反事实的鲁棒性对模型安全性具有显著影响。

0

相关内容

反事实

面向研究问题的深度学习事件抽取综述

面向研究问题的深度学习事件抽取综述

专知会员服务

26+阅读 · 2024年12月9日

【NTU博士论文】异构数据上机器学习模型的反事实解释，172页pdf

【NTU博士论文】异构数据上机器学习模型的反事实解释，172页pdf

专知会员服务

30+阅读 · 2024年1月2日

大模型如何处理事实？西湖大学等最新《大型语言模型中的事实性研究》综述，详述: LLM的知识、检索与领域特异性

大模型如何处理事实？西湖大学等最新《大型语言模型中的事实性研究》综述，详述: LLM的知识、检索与领域特异性

专知会员服务

47+阅读 · 2023年10月12日

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知会员服务

74+阅读 · 2023年4月12日

图上如何可解释？首篇《图反事实解释:定义、方法、评价》综述，46页pdf165篇文献全面概述图反事实解释进展

图上如何可解释？首篇《图反事实解释:定义、方法、评价》综述，46页pdf165篇文献全面概述图反事实解释进展

专知会员服务

41+阅读 · 2022年10月24日

黑盒机器学习模型的成员推断攻击研究

专知会员服务

23+阅读 · 2021年8月22日

反事实如何理解？看这份华为KDD2021《反事实解释及在XAI中的应用》教程，附143页Slides

反事实如何理解？看这份华为KDD2021《反事实解释及在XAI中的应用》教程，附143页Slides

专知会员服务

105+阅读 · 2021年8月16日

北航《深度学习事件抽取》文献综述和当前趋势

北航《深度学习事件抽取》文献综述和当前趋势

专知会员服务

87+阅读 · 2021年7月6日

事实抽取与验证研究综述

专知会员服务

23+阅读 · 2021年4月20日

From Data to Model Programming: Injecting Structured Priors for Knowledge Extraction，南加州大学计算机科学系任翔助理教授，CIPS ATT 16（2019）

From Data to Model Programming: Injecting Structured Priors for Knowledge Extraction，南加州大学计算机科学系任翔助理教授，CIPS ATT 16（2019）

专知会员服务

14+阅读 · 2019年10月25日

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知

55+阅读 · 2023年4月13日

NLP 事件抽取综述（中）—— 模型篇

NLP 事件抽取综述（中）—— 模型篇

深度学习自然语言处理

21+阅读 · 2020年12月28日

实体关系抽取方法研究综述

实体关系抽取方法研究综述

专知

14+阅读 · 2020年7月19日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

论文浅尝 | 探索将预训练语言模型用于事件抽取和事件生成

论文浅尝 | 探索将预训练语言模型用于事件抽取和事件生成

开放知识图谱

26+阅读 · 2019年11月8日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

综述 | 事件抽取及推理 (下)

综述 | 事件抽取及推理 (下)

开放知识图谱

38+阅读 · 2019年1月14日

【干货】Python机器学习机器学习项目实战3——模型解释与结果分析（附代码）

【干货】Python机器学习机器学习项目实战3——模型解释与结果分析（附代码）

专知

16+阅读 · 2018年5月24日

推荐｜机器学习中的模型评价、模型选择和算法选择！

推荐｜机器学习中的模型评价、模型选择和算法选择！

全球人工智能

10+阅读 · 2018年2月5日

知识提取的一种应用，从上市公司年报中抽取因果关系

知识提取的一种应用，从上市公司年报中抽取因果关系

文因互联

10+阅读 · 2017年7月7日

面向特征提取的低秩与稀疏图嵌入理论与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

3+阅读 · 2014年12月31日

测量误差数据下约束线性模型的有偏估计及变量选择研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

面向事件分析的信息意图检测、建模与群体意图推理技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

反问题的数学建模、计算及应用

国家自然科学基金

2+阅读 · 2014年12月31日

Explanations Go Linear: Post-hoc Explainability for Tabular Data with Interpretable Meta-Encoding

Arxiv

0+阅读 · 3月18日

Linear probes rely on textual evidence: Results from leakage mitigation studies in language models

Arxiv

0+阅读 · 3月9日

Few-shot Model Extraction Attacks against Sequential Recommender Systems

Arxiv

0+阅读 · 3月3日

LoMime: Query-Efficient Membership Inference using Model Extraction in Label-Only Settings

Arxiv

0+阅读 · 2月21日

Efficient Model Repository for Entity Resolution: Construction, Search, and Integration

Arxiv

0+阅读 · 2月21日

Navigating the Deep: End-to-End Extraction on Deep Neural Networks

Arxiv

0+阅读 · 2月18日

Synthesizing Trajectory Queries from Examples

Arxiv

0+阅读 · 2月16日

Dashed Line Defense: Plug-And-Play Defense Against Adaptive Score-Based Query Attacks

Arxiv

0+阅读 · 2月9日

Entailed Opinion Matters: Improving the Fact-Checking Performance of Language Models by Relying on their Entailment Ability

Arxiv

0+阅读 · 2月4日

Explanations Leak: Membership Inference with Differential Privacy and Active Learning Defense

Arxiv

0+阅读 · 2月3日

VIP会员

文章信息

相关主题

最新内容

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

3+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

3+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

4+阅读 · 5月30日

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

5+阅读 · 5月30日

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

14+阅读 · 5月30日

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

7+阅读 · 5月30日

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

8+阅读 · 5月30日

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

8+阅读 · 5月30日

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

11+阅读 · 5月29日

AutoScientists：自组织智能体团队驱动长期科学实验

AutoScientists：自组织智能体团队驱动长期科学实验

专知会员服务

6+阅读 · 5月29日

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

专知会员服务

6+阅读 · 5月29日

战略前沿人工智能的再思考（中文）

战略前沿人工智能的再思考（中文）

专知会员服务

8+阅读 · 5月29日

《量化地基防空系统间接效应的博弈论方法》

《量化地基防空系统间接效应的博弈论方法》

专知会员服务

6+阅读 · 5月29日

传感器网络：美国如何探测来自伊朗的导弹与无人机

传感器网络：美国如何探测来自伊朗的导弹与无人机

专知会员服务

6+阅读 · 5月29日

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

专知会员服务

10+阅读 · 5月29日

相关VIP内容

面向研究问题的深度学习事件抽取综述

面向研究问题的深度学习事件抽取综述

专知会员服务

26+阅读 · 2024年12月9日

【NTU博士论文】异构数据上机器学习模型的反事实解释，172页pdf

【NTU博士论文】异构数据上机器学习模型的反事实解释，172页pdf

专知会员服务

30+阅读 · 2024年1月2日

大模型如何处理事实？西湖大学等最新《大型语言模型中的事实性研究》综述，详述: LLM的知识、检索与领域特异性

大模型如何处理事实？西湖大学等最新《大型语言模型中的事实性研究》综述，详述: LLM的知识、检索与领域特异性

专知会员服务

47+阅读 · 2023年10月12日

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知会员服务

74+阅读 · 2023年4月12日

图上如何可解释？首篇《图反事实解释:定义、方法、评价》综述，46页pdf165篇文献全面概述图反事实解释进展

图上如何可解释？首篇《图反事实解释:定义、方法、评价》综述，46页pdf165篇文献全面概述图反事实解释进展

专知会员服务

41+阅读 · 2022年10月24日

黑盒机器学习模型的成员推断攻击研究

专知会员服务

23+阅读 · 2021年8月22日

反事实如何理解？看这份华为KDD2021《反事实解释及在XAI中的应用》教程，附143页Slides

反事实如何理解？看这份华为KDD2021《反事实解释及在XAI中的应用》教程，附143页Slides

专知会员服务

105+阅读 · 2021年8月16日

北航《深度学习事件抽取》文献综述和当前趋势

北航《深度学习事件抽取》文献综述和当前趋势

专知会员服务

87+阅读 · 2021年7月6日

事实抽取与验证研究综述

专知会员服务

23+阅读 · 2021年4月20日

From Data to Model Programming: Injecting Structured Priors for Knowledge Extraction，南加州大学计算机科学系任翔助理教授，CIPS ATT 16（2019）

From Data to Model Programming: Injecting Structured Priors for Knowledge Extraction，南加州大学计算机科学系任翔助理教授，CIPS ATT 16（2019）

专知会员服务

14+阅读 · 2019年10月25日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

美以伊战争：首次人工智能战争——军事自主性困境

BES：让语言模型通过双向进化搜索自我改进

以色列-美国-伊朗战争中的无人机：关键要点

相关资讯

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知

55+阅读 · 2023年4月13日

NLP 事件抽取综述（中）—— 模型篇

NLP 事件抽取综述（中）—— 模型篇

深度学习自然语言处理

21+阅读 · 2020年12月28日

实体关系抽取方法研究综述

实体关系抽取方法研究综述

专知

14+阅读 · 2020年7月19日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

论文浅尝 | 探索将预训练语言模型用于事件抽取和事件生成

论文浅尝 | 探索将预训练语言模型用于事件抽取和事件生成

开放知识图谱

26+阅读 · 2019年11月8日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

综述 | 事件抽取及推理 (下)

综述 | 事件抽取及推理 (下)

开放知识图谱

38+阅读 · 2019年1月14日

【干货】Python机器学习机器学习项目实战3——模型解释与结果分析（附代码）

【干货】Python机器学习机器学习项目实战3——模型解释与结果分析（附代码）

专知

16+阅读 · 2018年5月24日

推荐｜机器学习中的模型评价、模型选择和算法选择！

推荐｜机器学习中的模型评价、模型选择和算法选择！

全球人工智能

10+阅读 · 2018年2月5日

知识提取的一种应用，从上市公司年报中抽取因果关系

知识提取的一种应用，从上市公司年报中抽取因果关系

文因互联

10+阅读 · 2017年7月7日

相关论文

Explanations Go Linear: Post-hoc Explainability for Tabular Data with Interpretable Meta-Encoding

Arxiv

0+阅读 · 3月18日

Linear probes rely on textual evidence: Results from leakage mitigation studies in language models

Arxiv

0+阅读 · 3月9日

Few-shot Model Extraction Attacks against Sequential Recommender Systems

Arxiv

0+阅读 · 3月3日

LoMime: Query-Efficient Membership Inference using Model Extraction in Label-Only Settings

Arxiv

0+阅读 · 2月21日

Efficient Model Repository for Entity Resolution: Construction, Search, and Integration

Arxiv

0+阅读 · 2月21日

Navigating the Deep: End-to-End Extraction on Deep Neural Networks

Arxiv

0+阅读 · 2月18日

Synthesizing Trajectory Queries from Examples

Arxiv

0+阅读 · 2月16日

Dashed Line Defense: Plug-And-Play Defense Against Adaptive Score-Based Query Attacks

Arxiv

0+阅读 · 2月9日

Entailed Opinion Matters: Improving the Fact-Checking Performance of Language Models by Relying on their Entailment Ability

Arxiv

0+阅读 · 2月4日

Explanations Leak: Membership Inference with Differential Privacy and Active Learning Defense

Arxiv

0+阅读 · 2月3日

相关基金

面向特征提取的低秩与稀疏图嵌入理论与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

3+阅读 · 2014年12月31日

测量误差数据下约束线性模型的有偏估计及变量选择研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

面向事件分析的信息意图检测、建模与群体意图推理技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

反问题的数学建模、计算及应用

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员