Quantamination: Dynamic Quantization Leaks Your Data Across the Batch - 专知论文

会员服务 ·

0

污染 · 数据泄露 · ML · 模型服务 · 攻击 ·

Quantamination: Dynamic Quantization Leaks Your Data Across the Batch

翻译：量化污染：动态量化导致批次内数据泄露

Hanna Foerster,Ilia Shumailov,Cheng Zhang,Yiren Zhao,Jamie Hayes,Robert Mullins

from arxiv, 11 pages, 4 figures, 4 tables

Dynamic quantization emerged as a practical approach to increase the utilization and efficiency of the machine learning serving flow. Unlike static quantization, which applies quantization offline, dynamic quantization operates on tensors at run-time, adapting its parameters to the actual input data. Today's mainstream machine learning frameworks, including ML compilers and inference engines, frequently recommend dynamic quantization as an initial step for optimizing model serving. This is because dynamic quantization can significantly reduce memory usage and computational load, leading to faster token generation and improved model serving efficiency without substantial loss in model accuracy. In this paper, we reveal a critical vulnerability in dynamic quantization: an adversary can exploit such quantization strategy to steal sensitive user data placed in the same batch as the adversary's input. Our analysis demonstrates that dynamic quantization, when improperly implemented or configured, can create side channels that expose information about other inputs within the same batch. We call this phenomenon Quantamination, describing contamination from quantization. Specifically, we show that at least 4 of the most popular ML frameworks in use today either default to or can use configurations that leak data across the batch boundary. This data leakage, in theory, allows attackers to partially or even fully recover other users' batched input data, representing a serious privacy risk for existing ML serving frameworks.

翻译：动态量化已成为提升机器学习服务流程利用率与效率的实用方法。与离线应用的静态量化不同，动态量化在运行时对张量进行操作，根据实际输入数据自适应调整参数。当前主流机器学习框架（包括ML编译器和推理引擎）常将动态量化作为优化模型服务的初始步骤。这是因为动态量化可显著降低内存占用与计算负载，从而加速令牌生成、提升模型服务效率，且不会导致模型精度大幅下降。本文揭示动态量化中存在关键漏洞：攻击者可利用此类量化策略窃取与自身输入同批次的其他用户敏感数据。我们的分析表明，若动态量化实施或配置不当，将产生侧信道，暴露同批次内其他输入信息。我们将此现象称为“量化污染”（Quantamination），即由量化导致的污染。具体而言，我们证实当前最主流的ML框架中至少有4个在默认或可配置状态下存在跨批次边界的数据泄露。理论上，此类数据泄露能使攻击者部分甚至完全恢复其他用户批次化的输入数据，对现有ML服务框架构成严重隐私风险。

0

相关内容

【普林斯顿博士论文】量化、评估与缓解现代机器学习系统中的风险

【普林斯顿博士论文】量化、评估与缓解现代机器学习系统中的风险

专知会员服务

21+阅读 · 2025年10月20日

零样本量化：综述

零样本量化：综述

专知会员服务

13+阅读 · 2025年5月15日

动态数据驱动仿真综述

动态数据驱动仿真综述

专知会员服务

53+阅读 · 2024年5月17日

【慕尼黑大学博士论文】可解释自动化机器学习，200页pdf

【慕尼黑大学博士论文】可解释自动化机器学习，200页pdf

专知会员服务

41+阅读 · 2023年12月17日

【简明书册】从数据到交易:量化交易的机器学习方法，72页pdf

【简明书册】从数据到交易:量化交易的机器学习方法，72页pdf

专知会员服务

95+阅读 · 2022年12月31日

最新《自动化机器学习》报告，73页ppt建模阐述AutoML进展，附书籍

最新《自动化机器学习》报告，73页ppt建模阐述AutoML进展，附书籍

专知会员服务

114+阅读 · 2022年8月26日

强化学习如何做数据分析？新加坡国立等最新TKDE2022《深度强化学习数据处理与分析》综述论文阐述DRL数据分析落地应用

强化学习如何做数据分析？新加坡国立等最新TKDE2022《深度强化学习数据处理与分析》综述论文阐述DRL数据分析落地应用

专知会员服务

67+阅读 · 2022年3月28日

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

专知会员服务

54+阅读 · 2021年11月19日

【CVPR2021】动态度量学习

【CVPR2021】动态度量学习

专知会员服务

42+阅读 · 2021年3月30日

清华大学等首篇「动态神经网络」最新综述论文，20页pdf236篇文献

清华大学等首篇「动态神经网络」最新综述论文，20页pdf236篇文献

专知会员服务

80+阅读 · 2021年2月21日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

一文助你从零搭建自动交易系统，用Python玩转ML与量化

一文助你从零搭建自动交易系统，用Python玩转ML与量化

七月在线实验室

12+阅读 · 2019年9月10日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

概述自动机器学习（AutoML）

概述自动机器学习（AutoML）

人工智能学家

19+阅读 · 2019年8月11日

【综述】自动机器学习AutoML最新65页综述，带你了解最新进展

【综述】自动机器学习AutoML最新65页综述，带你了解最新进展

中国人工智能学会

48+阅读 · 2019年5月3日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

AI量化交易，盘点你不可不知的行业信息！

AI量化交易，盘点你不可不知的行业信息！

专知

17+阅读 · 2019年1月9日

超全总结：神经网络加速之量化模型 | 附带代码

超全总结：神经网络加速之量化模型 | 附带代码

PaperWeekly

12+阅读 · 2018年6月1日

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

专知

12+阅读 · 2018年5月18日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

操作风险动态量化方法研究：从微观机构到宏观系统

国家自然科学基金

1+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

大数据环境下的证券市场操纵行为发现机理、模型与方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

工业过程动态数据的多模型在线重构研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于排队模型的动态车辆路径问题实时优化策略及算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

关于面板(纵向）数据的动态统计分析

国家自然科学基金

0+阅读 · 2014年12月31日

基于高频数据的金融市场间信息溢出与风险传染的微观机理、动态模型及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

Defending Quantum Classifiers against Adversarial Perturbations through Quantum Autoencoders

Arxiv

0+阅读 · 4月30日

Momentum Further Constrains Sharpness at the Edge of Stochastic Stability

Arxiv

0+阅读 · 4月15日

From Ground Truth to Measurement: A Statistical Framework for Human Labeling

Arxiv

0+阅读 · 4月8日

Intelligent Cloud Orchestration: A Hybrid Predictive and Heuristic Framework for Cost Optimization

Arxiv

0+阅读 · 4月2日

DVM: A Bytecode Virtual Machine Approach for Dynamic Tensor Computation

Arxiv

0+阅读 · 4月2日

Safe learning-based control via function-based uncertainty quantification

Arxiv

0+阅读 · 4月1日

Quantification and object perception in Multimodal Large Language Models and human linguistic cognition

Arxiv

0+阅读 · 3月25日

DVM: Real-Time Kernel Generation for Dynamic AI Models

Arxiv

0+阅读 · 3月25日

Understanding Bugs in Quantum Simulators: An Empirical Study

Arxiv

0+阅读 · 3月24日

Quantifying the Performance Gap for Simple Versus Optimal Dynamic Server Allocation Policies

Arxiv

0+阅读 · 3月22日

VIP会员

文章信息

相关主题

最新内容

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

2+阅读 · 43分钟前

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

0+阅读 · 刚刚

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

0+阅读 · 今天7:28

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

1+阅读 · 今天7:18

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

1+阅读 · 今天7:07

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

1+阅读 · 今天7:03

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

3+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

4+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

7+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

4+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

7+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

5+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

3+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

相关VIP内容

【普林斯顿博士论文】量化、评估与缓解现代机器学习系统中的风险

【普林斯顿博士论文】量化、评估与缓解现代机器学习系统中的风险

专知会员服务

21+阅读 · 2025年10月20日

零样本量化：综述

零样本量化：综述

专知会员服务

13+阅读 · 2025年5月15日

动态数据驱动仿真综述

动态数据驱动仿真综述

专知会员服务

53+阅读 · 2024年5月17日

【慕尼黑大学博士论文】可解释自动化机器学习，200页pdf

【慕尼黑大学博士论文】可解释自动化机器学习，200页pdf

专知会员服务

41+阅读 · 2023年12月17日

【简明书册】从数据到交易:量化交易的机器学习方法，72页pdf

【简明书册】从数据到交易:量化交易的机器学习方法，72页pdf

专知会员服务

95+阅读 · 2022年12月31日

最新《自动化机器学习》报告，73页ppt建模阐述AutoML进展，附书籍

最新《自动化机器学习》报告，73页ppt建模阐述AutoML进展，附书籍

专知会员服务

114+阅读 · 2022年8月26日

强化学习如何做数据分析？新加坡国立等最新TKDE2022《深度强化学习数据处理与分析》综述论文阐述DRL数据分析落地应用

强化学习如何做数据分析？新加坡国立等最新TKDE2022《深度强化学习数据处理与分析》综述论文阐述DRL数据分析落地应用

专知会员服务

67+阅读 · 2022年3月28日

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

专知会员服务

54+阅读 · 2021年11月19日

【CVPR2021】动态度量学习

【CVPR2021】动态度量学习

专知会员服务

42+阅读 · 2021年3月30日

清华大学等首篇「动态神经网络」最新综述论文，20页pdf236篇文献

清华大学等首篇「动态神经网络」最新综述论文，20页pdf236篇文献

专知会员服务

80+阅读 · 2021年2月21日

热门VIP内容

开通专知VIP会员享更多权益服务

重新思考无人机时代的生存能力

在人工智能加速决策环境中拓展OODA循环

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

装甲突击旅：现代战争思考、战斗与组织

相关资讯

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

一文助你从零搭建自动交易系统，用Python玩转ML与量化

一文助你从零搭建自动交易系统，用Python玩转ML与量化

七月在线实验室

12+阅读 · 2019年9月10日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

概述自动机器学习（AutoML）

概述自动机器学习（AutoML）

人工智能学家

19+阅读 · 2019年8月11日

【综述】自动机器学习AutoML最新65页综述，带你了解最新进展

【综述】自动机器学习AutoML最新65页综述，带你了解最新进展

中国人工智能学会

48+阅读 · 2019年5月3日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

AI量化交易，盘点你不可不知的行业信息！

AI量化交易，盘点你不可不知的行业信息！

专知

17+阅读 · 2019年1月9日

超全总结：神经网络加速之量化模型 | 附带代码

超全总结：神经网络加速之量化模型 | 附带代码

PaperWeekly

12+阅读 · 2018年6月1日

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

专知

12+阅读 · 2018年5月18日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关论文

Defending Quantum Classifiers against Adversarial Perturbations through Quantum Autoencoders

Arxiv

0+阅读 · 4月30日

Momentum Further Constrains Sharpness at the Edge of Stochastic Stability

Arxiv

0+阅读 · 4月15日

From Ground Truth to Measurement: A Statistical Framework for Human Labeling

Arxiv

0+阅读 · 4月8日

Intelligent Cloud Orchestration: A Hybrid Predictive and Heuristic Framework for Cost Optimization

Arxiv

0+阅读 · 4月2日

DVM: A Bytecode Virtual Machine Approach for Dynamic Tensor Computation

Arxiv

0+阅读 · 4月2日

Safe learning-based control via function-based uncertainty quantification

Arxiv

0+阅读 · 4月1日

Quantification and object perception in Multimodal Large Language Models and human linguistic cognition

Arxiv

0+阅读 · 3月25日

DVM: Real-Time Kernel Generation for Dynamic AI Models

Arxiv

0+阅读 · 3月25日

Understanding Bugs in Quantum Simulators: An Empirical Study

Arxiv

0+阅读 · 3月24日

Quantifying the Performance Gap for Simple Versus Optimal Dynamic Server Allocation Policies

Arxiv

0+阅读 · 3月22日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

操作风险动态量化方法研究：从微观机构到宏观系统

国家自然科学基金

1+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

大数据环境下的证券市场操纵行为发现机理、模型与方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

工业过程动态数据的多模型在线重构研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于排队模型的动态车辆路径问题实时优化策略及算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

关于面板(纵向）数据的动态统计分析

国家自然科学基金

0+阅读 · 2014年12月31日

基于高频数据的金融市场间信息溢出与风险传染的微观机理、动态模型及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员