Shuffle and Joint Differential Privacy for Generalized Linear Contextual Bandits - 专知论文

会员服务 ·

0

上下文 · 差分 · 广义 · 赌博机 · 差分隐私 ·

Shuffle and Joint Differential Privacy for Generalized Linear Contextual Bandits

翻译：广义线性上下文赌博机的洗牌与联合差分隐私

Sahasrajit Sarmasarkar

We present the first algorithms for generalized linear contextual bandits under shuffle differential privacy and joint differential privacy. While prior work on private contextual bandits has been restricted to linear reward models -- which admit closed-form estimators -- generalized linear models (GLMs) pose fundamental new challenges: no closed-form estimator exists, requiring private convex optimization; privacy must be tracked across multiple evolving design matrices; and optimization error must be explicitly incorporated into regret analysis. We address these challenges under two privacy models and context settings. For stochastic contexts, we design a shuffle-DP algorithm achieving $\tilde{O}(d^{3/2}\sqrt{T}/\sqrt{\varepsilon})$ regret. For adversarial contexts, we provide a joint-DP algorithm with $\tilde{O}(d\sqrt{T}/\sqrt{\varepsilon})$ regret -- matching the non-private rate up to a $1/\sqrt{\varepsilon}$ factor. Both algorithms remove dependence on the instance-specific parameter $κ$ (which can be exponential in dimension) from the dominant $\sqrt{T}$ term. Unlike prior work on locally private GLM bandits, our methods require no spectral assumptions on the context distribution beyond $\ell_2$ boundedness.

翻译：我们提出了在洗牌差分隐私和联合差分隐私下的广义线性上下文赌博机的首个算法。尽管先前关于私有上下文赌博机的研究仅限于线性奖励模型（这类模型允许闭式估计器），广义线性模型带来了根本性的新挑战：不存在闭式估计器，需要私有凸优化；隐私保护必须在多个演化的设计矩阵中进行追踪；且优化误差必须明确纳入遗憾分析。我们在两种隐私模型和上下文设置下解决了这些挑战。对于随机上下文，我们设计了一种洗牌差分隐私算法，实现了$\tilde{O}(d^{3/2}\sqrt{T}/\sqrt{\varepsilon})$的遗憾。对于对抗性上下文，我们提供了一种联合差分隐私算法，其遗憾为$\tilde{O}(d\sqrt{T}/\sqrt{\varepsilon})$——与非私有情形的最优速率相比仅相差一个$1/\sqrt{\varepsilon}$因子。两种算法均消除了主导项$\sqrt{T}$对实例特定参数$κ$（该参数在维度上可能呈指数增长）的依赖。与先前关于局部私有广义线性模型赌博机的研究不同，我们的方法除了要求上下文分布的$\ell_2$有界性外，无需任何谱假设。

0

相关内容

上下文

差分隐私全指南：从理论基础到用户期望

差分隐私全指南：从理论基础到用户期望

专知会员服务

13+阅读 · 2025年9月8日

【新书】差分隐私，246页pdf

【新书】差分隐私，246页pdf

专知会员服务

27+阅读 · 2025年4月5日

【普林斯顿博士论文】在差分隐私机器学习中有效地从数据中学习和生成数据

【普林斯顿博士论文】在差分隐私机器学习中有效地从数据中学习和生成数据

专知会员服务

16+阅读 · 2024年10月7日

如何理解对抗鲁棒性和差分隐私？【MIT】鲁棒性意味着统计估计中的隐私，87页pdf

如何理解对抗鲁棒性和差分隐私？【MIT】鲁棒性意味着统计估计中的隐私，87页pdf

专知会员服务

17+阅读 · 2023年1月11日

【CVPR 2022】基于本地正则化和稀疏化差分隐私的联邦学习，Differentially Private Federated Learning with Local Regularization and Sparsification

【CVPR 2022】基于本地正则化和稀疏化差分隐私的联邦学习，Differentially Private Federated Learning with Local Regularization and Sparsification

专知会员服务

17+阅读 · 2022年3月19日

面向推荐应用的差分隐私方案综述

专知会员服务

14+阅读 · 2021年9月14日

UCL最新「机器学习隐私」综述论文，概述隐私挑战

UCL最新「机器学习隐私」综述论文，概述隐私挑战

专知会员服务

37+阅读 · 2021年7月11日

最新《分布式差分隐私》报告，65页ppt

专知会员服务

41+阅读 · 2020年12月1日

【DeepMind】无监督实体对齐，AlignNet: Unsupervised Entity Alignment

【DeepMind】无监督实体对齐，AlignNet: Unsupervised Entity Alignment

专知会员服务

21+阅读 · 2020年7月24日

【论文推荐】保护隐私的协同过滤综述，Survey of Privacy-Preserving Collaborative Filtering

【论文推荐】保护隐私的协同过滤综述，Survey of Privacy-Preserving Collaborative Filtering

专知会员服务

36+阅读 · 2020年3月19日

一文读懂线性回归、岭回归和Lasso回归

一文读懂线性回归、岭回归和Lasso回归

CSDN

34+阅读 · 2019年10月13日

【机器学习】一文读懂线性回归、岭回归和Lasso回归

【机器学习】一文读懂线性回归、岭回归和Lasso回归

AINLP

20+阅读 · 2019年10月12日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

差分隐私保护：从入门到脱坑

差分隐私保护：从入门到脱坑

FreeBuf

17+阅读 · 2018年9月10日

上证信息－文因互联（联合）发布：知识提取在上市公司信息披露中的应用

上证信息－文因互联（联合）发布：知识提取在上市公司信息披露中的应用

文因互联

27+阅读 · 2018年9月7日

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

专知

21+阅读 · 2018年5月14日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

综述——隐私保护集合交集计算技术研究

综述——隐私保护集合交集计算技术研究

计算机研究与发展

22+阅读 · 2017年10月24日

面向网络系统的一致性安全隐私分析与防护机制设计

国家自然科学基金

2+阅读 · 2017年12月31日

广义多用户环境下多接收者加密方案的研究

国家自然科学基金

0+阅读 · 2015年12月31日

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

面向时空特性的社交网络推演攻击与隐私保护关键技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

满足差分隐私的频繁模式挖掘研究

国家自然科学基金

2+阅读 · 2015年12月31日

低差分均匀度密码函数的构造与分析

国家自然科学基金

0+阅读 · 2015年12月31日

复杂网络上数据传输博弈的合作性优化与控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

广义双随机相位编码系统中以QR码为载体的信息加密及无损恢复

国家自然科学基金

0+阅读 · 2015年12月31日

协同创新团队隐性知识共享有效性的随机动态博弈分析

国家自然科学基金

4+阅读 · 2015年12月31日

大规模在线社会网络社区发现及隐私保护研究

国家自然科学基金

1+阅读 · 2014年12月31日

Robust and Computationally Efficient Linear Contextual Bandits under Adversarial Corruption and Heavy-Tailed Noise

Robust and Computationally Efficient Linear Contextual Bandits under Adversarial Corruption and Heavy-Tailed Noise

Arxiv

0+阅读 · 3月16日

Differential Privacy in Machine Learning: A Survey from Symbolic AI to LLMs

Arxiv

0+阅读 · 3月11日

Differentially Private Secure Multiplication: Beyond Two Multiplicands

Arxiv

0+阅读 · 3月11日

Analysis of Shuffling Beyond Pure Local Differential Privacy

Arxiv

0+阅读 · 3月2日

Universal Shuffle Asymptotics: Sharp Privacy Analysis in the Gaussian Regime

Arxiv

0+阅读 · 3月1日

Analysis of Shuffling Beyond Pure Local Differential Privacy

Arxiv

0+阅读 · 2月24日

Local Node Differential Privacy

Arxiv

0+阅读 · 2月17日

A Jointly Efficient and Optimal Algorithm for Heteroskedastic Generalized Linear Bandits with Adversarial Corruptions

Arxiv

0+阅读 · 2月11日

Single Index Bandits: Generalized Linear Contextual Bandits with Unknown Reward Functions

Arxiv

0+阅读 · 2月7日

Analysis of Shuffling Beyond Pure Local Differential Privacy

Arxiv

0+阅读 · 2月6日

VIP会员

文章信息

相关主题

最新内容

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

3+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

3+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

4+阅读 · 5月30日

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

5+阅读 · 5月30日

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

14+阅读 · 5月30日

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

7+阅读 · 5月30日

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

8+阅读 · 5月30日

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

8+阅读 · 5月30日

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

11+阅读 · 5月29日

AutoScientists：自组织智能体团队驱动长期科学实验

AutoScientists：自组织智能体团队驱动长期科学实验

专知会员服务

6+阅读 · 5月29日

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

专知会员服务

6+阅读 · 5月29日

战略前沿人工智能的再思考（中文）

战略前沿人工智能的再思考（中文）

专知会员服务

8+阅读 · 5月29日

《量化地基防空系统间接效应的博弈论方法》

《量化地基防空系统间接效应的博弈论方法》

专知会员服务

6+阅读 · 5月29日

传感器网络：美国如何探测来自伊朗的导弹与无人机

传感器网络：美国如何探测来自伊朗的导弹与无人机

专知会员服务

6+阅读 · 5月29日

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

专知会员服务

10+阅读 · 5月29日

相关VIP内容

差分隐私全指南：从理论基础到用户期望

差分隐私全指南：从理论基础到用户期望

专知会员服务

13+阅读 · 2025年9月8日

【新书】差分隐私，246页pdf

【新书】差分隐私，246页pdf

专知会员服务

27+阅读 · 2025年4月5日

【普林斯顿博士论文】在差分隐私机器学习中有效地从数据中学习和生成数据

【普林斯顿博士论文】在差分隐私机器学习中有效地从数据中学习和生成数据

专知会员服务

16+阅读 · 2024年10月7日

如何理解对抗鲁棒性和差分隐私？【MIT】鲁棒性意味着统计估计中的隐私，87页pdf

如何理解对抗鲁棒性和差分隐私？【MIT】鲁棒性意味着统计估计中的隐私，87页pdf

专知会员服务

17+阅读 · 2023年1月11日

【CVPR 2022】基于本地正则化和稀疏化差分隐私的联邦学习，Differentially Private Federated Learning with Local Regularization and Sparsification

【CVPR 2022】基于本地正则化和稀疏化差分隐私的联邦学习，Differentially Private Federated Learning with Local Regularization and Sparsification

专知会员服务

17+阅读 · 2022年3月19日

面向推荐应用的差分隐私方案综述

专知会员服务

14+阅读 · 2021年9月14日

UCL最新「机器学习隐私」综述论文，概述隐私挑战

UCL最新「机器学习隐私」综述论文，概述隐私挑战

专知会员服务

37+阅读 · 2021年7月11日

最新《分布式差分隐私》报告，65页ppt

专知会员服务

41+阅读 · 2020年12月1日

【DeepMind】无监督实体对齐，AlignNet: Unsupervised Entity Alignment

【DeepMind】无监督实体对齐，AlignNet: Unsupervised Entity Alignment

专知会员服务

21+阅读 · 2020年7月24日

【论文推荐】保护隐私的协同过滤综述，Survey of Privacy-Preserving Collaborative Filtering

【论文推荐】保护隐私的协同过滤综述，Survey of Privacy-Preserving Collaborative Filtering

专知会员服务

36+阅读 · 2020年3月19日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

美以伊战争：首次人工智能战争——军事自主性困境

BES：让语言模型通过双向进化搜索自我改进

以色列-美国-伊朗战争中的无人机：关键要点

相关资讯

一文读懂线性回归、岭回归和Lasso回归

一文读懂线性回归、岭回归和Lasso回归

CSDN

34+阅读 · 2019年10月13日

【机器学习】一文读懂线性回归、岭回归和Lasso回归

【机器学习】一文读懂线性回归、岭回归和Lasso回归

AINLP

20+阅读 · 2019年10月12日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

差分隐私保护：从入门到脱坑

差分隐私保护：从入门到脱坑

FreeBuf

17+阅读 · 2018年9月10日

上证信息－文因互联（联合）发布：知识提取在上市公司信息披露中的应用

上证信息－文因互联（联合）发布：知识提取在上市公司信息披露中的应用

文因互联

27+阅读 · 2018年9月7日

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

专知

21+阅读 · 2018年5月14日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

综述——隐私保护集合交集计算技术研究

综述——隐私保护集合交集计算技术研究

计算机研究与发展

22+阅读 · 2017年10月24日

相关论文

Robust and Computationally Efficient Linear Contextual Bandits under Adversarial Corruption and Heavy-Tailed Noise

Robust and Computationally Efficient Linear Contextual Bandits under Adversarial Corruption and Heavy-Tailed Noise

Arxiv

0+阅读 · 3月16日

Differential Privacy in Machine Learning: A Survey from Symbolic AI to LLMs

Arxiv

0+阅读 · 3月11日

Differentially Private Secure Multiplication: Beyond Two Multiplicands

Arxiv

0+阅读 · 3月11日

Analysis of Shuffling Beyond Pure Local Differential Privacy

Arxiv

0+阅读 · 3月2日

Universal Shuffle Asymptotics: Sharp Privacy Analysis in the Gaussian Regime

Arxiv

0+阅读 · 3月1日

Analysis of Shuffling Beyond Pure Local Differential Privacy

Arxiv

0+阅读 · 2月24日

Local Node Differential Privacy

Arxiv

0+阅读 · 2月17日

A Jointly Efficient and Optimal Algorithm for Heteroskedastic Generalized Linear Bandits with Adversarial Corruptions

Arxiv

0+阅读 · 2月11日

Single Index Bandits: Generalized Linear Contextual Bandits with Unknown Reward Functions

Arxiv

0+阅读 · 2月7日

Analysis of Shuffling Beyond Pure Local Differential Privacy

Arxiv

0+阅读 · 2月6日

相关基金

面向网络系统的一致性安全隐私分析与防护机制设计

国家自然科学基金

2+阅读 · 2017年12月31日

广义多用户环境下多接收者加密方案的研究

国家自然科学基金

0+阅读 · 2015年12月31日

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

面向时空特性的社交网络推演攻击与隐私保护关键技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

满足差分隐私的频繁模式挖掘研究

国家自然科学基金

2+阅读 · 2015年12月31日

低差分均匀度密码函数的构造与分析

国家自然科学基金

0+阅读 · 2015年12月31日

复杂网络上数据传输博弈的合作性优化与控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

广义双随机相位编码系统中以QR码为载体的信息加密及无损恢复

国家自然科学基金

0+阅读 · 2015年12月31日

协同创新团队隐性知识共享有效性的随机动态博弈分析

国家自然科学基金

4+阅读 · 2015年12月31日

大规模在线社会网络社区发现及隐私保护研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员