Robust Learning with Private Information - 专知论文

会员服务 ·

0

算法 · 鲁棒 · 鲁棒学习 · 学习算法 · 不确定 ·

Robust Learning with Private Information

翻译：鲁棒学习与私有信息

from arxiv, Add new results (e.g., rate-optimal algorithm)

Firms increasingly delegate decisions to learning algorithms in platform markets. Standard algorithms perform well when platform policies are stationary, but firms often face ambiguity about whether policies are stationary or adapt strategically to their behavior. When policies adapt, efficient learning under stationarity may backfire: it may reveal a firm's persistent private information, allowing the platform to personalize terms and extract information rents. We study a repeated screening problem in which an agent with a fixed private type commits ex ante to a learning algorithm, facing ambiguity about the principal's policy. We show that a broad class of standard algorithms, including all no-external-regret algorithms, can be manipulated by adaptive principals and permit asymptotic full surplus extraction. We then construct a misspecification-robust learning algorithm that treats stationarity as a testable hypothesis. It achieves the optimal payoff under stationarity at the minimax-optimal rate, while preventing dynamic rent extraction: against any adaptive principal, each type's long-run utility is at least its utility under the menu that maximizes revenue under the principal's prior.

翻译：在平台市场中，企业越来越多地将决策权委托给学习算法。当平台策略保持平稳时，标准算法表现良好，但企业常常面临策略是否平稳或是否针对其行为进行战略性调整的不确定性。当策略具有适应性时，基于平稳性的高效学习可能适得其反：它可能暴露企业持续的私有信息，使平台能够个性化条款并攫取信息租金。我们研究了一个重复筛选问题，其中具有固定私有类型的代理事先承诺采用某种学习算法，同时面临关于委托方策略的不确定性。我们证明，包括所有无外部遗憾算法在内的广泛标准算法类别都可能被适应性委托方操纵，并允许渐进式完全剩余提取。随后，我们构建了一种将平稳性视为可检验假设的误设鲁棒学习算法。该算法以极小极大最优速率实现平稳性下的最优收益，同时防止动态租金提取：针对任何适应性委托方，每种类型的长期效用至少不低于在委托方先验下实现收益最大化的菜单所对应的效用水平。

0

相关内容

在数学和计算机科学之中，算法（Algorithm）为一个计算的具体步骤，常用于计算、数据处理和自动推理。精确而言，算法是一个表示为有限长列表的有效方法。算法应包含清晰定义的指令用于计算函数。来自维基百科：算法

【博士论文】融合上下文的鲁棒机器学习，311页pdf

【博士论文】融合上下文的鲁棒机器学习，311页pdf

专知会员服务

35+阅读 · 2024年2月6日

【MIT博士论文】从未整理数据中的鲁棒学习，220页pdf

【MIT博士论文】从未整理数据中的鲁棒学习，220页pdf

专知会员服务

55+阅读 · 2023年11月10日

《用于海军计算机视觉应用的鲁棒机器学习》2023最新95页论文

《用于海军计算机视觉应用的鲁棒机器学习》2023最新95页论文

专知会员服务

53+阅读 · 2023年9月4日

西安交大等最新《鲁棒视觉问题回答》综述，20页pdf详述RVQA数据集、方法和未来挑战

西安交大等最新《鲁棒视觉问题回答》综述，20页pdf详述RVQA数据集、方法和未来挑战

专知会员服务

21+阅读 · 2023年7月25日

【斯坦福博士论文】大模型驱动的鲁棒机器学习，243页pdf

【斯坦福博士论文】大模型驱动的鲁棒机器学习，243页pdf

专知会员服务

59+阅读 · 2023年7月10日

【CMU博士论文】机器学习的基础: 民有，民享, 300页pdf阐述算法博弈论

【CMU博士论文】机器学习的基础: 民有，民享, 300页pdf阐述算法博弈论

专知会员服务

37+阅读 · 2023年1月3日

《电力系统机器学习的鲁棒性》美海军研究生院2022最新64页论文

《电力系统机器学习的鲁棒性》美海军研究生院2022最新64页论文

专知会员服务

25+阅读 · 2022年11月2日

鲁棒和隐私保护的协同学习

鲁棒和隐私保护的协同学习

专知会员服务

38+阅读 · 2021年12月22日

鲁棒表示学习简述

专知会员服务

26+阅读 · 2021年4月13日

联邦学习中的隐私和鲁棒性:攻击和防御, 杨强等学者最新综述论文，16页pdf

联邦学习中的隐私和鲁棒性:攻击和防御, 杨强等学者最新综述论文，16页pdf

专知会员服务

104+阅读 · 2021年2月3日

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知

13+阅读 · 2022年11月25日

联邦学习安全与隐私保护研究综述

联邦学习安全与隐私保护研究综述

专知

12+阅读 · 2020年8月7日

最新《多任务学习》综述，39页pdf

最新《多任务学习》综述，39页pdf

专知

28+阅读 · 2020年7月10日

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

专知

16+阅读 · 2020年4月27日

《机器学习与公平性》新书发布，附127页PDF下载

《机器学习与公平性》新书发布，附127页PDF下载

专知

24+阅读 · 2019年9月13日

【联邦学习】联邦学习的研究及应用、联邦学习的多种可能性

【联邦学习】联邦学习的研究及应用、联邦学习的多种可能性

产业智能官

30+阅读 · 2019年5月24日

机器学习经典必读书，李航《统计学习方法》出视频课了！

机器学习经典必读书，李航《统计学习方法》出视频课了！

深度学习与NLP

15+阅读 · 2019年5月16日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

学界 | 最大化互信息来学习深度表示，Bengio等提出Deep INFOMAX

学界 | 最大化互信息来学习深度表示，Bengio等提出Deep INFOMAX

机器之心

10+阅读 · 2018年9月6日

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

专知

21+阅读 · 2018年5月14日

面向网络系统的一致性安全隐私分析与防护机制设计

国家自然科学基金

2+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

视觉识别中的实用鲁棒回归技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

31+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

Robust Regularized Policy Iteration under Transition Uncertainty

Arxiv

0+阅读 · 3月10日

Robust Transfer Learning with Side Information

Arxiv

0+阅读 · 3月9日

A Robust Multi-Item Auction Design with Statistical Learning

Arxiv

0+阅读 · 3月7日

Adversarial Fine-tuning in Offline-to-Online Reinforcement Learning for Robust Robot Control

Arxiv

0+阅读 · 2月27日

Private and Robust Contribution Evaluation in Federated Learning

Arxiv

0+阅读 · 2月25日

Learning Optimal and Sample-Efficient Decision Policies with Guarantees

Arxiv

0+阅读 · 2月20日

Robust Processing and Learning: Principles, Methods, and Wireless Applications

Arxiv

0+阅读 · 2月10日

Strategy-robust Online Learning in Contextual Pricing

Arxiv

0+阅读 · 2月7日

Robust Hyperbolic Learning with Curvature-Aware Optimization

Arxiv

0+阅读 · 2月7日

Robust Online Learning

Arxiv

0+阅读 · 2月6日

VIP会员

文章信息

相关主题

最新内容

美国当前高超音速导弹发展概述

美国当前高超音速导弹发展概述

专知会员服务

4+阅读 · 4月19日

《高超音速武器：一项再度兴起的技术》120页slides

《高超音速武器：一项再度兴起的技术》120页slides

专知会员服务

7+阅读 · 4月19日

无人机蜂群建模与仿真方法

无人机蜂群建模与仿真方法

专知会员服务

4+阅读 · 4月19日

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

专知会员服务

3+阅读 · 4月19日

《量化反无人机系统对抗无人机蜂群效能的创新方法》

《量化反无人机系统对抗无人机蜂群效能的创新方法》

专知会员服务

5+阅读 · 4月19日

澳大利亚发布《国防战略（2026年）》

澳大利亚发布《国防战略（2026年）》

专知会员服务

2+阅读 · 4月19日

【CMU博士论文】迈向基于基础先验的 4D 感知研究

【CMU博士论文】迈向基于基础先验的 4D 感知研究

专知会员服务

2+阅读 · 4月19日

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

专知会员服务

3+阅读 · 4月19日

全球高超音速武器最新发展趋势

全球高超音速武器最新发展趋势

专知会员服务

2+阅读 · 4月19日

《利用大语言模型增强多域作战兵棋推演》（报告）

《利用大语言模型增强多域作战兵棋推演》（报告）

专知会员服务

12+阅读 · 4月18日

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

专知会员服务

11+阅读 · 4月18日

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

专知会员服务

9+阅读 · 4月18日

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

专知会员服务

17+阅读 · 4月18日

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

专知会员服务

8+阅读 · 4月18日

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

专知会员服务

10+阅读 · 4月18日

相关VIP内容

【博士论文】融合上下文的鲁棒机器学习，311页pdf

【博士论文】融合上下文的鲁棒机器学习，311页pdf

专知会员服务

35+阅读 · 2024年2月6日

【MIT博士论文】从未整理数据中的鲁棒学习，220页pdf

【MIT博士论文】从未整理数据中的鲁棒学习，220页pdf

专知会员服务

55+阅读 · 2023年11月10日

《用于海军计算机视觉应用的鲁棒机器学习》2023最新95页论文

《用于海军计算机视觉应用的鲁棒机器学习》2023最新95页论文

专知会员服务

53+阅读 · 2023年9月4日

西安交大等最新《鲁棒视觉问题回答》综述，20页pdf详述RVQA数据集、方法和未来挑战

西安交大等最新《鲁棒视觉问题回答》综述，20页pdf详述RVQA数据集、方法和未来挑战

专知会员服务

21+阅读 · 2023年7月25日

【斯坦福博士论文】大模型驱动的鲁棒机器学习，243页pdf

【斯坦福博士论文】大模型驱动的鲁棒机器学习，243页pdf

专知会员服务

59+阅读 · 2023年7月10日

【CMU博士论文】机器学习的基础: 民有，民享, 300页pdf阐述算法博弈论

【CMU博士论文】机器学习的基础: 民有，民享, 300页pdf阐述算法博弈论

专知会员服务

37+阅读 · 2023年1月3日

《电力系统机器学习的鲁棒性》美海军研究生院2022最新64页论文

《电力系统机器学习的鲁棒性》美海军研究生院2022最新64页论文

专知会员服务

25+阅读 · 2022年11月2日

鲁棒和隐私保护的协同学习

鲁棒和隐私保护的协同学习

专知会员服务

38+阅读 · 2021年12月22日

鲁棒表示学习简述

专知会员服务

26+阅读 · 2021年4月13日

联邦学习中的隐私和鲁棒性:攻击和防御, 杨强等学者最新综述论文，16页pdf

联邦学习中的隐私和鲁棒性:攻击和防御, 杨强等学者最新综述论文，16页pdf

专知会员服务

104+阅读 · 2021年2月3日

热门VIP内容

开通专知VIP会员享更多权益服务

《高超音速武器：一项再度兴起的技术》120页slides

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

美国当前高超音速导弹发展概述

无人机蜂群建模与仿真方法

相关资讯

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知

13+阅读 · 2022年11月25日

联邦学习安全与隐私保护研究综述

联邦学习安全与隐私保护研究综述

专知

12+阅读 · 2020年8月7日

最新《多任务学习》综述，39页pdf

最新《多任务学习》综述，39页pdf

专知

28+阅读 · 2020年7月10日

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

专知

16+阅读 · 2020年4月27日

《机器学习与公平性》新书发布，附127页PDF下载

《机器学习与公平性》新书发布，附127页PDF下载

专知

24+阅读 · 2019年9月13日

【联邦学习】联邦学习的研究及应用、联邦学习的多种可能性

【联邦学习】联邦学习的研究及应用、联邦学习的多种可能性

产业智能官

30+阅读 · 2019年5月24日

机器学习经典必读书，李航《统计学习方法》出视频课了！

机器学习经典必读书，李航《统计学习方法》出视频课了！

深度学习与NLP

15+阅读 · 2019年5月16日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

学界 | 最大化互信息来学习深度表示，Bengio等提出Deep INFOMAX

学界 | 最大化互信息来学习深度表示，Bengio等提出Deep INFOMAX

机器之心

10+阅读 · 2018年9月6日

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

专知

21+阅读 · 2018年5月14日

相关论文

Robust Regularized Policy Iteration under Transition Uncertainty

Arxiv

0+阅读 · 3月10日

Robust Transfer Learning with Side Information

Arxiv

0+阅读 · 3月9日

A Robust Multi-Item Auction Design with Statistical Learning

Arxiv

0+阅读 · 3月7日

Adversarial Fine-tuning in Offline-to-Online Reinforcement Learning for Robust Robot Control

Arxiv

0+阅读 · 2月27日

Private and Robust Contribution Evaluation in Federated Learning

Arxiv

0+阅读 · 2月25日

Learning Optimal and Sample-Efficient Decision Policies with Guarantees

Arxiv

0+阅读 · 2月20日

Robust Processing and Learning: Principles, Methods, and Wireless Applications

Arxiv

0+阅读 · 2月10日

Strategy-robust Online Learning in Contextual Pricing

Arxiv

0+阅读 · 2月7日

Robust Hyperbolic Learning with Curvature-Aware Optimization

Arxiv

0+阅读 · 2月7日

Robust Online Learning

Arxiv

0+阅读 · 2月6日

相关基金

面向网络系统的一致性安全隐私分析与防护机制设计

国家自然科学基金

2+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

视觉识别中的实用鲁棒回归技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

31+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员