在线价格竞争下的广义线性需求模型 (Online Price Competition under Generalized Linear Demands) - 专知论文

会员服务 ·

0

在线 · 广义 · 指标模型 · 表示 · PML ·

Online Price Competition under Generalized Linear Demands

翻译：在线价格竞争下的广义线性需求模型

Daniele Bracale,Moulinath Banerjee,Cong Shi,Yuekai Sun

We study sequential price competition among $N$ sellers, each influenced by the pricing decisions of their rivals. Specifically, the demand function for each seller $i$ follows the single index model $λ_i(\mathbf{p}) = μ_i(\langle \boldsymbolθ_{i,0}, \mathbf{p} \rangle)$, with known increasing link $μ_i$ and unknown parameter $\boldsymbolθ_{i,0}$, where the vector $\mathbf{p}$ denotes the vector of prices offered by all the sellers simultaneously at a given instant. Each seller observes only their own realized demand -- unobservable to competitors -- and the prices set by rivals. Our framework generalizes existing approaches that focus solely on linear demand models. We propose a novel decentralized policy, PML-GLUCB, that combines penalized MLE with an upper-confidence pricing rule, removing the need for coordinated exploration phases across sellers -- which is integral to previous linear models -- and accommodating both binary and real-valued demand observations. Relative to a dynamic benchmark policy, each seller achieves $O(N^{2}\sqrt{T}\log(T))$ regret, which essentially matches the optimal rate known in the linear setting. A significant technical contribution of our work is the development of a variant of the elliptical potential lemma -- typically applied in single-agent systems -- adapted to our competitive multi-agent environment.

翻译：我们研究了$N$个卖家之间的序贯价格竞争问题，其中每个卖家的决策均受到竞争对手定价策略的影响。具体而言，每个卖家$i$的需求函数遵循单指标模型$λ_i(\mathbf{p}) = μ_i(\langle \boldsymbolθ_{i,0}, \mathbf{p} \rangle)$，其中递增连接函数$μ_i$已知而参数$\boldsymbolθ_{i,0}$未知，向量$\mathbf{p}$表示所有卖家在给定时刻同时提供的价格向量。每个卖家仅能观测到自身实现的需求量（竞争对手无法观测）以及竞争对手设定的价格。我们的框架推广了现有仅关注线性需求模型的研究方法。我们提出了一种新颖的分散策略PML-GLUCB，该策略将惩罚极大似然估计与置信上界定价规则相结合，消除了卖家间协调探索阶段的需求（这在先前线性模型中不可或缺），并能同时处理二元和实数值需求观测。相较于动态基准策略，每个卖家实现了$O(N^{2}\sqrt{T}\log(T))$的遗憾界，该结果本质上匹配了线性设定下的已知最优速率。本研究的一个重要技术贡献在于：针对竞争性多智能体环境，发展了椭圆势引理（通常应用于单智能体系统）的变体形式。

0

相关内容

SORA底层模型用好了也能赚钱！DiffsFormer：基于扩散模型的股票因子生成

SORA底层模型用好了也能赚钱！DiffsFormer：基于扩散模型的股票因子生成

专知会员服务

36+阅读 · 2024年2月29日

【KDD2023】TransAct: 基于Transformer的实时用户行为模型在Pinterest的推荐系统中的应用

【KDD2023】TransAct: 基于Transformer的实时用户行为模型在Pinterest的推荐系统中的应用

专知会员服务

26+阅读 · 2023年6月6日

论文 | 《具有中立方的竞争环境中决策周期的数学建模》2022.12最新33页论文

论文 | 《具有中立方的竞争环境中决策周期的数学建模》2022.12最新33页论文

专知会员服务

21+阅读 · 2023年2月12日

【技术情报】《开发基于模型的方法来预测竞争对手系统》美国空军技术学院2022最新106页论文

【技术情报】《开发基于模型的方法来预测竞争对手系统》美国空军技术学院2022最新106页论文

专知会员服务

59+阅读 · 2022年12月2日

实时竞价在展示广告中的应用研究及进展

专知会员服务

21+阅读 · 2020年10月4日

基于Transformer嵌入模型的个性化产品搜索，A Transformer-based Embedding Model for Personalized Product Search

基于Transformer嵌入模型的个性化产品搜索，A Transformer-based Embedding Model for Personalized Product Search

专知会员服务

31+阅读 · 2020年5月20日

【WWW2020】解决推荐系统中目标客户失真问题，Addressing the Target Customer Distortion Problem in Recommender Systems

【WWW2020】解决推荐系统中目标客户失真问题，Addressing the Target Customer Distortion Problem in Recommender Systems

专知会员服务

10+阅读 · 2020年4月4日

和积网络综述论文，Sum-product networks: A survey，24页pdf

和积网络综述论文，Sum-product networks: A survey，24页pdf

专知会员服务

24+阅读 · 2020年4月3日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知会员服务

55+阅读 · 2020年3月17日

【ECML-PKDD 2019】基于邻域增强LSTM模型的出租车乘客需求预测（A Neighborhood-augmented LSTM Model for Taxi-Passenger Demand Prediction）

【ECML-PKDD 2019】基于邻域增强LSTM模型的出租车乘客需求预测（A Neighborhood-augmented LSTM Model for Taxi-Passenger Demand Prediction）

专知会员服务

22+阅读 · 2019年12月1日

淘宝 at KDD 2020，提出M2GRL优化大规模推荐中的多任务多视角图表示学习

淘宝 at KDD 2020，提出M2GRL优化大规模推荐中的多任务多视角图表示学习

AINLP

23+阅读 · 2020年6月16日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知

11+阅读 · 2020年3月17日

市场▍ToB的SaaS服务如何收费？关于定价的 10 年经验总结

市场▍ToB的SaaS服务如何收费？关于定价的 10 年经验总结

36大数据

20+阅读 · 2019年2月24日

主题模型 | 挖掘商品在线评论的主题特征（NLP方法）

主题模型 | 挖掘商品在线评论的主题特征（NLP方法）

沈浩老师

45+阅读 · 2018年11月6日

相关性≠因果：概率图模型和do-calculus

相关性≠因果：概率图模型和do-calculus

论智

31+阅读 · 2018年10月29日

零售商福音：用机器学习给产品定价实现收益最大化

零售商福音：用机器学习给产品定价实现收益最大化

论智

19+阅读 · 2018年9月28日

面向大规模在线学习的社会化推荐模型与方法

面向大规模在线学习的社会化推荐模型与方法

MOOC

10+阅读 · 2018年6月8日

【论文推荐】最新八篇主题模型相关论文—在线光谱学习、PAM变分推断、章节推荐、多芯片系统、文本分析、动态主题模型

【论文推荐】最新八篇主题模型相关论文—在线光谱学习、PAM变分推断、章节推荐、多芯片系统、文本分析、动态主题模型

专知

12+阅读 · 2018年5月6日

概率图模型体系：HMM、MEMM、CRF

概率图模型体系：HMM、MEMM、CRF

机器学习研究会

30+阅读 · 2018年2月10日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

基于在线双向拍卖的运输服务市场交易策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

集成专家意见的在线投资组合策略设计及竞争性能分析

国家自然科学基金

0+阅读 · 2015年12月31日

互联网商业模式价格形成机制与资源配置效率研究——基于消费者信息不完美与搜寻的博弈理论视角

国家自然科学基金

0+阅读 · 2015年12月31日

基于在线消费者购买意向挖掘的个性化推荐研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于社会网络的大型在线社区中虚拟商品购买行为研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向网络环境脉冲式需求的采购风险控制

国家自然科学基金

0+阅读 · 2014年12月31日

基于竞争差分析的单向交易策略

国家自然科学基金

0+阅读 · 2014年12月31日

竞争供应链之间存在横向信息共享的采购策略与合同设计

国家自然科学基金

0+阅读 · 2014年12月31日

订单排序模型及其最优性研究

国家自然科学基金

2+阅读 · 2014年12月31日

广义线性模型的组变量选择及其在信用评分中的应用

国家自然科学基金

2+阅读 · 2014年12月31日

Offline Dynamic Inventory and Pricing Strategy: Addressing Censored and Dependent Demand

Arxiv

0+阅读 · 3月11日

Generalised Linear Models Driven by Latent Processes: Asymptotic Theory and Applications

Arxiv

0+阅读 · 2月18日

Revenue-Optimal Pricing for Budget-Constrained Buyers in Data Markets

Arxiv

0+阅读 · 2月14日

Experimentation, Biased Learning, and Conjectural Variations in Competitive Dynamic Pricing

Arxiv

0+阅读 · 2月13日

Online Decision Making with Fairness over Time

Arxiv

0+阅读 · 2月11日

Online Bisection with Ring Demands

Arxiv

0+阅读 · 2月10日

Online Resource Allocation via Static Bundle Pricing

Arxiv

0+阅读 · 2月10日

Revenue Maximization Under Sequential Price Competition Via The Estimation Of s-Concave Demand Functions

Arxiv

0+阅读 · 2月9日

Strategy-robust Online Learning in Contextual Pricing

Arxiv

0+阅读 · 2月7日

On the Coordination of Value-Maximizing Bidders

Arxiv

0+阅读 · 1月29日

VIP会员

文章信息

相关主题

最新内容

《反小型无人机系统的雷达高度估计相干干扰研究》60页

《反小型无人机系统的雷达高度估计相干干扰研究》60页

专知会员服务

0+阅读 · 今天9:52

人工智能战争迷雾：洞悉乌克兰、加沙和伊朗三战区

人工智能战争迷雾：洞悉乌克兰、加沙和伊朗三战区

专知会员服务

3+阅读 · 今天9:28

（中文）以机器速度作战：来自Maven特遣队主任的见解

（中文）以机器速度作战：来自Maven特遣队主任的见解

专知会员服务

7+阅读 · 今天3:42

（中文）AUKUS第二支柱中的人工智能与自主性方案

（中文）AUKUS第二支柱中的人工智能与自主性方案

专知会员服务

3+阅读 · 今天3:24

（译文）认知战：以士兵为目标，塑造战略

（译文）认知战：以士兵为目标，塑造战略

专知会员服务

2+阅读 · 今天3:12

（中文）认知战的本体论基础（2026报告）

（中文）认知战的本体论基础（2026报告）

专知会员服务

17+阅读 · 今天1:45

美空军条令（2026）：外国对内防御

美空军条令（2026）：外国对内防御

专知会员服务

3+阅读 · 今天1:32

美国与以色列如何在攻击伊朗中使用人工智能

美国与以色列如何在攻击伊朗中使用人工智能

专知会员服务

7+阅读 · 4月16日

《面向大语言模型引导规划、Bandit算法驱动探索与多智能体导航的分层决策问题研究》180页

《面向大语言模型引导规划、Bandit算法驱动探索与多智能体导航的分层决策问题研究》180页

专知会员服务

7+阅读 · 4月16日

《自动化战略情报管控》

《自动化战略情报管控》

专知会员服务

3+阅读 · 4月16日

《反无人机蜂群技术研究：基于小队策略构建大规模无人机防御》

《反无人机蜂群技术研究：基于小队策略构建大规模无人机防御》

专知会员服务

13+阅读 · 4月16日

得失评估：审视对伊朗战争的轨迹（简报）

得失评估：审视对伊朗战争的轨迹（简报）

专知会员服务

3+阅读 · 4月16日

【CMU博士论文】迈向可解释机器学习的理论基础

【CMU博士论文】迈向可解释机器学习的理论基础

专知会员服务

5+阅读 · 4月16日

CVPR 2026 | HulluEdit：基于正交子空间编辑的多模态大语言模型幻觉缓解框架

CVPR 2026 | HulluEdit：基于正交子空间编辑的多模态大语言模型幻觉缓解框架

专知会员服务

4+阅读 · 4月16日

无人机视觉语言导航：研究进展、挑战与技术路线图

无人机视觉语言导航：研究进展、挑战与技术路线图

专知会员服务

6+阅读 · 4月16日

相关VIP内容

SORA底层模型用好了也能赚钱！DiffsFormer：基于扩散模型的股票因子生成

SORA底层模型用好了也能赚钱！DiffsFormer：基于扩散模型的股票因子生成

专知会员服务

36+阅读 · 2024年2月29日

【KDD2023】TransAct: 基于Transformer的实时用户行为模型在Pinterest的推荐系统中的应用

【KDD2023】TransAct: 基于Transformer的实时用户行为模型在Pinterest的推荐系统中的应用

专知会员服务

26+阅读 · 2023年6月6日

论文 | 《具有中立方的竞争环境中决策周期的数学建模》2022.12最新33页论文

论文 | 《具有中立方的竞争环境中决策周期的数学建模》2022.12最新33页论文

专知会员服务

21+阅读 · 2023年2月12日

【技术情报】《开发基于模型的方法来预测竞争对手系统》美国空军技术学院2022最新106页论文

【技术情报】《开发基于模型的方法来预测竞争对手系统》美国空军技术学院2022最新106页论文

专知会员服务

59+阅读 · 2022年12月2日

实时竞价在展示广告中的应用研究及进展

专知会员服务

21+阅读 · 2020年10月4日

基于Transformer嵌入模型的个性化产品搜索，A Transformer-based Embedding Model for Personalized Product Search

基于Transformer嵌入模型的个性化产品搜索，A Transformer-based Embedding Model for Personalized Product Search

专知会员服务

31+阅读 · 2020年5月20日

【WWW2020】解决推荐系统中目标客户失真问题，Addressing the Target Customer Distortion Problem in Recommender Systems

【WWW2020】解决推荐系统中目标客户失真问题，Addressing the Target Customer Distortion Problem in Recommender Systems

专知会员服务

10+阅读 · 2020年4月4日

和积网络综述论文，Sum-product networks: A survey，24页pdf

和积网络综述论文，Sum-product networks: A survey，24页pdf

专知会员服务

24+阅读 · 2020年4月3日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知会员服务

55+阅读 · 2020年3月17日

【ECML-PKDD 2019】基于邻域增强LSTM模型的出租车乘客需求预测（A Neighborhood-augmented LSTM Model for Taxi-Passenger Demand Prediction）

【ECML-PKDD 2019】基于邻域增强LSTM模型的出租车乘客需求预测（A Neighborhood-augmented LSTM Model for Taxi-Passenger Demand Prediction）

专知会员服务

22+阅读 · 2019年12月1日

热门VIP内容

开通专知VIP会员享更多权益服务

人工智能战争迷雾：洞悉乌克兰、加沙和伊朗三战区

（中文）AUKUS第二支柱中的人工智能与自主性方案

《反小型无人机系统的雷达高度估计相干干扰研究》60页

（中文）以机器速度作战：来自Maven特遣队主任的见解

相关资讯

淘宝 at KDD 2020，提出M2GRL优化大规模推荐中的多任务多视角图表示学习

淘宝 at KDD 2020，提出M2GRL优化大规模推荐中的多任务多视角图表示学习

AINLP

23+阅读 · 2020年6月16日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知

11+阅读 · 2020年3月17日

市场▍ToB的SaaS服务如何收费？关于定价的 10 年经验总结

市场▍ToB的SaaS服务如何收费？关于定价的 10 年经验总结

36大数据

20+阅读 · 2019年2月24日

主题模型 | 挖掘商品在线评论的主题特征（NLP方法）

主题模型 | 挖掘商品在线评论的主题特征（NLP方法）

沈浩老师

45+阅读 · 2018年11月6日

相关性≠因果：概率图模型和do-calculus

相关性≠因果：概率图模型和do-calculus

论智

31+阅读 · 2018年10月29日

零售商福音：用机器学习给产品定价实现收益最大化

零售商福音：用机器学习给产品定价实现收益最大化

论智

19+阅读 · 2018年9月28日

面向大规模在线学习的社会化推荐模型与方法

面向大规模在线学习的社会化推荐模型与方法

MOOC

10+阅读 · 2018年6月8日

【论文推荐】最新八篇主题模型相关论文—在线光谱学习、PAM变分推断、章节推荐、多芯片系统、文本分析、动态主题模型

【论文推荐】最新八篇主题模型相关论文—在线光谱学习、PAM变分推断、章节推荐、多芯片系统、文本分析、动态主题模型

专知

12+阅读 · 2018年5月6日

概率图模型体系：HMM、MEMM、CRF

概率图模型体系：HMM、MEMM、CRF

机器学习研究会

30+阅读 · 2018年2月10日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

相关论文

Offline Dynamic Inventory and Pricing Strategy: Addressing Censored and Dependent Demand

Arxiv

0+阅读 · 3月11日

Generalised Linear Models Driven by Latent Processes: Asymptotic Theory and Applications

Arxiv

0+阅读 · 2月18日

Revenue-Optimal Pricing for Budget-Constrained Buyers in Data Markets

Arxiv

0+阅读 · 2月14日

Experimentation, Biased Learning, and Conjectural Variations in Competitive Dynamic Pricing

Arxiv

0+阅读 · 2月13日

Online Decision Making with Fairness over Time

Arxiv

0+阅读 · 2月11日

Online Bisection with Ring Demands

Arxiv

0+阅读 · 2月10日

Online Resource Allocation via Static Bundle Pricing

Arxiv

0+阅读 · 2月10日

Revenue Maximization Under Sequential Price Competition Via The Estimation Of s-Concave Demand Functions

Arxiv

0+阅读 · 2月9日

Strategy-robust Online Learning in Contextual Pricing

Arxiv

0+阅读 · 2月7日

On the Coordination of Value-Maximizing Bidders

Arxiv

0+阅读 · 1月29日

相关基金

基于在线双向拍卖的运输服务市场交易策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

集成专家意见的在线投资组合策略设计及竞争性能分析

国家自然科学基金

0+阅读 · 2015年12月31日

互联网商业模式价格形成机制与资源配置效率研究——基于消费者信息不完美与搜寻的博弈理论视角

国家自然科学基金

0+阅读 · 2015年12月31日

基于在线消费者购买意向挖掘的个性化推荐研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于社会网络的大型在线社区中虚拟商品购买行为研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向网络环境脉冲式需求的采购风险控制

国家自然科学基金

0+阅读 · 2014年12月31日

基于竞争差分析的单向交易策略

国家自然科学基金

0+阅读 · 2014年12月31日

竞争供应链之间存在横向信息共享的采购策略与合同设计

国家自然科学基金

0+阅读 · 2014年12月31日

订单排序模型及其最优性研究

国家自然科学基金

2+阅读 · 2014年12月31日

广义线性模型的组变量选择及其在信用评分中的应用

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员