Non-Stationary Inventory Control with Lead Times - 专知论文

会员服务 ·

0

非平稳 · 损失 · 系统 · 算法 · 库存控制 ·

Non-Stationary Inventory Control with Lead Times

翻译：非平稳库存控制与提前期

Nele H. Amiri,Sean R. Sinclair,Maximiliano Udenio

We study non-stationary single-item, periodic-review inventory control problems in which the demand distribution is unknown and may change over time. We analyze how demand non-stationarity affects learning performance across inventory models, including systems with demand backlogging or lost-sales, both with and without lead times. For each setting, we propose an adaptive online algorithm that optimizes over the class of base-stock policies and establish performance guarantees in terms of dynamic regret relative to the optimal base-stock policy at each time step. Our results reveal a sharp separation across inventory models. In backlogging systems and lost-sales models with zero lead time, we show that it is possible to adapt to demand changes without incurring additional performance loss in stationary environments, even without prior knowledge of the demand distributions or the number of demand shifts. In contrast, for lost-sales systems with positive lead times, we establish weaker guarantees that reflect fundamental limitations imposed by delayed replenishment in combination with censored feedback. Our algorithms leverage the convexity and one-sided feedback structure of inventory costs to enable counterfactual policy evaluation despite demand censoring. We complement the theoretical analysis with simulation results showing that our methods significantly outperform existing benchmarks.

翻译：本文研究非平稳单物品周期盘点库存控制问题，其中需求分布未知且可能随时间变化。我们分析了需求非平稳性如何影响不同库存模型的学习性能，包括允许需求延期交货或发生缺货损失的库存系统，且同时考虑存在或不存在提前期的情况。针对每种场景，我们提出一种自适应在线算法，该算法在基库存策略类别上进行优化，并建立了相对于每个时间步最优基库存策略的动态遗憾性能保证。我们的研究结果揭示了不同库存模型间的显著差异。在允许延期交货的库存系统及零提前期的缺货损失模型中，我们证明即使在没有需求分布先验知识或需求变动次数信息的情况下，系统仍能适应需求变化，且不会在平稳环境中产生额外性能损失。相比之下，对于存在正提前期的缺货损失系统，我们建立了较弱的性能保证，这反映了延迟补货与删失反馈共同作用所施加的根本性限制。我们的算法利用库存成本的凸性与单边反馈结构，在需求删失条件下实现了反事实策略评估。我们通过仿真实验补充理论分析，结果表明所提方法显著优于现有基准算法。

0

相关内容

非平稳

《非平稳作战环境中航空医疗后送强化学习研究》60页

《非平稳作战环境中航空医疗后送强化学习研究》60页

专知会员服务

11+阅读 · 3月19日

【AAAI2026】《SimDiff：用于时间序列点预测的更简单但更优的扩散模型》

【AAAI2026】《SimDiff：用于时间序列点预测的更简单但更优的扩散模型》

专知会员服务

14+阅读 · 2025年11月25日

【博士论文】《通过提前退出算法加速大语言模型推理》

【博士论文】《通过提前退出算法加速大语言模型推理》

专知会员服务

13+阅读 · 2025年9月9日

【ICML2025】用于概率时间序列预测的非平稳扩散方法

【ICML2025】用于概率时间序列预测的非平稳扩散方法

专知会员服务

10+阅读 · 2025年5月10日

【牛津大学博士论文】不确定性量化与因果考量在非策略决策制定中的应用

【牛津大学博士论文】不确定性量化与因果考量在非策略决策制定中的应用

专知会员服务

20+阅读 · 2025年2月24日

非平稳过程异常监测方法: 综述与展望

非平稳过程异常监测方法: 综述与展望

专知会员服务

15+阅读 · 2024年9月5日

非平稳过程异常监测方法：综述与展望

非平稳过程异常监测方法：综述与展望

专知会员服务

23+阅读 · 2024年7月16日

《非常不均匀采样时间序列的顺序学习》美国空军研究实验室2022最新24页技术总结报告

《非常不均匀采样时间序列的顺序学习》美国空军研究实验室2022最新24页技术总结报告

专知会员服务

34+阅读 · 2022年9月28日

索邦大学121页博士论文《时间序列中的无监督异常检测》

索邦大学121页博士论文《时间序列中的无监督异常检测》

专知会员服务

104+阅读 · 2022年7月25日

【ICML2020-伯克利】稳定非策略强化学习的表示，Representations for Stable Off-Policy Reinforcement Learning

【ICML2020-伯克利】稳定非策略强化学习的表示，Representations for Stable Off-Policy Reinforcement Learning

专知会员服务

17+阅读 · 2020年7月14日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

【经典书】时间序列分析与预测导论，671页pdf

【经典书】时间序列分析与预测导论，671页pdf

专知

16+阅读 · 2022年4月1日

【经典书】时间序列分析:预测与控制(原书第5版)，709页pdf

【经典书】时间序列分析:预测与控制(原书第5版)，709页pdf

专知

31+阅读 · 2022年3月30日

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

专知

11+阅读 · 2020年8月28日

转化率预估(pCVR)系列--延迟预估模型（上篇）

转化率预估(pCVR)系列--延迟预估模型（上篇）

AINLP

31+阅读 · 2020年6月1日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

使用 Keras Tuner 调节超参数

使用 Keras Tuner 调节超参数

TensorFlow

15+阅读 · 2020年2月6日

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

专知

92+阅读 · 2019年11月20日

回归预测&时间序列预测

回归预测&时间序列预测

GBASE数据工程部数据团队

44+阅读 · 2017年5月17日

基于动态反馈的时滞非线性系统控制理论研究

国家自然科学基金

0+阅读 · 2017年12月31日

不确定分数阶非线性系统Mittag-Leffler自适应控制

国家自然科学基金

1+阅读 · 2016年12月31日

时滞输入大规模前馈非线性系统的控制设计

国家自然科学基金

1+阅读 · 2015年12月31日

考虑物品种类有限性的分类存储策略及仓储系统优化研究

国家自然科学基金

0+阅读 · 2015年12月31日

随机非线性量化反馈系统的自适应模糊控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

一类不确定非线性大系统的非光滑分散控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

非线性系统输入状态稳定性分析与设计的不定向量Lyapunov函数导数方法

国家自然科学基金

0+阅读 · 2015年12月31日

带有输入饱和的非线性控制系统的量化反馈控制

国家自然科学基金

0+阅读 · 2015年12月31日

混流式水轮机调节系统的非线性有限时间控制

国家自然科学基金

0+阅读 · 2015年12月31日

不确定非凸规划的稳健全局优化方法的研究

国家自然科学基金

1+阅读 · 2014年12月31日

Few Batches or Little Memory, But Not Both: Simultaneous Space and Adaptivity Constraints in Stochastic Bandits

Arxiv

0+阅读 · 3月14日

Offline Dynamic Inventory and Pricing Strategy: Addressing Censored and Dependent Demand

Arxiv

0+阅读 · 3月11日

TopRank-Based Delivery Rate Optimization for Coded Caching under Non-Uniform Demands

Arxiv

0+阅读 · 3月7日

Optimal training-conditional regret for online conformal prediction

Arxiv

0+阅读 · 3月5日

Online Bootstrap Inference for the Trend of Nonstationary Time Series

Arxiv

0+阅读 · 2月27日

Non-Stationary Online Resource Allocation: Learning from a Single Sample

Arxiv

0+阅读 · 2月20日

Improved Online Algorithms for Inventory Management Problems with Holding and Delay Costs: Riding the Wave Makes Things Simpler, Stronger, & More General

Arxiv

0+阅读 · 2月12日

Momentum LMS Theory beyond Stationarity: Stability, Tracking, and Regret

Arxiv

0+阅读 · 2月12日

Experimental Designs for Multi-Item Multi-Period Inventory Control

Arxiv

0+阅读 · 1月31日

Learning to Defer in Non-Stationary Time Series via Switching State-Space Models

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 今天14:45

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

1+阅读 · 今天14:43

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

3+阅读 · 今天14:31

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 今天14:20

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

2+阅读 · 今天14:11

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 今天14:07

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

《非平稳作战环境中航空医疗后送强化学习研究》60页

《非平稳作战环境中航空医疗后送强化学习研究》60页

专知会员服务

11+阅读 · 3月19日

【AAAI2026】《SimDiff：用于时间序列点预测的更简单但更优的扩散模型》

【AAAI2026】《SimDiff：用于时间序列点预测的更简单但更优的扩散模型》

专知会员服务

14+阅读 · 2025年11月25日

【博士论文】《通过提前退出算法加速大语言模型推理》

【博士论文】《通过提前退出算法加速大语言模型推理》

专知会员服务

13+阅读 · 2025年9月9日

【ICML2025】用于概率时间序列预测的非平稳扩散方法

【ICML2025】用于概率时间序列预测的非平稳扩散方法

专知会员服务

10+阅读 · 2025年5月10日

【牛津大学博士论文】不确定性量化与因果考量在非策略决策制定中的应用

【牛津大学博士论文】不确定性量化与因果考量在非策略决策制定中的应用

专知会员服务

20+阅读 · 2025年2月24日

非平稳过程异常监测方法: 综述与展望

非平稳过程异常监测方法: 综述与展望

专知会员服务

15+阅读 · 2024年9月5日

非平稳过程异常监测方法：综述与展望

非平稳过程异常监测方法：综述与展望

专知会员服务

23+阅读 · 2024年7月16日

《非常不均匀采样时间序列的顺序学习》美国空军研究实验室2022最新24页技术总结报告

《非常不均匀采样时间序列的顺序学习》美国空军研究实验室2022最新24页技术总结报告

专知会员服务

34+阅读 · 2022年9月28日

索邦大学121页博士论文《时间序列中的无监督异常检测》

索邦大学121页博士论文《时间序列中的无监督异常检测》

专知会员服务

104+阅读 · 2022年7月25日

【ICML2020-伯克利】稳定非策略强化学习的表示，Representations for Stable Off-Policy Reinforcement Learning

【ICML2020-伯克利】稳定非策略强化学习的表示，Representations for Stable Off-Policy Reinforcement Learning

专知会员服务

17+阅读 · 2020年7月14日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

【经典书】时间序列分析与预测导论，671页pdf

【经典书】时间序列分析与预测导论，671页pdf

专知

16+阅读 · 2022年4月1日

【经典书】时间序列分析:预测与控制(原书第5版)，709页pdf

【经典书】时间序列分析:预测与控制(原书第5版)，709页pdf

专知

31+阅读 · 2022年3月30日

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

专知

11+阅读 · 2020年8月28日

转化率预估(pCVR)系列--延迟预估模型（上篇）

转化率预估(pCVR)系列--延迟预估模型（上篇）

AINLP

31+阅读 · 2020年6月1日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

使用 Keras Tuner 调节超参数

使用 Keras Tuner 调节超参数

TensorFlow

15+阅读 · 2020年2月6日

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

专知

92+阅读 · 2019年11月20日

回归预测&时间序列预测

回归预测&时间序列预测

GBASE数据工程部数据团队

44+阅读 · 2017年5月17日

相关论文

Few Batches or Little Memory, But Not Both: Simultaneous Space and Adaptivity Constraints in Stochastic Bandits

Arxiv

0+阅读 · 3月14日

Offline Dynamic Inventory and Pricing Strategy: Addressing Censored and Dependent Demand

Arxiv

0+阅读 · 3月11日

TopRank-Based Delivery Rate Optimization for Coded Caching under Non-Uniform Demands

Arxiv

0+阅读 · 3月7日

Optimal training-conditional regret for online conformal prediction

Arxiv

0+阅读 · 3月5日

Online Bootstrap Inference for the Trend of Nonstationary Time Series

Arxiv

0+阅读 · 2月27日

Non-Stationary Online Resource Allocation: Learning from a Single Sample

Arxiv

0+阅读 · 2月20日

Improved Online Algorithms for Inventory Management Problems with Holding and Delay Costs: Riding the Wave Makes Things Simpler, Stronger, & More General

Arxiv

0+阅读 · 2月12日

Momentum LMS Theory beyond Stationarity: Stability, Tracking, and Regret

Arxiv

0+阅读 · 2月12日

Experimental Designs for Multi-Item Multi-Period Inventory Control

Arxiv

0+阅读 · 1月31日

Learning to Defer in Non-Stationary Time Series via Switching State-Space Models

Arxiv

0+阅读 · 1月30日

相关基金

基于动态反馈的时滞非线性系统控制理论研究

国家自然科学基金

0+阅读 · 2017年12月31日

不确定分数阶非线性系统Mittag-Leffler自适应控制

国家自然科学基金

1+阅读 · 2016年12月31日

时滞输入大规模前馈非线性系统的控制设计

国家自然科学基金

1+阅读 · 2015年12月31日

考虑物品种类有限性的分类存储策略及仓储系统优化研究

国家自然科学基金

0+阅读 · 2015年12月31日

随机非线性量化反馈系统的自适应模糊控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

一类不确定非线性大系统的非光滑分散控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

非线性系统输入状态稳定性分析与设计的不定向量Lyapunov函数导数方法

国家自然科学基金

0+阅读 · 2015年12月31日

带有输入饱和的非线性控制系统的量化反馈控制

国家自然科学基金

0+阅读 · 2015年12月31日

混流式水轮机调节系统的非线性有限时间控制

国家自然科学基金

0+阅读 · 2015年12月31日

不确定非凸规划的稳健全局优化方法的研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员