This paper proposes an extension to discrete Phase-Type distributions (DPH) by introducing random rewards. These allow for modeling a system in which a visit to a certain state does not emit a deterministic reward. Instead, the rewards follow either a Bernoulli or a geometric distribution. Utilizing this increased flexibility, we further sketch a possible use case for these random rewards by introducing the Inertia-Escalation model (IEM), a process with latent severity levels characterized through two parameters: Inertia ν and escalation η. We also discuss parameter inference for such models. To validate and explore random rewards and the IEM, we conducted extensive simulations and applied the model to two datasets: historical warfare and the Telco customer churn dataset.


翻译:本文提出了一种离散相型分布(DPH)的扩展,通过引入随机奖励机制。该机制允许对系统中访问特定状态时不产生确定性奖励的情形进行建模,转而采用伯努利分布或几何分布来刻画奖励。利用这种增强的灵活性,我们进一步通过引入惯性-升级模型(IEM)勾勒出一个可能的随机奖励应用场景,该模型通过两个参数(惯性ν和升级η)描述具有潜在严重性等级的过程。我们还讨论了此类模型的参数推断问题。为验证和探索随机奖励及IEM,我们进行了大量模拟,并将该模型应用于两个数据集:历史战争数据与电信客户流失数据集。

0
下载
关闭预览

相关内容

用于强化学习的扩散模型:基础、分类与发展
专知会员服务
23+阅读 · 2025年10月15日
深度强化学习中的奖励模型:综述
专知会员服务
29+阅读 · 2025年6月20日
【干货书】金融大数据的随机建模,305页pdf
专知会员服务
73+阅读 · 2022年9月15日
基于模型的强化学习综述
专知
42+阅读 · 2022年7月13日
【干货书】贝叶斯推断随机过程,449页pdf
专知
31+阅读 · 2020年8月27日
深度学习中Attention Mechanism详细介绍:原理、分类及应用
深度学习与NLP
10+阅读 · 2019年2月18日
Attention模型方法综述 | 多篇经典论文解读
PaperWeekly
107+阅读 · 2018年6月11日
迁移学习在深度学习中的应用
专知
24+阅读 · 2017年12月24日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Arxiv
22+阅读 · 2023年11月2日
VIP会员
最新内容
《特种部队在透明战场中的生存力》最新报告
专知会员服务
0+阅读 · 30分钟前
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
7+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员