Insurance Pricing Optimization via Off-Policy Evaluation - 专知论文

会员服务 ·

0

优化器 · 控制器 · 得分 · 估计/估计量 · Neural Networks ·

Insurance Pricing Optimization via Off-Policy Evaluation

翻译：基于离策略评估的保险定价优化

Sascha Günther,Dimitri Semenovich,Mario V. Wüthrich

Traditional insurance pricing relies on risk-based principles that ensure actuarial fairness and solvency but do not explicitly account for policyholders' price sensitivity. We formulate insurance pricing as a decision-making problem and study it using tools from off-policy evaluation and stochastic control. We propose a kernelized inverse propensity score estimator that exploits local structure in the action space and yields variance reduction compared to the classical inverse propensity score estimator. Building on these value estimates, we investigate policy optimization and present two practical approaches for computing optimal pricing rules: an interpretable data-shared Lasso formulation and a flexible policy parameterization based on neural networks. Using a controlled synthetic travel insurance environment, we empirically confirm the theoretical results and show that neural networks outperform existing techniques for policy optimization.

翻译：传统保险定价依赖于基于风险的原则，这确保了精算公平性和偿付能力，但未能明确考虑投保人的价格敏感度。本文将保险定价建模为决策问题，并利用离策略评估和随机控制工具进行研究。我们提出一种基于核函数的逆倾向得分估计器，该估计器利用动作空间中的局部结构，相较于经典逆倾向得分估计器能够实现方差缩减。基于这些价值估计，我们探索策略优化，并提出两种计算最优定价规则的实用方法：一种可解释的数据共享Lasso公式，以及一种基于神经网络的灵活策略参数化。通过受控的合成旅行保险环境，我们实证验证了理论结果，并表明神经网络在策略优化方面优于现有技术。

0

相关内容

优化器

基于因果推断的推荐系统去偏研究

基于因果推断的推荐系统去偏研究

专知会员服务

21+阅读 · 2024年11月10日

【ETHZ博士论文】贝叶斯优化：风险规避与计算效率决策，183页pdf

【ETHZ博士论文】贝叶斯优化：风险规避与计算效率决策，183页pdf

专知会员服务

30+阅读 · 2024年1月19日

【2023新书】现代优化方法用于在风险和不确定性下的决策, 388页pdf

【2023新书】现代优化方法用于在风险和不确定性下的决策, 388页pdf

专知会员服务

66+阅读 · 2023年10月29日

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

专知会员服务

66+阅读 · 2022年9月22日

推荐！《医疗保健中强化学习的离策略评估》哈佛大学181页博士论文

推荐！《医疗保健中强化学习的离策略评估》哈佛大学181页博士论文

专知会员服务

27+阅读 · 2022年7月21日

【斯坦福2021新书】决策算法，694页pdf阐述不确定性决策

【斯坦福2021新书】决策算法，694页pdf阐述不确定性决策

专知会员服务

264+阅读 · 2021年1月27日

【斯坦福新书】决策算法，464页pdf，Algorithms for Decision Making

【斯坦福新书】决策算法，464页pdf，Algorithms for Decision Making

专知会员服务

124+阅读 · 2020年12月7日

策略梯度方法的算子视图，An operator view of policy gradient methods

策略梯度方法的算子视图，An operator view of policy gradient methods

专知会员服务

11+阅读 · 2020年6月23日

【KDD2020】具有条件公平性的算法决策，Algorithmic Decision Making with Conditional Fairness

【KDD2020】具有条件公平性的算法决策，Algorithmic Decision Making with Conditional Fairness

专知会员服务

22+阅读 · 2020年6月19日

【2020密歇根大学论文】基于学习的序列决策算法的公平性综述论文，Fairness in Learning-Based Sequential Decision Algorithms: A Survey

【2020密歇根大学论文】基于学习的序列决策算法的公平性综述论文，Fairness in Learning-Based Sequential Decision Algorithms: A Survey

专知会员服务

23+阅读 · 2020年1月15日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

39+阅读 · 2023年4月13日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

33+阅读 · 2022年10月17日

MIT最新博士论文《用于个性化医疗和保险的新型机器学习算法》，350页pdf

MIT最新博士论文《用于个性化医疗和保险的新型机器学习算法》，350页pdf

专知

10+阅读 · 2022年5月2日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知

17+阅读 · 2021年1月18日

浅谈最广泛应用的金融风控算法-评分卡

浅谈最广泛应用的金融风控算法-评分卡

凡人机器学习

10+阅读 · 2020年8月3日

CTA策略获利原来是因为它？从动量的角度拆解CTA趋势策略基金收益

CTA策略获利原来是因为它？从动量的角度拆解CTA趋势策略基金收益

优矿量化实验室

12+阅读 · 2019年9月11日

市场▍ToB的SaaS服务如何收费？关于定价的 10 年经验总结

市场▍ToB的SaaS服务如何收费？关于定价的 10 年经验总结

36大数据

20+阅读 · 2019年2月24日

零售商福音：用机器学习给产品定价实现收益最大化

零售商福音：用机器学习给产品定价实现收益最大化

论智

19+阅读 · 2018年9月28日

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

数据分析

13+阅读 · 2018年8月15日

群体偏好的敏感性度量方法研究和群决策方法的可实施性评价

国家自然科学基金

0+阅读 · 2017年12月31日

最优再保险理论研究及其在金融中的应用

国家自然科学基金

2+阅读 · 2014年12月31日

基于竞争差分析的单向交易策略

国家自然科学基金

0+阅读 · 2014年12月31日

信息产品与附加服务的最优定价策略研究

国家自然科学基金

1+阅读 · 2014年12月31日

机制转化下的最优停时问题研究---以金融中投资决策分析为例

国家自然科学基金

2+阅读 · 2014年12月31日

统计估计与决策优化在库存和定价管理中的集成研究

国家自然科学基金

0+阅读 · 2014年12月31日

保险金融市场中相依风险模型的随机最优控制

国家自然科学基金

0+阅读 · 2014年12月31日

保险中两类随机最优控制问题及策略过程概率分布研究

国家自然科学基金

0+阅读 · 2014年12月31日

高维度、非线性模型下的金融资产定价和风险定量计算

国家自然科学基金

1+阅读 · 2014年12月31日

考虑具有风险结构的决策建模及应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

Gaming-Resistant Insurance Contracts for Autonomous AI Agents: Strategy-Proof Toll Mechanism Design

Arxiv

0+阅读 · 6月15日

Proximal Policy Optimization for Amortized Discrete Sampling

Arxiv

0+阅读 · 6月14日

Discrimination-free Insurance Pricing with Privatized Sensitive Attributes

Arxiv

0+阅读 · 6月12日

DRIVE: Distributional and Retrieval-Augmented Bidding with Value Evaluation

Arxiv

0+阅读 · 6月12日

Variational Proximal Policy Optimization

Arxiv

0+阅读 · 6月6日

Off-Policy Learning in Large Action Spaces: Optimization Matters More Than Estimation

Arxiv

0+阅读 · 6月1日

Quantum Subgradient Estimation for Conditional Value-at-Risk Optimization

Arxiv

0+阅读 · 5月15日

An Enriched Model of Strategic Voting under Uncertainty

Arxiv

0+阅读 · 5月15日

Fairness Testing for Algorithmic Pricing

Arxiv

0+阅读 · 5月12日

Risk-Controlled Post-Processing of Decision Policies

Arxiv

0+阅读 · 5月7日

VIP会员

文章信息

相关主题

估计/估计量

Neural Networks

最新内容

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

专知会员服务

2+阅读 · 今天7:13

俄乌无人机战争的六大启示

俄乌无人机战争的六大启示

专知会员服务

4+阅读 · 今天7:07

《无人机空中监控：通信实验洞察》

《无人机空中监控：通信实验洞察》

专知会员服务

3+阅读 · 今天7:05

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

专知会员服务

3+阅读 · 今天6:59

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

12+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

5+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

10+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

12+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

6+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

10+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

8+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

9+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

8+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

6+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

相关VIP内容

基于因果推断的推荐系统去偏研究

基于因果推断的推荐系统去偏研究

专知会员服务

21+阅读 · 2024年11月10日

【ETHZ博士论文】贝叶斯优化：风险规避与计算效率决策，183页pdf

【ETHZ博士论文】贝叶斯优化：风险规避与计算效率决策，183页pdf

专知会员服务

30+阅读 · 2024年1月19日

【2023新书】现代优化方法用于在风险和不确定性下的决策, 388页pdf

【2023新书】现代优化方法用于在风险和不确定性下的决策, 388页pdf

专知会员服务

66+阅读 · 2023年10月29日

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

专知会员服务

66+阅读 · 2022年9月22日

推荐！《医疗保健中强化学习的离策略评估》哈佛大学181页博士论文

推荐！《医疗保健中强化学习的离策略评估》哈佛大学181页博士论文

专知会员服务

27+阅读 · 2022年7月21日

【斯坦福2021新书】决策算法，694页pdf阐述不确定性决策

【斯坦福2021新书】决策算法，694页pdf阐述不确定性决策

专知会员服务

264+阅读 · 2021年1月27日

【斯坦福新书】决策算法，464页pdf，Algorithms for Decision Making

【斯坦福新书】决策算法，464页pdf，Algorithms for Decision Making

专知会员服务

124+阅读 · 2020年12月7日

策略梯度方法的算子视图，An operator view of policy gradient methods

策略梯度方法的算子视图，An operator view of policy gradient methods

专知会员服务

11+阅读 · 2020年6月23日

【KDD2020】具有条件公平性的算法决策，Algorithmic Decision Making with Conditional Fairness

【KDD2020】具有条件公平性的算法决策，Algorithmic Decision Making with Conditional Fairness

专知会员服务

22+阅读 · 2020年6月19日

【2020密歇根大学论文】基于学习的序列决策算法的公平性综述论文，Fairness in Learning-Based Sequential Decision Algorithms: A Survey

【2020密歇根大学论文】基于学习的序列决策算法的公平性综述论文，Fairness in Learning-Based Sequential Decision Algorithms: A Survey

专知会员服务

23+阅读 · 2020年1月15日

热门VIP内容

开通专知VIP会员享更多权益服务

俄乌无人机战争的六大启示

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《无人机空中监控：通信实验洞察》

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

39+阅读 · 2023年4月13日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

33+阅读 · 2022年10月17日

MIT最新博士论文《用于个性化医疗和保险的新型机器学习算法》，350页pdf

MIT最新博士论文《用于个性化医疗和保险的新型机器学习算法》，350页pdf

专知

10+阅读 · 2022年5月2日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知

17+阅读 · 2021年1月18日

浅谈最广泛应用的金融风控算法-评分卡

浅谈最广泛应用的金融风控算法-评分卡

凡人机器学习

10+阅读 · 2020年8月3日

CTA策略获利原来是因为它？从动量的角度拆解CTA趋势策略基金收益

CTA策略获利原来是因为它？从动量的角度拆解CTA趋势策略基金收益

优矿量化实验室

12+阅读 · 2019年9月11日

市场▍ToB的SaaS服务如何收费？关于定价的 10 年经验总结

市场▍ToB的SaaS服务如何收费？关于定价的 10 年经验总结

36大数据

20+阅读 · 2019年2月24日

零售商福音：用机器学习给产品定价实现收益最大化

零售商福音：用机器学习给产品定价实现收益最大化

论智

19+阅读 · 2018年9月28日

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

数据分析

13+阅读 · 2018年8月15日

相关论文

Gaming-Resistant Insurance Contracts for Autonomous AI Agents: Strategy-Proof Toll Mechanism Design

Arxiv

0+阅读 · 6月15日

Proximal Policy Optimization for Amortized Discrete Sampling

Arxiv

0+阅读 · 6月14日

Discrimination-free Insurance Pricing with Privatized Sensitive Attributes

Arxiv

0+阅读 · 6月12日

DRIVE: Distributional and Retrieval-Augmented Bidding with Value Evaluation

Arxiv

0+阅读 · 6月12日

Variational Proximal Policy Optimization

Arxiv

0+阅读 · 6月6日

Off-Policy Learning in Large Action Spaces: Optimization Matters More Than Estimation

Arxiv

0+阅读 · 6月1日

Quantum Subgradient Estimation for Conditional Value-at-Risk Optimization

Arxiv

0+阅读 · 5月15日

An Enriched Model of Strategic Voting under Uncertainty

Arxiv

0+阅读 · 5月15日

Fairness Testing for Algorithmic Pricing

Arxiv

0+阅读 · 5月12日

Risk-Controlled Post-Processing of Decision Policies

Arxiv

0+阅读 · 5月7日

相关基金

群体偏好的敏感性度量方法研究和群决策方法的可实施性评价

国家自然科学基金

0+阅读 · 2017年12月31日

最优再保险理论研究及其在金融中的应用

国家自然科学基金

2+阅读 · 2014年12月31日

基于竞争差分析的单向交易策略

国家自然科学基金

0+阅读 · 2014年12月31日

信息产品与附加服务的最优定价策略研究

国家自然科学基金

1+阅读 · 2014年12月31日

机制转化下的最优停时问题研究---以金融中投资决策分析为例

国家自然科学基金

2+阅读 · 2014年12月31日

统计估计与决策优化在库存和定价管理中的集成研究

国家自然科学基金

0+阅读 · 2014年12月31日

保险金融市场中相依风险模型的随机最优控制

国家自然科学基金

0+阅读 · 2014年12月31日

保险中两类随机最优控制问题及策略过程概率分布研究

国家自然科学基金

0+阅读 · 2014年12月31日

高维度、非线性模型下的金融资产定价和风险定量计算

国家自然科学基金

1+阅读 · 2014年12月31日

考虑具有风险结构的决策建模及应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员