The 2026 Formula 1 technical regulations introduce a fundamental change to energy strategy: under a 50/50 internal combustion engine / battery power split with unlimited regeneration and a driver-controlled Override Mode (abbreviated MOM throughout), the optimal energy deployment policy depends not only on a driver's own state but on the hidden state of rival cars. This creates a Partially Observable Stochastic Game that cannot be solved by single-agent optimisation methods. We present a tractable two-layer inference and decision framework. The first layer is a 30-state Hidden Markov Model (HMM) that infers a probability distribution over each rival's ERS charge level, Override Mode status, and tyre degradation state from five publicly observable telemetry signals. The second layer is a Deep Q-Network (DQN) policy that takes the HMM belief state as input and selects between energy deployment strategies. We formally characterise the counter-harvest trap -- a deceptive strategy in which a car deliberately suppresses observable deployment signals to induce a rival into a failed attack -- and show that detecting it requires belief-state inference rather than reactive threshold rules. On synthetic races generated from the model's own assumptions, the HMM achieves 92.3% ERS inference accuracy (random baseline: 33.3%) and detects counter-harvest trap conditions with 95.7% recall. Pre-registration -- empirical validation begins Australian Grand Prix, 8 March 2026.


翻译:2026年国际汽联一级方程式技术规则对能源策略带来根本性变革:在50/50内燃机/电池功率分配、无限制能量回收及车手控制的超越模式(全文简称MOM)条件下,最优能量部署策略不仅取决于车手自身状态,更依赖于对手赛车的隐藏状态。这构成了无法通过单智能体优化方法求解的部分可观测随机博弈。本文提出一个可处理的双层推断与决策框架:第一层为30状态隐马尔可夫模型,通过五个公开可观测的遥测信号推断每个对手的ERS充电水平、超越模式状态及轮胎磨损状态的概率分布;第二层为深度Q网络策略,以HMM信念状态为输入,在多种能量部署策略中进行选择。我们形式化定义了"反收割陷阱"——一种通过刻意抑制可观测部署信号诱导对手实施失败攻击的欺骗性策略,并证明检测该陷阱需采用信念状态推断而非反应式阈值规则。在基于模型假设生成的合成比赛中,HMM实现92.3%的ERS状态推断准确率(随机基线:33.3%),并以95.7%召回率检测反收割陷阱条件。预注册声明:实证验证将于2026年3月8日澳大利亚大奖赛启动。

0
下载
关闭预览

相关内容

《分布式多智能体强化学习策略的可解释性研究》
专知会员服务
28+阅读 · 2025年11月17日
《利用隐马尔可夫模型开发预测性军事规划工具》
专知会员服务
38+阅读 · 2024年11月4日
《面向 21 世纪战场的美军作战能源解决方案》
专知会员服务
20+阅读 · 2024年8月6日
面向多智能体博弈对抗的对手建模框架
专知
18+阅读 · 2022年9月28日
多智能体强化学习(MARL)近年研究概览
PaperWeekly
38+阅读 · 2020年3月15日
【泡泡点云时空】基于分割方法的物体六维姿态估计
泡泡机器人SLAM
18+阅读 · 2019年9月15日
新能源汽车关键技术在国防领域的应用展望
未来产业促进会
10+阅读 · 2019年5月28日
概率图模型体系:HMM、MEMM、CRF
机器学习研究会
30+阅读 · 2018年2月10日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
VIP会员
最新内容
《人工智能赋能电磁战》(报告)
专知会员服务
2+阅读 · 4月17日
【CMU博士论文】迈向可扩展的开放世界三维感知
前馈式三维场景建模
专知会员服务
1+阅读 · 4月17日
(译文)认知战:以士兵为目标,塑造战略
专知会员服务
3+阅读 · 4月17日
相关VIP内容
《分布式多智能体强化学习策略的可解释性研究》
专知会员服务
28+阅读 · 2025年11月17日
《利用隐马尔可夫模型开发预测性军事规划工具》
专知会员服务
38+阅读 · 2024年11月4日
《面向 21 世纪战场的美军作战能源解决方案》
专知会员服务
20+阅读 · 2024年8月6日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员