Real-time probability forecasts for binary outcomes are routine in sports, online experimentation, medicine, and finance. Retrospective narratives, however, often hinge on pathwise extremes: for example, a forecast that reaches $90\%$ for an event that ultimately does not occur. Standard pointwise calibration tools (e.g. reliability diagrams) do not quantify how frequently such extremes should occur under correct sequential calibration. Under this ideal, the forecast path $p_k=\Pr(Y=1\mid F_k)$ is a bounded martingale with terminal value $p_N=Y\in\{0,1\}$. We derive benchmark distributions for extreme-path functionals conditional on the terminal outcome, emphasizing the peak-on-loss statistic $M_N=\max_{k\le N} p_k$ given $Y=0$. For continuous-time martingales with continuous sample paths, we obtain an exact identity for $\Pr(\sup_{t\in[0,1]}p_t\ge x\mid Y=0)$. In discrete time, we prove sharp finite-sample bounds and an explicit correction decomposition that isolates terminal-step crossings (non-attainment) and overshoots. These formulas provide model-agnostic null targets and one-sided tail probabilities (exact in the continuous-path setting; conservative in discrete time) for diagnosing sequential miscalibration from extreme-path behavior. We also develop competitive extensions tailored to win-probability feeds, including the eventual loser's peak win probability in two-outcome contests and the eventual winner's trough in $n$-outcome contests. An empirical illustration using ESPN win-probability series for NFL and NBA regular-season games (2018-2024) finds broad agreement with the benchmark in the NFL and systematic departures in the NBA.


翻译:针对二元结果的实时概率预测在体育赛事、在线实验、医学诊断及金融领域已成为常规实践。然而,回溯性分析往往聚焦于路径极值:例如,某个事件的预测概率曾达到$90\%$,但该事件最终并未发生。标准的逐点校准工具(如可靠性曲线图)无法量化在正确的序列校准下此类极端情况应出现的频率。在理想校准状态下,预测路径$p_k=\Pr(Y=1\mid F_k)$是一个有界鞅,其终值为$p_N=Y\in\{0,1\}$。本文推导了极端路径泛函在给定最终结果条件下的基准分布,重点关注损失条件下的峰值统计量$M_N=\max_{k\le N} p_k$(当$Y=0$时)。对于具有连续样本路径的连续时间鞅,我们得到了$\Pr(\sup_{t\in[0,1]}p_t\ge x\mid Y=0)$的精确恒等式。在离散时间情形中,我们证明了尖锐的有限样本界,并提出了显式的修正分解方法,以分离终步穿越(未达成)和超调现象。这些公式为诊断序列校准偏差提供了与模型无关的零假设目标及单侧尾部概率(在连续路径设定中精确成立,在离散时间中保守成立)。我们还针对胜率数据流开发了竞争性扩展方法,包括双结果竞赛中最终败者的峰值胜率,以及$n$结果竞赛中最终胜者的谷值胜率。通过使用ESPN提供的NFL与NBA常规赛胜率序列(2018-2024年)进行实证分析,发现NFL数据与基准模型广泛吻合,而NBA数据则呈现系统性偏离。

0
下载
关闭预览

相关内容

【斯坦福博士论文】概率机器学习中的不确定性原理
专知会员服务
27+阅读 · 2025年8月4日
【ICML2025】用于概率时间序列预测的非平稳扩散方法
专知会员服务
10+阅读 · 2025年5月10日
异质信息网络链路预测方法综述
专知会员服务
17+阅读 · 2024年8月8日
专知会员服务
237+阅读 · 2020年12月15日
时空序列预测方法综述
专知
22+阅读 · 2020年10月19日
概率论之概念解析:边缘化(Marginalisation)
回归预测&时间序列预测
GBASE数据工程部数据团队
44+阅读 · 2017年5月17日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
2025年大语言模型进展报告
专知会员服务
1+阅读 · 今天13:30
多智能体协作机制
专知会员服务
0+阅读 · 今天13:26
非对称优势:美海军开发低成本反无人机技术
专知会员服务
4+阅读 · 今天4:39
《美战争部小企业创新研究(SBIR)计划》
专知会员服务
6+阅读 · 今天2:48
《军事模拟:将军事条令与目标融入AI智能体》
专知会员服务
9+阅读 · 今天2:43
【NTU博士论文】3D人体动作生成
专知会员服务
7+阅读 · 4月24日
以色列军事技术对美国军力发展的持续性赋能
专知会员服务
8+阅读 · 4月24日
《深度强化学习在兵棋推演中的应用》40页报告
专知会员服务
14+阅读 · 4月24日
《多域作战面临复杂现实》
专知会员服务
10+阅读 · 4月24日
《印度的多域作战:条令与能力发展》报告
专知会员服务
5+阅读 · 4月24日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员