Regularized Adjusted Plus-Minus (RAPM) is the standard framework for estimating individual player impact in basketball. Its application requires possession-level stint data -- records of which five players shared the court for each contiguous sequence of possessions -- a form of data the NBA did not systematically record until the late 1990s. This paper describes the construction, methodology, and validation of the first possession-level player impact database for the pre-play-by-play NBA era, covering the regular seasons from 1984--85 through 1995--96, spanning twelve published seasons. As of this writing, 2,179 regular-season games have been reconstructed across twelve published seasons, comprising 435,760 total logged possessions and 1,012 distinct player-seasons. Every game was manually reconstructed from broadcast video: lineup changes were logged at every dead-ball substitution, possessions were tallied directly from footage, and points scored by each lineup were recorded. RAPM is estimated via weighted ridge regression applied to the reconstructed stint data, using the identical mathematical framework applied to modern play-by-play records. We provide a rigorous treatment of the reconstruction protocol, the formal properties of the estimation procedure, uncertainty quantification through posterior credible intervals, a multi-criterion validation framework, and an analysis of sampling properties at partial coverage. The resulting database is the only possession-level individual impact record for this era and provides a foundation for historical analysis that has until now been technically inaccessible.


翻译:正则化调整正负值(RAPM)是评估篮球运动员个人影响力的标准框架。其应用需要获取回合级轮换数据——即记录每个连续进攻回合中同场竞技的五名球员组合——这类数据直到20世纪90年代末才被NBA系统记录。本文描述了首个NBA早期(涵盖1984-85至1995-96赛季共12个常规赛季)回合级球员影响力数据库的构建方法、技术流程与验证过程。截至目前,已重建12个赛季的2,179场常规赛,累计记录435,760个回合与1,012个球员赛季数据。每场比赛均通过转播视频人工重建:在每次死球换人时记录阵容变动,直接统计比赛录像中的回合数,并记录各阵容的得分情况。采用加权岭回归对重建的轮换数据进行RAPM估计,数学框架与应用于现代逐回合记录的方法完全一致。我们提供了重建方案的严格论证、估计过程的数学性质分析、基于后验可信区间的不确定性量化、多准则验证框架,以及部分覆盖条件下的抽样特性分析。该数据库是目前唯一涵盖该时期的回合级球员影响力记录,为此前技术上不可及的历史分析提供了基础。

0
下载
关闭预览

相关内容

美陆军《将数据融合融入指挥官的战损评估》2022年
专知会员服务
57+阅读 · 2023年2月9日
【泡泡汇总】最强 SLAM Datasets 合辑
泡泡机器人SLAM
17+阅读 · 2019年5月27日
推荐系统召回四模型之:全能的FM模型
AINLP
17+阅读 · 2019年3月4日
数据分析师应该知道的16种回归技术:弹性网络回归
数萃大数据
91+阅读 · 2018年8月16日
数据分析师应该知道的16种回归技术:岭回归
数萃大数据
15+阅读 · 2018年8月11日
推荐算法:Match与Rank模型的交织配合
从0到1
15+阅读 · 2017年12月18日
[推荐] 这些年,我用过的点击率(CTR)预估模型!!!
菜鸟的机器学习
28+阅读 · 2017年7月31日
国家自然科学基金
1+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
36+阅读 · 2008年12月31日
Arxiv
0+阅读 · 6月21日
VIP会员
最新内容
重新思考无人机时代的生存能力
专知会员服务
2+阅读 · 今天7:44
装甲突击旅:现代战争思考、战斗与组织
专知会员服务
2+阅读 · 今天7:28
在人工智能加速决策环境中拓展OODA循环
专知会员服务
3+阅读 · 今天7:18
军事欺骗:供作战战术指挥官使用的工具
专知会员服务
3+阅读 · 今天7:03
综述 | 世界动作模型:少做梦,多行动
专知会员服务
5+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
10+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
5+阅读 · 6月23日
相关VIP内容
美陆军《将数据融合融入指挥官的战损评估》2022年
专知会员服务
57+阅读 · 2023年2月9日
相关基金
国家自然科学基金
1+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
36+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员