In two-way contingency tables under an asymmetric situation, where the row and column variables are defined as explanatory and response variables, respectively, quantifying the extent to which the explanatory variable contributes to predicting the response variable is important. One quantification method is the association measure, which indicates the degree of association in a range from $0$ to $1$. Among various measures that have been proposed, those based on proportional reduction in error (PRE) are particularly notable for their simplicity and intuitive interpretation. These measures, including Goodman-Kruskal's lambda proposed in 1954, are widely implemented in statistical software such as R and SAS and remain extensively used. However, a well-known limitation of PRE measures is their potential to return a value of $0$ despite no independence. This issue arises because the measures are constructed based solely on the maximum joint and marginal probabilities, failing to make full use of the information available in the contingency table. To address this problem, we propose an extension of PRE measures designed for the proportional reduction in error with multiple categories. The properties of the proposed measures are examined, and their utility is demonstrated through numerical experiments. The results suggest their potential as practical tools in applied statistics.


翻译:在非对称情境的二维列联表中,当行变量和列变量分别被定义为解释变量和响应变量时,量化解释变量对预测响应变量的贡献程度至关重要。一种量化方法是关联度量,其通过从$0$到$1$的范围表示关联程度。在已提出的多种度量中,基于误差比例缩减(PRE)的方法因其简洁性和直观解释性而尤为突出。此类度量(包括1954年提出的Goodman-Kruskal lambda)已广泛集成于R、SAS等统计软件中并持续得到应用。然而,PRE度量存在一个公认的局限性:即使变量间非独立,其计算结果也可能为$0$。这一问题的根源在于该类度量仅基于最大联合概率和边际概率构建,未能充分利用列联表中的全部信息。针对该问题,我们提出一种面向多类别误差比例缩减的扩展PRE度量。通过数值实验检验了所提度量的性质并验证其实用性,结果表明其具有作为应用统计学实用工具的潜力。

0
下载
关闭预览

相关内容

面向多目标跟踪的数据关联方法研究综述
专知会员服务
27+阅读 · 2025年5月18日
【博士论文】开放环境下的度量学习研究
专知会员服务
49+阅读 · 2021年12月4日
深度多模态表示学习综述论文,22页pdf
专知
33+阅读 · 2020年6月21日
简述多种降维算法
算法与数学之美
11+阅读 · 2018年9月23日
详解常见的损失函数
七月在线实验室
20+阅读 · 2018年7月12日
推荐算法:Match与Rank模型的交织配合
从0到1
15+阅读 · 2017年12月18日
各种相似性度量及Python实现
机器学习算法与Python学习
11+阅读 · 2017年7月6日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
0+阅读 · 6月1日
Arxiv
0+阅读 · 3月23日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
6+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关VIP内容
面向多目标跟踪的数据关联方法研究综述
专知会员服务
27+阅读 · 2025年5月18日
【博士论文】开放环境下的度量学习研究
专知会员服务
49+阅读 · 2021年12月4日
相关资讯
深度多模态表示学习综述论文,22页pdf
专知
33+阅读 · 2020年6月21日
简述多种降维算法
算法与数学之美
11+阅读 · 2018年9月23日
详解常见的损失函数
七月在线实验室
20+阅读 · 2018年7月12日
推荐算法:Match与Rank模型的交织配合
从0到1
15+阅读 · 2017年12月18日
各种相似性度量及Python实现
机器学习算法与Python学习
11+阅读 · 2017年7月6日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员