CATEKAPPA: An R Shiny Application for Design and Analysis of Consistency Tests Based on the Kappa Statistic for Categorical Responses - 专知论文

会员服务 ·

0

Analysis · 统计量 · 设计 · 样本 · 泛函 ·

CATEKAPPA: An R Shiny Application for Design and Analysis of Consistency Tests Based on the Kappa Statistic for Categorical Responses

翻译：CATEKAPPA：基于Kappa统计量的分类响应一致性检验设计与分析的R Shiny应用

Zheng Gai,Li Xincheng,Jiang Wangyingjie,Zhao Panwei

from arxiv, 10 pages, 4 figures; This open-source R package CATEKAPPA is available on CRAN at https://CRAN.R-project.org/package=catekappa, source code repository is hosted at https://github.com/satellite837/catekappa. Manuscript planned for submission to Journal of Statistical Software (JSS). Supplementary R package source code uploaded as ancillary file

The kappa statistic is the most widely used measure of inter-rater agreement for categorical data. Despite its popularity, applied researchers often encounter two major hurdles: (i) determining the sample size required to achieve a desired level of agreement with given power, and (ii) computing appropriate kappa coefficients with proper interpretation. Existing R packages such as irr and kappaSize provide these functionalities but require programming skills and lack an integrated, user-friendly interface. We present CATEKAPPA, an R package that bridges this gap by combining sample size planning (via kappaSize) and agreement analysis (via irr) into a single Shiny-based web application. The package supports Cohen's kappa for two raters, Fleiss' kappa for three or more raters, and Light's kappa, and provides automatic interpretation using the Landis & Koch scale. Users can either launch an interactive graphical interface or use command-line functions for scripting. The package is freely available on CRAN.

翻译：Kappa统计量是分类数据中最广泛使用的一致性度量指标。尽管其应用普遍，但实际研究者常面临两大障碍：（i）确定在给定统计功效下达到期望一致性水平所需的样本量；（ii）计算合适的Kappa系数并进行准确解读。现有R包如irr和kappaSize虽能提供这些功能，但要求用户具备编程技能，且缺乏集成化的用户友好界面。我们提出CATEKAPPA这一R包，通过将样本量规划（经由kappaSize包）与一致性分析（经由irr包）整合至基于Shiny的单一网络应用程序，填补了这一空白。该包支持两位评估者的Cohen's Kappa、三位及以上评估者的Fleiss' Kappa及Light's Kappa，并依据Landis & Koch分级标准提供自动解读。用户可通过交互式图形界面启动程序，也可使用命令行函数进行脚本化操作。该R包已在CRAN上免费发布。

0

相关内容

Analysis

《数据标准管理实践白皮书》，20页pdf，中国信息通信研究院云计算与大数据研究所

《数据标准管理实践白皮书》，20页pdf，中国信息通信研究院云计算与大数据研究所

专知会员服务

51+阅读 · 2022年5月31日

香港中文大学最新《基于Aspect的情感分析》综述论文，涵盖近200篇文献阐述ABSA方法体系

香港中文大学最新《基于Aspect的情感分析》综述论文，涵盖近200篇文献阐述ABSA方法体系

专知会员服务

44+阅读 · 2022年3月3日

【干货书】统计基础、推理与推断，361页pdf

【干货书】统计基础、推理与推断，361页pdf

专知会员服务

86+阅读 · 2022年1月25日

【AAAI 2022】一致性信息瓶颈在域泛化中的应用

【AAAI 2022】一致性信息瓶颈在域泛化中的应用

专知会员服务

26+阅读 · 2022年1月15日

NTU最新《广义分布外OOD检测》综述论文，20页pdf阐述离群/异常/新类/开集/分布外检测的异同

NTU最新《广义分布外OOD检测》综述论文，20页pdf阐述离群/异常/新类/开集/分布外检测的异同

专知会员服务

29+阅读 · 2021年10月26日

【2020新书】Kafka权威指南，322页pdf，Apache Kafka: The Definitive Guide

【2020新书】Kafka权威指南，322页pdf，Apache Kafka: The Definitive Guide

专知会员服务

21+阅读 · 2020年10月26日

【KDD2020】CAST:一种基于相关关系的多尺度数据自适应光谱聚类算法,CAST: A Correlation-based Adaptive Spectral Clustering Algorithm on Multi-scale Data

【KDD2020】CAST:一种基于相关关系的多尺度数据自适应光谱聚类算法,CAST: A Correlation-based Adaptive Spectral Clustering Algorithm on Multi-scale Data

专知会员服务

20+阅读 · 2020年6月11日

【干货书】Python统计学分析应用，285页pdf讲述在生命科学领域的应用

【干货书】Python统计学分析应用，285页pdf讲述在生命科学领域的应用

专知会员服务

143+阅读 · 2020年6月2日

【干货书】R语言书: 编程和统计的第一课程，

【干货书】R语言书: 编程和统计的第一课程，

专知会员服务

118+阅读 · 2020年5月9日

语义相似性算法演化论文，29页pdf，Evolution of Semantic Similarity - A Survey

语义相似性算法演化论文，29页pdf，Evolution of Semantic Similarity - A Survey

专知会员服务

44+阅读 · 2020年4月30日

【干货书】数据科学家统计学基础：R和Python实战，486页pdf

【干货书】数据科学家统计学基础：R和Python实战，486页pdf

专知

30+阅读 · 2022年1月29日

【干货书】统计基础、推理与推断，361页pdf

【干货书】统计基础、推理与推断，361页pdf

专知

11+阅读 · 2022年1月25日

浅谈最广泛应用的金融风控算法-评分卡

浅谈最广泛应用的金融风控算法-评分卡

凡人机器学习

10+阅读 · 2020年8月3日

【干货书】R语言书: 编程和统计的第一课程，835页pdf

【干货书】R语言书: 编程和统计的第一课程，835页pdf

专知

40+阅读 · 2020年5月9日

【资源】kaggle数据科学竞赛方案集锦

【资源】kaggle数据科学竞赛方案集锦

专知

27+阅读 · 2019年9月4日

IJCAI 2019 | 为推荐系统生成高质量的文本解释：基于互注意力机制的多任务学习模型

IJCAI 2019 | 为推荐系统生成高质量的文本解释：基于互注意力机制的多任务学习模型

微软研究院AI头条

18+阅读 · 2019年8月13日

【自动化】详解PID调节的基本概念、参数与调试方法，清晰易懂！

【自动化】详解PID调节的基本概念、参数与调试方法，清晰易懂！

产业智能官

10+阅读 · 2018年12月20日

统计学常用数据类型

统计学常用数据类型

论智

19+阅读 · 2018年7月6日

PCA的基本数学原理

PCA的基本数学原理

算法与数学之美

11+阅读 · 2017年8月8日

各种相似性度量及Python实现

各种相似性度量及Python实现

机器学习算法与Python学习

11+阅读 · 2017年7月6日

面向网络系统的一致性安全隐私分析与防护机制设计

国家自然科学基金

2+阅读 · 2017年12月31日

理性安全两方计算协议设计与安全性证明

国家自然科学基金

0+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

复杂交互型网络系统的DEA效率评价与资源配置研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

试验设计中的模型选择

国家自然科学基金

6+阅读 · 2014年12月31日

基于部分核实数据的统计推断及应用

国家自然科学基金

0+阅读 · 2014年12月31日

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

复杂数据下含指标项半参数模型结构的统计推断及应用

国家自然科学基金

0+阅读 · 2014年12月31日

基于第三方的APP软件质量度量和评估方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

Smooth Concordance Metrics for Survival Models

Arxiv

0+阅读 · 6月4日

Unifying Information-Theoretic and Pair-Counting Clustering Similarity

Arxiv

0+阅读 · 6月2日

QUBRIC: Co-Designing Queries and Rubrics for RL Beyond Verifiable Rewards

Arxiv

0+阅读 · 6月2日

ICCDesign: An R Package for the Design and Analysis of ICC-Based Reliability Studies with Continuous Responses

Arxiv

0+阅读 · 6月1日

ThSQCA: Threshold-Sweep Qualitative Comparative Analysis in R

Arxiv

0+阅读 · 5月30日

Measuring Delivery Consistency in Practice: A DORA Extension from a Multi-Platform Release Setting

Arxiv

0+阅读 · 5月29日

CARM Tool: Cache-Aware Roofline Model Automatic Benchmarking and Application Analysis

Arxiv

0+阅读 · 5月28日

Parameter estimation for kappa distributions using the EM algorithm in the superstatistical framework

Arxiv

0+阅读 · 5月22日

critband: A Python Package for Critical Bandwidth Analysis of Multimodal Distributions

Arxiv

0+阅读 · 5月19日

PWEXP: An R Package Using Piecewise Exponential Model for Study Design and Event/Timeline Prediction

Arxiv

0+阅读 · 5月12日

VIP会员

文章信息

相关主题

最新内容

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

1+阅读 · 今天15:03

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

0+阅读 · 今天14:31

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

0+阅读 · 今天14:29

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

12+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

4+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

7+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

8+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

11+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

12+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

8+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

21+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

10+阅读 · 6月17日

相关VIP内容

《数据标准管理实践白皮书》，20页pdf，中国信息通信研究院云计算与大数据研究所

《数据标准管理实践白皮书》，20页pdf，中国信息通信研究院云计算与大数据研究所

专知会员服务

51+阅读 · 2022年5月31日

香港中文大学最新《基于Aspect的情感分析》综述论文，涵盖近200篇文献阐述ABSA方法体系

香港中文大学最新《基于Aspect的情感分析》综述论文，涵盖近200篇文献阐述ABSA方法体系

专知会员服务

44+阅读 · 2022年3月3日

【干货书】统计基础、推理与推断，361页pdf

【干货书】统计基础、推理与推断，361页pdf

专知会员服务

86+阅读 · 2022年1月25日

【AAAI 2022】一致性信息瓶颈在域泛化中的应用

【AAAI 2022】一致性信息瓶颈在域泛化中的应用

专知会员服务

26+阅读 · 2022年1月15日

NTU最新《广义分布外OOD检测》综述论文，20页pdf阐述离群/异常/新类/开集/分布外检测的异同

NTU最新《广义分布外OOD检测》综述论文，20页pdf阐述离群/异常/新类/开集/分布外检测的异同

专知会员服务

29+阅读 · 2021年10月26日

【2020新书】Kafka权威指南，322页pdf，Apache Kafka: The Definitive Guide

【2020新书】Kafka权威指南，322页pdf，Apache Kafka: The Definitive Guide

专知会员服务

21+阅读 · 2020年10月26日

【KDD2020】CAST:一种基于相关关系的多尺度数据自适应光谱聚类算法,CAST: A Correlation-based Adaptive Spectral Clustering Algorithm on Multi-scale Data

【KDD2020】CAST:一种基于相关关系的多尺度数据自适应光谱聚类算法,CAST: A Correlation-based Adaptive Spectral Clustering Algorithm on Multi-scale Data

专知会员服务

20+阅读 · 2020年6月11日

【干货书】Python统计学分析应用，285页pdf讲述在生命科学领域的应用

【干货书】Python统计学分析应用，285页pdf讲述在生命科学领域的应用

专知会员服务

143+阅读 · 2020年6月2日

【干货书】R语言书: 编程和统计的第一课程，

【干货书】R语言书: 编程和统计的第一课程，

专知会员服务

118+阅读 · 2020年5月9日

语义相似性算法演化论文，29页pdf，Evolution of Semantic Similarity - A Survey

语义相似性算法演化论文，29页pdf，Evolution of Semantic Similarity - A Survey

专知会员服务

44+阅读 · 2020年4月30日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

美国从乌克兰无人机战争中学习经验

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

相关资讯

【干货书】数据科学家统计学基础：R和Python实战，486页pdf

【干货书】数据科学家统计学基础：R和Python实战，486页pdf

专知

30+阅读 · 2022年1月29日

【干货书】统计基础、推理与推断，361页pdf

【干货书】统计基础、推理与推断，361页pdf

专知

11+阅读 · 2022年1月25日

浅谈最广泛应用的金融风控算法-评分卡

浅谈最广泛应用的金融风控算法-评分卡

凡人机器学习

10+阅读 · 2020年8月3日

【干货书】R语言书: 编程和统计的第一课程，835页pdf

【干货书】R语言书: 编程和统计的第一课程，835页pdf

专知

40+阅读 · 2020年5月9日

【资源】kaggle数据科学竞赛方案集锦

【资源】kaggle数据科学竞赛方案集锦

专知

27+阅读 · 2019年9月4日

IJCAI 2019 | 为推荐系统生成高质量的文本解释：基于互注意力机制的多任务学习模型

IJCAI 2019 | 为推荐系统生成高质量的文本解释：基于互注意力机制的多任务学习模型

微软研究院AI头条

18+阅读 · 2019年8月13日

【自动化】详解PID调节的基本概念、参数与调试方法，清晰易懂！

【自动化】详解PID调节的基本概念、参数与调试方法，清晰易懂！

产业智能官

10+阅读 · 2018年12月20日

统计学常用数据类型

统计学常用数据类型

论智

19+阅读 · 2018年7月6日

PCA的基本数学原理

PCA的基本数学原理

算法与数学之美

11+阅读 · 2017年8月8日

各种相似性度量及Python实现

各种相似性度量及Python实现

机器学习算法与Python学习

11+阅读 · 2017年7月6日

相关论文

Smooth Concordance Metrics for Survival Models

Arxiv

0+阅读 · 6月4日

Unifying Information-Theoretic and Pair-Counting Clustering Similarity

Arxiv

0+阅读 · 6月2日

QUBRIC: Co-Designing Queries and Rubrics for RL Beyond Verifiable Rewards

Arxiv

0+阅读 · 6月2日

ICCDesign: An R Package for the Design and Analysis of ICC-Based Reliability Studies with Continuous Responses

Arxiv

0+阅读 · 6月1日

ThSQCA: Threshold-Sweep Qualitative Comparative Analysis in R

Arxiv

0+阅读 · 5月30日

Measuring Delivery Consistency in Practice: A DORA Extension from a Multi-Platform Release Setting

Arxiv

0+阅读 · 5月29日

CARM Tool: Cache-Aware Roofline Model Automatic Benchmarking and Application Analysis

Arxiv

0+阅读 · 5月28日

Parameter estimation for kappa distributions using the EM algorithm in the superstatistical framework

Arxiv

0+阅读 · 5月22日

critband: A Python Package for Critical Bandwidth Analysis of Multimodal Distributions

Arxiv

0+阅读 · 5月19日

PWEXP: An R Package Using Piecewise Exponential Model for Study Design and Event/Timeline Prediction

Arxiv

0+阅读 · 5月12日

相关基金

面向网络系统的一致性安全隐私分析与防护机制设计

国家自然科学基金

2+阅读 · 2017年12月31日

理性安全两方计算协议设计与安全性证明

国家自然科学基金

0+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

复杂交互型网络系统的DEA效率评价与资源配置研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

试验设计中的模型选择

国家自然科学基金

6+阅读 · 2014年12月31日

基于部分核实数据的统计推断及应用

国家自然科学基金

0+阅读 · 2014年12月31日

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

复杂数据下含指标项半参数模型结构的统计推断及应用

国家自然科学基金

0+阅读 · 2014年12月31日

基于第三方的APP软件质量度量和评估方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员