The paper investigates the efficacy of parameter shrinkage on count data models through the use of penalized likelihood methods. The goal is to fit models to count data where multiple independent count variables are observed with only a moderate sample size per variable. The possibility of zero-inflated counts is also plausible for the data. In the context considered here, elementary school-aged kids were given passages of different lengths to read. We aim to find a suitable model that accurately captures their oral reading fluency (ORF) as measured by number of words read incorrectly (WRI) scores. The dataset contains information about the length of the passages (number of words) and WRI scores obtained from recorded reading sessions. The idea is to find passage-level parameter estimates with good MSE properties. Improvement over maximum likelihood MSE is considered by applying appending penalty functions to the negative log-likelihood. Three statistical models are considered for WRI scores, namely the binomial, zero-inflated binomial, and beta-binomial. The paper explores two types of penalty functions resulting in estimators that are either closer to $0$ or closer to the equivalent parameters corresponding to other passages. The efficacy of the shrinkage methods are explored in an extensive simulation study.


翻译:本文通过使用惩罚性可能性方法调查计算数据模型参数缩缩的功效。 目标是将观察多独立计数变量的数据模型与每个变量的中度样本大小相匹配。 对数据来说, 零膨胀计数的可能性也是有道理的。 在此处审议的背景下, 小学适龄儿童可以读取不同长度的段落。 我们的目标是找到一个合适的模型, 准确捕捉他们的口读流( ORF), 以错误读取( WRI) 分数的字数来衡量。 数据集包含关于从记录读取的段落长度( 字数) 和 WRI 分数的信息。 其想法是找到具有良好MSE 属性的跨行级别参数估计值。 考虑通过对负日志相似性应用附加惩罚功能来提高最大的可能性。 我们考虑三个统计模型, 即二进制、 零进缩二进制和 bebinomial 分数。 本文探索了两种类型的惩罚函数, 导致从记录阅读会话中获得的长度( 字数) 和 WRI 评分数 。 。 在模拟研究中, 对等同式的参数进行 。

0
下载
关闭预览

相关内容

专知会员服务
102+阅读 · 2021年9月21日
专知会员服务
29+阅读 · 2021年8月2日
【Manning新书】C++并行实战,592页pdf,C++ Concurrency in Action
专知会员服务
116+阅读 · 2021年1月11日
【干货书】机器学习速查手册,135页pdf
专知会员服务
127+阅读 · 2020年11月20日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
41+阅读 · 2019年10月9日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
一文道尽softmax loss及其变种
极市平台
14+阅读 · 2019年2月19日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
时间序列算法ARIMA介绍
凡人机器学习
5+阅读 · 2017年6月2日
Arxiv
0+阅读 · 2021年11月21日
Arxiv
4+阅读 · 2018年1月15日
VIP会员
最新内容
非对称优势:美海军开发低成本反无人机技术
专知会员服务
4+阅读 · 今天4:39
《美战争部小企业创新研究(SBIR)计划》
专知会员服务
5+阅读 · 今天2:48
《军事模拟:将军事条令与目标融入AI智能体》
专知会员服务
8+阅读 · 今天2:43
【NTU博士论文】3D人体动作生成
专知会员服务
6+阅读 · 4月24日
以色列军事技术对美国军力发展的持续性赋能
专知会员服务
8+阅读 · 4月24日
《深度强化学习在兵棋推演中的应用》40页报告
专知会员服务
13+阅读 · 4月24日
《多域作战面临复杂现实》
专知会员服务
9+阅读 · 4月24日
《印度的多域作战:条令与能力发展》报告
专知会员服务
4+阅读 · 4月24日
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
一文道尽softmax loss及其变种
极市平台
14+阅读 · 2019年2月19日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
时间序列算法ARIMA介绍
凡人机器学习
5+阅读 · 2017年6月2日
Top
微信扫码咨询专知VIP会员