Early identification of at risk students in higher education depends on predictive models that maintain accuracy across successive cohorts -- a requirement that single-cohort modeling approaches fail to meet. This study evaluates Bayesian updating with informative priors from a previous cohort to improve cross-cohort prediction robustness using digital trace data. We fit weekly Bayesian linear, logistic, and ordinal regression models with either uninformative default priors or informative priors derived from posterior distributions of a preceding cohort. Models were applied to six weekly self-regulated learning (SRL)-aligned engagement indicators from two consecutive cohorts of students in a blended first-year mathematics course (N1 = 307; N2 = 323). Outcomes were exam points, final grades, and a binary at risk indicator. The models were evaluated weekly based on accuracy, sensitivity, and RMSE. In the source cohort, performance was already substantial by week 6. In the target cohort, informative priors improved early classification: Logistic models with priors reduced misclassification by 22% and false negatives by 38% in week 3 relative to the uninformative default. Ordinal models with priors similarly showed the strongest improvements in early weeks, reducing misclassification by 42% in week 2 and reaching an accuracy of .77 by week 4. Linear models showed little benefit from prior information. These findings demonstrate that Bayesian updating is a viable method for improving early classification performance across cohorts, with gains concentrated in the early weeks of the semester when current-cohort data are scarce.


翻译:高等教育中早期识别学业风险学生依赖于能跨连续队列保持准确性的预测模型——这一需求是单队列建模方法无法满足的。本研究评估了采用前一个队列信息先验的贝叶斯更新方法,利用数字轨迹数据提升跨队列预测的鲁棒性。我们分别以无信息默认先验或基于前序队列后验分布的信息先验,拟合了每周的贝叶斯线性、逻辑斯蒂和序数回归模型。模型应用于某混合式大学数学课程连续两个队列学生(N1=307;N2=323)的六项每周自调节学习(SRL)对齐的参与度指标。结果变量包括考试分数、最终成绩及二分类风险指标。每周基于准确率、敏感性和均方根误差评估模型。在源队列中,模型至第六周时已展现显著性能。在目标队列中,信息先验改善了早期分类:相较无信息默认先验,采用先验的逻辑斯蒂模型在第三周将误分类率降低22%,假阴性率降低38%。带先验的序数模型同样在早期周次表现出最强改善,第二周误分类率降低42%,第四周准确率达0.77。线性模型则几乎未从先验信息中获益。这些发现表明,贝叶斯更新是改善跨队列早期分类性能的可行方法,其增益主要集中于当前队列数据稀缺的学期初几周。

0
下载
关闭预览

相关内容

《卫星图像的贝叶斯斑块预测》最新65页
专知会员服务
13+阅读 · 2024年10月19日
基于贝叶斯网络的武器装备体系作战效能评估方法
专知会员服务
89+阅读 · 2023年7月5日
【ICLR2022】Transformers亦能贝叶斯推断
专知会员服务
25+阅读 · 2021年12月23日
【干货书】贝叶斯推断随机过程,449页pdf
专知
31+阅读 · 2020年8月27日
一文读懂机器学习中的贝叶斯统计学
数据分析
26+阅读 · 2019年5月8日
贝叶斯机器学习前沿进展
机器学习研究会
21+阅读 · 2018年1月21日
回归预测&时间序列预测
GBASE数据工程部数据团队
44+阅读 · 2017年5月17日
国家自然科学基金
16+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
45+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
VIP会员
相关主题
最新内容
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
3+阅读 · 5月30日
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
4+阅读 · 5月30日
《Palantir任务保障性软件安全标准(MA-S2)》
专知会员服务
14+阅读 · 5月30日
基于声学的无人机检测技术综述
专知会员服务
8+阅读 · 5月30日
《当代混合战争分析框架:俄乌战争经验教训》
战略前沿人工智能的再思考(中文)
专知会员服务
8+阅读 · 5月29日
《量化地基防空系统间接效应的博弈论方法》
专知会员服务
6+阅读 · 5月29日
相关基金
国家自然科学基金
16+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
45+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员