Open-ended responses are central to learning, yet automated scoring often conflates what students wrote with how teachers grade. We present an analytics-first framework that separates content signals from rater tendencies, making judgments visible and auditable via analytics. Using de-identified ASSISTments mathematics responses, we model teacher histories as dynamic priors and represent text with sentence embeddings. We apply centroid normalization and response-problem embedding differences, and explicitly model teacher effects with priors to reduce problem- and teacher-related confounds. Temporally-validated linear models quantify the contributions of each signal, and model disagreements surface observations for qualitative inspection. Results show that teacher priors heavily influence grade predictions; the strongest results arise when priors are combined with content embeddings (AUC~0.815), while content-only models remain above chance but substantially weaker (AUC~0.626). Adjusting for rater effects sharpens the selection of features derived from content representations, retaining more informative embedding dimensions and revealing cases where semantic evidence supports understanding as opposed to surface-level differences in how students respond. The contribution presents a practical pipeline that transforms embeddings from mere features into learning analytics for reflection, enabling teachers and researchers to examine where grading practices align (or conflict) with evidence of student reasoning and learning.


翻译:开放式应答是学习的核心环节,但自动评分往往将学生作答内容与教师评分倾向相混淆。本文提出一种分析优先的框架,将内容信号与评分者倾向分离,通过分析使评判过程可见且可审计。基于去标识化的ASSISTments数学应答数据,我们将教师历史建模为动态先验,并使用句子嵌入表示文本。通过应用质心归一化与应答-问题嵌入差异,并利用先验显式建模教师效应,以降低问题相关和教师相关的混杂因素。经时间验证的线性模型量化了各信号的贡献度,模型分歧为定性检验提供了可观察的实例。结果表明:教师先验对成绩预测具有显著影响;当先验与内容嵌入结合时获得最优结果(AUC~0.815),而纯内容模型虽高于随机水平但明显较弱(AUC~0.626)。校正评分者效应能锐化从内容表征中提取的特征选择,保留更具信息量的嵌入维度,并揭示语义证据支持理解(而非学生应答的表面差异)的案例。本研究的贡献在于提出了一套实用流程,将嵌入从单纯特征转化为可供反思的学习分析工具,使教师和研究者能够审视评分实践在何处与(或偏离)学生推理和学习的证据相一致。

0
下载
关闭预览

相关内容

【ICML2023】SEGA:结构熵引导的图对比学习锚视图
专知会员服务
23+阅读 · 2023年5月10日
UTC: 用于视觉对话的任务间对比学习的统一Transformer
专知会员服务
14+阅读 · 2022年5月4日
专知会员服务
20+阅读 · 2021年8月30日
专知会员服务
33+阅读 · 2021年7月27日
【CVPR2021】跨模态检索的概率嵌入
专知
17+阅读 · 2021年3月2日
论文浅尝 | Interaction Embeddings for Prediction and Explanation
开放知识图谱
11+阅读 · 2019年2月1日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
VIP会员
相关VIP内容
【ICML2023】SEGA:结构熵引导的图对比学习锚视图
专知会员服务
23+阅读 · 2023年5月10日
UTC: 用于视觉对话的任务间对比学习的统一Transformer
专知会员服务
14+阅读 · 2022年5月4日
专知会员服务
20+阅读 · 2021年8月30日
专知会员服务
33+阅读 · 2021年7月27日
相关基金
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员