Personalized Worked Example Generation from Student Code Submissions Using Pattern-based Knowledge Components - 专知论文

会员服务 ·

0

代码 · 样例 · 知识 (knowledge) · Learning · MoDELS ·

Personalized Worked Example Generation from Student Code Submissions Using Pattern-based Knowledge Components

翻译：基于学生代码提交的个性化示例生成：利用基于模式的知识组件

Griffin Pitts,Muntasir Hoq,Peter Brusilovsky,Narges Norouzi,Arto Hellas,Juho Leinonen,Bita Akram

from arxiv, Accepted to the Thirteenth ACM Conference on Learning @ Scale (L@S 2026)

Adaptive programming practice often relies on fixed libraries of worked examples and practice problems, which require substantial authoring effort and may not correspond well to the logical errors and partial solutions students produce while writing code. As a result, students may receive learning content that does not directly address the concepts they are working to understand, while instructors must either invest additional effort in expanding content libraries or accept a coarse level of personalization. We present an approach for knowledge-component (KC) guided educational content generation using pattern-based KCs extracted from student code. Given a problem statement and student submissions, our pipeline extracts recurring structural KC patterns from students' code through AST-based analysis and uses them to condition a generative model. In this study, we apply this approach to worked example generation, and compare baseline and KC-conditioned outputs through expert evaluation. Results suggest that KC-conditioned generation improves topical focus and relevance to students' underlying logical errors, providing evidence that KC-based steering of generative models can support personalized learning at scale.

翻译：自适应编程练习通常依赖于固定的示例库和练习题，这需要大量的人工创作努力，且可能无法很好地对应学生在编写代码时产生的逻辑错误和部分解决方案。因此，学生可能接收到并未直接针对其正在努力理解的概念的学习内容，而教师则要么投入额外精力扩展内容库，要么接受较粗略的个性化程度。我们提出了一种基于知识组件的教育内容生成方法，该方法利用从学生代码中提取的基于模式的知识组件。给定问题描述和学生提交的代码，我们的流程通过基于抽象语法树的分析，从学生代码中提取重复的结构性知识组件模式，并利用它们来条件化生成模型。在本研究中，我们将此方法应用于示例生成，并通过专家评估比较了基线输出与知识组件条件化输出。结果表明，知识组件条件化生成提高了主题聚焦度以及与潜在逻辑错误的相关性，为基于知识组件引导生成模型以实现规模化个性化学习提供了证据。

0

相关内容

代码（Code）是专知网的一个重要知识资料文档板块，旨在整理收录论文源代码、复现代码，经典工程代码等，便于用户查阅下载使用。

博士论文 | 用代码结构感知方法推进代码大模型

博士论文 | 用代码结构感知方法推进代码大模型

专知会员服务

9+阅读 · 7月25日

《将形式化方法工具应用于电子战代码库（经验报告）》

《将形式化方法工具应用于电子战代码库（经验报告）》

专知会员服务

11+阅读 · 4月26日

《软件定义网络元素与机器代码的形式化验证》

《软件定义网络元素与机器代码的形式化验证》

专知会员服务

14+阅读 · 2025年11月18日

【CMU博士论文】外部知识增强的语言模型：用于代码生成与智能体开发

【CMU博士论文】外部知识增强的语言模型：用于代码生成与智能体开发

专知会员服务

25+阅读 · 2025年3月9日

【斯坦福博士论文】受限条件下的表示学习

【斯坦福博士论文】受限条件下的表示学习

专知会员服务

27+阅读 · 2025年3月8日

【牛津大学博士论文】基于变分自编码改进表示学习,170页pdf

【牛津大学博士论文】基于变分自编码改进表示学习,170页pdf

专知会员服务

39+阅读 · 2023年5月7日

【干货书】机器学习练习册，211页pdf，Exercises in Machine Learning

【干货书】机器学习练习册，211页pdf，Exercises in Machine Learning

专知会员服务

112+阅读 · 2022年10月5日

Knowledge In PLM: 语言模型可以作为一种知识库吗？

专知会员服务

30+阅读 · 2021年6月15日

【DeepMind】基于模型的强化学习，174页ppt，Model-Based Reinforcement Learning

【DeepMind】基于模型的强化学习，174页ppt，Model-Based Reinforcement Learning

专知会员服务

90+阅读 · 2021年1月12日

【Mila-Google】使用元学习动态调整源代码模型，On-the-Fly Adaptation of Source Code Models using Meta-Learning

【Mila-Google】使用元学习动态调整源代码模型，On-the-Fly Adaptation of Source Code Models using Meta-Learning

专知会员服务

21+阅读 · 2020年3月28日

居家学习！南京大学吴建鑫教授《模式识别》2020课程，附课件下载

居家学习！南京大学吴建鑫教授《模式识别》2020课程，附课件下载

专知

67+阅读 · 2020年2月24日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

基于逆强化学习的示教学习方法综述

基于逆强化学习的示教学习方法综述

计算机研究与发展

16+阅读 · 2019年2月25日

自编码表示学习 25页最新进展综述，90篇参考文献

自编码表示学习 25页最新进展综述，90篇参考文献

专知

34+阅读 · 2018年12月18日

面向大规模在线学习的社会化推荐模型与方法

面向大规模在线学习的社会化推荐模型与方法

MOOC

10+阅读 · 2018年6月8日

基于自适应学习平台促进学生个性化学习的研究

基于自适应学习平台促进学生个性化学习的研究

MOOC

12+阅读 · 2018年4月2日

资源 | 想用Python学机器学习？Google大神替你写好了所有的编程示范代码

资源 | 想用Python学机器学习？Google大神替你写好了所有的编程示范代码

AI100

13+阅读 · 2017年11月28日

技术 | 强化学习入门以及代码实现

技术 | 强化学习入门以及代码实现

AI100

51+阅读 · 2017年8月26日

Python机器学习Kaggle案例实战

Python机器学习Kaggle案例实战

炼数成金订阅号

12+阅读 · 2017年8月10日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

41+阅读 · 2015年12月31日

从仿生的角度设计用于指导构建组织支架的单元细胞模块、有限元分析以及3D打印工艺路径规划

国家自然科学基金

0+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

基于行为数据的设计知识提取及表达方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向构建过程的范畴学习模型及其适应性机制研究

国家自然科学基金

1+阅读 · 2015年12月31日

属性驱动的自适应多agent系统设计关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

项目知识情境提取与展现方法研究：基于主题模型和知识地图的大数据视角

国家自然科学基金

2+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

Towards Functional Correctness of Large Code Models with Selective Generation

Arxiv

0+阅读 · 6月15日

Simulating Students' Java Programming Errors with Large Language Models

Arxiv

0+阅读 · 6月12日

Towards Fully Automated Exam Grading: Fairness-Aware Recognition of Handwritten Answers with Foundation Models

Arxiv

0+阅读 · 6月9日

CompilerDream: Learning a Compiler World Model for General Code Optimization

Arxiv

0+阅读 · 5月28日

On the Road to Personalized Code Intelligence: Portraiting and Assisting Developers Based on Their In-IDE Behaviors

Arxiv

0+阅读 · 5月28日

Trustworthy Software Project Generation : a Case Study with an Interactive Theorem Prover

Arxiv

0+阅读 · 5月25日

Enhancing the Code Reasoning Capabilities of LLMs via Consistency-based Reinforcement Learning

Arxiv

0+阅读 · 5月18日

Towards SocratiCode: Designing a Generative AI-Based Programming Tutor for K-12 Students through a 4-Week Participatory Design Study

Arxiv

0+阅读 · 5月18日

MathConstraint: Automated Generation of Verified Combinatorial Reasoning Instances for LLMs

Arxiv

0+阅读 · 5月8日

Augmented Large Language Models with Parametric Knowledge Guiding

Arxiv

20+阅读 · 2023年5月8日

VIP会员

文章信息

相关主题

知识 (knowledge)

最新内容

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

1+阅读 · 今天2:42

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

1+阅读 · 今天2:37

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

2+阅读 · 今天2:23

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

5+阅读 · 今天2:21

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

2+阅读 · 今天1:46

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

4+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

3+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

8+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

相关VIP内容

博士论文 | 用代码结构感知方法推进代码大模型

博士论文 | 用代码结构感知方法推进代码大模型

专知会员服务

9+阅读 · 7月25日

《将形式化方法工具应用于电子战代码库（经验报告）》

《将形式化方法工具应用于电子战代码库（经验报告）》

专知会员服务

11+阅读 · 4月26日

《软件定义网络元素与机器代码的形式化验证》

《软件定义网络元素与机器代码的形式化验证》

专知会员服务

14+阅读 · 2025年11月18日

【CMU博士论文】外部知识增强的语言模型：用于代码生成与智能体开发

【CMU博士论文】外部知识增强的语言模型：用于代码生成与智能体开发

专知会员服务

25+阅读 · 2025年3月9日

【斯坦福博士论文】受限条件下的表示学习

【斯坦福博士论文】受限条件下的表示学习

专知会员服务

27+阅读 · 2025年3月8日

【牛津大学博士论文】基于变分自编码改进表示学习,170页pdf

【牛津大学博士论文】基于变分自编码改进表示学习,170页pdf

专知会员服务

39+阅读 · 2023年5月7日

【干货书】机器学习练习册，211页pdf，Exercises in Machine Learning

【干货书】机器学习练习册，211页pdf，Exercises in Machine Learning

专知会员服务

112+阅读 · 2022年10月5日

Knowledge In PLM: 语言模型可以作为一种知识库吗？

专知会员服务

30+阅读 · 2021年6月15日

【DeepMind】基于模型的强化学习，174页ppt，Model-Based Reinforcement Learning

【DeepMind】基于模型的强化学习，174页ppt，Model-Based Reinforcement Learning

专知会员服务

90+阅读 · 2021年1月12日

【Mila-Google】使用元学习动态调整源代码模型，On-the-Fly Adaptation of Source Code Models using Meta-Learning

【Mila-Google】使用元学习动态调整源代码模型，On-the-Fly Adaptation of Source Code Models using Meta-Learning

专知会员服务

21+阅读 · 2020年3月28日

热门VIP内容

开通专知VIP会员享更多权益服务

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

从采集到决策：美军视角下的战术情报范式重构

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

相关资讯

居家学习！南京大学吴建鑫教授《模式识别》2020课程，附课件下载

居家学习！南京大学吴建鑫教授《模式识别》2020课程，附课件下载

专知

67+阅读 · 2020年2月24日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

基于逆强化学习的示教学习方法综述

基于逆强化学习的示教学习方法综述

计算机研究与发展

16+阅读 · 2019年2月25日

自编码表示学习 25页最新进展综述，90篇参考文献

自编码表示学习 25页最新进展综述，90篇参考文献

专知

34+阅读 · 2018年12月18日

面向大规模在线学习的社会化推荐模型与方法

面向大规模在线学习的社会化推荐模型与方法

MOOC

10+阅读 · 2018年6月8日

基于自适应学习平台促进学生个性化学习的研究

基于自适应学习平台促进学生个性化学习的研究

MOOC

12+阅读 · 2018年4月2日

资源 | 想用Python学机器学习？Google大神替你写好了所有的编程示范代码

资源 | 想用Python学机器学习？Google大神替你写好了所有的编程示范代码

AI100

13+阅读 · 2017年11月28日

技术 | 强化学习入门以及代码实现

技术 | 强化学习入门以及代码实现

AI100

51+阅读 · 2017年8月26日

Python机器学习Kaggle案例实战

Python机器学习Kaggle案例实战

炼数成金订阅号

12+阅读 · 2017年8月10日

相关论文

Towards Functional Correctness of Large Code Models with Selective Generation

Arxiv

0+阅读 · 6月15日

Simulating Students' Java Programming Errors with Large Language Models

Arxiv

0+阅读 · 6月12日

Towards Fully Automated Exam Grading: Fairness-Aware Recognition of Handwritten Answers with Foundation Models

Arxiv

0+阅读 · 6月9日

CompilerDream: Learning a Compiler World Model for General Code Optimization

Arxiv

0+阅读 · 5月28日

On the Road to Personalized Code Intelligence: Portraiting and Assisting Developers Based on Their In-IDE Behaviors

Arxiv

0+阅读 · 5月28日

Trustworthy Software Project Generation : a Case Study with an Interactive Theorem Prover

Arxiv

0+阅读 · 5月25日

Enhancing the Code Reasoning Capabilities of LLMs via Consistency-based Reinforcement Learning

Arxiv

0+阅读 · 5月18日

Towards SocratiCode: Designing a Generative AI-Based Programming Tutor for K-12 Students through a 4-Week Participatory Design Study

Arxiv

0+阅读 · 5月18日

MathConstraint: Automated Generation of Verified Combinatorial Reasoning Instances for LLMs

Arxiv

0+阅读 · 5月8日

Augmented Large Language Models with Parametric Knowledge Guiding

Arxiv

20+阅读 · 2023年5月8日

相关基金

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

41+阅读 · 2015年12月31日

从仿生的角度设计用于指导构建组织支架的单元细胞模块、有限元分析以及3D打印工艺路径规划

国家自然科学基金

0+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

基于行为数据的设计知识提取及表达方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向构建过程的范畴学习模型及其适应性机制研究

国家自然科学基金

1+阅读 · 2015年12月31日

属性驱动的自适应多agent系统设计关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

项目知识情境提取与展现方法研究：基于主题模型和知识地图的大数据视角

国家自然科学基金

2+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员